
Flere og flere undervisningsmaterialer er blevet digitale og indsamler således big data fra eleverne.
Foto: Ida Maria Odgaard / Scanpix
Flere og flere undervisningsmaterialer er blevet digitale og indsamler således big data fra eleverne. Foto: Ida Maria Odgaard / Scanpix
Big data
Læsetid: 11 min
Indhold
Indledning
Vi efterlader elektroniske spor næsten hele tiden. Når vi er i kontakt med kommunen, laver en opdatering på Facebook, er indlagt på hospitalet, kører i en bil med GPS eller betaler med et dankort. De mange data, som opsamles om os, vokser konstant, og de enorme mængder information kan give både forskere, politikere og virksomheder ny viden. Hvis dataene analyseres og bruges rigtigt, kan de bruges til at indrette vores byer bedre, forebygge sygdomme og gøre os mere effektive i dagligdagen. Men de enorme datamængder kan også bruges af virksomheder og myndigheder, der ønsker at styre vores forbrug og adfærd. Så Big data rummer store muligheder, men også mange faldgruber og risici.
Video fra TED-Ed, hvor det forklares, hvad Big data er, og hvordan de enorme mængder data håndteres.
Relaterede emner
Big Data - Tim Smith
Video fra TED-Ed, hvor det forklares, hvad Big data er, og hvordan de enorme mængder data håndteres.
Blokeret indhold
Dette er eksternt indhold, derfor skal du acceptere cookies til statistik og markedsføring for at se det.
Baggrund om Big data
Hvad er Big data?
Stort set alt, hvad vi gør, resulterer i et dataspor, og mængden af data vokser så eksplosivt, at verdens samlede mængde data fordobles hvert tredje år. Denne enorme mængde data og de nye muligheder for analyse og regulering, som de indebærer, kaldes Big data. Big Data bruges i stigende grad inden for markedsføring og it og er også begyndt at brede sig til andre dele af erhvervslivet og det offentlige.
Hvad er forskellen på Small data og Big data?
Forskellen er, som navnet antyder, især mængden af data. Men i Big data ligger også, at det er data, som ikke altid er indsamlet med et bestemt formål, sådan som de fleste data var tidligere. Før i tiden lavede en virksomhed eller en offentlig myndighed for eksempel en undersøgelse af nogle borgeres ønsker eller behov med et helt bestemt formål for øje. De data, der blev indsamlet, kunne typisk kun bruges til netop det formål, de var blevet indhentet for at dække.
Men med Big data er det nærmest omvendt. De fleste af de mange data indsamles som en form for sideeffekt eller biprodukt, som opstår, når vi kommunikerer, handler og bevæger os. Det medfører, ifølge nogle af de førende eksperter i Big data, at forskere i dag kan opdage sammenhænge eller fænomener, som man i small data-tidsalderen ikke ville opdage, fordi man aldrig ville kunne forestille sig dem.
"For mange mennesker er det svært at forstå, men i Big Data-tidsalderen, er det smukke, at du kan få en masse indsigt ved at se på verden gennem korrelationer. I Small Data-tidsalderen blev vi nødt til at formulere et spørgsmål, derefter indsamle data og så se på mulige sammenhænge," siger Viktor Mayer-Schönberger, professor i Internet Governance and Regulation på Oxford University og forfatter til bogen "Big Data – A Revolution That Will Transform How We Live, Work and Think" i artiklen ”En revolution i sandheder” (se kilder).
Brugen af Big data
Hvem har adgang til Big data?
Det vides ikke med sikkerhed. Den amerikanske whistleblower Edward Snowden har afsløret, at den amerikanske efterretningstjeneste indsamler et væld af oplysninger ved at opsnappe kommunikation direkte fra de fiberkabler, som den globale internettrafik løber gennem, samt ved hjælp af det såkaldte PRISM-program, der giver NSA adgang til data fra alle de store internetselskaber som Google, Facebook, Skype og Microsoft.
Formodentlig har andre efterretningstjenester tilsvarende adgang til Big data, og det samme gælder store virksomheder. Forskere i Big data nævner, at der blandt private virksomheder er fem giganter, der især opsamler store datamængder, nemlig: Google, Facebook, Amazon, Apple og Microsoft. Disse giganter har altså rådighed over enorme datamængder, som de kun i begrænset omfang giver virksomheder eller forskere adgang til – mod betaling.
Hvilke typer data har Facebook, Google og Apple adgang til?
Facebook gemmer oplysninger om, hvordan sitets mere end 1,5 milliard daglige brugere interagerer med netværket og hinanden. Hver dag laver brugerne flere milliarder nye likes og lægger mange hundrede millioner billeder i Facebook-universet, og de store datamængder er ikke noget, udenforstående umiddelbart kan trække oplysninger fra. Facebook kan derimod bruge det til at målrette reklamer. Google har adgang til enorme datamængder om blandt andet websøgninger og e-mailkommunikation, mens Apple både har store mængder kommunikations- og netværksdata, men også indsamler data fra de indbyggede GPS’er, der bruges i blandt andet telefonens kortfunktioner.
Hvordan bruges Big data?
De store datamængder bruges blandt andet af firmaer, der trækker viden ud om kunder og bruger dem til at målrette reklamer. Google gemmer for eksempel alle søgeresultater og bruger det til markedsføring og Amazon registrerer alle køb og klik på deres hjemmeside og bruger det til at give den enkelte bruger de tilbud, der retter sig mest præcist mod vedkommendes interesser. Big data, som sælges af for eksempel Google til forskere eller offentlige institutioner, bruges desuden til at forudsige tendenser og problemer og til at forebygge dem. Et eksempel på det nævnes i artiklen ”En revolution i sandheder” (se kilder): ”Et eksempel er Googles projekt ’Flu Trends’, der har vist sig bedre og hurtigere at kunne forudsige og registrere udbrud af influenza end data indsamlet af sundhedssektoren. Google får mere end tre milliarder søgninger dagligt og gemmer samtlige søgeord. Så ved at gå tilbage historisk og koble alle søgninger på sundhedsdata om udbrud og spredning af influenza fandt Google ved hjælp af en matematisk model frem til en stærk sammenhæng mellem 45 søgetermer og den faktiske spredning af influenza igennem tiden. På den måde kan de nu hurtigere end myndighederne følge og forudsige spredningen af influenza.”
Hvem bruger Big data?
Efterretningstjenester og it-virksomheder som Google, Apple og Facebook bruger Big data, og virksomheder inden for andre brancher gør det også i stigende grad. Virksomheder kan for eksempel bruge data om køb, salg og besøg på bestemte hjemmesider til at målrette tilbud, kampagner, forsikringer, varer og meget andet til bestemte målgrupper, og de store mængder data gør det muligt at ramme meget præcist. En del offentlige institutioner bruger også Big data, og både kommuner, universiteter og stater har fået øjnene op for potentialerne i en øget udnyttelse af datamængderne. Men det offentlige halter stadig langt bagefter de private virksomheder, fremgår det af artiklen ”En revolution i sandheder” (se kilder).
Hvilke forhindringer er der for at bruge Big data?
Ifølge artiklen ”En revolution i sandheder” (se kilder) har især det offentlige problemer med at bruge Big data, fordi det offentlige mangler it-kompetencer og har problemer med at samarbejde på tværs af forskellige enheder. I artiklen citeres en førende amerikansk forsker i Big data, Viktor Mayer-Schönberger, for følgende: "Staten har ganske vist en masse information, men det er en meget stor organisation med forskellige enheder, der som oftest ikke taler særligt godt sammen. It i det offentlige er for det meste en trist historie om inkompetence og mangel på ressourcer, fordi de ikke har de bedste talenter, og deres projekter sædvanligvis er for store med omkostninger, der løber løbsk." En anden forhindring for, at Big data kan udnyttes er, at ingen instanser har adgang til alle de mane datasæt, som ofte skal kombineres for at få mest mulig gavn af dem. Ingen af dem, der indsamler data, har altså et komplet billede af, hvad deres brugere foretager sig, og det forhindrer, at man kan udnytte de mange data bedst muligt. Desuden tilhører de største og mest interessante datasæt teknologigiganterne, bl.a. Facebook og Google, og derfor kan for eksempel forskere og offentlige institutioner ofte ikke få adgang til alle de data, de ønsker. "Det er et demokratisk problem. For mængden af informationer, som kan udledes fra de her data er ufatteligt stor, og det kan bruges til mange praktiske formål," siger Dino Pedreschisi, der er professor i Computervidenskab på Universitetet i Pisa i artiklen ”Et overblik over livet i helt uset omfang” (se kilder). Desuden er der et dilemma mellem hensynet til den enkeltes privatliv og den gavn, forskere og andre kan have af at få adgang til personfølsomme oplysninger.
Debat om Big data
Hvilke positive muligheder er der i Big data?
"For videnskaben er det meget interessant, at det for første gang i historien er muligt for forskere at få adgang til data om den menneskelige adfærd i så stor skala. Det har aldrig været muligt før," siger Dino Pedreschi, der er professor i Computervidenskab på Universitetet i Pisa, i artiklen ”Et overblik over livet i helt uset omfang” (se kilder). I artiklen nævnes det, at han ved hjælp af GPS-data har været med til at kortlægge transportmønstre i en by og få overblik over, hvor der blev udledt mest bilforurening, og hvordan trafikken i byen kunne planlægges bedre. Det er blot et af mange eksempler, som håbefulde Big data-entusiaster nævner som positive muligheder. I artiklen ”En revolution i sandheder” (se kilder) opremses en lang række muligheder, som nogle af de konsulenter, der arbejder med Big data nævner: ”En McKinsey-rapport fra 2011 regner sig frem til, at brugen af Big Data i den offentlige sektor i Europa kan føre til ikke mindre end 15-20 procents besparelser i de administrative omkostninger, svarende til 150-300 milliarder euro. Det kan skabe bæredygtige og sikre byer og effektivisere sundhedssektoren, og hvis man som virksomhed formår at udnytte Big Data, kan man for alvor lægge afstand til sine konkurrenter. Skal man tro konsulenthusene er der stort set ikke det problem, som Big Data ikke kan løse både billigere og mere effektivt."
Ifølge artiklen ”Storstilet overvågning, styring og bullshit” (se kilder) ligger der desuden et stort potentiale i, at man ved hjælp af Big data kan forudsige begivenheder ud fra data fra fortiden: "Allerede nu mener Københavns Kommune ret præcist at kunne forudsige, hvor der skal bygges nye børnehaver og vuggestuer om et par år, og i USA eksperimenteres der i politiet med at bruge metoderne i kriminalitetsbekæmpelsen. Såkaldt ’forudsigende politiarbejde’ bruges af politiet i Los Angeles i programmet Pred Pol, der analyserer kriminalitetsstatistikker for de seneste år fordelt på geografi og kvarterer, således at man vil kunne forudsige, hvor og hvornår fremtidige forbrydelser bliver begået og dermed sætte ind med patruljering og lignende."
Hvilke negative konsekvenser kan Big data have?
En negativ konsekvens, som mange forskere i Big data nævner, er, at dem, der indsamler og bruger de store datamængder, kan komme til at afsløre personlige og private oplysninger. Frygten for, at personlige oplysninger kan misbruges, kan være til stor skade i for eksempel sundhedsforskningen. Det vurderer næstformand i og medlem af Etisk Råd, Ester Larsen og Thomas Ploug. I en kronik ”Big data på sundhedsområdet – er det sundt?” fra Kristeligt Dagblad den 26. juli 2013 (se kilder) skriver de: ”Der er således ikke grund til at tvivle på, at opbygningen af databaser med personlig sundhedsinformation vil være til stor gavn for dansk forskning og industri og dermed i sidste ende også for mange patienter. Men hvordan stilles de borgere, hvis data på denne måde bliver gjort tilgængelige – ikke mindst set i lyset af den svigtende evne til at beskytte og anonymisere data tilstrækkeligt?”. Kronikørerne nævner, at hvis borgerne mister tilliden til, at oplysninger om dem kan opbevares sikkert, vil de måske ikke længere deltage i undersøgelser, og så vil det svække forskningen og gøre muligheden for at forebygge og behandle sygdomme dårligere.
Desuden kan brugen af Big data risikere at fjerne fokus fra årsagerne til nogle samfundsproblemer, mener en anden forsker, Evgeny Morozov, fra Stanford University. I artiklen ”Storstilet overvågning, styring og bullshit” (se kilder) forudser han, at brugen af Big data kan føre til, at man for eksempel ikke længere interesserer sig for årsagerne til kriminalitet, men mest går op i at bekæmpe den der, hvor man ved hjælp af Big data kan forudsige, at den vil opstå. Det kan få som konsekvens, at samfundet ikke bruger ressourcer på at forstå de sociale årsager til kriminaliteten og forebygge den, mener han.
I Kina er der de senere år udviklet et offentligt socialt kreditsystem, der samler alle oplysninger om de enkelte borgere. I artiklen ”Kinas nye system for social kontrol er ikke et orwellsk mareridt (endnu)” (se kilder) gives et eksempler: ”Hvis man eksempelvis får en færdselsbøde og nægter at betale, ryger man på en landsdækkende sort liste og får sit navn offentliggjort online og i medierne. Det er den indtil videre mest veludviklede del af Kinas sociale kreditsystem. Der findes flere sorte lister, og den mest omfattende bliver lavet af Kinas højesteret. Betaler man ikke sin bøde, får man ikke lov til at oprette nye firmaer i den finansielle sektor og mest kontroversielt, så bliver man nægtet adgang til luksushoteller og rejser på første klasse med fly og tog.”
Hvilke demokratiske udfordringer rejser Big data?
Selvom de mange dataoplysninger om os kan være med til at løse problemer inden for sundhed og kriminalitet, kan Big data også udgøre et demokratisk problem, hvis de bliver udnyttet.
Det så vi for eksempel i 2018, da det kom frem, at konsulentvirksomheden Cambridge Analytica eftersigende har brugt Big data til at påvirke det amerikanske præsidentvalg i 2016, hvor Donald Trump blev valgt. Konsulentfirmaet skulle have brugt data fra mere end 50 millioner amerikanske Facebook-profiler til at målrette annoncer mod brugere, hvilket er imod Facebooks retningslinjer. Det fremgår af en artikel på DR den 21. marts 2018 (se kilder).
Cambridge Analytica kiggede blandt andet på brugernes vennelister, tidslinjer, og hvad de syntes godt om – med andre ord de dele, der er med til at tilkendegive, hvilken type man er, og hvordan man tager beslutninger. Derudover indsamlede de data gennem en personlighedstest-app, der var knyttet op til Facebook-profilerne.
Skandalen blev afsløret, da whistlebloweren Christopher Wylie trådte frem og afslørede konsulentfirmaets metoder. Han afslørede også, at der allerede tilbage i 2014 – to år før Trump blev valgt – blev testet pro-Trump slogans for at finde ud af, hvordan potentielle Trump-vælgere reagerede. For eksempel sloganet ‘build the wall’, der henviser til Trumps meget omtalte plan om at bygge USA og Mexico, og som endte med at blive meget fremtrædende blandt Trump-vælgere.
Ifølge Facebook udleverede de datasættet i god tro om, at det skulle bruges til forskning. Men eftersom det siden hen blev solgt videre, mener platformen, at deres retningslinjer er blevet overtrådt. Hele skandalen førte til stor diskussion om datasikkerhed, og Mark Zuckerberg, Facebooks skaber, blev også indkaldt til høring i sagen.
Cambridge Analytica er siden hen lukket, og sagen har – om ikke andet – skabt en større bevidsthed om, hvor meget information, der eksisterer om os på internettet og hvad det kan blive (mis)brugt til. Profiler på Facebook og Instagram og lignende sociale medier er måske gratis, men alle de oplysninger, vi putter i dem, er meget værdifulde. En god tommelfingerregel er derfor: Hvis en profil eller lignende på nettet er gratis, er det sandsynligvis dig som bruger, der er produktet.
AOC grills Facebook CEO Mark Zuckerberg on Cambridge Analytica and campaign ads
Mark Zuckerberg bliver udspurgt om sin viden om Cambridge Analytica-skandalen og Facebooks rolle i den. På engelsk.
Blokeret indhold
Dette er eksternt indhold, derfor skal du acceptere cookies til statistik og markedsføring for at se det.
Hvilken kritik rettes mod tilhængerne af Big data?
Nogle kritiserer tilhængerne af Big data for at overdrive de muligheder, som brugen af Big data gemmer på. Kritikerne mener, at Big data-tilhængerne blot ønsker at tjene penge på at udbrede ideen om, at Big data kan løse stort set alle problemer. Kritikerne mener bl.a., at vi stadig mangler metoder til for alvor at få mening ud af de enorme mænger af elektroniske spor, som vi alle efterlader os hver dag.
Citerede kilder
- Kopier link
Kinas nye system for social kontrol er ikke et orwellsk mareridt (endnu)
Artikel
Berlingske, 04-01-2019
- Kopier link
- Kopier link
- Kopier link
- Kopier link
- Kopier link
- Kopier link