Hvem
har adgang til Big data?
Det vides ikke med sikkerhed. Den amerikanske whistleblower
Edward Snowden har afsløret, at den amerikanske efterretningstjeneste indsamler
et væld af oplysninger ved at opsnappe kommunikation direkte fra de
fiberkabler, som den globale internettrafik løber gennem, samt ved hjælp af det
såkaldte PRISM-program, der giver NSA adgang til data fra alle de store
internetselskaber som Google, Facebook, Skype og Microsoft. Formodentlig har
andre efterretningstjenester tilsvarende adgang til Big data, og det samme gælder
store virksomheder. Forskere i Big data nævner, at der blandt private
virksomheder fem giganter, der især opsamler store datamængder, nemlig: Google,
Facebook, Amazon, Apple og Microsoft. Disse giganter har altså rådighed over
enorme datamængder, som de kun i begrænset omfang giver virksomheder eller
forskere adgang til – mod betaling.
Hvilke typer data har Facebook, Google
og Apple adgang til?
Facebook gemmer oplysninger om, hvordan sitets mere end én milliard brugere
interagerer med netværket og hinanden. Hver dag laver brugerne 2,5 milliarder
nye likes og lægger 300 millioner billeder i Facebook-universet, og de store
datamængder er ikke noget, udenforstående umiddelbart kan trække oplysninger
fra. Facebook kan derimod bruge det til at målrette reklamer. Google har adgang
til enorme datamængder om blandt andet websøgninger og e-mailkommunikation,
mens Apple både har store mængder kommunikations- og netværksdata, men også
indsamler data fra de indbyggede GPS’er, der bruges i blandt andet telefonens
kortfunktioner.
Hvordan bruges Big data?
De store datamængder bruges blandt andet af firmaer, der trækker viden ud
om kunder og bruger dem til at målrette reklamer. Google gemmer for eksempel
alle søgeresultater og bruger det til markedsføring og Amazon registrerer alle
køb og klik på deres hjemmeside og bruger det til at give den enkelte bruger de
tilbud, der retter sig mest præcist mod vedkommendes interesser. Big data, som
sælges af for eksempel Google til forskere eller offentlige institutioner, bruges
desuden til at forudsige tendenser og problemer og forebygge dem. Et eksempel
på det nævnes i artiklen ”En revolution i sandheder” (se kilder): ”Et eksempel
er Googles projekt ’Flu Trends’, der har vist sig bedre og hurtigere at kunne
forudsige og registrere udbrud af influenza end data indsamlet af
sundhedssektoren. Google får mere end tre milliarder søgninger dagligt og
gemmer samtlige søgeord. Så ved at gå tilbage historisk og koble alle søgninger
på sundhedsdata om udbrud og spredning af influenza fandt Google ved hjælp af
en matematisk model frem til en stærk sammenhæng mellem 45 søgetermer og den
faktiske spredning af influenza igennem tiden. På den måde kan de nu hurtigere
end myndighederne følge og forudsige spredningen af influenza.”
Hvem
bruger Big data?
Efterretningstjenester og
it-virksomheder som Google, Apple og Facebook bruger Big data, og virksomheder
inden for andre brancher gør det også i stigende grad. Virksomheder kan for
eksempel bruge data om køb, salg og besøg på bestemte hjemmesider til at
målrette tilbud, kampagner, forsikringer, varer og meget andet til bestemte
målgrupper, og de store mængder data gør det muligt at ramme meget præcist.
En del offentlige institutioner bruger også Big data, og både kommuner,
universiteter og stater har fået øjnene op for potentialerne i en øget
udnyttelse af datamængderne. Men det offentlige halter stadig langt bagefter de
private virksomheder, fremgår det af artiklen ”En revolution i sandheder” (se
kilder).
Hvilke forhindringer er der for at bruge
Big data?
Ifølge artiklen ”En revolution i sandheder” (se kilder) har især det
offentlige problemer med at bruge Big data, fordi det offentlige mangler
it-kompetencer og har problemer med at samarbejde på tværs af forskellige
enheder. I artiklen citeres en førende amerikansk forsker i Big data, Viktor
Mayer-Schönberger, for følgende: "Staten har ganske vist en masse
information, men det er en meget stor organisation med forskellige enheder, der
som oftest ikke taler særligt godt sammen. It i det offentlige er for det meste
en trist historie om inkompetence og mangel på ressourcer, fordi de ikke har de
bedste talenter, og deres projekter sædvanligvis er for store med omkostninger,
der løber løbsk."
En anden forhindring for, at Big data kan udnyttes er, at ingen instanser har
adgang til alle de mange datasæt, som ofte skal kombineres for at få mest mulig
gavn af dem. Ingen af dem, der indsamler data, har altså et komplet billede af,
hvad deres brugere foretager sig, og det forhindrer, at man kan udnytte de
mange data bedst muligt. Desuden tilhører de største og mest interessante
datasæt teknologigiganterne, bl.a. Facebook og Google, og derfor kan for
eksempel forskere og offentlige institutioner ofte ikke få adgang til alle de
data, de ønsker. "Det er et demokratisk problem. For mængden af
informationer, som kan udledes fra de her data er ufatteligt stor, og det kan
bruges til mange praktiske formål," siger Dino Pedreschisi, der er
professor i Computervidenskab på Universitetet i Pisa i artiklen ”Et overblik
over livet i helt uset omfang” (se kilder).
Desuden er der et dilemma mellem hensynet til den enkeltes privatliv og den
gavn, forskere og andre kan have af at få adgang til personfølsomme
oplysninger.