Zaskrbljenost glede zasebnosti bi lahko izkoreninila načrt brez primere uporabe podatkov iz Facebooka za študij volitev

Zaposleni v Facebooku si prizadevajo za zmanjšanje širjenja dezinformacij, ki bi lahko vplivale na volitve.

NOAH BERGER / AFP / Getty slike

Zaskrbljenost glede zasebnosti bi lahko izkoreninila načrt brez primere uporabe podatkov iz Facebooka za študij volitev

Avtor Jeffrey MervisSep. 24., 2019, 16:50

Gary King je izkoristil popolno časovno razporeditev pri prodaji Facebooka o zamisli o deljenju zakladnice svojih podatkov akademikom. Toda zdaj ura deluje proti prizadevanjem Kinga in drugih, da inovativni projekt - katerega cilj je boljše razumevanje, kako informacije, razširjene na Facebooku, vplivajo na volitve in politične institucije po vsem svetu - ne bo razpadel. Ključna točka: zaščita zasebnosti uporabnikov Facebooka.

Marca 2018 je King, kvantitativni družboslovec z univerze Harvard, obiskal sedež Facebooka v Menlo Parku v Kaliforniji. Mediji so pravkar prebili novico, da je britanska firma Cambridge Analytica prodajala profile volivcev kandidatom na podlagi osebnih podatkov, ki jih nehote posredujejo milijoni uporabnikov Facebooka. Škandal, ki je nastal, je bil za Facebook streznitev, kako ne bi delil svojih podatkov z zunanjimi ljudmi.

King je na Facebooku predlagal boljši način za izmenjavo podatkov. Njegov načrt je bil zasnovan tako, da bo dosegel visoke etične in intelektualne standarde, hkrati pa dosegel tri pomembne cilje: ohranjanje zasebnosti uporabnikov Facebooka, varovanje poslovnih skrivnosti podjetja glede upravljanja njegovih podatkov in nalaganje omejitev, kaj raziskovalci lahko objavijo na podlagi teh podatkov.

Kingova ureditev bi po mnenju Kinga lahko spremenila kvantitativno družboslovje tako, da bi raziskovalcem zagotovila dostop do resnično velikih podatkov, ne pa do raziskav in majhnih vzorcev, ki so bili tradicionalno njihova osnovna prehrana. Soočilo bi se tudi z velikim izzivom, s katerim se soočajo na terenu: zasebna podjetja imajo zdaj veliko več informacij o obnašanju ljudi kot vlade. In raziskovalci so potrebovali boljši dostop do teh podatkov.

Facebookovi uradniki so vljudno prisluhnili Kingovi igri, vendar niso obljubljali. Ugotovil je, da se je izmuznil.

Potem se je pred kratkim spomnil: "Bil sem v svoji hotelski sobi in se pakiral, da sem šel domov, ko sem prejel e-poštno sporočilo od ljudi, s katerimi sem se pravkar srečal." Postavljalo se je vprašanje: "Kaj lahko storimo glede tega?" do škandala Cambridge Analytica. Uradniki podjetja, ki so zaskrbljeno gledali, kako se je cena delnic Facebooka ob razkritjih strmoglavila, so bili zaskrbljeni, kako bi škandal lahko škodoval ugledu družbe.

Nekaj ​​dni kasneje je King poklical nadaljnji klic. "Hej, bi lahko naredili študijo volitev 2016 in vsem povedali, da izida nismo spremenili?" Ga je vprašal uradnik Facebooka. "In če smo naredili kaj narobe, nam povejte, kaj naj naredimo, in takoj bomo to storili." King pravi, da je bila njegova prva reakcija: "Mislim, da izguba 100 milijard dolarjev tržne kapice usmeri um."

"Pomemben nov model"

Razpis je poslal Kinga in Natea Persilyja, profesorja prava na univerzi Stanford v Palo Altu v Kaliforniji, da je spremenil načrt, da bi se postavil v program Social Science One, neprofitna organizacija, ki bi bila spletna stran za raziskovalce, da bi dostopali do vseh podatkov, ki jih je Facebook objavil . Njegov prvi projekt bi raziskovalcem predstavil, kako je 2 milijard uporabnikov Facebooka delilo spletna mesta, na katerih so razpravljali o ameriških predsedniških volitvah leta 2016, in o demokratičnih institucijah po vsem svetu.

Nabori podatkov bi vsebovali spletne naslove ali URL-je, ki so jih uporabniki Facebooka javno objavili, nekatere značilnosti teh URL-jev in zbirali podatke o deliteljih, vključno z njihovo starostjo, spolom, lokacijo in političnimi nagibi. Obljubil je, da bo zlati rudnik za raziskovalce, ki preučujejo, pod katerimi pogoji in kdo jih lažne novice širijo po internetu.

9. aprila 2018 je Elliot Schrage, višji izvršni direktor Facebooka, objavil novo pobudo, za katero je zapisal, da bo "pripomogla k zagotavljanju neodvisnih, verodostojnih raziskav vloge socialnih medijev na volitvah." Schrage je v svojem blogu označil za "pomembno novo model za partnerstva med industrijo in akademsko skupino. "In čeprav ni omenil Cambridge Analytica, je škandal očitno padel na pamet. "Ista Facebook orodja, ki pomagajo politikom, da se povežejo s svojimi volivci, se lahko zlorabijo tudi za manipulacijo in zavajanje, " je zapisal.

Temelji se vzpenjajo na krovu

V objavi za april 2018 je bilo naštetih tudi sedem dobrodelnih organizacij, ki bi financirale pobudo. Konzorcij je sestavil Larry Kramer, predsednik fundacije William in Flora Hewlett, ki se nahaja le nekaj milj od Facebookovega sedeža v parku Menlo. Fundacija je pred kratkim razširila veliko demokratično pobudo, imenovano Madison Initiative, ki se je osredotočila na preučevanje kongresa, da bi več pozornosti namenili digitalnim dezinformacijam.

"Spominjam se, da je naš programski vodja trepetal od navdušenja, " ko je slišala za novo partnerstvo, se spominja Kramer. "Pravkar smo ugotovili, da je pomanjkanje dostopa do podatkov naša glavna težava v Madison pobudi, in potem, boom, tukaj je ta zakladnica, ki nam bo omogočila, da mislimo, da je treba storiti."

Kramerju je uspelo pridobiti fundacije Alfreda P. Sloana, fundacije Laura in John Arnold, fundacijo Charlesa Kocha, fundacije John S. in James L. Knight, sklad za demokracijo in mrežo Omidyar. Vsi se zanimajo za delovanje demokracij, pravi. Pomembna je bila tudi njihova ideološka raznolikost - Koch podpira več konzervativnih vzrokov, Omidyarjeva mreža pa je močno liberalna.

"Strinjali smo se, da za to delo potrebujemo zunanja sredstva, " se spominja Kramer. "Ker bi ga, če bi ga financiral Facebook, ljudje nezaupanja rezultatom. Tako so danes. "Organizacije so se dogovorile, da bodo za enoletni pilotni projekt zagotovile skupno 11 milijonov dolarjev, ki ga bo vodil Social Science Research Council (SSRC), neprofitna organizacija s sedežem v New Yorku, ki bi prav tako potekala. postopek dodelitve nepovratnih sredstev.

"Ta struktura je imela smisel in ljudje, ki so jo vodili, so bili vrhunski, " pravi Kramer. "In začelo se je zelo dobro."

Julija 2018 je SSRC objavil razpis za zbiranje predlogov in aprila dodelil 50.000 dolarjev nepovratnih sredstev vsakemu od ducatov skupin znanstvenikov. (Izbrana je bila druga skupina od 13 skupin, ki še niso objavljene.) Prvi krog projektov vključuje študije o tem, kako bi lahko aktivnost na Facebooku vplivala na državljansko udejstvovanje in nedavne volitve v Tajvanu, Čilu, Braziliji in Nemčiji ter kako uporabniki se različno odzivajo na glavne in zavajajoče spletne vire novic.

Pohiti in počakaj

A kolikor je Kramer upal na edinstveno sodelovanje med Facebookom, Social Science One in finančniki, bo uspelo, je po njegovem mnenju napačno, da se je tako hitro premaknilo na začetku. "Vse to se je zelo hitro odvijalo, " pravi. Zdaj je jasno, pravi, da so vsi vpleteni podcenjevali čas, ki bi ga potrebovali za sprejemanje sprejemljivega načina varovanja zasebnosti uporabnikov Facebooka. "Skoraj vsa vprašanja [okoli zasebnosti], ki so se pojavila, so se pojavila, ker v resnici nismo imeli časa, da bi prečkali vse Ts in narisali Is, kot bi običajno, " pravi Kramer.

Štipendisti, kot je Joshua Tucker, profesor politologije in znanosti o podatkih na newyorški univerzi v New Yorku, so plačali ceno za to naglico. Januarja je njegova ekipa poročala o študiji, ki je pokazala, da so starejši ljudje delili sedemkrat več dezinformacij kot tisočletniki. Rezultati kažejo, da je digitalna pismenost lahko pomemben dejavnik pri tem, kako dobro lahko ljudje določijo resničnost tega, kar berejo na spletu.

Toda ta projekt se je opiral na tradicionalno raziskovanje z ljudmi, ki so privolili v deljenje svojega spletnega vedenja. In Tucker je želel iti dlje, tako da je povezal javno dostopne podatke, ki jih je pridobil od Reddita in Twittera, z nejavnimi podatki o uporabnikih, ki jih je posredoval Facebook. Podatki na Facebooku bi po njegovem mnenju ekipi omogočili "preizkušanje nekaterih naših hipotez" o tem, kako se novice, vključno z dezinformacijami, širijo po različnih platformah družbenih medijev.

Podatki o skupnih povezavah so bili z vidika varstva zasebnosti označeni kot nizko sadje, saj so vsebovali le zbirne informacije.

"Lahko bi vam povedali, da moški, stari od 25 do 35 let, ki živijo v zvezni državi New York, delijo določeno povezavo 1000-krat, medtem ko ženske iz Severne Dakote, starejše od 65 let, podatke delijo šestkrat, " razlaga o obljubljenem naboru podatkov. "Vendar ne bi vseboval vašega Facebookovega ID-ja ali hashtaga, ki bi mu sledil kup stvari o vas."

Zaenkrat pa Tucker - ki vodi tudi enega od štirih svetovalnih odborov, ki so pomagali širiti besedo o Social Science One - ne more dobiti dostopa do teh podatkov. To je zato, ker Facebook še ni spoznal, kako zagotoviti zasebnost pred objavo podatkov.

Izziv glede zasebnosti je postal jasen skoraj takoj, trdijo uradniki Kinga in Facebooka. Zlasti so spoznali, da tradicionalne tehnike zagotavljanja zasebnosti, ki temeljijo na anonimizaciji, niso več ustrezne. Računalniki so pokazali, da lahko prepoznajo posameznike, ki so vključeni v anonimizirane naloge podatkov, z uporabo ogromne računalniške moči, da zamaskirane podatke povežejo z drugimi osebnimi podatki, ki so že dostopni na spletu.

Glede na tovrstne zmožnosti so strokovnjaki za zasebnost na Facebooku povedali, da je podatke "narezal na pretanke podatke glede na demografske skupine in kolikokrat [so bili objavljeni spletni naslovi]", pojasnjuje en Facebook uradnik. Da bi zagotovili zasebnost, bi podjetje moralo podatkom dodati toliko statističnega "hrupa", da bi bili rezultati preveč izkrivljeni, da bi bili koristni raziskovalcem, pravi uradnik.

Facebook se je odločil, da bo uporabil drugačno zasebnost. Matematični pristop za dodajanje hrupa zunanjemu človeku ne more vedeti, ali so posamezni osebni podatki v določenem naboru podatkov in s tem zagotavlja njihovo zasebnost. Na operativni ravni, je pojasnil Facebook uradnik, je to pomenilo, da "potrebujemo nov nabor računalniških strežnikov, z novimi vrstami varnosti in z različno zasebnostjo, ki se uporablja za nabore podatkov."

Toda za dosego tega cilja je potreben čas. "Diferencialna zasebnost je vrhunska tehnologija, " pravi King. "Gre za zelo pomemben razvoj, vendar ni tako, da je na voljo programska oprema, ki absolutno deluje in je prilagojena vsem statističnim metodam. Tako smo ugotovili, da imamo leto ali več dela, ki ga nismo načrtovali. "

"Ne pozabite, to so raziskave, " doda King. "Če bi bilo enostavno, bi ga imenovali samo iskanje."

Tucker pravi, da so sodelavci vedeli, da v pogodbo s Facebookom vstopajo v "precej nespremenjene vode". "Prvotni načrt je bil omogočiti raziskovalcem, da delajo na zbranih podatkih in se pozneje lotijo ​​bolj trnovitega vprašanja diferencialne zasebnosti, " pravi. "Toda to je postalo nevzdržno."

Iskanje različne zasebnosti je prišlo "s stroški upočasnjevanja razpoložljivosti podatkov, " pravi. Toda to je "v zameno za matematično zagotovilo o zasebnosti", je še dodal, cena, ki jo je pripravljen plačati.

"Revolucija" na čakanju

Konec prejšnjega meseca sta konzorcij za financiranje in SSRC sklenila, da se je ura iztekla. V odprtem pismu SSRC so financerji zapisali, da "priporočajo prekinitev postopka nepovratnih sredstev, če in dokler ne bo na voljo več podatkov. … Nekateri ali vsi izmed nas bodo morda pripravljeni razmisliti o razširitvi ali ponovni uvedbi podpore, če bodo na voljo novi podatki z zadostno količino uvoza in vrednosti. "

Hkrati je SSRC izdal izjavo, ki se strinja s tem priporočilom, in opisal, kako bo "projekt prenehal do konca leta 2019." Raziskovalci, ki so že financirani, bi lahko obdržali svoje donacije, tisti v drugem krogu pa bi jih lahko financirali, če bi lahko dokončali projekt "s trenutno razpoložljivimi podatki."

Nekateri mediji v zvezi s temi objavami zamujajo kot še en primer, kako se Facebook obljublja. Facebookovi uradniki to oceno zavračajo, češ da je družba že od samega začetka jasno povedala, da je njena zasebnost najpomembnejša.

Tucker, Kramer in King pravijo, da verjamejo, da Facebook naredi vse, kar je v njegovi moči, da bi utiral pot raziskovalcem. "Mislim, da ne zavlačujejo, " pravi Tucker. "Vsi želijo, da se ta raziskava opravi. A je zelo zapleteno. "

Kramer pravi, da ne brani Facebookovih dejanj. "Vseeno mi je, če [zamuda] podjetju pomaga ali škodi, vendar pravi, da si Facebook resnično zasluži nekaj zaslug.

Kako se bo vse izkazalo, lahko vpliva na to, ali se takim prizadevanjem za izmenjavo podatkov pridružijo tudi drugi digitalni velikani, kot je Google. "Ko smo začeli, " je dejal Kramer, "smo upali, da se bo to zgodilo s Facebookom, nato pa povabili druge družbene medije, ki sedijo za podobnimi podatki, da se pridružijo in nam pomagajo do celovitega pogleda. A nobenega od njih ni zanimalo. "

Googlov uradnik potrjuje, da je podjetje zavrnilo sodelovanje, ko se je obrnil na Social Science One. "Odločili smo se, da počakamo in bomo videli, kaj se bo zgodilo s Facebookom, " pravi velikanski vodja javne politike v San Franciscu v Kaliforniji Clement Wolf. "In zelo nas zanima, kako se igra."

"Če Facebook uspe, " pravi Tucker, "bi lahko spremenil vrste spletnih podatkov, do katerih lahko raziskovalci dobijo dostop, in vprašanja, ki si jih lahko zastavijo ljudje, ki niso zaposleni na tej platformi. Facebookovi zaposleni to lahko storijo zdaj, mi pa ne moremo. "

Približno dva ducata uslužbencev Facebooka sta v preteklem letu preživela težavo in dosegla velik napredek. Prejšnji teden je denimo Facebook na voljo različno zaščitene podatke na približno 32 milijonih naslovov spletnih strani, ki so jih uporabniki Facebooka v zadnjih 2 letih javno delili več kot 100-krat. Podatki vključujejo informacije o tem, ali je bil naslov prijavljen, da vsebuje ponarejene novice, neželeno pošto ali sovražni govor, in kolikokrat je bil v skupni rabi, ne da bi nanj kliknili.

Ta izdaja je dobra za projekt, pravi King, ki meni, da je prekinitev financiranja zgolj težava na poti k večjemu sodelovanju med velikimi internetnimi podjetji in akademiki. Data polni polje, pravi. I družboslovje ima veliko več podatkov kot kdaj koli prej. Toda večina podatkov je znotraj podjetij in jih uporabljajo za lastne namene. Tako da mi kot znanstveniki nimamo druge izbire, kot da se dogovorimo z nekakšno pogodbo z zasebno industrijo.

* Popravek, 25. septembra, 10:25: Ta zgodba je bila posodobljena, da bi popravila ime sveta za družbene vede.