Našli vas bomo: iskanje DNK, ki se uporablja za ubiranje Golden State Killerja, lahko domuje pri približno 60% belih Američanov

Joseph DeAngelo, osumljeni Golden State morilca

Randy Pench / TNS / Newscom

Našli vas bomo: iskanje DNK, ki se uporablja za ubiranje Golden State Killerja, lahko domuje pri približno 60% belih Američanov

Avtor Jocelyn KaiserOct. 11., 2018, 14:00

Če ste vi belci, živite v ZDA in je daljni sorodnik svoj DNK naložil v javno bazo podatkov o rodovnikih, obstaja velika možnost, da vas internetni sleuth lahko prepozna iz vzorca DNK, ki ste ga nekje pustili. To je zaključek nove študije, ki ugotavlja, da bi raziskovalci lahko s kombiniranjem anonimnega vzorca DNK z nekaterimi osnovnimi informacijami, kot je nekdo iz stare starosti, zožili identiteto te osebe na manj kot 20 ljudi začenši z bazo podatkov o 1, 3 milijona posameznikov.

Takšno iskanje bi lahko omogočilo identifikacijo približno 60% belih Američanov iz vzorca DNK even, če nikoli ne bi posredovali lastne DNK v bazo podatkov o rodovnikih. Čez nekaj let bo res vse, pravi vodja študije Yaniv Erlich, računalniški genetik na univerzi Columbia.

Študijo je sprožila aprilska aretacija domnevnega Golden State Miller kalifornijskega moškega, obtoženega več desetletij starega posilstva in umora. Da bi ga odkrili in več kot ducat drugih kriminalnih osumljencev od takrat pravni organi pregona najprej preizkusijo DNK vzorca zločina, na katerem je lahko stara kri, lasje ali seme, za več sto tisoč markerjev DNK znaki ob genomu, ki se med ljudmi razlikujejo, vendar katerih identiteto v mnogih primerih delimo s krvnimi sorodniki. Nato podatke DNK naložijo v GEDmatch, brezplačno spletno bazo podatkov, kjer lahko vsakdo deli svoje podatke od potrošniških podjetij za testiranje DNK, kot sta 23andMe in Ancestry.com, in išče sorodnike, ki so oddali svoj DNK. Iskanje GEDMatch s skoraj milijon profilov je razkrilo več sorodnikov, ki so bili enakovredni tretjim bratrancem na kraju zločina DNK, ki so bili povezani z morilcem Golden Statea. Druge informacije, kot so rodoslovni zapisi, približna starost in mesta zločinov, so nato omogočile, da se slehti naselijo pri eni osebi.

Genetiki so hitro ugibali, da bi ta pristop lahko identificiral veliko ljudi iz neznanega zaporedja DNK. Toda za natančno določitev, koliko jih je Erlich in sodelavci podrobneje pregledali bazo podatkov MyHeritage, ki vsebuje 1, 28 milijona DNK profilov posameznikov, ki si ogledajo svojo družinsko zgodovino. (Erlich je glavni znanstveni sodelavec podjetja za testiranje DNK prednikov.) Če živite v Združenih državah Amerike in imate evropsko poreklo, obstaja 60-odstotna možnost, da v tej bazi imate tretjega bratranca ali bližjega sorodnika, je napovedala skupina . Njihova stopnja uspeha je bila podobna, ko so v GEDmatchu iskali 30 naključnih profilov. (Kvota za osebe iz podsaharske Afrike v zbirki podatkov MyHeritage pade na 40%.)

Ob predpostavki, da imate sorodnika v eni od teh baz podatkov, kakšne možnosti je, da bi vas policija našla iz neznanega vzorca DNK, na način, kako so pokupili domnevnega morilca Golden Statea? Erlich in njegovi sodelavci so podatke o zbirki MyHeritage združili z družinskimi drevesi in demografskimi podatki, kot so groba starost in verjetno geografska lega. V povprečju jim je to omogočilo uporabo hipotetičnega zaporedja DNK pri 17 „osumljencev“ iz baze okoli 850 ljudi, danes poroča ekipa Science.

GEDmatch verjetno obsega le okoli 0, 5% odraslega prebivalstva ZDA, vendar milijoni Američanov uporabljajo storitve testiranja DNK prednikov. Ko se številka GEDmatch dvigne na 2%, bo več kot 90% ljudi evropskega porekla imelo tretjega bratranca ali bližjega sorodnika in ga je mogoče najti na tak način. "Presenetljivo je, kako majhna baza podatkov mora biti, " pravi populacijski genetik Noah Rosenberg z univerze Stanford v Palo Altu v Kaliforniji, ki ni bil vključen v delo.

Rosenberg in sodelavci so lani pokazali, da se lahko profil v podatkovni bazi potrošnikov DNK ujema s profilom iste osebe v forenzičnih bazah DNK za pravosodje, čeprav uporabljajo drugačen, manjši nabor markerjev DNK. Danes v Cellu poročajo, da je več kot 30% posameznikov v forenzičnih bazah podatkov lahko tudi v zbirki podatkov o potrošnikih povezanih s sorodnikom, staršem ali otrokom. Dve vrsti zbirk podatkov bi lahko še lažje našli osumljenca iz vzorca DNK. Povezani profil DNK potrošnikov lahko razkrije tudi fizični videz ali zdravstvene podatke kriminalista ali njihovih svojcev, kot so geni za barvo oči ali bolezen, čeprav forenzične zbirke podatkov ne bi smele vsebovati takšnih informacij. "Z njimi je mogoče storiti več, kot je bilo zahtevano, " pravi Rosenberg.

Čeprav te študije spodbujajo novice za reševanje kaznivih dejanj, vzbujajo zaskrbljenost glede zasebnosti za državljane, ki spoštujejo zakon, pravi Erlich. Ena izmed možnih rešitev, ki jo je predlagal njegov tim, je, da podjetja, ki testirajo DNK potrošnikov, digitalno šifrirajo podatke stranke in da GEDMatch dovoli nalaganje le teh šifriranih datotek. Tako organ pregona ne bi mogel prenašati podatkov o zaporedju DNK iz lastnega laboratorija brez sodelovanja podjetja prednikov. (Policija se ne more samo pretvarjati, da je stranka, in pošilja vzorce DNK s kraja zločina podjetjem, kot so 23andMe, ker stroji za sledenje podjetja običajno ne morejo predelati skromnih, degradiranih vzorcev DNK.)

Erlich tudi meni, da morajo ameriški uradniki ponovno pregledati zvezne predpise, ki ščitijo ljudi, ki prostovoljno sodelujejo v raziskovalnih študijah. Nedavno spremenjena smernica za biomedicinske raziskovalce, imenovana Skupno pravilo, predvideva, da udeležence raziskave ni mogoče enostavno identificirati iz njihovega anonimiziranega profila DNK. Toda v svojem prispevku je Erlichova ekipa s pomočjo GEDMatch-a identificirala žensko, ki je bila del študije, z uporabo anonimnega DNK profila in datuma rojstva, ki je raziskovalcem pogosto na voljo.

Strokovnjaki za gensko politiko se strinjajo, da so potrebne spremembe načina delovanja ali urejanja genealoških baz podatkov in podjetij za zaporedje DNK. Digitalni podpis je lahko "delna rešitev, " pravi profesorica prava Natalie Ram z univerze v Baltimoru v Marylandu. Toda vsi akterji v industriji zaporedja DNK med neposrednimi do potrošnikov bi se morali strinjati s to shemo, ugotavlja. "Če ne, se vrnemo k kvadraturi."

Namesto tega sta se pred nedavnim v Scienceu trdila, da bi morale države in Kongres sprejeti zakone, ki omejujejo primere, ko lahko organi pregona uporabljajo genealoške baze podatkov za iskanje osumljencev. Morda je smiselno za primer umora, ne pa za sitno kaznivo dejanje, pravi Ram. "Pomembno je najti pravo ravnotežje."