(CNN)在21世纪初,基因检测成为一种直接面向消费者的产品,不需要医生的参与,这种转变的后果可能会影响每个人。 新的研究发现,超过60%的具有欧洲血统的人可以通过匿名DNA样本进行鉴定,只需使用来自消费者基因数据库的数据即可。根据周四发表在“科学”杂志上的一项研究,这个百分比包括那些没有经过DNA测试的人。 “通常,我们考虑亲子鉴定,你可以找到父亲,你可以找到兄弟姐妹,但随着基因组学中更强大的技术的进步,你现在可以真正识别出第三代堂兄弟,甚至在某些情况下也是第四代表兄弟,”Yaniv Erlich说。该研究的主要作者和哥伦比亚大学计算机科学副教授。根据这项研究,一旦找到了远房亲戚,身份不明的“匿名”DNA就可以引导你找到一个特定的人。 去钓鱼? 根据Erlich及其合着者的说法,截至4月份,已有超过1500万人使用了直接面向消费者的基因测试。由于大多数基因测试公司允许其客户下载其原始遗传信息的文件,这*了其他公司的第三方服务,包括GEDmatch,它允许人们上传他们的原始数据以进行额外的分析,例如血统搜索。 这些服务吸引了许多人,包括寻求生物亲属的被收养者,因为它扩大了对最初测试公司的搜索范围。用Erlich的话来说,“你在更多的池塘中钓鱼,你可能会找到一些东西。” 事实上,GEDmatch专门用于家谱研究,在追踪难以捉摸的金州杀手嫌疑人方面发挥了重要作用。今年,调查人员通过使用犯罪现场DNA进行所谓的远程家庭搜索,在凶手横冲直撞结束近32年后抓获了一名嫌犯。搜索帮助执法部门确定了连环强奸犯和杀手的第三个堂兄,而另外的数据则将调查人员带到了一名嫌疑人身上,他们采取了标准的DNA测试来证实他的身份。 基于这一成功,Erlich及其合着者提出,远程家族搜索有望成为一种标准的调查工具,因此他们进行了一项研究,以了解其力量。他们首先分析了100多万个匿名基因组,这些基因组是由MyHeritage测序的,MyHeritage是Erlich担任首席科学官的消费者基因测试提供商。 “我们现在有一个超过175万人的数据库,我们基本上提供了一个测试,你可以了解你的过去并找到亲戚,”Erlich说,并解释说他和他的同事“想看看比赛的简介是什么你来自一个人。“ 该研究强调了欧洲人后裔的结果,因为“它恰好发生在我们数据库中最大的群体,”他说。 对于大约60%的基因被分析的匿名个体,他们都是欧洲血统,研究人员能够找到第三个表亲或更近的亲属。研究表明,对于这些人中约有15%的人来说,最近的亲属是第二个表亲或近亲。 接下来,该团队在GEDmatch上重复了这一过程,GEDmatch是一个不相关的网站,其隐私政策允许用户比较那些被其所有者指定为“公开”的匿名文件。 CNN已与GEDmatch联系以征求意见。 在这里,Erlich的团队发现这两个使用不同策略识别生物亲属的数据库提供了非常相似的结果。他说,这证明了该方法可以使用不同的数据库进行复制。 一旦找到亲属,可以ManBetX万博体育原生态体育客户端ManBetX电子竞技,万博体育水位高,万博体育投注官网通过构建家谱,重新识别匿名人员,搜索其他亲属,然后从那里进行三角测量,该研究表明该团队从她的“匿名”中重新识别了一名女性 - 尽管公开 - DNA信息。 Erlich指出,遗传数据库中包含的数据仅占美国总人口的一小部分。然而,一旦遗传数据库覆盖了大约2%的人口,他和他的共同作者估计,几乎任何人都可以与至少第三个表亲水平相匹配,并且可以想象通过DNA进行鉴定。 他们总结说,鉴于消费者基因组学的快速增长,这种可能性在不久的将来可能是可以实现的。 组合数据库 斯坦福大学(Stanford University)生物学教授诺亚罗森伯格(Noah Rosenberg)表示,埃里奇的研究“表明,金州杀人案不是一个异常现象。” “在很大一部分案例中,有可能使用该案例中使用的技术来识别DNA样本的贡献者,”罗森伯格说,他没有参与该研究,但也是另一项研究的高级作者。周四在Cell杂志上发表。 在他的研究中,罗森伯格和他的合着者希望看到“法医遗传学中常用的数据库是否可以与生物医学,家谱学和个人基因组学研究中常用的数据库进行交流。” 自20世纪80年代后期以来,DNA证据一直在美国法院受理,从那以后,执法部门一直在收集DNA。罗森伯格说,由于每种类型的数据库都使用“基因组的不同部分”,因此他的研究中使用的技术与金州杀手案中采用的方法不同。 罗森伯格解释说,其中一位病理学家保留了凶手的DNA样本,这使得感冒病例研究人员能够回归,重新测序并识别出比典型法医报告中更多的遗传标记。 “如果无法获得DNA样本,那么通常可用的是法医遗传标记。” 由于执法部门的数据较少,当调查人员无法重新测试DNA样本时会发生什么? “科学上可以在不同类型的数据库之间建立链接,”罗森伯格说。 “我们能够找到非重叠遗传标记数据库中样本之间的匹配,超过90%的时间是来自同一个体的样本,而大约30%的时间是来自近亲的样本。 “为不同目的构建的不同数据库可能无法提供足够的信息来揭示一个人的身份,但通过组合来自多个数据库的信息,可以进行识别,”他说。 他和Erlich的研究“都是关于这个原则,即连接多个数据库会发现未包含在任何一个数据库中的信息,而这些信息可能不是那些制作这些数据库的人所想要的,”他说。 获取CNN Health的每周时事通讯在这里注册,每周二从CNN健康团队获得结果与Sanjay Gupta博士一起。 罗森伯格希望他的研究“将有助于促进法医遗传学,遗传隐私和血统测试中许多不同利益相关者之间的对话。” Erlich和他的合着者以减少滥用遗传数据库的想法结束了这项研究。首先,他们呼吁改变规则,允许诊所中的废弃材料进行基因检测。 Erlich说,在测试之前要求个人同意将“为人类受试者提供更好的保护”。他们还建议消费者遗传公司采用更好的加密策略,以便有“技术手段来区分合法和非法搜索”。 罗森伯格说,“这些想法值得一些讨论。另一个想法可能是关于什么类型的信息在法庭上被视为可接受的。”ManbetX带你领略世界杯中,主场三比零完胜塞维利亚,彰显出追分的信心