中国科普博览
与科学同行
只要一根头发就能知道你长什么样 这项神奇黑科技让真相不必再沉默
发布时间:2020-10-13
出品:科普中国
制作:郭菲 (烟台大学)
监制:中国科学院计算机网络信息中心

  910日,《自然》杂志报道了一种能够利用DNA重构人脸的AI系统。只需一点残留在犯罪现场的嫌疑人DNA样本,电脑就能绘制出该人的精确画像,协助警方更快地追踪犯罪嫌疑人,如此神奇的新技术不禁让我们这些“吃瓜群众”大呼黑科技万岁。

  

  利用DNA信息重构的嫌疑人画像(系1987年某一谋杀案件嫌疑人,已被美国警方依据画像抓获) 来源:Parabon官网

  其实,这套系统应用的技术虽然较为新颖,但绝对算不上是黑科技。而且,它很可能并不是凶案侦查技术的最优解,发展它的背后其实是技术进展对于伦理争议的无奈妥协。下面就带大家来了解一下DNA在刑侦技术中的各种应用,以及DNA重构人脸在其中所处的位置。

DNA破案不稀奇,可它的原理你真的了解吗?

  利用DNA破案的核心关键是必须获得犯罪嫌疑人的DNA,这一条件在大部分的凶案事件中都能得到满足。无论是多么狡猾的犯罪分子,完全抹除自己在犯罪现场的痕迹都绝非易事。警方采集到可疑DNA后,会采用各种方式寻找拥有该DNA的嫌疑人,这些方式大致可以分为两类。其一是通过解析这些DNA数据中特定的基因信息,得出犯罪嫌疑人相关的生理特征,例如性别、人种乃至发色、瞳色等等,这些生理特征对于警方缩小嫌疑人范围、确定突破方向都至关重要。另一种方式则是通过将采集到的数据与基因数据库中的个人DNA信息进行比对,一旦比对成功,就可以确定嫌疑DNA的归属。

  具体的比对过程又分为很多种情况,可以利用的技术路线也相当丰富。例如我们可以尽量地丰富DNA数据库的内容,把尽可能多的人类DNA数据纳入其中,这样一来嫌疑数据与库中数据直接吻合的概率就会提高。不过由于现阶段扩展DNA数据库还存在诸多的技术和法律课题,因此目前DNA数据库中的人类样本数量其实并不算非常庞大,至少远远达不到亿这样的数量级。所以实际应用过程中,直接命中库内样本的几率非常小,大部分情况是在库中发现和嫌疑人存在亲缘关系的人。

  存在血缘关系的人之间,会共享一部分相同的遗传基因,这也正是DNA亲子鉴定所依据的原理。例如儿子拥有父亲一半的遗传基因,兄弟之间各自拥有对方一半的遗传基因等。而亲缘关系越远,共享的基因量就越少。目前的比对技术已经可以确认四代以内的表亲(共享同一个曾曾曾祖父,即爷爷的爷爷的父亲)关系,只要DNA样本库中存在嫌疑人四代表亲以内的血亲,就可以首先将这位血亲筛选出来,再通过各种调查顺藤摸瓜确定嫌疑人身份。

  此外,近年来在凶案刑侦中屡有高光表现的Y-STR基因比对技术同样属于这一路线,它依据的原理是同一姓氏家族中的男性成员之间,Y染色体存在一定的家族特征,因此只要基因数据库中存在与嫌疑人同姓的男性家族成员,就能被筛选出来。白银案和南医大案的侦破过程中,Y-STR都发挥了至关重要的作用。

  

  来源:Veer图库

有了DNA比对技术,为什么还要用DNA重构人脸?

  看完了上一个段落中的讲解,相信有人会提出这样一个疑问:既然我们已经有这么多的办法来比对DNA数据,那利用DNA绘制嫌疑人的画像是否有多此一举的嫌疑?我们直接把嫌疑人的数据输入到库里进行比对,不就能发现嫌疑人的亲属,从而极大地缩小排查范围了吗?

  其实,通过DNA比对直接找到线索在现阶段还有两大问题。第一,由于刚才提到的各种DNA数据库规模都较小的原因,比对成功的几率仍然很低。白银案和南医大案在我国刑侦人员广泛采用类似的比对技术后,仍然花了很多年才破获,原因就是一直没找到比对命中的目标。例如白银案是嫌疑人家族中某男性亲属因涉经济案件而入狱,警方将他的DNA数据输入数据库中后才发现他与白银案嫌疑人存在亲缘关系。因此,如果能够通过DNA数据得到嫌疑人的样貌,对于案件的破获同样具有重大的意义。

  比对方式存在的第二个问题就是伦理争议,它包含很多的潜在议题。例如收集公民的DNA数据是否有法律依据;在公民不知情的情况下进行DNA数据的比对是否有侵犯公民隐私的嫌疑;大部分面向公众开放的DNA数据库,都不是以解决刑事案件为目的(主要目的是为了寻找失散的亲人等),如果违背上传者本意使用这些数据,是否涉嫌违反最初的用户协议;寻找嫌疑人家族成员的方式会不会造成歧视行为(例如当事人周围的舆论会有某某家族的人都是罪犯一类的议论)等等。

  

  南医大案疑犯麻某刚的速写画像与真人照片 来源:扬子晚报

  而利用DNA模拟嫌疑人画像的方式较好地回避了上述争议,它并不会涉及DNA数据的直接比对,因此不存在比对不成功或者比对过程中产生伦理或者法律问题的情况。实际上,本次得到《自然》杂志专门报道的DNA数据解析公司Parabon-Nanolabs正是因为面临伦理和法规困境,才将主攻方向从DNA比对技术转向了人脸还原。

  2018年左右,Parabon开始与警方合作,采用自己的技术将警方提供的嫌疑人样本与以寻亲为目的的公众DNA数据库GEDmatch进行比对。两年多时间内,相继协助警方破获了120起杀人、强奸案件。

  臭名昭著的“金州杀手”案件正是在此时取得突破,虽然本案的破获并非是Parabon直接参与,但他们采用完全相同的方法,且当时为警方提供技术支持的人员有多人后来加入了Parabon

  利用DNA数据比对技术,20184月,萨克拉门托警方逮捕了7080年代在加州犯下至少12起谋杀案、50起强奸案的“金州杀手”—— 约瑟夫 詹姆斯 迪安杰洛。之前几个月,警方在GEDmatch数据库中发现了2名迪安杰洛的疑似二代表亲,然后逐一排查、顺藤摸瓜,最终将其收入法网。

  金州杀手的伏法在美国引发了广泛的社会关注,评论对新技术普遍表示赞扬,称其为科学的胜利。但舆论在另外一起事件后却发生了反转,令事业发展顺风顺水的Parabon不得不转移主攻方向。

  201811月,一位71岁的摩门教信徒在教会的大厅内练习风琴时遭到不明身份人员的袭击和拘禁。警方根据破碎玻璃上携带的血迹,提取到了嫌疑人的DNA,经由Parabon分析,在数据库中找到了该DNA拥有者叔父(舅父)的情报,从而最终抓获了18岁的犯罪嫌疑人。

  这一事件本来是Parabon的一起成功案例,但令他们没有想到的是,舆论却普遍对此表示担忧。不少人认为这起案件并不是杀人或者强奸一类严重的刑事案件,是否存在技术滥用的嫌疑,毕竟GEDmatch的用户在上传数据时并未签署同意将自身数据用于此类案件侦查的协议。对于个人隐私权的关注成为了舆论主流,瞬间将Parabon置于争议旋涡的中心。此后,GEDmatch和行政管理部门都收紧了对于DNA匹配的管理和审查,这也让Parabon不得不将重心转移到DNA还原人脸的方向。

  值得一提的是,除了能够还原凶手相貌,在确认面容高度毁坏的无名尸体身份方面,Parabon的面容复原技术也具有非常高的应用价值,且几乎完全没有伦理争议。下方左图是Parabon帮助警方复原的某无名女尸生前样貌,右图是女尸身上的纹身,上面的“Monique”应该是她的名字。

  

  “Monique”面容复原图和纹身 来源:纽约时报

  这样看来,DNA还原人脸的技术确实有它存在的价值,那么这一技术是如何实现的呢?

DNA人脸重构是如何实现的?

  从技术角度来说,利用DNA还原人脸介于上一段中提到的两种路线之间,既有对个别基因的定位,又有数据库样本间的比对。理论上,面容由遗传基因决定,但决定面容的基因绝非十个八个,而很可能是数千个、数万个。因此,如果逐个分离眼皮单双、瞳色发色一类决定面容的基因再将其进行综合,需要定位的基因数量过于庞大,基本上是不可能完成的任务。

  因此,Parabon采用人工智能和基因大数据相结合的方式,通过将人脸照片和对应的DNA数据输入自己开发的系统,训练电脑逐渐掌握基因和面容的对应关系。经过对几十万人样本的学习,电脑就能对特定DNA的主人进行面容预测。虽然这项技术虽然仍在发展中,但已经取得了令人惊叹的成果,尤其是相对于传统的嫌疑人速写,DNA人脸重构技术稳定性与准确性都有所提升。

  在“金州杀手”案件破案后,人们就发现根据目击者描述绘制的嫌疑人速写实际上对破案的帮助相当有限。如下图各版本速写中,与真人照片(最左)相对接近的可能只有一到两幅(例如最右)。传统方式的嫌疑人速写很多时候反而起了误导警方的反作用。

  

  迪安杰洛犯案期间的真人照片以及不同地区警方提供的画像 来源:维基百科“金州杀手”条目

  在我国,类似的DNA比对技术近年来在陈年积案的破获过程中多次立功,民众对此普遍持欢迎态度。与西方社会有所不同,我国在强调个人隐私的同时更加强调公共安全,因此民众对于这项技术的应用也表现出更高程度的理解与配合。Parabon公司的负责人持有同样的观点,“你有隐私不被侵犯的自由,你同样也应该有不被杀害、不被强奸的自由”。

参考文献:

The controversial company using DNA to sketch the faces of criminal

Parabon Nanolabs Faces Controversy for Using Supposedly Private DNA Database to Identify Criminals

Using DNA to Sketch What Victims Look Like; Some Call It Science Fiction - The New York Times

“科普中国”是中国科协携同社会各方利用信息化手段开展科学传播的科学权威品牌。
本文由科普中国融合创作出品,转载请注明出处。

中国科学院科普云平台技术支持,中国科学院计算机网络信息中心运行
文章内容仅为作者观点,不代表中国科普博览网、中国科普博览网运行单位、中国科普博览网主办单位的任何观点或立场。
科普中国系列品牌网站: 科普中国
关闭
中国科普博览版权所有 Copyright © All Rights Reserved
京ICP备09112257号-28,-43   京公网安备11010802031770号