2018年10月19日,由亿欧主办,思贝克联合主办的“BATi智慧城市论坛”在深圳万科前海国际会议中心隆重举办。本次峰会是亿欧今年5月举办的“GIIS安防AI创新峰会”的延续,上一次,亿欧关注人工智能等新技术对安防产业的赋能,这一次,亿欧将视野从安防扩散到整个城市。本次论坛以“智慧城市”为主题,不仅探讨了智慧安防新机遇,还将目光扩散到了智慧交通、智慧生活等智慧城市建设的多个领域。
中科院自动化研究所研究员、博士生导师孙哲南发表了精彩的演讲。
【孙哲南现场演讲实录】
演讲主题:虹膜识别新进展
孙哲南:大家下午好!非常高兴有机会来到智慧城市论坛,跟大家交流一下虹膜识别的研究情况。虹膜识别是我们课题组做了将近20年的一个研究方向。今天我主要从研究的角度来汇报一下我们的工作。
我给大家的报告提纲是虹膜识别。我们最近几年在三块都取得进展:第一块,虹膜成像设备新成像,特别是用光场成像技术,可以实现多目标同时进行虹膜识别技术。第二块,虹膜识别算法方面也有一些新突破,包括图像识别等各种提取。第三块,虹膜识别应用,包括国外项目,联合国一些难民营管理等。
虹膜识别第一步,需要进行虹膜图像采集,虹膜不像人脸和其他目标用普通相机可以采集。虹膜的物理尺寸小,人的虹膜只有11个毫米的直径,虹膜识别图像分辨率又要求比较高,导致虹膜成像景深比较小,用户眼睛必须放在光图上,特别是东方人都是褐色虹膜色素细胞,采用近红外光才能看清虹膜纹理细节特征。因此,虹膜识别采集过程中也会遇到很多难题。虹膜识别总体看,采集成了一个瓶颈,会导致虹膜识别的应用性不广,推广不是很多,反而是指纹用得多一点。虹膜成本高,应用起来不是太方便。但本质上虹膜的特征纹理,唯一性、准确性很高。第一步看如何解决虹膜成像问题。虹膜成像也是系统工程,涉及到各个方面,包括光学、机械、电子、算法各方面需要综合考虑。
已有的虹膜成像设备主要分成两大类,第一类是近距离虹膜成像设备,一米远距离内采集人的虹膜。也有一些国外公司开展远距离虹膜成像。比如开车过程中不需要下车,直接摇下车窗进行虹膜识别,包括边境通关、机场大流量情况下,远距离虹膜识别很有优势,我们提出一些新的虹膜成像解决方案。
虹膜成像的发展目标,有以下几个:
多模态的采集;我们研究过程中是想通过现有生物特征传感感知盲区。现在的成像设备,要么对虹膜,要么对人脸,要么对步态,能不能实现多模态的采集。
延长成像距离;新一代成像设备,成像距离非常有限,有的虹膜设备只能近距离很窄的有效的景深范围内,人数也很有限。目前虹膜识别基本一次只能识别一个人,但人脸识别基本可以做到多人识别。
多视角成像;比如可以多个视角姿态的人脸和步态呈现,包括多光谱,另外比如多维度的,3D人脸和步态。
虹膜成像技术路径从近距离到远距离,从静态到动态用户虹膜成像,从被动成像变成主动成像。虹膜成像设备都是固化的成像模式,用户需要高度配合设备。下一步研究目标是相机能自身对用户进行识别。技术路径是从单模态转向多模态,成像目标从一个人转向多个人,成像距离从近距离到远距离,实现多波段,通过采集近红外和可见光,实现室外场景,对用户的配合尽可能低。
因此,需要突破现有成像模式,我们认为现有虹膜成像模式是成像和认知计算分离,是感知,没有协同起来。感和知分离,成像是成像,大家对图象处理都是木已成舟的图象数字进行处理,显然对于识别不是最优的。本来成像和识别算法应该是一体化的。因此,我们目前也在研究一种新的成像模式,感知协同。成像过程中能引入一些认知任务的驱动,比如在成像过程中采用动态可变成的传感框架,可以自适应选择最优的波段、成像光学参数、最优的计算成像算法,对一个运动的目标进行主动式的成像。但现在主要是解决一些挑战性的问题,一是如何扩展景深、如何远距离成像,如何多目标,多模态。虹膜图像研究已经将近20年历史,第一步也是解决了从无到有,近距离高清虹膜图像采集;第二步从单目到双目;第三步,由近到远;第四步,从固定到移动。
目前研究的成像技术框架和原来的成像有很大区别。成像过程中引入了认知物的驱动,认知任务对光学系统的参数和计算成像算法采用自适应处理。我们把光场成像看做新的革命性的成像方式,既记录光的强度也记录光的方向,可以得到四维光感数据,通过后处理扩展景深,在光场成像的研究成果,目前用在人机交互、光场显微镜、神经科学方面。
我们目前做光场成像,对虹膜识别两个价值,可以实现多目标大景深,先拍摄四维光场数据,然后进行后面计算成像处理,先拍照后对焦,可以对多个目标进行清晰虹膜成像。原来的虹膜相机一次只能对一个人进行成像,光场成像可以合理检测,对不同焦平面模糊度的曲线,真实虹膜和伪造虹膜会有显著区别。比如目前计算成像方式,远距离虹膜考勤,最远可以做到3米。目前已经虹星科技有一些量产产品,在深圳罗湖口岸推广虹膜识别技术,目前内部人员使用很方便。现在罗湖口岸很多人进出香港用一些假指纹。传统安检系统容易受到假的攻击。虹膜识别可以用在安全级别要求比较高的地方。
虹膜识别的算法,要面对得到图像。后如何进行处理,如何准确是别人的身份等关键性的问题。因为虹膜是黑色的,和白色巩膜之间环状区域,首先要进行定位,也要进行睫毛、眼睛遮挡的分割,虹膜的特征如何进行表达,如何进行合理检测。这些低质量的图像上,如何融合眼珠特征提高识别精度。
目前在图像分割和定位方面,实现新的算法。传统做虹膜定位和分割,基本都只能解决虹膜的分割,对图像中的象素进行语义标准,是虹膜区和非虹膜区,提出了多任务的神经网网络,并且带了主动视觉注意机制,实验效果得到非常鲁棒。不管是可见光虹膜成像分割、跨设备、跨场景的虹膜分割,都得到很好的效果。
另外,在如何进行虹膜图像特征表达方面,也有一个新的方法,非常高效、实用,传统的都是图像特征都是计算灰度或者小波、深度学习的绝对值,但我们是计算相对值,计算图像区域快之间相对的灰度,排序,这个区域比那个区域灰度值高,编码是1或者编码是0,编码效率很高,特征很稳定。因为即使有光照变化,灰度绝对值会发生变化,相对值还是很稳定的。我们可以应用在高效的芯片或者手机里,对虹膜进行处理。
提取定序测量特征,有很多滤波器参数可以选择,我们提出一个机器学习方法,选择最优方式对虹膜图像进行特征提取,可以提取最优的二进制和三进制,靠近虹膜区它的本征更加稳定可靠,有不同的成像尺度和距离,达到比较好识别效果。
移动终端光靠虹膜识别还达不到非常好的效果,同时融合虹膜和眼珠,眼珠区域的纹理特征,通过虹膜和眼珠的融合,错误率可以降低50%左右,在移动终端可以达到错误率可以达到千分之五左右,足够满足移动终端身份识别的需求。
虹膜用在安全级别很高的场合,有可能有人用假的虹膜或者戴美瞳,但我们发现假体虹膜纹理粗糙,活力虹膜纹理细腻,我们采用纹理分类,可以较好的区分活体和假冒虹膜图像,并且可以区分亚洲人和非亚洲人虹膜图像,用在大数据检索方面。活体检测方面也取得一些成果,用光场成像,既可以刻划眼周周围的特征,可以达到99%以上的活体检测精度。
目前虹膜识别应用在安检通关、反恐。比如新疆,很难抓到恐怖分子,因为他们可能拿个假护照或者整容回来,在新疆,所有出入口可能都要进行虹膜识别。也用在国外银行存款区域,移动支付、社保福利、公安司法、煤矿工人的考勤、门禁等等。虹膜识别整体增长速度非常快,每年复合增长率可以达到20%以上。
举例,我们授权一个国外的公司把虹膜识别技术用在联合国难民营管理,采用虹膜识别+区块链技术,用于管理联合国几百万难民。因为难民又没有身份证,就必须用虹膜识别来援助一些钱或者食品、救济品。
每个人可能两三秒钟就可以把虹膜成像注册,目前在中东、叙利亚、埃及等国家的难民管理。目前虹膜识别是唯一可以一对多的身份认证方式。目前没有任何一个银行只用人脸识别就可以取款,但国外几十家都可以用到,安全一对多大规模人群身份验证。目前人脸都是小规模数据库,几百人、几千人。这种虹膜可以用在几十万甚至几百万的一对多的身份认证,包括用在银行提款机,不需要密码,直接刷虹膜就可以取款。
除了人的虹膜识别,我们把虹膜用在宠物狗和马的管理。宠物狗都是几亿条的,身份管理传统是打电子标签,对狗是一个伤害。现在有些地方可以采用虹膜,对狗建立档案,每一个狗赋予一个身份证ID,包括宠物狗去宠物医院、日常管理。在虹膜处理宠物狗的识别还很难,目前也已经达到比较好的精度,实验了2000多条狗,准确率可以达到99.9%以上,可以解决宠物狗的身份确认和管理。目前这块市场正在推广。
我的报告到此结束,谢谢大家!