人脸识别核心算法技术(精选8篇)
分析人士称,人脸识别领域的投资预计还将继续增长。由于中国人口众多和集中式的身份数据库,中国在人脸识别技术上取得了长足的进展,同时也催生了一批颇有前途的人工智能初创企业。而通过使用复杂的人工智能算法,许多创新型的中国科技初创企业也与有关部门展开合作,在金融服务、零售和旅游场景中部署面部识别系统。
那些推动AI技术落地的幕后功臣,让我们看看谁最牛吧!
1、SenseTime 商汤科技成立于2014年,专注于计算机视觉和深度学习方面的原创技术,是全球领先的人工智能平台公司,目前其研究领域已经扩大到了自动驾驶和增强现实,与麻省理工学院、华为小米等诸多高校和企业建立了合作关系。
商汤科技2017 年 7 月获投 4.1 亿美元 B 轮融资,引起业内极大的关注,创下当时全球人工智能领域单轮融资额纪录,成为世界级的人工智能独角兽企业。2018年4月份,商汤科技完成了6亿美元的C轮融资,由阿里巴巴集团领投,新加坡主权基金淡马锡、苏宁等投资机构和战略伙伴跟投。商汤科技表示,本轮融资结束后,其估值超过45亿美金,继续保持全球总融资额最大、估值最高的人工智能独角兽地位。
而在团队方面,2017 年左右商汤团队就已有 700 人,其中有 120 位拥有博士学位。商汤科技现已在香港、北京、深圳、上海、成都、杭州、日本京都和东京成立分部,汇集世界各地顶尖人才,合力打造一家世界一流的原创人工智能技术公司。中国“智”造,“慧”及全球。
2、Face++ 北京旷视科技有限公司成立于 2011 年 10 月。成立之初,旷视科技获得了联想之星天使融资;2013年获得创新工场百万美元 A 轮投资;2015年获得来自启明创投、创新工场2200万美元B轮融资;2016年获得建银国际、富士康集团融资。在2016年底完成新一轮的1亿美元融资后,旷视科技的估值已至20亿美元。据彭博社援引知情人士消息称,旷视科技正进行至少6亿美元融资,参与融资的投资者包括阿里巴巴和博裕资本(Boyu Capital)。此后该公司将寻求进行第二笔融资。本轮融资后,旷视科技将会用筹得资金的主要部分用于支持零售领域,包括将其技术用于无人商店。
旷视以深度学习和物联传感技术为核心,立足于自有原创深度学习算法引擎 Brain++,深耕金融安全,城市安防,手机 AR,商业物联,工业机器人五大核心行业,致力于为企业级用户提供全球领先的人工智能产品和行业解决方案。发展至今,旷视已在北京、西雅图、南京设立独立研究院,并在十余个核心城市设立分部。在“赋能机器之眼,构建城市大脑”的愿景下,旷视人正在推动人工智能技术在中国及全球范围的产业落地,并通过打造 MegCity 城市大脑数据平台为构建智慧城市、平安城市基础设施而奋斗。
3、云从科技
背靠“计算机视觉之父”,中科院实验室创业团队创立人工智能国家队
在人脸识别三大“独角兽”中,成立于2015年的云从科技是年轻但也是务实的一位。在成立两年多的时间,云从科技迅速击败其它老牌明星竞争对手,让100多家金融机构成为其客户,安防产品在全国23省上线,并与中国科学院重庆研究院合作,覆盖了全国80%的枢纽机场,成为银行、机场行业的第一大供应商,树立安防行业的标杆。风格与一般的互联网公司不同,塑造了极深的护城河。2017年11月,云从科技完成B轮融资,获得25亿元发展资金。
云从科技团队成员除了来自中科大的校友外,还来自中国科学院各大研究所、UIUC、IBM、NEC、MicroSoft等全球顶尖学府及研究机构;云从科技之所以称之为国家队:
一是因为它是中科院入股的纯中资背景,没有采取一般互联网公司的VIE架构;二是与公安部、四大行成立了联合实验室,成为唯一一家同时参与制定人脸识别国标、行标的AI企业。
三是它在2017年3月入选国家发改委“人工智能基础资源公共服务平台”建设,为未来商业社会运行提供AI服务。
4、依图科技
依图科技曾于2013年8月获得真格基金天使轮投资,2015年1月完成高榕资本A轮投资,2016年6月完成云锋基金领投的B轮投资,2017年5月完成来自云锋、红杉等机构的3.8亿C轮融资。
与商汤科技、旷视等国内知名的人工智能公司不同,创立于2012年的依图科技以To B业务起家,是“AI独角兽”中最早将人工智能应用于安防领域的公司,官方信息显示,目前其安防产品已应用于中国近30省。
除了招兵买马大力拓展安防、金融等业务,依图科技在完成C轮融资后迅速扩张,2017年12月,依图科技与IDG联合投资了AI制药公司AccutarBio,促成了迄今为止中国AI制药领域最大融资之一。随后,依图科技又与红杉资本、云锋基金等联合投资了AI芯片公司ThinkForce。有媒体报道,其子公司依图医疗也已在2017年完成了单独融资。而在今年1月依图科技新加坡办公室的开幕活动上,依图科技联合创始人林晨曦接受新智元采访时还表示,依图科技接下来会继续进军语音识别和自然语言处理,希望在这两个领域也做到超越人类水平。
至此,依图科技的“AI版图”上已囊括AI安防、AI金融、AI医疗、AI生物制药和AI芯片几大板块,完成了AI生态的初步布局。同时,技术产品线覆盖计算机图像识别、计算机语音识别和自然语言处理,公司整体估值已突破23亿美元。
5、中科奥森
北京中科奥森数据科技有限公司于2015年9月在北京成立,核心创始人是“人脸识别教父”、IEEE Fellow李子青教授。李子青教授曾任微软亚洲研究院研究员,现任中科院生物识别与安全研究中心主任。创始团队来自于国内最好的人工智能研究机构——中国科学院自动化研究所,团队核心技术成员来自于清华、北航、法国、芬兰等国内外顶级学术和研究机构。并与中国科学院、北京航空航天大学建有2个国家级联合实验室, 进行完全自主知识产权的原创核心技术研究与应用开发。与此同时,成立人工智能研究院,保持核心技术的持续先进性,拥有100余项发明专利和软件著作权。
中科奥森的技术领域从专注于人脸识别已经拓展至机器视觉全栈技术,并形成了完善的产品线、解决方案,并且打造了一批顶端的行业客户案例。作为一家老牌AI企业,中科奥森可以说是这个领域内唯一一家专注于技术+产品+解决方案+应用,踏踏实实做技术和产品的科技公司,而不是在玩资本。
人脸识别[1]技术涵盖了数字图像处理、计算机视觉、 模式识别以及数学等多方面内容。目前,相关研究虽然取得了一些重要成果,但该技术在实际应用中仍存在很多问题。由于人脸五官分布的相似性,人脸表情、姿态、发型、 化妆的不同都给识别带来了困难。如何快速正确地识别大量人脸是目前急需解决的难题。人脸识别在身份认证、 信息安全、金融交易、国防安全[2]等方面应用广泛。人脸识别是对人脸部信息处理的重要研究课题之一,有很高的研究价值。人脸识别又是一个非常具有挑战性的课题,面临着诸多难题。
1基于PCA的人脸识别方法
1.1 K-L变换
K-L(Karhunen-Loeve)变换是研究人员常用的特征提取方法。K-L变换也可称为主成分变换PCA,可以使大维数的数据集合简化。
依据K-L变换[3]流程,首先从人脸样本中提取出人脸关键特征。假设图像为N*N的人脸图像,一幅N*N个像素组成的图像则是一个N*N维的矩阵,人脸图像可以视为一个N2维向量的样本。但是由于维数太高,需要对这些特征降维。
不考虑类别标号,利用所有的样本估计总协方差矩阵为:
其中,X是由所有去均值的样本构成的N2*m维矩阵。∑称为总体散布矩阵,其维数是N2*N2。要对样本降维,要求∑正交归一的本征向量。由于矩阵维数过高, 直接进行计算比较困难。
由样本集组成的矩阵R=XTX,维数为m*m,通常m <<N2。矩阵R的特征方程是:
两边同时左乘X,得:
即:
记μi= Xυi,则上式变成:
这就是∑的特征方程。
因此,维数为m*m的矩阵XTX和维数为N2*N2矩阵XXT本征值相同,本征向量关系如下:
对本征向量归一化,得到∑的正交归一的本征向量是:
∑的秩小于等于m,所以∑ 最多有m个不为零的本征值。解出维数低的矩阵XTX的本征值和本征向量则实现了K-L变换。
每一个本征向量是一个N2维的向量,它具有一些人脸的特征,所以被称为“本征脸”(eigenfaces)。现在如果提取k个特征,其中每个样本则是k个本征脸的线性组合。选取k个本征脸能代表的样本之间的差异占全部差异的比如下:
一般选取出的本征脸个数k根据上式比例确定。每张图在k个本征脸上的投影系数是样本的新特征,后续分类即可实现对人脸的识别。
假设在本征脸中样本xi表示为yi= [yi1,···yik]T, μ是样本的均值向量,由选出的k个本征脸还原出原来的图像:
如果k<m,则重构出来的图像和原图像之间会出现误差,但一般不会对图像的识别造成影响,很多本征向量实际上是由噪声引起的。
1.2 PCA技术
简单而言PCA技术就是将人脸的特征空间进行降维,在构造新的人脸特征空间时,需要在原来的人脸中求得一组正交向量,新的人脸特征空间由原来人脸中求得的正交向量中的重要部分组成。这些重要部分组成了特征脸,因其保留了人脸形状,因此能够表征人脸的基本信息。 具体人脸识别步骤如下:
步骤一:将人脸数据库输入到算法中。在该部分需要将人脸数据库中的数据归一化,并将数据库中的人脸数据分成训练集和测试集用于后续的人脸识别,将n*n人脸空间转换成2n的形式表示。
步骤二:进行K-L变换,得到相应的产生矩阵。可以使用训练集的整体散落矩阵,记为:其中,μ是均值,m是训练集个数,而xi是第i个样本。在求取本征值和本征向量的过程中,为了减少运算量,将使用SVD定理进行降维处理。
步骤三:对图像的本征值和本征向量进行运算。SVD定理为:设X为一个随机矩阵,且矩阵维数为n×r,则在这个基础上得到:
正交矩阵:
正交矩阵:V = [v0,v1,v2,...,vr-1]∈ Rn×r,且VTV =I;
对角阵:Λ =diag[λ0,λ1,λ2,...,λn]∈ Rr×r,且λ0≥ λ1≥λ2≥...≥λr-1。
以上3个公式满足:;得到
∑表达为可得到矩阵:
由本征向量μi能够从∑推断出:
由于∑的维数较小,相应的运算量也变小,本征值排序降序排列为:λ0≥λ1≥λ2≥ .…≥λr-1,对应的本征值表示为μi,相应的μ0,μ1,μ,2,…,μM-1被称为特征脸,所有的特征脸又可称为特征脸空间。在特征脸空间中,大的特征属性值可以表示为人脸整体轮廓以及附近环境,而小的值用来表述细节特征。
步骤四:将训练集合和测试集合映射到特征空间中。 将全部的人脸图像映射到特征子空间,每一幅图像对应特征子空间的每一个坐标,该坐标有自己的坐标系数,这组系数代表相应的人脸图像。在一般情况下,一个特定的人脸图像可以通过多个特征脸的加权组合得到,用于最终的人脸识别。通过K-L变换产生的系数,即为y =UTf 。 经过相应的矩阵以及系数的转变,原始图像能够转变成新图像:
步骤五:对待识别样本进行分类。通过分类器将待识别的样本进行分类,分类方法可以是贝叶斯算法、SVM算法等。
2基于Fisher线性判别的人脸识别方法
Fisher线性判别分析(Fisher Discriminant Analysis)算法[4]是降低特征维数的一种方法。即把d维空间中的所有模式全部投影到一条直线上,然后将该模式的维数缩减到一维,并且需要同一类型的样本之间聚在一起,不同类型样本之间分开。而关于c类问题,需要c-1个判别函数。由d维空间向c-1维空间进行投影,假如d>c,关于样本的类内散布矩阵SW和类间散布矩阵SB定义如下:
式中,c为类别数;ni为ci的样本数;ui为ci的样本均值,;u为所有样 本的xij为ci类中的第j个样本。
为了找出一个矩阵W,使类间离散度[5]和类间离散度的比值达到最大值,散布矩阵的行列式的值是离散度的一种简单的标量度量,得到Fisher准则函数定义为:
当Fisher准则函数取最大值时,Wopt= [W1,W2,…, Wc-1]则是使类间离散度和类内离散度的比值最大时的最优投影方向。求解[W1,W2,…,Wc-1]特征值可以求出最优投影方向,即方程的前c-1个最大特征值对应的特征向量,即:
在SW可逆时,得到:
在求出特征向量[W1,W2,…,Wc-1]后,确定式(4)中c-1个判别函数,由式gi(X)>gj(X)可知,对于所有的i≠j有yi(X)>yj(X),则把X归为Wi类。
3结语
通过选用FERET人脸数据库和AT&T人脸数据库进行人脸识别实验,实现了人脸识别实验平台的效果,验证了两种人脸识别算法的有效性。基于PCA的人脸识别算法,主要被用来进行图像的特征提取,而基于Fisher线性判别的人脸识别算法,可达到将高维空间进行降维,映射到最佳鉴别向量空间中,求得最佳鉴别平面,并在图像的局部层级通过对图像纹理特征的描绘达到描述图像的目的,在图像的识别、检索以及分析方面有更多应用。
参考文献
[1]周德华,毛敏峰,徐浩.一种多人脸跟踪算法的研究与实现[J].电视技术,2005,275(5):88-90.
[2]王伟,张佑生,方芳.人脸检测与识别技术综述[J].合肥工业大学学报:自然科学版,2006(2):158-163.
[3]高建坡,王煜坚,杨浩,等.一种基于KL变换的椭圆模型肤色检测方法[J].电子与信息学报,2007(7):1739-1743.
[4]王芳.基于五官特征定位的人脸识别技术在防盗门中的应用[D].青岛:中国海洋大学,2006.
摘 要:本文设计一款应用于汽车防盗抢系统的人脸识别算法。迅速识别人脸区域,并在该关键区域执行后续程序。在人脸检测部分,应用Viola等人提出的Adaboost级联算法;人脸特征提取部分应用LBP(局部二元模式)结合PCA(主成分分析)降维的算法;在人脸匹配部分应用最近邻分类器来确定是否为已知人脸。
关键词:汽车防盗抢系统;人脸识别;Adaboost;PCA;LBP;最近邻分类器
中图分类号:TP391.4 文献标识码:A 文章编号:1006-8937(2016)02-0044-02
1 汽车防盗抢系统简介
1.1 现代汽车防盗抢系统简述
汽车防盗器是一种在车上安装,延长盗车时间,并增加盗车难度的装置。汽车防盗抢产品分类较多,根据不同的方式防盗产品可分为不同种类。汽车防盗抢设备按能否反馈汽车信息分:单向、双向;根据其防盗具体方式分为:刹车锁止、车门锁止、方向盘锁止、油门锁止、变速杆锁止或车轮锁止。按结构功能分为四大类:机械类、电子式、芯片式和网络式。而根据当前市场形势,汽车防盗抢装置的总体发展方向朝着更高智能网络芯片式发展。
单向电子防盗器是第一代汽车防盗抢产品,至今仍是市场主流产品。通过遥控器,车主可以在有限距离内进行汽车锁止系统的控制,其中包括:车门的开关、震动或强制车门开关警报,为钥匙到系统的单向控制。其优点可总结为:方便安装,成本较低,智能断电;其缺点科总结为:受到高频率信号的扰动会致使汽车防盗抢系统无法正常接收信号,质量不稳定即可靠性差。
随着市场的发展,第二代防盗抢系统产品逐渐形成:可视的双向控制防盗抢控制器。第二代产品即可远程遥控防盗抢系统,也能通过互联网络将车辆实时状态信息反馈给车主,具有更远的遥控距离。在汽车运行过程中若出现驾驶情况预期之外的动作发生,则汽车会将实时运行信息保存并反馈给车主(包括位置信息、车窗开启信息、车子运行状态)。其优点科总结为:超远程监控汽车行驶状态,具备智能断电系统,能根据汽车安全状态控制汽车启停;其缺点可总结为:安装程序繁琐、成本较高,而且正是由于这种繁琐的系统,令其操作变得复杂,错误报错率、错误操作,总体防盗效果差强人意,并且具有很高耗电量。
电子技术的发展和集成电路的出现给防盗器产品带来了新的机遇,第三代芯片式数码防盗器,它是现代汽车防盗器发展的主流方向,芯片式数码防盗器的原理是发动机的锁止、切断电路与油路,车辆只有在获取遥控钥匙信息时才可启动,而且需要钥匙中的密码新品与防盗抢系统的密码芯片成功对接才可启动。目前市场上多数汽车均采用此种防盗方式作为原配防盗器。
芯片式防盗系统与前几代汽车防盗抢系统相比发展更,最近研發的高端电子防盗抢芯片能够进行自我诊断,根据车主授权备用钥匙的数量,授权者能够读取防盗抢系统的工作日志。而且利用其专有的射频识别技术(RFID),车辆防盗抢系统能够准确有效的识别车主,车主走近或离开车辆时,系统可自动识别其身份并自动开启、锁止汽车。其优点可总结为:密码破译难度高,密码重复率低。而缺点有:损坏或丢失密码钥匙维护不方便,只能反厂,因为该防盗装置由汽车原厂生产。
随着网络技术的发展,产生了以网络技术为核心的第四代汽车防盗抢装置。这一代汽车防盗抢装置以 GPS卫星定位的汽车防盗抢系统为代表,主要依靠汽车点火系统的锁止,达到汽车防盗抢的目的。同时,这一代防盗抢系统能够通过 GPS 卫星定位到防盗抢系统,并将被盗抢的汽车实时状态信息、车辆准确的位置及警报信息后台发送到系统报警中心,这一代防盗抢装置属于网络式电子防盗器。这种防盗系统地优点是:实时性强,功能全,可以远程监控。缺点是:运行费用高,每月都要服务费用,另外系统存在信号死角,易受到破坏,价格昂贵,安装复杂。国外第四代防盗抢装置已安装蓝牙装置,这种非接触式技术是其新的优势,而国内并未普遍采用此技术。随着人工智能技术的发展,汽车防盗抢技术也朝着更加智能化的方向发展,目前市场上的汽车智能终端产品,将汽车防盗、报警、导航、显示、多媒体、远程控制等技术全部集成在一个终端模块上,即本文要讨论的汽车防盗抢系统。
基于人脸识别技术的防盗抢系统将实现一种新的具有人性化、智能化的汽车防盗抢功能。驾驶员进入汽车后,ccd镜头采集驾驶员头像进行人脸识别,若非指定驾驶员则汽车无法发动。即使是在车钥匙及遥控器被复制或丢失的情况下,其他人也无法开走车辆。
2 算法的模块化分类
根据系统功能,算法可分为系统启停模块,人脸识别模块。
2.1 系统启停模块
启动模块,驾驶员用钥匙或按钮接通电源,CCD镜头启动,进行一次头像采集。停止模块,若是已知人脸,系统待命,若是未知人脸,则系统切断发动机点火电路。
2.2 人脸识别模块
本系统将人脸识别模块分为四部分:图像预处理模块、人脸检测模块、人脸特征提取模块、人脸匹配模块。
2.2.1 图像预处理模块
使用黑白CCD镜头来简化灰度处理这一步骤。
2.2.2 人脸检测模块
矩阵求和示意图如图1所示。特征矩形根据实际人脸部位颜色深浅表示为深色和浅色。A,B所示为两矩形特征。C、D所示为三、四矩形特征。两矩形特征的值是黑色区域矩形内像素总和减去白色区域矩形的像素总和。依次类推。
Adaboost算法的三个关键点:积分图、分类器、级联结构。
②主成分分析法:假设训练图像有N幅,图像大小为m×n,图像维数为M=m×n,将第i幅训练图像转化为一维的列向量xi,并求训练样本的协方差矩阵S,大小为M×M。PCA提取的主元方向即为协方差矩阵S的特征向量。
2.2.4 人脸匹配
在匹配阶段,对现场采集的人脸头像按照以上步骤进行特征提取,得到M个特征值,?姿1≥?姿2≥...≥?姿m,并按照该顺序构成向量。求出该特征向量与样本特征向量间欧氏距离并与实验得出最大阈值对比,若小于等于该值,则是;若大于该值,则否。
3 结 语
人脸检测系统的整体流程,如图4所示。
高效的在检测到的人脸上进行识别匹配。
参考文献:
2008年,北京奥运会开幕式正式使用了中国自主知识产权的人脸识别比对系统;
2010年 4月 1日起,国际民航组织(ICAO)已确定其 118个成员国家和地区必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准;
2011年,Face book初次引入人脸识别技术,登陆人员可以免信息验证而激活页面;2012年3月6日,江苏省公安厅与南京理工大学日前签约共建“社会公共安全重点实验室”,开展“人脸识别”技术相关领域项目攻关;
目前,英国机场也开始启动人脸识别技术加强安检……
人脸识别技术自21世纪被引起中国,随着在各行各业的逐渐认识及应用,以及该技术水平的不断完善,现在已经被越来越多的推广到门禁和考勤等应用领域,被广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。
人脸识别技术是基于人的脸部特征对输入的人脸图像或视频流,首先判断其是否存在人脸,如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息;并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。广义的人脸识别包括构建人脸识别系统的一系列相关技术,如人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。
人脸识别有三大优势:一是其自然性,所谓的自然性是指该识别方式同人类(包括其它生物)进行个体识别时所利用的生物特征相同,是通过观察比较人脸区分和确认身份;具有自然性的识别还有语音识别和体形识别,而指纹识别和虹膜识别等因人类或其他生物不能通过此类生物特征区别个体所以是不具备自然性的。二是非强制性,被识别的人脸图像信息可以主动获取而不被被测个体察觉,人脸识别是利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而带有可被伪装欺骗性。第三个优点是非接触性,相比较其他生物识别技术而言,人脸识别是非接触的,用户不需要和设备直接接触,而同时能够满足在实际应用场景下进行多个人脸的分拣、判断及识别。
现行用于门禁和考勤环境的是一种多光源人脸识别技术,可以实现在多种完全对人体无伤害的辅助光源的条件下进行人脸识别,支持 PC(Windows/Linux)和ARM/DSP(Linux等)系统环境,现今的算法已经能够保证识别率、识别速度、误识率和拒识率等各项指标的优异性,确保短距离人脸检测捕捉。
目前在国内,人脸识别技术的应用案例最典型的莫过于通过人脸识别解决监狱系统门禁管理:监狱系统对于门禁管理历来是要确保万无一失,但监狱如一个小型化社会,包括监室、生活区、劳动车间、医务室、教学楼、禁闭室、值班室、餐厅、浴室、操场等不同区域,无论如何防范到位,随着犯罪分子的作案能力和作案手法的不断增强,单纯以刷卡、指纹等识别方式的监狱门禁系统存在很大的隐患与漏洞,监狱不得不投入大量人力物力加强门禁管理,其中包括警卫巡逻、警卫站岗、视频监控等。在现有的监狱管理系统如刷卡门禁和指纹门禁的基础上加入人脸识别门禁解决方案,能有效地控制识别进出人员的真实身份、防止越狱发生的可能性。将人脸识别门禁机作为前端智能识别设备,具备非接触和自动实现人脸开门等功能,从而有效地防止门禁卡的遗失、冒用和盗用,真正实现专人专用,防止他人冒用等情况出现;同时人脸识别门禁系统具有活体检测功能,能有效防止指纹被盗用,可以消除目前监狱门禁系统普遍存在的安全隐患,更大力度避免越狱事件的发生。
消费者在选购人脸识别产品时,有哪些注意呢?我们可以从以下六个方面来选择产品:
背景
2015年年末,央行发布了《中国人民银行关于改进个人银行账户服务加强账户管理的通知》,明确提出“提供个人银行账户开立服务时,有条件的银行可探索将生物特征识别技术和其他安全有效的技术手段作为核验开户申请人身份信息的辅助手段”。至此,这两年火遍天际的人脸识别终于得到了“正式名份”!将在银行大显身手的人脸识别到底能做什么?备受银行青睐的人脸识别真有那么“万能”吗? 目前人脸识别在银行的应用主要集中在自助终端、移动金融/营销和柜面系统三大方向。
“人脸识别”自助终端
“人脸识别”自助终端是当前银行应用最为普遍的方向,交通银行的自助发卡机、民生银行的VTM、农业银行的超级柜台等都是将人脸识别系统引入到自助设备中,利用人脸识别技术将现场采集的照片与已存照片、身份证照片进行比对并提供人脸相似值,工作人员即可根据相似值的高低判断是否直接通过或进行人工审核。
目前,用户可以在自助终端上实现自助开卡、业务变更、密码重置等个人业务,全流程电子化不仅节约时间和成本,也更加环保。不仅如此,银行工作人员也可以通过人脸识别自助终端实现一对多服务,通过客户自助办理+现场审核授权,原本只能服务一个客户的工作人员可以同时服务6-8人。
移动金融/营销
银行在开展移动金融/营销时,也经常遇到一个难题:在移动端如何确认客户身份?而人脸识别则可以较好的解决虚拟世界两端“你是谁”的身份认证难题:一方面用户可以借助于手机等移动设备的摄像头进行人脸身份核查,另一方面银行工作人员也可以通过便携性移动终端进行客户人脸身份核查,为客户办理业务。目前包括民生银行、攀枝花商行在内的众多银行已经开始基于多模态生物识别统一身份认证平台,通过人脸识别技术平台布局移动金融和移动营销:直销银行、远程贷款、大客户上门服务等都是典型应用。与此同时,该平台还具有强大的渠道管理能力,一旦前端出现报错情况,可以迅速反查、定位并进行修复。
柜面系统
1.人员注册: :在机器上按“MENU” —>管理员验证,进入系统—>登记用户
—>输入“工号”按OK—>人脸图像采集,完后按OK保存。第一次使用设备,管理员均未设定,按MENU,选择管理员配置,进入配置管理员模块 2.设备连接: 安装完软件(软件安装,参照光盘目录使用说明书),打开软件
(用户名和初始密码均为Admin)点击“设备管理”—> “添加设备”—>输入“设备号”,“名称”,“设备类型”,“IP地址”—>按“添加”。双击设备信息,测试设备是否连接,若已连接,则“连接状态”显示为“已连接”。然后点击“下载/上传数据”—>选中设备—>“导入设备人员信息”—>“查看设备所有员信工”,在左下角选中所有员工,按“下载至本地数据库”将员工信息从设备接收下来—>“全部保存”
3.人员修改:点击“人员管理”—> “添加”—>“添加同级部门”或“添加
下级部门”—>“输入部门名称”保存。,在“未分配”里面,选中要分配的人员,点击“员工调动”,把员工添加到相应的部门,然后在其部门修改员工的信息。
4.班次及考勤规则设置:点击“工作时间段管理”-—>“新增时段”—>输入
“时段名称”,“上班时间”,(根据上班的时间,在出勤时间段中输入相应的时间点,单击确定。)—>保存。进入“班次设置”—> “添加班次”菜单,单击添加需要的班次。在弹出的窗口中输入班次名称,班次类别,班次信息(根据情况需要选择相应的周期数,通过“插入时段”把合适的时间段插入到相应的时间内),考勤规则,单击保存完成班次属性设置。具体操作说明可参照光盘目录的使用说明书。
5.人员排班: 点击“人员排班设置”—>选择要排班的员工(部门或直接输入
工号姓名-查找员工)—>在人员信息表选中要排班的人员—>点击“人员排班”(针对规则排班,若是不规则班次则选择“不规则排班”)—>选中需要的班次—>“添加排班”然后关闭
6.记录采集: 点击“下载/上传数据” —>刷新设备,选择采集记录的日期—>
“下载设备记录”。可进入“考勤记录查询” , 选择部门,记录开始结束时间,单击“查询”,查看考勤的明细记录。
7.生成报表并打印或导出:点击“统计报表”—>选择部门,日期,报表的形
式—>“记录处理”,完成后,系统根据处理的结果显示该报表的信息。单击“报表预览”窗口工具栏打印,进行报表的打印或点击“导出数据”用EXCEL格式存储。
8.数据备份:在导航栏的“其他”单击“备份数据库与还原—>选择“备份数
1 2DPCA算法原理
人脸识别的关键在于提取特征空间,一般可分为以下3个步骤。首先将人脸数据库的部分样本用来训练,计算得出相应的投影空间。然后将训练样本直接投影在这个投影空间上,计算其特征矩阵即主成分量。最后将需要识别的图像投影在这个投影空间上,计算出主成分量,将其与训练样本的主成分量一一对比,识别人脸。
PCA算法在运算时,需要把二维图像相应的首尾相连转变成一维行或者列向量。然而当二维图像矩阵维数较大时,计算量也会变得相当繁重。为了解决PCA算法的不足之处,Yang Jian、David Zhang于2004年提出直接基于原始图像矩阵的算法,即2DPCA算法。该算法的优点是对原始图像矩阵进行计算,不必转变,这样使运算量得到相应的简化,这是人脸识别又一意义非凡的里程碑。
2DPCA算法的思想:设X∈R1×n,训练样本原始图像A大小为m×n,先把A经过线性变换的预处理过程以减小外界因素的影响,然后再根据Y=AX投影在X上,就可以计算出Y,Y∈R1×m。Y称为图像A的投影特征向量。怎样确定合适投影方向,找到最佳投影轴,需要借助Y的协方差矩阵Sx迹tr(Sx)的最大值,如下[7]
接下来求J(X)的最大值
设G为样本A的协方差
可求得G是一个非负n×n维的矩阵。假设训练样本总数是M,Ai(i=1,2,…,M)表示第i个人,G计算则如式(5)所示
其中,为所有训练样本的均值图像
由此可得
式(7)称为广义总离散度准则[8]。当J(X)最大,求得G的r个非零的特征值所对应的特征向量记为Xopt,称为最佳投影轴[9]。将A投影在这个Xopt上,就可以得到Y的最大总离散度。
这里取p≤r构建特征空间如下所示
这些特征向量既满足广义离散度准则,又相互正交[10]。
把前期训练和需要测试的样本分别投影在这个X1,X2,…,Xp空间上,可以获得相应的特征矩阵即主成分量。在最后识别阶段采用最近邻分类器,求出上一阶段两种样本主成分量之间的间距[11],以其最小为依据确认此人属于本数据库中的哪个人。
2 2DDPCA算法原理
利用PCA算法提取特征时,为了计算训练样本的协方差矩阵必须将原始图像矩阵先转变为一维列向量或者行向量,使得整个过程的运算量相当大。2DPCA算法在计算协方差上面更简单,针对原始图像,不必转换,在提取特征上相对直观。基于2DPCA算法提取的特征向量空间维数相对较大,占用内存较多,识别率还有待提高。本文提出改进的2DDPCA算法,首先利用2DPCA算法进行第一次特征提取,构建成训练样本集,然后通过2DDPCA算法进行第二次特征提取,最后再进行人脸识别。这样不仅有利于提高特征提取的识别率,还有利于压缩特征向量空间维数,加快识别速度。
2.1 第一次提取
假设训练样本集为{Aij∈Rm×n,i=1,2,…,N,j=1,2,…,K},其中i表示第i个人,即类别数;j表示第i个人的第j幅图像;N表示人数;K表示每个人的图像总数;M表示样本总数可表示为M=NK。
计算图像均值和协方差矩阵如式(9)和(10)所示
根据准则式(7)只保留最大信息量即G1前p个最大特征值
然后求其特征向量作为投影空间即特征空间X=(X1,X2,…,Xp),其中X1,X2,…,Xp两两之间相互正交化。为了求得特征矩阵,将{Aji∈Rm×n,i=1,2,…,N,j=1,2,…,K}向其投影,式(11)如下所示
其中,矩阵Yji∈Rm×p,主成分量[12]是Yji(1),Yji(2),…,Yji(p)。
将得到的{Yji,i=1,2,…,N,j=1,2,…,K}转置再赋值给Bji,(Yji)T=Bji∈Rm×p,接下来利用2DDPCA算法对新样本Bji处理。
2.2 第二次提取
计算新的图像均值和新的协方差矩阵如式(13)和(14)所示
只保留G2的前h个最大特征值,根据2DPCA一样的原理法则即保留最有用的信息量。然后求出它的特征向量即可组成最终需要的特征空间Z=(Z1,Z2,…,Zh),其中h≤p,Z1,Z2,…,Zh两两之间相互正交化。相应求出最终需要的特征矩阵Uji如下所示
其中,Uji(1),Uji(2),…,Uji(h)就是本文经过两次特征提取获取的主成分量。
2.3 识别阶段
为了获取相应的特征矩阵Ut和主成分量Ut(1),Ut(2),…,Ut(h),将需要检测的图像ω在Z=(Z1,Z2,…,Zh)上进行投影,Ut表示为
本文利用最近邻分类器,它是根据最小距离来确定人脸图像到底是属于哪个类别,将需要识别的图像特征矩阵和所有训练样本的特征矩阵一一对比,当其之间距离最小则可以确定。距离度量准则[13]如式(17)所示
其中,表示两个特征向量间距。若,则可以确定ω是训练样本中的第k个人。
样本A通过2DDPCA算法提取得到的特征矩阵U是p×h维的,而通过2DPCA算法提取的特征矩阵Y是m×p维的,其中h≤m,因此有效地起到压缩特征矩阵维数的目的,减少了维数,有利于提高分类识别速率。
3 实验结果
本文借助ORL库和Yale库来完成以下实验。ORL库40人,400张人脸图像,Yale库15人,165张图像。ORL库人脸图像倾斜变化和旋转变化20%左右,光照和表情变化轻微,部分人脸图像如图1所示。Yale库这些图像优点在于对比差异特别明显,包括左光源和右光源的不同对比、是否戴眼镜的对比和大幅度表情变化的对比。
根据上文的分析,这里只保留h(h≤10)个特征值及其特征向量。取图1第一张人脸图像作为实验样本,可以得到h不同取值时的各重建子图。h=1,3,5,8,10时的各重建子图像如图2所示。
通过图2可以看到,第一幅子图涵盖的原始图像信息量是最多的,而其他子图相比第一幅明显要少很多。经验证,随着特征值h的不断增加,则提供的信息量已不能明显改善识别率。通过图3对比特征值和图像信息量,可以知道,特征值h取值越大,原始图像的信息量越小。当h<5时,人脸信息有一定的保留,但当h≥5时,可提供的信息量趋于0,几乎无法重建人脸图像。因此,在本文的新算法中,选取的h不大于5。
重建公式
根据重建公式将多个子图相加就可以获得一个无限接近原始图像的重建图像,如图4所示。图4上边A'是基于2DDPCA算法根据式(19),下边A″是基于2DPCA算法根据式(18)。通过对比可知,2DDPCA算法当h=5时,重建的图像看起来很清楚,与原图像很接近。而2DPCA当p=10时,图像还没有重建好,需要更多的特征值进行重建。
图5和图6分别是在ORL、Yale人脸数据库上实验得到的特征空间维数(自变量)和识别率(因变量)的关系图。在图5中,当自变量取10时,2DDPCA的因变量高于PCA约10.5%,高于2DPCA约8%;当自变量取30时,2DDPCA的因变量高于PCA约8.5%,高于2DPCA约3.5%;当自变量取55时,2DDPCA的因变量高于PCA算法约5.5%,高于2DPCA约1.8%。2DDPCA算法的识别率在自变量较低时比PCA、2DPCA算法要高很多一部分,随着自变量的不断增加,虽然与其他两种算法识别率之间的差距在缩小,但仍然是三者中最好的。后面的实验将特征向量维数取为55维,主要是因为不是自变量越高,因变量越好,随着自变量达到55左右时,三者的因变量也达到峰值,当自变量越来越高,反而会降低因变量。
当自变量取10时,PCA、2DPCA、2DDPCA三种方法在图6上的识别率分别为76.3%、80.2%、86.7%,相应的取值条件下图5中3种方法的因变量分别为79.5%、82%、90%;随着自变量增加到55时,图6中3种方法的因变量为86%、90.5%、92%,图5相应的因变量为87.5%、91.2%、93%。图6各方法识别率相对低于图5,主要是因为图6用于实验的Yale数据库图像光照表情变化较大,对识别率造成了影响。在外界环境变化较大的这种情况下,2DDPCA算法识别率仍然优于PCA、2DPCA算法,可见2DDPCA算法具有很好的鲁棒性。
为了测试训练样本数目对识别率的影响,分别在ORL、Yale库上进行实验,得到相应的关系图如图7、图8。实验中,将特征向量维数值取为55,再将训练样本数从1取值到5,记录3种算法识别率的变化情况。由图7和图8所示的实验结果,可以发现不论是变化轻微的ORL数据库还是变化明显的Yale数据库都随着样本数目的增加,PCA、2DPCA、2DDPCA算法的识别率不断提升,但当样本数增加到3个以后,识别率将不明显上升,可见样本数不是越多越好,在2DDPCA算法中,样本数选4~5个即可满足要求。
ORL和Yale库的3种识别算法的识别时间如表1所示。表1的各种算法所需的识别时间都明显大于表2,主要是Yale数据库训练样本人数相对ORL数据库较少。在进行训练前期准备工作时,样本数取1,3,5,ORL库用于训练的总人数分别为40,120,200,而Yale库则分别为15,45,75。由表1、表2可知,在识别速度上来看2DDPCA算法明显比PCA、2DPCA算法要好的多。主要原因是PCA算法的识别率,因其识别率相对较低,必须对比多次才能正确识别,易浪费时间。而2DPCA算法需要增加相应的识别时间,是因为X=(X1,X2,…,Xp)的维数大于Z=(Z1,Z2,…,Zh)。
ms
ms
4 结语
危急学生人身、财物的安全新闻随意可见,解决问题的关键是,提高安全、加强安全。给传统的人防,配上一把好的“武器”,人物联防,实现现代化管理,是学校更用心的表现。
创合人脸识别——校园寝室门禁系统
针对学生宿舍安全管理,以及在校学生夜不归寝,导致学生人身安全.学业.得不到妥善保障的解决方案及建议。
在当今 充满诱惑物欲横流的社会,充满好奇、缺乏分辨能力、自主意识薄弱的学生最容易学会夜不归寝并且无法自拔,还有甚者引以为荣,逐渐的人数越来越多。从而影响了学业,威胁学生的人身安全。
我公司提出以下解决建议方案,希望可以改善现阶段夜不归寝的问题。
1、使用意义,重要作用:
1.降低校园被盗事件的发生,往往偷盗事件发生的两个因素,第一是学生防盗意识薄弱,第二是校园硬件设备滞后。而其中一个环节的提高,都会使得偷盗事件发生率的降低。传统的监控设备,起到作用是方便案件发生后的追查。而人脸识别的门禁设备,是把事件的发生制止与未然。把犯罪嫌疑人止于门外。
2.提高安全,解决潜在隐患。因为钥匙、磁卡可复制性,以及流动性强,决定了一旦钥匙丢失、或者传递,便使得宿舍楼处于亚安全状态,无形中增加管理难度。斯盾洛克人脸识别机器采用,人脸面部验证,不仅仅能确保出入人员的身份,更能记录下出入详细信息。通过软件设置,还能实现出入人员的管理(例学生在假期间识别无效,赋予假期留校生专门权限)。
3.减少舍管员工作量,提高工作效率,斯盾洛克人脸识别机器,将代替舍管员晚归登记工作。减少工作中舍管员与晚归学生接触的工作部分,降低因为晚归事件延伸,导致增加舍管员增加工作量的不必要工作。
4.降低学生因为夜不归寝发生事故的机率。首先明确一点,由于晚归发生事故的学生,绝大部分是经常晚归的学生,因为不常晚归的学生晚间的警惕性较高。所以,针对这点,能够及时获取晚归学生信息,晚归次数,集中管理部分晚归“惯犯”,不仅仅在校园管理上获得“蛇打七寸”事半功倍的效果,“枪打出头鸟”还能给予同学们警示。人脸识别系统,配备的管理软件,可以轻松的为你获取和管理晚归人员信息。
2、人脸识别门禁系统
系统支持人脸识别的门禁系统,并过可通前端监控摄像机进行联动功能,有效将门禁通行人员照片做为对应视频文件后期查询的标签,将视频定位到指定人员。
2.1、系统结构
系统采用网络版人脸识别出入口控制系统,每套门禁均为嵌入式设备,设备可以联网管理和管控,每台设备均连入校园的内部局域网,服务器可架设在监控主控中心,以便进行实时管控,校领导办公室也可安装客户端程序,能进行日常管理和事件查询。
2.2、主要功能
利用人脸识别技术精确辨识出入口人员身份。
利用人脸识别技术辨识进入各层大楼人员身份,只有登记了人脸特征的用户方可进入指定区域。人脸识别技术具备唯一性、永不丢失性,可有效解决卡片、密码等介质忘记携带、易丢失、易复制弊端,大大提高安全性。
联网版门禁可有效实现单点登记,然后再根据权限将用户分发到指定门点,有效简化工作。
设备为 TCP/IP联网门禁,因此能够有效的实现集中登记,在得到领导的权 限分配和管理规则以后,只需要给已登记人员分配指定权限,即可实现马上在其 他门禁点根据权限通行功能,所有人员无需在其指定门点进行登记,大大简化管理工作,有效提升管理效率。
各楼层门禁点可分权限通行,指定人员只能进入到指定楼层,有效提升管理。
权限分配可以根据指挥中心实际的管理要求进行配置。人脸识别门禁可简单的设定已登记人员的通行权限,如:2楼工作人员在未取得 3楼或者其他楼层通行权限时,只能进入到指定区域,同时也可设定领导、安保巡视人员、管理人员等人群具备通行所有楼层门禁点的权限。
各楼层门禁点可以设定指定人员的通行时间段,将管理做到更精确。
各楼层的门禁点均可针对某些指定人群设定通行时间段功能,如:可以设定保洁人员仅能在7:00-8:00进入办公大楼进行清洁工作,设定以后,保洁人员在除设定时间段以外的其他正常的办公时间均无法进入办公大楼,以免影响正常工作,也可有效督促保洁人员必须在指定时间进入大楼清洁,否则其无法完成其工作任务,将管理做到更加精确。
各楼层门禁点可以有效保证巡更人员到点到位的工作管理。
门禁的识别记录中包括事情最基本的四大要素:人物、时间、地点、事件等四大要素,记录中包括识别人员姓名、验证时间、开门事件、人物现场验证照片等基本要素,因此能够有效保证巡更人员必须在指定时间到达指定地点进行验证的巡视管理,有效避免未定点、定时巡更所造成的风险。 特殊、紧急时间的处理方式简单、实用,也符合消防要求。人脸识别门禁为联网版门禁,在管理平台中提供了方便实用的特殊事件处理机制。
如:其他各级领导参观、巡视时,可在管理平台中将所有联网门点一次性全部开启,在未回复常规门控之前均可以不验证通行。
如:消防等自然灾害事件发生时,管理中心可以一次性将所有联网门点全部开启以方便通行。
安保中心发现某楼层已经有不法事件在实施,可以将某楼层门点锁闭,此时不法分子,即便在门内通过出门按钮也无法开启门锁,确保安全。 安保中心能够直观形象的查看需管控门点的各类实时事件。
人脸识别门禁具备其他生物识别技术所不具备的优势,即可以轻松的提取现 场验证人员照片。视频监控系统的后端管理平台可以接入前端的人脸识别设备的摄像头,在主控中心能够直观形象的看到需管控的各联网门点的实时通行情况,也可看到门点各类告警事件,以便快速反应。
软件管理平台具备多管理端模式,可以分权限、分级别进行管理,操作记录一一记录,方便后查。
采用 ICP/IP协议联网的专业人脸识别门禁控制系统,领导可以根据权限分配给管理中心技术人员、值班室安保人员等不同的管理和查询权限,领导、管理中心、安保中心值班室均可在办公室通过管理平台即实现管控、查询、浏览所有联网门点的实时情况。每个操作人员登录后所做的操作记录均有保存,以备后查,让多级监管更规范。 具备其他专业门禁功能以及多重化人性化设计。
特殊场合门禁(领导办公室)还可配置可视对讲以及遥控功能开门功能,方便来访控制以及远程开门方便性。
设备还具备多重专业门禁功能,如:N+1验证开门(技防+人防的双重确认方式)、胁迫开门方式、领导特权密码授权远程开门方式、防尾随联动互锁等各种专业门禁功能,满足不同场合需求。
设备具备多重人性化设计:如定时工作计划、时间同步、告警语音提示等,让工作和管理更轻松。
人脸识别门禁与视频监控系统的联动。
设备可以与视频监控系统进行联动,门禁点与对应摄像头进行事件的联动,以便快速准确将视频录像定位到人。
如上图所示,门禁点一可以与摄像头一、二绑定形成联动关系,形成联动关系以后,门禁点会保存合法(或非法)用户通行照片、时间等信息,并将照片做为此用户对应视频查询的标签,当需要查找指定门点、指定用户的视频录像时,点击此用户门禁点通行照片,马上就调出此用户在这个门禁点通行时对应摄像头一、二的视频,让事后追溯查询迅速、直观、有针对性,屏蔽了冗余视频的查看时间。
通过给人脸设备和报警主机绑定通道视频。实现了智能同一化的管理,一旦设防区域触发报警,可直观的在管理平台上显示,将人防相应时间压缩到最短时间。
将通道视频绑定相关设备,和选择设备中布置好的防区
管理软件中直观体现,防区、通道位置,和门禁进出实况
发生报警单击报警图标,查看通道视频
2.3、主要应用场合
2.3.1 校园办公大楼出入口控制系统
随着经济的快速发展,出入口控制系统已经成为企事业单位必备的系统之一,当前校园办公大楼仅有大门有些已经有传统出入口控制系统,有些还没有加入出入口控制系统,传统出入口系统主要为密码、卡片、指纹等门禁系统。此类型系统有些容易丢失、复制而无法精确辨识身份,而指纹只能留下通行记录而无实际通行实时照片,且当前“指纹套”的出现,带来了一定的安全隐患,因此均有不足。企事业单位提升整体形象,加强各类人员身份的辨识需要更新更先进的技术来解决以上问题。
人脸识别出入口控制系统,采用当前国际前沿的非接触式的人脸识别技术做为辨识身份的依据,能够有效解决卡片、密码被复制和遗失风险,能够轻松,使用时无需接触设备,使用方式非常符合人类与生俱来的辨识习惯,且能留下通行时的实时照片,人脸识别出入口控制系统具备众多专业门禁所需功能,完全能够满足校园办公大楼出入口控制要求。系统采用专业人脸识别门禁设备与管理平台结合的方式,门禁还能有效于视频监控系统联动,将安全掌控于轻松管理集于一身,能有效提升企事业单位的形象,有效提升管理效率。
总体示意图如下:
实际应用图示:
2.3.2 大学机房、实验室、器材室、物资仓库、领导办公室、女生宿舍等位置的出入口控制系统
校园的机房、实验室、器材室、国防教育器械室、仓库、女生宿舍等场合有着各种重要器材和设备,均涉及到准确判别进出人员身份的问题,因此出入口的安全,重要区域的保密要求非常重要。
人脸识别出入口控制系统能有效抵御非法人员入侵,能有效对非法入侵者做出快速反应,保留完善的事后查询资料,对犯罪分子产生巨大威慑作用,同时又能够及时发现事故隐患,预防破坏,减少事故发生。现代化的出入口控制的使用可以进一步提升综合楼出入人员的安全,对出入人员进行严密、科学、精确、高效的管理,以确保此类场合的事前的进出的身份辨识、事中的警示、事后的查询。
实际应用图示:
3、安装使用
1.顿诺克人脸识别机器,可以兼容原有的门禁设备(刷卡器),所以无需改动原有设备,以用户便捷为主,为保证识别速度在1秒以下,采用1:1的形式使用(刷卡加人脸),确保本人持卡进出,原有进出卡失效,遗失,或者转借他人都无法进出楼道。
2.如果原有进出大门没有使用电控门锁,需要增加电控设备。
人脸识别门禁系统应用图如下:
4、实现意义
斯顿诺克人脸识别系统在校园宿舍楼道的使用,以机器管理代替舍管员工作,将变得更精准更科学,是校园安全管理步入智能化重要的一步。
【人脸识别核心算法技术】推荐阅读:
人脸识别通道方案12-16
人脸识别监控考勤方案10-18
管理系统人脸识别11-09
模式识别技术及其应用06-24
射频识别技术在猪群生产管理中的应用论文06-25
吊装作业危害识别05-27
财务报表舞弊识别系统05-30
银行风险识别与评估06-21
客户身份识别工作指引09-06