人脸识别通道方案
人脸识别布控系统方案
北京众智益华科技有限公司
北京市海淀区清河三街同源大厦12层0926室
电话:010-62919824
网址:http://
一、项目背景及系统介绍
火车作为人们主要的出行工具,通过火车逃串的逃犯也较多。火车站作为人们乘坐火车的唯一进出口,在进出站行人中藏匿着各类特殊人群。当有需要对这些人员进行辨别、防范时,如何准确、有效地发现他们就成为车站公安,安保部门迫切希望解决的问题。
根据目前国内多数火车站进出站管理流程的模式来看,火车站的进站口、出站口、售票口都是旅客必经之地,在这类地区旅客的流动速度会放慢,就为拍摄照片及人脸比对提供了有利的条件。通常相关部门会在进出站口和售票处安装录像监控设备,利用这些地点的特殊性,通过人工进行辨认方式进行比对;或者直接排人员进行现场身份证抽查辨认。但人工查找和比对有很大的局限性,例如:面对大量的客流量导致的人工成本问题,人的记忆力有限,通常不能清楚地记住短时间接触的对象的面部特征;不能同时辨认多个对象;不能长时间保持注意力和辨认力等等。因此在这些主要地方迫切需要引入人脸智能识别比对系统,来提高安全防范的效率和效果。
北京众智益华综合智能视频联网监控管理平台(Integrated Intelligent Video Surveillance Network Management Platform,简称IVS)是分布式、智能化、网络化的视频智能识别分析、图像监控和集中信息管理平台。IVS利用现有的各种形式的数字网络,对监控前端经数字化压缩的视频信号,通过标准的TCP/IP联网协议,传输到监控中心进行智能化人脸检测分析识别比对,并结合分析结果与报警预案进行联动,从而达到智能化布控防范的作用。因此,IVS是集成了人工视觉/生物识别技术、计算机系统、软件、网络、通信、控制以及安全防范技术的综合技术平台。
本文将详细叙述通过北京众智益华科技有限公司的综合智能视频联网监控管理平台对28个车站,38个安检通道实现人脸识别布控的实现方案。
二、组网结构及系统构成
2.1 组网结构
(图一)
由“图一”可见我们采用了网络比对的方式把28个车站通过内部星形2M的网络进行连接,设置一个中心控制室,在中心控制室设置比对服务器,数据服务器,流媒体服务器等设备把火车站传来的视频进行分析比对,并把分析比对结果分别传送给中心客户端及火车站本地客户端,由客户端执行预警方案(比如声音报警,发生手机短信等)。
2.2 硬件产品构成
由“图一”可以看出,我们在拥有四个通道或三个通道的火车站采用模拟高清摄像机+四路CIF视频服务器的方式进行的原始视频采集,在两个或者只有一个通道的火车站采用标清的IP摄像机进行采集原始视频。
在中心我们设置数据服务器一台,比对服务器两台(比对服务器的台数来自于需要比对的图片个数及整个比对系统的速度,两台服务器能支持1秒2万张图片的比对),一台流媒体及存储服务器,大屏显示客户端,N个客户端。
28个火车站,38个通道具体设备列表如下: 模拟高清摄像机:7个 四路视频服务器:2个 标清IP摄像机:31个 服务器:4台
客户端机器:根据实际使用客户端的数量决定 2.3 软件产品构成
(1)综合智能视频联网监控管理平台一套,其中包括:数据服务器软件,流媒体/存储服务器软件,智能分析服务器软件,客户端(带电子地图)管理系统,大屏电视墙系统,人脸图库管理系统五部分组成。
(2)SQL SERVER数据库一套。
三、系统各模块详细说明
数据服务器
数据服务器需要连续工作,建议采用高稳定服务器,要求较高的场合建议采用双硬件冗余;WINDOWS2000以上操作系统,SQL数据库。(一)功能
设备的登录注册。设备冷启动、热启动或注销后,用设备唯一的ID号登录,合法设备(在配置管理服务器中配置)注册成功后,获取设备的硬件配置和工作参数,进入正常工作状态,非法用户拒绝登录。
用户的登录注册。用户采用用户名、密码和唯一的软件ID号登录,合法用户(在配置管理服务器中配置)注册成功后,获取用户可管理的前端对象,及操作权限,用户的级别。
认证服务器在收到用户布防请求后,进行权限判别,若请求合法,命令设备执行,否则拒绝,并给出相应的提示信息。(二)特点
集中权限管理。任何用户的权限改变能够即时反映到任何一个用户对任何系统的操作。
身份认证采用双因子认证,即口令与ID认证。
网络信息采用了SSL认证体系,保证了网络信令的安全。
用户的帐号支持一次性认证,即用户在访问不同子系统时,无需反复进行帐号认证。所有认证操作(包括成功的和失败的)都被日志系统记录并安全地保留,以备查阅。
用户的角色具有流动性。即用户操作的设备,权限只与用户名和密码有关,与具体的设备无关。
流媒体服务器/集中存储服务器
北京众智益华科技有限公司研制的流媒体/集中存储服务器,用于大型监控联网的企业级创新型的解决案,系统的硬件采用高端的服务器,兼备高端功能与可承受价格的先进存储系统,是经过验证的先进体系架构,连续的数据可用性和完整性,高级信息复制功能,功能强大的管理工具。从高、中、低端产品共享通用架构,可实现跨产品型号的平滑升级。(一)功能
流媒体转发。当网络中有多个用户访问同一个视频流时,虽然访问的是同一个视频流,但各自占用一个带宽资源,容易造成网络拥挤,影响视频的接收效果。众智益华在有质量(Qos)的多媒体网络传输上拥有独创性的核心技术,采用高效率UDP传输协议,自动穿透各种网络设备,根据网络结构自动启用单播技术,组播技术,也可强制制定,自适应网络流量控制,配合独创的编码,解码算法,在丢包率低于20%的情况下,仍然保证清晰流畅的视频效果,网络延时短,成功地解决了带宽资源和网络拥挤问题。设置流媒体转发服务器的目的在于缓解网络带宽紧张的区域,对该区域内的视频访问全部通过流媒体转发服务器软件模块来进行转发,使得该视频服务器的视频服务只占一个通道。流媒体网关。主要是实现异构设备和嵌入式设备接入,把不同设备的信令转化为统一的信令;把不同编码格式的流媒体数据转化为统一的流媒体格式;把不同的硬件控制协议转化为统一的控制协议从而实现异构设备的互连互通。
流媒体路由。支持双网卡或多网卡,实现跨网段联网监控系统。与不同的网络路由器相比,北京众智益华的流媒体路由设备,转发的效率高,在丢包率低于20%的情况下,视频仍然比较流畅,采用保护的语音数据延迟小,无噪声。
1.支持定时录像,报警联动实时录像。
2.支持前端分布式录像和后端集中录像的综合性方法。3.支持多路径数据存取,支持动态负载均衡与故障切换。4.存储服务器可选择DAS、NAS或SAN结构。
(二)特点
效率高。在普通P4,1G内存,双1000M网卡配置下,对1M的单路码流,单播转发300路的情况下,CPU占用的比例约为20%以下,音视频清晰流畅。网络功能强大。能根据交换机的性能,网络结构,服务的质量,自动启动单播或组播转发,无需人工干预,也可指定单播或组播。
支持异构设备多。众智益华的流媒体服务器支持主流板卡(海康、汉邦、恒亿、金鹏)的PC系列监控设备的接入;支持主流嵌入式(海康、大华、大立)监控设备的接入。
能实时根据不同的网络情况,自适应地选择合适的传输协议(TCP、UDP单播、UDP组播),调节视频包大小来优化网络传输,适应不同的网络环境。特有的NDU升级方式,无须数据迁移即可对存储系统进行硬件、软件升级,达到最安全的投资保护。
可从最小配置起始,因需而动,支持从5个硬盘驱动器到240个硬盘驱动器的灵活扩展,可伴随业务和需求的增长而进行扩容或升级。
系统高的可靠性,稳定性。屏蔽单点故障的高可用设计,为关键应用提供可信赖的系统和信息可用性;独立的双存储控制器,具有镜像式缓存;多种级别的RAID数据保护;自动系统诊断和全局热备盘技术(Hot-spare)。
高性能的检索信息保存和获取,采用专用的内嵌数据库,特别适合对录像资料进行检索。高可用性和容错系统提供三个层次上的容错,首先系统体系结构上的容错技术,系统支持分布式的集群技术,每台服务器正常执行当前的存储任务,但是同时又作为其他服务器的后备集群节点。第二个层次上的容错是在整个中心集群都和图像源断开,不能进行实时录像,系统通过计划和实际的录像执行情况进行补录。第三个层次的容错是在录像分包时,每一个录像文件结束和一个新的录像文件开始,系统都被冗余一部分数据,以保证没有任何图像帧丢失。
录像计划和补录根据预定计划和实际的执行情况的差异性,可以计算出需要补录得时间段,自动从合时的DVR下载缺少的录像信息。
清盘策略和录像优先保留权当系统发现存储的容量超过系统规定的最高警戒线,将开始启动清盘任务,这个工作是由挂接的认证中心服务器来管理的,认证中心服务器将定时检查磁盘的情况,进行磁盘的清理、自动导出等功能。系统提供集中清盘策略,包括先进先出、最近访问、最多访问、以及保留优先权。
对比服务器
(一)功能
通过流媒体视频进行视频分析
提取图像特征值与数据库中的预存进行比对 将设定阀值以上的结果发送给需要的各个客户端 将比对结果存入数据服务中心(二)特点
比对速度快,一台服务器支持百路视频小于等于1秒 采用国际先进人脸比对算法,比对结果准确。独有的人像搜索、跟踪、定位、捕捉技术,人脸抓拍率在98%以上,角度能达到35度的偏移不会影响抓拍效果。针对有多个人像张的照片,系统会自动检测人像并分割出多张独立的照片,识别准确度高识别准确度高,1:1识别准确率97%;1:N识别准确率95%以上。独有的图像三维建模技术,每张人脸图像预处理后的特征值大小只有2K左右,识别速度能达每秒2万张以上。
采用独有的组播技术,在节约最少带宽情况下,把比对结果发送给各个客户端模块。
强大的日志功能,通过与数据服务器的配置,将比对结果完整的保存到数据库方便日后查看。
具有很好的容错功能,保证服务出错后,3秒内自动恢复运行。采用C/C++开发,核心层稳定可靠。
网络分控
(一)功能
树形视频选择,声音监听与视频图像同步。连接视频后可进行图像抓拍操作。支持单分屏、四分屏、六分屏、七分屏、九分屏、十分屏、十三分屏、十六分屏、二十五分屏显示。
支持视频轮巡,分组轮巡等多种视频观看方式 可实现电子地图与视频联动
报警自动地图定位,具有缩略图功能
可回放前端设备录像分为硬盘录像机本地存储、流媒体/集中存储服务器录像。支持报警提示, 系统中一旦有报警产生,界面上有明显提示。支持报警联动, 报警后可联动地图,联动报警声音,联动视频录像,联动视频显示,联动分组及轮巡,联动手机短信,可以联动外围IO设备。可查看历史报警记录并进行人工确认赛选。具有用户注销锁定功能,安全方便。
电视墙中心管理系统
(一)功能
可选择任意一路主要视频的实时视频,并形象显示人脸截图 实时显示比对结果。(二)特点
支持1280×720高分辨率 实时显示最近四对报警结果 支持比对声音提示
四、技术特点
本系统具有很好的开放性,可以很容易兼容现有设备,并能很好的和其他平台形成互动。
本系统人脸识别速度快,准确率高,一台对比服务器可以完成100路的视频实时识别,并完成与数据库内图片特征值的实时比对。本系统人脸比对采用独有的人像搜索、跟踪、定位、捕捉技术,比对技术,人脸抓拍率在98%以上,角度能达到35度的偏移不会影响抓拍效果。针对有多个人像张的照片,系统会自动检测人像并分割出多张独立的照片;识别准确度高,1:1识别准确率97%;1:N识别准确率95%以上。独有的图像三维空间建模技术,每张人脸图像预处理后的特征值大小只有2K左右,识别速度能达每秒万张以上。
本系统具有很友好的界面操作,一旦发生报警,用户可以根据电子地图得到位置,可以看到实时视频,并能看到报警时比对服务器抓拍的照片以及图库中原照片,方便用户进行再次的确认。
1 加强警用装备管理的重要性和必要性
警用装备越来越丰富, 呈现出种类多, 数量大等特点, 加强装备管理的重要性和必要性有以下几方面:一是对管理方法上要求越来越高;二是综合指挥对技侦装备的信息化程度要求越来越高;三是处理突发事件对警用装备的可用性要求越来越高;四是对警用装备的保密性要求越来越高。
2 系统总体设计
2.1 系统组成
RFID和动态人脸识别技术的装备管理系统 (以下简称为RFID系统) 由电子标签、管理终端、读写器、手持RFID终端、装备门禁管理终端、人脸抓取识别前置、报警器、红外探测器等8个部分组成。RFID电子标签贴于装备上, 读写器、天线安装和人脸抓取识别前置安放在仓库大门或者门禁处;录入每位使用者人脸照片和身份信息;当该使用者持有设备通过门禁时, 人脸识别前置拍取人脸照片并和设备信息进行关联;红外探测器探测装备通过RFID门禁是否违规, 并发出报警。管理员可以通过终端获取比对结果和装备的状态、位置等信息, 实现对装备的闭环管理。
2.2 系统功能
2.2.1 实时记录装备状态, 提高装备可用性水平
装备自采购入库就植入一张独一无二的标识码伴随该装备的整个寿命周期, 明确装备的状态、位置等相关信息, 记录可用性以及相关的维修状况。
2.2.2 简化业务工作流程, 改善清仓查库的质量
装备每次出库、入库以及使用者都能在终端有效的反应出来, 维修情况的等级和管理通过终端系统进行, 提高了清仓察库的效率。
2.2.3 明确界定责任归属, 提高装备保密性水平
实现装备的闭环管理, 明确“谁取出、谁使用、谁维护、谁归还”, 做到每个使用者对设备全程负责的前提下, 将使用者和装备进行信息匹配和归档, 避免相关装备的滥用和私用。
3 系统硬件模块设计
RFID管理系统硬件包含RFID电子标签、信息采集模块、手持RFID终端、RFID管理终端、门禁管理终端6个模块组成。
3.1 RFID电子标签
制作个体所属的电子标签, 将数据信息写入其相应的电子标签, 每个电子标签都是独一无二的, 将伴随该装备的入库、使用、维护、报废的整个生命周期;电子标签由集成电路芯片和天线组成, 芯片内部有存储器, 通过电感耦合和电磁反向散射耦合与读写器通信[1], 电子标签按供电形式可分为有源标签和无源标签, 按照工作方式可分为主动式、被动式和半主动式, 按工作频率可分为低频、高频、超高频和微波[2]。
3.2 信息采集模组
该模组包括两部分, 其中数据读写器要对出库的设备上的RFID进行读取, 获取该设备RFID标签的数据, 并将该数据回传到后台数据库;同时, 向人脸抓取比对前置发出信号, 摄像机在收到信号后要对该使用者进行面部抓取, 将人脸图像转化为人脸特征码回传后台人脸信息数据库。人脸抓取比对前置采用Neoface的API开发接口进行开发。读写器由射频通道模块、控制模块、天线和I/O接口模块组成[3]。读写器完成射频处理功能, 产生射频能量, 激活无源标签;射频通道模块中一般由2个分隔开的信号通道组成, 发送通道和接收通道, 分别用于向标签发送、接收数据。通过将发射命令调制到读写器发射的载波信号上, 形成发射信号, 经读写器天线发送, 信号经过空间信道传送到电子标签上, RFID标签收到射频信号并做出响应, 形成反射回波信号;将回波信号进行加工处理并解调, 提取回送的数据。
3.3 手持RFID终端
手持RFID终端主要是为设备管理员设计, 该终端以PDA为平台进行开发, 作用距离小于等于0.3m, 具有手写功能, Window CE或者android系统, 支持应用程序的二次开发, 具有嵌入式数据库, 能够通过USB、WIFI等方式和管理终端进行同步。可以识别在管理系统各种注册过的电子标签, 同时也可以将采集到的装备信息通过USB、WIFI等方式传输到RFID终端并存入数据库。
3.4 RFID管理终端
RFID管理终端是装备管理系统的核心, 硬件平台为一台连接局域网的服务器, 装有RFID管理系统软件以及人脸识别引擎。通过USB口连接读写器和人脸采集器, 对电子标签进行操作, 建立相应的RFID-装备数据库, 以及侦查员人脸信息库。
3.5 门禁管理终端
装备门禁管理终端是一台连接局域网的计算机, 连接红外感应器和声光报警器, 红外感应器探测有人或者是装备通过门禁时输出信号;同时, 将通过信号传输给RFID装备管理终端, 人脸抓取前置采集人脸图像并一同传回终端, 经过比对确定装备是否允许带出使用。
4 系统软件模块设计
RFID装备管理系统软件部分包含标签管理模块、装备生命周期管理模块、装备使用流程管理模块、人脸采集模块、门禁管理模块和手持RFID终端模块等6个部分组成, 实现对装备的日常流程管理;装备门禁管理模块作为一个单独的程序运行在装备门禁计算机上, 向装备管理终端发送通过信号;手持RFID终端软件包括两部分, 一部分是和RFID系统之间数据通信软件, 另一部分是手持终端上的运行软件, 用于对装备数据的采集和存储。
5 结语
RFID技术应用于警用装备管理系统, 可以实现装备的可视化管理, 消除人为差错, 提高整个管理过程中的安全可靠性, 明确使用过程责任归属和避免滥用、私用。该技术还有较大的应用空间, 可以通过扫描RFID标签搜索相关的装备使用说明, 将RFID标签信息和指挥作战系统对接, 实现装备和人员的布置和调度。
摘要:针对传统警用装备管理在效率和可靠性等方面存在的问题, 提出一种基于RFID和人脸识别技术的警用装备管理解决方案。结果表明, 该管理系统能够实现警用装备的自动识别和使用者自动匹配, 有效提高了装备管理的效率和水平, 从而实现装备管理智能化。
关键词:RFID,人脸识别,装备管理
参考文献
[1]Miah MS, Gueaieb W.An RFID-Based Robot Navigation System with A Customized RFID Tag Architecture[J].Microelectronics, 2007, 148 (2) :68-72.
[2]王肖, 马汝建, 杨雪岩.基于RFID技术的供热计量系统设计[J].济南大学学报:自然科学版, 2009 (6) .
王军军
(西安交通大学,西安,710086)
摘要:人脸识别已成为多个学科领域的研究热点之一,本文对人脸识别的发展历史、研究现状进行了综述,系统地对目前主流人脸识别方法进行了分类针对人脸识别面临的挑战,着重对近几年来在光照和姿态变化处理方面的研究进展进行了详细沦述,并对未来人脸识别的发展方向进行了展望。
关键词:人脸识别,人脸检测,模式识别
一、引言
人脸识别是近年来模式识别、图像处理、机器视觉、神经网络以及认知科学等领域研究的热点课题之一。所谓人脸识别,是指给定一个场景的静态图像或动态视频,利用存储有若干已知身份的人脸图像的数据库验证和鉴别场景中单个或者多个人的身份[1]。人脸识别按照人脸信息的来源可以分为两类:基于静态人脸图像的识别和基于包含人脸的动态视频信息的识别。因为动态视频信息并不能明显提高人脸识别的性能,因此本文只研究基于静态人脸图像的识别[2]。
作为生物特征识别的一个重要方面,人脸识别在档案管理系统、安全验证系统、信用卡验证、公安系统的罪犯身份识别、银行和海关的监控、人机交互等领域具有广阔的应用前景。与指纹识别、视网膜识别、虹膜识别等[3]技术相比,人脸识别技术在数据采集方面手续比较简单,使用者更容易接受。人脸作为生物特征,虽然唯一性比指纹和虹膜要差[4],在高安全性要求的系统中只能作为辅助手段。然而,对于一般安全性要求的身份验证和鉴别系统[5],人脸识别技术已经足够应用了。
人脸识别研究在二十世纪六七十年代引起了诸多学科领域研究者的浓厚兴趣。进人九十年代后,随着各行业对人脸识别系统的迫切需求,人脸识别研究再次成为热门课题。当前世界各国有许多研究机构在从事这方面的研究,这些研究受到军方、警方以及大公司的高度重视和资助[6]。美国军方还专门组织了人脸识别竞赛以促进人脸识别研究的发展。经过三十多年的研究,人脸识别已经成为图像分析与图像理解领域最成功的应用之一研究人员提出了很多识别方法,建成了一些实验系统,也有一些成功的人脸识别商业软件投人市场。
人脸识别作为模式识别的一种,一般可以分为三个组成部分:从场景中检测并分割人脸;抽取人脸特征;匹配和识别人脸[7]。由于人脸检测已经发展成为一个独立的课题,具有特定的思想和方法,所以本文假定人脸已经被正确检测并从场景中分割出来。
二、人脸识别的方法
目前,人脸识别的方法大致可以分为以下几类:基于几何特征的方法、基于模型的方法、基于统计的方法、基于神经网络的方法和多分类器集成的方法[8]。目前主流的方法有基于几何特征的方法和基于模型的方法。
2.1基于几何特征的方法
文献中记载最早的人脸识别方法就是Bledsoe[9]提出的基于几何特征的方法。该方法以面部特征点之间的距离和比率作为特征,通过最近邻方法来识别人脸,以该方法建立的人脸识别系统是一个半自动系统,面部特征点必须由人手工定位。也正是由于人工的参与,该系统对光照变化和姿态变化不敏感[10]。
侧影[11](Profile)识别也是早期基于几何特征人脸识别的一个重要方法,其基本原理是从人脸的侧影轮廓线上提取特征点,将侧影转化为轮廓曲线,从中提取基准点,根据这些点之间的几何特征来进行识别,由于侧影识别相对较简单且应用面小,对侧影识别的研究较少。
基于几何特征的方法非常直观,识别速度快,内存要求较少,提取的特征在一定程度上对光照变化不太敏感[12]。但是,当人脸具有一定的表情或者姿态变化时,特征提取不精确,而且由于忽略了整个图像的很多细节信息,识别率较低,所以近年来已经很少有新的发展。
2.2基于模型的方法
隐马尔可夫模型[13](Hidden Markov Model,HMM)是一种常用的模型,基于HMM的方法首先被用于声音识别等身份识别上,之后被Nefian和Hayes引人到人脸识别领域。它是用于描述信号统计特性的一组统计模型。HMM用马尔可夫链来模拟信号统计特性的变化,而这种变化又是间接通过观察序列来描述的,因此马尔可夫过程是一个双重的随机过程。在HMM中结点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同形态表现出这一特征的概率不同[14]。在人脸识别过程中,Nefian首先采用两维离散余弦变换(Discrete Cosine Transform,DCT)抽取人脸特征,得到观察向量,构建HMM人脸模型,然后用EM(Expectation Maximization)算法训练,利用该模型就可以算出每个待识别人脸。观察向量的概率,从而完成识别。HMM方法的鲁棒性较好,对表情、姿态变化不太敏感,识别率高[15]。
主动形状模型[16](Active Shape Model, ASM)方法由Cootes等人提出,Cootes对形状和局部灰度表象建模,用建立的ASM在新的图像中定位易变的物体。后来,Lanitis等将其应用于解释人脸图像,在使用ASM找出人脸的形状后,将人脸切割并归一到统一的框架,对这个与形状无关的人脸采用亮度模型来进行解释和识别,其鲁棒性和识别效率均较高,但需要手动标会人脸的特征点,算法的自动化程度有待加强。
主动表象模型[17](Active Appearance Model, AAM)可以看成是对ASM的进一步扩展,是一种通用的非线性图像编码模式,通过变形处理将通用人脸模型与输人图像进行匹配,并将控制参数作为分类的特征向量。
2.3 基于统计的方法
基于统计的方法将人脸图像视为随机向量,从而用一些统计方法来分析人脸模式,这类方法有着完备的统计学理论支持;得到了较好地发展,出现了一些较成功的算法。
特征脸[18](Eigenface)方法由Turk和Pentland提出。对于每一幅人脸图像,按照从上到下、从左到右的顺序将所有像素的灰度值串成一个高维向量,然后通过主成分分析(Principal Component Analysis, PCA)将高维向量降低维数。用PCA[19]降维主要基于以下三点:(1)压缩功能,在低维空间内比较图像将提高计算效率;(2)人脸样本的分布近似正态分布,方差大的维可能与有用信号相关,而方差小的维可能对应噪声,因此去掉小方差对应的维将有利于提高识别精确率;(3)因为每幅图像都被减去均值,且被放缩成单位向量,两幅图像之间的相关性与特征空间中投影之间的距离成反比,因此特征空间中的最近邻匹配是图像相关性的有效近似。PCA技术首先由Kirby[20]和Sirovich引人到人脸识别领域,并且证明了PCA是使原始图像与重构图像之间的均方误差极小化的最佳压缩方式。一幅图像在各个特征脸上的投影组成了该图像的权值向量,将待识别图像的权值向量与人脸数据库中各图像的权值向量相比较,确定哪一幅图像与待识别图像的权值向量最接近。后来Pentland等人进一步扩展了特征脸方法,将类似的思想运用到面部特征上,分别得到了本征眼、本征鼻、本征嘴,并且将它们结合起来进行人脸识别。实验结果表明,这样比单独使用特征脸效果更好。特征脸方法计算量低,使用方便,并且效果良好,目前已经成为人脸识别的基准程序(Benchmark)和事实上的工业标准。但是它对于外界因素所带来的图像差异和人脸自身所造成的差异是不加区分的,因此外界因素(例如光照、姿态)变化会引起识别率的降低。
特征脸方法使用由各个特征脸扩展的空间来表示人脸,虽然可以有效地表示人脸信息,但是并不能有效鉴别和区分人脸。很多研究者提出了使用其他线性空间来代替特征脸空间以取得更好的识别效果。此中线性判别分析方法[21](也叫Fisher脸方法),利用了类别归属信息,它选择类内散布正交的矢量作为特征脸空间,从而压制了图像之间与识别信息无关的差异,强调了不同人脸之间的差别,同时弱化了同一人脸由于光照、视角和表情而引起的变化,获得了比特征脸更好的识别效果。LDA[22]是一种监督学习方法,而PCA是非监督学习方法。Belhumeur对16个人的各10幅图像进行识别实验,PCA方法的识别率为81%,而Fisher脸方法的识别率为99.4%。
Moghaddam[23]等人提出了贝叶斯人脸识别方法。他们提出了一种基于概率的图像相似度度量方法,将人脸图像之间的差异分为类间差异和类内差异。其中类间差异表示不同对象之间的本质差异。类内差异为同一对象的不同图像之间的差异。而实际人脸图像之间的差异为两者之和。如果类内差异大于类间差异,则认为两人脸图像属于同一对象的可能性大,他们提出了类间差异和类内差异度量的概率模型和计算方法。由于贝叶斯相似度的计算涉及复杂的非线性计算。Moghaddam等人提出了一种线性的快速计算方法。这种人脸识别方法在1996年美国DAPAR组织的FERET人脸测试中是效果最好的方法之一特别是在克服光照和表情变化对识别的影响方面性能较好。
奇异值分解[24](Singular Valor Decomposition。SVD)是一种有效的代数特征提取方一法。奇异值特征具有良好的稳定性、转置不变性、旋转不变性、位移不变性以及镜像变换不变性等重要性质。因此奇异值分解技术也被应用到人脸识别领域。
独立成分分析[25](Independent Component Anal-ysis,ICA),可以看成是对PCA的推广,PCA利用二阶矩去掉输人数据的相关性。使得数据的协方差为零。而ICA使得输人数据的二阶和高阶矩依赖性最小,ICA首先被用于盲源分离(Blind Source Separation。BSS)问题,用来将观察信号分解成一系列独立信号的线性组合。ICA用于人脸识别有两种结构(ICA Architecture I和ICA Architecture II)和多种算法(例如FastICA和InfoMax),PCA和ICA Architecture II利用的是全局特征,而ICA Architecture I利用的是空间局部特征。B Draper等人详细比较了PCA和ICA在人脸验证和面部表情识别中的性能,人脸验证实验中,ICA Architecture II的性能最好。PCA的性能与距离度量标准有关。ICA Architecture I的性能较差,ICA用Fast I-CA算法较好;表情识别实验中,用InIoMax算法实现的ICA A rchitecture I性能最好。
3、人脸识别面临的挑战
当光照、姿态、表情变化时,人脸的表象会产生较大变化,从而造成人脸识别系统的性能下降。FE-RET测试川表明,光照和姿态变化问题是当前人脸识别系统面临的挑战。随着人脸识别研究的深人,很多研究者对光照和姿态变化进行了专门的研究,也取得了一定的进展。本节专门针对这两方面问题进行论述。
3.1 光照变化
因为光照会改变人脸图像灰度的相对分布,所以由光照引起的人脸图像变化甚至比因个体差异引起的变化还要大。因此,光照变化会造成人脸识别系统性能的严重下降。对光照变化的处理已经引起了很多研究者的重视,并且取得了较大进展。目前已经出现了很多光照处理方法,这些方法大致可以分为三类: 第一类方法的主要思想是寻找对于光照变化不敏感的人脸图像表示方法。第二类方法是对原来某些不存在光照变化时人脸识别算法的简单改进和推广。第三类方法的主要出发点是构建图像合成(Synthesize)模型[26],这些模型可以合成与测试(Probe)图像具有相同或相似光照条件的新图像作为数据库(Gallery)中的图像。这类方法的关键是对光照进行建模。
3.2 姿态变化
视角的变化,即人脸姿态变化也会造成人脸识别系统性能的降低,因此对多视角人脸图像的处理是人脸识别面临的另一挑战。Beymer[27]先对输人图像的视角进行估计,接着根据自动检测到的三个特征点进行二维仿射变换使之与原型(Prototype)的视角相同,然后直接使用模板匹配来实现多视角人脸识别。在一个62人的多视角人脸数据库上取得了较好的实验结果,但测试集和训练集的视角比较接近,因此识别难度较低。
Pentland[28]等人提出的基于视角的特征脸(View-based Eigenface)方法为每个视角构建一个
特征空间。取得了比标准特征脸方法更高的性能。Huang等人在基于视角的特征脸方法的基础上,采用神经网络集成(Neural Network Ensemble)的方法,实现多视角人脸的识别。这类方法的缺点是每人需要多张人脸图像作为训练集,而且将光照变化问题与视角变化问题分开来考虑,这些前提条件在很多场合不能满足。
3.3同时存在光照和姿态变化
上述的很多方法只是对光照或姿态变化中的一种进行了处理,但在现实情况下,光照和姿态变化会同时存在。因此,要使人脸识别技术真正实用,人脸识别系统必须能够处理同时存在两种甚至任意多种成像条件变化的情况。光场(Light Field)[29]方法是最新提出的较有效的方法,对各种外部成像条件的变化都能进行较好处理。由于人脸是三维的,因此利用三维模型(或者三维和两维相结合)可以显著地提高识别性能。
4总结与展望
本文对人脸识别的发展历史、研究现状进行了综述,尤其是对近几年来在光照和姿态变化处理方面的研究进展进行了详细论述。
经过几十年的研究,人脸识别已经取得了很大的进展,但现有的人脸识别方法一般都是针对某一类问题提出的,由于人脸识别问题的复杂性,实现一个通用的人脸识别系统目前还不现实。因此,解决特定条件或者特定应用领域的人脸识别问题仍然是目前人脸识别研究的重要课题。要构建一个稳健的人脸识别系统,以下是有待于解决的几个主要问题:
1、非线性建模问题。目前统计方法中的子空间方法有一个共同的特点,即都是线性方法。人脸图像显然是一种高度非线性的模式。也就是说,人脸图像的分布应该是位于某种高度非线性的流形[30](Mani-fold)上的,因此用非线性方法来进行人脸识别是一个必然的发展趋势。人脸识别技术由线性向非线性发展可能的现实途径有两条:一是利用核理论将现有的线性分析方法向非线性扩展,这是一种间接的方法。典型代表是核主成分分析(Kernel Principal Component Analysis, KPCA),也就是利用核理论对PCA进行扩展;二是直接从数据分布本身出发,研究高效的非线性流形学习算法,从而将人脸图像投影到其实际分布所在的流形上进行识别,目前,已有研究人员将其应用到人脸识别领域,对人脸图像采用流型的方法来进行识别。
2、三维建模问题。目前只利用二维信息的人脸识别方法只能在特定环境下取得较好的性能,然而在处理光照、视角和表情等方面的变化时会遇到较大的困难。由于人脸是三维的,因此利用三维模型可以显著提高识别性能本文论述的三维可变型模型方法就是在这方面较好地尝试。但是目前三维人脸识别在识别算法、三维人脸库以及实验方法等方面还存在很多挑战。
3、三维模型计算开销问题。利用三维模型可以显著提高识别性能,然而,构造和存储完整的三维人脸模型需要的开销太大,因此如何通过二维图像对三维人脸参数进行建模将是未来人脸识别研究的一个热点。另外,利用2.5维信息进行识别也是减小存储和计算开销的一条可能途径。
4、算法的自动化与时间开销问题。本文所提到的算法中,基于几何特征的方法与基于模型的方法中的部分算法存在手工标定人脸特征点的问题,算法的自动化程度有待进一步加强。另外,算法中某些鲁棒性与准确率较高的算法,计算量巨大,运算时间比较长,人脸识别的实时性有待加强。[1] 厉小润,赵光宙,赵辽英.改进的核直接Fisher描述分析与人脸识别[J].浙江大学学报:工学版, 2008,42(4): 583-589.[2] YU Hua, YANG Jie.A direct LDA algorithm for high-dimensionaldatawith application to face recognition [J].Pattern Recognition,2001,34(10): 2067-2070.[3] 周大可,杨新,彭宁嵩.改进的线性判别分析算法及其在人脸识别中的应用[J].上海交通大学学报, 2005,39(4): 527-530.[4] BARTLELLM S, MOVELLAN JR, SEJNOWSKIT J.Face recognition by independent component analysis [J].IEEE Trans on NeuralNetworks, 2002,13(6): 1450-1464.[5] 洪子泉,杨静宇.基于奇异值特征和统计模型的人像识别算法[J].计算机研究与发展, 1994,31(3): 60-65.[6] 杜干,朱雯君.基于局部奇异值分解和模糊决策的人脸识别方法[J].中国图象图形学报, 2006,11(10): 1456-1459.[7] 高全学,梁彦,潘泉,等.SVD用于人脸识别存在的问题及解决方法[J].中国图象图形学报, 2006,11(12): 1784-1791.[8] COOTES T F, EDWARDS G J, TAYLOR C J.Active appearance models: active appearance models [ J].IEEE Trans on Pattern Analysis and Machine Intelligence, 2001,23(6): 681-685.[9] WISKOTTL, FELLOUS JM, KRUGER N,et al.Face recognition by elastic bunch graphmatching [J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1997,19(7): 775-779.[10] WURTZ R P.Object recognition robust under translations, deformations, and changes in background [ J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1997,19(7): 769-775.[11] 孙大瑞,吴乐南.基于特征的弹性图匹配人脸识别算法[J].应用科学学报, 2002,20(4): 377-381.[12] 张海旸,马华东.基于网格的自适应弹性图人脸匹配方法[J].计算机辅助设计与图形学报, 2008,20(2): 253-258.[13] 刘小军,王东峰,张丽飞,等.一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报, 2003,26(3): 340-344.[14] 李耀东,崔霞,肖柏华,等.自动人脸识别技术综述[J].计算机科学, 2002,29(12): 1-11.[15] 邹志煌,孙鑫,程武山.人脸识别技术产品的发展概况[J].视频应用与工程, 2008,32(3): 91-93.[16] 刘瑾,徐可欣,陈小红,等.采用图像融合技术的多模式人脸识别[J].工程图学学报, 2007,28(6): 72-78.[17] 王耀明,王仲国,沈毅俊.基于图像集似然度的人脸识别[J].计算机工程, 2001, 27(7): 113-114.[18] 王宏勇,廖海斌,段新华,丁汨.基于奇异值与特征融合矩阵的自适应人脸识别[J].计算机工程与应用,2010,46(7):162-174.[19] 斯华龄,张立明.智能视觉图像处理-多通道图像的无监督学习方法及其他方法[M].上海:上海科技教育出版社,2002.[20] 郭武,张鹏,王润生.独立分量分析及其在图像处理中的应用现状[J].计算机工程与应用,2008,44(23):172-176.[21] 白晓明,王成章,石勤.基于二维线性判别分析的彩色人脸识别[J].北京工业大学学报.2010,12(36):1717-1721.[22] 王晓慧.线性判别分析与主成分分析及其相关研究评述[J].中山大学研究生学刊(自然科学、医学版).2007,4(28):50-59.[23] 聂会星,梁坤,徐枞巍.基于小波变换和支持向量机的人脸识别研究[J].合肥工业大学学报(自然科学版).2022,2(34):208-211 [24] 段锦著.人脸自动机器识别[M].北京: 科学出版社, 2009.
[25] 吴巾一,周德龙.计算机应用研究[J].人脸识别方法综述,2009,9(26): 3205-3209 [26] SIROVITCH L, KIRBYM.Low-dimensionalprocedure for the characterization of human face[ J].Journal of the Optical Society of America, 1987,4(3): 519-524.[27] KIRBYM, SIROVITCH L.Application ofKarhunen-Loeve procedure for the characterization ofhuman faces[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1990,12(1): 103-108.[28] 刘成明,张立明.一种改进的人脸特征点定位方法[J].复旦学报:自然科学版,2006,45(4):452-463.[29] 杜春华.人脸特征点定位及识别的研究[D].上海:上海交通大学.2008.[30] 马艳妮,耿国华等.脸部特征点的定位与提取方法[J].计算机工程与应用,2009,45(18):167-170.读书的好处
1、行万里路,读万卷书。
2、书山有路勤为径,学海无涯苦作舟。
3、读书破万卷,下笔如有神。
4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文
5、少壮不努力,老大徒悲伤。
6、黑发不知勤学早,白首方悔读书迟。——颜真卿
7、宝剑锋从磨砺出,梅花香自苦寒来。
8、读书要三到:心到、眼到、口到
9、玉不琢、不成器,人不学、不知义。
10、一日无书,百事荒废。——陈寿
11、书是人类进步的阶梯。
12、一日不读口生,一日不写手生。
13、我扑在书上,就像饥饿的人扑在面包上。——高尔基
14、书到用时方恨少、事非经过不知难。——陆游
15、读一本好书,就如同和一个高尚的人在交谈——歌德
16、读一切好书,就是和许多高尚的人谈话。——笛卡儿
17、学习永远不晚。——高尔基
18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向
19、学而不思则惘,思而不学则殆。——孔子
北京日报讯(实习记者 王维维)昨天是我国《公证法》颁布实施六周年。记者从周末召开的首都公证事业发展论坛上获悉,为应对日益增加的骗取公证书谋取利益案件,避免欺诈公证的风险,有公证处准备探索引入人脸识别系统帮助识别身份。
据北京市方圆公证处副主任吴凤友介绍,随着《公证法》的颁布实施,公众办理公证的意识逐年提高,目前全市公证机构年办理60余万件公证事项。其中,民事公证增长最快。目前,首都公证事业已走过了六十年,公证机构也由原来的行政机关变成了一个独立执业的、具有民事主体地位的法人单位,在执业过程当中所产生的责任也要独立承担。尤其是在房产等迅速升值的同时,巨大的财产利益考验着社会诚信系统,欺诈公证、骗取公证书谋取利益的情况层出不穷,成了公证机构最大的困扰。
记者了解到,在婚姻法司法解释
(三)正式实施后,夫妻间婚前婚后公证房产的案件也有所增加,导致欺诈公证、骗取公证书谋取利益的案件也有所增多。如在办理银行的抵押贷款时,房产可能属于夫妻一方,也可能是共同财产,这时,公证机构在审查婚姻状况时要求配偶进行表态,就会遭遇通过造假结婚证,雇人客串配偶等欺诈公证。甚至有些不法分子公然就在公证处的门前,当场培训如何作假对付公证人员的技巧。据介绍,市司法局和市公安局已经联合发文,对于在办理公证过程中提供假证件或者是身份造假骗取公证书的行为,要予以严厉的制裁和打击。目前为防假,公证机构都安装了二代身份证识别系统,实时录像刻录系统,对于办理财产公证,当事人必须现场拍照。但是,公安系统的个人相关信息,比如身份证件的核对,公证部门都必须付费才能查询。这在某种程度上,延长了公证办理的时间,也使得公证的程序将安全防范欺诈当成第一要求,快速服务则退居其次。
吴凤友副主任说,目前全市公证机构都设置了现场录音、拍照系统,并借鉴法院的庭审刻录系统,全程对公证过程进行同步录制。虽然不能杜绝不法人员欺诈公证的欲望,但至少可以用声画影像证明公证过程和认定事实,一定程度上规避被欺诈的风险。他透露,作为本市成立最早、规模最大的公证机构,方圆公证处正准备探索引入人脸识别系统,改变以往只靠肉眼对照身份证进行识别的不足。
1.人员注册: :在机器上按“MENU” —>管理员验证,进入系统—>登记用户
—>输入“工号”按OK—>人脸图像采集,完后按OK保存。第一次使用设备,管理员均未设定,按MENU,选择管理员配置,进入配置管理员模块 2.设备连接: 安装完软件(软件安装,参照光盘目录使用说明书),打开软件
(用户名和初始密码均为Admin)点击“设备管理”—> “添加设备”—>输入“设备号”,“名称”,“设备类型”,“IP地址”—>按“添加”。双击设备信息,测试设备是否连接,若已连接,则“连接状态”显示为“已连接”。然后点击“下载/上传数据”—>选中设备—>“导入设备人员信息”—>“查看设备所有员信工”,在左下角选中所有员工,按“下载至本地数据库”将员工信息从设备接收下来—>“全部保存”
3.人员修改:点击“人员管理”—> “添加”—>“添加同级部门”或“添加
下级部门”—>“输入部门名称”保存。,在“未分配”里面,选中要分配的人员,点击“员工调动”,把员工添加到相应的部门,然后在其部门修改员工的信息。
4.班次及考勤规则设置:点击“工作时间段管理”-—>“新增时段”—>输入
“时段名称”,“上班时间”,(根据上班的时间,在出勤时间段中输入相应的时间点,单击确定。)—>保存。进入“班次设置”—> “添加班次”菜单,单击添加需要的班次。在弹出的窗口中输入班次名称,班次类别,班次信息(根据情况需要选择相应的周期数,通过“插入时段”把合适的时间段插入到相应的时间内),考勤规则,单击保存完成班次属性设置。具体操作说明可参照光盘目录的使用说明书。
5.人员排班: 点击“人员排班设置”—>选择要排班的员工(部门或直接输入
工号姓名-查找员工)—>在人员信息表选中要排班的人员—>点击“人员排班”(针对规则排班,若是不规则班次则选择“不规则排班”)—>选中需要的班次—>“添加排班”然后关闭
6.记录采集: 点击“下载/上传数据” —>刷新设备,选择采集记录的日期—>
“下载设备记录”。可进入“考勤记录查询” , 选择部门,记录开始结束时间,单击“查询”,查看考勤的明细记录。
7.生成报表并打印或导出:点击“统计报表”—>选择部门,日期,报表的形
式—>“记录处理”,完成后,系统根据处理的结果显示该报表的信息。单击“报表预览”窗口工具栏打印,进行报表的打印或点击“导出数据”用EXCEL格式存储。
8.数据备份:在导航栏的“其他”单击“备份数据库与还原—>选择“备份数
关键词:表情识别,研究方法,创新,不足
人脸表情是人们鉴别情感的主要标志。人际交往中,面部表情为人们相互间的交流提供了一种非语言沟通的重要渠道,人们通过面部丰富细小的变化,能表达各种各样的表情,并且表情有时甚至比语言更能显示情感的真实性。
人脸表情识别是指通过计算机来计算分析人的脸部表情及变化,判定其内心情绪或思想活动,从而获得更加智能化的人机交互环境。在模式识别领域中表情识别是一个非常具有挑战性的课题,它在心理学、远程教育、安全驾驶、公共监控、测谎技术、电脑游戏、临床医学、精神病理分析等方面都有着广泛的应用。
1 研究背景及现状
早在20世纪70年代,有关于人脸表情识别的研究就已经展开,但是早期主要集中在心理学和生物学方面。随着计算机技术的发展,人脸表情识别技术逐渐发展起来,到上个世纪90年代该领域的研究已经变得非常活跃。大量的文献资料显示表情识别已经从原来的二维图像走向了三维数据研究,从静态图像识别研究转向实时视频跟踪。
国内开展该项目研究的单位主要有:清华大学、北京科技大学、中国科学院、南京理工大学、中国科学技术大学、浙江大学、东南大学、南京大学、北京航空航天大学、西南交通大学、大连理工大学、天津大学、湖南大学等。国外较为著名的研究机构有麻省理工学院、卡内基梅隆大学、匹兹堡大学、马里兰大学、加利福尼亚大学、代尔夫特理工大学等。
国际上关于人脸或表情识别方面的国际会议中影响比较大的有:
CVPR:计算机视觉与模式识别会议(International Conference on Computer Vision and Pattern Recognition)
FGR:人脸与姿态自动识别国际会议(International Conference Automatic Face and Gesture Recognition)
ICPR:模式识别国际会议(International Conference on Pattern Recognition)
ICCV:IEEE计算机视觉国际会议(IEEE International Conference on Computer Vision)
SIGGRAPH:计算机图形和交互技术国际会议(International Conference on Computer Graphics and Interactive Techniques)
ECCV:欧洲计算机视觉会议(European Conference on Computer Vision)
ICMI:多模式接口国际会议(International Conference on Multimodal Interfaces)
ACCV:亚洲计算机视觉会议(Asian Conference on Computer Vision)。
VISAPP:计算机视觉理论与应用国际会议(International Conference on Computer Vision Theory and Applications)。
ACII:情感计算及智能交互国际会议(International Conference on Affective Computing and Intelligent Interaction)
ICBA:国际生物特征识别国际会议(International Conference on Biometric Authentication)
2 研究内容
人脸表情识别(Facial Expression Recognition,FER)主要包括三个技术环节(如图1所示):首先是人脸的检测与定位,然后进行表情特征提取和识别,即从输入的图像中检测和定位人脸,然后再提取出对表情识别有用的信息并进行分类识别。
2.1 人脸检测与定位
近十年来人脸检测得到了广泛的关注,并且取得了长足的发展和一定的成果。国内外很多学者提出了不少方法,现有的人脸检测技术方法,从不同的角度可以有多种分类方式。根据利用人脸知识的不同,现有的人脸检测方法可以分为基于特征的方法(Feature-based Method)和基于图像的方法(Image-based Method)两大类[2,3]。目前基于特征方法比较成熟,常用的有基于肤色特征[4,5]、模板匹配[6]等方法;基于图像的人脸检测方法主要有主成分分析法(Principal Component Analysis,PCA)[7]、人工神经网络(Artificial Neural Network Approach,ANNA)[8]方法、隐马尔可夫模型(Hidden Markov Models,HMM)[9]方法、支持向量机(Support Vector Machines,SVM)[10]方法和Ada Boost方法。
2.2 特征提取
表情特征的提取方法分为基于运动与基于形变的两类[11]。其中运动是指表情发生时面部特征随时间的变化,而形变则是指有表情的脸相对于中性表情脸的差异。运动特征提取方法代表性的包括光流法[12]、运动模型、特征点跟踪方法等。面部特征的形变可以由形状和纹理两方面来描述,又可以分为基于模型的方法和基于图像的方法两类。其中基于模型的方法有活动外观模型(AAM)[13]、点分布模型(PDM)[14]等;基于图像的方法有Gabor变换[15]、主成分分析(PCA)[16]等。
2.3 表情分类
用于表情分类的方法可以分为时空域方法和空域方法两类[17]。其中时空域方法包括隐马尔可夫模型方法、回归神经网络方法、空时运动能量模板方法等;空域方法包括神经网络方法、支持向量机方法、Ada Boost方法、基于规则推理的方法、主成分分析、独立分量分析、Fisher线性判别分析等。
3 存在问题
尽管在当前表情识别领域的研究中很多核心环节上已经取得了一定的成果如人脸检测,特征提取,情感分类等,但是该领域仍然存在以下问题:
1)缺乏对于自发表情识别方面的研究
人为表情识别和自发表情识别之间存在巨大的差异度,而目前大多数人脸表情识别都是对来自于现有的表情数据库(即人为表情)进行分析和识别,并非是对自然人的实时表情(即自发表情)。现有表情库里面的表情都是一些单一的比较夸张的表情,现实生活中人们的表情往往是混合的,强度也是深浅不一,因此需要加强对于混和表情以及表情强度方面的研究。
2)对于表情的标定还没有一个精细的标准
人类的表情可以说是多姿多彩、千变万化的,但是目前,包括FACS在内的现有人脸表情识别系统仅能做到简单的基本表情识别,因为很多现有的表情库中并没有具体的标定每一个表情该有的尺度。因此,今后的一个研究重点应该是加强人脸表情的视觉认知加工等认知心理学的基础研究,从而建立其更加精细的人脸表情描述标准,指导计算机进行人脸表情的精细识别。
3)需要提高表情识别的鲁棒性
个体表情对象研究时很多外部因素如:光照、肤色、姿势以及是否有遮挡物等都会对面部表情识别产生一定的影响,但是当前大多数的研究都是针对特定条件下的表情模式,实际上这些因素都影响到了表情识别的实用化,导致了表情识别的鲁棒性不强。因此,只有综合考虑人脸的表情、光照、噪声、附属物等影响并且使用恰当的判决模型才能较好地解决这个问题。
4)缺乏实用性的应用系统
人脸表情识别潜在应用十分广泛,但是实用性系统却很少,已知的有数码相机自动捕捉笑脸系统、驾驶员疲劳监测系统、微表情识别系统等。我们在开展人脸表情识别的基础理论研究同时,也应该结合工程应用需求,同时强化其在工程上的应用。
4 总结
人的内心是丰富的,丰富的内心造就了人类丰富的表情,有些表情之间的差别本身也不是很明显,纵使自然人尚且不能精确的判断出每一个表情及其程度,更何况由人设计出的经验识别算法。虽然一些经典的识别方法已经取得了不错的识别率,但都是基于一定条件下的几种方法的综合,因此到目前为止仍然没人能够提出一种复杂如人脑的计算方法去让机器识别人脸的表情。
【人脸识别通道方案】推荐阅读:
人脸识别监控考勤方案10-18
人脸识别核心算法技术06-07
管理系统人脸识别11-09
吊装作业危害识别05-27
财务报表舞弊识别系统05-30
银行风险识别与评估06-21
模式识别技术及其应用06-24
客户身份识别工作指引09-06
内存序列号识别10-03