基于AdaBoost 和PCA 的动态人脸考勤技术研究 - 中国一卡通网
用户名密码 [免费注册] [找回密码] 推广技巧 发布求购 建商铺  发产品  会员体制比较  
 

基于AdaBoost 和PCA 的动态人脸考勤技术研究

来源:中国一卡通网  作者:王刚  发布时间:2011-12-07 08:44:39  字体:[ ]

关键字:考勤  人脸识别  视频采集  PCA  

摘   要:设计并实现了基于Adaboost 和PCA 的动态人脸识别考勤系统。利用AdaBoost 快速人脸检测方法为基础,然后使用PCA 方法来实现人脸识别. 实验结果表明,利用该方法开发的动态人脸识别考勤系统具有识别率高、实用性好、可靠性强等特点.


  AdaBoost 算法是一种迭代方法,通过从大量的弱分类器中选取最具有分类意义的组合成一个强分类器,目的是为了提高检测的精确度. Viola 等提出了积分图像概念和基于AdaBoost 方法训练人脸检测分类器的方法如图2 所示,该方法使用图像的矩形特征作为分类的依据,为了有效地排除大量的非人脸窗口,整个分类器由多级子分类器级联而成. 每级分类器对应一个Harr 特征. 输入的待检测窗口将被逐级验证. 如果其中的分类器将其验证为非人脸,则立即排除,不再进入下一级分类器验证.Viola 等人提出的AdaBoost 方法,不仅检测效果好,而且检测速度达到15fps ,该方法易于实现,在实际系统开发中得到了广泛的应用. 限于篇幅,具体算法见文献. 最终得到的强分类器CFINAL ( x) 为 


(1)

  式中, Ci ( x ) 为弱分类器, ai = log (1/βi ) ,具体含义是当已经提取的分类器对于某些样本分类正确, 那么减小这些样本的权重(βi 变小) ;当分类错误,增加样本的权重(βi 变大) . 这样,后面训练提取的简单分类器就会更加强化对这些分类错误样本的训练。


  3. 3  人脸动态采集与人脸库的构建 

  系统采集每人的10 幅有一定差别的正面人脸图像,保存到训练库, 图3 是动态采集某个人员10副照片的图例. 在对同一个人脸采集10 个样本的过程中,如果后面采集的人脸与前面采集的相似度很高,则认为此次采集的人脸已经在训练库中存在,不保存结果并继续采集, 直到采集相似度较高的图像为止,然后保存到训练库中. 相似度的计算如式(2)所示,式中f i 和f j 分别表示第i 和j 个人脸,其中f i= ( ui1 , ui2 , ?, uip) . 最后在训练库中, 同一个人的不同样本归为相同的类, 不同的受考勤人员的样本属于不同的类。


(2)

  3. 4  维数约减与特征提取 

  人脸图像是高维的数据,并且在高维空间分布很不紧凑,计算复杂度高,为此,需要对高维的人脸数据进行维数约减. 常见的维数约减方法有主成分分析( PCA) 、独立成分分析( ICA) 、线性判别分析(LDA/ FDA) 、非负矩阵因子(NMF) 、多维尺度分析(MDS) 、核主成分分析( KPCA) 、核Fisher 判决分析(KFDA) 、流形学习(ML) 等方法. 考虑到本系统在考勤时人脸图像基本上是正面人脸,因此采用PCA方法对人脸图像进行降维、特征提取并最终识别出人脸。Kirby 和Sirovich[6 ]首先把PCA 思想引入到人脸识别; Turk 和Pentland[7 ] 进一步发展为特征脸(Eigenface) 方法,用于正面的人脸识别,并取得很大成功. PCA 是基于DKL T (离散K - L 变换) 的人脸识别方法,DKL T 变换是图像压缩的一种最优正交变换,其生成矩阵一般为训练样本的总体散布矩阵.高维的图像空间经过DKL T 变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以组成低维线性空间. PCA 是一种简单、快速、实用的基于代数特征的多元分析技术,保留了人脸部件之间的拓扑关系,也保留了各器官部件的信息,目前得到广泛的应用。

  PCA 的目的是通过线性变换找一组最优的单位正交向量基(即主成分) , 用它们的线性组合来重建原样本,并使重建后的样本和原来样本的均方误差(MSE) 最小. 假定有N 个样本x k ( k = 1 ,2 , ?,
N) ,所有样本的均值为E( x) , 则x 的协方差矩阵 


(3)

  令u1 , u2 , ?, un 和λ1 ,λ2 , ?,λn 分别是S 的特征向量和特征值,并且λ1 ≥λ2 ≥ ?λn . 然后将协方差矩阵S 分解成: 


(4)

  式中, U = [ u1 , u2 , ?, un ] ,Ω = diag (λ1 ,λ2 , ?,λn) 选择最优的m ( m < n) 个非零特征值作为主成分,并使得均方误差(MSE) 最小. 令Wopt = [ u1 ,u2 , ?, um ] , 则原空间的样本就可以在低维主成分子空间上的投影系数用来描述: 


(5)

  3. 5  相似度匹配及阈值确定 

  对人脸图像进行特征提取后,接着进行相似度度量. 常见的相似性度量有基于距离的方法、基于概率的方法和基于熵函数的方法,其中基于距离的方法中,有Euclidean 距离、Manhattan 距离、Hamming距离、Chebychev、s 阶Minkowski 等方法. 在基于几何特征的识别方法中,通常利用特征矢量之间的距离函数进行度量. 针对本系统得到的特征矢量信息,采用Euclidean 距离的方法来计算待识别人脸与训练样本的距离. 根据相似度计算的结果,如果相似度大于给定的阈值δ,则系统判定现场采集的人脸与事先采集的人脸图像为同一个人,并在数据库中记录考勤的日期、上班时间等信息. 考勤时人脸相似度阈值δ确定的依据来源于人脸采集时的样本相似度值,以克服人为因素设定阈值的随意性,确保阈值取值的合理性. 

  4  实验结果及分析 

  动态人脸考勤系统采集了天思智能系统研究所50 位博硕士生的各10 幅图像进行识别实验,结果表明系统一次性识别率达到为96 % ,主要原因在于: (1) 人脸训练库比较小、人员固定; (2) 要求考勤时人脸正面或近似正面对准摄像头; (3) 通常情况下用户在考勤时候姿态、表情都是正常情况,没有太大变化,也没有复杂背景及夸张性的化妆等情况,所以识别率很高。

  5  结束语 

  文中设计并实现了基于Adaboost 和主元分析法(PCA) 的动态人脸识别考勤系统. AdaBoost 算法选择多个弱分类器构成强分类器,提高人脸的检测速度;PCA 算法实现从高维特征空间到低维特征空间的降维压缩处理,提取出高维人脸图像在低维空间的特征描述,实现人脸识别,最终实现考勤管理.系统运行结果表明,动态人脸识别考勤系统具有人脸识别动态性、识别率高、实用性好、可靠性强等特点. 下一步的工作是进一步优化人脸特征的选择和提取算法,提高识别的速度和系统的性能。

更多

新闻投稿合作邮箱:yktchina-admin@163.com    字体[ ] [收藏] [进入论坛]

推荐文章

论坛热帖