第33卷第1期 计算机应用与软件 V0l_33 No.1 2016年1月 Computer Applications and Software Jan.2016 基于改进的YCbCr空间及多特征融合的手势识别 薛俊韬 纵蕴瑞 杨正瓴 (天津大学电气与自动化工程学院天津300072) 摘要 针对基于视觉的手势识别的复杂性,提出一种基于改进的YCbCr空间及多特征融合的手势识别新方法。首先针对YCb— cr颜色空间易受环境因素影响的特点,采用改进的YCbCr椭圆聚类肤色模型的手势分割方法提取手势区域;然后按手势图像外接 矩形的宽高比和手指个数进行粗分类,再提取手势的Hu矩和傅里叶描述子构建融合特征,并将融合特征输入BP神经网络进行训 练识别;最后综合粗分类和BP神经网络的结果进行手势判别。实验结果表明,该方法在保证实时性的同时具有较高的识别率。 关键词 手势识别 YCbCr颜色空间Hu矩傅里叶描述子BP神经网络 中图分类号TP391 文献标识码A DOI:10.3969/j.issn.1000 ̄86x.2016.O1.039 GESTURE RECoGNITIoN BASED oN IMPRoVED YCBCR SPACE AND MULTI—FEATURE INTEGRATIoN Xue Juntao Zong Yunrui Yang Zhengling (School ofElectrical andAutomationEngineering,Tie n University,Tianfin 300072,China) Abstract Because 0f the complexity of vision—based hand gesture recognition.we presented a novel hand gesture recognition algorithm which is based on improved YCbCr space and multi—feature integration.Firstly,considering the characteristic that YCbCr eolour space is prone to the influence of environmental factors,the algorithm adopts the improved hand gesture segmentation method using YCbCr elliptic clustering skin colour model to extract hand gesture region.Then it makes initial classification according to the aspect ratio of envelop rectangle of hand gesture image and the number of ifngers,and extracts Hu moment and Fourier descriptor of hand gesture to build integration features,which are put into BP neural network for training and recognition.Finally the results of the initial classification and BP neural network are combined for hand gesture recognition.Experimental results showed that the proposed method could ensure the real—time performances while getting a quite higher recognition rate. Keywords Hand gesture recognition YCbCr eolour space Hu moment Fourier descriptors BP neural network 傅里叶描述子能准确地描述手势且具有平移、旋转和缩放不变 0 引 言 性,因此在目标识别中具有广泛的应用。 殷涛等 利用Hu矩对四十个静态手势进行识别研究,取 手势识别作为人机交互中对使用者限制最小的一种方式, 得了较高的识别率,但对手势图片要求较高,图片光线复杂或者 正越来越受到计算机视觉研究者的关注。手势的多样性、多义 手势拍摄角度不佳等于扰对于判定结果的影响较大。Heba 性,时间和空间差异性 J,以及视觉本身的不稳定性,使得建立 等 利用傅里叶描述子和BP神经网络结合的方法对四个简单 基于视觉的手势识别系统是一个极富挑战性的课题。手势识别 手势进行识别研究,可以获得比较高的识别率,但是对于局部相 主要由图像分割、特征提取和识别等部分组成。 似度较高的手势,识别结果仍然差强人意,难以对更加丰富复杂 手势分割是手势识别的基础,它处理的好坏直接影响到后 的手势库进行识别。可见单独应用Hu矩和傅里叶描述子特征 续的特征提取和识别效果。由于肤色具有很好的特征,目前很 进行手势识别难以取得完善的效果。 多分割方法基于肤色聚类特性 J,运用颜色信息得到完整的手 针对上述问题,本文首先采用基于改进的YCbCr颜色空间 部区域。但光照条件的变化、前景和背景中类肤色区域的干扰 的手势分割方法,实现了复杂和多变背景下的有效分割。然后 等,都会使得分割效果不理想。最简单的方法是外加种种限制, 在分割图像上寻找有表征意义的结构特征对手势进行粗分类, 如要求背景使用某种特定的颜色,虽然明显提高了分割效果,但 将可能的手势限定在某一范围之内;再提取Hu矩和傅里叶描 这样不利于实际应用。 述子构建具有平移、旋转、缩放不变性特点的融合特征,并利用 手势特征选择与提取是手势识别的难点。文献[3]提取了 收稿日期:2014~06—11。天津市科技支撑计划重点项目(10ZCKF 手势边缘特征像素点,计算量小,但未考虑手势旋转、缩放、肤色 SFOI100);天津市科技型中小企业创新基金项目(13zxCxGx4o40o)。 干扰时的识别。文献[4]利用图像的密度分布特征实现二值图 薛俊韬,副教授,主研领域:图像处理,智能信息处理,智能仪器,模式识 像的检索识别,但无法识别区分度较小的手势。由于Hu矩和 别应用。纵蕴瑞,硕士生。杨正瓴,副教授。 第1期 薛俊韬等:基于改进的YCbCr空间及多特征融合的手势识别 155 作用,一定程度上减少了BP神经网络的误判,整体提升了判别 的准确率。本系统在Visual C++6.0环境下,用C++语言编 写,并利用OpenCV中的部分函数完成图像处理的编程。在 的修正作用,整体提升了最终识别率。当然,文中采用的图像分 割方法对于光照仍然比较敏感,所以还需要进一步完善。此外, 对于最接近人们日常生活的动态手语识别系统的研究具有非常 现实的意义,是未来手语识别的发展方向。 2.6 GHz CPU,2 GB RAM硬件环境下,处理320×240图片需要 的平均时间在26 ms左右,完全可以满足实时性的要求。 表3各手势识别率 手势 识别率 手势 识别率 手势 识别率 A 96.7% K 96.7% U 86.7% B 86.7% L 90.0% V 93.3% C 86.7% M 86.7% W 96.7% D 96.7% N 90.0% X 83.3% E 9O.0% 0 93.3% Y 90.0% F 96.7% P 96.7% Z 96.7% G 93.3% Q 90.O% ZH 93.3% H 86.7% R 86.7% CH 90.O% I 86.7% S 96.7% SH 86.6% J 93.3% T 9O.O% NG 93.3% ^ U t r H’J L M No- H 5 1 U v W X ‘ 州 手辨 一 图7各方法识别率对比图 综合实验数据得出,本文所设计的静态手势识别系统具有 很好的实时性以及识别率,达到了预期的目标。通过对误识别 手势分析不难发现,个别手势不能识别的原因是手指语中有许 多手势较为类同,或者拍摄角度欠佳,使得手势间的区分度较 小,外形非常接近。例如图6中手势H在侧面拍摄时,伸出的 两根手指会重合在一起,易误判为手势I。另外,一些手势图像 在预处理时部分有用信息会丢失,这些因素都会对识别率造成 一定的影响。 4 结语 本文利用改进的YCbCr颜色空间椭圆模型实现了色度信 号与亮度信号分离,减少了光照强度对手势图像的影响,一定程 度上满足了图像分割的要求。Hu矩和傅里叶描述子构建的混 合特征训练的BP神经网络相对于单一特征训练的BP神经网 络,在满足实时性的基础上极大地提高了识别率。同时提取的 手势结构特征进行的粗分类,对BP神经网络识别结果有很好 参考文献 [1]Licsar A,Sziranyi T.User-adaptive hand gesture recognition system with interactive training[J].Image and Vision Computing,2005,23 (12):1102—1114. [2]Phung S,Bouzerdoum A,Chai D.Skin segmentation using color pixel classiifcation:naalysis and comparison[J].IEEE Transactions on Pat- tern Analysis and Machine Intelligence,2005,27(I):148—154. [3]张良国,吴江琴,高文,等.基于Hausdorf距离的手势识别[J].中 国图象图形学报:A版,2002,7(11):1144—1150. [4]黄春木,周利莉.密度分布特征及其在二值图像检索中的应用 [J].中国图象图形学报,2008,13(2):307—311. [5]殷涛,葛元,王林泉.基于几何矩的字母手势识别算法[J].计算机 工程,2004,30(18):127—129. [6]Gamal M,Abdul K,Sallam E.Hand Gesture Recognition using Fourier Descrlptom[C]//International Conference on Computer Engineering and Systems,Cairo,EGYPT,2013:274—279. [7]徐战武,朱淼良基于颜色的皮肤检测综述[J].中国图象图形学 报,2007,12(3):377—388. [8]Dhrnva N,Rupanagudi S,Sachin S,et a1.Novel Segmentation Algorithm for Hand Gesture Recognition『C]//IEEE International Multi Confer- ence on Automation Computing,Control,Communication and Com- pressed Sensing,Kottayam,INDIA,2013:383—388. [9]Pramod K,Prahlad V,Ai P.Attention Based Detection and Recognition of Hand Postures against Complex Backgrounds[J].International Jour- nal ofComputerVision,2013,101(3):403—419. [10]Hsu R,Mottaleb A,Jain A.Face detection in color images[J].Pattern Analysis and Machine InteHigence,2002,24(5):696—706. [11]李丹娇,彭进业,冯晓毅,等.结合CCS与傅里叶描述子的手势特 征提取[J].计算机工程,2012,38(6):178—180. [12]Liu Y,Zhang L,Zhang S.A Hand Gesture Recognition Method Based on Multi—Feature Fusion and Template Matching[C]//International Workshop on Ifnormation and Electronics Engineering,Harbin,PEO— PLES R CHINA,2012:1678—1684. (13]裴利沈,董乐,赵雪专,等.基于区域形状与运动特征的实时行为识 别[J].计算机科学,2013,40(5):261—265. (上接第141页) [16]Fukungaa K.Introduction to statistical pattenr recognition[M].Aca— demic press,1990. [17]Wong M A,Lane T.A kth nearest neighbour clustering procedure [C]//Computer Science and Statistics:Proceedings of the 13th Sym- posium on the Interface.Springer US,1981:308—311. [18]Phillips P J,Moon H,Rizvi S A,et a1.The FERET evlauation method- ology ofr face-recognition lagoirthms[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2000,22(10):1090—1104. [19]Gao W,Cao B,Shan S.The CAS—PEAL lrage-scale Chinese face data- base and baseline evaluations[J].IEEE Trnasactions on Systems Man nad Cybernetics,2008,38(1):149—161.