智能安防新技术——大空间建筑中基于视频的步态分析(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-10 12:04:00

点击下载

作者:张德

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

智能安防新技术——大空间建筑中基于视频的步态分析

智能安防新技术——大空间建筑中基于视频的步态分析试读:

前言

现代社会中,公共场合下的安全形势日益严峻,如何确保公众安全越来越成为人们关心和瞩目的话题。像银行、机场和大型商场等具有大空间建筑特点的公共场所有着不断增长的智能监控需求,即自动确定或者验证人的身份。传统的身份验证系统包括基于知识的(Knowledge-based,如密码等)和基于拥有物的(Possession-based,如钥匙、身份证等)。

众所周知,传统的身份验证系统存在很多缺陷,如容易丢失、遗忘、易被复制和篡改等。日益兴起的生物特征识别系统则能有效克服这些缺点,它通过利用人们所特有的、区别于其他人的生物特征来特定标识一个人。生物特征是一个人专属的特征信息,不会丢失和遗忘。而且,一般情况下一个人的生物特征不可能被完全复制。目前常被用于身份验证系统的生物特征包括DNA、牙形、虹膜、指纹、掌纹、手部静脉、手型、脸像、红外脸温谱、耳形、颅骨、声音、签名、笔迹、步态等。这些特征都是人自身固有的,非常可靠,只能模仿却不能复制。

本书所关注的出现在监控视频中的行人步态(Gait),即人行走时的姿态,是一种新兴的生物特征。早期的医学研究表明:步态是一个独特的个性化特征,拥有韵律,并且本质上周期性的。步态与其他生物特征相比较,具有四点优势。一是非侵犯性,即在步态信息获取过程中,被采集者保持其自然的行走过程即可,而无须与被采集人任何身体部位发生接触,也无须保持某种特定姿势。二是非感知性,即可以在被采集人毫无察觉的情况下完成步态信息获取,这在监控场景中具有十分重要的意义。三是远距离识别,即步态信息能在远距离获取,即使是在低分辨率下,步态特征仍能提供丰富和有效的信息进行身份识别和状态分类。四是难于隐藏,即脸部信息可以通过化妆改变,指纹、掌纹等都可以通过整形手段改变。而在自然情况下,人们走路的姿势是不受自己控制的,是一种下意识的行为。主观控制走路姿势,将会使得行走姿势不协调,从而容易被系统检测出来。

美国国防高级研究项目署(Defense Advanced Research Projects Agency,DARPA)于1997年启动了一个重大的视觉监控项目——VSAM(Visual Surveillance and Monitoring),其目标是研发自动智能视频理解技术,以用于未来的智能城市或者智能化战场等。关于行人的运动分析是VSAM项目中一个极其重要的研究内容。2000年,DARPA又启动了一个重大项目——Human ID(Human Identification at a Distance)计划。Human ID计划的目标是研发智能生物特征识别技术,实现远距离的行人检测和身份识别,以期能够为军事保护和领土防卫提供早期的关键预警支持。2001年9月11日,美国发生恐怖袭击事件,使得政府、民众和企业对安全监控、设施保护、领土防卫和犯罪预警的要求变得非常强烈。2015年在法国、澳大利亚等地都发生了严重的恐怖袭击事件,地点都是影剧院等大空间场所。与此同时,计算机硬件技术和性能飞速提高,而价格却不断下降,这使得视频监控系统的部署成本越来越低,性价比越来越好。视频监控系统的广泛普及也和计算机视觉、机器学习和图像处理等研究领域的软件算法的成熟相辅相成,互相推动着前进。

本书是应智慧城市发展的要求,抓住最关乎人民群众安全的智能视频监控做了深入的研究,给广大读者提供了解和学习前沿科学技术的机会。特别是当前大空间建筑越来越多,基本上都属于人群密集场所。在当今复杂的社会形势下,保护人民群众的安全刻不容缓。本书作者都是在智能安防领域从事过多年研究的科技人员。其中,北京建筑大学张德编写了第1、3、6、7、8章,航天信息股份有限公司技术研究院胡懋地编写了第2、4、5章。作者2015年12月第1章绪论

步态即人在行走时所表现的姿态。人在行走过程中,上肢、下肢关节处呈现有规律的变化,这种变化反映了个体独有的运动方式。通过对步态的分析,可以得到身份、性别、种族等多种有用信息。由于步态是一种可以从远距离获取的、难以隐藏和伪装的生物特征,其识别技术已经成为计算机视觉与模式识别中的一个重要研究方向,适用于大空间建筑内的智能视频监控系统。因此,本书把步态分析作为探讨对象,就其尚待解决的难点和热点问题进行了深入研究,提出了高效、准确的属性分类和身份识别算法。1.1 步态分析概述

步态,顾名思义,就是人走路的姿态。在美国最畅销的《韦氏词[1]典》中,步态被定义为人走路的方式(A Manner of Walking)。步[2]态作为一种后起新兴的生物特征,因人而异,也因人群而异。从分类识别的角度来考虑,可以进行基于步态的性别分类、种族分类、年龄分类和身份识别研究。此外,在监控系统中往往可以同时获得人脸和步态的信息,从而进行基于步态和人脸融合的研究。1.1.1 步态分析的发展背景

最近十多年来,伦敦地铁爆炸案等恐怖袭击事件使人们更加清晰地认识到安全监控对国防和公共安全的重要性。大量的监控摄像头已经被安装于银行、商场、大型厂房和地铁站等大空间建筑类场所。人工的监控手段已经不能满足当前的安全需要,因为这不仅耗费大量的人力和财力,而且监控人员的生理视觉疲劳使得安全预警的目的很难达到。因此,这些安全敏感场合迫切需要一种智能化的预警手段。理想的智能监控系统应该能够自动分析摄像机采集到的图像数据,在恶性事件尚未发生前进行预警,从而最大限度地减少人员伤害和经济损失。例如,发生盗窃时立即对人进行跨区域跟踪并确定身份信息,出现通缉犯时及时报告等。这就要求监控系统不仅能判断人的数量、位置和行为,还需要分析人的身份等信息。

常用的生物特征分为生理特征和行为特征两种。其中,生理特征是指人与生俱来的直接表现形式,如虹膜、指纹、掌纹等;行为特征是指人后天逐渐形成的执行某种动作时表现出的特定习惯,如签名、声纹等。在监控场景中对人进行身份识别时,距离往往比较远,绝大部分特征难以被清晰完整地获取。现有的智能监控手段一般选用人脸作为检测、跟踪和识别的生物特征,其缺点也十分明显,例如,由于视角和遮挡而不能拍到正面完整人脸,距离较远导致脸部分辨率过低等。这使得人脸这种静态生物特征在实际的视频监控应用中往往不能达到好的识别效果。

步态特征由生理条件决定,与体重、腿的长度、骨骼粗细等都有关系。行走是人的自然活动,对于监控环境中的行人,步态是一种极具潜质的生物特征。在一定的距离下,当其他的生物特征由于分辨率过低或者故意被隐藏时,步态却可能发挥作用。与其他生物特征相比,步态具有可远距离获取、非接触性和非侵犯性、难以伪装模仿或隐藏、不需要特别配合及接触识别设备、对图像分辨率要求低等优点。例如,人脸和虹膜等通常需要距离比较近以保证采集的图像足够清晰,而指纹和掌纹等往往需要与传感器进行接触来完成采集。步态可以从几十米甚至上百米远的距离处采集到,这一优点是其他生物特征难以比拟的。而且,步态可以用非接触的方式进行隐蔽采集,而大部分生物特征往往需要用户的友好配合来完成采集。这一点在智能监控中十分重要。另外,在公共场合中的每个人都要走路,如果一个人要刻意改变自己的步态,那么他的行为往往变得可疑而更容易引起注意。[3,4]

早在20世纪60年代,M.P.Murray等人在医学实验研究中就已经证明了步态是一种可识别的周期性的运动模式,并初步分析了身高、年龄等因素对步态的影响。H.J.Ralsto等人把步态细致的分解为[5]多个关节和肌肉的合成运动,其中的参数因素包括体重、四肢长度、关节速度、骨骼结构等,并指出了步态模式的唯一性。这些工作都为步态作为一种生物特征在生理学上做了充分的论证。在早期的关于步态识别的心理学研究中,大多工作是基于光点的观测识别实验。[6,7]G.Johansson和C.D.Barclay等人在研究中把反光片或移动光灯等设备固定在人的几个关节上,使得观测者在黑暗中只能看到这些光点而不能直接看到行人,研究中的光点分布如图1-1所示。实验结果与生理学测量的结果相符,大部分观测者凭借有限的光点就能够认出他们所熟悉的朋友。以上实验证明了步态作为一种个人的唯一运动模式,并且性别、年龄的差异性较大,能够用于身份、性别和年龄等的准确识别。图1-1 附着在人体关节处的光点示例

由于智能监控的迫切需要和计算机相关领域的发展成熟,步态识别研究在20世纪90年代逐渐兴起。按步态数据的来源分,目前的步态研究主要有基于特殊传感器数据和基于图像序列两类。在基于特殊传感器数据的步态研究中,常用的传感器设备主要有触觉和穿戴式两[8,9]种。触觉传感器一般指多自由度(角度)压力传感器,通常被安装在一段特定的道路上,以采集人在行走时产生的压力信号,图1-2[7]所示为赤脚、穿皮鞋和穿布鞋时的脚部压力图像。穿戴式传感器需[10]要附着在身体上,用于关节点等部位的速度、加速度、位置等信息的选择性采集,延续了上述生理学研究的方法。常用的有光感应设备(如反光片、移动光灯)、加速度传感器、磁传感器、回转仪等。通过传感器能够直接获取指定部位的运动信息,在数据的精确度上容易保证,但需要比较复杂的装置来进行采集。P.Vanitchatchavan在研[11]究中对关节夹角变化模式进行了分析,在骨盆、膝盖和脚踝这3个关节处粘贴测角器,记录行走过程和行走停止时关节处的角度变化信[12][13]息,并分析其运动模式。C.D.Barclay等人和J.E.Cutting等人提出了利用肩宽、臀宽等特征进行身份和性别识别的方法,还分析了识别的准确性和可行性,这也成为后续很大一批研究工作的基石。这类方法的适用范围大部分在医学研究中,常用于对人的健康状况等进行诊[14][15]断,如帕金森病患者的诊疗反馈。另外,还有基于雷达等信号的受限步态分类研究。图1-2 压力传感器采集的脚部压力图像示例

基于图像序列的步态识别研究一般是指不依靠特殊设备,只通过光学摄像头拍摄到的视频获取步态特征并进行识别。2000年,美国国防高级研究项目署DARPA启动了Human ID计划,受到该计划的支持,来自世界范围内的多家研究机构和高校开展了大量关于步态识别的工作。在步态识别技术的发展过程中,马里兰大学、麻省理工学院、卡耐基梅隆大学、南佛罗里达大学、乔治亚理工学院、南安普顿大学等都分别建立了自己的步态数据库,然后对世界各地的研究人员开放,大家用这些数据库开展自己的研究工作,并互相借鉴,促进学术交流。目前在学术研究中被广泛使用的步态数据库有中国科学院自动[16]化研究所模式识别国家重点实验室的CASIA数据库,美国卡耐基梅[17]隆大学机器人研究所的CMU-MOBO数据库,英国南安普敦大学电子与计算机科学学院的信息、信号、图像与系统研究组的SOTON数[18]据库,美国南佛罗里达大学计算机科学与工程学院的计算机视觉[19]与模式识别研究组的USF数据库等。基于这些数据库,已经有很多步态识别的研究成果,它们通过对步态特征进行分析,能够比较准确地获取身份、性别、年龄、种族等信息。这些数据库中最常用的是CASIA数据库中的B数据集,常被简称为CASIA-B步态数据库,由中国科学院自动化研究所模式识别国家重点实验室在2005年采集。CASIA-B数据库收集了室内环境中11个视角下124个人的步态视频,其中有83名男性和31名女性,在视角个数、人数规模、性别均衡度等方面都是最具有优势的。除了普通步态以外,该数据库中还收集了每个人在穿大衣和背包时的步态视频。本书主要使用CASIA-B数据库来进行身份识别和性别分类的研究。另外,为了更全面地验证本书中提出的算法,也选用了其他一些数据。例如,选用CASIA-A室外步态数据库验证算法对室外环境的鲁棒性。

基于图像序列的步态识别研究,也即步态作为生物特征的识别研究,可以分为属性分类和身份识别两大类。一般,属性分类又称属性识别,其目标是要识别出人的性别、年龄、种族等自然属性,其常见的应用是在远距离拍摄的大型监控场景下对行人进行粗分类,例如,对性别和年龄的查找、统计等,其针对的数据一般有分辨率不高、待测人数较多、类别数较少等特点。身份识别则常用于在中远距离、人数较少的场景中对特定行人的查找、验证等。现有的一些工作在步态识别研究中有一定的通用性,如在空间特征方面,椭圆拟合和积分投影等特征都已经被用于身份识别和性别分类的实验中。并且,基于步态的属性分类和身份识别都会遇到视角、衣着、携带物品等因素的影响。但现有的研究还不够成熟,体现为遮挡、相机抖动、光线变化等条件下难以提取到精确的步态特征、视角变化时步态特征难以匹配等问题。这些是属性分类和身份识别的研究中都需要解决的问题。

但是,即使对于同样的步态数据,属性分类和身份识别需要考虑的问题也有很大的不同。以性别分类为例,首先,身份识别的算法要求易于处理多分类问题,因为需要从多个身份中寻找最可能的一个,而性别分类则是一个二分类问题,多分类问题和二分类问题在模式识别的方法选择上有着不同的考虑;其次,在模型复杂度等考虑上,身份识别与性别分类也是不同的,一般,各性别比各身份有更多的数据,并且在数据分布上也更加复杂,所以,在建模和匹配方法上也应该进行针对性的考虑;再次,当以身份识别为目的和以属性分类为目的时,获取数据的代价是不一样的,这导致了识别策略上的差异。例如,相比获取特定身份的行人的多视角数据,收集属于某性别的行人的多视角数据显然更加容易。所以,基于多视角步态的身份识别工作一般更关注视角转换问题,即给定一个人在某视角下的步态特征,合成或匹配这个人在其他视角下的步态特征,而性别分类则可以针对直接大量视角的各性别数据进行建模。

步态识别可用于安全敏感场合的监控系统中,如银行、机场、地铁站、军事设施等重要场合。步态运动属于人的运动形式的一种,因此,它离不开对人的运动进行分析的视觉处理技术。美国国防高级研究项目署DARPA(Defense Advanced Research Projects Agency)于1997年启动了一个重大的视觉监控项目——VSAM(Visual Surveillance and Monitoring),目标是研发自动智能视频理解技术,以用于未来的智能城市或者智能化战场等。关于行人的运动分析是VSAM项目中一个极其重要的研究内容。2000年,DARPA又启动了一个重大项目——Human ID(Human Identification at a Distance)计划。Human ID计划的目标是研发智能生物特征识别技术,实现远距离的行人检测和身份识别,以期能够为军事保护和领土防卫提供早期的关键预警支持。2001年9月11日,美国发生恐怖袭击事件,使得政府、民众和企业对安全监控、设施保护、领土防卫和犯罪预警的要求变得非常强烈。进入21世纪以来,计算机硬件技术和性能飞速提高,而价格却不断下降,这使得视频监控系统的部署成本越来越低,性价比越来越好。视频监控系统的广泛普及也和计算机视觉、机器学习和图像处理等研究领域的软件算法的成熟相辅相成,互相推动着前进。

在很多监控环境中,有时并不需要或不能准确识别出目标的身份,而是对目标的一些状态更为感兴趣,例如,性别、年龄、携带状况或者步行姿态是否正常等。在大使馆、油库或者飞机场周围,我们对人们的携带状况感兴趣;在人口密集和海关等场所,我们对步行姿态是否正常感兴趣;在危险作业区域内,我们对行人的年龄感兴趣。而且,对行人进行性别、种族和年龄的识别和分类有助于目标的身份识别。性别、种族、年龄、身高、体重等被称为软生物特征属性[20](Soft-Biometric Trait),这些属性都有助于提高身份识别正确率。在智能监控系统的应用中,提供行人的性别、种族和年龄等属性信息对于疑犯查找、场景分析等具有重要价值。因此,本书针对性别分类、种族分类和年龄分类做了很多研究工作,通过确定这些软生物特征属性来增强视频监控系统的智能性和预警分析能力。同时,目前的监控环境中摄像头越来越多,拍摄的信息越来越全面。为了充分利用监控系统中所获得的生物特征信息,本书不仅研究基于步态的行人分类和身份识别,也研究了基于步态和人脸融合的行人分类。1.1.2 步态识别的国内外研究现状

步态分析在医学、生理学、认知心理学等诸多领域有着长期的研究,这些领域内的研究成果为计算机视觉领域的步态研究提供了大量的理论依据和思路指导。早期的医学研究证明“步态是一个独特的个性化特征,拥有韵律,并且本质上是周期性的”[21,22]。在关于通过步态来识别性别的研究上,医学和心理学等领域的研究人员做了大量的实验。早在1970年,Murray等人就观察并分析了不同性别的人的走路姿态,从正面视角下的步态研究出发,他们认为行走过程中肩部[22,23]的摆动对于区分性别来说是一个有效的信息点。Murray等人使用的是以点光源记录的步态数据来进行的性别分类实验研究。点光源这种方式是在人的身体关节部位粘贴发光点,然后在人走路的过程中记录这些发光点的位置和运动轨迹等信息,把这些信息作为步态数据[24],以此为基础进行研究实验。Kozlowski和Cutting在1977年开始了[25]基于步态的性别分类研究,他们的实验结果表明,观察者能够区分出由点光源步态数据表示的个体性别属性。在他们的实验中,首先通过点光源的方式进行步态数据采集,记录了6位个体(3位男性,3位女性)行走时侧面(径向)方向上,也就是侧面视角,粘贴的发光点位置等信息,然后让观察者判断这些数据分别是来自哪个性别的个体。实验结果表明性别分类平均正确率为63%。他们还发现晃动手臂、改变行走速度或是遮挡一部分身体都会对识别率产生较大的影响。当个体不自然地摆动上肢时,分类正确率几乎下降到随机选择的水平,[26]也就是50%左右。他们进一步的实验还有一个有趣的发现,仅通过观察粘贴在两个脚踝上的发光点记录的数据就可以进行性别分类,就是说以部分的点光源数据为基础就可以达到近似于使用全部数据下的分类正确率。

Barclay等人对基于点光源步态数据的性别分类进行了进一步研[27]究,分析了时域和空域参数对分类正确率的影响。由他们的实验结果可知,要正确识别出个体性别,至少需要两个完整的步态周期。并且,他们发现,行走速度的变化对性别识别正确率有很大的影响。正常速度下采集的步态数据,如果使用低速播放的方式呈现给观察者,会使得性别分类正确率下降到随机选择的水平。另外,如果把点光源发光点模糊化或者把点光源步态数据图像颠倒显示,同样也会使得分类正确率下降到随机选择的水平。如果个体点光源数据表示图像被上下颠倒,那么女性容易被认为是男性;而男性个体则容易被认为是女性。Barclay等人指出,这一现象是由于男性和女性身体结构不同造成的。男性肩比臀宽,而女性则臀比肩宽,因此,颠倒点光源图像会使得肩部和臀部位置颠倒,观察者容易将男性认为是女性,而将女性认为是男性。Cutting等人的研究也支持了肩部和臀部的比例关系[28]在性别分类中的影响作用,并提出了躯干的时刻中心特征。这些主要是基于男性和女性的身体结构差异来提出的。在行走过程中,动态的可视化信息同样也会对性别识别起重要的作用。Mather等人通过一系列实验找出了运动中的结构信息和动态信息在性别识别中的不同[29]作用。实验中他们所关注的结构信息是肩部和臀部的宽度比,而动态信息则是身体的横向摆动。实验结果表明,男性上部身体横向摆动的幅度比女性大,并且在通过人工干预点光源数据使得动态信息和静态信息发生冲突时,动态信息比静态结构信息更占优势,即观察者更多地依据动态信息做出性别判断。Troje也比较了动态信息和结构[30]信息对性别分类的不同作用。使用点光源表示的步态数据,他们的实验结果表明动态信息可以得到更好的性别分类正确率。

上述实验多数都是基于侧面视角的步态数据。也有一些实验进行了视角对性别分类能力影响的比较。在点光源表示的步态数据下,正面视角比侧面视角具有更好的性别识别能力。Montepare等人也分析[31]了年龄对性别识别的影响作用。实验数据包括4个年龄段的样本,分别来自儿童、少年、青年和老年群体。相对应的平均正确识别率分别为55%、70%、64%和69%。还有研究人员对不同动作下的性别识别率进行了实验,包括行走、坐下、起立、站在椅子上和跳动等动作。[32]在这些动作下得到了75% 的平均正确识别率。他们还比较了自然行走状态和刻意模仿或者伪装状态下得到的步态数据对性别识别能力的影响,实验结果表明,自然行走状态下性别识别率最高,可以达到86%。[33]

Cho等人在一个大规模的数据库上进行了性别分类的研究。同样是采用点光源表示步态数据,并且包括了来自98个样本(47位女性,51位男性)的数据。他们的实验结果表明,如果健康的成年人在不穿鞋的情况下以自然速度行走,那么他们行走的姿势将会依据他们的性别有所不同。实验发现,女性在身高和腿长方面都比男性矮和短一些,而步行节奏比男性快,盆骨宽度比男性宽。由于女性的腿较短,所以,她们步幅会短一些。女性行走时臀部上下摆动较大,并且她们的膝关节外翻角度比男性大。

对于以点光源方式表示的步态数据,后期也有研究人员使用模式识别领域的方法来进行自动性别分类实验,而不再是通过志愿者观察测试或者认知心理学领域的方法。Troje采用了一个两级主元分析框架。实验数据库包括20个男性样本和20个女性样本,数据为点光源获取的三维运动轨迹。第一级主元分析对每个样本的数据进行处理,把运动模式分解为姿态基向量。第二级主元分析对由基姿态连接组成的描述向量进行处理,降低维度。另外,使用线性分类器进行分类,达到了92.5%的正确分类率。Davis等人提出了一个三模态主元分析[34-36]方法来进行性别分类。把初始的男性和女性步态数据分解到一个三模态的子空间中,三模态包括姿势、时间和性别。不同于Troje的工作,Davis等人使用的是二维的轨迹数据,而不是全三维的数据。他们对样本的行走速度和身高进行了归一化处理。最重要的是,他们所提出的三模态子空间,使得在主元分析的表示方法中可以嵌入有表现力的权值。权值应用于每一个点光源表示的轨迹数据,从训练数据中自动学习权值的大小,由此来实现自适应性的上下文相关性别估计,取得了更高的性别识别率,达到了95.5%。

在关于通过步态来进行年龄分类的研究方面,医学和心理学等领域的研究人员也进行了大量的实验。Murray等人通过记录绑定在人身上的反光带的运动轨迹信息而得到相关的步态数据来进行分析。数据采集使用闪光灯拍照方式,在行人身上不同的部位绑定了反光带,这些反光带的位置点组合可以近似表示人的形状。在一个半黑的环境中,被采集者在远离照相机16英尺的地方沿着直线行走。所使用的照相机调整到每秒闪拍20次,这样采集到的数据是连续的接近于视频流的步态数据。在他们的实验中,一共有60个人,按照年龄分为5组,分别对应20~25岁、30~35岁、40~45岁、50~55岁和60~65岁。由于在头部、颈部、上肢、下肢、足部、脚踝等身体部位都绑定了反光带,所以,根据采集到的反光位置,以及运行轨迹等数据可以测量得出的参数信息有:步态周期的时间长度、行走中不同姿势阶段的持续时间长度、行走一步的长度和宽度、臀部、膝盖和脚踝处的角度变化,还有头部和颈部的竖向、横向的移动距离等。通过比较不同年龄段样本得到的这些参数信息,Murray等人得出结论,当个体的年龄大于60岁时,其步态和其他年龄段的个体有明显的不同。特别是步幅的长度和速率有明确的下降。另外,他们也发现,脚底和地面之间的角度参数随着个体的不同,差异较其他参数更为明显。

Hageman等人为了分析老年人群体的医疗器材辅助问题,研究[37]了年龄对人体的运动特别是走路带来的影响。实验中采集了来自26个健康女性个体的步态参数信息,其中一半个体来自20~35岁,另一半来自60~84岁。数据采集使用两个高速摄像机,分别从被采集者的正面和侧面视角去拍摄。在每个视角下还放置了光源设备,用以提供分析步态周期的参考点。每个被采集者都按照正常行走速度,在长为14米的直线路径上行走来进行步态数据采集。从侧面视角的数据中可以测量出的参数有脚踝部位肌肉在行走中的弯曲程度、重心的平均水平移动速度、步幅长度和重心的垂直偏移范围。从正面视角的数据中可以测量出的参数有步幅宽度、重心的左右偏移范围、骨盆的倾斜程度、骨盆的转动程度和胫骨的转动程度。主要使用独立t检验方法对来自不同年龄段的基本测量参数值进行比较。经过比较发现,年老的个体比年轻的个体步幅短,平均走路速度下降,步幅的差异程度较明显。这些都表明,由于年龄的变化带来了人身体机能的衰退,也导致了各种运动包括行走表现出的因年龄而产生的差异。这就说明,根据步态是可以对年龄进行区分的。后来,Blanke等人采集了不同年龄段男性样本的行走数据,按照上述方法进行了同样的实验比较,得[38]出了一致的结论。

Elble等人重点考察了步态的两个独立变量——步幅长度和步幅[39]频率,受年龄变化带来的影响。有20个年龄为20~39岁的年轻人和20个年龄为65~87岁的老年人参与了实验。这些个体是经过挑选的,保证他们在神经病症相关方面都是健康的。这是为了排除神经方面的病症对步态带来的干扰,保证所采集的不同年龄段数据的纯粹性,也就是说只有年龄的区别。这些个体平时都有规律性的身体锻炼,没有任何行走障碍和相关疾病。步态数据信息的采集是通过获取粘贴在人体不同部位的反光片的运动轨迹来记录的。反光片的粘贴位置为小脚趾、脚后跟、脚踝、膝盖、臀部、骨盆、肩部和肘部。被采集者沿着长度为10米的直线路径进行了正常速度和快速行走。通过对不同年龄段下得到的数据的分析,和年轻人相比,在快速行走方式和正常行走方式下,老年人在走路速度和步幅长度上分别有17%和20%的下降。并且,在脚趾离地的最大距离、摆臂角度、臀部和膝盖的摆动角度等参数上都有下降趋势。Oberg等人在一个大规模的数据库上进[40]行了步态相关参数信息的分析。该大型数据库包括233个健康个体,跨越年龄区间10~79岁。步态数据是在10米长的直线路径上、室内环境下采集。使用了光电管进行数据采集,主要进行了慢走、正常行走、快走3种方式下基本步态参数信息的采集,包括行走速度、步幅长度和步幅频率。通过双因素方差分析模型来进行数据分析,发现走路速度和步幅长度随着年龄而变化的现象,和前面所述的实验结论是一样的。随着年龄的增长,行走速度和步幅长度有明显的下降趋势,而步幅频率变化不明显,甚至观察不出来。后来,在Ostrosky等人的研究中,也进行了如上类似的数据分析,不过,他们增加测量了膝盖[41]的伸展程度参数,并且发现该参数随年龄而明显不同。他们的实验数据库包括30个年轻人样本(20~40岁)和30个老年人样本(60~80岁)。在被采集者下肢侧面的骨盆、膝盖、脚踝等位置粘贴上6个反射式标识。然后,在被采集者行走过程中使用摄像机来记录行走图像和反射式标识的位置变化图像。通过标识点的位置变化可以测量出步幅长度、行走速度、臀部转动角度、膝部扩展角度、脚踝转动角度等参数信息,然后使用统计学的F检验等方法进行了数据分析而得出结论。

Nigg等人使用运动学分析方法,对常速行走状态下获取的样本数[42]据考察步态参数信息随年龄的变化。在3种方式下采集了步态数据:光脚行走、穿标准鞋行走和穿自己的鞋行走。在他们的实验中,对行走过程中身体关键部位的运动路径进行了分析。数据库包括118个身体健康的个体,60个男性和58个女性。按照年龄分为4组:20~39岁、40~59岁、60~69岁和70~79岁。运动相关参数的三维数据通过一套三维运动分析系统来采集。在被采集者的身体左侧腿和脚上的9个不同位置固定粘贴圆形反光标记,使用高速摄像机来拍摄记录走路情况。通过对因年龄变化带来的对步态相关参数的影响,Nigg等人把缘由归于肌肉力量随着年龄增长的削弱。背负肌肉和脚底肌肉力量的衰退对于一个健康的人而言从50岁开始。这样会对运动的控制能力带来很大影响,在走路过程中肌肉的收缩和放松时间会变久一些。这些分析对计算机视觉领域的基于步态的年龄分类提供了先验理论支持。

如上所述,年龄的增长带来缩短的步幅长度,也导致了行走速度的下降。Judge等人考察了走路过程中关节的运动和步幅长度的关系[43]。三维的步态运动学数据被采集,采集对象包括26个老年人(平均年龄79岁)和32个年轻人(平均年龄26岁)。实验数据分析发现,老年人在步幅长度上有10%的下降,在步态周期的后期阶段姿态上表现出脚踝部位肌肉力量的下降,而只能通过提高臀部肌肉力量来弥补。这样的发现可以帮助老年人来改善如何增强走路质量,从而避免生活中过多的不方便。这样可以通过适当锻炼脚踝部位的肌肉,来保持走路的步幅长度和速度,避免随着年龄的增长而导致的行动不便。Price等人于1997年发表了一篇综述文章,总结了医学和生理学领域[44]多年来对步态的研究分析。在该文献中提到,人的行走运动在7~60岁达到成熟状态,过了60岁之后走路状态逐渐下滑,由于走路不慎而跌倒已经成为老年人发病的主因。所以,医学界一直在探讨有效的诊断措施来预防和避免老年人跌倒的频率,来改善老年人走路的质量。Price等人从神经学、生理学和运动学等方面对老年人走路的变化进行了总结和分析,也指出了在采集步态数据方面的一些关键要求:着重从健康群体来采集数据,才能得到可靠的实验分析,而且,数据库规模越大越好。这些对我们在计算机视觉领域进行相关研究也是很好的参考点。

20世纪90年代后期,许多计算机视觉领域的研究人员开始着手步态的分析和研究,从视频中录制的行人走路图像序列来进行步态特征分析并将提取出的步态特征应用于身份识别和行人分类。从2000年开始,从事步态分析的研究人员越来越多,步态研究进入迅速发展阶段。步态作为一种新兴的生物特征被广泛研究,生物特征研究的前提是采集数据库。长期关注步态研究的代表性研究机构有英国南安普敦大学、美国麻省理工学院、卡内基梅隆大学、佐治亚理工学院、马里兰大学和中科院自动化研究所等。这些研究机构都在不同的变化条件下进行了步态数据库的采集,并且共享了采集的数据库。表1-1列出了可以公开使用的规模在25人以上的步态数据库。在这些数据库的基础上,大量的步态分析算法被提出来。表1-1 公开的25人以上的步态数据库

当前的步态分析方法要么使用行人的时空模式得到步态特征,要么通过光流分布来提取特征,要么特征化实际运动的外观,要么瞄准一般性目标结构运动描述等。如何紧致有效地表达分割出的(或跟踪的)行人是非常重要的,因为它将直接被进一步分析来获取用于识别或者分类的步态特征。步态自身包含两种重要的分量,结构化分量和动态分量。结构化分量捕捉了一个人的身体形状,如身高、肢体长度、步长等,而动态分量捕捉了人体行走期间的运动特性,如人摇摆胳膊、臀部、腿的方式等。根据上述观察,当前的步态特征分析方法可以被划分为两个主要类别。一类是基于模型(Model-based)或结构(Structural)的方法,它通常建模人体结构并且提取图像特征来映射它们为模型的结构化分量,或者衍生出人体部分的运动轨迹来识别和分类个体;另一类是非结构(Non-Structure)或者基于运动(Motion-based)的方法,它通过特征化人体的整个运动模式来获取运动特征的紧致表达,而不考虑潜在的结构。

基于结构的方法旨在明确地对人体或者运动进行建模。它通常需要在行走序列的每一帧中进行模型匹配,并且对参数(如角速度、轨迹、肢体长度等)在人体或运动模型上加以度量。走路是人最常见、最普通的一种运动,在行人前进的过程中,臀部和膝盖是不停旋转变化的。结合这两个部分的结构特征,Kuan对腿建立了两个钟摆模型[45]。以骨盆为轴,大腿的摆动引起的角度变化可以建立一个钟摆模型;以膝盖为轴,小腿的摆动引起的角度变化也可以建立一个钟摆模型。这个钟摆模型可以追溯到Murray等人对人体生理学研究的结果,已经表明臀部和膝盖的旋转角度变化是一个周期性的伸展和弯曲过程,并且对于一个人来说该变化具有一致性。由于裤子遮挡的影响,从行走视频或者行人图像中自动取得准确的膝盖的旋转角度很难,但是使用相位信息可以消除角度误差的影响。考虑到钟摆模型周期性的特征,傅里叶变换可以把周期性信号表示为基本谐波信号。通过傅里叶变换可以得到频谱幅值和相位信息。衣物的遮挡不会影响到钟摆旋转模型中的相位成分。Cunado等人使用傅里叶变换得出的相位信息,建立起准确的钟摆模型。使用最小方差拟合来进行去噪处理,最近邻方法进行分类。Cunado等人在10个人的数据库上进行了基于步态的身份识别的实验,实验结果表明基于该钟摆模型可以得出不错的正确[46,47]识别率。Cunado等人又进一步提出了大腿随时间变化的模型,[48]该模型还包括骨盆也就是旋转轴心的速度变化。Cunado等人对如何以这个模型来描述步态特征进行了完整的讲述。通过分析大腿的运动来反映臀部的旋转模式,并使用傅里叶变换来进行模型分析。所建立的模型描述了骨盆位置上下和前后的运动变化,还有大腿晃动的角度。在常速行走下,表示大腿晃动角度的函数是周期性的,适合用傅[49]里叶序列来表达。Yam等人对大腿和小腿同时建模。一个钟摆模型表示大腿的运动,另一个钟摆模型表示小腿的运动变化。这两个模型之间由膝关节相连。大腿的结构由表示臀部的一个位置点和该点与膝盖位置点的连线,以及该条线和垂直方向所成的锐角来表示,小腿的结构就由膝盖位置点和脚踝位置点的连线,以及该条线和垂直方向所成的锐角来表示。由于在行走过程中,人体姿态随着时间连续变化,所以,这两个结构都是以时间为变量的函数。文献[48,49]都使用了基[50]于速度的霍夫变换方法,从图像序列中自动获取模型所需要的角度变化情况。[51]

Bouchrika等人设计了一个基于模型的自动特征抽取方法。首先使用Harris检测到脚后跟位置,然后辅以霍夫变换检测关节位置,主要是膝关节和骨盆关节处。这样就可以建立一个人体模型,得到相应的步态相关参数。在后来的研究工作中,Bouchrika等人使用同样的方法得到步态特征,然后使用自适应前向顺序搜索算法来进行特征[52]选择,使用选择出的低维特征进行分类。他们还使用这种基于模型的步态分析方法,对影响步态的各种客观条件进行了实验研究[53]。这些条件包括鞋子的变化、衣服的变化、携带物品的变化和走路速度的变化。Calow等人探讨了基于模型的步态分析中的两个问题[54]。一个是从合成的图像的像素点到三维模型的逆映射问题;另一个是如何获得自动三维模型跟踪的初始化参数问题。对于这两个问题,他们提出了梯度双差分算法,使得这两个问题得到了有效的解决。[55]Chai等人采用融合形状和动态参数信息的方法来进行步态分析。根据身体各部分的比例,他们使用棍模型进行动态参数的获取,形状信息使用的是像素点个数和轮廓图像高宽比例。由此得到两种步态特征,分别进行了特征层和决策层上的融合。

基于结构的方法的优点是所建立的模型在某种程度上能够处理遮挡和噪声,并且提供了可直接从模型参数中获取步态特征的能力。然而,人和摄像机之间的距离要求不能太远,否则,图像分辨率过低,使得模型难以被准确描述和建立。并且,在三维空间中准确跟踪和定位人体长期以来是计算机视觉领域中的挑战性问题。另外,很多建模方法的计算代价也是很高的。一般认为步态模式上的变化可以从图像序列中的变化像素进行恢复,所以,基于运动(或者说是不需要模型的)的步态分析方法是可行的。对于诸如步态的周期性运动,运动变化的空间分布非常明显。捕捉这些变化并且分析它们的时间变化能够推出一个有用的周期性运动的特征化方式。非结构的方法通过由行人在图像中的轮廓所产生的时空模式的统计特性来特征化步态运动。

Little等人使用光流来分析步态序列图像,得到行人的位置信息和[56]光流分布。接下来,计算这些周期性信号的频率和相位。光流用来分析步态序列图像包含的运动相关信息,所以,最后提取出的特征为不同测量下的相对相位。Ben Abdelkader等人使用自相似图来分析[57]步态序列的运动信息。将步态序列灰度图归一化到同样大小并且正好仅包含行人,然后对步态序列图像来计算自相似图,接下来使用PCA对自相似图进行降维处理。在文献[58]中,Ben Abdelkader等人进一步从自相似图中提取出单元自相似图,这其实是一组标准化的特征向量,使用此进行分类。Tolliver等人对二值步态轮廓图像进行聚[59]类分析。由于人在步态过程中的姿势是不断变化的,所以,可以把相似的姿势聚为一类。同时,他们使用一个光谱分割框架来分析轮廓图像之间的相似度。最后,在训练集与测试集之间进行姿势比较与[60]匹配。Liang等人把独立主元分析引入了步态特征的提取分析。首先,PCA用来从二值步态轮廓图像中获取不相关的主元系数;然后,在这些系数上进行独立主元分析,得到独立的主元系数,将同一个人的独立主元系数平均化,就可以用来表示这个人的步态特征。Ekinci[61]等人引入了核PCA方法。首先,二值步态轮廓图像可以在上、下、左、右4个方向上进行投影,每个周期的步态序列就可以得到四幅投影图像;然后使用核PCA对这4幅图像进行降维处理,并进行特征层上的融合;最后,实验结果表明该方法具有很好的分类性能。

Lee等人考虑到步态运动包含了丰富的二维形变信息,由此,作[62]者引入了一个同时进行步态跟踪和识别的框架。该框架基于一个人体全局的形变模型,该模型利用运动多样式嵌入和核映射得到。人体形状的几何形变和姿势的变化使用贝叶斯公式来估计。形状变化形成的每个人特有的步态方式可以用来进行身份识别,实验结果表明该方法具有不错的识别性能。Vega等人使用SoPF框架对步态特征进行分析,该框架的全称是Space of Probability Functions,是用来计算特[63]征间关联度分布的一个统计模型。他们使用的步态特征是在步态序列的一帧中发生变化的边缘像素信息。Sundaresan等人引入了隐[64]马尔可夫模型(HMM)来进行步态分析。在一个步态序列中,不同时刻的步态姿势是不同的,并且是连续稳定变化的。二值轮廓图像中所包含的轮廓就代表了不同的步态姿势,以此为状态,使用HMM进行分析,并且使用L1和L2泛数来进行距离计算分类,实验结果表[65]明,该方法具有不错的识别性能。Iwamoto等人使用傅里叶描述子来处理二值轮廓图像的轮廓边界,由此得到的时序信号再使用HMM来分析,最后的实验结果表明了该方法的有效性。

在处理具体问题的时候,选择合适的步态分析方法是很重要的。没有哪一类或者哪一种步态分析方法是最优的。但是,提高步态分析算法的鲁棒性和高适应性是步态研究领域一个重要的发展目标。1.1.3 步态特征分析综述

本节对空间特征分析和时间特征分析的相关典型算法进行综述和讨论。步态空间特征的研究目标是如何从图像序列中提取出身体轮廓、关节点位置等信息,以便用于进一步的时序分析和识别。步态空间特征分析方法可以分为基于二维结构、基于三维结构和基于非结构这三大类。步态的时间特征分析方法主要有4种:基于周期特性的方法、基于动态匹配的方法、基于时间切片的方法和基于时序建模的方法。

很多基于二维结构的方法仅以腿部的运动作为分析对象,能够达到较好的识别效果。下面介绍一些典型的特征提取和应用方法。Mark S.Nixon等人在文献[66]中介绍了一种基于边缘检测和Hough变换的连接线模型。这种模型可以通过证据收集的机制发现运动目标,并将两腿的运动建模为一对线段的变化。他们用余弦变换函数来表示水平速度的改变,用正弦函数来表示两腿夹角的变化。由于Hough变换自身对噪声和遮挡的鲁棒性,这种模型被用于发现图像序列中的运动目标,以及确定感兴趣区域(ROI)等。ChewYean Yam等人在文献[67]中建立了两个钟摆模型,对图像序列中的大腿和小腿分开建模,在进行傅里叶变换之后,使用相位和幅值的乘积作为步态特征进行身份识别。Jang-Hee Yoo等人在文献[68]中提出了一个三段式、两夹角的钟摆模型,主要对腿部的夹角进行建模。每个腿的模型都用三角多项式插值函数表示,各包括两个中心点和两个夹角,来表示躯干、大腿和小腿之间的关系,也能够达到一定的识别效果。每帧中的模型参数都由线性回归得到,并由相关系数得到当前模型参数的可信度,再以滑动平均配以可信度权值来决定最终的模型。Yang Ran等人在文献[69]中结合边缘检测和Hough变换提取出主要步态角度(腿部),用训练好的贝叶斯分类器将其分为大角度步态和小角度步态两类。

除了腿部以外,身体其他部分的结构特性,以及在行走时的运动也能为步态识别提供帮助,提高识别率。A.Y.Johnson和A.F.Bobick在文献[70,71]中从步态图像序列中恢复出了每个人的4个静态参数作为识别的特征,包括头脚距离、头到骨盆距离、脚到骨盆距离和双脚距离。然后根据这些参数的方差情况来估计识别的可信度,并给出了用高斯模型进行识别的ROC曲线。David K Wagg等人在文献[72]中使用高斯平均滤波、Sobel边缘检测、平均背景减除等预处理之后,得到了运动目标及其内部的边缘信息,然后采用运动补偿的时间积累算法对一段数据序列进行叠加。利用椭圆和多边形等形状拟合叠加后的结果,并用这些形状的参数进行最终的步态识别。Rong Zhang等人在文献[73]中提出了一个五分区的人体模型,各分区用一个梯形表示。他们假设这五部分是高斯独立的,然后使用Metropolis-Hasting算法进行形状参数调整,并给出了相应的跟踪算法。然后用踝关节高度、膝盖高度、踝关节距离和膝关节距离的变化曲线的傅里叶变换特征进行识别。Guochang Huang等人在文献[74]中对不同视角的实心轮廓图采用不同的分块,并使用椭圆拟合来表述,正面0度和侧面90度两个视角的拟合结果如图1-3所示。然后,通过融合不同视角的椭圆参数进行步态识别。图1-3 正面和侧面视角下的椭圆拟合结果示例

Frederic Jean等人在文献[75]中使用了一种更简单的特征,用头部和双脚的三条运动轨迹进行识别。这些轨迹的提取难点在于双脚在步态运动周期过程中的自遮挡问题,他们对每一帧判断双脚是否分开,以此作为左、右脚在前在后的切换判断,在未切换的时间段内用光流进行跟踪。Baofeng Guo等人在文献[76]中将最大化互信息量的方法用于步态特征的选择中,目的是摒弃高维特征中的无关冗余信息,找出对识别最重要的部分。他们将最大化互信息量应用于包含用形状拟合方法得到的身体各部分大小位置等参数和运动速度等的步态特征中,并把选择出的低维特征用支持向量机(SVM)进行识别,达到了比相关性分析和方差分析的降维结果更好的准确率。

采用三维人体结构模型进行分析的主要优势在于能够融合多个视角的信息,便于解决单视角情况下的自遮挡问题,从而准确地表达肢体的结构。三维结构可以应用于不同视角下的步态信息提取,但是相比二维的方法需要使用不同视角下拍摄的图像序列作为训练数据。

Shiloh L.Dockstader等人在文献[77]中提出用层次化的带软约束的三维骨架模型来拟合多角度的图像序列。软约束是从具体活动中表现出的身体配置中获取一个先验分布,用来补充由硬运动约束限制的骨架运动模型。他们使用了带时变参数的结构模型去测量步速、站立阔度、步幅、单脚站立时间和其他的步态参数,并给出了其模型用于跟踪的具体步骤和效果。R.Urtasun等人在文献[78]中用椭球组合的三维模型参数与多个视角下已经同步的图像序列进行拟合,并用主成分系数作为特征,提出了一种确定性的跟踪算法。实验中用少量数据显示出了一定的识别能力。Junxia Gu等人在文献[79]中提出了一种通过三维体数据中自动提取关节点和姿态等参数序列的无标记恢复方法,然后从恢复出的参数序列中获取形态特性(关节的组合)和运动特性(位置、方向和身体的高度),并用隐马尔可夫模型(HMM)和基于样例的隐马尔可夫模型(EHMM)进行时序建模,基于这些模型的加权最大后验概率(MAP)之和用在最终的识别中。

对于不需要从图像序列中恢复出人体模型,而是直接提取图像特征作为步态特征的方法有图像分辨率要求低、计算复杂度低等优点,是目前主流的步态分析方法。根据初始特征的不同,可以分为实心轮廓图、轮廓线、光流特征等类别。

实心轮廓图是最常用的一种初始步态特征,它可以通过减除背景后检测得到。这里介绍一种简单的轮廓图提取方法。首先,计算序列中所有帧的平均图像,将其作为背景图像。给定一个阈值,针对每一帧图像的每一个像素点,与背景图像中该像素值之差大于阈值的设为前景像素点,反之,设为背景像素点。将各帧前景和背景像素点的值分别设为1和0,就得到了初始的实心轮廓图。为了降低轮廓图的噪声,再用腐蚀和膨胀的方法消除图中的一些不连续区域。最后,将所有轮廓图缩放到同一大小,并按水平和竖直中心对齐,得到归一化后的轮廓图序列。下文将归一化后的轮廓图简称轮廓图。目前已经有很[80-83]多对实心轮廓图进一步做空域特征提取的研究,如Gabor特征、[84]LBP特征等。

Yanxi Liu等人在文献[85]中提出了Frieze模式步态特征,即在每一帧对实心轮廓图进行横向和纵向的像素投影积分上进行对称性分析。他们借助于几何群论来描述周期性特征,列出了7种不同的Frieze模式集。然后用对称距离和最近邻分类器进行识别实验,达到了比较好的正确率。Zongyi Liu等人在文献[86]中分析了实心轮廓图的质量对身份识别能力的影响,并提出了一种实用的修复方法。首先,他们将一个周期的步态序列线性映射到35个关键姿态上,然后提出了本征姿态的概念,即使用主成分分析(PCA)方法对每一个关键姿态进行训练,得到保留80%能量的本征向量和系数。通过使用HMM构建这些关键姿态的连接关系,可以对一个序列的每一帧进行姿态索引,最后用该索引下的本征姿态进行重建,得到修复后的实心轮廓图。他们还通过计算每帧轮廓的前景像素点个数的方法对步态周期进行分[87]割和提取。由于人在行走时腿部会周期性地分开和合拢,前景像素点个数也会随之周期性地变化。为了提高精度,只计算下半部分的像素点数。两个最小值的距离均值作为半个周期的长度,两次这样的变化即为一个周期。然后,采用了实心轮廓图的一个周期内的平均图[88]作为步态特征,获得了可接受的识别率。Ju Han等人将周期内的实心轮廓图的平均值定义为步态能量图(GEI),这也是目前使用最广泛的步态特征。他们还将经典的PCA和线性判别分析(LDA)降维方法直接应用于GEI,提出了GEI+PCA+LDA步态特征,并用欧式距离进行相似性度量,实验证明这是一种快速且有效的身份识别方法。

Nikolaos V.Boulgouris等人在文献[89]中采用了Radon变换,即极坐标变换下各角度的积分投影,对实心轮廓图进行特征描述,然后将LDA用来对一个周期内堆积的特征进行降维,并进行身份识别。他们在文献[90]中还手动将实心轮廓图分为头部、躯干,以及左右部分的大臂、小臂、大腿、小腿八块,并对各块轮廓图的识别权值进行了分[80]析研究。Dacheng Tao等人提出了一种张量空间的线性判别方法(GTDA),并将其应用到实心轮廓图的Gabor滤波特征上,获得了比线性判别分析等方法更好的识别效果。Xiaochao Yang等人在文献[81]中在步态能量图的基础上,提出了增强的步态能量图(EGEI),即利用能量图的每个像素点的方差作为依据对各像素点赋予不同的权值,并用Gabor滤波和线性判别分析获得了较好的识别率。Jianyi Liu等人在文献[91]中将实心轮廓图的前景像素随时间变化的趋势作为衡量轮廓图质量的依据,并此作为各帧的权值提出使用轮廓图质量加权(SQW)后的步态能量图可以达到更高的识别率。De Zhang等人在文献[92]中将横向和纵向的像素投影积分图应用于性别分类上。图1-4和图1-5所示分别是从0°、30°…… 180°视角下的步态序列中提取出的纵向和横向投影积分图。图1-4 不同视角下的纵向投影积分图示例图1-5 不同视角下的横向投影积分图示例

Lei Chen等人在文献[93]中将Radon特征用到了基于步态的性别分类上,不同性别的Radon步态特征如图1-6所示。Savvas Argyropoulos等人在文献[94]中将实心轮廓图Radon变化后进行环向和径向的积分作为特征,把识别问题视为信道编码问题,并用纠错码进行用户验证。Shiqi Yu等人在文献[95]中对基于步态的性别分类做了心理学实验,还提出了一种分块加权的自动性别分类方法。实验表明,人类通过步态识别出性别信息,人体的上下两部分的贡献各不相同。然后,将先验知识与自动的方法相结合可以提高人工分类精度,即把侧面人体轮廓平均图分为头、前胸、后背、腰臀和腿5个部分,并用支持向量机(SVM)进行权值的学习,达到了较好的实验效果。Erhu Zhang等人在文献[96]中基于两两实心轮廓图差分之和提出了主动能量图(AEI),然后结合二维局部保持映射(2DLPP)获得了更高的识别率。Junping Zhang等人在文献[97]中进行了基于低分辨率步态能量图的识别研究,并将超分辨率(SR)的方法应用其中。他们把步态能量图看作一个二维张量,使用多线性张量学习(MTP)和线性判别分析结合的方法进行识别实验。Ibrahim Venkat等人在文献[98]中将步态能量图分为多个部分,包括上、中、下三部分,以及左、右两部分,并用贝叶斯网络训练出各部分对身份识别的相关影响程度,在背包等状态下达到了较好的识别效果。

Liang Wang等人在文献[99]中以人体轮廓的形状中心作为原点,沿着轮廓线等角度采样360个点,计算与原点的距离,然后使用基于主成分分析的特征空间变换提取步态特征,以减少输入空间的信号维数。Liang Wang等人在文献[100]中使用Procrustes形状分析方法通过轮廓线获得紧致体型表示。Maricor Soriano等人在文献[101]中将正面视角下的轮廓线用Freeman编码的梯度向量表示,二维互相关系数用于目标间的比较识别。Kyung Su Kwon等人在文献[102]中将测地主动边界模型(GACM)和均值漂移(mean-shift)应用在步态轮廓的提取和跟踪上,从而获得比较准确的轮廓线用于步态识别。De Zhang等人在文献[103]中通过轮廓线对老年人和年轻人的步态进行分析,将沿边缘等角度采样的60个点离中心的距离作为分类的特征。然后,使用距离差分特征和EHMM对不同年龄段的步态轮廓序列进行建模和分类。Chen Wang等人在文献[104]中提出了时间步态图(CGI),通过颜色映射来编码各帧之间的时空信息,以提高识别性能。先在每个步态实心轮廓图中用局部信息熵法提取出外轮廓,利用颜色映射对一个周期的所有帧进行编码得到一个时间步态图用于识别。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载