基于粒计算模型的图像处理(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-01 14:45:30

点击下载

作者:郝晓丽

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

基于粒计算模型的图像处理

基于粒计算模型的图像处理试读:

前言

人们在认知和处理现实世界的问题时,常常采用从不同层次观察问题的策略,这种策略可以使用粒计算的原理更加准确、严格地表述。因此粒计算不仅是一些理论、方法、技术或工具的总称,而且可以认为是一种看待客观世界的世界观和方法论。粒计算可以从两大方面来进行研究:粒的构造和使用粒的计算。前者处理粒的形成、表示和解释,后者处理在问题求解中粒的运用。总的来说,粒计算是通过粒对现实问题的抽象、粒之间的关系、粒的分解和合成以及粒或者粒集之间的交互来描述和解决问题的一种方法。

本书以研究粒计算的3个主要模型——词计算模型、粗糙集模型、商空间理论模型的基本理论为起点,从人工智能、粒度表示、所研究的对象粒等角度,分析了三者之间的联系及区别。由此,本书以一种新的粒计算模型——粒度格矩阵空间模型为理论轴线,在二进制粒空间和模糊空间下进行了定义和定理的阐述和证明,解释了粒化、粒计算,使其成为连接关系、粒、矩阵理论和图论之间的一座桥梁。其次,将该理论与其他智能计算理论相结合,依次应用于完备和不完备信息系统的知识发现、聚类、图像分割、镜头边界检测、关键帧提取、人脸检测、人眼检测、面部表情识别等相关领域。

本书在结构上力求从传统理论研究入手,以粒计算模型为主线,以应用研究为立足点,由浅入深、由远及近地介绍了粒计算理论的历史发展、研究现状及应用。在文字叙述上,着力描述准确、简明扼要、层次清晰,便于读者对全书理论的了解和梳理。在内容上,本书集合了著者多年对粒计算模型研究的理论体会,以及以大量实验为基础的研究成果。谈及此处,深知从事粒计算理论研究的学者前辈之多、研究理论之深广、经验之丰富,足令著者等晚辈自惭,虽以此书为阶段科研总结,也是下一步致力于应用领域研究的契机。

全书共分11章,安排如下。

第1章为绪论,总结了粒计算的基本问题,分析了粒计算目前存在的3个主要模型,同时对其当前的研究现状及在相关领域的应用进行了阐述,为新模型的建立提供了理论和应用依据。

第2章提出了粒度格矩阵空间模型。该章在集合论的框架下,从商空间理论、粗糙集方法及模糊集理论出发,提出更强有力的粒度格矩阵空间模型(GX,GA,GV,(GI,GE,GM),t),构成一个更加完整的粒计算理论。第2章是全书的理论基础,为后续章节的知识发现、聚类和图像分割等领域的应用提供了有力的理论依据。

第3章阐述了基于新模型的完备和不完备信息系统的知识发现。首先,以完备信息系统为研究对象,通过等价关系将论域划分为互不相交的等价粒,以粒度格矩阵作为运算途径对系统进行知识约简。其次,针对粗糙集知识发现的非动态性缺点,提出了一种基于新模型的具有动态粒度的决策规则挖掘算法。最后,以不完备信息系统为研究对象,通过构造相容粒和粒空间,达到不完备信息系统的知识挖掘。

第4章提出了基于新模型的动态聚类算法,阐明了对不同性质的样本点采用“动态粒度”聚类的必要性。利用第2章建立的粒度模型和第3章基于新模型的知识发现算法,对构建的信息系统进行知识挖掘,明确样本集合中各属性的权值,重新定义距离公式,提出了新聚类算法。第4章是第3章提出的基于新模型的知识发现算法在聚类问题中的应用,从另一个角度验证了基于新模型的知识发现算法的可行性和有效性,同时为第5章的图像分割问题做了铺垫。

第5章详细描述了粒度格矩阵空间模型下的图像分割问题。首先,论证了图像分割问题与粒度划分的一致性,完成了图像向粒度格矩阵空间模型的转换。其次,根据等价关系的不同设定,将图像转化为具有分层结构的知识体系。最后,在各单元粒度层完成图像的逐次分割后,通过粒度的合成取得最终的分割效果。

第6章在分析镜头边界检测算法的基础上,提出了一种基于多粒度特征融合的自适应双阈值镜头检测算法。该方法运用HSV颜色粒度特征和LBP纹理粒度特征来突出表现视频帧的主要内容,同时采用自适应阈值选取方式进行镜头边界检测。

第7章针对当前关键帧提取算法普遍存在速度慢、时间复杂度高等缺点,提出了一种基于CUDA模型的粒信息熵的关键帧提取算法,利用帧粒互信息熵提取图像帧特征,并运用SUSAN算子完成帧粒特征的边缘匹配,结合CPU+GPU并行编码的方式加速计算过程,从而缩短提取关键帧所用的时间开销。同时,提出了基于DCT与NCIE的关键帧多级提取方法,将镜头分为动态镜头集和静态镜头集,针对动态镜头,采用非线性相关信息熵(NCIE)对镜头帧进行相似性度量,从子镜头中选择最接近平均信息熵的一帧作为关键帧。

第8章提出基于Adaboost的人脸检测多阶段优化算法。该算法为避免传统Adaboost算法易出现训练过度、训练时间长、误报率高等问题,在算法学习和检测过程中通过扩充训练样本、缩减特征数量、限制样本权重等,对传统Adaboost算法进行多阶段优化;其次,通过在算法前端和后端设置自判断机制缩减误报。在分类器判断待检测窗口之前设置前端误报缩减机制,通过边缘能量初步过滤、删除非感兴趣子窗口,提高检测准确度;后端自判断机制是在Adaboost算法检测后,设置基于粗糙粒的肤色检测和边缘蒙板的“过滤器”,在窗口内再次筛选人脸,进一步缩减误报。

第9章在改进Adaboost算法三层结构人眼检测方法的基础上,针对CamShift算法在跟踪过程中仅仅依靠前一帧获取到的目标信息初始化当前帧图像的搜索窗口缺乏预测模块、易跟踪失败等弊端,将Kalman滤波器引入CamShift算法,提出了一种基于Kalman滤波器和改进CamShift算法的双眼跟踪方法;其次,在人眼检测和人眼跟踪的基础上,利用Ostu对定位到的人眼区域进行阈值化处理,通过Freeman链码方法提取人眼外围轮廓进行拟合,根据椭圆的长短轴比值分析判断人眼状态。

第10章针对改善深度置信网络运用于面部表情识别时,易出现局部结构特征被忽视、顽健性差、运算量大等问题,提出了融合双韦伯特征的深度置信网络表情识别算法。通过设计双韦伯描述算子,在空间分布优化传统韦伯特征的梯度方向算法,对图像进行初次特征提取,丰富局部细节纹理信息;其次,在深度置信网络中进行二次特征提取,融合局部纹理信息的表征优势,借助深度学习在整体结构信息的提取优势,得到更易识别的高级抽象特征。

第11章为结论和展望,总结了全书的工作及创新,并为下一步的研究指明了方向。在本书的编写过程中,初稿得益于太原理工大学谢克明教授的大力支持,在应用领域的编写中,得到了同课题组各位老师、同学的鼓励和帮助。在此,对他们表示衷心的感谢。限于著者的水平,书中难免存在不妥之处,敬请致力于粒计算研究的前辈、同仁和各位学者批评指正。作者2019年5月第1章 绪论1.1 引言

人们在认知和处理现实世界的问题时,常常采用从不同层次观察问题的策略,这种策略可以使用粒计算的原理更加准确、严格地表述。因此粒计算不仅是一些理论、方法、技术或工具的总称,还可以认为是一种看待客观世界的世界观和方法论。

一般来说,人们对事物的认识总是由浅至深、由表及里。人们在思考问题时,总是先从总体进行观察,然后再逐步深入地研究各个部分的情况;或先从各个方面对同一问题进行不同层面的了解,然后对它们进行综合;或根据具体情况,将大问题分解成若干个小问题,或把若干个小问题合并成一个大问题。人们从不同的角度或不同的层次对问题进行观察和分析,然后把这些零星的、片面的知识进行汇总,进而对整个事物有较为系统的、全面的了解。总之,凭借经验或专业知识,根据需要从不同层面、不同角度反复对事物进行了解、分析、综合、推理,最后得出事物本质的性质和结论,这正是粒计算的基本思想。

顾名思义,所谓粒度,就是将问题划分为不同大小的颗粒,规模较大的对象称为“粗粒度”,反之则称为“细粒度”,继而进一步研究粗细粒度的相互转换。所谓粒计算,就是研究被划分类或颗粒的大小及这些颗粒之间的关系。

以上是对人们智能求解问题的总结,即人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题求解,还能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。这种处理不同粒度世界的能力,正是人们对于问题求解能力强有力的表现。同样地,在信息处理过程中,人们希望计算机能从不同的粒度解决复杂的问题,甚至能在不同的粒度之间进行跳跃或在不同的粒度之间进行计算结果的融合以得到更优的解。这就要求在信息处理的过程中引入粒计算,完成信息粒化的过程,即解决和处理大量复杂信息问题时,需要把大量复杂信息按各自的特征和性能将其划分成若干个较简单的块,而每个如此划分的块被看成一个粒。由此看出,粒计算同样是智能计算最重要的研究方法。

虽然目前还没有一个公认的关于粒计算的精确定义,也没有一个统一的粒计算模型,但它被公认为是信息处理的一种新的概念和计算范式,其覆盖了所有与粒度相关的理论、方法、技术和工具,主要用于不确定、不完整的模糊海量信息的智能处理。在很多情况下,当问题涉及不完全性、不确定性或模糊信息时,人们很难将不同元素区分开来,这时不得不考虑粒,典型的例子是粗糙集理论。同时,在许多实际问题中并不要求精确求解,或获取精确信息的代价不菲,而粗化粒度就可以有效而实际地解决问题。由此引出了模糊逻辑的原则:“充分利用不精确、不确定和部分为真的容许偏差,实现问题求解的易处理、顽健、低求解耗费以及与现实的友好性。”因此,粒计算不仅是粒度属性的子集,同时也是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集。

本章对粒计算的相关知识进行了讨论,不仅总结了粒计算的基本问题,还分析了目前存在的3个主要粒计算模型,并对其当前的研究现状及在相关领域的应用进行了阐述。1.2 粒计算的起源

粒度原本是一个物理学的概念,是指对微粒大小的平均度量。在这里被借用作对数据信息和知识粗细的平均度量,用于从宏观或微观层面上分析和处理信息。在人们的认识活动中,粒度的思想无处不在,人们观察、度量、定义和推理的实体都是粒度。[1-2]

粒度的概念起源于20世纪70年代。模糊数学的创始人Zadeh首次提出并探讨了模糊信息粒度,以元素属于给定概念(信息粒)的隶属程度作为粒度,推动了模糊逻辑理论及其应用的发展。1996[3-5]年,Zadeh提出了“词计算理论”,认为人们认知的3个主要概念是粒化、组织和因果,人们在进行思考、判断和推理时主要是用语言进行的,而语言本身就是粒度。这标志着模糊粒度化理论的诞生。

与此同时,粒计算中的另一个子集——粗糙集(Rough Set)理论,从20世纪80年代初诞生以来就得到了长足的发展和研究。1982[6-7]年,Pawlak提出了粗糙集理论,认为“人的知识就是一种分类的能力”,这个观点可能不是很完备,但却非常精炼。它用论域中的子集来表示概念,给定了论域上的一簇子集,相当于给定了一组知识。这样,在论域中给定了一个等价关系,就给定了一个知识基,然后再讨论一个如何用这个知识基来表示的一般概念。

随着粗糙集理论的不断发展,并随之应用在人工智能领域中,人们开始探讨是否有一种更为抽象的、建立在粗糙集之上的广义理论,于是开始对粒度概念进行深入研究。

国内在粒计算的研究方面起步较早,如张钹教授和张玲教授提出的商空间理论粒度模型和模糊商空间理论粒度模型,是目前粒计算理论中的代表性研究方向之一。他们于1990年在清华大学出版社出版的专著《问题求解理论及应用》中进行了关于粒度问题的讨论,提出了商空间理论模型,建立了一整套理论和相应的算法,并将其应用于启发式搜索、路径规划等方面,取得了较大的成功。该模型已经和Zadeh的模糊集理论模型、Pawlak以粗糙集理论为基础的粒计算模型并列成为目前粒计算的3个主要模型。他们认为“人类智能的一个公认的特点,就是人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题的求解,还能够很快地从一个粒度的世界跳到另一个粒度的世界,往返自如,毫无困难。这种处理不同粒度世界的能力,正是人类问题求解的强有力的表现。”这正是建立商空间理论的出发点。

然而,粒计算(GRC,Granular Computing)作为一个专业术语是在1997年由Lin和Zadeh首先提出的。随后,Lin、Yao和Zadeh在文献中着重描述了粒计算的重要性,激发了人们对它的研究兴趣。随着粒计算理论研究的不断深入及其在相关各个领域的广泛应用,粒计算已作为一个固定的课题,成为当前人工智能领域的研究热点之一。

近年来,关于粒计算的文章和专著越来越多,粒计算的应用领域也越来越广,它已成为计算智能领域研究的热点。人们对它的研究将对复杂的智能系统的设计和实现产生深远的影响。1.3 粒计算的3个主要模型及其关系

虽然目前还没有一个公认的关于粒计算的精确定义,也没有一个统一的粒计算模型,但它被公认为是信息处理的一种新的概念和计算范式,覆盖了所有与粒度相关的理论、方法、技术和工具,主要用于不确定、不完整的模糊海量信息的智能处理,其实质是用简单易求、低成本的、足够满意的近似解替代精确解,即利用不精确、不完整、不确定和海量信息的可容度,实现问题的易处理、顽健性、低求解耗费以及与现实的友好性。粗略地讲,一方面它是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集,另一方面它又是粒度属性的子集。具体地说,凡是在分析问题和求解问题的过程中应用了分组、分类和聚类手段的一切理论与方法,均属于粒计算的范畴。1.3.1 词计算模型

人类思考、判断、推理主要用语言,而语言是一个很粗的粒,如何用语言进行推理判断,这就是词计算。Zadeh于1996年提出了“词计算理论”,标志着模糊粒度化理论的诞生。随后,Helmut教授的“词计算理论的语义模型”和Zadeh发表的文献促进了词计算理论的发展。词计算旨在解决利用自然语言,进行模糊推理和判断,以实现模糊智能控制。词计算理论对互联网上海量信息资源的高效利用有着深远的影响,由此,基于模糊集合论的词计算理论和模型的研究成为粒计算研究的主要方向之一。

Zadeh指出,人类认知的3个主要概念分别是粒化(Granulation)、组合(Organization)、因果(Causation)。他认为人类在进行思考、判断、推理时主要是用语言进行的,而语言本身就是“粒度”。粒化是将全体分解为部分;组合是将部分集合为全体;因果是挖掘出原因与结果之间的关系。对象A的粒化产生一系列A的粒,粒是指一些个体(元素、点等)通过不分明关系、相似关系、邻近关系或功能关系等形成的块,即每个粒为一簇点集,这些点难以区别,它们以不同的程度分属于几个不同的集合,是一种不确定现象。例如,人类头部的额头、鼻子、脸颊、耳朵、眼睛等,它们都是模糊粒,因为无法准确地划分它们具体的边界限位置。对于每个模糊粒,它都与一个模糊属性集联系在一起,比如头发,其模糊属性是颜色、长度、组织结构等,且每个模糊属性又与一个模糊值集联系在一起。在这里,模糊属性长度的模糊值包括长的、短的、不很长的等。这些模糊粒的属性及其模糊性都是在人类概念中形成、组织、处理并赋予特征值的。

总之,模糊信息粒化理论通过处理人类感知的信息,根据人类运用自然语言描述和分析事物的习惯进行运算,其运算对象是语言变量,即变量的值是用自然语言描述的词语或句子,是人类在一种不精确和部分真值的环境中做出合理决策的一种方法。

人的概念大都是模糊的,人脑在推理、形成概念粒方面的特点决定了信息的粒化具有模糊性。因此,模糊信息粒化正是这种能力的基础,是由定义它的广义约束来刻画的。在模糊逻辑中,它也是语言变量、模糊规则“if-then”以及模糊图的基础。这种划分上的不确定性是由于事物之间差异的中间过渡性所引起的,是事物本身固有的属性,它摆脱了经典数学中的二元性(非此即彼),使概念的外延具有一种模糊性(亦此亦彼)。

词计算就是在语言基础上发展起来的,是用词语代替数字进行计算和推理的一种方法。在词计算中,粒的概念是出发点。从本质上看,粒是点的模糊集,而这些点是一簇元素,由于相似性结合在一起。词是粒的标签,反过来粒是词的外延,一个词可以是原子词,也可以是复合词。词的外延可以是高阶谓词,作为词外延的粒可看作是对一个变量的模糊约束,如命题“小王是年轻的”,模糊粒“年轻”是加在小王年龄上的模糊约束。用词语进行计算有2个最主要的理由:第一,当可得到的信息不够精确从而使数值失之偏颇时,必须进行词计算;第二,当允许利用不精确性、不确定性及部分真值使问题易于处理、获得顽健性、降低求解费用以及能较好地与现实一致时,有利于运用词计算。

基于词计算理论的推理、决策和识别方式是最贴近人类的思维形式来求解问题的,其对复杂系统的信息处理有着广阔的应用前景,并在解决利用自然语言进行模糊推理判断、实现模糊控制以及在语言动力学系统和医疗诊断等应用领域获得了一些成功。1.3.2 粗糙集模型

波兰科学家Pawlak于1982年提出的粗糙集理论是一种刻画不完整性、不确定性的数学工具,主要解决信息粒在近似方面的问题。它是建立在分类机制基础上处理不精确、不确定与不完全数据的新的数学理论,不需要提供除问题所需集合之外的任何先验信息,仅根据观测数据删除冗余信息。通过比较知识不完整的程度——粗糙度、属性间的依赖性与重要性发现数据间的关系,在不损失信息的前提下提取有用特征、简化信息,为研究不精确、不确定知识的表达、学习、归纳方法等提供了一个有力的数学工具,为智能信息处理提供了有效的处理技术,成为当前机器学习、知识发现等领域的研究热点。

粗糙集理论将知识理解为对数据的划分,将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。每一个被划分的集合称为粒。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来近似刻画。

粗糙集理论的核心是将知识与分类联系在一起。在粗糙集理论中,“知识”被认为是一种将现实或抽象的对象进行分类的能力。分类用来产生概念,概念则是构成知识的模块。粗糙集理论中的不确定性和模糊性是一种基于边界的概念,即一个模糊的概念具有模糊的边界。

在粗糙集中,人们经常利用知识约简,在保证不丢失知识库有效信息的前提下,消除知识库中的冗余分类或冗余范畴。完成知识约简的基本工作是利用“约简”和“核”这2个概念进行的。核是表达知识必不可少的重要属性集。可以看出,核的概念有2个目的:首先,它可以作为所有简化的计算基础,因为核包含在所有的简化之中,且计算可以直接进行;其次,核是在知识约简时不能消去的知识特征的集合。

粗糙集理论不需要提供问题所需处理的数据集合之外的任何先验信息,对问题不确定性的描述或处理是比较客观的。由于这个理论未包含处理不精确或不确定原始数据的机制,因此其与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。目前,粗糙集理论已被广泛应用于神经网络、数据挖掘、系统分析、二进制粒算法等领域。1.3.3 商空间理论模型[8]

张钹等在研究问题求解时提出了商空间理论。该模型基于这样的哲学思想,即“人类智能的公认特点,就是人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题求解,还能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。这种处理不同粒度世界的能力,正是人类对于问题求解能力强有力的表现”。商空间粒度理论是关于复杂问题求解的空间关系理论,其主要内容包括复杂问题的商空间描述、商空间的粒计算、粒度空间关系的推理等。商空间理论已被成功应用于时间表安排、空间路径规划、遥感图像处理和模式识别等领域。

张钹等又将模糊集合论引入商空间,利用模糊等价关系实现了商空间模型的推广。模糊商空间理论能够更好地反映人类处理不确定问题的若干特点,即信息的确定与不确定、概念的清晰与模糊都是相对的,其都与问题的粒度粗细有关。因此,构造合理的分层递阶的粒度结构,可以高效地求解问题和处理信息。另一方面,商空间理论同样缺少实现粒度之间、粒度世界之间等转换的手段和技术方法。1.3.4 从粒计算分析三者之间的关系

词计算理论、粗糙集理论和商空间理论都是粒计算这把“大伞”下具体的粒计算模型,而且它们都是在集合论这个大框架下讨论粒计算的,即它们都把粒看作论域的子集。这三者不是相互排斥的,而是侧重点各有不同而已。下面,简单地讨论三者之间的联系。(1)从人工智能的角度来看

三者都是从各自研究的角度阐述了对人类智能的理解,虽然表述不尽相同,但是都体现了粒计算的基本思想。一方面,人们在求解复杂问题时,可以将其划分为一系列更容易管理和更小的子问题,并在这些子问题上进行求解,从而降低问题求解的复杂度。另一方面,在实际应用中,人们所获得的信息是不完全的、不确定的或模糊的,要想完全区分不同元素是很困难的,而且精确解的代价也很高。因此,为了提高问题求解的效率,需要选择适当的粒度,忽略无关紧要的细节,缩小对问题解的搜索范围。(2)从粒度的模型来看

虽然三者都是描述人类按照不同粒度处理事物能力的模型,然而商空间理论和粗糙集理论认为“概念用集合来表示”,即不同粒度的概念可以用不同大小的子集来表示,所有这些表示又可以用等价关系来描述。而词计算理论认为“概念用词来表示”,而描述“词”的有效方法就是模糊集合论。(3)从粒度的表示来看

三者都是将所讨论的对象的集合构成论域,然后通过子集来描述粒。商空间理论、粗糙集理论认为概念可以用子集来表示,不同粒度的概念可以用不同大小的子集来表示,所有这些表示可以用等价关系来描述。一个等价关系对应一个粒,它们的粒可定义为:

粗糙集主要是以G中的元素即等价类作为研究对象,商空间则R是以宏观粒作为研究对象。

Zadeh认为,概念用“词”来表示,而描述“词”的有效方法就是模糊集理论。设X为论域U上任意一个非空符号子集,则X中的任一有限或无限的元素组成的字符串都对应于X的一个词,可见词可以用集合来表示,只是此时的粒定义为G={X|X isr R},其按照约束R的类型进行分类。(4)从研究的对象粒来看

虽然粗糙集与商空间都是利用等价类来描述粒,利用粒来描述概念,但二者的侧重点有所不同。粗糙集理论是通过元素的不同属性值来描述元素之间的关系,即按照不同属性进行元素分类来表示不同的概念粒度对象。粗糙集理论主要研究概念的表示、刻画及粒与概念之间的依存关系。商空间理论的本质是对(X,f,T)采用分层递阶方法,其着重点在于通过模型转换来构造不同的粒度空间,进而研究不同粒度空间之间的相互转换、相互依存的关系,是描述空间关系学的理论。

然而,从Zadeh的观点来看,前两者所讨论的都是清晰的粒计算,而词计算则是模糊的粒计算,不同的词就表示不同的粒度。词计算理论主要研究如何描述由词界定的不同粒度的对象,它更擅长描述形容词、副词等表达的不同粒度的概念,如非常好、很好等。因为这些词有程度上的不同,所以在一定意义上,虽然词计算理论给出了描述元素之间的关系,但只限于由属性的强弱程度不同所形成的关系。

总之,商空间的求解过程是在“由所有商空间组成的半序格”中运动转换的过程,故可看作宏观的粒计算,而粗糙集理论是在给定的商空间中的运动,故可看作微观的粒计算。由于两者都建立在等价关系之上,因此可以将两者结合起来以便得到更为有效的粒计算工具。从理论上说,若对商空间理论和粗糙集理论进行模糊化,即在它们的模型上引入模糊的概念,则分别提出了模糊商空间理论和模糊粗糙集理论。

由以上对比可以看出,词计算理论是从微观的角度研究词的推理,粗糙集理论是从微观的角度研究属性的约简,而商空间理论是从宏观的角度研究粒度的变化规律。这3个不同的粒计算理论,从思考问题的出发点到解决问题的任务等都不尽相同,但是三者都有一个共同的特点,那就是都考虑到人类智能中有从不同粒度思考问题的这一特点。如何将三者的优点结合起来,形成更强有力的粒计算的方法和理论,是今后一个重要的研究课题。1.4 粒计算的基本问题

Yao认为,粒的大小、粒上的操作、粒之间的关系是粒计算理论发展中最重要的部分。对研究对象进行适当分割,在问题求解中使用粒子,是粒计算的基本思想。粒计算是一个很宽泛的概念,它“覆盖了所有有关粒度的理论、方法、技术和工具的研究。粗略地讲,一方面,它是模糊信息粒理论、粗糙集理论、商空间理论、区间计算等的超集,另一方面,它又是粒度数学的子集。具体地讲,凡是在分析问题中应用了分组、分类和聚类手段的一切理论与方法均属于粒计算的研究范畴。”综上所述,粒计算是研究信息如何分类的,被分成的块是两两分离的划分,还是两两可能有交的模糊分割,它还研究分成的粒度大小、不同粒度层之间的关系、粒度分解和合并等。简言之,它是对于基于不同粒度层次和粒度细节的一般问题求解理论的研究。

毫无疑问,要建立一个形式化模型,首先应该确定要研究的对象及对象之间的相互关系。下面,详细讨论构成粒计算模型的3种基本元素:粒、按照相同准则所得到的粒构成的粒层(粒世界)和所有粒层构成的层次结构,以及2个方面的问题:粒化和以粒作为运算对象的运算、推理。对于每个问题都可以从语义和算法这2个方面来进行研究。1.4.1 粒的构造和使用粒的计算

粒计算主要有2个方面的问题:粒的构造和使用粒的计算。前者处理粒的形成、表示和解释,后者处理在问题求解中的粒的运算。同时,粒计算可以从语义和算法的层面展开,其中每个方面对粒计算来说都同等重要。

①粒的构造:构造粒的标准、准则,构造粒的方法,粒的表示及描述。

②利用粒为对象的运算和推理:粒层映射,粒的转换,粒上的操作,性质保持性。1.4.2 粒

粒是构成一个粒计算模型最基本的元素,或者说是粒计算模型的原语。粒是一簇点(对象、物体),这些点由于难以区别,或相似、或接近、或因为某种功能而结合在一起。我们可以把粒理解为由若干小的“颗粒”遵循某个规则结合在一起而构成一个大的“颗粒”,该规则称为粒化准则,按照粒化准则形成粒的过程称为粒化。一般来说,按照一个粒化准则可以得到一簇粒。

粒是无处不在的。可以说,人类生活在一个对现实世界进行粒化后的世界中。例如,时间的粒化伴随着人类生活,大到一个国家的长远战略规划,小到每个人的日常生活安排,几乎都是粒化的例证。再如,图像处理及地理信息都涉及空间粒化,图像的下层处理涉及分割、边缘检测、降噪等,而上层处理涉及图像的描述、解释。不同阶段粒化的程度不同,或者说对图像抽象的程度不同。

一个粒的物理含义与具体的问题以及所采用的粒化准则有关。例如,在商空间理论、粗糙集理论、聚类分析中,粒化准则通常是等价关系,而相应的等价类就是粒,它是原来论域的一个子集。

综上所述,粒是按照某个粒化准则对原来世界进行抽象所得到的结果,是粒计算模型中最基本的元素。1.4.3 粒化

构造信息粒的过程称作信息粒化。信息粒化在本质上是分层次的。例如,在对一群人进行分析时,可以从性别、年龄、籍贯等角度进行考虑,即从不同粒度上来观察分析。

粒化是一个构造性的过程,可以简单地理解为在给定的粒化准则下得到一个粒层,在给定的多个粒化准则下得到多个粒层,进而得到所有粒层构成的结构。通常的方法可以是自顶而下地通过分解粗粒度的粒得到更细的粒,或自底而上地通过合成细粒度的粒得到更粗粒度的粒。粒化是执行粒计算的前提。

粒化准则考虑的是语义方面的问题,是回答为什么2个对象会被放进同一粒内的问题。关于粒化准则的一般要求有:粒化的结果使人们对问题的本质方面有更深入的理解,同时,抛弃那些无关紧要的细节,从而可以达到降低问题求解复杂度的目的。

粒化方法回答如何进行粒化的问题。在给定粒化准则的前提下,采用何种方法来实现粒层的构造,是算法方面的问题。例如,在划分模型下,粒化方法就是如何高效地实现划分的问题。1.4.4 粒层

Yao从整个粒计算的结构角度出发,提出粒计算中的3个层次结构如下。

①每个粒内部的结构。

②处于同一粒层的不同粒之间的结构。

③所有粒层形成的结构。按照某个粒化准则所得到的粒的全体构成一个粒层,又被称为一个粒世界,是对现实世界的一种抽象化描述。下面,主要集中在集合论上讨论粒层的内部结构和粒层上的运算,因此可以借助一些数学术语。事实上,绝大部分实际应用问题都可以抽象到集合论这种模型下。(1)粒层的内部结构

粒层的内部结构是指该层上的各个粒所组成的论域的结构,即粒与粒之间的关系。作为原来论域的子集来说,粒与粒之间可以是两两不相交的,如商空间理论、经典粗糙集理论;也可以是有交叉的,如基于模糊数学的词计算、某些广义粗糙集模型。粒层的内部结构可以把原来论域上的结构“继承”过来。(2)粒层上的运算

这里提及2类:一类是代数运算,另一类是函数运算。某个论域上的一个代数运算可以简单地描述为参与若干个运算的对象以及运算的结果,其都是该论域上的元素,可以等价地用多元关系描述,实际上可以看作该论域上的一种结构。

人类在认识事物和解决问题时,总是习惯于从不同的角度和不同的方面去观察和分析,这是人类认识事物的一种基本方法。粒计算思想延续了人类这种智慧的结晶,使粒化后的不同粒之间形成了一种层次关系,不同层次的粒通过一定的自身内在关系(规则等)来形成联系;一般来说,上一层的粒比下一层的粒粗糙,下一层的粒比上一层的粒更细(具体);不同层次的粒形成了一种分层的框架结构,正如人类思维中现实世界的概念也是层次结构的一样,并且这种层次结构可以形成一种偏序结构等。1.4.5 所有粒层构成的结构

一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,这实际反映了人们可以从不同的角度、不同的侧面来观察和理解世界。那么,所有的粒层在一起应该用一定的结构表示。我们可以用层次结构或塔状结构来对其进行描述。虽然所用的术语不同,但它们都传递了一个基本的信息:应该考虑所有粒层构成的结构。如果把每个粒层看成一个元素,那么所有的粒层构成一个论域。(1)粒层之间的关系

粒层与粒层之间可以按照集合的包含关系自然构成一个偏序集,甚至是完备格。例如,所有等价关系的全体构成完备格,其对应划分的全体构成的完备格被称为划分格,商空间理论和经典的粗糙集理论都是在这个格上进行讨论的,不过前者重在寻求一个合适的粒层上进行问题求解而后者强调在某个粒层上完成未知知识的表示。(2)粒层之间的通信

一个粒层就是一个智能Agent,它们之间应该有通信的功能,而遍历所有粒层的基本问题是编码和解码问题。编码是将输入该层的信息变换成该层所能识别的码字,而解码则是将该层的粒变换成目标层所能识别的格式。2个粒层之间的编码和解码应该满足的理想条件是两者的合成是恒同映射,但实际上往往不能满足,因此取某种最优解。(3)构造新的粒层

若给定一个粒世界,人们可以对它进行细分以得到抽象程度最低的粒层。例如,基于模糊等价关系的商空间理论,通过由小到大选取一组水平值,就可以得到一个分层递阶结构。若给定2个或若干个粒层,实际是得到对现实世界的不同层面的理解。为了得到对现实世界更为综合、客观的理解,需要进行粒世界的合成来解决这一问题。1.4.6 以粒为运算对象的运算和推理

以粒为运算对象的运算和推理,也就是前面所说的狭义上的粒计算。粒计算一般涉及粒、粒层和所有粒层构成的层次结构,也可以从语义和算法这2个方面来研究。(1)不同粒层之间的映射

由粒化得到的不同粒层之间的联系可以由映射来表示。在不同粒层上,同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题不同细节描述之间的关系。例如,在商空间理论中,分层递阶结构实际是一条商空间链,自然投影具有连接各个层的作用,且任何3个层次之间的自然投影满足合成律,这样就实现了对同一问题在不同细节上的描述。事实上,商空间理论中所讨论的投影问题、合成问题以及推理问题都与自然投影有关,其中的核心概念是它的连续性。(2)不同粒层之间的转换

在不同粒层上观察、分析、求解问题并实现在不同粒度间的自由转换,是粒计算的根本任务。考虑粗糙集模型,若等价关系由信息的属性子集决定,则对属性子集增加或减少若干属性,一般来说,可以实现在不同粒度之间的转换。在商空间理论中,从2个(或若干个)商空间出发进行合成,得到上界商空间和下界商空间,也可以完成不同粒度之间的转换。(3)性质保持性

粒化允许同一问题在不同的细节上表示,一个自然的要求就是该问题的某些关键性质必须能够在不同粒度上体现出来,这是衡量粒化准则好坏的一个标准。商空间理论关于连通性、序的讨论都体现了这一点,其关键是自然投影(同时可以看作粒化方法、集值映射)的连续性。特别是由连通性所得到的保假原理,可以大大地缩小问题求解的搜索空间,在推理模型中尤为重要。1.5 粒计算模型研究现状及与其他智能理论的关系1.5.1 粒计算模型研究现状

虽然词计算模型、粗糙集模型和商空间模型是3个主要的粒计算模型,但是在这3个模型的基础上,人们提出了很多新的模型。例如,基于划分的模型,文献[9]从语义和算法这2个方面定义了粒子的构建、描述和表达方法,研究了粒子进行计算和推理的规则等问题,并构建了Zooming-in和Zooming-out算子,用以实现不同粒层之间的粒子相互转化,该模型为基于集合论的划分粒计算模型。文献[10]在二元关系下,对粒计算的结构、表示和应用进行了系统的诠释,其研究对象是以邻域为载体的典型的覆盖模型。文献[11]提出了基于集合覆盖原理的粒计算模型,该模型是基于一个有限集合上的自反二元关系,并利用Zooming-in和Zooming-out算子来实现不同粒层上粒子的相互转化。文献[12]以容差关系为基础,提出了容差信息系统的粒计算模型,使用属性值上的容差关系给出了粒表示、粒运算规则和粒分解算法,提出了容差信息系统在粒表示下属性必要性的判定条件。文献[13]提出了相容粒度空间模型,根据人类具有依据具体的任务特性把相关数据和知识泛化或例化成不同程度、不同大小的粒的能力,并进一步依据粒和粒之间的关系来进行问题求解。文献[14]进一步研究了覆盖粒计算模型的不确定度量。1.5.2 粒计算模型与其他智能理论的关系

无论何种粒计算模型,其都反映了人类智能求解问题的本质,即人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题求解,还能够很快地从一个粒度的世界跳到另一个粒度的世界,往返自如,毫无困难。当前,模拟人类智能体系的理论有很多,如模拟自然界生物进化机制的进化计算,模拟人脑神经网络的结构和功能的人工神经网络构建,以及模拟人类复杂思想诸如判断、结论等的形式概念分析等,这些理论在机器学习、专家系统、故障诊断、预测控制和图像识别等领域都有着重要的理论意义和实际应用。因此,作为反映人类智能的新模型——粒计算模型,它不但与其他智能理论都有着千丝万缕的联系,而且它们之间的结合将为理论研究和工程应用开辟新的领域和方向。

1.粒计算模型与概念格理论[15]

形式概念分析也称为概念格理论,是Wille于1982年提出的,其基本思想是基于对象与属性之间的关系建立的一种二元关系概念层次结构,其中,每个概念都是对象与属性的统一体。从数据集中生成概念格的过程实际上是一种概念聚类的过程。概念格理论作为数据分析、规则提取和知识处理的形式化工具,已被广泛地应用于软件工程、知识工程、数据挖掘、信息检索等领域。

由于概念格与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示的,而且粒度划分本身构成一个格结构,因此两者在概念层次递阶方面有着密切的联系。文献[16]通过对论域的划分来分析概念,找出概念粒度划分与概念划分的格结构之间的联系,得到粒度划分格与概念格在进行概念递阶过程中的相通之处,为概念的泛化与细化提供了新的渠道。

概念格理论和粒计算的主要模型之一——粗糙集也有着内在的联系。虽然两者属于2种不同的数据处理方法,可以从不同层面研究和表现数据中隐含的知识,但它们之间有许多相似之处。例如,在概念格理论中引用近似算子,或将粗糙集的一些概念用概念格来表示。文献[17]提出了基于模糊概念格的算法,讨论了基于模糊概念格的模糊推理。

文献[18]首先对形式概念的外延与粗糙集的等价类之间的关系进行了讨论,给出了形式背景约简和划分约简之间的关系。文献[19]进一步证明了粗糙集与概念格之间存在着内在联系,由此定义了对象粒,给出了形式背景中对象粒的属性特征及属性粒约简,最终实现了由形式背景向集值信息系统的转化。

此外,文献[20]通过证明粗糙集理论中的划分、上下近似、独立、依赖、约简等核心概念在相应的衍生背景中的表示,利用梯级的方法扩展了粗糙集理论,建立起形式概念与粗糙集之间融合的理论基础。

2.粒计算模型与人工神经网络理论

人工神经网络是指利用工程技术手段模拟人脑神经网络结构和功能的一种技术系统,它是一种大规模并行的非线性动力学系统。一方面,由于神经网络具有信息的分布存储、并行处理以及自学习能力等优点,因此,在信息处理、模式识别、智能控制等领域有着难以估量的应用价值。另一方面,神经网络具有学习时间较长、所表达的知识隐蔽且难以理解以及功能主要集中在分类上等弱点,因此其应用受到局限,难以成为理想的知识获取的工具。

为了解决神经网络在效率和可扩展性方面的缺陷,文献[21]将粒计算引入了人工神经网络,提出了语言粒度神经网络(LNN,Language Neural Network),论证了一种基于词计算理论的粒向量空间理论,并研究分析了基于这种粒向量空间理论的人工神经网络模型。

鉴于运用神经网络直接对样本进行学习时,由于不同样式信号的特殊性,难以得到好的识别结果。文献[22]提出先对样本进行粒度处理,将属性相近的不同类别样本进行粗粒度合并形成新的训练样本,然后再进行分类学习。这样不但降低了样本学习难度,提高了分类泛化能力,而且识别正确率得到很大程度的提高。

文献[23]充分利用了商空间理论选取最优粒度聚类的优势,同时发挥了构造型神经网络计算复杂度低的优点,提出了基于人工神经网络的新的聚类算法,该算法对大规模复杂数据的聚类效果好。

虽然进化神经网络的提出有助于改善其结构的顽健性,但依旧存在计算量大、耗时长的问题。鉴于该问题,文献[24]提出了在分布式计算环境下,进化神经网络的集中式粗粒度实现模型。由于引入粒度概念,该模型区别于传统的主从式并行模型,使每一台从机上都运行一个ENN(Electronic Neural Network),有利于提高并行进化的整体效率,加快了神经网络的进化速度。

针对有些分类问题中存在的类数多且分布极其不平衡的情况,在构造性学习方法的基础上,利用商空间的粒度原理和霍夫曼编者按码的思想,将比例较小的类别合并,构造多种粒度,在不同的粒度空间上建立层次覆盖网络,构造分层竞争覆盖网络,提高了网络训练的速度和识别的精度,减少了拒识样本。

神经网络与粒计算主要模型的结合是研究的热点。神经网络存在结构缺乏通用且推理过程不透明等缺陷,都可运用粗糙集分析来辅助。粗糙集理论对噪声敏感且泛化能力弱,可以用神经网络的优点(自组织、容错和推广能力)来弥补。所以粗糙集理论和神经网络之间具有很强的优势互补性,将两者结合起来能很好地实现数据的分类以及预测问题。二者的结合,为处理不确定、不完整信息提供了一条强有力的途径,粗糙神经网络的模型已成功地应用在电力设备故障诊断、图像识别、医疗诊断以及预测控制当中。

3.粒计算模型与进化计算理论

进化计算模拟的是达尔文生物进化机制。在粒度与进化计算的结合上,学者们进行了初步的探讨和尝试。粒度进化计算是粒计算框架内的一种计算方法,它是基于文化进化机制来实现粒度的“自我扩大”,即粒度的进化扩张。文献[25]基于粒度的思想,利用多种群并行优化,不仅在各岛屿的群体之间进行竞争,还在各岛屿间引入竞争,实现了多种群的协同进化。这不但提高了GA的运行速度,而且很好地抑制了早熟现象的发生。

将粗糙集理论应用于进化算法的研究不少。将以粗糙集为代表的知识发现与推理的方法融合在进化计算中,形成知识与进化相融合的混合智能进化算法,可以提高进化算法的性能。本课题组一直致力于该方向上的研究,采用粒化的方法将复杂的优化问题进行分解,利用粗糙集和粒计算方法分析被求解问题的特征,形成知识引导进化方向。1.5.3 粒计算模型与其他应用研究的结合

粒计算不但在理论研究方面与其他智能计算有了一定的融合,而且由于粒计算具有不同层次观察问题的策略,因此在自然科学和社会科学领域的应用也越来越广泛,并逐步受到人们的关注。这里进行一个简要的介绍。

1.粒计算模型与分类

文献[26]提出概念的内涵与外延,将概念的形成与if-then关系描述为颗粒的形成和颗粒集合的包含关系,并提出了利用所有划分构成的格来求解一致分类问题。

粒计算的模型之一——粗糙集是一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法,由于它是建立在分类机制基础上的,因此它在分类问题中的应用很多。基于模糊集的词计算是较早提出的粒计算模型,将它引入聚类,打破了硬聚类的约束,从而产生了模糊聚类及其一系列的改进算法。从信息粒度角度剖析分类和聚类,试图用信息粒度原理的框架来统一分类和聚类。

2.粒计算模型与规则挖掘

面对海量的数据处理,不同领域的人们期待从这些数据中得到自己的答案,将信息变为知识,因此提出了各式各样的挖掘方法。粒计算方法凭借自身的特点在数据挖掘领域中显现出了较大的优势。

文献[27]通过概念形成和概念关系识别将粒计算和数据挖掘联系起来,提出了基于粒计算的规则挖掘的形式化模型,此模型提供了一个通用背景以分析和比较规则挖掘的不同算法。商空间理论是研究不同粒度世界的数学工具,在面对海量的数据时,其可以针对要处理的问题,在保证问题求解精度的前提下,选择合适的粒度空间,不仅得到所需的处理结果,还提高挖掘知识的效率。利用商空间粒度理论中将原问题变成商空间层次上的问题进行描述的方法,人们可以从不同粒度考察数据库,得出比较满意的结果。

3.粒计算模型与逻辑推理

文献[28]定义了粒语言及其语法、语义以及粒语句运算法则,还定义了粒与粒之间相互包含和相似的关系,构造了一种逻辑推理的新模型,然后基于Rough集定义了决策规则粒,构造了决策规则粒库,将它运用于搜索推理,并用实例说明这种推理模式的可行性和有效性。

4.粒计算模型与复杂问题的求解

面对复杂的、难以准确把握的问题,人们通常不是采用系统、精确的方法去追求问题的最佳解,而是通过逐步尝试的方法达到有限的、合理的目标,也就是取得所谓足够满意的解。人们就是采用这种概括的、由粗到细的、不断求精的多粒试验分析法,解决了计算复杂度高的困难。对于复杂问题的描述方法,关键在于不同粒度世界的描[29]述问题。商空间模型给出了描述不同粒度世界的分层递阶方法,通过合成技术将不同角度、不同层次上得到的信息合成得到原问题的解。近年来,针对实际问题,很多学者将商空间理论进行了推广和应用。

5.粒计算模型与图像处理

根据粒计算理论,图像分割就是图像由细粒度空间转变成粗粒度空间的过程。文献[30]正是利用商空间粒计算模型来描述图像分割过程的,其采用分层方法,先对图像进行粗分割,再向更高层次分析。在图像粗分割后,可以得到图像的一些重要区域特征,在此粗粒度空间上进一步对图像局部进行细化。文献[31]同样将商空间粒度合成理论引入SAR图像的分类中,利用不同纹理特征对SAR图像不同区域的刻画能力及对分类结果的不同贡献,采用粒度合成技术实现信息融合,从而提高SAR图像分类精度。然而,在国内,由于粒计算的发展与研究还处于初期,因此它与图像处理结合的相关文献还比较少。1.6 主要创新

本章从粒计算的角度出发,提出了粒度格矩阵空间模型,用以模拟粒与粒之间的关系。该模型集粗糙集、模糊集和商空间理论为一体,重新定义了粒计算模型。它不仅能对知识和信息进行不同层次和粗细程度的粒化,还体现了粒化后粒与粒之间的关系,从而更好地挖掘内在知识。在解决问题时,可以根据具体的情况,利用粒度格矩阵空间模型中粒与粒之间的空间结构,实现不同粒和粒层之间的跳跃和往返,从而提供了一种知识发现和描述的新方法。该模型在后续的章节中充分证明了其在知识发现、聚类、图像分割、视频处理等领域得到了有效的应用。

本书的主要创新点如下。

①基于商空间理论、粗糙集方法及模糊集理论等理论基础,提出了新的粒计算模型,即粒度格矩阵空间模型。该模型不仅延承了粗糙集和商空间的“等价类”和“商集”等基于划分的概念,还吸收了模糊集处理不精确问题的方法,同样具有在模糊空间下处理问题的能力。该模型的提出架起了关系、粒、矩阵理论以及图论之间的桥梁,为模糊集、粗糙集和商空间等理论的统一提供了简单可行的算法模型。

②提出了基于新模型的完备和不完备信息系统的知识发现算法。该算法分别以完备和不完备信息系统为研究对象,将常规的知识约简转化为矩阵的数值运算过程,提供了一种有别于传统方法的新的运算规则,该运算途径有利于对复杂的对象进行处理,如聚类问题和图像分割问题。通过举例证明了该算法和现有的几种常规知识约简算法的等价性。

③提出了基于新模型的动态聚类算法。该算法针对不同性质的样本点,采用“动态粒度”的思想对其进行层次聚类。该算法是基于新模型的知识发现算法在聚类问题上的应用,它从应用的角度验证了新模型的可行性和有效性。

④提出了基于新模型的图像分割算法。该算法基于图像分割问题与粒度划分的统一性,将图像转化为具有分层结构的知识体系,构造了多个单元粒度层,通过各单元粒度层分割的粒度合成取得最终的分割效果。实验证明,该算法在边缘细化的处理上有明显的效果。

⑤提出了融合粒空间的多特征显著区域检测方法。借鉴矩形粒对比显著图有效得到显著目标的位置和边缘信息,而球形粒对比显著图有着更为完整的纹理和内容信息,以矩形粒对比显著图为基准,与球形粒相融合,检测图像的显著区域,该方法计算量小、用时短,准确率和查全率均高于现存算法。

⑥提出了一种基于多粒度特征融合的自适应双阈值镜头检测算法。通过选取HSV颜色粒度特征和LBP纹理粒度特征作为视频帧的主要特征,既描述了视频图像的全局内容,又充分利用了图像的局部细节信息,并通过权值将2个特征粒度融合为统一粒度空间来计算帧间差,运用自适应设定的阈值,更好地区别突变镜头和渐变镜头。

⑦提出了一种基于CUDA模型的粒信息熵的关键帧提取算法。利用帧粒互信息熵提取图像帧特征,并运用SUSAN算子完成帧粒特征的边缘匹配,结合CPU+GPU并行编码的方式加速计算过程,从而缩短提取关键帧所用的时间开销。

⑧提出了基于DCT与NCIE的关键帧多级提取方法。通过将视频帧从像素域转换到频率域,采用DCT算法对视频帧提取相关系数作为图像特征;再将镜头类型区分为动态镜头和静态镜头。针对静态镜头,提取中间一帧作为关键帧;针对动态镜头,采用非线性相关信息熵(NCIE)的度量方法对镜头帧进行相似性度量,并进一步细分成若干子镜头,然后从子镜头中选择最接近平均信息熵的一帧作为关键帧。

⑨提出了基于Adaboost的多阶段优化人脸检测算法。以经典Adaboost算法为基础,分别在算法学习、算法检测过程中对其进行优化,提出前后端自判断机制用以缩减误报。在分类器判断待检测窗口之前,设置前端误报缩减机制,通过边缘能量检测删除非感兴趣子窗口;在Adaboost算法检测后,通过基于粗糙粒的肤色检测和边缘蒙版过滤构成的“过滤器”,在窗口内再次筛选人脸,进一步缩减误报。

⑩针对目前的人眼跟踪方法对人眼部分遮挡、人脸尺度变化和头部旋转等情况过于敏感,经常因丢失目标而导致跟踪失败的情况,提出了一种基于Kalman滤波器和改进CamShift算法的双眼跟踪方法。运用Kalman滤波器预测当前帧图像中双眼的位置,根据双眼的颜色分布特征运用改进Camshift迭代算法在估计的邻域范围内搜索双眼目标,再根据双眼分布的对称性和旋转不变性校正搜索到的双眼窗口,并更新Kalman滤波器和人眼模板。该算法避免了遮挡和背景对双眼的影响,对人脸尺度变化、人眼部分遮挡和头部旋转都有较强的顽健性,在人眼微睁甚至完全闭合的情况下可以准确跟踪到人眼状态。提出了融合双韦伯特征的深度置信网络表情识别算法。采用

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载