计算机视觉特征检测及应用(txt+pdf+epub+mobi电子书下载)


发布时间:2021-03-08 08:41:20

点击下载

作者:刘红敏

出版社:机械工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

计算机视觉特征检测及应用

计算机视觉特征检测及应用试读:

前言

计算机视觉和图像处理是当前热门的研究课题,相关技术以其简便、实用性强的特点,在社会经济生活的各个领域得到广泛应用,且已渗透到人们生活的方方面面,如目前新型的手机指纹锁、人脸刷卡支付系统、停车场自动收费系统等。

图像的特征一般分为三大类:点特征、线特征和区域特征。图像局部特征在保留图像中物体重要特征信息的同时,有效减少了信息的数据量。因而特征检测是计算机视觉和图像处理的基础环节,特征检测算子的检测性能直接决定了后续图像处理与分析的效率和结果精度。本书针对计算机视觉的基础环节——特征检测,结合作者多年来的相关研究成果,系统介绍了特征点、线、区域和规则几何图形检测的新方法。在此基础上,给出特征检测技术在图像对称性检测、新闻标题字幕检测、珠宝自动定位与测量以及手镯尺寸自动检测等方面的应用实例。本书专注计算机视觉特征检测技术,提供了特征检测方面前沿性和实用性技术。

本书需要读者掌握计算机视觉和图像处理的基础知识,在阅读本书之前至少要对图像处理的概念和内容有基本了解,若读者对相关知识内容存在疑惑,可参考《数字图像处理》(Rafael C. Gonzalez)等书籍。

本书由多年从事计算机视觉领域的科研工作者编写,书中的内容安排经过认真的讨论与审定。全书由刘红敏和王志衡共同撰写,其中刘红敏负责第1、5~15章,王志衡负责2、3、4章,全书由刘红敏统稿和整理。

本书的顺利出版,感谢河南理工大学计算机科学与技术学院的资助。感谢机械工业出版社李馨馨编辑的辛勤付出,他们对出版物追求完美、细致入微的专业态度给我留下深刻的印象。

由于作者水平有限,书中难免存在纰漏和谬误之处,请读者原谅,并提出宝贵意见。刘红敏2018年2月于河南焦作第1章 绪论

视觉是人类智能的重要组成部分,人类获取的信息70%~80%来自视觉。计算机视觉是信息科学领域具有挑战性的重要分支之一,其中心任务是通过对单幅或多幅二维图像进行分析计算来获得图像的内容信息。众所周知,计算机不认识图像,只认识数字。为了使计算机能够“理解”图像,从而具有类似于人的“视觉”,人们需要从图像中提取有用的数据或信息,得到图像的“非图像”表示或描述,如数值、符号或向量等。这一过程就是特征检测,而检测出的这些“非图像”的表示或描述就称之为特征。图像特征检测是计算机视觉中的重要问题和关键技术之一,也是各种视觉任务的基础环节,其目的是从图像中提取稳定、可靠的特征。图像特征检测在如下诸多领域有着极[1-2]其重要的应用。(1)物体识别 物体识别是计算机视觉的基本内容和应用之一,其主要任务是将单一物体的目标图像与图像集合中的图像进行比较,找到与目标图像内容一致的图像,从而达到识别出目标的目的。该过程需要利用特征检测技术来提取图像中目标的信息。(2)视频跟踪 视频跟踪是计算机视觉的重要应用,其主要目的在于进行视觉监控或者通过自动跟踪目标的运动轨迹分析目标的行为。近几年来,随着匹配技术的发展,进行特征检测并在不同视频帧之间进行特征匹配已成为视频跟踪的主流方式之一。(3)遥感图像配准 随着新型遥感传感器的不断投入使用,多种航空和卫星遥感平台每天都会获得大量图像数据,利用计算机对这些遥感图像进行自动分析已成为世界各国的迫切需求。典型的应用有信息融合和变化检测,前者将不同传感平台的图像进行集成分析,利用这些互补信息获得准确的地球资料,来实现诸如分类、测量和识别等高层任务;后者对同一地区不同时刻获取的图像进行分析比较,来监控和检测目标场景的变化。在遥感图像处理中,无论是目标识别、变化检测还是几何配准等环节均需要首先检测图像中点、线和区域等特征。(4)三维重建 三维重建的任务是通过两幅或多幅不同视角下拍摄的图像来恢复场景的三维几何结构,其主要步骤由图像获取、特征检测、特征匹配、三维坐标恢复和三维显示等组成。显然,特征检测与定位是恢复图像三维结构信息的前提条件,特征检测的准确性将直接影响到三维重建的效果和精度。(5)图像检索 随着计算机技术、网络技术和数字图像设备的发展与普及,全世界的数字图像的容量正以惊人的速度增长,如何有效地对大规模图像数据库进行管理并快速检索出所需图像是目前一个相当重要又富有挑战性的研究课题。基于内容的图像检索技术正是为了解决这一问题应运而生的,并在近年来受到越来越多的关注,其在许多领域具有广泛的应用前景。本质上说,基于图像内容的检索就是获取请求图像特征、查找与请求图像特征近似的图像的过程。

此外,特征检测自动工件检测、视频数据压缩、合成高分辨率图像、基于图像的建模和绘制、模式分类、图像拼接以及增强现实等应用中也具有重要的应用前景。可以说,特征检测是诸多计算机视觉应用和图像处理的共性核心问题。

图像特征主要包括点特征、线特征和区域特征,其历史可追溯到[3]20世纪70年代,Moravec基于自相关函数提出了最早的角点检测算子,至2004年Lowe做出了里程碑式的成果,提出了高效的尺度不[4]变特征变换(Scale Invariant Feature Transform, SIFT)。历经30多年的发展,图像特征已经发展得较为成熟。但由于图像成像机理条件多变和几何形变的复杂多样,不同应用对图像特征检测的具体要求也各不相同,还有许多问题需要进一步深入研究,如光照条件比较差情况下的特征检测、大视角变换时稳定特征的检测等。总之,图像特征的检测目前依旧是一个具有重大意义而又有挑战性的课题,本书正是在这种背景下对图像特征检测问题展开研究,主要研究图像中点、线、区域、规则图形(如多边形、圆和椭圆)等各种特征的鲁棒性及高精度提取,以及特征检测技术在图像对称性检测、新闻字幕提取和珠宝尺寸自动测量方面的应用。下面分别从特征点、特征线和特征区域三方面介绍特征检测方面的研究发展。1.1 特征点检测方法

特征点是图像最基本的特征,又称兴趣点、关键点,它指的是图像灰度值发生剧烈变化的点或者在图像边缘上曲率较大的点(即两个边缘的交点)。特征点是图像特征的局部表达,对遮挡有一定的鲁棒性,且具有较好的辨识性,不同物体上的点容易区分。通常图像中可以检测到成百上千的特征点。通过特征点的匹配能够完成图像的匹配,识别出图像中的目标物体。1.1.1 常见的特征点检测方法

1.Harris与Hessian检测算子[3]

Moraves第一个给出了特征点的检测算法,该算法是基于图像灰度自相关函数的,它使用一个邻域窗口在图像平面的四个方向 (水平的正负方向和竖直的正负方向)上平移,计算原始窗口与平移窗口之间的灰度变化量。如果四个方向上的最小变化量大于某个设置的阈值,则将原始窗口中心的图像点作为特征点输出。Harris检测算[5]子在Moraves的基础上进行了数学简化,它使用图像的一阶差分来刻画图像灰度的自相关性,并利用一阶差分的自相关矩阵来避免平移操作。Harris的自相关矩阵定义如下:式中, G是高斯加权函数,即i,它表示距窗口中心越远的点对特征点的贡献越小;Δ(x,y)和Δ(x,y)分别表示水平xiiyii和竖直方向的差分:

Harris指出,式(1-1)所定义的矩阵可以描述图像在窗口内的结构,如果矩阵的两个特征值较大且比较接近,则窗口中心点对应于一个角点;如果矩阵的两个特征值相差较大或者都比较小,则窗口中心点对应于一个边缘点或均匀区域(指具有相近灰度值的区域)内的点。为了计算方便,Harris使用下述函数来检测特征点:式中,det和tr分别表示方阵的行列式和迹;k是常数,一般取0.04≤k≤0.06。

当C是较大的正值时,窗口中心点是特征点;当C是较小的正值时,窗口中心点是边缘点;当C是负值时,窗口中心点是均匀区域点。Harris检测算法就是根据上述原理来实现角点检测的,虽然Harris检测算法是为检测角点而设计的,但在实际应用中也能检测出在各个方向灰度变化都很剧烈的点,因此Harris检测算法所检测的角点通常也称为Harris特征点。

Hessian矩阵具有同Harris矩阵相似的形式和特征点检测性质:式中,I(x,y)、I(x,y)、I(x,y)分别表示图像进行对应的二xxyyxy阶高斯滤波后点(x,y)处的值。相对于Harris矩阵,Hessian矩阵检测出的特征点具有更高的定位精度,但同时二阶差分使得它对噪声的影响更加敏感。

2.CSS检测算子[6]

Mokhtarian同时利用Canny边缘检测技术和曲率空间技术,通过在边缘上寻找曲率较大的极值点来检测角点的初始位置,然后通过多尺度跟踪定位角点的准确位置,提出了著名的CSS角点检测算法(已被MPEG-7采用)。

将边缘近似看作一条曲线,设曲线的参数方程为Γ(u,σ)=(x(u,σ),y(u,σ)),则曲线Γ上任意一点处的曲线曲率定义为:其中,x(u,σ)=x(u)⊗g(u,σ), x(u,σ)=x(u)⊗g(u,uuuuuuσ)y(u,σ)=y(u)⊗g(u,σ), y(u,σ)=y(u)⊗g(u,uuuuuuσ)在曲线上,变化平缓的普通边缘点处的曲率k(u,σ)的值一般比较小,而在角点位置处,曲率k(u,σ)有着较大的值并能达到局部极大值。因此,通过在边缘上计算并寻找曲率达到局部极大值的点能够达到检测角点的目的。CSS角点检测算子的具体步骤如下:

1)利用Canny边缘检测算子进行边缘检测。

2)重新连接所得边缘中的间断部分,识别并标记其中的T形角点。

3)利用曲线曲率极大值在边缘图像上进行角点检测。

4)进行从粗到细的多尺度跟踪来重新精确定位角点。

5)比较合并步骤2)、3)获得的位置足够接近的角点。

3.LoG与DoG检测算子

高斯拉普拉斯 (Laplacian of Gaussian, LoG)算子是二阶微分算子,实际上它等价于首先利用高斯函数对图像进行平滑,然后对图像进行二阶差分运算,其连续函数的数学表达式为:

通过对上式进行离散采样,即可获得LoG模板。LoG算子在中心附近的值为正数,而模板边缘处的值为负值,直观上可以看作一个区域内环和外环的差异响应,LoG的这种性质与图像中局部块状(Blob)点的结构相一致,因此,LoG 能够有效地检测出图像中的Blob结构。

在尺度空间中,为达到尺度不变性,Lindeberg提出了尺度正则化的LoG算子:,Mikolajczyk指出在众多的特征点检测方[8]法中,能够提供最为稳定的特征点。由于高斯函数关于尺度σ的偏导数:是LoG算子的σ倍,它们仅相差一个常数因子,因此它们具有完全相同的特征点检测性能。又有:即

因此,在尺度空间中能够利用高斯的差分来近似,Lowe将这种高斯差分算子称为DoG (Difference of Gaussian)算子,相对于LoG算子,DoG算子具有更高的计算效率。

4.SUSAN检测算子[9]

与常见算子有着完全不同的工作原理,Smith和Brady提出了最小核值相似区(Smallest Univalue Segment Assimilating Nucleus, SUSAN)。其基本工作原理是:对于图像中的任意一点(x,y),选00定在以它为中心的一个圆形邻域窗口,该邻域窗口内亮度与中心点相同或者相近的像素组成的区域称为USAN区域,USAN区域的大小用以下两式进行计算:式中,I(x,y)表示点(x,y)处的灰度值;t为设定的阈值。将USAN区域大小与一个给定阈值g(一般取窗口面积的一半)进行比较,可得到一个响应函数:

对应于图像中平滑区域位置处的点,其利用式(1-11)和式(1-12)计算所得的USAN值一般接近其窗口内像素点的个数,于是利用式(1-13)得到的响应值一般为0;对应于图像中边缘两侧的点,其USAN值一般接近其窗口面积的1/2,其最终得到的响应值很小;而位于角点附近的点由于USAN值通常小于窗口面积的一半,因此最终将获得较大的响应。实际应用中,利用式(1-11)比较两个点的灰度值是否相似对参数t的选择比较敏感,为克服这种问题,一般使用如下函数代替式(1-11)来计算两个像素点之间的灰度相似度:

5.其他特征点检测方法[10]

基于自适应阈值和动态支持区域策略,He和Yung提出了一[11]种改进型的CSS算法。Zhang等在深入研究角点在尺度空间的极值性质后,指出利用多个尺度曲率乘积能够有效地进行自适应尺度[12]选择,从而避免了CSS算法的多尺度跟踪。Zhong从理论上分析了CSS算法直接用于检测平面曲线角点时的性能,指出将尺度空间图像变换到树状图的方法能够提高算法的鲁棒性。[13]

Arrebola等提出的算法同时利用了曲线多分辨率像素连接技术和轮廓链表编码技术,能够有效检测曲线轮廓上的角点,但该算法不能直接用于灰度图像的角点提取。基于小波变换的角点检测算法[14]易于进行多尺度分析并具有较高的鲁棒性,但频域变换需要大量计算导致算法效率不高。此外,协方差传播理论和支持向量机技术也被引入角点检测领域。文献中还提出了许多其他的角点检测方法[15,16]。

为比较各种角点检测算法的性能,Mokhtarian提出了衡量角点检测算法性能的五条准则:①真实角点检测能力;②虚假角点抑制能力;③角点定位精度;④噪声鲁棒性;⑤计算效率。通过对常见的角点检测算子分析比较,Harris算子、SUSAN算子和CSS算子具有最好的角点检测性能。但实际上,由于诸多因素(噪声、滤波平滑效果、角点附近的其他边缘等)的影响,常见检测算子检测出角点的位置与其真实位置之间经常存在偏差。1.1.2 尺度不变特征点检测[7]

Lindeberg对特征检测的尺度选择问题进行了深入研究,提出了一种基于尺度归一化高斯拉普拉斯LoG算子的特征检测方法。通过使用不同尺度的高斯核函数对高分辨率图像连续地进行平滑处理,可以建立起一个三维尺度空间,然后通过在该尺度空间中检测LoG算子的极大值来进行特征点检测。由于LoG算子是圆形对称的,用它检测出来的特征主要是类似于局部块状(Blob)的结构,即灰度均匀的、可近似为椭圆的区域的中心。

利用DoG算子近似LoG算子 (式1-9),Lowe提出了具有更高计算效率的尺度空间金字塔建立方法,具体步骤如下:在尺度空间中,利用 LoG算子检测出的特征点具有最好的稳定性。由于 LoG可以用 DoG来近似(式1-9),为提高算法的运算效率,Lowe采用了DoG算子来建立尺度空间金字塔图像结构,如图1-1 所示,首先利用高斯核函数对原始图像进行平滑处理,并将其尺寸放大一倍;然后将图像通过高斯核函数进行连续平滑与下采样获得一系列平滑图像;最后对同一层上 (图像尺寸相同)相邻的两个平滑图像相减得到DoG多尺度空间表示。建立高斯金字塔后,通过将 DoG金字塔尺度空间中每个点与其相邻尺度和相邻位置的点逐个进行搜索比较来进行特征点检测:如图1-2所示,如果该点处的值大于或者小于其26个邻域位置的值,则该点将被检测为关键特征点。图1-1 利用DoG建立尺度空间示意图图1-2 DoG尺度中间中进行特征点检测示意图[17]

Mikolajczyk和Schmid将Harris特征检测算法扩展为尺度不变的Harris-Laplace算子。原始的Harris特征只具有旋转不变性,为了适应图像分辨率的变化,在自相关矩阵中加入尺度参数。尺度自适应的Harris自相关矩阵定义如下:式中,σ,σ分别是积分尺度和微分尺度。矩阵中的局部导数采用尺ID度大小为σ的高斯内核计算,然后采用尺度大小为σ的高斯加权计算DI邻域窗口内所有导数的平均。积分尺度和微分尺度之间一般可取为倍数关系,并可将积分尺度作为特征点的特征尺度。

Mikolajczyk和Schmid将多尺度下的Harris特征检测与Lindeberg的自动尺度选择方法相结合,通过计算LoG算子的极值来选择特征点的最稳定尺度,提出了一种迭代方法在三维尺度空间中由粗到精地搜索特征点的精确位置和尺度,这种算法被称为Harris-Laplace检测算子。同样的思想也可以用于基于Hessian矩阵的特征检测算法: 特征点的位置通过Hessian矩阵行列式的局部极大值确定,尺度则通过LoG算子的局部极大值来确定,这种算法被称为Hessian-Laplace检测算子。相对于Harris-Laplace算子,Hessian-Laplace算子在尺度空间中的定位精度更高,但对图像噪声更加敏感。此外,Kadir和[18]Brady采用信息熵作为显著性度量,通过计算描述子的熵的局部极值来选择显著尺度,这种算法检测出来的区域称为显著区域。1.1.3 仿射不变特征点检测

在特征检测方面,近年来对仿射不变特征区域的研究取得了很大[19]的进展。1997年Alvarez和Morales提出了一种仿射不变算法来检测角点特征。他们采用了仿射形态学多尺度分析的方法,对提取的每个特征点,将对应于同一局部图像结构在不同尺度下检测出来的点连成一链,然后用这个点链形成的平分线(Bisector)来计算角点的位置和方向。实际上,由于图像中的纹理会严重影响局部最大值的定位精度,因此不同尺度下检测出来的点并不是完全沿着一条直的平分线。这类方法对那些由直线或者近似直线形成的角点效果较好,但并不能全面地解决仿射不变性区域检测的问题。[20]

Lindeberg和Garding提出了一种迭代算法来检测局部块状结构的仿射不变特征,该工作为仿射不变特征检测提供了很好的理论基础。式 (1-15 )的二阶矩矩阵描述了图像局部结构的各向异性的形状,因此通过归一化的方法可以将仿射形变转换为旋转。如图1-3所示,X和X分别为左图和右图中的点,它们之间满足仿射变换LRX=AX。其中M和M分别代表左图中的点M和右图中的点M点邻RLLRLR域的二阶矩矩阵,则仿射变换A可以定义为:,其中R为一旋转矩阵。因此,通过图中的坐标变换可将仿射形变归一化为仅仅相差一个旋转因子。Lindeberg和Garding首先在各向同性的尺度空间中提取局部极值作为特征点,然后利用二阶矩矩阵的性质通过迭代计算来调整特征点的尺度和形状。但是该方法在进行特征点初始位置检测时没有考虑仿射不变性,而且在迭代过程中也没有进行调整,因此在仿射形变剧烈的情况下检测获得的特征的定位误差较大。图1-3 通过二阶矩矩阵变换将仿射形变归一化为旋转[21]

Baumberg将这种归一化仿射形状的思路用于匹配和识别中,首先在多个尺度下检测Harris特征点,然后采用Lindeberg提出的迭代算法调整特征点邻域的形状以适应图像的局部结构。在该方法中,特征点的尺度和位置在迭代中都是固定的,因此在大的仿射形变下不[22]能保持不变性。Schaffalitzky和Zisserman将Harris-Laplace检测算法进行扩展使其具有仿射不变性,他采用尺度不变的Harris-Laplace算法来检测特征的位置和尺度,然后采用Baumberg的方法消除仿射形变,因此也带来了和文献[21]中同样的问题。[17]

Mikolajczyk和Schmid在Harris-Laplace的基础上提出了一种仿射不变的Harris-Affine算法。这种方法也是基于Lindeberg的二阶矩矩阵变换的思路,首先采用多尺度的Harris检测算法提取角点特征,然后在迭代过程中不断调整特征点的尺度、位置和形状。积分尺度的选择采用了LoG算子,计算微分尺度时则引入了一个各向同性度量值,选择能够达到最大度量值(即二阶矩矩阵的两个特征值相等)的微分尺度。通过这种处理,Harris-Affine特征能够在大仿射形变下依然保持较好的不变性,这也是对前面提到的几种类似算法的改进。当然,这个算法也可以用于基于Hessian矩阵的方法,即Hessian-Affine特征检测算法。1.2 特征线检测

作为最常见的图像底层特征,图像边缘包含丰富的信息,人眼可通过简单的边缘轮廓识别出复杂的目标。而在现实生活和工业生产中需要处理大量的人工环境图像,如道路两旁的交通标志牌、工业产品质量自动检测中的规则产品、建筑物等,这些人工环境图像中包含大量的线和规则图形信息。有效提取这些线和图形信息,可辅助完成相关的计算机视觉任务。1.2.1 Canny边缘检测[23]

Canny提出了衡量边缘检测算法性能的三个理论标准:检测性能、定位精度和单边响应,理论上,只有当三个准则同时被最大化时边缘检测算法才具有最优的性能。检测性能包括对真实边缘的检测性能和对虚假边缘的抑制性能两个方面,用信号输出和噪声输出值比(SNR)来度量:式中,f(x)表示优化算子;G(x)表示理想边缘;n为噪声方差水0平,假设检测算子具有有限的边缘响应[-W,W]。SNR越大表明算法的检测性能越好,反之算法的检测性能越差。

边缘定位精度的度量准则为(式中f′(x)表示f(x)的导数):

边缘检测算法对于单一边缘应该具有单一的边缘输出,因此边缘响应在真实的边缘处应达到极大值。但是由于噪声的影响,同一边缘附近边缘响应可能出现多个极大值,相邻的两个极大值之间的偏差为:

噪声可能引起的虚假边缘的个数为N=2W/x=2/k,为使边缘nmax检测算子对同一边缘具有单一边缘响应,应最大化x以使检测算子max对噪声响应的极大值个数N趋近于零。n

理论上已经证明,Canny算子是对上述三个检测准则同时优化的结果,因此,理论上Canny算子是一种最优的边缘检测算子,实际上Canny算子已经成为边缘检测的标准算法。经典的Canny算子主要由四个步骤组成:首先用高斯滤波器平滑图像;接着用高斯一阶偏导的有限差分来计算梯度的幅值和方向;然后对梯度幅值进行非极大值抑制(NMS);最后用双阈值算法检测和连接边缘。

但是,Canny算子在高斯滤波过程中在抑制噪声的同时也使图像损失了部分边缘信息,因而影响了边缘的定位精度。噪声抑制性能和边缘定位精度成为所有边缘检测算子相互矛盾的两个性能要求,这也是导致边缘检测成为最困难的问题之一的主要内在原因。通常进行边缘检测时通过参数调整来获得噪声抑制性能和边缘定位精度两方面的折中效果。

近几十年来,对边缘检测的研究大多集中在解决噪声抑制性能和边缘定位精度之间的这种矛盾上,文献中提出了大量的方法来使得在有效地抑制噪声的条件下能够对边缘保持较高的定位精度。中值滤波是最常用的简单滤波方法之一,它在保持边缘定位精度的条件下具有一定的去除图像中噪声的能力。频域变换为图像的内容分析提供了有力的工具,通过整体变换进行噪声估计和局部变换进行边缘分析相结[7]合,能够同时达到平滑噪声和保持边缘的目的。Lindeberg分析了边缘检测算子的平滑性和定位精度之间的矛盾,认为选取合适的尺度是取得较好折中效果的有效步骤,并通过在尺度空间内搜索使边缘强度达到极大值的位置来自动选取合适的局部尺度参数,一定程度上[24]缓和了这一矛盾。Rivera和Marroquin从图像复原的角度利用边[25]缘保持的正则化方法对这一问题进行了深入的探讨。Gijbels等将灰度图像视为图像曲面,通过估计其表面的不连续性并采用局部线性核平滑的方法,在保持图像边缘的同时能够有效地去除平滑区域的噪声。

尺度选择是进行边缘检测最为重要也是最为困难的问题之一,尺度选择过大可能会导致许多对比度较小的边缘检测不出来并且影响边缘的定位精度,尺度选择过小又将导致所检测出的边缘点中包含大量噪声点。如何对图像进行多尺度分析和选择合适的尺度目前是边缘检测最为热门的方向之一。早期在边缘检测多尺度分析方面的工作主要是边缘聚焦法,该方法利用一系列从粗到细的尺度参数分别进行边缘检测,同时通过对边缘进行跟踪来确定边缘检测的合适参数和边缘的相对准确位置。通过在尺度空间中分析图像边缘的极值特性,Lindeberg提出了一种进行自动边缘尺度选择的基本思想:在没有其他任何先验知识的前提下,如果定义的正则化能量函数在某一尺度上达到局部极大值,则这一尺度可以看作该点处的特征尺度之一。Lindeberg构造了两个基于高斯函数的正则化能量函数来进行自适应边缘尺度检测:式中,σ表示计算梯度时所用高斯函数的尺度参数;L、L、L和xyxxyL分别是图像与高斯函数的各阶偏微分模板卷积后某一像素点处的xyy[26]值。同Lindeberg的思想完全不同,Elder和Zucker提出了一个完全基于局部信息的尺度选择算法。Elder认为,在边缘检测过程中边缘点和噪声点仅仅基于图像内容信息很难区分开来,边缘检测算子应该检测出图像中所有的真正边缘,同时控制由噪声引起的虚假边缘点以最小概率检测出来。通过对高斯函数的扩散方程进行概率分析,Elder引入了最小可靠尺度来保证大于这一尺度进行边缘检测获得的边缘点是噪声点的概率小于某一设定值。

目前常见边缘检测算法大体上可以分为四类:基于高斯函数的算法、形态学的算法、基于频域的算法和彩色边缘检测算法。Nguyen[27]和Ziou通过实验系统地比较了常见的边缘检测算子的性能,并指出绝大多数情况下Canny算子具有最好的检测性能。但是,Canny[28]算子也有一定的局限性,Basu分析后指出:“Canny算子在进行非极大值抑制时简单地将梯度幅值比其梯度方向上相邻点梯度幅值大的像素点检测为边缘点,而没有考虑到这种差异是否大于随机误差导致的变化”。因此Canny算子对于较弱边缘附近的噪声非常敏感,当图像中存在较大的随机噪声时,算法的抗噪能力急剧下降。1.2.2 规则图形检测[29]

在圆检测方面,基于Hough变换的方法被广泛地应用,该类方法使用边缘检测的结果将直线的检测问题转化为参数空间的投票问题,对投票结果进行局部极大值检测,确定圆心的位置和圆半径值,实现圆检测。但该类方法存在计算量大、占内存空间大、效率低下的缺点。为了克服该缺点,其他的方法被提出来,如模板匹配技术、遗传算法和最小二乘方法。大部分的方法在噪声条件下能获得较好的准确性。

针对椭圆检测,根据其检测原理相关方法可分为三类:基于拟合的方法、基于Hough变换的方法和基于曲线弧的方法。第一类方法主要利用边缘点,基于代数拟合、正交最小二乘法拟合或最大似然估计建立椭圆数学模型。基于Hough变换的方法通过在变换空间中找到局部极值点获取椭圆的参数。尽管要考虑鲁棒性,但利用标准Hough变换产生一个五维椭圆参数空间是不切实际的,涉及大量计算成本与内存需求。为了提高效率和减少空间需求,随机Hough变换(Randomized Hough Transform,RHT)和概率Hough变换(Probabilistic Hough Transform,PHT)利用边缘点的子集求解椭圆参数。降低时间成本和内存的另一种方法需求是分解五维参数空间至[30]低维子空间,从而逐步确定椭圆参数。最近,基于曲线弧的方[31]法被提出。该类方法首先基于连续性找到曲线弧,然后验证有效的曲线弧,最后利用RANSAC等算法进行拟合,获取参数值。该类方法需要少量的计算和存储负载,对于图像内容较为简单的应用,要优于基于Hough变换的方法。但是,由于其严重依赖边缘弧检测的准确性,对于包含复杂轮廓的图像检测精度将下降。

多边形检测方面,广义Hough变换(GHT)利用多边形的几何特性,将变量空间图形的检测问题转化为参数空间的聚类问题,实现多边形的直接检测。其特点是简单直接,但由于计算量大,一般只适用[32]于三角形等边数较少的多边形检测。Lara等提出了平行算法识别图像中的多边形, 该算法在已知图像中直线及其端点的条件下,首先计算直线间的交叉点,并设计四个矩阵来表示端点及交叉点的相互位置关系,然后由一个端点出发,按照规则遍历各端点或交叉点,直至构成封闭序列,从而实现多边形检测。该方法可检测出图像中独立[33]的多边形,不适用于图像中多边形有嵌套的情况。Barnes等提出的方法首先获得图像边缘,然后依据正多边形的几何特性,利用后验概率定义正多边形的概率密度函数,接着通过计算正多边形边数和[34]方向偏角来实现道路标识牌中正多边形的检测。Manay等采用梯度方向匹配的方法获取图像角点及其夹角、方向等信息,对比给定多边形的边数、夹角等信息,基于模板匹配实现航拍图像中指定多边[35]形的检测。施俊等利用可调滤波器获取图像的能量图和方向角度图,在此基础上,计算图形边缘的角度信息和线条数量,实现指定多边形的检测。此外,文献[36,37]中还提出了少量其他多边形检测方法。1.3 特征区域检测方法1.3.1 最大稳定极值区域特征检测[38]

Matas等提出了一种基于局部灰度极值的区域特征检测算法,称为最大稳定极值区域(Maximally Stable Extremal Region, MSER)。首先他采用了一种类似于分水岭(Water-Shed)的方法来检测灰度区域,然后用椭圆拟合不规则区域的边缘。进行椭圆拟合之前获得的原始MSER区域具有真正意义上的射影不变性,而进行拟合后获得的椭圆区域特征仅对仿射具有良好的不变性。

MSER特征检测的基本原理如下。对于一幅灰度图像I,给定一个阈值T(T=0,1,…,255)将图像进行二值化:假设图像中灰度值大于等于T的像素为白色,小于T的像素为黑色。当阈值T从0到255依次增大时,可以形成256幅连续变化的图像。最初的图像是白色的,紧接着代表较小灰度值的黑色小点出现在白色的图像上,随着阈值的增大,黑点生长并形成小的连接区域;在某些阈值上,一些小的区域会连接形成一些较大的区域;最后形成一个黑色图像。对于区域Q∈I,若它内部像素的灰度值均小于区域边界上像素的灰度值,即p∈Q,q∈∂Q,I(p)

设Q,…Q,Q…(Q

最稳定极值区域具有如下显著性质:①良好的射影不变性;②可靠的稳定性和重复出现性;③对光照视角等图像变化具有良好的鲁棒性;④可以检测出各种大小、形状不同的区域;⑤算法实现简单、速[39]度快,特别是Nister和Stewenius提出快速MSER算法以后,MSER区域的检测能够在线性时间内完成。1.3.2 仿射不变特征区域检测[40]

Tuytelaars和Van Gool提出了两种仿射不变区域特征的检测算法,这两种算法都是通过计算某些度量函数的极值来确定仿射不变区域的。第一种是基于边缘的方法,从Harris角点开始沿着两个方向的直线或曲线边缘进行搜索,这个角点与两条边缘能够产生一个平行四边形,然后通过计算某些度量函数的极值来确定这个平行四边形。这种方法依赖于图像中边缘的稳定提取,并且其检测出特征的数量受角点与边缘结构的限制。另一种方法是基于灰度的,直接从图像中提取局部灰度极值点,然后沿径向搜索灰度极值点,这些点组成的轮廓区域是仿射不变的,最后用一个椭圆来拟合这个不规则区域。[41]

Kadir等将尺度不变的显著区域扩展为仿射不变区域。他们用椭圆替代了原来的圆形窗口,在椭圆窗口区域中计算灰度概率密度函数的信息熵,然后搜寻熵达到局部极值时的尺度和椭圆参数,并将这些参数确定的区域作为仿射不变的显著区域。Mikolajczyk对上述具有仿射不变性的区域检测方法系统地进行比较后指出,它们在不同的图像上各有优势,不存在一种方法在总体性能方面显著优于其他方法。第2章 基于局部方向分布的角点检测及亚像素定位

长期以来,角点检测一直是计算机视觉、图像理解以及模式识别中最为基础和经典的课题之一,在图像匹配、遥感配准、图像拼接、物体识别和三维重建等诸多领域有着重要应用。文献中已有许多角点检测算法提出。为比较各种角点检测算法的性能,Mokhtarian提出了衡量角点检测算法性能的五条准则:真实角点检测能力、虚假角点抑制能力、角点定位精度、噪声鲁棒性和计算效率。对常见的检测算子分析比较后发现,Plessey 算子、Kitchen & Rosenfeld算子、SUSAN算子和CSS算子具有最好的角点检测性能。但是,这些文献在进行比较时没有进行角点定位精度的分析。实际上,由于诸多因素(噪声、滤波平滑效果和角点附近的其他边缘等)的影响,常见检测算子检测出的角点位置与真实位置之间经常存在偏差。[42]

为提高角点检测的定位精度,本章通过引入方向线和局部方向分布的概念,定义了新的角点度量(绝对角点能量和相对角点能量),并提出了一种新型的角点检测及定位方法——基于局部方向分布的角点检测及亚像素定位算法。该算法将角点定位问题转化为直线交点的拟合问题,能够较准确地将角点定位到亚像素精度。2.1 基于局部方向分布的角点检测2.1.1 方向线及局部方向分布

记图像I(x,y)中的点X(x,y),其梯度向量为grad(X)iiii=[d,d], 则经过点X且与其梯度方向垂直的直线可表达为:ixiyi2对l系数向量的L范数进行归一化,可得:i式中,。 l被定义为点 X的oii方向线,它与点 X的主要边缘方向一致 (如图2-1所示, l,l,ioAoBl分别表示点A, B, C的方向线)。oC图2-1 方向线

像素点的结构类型主要由其附近边缘点(梯度较大的点)的分布所决定,但并非所有边缘点都对其结构类型有贡献。如在图2-1中,角点P主要由PA、PB上的边缘点组成,边缘点C对于构成角点P没有任何贡献。无论点P是一维边缘点或者多维角点(包括L、T、Y、X四种类型),只有方向线通过点P的边缘点才对其结构有所贡献。

对于图像点P, 考虑其支撑区域Ω(以点P为中心、R为半径的一个圆形区域,如图2-1所示)内的边缘点,方向线通过或非常接近点P

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载