昆虫图像自动鉴定是一种快速鉴定昆虫的方法,图像分割则是其中的关键步骤。随着计算机图像技术的发展,昆虫图像分割方法吸收了许多图像分割领域中新兴的方法,诸如阈值分割法、区域提取技术、边缘检测方法和结合特定理论工具的分割方法等。阈值分割法计算简单、速度快,通常利用图像的灰度直方图求取阈值,主要适用于灰度图像。区域提取技术在昆虫图像中的应用相对较少,该类方法通常和阈值法或分类技术相结合,对待分割图像首先进行灰度转换,划分前景和背景,再利用区域增长算法实现分割,适用范围有限。边缘检测方法在昆虫图像分割中应用较多,是当期的研究热点,该类方法适合于彩色昆虫图像,但有时存在过分割现象。结合特定理论的方法主要包括模糊聚类FCM算法、基于Gabor滤波器和支持向量机SVM的算法、多特征最大期望值EM算法等等,这些算法通常利用图像的纹理、色彩等多种信息,分割时使用较复杂的判定方法,更接近于通用的图像分割方法研究。
虽然大量的图像分割方法被引入到昆虫图像研究中,但由于昆虫图像采集条件和昆虫图像本身都具有复杂性,目前分割技术依然是阻碍昆虫图像广泛应用的关键。多元线性回归(linearregression)是利用数理统计中的回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,它在生物、医学、工业、农业、经济以及物理和自然等领域运用十分广泛。采用多元线性回归算法实现昆虫图像分割能够较好地将目标与背景分割开来,但该算法对具有阴影背景的部分昆虫图像的边界分割效果不太理想。
图像过渡区是指介于图像背景和目标之间的一个特殊的区域。它既有边界的特点,将不同的区域(前景和背景)分开;也有区域的特点,其自身有宽度,且面积不为零。利用图像过渡区实现图像的前景和背景分离是图像分割的新途径。本文利用过渡区对多元线性回归昆虫图像分割算法进行优化。算法首先确定昆虫图像RGB三色板的多元线性回归模型,并对回归模型进行范数优化,然后利用优化后的回归模型对昆虫图像进行分割。对于边界分割效果不理想的图像,将分割后的彩色图像转换为灰度图像,求取灰度图像的过渡区,再运用过渡区分割算法对其进行二次分割优化。优化算法有效结合了多元线性回归算法和过渡区分割算法的优势,增强了多元线性回归算法的鲁棒性,提高了昆虫图像的分割精度。
1、多元线性回归分割算法
1.1多元线性回归的数学模型
线性回归根据自变量的个数不同分为一元线性回归和多元线性回归。线性回归算法最初应用于图像处理中时通常选用灰度图像或彩色图像三色板中的一个色板的像素信息通过构建一元回归模型来实现,然而一元线性回归具有较大的局限性,三色板像素信息更有利于表达图像的完整信息,因此需要借助多元线性回归模型。
多元线性回归研究一个因变量和多个自变量之间数量上相互依存的线性关系。多元线性回归模型的方程是:Y=β0+β1X1+β2X2+…+βmXm+ε(1)其中,β0是常数项,β1,β2,…,βm称为偏回归系数(partialre-gressioncoefficient)。βi(i=1,2,…,m)的含义是在其他自变量保持不变的条件下,自变量Xi改变一个单位时因变量的平均改变量。ε为随机误差,又称残差(residual),它表示Y的变化中不能由自变量解释的部分。
1.2基于RGB三色板的多元线性
回归算法在图像处理过程中,为了充分利用彩色图像RGB各个分量像素的数据,考虑利用图像的RGB三色板的像素来处理图像。根据式(1)的多元线性回归数学模型,结合彩色图像中的三色板信息,建立彩色图像的RGB三色板多元线性回归模型如下:
R=β0+β1*G+β2*B(2)其中,R、G、B分别表示彩色图像的红色板、绿色板和蓝色板像素信息。
图像的像素信息通常采用二维坐标表示,即假设I(i,j)表示图像I的第(i,j)个像素,R(i,j)、G(i,j)、B(i,j)分别代表像素I(i,j)的红、绿、蓝3个分量。将这些像素信息代入式(2)中,RGB三色板的多元线性回归模型转换为:R(i,j)=β0+β1G(i,j)+β2B(i,j)(3)为了计算方便,图像处理中通常将二维向量转换成一维向量,即使用变换:R(i,j)→R(m(j-1)+i),i=1,…,m,j=1,…,n则式(3)再次转换为如下形式:R(j)=β0+β1G(j)+β2B(j)(4)其中,R(j)、G(j)、B(j)分别代表红色板、绿色板和蓝色板像素的一维信息,与式(1)多元线性回归模型中的X、Y变量相对应,则式(4)的变量形式为:
Y=[R(1)R(2)…R(m×n)]
T系数矩阵为:β=[β0β1β2]T
根据矩阵理论相关知识可得线性回归参数的求解公式为:β=(XTX)-1XTY(5)由于图像的三色板信息已知,因此可根据所选取区域的R、G、B信息确定β参数,建立整幅图像的线性回归模型,从而将具有同样背景信息的图像分割出来,得到昆虫的目标图像。实际应用中,样本像素块的选取依据具体图像的背景信息而定(见图1(b)),背景颜色越单纯,所需像素块数越少,反之则需要设置多个像素块,以包含更全面的图像信息。样本信息越多越有利于图像目标区域的分割,但同时也加大了工作量,对复杂背景图像选择合适数量的像素块不是容易的事,对此引入范数对式(3)的模型进行优化。
1.3RGB三色板线性回归模型的范数优化
式(3)的回归模型是取图像像素的RGB三色板信息建立线性关系,由于像素信息的取值范围较大,有可能导致回归模型的线性拟合发生较大偏差,对三色板信息进行取范数规范化处理可以较好地解决这个问题。R(i,j)、G(i,j)、B(i,j)的规范化形式如下:
则式(4)的多元回归模型转换为:
以稻棘缘蝽成虫图像为例,比较对三色板信息进行取范数规范化前后的分割效果,说明利用式(9)对昆虫图像进行分割能够更好地实现目标提取。从经过预处理的稻棘缘蝽成虫图像的背景样本中采集合适数量的像素块,分别利用式(4)和式(9)实现对整个图像的分割,如图1所示。其中图1(a)为原图,图1(b)为从背景中任意选取的一块像素块样本,图1(c)为基于式(4)的回归算法分割效果,图1(d)为基于式(9)的范数优化后的分割效果。
对比图1(c)和图1(d)可知,进行范数优化后的算法在去掉阴影方面具有一定的优越性,能更好地实现目标提取。然而该算法依然存在不足,即在稻棘缘蝽成虫图像的边界处仍然有部分阴影未被去掉,即对稻棘缘蝽成虫图像的边界分割效果不理想。过渡区结合了边界与区域的特点,利用过渡区算法在分割含阴影图像或背景边界不清晰图像上有更好的效果,因此,结合过渡区算法进行优化能更好地实现含阴影的昆虫图像分割。
2、结合过渡区的多元线性回归算法
图像过渡区是介于背景和目标之间的区域,是一个特殊的区域。它既有边界的特点,可以将不同的区域分开;也有区域的特点,其自身有宽度,且面积不为零。过渡区在空间上位于目标和背景之间,其中的像素的灰度也在对应的目标和背景之间。图像过渡区的存在将会为图像分割提供一种新的可靠的方法。
2.1图像过渡区确定
过渡区的确定取决于图像的有效平均梯度(EAG)和对图像灰度的剪切(CLIP)。设f(i,j)为二维空间变化的图像函数,(i,j)表示像素空间坐标,f表示像素点的灰度值;g(i,j)代表f(i,j)的梯度,可通过梯度算子作用于f(i,j)得到,即g(i,j)=▽f(i,j)。有效平均梯度EAG的定义为:EAG=TG/TP(10)其中,TG=∑i,j∈Sg(i,j)为梯度图的总梯度值;TP=∑i,j∈Sp(i,j)为非零梯度像素的总数,其中,p(i,j)=1,ifg(i,j)>00,ifg(i,j){=0。
由此可知,有效平均梯度EAG只与非零梯度像素有关。影响过渡区确定的另一个因素是对图像灰度的剪切,过渡区算法的剪切可分为高端剪切fL(i,j)和低端剪切fL(i,j)两种。设L为剪切值,即被剪切的部分,其范围为0~255,则剪切后的图像可分别表示为;
剪切值从零灰度值开始剪切,对剪切后的灰度图像求梯度,其梯度函数必然与剪切值L有关,由此得到的EAG也变成了L的函数EAG(L)。EAG(L)与剪切的方式也有关,对应高端和低端剪切的EAG(L)可分别写成EAGhigh(L)和EAGlow(L)。典型的EAGhigh(L)和EAGlow(L)曲线都是单峰单线,即它们各有一个极值,如图2所示。设EAGhigh(L)和EAGlow(L)曲线的极值点分别为Lhigh和Llow,则它们可表示为:
Lhigh=Arg{MaxL∈F[EAGhigh(L)]}(13)Llow=Arg{MaxL∈F[EAGlow(L)]}(14)
两个极值点对应灰度值集合中的两个特殊值,它们在灰度值上限定了过渡区的范围。根据式(13)和式(14)可计算出Lhigh和Llow,从而确定出过渡区,即:TR={(i,j)∈I|Llow≤f(i,j)≤Lhigh}(15)2.2过渡区算法优化图像分割效果由于多元线性回归算法对含有阴影的昆虫图像边界分割不准确(见图1(d)),因此本文引入过渡区分割算法,将多元线性回归算法与过渡区相结合,实现对昆虫图像的分割。
过渡区分割算法主要面向灰度图像,因而要求取图像过渡区需首先将多元线性回归算法分割后的彩色图像转换为灰度图像。将转换后的灰度图像作为原始图像,再利用3.1节中介绍的方法求取它的过渡区。继续以图1的稻棘缘蝽成虫为例,图3(a)为图1(d)中利用多元线性回归规范化算法分割的图像,求取其对应的灰度图,如图3(b)所示,图3(c)为利用式(15)得到的过渡区截取图像。
一旦确定了过渡区,进一步对昆虫图像分割就比较容易了。因为真正的边界是在过渡区之中,所以可以借用过渡区里像素的信息来帮助分割。本文采用这些像素确定一个阈值来实现分割。由于Lhigh和Llow限定了边界线灰度值的上下界,阈值可直接借助它们来计算,即根据Lhigh和Llow确定一个阈值来实现对昆虫图像的进一步分割。由于过渡区的确定都保证了边界线灰度值的范围,因此分割偏差太大的可能性很小,也可以说这种方法的抗干扰能力较强。
3、算法设计实现
基于过渡区优化的多元线性回归分割算法结合了多元线性回归和过渡区算法的优点。算法首先对预处理的昆虫图像建立多元线性回归模型,并对回归模型进行范数优化,然后利用优化后的回归模型对昆虫图像进行分割,对于边界分割效果不理想的图像,将其转化为灰度图像,求取过渡区,再运用过渡区分割算法对其边界进行二次分割优化。算法的主要步骤和实现流程如下。
3.1算法实现步骤
结合过渡区的多元线性回归昆虫图像分割算法的具体步骤如下:
Step1图像预处理:首先将昆虫图片进行统一的亮度处理,使图片不至于过亮或者过暗。
Step2背景样本块选择:从图像的背景信息中选择有代表性的区域作为样本块,以求取回归参数。由于不同图像的背景信息不同,单纯一色的背景也可能由于色度深浅不均带来误差,因而提取1块像素块作为回归模型样本具有较大的局限性。实验证明,在昆虫图像分割中,选择4~7块样本块效果较好。
Step3建立回归模型:根据样本块信息按照式(5)计算回归参数,建立式(4)的图像RGB多元线性回归模型。
Step4求取RGB像素范数:根据式(6)-式(8),计算三色板像素的范数,构建优化模型,见式(9)。
Step5昆虫图像提取:利用优化模型,实现昆虫图像。
分割。
Step6确定过渡区:将采用多元线性回归算法分割后的彩色图像转化为灰度图像,并确定其过渡区。
Step7基于过渡区的优化分割:取过渡区两边界的灰度值Lhigh和Llow之间的均值作为阈值,以此阈值分割原始图像,得到优化后的分割图像。
3.2算法流程图
根据上述讨论,采用多元线性回归与过渡区相结合的算法对昆虫图像进行分割的流程如图4所示。
4、实验验证与效果分析
为了验证本文算法的有效性,以3张经过预处理的昆虫图像分割为例进行对比研究,3张图片的尺寸分别为551×364、630×472、552×374,且它们的水平分辨率和垂直分辨率均为96dpi。图片来源于课题组的科研数据库。算法在Win-dowsXP系统下,利用Matlab实现。
分别将本文提出的优化算法和原有多元线性回归算法及文献的基于区域的分割算法进行对比,将3种算法分别应用于所选图片进行分割。为了增强显示结果的可视性,对本文算法和文献提出的算法的分割结果进行了伪彩色处理,效果如图5所示。图5(a)为3种昆虫的原图像;图5(b)为利用文献[5]的区域分割算法分割后的图像,3种昆虫图像中,红蜘蛛图像和飞蛾图像因为阴影区域较少,分割效果好于青步甲成虫图像,但昆虫边界分割不够精确,青步甲成虫图像则包含较多阴影背景;图5(c)为多元线性回归算法分割后的图像,整体分割效果优于图5(b)的区域分割算法,图像边界分割较清晰,但图像阴影部分没有完全去除;图5(d)为由图5(c)生成的对应灰度图;结合过渡区算法得到图5(e)所示的本文算法的分割结果。由图5(e)可以看出,本文提出的过渡区优化算法弥补了多元线性回归算法的不足,对含阴影昆虫图像的分割效果良好。
为了进一步客观评价实验结果,本文采用FOM(FigureofMerit)定量地分析各检测算法的性能。
FOM的定义如下:
其中,Ni和Nt分别为实际和检测到的边缘像素的数量;α为补偿系数(通常取值为1/9);di为检测到的边缘点与其最近的理想边缘点的距离。FOM值处于0到1之间,其值越大,说明边缘检测效果越好。分别计算图5中3种算法的FOM值,结果如表1所列。
从表1中可以看出,对于以上3张图像,本文方法的FOM值均较大,说明检测结果相对较好,即改进算法比其它算法能更好地实现对含阴影昆虫图像边界的分割。运行时间方面,改进算法由于是在多元线性回归算法的基础上再进行优化分割,因此速度上比单独应用多元线性回归算法稍慢。区域分割算法由于通常结合其他方法先进行阈值判断或分类,再利用区域增长算法进行分割,因此运行速度不占优势,比多元线性回归算法耗时更长,与本文算法的运算时间相当。
3种算法分割上述昆虫图像的运行时间(单位:秒)对比如表2所列。
综合分析表1和表2,本文提出的结合过渡区优化的多元线性回归图像分割算法相比原多元线性回归算法和区域分割法在分割带有阴影背景的昆虫图像方面具有更好的特性,在速度和效果上达到了一个较好的平衡,能较好地解决含阴影昆虫图像边界分割效果不理想的问题,更准确地实现昆虫图像分割。
结束语
本文介绍了一种结合过渡区优化的多元线性回归图像分割方法,说明了其在昆虫图像分割中的应用。实验和分割效果对比证明,本文提出的算法能较好地解决含阴影的昆虫图像边界分割效果不理想的问题,更加精确地实现昆虫图像分割。在实际的农林虫害防治中,运用本文算法能够很好地识别害虫,将其中的目标区域(害虫)分离出来,从而实现仅对害虫进行药剂喷洒,防止了由于化学药剂的大面积使用而造成的环境污染问题。本文算法的不足是目前更适合于背景颜色较少、背景色彩分布较均匀、背景和前景颜色相差较大的昆虫图片。下一步将针对各种复杂背景图片及背景与前景颜色比较接近的图片进一步优化和完善算法,以扩大算法的应用范围。
参考文献:
[1]王江宁,纪力强.昆虫图像分割方法及其应用[J].昆虫学报,2011,54(2):211-217.
[2]于新文,沈佐锐.昆虫数字图像的分割技术研究[J].农业工程学报,2001,17(3):137-141.
[3]罗涛华.基于自适应阈值的储粮害虫图像分割算法[J].武汉工业学院学报,2006,25(1):5-8.