计算机图像识别的智能化处理方法分析,数字图像处理论文

　　图像识别论文第五篇：计算机图像识别的智能化处理方法分析

　　摘要：现有的依靠人工运维巡视的方式，无法及时、有效的发现地下管线外破事件，而依靠人工智能的方式识别外破事件，却受训练模型的制约，影响识别准确率。

　　关键词:地下管线;外力破坏;人工智能;

　　1 图像预处理介绍

　　对训练素材进行预处理可有效提升图像识别准确率。图片需要进行预处理的原因：适应神经网络结构。因为网络结构能够接收的数据格式一般来说比较固定，因此在训练模型前，一般要提前将训练样本预处理，使之转换为可读格式；训练样本提纯。本文的训练样本中一般可能有垃圾数据，预处理后这部分数据被干净的清理，这样他们的影响就会消失；数据增强。预处理的样本增加了数据本身的多样性。利用旋转、镜像等方法来表现图像的空间多样性。基于这一原理，该模型具有更强的鲁棒性；归一化处理。预处理的形式很多，不同规格的数据经过转换后，成为规格相同的实证数据，图片的归一化就是最为典型的案例；数据体积压缩。处理后可以减小尺寸，如果原始数据的尺寸是FHD，经过压缩可后可以达到VGA，从而就会减少降低数据体积。

　　2 图像预处理方法

　　2.1 几何规范化

　　计算机图像识别技术在应用过程中存在一些缺陷，在一定程度上阻碍了智能化技术的发展[1]。计算机图像识别要求系统高效准确地进行图像识别，智能化处理方法的应用可显着提升计算机图像识别的性能，提升其识别的准确性及效率[2]。由于地下管线外破事件图片在拍摄提取过程中，容易受到光线强弱、有无阴影、拍摄角度的影响，因此需在识别前对图像进行标准化的预处理，并使用平移、旋转和缩放等几何变换选取一个共同点作为参照点统一规范化图像。在此过程中还可通过几何仿射的几种变换方式(例如移位，旋转和缩放)对地下管线外破事件图像进行几何规范化处理，仿射变化的公式为：

　　在这里(u，v)具体表示所输入图像的实际像素，而(x，y)坐标表示的是输出图像中的像素的坐标。将上式展开可得x=a11u+a21v+a31，y=a12u+a22v+a32。平移变换得具体步骤是给所有点坐标都加上同样的Δu和Δv，具体的表达式可以转换为：

　　旋转的步骤如下：所有点的坐标是相对于原点，进行θ角的逆时针旋转，具体表达式为：

　　缩放变化是指在同比例缩小与放大，当r>1时图像是完全可以被放大的，当0<r<1时，图像就是会被缩小，其中具体的数据变换表达方式如下列公式为：

　　2.2 灰度规范化

　　2.2.1 图像平滑化

　　图像需要保证平滑，目的在于能显着提高图像质量。它可以在空间域和频率域中实现。一般常用的方法包括相邻区域平均值滤波、空间滤波和中值滤波。相邻区域平均值滤波是局部空间处理方法，使用像素附近的每个像素的平均灰度值来实现图像的平滑度而不是像素的原始灰度值。

　　无论是直接获取的灰度图像，还是由彩色图像转变得到的灰度图像，这里面都会有噪声的存在，噪声对图像质量有很大的影响。进行中值滤波不仅可以去除孤点噪声，而且还能够完美保留边缘特征。它不会导致图像明显模糊，更适合于实验中电网设备的缺陷图像的处理。

　　中值滤波的步骤如下：在模板中让图像进行漫游，并将模板的中心与图中某个确定的像素点重合；读取对应像素的灰度值；这些灰度值从小到大排列；在中间找出一个对应值；将中间值分配给到对应的模板中心像素。从上述步骤可看出，中心滤波的主要功能是让与周围像素和灰度值之间的差异过大的像素点改为与周围像素接近的值，所以对孤立的噪声像素具备极强的消除能力，而这种能力也经常被用于人像美化中。由于它的原理不是简单取均值，因此产生的模糊性较小。换句话说，中值滤波可以消除噪声却又可以保留图像的细节。

　　2.2.2 高斯滤波

　　在高斯滤波器中，高斯函数用来检查输入阵列中每个像素的卷积，并将卷积设置为输出像素值。g函数可对输出像素的相邻区域赋予不同的权值：，这里h被称为过滤器的核心功能，即权重值。高斯函数有五个重要属性，特别适用于早期图像处理。这些特性使得高斯滤波器成为空间域和频域中非常有效的低通滤波器，很多工程师将它用于早期的图像处理中。

　　高斯滤波的主要特点如下：二维高斯函数具有旋转对称性，因此高斯滤波器在各个方向上的平滑度都是相同的，在后续的边缘检测中不会出现偏向于某一方向的情况；由于高斯滤波器的原理是将某一像素点邻域的权值替换该点的像素值，且距离越远的点的权重值越低，这样就能有效区分出图像边缘，使图像能高保真；由于高斯滤波的傅里叶变换频谱为单瓣，因此可以过滤大部分高频干扰信号；由于高斯滤波器的宽度可人为设定，因此可将图像在过平滑和欠平滑间进行切换，并取得最适合的中间值；由于高斯函数具备可分离性，二维高斯函数的计算量随模板宽度成线性增长，而不是与模板宽度的平方成正相关，这样能在很大程度上减少高斯滤波器的复杂程度。

　　2.2.3 均值滤波

　　均值滤波也称为线性滤波，主要方法是取相邻区域像素平均值。首先计算模板中所有像素的平均值，然后再将该平均值给予当前像素点(x，y)，则该均值即为滤波后该点图像上的灰度值g(x,y)=1/m∑f(x,y)。均值滤波可有效地去除图像中的附加噪声，但实质上它有一个十分明显的缺点，即无法保护图像的细节，利用这种方法去除噪声时很大概率上会破坏原始图像。均值滤波器可更好地抑制高斯噪声和均匀分布噪声，但不影响椒盐噪声。当噪声降低时整个图像变得模糊，并且噪声仍然存在。

　　均值滤波通常包括算术均值滤波、几何均值滤波、谐波均值滤波和逆谐波均值滤波。这几种滤波方式里，几何平均滤波的平滑度可与算术平均滤波的平滑度相媲美，但滤波中丢失的图像细节却很小。逆谐波均值滤波器特别适用于脉冲噪声的处理，但需提前知道噪声点是暗噪声还是亮噪声，以便于选择正确的滤波器阶数符号，否则将严重影响滤波效果。当阶数为正时，逆谐波均值滤波器对“胡椒”噪声有较好的滤波效果，当阶数为负时，逆谐波均值滤波器对“盐”噪声有较好的滤波效果。然而，逆谐波均值滤波器不能同时滤除“胡椒”噪声和“盐”噪声。

　　2.2.4 直方图均衡化

　　灰度直方图直接反映不同层级灰度以及对应出现频率之间的关系，可表示为P(rk)=nk/N，其中r表示第K个灰度级，nk为第k级灰度的像素数，N为当前图像的像素总数。

　　灰度直方图被认为是图像的重要统计特征，并且灰度直方图可被视为不同灰度概率密度的近似值，因此灰度直方图的均衡化就相当于是图像灰度分布的一种均衡化过程。对于尺寸娇小的图像而言，其灰度直方图散落在某一较小区间内，均衡化后其所有灰度出现的频率相同，此时图像包含的信息量将达到最大值。现在以r和s分别表示经过归一化处理的原始图像灰度值和经过均衡化后的图像灰度值，T(r)为变换函数，则在区间[0，1]随机一个r经过变换后都会对应一个s，即s=T(r)。T(r)应满足2个条件：s在[0，1]的区间内为单调递增函数；调递增函数为在[0，1]区间内也存在反变换的r=T-1(s)。

　　条件1能保证灰度级从黑变白的顺序，条件2保证变换后的像素灰度在允许的范围内。根据概率论，将随机的变量r的概率密度函数设置为Pr(r)，如果设置的随机变量s是r的函数，那么随机变量s的概率密度函数Ps(s)可以由Pr(r)求出。假设随机变量s的分布函数Fs(s)，可得出公式，将上式两边对s求导得。

　　综上所示，变换函数T(r)控制了图像灰度的概率密度，因为Ps(s)=1，则ds=Pr(r)dr=d[T(r)]，双边的积分得出。由上式可知，该函数为原始图像直方图的累积值。如果图像为灰度值离散状态的数字图像，则可选择用频率来代替概率，因此变换函数T(r)可以表示为，式中0≤rk≤1，k=0，1，2…L-1，L，L为灰度级数目。

　　2.2.5 灰度变换

　　灰度变换中最基本的方式叫做灰度拉伸，又叫做对比度拉伸，它使用了非常简单的分段变换函数，将原来图像的亮度范围线性拓展到新的动态范围。其主要思想是通过提升图像的对比度扩大图像色彩动态范围，尤其适用于低对比度图像的预处理，其过程包括两个基本操作：利用灰度直方图统计的方式确定图像对比度拉伸过程中的两个拐点；根据上一阶段确定的拐点，利用分段变换函数进行灰度值的变换。

　　该种变换方式可使得低对比度的图片细节变得更加明显和突出。这种通过灰度转换将不同图像的灰度分布参数调整为预定值的过程，称为灰度归一化，通常调整后的图像灰度分布的均值和均方差取0和1。假设一个尺寸为M×N的图像，它的灰度分布可用矩阵I(i，j)表示，且1≤i≤M；1≤J≤N，那么矩阵每个元素值都是该点像素值，其灰度值概率密度函数的均值和均方差则为：

　　2.3 图像锐化

　　在转换和传输数字图像后一定会产生模糊的情况。锐化图像的主要目的是补偿图像边缘的轮廓，强调图像的细节信息，使图像更加生动并与人类的视觉习惯相匹配。经过平滑处理过的图像之所以变得模糊，主要原因在于取了平均值或做了积分运算，如果想要图片再次变清晰，可选择对应的逆运算过程。而对于那些通过滤波器处理过的图像而言，变模糊的原因在于高频分量被过滤太多，针对于这种类型的图片可选择高通滤波器进行锐化处理。常见的锐化方式可分为一阶微分锐化和二阶微分锐化。一阶微分锐化中又分为单方向一阶锐化和无方向一阶锐化，前一种方式对规则物体具有很好的锐化功能，但无法完成不规则物体的锐化，在城市配电网设备缺陷检测中，绝大多数设备缺陷的二维图像为不规则物体。常见锐化方式有Sobel算子锐化、Prewitt算子锐化、LOG算子锐化等方法，由于篇幅有限在此不再赘述。

　　3 结语

　　图像处理中的重要步骤是噪声的消除与图像的增强，主要的目的是为提高图像的质量，它通常被称为图像预处理。图像增强的主要目的是突出显示图像的有用部分中的信息并减少图像中部分的无效的信息。图像的噪声消除的目的是为尽最大的能力去将噪声的干扰点，得到图像本来的样子。

　　本文分析了几种常见的图像预处理技术，有效的图像与处理手段，不但能最大程度保留图像的有用信息，还能降低后续图像学习、检测、识别的难度，并最终转化为识别准确率的提升。对于后续卷及神经网络模型的训练而言，一个好的图像预处理技术能从根本上改变模型的训练特性，如何开发出一款更加优秀的图像预处理函数，也是本项研究后期需要重点开展的工作。

　　参考文献

　　[1]杨声英胡海霞计算机图像识别的智能化处理技术瓶颈与突破[J].信息与电脑(理论版):2019,16.

　　[2]刘宣彤.计算机图像识别的智能化处理方法分析[J]科技经济导刊:2019,11.

返回本篇论文导航