BP神经网络在中厚板字符识别中的应用

来源:专题范文时间:2024-02-13 17:19:01

李亚光，郑小平，肖广耀，田亚强，陈连生

(1.华北理工大学教育部现代冶金技术重点实验室，河北唐山 063210；
2. 唐山中厚板材有限公司，河北唐山 063600)

当中厚板生产完成后，作为唯一可以标识板材信息的喷码号，在运输管理和仓储管理等方面都起了十分关键的作用[1]。目前，中厚板企业实板入库过程中，存在人工喷码和人工读取识别信息的状况，这样不但增加了员工的劳动量，并且极易出现错误，严重影响了中厚板的生产进度。

目前，轧钢产品的字符识别得到了国内外学者的广泛关注并取得了一定的研究成果。东南大学周啸采用了一种改进的模板匹配法对板材上的字符进行识别[2]。模板匹配作为一种最常用的字符识别算法，适用于字符无断裂或无字符损坏严重的情况，当这些干扰因素出现时，识别率就会大大降低。针对字符出现粘连的情况，武汉工程大学董彬提出了多级切割投影算法[3]，采用层层分割的方法对钢板的喷码进行定位，但是该算法对图像的要求比较高，需要将目标固定在图像的某一具体位置。吴迪等人基于目前钢厂的信息化生产趋势，提出了一种支持向量机的字符自动识别算法[4]。该方法分类识别准确率较高，但其依赖字符特征的选取。Khan M A[5]采用了一种基于熵的向量机的特征提取算法，该方法能够用于处理字符识别中的某些问题，如光线变化、遮挡和多视图，但不适合于样本数量少且复杂的图像。Ohyama等[6]提出了角点检测和MQDF( Modified quadratic discriminant function)分类器结合的点阵字符识别方法，但在应用于运动模糊图像时，其鲁棒性还需进一步改进。

因此，基于深度学习大发展的背景，为了提高某中厚板厂的生产效率和信息化监管水平，将一种改进后的BP神经网络算法应用于中厚板的热喷码字符识别，且效果显著，达到了该中厚板厂的应用要求。

板材生产现场的热喷码识别基本原理可概括为：图像的采集→预处理→BP网络→识别并输出结果。生产现场采集到的图像包含了大量的无效信息，首先要对待识别图像进行预处理[7]，经过预处理后的图像是一张自定义大小的黑白单个字符图像，然后将该图像传输到已训练完成的BP神经网络中进行仿真，最后利用神经网络输出判断并识别出来。

图像的预处理是字符识别的基石，预处理的优劣会直接影响字符识别效率。图像预处理的方式涵盖了：图像阈值处理、形态学处理、字符分割以及归一化等[8]。

2.1 图像二值化

生产现场采集到的图像还包含着背景信息，需要通过合适的阈值将字符从背景中分割出来，便于下一步处理。目前，迭代法、最大类间误差法、最大熵法在单独使用的过程中会因为现场条件的差异而影响处理效果[9-11]。图1所示为预处理图像，为了改善图像的效果，采用迭代法和最大类间误差法相结合对图1(a)的图像进行二值化处理：先用最大类间误差法自动选取一个阈值，然后使用一个小矩形窗口从左到右逐像素移动，使用误差法来计算窗口的局部方差，判断此阈值是否合适，如果该值小于或大于阈值，就继续迭代，迭代数次后，使图像分割的像素点降到最少，结果如图1(b)所示。

图1 预处理图像

2.2 形态学处理

利用形态学[12]处理技术，消除二值化后图像中不利识别的影响因素，将有意义的分量和边界特征提取出来，便于后续的分割。对图1(b)采取开运算的操作：先腐蚀后膨胀，去除图像中字符边缘孤立的噪点，平滑字符的边界，使字符更加清晰有轮廓，便于后续分割，其结果如图1(c)、图1(d)所示。由图可知，相较于二值化后的字符轮廓模糊、噪点嘈杂，腐蚀与膨胀后的字符更加清晰、丰满，识别度更高，更加有利于分割。

2.3 字符分割及归一化

BP神经网络只能对单个字符进行识别，需要将中厚板热喷码的连串字符分割成单个字符，且分割后字符的独立性与完整性决定字符是否能够快速准确地被识别出来，所以字符分割也是整个过程中极为重要的一步。基于目前比较主流的字符分割方法[13-15]，结合该厂中厚板热喷码的实际情况，采用了连通域字符分割方法，将字符的先验知识和字符的特性结合起来，适用于板材字符的快速且有效的识别情况。该方法分割及归一化步骤如下：

(1)获取图1(d)中值为1的矩形区域左上坐标以及区域的长和宽；
(2)依次读取每个字符的质心坐标，将矩形区域从处理后的图像上截取下来；
(3)得到截取后字符的高度，与目标高度进行比较，从而计算出变换的系数，然后通过这个系数计算出每一个原始字符归一化后在新图像中的位置，最后计算出归一化图像中每个像素点的值，即求出原始像素点及其周围3个点的像素值的平均值，最后用floor函数取整。字符分割及归一化结果如图2所示。

图2 字符分割及归一化图像

基于BP神经网络的字符识别方法主要包括：从所有需要识别的样本字符中提炼出有用特征，再通过神经网络对于此类特征进行训练和熟悉加以识别；
直接把待识别的字符图像上传神经网络，由神经网络自动完成特征提取和识别并得出结果。由于识别效果与字符的特征提取相关，而特征提取又比较耗时，不符合生产需要。因此，对分割后的热喷码字符采用第2种方法进行识别[16,17]。

3.1 BP算法的改进

初值选择。BP神经网络是非线性网络，初始参数的取值异常关键，不能过大也不能过小，过大容易使网络的误差变化过小，造成网络瘫痪；
过小会影响网络的训练速度，造成效率低下。所以通过赋予BP网络多次不同的初始参数，可以使网络真正地达到全局最小值，并且选取网络参数的初值需在[-1,1]之间，保证权值的调节具有足够的活性。

学习速率的改进。对BP网络改进学习方法，利用公式(1)，通过权值与误差函数的比较确定学习速率的大小，使网络自动调节学习速率。

(1)

其中，η(t)为初始权值，SSE(t+1)和SSE(t)分别表示第t+1次和第t次的误差平方和。当第t+1次的误差平方和大于第t次的误差平方和，则表明第t次训练是有效果的，然后再乘以增量因子，就可以增大学习步长；
反之，就乘以减量因子，减小步长，加快网络的迭代速率。

附加动量因子。BP算法采用的是梯度下降法，当误差函数是多维曲面的时候，就会在训练过程中出现误差陷入局部最小值的问题。为了解决这一问题，在训练网络时附加动量因子，该方法是根据梯度的变化来修改权值，同时还考虑在误差曲面上变化趋势的影响，如同一个低通滤波器，略过某些局部最小值。式(2)、式(3)是附加动量因子的权值调节公式，其中x为迭代次数，kt为动量因子。

Δwij(x+1)=(1-kt)ηδipj+ktΔwij(x)

(2)

Δbi(x+1)=(1-kt)ηδi+ktΔbi(x)

(3)

为了验证改进后的BP算法对网络性能的影响，选取同一组训练样本，分别通过4种算法函数进行训练，期望方差均为1，最大迭代次数为5 000，训练结果如表1所示。

表1 4种BP训练算法效果比较

表1中，Traingd和Traingdm2种算法并没有达到期望误差，只是完成最大训练次数就停止了；
只有Traingda和Traingdx2种算法满足了目标要求，且Traingdx的训练次数远少于Traingda，说明经过改进后的BP算法与其它算法相比，运行速度和网络性能都得到了提升。

3.2 BP网络的设计

预处理分割后的图像大小是80×40的二值图像，经过归一化后转化为30×16的像素大小。然后将图像转化为一个480×1的矩阵，用同样的方法表示其它字符，最终得到26个大写英文字母和0～9数字的样本矩阵为：

Sample=[letter a,letter b,letter c,……letter z,number 0,number 1,number 2……number 9];

BP网络的输入为每一个480×1的矩阵，即输入的节点数为480个。该项研究所用到的训练样本有25组，于是输入向量就是一个480×36的矩阵，共有25组这样的输入向量。

由于系统要识别的是26个大写英文字母和10个阿拉伯数字，所以网络的输出可以设定为一个36×36的单位矩阵T，其中与字符对应的那位为1，其它的全为0。所以输出层的节点数为36个。

隐藏层的节点数没有确切的选择方式，可以根据一个经验公式来作为参考[18,19]：

(4)

其中，y为隐藏层的节点数，a和b分别为输入和输出的节点数，x为[1,10]之间的调节常数。经过大量的实验反复比较，最终选择的隐藏层节点数为25。

由上述分析得出BP神经网络的系统结构为3层，输入层节点的个数为480个，隐藏层节点的个数为25个，输出层节点的个数为36个，为480-25-36结构。激活函数采用S型函数2层logsig/logsig网络，如图3所示。

图3 BP网络系统结构图

3.3 BP网络的训练

为了使BP网络具有一定的容错能力，采取理想字符和带有噪声的字符共同训练的方法，具体训练过程如下：

(1)先用理想的字符样本对网络进行训练，直到达到目标误差为止。

(2)然后用等量的理想字符样本和含噪标准差分别为10%、20%、30%、40%、50%的样本进行训练，其中含噪字符是通过对理想字符加入期望为0标准差依次增加的噪声得到的样本。

(3)最后将(2)中得到的训练网络作为初值，对理想样本再进行训练，这样做是为了输入理想字符时，网络也能够作出正确的判断。

训练结束后，为了验证神经网络的训练效果，采用了一组含噪比为0～0.5的测试样本对网络的性能进行了测试。

图4所示为网络训练的性能结果图，由图4(a)可以看出，经过误差训练的网络收敛速度明显快于未经误差训练的网络，说明经过误差训练后，神经网络具有良好的样本泛化能力，且训练速度也大大提高。由图4(b)可以看出，理想网络和含噪网络都具有一定的抗干扰能力，含噪比在0～0.2之间的网络识别错误率几乎为0，当含噪比在0.25～0.5之间时，理想网络的错误率略高于含噪训练网络，说明经过误差训练后的网络，其容错能力得到了提高。网络训练的性能结果如图4所示。

图4 网络训练的性能结果图

为了验证该方法的有效性，采用500个测试字符，基于MATLAB软件的 R2018b平台，通过参数与算法训练改进后的BP神经网络完成识别，并且与文献[20-22]的方法进行了对比，结果如图5、图6所示。

图5 不同方法识别准确率比较图6 部分字符识别结果图

文献[20]提出的基于支持向量机算法的连铸坯端面信息码识别方法，通过滑动窗口算法与支持向量机分类模型完成了字符的识别。文献[21]针对亮度和喷印不均的钢板喷印字符的识别问题，结合模板匹配法，提取钢板字符的笔画特征来识别字符。文献[22]提出了基于SSD深度学习方法对钢板字符完成了识别。上述方法在识别的过程中均未考虑识别的效率，而该研究将BP神经网络应用于中厚板厂热喷码的识别，通过算法的改进和含噪信号的训练，大大提高了网络的性能，从而有效地提高了字符识别准确率和效率。

(1)基于目前工厂信息化、智能化的生产趋势，为了提高某中厚板厂的生产效率和智能化监管水平，通过MATLAB软件和BP神经网络完成了板材热喷码字符的识别。

(2)与其它传统方法相比，利用MATLAB对中厚板热喷码进行二值化、形态处理、分割等预处理，然后经过改进的BP网络算法和含噪字符的网络训练，优化了神经网络的迭代速率，提高了神经网络的识别准确率。该识别方法字符识别准确率可达98.5%，达到了该中厚板厂的识别要求，并且对其它中厚板厂也有一定的借鉴意义。

猜你喜欢中厚板字符识别字符视觉检测技术在八钢中厚板生产线中的运用新疆钢铁(2021年1期)2021-10-14钢结构厚板及中厚板的焊接建材发展导向(2021年9期)2021-07-16论高级用字阶段汉字系统选择字符的几个原则汉字汉语研究(2020年2期)2020-08-13字符代表几小学生学习指导(低年级)(2019年12期)2019-12-04一种USB接口字符液晶控制器设计电子制作(2019年19期)2019-11-23图片轻松变身ASCⅡ艺术画电脑爱好者(2019年8期)2019-10-30我国中厚板生产发展现状中国钢铁业(2017年4期)2017-07-25融合字符及字符排列特征的铭牌识别方法现代电子技术(2016年22期)2016-12-26一种基于OpenCV的车牌识别方法软件导刊(2016年11期)2016-12-22基于MATLAB的图片中字符的分割与识别科学与财富(2016年28期)2016-10-14

上一篇：具有双光子活性的镉配合物的合成、结构及性质
下一篇：抗病毒药物电化学检测研究述略

扩展阅读文章

推荐阅读文章