您的位置: turnitin查重官网> 计算机 >> 软件应用 >手查重复率写数字识别策略

手查重复率写数字识别策略

收藏本文 2024-04-14 点赞:4156 浏览:13057 作者:网友投稿原创标记本站原创

摘要:提出了一种用BP神经网络识别手写数字的方法。论述了其良好的监督学习功能,并结合轮廓特征提取进行训练,给出了一种基于梯度下降法训练BP神经网络的手写数字识别方法。实验结果表明,该方法简单且有较好的识别效果。
关键词:BP网络;手写数字识别;轮廓特征;梯度下降法
1672-7800(2012)012-0172-03
0引言
手写数字识别是模式识别的一种,在学科上属于模式识别和人工智能的范畴。模式识别研究的内容是利用计算机对客观物体进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。
一种经典的模式识别技术流程如图1所示,由数据获取、预处理、特征提取、分类决策及分类器设计5部分组成。一般分为上下两部分,上部分完成未知类别的模式分类;下部分属于设计分类器的训练过程,利用样品进行训练,确定分类器的具体参数,完成分类器的设计。而分类决策在识别过程中起作用的是对待识别样品进行决策分类。
在手写数字的识别中,特征提取是其中很重要的一个环节。现有的手写特征提取算法有多种,最邻近模版匹配法、基于类中心的欧式距离法分类法、马氏距离分类法、夹角余弦距离分类法、最小错误概率的贝叶斯分类法、Fisher算法、BP神经网络分类法、RBF神级网络分类法等,还有各种现阶段的新型算法。
本研究的基本内容主要是从BP神经网络仿真程序设计分类入手,运用BP网络分类器解决现实生活中经常涉及到的手写数字字符0~9的识别问题。
1手写数字特征提取及识别方法

1.1文献综述

特征提取是整个字符识别系统的关键,识别算法是根据选取特征的种类来判断所选取的特征是否稳定,是否代表一类字符的特点,是系统识别率高低的关键。
(1)结构特征。包括点、线、弧、圆等。结构特征可以描述数字的结构,对于字符的精细结构反应灵敏,该方法可以充分利用字符图形的结构信息及组成规律,减少笔画与字符型态变化的影响。结构法分辨相似字的能力较强。
(2)统计特征。包括笔画密度特征、投影特征、面积特征、边缘特征、轮廓特征等,特点是易于训练,可降低书写随意性的干扰。
(3)变换特征。可以分为二维的变换特征和一维的变换特征。常用的变换特征有Fourier变换、Hadanmand变换、Walsh变换、Rapid变换、Gabor变换、K-L变换、Welet变换。

1.2手写特征模式识别方法

本文采用的方法是先提取数字的轮廓特征,然后对图像进行裁剪之后按黑像素占总像素的比率提取出特征值。轮廓特征主要是指周边轮廓特征,即将数字字形加上外接矩形边框,然后分别从上、下、左、右四个方向依次扫描数字点阵直至碰到第一个黑像素或对面的边框为止,记录每次扫描所经过的白像素数,从而得到对应数字的四维特征向量,称为数字的周边轮廓特征,此特征稳定性较强,较易提取,维数较低,独立性较强。完成图像裁剪后,把每个数字图形定义成一个N*N(5*5)的模板,将每个样品的长度和宽度N等分,平均有N*N个等分,对每一等分进行像素个数统计,除以每一份的面积总数即得特征值。计算出第一行的5个比例值保存到特征的前5个,第二行对应着特征的6~10,如此保存样本的特征值。具体流程如图2所示。
下面以0为例,简单描述求取特征值的方法。首先把图像按边缘裁剪放缩,然后分成5*5的小区域(如图3所示),再计算出每个小区域中黑像素所占的比例,存储之后即为0的一个样本特征值。
2BP神经网络分类器的设计

2.1BP神经网络训练过程论述

BP网络结构有3层:输入层、隐含层、输出层,如图4所示。
3层BP神经网络学习训练过程主要由4部分组成:输入模式顺传播(输入模式由输入层经隐含层向输出层传播计算)、输出误差逆传播(输出的误差由输出层经隐含层传向输入层)、循环记忆训练(模式顺序传播与误差逆传播的计算过程反复交替循环进行)和学习结果判别(判定全局误差是否趋向极小值)。具体实现如图5所示。
下面具体介绍和分析用梯度下降法训练BP神经网络,在第1次输入样品(1=1,2,……,N)进行训练时各个
参数的表达及计算方法。
(1)确定参数。①输入向量为X=[x1,x2,…,xn]T(n—输入层单元个数);②输出向量Y=[y1,y2,…,yq]T(q—输出层单元个数);③希望输出向量O=[o1,o2,…,oq]T;④隐含层输出向量B=[b1,b2,…,bp]T(p—隐含层单元个数);⑤初始化输入层至隐含层的连接权值Wj=[wj1,wj2,…,wjt,…,wjn]T,j=1,2,…,p;⑥初始化隐含层至输出层的连接权值Wk=[wk1,wk2,…,wkj,…,wkp]T,k=1,2,…,q。
(2)输入模式顺序传播。这一过程主要是利用输入模式求出它对应的实际输出。
①计算隐含层各神经元的激活值Sj:
s=∑ni=1wji?Xi-θj(θj为隐含层单元的阈值)
②激活函数用S型函数,即:f(x)=f11+exp(-x)这里之所以选S型函数为BP神经网络神经元的激活函数,是因为它是连续可微分的,而且更接近于生物神经元的信号输出形式。
③计算隐含层j单元的输出值:bj=f(sj)=f11+exp-∑ni=1wji?xi+θj④计算输出层第k个单元的激活值sk:SK=∑pj=1vkj?bj-θk⑤计算输出层第k个单元的实际输出值yk:yk=f(sk)(3)输出误差的传播。 在第(2)步的模式顺传播计算中得到网络的实际输出值,当这些实际的输出值与希望的输出值不一样时或者说误差大于所限

源于:免费论文www.udooo.com

定的数值时,就要对网络进行校正。
①输出层的校正误差为:dk=(ok-yk)yk(1-yk)②隐含层各单元的校正误差为:ej=∑qk=1vkj?djbj(1-bj)③对于输出层至隐含层连接权和输出层阈值的校正量为:△Vkj=α?dk?bj△θk=α?dk(α为学习系数,α>0)
④隐含层至输入层的校正量为:△Wji=β?ej?xi
△θj=β?ej(β为学习系数,0<β<1)
(4)循环记忆训练。对于BP神经网络输入的每一组训练模式,一般都要经过数百次甚至上万次的循环记忆训练,才能使网络记住这一模式。这种循环记忆训练实际上就是反复重复上面介绍的输入模式。
(5)学习结果的判别。判别的目的主要是检查输出误差是否已经小到可以允许的程度。学习或者说训练的过程是网络全局误差趋向于极小值的过程。

2.2BP神经网络分类器设计

对于手写数字提取了5*5=25个特征,来作为神经网络的输入,因此输入结点为25个。根据隐含层个数大约为输入结点两倍的关系,隐含层取50个结点,输出层取4个结点,这4个输出为四位二进制数,代表神经网络输出的数字类型。图4中,o3[0]~o3[3]为0或1,表示0~9的一个二进制数。
MATLAB中

源于:毕业总结范文www.udooo.com

运用newff函数进行BP网络功能的实现,其部分伪代码程序如下:
%构建使用梯度下降法训练的BP神经网络
function bpgdtrain
global bpnet; %定义全局变量
clc;
load templet pattern; %加载样品库
……
bpnet=newff(x,[50,4],{'logsig','logsig'},'traingd');
……
[bpnet]=train(bpnet,p,t);%识别手写数字特征
3BP网络分类实验与分析

3.1特征提取方法的结果

本文提出了基于BP神经网络的手写数字识别,并用Matlab软件程序实现了该系统。
本系统实验采用200个手写数字样本作为训练样本,200个手写数字样本作为测试样本。截取部分结果如表2所示。

3.2结果分析

(1)该系统对于模拟手写的数字基本上能正确识别。
(2)每个手写数字的结果正确率都不一样。
(3)有些数字的错误率较低而有些较高。
(4)对于手写不规范的数字会存在错判的情况,这跟样品库的存储有限有关。
4结语
从仿真结果可以看出,BP神经网络训练达到了对手写数字的分类和识别。但是由于样品库的存储有限,神经网络训练集对这些形状的数字识别仍具有很大的局限性。因此,在进行训练时,一定要注意保存最优的权值和阈值,以便下次实验时进行参考与对比。
参考文献:
任丹,陈学峰.手写数字识别的原理及应用[J].计算机时代,2007(3).
GEORGE F,LUGER.Artificial intelligence[M].Beijing:ChinaMachine Press,2005.
[3]柳回春.手写体数字识别技术研究[J].计算机工程,2003(4).
[4]双小川,张克.基于统计和结构特征的手写数字识别研究[J].计算机工程与设计,2012(4).
[5]杨淑莹.模式识别与智能计算——Matlab技术实现[M].北京:清华大学出版社,2008.
[6]任翠池,杨淑莹,洪俊.基于BP神经网络的手写字符识别[J].天津理工大学学报,2006(4).
[7]颜培育,张国栋.基于人工神经网络的手写体数字识别方法[J].沈阳航空工业学院学报,2008(2).
[8]ZAHEER AHMAD.Urdu optical character recognition using neural networks[J].Institue of Management Sciences Peshawer,2009(2).
[9]张德丰.Matlab程序设计与工程应用[M].北京:清华大学出版社,2011.
[10]胡小峰,赵辉.Visual C++/Matlab图像处理与识别实用案例精选[M].北京:人民邮电出版社,2004.
(责任编辑:孙娟)

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号