基于

VC++的数字识别系统的设计与实现

第

1 章绪论

1.1 数字识别概述

模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机器来

实现人

(及某些动物)对事物的学习、识别和判断能力，因而受到了很多科技领域研究

人员的注意，成为人工智能研究的一个重要方面。

字符识别是模式识别的一个传统研究领域。从

50年代开始，许多的研究者就在

这一研究领域开展了广泛的探索，并为模式识别的发展产生了积极的影响。

字符识别一般可以分为两类

:1.联机字符识别;2.光学字符识别(Optical Chara-

cter Recognition，OCR)或称离线字符识别。在联机字符识别中，计算机能够通过
与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状，所
以相对

OCR来说它更容易识别一些。但联机字符识别有一个重要的不足就是要求输

入者必须在指定的设备上书写，然而人们在生活中大部分的书写情况是不满足这一
要求的，比如人们填写各种表格资料，开具支票等。如果需要计算机去认识这些己经
成为文字的东西，就需要

OCR技术。比起联机字符识别来，OCR不要求书写者在特

定输入设备上书写，它可以与平常一样书写，所以

OCR的应用更为广泛。OCR所使

用的输入设备可以是任何一种图像采集设备，如

CCD、扫描仪、数字相机等。通过使

用这类采集设备，

OCR系统将书写者已写好的文字作为图像输入到计算机中，然后

由计算机去识别。由于

OCR的输入只是简单的一副图像，它就不能像联机输入那样

比较容易的从物理特性上获得字符笔划的顺序信息，因此

OCR是一个更具挑战性的

问题。

数字识别是多年来的研究热点，也是字符识别中的一个特别问题，它是本文研

究的重点。数字识别在特定的环境下应用特别广泛，如邮政编码自动识别系统，税表
和银行支票自动处理系统等。一般情况下，当涉及到数字识别时，人们往往要求识别
器有很高的识别可靠性，特别是有关金额的数字识别时，如支票中填写的金额部分，
更是如此。因此针对这类问题的处理系统设计的关键环节之一就是设计出高可靠性和
高识别率的数字识别方法。然而可以说还没有哪个数字识别器达到完美的识别效果。

在过去的数十年中，研究者们提出了许许多多的识别方法。按使用的特征不同，

这些方法可以分为两类

:基于结构特征的方法和基于统计特征的方法。结构特征通常

包括圆、端点、交叉点、笔划、轮廓等，统计特征通常包括点密度的测量、矩、特征区域
等，一般来说，两类特征各有优势。例如，使用统计特征的分类器易于训练，而且对
于使用统计特征的分类器，在给定的训练集上能够得到相对较高的识别率，而结构
特征的主要优点之一是能描述字符的结构，在识别过程中能有效地结合几何和结构
的知识，因此能够得到可靠性较高的识别结果。

1.2 神经网络在数字识别中的应用