文字识别技术是图像处理领域中的一个重要方向,分为印刷体文字的识别和手写体文字的识别,后者又分为联机手写文字识别和离线手写文字识别。目前经过科研工作者的不懈努力,印刷体文字识别和联机手写文字识别技术已经进入到了实际应用阶段,但是离线手写文字识别还处于实验室研究阶段。 本文对离线手写体阿拉伯文字从文本图像的采集、预处理、特征抽取到分类,这样一个完整的识别系统的开发作了研究,评估了现有的相关算法,改进了有关的算法。文中对阿拉伯手写体文本图像的二值化、去噪、规范化、细化、基线检测以及倾斜矫正等的相关算法进行了阐述。在对各种图像阈值化算法分析、研究的基础上,提出了一种改进的灰度文档图像动态聚类获得阈值的算法——分块EM二值化方法;提出了由词的文本图像得到字符的模型再串联得到词模型的算法。采用经验值选取恰当的参数,优化算法,并使用多分类器的融合(最近邻法和HMM的融合),提高文本的识别率。
Book Details: |
|
ISBN-13: |
978-3-639-81885-7 |
ISBN-10: |
3639818857 |
EAN: |
9783639818857 |
Book language: |
中文 |
By (author) : |
艳芬 程 |
Number of pages: |
116 |
Published on: |
2015-10-09 |
Category: |
Informatics, IT |