复杂彩色文本图像中字符的提取

被引:9
作者
陈又新
刘长松
丁晓青
机构
[1] 清华大学电子工程系图像所
[2] 清华大学电子工程系图像所 北京
[3] 北京
关键词
人工智能; 模式识别; 字符提取; 图像分割; CRAG算法; 区域生长; 彩色文本图像;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
从复杂彩色文本图像中提取和识别字符已经成为一个既困难又有趣的问题。本文给出了一个具有创新性和实用性的区域生长算法用于彩色图像的分割:彩色图像游程邻接算法CRAG(colorrun lengthadja cencygraphalgorithm)。我们将该算法用于彩色文本图像,首先得到图像的彩色连通域,再对这些连通域的平均颜色进行颜色聚类,可得到若干个聚类中心,然后根据不同的颜色中心将图像分为相应的彩色层面,最后通过连通域分析判断所需的文字层。该生长算法修改并扩展了传统的BAG算法,并将其运用于彩色印刷体文本图像中,充分利用了彩色图像的颜色和位置信息。实验结果表明新的方法能很好的从彩色印刷图像中提取多种常见的艺术字,并具有较高的提取速度,同时保留了文字和背景图像的原始色彩,便于将来的图像恢复。
引用
收藏
页码:55 / 59
页数:5
相关论文
共 1 条
[1]  
模式识别[M]. 清华大学出版社 , 边肇祺等编著, 2000