基于顶点链编码的表格图像分析

基于顶点链编码的表格图像分析

李国强[1]2004年在《基于顶点链编码的表格图像分析》文中进行了进一步梳理顶点链编码是数字图像处理领域非常重要的工具。链编码的优点是十分明显的。它把二维图像的存储和处理变为一维链上的问题。对于大尺度的图像,链编码可以大幅度地节省存储空间并提高处理速度。该算法对推动顶点链编码在图像处理领域的应用,起到了重要作用。 表格文档分析与识别是计算机文档处理中的一个重要项目。表格是文档中常用的数据资料载体,因而表格图像分析技术的研究具有很大的潜在的应用价值。本文基于顶点链编码技术,提出了一种新的表格图像分析算法,并发展了一种自定义的表格文件格式,对丰富表格文档的分析手段,减小表格图像的存储空间都有很大的作用。 由于在用扫描仪和数字照相机获得表格文档时,倾斜总是难免的,因此表格图像的倾斜探测和矫正是表格图像分析的第一步,也是表格分析及以后各项识别工作准确性的保证。物体在数字图像中占据的面积在图像分析和识别中具有重要的作用。通常采用的方法是积分法,但对于各种极其复杂的图像形状,该算法不一定适用。因此,人们对具体对象研究了不少其他算法。但是这些算法普遍存在的问题就是运算量较大,计算时间长。 本文针对这两个问题,提出了新的算法。首先,根据表格图像中,表格的框线或悬线具有最长的边界,以及边界标定自动机能获得区域边界的优点,提出了一种新的表格图像文件倾斜矫正的方法。该方法使用简便,而且在大噪声的背景下也能使用。其次,提出直接从顶点链编码计算封闭边界所围区域的面积的方法,对于正方形、正叁边形和正六边形点阵上的图形,都有直接从链编码计算区域面积的方法。最后,通过实验证明了两个算法的有效性。 本文在研究算法的同时,在windows平台下,使用Visual C斗¨}编程工具,对涉及的算法进行了系统开发和实现。

张圣希[2]2005年在《利用顶点链编码探测表格图像斜率》文中研究指明如今,文本图像处理技术在各类应用程序中发挥着越来越大的作用。表格是一种常见的文档形式。它作为一种高度精练、集中信息的表达手段,以其简明、规范、便于填写等特点,被广泛地应用在国民经济和日常生活的各个方面。表格的计算机自动输入、存储、分析和管理已经成为文档智能处理领域的重要组成部分。在扫描录入的过程中,图像或多或少会出现某种程度的倾斜,这种图像的倾斜不仅会给下一步的分析和切割造成困难,也影响表格字符内容识别的精度。因此,表格倾斜矫正是表格识别和图像分析的第一步,也是表格版面结构分析,表格文字提取和表格OCR的前提和基础。倾斜矫正的正确率将直接影响到能否进一步正确地提取表格中的信息。本文针对现有的一些算法计算量大或在较大的噪声环境下无法正常工作的弱点,发展了顶点链编码便于探测角点的优势,提出了一种全新的倾斜表格图像角度探测算法,该算法使用方便,效率高,并且在大噪声背景下也能使用。文末给出了算法在各类噪声下的实验数据,证明了算法的正确性和有效性的同时,也指出了算法的一些弱点。

黄穗[3]2007年在《基于链编码的棋谱识别算法研究》文中提出随着数字图像处理和模式识别技术的不断发展与成熟,图像的编码技术得到了飞速发展,并以其优良的特性在图像处理领域得到越来越多的运用。本文指出了原顶点链编码算法在标定的时候存在的一些问题:在某些情况下会漏标定链编码。本文接着提出一种新的顶点链编码标定方法及其改进方法解决了这个问题。创新之处是通过使用边缘矩阵的结构改进了标定的方法,提高了算法的可靠性,同时又没有牺牲算法的效率。接下来,本文在新的链编码基础上作了一系列应用:嵌套结构分析、填充、区域统计。并且和同类算法相比,有较高的效率。另外,本文又将新的顶点链编码技术应用到围棋棋谱识别领域。在市场上,有较大的需求把传统的物理介质棋谱转换为电子棋谱,但现今却没有成熟且广泛使用的方法。本文首先在分析了棋谱识别问题,用顶点链编码作为主框架,辅以Freeman链编码、投影法等其他模式识别技术来对棋谱进行识别。本文提出的算法,经过实验,比市场上现存的产品在效率上和效果上有较大改进。本文前半部分研究对象是通用算法,后半部分是在棋谱识别这个具体领域的应用。前半部分是后半部分的基础。

张薇[4]2006年在《自动机和链编码的理论研究与应用》文中进行了进一步梳理图像编码技术和图像自动识别技术,是人类保存数字图像、从原始的图像中获取重要信息、对图像按照人类的意图进行修正的重要手段,是计算机图形科学的一个重要组成部分。自动机是实现计算机程序的模型,自动机理论的任务就在于研究这种抽象机器的模型。其中的有限自动机模型在文本处理、编译程序以及硬件设计等等中非常有用。 本文将这二者进行了结合,在自动机模型的基础上构建了边界跟踪的新算法,有效地生成顶点链编码和缝隙码等常用的链编码,提出了坐标标定自动机的算法。图像表示之间的转换是图像处理中的一个基本内容,本文建立各种常用链编码之间转换算法。本文提出了由链编码直接获得区域面积的一个新算法。在自动机边界跟踪算法的基础上,提出了两套链编码图像压缩格式,该图像格式已经用于黑白二值图像的存储,达到了很高的压缩比。利用自动机边界跟踪的新算法,提出了自动检测文本图像倾斜角度的一种新方法。对于表格类的图像,该方法具有高速和抗强噪声的特点。区域填充也是计算机图形学中的一个基本内容,在自动机模型的基础上,作者发明了新的交点配对的方法,并提出了一种高效的填充方法。另外,本文还提出了计算文字笔画宽度的方法和图形的自动切割算法。 本文利用元胞自动机研究了城市交通网络这一复杂系统,在自动机模型中容纳了路段这一基本的交通因素对BML模型做了修正。对路段、路段长度分布的随机化和警察等交通因素和交通现象进行建模和较为细致的模拟研究。在基于BML型的自动机模型中都有从自由行驶相经过一级相变到所有车辆都不能行驶的堵塞相,这是真实系统中不会出现的非物理结果。本文的研究表明,区分路段和路口并由警察管理路口的交通,则低密度交通流和高密度交通流由二级相变区分,符合城市交通流的实际情况。 作为应用,作者开发并实现了名片的储存管理系统。该系统包括:目标区域(名片图像)的自动探测;名片图像的自动切割;名片图像倾斜的自动探测和矫正;噪声消除;名片整合等功能。

陈优广[5]2006年在《边界跟踪、区域填充及链码的应用研究》文中研究指明边界跟踪与填充是图像处理的基本问题。链码间的转换是从已知一种链码获得其他链码的便捷方法。链码是获得图像几何特征的重要手段。文档图像的倾斜校正和表格识别是字符识别技术最重要的应用领域之一。 本文从边界跟踪、链码转换、区域填充、图像几何特征的计算到基于链码的表格处理软件,对链码相关的算法和链码的应用问题进行较为宽幅度的研究。本文的工作及研究成果可以归纳为: 1、分别就八近邻图像和四近邻图像给出了边界跟踪、顶点链码抽取及围线树结构的生成算法。首先通过构造像素顶点矩阵,利用像素顶点矩阵跟踪边界、抽取边界的顶点链码并生成围线树结构。其次设计了边界跟踪自动机,利用自动机的输出获得边界的顶点链码,自动机跟踪所有图像边界的同时生成围线树结构。这两种算法都是线性的,且适用于任意复杂图像区域,生成的围线树结构是一棵以围线类为节点的双向指针树。 2、研究了正方形点阵上二值图像的几种链码之间的相互转换算法。包括Freeman缝隙码与顶点链码之间的相互转换算法,四方向Freeman链码与顶点链码之间的相互转换算法和八方向Freeman链码与顶点链码之间的相互转换算法。这样只要获得一种链码就可以得到其它的链码表示,由某种链码获得的图像信息也为其他链码所共享。 3、分析研究并发展了基于Freeman链码、缝隙码和顶点链码的区域填充算法。算法包括一种基于Freeman链码的区域填充算法、一种基于缝隙码的区域填充算法、一种基于顶点链码的区域填充算法和一种新的奇偶点配对的区域填充算法。还给出了算法的复杂度分析,并与现有的填充算法进行了实验和比较,实验结果表明这些新算法的速度优于现有算法,特别对多连通或整幅图像填充时,由于不对区域内部孔洞填充,算法运行速度有很大提高。 4、利用区域边界的顶点链码表示,给出了计算边界点坐标和边界上任意两点之间的欧氏距离的坐标标定自动机,还给出了计算图像几何矩和图像Euler数的算法。 5、给出了一种表格文档图像的倾斜校正和表格单元格的实时识别算法,在图像倾斜校正和表格单元格识别算法的基础上,给出了一个基于图像的填表系统的设计与实现方法。

巨志勇[6]2007年在《基于动态系统计算的数字图像处理》文中提出数字图像本质是2-D矩阵,其处理方法是进行各种图像变换。从这种角度来说,图像可以认为是一个动态离散系统,因此动态系统理论在图像处理问题中有着广泛应用。本文的研究对象是黑白二值的文档图像。研究内容是将动态系统的自动机理论与图形链编码理论相结合,构建了基于图像边界链码的自动机,实现了若干图像算法,并解决了二值图像处理中的一些实际问题。作为自动机的应用,本文还研究了交通问题中的自动机模型。最后本文编制了基于图像和文字信息分离的表格文字填写识别软件。本文的研究成果如下:1.将自动机理论与图像处理中的链编码理论相结合,创建了基于八方向Freeman链码的边界自动机,定义了状态映射关系,研究了边界自动机在二值图像中的实现算法。2.将图形学中的栅栏算法移植到基于Freeman链码的边界自动机中,提出了一种新的基于链码的自动机区域填充算法。利用自动机运行得到的边界链码,通过对边界上的左右端点到栅栏间的像素取补来填充区域。算法能填充任意复杂图像区域,不需要辅助内存空间和标记边界色。3.在研究二值图像边界的单向标记和双向标记算法基础上提出了完整的边界标记规则。该规则不仅考虑图像区域的左右边界,还考虑了上下边界因素,是一种更加完善的边界点标记分类方法。基于本文边界标记规则提出了一种快速求取图像行长度的算法。根据自动机进行图像边界标记时的跟踪方向,确定图像区域的左右边界,快速求得封闭区域每一行的长度。本文还应用图像行长度算法进行了图像面积和图像矩的快速计算。4.在对现有表格软件分析的基础上,提出了一种新的表格填写识别软件的设计方案。设计思想是将原始表格通过扫描仪输入成为数字图像,把所填内容以图像处理中的文字添加方式填入到图像中。本软件可以很好地解决将填写信息打印在原始表格上的难题。软件定义了一种高效的图像和格式化文字混排的文件格式,保存时将图像和文字信息分离存储。填写类似表格时,只需修改填充文字就可以实现表格数据的更新。5.应用边界自动机研究了表格图像单元格的识别算法,并进行了二值表格图像倾斜校正算法的设计。本文开发的软件中将两种算法加以了实现,在实际应用中表现良好。

张圣希, 张薇, 李国强, 顾国庆[7]2004年在《利用顶点链编码探测表格的斜率》文中指出根据表格图像中表格的框线或悬线具有最长的边界,以及边界标定自动机能获得区域边界的优点,提出了一种新的表格图像文件倾斜矫正的方法.该方法使用简便,而且在大噪声的背景下也能使用.

陈优广, 顾国庆, 张薇, 许彦冰[8]2006年在《一种新的表格单元格矩形识别算法》文中认为现有的表格识别算法速度较慢,且仅能容忍表格线的微小断线,文章给出了基于顶点链编码的表格单元格矩形识别算法,利用边界标定自动机,标定表格单元格内环边界并生成顶点链编码,利用顶点链编码特性,有效地去除表格框线上的锯齿,修复断裂的框线,通过搜索单元格矩形4个角的顶点链编码来获得表格单元格的矩形区域。实验证明本算法具有速度快、鲁棒性高、抗表格框线断裂等优点。

王涤琼[9]2005年在《对利用边界标定自动机进行文档图像分析的研究》文中指出文档图像分析是光学字符识别(OCR)技术的重要组成部分。本文在对顶点链编码深入研究的基础上,设计并实现了利用边界标定自动机进行文档图像倾斜校正、版面分析及连通体几何特征提取的方法。边界标定自动机是一套能对数字图像中的目标对象进行边界标定并生成对应的顶点链编码的技术,作者首次将这一技术应用于文档图像分析,其中,根据输出的顶点链编码得到文档图像中所有连通体的外接矩形并相应进行对整幅图像的文本行判断以实现倾斜角度探测和版面分析均属本文的创新之处。同时,作者通过大量实验,证明了本算法在实际应用中的可行性和有效性。

王玲[10]2007年在《链编码的获取和文档图像的版面分析》文中研究指明链编码是数字图像处理领域中重要的工具,它将二维的数字图像通过一维的编码表示,大幅度减少了存储空间,各种链编码的优良特性也给数字图像处理和分析带来了便利。获得图像的链编码表示是图像处理和分析中的一个关键步骤,本文详细介绍了几种常用的链编码,并提出了一种新的标记方式用于边界跟踪,解决了在边界跟踪时可能出现的漏跟踪和重复跟踪的问题,在边界跟踪的同时可以获得多种链编码表示,避免了在实际应用时需要使用不同的链编码,必须在多种链编码之间进行转换的问题。区域填充也是图形图像学中的一个基本课题,本文提出了一种基于链编码的区域填充方法,该方法可以避免对多连通区域重复填充,提高了填充的效率;同时也对各种多边形扫描转换的方法进行了研究,在此基础上提出了一种新的方法,通过实验比对了各种方法的优缺点。文档图像的版面分析是光学字符识别(OCR)的一个重要步骤,本文在获取边界链编码的基础上,通过分析区域的链编码特征,首先探测文档中的矩形框线、直线,框线和直线的特征相对文字更容易提取,且更准确,因此,在这种情况下优先分析框线和直线可以迅速定位文档倾斜角度;在无法找到合适的框线和直线的情况,则从文字进行倾斜角度探测,通过文字之间的角度差寻找相邻文字,确定角度。通过大量的实验证明,这种方法是可行和有效的。在得到倾斜角度校正文档后,利用文档中的区域间隙和段落缩进划分文章段落,进行版面分析。

参考文献:

[1]. 基于顶点链编码的表格图像分析[D]. 李国强. 华东师范大学. 2004

[2]. 利用顶点链编码探测表格图像斜率[D]. 张圣希. 华东师范大学. 2005

[3]. 基于链编码的棋谱识别算法研究[D]. 黄穗. 华东师范大学. 2007

[4]. 自动机和链编码的理论研究与应用[D]. 张薇. 华东师范大学. 2006

[5]. 边界跟踪、区域填充及链码的应用研究[D]. 陈优广. 华东师范大学. 2006

[6]. 基于动态系统计算的数字图像处理[D]. 巨志勇. 同济大学. 2007

[7]. 利用顶点链编码探测表格的斜率[J]. 张圣希, 张薇, 李国强, 顾国庆. 华东师范大学学报(自然科学版). 2004

[8]. 一种新的表格单元格矩形识别算法[J]. 陈优广, 顾国庆, 张薇, 许彦冰. 计算机工程. 2006

[9]. 对利用边界标定自动机进行文档图像分析的研究[D]. 王涤琼. 华东师范大学. 2005

[10]. 链编码的获取和文档图像的版面分析[D]. 王玲. 华东师范大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  

基于顶点链编码的表格图像分析
下载Doc文档

猜你喜欢