彩色照片中日期文字的提取与识别

彩色照片中日期文字的提取与识别

朱曦[1]2004年在《彩色照片中日期文字的提取与识别》文中研究表明照片中的日期标记是一种可供检索和查询的重要信息。照片中的日期标记属于视频和图像中的文字。近年来,视频及图像中文字的检测和识别问题是基于内容检索中的一个热点问题。视频和图像中的文字可以分为场景文字和人工添加文字,照片日期标记即为一种特殊的人为添加的文字。照片日期标记与传统的视频图像文字不同,它一般不具有清晰的边缘,固定的颜色,和等同的距离。这致使传统常用的基于颜色聚类的方法、基于边缘与纹理分析的方法不一定有效。本文提出了一种从彩色照片的复杂背景下定位并分割日期标记的方法。首先利用一个基于颜色的两步定位算法,利用增强了的R分量R1信息同时在照片四个角区域进行搜索以确定出四个可能包含日期的候选矩形区域。然后分析以其他参数增强的R分量R2的高斯平滑直方图,认为直方图的最后一个峰包含了日期标记的像素,找到其左侧的谷,将这四个候选区域内图像二值化。在提取这四个区域R分量的较强边缘图后与前边得到的二值化图像进行联合操作从而去除非标记像素及部分噪声的影响,使日期标记更突出。在联合图像中采用由粗到细的方法进行分割,然后又由日期的字符数目,字符在一定范围内横向排列以及字符高度相近等启发式信息,可以最终将日期字符串精确定位出来。找到日期字符串所在位置后,可以利用投影法,将其细化图像分割成单个的字符,送入识别模块。识别时,根据不同位置处的笔划数目信息,提取一个15维的特征矢量。最后利用最小加权欧式距离法,将日期字符分类识别,转换成文本字符形式。实验表明,论文中所述各个算法能有效地对日期进行定位、分割和识别,为这一新领域提供了研究基础和有效的解决方案。

赵振宇[2]2016年在《偏微分方程学习模型的算法研究及其在图像处理中的应用》文中研究表明机器学习的算法能指引计算机在海量数据中挖掘有用价值,如何将传统偏微分方程图像处理方法与先进的机器学习方法融合并处理高层视觉问题具有非常大的潜在应用价值和挖掘空间。本文试图将机器学习的思想应用到偏微分方程图像处理中,即建立了偏微分方程学习模型,通过训练数据学习偏微分方程的模型进而处理视觉任务。本文主要从建模、算法设计与分析、应用叁方面对机器学习和偏微分方程图像处理的融合进行了系统研究。具体而言,本文的主要贡献如下:1.提出了一个快速交替时间分裂方法求解现有的偏微分方程学习模型,成功解决了Liu等人提出的梯度下降(GDM)求解方法所面临的难题。通过最小化每个时刻方程的输出与期望输出之间的误差来求解系数函数,不仅避免了梯度难以求解的问题,还使得模型可以适应不同正则化条件或约束控制条件。2.提出了一个针对彩色图像任务的紧致有效偏微分方程学习模型,解决了原有模型扩展到彩色图像后过于复杂且难于求解的问题。首先去除了已有偏微分方程学习模型中关于指示函数的方程,并对线性组合系数添加了L1正则约束项;然后利用近端算法对模型进行求解,并对算法的收敛性和收敛速率进行了相关研究。3.将偏微分方程学习模型应用到高层次视觉处理问题中,即自然场景中的文本检测。基于偏微分方程学习模型,提出了一种同时包含自顶向下和自底向上处理过程的鲁棒混合方法。通过偏微分方程学习模型给出一个文本置信映射,并通过这个置信映射检测出文本候选区域,去除了大部分复杂背景,从而使得进一步的检测变得更加容易和准确。4.将偏微分方程学习模型应用到另一个高层次视觉处理问题:人脸识别。提出了一种新的基于偏微分方程学习模型的特征选择方法,其提取的特征保持了旋转和平移不变性,而且对于光照的变化也更加鲁棒。在四个公开标准人脸识别数据库上同目前最先进的方法进行了比较,都取得了较好的实验结果。

刘吉刚[3]2007年在《视频文字识别技术的研究》文中研究表明文字识别作为模式识别的一个重要分支,愈来愈受到人们的重视。而随着图像和视频信息的迅速增长,如何利用图像和视频中所包含的文字信息建立基于内容的图像信息索引成为一个非常有意义的课题。视频是由一帧帧图像所构成的,为了识别视频信息中所包含的文字,首先根据视频以及图像处理的相关知识对视频文件进行预处理,这些处理包括利用DirectShow提取视频文件中的关键帧、利用图像变换将彩色图像变为灰度图像、灰度均衡、二值化以及去噪声等。在预处理的基础上给出了一种区分中英文与粘连文字分割的算法,先分割出文字行,然后把行文字根据算法切分成单个文字,以利于对每个文字进行特征的提取或是依据已知文字的特征来对视频图像中的文字进行识别。分割算法还根据中文和英文的不同特点先区分出中文与英文,然后分别对英文与中文进行不同的处理。对分割后文字的识别采用人工神经网络技术中的BP(Back-propagation)算法。针对BP算法存在的不足,给出一种改进的BP算法。该算法主要通过调整BP算法中sigmoid函数倾斜度α来改善BP算法。如果α取值过大,各层的输出0或1被离散,学习效果变差,反之其值选择过小,系统线性化变强,非线性能力被削弱,所以最佳值是介于两者之间。利用改进后的倾斜度得到的激励函数,使计算结点的sigmoid函数的倾斜度可以在训练的过程中逐渐调整到最优值。在普通的PC(Personal Computer)机上对包含宋体的视频图像进行识别的试验结果表明,识别的准确率比较理想。

陈笑[4]2017年在《证件图像定位与信息提取技术的研究与应用》文中指出“互联网+”时代,以互联网金融为代表的互联网产业得到迅速发展。与此同时,由网络虚拟化带来的潜在安全问题日益严峻,实名制成为一种控制风险的有效手段。网络实名制的方式一般是对用户进行以身份证为主的证件信息认证。在众多互联网应用中,如在线支付、跨境物流等,实名认证的方式是由用户上传如身份证等证件的照片,然后提取并记录照片中的证件信息。用户上传的证件照片可能具有比较复杂的背景,还可能存在倾斜和透视失真等,对信息提取造成困难。因此,需要先将证件在照片中定位并提取出来,再进行信息提取。基于以上背景,本文研究自然场景下的证件图像定位技术,并对规范化后的证件图像进行信息提取和识别。论文的主要工作包括:1.提出一种基于Hough变换的证件定位方法。利用证件形状特征,通过Hough直线检测、Hough圆检测技术实现对证件区域的定位,并利用haar人脸检测对定位结果进行检验。2.提出一种基于局部特征匹配的证件定位方法。首先利用证件的固定提示性文字提取证件模板,然后通过图像与证件模板的局部特征匹配实现对证件区域的定位,并利用haar人脸检测对定位结果进行检验。3.提出一种方法融合的证件定位方案。将以上两种证件定位方法进行融合,进一步提高证件定位的准确率。4.提出一种证件信息提取方法。首先利用证件信息相对位置的先验知识对证件信息进行粗分割,然后通过交替使用二值化和投影法实现证件信息的细分割和二值化。另一方面,充分利用证件信息的先验知识对OCR引擎进行优化,并对文字识别结果进行修正。5.设计并实现了一套证件定位和信息提取系统。对证件定位技术和证件信息提取技术进行整合,并加入图形用户界面和数据库,实现了具有实用价值的证件定位和信息提取系统。本文重点研究了证件图像的定位技术和信息提取技术,设计并实现了有效的证件定位和信息提取系统,为自然场景下图像的证件定位和信息提取课题提供技术方案。

王克如[5]2005年在《基于图像识别的作物病虫草害诊断研究》文中研究说明本文围绕作物病虫草害的快速诊断,将作物病虫草害识别的专家知识与数字图像处理、神经网络结合,综合运用人工智能和网络技术,研究实现了作物病虫草害的远程图像识别与诊断。取得以下进展: 1.图像预处理方面,针对作物病虫草害的图像特点,分析、比较了病虫草害图像的增强处理方法,提出了对彩色图像先进行反色运算,再通过RGB通道分离,得到增强图像的新方法,与传统图像增强算法相比,此法简单易行,运算量小,并具有较强的消除噪声能力。 2.图像分割方面,根据病害图像特点,提出通过H分量图像灰度分析来确定阈值对灰度图像分割的方法,分割精度明显高于传统的自动阈值分割结果;对病害彩色图像分割时,用HIS颜色系统中的H分量图像分割效果最好,其次是RGB颜色系统中的红色分量图像所做的分割。并提出B分量图像对光照更为敏感,适合处理在光线较暗条件下获取的图像或病斑与非病斑区域明暗差别较小图像的分割;提出了用提取轮廓分割识别目标图像的新方法,即先对病害图像作反色运算,对得到的图像进行二值化后,再进行腐蚀运算,对其结果作轮廓提取,可消除全部噪声。与传统轮廓提取方法相比,分割更为准确,几乎没有噪声。提出了对在叶片上造成孔洞图像进行分割的有效方法,即轮廓提取加种子填充技术。该方法可有效消除除叶脉外的各种背景噪声。提出了用模糊判别的自动阈值法与手工补选样点修正阈值法相结合的图像分割方法,实现了对有其它植物叶片为背景的杂草图像的正确分割。 3.在图像特征提取方面,提出使用RGB颜色系统的B/R、色度坐标b、b/r值及HIS彩色系统中的色调、饱和度、亮度值作为作物病虫草害图像识别与诊断的关键特征;研究并建立了6组叶片颜色特征与叶片绿度值(叶绿素含量)的定量预测模型,预测叶绿素含量误差在7.8-13.65%之间,用b/r与叶绿素b含量间的模型y=0.8058x+1.2403(R~2=0.8056~(**))对叶绿素b的预测精度超过90%,可以图像诊断的方法改进传统的作物病虫为害分级调查方法与指标,建立病虫为害分级的新指标与新方法。首次以纹理特征中能量值、熵及惯性矩作为作物病虫草害图像识别与诊断的重要特征,以单个特征识别无病斑叶片的正确率达100%,对有病斑叶片的正确识别率达90%;综合应用叁个纹理特征,识别有病斑叶片的正确率达100%;提出以这些特征作为病斑图像分割的判据(阈值)。病斑的圆形度可作为病斑形状差异较大的病虫害图像初步诊断的形态特征;杂草叶片的长宽比可作为对窄叶与阔叶杂草的图像识别特征,结合颜色特征可对杂草进行更为细致的分类识别。 4.构建了基于图像识别的、具有32个特征参数的作物病虫草害图像识别特征数据库。并利用构建的玉米病害图像识别神经网络成功地实现了作物病虫草害的仿真识别与诊断,对玉米6种叶部病害图像的自动识别平均正确率达98.3%。 5.对基于图像识别的作物病虫草害诊断系统与作物远程诊断系统集成,实现了基于网络的作物病虫草害的图像识别与诊断。

董慧云[6]2017年在《基于社交网络图片元数据分析的旅游目的地形象测量研究》文中研究指明随着时代的进步和发展,旅游作为一种休闲方式融入人们的日常生活,摄影活动是游客获得旅游体验并进行信息传播的主要方式。随着互联网技术的快速发展,传统的拍照的方式从根本上发生了改变,用户可以通过拍摄设备进行照片的分享和互动,将筛选或加工过的照片上传到各种在线共享服务网站,社交网络图片成为旅游目的地形象传播的主要渠道之一。随着多媒体数据的增多,海量的网络数据为科学研究提供了更加丰富的样本,通过获取网络数据,对网络文本进行分析成为新兴的研究渠道。在旅游目的地的形象测量中,传统的测量方法仍然占据主要地位,结构性测量及非结构性测量无法在图片测量中提供准确的测量指标。传统基于图片的旅游目的地形象研究主要通过雇佣拍照法获取研究样本,图片的测量内容的分类仍以人工识别与编码为主,并且现有的相关研究较少,无法以海量网络图片为样本快速、有效、准确的进行数据的处理及目的地形象的提取。针对以上问题本研究以认知心理学及形象结构理论为指导构建了基于图片元数据的旅游目的地形象测量框架,并采用Flickr上的图片元数据为样本提取了北京旅游目的地形象。主要依据图片元数据的中名词相关词汇进行了认知形象的提取,形容词相关词汇进行了情感形象的提取,此外对部分抽样图片内容进行了情态的分析,加之其他可用元数据获取了北京的整体旅游目的地形象。研究过程运用人工与计算机技术相结合的手段,在数据提取、筛选等方面运用大数据分析方法,力求使测量结果更加客观,使此测量方法具有可信性、可操作性及简便性。最终,为基于图片的旅游目的地形象分析提供了一个新的研究角度,进一步扩宽了旅游目的地形象测量路径,为今后的相关研究提供了参考。

吴黎[7]2006年在《人像照片背景替换方法研究》文中研究指明人像照片背景替换技术是在人像照片中,运用彩色图像分割技术对照片进行处理,提取人像并分离背景,将分离的背景替换成其他颜色或者其他背景,它广泛应用于人事、公安、海关等部门的证件录入系统、照片更新系统,影像处理系统等。 在分析比较大量彩色图像分割算法的基础上,本文将一种改进的模糊聚类方法(FFCM)运用于人像图像分割。这种方法先利用分层聚类把图像数据分成一定数量的色彩相近的子集,再利用子集中心点和分布密度对图像进行模糊聚类。然后,本文提出了人机交互方式的人像目标提取方法。这种方法旨在能够准确地还原模糊分类后的人像目标,并使背景部分替换成其他颜色。为了达到自动的背景替换的效果,本文将一种基于YCb'Cr'空间的人脸肤色检测算法运用于人像目标提取。最后,在分析现有的图像合成算法的基础上,本文设计了一种新的数据融合法将两种不同的合成算法结合起来,最终使人像目标与背景图像有机的合成在一起,从而实现人像照片的背景替换。

冀翠萍[8]2008年在《基于内容的图像分类研究》文中指出随着计算机网络技术和通信技术的快速发展,网络学习资源呈现多媒化、智能化的发展趋势,多媒体资源库和数字图书馆的建设成为时代的需要。图像作为一种重要的媒体资源形式,具有形象直观、具体生动的特点,在教育教学实践中扮演着越来越重要的角色,但是由于现有的资源库没有对图像资源进行有效的管理和分类,使得用户在寻找资源时出现了费时费力却又没有找到所需资源的情况,因此如何对图像资源进行有效的分类,以更好的服务于信息化教学成为亟待解决的问题。本论文以服务教育资源库建设为目的,依据对图像进行内容分析的思路,对数字图像进行了基于内容的分类研究。首先通过对100,000张数字图片的观察和调研,建立了视觉和语义相结合的图像分类体系,并且按照层级分类的方法,就每类图像的概念进行界定,对可用的视觉特征进行分析,为以后的图像分类实验提供了框架和依据。其次,论文针对待分类图像的实际情况,提出了可用有效的视觉特征描述子,包括:颜色通道距离、颜色聚类后的丰富度、小波二层分解下的均方差、分形维数等,并就每种特征描述子的算法和具体应用结果进行了介绍。再次,在提取图像特征的基础上,利用阈值分类和支持向量机模糊分类两种主要方法,对绘制类/拍摄类、线条画/油墨画、简笔/素描、国画/油画等进行了分类实验,提出了6种可用的分类方法,达到了较高的分类准确率和正确率,并就每种分类实验的结果进行分析,指出误分类的原因,提出可行的改进方向,在此基础上把基于内容的图像分类研究应用到教育视频镜头的分类中,进行了近景/远景分类实验,取得了比较满意的结果。最后,本文以网站形式呈现课题研究的成果,建立了“基于内容的数字图像分类网站”,设置了7个版块的内容,用于展示分类体系、分类示例图像和课题研究的最新进展,方便与同行的沟通和交流。本文基于Windows XP操作系统,以VC++ 6.0为开发平台,结合Matlab 6.5数据仿真工具,开发了“基于内容的图像分类系统”,以Dreamweaver 8.0为界面设计和框架搭建工具,利用ASP为程序实现语言,制作了“数字图像分类体系建设研究”网站,图像分类实验取得了较高的准确率,分类网站得到了较好的推广和应用。研究结果表明,对图像资源进行内容层次的分类,不仅将人力从资源建设中解放出来,而且避免了资源的重复建设,保证了资源属性标注的客观性,有利于资源的跨平台、跨地区共享,从而为教育资源库的有效建设提供了有力保障,更好的为我国的教育信息化工作服务。

陈鼎[9]2017年在《基于Matlab的车牌识别系统的研究》文中研究指明车牌识别技术(Vehicle License Plate Recognition,VLPR)是通过计算机对车牌图像进行识别分析,进而确定车牌号码的计算机技术,也是智能交通系统的前端技术。本文研究分析了该技术的各部分所使用的相关算法,并比较了的优缺点,根据需求确定了各部分算法,并使用MATLAB语言进行编程,实现了系统中图像预处理、车牌定位、字符分割和字符识别的具体功能,完成了车牌识别系统软件设计。1、在图像预处理部分,先把通过摄像机得到的照片处理为灰度图,处理过程使用了加权平均法,减少了计算量,提高了程序的运行速度;然后对图像中车牌部分和背景部分灰度差别不大的的状况,对图像实行了灰度拉伸的处理和图像的平滑处理。最后利用Roberts算子提取车牌边缘。2、在车牌定位部分,对图像进行了腐蚀运算和闭运算,去除了图像中杂乱且无意义的微小部分,保留了图像的主要特征,然后再分别从水平方向和垂直方向对图像的投影,找到车牌位置;之后通过Radon变换校正了倾斜车牌。3、在字符分割部分,根据车牌上字符所占据的宽度、高度、字符和字符之间的间隔以及字符与车牌边框的间隔等数据,对车牌进行纵向的投影,并根据投影结果,把牌照切分为单独的字符,在对字符的归一化处理中,使用了双线性插值算法。4、在最后进行字符的识别部分,分别采用了两种算法,一种是模板识别法,略微修改了字符所提取的特征;另一种近年来较为流行的是神经网络识别法。对两种算法的结果进行对比分析,神经网络识别法较模板识别法在各方面的效果都更好。

王小丽[10]2016年在《基于OPENCV的身份证图像信息提取研究与实现》文中认为随着计算机图像处理、分析和理解,为了识别各种不同型号的目标和图像的技术日益成熟,身份证识别成为可能。身份证是公民的一张名片,它由政府机构赋予给公民并作为每个人独一无二的公民身份的证明工具。身份证上的身份证号码存储了公民的信息,身份证号是唯一的,在众多生活和工作的场合中都需要到身份证号。可用于各行各业比如应用于公安系统、银行系统、交通系统等需要验证身份证号的机构,身份证识别系统相比于人工来说最大的优势是准确、高效和安全。目前对于未获得公安机关授权的机构对身份证信息的采集基本还是人力输入身份证号,这样做工作效率非常低,输错数字的可能性比较大。因此开展基于图像处理与分析的身份证信息提取具有非常广泛的实际应用价值。我国二代公民身份证号码是一个字符组合码,由十七位码和一位数字验证码组成。从左至右的顺序如下:六位表示出生的本机代码,八位数字表示出生日期码,叁位码的顺序和一个校验码。论文借助OpenCV进行身份证信息处理与分析的相关研究,论文主要内容包括身份证图像的预处理、身份证图像区域分割和字符分割以及身份证号识别叁个方面,并在论文相关研究的基础上设计和实现了身份证信息提取的系统原型。1)针对身份证图像偏暗或偏亮问题,进行图像的灰度变换、灰度拉伸、二值化、图像归一化、图像校正以及图像去噪,以保证采集的身份证图像可以在一个比较理想的状态下,有利于后续识别精度的提高。2)针对身份证具有特定的版面布局结构,利用形态学的膨胀算子进行连通域的初始寻找,然后利用轮廓提取和标记策略进行连通域的划分,最终将获得的连通域运用于身份证图像的区域分割;同时对分割出来的身份证号区域利用灰度化、二值化、膨胀操作等一系列操作后完成字符的切分。由于分割出的字符区域具有字符大小不同的情况,最后将图像中的字符一个一个取出来并且归一化成指定大小的字符模板,以便提高系统识别性能的稳定性,并较好的克服图像噪声带来的影响,为字符识别做准备。3)针对论文研究主要是为获取身份证上的身份证号和人像信息,论文利用模板匹配的方法进行了身份证号的识别研究。首先根据数字图像特征编写数字字符库,并利用模板匹配的方法识别,通过字符的归一化处理与模板样本字符相关的遍历处理,最终识别出字符。由于身份证号码仅有11个,且大小字体固定,所以模板匹配识别算法相对于身份证而言是非常合适的,实验也表明了本算法的可行性。4)鉴于上述研究,实现了基于摄像头或照相机采集身份证图像下的第二代身份证号识别系统的软件原型,主要包括了预处理模块、区域分割模块和字符识别模块。

参考文献:

[1]. 彩色照片中日期文字的提取与识别[D]. 朱曦. 清华大学. 2004

[2]. 偏微分方程学习模型的算法研究及其在图像处理中的应用[D]. 赵振宇. 国防科学技术大学. 2016

[3]. 视频文字识别技术的研究[D]. 刘吉刚. 华中科技大学. 2007

[4]. 证件图像定位与信息提取技术的研究与应用[D]. 陈笑. 北京邮电大学. 2017

[5]. 基于图像识别的作物病虫草害诊断研究[D]. 王克如. 中国农业科学院. 2005

[6]. 基于社交网络图片元数据分析的旅游目的地形象测量研究[D]. 董慧云. 北京第二外国语学院. 2017

[7]. 人像照片背景替换方法研究[D]. 吴黎. 浙江工业大学. 2006

[8]. 基于内容的图像分类研究[D]. 冀翠萍. 山东师范大学. 2008

[9]. 基于Matlab的车牌识别系统的研究[D]. 陈鼎. 南昌大学. 2017

[10]. 基于OPENCV的身份证图像信息提取研究与实现[D]. 王小丽. 苏州大学. 2016

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

彩色照片中日期文字的提取与识别
下载Doc文档

猜你喜欢