CN101299239A - 文字区域图像的获取方法及装置、文字识别系统 - Google Patents

文字区域图像的获取方法及装置、文字识别系统 Download PDF

Info

Publication number
CN101299239A
CN101299239A CNA2008101144762A CN200810114476A CN101299239A CN 101299239 A CN101299239 A CN 101299239A CN A2008101144762 A CNA2008101144762 A CN A2008101144762A CN 200810114476 A CN200810114476 A CN 200810114476A CN 101299239 A CN101299239 A CN 101299239A
Authority
CN
China
Prior art keywords
unit
image
character
images
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101144762A
Other languages
English (en)
Other versions
CN101299239B (zh
Inventor
王磊
邓亚峰
黄英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongxing Technology Co ltd
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN2008101144762A priority Critical patent/CN101299239B/zh
Publication of CN101299239A publication Critical patent/CN101299239A/zh
Application granted granted Critical
Publication of CN101299239B publication Critical patent/CN101299239B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种文字区域图像的获取方法,包括:对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;获取所述文字区域图像。本发明还提供一种文字区域图像的获取装置及文字识别系统。本发明的实施例提供的技术方案通过对文字检测结果的验证,降低文字检测的误检几率。

Description

文字区域图像的获取方法及装置、文字识别系统
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字区域图像的获取方法及装置、文字识别系统。
背景技术
文字识别进程主要包括,从拍摄文字资料所形成的图像上提取文字内容所对应的文字区域图像,基于提取到的文字区域图像,进行文字识别,获取具体的文字内容。
参见图1,图1是现有文字识别系统的结构示意图。图1中,文字检测模块检测出单帧图像上的文字区域图像,之后由图像处理模块对检测到的文字区域图像进行图像的质量优化处理,如采用滤波技术滤除噪声,后续再由文字识别模块基于文字识别技术对文字区域图像进行识别处理,得出文字信息。
其中,在文字检测环节,文字检测模块基于现有文字检测技术能够从被检测的图像上将文字区域界定出来,获取到文字区域图像。由于噪声或其他因素的影响,会出现误检的情况,即获取到的文字区域图像中实际并不包含文字内容。文字检测环节出现的误检一方面浪费硬件资源,另一方面可能因文字识别错误而导致相关联环节的出错或损失。
为降低文字检测的误检几率,一些场景中,采用高清晰数码相机、扫描仪等等设备,为文字识别装置提供待检测的图像。相对来讲,由于待检测的图像较理想,因此,文字检测模块出现误检的几率被降低。
但是,一方面,由于高清晰数码相机及扫描仪等成像设备的成本较高,一些情况下难以及时获取到这些高成本设备;另一方面,即使采用高成本成像设备,但由于现有文字识别进程中,用于获取文字区域图像的文字检测环节只根据对单帧图像的检测即给出检测结果,而文字检测本身受干扰因素的影响较大,因此误检几率仍较大。
因此,现有文字识别进程中,获取文字区域图像的方案尚有待改进。
发明内容
本发明的目的在于提供文字区域图像的获取方法及装置、文字识别系统,确保文字检测环节获取到的图像为包含文字内容的文字区域图像。
本发明提供一种文字区域图像的获取方法,包括:
对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
获取所述文字区域图像。
优选地,所述比对处理之前,该方法包括:
将所述至少两个候选文字区域图像调整到相同尺寸。
优选地,进行比对处理包括:
利用预设算法,计算所述至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预设;
计算每两个图像特征参量的值之间的差值。
优选地,确定所述至少两个候选文字区域图像属于所述文字区域图像包括:
所述至少两个候选文字区域图像中,两两图像特征参量的值之间的差值在所述预设范围之内。
优选地,获取所述文字区域图像包括:
从所述至少两个候选文字区域图像中选择一个或多个候选文字区域图像用作所述文字区域图像。
优选地,确定所述至少两个候选文字区域图像属于所述文字区域图像之前,该方法进一步包括:
从未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字区域图像中的任意一个候选文字区域图像所存差异最小的区域,用作搜索区域。
优选地,所述未参与所述文字检测的一帧目标图像为所述一个候选文字区域图像所在目标图像的下一帧。
优选地,搜索出所述区域,用作搜索区域包括:
利用预设算法,计算未参与所述文字检测的目标图像中,多个指定区域的图像特征参量的值;所述图像特征参量被预设;
计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的值之间的差值;
选出与所述一个候选文字区域图像的图像特征参量的值之间的差值最小的指定区域,用作所述搜索区域。
优选地,计算所述多个指定区域的图像特征参量的值包括:
预设大小小于或等于所述未参与所述文字检测的目标图像的大小的搜索窗,且所述搜索窗在该目标图像内;
分别计算所述搜索窗内,与所述一个候选文字区域图像大小相同的各个指定区域的图像特征参量的值。
优选地,获取所述文字区域图像包括:
选择所述搜索区域用作所述文字区域图像。
本发明提供一种文字区域图像的获取装置,包括:文字检测单元、比对处理单元、筛选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像。
优选地,所述装置进一步包括:尺寸调整单元,用于将比对处理单元处理的至少两个候选文字区域图像调整到相同尺寸。
优选地,所述比对处理单元包括:参量值计算单元,差值计算单元;其中,
所述参量值计算单元,用于利用预设算法,计算比对处理单元处理的至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预先设置;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每两个图像特征参量的值之间的差值。
优选地,所述筛选单元包括:判决单元和判决结果处理单元,其中,
所述判决单元,用于根据所述比对处理单元的比对结果,判断至少两个候选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;
所述判决结果处理单元,用于根据所述判决单元的判断结果,判断所述至少两个候选文字区域图像中是否包含文字内容。
优选地,所述判决结果处理单元包括:结果获取单元和确定单元;
所述结果获取单元,用于获取所述判决单元的判断结果;
所述确定单元,用于在结果获取单元获取到的判断结果为肯定时,确定所述至少两个候选文字区域图像中包含文字内容。
优选地,所述判决结果处理单元包括:结果获取单元、搜索单元和结果处理单元;
所述结果获取单元,用于获取所述判决单元的判断结果;
所述搜索单元,用于在结果获取单元获取到的判断结果为肯定时,从搜索未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字区域图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜索区域;
所述结果处理单元,用于在结果获取单元获取到的判断结果为肯定以及在所述搜索单元搜索到所述搜索区域时,确定所述至少两个候选文字区域图像中和/或所述搜索区域对应的图像中包含文字内容。
优选地,所述搜索单元包括:定位单元、参量值计算单元、差值计算单元和选择单元,其中,
所述定位单元,用于指定未参与所述文字检测的目标图像中的多个指定区域;
所述参量值计算单元,用于计算所述定位单元定位出的各个指定区域的图像特征参量的值,以及所述一个候选文字区域图像的图像特征参量的值;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的值之间的差值;
所述选择单元,用于根据所述差值计算单元的计算结果,选择所述搜索区域用作所述文字区域图像。
本发明提供一种文字识别系统,包括:存储器、文字区域图像的获取装置、文字识别器和输出单元;
所述存储器,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像;
所述文字区域图像的获取装置,包括:文字检测单元、比对处理单元、筛选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像;
所述文字识别器,用于根据所述文字区域图像的获取装置获取到的所述文字区域图像,识别出所述文字内容;
所述输出单元,用于将所述文字识别器识别出的文字内容输出。
本发明提供的上述技术方案,文字检测操作对至少两帧目标图像进行文字检测,并通过比对得到的至少两帧候选文字区域图像,确定相似程度,来对验证至少两帧候选文字区域图像上是否确实包含文字内容,若较相似,则可得出至少两帧候选文字区域图像上所包含的内容基本相同,基于文字检测,可得出至少两帧候选文字区域图像上确实包含文字内容,从而,确保通过文字检测获得的文字区域图像确实包含文字内容,排除文字检测所误检到的图像,降低文字检测的误检几率。
附图说明
图1是现有文字识别系统的结构示意图;
图2是一帧图像上文字检测界定出的文字区域分布示意图;
图3是本发明实施例一中的文字识别流程图;
图4是本发明实施例二中的文字识别流程图;
图5是本发明的实施例二中利用搜索窗W搜索Yt中与It-1相似的搜索区域的示意图;
图6是本发明的一个实施例中文字区域图像的获取装置的结构示意图;
图7是本发明的一个实施例中判决结果处理单元6032的结构示意图;
图8是本发明的另一个实施例中判决结果处理单元6032的结构示意图;
图9是本发明的一个实施例中文字识别系统的结构示意图。
具体实施方式
发明人提出获取文字区域图像的技术方案,以确保获取到的文字区域图像中包含文字内容,具体包括:文字检测过程对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;通常,每帧目标图像上会检测出多处包含不同内容的候选文字区域图像,但由于各目标图像是通过拍摄基本相同的场景得到的,因此,不同的目标图像上检测出的候选文字区域图像中可能包含相同的内容;而所谓候选是指候选文字区域图像上是否包含文字内容尚不确定,后续,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则说明被比对的候选文字区域图像较相似,包含的信息基本相同,又由于候选文字区域图像基于文字检测技术获得,因此,可确定该被比较的至少两个候选文字区域图像包含相同的文字内容,也即该至少两个候选文字区域图像属于包含文字内容的文字区域图像,获取确定包含文字内容的文字区域图像。
反之,若上述至少两个候选文字区域图像之间的差异,超出预设范围,则说明该被比较的至少两个候选文字区域图像上包含的信息差异较大,文字检测出现误检,被比较的候选文字区域图像也就不能被用作文字区域图像。
相比较现有文字检测环节中获取文字区域图像的做法,本发明的具体实施中,通过进一步验证文字检测结果是否确实包含文字内容,可有效降低文字检测环节的误检几率,获得确实包含文字内容的文字区域图像。
本发明在具体实现时,在比对处理环节,预设图像特征参量,并通过比对可能包含相同文字内容的多个候选文字区域图像的图像特征参量的值,来度量这些候选文字区域图像之间的相似性。
本发明的具体实施中,为进一步提高后续的文字识别效率,为文字识别环节提供优质的文字区域图像,在完成比对处理之后,若比对结果表示被比对的候选文字区域图像之间的相似性较好,则继续分析未参与比对处理的目标图像,搜索未参与比对处理的目标图像上与被比对的候选文字图像的差异最小的搜索区域,用作文字区域图像。
为使本发明的技术方案和优点更加清楚,下面将结合附图及具体的实施例作进一步详细描述。
实际应用中,基于拍摄对象上文字区域的分布可能是零散的,因此,针对一帧图像,文字检测过程界定出的文字区域通常有多个,参见图2,图2是一帧图像上文字检测界定出的文字区域分布示意图。图2中界定出的文字区域如I、J、K。为清楚表述本发明的具体实现方案,设目标图像中只有包含一个文字区域如I区域,而对于多个文字区域的实际情况,处理方式是类似的。另外,本发明的具体实施中,目标图像可以是时间间隔非常短的连续帧中的一帧,也可以是时间间隔相对较长的非连续帧中的一帧。
实施例一:
本实施例一中,被处理的目标图像是从多个目标图像中选出两帧图像。本实施例一中,设置的图像特征参量为图像的像素值。
参见图3,图3是本实施例一的文字识别流程图,该流程可包括以下步骤:
步骤301、对选出的每帧目标图像分别进行文字检测,得到两个候选文字区域图像。
该两个候选文字区域图像中可能包含相同的文字内容。
该步骤301中,文字检测过程基于现有文字检测技术实现,只是与现有技术不同的是,本实施例一的流程中,检测结果并不直接被用作确定包含文字内容的文字区域图像,而是需要通过后续的比对处理,来验证检测到的候选文字区域图像中是否确实包含文字内容。
步骤302、基于预设的图像特征参量为图像的像素值,算出能够用于度量两个候选文字区域图像的相似性的图像像素差值。
该步骤302中,对于各候选文字区域图像上各点的像素值,可基于现有技术得出。本实施例一中,设两个候选文字区域图像分别用I1、I2标记,设I1对应大小为R1的矩形框,I2对应大小为R2的矩形框。由于拍摄的远近距离不同,R1与R2的大小可能不同,因此,本实施例中,为避免因拍摄造成的候选文字区域图像的差别,基于现有图像缩放技术如插值技术,对I1和I2进行缩放处理,将I1和I2的大小均调整
实际应用中,也可将I1调整到R2的大小,或者将I2调整到R1的大小,总之,尽量保证两个候选文字区域图像大小基本相同即可。
进一步,基于以下误差计算式(1)计算I1与I2的差值,用d标记差值,
则, d ( I 1 , I 2 ) = Σ i = I h Σ j = I w | I 1 ( i , j ) - I 2 ( i , j ) | - - - ( 1 )
其中,h为R矩形的高度值,w为R矩形的宽度值。基于量度相同的坐标,给出I1与I2中,各像素点的像素值,如,I1(i,j)表示I1中,横坐标为j,纵坐标为i的像素点上的像素值,I2(i,j)表示I2中,横坐标为j,纵坐标为i的像素点上的像素值。基于以上计算式(1),算出I1与I2上像素值的差值d(I1,I2)。
实际应用中,也可采用其他误差计算式计算两个候选文字区域图像之间的差异。
步骤303、若像素差值超过预设范围,则执行步骤304,否则,执行步骤305。
本实施例一中,由于d(I1,I2)直接体现两个候选文字区域图像之间的差异程度,即d(I1,I2)越小,则差异越小,d(I1,I2)越大,差异越大,因此,预设范围可设为小于预设阈值,或可设置为大于一个最小阈值且小于另一最大域值,其中,各阈值可根据经验设置。
实际应用中,基于计算差值的计算式可能与式(1)不同,d(I1,I2)的含义可能不到,使得可能会出现d(I1,I2)越大,体现两个候选文字区域图像之间的差异越小,而d(I1,I2)越小,体现差异越大的情况,则预设范围可设为大于预设阈值,等等。根据实际情况,设置具体的比对方式。
步骤304、确定两个候选文字区域图像之间的相似性较差,所包含的信息并不相同,则丢弃候选文字区域图像,退出该流程。
实际应用中,可提示文字检测出错的信息。
步骤305、确定两个候选文字区域图像之间的相似性较好,包含相同的信息,从而获得确定包含文字内容的文字区域图像。
本实施例一中,选用I1和I2为文字区域图像。实际应用中,可选I1和I2中的任一个进行后续的优化处理。
步骤306、对两个文字区域图像分别进行图像质量的优化处理,并选出效果较优的文字区域图像。
该步骤306中,对于文字区域图像的优化处理可基于现有相关技术进行,如,可以使用时域中值滤波、均值滤波、最大值滤波或者最小值滤波赠强图像。如果图像像素的亮度低于背景物体,就可以使用最大值滤波,可以增强图像中文字与背景之间的对比,有利于后续文字识别过程的文字分割。反之,若文字区域图像像素的亮度高于背景物体,使用最小值滤波。如果既有文字像素的亮度高于背景物体又有文字像素的亮度低于背景物体的情况,就可以使用中值滤波或者均值滤波。
步骤307、利用文字识别技术,处理经过优化的文字区域图像,识别出相应的文字内容。
文字识别技术可采用光学字符识别(OCR)技术。
步骤308、将识别出的文字内容输出。
具体的输出方式可以文本形式或以声音形式输出。
实施例一的流程结束。
上述实施例一中,通过对文字检测出的两个候选文字区域图像作进一步的比对处理,来验证文字检测结果的正确性,在确定两个候选文字区域图像比较相似后,可获得确定包含文字内容的文字区域图像,而若两个候选文字区域图像比较相似性较差,则可确定两次文字检测结果并不相同,为避免对误检结果作进一步的文字识别处理,浪费资源,可丢弃本次的文字检测结果。
另外,实际应用中,可选出更多帧作为待检测图像,只是需要计算更多个候选文字区域图像的图像特征参量值,并可两两比较这些候选文字区域图像的相似性,选出满足要求的候选文字区域图像,而丢弃与其他文字区域图像相似性较差的图像。
实施例二:
本实施例二中,预设的图像特征参量为图像的色度。
参见图4,图4是本发明实施例二中的文字识别流程图,该流程可包括以下步骤:
步骤401的描述可参考上述步骤301的描述。
步骤402、基于预设的图像特征参量为图像的色度,算出能够用于度量两个候选文字区域图像的相似性的色度差值。
本实施例二中,色度差值的计算方式可参考上述实施例一中,像素差值的计算,所不同的是,代入计算式(1)的值为两个候选文字区域图像上各点的色度值,如,I1(i,j)表示I1中,横坐标为j,纵坐标为i的像素点上的色度值,I2(i,j)表示I2中,横坐标为j,纵坐标为i的像素点上的色度值。基于以上计算式(1),算出I1与I2上色度值的差值d(I1,I2)。
步骤403、若色度差值超过预设范围,则执行步骤404,否则,执行步骤405。
步骤404的描述可参考上述步骤304的描述。
步骤405、标记候选文字区域图像It-1所在帧为Yt-1,从未参与文字检测处理的目标图像中,选出一帧,标记为Yt
较佳地,可将当前帧用作Yt
本实施例二中,设选用的候选文字区域图像It-1的大小为R。
步骤406、设置大小小于或等于Yt的搜索窗W,基于搜索窗W,在Yt内搜索与It-1之间的差异最小的搜索区域,用作文字区域图像。
较佳地,为提高搜索效率,搜索窗的大小可设置为R的两倍大小。参见图5,图5是本实施例二中利用搜索窗W搜索Yt中与It-1相似的搜索区域的示意图。图5中,围绕搜索窗W内的任意位置点X(x,y),提取与R大小相同的指定区域,标记为C(x,y)。并且为减少计算量,搜索窗的中心位置位于与It-1所在位置基本相同区域。另外,实际应用中,为减少计算量,可基于R的大小选取X(x,y),也即设置x和y的最小取值。
利用上述计算式(1)算出该C(x,y)的色度值与It-1的色度值之间的色度差值,选出差值最小的搜索区域,标记该搜索区域(x*,y*),则
( x * , y * ) = arg min ( x , y ) ∈ W ( d ( C ( x , y ) , I t - 1 ) - - - ( 2 )
另外,可以根据实际情况,设置一个相似性阈值,如果搜索窗内搜索到的搜索区域与候选文字区域的相似性仍然低于该相似性阈值,可重新调整搜索窗的位置,重新搜索。
另外,实际应用中,也可用像素值代替色度值的计算,或设置其他图像特征参量,如候选文字区域图像的边缘信息等等。并且,根据实际情况,R可能是实施例一或二所列举的矩形,也可能是其他形状,类似处理。
步骤407、对从步骤406获得的文字区域图像进行优化处理,得到优质的文字区域图像。
该步骤407中,对文字区域图像的优化处理可参见上述步骤306所采用的技术,不再赘述。
步骤408至步骤409的描述可参考上述步骤307至步骤308的描述。
实施例二的流程结束。
上述实施例二中,通过搜索未参与文字检测处理的目标图像中与候选文字区域图像最相似的搜索区域,选出效果较好的文字区域图像,有利于后续文字识别处理,可提高文字识别效率;另外,基于搜索窗搜索其中的搜索区域,相比较采用现有文字检测技术检测整个图像,计算量要少很多。
参见图6,图6是本发明的一个实施例中文字区域图像的获取装置的结构示意图,该装置可包括:文字检测单元601、比对处理单元602、筛选单元603和获取单元604;其中,
文字检测单元601,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
比对处理单元602,用于根据文字检测单元601的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
筛选单元603,用于根据比对处理单元602的处理结果,若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
获取单元604,用于根据筛选单元603的筛选结果,获取包含文字内容的文字区域图像。
优选地,上述图6所示装置可进一步包括:尺寸调整单元605,用于将比对处理单元602处理的至少两个候选文字区域图像调整到相同尺寸,之后由比对处理单元602进行比对处理。
上述图6所示装置中,比对处理单元602可包括:参量值计算单元6021,差值计算单元6022;其中,
参量值计算单元6021,用于利用预设算法,计算比对处理单元602处理的至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预先设置;
差值计算单元6022,用于根据参量值计算单元5021的计算结果,计算每两个图像特征参量的值之间的差值。
上述筛选单元603可包括:判决单元6031和判决结果处理单元6032,其中,
判决单元6031,用于根据比对处理单元602的比对结果,判断至少两个候选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;
判决结果处理单元6032,用于根据判决单元6031的判断结果,判断所述至少两个候选文字区域图像中是否包含文字内容。
参见图7,图7是本发明的一个实施例中判决结果处理单元6032的结构示意图,该实施例中,判决结果处理单元6032包括:结果获取单元701和确定单元702;
结果获取单元701,用于获取判决单元6031的判断结果;
确定单元702,用于在结果获取单元701获取到的判断结果为肯定时,确定被比对的至少两个候选文字区域图像中包含文字内容。
参见图8,图8是本发明的另一个实施例中判决结果处理单元6032的结构示意图,该实施例中,判决结果处理单元6032包括:结果获取单元801、搜索单元802和结果处理单元803;
结果获取单元801,用于获取判决单元6031的判断结果;
搜索单元802,用于在结果获取单元801获取到的判断结果为肯定时,从搜索未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字区域图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜索区域;
结果处理单元803,用于在结果获取单元801获取到的判断结果为肯定,以及在搜索单元802搜索到搜索区域时,确定被比对的至少两个候选文字区域图像中和/或搜索区域对应的图像中包含文字内容。
图8中,搜索单元802包括:定位单元8021、参量值计算单元8022、差值计算单元8023和选择单元8024,其中,
定位单元8021,用于指定未参与所述文字检测的目标图像中的多个指定区域;
参量值计算单元8022,用于计算定位单元8021定位出的各个指定区域的图像特征参量的值,以及被比对的一个候选文字区域图像的图像特征参量的值;
差值计算单元8023,用于根据参量值计算单元8022的计算结果,计算每个指定区域的图像特征参量的值与被比对的一个候选文字区域图像的图像特征参量的值之间的差值;
选择单元8024,用于根据差值计算单元8023的计算结果,选择用作文字区域图像的搜索区域。
参见图9,图9是本发明的一个实施例中文字识别系统的结构示意图,该系统可包括:存储器901、文字区域图像的获取装置902、文字识别器903和输出单元904;
存储器901,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像;
文字区域图像的获取装置902可参见上文描述;
文字识别器903,用于根据文字区域图像的获取装置902获取到的文字区域图像,识别出文字内容;
输出单元904,用于将文字识别器识别出的文字内容输出。
上述文字识别系统中可进一步包括图像优化处理单元,对文字区域图像的获取装置902获取到的文字区域图像进行优化处理后,在由文字识别器903针对经过优化处理的图像,进行文字识别处理。
综上所述,本发明的具体实施中,通过对文字检测结果作进一步验证处理,即比较文字检测得出的候选文字区域图像之间的差异程度,在比对出差异程度较小后,可确定至少两个候选文字区域图像中的内容较相似,并且基于候选文字区域图像是文字检测得出的,因此,可得到确定包含文字内容的文字区域图像,从而通过对文字检测结果的验证,降低文字检测的误检几率。

Claims (18)

1、一种文字区域图像的获取方法,其特征在于,包括:
对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
获取所述文字区域图像。
2、根据权利要求1所述的方法,其特征在于,所述比对处理之前,该方法包括:
将所述至少两个候选文字区域图像调整到相同尺寸。
3、根据权利要求1或2所述的方法,其特征在于,进行比对处理包括:
利用预设算法,计算所述至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预设;
计算每两个图像特征参量的值之间的差值。
4、根据权利要求3所述的方法,其特征在于,确定所述至少两个候选文字区域图像属于所述文字区域图像包括:
所述至少两个候选文字区域图像中,两两图像特征参量的值之间的差值在所述预设范围之内。
5、根据权利要求1或2所述的方法,其特征在于,获取所述文字区域图像包括:
从所述至少两个候选文字区域图像中选择一个或多个候选文字区域图像用作所述文字区域图像。
6、根据权利要求1或2项所述的方法,其特征在于,确定所述至少两个候选文字区域图像属于所述文字区域图像之前,该方法进一步包括:
从未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字区域图像中的任意一个候选文字区域图像所存差异最小的区域,用作搜索区域。
7、根据权利要求6所述的方法,其特征在于,所述未参与所述文字检测的一帧目标图像为所述一个候选文字区域图像所在目标图像的下一帧。
8、根据权利要求6所述的方法,其特征在于,搜索出所述区域,用作搜索区域包括:
利用预设算法,计算未参与所述文字检测的目标图像中,多个指定区域的图像特征参量的值;所述图像特征参量被预设;
计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的值之间的差值;
选出与所述一个候选文字区域图像的图像特征参量的值之间的差值最小的指定区域,用作所述搜索区域。
9、根据权利要求8所述的方法,其特征在于,计算所述多个指定区域的图像特征参量的值包括:
预设大小小于或等于所述未参与所述文字检测的目标图像的大小的搜索窗,且所述搜索窗在该目标图像内;
分别计算所述搜索窗内,与所述一个候选文字区域图像大小相同的各个指定区域的图像特征参量的值。
10、根据权利要求6所述的方法,其特征在于,获取所述文字区域图像包括:
选择所述搜索区域用作所述文字区域图像。
11、一种文字区域图像的获取装置,其特征在于,包括:文字检测单元、比对处理单元、筛选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像。
12、根据权利要求11所述的装置,其特征在于,所述装置进一步包括:尺寸调整单元,用于将比对处理单元处理的至少两个候选文字区域图像调整到相同尺寸。
13、根据权利要求11或12所述的装置,其特征在于,所述比对处理单元包括:参量值计算单元,差值计算单元;其中,
所述参量值计算单元,用于利用预设算法,计算比对处理单元处理的至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预先设置;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每两个图像特征参量的值之间的差值。
14、根据权利要求11或12所述的装置,其特征在于,所述筛选单元包括:判决单元和判决结果处理单元,其中,
所述判决单元,用于根据所述比对处理单元的比对结果,判断至少两个候选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;
所述判决结果处理单元,用于根据所述判决单元的判断结果,判断所述至少两个候选文字区域图像中是否包含文字内容。
15、根据权利要求14所述的装置,其特征在于,所述判决结果处理单元包括:结果获取单元和确定单元;
所述结果获取单元,用于获取所述判决单元的判断结果;
所述确定单元,用于在结果获取单元获取到的判断结果为肯定时,确定所述至少两个候选文字区域图像中包含文字内容。
16、根据权利要求14所述的装置,其特征在于,所述判决结果处理单元包括:结果获取单元、搜索单元和结果处理单元;
所述结果获取单元,用于获取所述判决单元的判断结果;
所述搜索单元,用于在结果获取单元获取到的判断结果为肯定时,从搜索未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字区域图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜索区域;
所述结果处理单元,用于在结果获取单元获取到的判断结果为肯定以及在所述搜索单元搜索到所述搜索区域时,确定所述至少两个候选文字区域图像中和/或所述搜索区域对应的图像中包含文字内容。
17、根据权利要求16所述的方法,其特征在于,所述搜索单元包括:定位单元、参量值计算单元、差值计算单元和选择单元,其中,
所述定位单元,用于指定未参与所述文字检测的目标图像中的多个指定区域;
所述参量值计算单元,用于计算所述定位单元定位出的各个指定区域的图像特征参量的值,以及所述一个候选文字区域图像的图像特征参量的值;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的值之间的差值;
所述选择单元,用于根据所述差值计算单元的计算结果,选择所述搜索区域用作所述文字区域图像。
18、一种文字识别系统,其特征在于,包括:存储器、文字区域图像的获取装置、文字识别器和输出单元;
所述存储器,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像;
所述文字区域图像的获取装置,包括:文字检测单元、比对处理单元、筛选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;
所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像;
所述文字识别器,用于根据所述文字区域图像的获取装置获取到的所述文字区域图像,识别出所述文字内容;
所述输出单元,用于将所述文字识别器识别出的文字内容输出。
CN2008101144762A 2008-06-06 2008-06-06 文字区域图像的获取方法及装置、文字识别系统 Expired - Fee Related CN101299239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101144762A CN101299239B (zh) 2008-06-06 2008-06-06 文字区域图像的获取方法及装置、文字识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101144762A CN101299239B (zh) 2008-06-06 2008-06-06 文字区域图像的获取方法及装置、文字识别系统

Publications (2)

Publication Number Publication Date
CN101299239A true CN101299239A (zh) 2008-11-05
CN101299239B CN101299239B (zh) 2011-09-14

Family

ID=40079063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101144762A Expired - Fee Related CN101299239B (zh) 2008-06-06 2008-06-06 文字区域图像的获取方法及装置、文字识别系统

Country Status (1)

Country Link
CN (1) CN101299239B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013097429A1 (en) * 2011-12-30 2013-07-04 Lg Electronics (China) R & D Center Co., Ltd Method and apparatus for recognizing video captions
CN105631446A (zh) * 2015-12-17 2016-06-01 天脉聚源(北京)科技有限公司 一种互动角标提示符的确定方法及装置
CN106157284A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 图像中文字区域的定位方法及装置
CN103729638B (zh) * 2012-10-12 2016-12-21 阿里巴巴集团控股有限公司 一种文字区域识别中的文字行排列分析方法和装置
WO2017156864A1 (zh) * 2016-03-14 2017-09-21 百度在线网络技术(北京)有限公司 图像识别方法、装置、设备及非易失性计算机存储介质
CN109614971A (zh) * 2018-12-05 2019-04-12 山东政法学院 一种比对式文件检验仪
CN111626310A (zh) * 2020-05-27 2020-09-04 百度在线网络技术(北京)有限公司 图像比对方法、装置、设备以及存储介质
CN112749599A (zh) * 2019-10-31 2021-05-04 北京金山云网络技术有限公司 图像增强方法、装置和服务器
CN113569859A (zh) * 2021-07-27 2021-10-29 北京奇艺世纪科技有限公司 一种图像处理方法、装置、电子设备及存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013097429A1 (en) * 2011-12-30 2013-07-04 Lg Electronics (China) R & D Center Co., Ltd Method and apparatus for recognizing video captions
CN103729638B (zh) * 2012-10-12 2016-12-21 阿里巴巴集团控股有限公司 一种文字区域识别中的文字行排列分析方法和装置
CN106157284B (zh) * 2015-04-01 2019-10-11 阿里巴巴集团控股有限公司 图像中文字区域的定位方法及装置
CN106157284A (zh) * 2015-04-01 2016-11-23 阿里巴巴集团控股有限公司 图像中文字区域的定位方法及装置
CN105631446A (zh) * 2015-12-17 2016-06-01 天脉聚源(北京)科技有限公司 一种互动角标提示符的确定方法及装置
WO2017156864A1 (zh) * 2016-03-14 2017-09-21 百度在线网络技术(北京)有限公司 图像识别方法、装置、设备及非易失性计算机存储介质
US11455783B2 (en) 2016-03-14 2022-09-27 Baidu Online Network Technology (Beijing) Co., Ltd. Image recognition method and apparatus, device and non-volatile computer storage medium
CN109614971A (zh) * 2018-12-05 2019-04-12 山东政法学院 一种比对式文件检验仪
CN112749599A (zh) * 2019-10-31 2021-05-04 北京金山云网络技术有限公司 图像增强方法、装置和服务器
CN111626310A (zh) * 2020-05-27 2020-09-04 百度在线网络技术(北京)有限公司 图像比对方法、装置、设备以及存储介质
CN111626310B (zh) * 2020-05-27 2023-08-29 百度在线网络技术(北京)有限公司 图像比对方法、装置、设备以及存储介质
CN113569859A (zh) * 2021-07-27 2021-10-29 北京奇艺世纪科技有限公司 一种图像处理方法、装置、电子设备及存储介质
CN113569859B (zh) * 2021-07-27 2023-07-04 北京奇艺世纪科技有限公司 一种图像处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101299239B (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN101299239B (zh) 文字区域图像的获取方法及装置、文字识别系统
Fang et al. No-reference quality assessment of contrast-distorted images based on natural scene statistics
US9471964B2 (en) Non-local mean-based video denoising method and apparatus
US8363933B2 (en) Image identification method and imaging apparatus
US8121403B2 (en) Methods and systems for glyph-pixel selection
CN104408707B (zh) 一种快速数字成像模糊鉴别与复原图像质量评估方法
CN105404884B (zh) 图像分析方法
US20050286802A1 (en) Method for detecting and selecting good quality image frames from video
US8355537B2 (en) Image processing apparatus and control method thereof
JP2005310124A (ja) 赤目検出装置、プログラムおよびプログラムを記録した記録媒体
US20070047824A1 (en) Method, apparatus, and program for detecting faces
US20140037212A1 (en) Image processing method and device
US8655060B2 (en) Night-scene light source detecting device and night-scene light source detecting method
US20110200257A1 (en) Character region extracting apparatus and method using character stroke width calculation
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
JP2018120445A (ja) 車番認識装置
CN102301697B (zh) 视频签名产生设备
US20110085026A1 (en) Detection method and detection system of moving object
CN111738272B (zh) 一种目标特征提取方法、装置及电子设备
JP2006222899A (ja) 画像処理装置及び画像処理方法
JP2021111228A (ja) 学習装置、学習方法、及びプログラム
CN110532993A (zh) 一种人脸防伪方法、装置、电子设备及介质
CN109598209A (zh) 一种虹膜图像清晰度的检测方法
US8538142B2 (en) Face-detection processing methods, image processing devices, and articles of manufacture
JP2009032044A (ja) 車色判定装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171221

Address after: 100083 Haidian District, Xueyuan Road, No. 35, the world building, the second floor of the building on the ground floor, No. 16

Patentee after: Zhongxing Technology Co.,Ltd.

Address before: 100083, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 15 Floor

Patentee before: VIMICRO Corp.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: 100083 Haidian District, Xueyuan Road, No. 35, the world building, the second floor of the building on the ground floor, No. 16

Patentee after: Zhongxing Technology Co.,Ltd.

Address before: 100083 Haidian District, Xueyuan Road, No. 35, the world building, the second floor of the building on the ground floor, No. 16

Patentee before: Zhongxing Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110914

CF01 Termination of patent right due to non-payment of annual fee