CN103500337A - 用于智能无线通信终端的识别四边形边框的方法及装置 - Google Patents

用于智能无线通信终端的识别四边形边框的方法及装置 Download PDF

Info

Publication number
CN103500337A
CN103500337A CN201310462071.9A CN201310462071A CN103500337A CN 103500337 A CN103500337 A CN 103500337A CN 201310462071 A CN201310462071 A CN 201310462071A CN 103500337 A CN103500337 A CN 103500337A
Authority
CN
China
Prior art keywords
image
quadrilateral
classification
identifying object
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310462071.9A
Other languages
English (en)
Other versions
CN103500337B (zh
Inventor
陈青山
沈东辉
占大志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Linguan Data Technology Co.,Ltd.
Shanghai Hehe Information Technology Development Co Ltd
Original Assignee
Shanghai Hehe Information Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Hehe Information Technology Development Co Ltd filed Critical Shanghai Hehe Information Technology Development Co Ltd
Priority to CN201310462071.9A priority Critical patent/CN103500337B/zh
Publication of CN103500337A publication Critical patent/CN103500337A/zh
Application granted granted Critical
Publication of CN103500337B publication Critical patent/CN103500337B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供一种应用于智能无线通信终端的图像识别四边形边框的方法及装置。所述图像识别四边形边框的方法为:获取待处理的图像后,通过设定或检测得到识别对象的类别,进而获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框,确定目标四边形边框,最后对目标四边形边框内的图像部分进行处理。所述的装置包括图像获取模块;识别对象类别确定模块;四边形框识别模块;图像处理模块。应用所述的方法或装置可以改进目前对所拍摄的目标区域为矩形区域的图像的处理中存在的需要用户对所拍摄的图像四边形区域都进行手动调整来确保目标四边形边框的准确性的问题。

Description

用于智能无线通信终端的识别四边形边框的方法及装置
技术领域
本发明涉及一种图像识别技术,特别是涉及一种用于智能无线终端的识别四边形边框的方法和装置。
背景技术
随着智能无线终端的普及,越来越多的用户使用智能无线终端对所拍摄对象的图像信息进行加工和提取。其中,拍摄对象为矩形区域的情况非常多,典型的拍摄得到的图像有白板图像和文本图像。白板图像是对会议白板,公告牌和其他文本类矩形目标拍摄所得的图像。文本图像是对标准文本,如A4格式纸质文本,各种书籍中的页面,电影海报等进行拍摄所得的图像。由于拍摄的角度等原因,这些拍摄的图像可能存在所拍摄对象图像以外的区域,如白板图像存在目标会议白板图像以外的区域,不规则的四边形,以及缺角等情况,而所拍摄对象的图像才是用户需要的目标对象。为此,对所拍摄图像的处理通常需要先进行目标对象的四边形边框检测操作。四边形边框检测操作是指对所拍摄的图像进行检测,提取目标四边形边框,从而在之后的操作中,去除四边形边框以外的区域,并对所述四边形边框进行矩形框校正或补角操作。在实际操作中,对所拍摄图像的自动检测所得到的四边形边框范围常常不是用户期望的结果。因此,需要用户手动调整的概率就很高,而现有的调整图像四边形边框检测结果的方法,是通过手动拉伸来选择图像中的四边形边框,每次在对图像进行调整的时候,需要对四个顶点的位置分别进行确定,之后才完成对一个四边形边框的选择。
这种方法虽然保证了目标四边形边框的正确性,但每次调整都需要对四个顶点的位置分别进行确定。当存在大量的四边形边框检测操作需要时,用户的任务变得极其繁重。因此如何在尽量保证四边形边框检测操作能得到用户所期望的四边形边框的情况下,最大限度的减轻用户的负担是这个领域要解决的重要技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用于智能无线通信终端的识别四边形边框的方法,该方法把所要识别的所拍摄的对象图像作为识别对象,并运用识别对象的信息特征识别出目标四边形边框,该方法能改进现有技术中对所拍摄的对象图像为矩形区域的图像的处理中存在的需要用户对识别对象的四边形区域都进行手动调整来确保目标四边形边框的准确性的问题。
为实现上述目的及其他相关目的,本发明提供一种用于智能无线通信终端的识别四边形边框的方法,所述识别四边形边框的方法至少包括以下步骤:步骤一,获取待处理的图像;步骤二,确认所述图像中识别对象的类别;步骤三,根据所述识别对象的类别获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框。
优选地,所述步骤一中获取待处理的图像的方式包括采用智能无线通信终端的摄像头进行拍照方式来获取图像或通过打开已有的图像文件方式来获取图像。
优选地,预先存储有所述识别对象的类别及其所对应的四边形边框的特征信息,所述步骤二中获取识别对象的类别的方式为如下方式中的至少一种:由用户在预先存储的识别对象的类别中进行选择;通过图像引擎对所述图像数据的内容进行分析来确定识别对象的类别;通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。
优选地,所述步骤二中获取识别对象的类别的方式为:由用户自定义识别对象的类别,并由用户自定义所对应的四边形边框的特征信息。
优选地,所述特征信息为以下几项中的至少一项:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字符的格式特征。
优选地,所述特征信息以区间方式进行定义,所述步骤三中相应的特征落入该区间的四边形边框即为与特征信息相匹配的四边形边框。
优选地,所述步骤三中如果有多个四边形边框与所述特征信息相匹配,则由用户从该多个四边形边框中做出选择。
优选地,所述识别四边形边框的方法还包括步骤四,与识别对象的类别对应有标准尺寸,将识别得到的四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。
上述智能无线通信终端的识别四边形边框的方法还可以是一种用于智能无线通信终端四边形边框识别装置,包括:图像获取模块,用于获取待处理的图像;识别对象类别确定模块,用于确定所述图像获取模块所获取的所述图像的识别对象的类别;四边形边框识别模块,根据所述识别对象类别确定模块确定的识别对象的类别,根据所述识别对象的类别获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框。
优选地,所述的四边形框识别装置,其特征在于:所述图像获取模块获取待处理的图像的方式包括采用智能无线通信终端的摄像头进行拍照方式来获取图像或通过打开已有的图像文件方式来获取图像。
优选地,所述的四边形框识别装置,其特征在于:预先存储有所述识别对象的类别及其所对应的四边形边框的特征信息,所述识别对象类别确定模块中获取识别对象的类别的方式为如下方式中的至少一种:由用户在预先存储的识别对象的类别中进行选择;通过图像引擎对所述图像获取模块获取的图像的图像数据内容进行分析来确定识别对象的类别;通过图像引擎对所述图像获取模块获取的图像的图像数据格式进行分析来确定识别对象的类别。
优选地,所述的四边形框识别装置,其特征在于:所述识别对象类别确定模块中获取识别对象的类别的方式为:由用户自定义识别对象的类别,并由用户自定义识别对象的类别所对应的四边形边框的特征信息。
优选地,所述的四边形框识别装置,其特征在于:所述特征信息为以下几项中的至少一项:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字符的格式特征。
优选地,所述的四边形框识别装置,其特征在于:所述特征信息以区间方式进行定义,所述四边形边框识别模块中相应的特征落入该区间的四边形边框即为与特征信息相匹配的四边形边框。
优选地,所述的四边形框识别装置,其特征在于:所述四边形边框识别模块中如果有多个四边形边框与所述特征信息相匹配,则由用户从该多个四边形边框中做出选择。
优选地,所述的四边形框识别装置,其特征在于:还包括图像处理模块,与识别对象类别确定模块中得到的识别对象类别对应有标准尺寸,将所述四边形边框识别模块中识别得到的四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。
如上所述,本发明的用于智能无线通信终端的识别四边形边框的方法及装置,具有以下有益效果:本发明能在通过获取所述图像的识别对象的类别之后,再通过特征信息获取与特征信息相匹配的四边形边框,进而获得与所述识别对象对应的目标四边形边框,这可以大幅减少用户对所拍摄或打开的图像四边形区域进行手动调整的操作,同时也最大限度的保证了目标四边形边框的正确性。同时,本发明还能对所述目标四边形边框内的图像进行拉伸处理,转换成符合所述识别对象的标准尺寸的图像,进一步满足用户对识别对象处理的需要。这大大简化了用户在此处理中的操作,给用户带来了很大的便利。
附图说明
图1显示为本发明一种用于智能无线通信终端的识别四边形边框的方法的步骤流程示意图。
图2显示为本发明一种用于智能无线通信终端的识别四边形边框的装置的模块示意图。
元件标号说明
S1~S12   步骤
21        图像获取模块
22        识别对象类别确定模块
23        四边形框识别模块
24        图像处理模块
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
本发明提供一种用于智能无线通信终端的识别四边形边框的方法,可应用在商务手机等智能无线通信终端中,在具体地实施方式中,所述智能无线通信终端包括但不限于商务手机,还可应用于PDA等。图1显示为本发明识别四边形边框的方法步骤流程示意图,如图1所示,所述方法至少包括以下步骤:
首先执行步骤S1,获取待处理的图像,并显示该图像。具体地,所述智能无线通信终端获取待处理的图像,并将所述图像显示在屏幕中。于本实施例中,所述获取待处理的图像具体为启动所述智能无线通信终端中的拍摄装置拍摄图像,但并不以此为限,另一种获取待处理的图像的实现方式是打开智能无线通信终端中预存的图像文件。得到图像后,将图像显示在智能无线通信终端的屏幕上。接着执行步骤S2。
在步骤S2中,获取到图像后,确定用户是否不设定所述图像中识别对象的类别。具体地,针对图像中识别对象的类别的设定,用户可以选择不设定所述识别对象的类别或选择设定识别对象的类别。
如果步骤S2中的判断为真,用户选择不设定所述识别对象的类别,则执行步骤S6;如果步骤S2中的判断为假,用户选择设定所述识别对象的类别,则执行步骤S3。
在步骤S3中,确定用户是否选择自定义识别对象的类别。具体地,用户可以选择自定义识别对象的类别或者用户可以选择在预先存储的识别对象的类别中进行选择,所述预先存储的识别对象的类别及其相应的特征信息可存储在数据库或数据表中。
如果步骤S3中的判断为真,用户选择自定义识别对象的类别,则执行步骤S5;如果步骤S3中的判断为假,用户选择选择在预先存储的识别对象的类别中进行选择,则执行步骤S4。
在步骤S4中,用户在预先存储的识别对象的类别中选择出识别对象的类别。接着执行步骤S7。
在步骤S5中,用户自定义识别对象的类别,即用户自定义所述图像的识别对象的类别,并由用户自定义所对应的四边形边框的特征信息,这些特征信息可以包括以下几项中:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字符的格式特征,标准尺寸。接着执行步骤S7。
在步骤S6中,系统调用图像引擎检测所述图像的数据的内容或/和格式进行分析,确定识别对象的类别。
具体地,所述分析确认识别对象的类别的方式包括如下方式中的至少一种:
1,通过图像引擎对所述图像数据的内容进行分析来确定识别对象的类别;例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有“公民身份号码”的文字,则确定所述识别对象的类别为身份证;又假如预先存储的识别对象的类别中有银行卡,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有图像数据中经过识别后有“**银行”的文字,或者有“VISA”标志图案,则确定所述识别对象的类别为银行卡。
2,通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果图像中的某一区域中,左侧特定位置上有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定位置上有身份证号码信息,根据上述格式,确定所述识别对象的类别为身份证。
如果步骤S6的判断为真,能确定识别对象的类别,则执行步骤S7;如果步骤S6的判断为假,不能确定识别对象的类别,则执行步骤S11。
在步骤S7中,根据所述确定的识别对象的特征信息进行匹配检测,确定与特征信息相匹配的四边形边框,所述与特征信息相匹配的四边形边框也就是配置成功的四边形边框。具体地,匹配检测的方式包括如下方式中的至少一种:
(1)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框相邻两条边的长度之比,即边框长宽比,该边框长宽比以区间方式定义;检测所述图像中存在的所有四边形边框,判断所述四边形边框相邻两条边的长度之比是否落入到所述边框长宽比区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。例如得到所述步骤S4或者步骤S5或者步骤S6确定的所述识别对象的类别为身份证,获取相对应的边框长宽比为【1.4,1.7】,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的相邻两条边的长度之比是否落入所述区间【1.4,1.7】,如所述检测出的四边形边框的相邻两条边的长度之比为1.5,落入所述区间【1.4,1.7】,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(2)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的形状特征,即四边形边框中的边框的形状的特征,该形状特征以区间方式定义;检测所述图像中存在的所有四边形边框,寻找到所述四边形边框的形状特征落入到所述形状特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。所述形状特征可以以数字的形式被记录,以基准线条形状数据作为参照来定义一个区间,使得与基准线条形状相似的线条的数据落入该区间内。具体地,所示形状特征可以是边框线条形状特征,例如,所述识别对象的类别相对应的四边形边框的边框线条形状是以波浪线作为参照来定义的一个区间;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框线条形状是否落入所述波浪线区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。所示形状特征也可以是边框顶点形状特征,例如,所述识别对象的类别相对应的四边形边框的边框顶点形状为以圆角作为参照定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框顶点形状是否落入所述圆角区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(3)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的图像中的关键数据内容,所述关键数据内容以区间方式定义;检测所述图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中的数据内容落入所述关键数据内容区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。由于图像在拍摄的时候可能会有失真,因此需要在图像识别和匹配过程中容许有一定的差别,因此相似的文字或图案也被认为是可以匹配的,所以将所述图像中的关键数据内容以区间方式定义,即以基准文字或基准图案为参照定义的一个区间,使得和该基准文字或基准图案相似的文字或图案也落入该区间。具体地,例如,所述识别对象的图像中的关键数据内容是以基准文字“**银行”定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“**银行”相同或相似的文字,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。又例如,所述识别对象的图像中的关键数据内容是以基准图案为“VISA”标志图案定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“VISA”标志图案相同或相似的图案,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(4)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的图像中字符的格式特征,所述格式特征以区间方式定义;检测所述图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中字符的格式特征落入所述格式特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。具体地,例如,假定识别对象的类别为身份证;身份证的格式都有以下格式特征,“左侧特定的位置上分别有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定位置上有身份证号码信息”,将身份证类别的图像中字符的格式特征定义为以上述格式特征为基准定义的一个区间,这样,在检测时被检测四边形边框图像字符的格式中内容近似,图像近似或者位置近似的信息也被认为是落入到所述区间中,纠正可能因为失真而使得图像中的数据存在的偏差;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中字符的格式特征落入所述格式特征区间中,如果是,则本次判断的所述四边形边框为与所述身份证类别的特征信息相匹配的四边形边框。
由于特征信息的内容可以用区间的方式进行定义,这就使得不仅仅与基准信息相同,那些与基准信息相似的,例如内容近似,图像近似或者位置近似的信息也被认为是可以匹配的内容,由于图像可能因为失真而使得记载的数据存在偏差,这种通过区间的方式对特征信息进行定义,很好的克服了由于这种偏差而造成的识别匹配错误。
在一个实施例中,当找到一个与特征信息相匹配的四边形边框时,继续进行判断,寻找出所有与特征信息相匹配的四边形边框。接着执行步骤S8。在另一个实施例中,当找到一个与特征信息相匹配的四边形边框时,就结束本步骤,接着执行步骤S8。
在步骤S8中,判定步骤S7中是否不存在所述与特征信息相匹配的四边形边框。
如果步骤S8的判断为真,不存在所述与特征信息相匹配的四边形边框,则执行步骤S11;如果步骤S8的判断为假,存在所述与特征信息相匹配的四边形边框,则执行步骤S9。
在步骤S9中,判定步骤S7中是否存在多个与特征信息相匹配的四边形边框。
如果步骤S9的判断为真,存在多个所述与特征信息相匹配的四边形边框,则执行步骤S10;如果步骤S9的判断为假,只存在有一个所述与特征信息相匹配的四边形边框,该四边形边框就为识别得到的四边形边框,即目标四边形边框,则执行步骤S12。
在步骤S10中,由用户从该多个四边形边框中做出选择。具体地,用户从多个所述与特征信息相匹配的四边形边框中选择出所述识别得到的四边形边框,即目标四边形边框。接着执行步骤S12。
在步骤S11中,由用户手动得到与所述识别对象对应的识别得到的四边形边框。具体地,由用户对四边形边框的四个顶点的位置分别进行确定,得到目标四边形边框。接着执行步骤S12。
在步骤S12中,从所述识别对象的类别获取相对应的四边形边框的标准尺寸,将所述目标四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。例如,所述识别对象的类别为“身份证”,获取“身份证”相对应的四边形边框的标准尺寸为“85.6mm×54.0mm”,则将所述识别得到的四边形边框或目标四边形边框内的图像进行拉伸处理,转换成长宽尺寸为“85.6mm×54.0mm”的图像。
本发明还提供一种用于智能无线通信终端的识别四边形边框的装置,可应用在商务手机等智能无线通信终端中,在具体地实施方式中,所述智能无线通信终端包括但不限于商务手机等。图2显示为本发明识别四边形边框的装置的模块示意图,如图所示,所述装置至少包括以下模块:
图像获取模块21,用于获取待处理的图像。具体地,所述图像获取模块获取到待处理的图像,将所述图像显示在屏幕中。于本实施例中,所述获取到待处理的图像的方式具体为启动所述智能无线通信终端中的拍摄装置拍摄图像,但并不以此为限;另一种获取待处理图像的方式是打开智能无线通信终端中的图像文件。得到所述图像后,调用图像引擎将所述图像显示在智能无线通信终端的屏幕上。
识别对象类别确定模块22,和图像获取模块21连接,用于确定从图像获取模块21所获取的所述图像的识别对象的类别,所述图像的识别对象的类别可以通过用户设定的方式确定。具体地,用户设定的方式为:用户可以选择用户或者用户可以在预先存储的识别对象的类别中选择设定所述识别对象的类别;所述预先存储的识别对象的类别及其相应的特征信息可存储在数据库或数据表中。用户设定自定义识别对象的类别时,需要用户自定义所对应的四边形边框的特征信息,这些特征信息包括以下几项:四边形边框相邻两条边的长度之比,形状特征,图像中的关键数据内容,图像中字符的格式特征,标准尺寸。
识别对象类别确认模块22的另一种可以实现的方式是,通过图像引擎对从图像获取模块21所获取的所述图像数据的内容进行分析来确定识别对象的类别。例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有“公民身份号码”的文字,则确定所述识别对象的类别为身份证;又假如预先存储的识别对象的类别中有银行卡,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有图像数据中经过识别后有“**银行”的文字,或者有“VISA”标志图案,则确定所述识别对象的类别为银行卡。
识别对象类别确认模块22的另一种可以实现的方式是,通过图像引擎对从图像获取模块21所获取的所述图像数据的格式进行分析来确定识别对象的类别。例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果图像中的某一区域中,左侧特定位置上有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定位置上有身份证号码信息,根据上述格式,确定所述识别对象的类别为身份证。
四边形边框识别模块23,和图像获取模块21以及识别对象类别确认模块22,用于从识别对象类别确认模块22中得到的所述识别对象的类别,进而获取相对应的四边形边框的特征信息,在所述图像获取模块21中获取的图像中结合图像所显示的内容来识别与该特征信息相匹配的四边形边框,进而得到与所述识别对象对应的目标四边形边框。确定与特征信息相匹配的四边形边框。具体地,结合图像所显示的内容来识别与该特征信息相匹配的四边形边框的方式包括如下方式中的至少一种:
(1)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框相邻两条边的长度之比,即边框长宽比,该边框长宽比以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,判断所述四边形边框相邻两条边的长度之比是否落入到所述边框长宽比区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。例如,从识别对象类别确认模块22中得到的所述识别对象的类别为身份证,获取身份证相对应的边框长宽比为【1.4,1.7】,通过图像引擎检测出所述图像获取模块21中获取的图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的相邻两条边的长度之比是否落入所述边框长宽比区间【1.4,1.7】中,如所述检测出的四边形边框的相邻两条边的长度之比为1.5,落入所述边框长宽比区间【1.4,1.7】中,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(2)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的形状特征,即四边形边框中的边框的形状的特征,该形状特征以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,寻找到所述四边形边框中的形状的特征落入到所述形状特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。所述形状特征可以以数字的形式被记录,以基准线条形状数据作为参照来定义一个区间,使得与基准线条形状相似的线条的数据落入该区间内。具体地,所示形状特征可以是边框线条形状特征,例如,所述识别对象的类别相对应的四边形边框的边框线条形状是以波浪线作为参照来定义的一个区间;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框线条形状是否落入所述波浪线区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。所示形状特征也可以是边框顶点形状特征,例如,所述识别对象的类别相对应的四边形边框的边框顶点形状为以圆角作为参照定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框顶点形状是否落入所述圆角区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(3)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的图像中的关键数据内容,所述关键数据内容以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中的数据内容落入所述关键数据内容区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。由于图像在拍摄的时候可能会有失真,因此需要在图像识别和匹配过程中容许有一定的差别,因此相似的文字或图案也被认为是可以匹配的,所以将所述图像中的关键数据内容以区间方式定义,即以基准文字或基准图案为参照定义的一个区间,使得和该基准文字或基准图案相似的文字或图案也落入该区间。具体地,例如,所述识别对象的图像中的关键数据内容是以基准文字“**银行”定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“**银行”相同或相似的文字,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。又例如,所述识别对象的图像中的关键数据内容是以基准图案为“VISA”标志图案定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“VISA”标志图案相同或相似的图案,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。
(4)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的图像中字符的格式特征,所述格式特征以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中字符的格式特征落入所述格式特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。具体地,例如,假定识别对象的类别为身份证;身份证的格式都有以下格式特征,“左侧特定的位置上分别有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定位置上有身份证号码信息”,将身份证类别的图像中字符的格式特征定义为以上述格式特征为基准定义的一个区间,这样,在检测时被检测四边形边框图像中字符的格式中内容近似,图像近似或者位置近似的信息也被认为是落入到所述区间中,纠正可能因为失真而使得图像中的数据存在的偏差;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中字符的格式特征落入所述格式特征区间中,如果是,则本次判断的所述四边形边框为与所述身份证类别的特征信息相匹配的四边形边框。
由于特征信息的内容可以用区间的方式进行定义,这就使得不仅仅与基准信息相同,那些与基准信息相似的,例如内容近似,图像近似或者位置近似的信息也被认为是可以匹配的内容,由于图像可能因为失真而使得记载的数据存在偏差,这种通过区间的方式对特征信息进行定义,很好的克服了由于这种偏差而造成的识别匹配错误。
当找到一个与特征信息相匹配的四边形边框时,继续进行判断,继续寻找与特征信息相匹配的四边形边框。如果得到多个匹配成功的四边形边框,则由用户从多个所述匹配成功的四边形边框中选定出一个识别得到的四边形边框,即与所述识别对象对应的目标四边形边框。在另一个实施例中,当找到一个与特征信息相匹配的四边形边框时,直接结束判断,将该与特征信息相匹配的四边形边框作为所述识别得到的四边形边框,即与所述识别对象对应的目标四边形边框。
图像处理模块24,和别对象类别确认模块22以及四边形边框识别模块23相连,用于从所述识别对象类别确认模块22获取识别对象的类别,从所述识别对象的类别获取相对应的四边形边框的标准尺寸,并对四边形边框识别模块23所识别出的所述目标四边形边框或目标四边形边框内的图像部分进行图像处理。具体地,从所述识别对象类别确认模块22获取识别对象的类别,根据所述识别对象的类别获取相对应的四边形边框的标准尺寸,将所述四边形边框识别模块23得到的所述识别得到的四边形边框或目标四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸值的图像。例如,所述识别对象的类别为“身份证”,获取到“身份证”相对应的四边形边框的标准尺寸为“85.6mm×54.0mm”,则将所述识别得到的四边形边框或目标四边形边框内的图像进行拉伸处理,转换成长宽尺寸为“85.6mm×54.0mm”的图像。
综上所述,本发明一种用于智能无线通信终端的识别四边形边框的方法及装置,通过确认待处理图像的类别,获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框,从而确定识别得到的四边形边框,即目标四边形边框,并对目标四边形边框内的图像部分进行处理。本方案能够根据图像的类别准确的得到图像的目标四边形边框,并且所述处理过程不需要用户对所拍摄的图像四边形区域进行手动调整来确保目标四边形边框的准确性。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (9)

1.一种用于智能无线通信终端的识别四边形边框的方法,其特征在于,包括:
步骤一,获取待处理的图像;
步骤二,确认所述图像中识别对象的类别;
步骤三,根据所述识别对象的类别获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框。
2.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:所述步骤一中获取待处理的图像的方式包括采用智能无线通信终端的摄像头进行拍照方式来获取图像或通过打开已有的图像文件方式来获取图像。
3.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:预先存储有所述识别对象的类别及其所对应的四边形边框的特征信息,所述步骤二中获取识别对象的类别的方式为如下方式中的至少一种:
由用户在预先存储的识别对象的类别中进行选择;
通过图像引擎对所述图像数据的内容进行分析来确定识别对象的类别;
通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。
4.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:所述步骤二中获取识别对象的类别的方式为:由用户自定义识别对象的类别,并由用户自定义所对应的四边形边框的特征信息。
5.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:所述特征信息为以下几项中的至少一项:
四边形边框相邻两条边的长度之比;
形状特征;
图像中的关键数据内容;
图像中字符的格式特征。
6.根据权利要求5所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:所述特征信息以区间方式进行定义,所述步骤三中相应的特征落入该区间的四边形边框即为与特征信息相匹配的四边形边框。
7.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:所述步骤三中如果有多个四边形边框与所述特征信息相匹配,则由用户从该多个四边形边框中做出选择。
8.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在于:还包括步骤四,与识别对象的类别对应有标准尺寸,将识别得到的四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。
9.一种基于智能无线通信终端的四边形边框识别装置,其特征在于,采用如权利要求1-8中任意一项所述的用于智能无线通信终端的识别四边形边框的方法识别四边形边框。
CN201310462071.9A 2013-09-30 2013-09-30 用于智能无线通信终端的识别四边形边框的方法及装置 Active CN103500337B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310462071.9A CN103500337B (zh) 2013-09-30 2013-09-30 用于智能无线通信终端的识别四边形边框的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310462071.9A CN103500337B (zh) 2013-09-30 2013-09-30 用于智能无线通信终端的识别四边形边框的方法及装置

Publications (2)

Publication Number Publication Date
CN103500337A true CN103500337A (zh) 2014-01-08
CN103500337B CN103500337B (zh) 2018-10-09

Family

ID=49865542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310462071.9A Active CN103500337B (zh) 2013-09-30 2013-09-30 用于智能无线通信终端的识别四边形边框的方法及装置

Country Status (1)

Country Link
CN (1) CN103500337B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408427A (zh) * 2014-12-01 2015-03-11 上海合合信息科技发展有限公司 图像四边形识别的方法和装置
CN104717425A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据调整的方法、客户端及系统
CN104767928A (zh) * 2014-12-30 2015-07-08 上海孩子国科教设备有限公司 关联规则图像数据的调整方法、客户端、系统及装置
CN105141843A (zh) * 2015-09-01 2015-12-09 湖南欧斐网络科技有限公司 基于摄像装置拍摄目标图像的标尺定位方法和设备
CN106250894A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 卡片信息识别方法及装置
CN106339705A (zh) * 2016-08-16 2017-01-18 北京小米移动软件有限公司 图片获取方法及装置
CN106503703A (zh) * 2015-09-08 2017-03-15 Sk普兰尼特有限公司 使用终端设备来识别信用卡号码和到期日期的系统和方法
CN107403409A (zh) * 2017-07-21 2017-11-28 苏州科达科技股份有限公司 图像拼接前的图像处理方法、装置及图像拼接方法及装置
CN107644183A (zh) * 2017-09-01 2018-01-30 福建联迪商用设备有限公司 一维码cmos摄像引擎的解码方法及终端
CN108288281A (zh) * 2017-01-09 2018-07-17 翔升(上海)电子技术有限公司 视觉跟踪方法、视觉跟踪装置、无人机以及终端设备
WO2019062426A1 (zh) * 2017-09-26 2019-04-04 腾讯科技(深圳)有限公司 边框检测方法、服务器及存储介质
CN110945520A (zh) * 2017-12-27 2020-03-31 株式会社日立制作所 生物体认证系统
CN112204945A (zh) * 2019-08-14 2021-01-08 深圳市大疆创新科技有限公司 图像处理方法、设备、拍摄装置、可移动平台及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1914611A (zh) * 2004-01-29 2007-02-14 泽塔普利株式会社 信息检索系统、信息检索方法、信息检索装置、信息检索程序、图像识别装置、图像识别方法及图像识别程序、以及销售系统
US20100290701A1 (en) * 2009-05-13 2010-11-18 Tata Consultancy Services Limited Document image segmentation system
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1914611A (zh) * 2004-01-29 2007-02-14 泽塔普利株式会社 信息检索系统、信息检索方法、信息检索装置、信息检索程序、图像识别装置、图像识别方法及图像识别程序、以及销售系统
US20100290701A1 (en) * 2009-05-13 2010-11-18 Tata Consultancy Services Limited Document image segmentation system
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN102201053A (zh) * 2010-12-10 2011-09-28 上海合合信息科技发展有限公司 一种文本图像的切边方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408427A (zh) * 2014-12-01 2015-03-11 上海合合信息科技发展有限公司 图像四边形识别的方法和装置
CN104717425A (zh) * 2014-12-30 2015-06-17 上海孩子国科教设备有限公司 数据调整的方法、客户端及系统
CN104767928A (zh) * 2014-12-30 2015-07-08 上海孩子国科教设备有限公司 关联规则图像数据的调整方法、客户端、系统及装置
CN105141843B (zh) * 2015-09-01 2018-10-09 湖南欧斐网络科技有限公司 基于摄像装置拍摄目标图像的标尺定位方法和设备
CN105141843A (zh) * 2015-09-01 2015-12-09 湖南欧斐网络科技有限公司 基于摄像装置拍摄目标图像的标尺定位方法和设备
CN106503703B (zh) * 2015-09-08 2019-12-20 11街股份有限公司 使用终端设备来识别信用卡号码和到期日期的系统和方法
CN106503703A (zh) * 2015-09-08 2017-03-15 Sk普兰尼特有限公司 使用终端设备来识别信用卡号码和到期日期的系统和方法
CN106250894A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 卡片信息识别方法及装置
CN106339705B (zh) * 2016-08-16 2019-07-02 北京小米移动软件有限公司 图片获取方法及装置
CN106339705A (zh) * 2016-08-16 2017-01-18 北京小米移动软件有限公司 图片获取方法及装置
CN108288281A (zh) * 2017-01-09 2018-07-17 翔升(上海)电子技术有限公司 视觉跟踪方法、视觉跟踪装置、无人机以及终端设备
CN107403409A (zh) * 2017-07-21 2017-11-28 苏州科达科技股份有限公司 图像拼接前的图像处理方法、装置及图像拼接方法及装置
CN107403409B (zh) * 2017-07-21 2021-02-02 苏州科达科技股份有限公司 图像拼接前的图像处理方法、装置及图像拼接方法及装置
CN107644183A (zh) * 2017-09-01 2018-01-30 福建联迪商用设备有限公司 一维码cmos摄像引擎的解码方法及终端
WO2019062426A1 (zh) * 2017-09-26 2019-04-04 腾讯科技(深圳)有限公司 边框检测方法、服务器及存储介质
US11328427B2 (en) 2017-09-26 2022-05-10 Tencent Technology (Shenzhen) Company Ltd Border detection method, server and storage medium
CN110945520A (zh) * 2017-12-27 2020-03-31 株式会社日立制作所 生物体认证系统
CN110945520B (zh) * 2017-12-27 2023-12-19 株式会社日立制作所 生物体认证系统
CN112204945A (zh) * 2019-08-14 2021-01-08 深圳市大疆创新科技有限公司 图像处理方法、设备、拍摄装置、可移动平台及存储介质

Also Published As

Publication number Publication date
CN103500337B (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN103500337A (zh) 用于智能无线通信终端的识别四边形边框的方法及装置
CN108985199B (zh) 商品取放操作的检测方法、装置及存储介质
US10956715B2 (en) Decreasing lighting-induced false facial recognition
CN102201053B (zh) 一种文本图像的切边方法
CN106250894B (zh) 卡片信息识别方法及装置
US20100142807A1 (en) Image identification method and imaging apparatus
CN106295638A (zh) 证件图像倾斜校正方法和装置
WO2017071061A1 (zh) 区域识别方法及装置
CN103597500A (zh) 用于辨识对象中的文本信息的系统和方法
CN105631039A (zh) 一种图片浏览方法
CN112165571B (zh) 一种证件图像采集方法、装置和设备
CN110443237B (zh) 证件识别方法、装置、电子设备及计算机可读存储介质
CN105931239A (zh) 图像处理的方法及装置
CN111680635B (zh) 一种文本识别的方法、装置、电子设备和存储介质
CN105678301B (zh) 一种自动识别并分割文本图像的方法、系统及装置
CN114445843A (zh) 固定版式的卡证图像文字识别方法和装置
CN115239683A (zh) 电路板的检测方法、模型训练方法、装置和电子设备
CN113379713B (zh) 证件图像的检测方法及其装置
CN104408427A (zh) 图像四边形识别的方法和装置
CN112308057A (zh) 一种基于文字位置信息的ocr优化方法及系统
JP6669390B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN112396060A (zh) 基于身份证分割模型的身份证识别方法及其相关设备
CN108810307B (zh) 一种边框页码扫描系统
US9514451B2 (en) Method, apparatus and system for information identification
KR101384784B1 (ko) 모바일 기기 카메라 화면의 사물 위치 판단 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 200433, Shanghai, Yangpu District Fudan hi tech Park Road, No. 335, building 11011A room

Patentee after: Shanghai hehe Information Technology Co., Ltd

Address before: 200433, Shanghai, Yangpu District Fudan hi tech Park Road, No. 335, building 11011A room

Patentee before: INTSIG INFORMATION Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 1105-1123, No. 1256, 1258, Wanrong Road, Jing'an District, Shanghai, 200436

Patentee after: Shanghai hehe Information Technology Co., Ltd

Address before: 200433, Shanghai, Yangpu District Fudan hi tech Park Road, No. 335, building 11011A room

Patentee before: Shanghai hehe Information Technology Co., Ltd

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20210420

Address after: Room 1105-1123, No. 1256, 1258, Wanrong Road, Jing'an District, Shanghai, 200436

Patentee after: Shanghai hehe Information Technology Co., Ltd

Patentee after: Shanghai Linguan Data Technology Co.,Ltd.

Address before: Room 1105-1123, No. 1256, 1258, Wanrong Road, Jing'an District, Shanghai, 200436

Patentee before: Shanghai hehe Information Technology Co., Ltd

TR01 Transfer of patent right