发明内容
基于此,有必要针对上述技术问题,提供一种能够获取图像更多的文本及其形音义特征的图像文本及形音义特征识别方法和装置。
为了实现上述目的,一方面,本发明实施例提供了一种图像文本及形音义特征识别方法,包括以下步骤:
对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串;
按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;
基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征;
选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。
在其中一个实施例中,图像特征描述符为采用相同或高度相似的字符串、对待处理图像中具有相同感知内容或特征进行记录,而采用不同的字符串、对待处理图像中具有不同感知内容或特征进行记录的图像特征表示形式;图像特征表示形式为描述待处理图像的图像特征的一组或多组字符串的集合;
预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则;
组合单元数据为根据预设最小单元组合规则对各最小单元进行组合得到的、用于存储以及作为检索的关键词的字符串数据;
样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;形音义特征包括形状特征、读音特征以及含义特征;
对待处理图像的图像特征描述符进行分割,得到各最小单元的步骤之前还包括步骤:
提取待处理图像的图像特征描述符;
和/或
建立样本图像数据库。
在其中一个实施例中,建立样本图像数据库的步骤包括:
记录样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及形音义特征;
对样本图像进行图像特征描述符分割以及最小单元组合处理,得到样本图像的各最小单元以及样本图像的各组合单元数据。
在其中一个实施例中,图像轮廓线的图像特征描述符的最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,第一预设定长的取值范围为大于或等于图像轮廓线上的线段总长的20%;
图像骨架线的图像特征描述符的最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,第二预设定长的取值范围为大于或等于图像骨架线上的线段总长的20%。
在其中一个实施例中,图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;
最小单元为任一规格的标准坐标系的任一坐标区域所对应图像轮廓线或图像骨架线的一个或多个像素点的位置数据。
在其中一个实施例中,获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率的步骤包括:
获取待处理图像的最小单元的总数,样本图像匹配待处理图像的最小单元合计数,样本图像不匹配待处理图像的最小单元合计数
基于以下公式得到最小单元匹配率:
Ma=(Ua÷U0)×100%
其中,Ma表示最小单元匹配率,U0表示待处理图像的最小单元的总数,Ua表示样本图像匹配待处理图像的最小单元合计数;
基于以下公式得到最小单元不匹配率:
Mi=(Uc÷U0)×100%+(n-1)×ω
其中,Mi表示最小单元不匹配率,U0表示待处理图像的最小单元的总数,Uc表示样本图像不匹配待处理图像的最小单元合计数,n表示样本图像与待处理图像在图像特征线上所不相匹配的处数,ω表示处数的权数;其中,ω的取值范围为小于或等于50%。
在其中一个实施例中,选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像的步骤包括:
选取出最小单元匹配率大于或等于预设最小单元匹配率,且最小单元不匹配率小于或等于预设最小单元不匹配率的各初步匹配样本图像;
对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序,将最小单元匹配率和最小单元不匹配率的排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
在其中一个实施例中,预设应用需求包括预设最小单元匹配率的取值范围、预设最小单元不匹配率的取值范围以及预设排序名次的取值范围;
其中,预设最小单元匹配率的取值范围为大于30%;预设最小单元不匹配率的取值范围为小于70%;预设排序名次的取值范围为前100名以内;
对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序的步骤包括:
对各最小单元匹配率由大至小进行排序,对最小单元不匹配率由小至大进行排序,将排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
另一方面,本发明实施例还提供了一种图像文本及形音义特征识别装置,包括:
分割模块,用于对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串;
组合模块,用于按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;
检索模块,用于基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征;
筛选模块,用于选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述图像文本及形音义特征识别方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图像文本及形音义特征识别方法的步骤。
上述技术方案中的一个技术方案具有如下优点和有益效果:
本发明实施例可以通过现有海量的知识数据信息,从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取,一方面,有效解决对待处理图像的内容特征信息智能化自动识别的问题,实现从以往手工录入到智能化自动识别录入的跨越;同时有效克服过去人工录入易造成图像文本及其形音义特征信息不统一、提取信息易遗漏的缺陷;并且能对规范的文本图像和非规范的文本图像进行有效识别,提高其识别的准确率;本发明实施例能通过大数据的关联信息推定识别出文本图像中不直接显示出的文本图像的读音、文字组合的含义、图形要素编码及其他反映图像形音义特征的信息,改善图像识别结果在图像检索中相同或近似图像的匹配效果,以提高相同或近似图像的查全率、查准率。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
OCR能将规范的文本图像转化为机器可编辑文本的数字形式,但其存在如下局限或缺陷:当对非规范的文本图像进行识别时,其识别的准确率不高;无法识别文本图像中不直显示出的文本图像的读音、文字组合是否具有含义、图形要素编码及其他反映图像形音义特征的信息;从图像中识别出的文字,当作为关键词用于相同或近似图像的检索时,虽能起到一定的检索效果,但由于欠缺其他的图像内容描述,因而造成相同或近似图像的漏检在所难免。
本发明实施例能够基于海量知识数据信息,从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取。
本申请提供的图像文本及形音义特征识别方法,可以应用于如图1所示的应用环境中。其中,终端102可通过网络与服务器104进行通信,便于获取待处理图像、样本图像以及样本图像数据库涉及的相关数据,需要说明的是终端102也可不与服务器104进行通信,可预先将相关数据存储在终端102中,再进行处理即可;其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像文本及形音义特征识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串。
其中,图像特征描述符是一种能够对图像中具有相同感知内容或特征采用相同或高度相似的字符串进行记录而对图像中具有不相同感知内容或特征采用不同的字符串进行记录的一种图像特征表示形式。进一步的,该图像特征表示形式可以是描述待处理图像的图像特征的一组或多组字符串的集合,即图像特征描述符是对图像特征进行描述而得到的一组或多组字符串的集合。需要说明的是,可以采用现有技术方法提取待处理图像的图像特征描述符。
图像特征描述符的最小单元指的是:图像特征描述符的字符串一般用于表示图像的特征点,每一特征点所对应的一个或多个字符串称为图像特征描述符的最小单元。
具体地,图像特征描述符的字符串一般用于表示图像的特征点,每一特征点所对应的一个或多个字符串称为图像特征描述符的最小单元。图像特征描述符所描述的图像特征点一般是多个的,因而图像特征描述符的最小单元也可以是多个。对待处理图像的图像特征描述符进行分割处理的过程可以为:将图像特征描述符所表示的每一图像特征点进行分割,将图像特征描述符的每一图像特征点所对应的每一个或多个字符串视为图像特征描述符的最小单元。
在一个具体的实施例中,图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;
最小单元为任一规格的标准坐标系的任一坐标区域所对应图像轮廓线或图像骨架线的一个或多个像素点的位置数据。
而本发明实施例中的待处理图像可以包括终端当前获取的待处理图像以及样本图像;待处理图像由用户根据实际应用需要进行确定。
步骤204,按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据。
其中,孤立的图像特征描述符的最小单元,可能没有实际应用意义,但是基于本发明实施例,按照预设最小单元组合规则对各最小单元进行组合,获取最小单元的组合单元,使组合后的图像特征描述符的最小单元组合具有特定的含义。
具体而言,可以根据应用的需要,建立预设的图像特征描述符的最小单元组合规则;进一步的,按预设的图像特征描述符的最小单元组合规则进行组合,获取图像特征描述符的组合单元数据。
需要说明的是,本发明实施例所获取图像特征描述符的最小单元组合数据可以用于表示一个连通域组合单元数据,也可表示一个线段组合单元数据,还可以表示用于进行存储处理的字符串数据。
进一步的,预设最小单元组合规则可以包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则。
而在一个具体的实施例中,图像轮廓线的图像特征描述符的最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,第一预设定长的取值范围为大于或等于图像轮廓线上的线段总长的20%;
图像骨架线的图像特征描述符的最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,第二预设定长的取值范围为大于或等于图像骨架线上的线段总长的20%。
步骤206,基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征。
其中,匹配指的是待处理图像与样本图像的组合单元数据是相同的;最小单元匹配率指的是样本图像与待处理图像匹配的最小单元占比;最小单元不匹配率指的是样本图像与待处理图像不匹配的最小单元占比。而形音义特征可以包括形状特征、读音特征以及含义特征。
在一个具体实施例中,获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率的步骤可以包括:
获取待处理图像的最小单元的总数,样本图像匹配待处理图像的最小单元合计数,样本图像不匹配待处理图像的最小单元合计数
可基于以下公式得到最小单元匹配率:
Ma=(Ua÷U0)×100%
其中,Ma表示最小单元匹配率,U0表示待处理图像的最小单元的总数,Ua表示样本图像匹配待处理图像的最小单元合计数;
可基于以下公式得到最小单元不匹配率:
Mi=(Uc÷U0)×100%+(n-1)×ω
其中,Mi表示最小单元不匹配率,U0表示待处理图像的最小单元的总数,Uc表示样本图像不匹配待处理图像的最小单元合计数,n表示样本图像与待处理图像在图像特征线上所不相匹配的处数,ω表示处数的权数;其中,ω的取值范围为小于或等于50%。
具体的,本发明实施例以组合单元数据作为检索关键词,对样本图像数据库进行检索,获取初步相匹配的样本图像,以及该样本图像的图像特征描述符、最小单元、组合单元数据以及该样本图像关联的文本及其形音义特征信息。
进一步的,若待处理图像是样本图像,可以按照步骤202以及步骤204,对样本图像做图像特征描述符提取、分割、组合的预处理,将预处理所获取的最小单元的组合单元数据存储于样本图像数据库。
若待处理图像是输入图像,则将上述获取的最小单元的组合单元数据的集合作为检索关键词,对样本图像数据库进行检索,找出与输入图像的最小单元的组合单元数据相匹配的样本图像的最小单元的组合单元数据记录,并获取该初步匹配样本图像和该样本图像关联的文本及其形音义特征信息。
通过上述检索匹配过程,本发明实施例可以从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取,有效解决对待处理图像的内容特征信息识别不足,克服传统技术方法可能会造成图像文本及其形音义特征信息提取遗漏的缺陷,能对规范的文本图像和非规范的文本图像进行有效识别,提高其识别的准确率;能通过大数据的关联信息推定识别出文本图像中不直接显示出的文本图像的读音、文字组合的含义、图形要素编码及其他反映图像形音义特征的信息,改善图像识别结果在图像检索中相同或近似图像的匹配效果,以提高相同或近似图像的查全率、查准率。
步骤208,选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。
其中,可根据应用需要,预设最小单元匹配率和最小单元不匹配率的筛选范围。
具体而言,获取每一初步匹配的样本图像与待处理图像的最小单元匹配率和不匹配率。并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。
进一步的,选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像的步骤可以包括:
选取出最小单元匹配率大于或等于预设最小单元匹配率,且最小单元不匹配率小于或等于预设最小单元不匹配率的各初步匹配样本图像;
对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序,将最小单元匹配率和最小单元不匹配率的排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
在一个具体实施例中,预设应用需求包括预设最小单元匹配率的取值范围、预设最小单元不匹配率的取值范围以及预设排序名次的取值范围;
其中,预设最小单元匹配率的取值范围为大于30%;预设最小单元不匹配率的取值范围为小于70%;预设排序名次的取值范围为前100名以内;
此外,对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序的步骤可以包括:
对各最小单元匹配率由大至小进行排序,对最小单元不匹配率由小至大进行排序,将排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
即基于本发明实施例,将匹配率和不匹配率的排序名次符合预设排序名次的匹配样本图像视为与待处理图像相同或高度相似的图像,并将该匹配样本图像已记录的文本及其形音义特征信息推定为待处理图像的文本及其形音义特征信息。
上述图像文本及形音义特征识别方法中,能获取图像更多的文本及其形音义特征信息,有效解决图像内容特征信息更多的识别和描述,克服传统OCR技术方法仅提取文本图像文字信息的局限或缺陷,改善图像识别结果在图像检索中相同或近似图像的匹配效果,以提高相同或近似图像的查全率。
在一个实施例中,如图3所示,提供了一种图像文本及形音义特征识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S302,建立样本图像数据库。
具体而言,建立样本图像数据库,在一个具体的实施例中,可以包括以下步骤:
记录样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及形音义特征;
对样本图像进行图像特征描述符分割以及最小单元组合处理,得到样本图像的各最小单元以及样本图像的各组合单元数据。
具体而言,在建立样本图像数据库过程中,记录样本图像可认读的文字内容、读音、文字组合的含义、商标图形要素编码、图像信息编码及反映图像形音义特征的其他信息;其中,样本图像可以包括:商标图样、外观设计图样、著作权登记的美术作品图样、每个汉语文字构成的图样、每个非汉语文字构成的图样、用户预设自定义的图像;而样本图像数据库可以包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;形音义特征包括形状特征、读音特征以及含义特征;
其中,商标样本图像数据库收录的样本数据可以包括:已申请的商标和已注册的商标,这些商标的标识图样及其可认读的文字内容、读音、文字组合的含义、商标图形要素编码及反映图像形音义特征的其他信息。
而形音义特征可以包括:形状特征、读音特征、含义特征。
进一步的,商标构成要素样本图像数据库收录的样本数据包括:每个汉语文字构成的图样、每个非汉语文字构成的图样、基础素材图样、用户预设自定义的图样、这些图样可认读的文字内容、读音、文字组合的含义、商标图形要素编码及反映图像形音义特征的其他信息。
在样本图像数据库中,可运用现有的技术方法,对所收录的样本图像信息记录其可认读的文字内容、读音、文字组合的含义,还可利用专业人员对样本图像划分其商标图形要素编码以及记录反映其图像形音义特征的其他信息。
其中,商标图形要素编码是指依据《建立商标图形要素国际分类维也纳协定》所产生的一种商标图形要素划分工具,由商标图形要素按大类、小类及组分类的一览表组成,其中包括商标图形要素编号和商标图形要素名称。
在实际应用中,通常以上数据信息是已知的和海量的,并且构成规模庞大的样本图像大数据,这些数据均可成为本技术方案所依据的样本图像数据。
步骤S304,对待处理图像分别做图像特征描述符提取、分割、组合处理,获取最小单元组合单元数据;
具体而言,如图4、图5所示,随机给出若干待处理图像,第一示例性图像是华为技术有限公司的商标图样,第二示例性图像是“长城”由隶书体文字所构成的图形商标,这些图样均可成为本发明的实施例待处理图像。
在本发明的实施例中,结合图4、图5说明对待处理图像分别做图像特征描述符提取、分割、组合处理的具体实现过程:
一、对待处理图像的图像特征描述符可以采用现有技术方法进行提取。
以图4为例,可采用申请号为201710553007X的发明专利《一种图像轮廓线描述符的获取方法、装置》提取的图像特征描述符或图像轮廓线描述符,其中,该轮廓线基于10×10规格的标准坐标系的图像特征描述符是:
3,4,5,15,25,35,45,55,65,55,45,44,34,24,23,13;
6,7,8,18,28,27,37,47,56,66,56,46,36,26,16;
12,23,33,34,44,54,55,65,64,54,53,43,42,32,31,21,22;
19,29,30,40,50,49,48,58,57,67,66,56,57,47,37,38,28,29;
41,42,52,53,54,64,65,64,63,62,61,51;
49,50,60,70,69,68,67,57,58,59;
62,63,64,65,74,73,83,82,72;
67,68,69,70,80,79,89,88,78,77;
81,82,92,91;
82,83,93,94,84,94,93,92;
84,85,95,96,95,94;
85,95;
86,96,97,87,97,98,88,98,97,87,97,96;
88,89,90,89,90,100,99,100,99,98;
90,100。
该轮廓线基于20×20规格的标准坐标系的图像特征描述符是:
7,8,9,30,50,70,90,110,130,150,170,190,210,230,250,230,229,209,189,188,168,148,147,127,107,106,86,66,46,26,27;
12,13,14,34,35,55,75,95,115,114,134,154,174,173,193,212,232,231,251,231,211,191,171,151,131,111,91,71,51,52,32;
44,64,85,105,106,126,127,147,167,168,188,208,209,229,249,248,228,227,206,205,185,184,164,163,143,142,122,102,82,83,63;
58,78,98,99,119,139,159,179,178,198,197,196,216,215,235,234,233,253,252,232,233,213,193,194,174,154,155,135,115,116,96,97,77;
161,162,182,183,184,204,205,225,226,227,247,248,269,268,267,266,265,264,263,243,242,222,221,201,181;
179,180,200,220,240,260,259,258,278,277,276,275,274,273,253,254,234,235,236,216,217,197,198,199;
263,264,265,266,267,268,269,288,287,307,306,325,324,304,303,283;
273,274,275,276,277,278,279,299,298,318,317,337,336,315,314,294,293;
321,341,342,343,323,324,344,364,384,383,363,362,361,381,361,341;
324,325,345,365,385,386,367,347,327,347,367,387,386,385,384,364,344;
329,330,350,370,371,391,390,370,369,388,368,348,349;349,350,370,369;
331,332,352,372,373,353,333,334,354,374,375,355,335,336,356,376,375,395,394,374,354,353,373,393,392,372,371,351;
337,338,339,359,358,357,358,359,379,378,377,398,399,398,397,377,376,356,357;
340,360,380,400,380,360。
图6是图4图像轮廓线上像素点的位置数据与10×10规格的标准坐标系坐标区域的对应关系图像。
图7是图4图像轮廓线上像素点的位置数据与20×20规格的标准坐标系坐标区域的对应关系图像。
以图5为例,可采用申请号为201710553007X的发明专利《一种图像轮廓线描述符的获取方法、装置》提取的图像特征描述符或图像轮廓线描述符,其中,该轮廓线基于10×10规格的标准坐标系的图像特征描述符是:
6,7,17,27,37,27,28,18,8,9,19,29,30,40,39,49,39,40,50,60,59,69,70,80,90,100,99,89,79,89,88,98,88,78,88,87,97,96,86,87,77,67,77,76,75,65,66,56,46,36,26,16;
38,48;
47,57;
58,68;
58,59,69,79,78,68;
2,12,22,23,13,14,4,14,24,23,33,32,42,43,44,34,35,45,55,54,53,63,64,74,75,85,95,94,84,74,73,83,93,92,82,72,62,52,51,41,31,41,42,32,22,12;
52,53,52,53,63,73,72,62;
9,10,20,19,29,19。
该轮廓线基于20×20规格的标准坐标系的图像特征描述符是:
16,17,37,57,77,97,98,118,119,120,140,160,159,158,157,177,197,198,178,158,159,179,199,219,239,238,258,278,279,299,319,320,340,360,380,400,399,398,378,358,338,337,317,337,357,356,376,356,355,335,315,316,315,295,315,335,334,354,374,373,372,352,332,333,313,293,294,274,273,293,292,312,311,291,290,270,251,252,232,212,192,191,171,151,131,132,112,92,72,52,32,33,53,73,93,113,133,134,114,94,95,115,116,96,76,56,36;
155,156,176,175;
173,174,194,214,234,233,213,193;
215,216,236,256,276,275,255,235;
216,217,237,257,277,297,296,276,256,236;
3,4,24,44,64,84,85,65,66,46,47,27,28,48,68,88,87,107,106,126,125,124,144,164,165,166,167,168,148,149,169,189,209,208,207,206,205,225,226,246,247,267,268,288,289,309,310,330,350,370,390,389,388,368,367,347,327,307,306,326,345,365,364,384,383,363,343,323,303,283,263,243,223,203,202,222,221,201,181,161,141,142,162,163,143,123,103,83,63,43,23;
204,205,204,224,225,245,265,266,286,285,305,304,284,264,244,224;
18,19,39,59,79,78,98,97,77,78,58,38。
图8是图5图像轮廓线上像素点的位置数据与10×10规格的标准坐标系坐标区域的对应关系图像。
图9是图5图像轮廓线上像素点的位置数据与20×20规格的标准坐标系坐标区域的对应关系图像。
二、对待处理图像的图像特征描述符进行分割;
如上例中,图像的图像特征描述符用于表示图像轮廓线某一像素点的位置数据与某一规格的标准坐标系坐标区域的对应关系这一图像的特征点,因此,可以将每一规格的标准坐标系的一个坐标区域所对应图像轮廓线一个或多个像素点的位置数据视为图像特征描述符的最小单元。
如图6为例,该轮廓线基于10×10规格的标准坐标系的图像特征描述符中的“3,4,5,15,25,35,45,55,65,55,45,44,34,24,23,13”的图像特征描述符的最小单元分别为描述符中的每一个数字,即:“3”、“4”、“5”、“15”、“25”、“35”、“45”、“55”、“65”、“55”、“45”、“44”、“34”、“24”、“23”、“13”。
又如图7为例,该轮廓线基于20×20规格的标准坐标系的图像特征描述符中的“7,8,9,30,50,70,90,110,130,150,170,190,210,230,250,230,229,209,189,188,168,148,147,127,107,106,86,66,46,26,27”的图像特征描述符的最小单元分别为描述符中的每一个数字,即:“7”、“8”、“9”、“30”、“50”、“70”、“90”、“110”、“130”、“150”、“170”、“190”、“210”、“230”、“250”、“230”、“229”、“209”、“189”、“188”、“168”、“148”、“147”、“127”、“107”、“106”、“86”、“66”、“46”、“26”、“27”。
三、对待处理图像的图像特征描述符的最小单元进行组合;
获取最小单元组合单元处理具体方法包括:
第一,根据应用的需要,建立预设的图像特征描述符的最小单元组合规则,其中,预设的图像特征描述符的最小单元组合规则具体包括:
图像轮廓线的图像特征描述符的最小单元组合规则包括:1)每一个图像轮廓线上的全部线段视为一个图像整体组合单元;2)每一个图像轮廓线上的闭环线视为一个连通域组合单元;3)每一第一预设定长的图像轮廓线上的线段视为一个线段组合单元,其中,第一预设定长可在其线段总长的20%及以上取值。
图像骨架线的图像特征描述符的最小单元组合规则包括:1)每一个图像骨架线上的全部线段视为一个图像整体组合单元;2)每一个图像骨架线上不间断的连线视为一个连通域组合单元;3)每一第二预设定长的图像骨架线上的线段视为一个线段组合单元,其中,第二预设定长可在其线段总长的20%及以上取值。
第二,按前述预设的图像特征描述符的最小单元组合规则,将图像特征描述符的最小单元进行组合,分别获取图像特征描述符的组合单元数据。
在本发明的一些实施例中,所获取图像特征描述符的最小单元组合数据可以用于表示一个连通域组合单元数据,也可表示一个线段组合单元数据。
如图6中该轮廓线基于10×10规格的标准坐标系的图像特征描述符为例,每个连通域组合单元包括如下:
“3,4,5,15,25,35,45,55,65,55,45,44,34,24,23,13”,
“6,7,8,18,28,27,37,47,56,66,56,46,36,26,16”,
“12,23,33,34,44,54,55,65,64,54,53,43,42,32,31,21,22”,
“19,29,30,40,50,49,48,58,57,67,66,56,57,47,37,38,28,29”,
“41,42,52,53,54,64,65,64,63,62,61,51”,
“49,50,60,70,69,68,67,57,58,59”,
“62,63,64,65,74,73,83,82,72”,
“67,68,69,70,80,79,89,88,78,77”,
“81,82,92,91”,
“82,83,93,94,84,94,93,92”,
“84,85,95,96,95,94”,
“85,95”,
“86,96,97,87,97,98,88,98,97,87,97,96”,
“88,89,90,89,90,100,99,100,99,98”,
“90,100”。
步骤S306,以最小单元组合单元数据作为检索关键词,对样本图像数据库进行检索,获取初步相匹配的样本图像的最小单元的组合单元数据、匹配样本图像及该样本图像关联的文本及其形音义特征信息;
具体而言,如果待处理图像是样本图像,可以对样本图像做图像特征描述符提取、分割、组合的预处理,将预处理所获取的最小单元的组合单元数据存储于样本图像数据库。
如果待处理图像是输入图像,则将上述获取的最小单元的组合单元数据的集合作为检索关键词,对样本图像数据库进行检索,找出与输入图像的最小单元的组合单元数据相匹配的样本图像的最小单元的组合单元数据记录,并获取该初步匹配样本图像和该样本图像关联的文本及其形音义特征信息。
步骤S308,计算每一样本图像与待处理图像的最小单元匹配率和最小单元不匹配率,将达到或大于预设最小单元匹配率和达到或小于预设最小单元不匹配率的初步匹配样本图像作为匹配样本图像;
具体而言,根据检索结果所获取每一样本图像与待处理图像相匹配的组合单元数据,分别找出待处理图像最小单元总数、检索结果的样本图像中相匹配的最小单元合计数、检索结果的样本图像中不相匹配的最小单元合计数、检索结果的样本图像与待处理图像在图像特征线上所不相匹配的处数。
按如下公式计算每一样本图像与待处理图像相匹配的最小单元匹配率:
Ma=(Ua÷U0)×100%
其中,Ma表示最小单元匹配率,U0表示待处理图像最小单元总数,Ua表示检索结果初步匹配样本图像中相匹配的特征描述符最小单元合计数;
Mi=(Uc÷U0)×100%+(n-1)×ω
其中,Mi表示最小单元不匹配率,U0表示待处理图像最小单元总数,Uc表示检索结果的样本图像特征描述符中所不相匹配的最小单元数,n表示检索结果的样本图像与待处理图像在特征线上所不相匹配的处数,ω表示不相匹配处数的权数;其中,ω的取值范围在小于50%以下取值。
在实际应用中,可根据应用需要预设最小单元匹配率和最小单元不匹配率,一般地,预设最小单元匹配率在大于30%取值,预设最小单元不匹配率在小于70%取值。
经上述计算后,可以将达到或大于预设最小单元匹配率和达到或小于预设最小单元不匹配率的初步匹配样本图像作为匹配样本图像,并获取匹配样本图像和该样本图像关联的文本及其形音义特征信息。
步骤S310,将匹配率和不匹配率的排序名次符合预设排序名次的匹配样本图像视为与待处理图像相同或高度相似的图像,将该匹配样本图像已记录的文本及其形音义特征信息推定为待处理图像的文本及其形音义特征信息。
具体而言,对匹配样本图像所对应的最小单元匹配率和最小单元不匹配率进行排序。
将最小单元匹配率由大至小排序名次符合预设排序名次和最小单元不匹配率由小至大排序名次符合预设排序名次的匹配样本图像视为与待处理图像相同或高度相似的图像,其中,预设最小单元匹配率排序名次和最小单元不匹配率排序名次可根据应用需要确定,一般在前100名以内取值,并将该排序名次内的匹配样本图像已记录的文本及其形音义特征信息推定为待处理图像的文本及其形音义特征信息。
上述图像文本及形音义特征识别方法中,可以通过现有海量的知识数据信息,从形音义方面对待处理图像进行文本识别和其形音义特征信息的推定获取,一方面,有效解决对待处理图像的内容特征信息智能化自动识别的问题,实现从以往手工录入到智能化自动识别录入的跨越;同时有效克服过去人工录入易造成图像文本及其形音义特征信息不统一、提取信息易遗漏的缺陷;并且能对规范的文本图像和非规范的文本图像进行有效识别,提高其识别的准确率;本发明实施例能通过大数据的关联信息推定识别出文本图像中不直接显示出的文本图像的读音、文字组合的含义、图形要素编码及其他反映图像形音义特征的信息,改善图像识别结果在图像检索中相同或近似图像的匹配效果,以提高相同或近似图像的查全率、查准率。
应该理解的是,虽然图2、图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种图像文本及形音义特征识别装置,包括:
分割模块110,用于对待处理图像的图像特征描述符进行分割,得到各最小单元;最小单元为对应图像特征描述符所表示的任一图像特征点的一个或多个字符串;
组合模块120,用于按照预设最小单元组合规则对各最小单元进行组合,得到各组合单元数据;
检索模块130,用于基于组合单元数据检索样本图像数据库,得到匹配组合单元数据的样本图像,并获取样本图像与待处理图像的最小单元匹配率、最小单元不匹配率;样本图像数据库包含样本图像的各最小单元、样本图像的各组合单元数据和样本图像已记录的文本及形音义特征;
筛选模块140,用于选取出最小单元匹配率以及最小单元不匹配率满足预设应用需求的样本图像,并将选取出的样本图像已记录的文本及形音义特征作为待处理图像的文本及形音义特征。
在一个具体实施例中,图像特征描述符为描述待处理图像的图像特征的一组或多组字符串的集合;
预设最小单元组合规则包括图像轮廓线的图像特征描述符的最小单元组合规则和图像骨架线的图像特征描述符的最小单元组合规则;
组合单元数据为用于存储以及作为检索的关键词的字符串数据;
样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;样本图像数据库包括商标样本图像数据库、商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;形音义特征包括形状特征、读音特征以及含义特征;
图像文本及形音义特征识别装置还包括:
提取模块,用于提取待处理图像的图像特征描述符;
和/或
数据库建立模块,用于建立样本图像数据库。
在一个具体实施例中,数据库建立模块,用于记录样本图像的可认读的文字内容、读音、文字组合的含义,商标图形要素编码,图像信息编码以及形音义特征;以及对样本图像进行图像特征描述符分割以及最小单元组合处理,得到样本图像的各最小单元以及样本图像的各组合单元数据。
在一个具体实施例中,图像轮廓线的图像特征描述符的最小单元组合规则包括:将图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,第一预设定长的取值范围为大于或等于图像轮廓线上的线段总长的20%;
图像骨架线的图像特征描述符的最小单元组合规则包括:将图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,第二预设定长的取值范围为大于或等于图像骨架线上的线段总长的20%。
在一个具体实施例中,图像特征描述符为用于表示图像轮廓线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;
最小单元为任一规格的标准坐标系的任一坐标区域所对应图像轮廓线或图像骨架线的一个或多个像素点的位置数据。
在一个具体实施例中,检索模块还用于获取待处理图像的最小单元的总数,样本图像匹配待处理图像的最小单元合计数,样本图像不匹配待处理图像的最小单元合计数;
并基于以下公式得到最小单元匹配率:
Ma=(Ua÷U0)×100%
其中,Ma表示最小单元匹配率,U0表示待处理图像的最小单元的总数,Ua表示样本图像匹配待处理图像的最小单元合计数;
以及基于以下公式得到最小单元不匹配率:
Mi=(Uc÷U0)×100%+(n-1)×ω
其中,Mi表示最小单元不匹配率,U0表示待处理图像的最小单元的总数,Uc表示样本图像不匹配待处理图像的最小单元合计数,n表示样本图像与待处理图像在图像特征线上所不相匹配的处数,ω表示处数的权数;其中,ω的取值范围为小于或等于50%。
在一个具体实施例中,筛选模块,还用于选取出最小单元匹配率大于或等于预设最小单元匹配率,且最小单元不匹配率小于或等于预设最小单元不匹配率的各初步匹配样本图像;以及对各初步匹配样本图像的最小单元匹配率进行排序,对各初步匹配样本图像的最小单元不匹配率进行排序,将最小单元匹配率和最小单元不匹配率的排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
在一个具体实施例中,预设最小单元匹配率的取值范围为大于30%;预设最小单元不匹配率的取值范围为小于70%;预设排序名次的取值范围为前100名以内;
筛选模块,还用于对各最小单元匹配率由大至小进行排序,对最小单元不匹配率由小至大进行排序,将排序名次符合预设排序名次的初步匹配样本图像作为满足预设应用需求的样本图像。
关于图像文本及形音义特征识别装置的具体限定可以参见上文中对于图像文本及形音义特征识别方法的限定,在此不再赘述。上述图像文本及形音义特征识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、数据库、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本图像数据库等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像文本及形音义特征识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述图像文本及形音义特征识别方法中的各步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图像文本及形音义特征识别方法中的各步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。