发明内容
本发明所要解决的技术问题是:提供一种基于图像匹配和网络查询的识别方法,可提高使用名片识别软件来输入名片信息的通用性、可靠性和便利性。
此外,本发明进一步提供一种基于图像匹配和网络查询的识别系统,可提高使用名片识别软件来输入名片信息的通用性、可靠性和便利性。
为解决上述技术问题,本发明采用如下技术方案:
一种基于图像匹配和网络查询的识别方法,所述方法包括如下步骤:
步骤101,客户端获得名片图像;
步骤102,客户端将名片图像提交上传到网站的服务器;所述服务器存有名片图像及该名片图像对应的名片信息;
步骤103,网站的服务器将所提交的名片图像与该网站服务器存有的名片图像进行匹配,获得一张或多张与所提交的名片图像相似性程度最高的名片图像,以及对应的表示相似性程度的度量的值;
步骤104,网站的服务器根据匹配的结果决定返回给客户端的内容;
步骤105,客户端根据网站的服务器的返回内容来决定名片识别是成功还是失败,若成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果;
步骤106,结束。
作为本发明的一种优选方案,所述步骤103中,网站的服务器经过图像匹配获得一张或多张与所提交的名片图像相似性程度最高的服务器存有的名片图像,以及对应的表示相似性程度的度量的值;
所述表示相似性程度的度量的值是一个大于或等于0的数;
如果所述表示相似性程度的度量的值为0,则表示网站的服务器存有的名片图像中不存在与所提交的名片图像相似的图像,或者说匹配失败;
如果所述表示相似性程度的度量的值大于0,则获得一张或多张与所提交的名片图像相似性程度最高的服务器存有的名片图像,这些名片图像的获得方式是按照表示相似性程度的度量的值的大小进行从大到小的排序,然后选取第一个或多个表示相似性程度的度量的值所对应的名片图像。
作为本发明的一种优选方案,所述步骤103中,网站的服务器将所提交的名片图像与该网站的服务器存有的名片图像进行匹配;方法如下:
所有的名片图像,包括网站的服务器存有的名片图像和客户端所提交的名片图像都要先进行初始化;
所述网站的注册用户将名片图像保存到自己的账户中以后,网站的服务器就对这个名片图像进行初始化,如果初始化失败,则要求用户重新提交另外一张名片图像,或者将这张名片图像标记为不可用;
客户端所提交的名片图像同样要先进行初始化,如果初始化失败,则表示这张名片图像不能进行匹配,返回匹配失败;初始化成功才开始匹配。
作为本发明的一种优选方案,所述初始化步骤包括:
步骤201,在名片图像中查找名片的四条边;
步骤202,判断:是否成功的找到名片的四条边;如果答案为是,转到步骤204,否则转到步骤203;
步骤203,初始化失败,转到步骤206;
步骤204,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化;
步骤205,将归一化后的名片图像二值化,得到仅有黑白两色的二值图像;
步骤206,结束。
作为本发明的一种优选方案,所述步骤204中,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化,是指去除名片的四条边外面的图像背景区域,并将名片的四条边所框住的四边形区域经过坐标变换,变成一个大小统一的长方形图像,从而得到归一化后的名片图像;所述统一的大小由预先的设置确定;
客户端所提交的名片图像经过初始化之后,与同样经过了初始化的服务器存有的名片图像进行匹配,获得表示相似性程度的度量的值,方法是:
比较两张黑白两色的二值图像,统计出它们之间像素值相同的像素的个数totalNum;所述个数totalNum作为两张名片图像的相似性程度的度量,个数totalNum的值越大说明两张名片图像的相似性程度越高,个数totalNum的值越小说明两张名片图像的相似性程度越低。
作为本发明的一种优选方案,所述步骤104中,网站的服务器根据匹配的结果决定返回给客户端的内容;所述网站的服务器决定返回客户端的内容的方式为如下四种方式的一种:
方式之一是网站的服务器将一张或多张与所提交的名片图像匹配程度最高或最相似的服务器存有的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像;在这种方式之下,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果;
方式之二是网站的服务器仅将表示相似性程度的度量的值超过一个预先设定的阈值的名片图像返回给客户端,同样让用户自己去选择其中跟所提交的名片图像完全一致的图像;在这种方式之下,如果网站的服务器没有返回名片图像,或者如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果;
方式之三是仅在与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值超过一个预先设定的阈值时,网站的服务器才返回识别成功的标记,并返回这张名片图像所对应的文字信息;否则网站的服务器返回识别失败的标记;
方式之四是预先设定两个阈值t1和t2,其中t2大于t1;如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值小于t1,则网站的服务器返回识别失败的标记;如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值大于t2,则网站的服务器返回识别成功的标记,并返回这张名片图像所对应的文字信息;其它情况下,则网站的服务器将表示相似性程度的度量的值介于t1和t2之间的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果。
作为本发明的一种优选方案,所述网站中保存的名片图像和名片信息的来源包括:注册用户保存的自己的名片图像和名片信息,注册用户保存的他人的名片图像和名片信息,网站不通过注册用户而直接获得的名片图像和名片信息。
一种基于图像匹配和网络查询的识别方法,所述方法包括如下步骤:
步骤A,客户端获得包含有文字信息的图像;
步骤B,客户端将包含有文字信息的图像提交上传到一服务器;所述服务器存有包含有文字信息的图像及该图像对应的文字信息;
步骤C,所述服务器将客户端提交的包含有文字信息的图像与所述服务器存有的包含有文字信息的图像进行匹配,在服务器存有的图像中获得与所提交的包含有文字信息的图像相似性程度符合设定要求的图像;
步骤D,将从所述服务器中获得的图像对应的文字信息作为识别结果。
作为本发明的一种优选方案,所述步骤C中,匹配的方法为:匹配整个图像;或者,各图像均设定一匹配区域,在匹配时仅匹配该设定区域的图像。
一种基于图像匹配和网络查询的识别系统,所述系统包括:
客户端,用以获得名片图像,而后将获得的名片图像上传至一网站的服务器;
服务器,存有名片图像及该名片图像对应的名片信息;同时用以接收客户端上传的名片图像,并将接收到的名片图像与存有的名片图像进行匹配,获得一张或多张与所提交的名片图像相似性程度最高的名片图像,以及对应的表示相似性程度的度量的值;若匹配成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果。
作为本发明的一种优选方案,所述网站的服务器经过图像匹配获得一张或多张与所提交的名片图像相似性程度最高的服务器存有的名片图像,以及对应的表示相似性程度的度量的值;
所述表示相似性程度的度量的值是一个大于或等于0的数;
如果所述表示相似性程度的度量的值为0,则表示网站的服务器存有的名片图像中不存在与所提交的名片图像相似的图像,或者说匹配失败;
如果所述表示相似性程度的度量的值大于0,则获得一张或多张与所提交的名片图像相似性程度最高的服务器存有的名片图像,这些名片图像的获得方式是按照表示相似性程度的度量的值的大小进行从大到小的排序,然后选取第一个或多个表示相似性程度的度量的值所对应的名片图像。
作为本发明的一种优选方案,所述网站的服务器将所提交的名片图像与该网站的服务器存有的名片图像进行匹配;方法如下:
所有的名片图像,包括网站的服务器存有的名片图像和客户端所提交的名片图像都要先进行初始化;
所述网站的注册用户将名片图像保存到自己的账户中以后,网站的服务器就对这个名片图像进行初始化,如果初始化失败,则要求用户重新提交另外一张名片图像,或者将这张名片图像标记为不可用;
客户端所提交的名片图像同样要先进行初始化,如果初始化失败,则表示这张名片图像不能进行匹配,返回匹配失败;初始化成功才开始匹配。
作为本发明的一种优选方案,所述初始化步骤包括:
步骤201,在名片图像中查找名片的四条边;
步骤202,判断:是否成功的找到名片的四条边;如果答案为是,转到步骤204,否则转到步骤203;
步骤203,初始化失败,转到步骤206;
步骤204,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化;
步骤205,将归一化后的名片图像二值化,得到仅有黑白两色的二值图像;
步骤206,结束。
作为本发明的一种优选方案,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化,是指去除名片的四条边外面的图像背景区域,并将名片的四条边所框住的四边形区域经过坐标变换,变成一个大小统一的长方形图像,从而得到归一化后的名片图像;所述统一的大小由预先的设置确定;
客户端所提交的名片图像经过初始化之后,与同样经过了初始化的服务器存有的名片图像进行匹配,获得表示相似性程度的度量的值,方法是:
比较两张黑白两色的二值图像,统计出它们之间像素值相同的像素的个数totalNum;所述个数totalNum作为两张名片图像的相似性程度的度量,个数totalNum的值越大说明两张名片图像的相似性程度越高,个数totalNum的值越小说明两张名片图像的相似性程度越低。
作为本发明的一种优选方案,所述网站的服务器根据匹配的结果决定返回给客户端的内容;客户端根据网站的服务器的返回内容来决定名片识别是成功还是失败,若成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果;所述网站的服务器决定返回客户端的内容的方式为如下四种方式的一种:
方式之一是网站的服务器将一张或多张与所提交的名片图像匹配程度最高或最相似的服务器存有的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像;在这种方式之下,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果;
方式之二是网站的服务器仅将表示相似性程度的度量的值超过一个预先设定的阈值的名片图像返回给客户端,同样让用户自己去选择其中跟所提交的名片图像完全一致的图像;在这种方式之下,如果网站的服务器没有返回名片图像,或者如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果;
方式之三是仅在与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值超过一个预先设定的阈值时,网站的服务器才返回识别成功的标记,并返回这张名片图像所对应的文字信息;否则网站的服务器返回识别失败的标记;
方式之四是预先设定两个阈值t1和t2,其中t2大于t1;如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值小于t1,则网站的服务器返回识别失败的标记;如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值大于t2,则网站的服务器返回识别成功的标记,并返回这张名片图像所对应的文字信息;其它情况下,则网站的服务器将表示相似性程度的度量的值介于t1和t2之间的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果。
一种基于图像匹配和网络查询的识别系统,所述系统包括:
客户端,用以获得包含有文字信息的图像,而后将获得的包含有文字信息的图像上传至一服务器;
服务器,存有包含有文字信息的图像及该图像对应的文字信息;同时用以接收客户端上传的图像,并将接收到的图像与存有的图像进行匹配,在服务器存有的图像中获得与所提交的包含有文字信息的图像相似性程度符合设定要求的图像;将从所述服务器中获得的图像对应的文字信息作为识别结果。
本发明的实现需要有一个具有维护联系人信息功能的网站。该网站的注册用户可以将自己或他人的一张或多张名片的文字信息连同名片图像一起保存到自己的账户中,所保存的名片文字信息是经过用户自己或者网站管理人员的检查校正,保证正确的。所保存的对应同样的文字信息的名片图像可以有一张或者多张。该网站的用户可以将名片图像上传到特定网站的服务器,由这个服务器对上传的名片图像和该网站的注册用户所保存的名片图像进行图像匹配,找出对应的图像,并返回这个对应的图像中所包含的名片文字信息。
本发明的有益效果在于:本发明提出的基于图像匹配和网络查询的识别方法及系统,作为对基于光学字符识别原理的名片识别技术的补充,为了克服光学字符识别技术的局限性,推出一种在使用名片识别软件来识别名片图像时,将名片图像上传到特定网站的服务器,由这个服务器对上传的名片图像和该网站已有的名片图像进行图像匹配,找出对应的图像,并返回这个对应的图像中所包含的名片文字信息的方法。本发明采用图像匹配的技术,而不采用光学字符识别技术,能有效的处理基于光学字符识别技术无法准确识别的名片,提高了使用名片识别软件来输入名片信息的通用性,可靠性和便利性。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
本发明的实现需要有一个具有维护联系人信息功能的网站,该网站的注册用户可以将自己或他人的一张或多张名片的文字信息连同名片图像一起保存到自己的账户中,所保存的名片文字信息是经过用户自己或者网站管理人员的检查校正,保证正确的。所保存的对应同样的文字信息的名片图像可以有一张或者多张。此外,网站也可以不通过注册用户而通过其他来源直接获得的名片图像和名片信息。
该网站的用户可以将名片图像上传到特定网站的服务器,由这个服务器对上传的名片图像和该网站的注册用户所保存的名片图像进行图像匹配,找出对应的图像,并返回这个对应的图像中所包含的名片文字信息。
请参阅图1,本发明基于图像匹配和网络查询的识别方法包括如下步骤:
【步骤101】客户端获得名片的图像。
【步骤102】客户端将名片图像提交上传到网站的服务器。
【步骤103】网站的服务器将所提交的名片图像与该网站的注册用户保存的名片图像进行匹配,获得一张或多张与所提交的名片图像相似性程度最高的注册用户保存的名片图像,以及对应的表示相似性程度的度量的值。
所述步骤103中,网站的服务器经过图像匹配获得一张或多张与所提交的名片图像相似性程度最高的注册用户保存的名片图像,以及对应的表示相似性程度的度量的值。所述对应的表示相似性程度的度量的值是一个大于或等于0的实数或整数,如果与所提交的名片图像相似性程度最高的注册用户保存的名片图像对应的表示相似性程度的度量的值为0,则表示网站的注册用户保存的名片图像中不存在与所提交的名片图像相似的图像,或者说匹配失败。所述获得一张或多张与所提交的名片图像相似性程度最高的注册用户保存的名片图像,这些名片图像的获得方式是按照表示相似性程度的度量的值的大小进行从大到小的排序,然后选取第一个,或者前面几个表示相似性程度的度量的值所对应的名片图像。
所述步骤103中,网站的服务器将所提交的名片图像与该网站的注册用户保存的名片图像进行匹配,匹配的方法有很多种,在此,我们给出一种匹配的方法作为例子,描述如下:
所有的名片图像,包括网站的注册用户保存的名片图像和客户端所提交的名片图像都要先进行初始化。
所述网站的注册用户将名片图像保存到自己的账户中以后,网站的服务器就对这个名片图像进行初始化,如果初始化失败,则要求用户重新提交另外一张名片图像,或者将这张名片图像标记为不可用。
客户端所提交的名片图像同样要先进行初始化,如果初始化失败,则表示这张名片图像不能进行匹配,返回匹配失败。初始化成功才开始匹配。
如图2所示,所述初始化的步骤如下:
(步骤201)在名片图像中查找名片的四条边。
(步骤202)判断:是否成功的找到名片的四条边?如果答案为是,转到步骤204,否则转到步骤203。
(步骤203)初始化失败,转到步骤206,结束。
(步骤204)根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化。
其中,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一化,是指去除名片的四条边外面的图像背景区域,并将名片的四条边所框住的四边形区域经过坐标变换,变成一个大小统一的长方形图像,从而得到归一化后的名片图像。这个统一的大小可由预先的设置确定,如宽为900像素,高为540像素。将四边形的图像区域经过坐标变换变成一个设定大小的长方形图像区域,这是图像处理中的成熟技术。
客户端所提交的名片图像经过初始化之后就可以跟同样经过了初始化的注册用户保存的名片图像进行匹配,获得表示相似性程度的度量的值,方法是:比较两张黑白两色的二值图像,统计出它们之间像素值相同的像素的个数totalNum。这个totalNum就作为两张名片图像的相似性程度的度量,totalNum的值越大说明两张名片图像的相似性程度越高,totalNum的值越小说明两张名片图像的相似性程度越低。在这里我们仅给出一个比较两张黑白两色的二值图像相似性的简单而直观的方法作为例子,依据图像处理和模式识别的基本原理,还有很多其他的设计更为复杂,可靠性更高的比较方法和相似性度量,在此不一一例举。
(步骤205)将归一化后的名片图像二值化,得到仅有黑白两色的二值图像。
(步骤206)结束。
【步骤104】网站的服务器根据匹配的结果决定返回给客户端的内容。
其中,所述网站的服务器决定返回客户端的内容的方式有如下几种:
方式之一是网站的服务器将一张或多张与所提交的名片图像匹配程度最高(或最相似)的注册用户保存的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像。在这种方式之下,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果。
方式之二是网站的服务器仅将表示相似性程度的度量的值超过一个预先设定的阈值的名片图像返回给客户端,同样让用户自己去选择其中跟所提交的名片图像完全一致的图像。在这种方式之下,如果网站的服务器没有返回名片图像,或者如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果。
方式之三是仅在与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值超过一个预先设定的阈值时,网站的服务器才返回识别成功的标记,并返回这张名片图像所对应的文字信息。否则网站的服务器返回识别失败的标记。
方式之四是预先设定两个阈值t1和t2,其中t2大于t1。如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值小于t1,则网站的服务器返回识别失败的标记。如果与所提交的名片图像匹配程度最高的那张名片图像所对应的表示相似性程度的度量的值大于t2,则网站的服务器返回识别成功的标记,并返回这张名片图像所对应的文字信息。其它情况下,则网站的服务器将表示相似性程度的度量的值介于t1和t2之间的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图像完全一致的图像,如果从网站的服务器返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果。
【步骤105】客户端根据网站的服务器的返回内容来决定名片识别是成功了还是失败了,成功了的话则从网站的服务器获取名片图像对应的文字信息作为识别结果。
【步骤106】结束。
以上介绍了本发明的基于图像匹配和网络查询的识别方法,本发明在揭示上述方法的同时,还揭示一种基于图像匹配和网络查询的识别系统,所述系统包括客户端、服务器。
客户端用以获得名片图像,而后将获得的名片图像上传至一网站的服务器。
服务器存有名片图像及该名片图像对应的名片信息;同时用以接收客户端上传的名片图像,并将接收到的名片图像与存有的名片图像进行匹配,获得一张或多张与所提交的名片图像相似性程度最高的名片图像,以及对应的表示相似性程度的度量的值;若匹配成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果。
上述客户端及服务器的作用流程可参考以上针对方法的介绍,这里不做赘述。
综上所述,本发明提出的基于图像匹配和网络查询的识别方法及系统,作为对基于光学字符识别原理的名片识别技术的补充,为了克服光学字符识别技术的局限性,推出一种在使用名片识别软件来识别名片图像时,将名片图像上传到特定网站的服务器,由这个服务器对上传的名片图像和该网站已有的名片图像进行图像匹配,找出对应的图像,并返回这个对应的图像中所包含的名片文字信息的方法。本发明采用图像匹配的技术,而不采用光学字符识别技术,能有效的处理基于光学字符识别技术无法准确识别的名片,提高了使用名片识别软件来输入名片信息的通用性,可靠性和便利性。
实施例二
本实施例中,本发明方法及系统不但可以用于识别名片中的联系信息,还可以用于识别其他包含有联系信息的图像的识别,甚至可以用于任意包含有文字信息的图像的识别。
本实施例中,本发明基于图像匹配和网络查询的识别方法包括如下步骤:
【步骤A】客户端获得包含有文字信息(如联系信息)的图像;
【步骤B】客户端将包含有文字信息的图像提交上传到一服务器;所述服务器存有包含有文字信息的图像及该图像对应的文字信息;
【步骤C】所述服务器将客户端提交的包含有文字信息的图像与所述服务器存有的包含有文字信息的图像进行匹配,在服务器存有的图像中获得与所提交的包含有文字信息的图像相似性程度符合设定要求的图像。
其中,匹配的方法为:匹配整个图像;或者,各图像均设定一匹配区域,在匹配时仅匹配该设定区域的图像。由于有些名片较为复杂,可以将名片的设定区域设置为专门的识别区域,便于提高识别效率。
【步骤D】将从所述服务器中获得的图像对应的文字信息作为识别结果。
以上步骤的具体实现方式可以参照实施例一中的方式,这里不做赘述。
以上介绍了本发明的基于图像匹配和网络查询的识别方法,本发明在揭示上述方法的同时,还揭示一种基于图像匹配和网络查询的识别系统,所述系统包括客户端、服务器。
客户端用以获得包含有文字信息的图像,而后将获得的包含有文字信息的图像上传至一服务器。
服务器,存有包含有文字信息的图像及该图像对应的文字信息;同时用以接收客户端上传的图像,并将接收到的图像与存有的图像进行匹配,在服务器存有的图像中获得与所提交的包含有文字信息的图像相似性程度符合设定要求的图像;将从所述服务器中获得的图像对应的文字信息作为识别结果。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。