通过网络查询自动校正识别结果的方法及系统
技术领域
本发明属于文字识别技术领域,涉及一种网络系统,尤其涉及一种通过网络查询自动校正识别结果的方法;同时,本发明还涉及一种通过网络查询自动校正识别结果的系统。
背景技术
名片是人们经常使用的一种记载和传递联系方式的媒体,在日常商务活动中往往会涉及大量的名片交换,人们通过名片交换的方式来传递联系方式,跟其他人建立联系。
目前已经在手机和微机中广泛使用的名片识别技术利用图像处理和光学字符识别(OCR,Optical Character Recognition)的原理,对相机拍摄或扫描仪扫描得到的名片图像自动进行处理和识别,然后自动提取出其中的姓名,电话,ema il等有用信息来加入到地址簿中去,为人们在电子设备中输入名片上记载的联系信息提供了很大的方便。一个例子如多普达Touch Diamond手机中预装的名片识别软件。
名片识别软件对名片图像自动进行处理和识别,其识别结果是不可能达到100%的准确率的,因而,总是需要用户在保存识别出来的信息之前先对识别结果进行人工的检查和校正,以保证所保存信息的正确性,否则的话,保存下来的电话号码,email地址,网址等等中间哪怕仅仅错了一个符号,也成为无效的信息了。这种人工的检查和校正给使用名片识别软件的人带来很大的不便。
目前各种具有保存联系人信息功能的网站,如各种社交网站在人们日常生活中的使用也已经非常普及了,如国内的QQ,开心网,国外的facebook,twitter,MSN等。用户先进行注册,成为网站的注册用户,每个注册用户都会有一个联系人列表,同时每个注册用户自己的联系信息也会纪录在他的账号信息中。
发明内容
本发明所要解决的技术问题是:提供一种通过网络查询自动校正识别结果的方法,可提高使用名片识别软件来输入名片信息的可靠性和便利性。
此外,本发明还提供一种通过网络查询自动校正识别结果的系统,可提高使用名片识别软件来输入名片信息的可靠性和便利性。
为解决上述技术问题,本发明采用如下技术方案:
一种通过网络查询自动校正识别结果的方法,所述方法包括如下步骤:
步骤101,使用名片识别软件自动识别名片的图像;
步骤102,将名片识别软件得到的识别结果提交网站的服务器,要求进行查询;
步骤103,网站的服务器根据所提交的识别结果来查询该网站保存的名片信息,如果找到与识别结果相匹配的名片信息,则返回正确的名片信息,转到步骤104,否则返回查询失败,转到步骤105;
步骤104,名片识别软件将返回的正确的名片信息显示给用户,在得到用户确认后依据返回的正确的名片信息对识别结果进行自动校正;或者,名片识别软件将识别的名片信息进行自动校正;
步骤105,名片识别软件提示用户网络查询校正失败。
作为本发明的一种优选方案,所述步骤101中,用户使用名片识别软件自动识别名片的图像;所述名片的图像来自相机拍摄,或者扫描仪扫描;
所述名片识别软件运行在移动设备上,或运行在计算机上,或运行在网站的服务器上,由网站的服务器使用名片识别软件对用户提交的名片图像进行识别并将识别结果返回给用户。
作为本发明的一种优选方案,所述步骤103中,网站的服务器根据名片识别软件提交的识别结果来查询该网站保存的名片信息,以确定能不能找到与识别结果相匹配的名片信息,具体步骤如下:
步骤201,获取该网站保存的一张名片信息;
步骤202,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与所述名片信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤203,判断识别结果与所述名片信息是否相匹配,如果答案为是,则转到步骤204,否则转到步骤205;
步骤204,将这个名片信息作为正确的名片信息返回,并转到207;
步骤205,判断是否已经检查了该网站保存的所有名片信息,如果答案为是,则转到步骤206;否则转到步骤201去获取并匹配该网站保存的下一个名片信息;
步骤206,返回查询失败,并转到207;
步骤207,结束。
作为本发明的一种优选方案,所述步骤202中,所述部分信息不一致指不一致的字符个数不超过该项字符总个数的八分之一。
作为本发明的一种优选方案,所述步骤203中,判断识别结果与所述网站保存的名片信息是否相匹配的方法是:
如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于网站保存的名片信息中包含的信息项目数的一半,则认为识别结果与所述网站保存的名片信息相匹配;否则认为不相匹配。
作为本发明的一种优选方案,步骤104中,所述自动校正的方法为:直接用网站返回的正确结果代替识别结果。
作为本发明的一种优选方案,所述网站中保存的名片图像和名片信息的来源包括:注册用户保存的自己的名片图像和名片信息,注册用户保存的他人的名片图像和名片信息,网站不通过注册用户而直接获得的名片图像和名片信息。
一种通过网络查询自动校正识别结果的方法,所述方法包括如下步骤:
步骤A,使用文字识别单元自动识别包含有文字信息的图像;
步骤B,将文字识别单元得到的识别结果提交至一服务器;
步骤C,所述服务器根据所提交的识别结果,检索该服务器内保存的文字信息;如果找到与识别结果相匹配的文字信息,则返回正确的文字信息,转到步骤D,否则返回查询失败,转到步骤E;
步骤D,文字识别单元将返回的正确的文字信息显示给用户,在得到用户确认后依据返回的正确的文字信息对识别结果进行自动校正;或者,文字识别单元直接将识别的文字信息进行自动校正;
步骤E,文字识别单元提示用户网络查询校正失败。
作为本发明的一种优选方案,所述步骤C中,服务器根据文字识别单元提交的识别结果来查询所述服务器保存的文字信息,以确定能不能找到与识别结果相匹配的文字信息,具体步骤如下:
步骤C1,获取服务器保存的一个文字信息;
步骤C2,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与步骤C1获取的所述文字信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤C3,判断识别结果与所述文字信息是否相匹配,如果答案为是,则转到步骤C4,否则转到步骤C5;
步骤C4,将该文字信息作为正确的文字信息返回,并转到C7;
步骤C5,判断是否已经检查服务器保存的所有文字信息,如果答案为是,则转到步骤C6;否则转到步骤C1去获取并匹配服务器保存的下一个文字信息;
步骤C6,返回查询失败,并转到C7;
步骤C7,结束。
作为本发明的一种优选方案,所述步骤C3中,判断识别结果与所述服务器保存的文字信息是否相匹配的方法是:
如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于服务器保存的文字信息中包含的信息项目数的一半,则认为识别结果与所述服务器保存的文字信息相匹配;否则认为不相匹配。
一种通过网络查询自动校正识别结果的系统,所述系统包括客户端、服务器;所述客户端或/和服务器包括名片识别单元;
用户通过客户端的名片识别单元识别名片中的联系信息,或者用户通过客户端上传名片信息至服务器,由服务器的名片识别单元识别名片中的联系信息;
所述系统进一步包括:
-名片匹配单元,用以根据所述名片识别单元提交的识别结果为关键字,来查询该网站保存的名片信息,如果找到与识别结果相匹配的名片信息,则返回正确的名片信息,否则返回查询失败;
-校正单元,用以根据所述名片匹配单元返回的正确的名片信息对识别结果进行自动校正;
所述名片匹配单元设置于服务器中,所述校正单元设置于服务器或客户端中。
作为本发明的一种优选方案,所述名片匹配单元根据名片识别软件提交的识别结果来查询该网站保存的名片信息,以确定能不能找到与识别结果相匹配的名片信息,具体步骤如下:
步骤201,获取该网站保存的一张名片信息;
步骤202,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与所述名片信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤203,判断识别结果与所述名片信息是否相匹配,如果答案为是,则转到步骤204,否则转到步骤205;
步骤204,将这个名片信息作为正确的名片信息返回,并转到207;
步骤205,判断是否已经检查了该网站保存的所有名片信息,如果答案为是,则转到步骤206;否则转到步骤201去获取并匹配该网站保存的下一个名片信息;
步骤206,返回查询失败,并转到207;
步骤207,结束。
作为本发明的一种优选方案,所述步骤203中,判断识别结果与所述网站保存的名片信息是否相匹配的方法是:如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于网站保存的名片信息中包含的信息项目数的一半,则认为识别结果与所述网站保存的名片信息相匹配;否则认为不相匹配。
一种通过网络查询自动校正识别结果的系统,所述系统包括客户端、服务器;所述客户端或/和服务器包括文字识别单元;
用户通过客户端的文字识别单元识别图像中的文字信息,或者用户通过客户端上传包含有文字信息的图像至服务器,由服务器的文字识别单元识别图像中的文字信息;
所述系统进一步包括:
-匹配单元,用以根据所述文字识别单元提交的识别结果为关键字,查询所述服务器保存的文字信息,如果找到与识别结果相匹配的文字信息,则返回正确的文字信息,否则返回查询失败;
-校正单元,用以根据所述匹配单元返回的正确的文字信息对识别结果进行自动校正;
所述匹配单元设置于服务器中,所述校正单元设置于服务器或客户端中。
作为本发明的一种优选方案,所述匹配单元根据文字识别单元提交的识别结果来查询所述服务器保存的文字信息,以确定能不能找到与识别结果相匹配的文字信息,具体步骤如下:
步骤C1,获取服务器保存的一个文字信息;
步骤C2,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与步骤C1获取的所述文字信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤C 3,判断识别结果与所述文字信息是否相匹配,如果答案为是,则转到步骤C4,否则转到步骤C5;
步骤C4,将该文字信息作为正确的文字信息返回,并转到C7;
步骤C5,判断是否已经检查服务器保存的所有文字信息,如果答案为是,则转到步骤C6;否则转到步骤C1去获取并匹配服务器保存的下一个文字信息;
步骤C6,返回查询失败,并转到C7;
步骤C7,结束。
作为本发明的一种优选方案,所述步骤C3中,判断识别结果与所述服务器保存的文字信息是否相匹配的方法是:
如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于服务器保存的文字信息中包含的信息项目数的一半,则认为识别结果与所述服务器保存的文字信息相匹配;否则认为不相匹配。
本发明的实现需要有一个具有维护联系人信息功能的网站。该网站保存有很多张名片所包含的文字信息,这些文字信息是经过人工检查和校正,可以作为准确信息使用的。该网站的用户可以将名片识别软件得到的识别结果上传到网站服务器,由网站服务器根据上传的识别结果,在该网站保存的名片文字信息中进行检索查询,并返回所识别名片的准确信息,从而实现识别结果的自动校正。
本发明的有益效果在于:本发明提出的通过网络查询自动校正识别结果的方法及系统,使得用户在使用名片识别软件来识别名片图像时,可以自动连接到特定的网站去查询所得到的识别结果,并根据查询的结果对识别结果进行自动校正。本发明提高了使用名片识别软件来输入名片信息的可靠性和便利性。
附图说明
图1为本发明方法的流程图。
图2为判断能不能找到与识别结果相匹配的名片信息的流程图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
本发明的实现首先需要有一个具有维护联系人信息功能的网站(当然也可以是具有服务器的其他形式),该网站的注册用户可以将自己或他人的一张或多张名片信息保存到自己的账户中,所保存的名片信息是经过用户自己的检查校正,保证正确的。此外,网站也可以不通过注册用户而通过其他来源直接获得的名片图像和名片信息。
该网站的用户可以将名片识别软件得到的识别结果上传到网站服务器,由网站服务器根据上传的识别结果,在该网站的注册用户保存(或者通过其他方式保存的,下同)的名片信息中进行检索查询,并返回所识别名片的准确信息,从而实现识别结果的自动校正。
请参阅图1,本发明提出的通过网络查询自动校正识别结果的方法包括如下步骤:
【步骤101】使用名片识别软件自动识别名片的图像。
其中,所述名片的图像来自相机拍摄,或者扫描仪扫描。所述名片识别软件可能运行在手机等移动设备上,可能运行在台式机上,也可能就运行在网站的服务器上,由网站的服务器使用名片识别软件对用户提交的名片图像进行识别并将识别结果返回给用户。
【步骤102】将名片识别软件得到的识别结果提交网站的服务器,要求进行查询。
【步骤103】网站的服务器根据所提交的可能包含错误的识别结果来查询该网站保存的名片信息,如果找到与识别结果相匹配的名片信息,则返回正确的名片信息,转到步骤104,否则返回查询失败,转到步骤105。
其中,网站的服务器根据所提交的可能包含错误的识别结果来查询该网站保存的名片信息,判断能不能找到与识别结果相匹配的名片信息,一种实现方法如图2所示,具体步骤如下:
步骤201,获取该网站保存的一张名片信息
步骤202,将识别结果中包含的姓名,电话号码,手机号码,传真号码,email等信息逐项与所述名片信息中的对应项信息进行匹配,得出有几项信息完全一致,有几项信息仅少数字符不一致。其中,所谓仅少数字符不一致是指不一致的字符个数不超过该项字符总个数的八分之一。
步骤203,判断识别结果与所述名片信息是否相匹配,如果答案为是,则转到步骤204,否则转到步骤205。其中,判断识别结果与所述网站保存的名片信息是否相匹配,其方法是:如果至少有一项信息完全一致,而且完全一致的信息的项数,以及仅少数字符不一致的信息的项数之和大于网站保存的名片信息中包含的信息项目数的一半,则认为识别结果与所述网站保存的名片信息相匹配,否则认为不相匹配。
步骤204,将这个名片信息作为正确的名片信息返回,并转到207,结束。
步骤205,判断是否已经检查了该网站保存的所有名片信息,如果答案为是,则转到步骤206。否则转到步骤201去获取并匹配下一个该网站保存的名片信息。
步骤206,返回查询失败,并转到207,结束。
步骤207,结束。
【步骤104】名片识别软件将返回的正确的名片信息显示给用户看,在得到用户确认后依据返回的正确的名片信息对识别结果进行自动校正。
其中,也可以经过用户预先的设置使得名片识别软件跳过要求用户确认这一步骤,而直接进行自动校正。所述自动校正的一种简单做法就是直接用网站返回的正确结果代替识别结果。
【步骤105】名片识别软件提示用户网络查询校正失败,识别结果需要进行人工检查校正。
【步骤106】结束。
以上介绍了本发明通过网络查询自动校正识别结果的方法,本发明在揭示上述方法的同时,还揭示一种通过网络查询自动校正识别结果的系统,所述系统包括客户端、服务器;所述客户端或/和服务器包括名片识别单元。
用户通过客户端的名片识别单元识别名片中的联系信息,或者用户通过客户端上传名片信息至服务器,由服务器的名片识别单元识别名片中的联系信息。所述服务器包括名片匹配单元、校正单元(此外,校正单元还可以设置于客户端中,或者仅设置于客户端中)。名片匹配单元用以根据所述名片识别单元提交的识别结果为关键字,来查询该网站保存的名片信息,如果找到与识别结果相匹配的名片信息,则返回正确的名片信息,否则返回查询失败。校正单元用以根据所述名片匹配单元返回的正确的名片信息对识别结果进行自动校正。
本实施例中,所述名片匹配单元根据名片识别软件提交的识别结果来查询该网站保存的名片信息,以确定能不能找到与识别结果相匹配的名片信息,具体步骤如下:
步骤201,获取该网站保存的一张名片信息;
步骤202,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与所述名片信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤203,判断识别结果与所述名片信息是否相匹配,如果答案为是,则转到步骤204,否则转到步骤205。其中,判断识别结果与所述网站保存的名片信息是否相匹配的方法是:如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于网站保存的名片信息中包含的信息项目数的一半,则认为识别结果与所述网站保存的名片信息相匹配;否则认为不相匹配。
步骤204,将这个名片信息作为正确的名片信息返回,并转到207;
步骤205,判断是否已经检查了该网站保存的所有名片信息,如果答案为是,则转到步骤206;否则转到步骤201去获取并匹配下一个该网站保存的名片信息;
步骤206,返回查询失败,并转到207;
步骤207,结束。
综上所述,本发明提出的通过网络查询自动校正识别结果的方法及系统,使得用户在使用名片识别软件来识别名片图像时,可以自动连接到特定的网站去查询所得到的识别结果,并根据查询的结果对识别结果进行自动校正。本发明提高了使用名片识别软件来输入名片信息的可靠性和便利性。
实施例二
本实施例中,本发明方法及系统不但可以用于识别名片中的联系信息,还可以用于识别其他包含有联系信息的图像的识别,甚至可以用于任意包含有文字信息的图像的识别。
本实施例中,本发明通过网络查询自动校正识别结果的方法包括如下步骤:
【步骤A】使用文字识别单元自动识别包含有文字信息(如联系信息)的图像;
【步骤B】将文字识别单元得到的识别结果提交至一服务器;
【步骤C】所述服务器根据所提交的识别结果,检索该服务器内保存的文字信息;如果找到与识别结果相匹配的文字信息,则返回正确的文字信息,转到步骤D,否则返回查询失败,转到步骤E;
其中,服务器根据文字识别单元提交的识别结果来查询所述服务器保存的文字信息,以确定能不能找到与识别结果相匹配的文字信息,具体步骤如下:
步骤C1,获取服务器保存的一个文字信息;
步骤C2,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与步骤C1获取的所述文字信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤C3,判断识别结果与所述文字信息是否相匹配,如果答案为是,则转到步骤C4,否则转到步骤C5。其中,判断识别结果与所述服务器保存的文字信息是否相匹配的方法是:如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于服务器保存的文字信息中包含的信息项目数的一半,则认为识别结果与所述服务器保存的文字信息相匹配;否则认为不相匹配。
步骤C4,将该文字信息作为正确的文字信息返回,并转到C7;
步骤C5,判断是否已经检查服务器保存的所有文字信息,如果答案为是,则转到步骤C6;否则转到步骤C1去获取并匹配服务器保存的下一个文字信息;
步骤C6,返回查询失败,并转到C7;
步骤C7,结束。
【步骤D】文字识别单元将返回的正确的文字信息显示给用户,在得到用户确认后依据返回的正确的文字信息对识别结果进行自动校正;或者,文字识别单元直接将识别的文字信息进行自动校正;
【步骤E】文字识别单元提示用户网络查询校正失败。
以上介绍了本发明通过网络查询自动校正识别结果的方法,本发明在揭示上述方法的同时,还揭示一种通过网络查询自动校正识别结果的系统,所述系统包括客户端、服务器;所述客户端或/和服务器包括名片识别单元。
用户通过客户端的文字识别单元识别图像中的文字信息,或者用户通过客户端上传包含有文字信息的图像至服务器,由服务器的文字识别单元识别图像中的文字信息。
所述服务器包括:匹配单元、校正单元。匹配单元用以根据所述文字识别单元提交的识别结果为关键字,查询所述服务器保存的文字信息,如果找到与识别结果相匹配的文字信息,则返回正确的文字信息,否则返回查询失败。校正单元用以根据所述匹配单元返回的正确的文字信息对识别结果进行自动校正。
本实施例中,所述匹配单元根据文字识别单元提交的识别结果来查询所述服务器保存的文字信息,以确定能不能找到与识别结果相匹配的文字信息,具体步骤如下:
步骤C1,获取服务器保存的一个文字信息;
步骤C2,将识别结果中包含的姓名、电话号码、手机号码、传真号码、email信息逐项与步骤C1获取的所述文字信息中的对应项信息进行匹配,得出信息完全一致的项数,部分信息不一致的项数;
步骤C3,判断识别结果与所述文字信息是否相匹配,如果答案为是,则转到步骤C4,否则转到步骤C5。其中,判断识别结果与所述服务器保存的文字信息是否相匹配的方法可以是:如果至少有一项信息完全一致,而且完全一致的信息的项数以及部分信息不一致的信息项数之和大于服务器保存的文字信息中包含的信息项目数的一半,则认为识别结果与所述服务器保存的文字信息相匹配;否则认为不相匹配。当然,匹配方法还可以为其他;本领域的技术人员可以根据需要设定。
步骤C4,将该文字信息作为正确的文字信息返回,并转到C7;
步骤C5,判断是否已经检查服务器保存的所有文字信息,如果答案为是,则转到步骤C6;否则转到步骤C1去获取并匹配服务器保存的下一个文字信息;
步骤C6,返回查询失败,并转到C7;
步骤C7,结束。
实施例三
本实施例与实施例二的区别在于,本实施例中,校正单元还设置于客户端中(即同时设置于服务器与各客户端中),或者仅设置于客户端中(即服务器中可以不设置)。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。