CN108053545B - 证件验真方法和装置、服务器、存储介质 - Google Patents

证件验真方法和装置、服务器、存储介质 Download PDF

Info

Publication number
CN108053545B
CN108053545B CN201711498581.6A CN201711498581A CN108053545B CN 108053545 B CN108053545 B CN 108053545B CN 201711498581 A CN201711498581 A CN 201711498581A CN 108053545 B CN108053545 B CN 108053545B
Authority
CN
China
Prior art keywords
information source
character string
credibility
parameter
certificate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711498581.6A
Other languages
English (en)
Other versions
CN108053545A (zh
Inventor
王刘强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711498581.6A priority Critical patent/CN108053545B/zh
Publication of CN108053545A publication Critical patent/CN108053545A/zh
Application granted granted Critical
Publication of CN108053545B publication Critical patent/CN108053545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种证件验真方法和装置、服务器、存储介质,其中该方法包括:从证件的图像中识别出第一信息源,其中,第一信息源包括证件的至少一种参数;根据证件的图像和预设途径获取第二信息源,其中,第二信息源包括证件的至少一种参数;将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值;依据相同类型的参数对应的可信度值计算证件的整体可信度值,依据整体可信度值确定证件的真伪。本发明实施例可以提高证件验真的准确率,降低证件验真的人力成本和资金成本。

Description

证件验真方法和装置、服务器、存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种证件验真方法和装置、服务器、存储介质。
背景技术
随着网络销售和网络金融的不断发展,对网络实名认证和网络资质验真的需求逐渐增加。
现有技术中,通常采用人工或者光学字符识别(Optical CharacterRecognition,OCR)技术识别比对的方式进行证件的验真,包括对身份证、营业执照或者护照等的验真。然而,人工验真过程慢且人工成本高;OCR识别比对的方式中,由于OCR本身的局限性,其识别出证件上的数据可能出现错字、多字和少字等问题,因此其准确率较低,无法满足实际业务需求。此外,证件还可以通过政府提供的接口进行验真,但是这些服务都是收费的,验真成本高。
发明内容
本发明实施例提供一种证件验真方法和装置、服务器、存储介质,以提高证件验真的准确率,并降低验真成本。
第一方面,本发明实施例提供了一种证件验真方法,该方法包括:
从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。
第二方面,本发明实施例还提供了一种证件验真装置,该装置包括:
第一信息源获取模块,用于从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
第二信息源获取模块,用于根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
参数可信度计算模块,用于将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
真伪确定模块,用于依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。
第三方面,本发明实施例还提供了一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的证件验真方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的证件验真方法。
本发明实施例通过从证件的图像中识别出第一信息源,并根据证件的图像和预设途径获取第二信息源,其中,第一信息源和第二信息源均包括证件的至少一种参数,然后将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,进而得到证件的整体可信度值,并以此确定证件的真伪。本发明实施例解决了现有的证件验真方法准确率较低且验真成本高的问题,实现了提高证件验真准确率以及降低验真成本的效果。
附图说明
图1是本发明实施例一提供的证件验真方法的流程图;
图2是本发明实施例二提供的证件验真方法的流程图;
图3是本发明实施例三提供的证件验真方法的流程图;
图4是本发明实施例四提供的证件验真装置的结构示意图;
图5是本发明实施例五提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的证件验真方法的流程图,本实施例可适用于确定证件真伪的情况,该方法可以由证件验真装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在服务器中。如图1所示,该方法具体包括:
S110、从证件的图像中识别出第一信息源,其中,第一信息源包括证件的至少一种参数。
证件的图像可以是利用具有图像采集功能的终端,例如电脑、移动终端或者照相机等进行采集,也可以是利用已有的图像数据库进行数据调用。证件包括但不限于身份证、营业执照或者护照等。
S120、根据证件的图像和预设途径获取第二信息源,其中,第二信息源包括证件的至少一种参数。
预设途径是除了识别第一信息源所用的识别技术之外的信息源获取方法,即第一信息源和第二信息源分别采用不同的获取途径进行获取。
S130、将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值。
由于第一信息源和第二信息源均包括证件的至少一种参数,分别将相同类型的参数进行比较,得到相同类型的参数对应的可信度值。例如,第一信息源和第二信息源中均包括证件持有者姓名和单位名称,则分别让第一信息源和第二信息源中的姓名进行比较,得到姓名对应的可信度值,然后继续将第一信息源和第二信息源中的单位名称进行比较,得到单位名称对应的可信度值。
优选的,考虑到证件上不同信息的类型、不同信息所处位置以及信息之间的相互干扰程度都有差别,因此针对相同类型的参数分别计算可信度值,而且对于不同类型的参数,可采用不同的方法来计算,相比于现有技术中对证件上的参数信息不加以区分而直接进行统一识别验真的方法,可以更加有针对性地提高可信度计算的准确性,从而提高验真的准确率,满足实际业务需求。
S140、依据相同类型的参数对应的可信度值计算证件的整体可信度值,依据整体可信度值确定证件的真伪。
当得到相同类型的参数对应的可信度值之后,依据单独的每种类型的参数的可信度值,便可以计算得到证件整体的可信度值,进而确定出证件的真伪。
本实施例的技术方案通过从证件的图像中识别出第一信息源,并根据证件的图像和预设途径获取第二信息源,其中,第一信息源和第二信息源均包括证件的至少一种参数,然后将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,进而得到证件的整体可信度值,并以此确定证件的真伪。本实施例解决了现有的证件验真方法准确率较低且验真成本高的问题,提高了证件验真的准确率,并且自动化验真的实现降低了证件验真的人力成本和资金成本。
实施例二
图2是本发明实施例二提供的证件验真方法的流程图,本实施例是在上述实施例的基础上进一步进行优化,针对证件为营业执照的验真进行详细说明。如图2所示,该方法具体包括:
S210、从营业执照的图像中识别出第一信息源,其中,第一信息源是利用光学字符识别技术从营业执照的图像中识别出来,包括营业执照的名称、地址、法人和编号中的至少一种。
营业执照上包含大量信息,包括但不仅限于名称、地址、法人和统一信用代码等。针对营业执照进行专门地光学字符识别,例如,首先通过营业执照外框识别出营业执照范围;然后根据比例识别出“营业执照”字样;最后分别读取营业执照上各字段信息。
S220、根据营业执照的图像和预设途径获取第二信息源,其中,第二信息源是利用营业执照中的二维码获取到,包括营业执照的名称、地址、法人和编号中的至少一种。
营业执照的二维码中包括营业执照的相关信息,可以利用具有二维码扫描功能的终端,例如移动终端等,对二维码进行扫描,获取第二信息源。
可选地,该方法还包括:
如果二维码对应的内容是网址,则判断该网址与营业执照所属的省的预设网址是否匹配,若不匹配,则确定营业执照为伪造,若匹配,则通过该网址获取第二信息源;
如果二维码对应的内容是营业执照数据,则判断该营业执照数据与营业执照所属的省的预设数据模板是否匹配,若不匹配,则确定营业执照为伪造,若匹配,则将该营业执照数据作为第二信息源。
具体的,通过扫描二维码识别获取营业执照内的二维码对应的内容,判断二维码内容是网址还是营业执照数据。全国不同省份对应的营业执照的网址和营业执照数据模板各有不同。如果二维码内容是网址,则首先判断该网址与对应省份的预设网址是否匹配,若不匹配,则认为营业执照伪造,若匹配,则通过该网址继续获取第二信息源。如果二维码内容是营业执照数据,则首先判断该营业执照数据与该省份的数据模板格式是否一致,若不一致,则认为营业执照伪造,若一致,则将该营业执照数据作为第二信息源。
S230、将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值。
S240、依据相同类型的参数对应的可信度值计算证件的整体可信度值,依据整体可信度值确定营业执照的真伪。
可选地,该方法还包括:
如果利用二维码无法获取第二信息源,则利用营业执照上的统一信用号和政府网站查询获取第三信息源;
相应地,将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,包括:
将第一信息源和第三信息源中相同类型的参数进行可信度计算,得到相同类型的参数对应的可信度值。
其中,当利用二维码无法成功获取第二信息源时,利用光学字符识别出营业执照的统一信用号,通过此统一信用号在国家企业信息公示系统中查询获取第三信息源,若统一信用号无法识别或者查询失败,则根据需要通过政府接口获取第三信息源。在本实施例中,不同的信息源分别采用不同的获取途径。相比于单一方式获取信息源的方法,多途径获取信息源为实现证件的有效验真奠定了基础。
进一步地,该方法还包括:
如果利用光学字符识别技术无法识别出第一信息源,则确定验真失败;
如果无法识别出第二信息源和第三信息源,则确定验真失败。
三种信息源中以利用光学字符识别获取的第一信息源为主要匹配源;第二信息源可能会因为二维码的清晰度或者靶向网址的问题无法访问,导致第二信息源获取失败;第三信息源为辅助源,仅在第一信息源成功获取后使用。若第一信息源不可正常获取,则判定营业执照无法验真;若第二信息源和第三信息源均无法获取,则判定营业执照无法验真;若第一信息源可获取,第二信息源可获取,则取二者中相同类型的参数进行比对;若第一信息源可获取,第二信息源不可获取,则取第一信息源和第三信息源中的相同类型参数进行比对。具体的不同信息源内参数比对规则如下表1所示。
表1:不同信息源内参数比对规则
信息源1 信息源2 信息源3 比对信息源
不能获取 任意 任意 不可验真
能获取 不能获取 不能获取 不可验真
能获取 能获取 任意 1、2验真
能获取 不能获取 能获取 1、3验真
在上述技术方案的基础上,可选地,如果相同类型的参数为营业执照的名称,则计算该名称对应的可信度值,包括:
对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;
根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;
获取第一主题字符串和第二主题字符串的最长公共子串;
确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算所述最长公共子串的长度与目标名称长度的比值,将该比值作为名称对应的可信度值。
示例性地,对于营业执照上的企业名称,首先对名称进行分词,根据分词结果去除类似“有限”和“公司”等通用词,保留企业名称主题,然后将剩余结果按原顺序拼接成主题字符串,获取两个主题字符串中最长连续公共子串,将最长连续公共子串长度与两个主题字符串中长度较短的字符串长度的比值作为可信度值。
可选地,如果相同类型的参数为营业执照的地址,该方法还包括:
通过分词获取第一信息源和第二信息源的地址中各自的省市区数据;
如果第一信息源的省市区数据与第二信息源的省市区数据不匹配,则确定营业执照为伪造。
进一步地,计算营业执照的地址对应的可信度值包括:
获取第一信息源和第二信息源的地址中,除省市区数据之外的最长公共子串;
确定第一信息源的地址和第二信息源的地址相比字符串长度小的地址长度为目标地址长度,计算最长公共子串的长度与目标地址长度的比值,将该比值作为地址对应的可信度值。
示例性地,对于营业执照上的企业地址,首先对地址进行分词,拆分出省、市、区数据,若第一信息源和第二信息源中均有省市区数据,则分别判断是否一致,不一致则认为营业执照为伪造。匹配之后,具体的可信度计算过程如下:除去匹配的省市区数据外,对剩余数据进行比对,计算剩余数据中的最长公共子串,将最长公共子串长度与两个信息源中地址长度较短的字符串长度的比例作为可信度值。
可选地,如果相同类型的参数为营业执照的法人,则计算该法人对应的可信度值,包括:
根据预设姓氏词库,匹配并比较第一信息源和第二信息源的法人中的姓氏;
如果所述第一信息源和第二信息源的法人中的姓氏相同,则分别获取第一信息源和第二信息源的法人中除姓氏之外的字符串,作为第一法人字符串和第二法人字符串;
以第二法人字符串作为比对字符串,判断第一法人字符串是否与第二法人字符串相同;
如果所述第一法人字符串与第二法人字符串相同,则确定法人的可信度值为满分。
进一步地,该方法还包括:
根据预设姓氏词库,如果在第一信息源和第二信息源的任一法人中不能匹配到姓氏,则确定该法人识别失败,不计算法人对应的可信度值;以及
如果第一信息源和第二信息源的法人中的姓氏不相同,则确定营业执照为伪造。
示例性地,首先将全国4000余姓氏作为比对数组,判断数组在法人名称出现的初始位置,若未在法人名称中出现,则认为未识别出法人。对于没有识别出的参数,不将其作为整体可行度计算的参数。如果从初始位置开始,取两个信息源数据中较短字符串长度为比对长度,若此比对长度大于等于1,且比对长度内两个信息源中对应字符完全一致,则认为法人匹配一致,可信度值为满分。如果两个信息源中的法人不匹配,便确定营业执照为伪造。
可选地,如果相同类型的参数包括营业执照的地址,该方法还包括:
如果第一信息源和第二信息源的地址中任一地址的长度小于预设的地址最小长度阈值,则确定该地址识别失败,不计算地址对应的可信度值;
如果相同类型的参数包括营业执照的地址和法人,该方法还包括:
如果所述第一信息源和第二信息源的地址中任一地址的长度大于预设的地址最大长度阈值,并且经计算得到法人的可信度值不是满分,则确定法人识别失败。
示例性地,预设地址最小长度阈值为6个字符,判断第一信息源和第二信息源中的地址长度,若任一地址长度小于6个字符,则认为地址识别失败。预设的地址最大长度阈值为25字符,若两个信息源中任一地址长度大于25字符,认为营业执照中的地址产生了换行,并且两个信息源中计算的法人可信度值不是满分,则可能是因为地址换行给法人字段造成遮挡,那么法人的可信度值则不具有参考意义,于是确定法人识别失败,已经计算出来的法人可信度值则不作考虑。
可选地,如果相同类型的参数为营业执照的编号,则计算该编号对应的可信度值,包括:
去除第一信息源和第二信息源的编号中非数字和非英文字母的字符,分别得到第一编号字符串和第二编号字符串;
获取第一编号字符串和第二编号字符串的最长公共子串;
确定第一编号字符串和第二编号字符串相比长度小的字符串长度为目标编号长度,计算最长公共子串的长度与目标编号长度的比值,将该比值作为编号对应的可信度值。
即去除营业执照的编号中非数字、非英文字母的字符,计算第一信息源和第二信息源的编号中剩余字符中最长公共子串,将最长公共子串长度与两个信息源中剩余字符串中较短的字符串长度的比例作为可信度值。
本实施例的技术方案通过利用光学字符识别技术从营业执照的图像中识别出第一信息源,利用营业执照中的二维码获取到第二信息源,将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,进而得到营业执照的整体可信度值,确定其真伪,本实施例解决了现有的证件验真方法准确率较低且验真成本高的问题,实现了提高证件验真准确率以及降低验真成本的效果,全流程自动审核,不存在额外的人工成本。并且,本实施例中通过多种渠道获取信息源,并针对不同信息源中的不同类型数据采取不同的可信度计算方法,进行验真模块优化,突破了完全依赖于光学字符识别导致证件验真准确率较低,无法满足业务需求的局限性,实现了在证件自动化验真的同时,还可以提高验真准确率,并且验真过程不依赖于政府查询接口,无需增加额外的成本。
实施例三
图3是本发明实施例三提供的证件验真方法的流程图,本实施例是在上述实施例的基础上进一步进行优化。如图3所示,该方法具体包括:
S310、从营业执照的图像中识别出第一信息源,其中,第一信息源包括营业执照的名称、地址、法人和编号中的至少一种。
S320、根据营业执照的图像和预设途径获取第二信息源,其中,第二信息源包括营业执照的名称、地址、法人和编号中的至少一种。
S330、将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值。
当计算得到的任一类型参数的可信度值小于对应的可信度阈值,或者参数对应的预设权重之和小于预设的权重阈值时,执行操作S340,否则跳过操作S340,继续执行操作S350。
S340、在每种类型的参数对应的可信度值中,如果任一一种类型的参数对应的可信度值小于该种类型的参数对应的可信度阈值,或者各种类型的参数对应的预设权重之和小于预设的权重阈值,则确定营业执照为伪造。
针对不同类型的参数,分别设置对应的可信度阈值以及权重。考虑到不同的需求情况下所获取的营业执照质量不同,光学字符识别准确率不同,因此可信度阈值与权重可以根据实际情况进行调整。预设的各种类型的参数对应的可信度阈值,示例性地如下表所示。当计算得到的可信度值中任一种类型的参数对应的可信度值小于预设的可信度阈值时,或者各种类型的参数对应的预设权重之和小于预设的权重阈值时,便可以确定营业执照为伪造。
表2:参数可信度初始阈值
可信度阈值下限 权重
名称 30 1
地址 30 1
编号 30 1
法人 0 2
整体 80 0
示例性地,第一信息源和第二信息源中相同类型的参数包括名称和地址,计算得到的名称对应的可信度值为20,地址对应的可信度值为80,由于名称对应的可信度值小于其可信度阈值30,便确定此营业执照为伪造。或者预设的权重阈值为3,而此时名称和地址对应的权重之和为2,小于权重阈值,同样确定此营业执照为伪造。
S350、如果每种类型的参数对应的可信度值均大于各自对应的可信度阈值,并且各种类型的参数对应的预设权重之和大于等于权重阈值,则计算每种类型的参数对应的可信度值与各自权重的加权求和,得到整体可信度值。
在计算得到的参数对应的可信度值符合条件的情况下,通过权重打分,得到整体可信度值。示例性地,第一信息源和第二信息源中相同类型的参数包括法人、名称和地址,预设的权重阈值为3。法人、名称和地址对应的权重之和为4,符合要求。计算得到的法人对应的可信度值为100,名称对应的可信度值为80,地址对应的可信度值为40,均大于各自对应的可信度阈值,则整体可信度值为(100×2+80×1+40×1)/(2+1+1)=80。
S360、根据整体可信度值和预设的整体可信度阈值确定营业执照的真伪。
当计算得到的整体可信度值大于等于预设的整体可信度阈值时,则确定营业执照是真的,当低于预设的整体可信度阈值时,则确定营业执照是伪造。继续以上述示例为例,计算得到的整体可信度值为80,而预设的整体可信度阈值正好是80,则确定此营业执照是真的。
可选地,该方法还包括:
利用机器学习的方法,对所述营业执照验真的历史数据进行训练,以便将可信度阈值、整体可信度阈值和预设权重拟合为验真准确率趋于百分之百时对应的值。
通过机器学习的方法,对验真的历史数据进行训练,使用初始值运行一段时间之后,根据实际情况定期调整阈值以及权重参数,训练拟合得到一个准确的训练模型,使用训练模型对证件进行验真,可以进一步提高证件验真的自动化与准确性。
本实施例的技术方案通过采用不同的获取方法从营业执照的图像中获取出第一信息源和第二信息源,然后将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,在满足条件的情况下,将每种类型的参数对应的可信度值与各自权重的加权求和,得到整体可信度值,根据与整体可信度阈值的关系确定营业执照的真伪。本实施例解决了现有的证件验真方法准确率较低且验真成本高的问题,针对不同的参数类型设置可调节的可信度阈值,提高了证件验真的准确率,并且自动化验真的实现降低了证件验真的人力成本和资金成本。
实施例四
图4是本发明实施例四提供的证件验真装置的结构示意图,本实施例可适用于确定证件真伪的情况。本发明实施例所提供的证件验真装置可执行本发明任意实施例所提供的证件验真方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置包括第一信息源获取模块410、第二信息源获取模块420、参数可信度计算模块430和真伪确定模块440,其中:
第一信息源获取模块410,用于从证件的图像中识别出第一信息源,其中,第一信息源包括证件的至少一种参数;
第二信息源获取模块420,用于根据证件的图像和预设途径获取第二信息源,其中,第二信息源包括证件的至少一种参数;
参数可信度计算模块430,用于将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值;
真伪确定模块440,用于依据相同类型的参数对应的可信度值计算证件的整体可信度值,依据整体可信度值确定证件的真伪。
可选地,该证件包括营业执照;相应地,
营业执照的至少一种参数包括名称、地址、法人和编号中的至少一种;
第一信息源是利用光学字符识别技术从营业执照的图像中识别出来;
第二信息源是利用营业执照中的二维码获取到。
可选地,该装置还包括:
第三信息源获取模块,用于如果利用二维码无法获取第二信息源,则利用营业执照上的统一信用号和政府网站查询获取第三信息源;
相应地,参数可信度计算模块430用于:
将第一信息源和第三信息源中相同类型的参数进行可信度计算,得到相同类型的参数对应的可信度值。
可选地,该装置还包括:
第一验真失败模块,用于如果利用光学字符识别技术无法识别出第一信息源,则确定验真失败;
第二验真失败模块,用于如果无法识别出第二信息源和第三信息源,则确定验真失败。
可选地,该装置还包括:
网址匹配模块,用于如果二维码对应的内容是网址,则判断该网址与营业执照所属的省的预设网址是否匹配,若不匹配则确定营业执照为伪造,若匹配,则通过所述网址获取第二信息源;
营业执照数据匹配模块,用于如果二维码对应的内容是营业执照数据,则判断该营业执照数据与营业执照所属的省的预设数据模板是否匹配,若不匹配则确定营业执照为伪造,若匹配,则将该营业执照数据作为第二信息源。
可选地,如果相同类型的参数为营业执照的名称,参数可信度计算模块430包括:
分词单元,用于对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;
通用词去除单元,用于根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;
名称最长公共子串获取单元,用于获取第一主题字符串和第二主题字符串的最长公共子串;
名称可信度计算单元,用于确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算最长公共子串的长度与目标名称长度的比值,将该比值作为名称对应的可信度值。
可选地,如果相同类型的参数为营业执照的地址,该装置还包括:
省市区数据获取模块,用于通过分词获取第一信息源和第二信息源的地址中各自的省市区数据;
第一伪造确定模块,用于如果第一信息源的省市区数据与第二信息源的省市区数据不匹配,则确定营业执照为伪造。
进一步地,参数可信度计算模块430包括:
地址最长公共子串获取单元,用于获取第一信息源和第二信息源的地址中,除省市区数据之外的最长公共子串;
地址可信度计算单元,用于确定第一信息源的地址和第二信息源的地址相比字符串长度小的地址长度为目标地址长度,计算最长公共子串的长度与目标地址长度的比值,将该比值作为地址对应的可信度值。
可选地,如果相同类型的参数为营业执照的法人,参数可信度计算模块430包括:
姓氏匹配单元,用于根据预设姓氏词库,匹配并比较第一信息源和第二信息源的法人中的姓氏;
法人字符串获取单元,用于如果所述第一信息源和第二信息源的法人中的姓氏相同,则分别获取第一信息源和第二信息源的法人中除姓氏之外的字符串,作为第一法人字符串和第二法人字符串;
法人字符串判断单元,用于以第二法人字符串作为比对字符串,判断第一法人字符串是否与第二法人字符串相同;
法人可信度计算单元,用于如果所述第一法人字符串与第二法人字符串相同,则确定法人的可信度值为满分。
进一步地,该装置还包括:
法人识别失败模块,用于根据预设姓氏词库,如果在第一信息源和第二信息源的任一法人中不能匹配到姓氏,则确定该法人识别失败,不计算法人对应的可信度值;以及
第二伪造确定模块,用于如果第一信息源和第二信息源的法人中的姓氏不相同,则确定营业执照为伪造。
可选地,如果相同类型的参数包括营业执照的地址,该装置还包括:
地址识别失败模块,用于如果第一信息源和第二信息源的地址中任一地址的长度小于预设的地址最小长度阈值,则确定该地址识别失败,不计算地址对应的可信度值;
如果相同类型的参数包括营业执照的地址和法人,该装置还包括:
法人可信度取消模块,用于如果所述第一信息源和第二信息源的地址中任一地址的长度大于预设的地址最大长度阈值,并且经计算得到法人的可信度值不是满分,则更改为法人识别失败,取消经计算得到的法人对应的可信度值。
可选地,如果相同类型的参数为营业执照的编号,参数可信度计算模块430包括:
编号字符串获取单元,用于去除第一信息源和第二信息源的编号中非数字和非英文字母的字符,分别得到第一编号字符串和第二编号字符串;
编号最长公共子串获取单元,用于获取第一编号字符串和第二编号字符串的最长公共子串;
编号可信度计算单元,用于确定第一编号字符串和第二编号字符串相比长度小的字符串长度为目标编号长度,计算最长公共子串的长度与目标编号长度的比值,将该比值作为编号对应的可信度值。
进一步地,真伪确定模块440包括:
伪造确定单元,用于在每种类型的参数对应的可信度值中,如果任一一种类型的参数对应的可信度值小于该种类型的参数对应的可信度阈值,或者各种类型的参数对应的预设权重之和小于预设的权重阈值,则确定营业执照为伪造;
整体可信度计算单元,用于如果每种类型的参数对应的可信度值均大于各自对应的可信度阈值,并且各种类型的参数对应的预设权重之和大于等于权重阈值,则计算每种类型的参数对应的可信度值与各自权重的加权求和,得到整体可信度值;
真伪确定单元,用于根据整体可信度值和预设的整体可信度阈值确定营业执照的真伪。
可选地,该装置还包括:
数据训练模块,用于利用机器学习的方法,对营业执照验真的历史数据进行训练,以便将可信度阈值、整体可信度阈值和预设权重拟合为验真准确率趋于百分之百时对应的值。
本实施例的技术方案通过从证件的图像中识别出第一信息源,并根据证件的图像和预设途径获取第二信息源,其中,第一信息源和第二信息源均包括证件的至少一种参数,然后将第一信息源和第二信息源中相同类型的参数进行比较,计算得到相同类型的参数对应的可信度值,进而得到证件的整体可信度值,并以此确定证件的真伪。本实施例解决了现有的证件验真方法准确率较低且验真成本高的问题,提高了证件验真的准确率,并且自动化验真的实现降低了证件验真的人力成本和资金成本。
实施例五
图5是本发明实施例五提供的一种服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器512的框图。图5显示的服务器512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器512以通用服务器的形式表现。服务器512的组件可以包括但不限于:一个或者多个处理器516,存储装置528,连接不同系统组件(包括存储装置528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
服务器512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)530和/或高速缓存存储器532。服务器512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储装置528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
服务器512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该服务器512交互的设备通信,和/或与使得该服务器512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,服务器512还可以通过网络适配器520与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide AreaNetwork,WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器520通过总线518与服务器512的其它模块通信。应当明白,尽管图中未示出,可以结合服务器512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器516通过运行存储在存储装置528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的证件验真方法,该方法包括:
从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的证件验真方法,该方法包括:
从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种证件验真方法,其特征在于,包括:
从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪;
其中,如果所述相同类型的参数为营业执照的名称,则计算所述名称对应的可信度值,包括:
对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;
根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;
获取第一主题字符串和第二主题字符串的最长公共子串;
确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算所述最长公共子串的长度与目标名称长度的比值,将所述比值作为所述名称对应的可信度值。
2.根据权利要求1所述的方法,其特征在于,所述证件包括营业执照;相应地,
所述营业执照的至少一种参数包括名称、地址、法人和编号中的至少一种;
第一信息源是利用光学字符识别技术从所述营业执照的图像中识别出来;
第二信息源是利用所述营业执照中的二维码获取到。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果利用所述二维码无法获取第二信息源,则利用所述营业执照上的统一信用号和政府网站查询获取第三信息源;
相应地,所述将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值,包括:
将第一信息源和第三信息源中相同类型的参数进行可信度计算,得到所述相同类型的参数对应的可信度值。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果利用所述光学字符识别技术无法识别出第一信息源,则确定验真失败;
如果无法识别出第二信息源和第三信息源,则确定验真失败。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述二维码对应的内容是网址,则判断所述网址与所述营业执照所属的省的预设网址是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则通过所述网址获取第二信息源;
如果所述二维码对应的内容是营业执照数据,则判断所述营业执照数据与所述营业执照所属的省的预设数据模板是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则将所述营业执照数据作为第二信息源。
6.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述地址,所述方法还包括:
通过分词获取第一信息源和第二信息源的地址中各自的省市区数据;
如果第一信息源的省市区数据与第二信息源的省市区数据不匹配,则确定所述营业执照为伪造。
7.根据权利要求6所述的方法,其特征在于,计算所述地址对应的可信度值包括:
获取第一信息源和第二信息源的地址中,除所述省市区数据之外的最长公共子串;
确定第一信息源的地址和第二信息源的地址相比字符串长度小的地址长度为目标地址长度,计算所述最长公共子串的长度与目标地址长度的比值,将所述比值作为所述地址对应的可信度值。
8.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述法人,则计算所述法人对应的可信度值,包括:
根据预设姓氏词库,匹配并比较第一信息源和第二信息源的法人中的姓氏;
如果所述第一信息源和第二信息源的法人中的姓氏相同,则分别获取第一信息源和第二信息源的法人中除所述姓氏之外的字符串,作为第一法人字符串和第二法人字符串;
以第二法人字符串作为比对字符串,判断第一法人字符串是否与第二法人字符串相同;
如果所述第一法人字符串与第二法人字符串相同,则确定所述法人的可信度值为满分。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
根据所述预设姓氏词库,如果在第一信息源和第二信息源的任一法人中不能匹配到所述姓氏,则确定所述法人识别失败,不计算所述法人对应的可信度值;以及
如果所述第一信息源和第二信息源的法人中的姓氏不相同,则确定所述营业执照为伪造。
10.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数包括所述地址,所述方法还包括:
如果第一信息源和第二信息源的地址中任一地址的长度小于预设的地址最小长度阈值,则确定所述地址识别失败,不计算所述地址对应的可信度值;
如果所述相同类型的参数包括所述地址和法人,所述方法还包括:
如果所述第一信息源和第二信息源的地址中任一地址的长度大于预设的地址最大长度阈值,并且经计算得到所述法人的可信度值不是满分,则确定所述法人识别失败。
11.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述编号,则计算所述编号对应的可信度值,包括:
去除第一信息源和第二信息源的编号中非数字和非英文字母的字符,分别得到第一编号字符串和第二编号字符串;
获取第一编号字符串和第二编号字符串的最长公共子串;
确定第一编号字符串和第二编号字符串相比长度小的字符串长度为目标编号长度,计算所述最长公共子串的长度与目标编号长度的比值,将所述比值作为所述编号对应的可信度值。
12.根据权利要求2所述的方法,其特征在于,依据所述相同类型的参数对应的可信度值计算所述营业执照的整体可信度值,依据所述整体可信度值确定所述证件的真伪,包括:
在每种类型的参数对应的可信度值中,如果任一一种类型的参数对应的可信度值小于该种类型的参数对应的可信度阈值,或者各种类型的参数对应的预设权重之和小于预设的权重阈值,则确定所述营业执照为伪造;
如果每种类型的参数对应的可信度值均大于各自对应的可信度阈值,并且各种类型的参数对应的预设权重之和大于等于所述权重阈值,则计算每种类型的参数对应的可信度值与各自权重的加权求和,得到整体可信度值;
根据所述整体可信度值和预设的整体可信度阈值确定所述营业执照的真伪。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
利用机器学习的方法,对所述营业执照验真的历史数据进行训练,以便将所述可信度阈值、整体可信度阈值和预设权重拟合为验真准确率趋于百分之百时对应的值。
14.一种证件验真装置,其特征在于,包括:
第一信息源获取模块,用于从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;
第二信息源获取模块,用于根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;
参数可信度计算模块,用于将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;
真伪确定模块,用于依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪;
其中,如果所述相同类型的参数为营业执照的名称,则所述参数可信度计算模块包括:
分词单元,用于对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;
通用词去除单元,用于根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;
名称最长公共子串获取单元,用于获取第一主题字符串和第二主题字符串的最长公共子串;
名称可信度计算单元,用于确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算所述最长公共子串的长度与目标名称长度的比值,将所述比值作为所述名称对应的可信度值。
15.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~13中任一所述的证件验真方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~13中任一所述的证件验真方法。
CN201711498581.6A 2017-12-29 2017-12-29 证件验真方法和装置、服务器、存储介质 Active CN108053545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711498581.6A CN108053545B (zh) 2017-12-29 2017-12-29 证件验真方法和装置、服务器、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711498581.6A CN108053545B (zh) 2017-12-29 2017-12-29 证件验真方法和装置、服务器、存储介质

Publications (2)

Publication Number Publication Date
CN108053545A CN108053545A (zh) 2018-05-18
CN108053545B true CN108053545B (zh) 2020-05-15

Family

ID=62126010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711498581.6A Active CN108053545B (zh) 2017-12-29 2017-12-29 证件验真方法和装置、服务器、存储介质

Country Status (1)

Country Link
CN (1) CN108053545B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145819B (zh) * 2018-08-22 2022-02-11 国网信通亿力科技有限责任公司 基于ocr和可信结构化数据的信息鉴别方法
CN109284467A (zh) * 2018-09-14 2019-01-29 阿里巴巴集团控股有限公司 一种用户生成内容ugc重复次数确定方法及装置
CN110163204A (zh) * 2019-04-15 2019-08-23 平安国际智慧城市科技股份有限公司 基于图像识别的商家监管方法、装置及存储介质
CN110751041A (zh) * 2019-09-19 2020-02-04 平安科技(深圳)有限公司 证件真伪验证方法、系统、计算机设备及可读存储介质
CN110796054B (zh) * 2019-10-21 2023-04-28 支付宝(杭州)信息技术有限公司 证件验真方法及装置
CN112749311A (zh) * 2019-10-31 2021-05-04 西门子股份公司 资产信息管理方法、装置和计算机可读介质
CN111177509A (zh) * 2019-12-16 2020-05-19 航天信息股份有限公司 一种基于多种方式对信息进行判断的方法及系统
CN111291049A (zh) * 2020-01-19 2020-06-16 软通动力信息技术有限公司 一种创建表的方法、装置、设备和存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8190626B2 (en) * 2008-05-05 2012-05-29 The Mitre Corporation Comparing anonymized data
CN101661644A (zh) * 2008-08-25 2010-03-03 刘振海 护照、证件自动查验技术
CN104112151B (zh) * 2013-04-18 2018-11-27 航天信息股份有限公司 卡片信息的验证方法和装置
CN103354585A (zh) * 2013-06-21 2013-10-16 张家港保税区润桐电子技术研发有限公司 一种能够识别驾照信息的智能手机
CN106156738A (zh) * 2015-01-16 2016-11-23 合肥工业大学 一种带加密qr二维码的汽车车牌密文图像的读取方法
CN105320952B (zh) * 2015-10-15 2018-06-05 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法
CN106845323B (zh) * 2015-12-03 2020-04-28 阿里巴巴集团控股有限公司 一种打标数据的收集方法、装置以及证件识别系统
CN106156279B (zh) * 2016-06-24 2020-01-10 深圳壹账通智能科技有限公司 基于经纬度及文本比对的地址相似度识别方法及系统
CN106650718A (zh) * 2016-12-21 2017-05-10 远光软件股份有限公司 凭证图像识别方法及装置
CN106846008B (zh) * 2016-12-27 2021-06-29 北京五八信息技术有限公司 营业执照验证方法及装置
CN106845469B (zh) * 2017-01-24 2020-08-18 深圳怡化电脑股份有限公司 一种纸币识别方法及装置
CN106981016A (zh) * 2017-03-30 2017-07-25 广东微模式软件股份有限公司 一种远程自助实名购买电话卡的方法与系统
CN107067228A (zh) * 2017-03-31 2017-08-18 南京钧元网络科技有限公司 一种手持式认证智能审核系统及其审核方法
CN107516289A (zh) * 2017-08-29 2017-12-26 努比亚技术有限公司 一种证件图像获取方法及设备

Also Published As

Publication number Publication date
CN108053545A (zh) 2018-05-18

Similar Documents

Publication Publication Date Title
CN108053545B (zh) 证件验真方法和装置、服务器、存储介质
US8977861B2 (en) Method and system for biometric authentication
CN109033249B (zh) 公检法领域结构化文书的信息提取方法、装置及存储介质
EP2354998A1 (en) Method and system of accounting for positional variability of biometric features
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
WO2022156275A1 (zh) 电子合同生成方法、装置、计算机设备及存储介质
CN109739957B (zh) 基于数据处理的单据信息录入方法、装置、设备及存储介质
WO2022105496A1 (zh) 智能回访方法、装置、电子设备及可读存储介质
CN109697267B (zh) Cms识别方法及装置
US20230134169A1 (en) Text-based document classification method and document classification device
CN111797217B (zh) 基于faq匹配模型的信息查询方法、及其相关设备
WO2022134580A1 (zh) 证件信息的获取方法及装置、存储介质、计算机设备
CN110070045A (zh) 一种营业执照的文本识别方法、系统及相关组件
CN116704528A (zh) 票据识别核验方法、装置、计算机设备及存储介质
CN113177543B (zh) 证件识别方法、装置、设备及存储介质
CN116189215A (zh) 自动审核方法、装置、电子设备及存储介质
CN115880702A (zh) 数据处理方法、装置、设备、程序产品及存储介质
US9106423B1 (en) Using positional analysis to identify login credentials on a web page
US11335108B2 (en) System and method to recognise characters from an image
KR101056307B1 (ko) 다양한 응용을 위한 다기준 신뢰도 지원 하이브리드 온라인 서명검증 시스템 및 그 방법
WO2021151274A1 (zh) 图像文档处理方法、装置、电子设备及计算机可读存储介质
CN114519568A (zh) 审单方法、装置、电子设备和存储介质
US9507947B1 (en) Similarity-based data loss prevention
CN107092903A (zh) 信息识别方法及装置
CN110909538A (zh) 问答内容的识别方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant