CN111144416A

CN111144416A - 信息处理方法和装置

Info

Publication number: CN111144416A
Application number: CN201911357652.XA
Authority: CN
Inventors: 唐恭鹏
Original assignee: China United Network Communications Group Co Ltd; Unicompay Co Ltd
Current assignee: China United Network Communications Group Co Ltd; Unicompay Co Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2020-05-12

Abstract

本申请实施例提供的信息处理方法和装置，在对商户上传的包括相同目标文本的证件图像信息和商户手工录入的信息进行一致性对比时，不是像现有技术中直接对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行全字段对比，而是通过对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，并将切片处理得到的M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配，细化了匹配的内容，并根据字符匹配结果，输出字符匹配结果对应的提示信息，这样无需采用人工的方式进行审核，从而提高了信息的处理效率。

Description

信息处理方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种信息处理方法和装置。

背景技术

在进行商户入网信息审核时，商户审核部门通常需对商户上传的证件信息和商户手工录入的信息进行一致性对比，若上传的证件信息和手工录入的信息一致，则转接到风控审核部门进行下一步的审核，若风控审核部门审核通过，则确定该商户顺利通过审核流程，这样商户就可以开始经营日常业务。

现有技术中，在对商户上传的证件信息和商户手工录入的信息进行一致性对比时，是先通过光学字符识别(Optical Character Recognition，简称OCR)技术对商户上传的证件信息进行识别，得到该证件信息对应的字符串信息，然后将该证件信息对应的字符串信息与商户手工录入的信息进行全字段对比。当确定存在不一致信息时，只会将审核不通过的结果反馈给商户信息的审核人员，而不会具体到哪一个信息不一致，这样需要信息审核人员重新对商户上传的证件信息和商户手工录入的信息进行一致性对比，并确定存在不一致信息时，将该不一致信息的审核结果反馈给商户，以便商户根据该不一致信息的审核结果修改不一致的信息，并继续上传修改后的信息进行审核，直至上传的证件信息和手工录入的信息一致。

因此，在对商户上传的证件信息和商户手工录入的信息进行一致性对比时，由于需要采用人工的方式进行审核，使得信息的处理效率较低。

发明内容

本发明实施例提供一种信息处理方法和装置，在对商户上传的证件信息和商户手工录入的信息进行一致性对比时，提高了信息的处理效率。

第一方面，本申请实施例提供一种信息处理方法，该信息处理方法可以包括：

接收商户上传的证件图像信息和所述商户手工录入的信息；其中，所述证件图像信息和所述手工录入的信息中包括相同的目标文本。

分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，得到所述证件图像信息对应的M个第一片段，以及所述手工录入的信息对应的M个第二片段；M为大于或者等于2的整数。

将所述M个第一片段中第i个第一片段与所述M个第二片段中第i个第二片段进行字符匹配；i为大于或者等于1，且小于或者等于M的整数。

根据字符匹配结果，输出所述字符匹配结果对应的提示信息。

在一种可能的实现方式中，所述根据字符匹配结果，输出所述字符匹配结果对应的提示信息，包括：

若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段不匹配，则确定第i个片段指示的目标文本内容。

输出第一提示信息，所述第一提示信息用于指示所述目标文本内容审核不通过。

在一种可能的实现方式中，所述确定第i个片段指示的目标文本内容，包括：

获取片段与文本内容之间的映射关系；根据所述第i个片段和所述映射关系，确定所述第i个片段指示的所述目标文本内容。

在一种可能的实现方式中，所述获取片段与文本内容之间的映射关系，包括：

获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果。

根据所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果，训练得到所述片段与文本内容之间的映射关系。

在一种可能的实现方式中，所述根据所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果，训练得到所述片段与文本内容之间的映射关系，包括：

采用机器学习的方法，对所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果进行训练，得到所述片段与文本内容之间的映射关系。

在一种可能的实现方式中，所述分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，包括：

确定所述目标文本对应的目标切片规则。

根据所述目标切片规则，分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理。

在一种可能的实现方式中，该信息处理方法还可以包括：

若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段匹配，则输出第二提示信息，所述第二提示信息用于指示所述证件图像信息和所述手工录入的信息审核通过。

在一种可能的实现方式中，对所述证件图像信息中目标文本对应的字符串进行切片处理之前，还包括：

采用图像识别技术对所述证件图像信息中目标文本进行识别，得到所述证件图像信息中目标文本对应的字符串。

第二方面，本申请实施例提供一种信息处理装置，该信息处理装置可以包括

接收单元，用于接收商户上传的证件图像信息和所述商户手工录入的信息；其中，所述证件图像信息和所述手工录入的信息中包括相同的目标文本；

处理单元，用于分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，得到所述证件图像信息对应的M个第一片段，以及所述手工录入的信息对应的M个第二片段；M为大于或者等于2的整数。

所述处理单元，还用于将所述M个第一片段中第i个第一片段与所述M个第二片段中第i个第二片段进行字符匹配；i为大于或者等于1，且小于或者等于M的整数。

输出单元，用于根据字符匹配结果，输出所述字符匹配结果对应的提示信息。

在一种可能的实现方式中，所述处理单元，具体用于若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段不匹配，则确定第i个片段指示的目标文本内容。

所述输出单元，具体用于输出第一提示信息，所述第一提示信息用于指示所述目标文本内容审核不通过。

在一种可能的实现方式中，所述处理单元，具体用于获取片段与文本内容之间的映射关系；并根据所述第i个片段和所述映射关系，确定所述第i个片段指示的所述目标文本内容。

在一种可能的实现方式中，所述处理单元，具体用于获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果；并根据所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果，训练得到所述片段与文本内容之间的映射关系。

在一种可能的实现方式中，所述处理单元，具体用于采用机器学习的方法，对所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果进行训练，得到所述片段与文本内容之间的映射关系。

在一种可能的实现方式中，所述处理单元，具体用于确定所述目标文本对应的目标切片规则；并根据所述目标切片规则，分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理。

在一种可能的实现方式中，所述输出单元，还用于若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段匹配，则输出第二提示信息，所述第二提示信息用于指示所述证件图像信息和所述手工录入的信息审核通过。

在一种可能的实现方式中，所述处理单元，还用于采用图像识别技术对所述证件图像信息中目标文本进行识别，得到所述证件图像信息中目标文本对应的字符串。

第三方面，本申请实施例还提供一种电子设备，该电子设备可以包括存储器和处理器；

存储器，用于存储计算机程序。

处理器，用于读取存储器存储的计算机程序，并根据所述存储器中的计算机程序执行如上述第一方面任一项所述的信息处理方法。

第四方面，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上述第一方面任一项所述的信息处理方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本申请实施例提供的一种应用场景的示意图；

图2为本申请实施例提供的一种信息处理方法的流程示意图；

图3为本申请实施例提供的另一种信息处理方法的流程示意图；

图4为本申请实施例提供的又一种信息处理方法的流程示意图；

图5为本申请实施例提供的一种信息处理装置的结构示意图；

图6为本发明实施例提供的一种电子设备的结构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本发明的实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况，其中A，B可以是单数或者复数。在本发明的文字描述中，字符“/”一般表示前后关联对象是一种“或”的关系。

图1为本申请实施例提供的一种应用场景的示意图，示例的，参见图1所示，在对商户上传的证件信息和商户手工录入的信息进行一致性对比时，为了解决现有技术中，在对商户上传的证件信息和商户手工录入的信息进行一致性对比时，由于需要采用人工的方式进行审核，使得信息的处理效率较低的问题，本申请实施例提供了一种信息处理方法，在对商户上传的包括相同目标文本的证件图像信息和商户手工录入的信息进行一致性对比时，不是像现有技术中直接对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行全字段对比，而是通过对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，并将切片处理得到的M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配，细化了匹配的内容，并根据字符匹配结果，输出字符匹配结果对应的提示信息，这样无需采用人工的方式进行审核，从而提高了信息的处理效率。其中，M为大于或者等于2的整数，i为大于或者等于1，且小于或者等于M的整数。

需要说明的是，在对切片处理后得到的片段进行匹配时，为了提高匹配的准确度，不是将证件图像信息对应的M个第一片段中的某一个第一片段与手工录入的信息对应的M个第二片段中的任意一个第二片段进行比较，而是将M个第一片段中第i个第一片段与M个第二片段中对应位置上的第i个第二片段进行字符匹配，例如，在切片处理后，得到证件图像信息对应的3个第一片段以及手工录入的信息对应的3个第二片段，在进行字符匹配时，是将3个第一片段中第一个第一片段与3个第二片段中第一个第二片段进行字符匹配，将3个第一片段中第二个第一片段与3个第二片段中第二个第二片段进行字符匹配，将3个第一片段中第三个第一片段与3个第二片段中第三个第二片段进行字符匹配，这样可以避免因为进行字符匹配使用的片段不对应，而导致匹配结果的准确度不高，从而提高了匹配的准确度。

下面，将通过几个具体的实施例对本申请实施例提供的技术方案进行详细说明。可以理解的是，下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供的一种信息处理方法的流程示意图，示例的，请参见图2所示，该信息处理方法可以包括：

S201、接收商户上传的证件图像信息和商户手工录入的信息。

其中，证件图像信息和手工录入的信息中包括相同的目标文本。示例的，当证件图像信息为身份证图像信息、且手工录入的信息为身份证中的相关信息时，身份证图像信息和身手工录入的份证中的相关信息中的相同的目标文本可以为姓名、性别、身份证号以及地址等。

在对商户上传的证件图像信息和商户手工录入的信息进行一致性对比时，需要先接收商户上传的证件图像信息和商户手工录入的信息，之后，再能对商户上传的证件图像信息和商户手工录入的信息进行一致性对比，并且在进行一致性对比时，是将证件图像信息和商户手工录入的信息中的相同目标文本进行匹配，以完成证件图像信息和手工录入的信息的审核。

需要说明的是，与现有技术中不同的是，本申请实施例在进行匹配时，不是直接将证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行全字段字符匹配，而是在匹配之前，先分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段，然后再将M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配，即执行下述S202-S203：

S202、分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段。

其中，M为大于或者等于2的整数。

可选的，在分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理之前，可以先采用图像识别技术对证件图像信息中目标文本进行识别，得到证件图像信息中目标文本对应的字符串。示例的，图像识别技术可以为光学字符识别(Optical Character Recognition，简称OCR)技术，当然，也可以为具有相同功能的其他识别技术，在此，本申请实施例只是以图像识别技术可以为OCR技术为例进行说明，但并不代表本申请实施例仅局限于此。其中，OCR技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式。

示例的，结合图1所示，当证件图像信息为身份证图像信息、且手工录入的信息为身份证中的相关信息时，身份证图像信息和身手工录入的份证中的相关信息中的相同的目标文本可以为姓名、性别、身份证号以及地址等，在对身份证图像信息与手工录入的身份证中的相关信息进行一致性对比时，是分别将身份证图像信息中的姓名对应的字符串与手工录入的身份证中的姓名对应的字符串进行匹配，将身份证图像信息中的性别对应的字符串与手工录入的身份证中的性别对应的字符串进行匹配，将身份证图像信息中的身份证号对应的字符串与手工录入的身份证中的身份证号对应的字符串进行匹配，将身份证图像信息中的地址对应的字符串与手工录入的身份证中的地址对应的字符串进行匹配，以完成对身份证图像信息与手工录入的身份证中的相关信息进行一致性对比。以将身份证图像信息中的身份证号对应的字符串与手工录入的身份证中的身份证号对应的字符串进行匹配，且身份证图像信息中的身份证号对应的字符串为610XXX19930721YYYY，手工录入的身份证中的身份证号对应的字符串为610XXX19930924YYYY为例，在对身份证图像信息中的身份证号对应的字符串与手工录入的身份证中的身份证号对应的字符串进行匹配时，与现有技术中不同的是，在本申请实施例中，不是直接将身份证图像信息中的身份证号对应的字符串与手工录入的身份证中的身份证号对应的字符串进行全字段字符匹配，而是先分别对身份证图像信息中的身份证号对应的字符串与手工录入的身份证中的身份证号对应的字符串进行切片处理，得到身份证图像信息中的身份证号对应的3个第一片段，该三个第一片段分别为第一片段610XXX、第一片段19930721以及第一片段YYYY，以及手工录入的身份证中的身份证号对应的3个第二片段，该三个第二片段分别为第二片段610XXX、第二片段19930924以及第二片段YYYY，然后，将身份证图像信息中的身份证号对应的3个第一片段中的第i个第一片段与手工录入的身份证中的身份证号对应的3个第二片段中第i个第一片段进行匹配，即执行下述S203：

S203、将M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配。

其中，i为大于或者等于1，且小于或者等于M的整数。

继续结合上述S202中的相关描述，身份证图像信息中的身份证号对应的三个第一片段分别为第一片段610XXX、第一片段19930721以及第一片段YYYY，以及手工录入的身份证中的身份证号对应的三个第二片段分别为第二片段610XXX、第二片段19930924以及第二片段YYYY，在匹配时，为了避免因为进行字符匹配使用的片段不对应，而导致匹配结果的准确度不高，因此，是将身份证图像信息中的身份证号对应的第一个第一片段610XXX与手工录入的身份证中的身份证号对应的第一个第二片段610XXX进行匹配，将身份证图像信息中的身份证号对应的第二个第一片段19930721与手工录入的身份证中的身份证号对应的第二个第二片段19930924进行匹配，将身份证图像信息中的身份证号对应的第三个第一片段YYYY与手工录入的身份证中的身份证号对应的第三个第二片段YYYY进行匹配，这样可以不仅可以细化匹配的内容，而且还可以提高匹配结果的准确度。

S204、根据字符匹配结果，输出字符匹配结果对应的提示信息。

若字符匹配结果指示匹配，则向用户输出用于指示审核通过的提示信息；相反的，若字符匹配结果指示存在不匹配的片段，则向用户输出用于指示审核不通过，并提醒用户修改片段的提示信息。

需要注意的是，在输出字符匹配结果对应的提示信息时，为了避免提示信息的口语化较严重，不利于智能审核系统的标准化输出，可以制定出规范化的审核结果术语，用于指示规范审核结果。

示例的，结合上述S203中的相关描述，在将身份证图像信息中的身份证号对应的第一个第一片段610XXX与手工录入的身份证中的身份证号对应的第一个第二片段610XXX进行匹配，将身份证图像信息中的身份证号对应的第二个第一片段19930721与手工录入的身份证中的身份证号对应的第二个第二片段19930924进行匹配，将身份证图像信息中的身份证号对应的第三个第一片段YYYY与手工录入的身份证中的身份证号对应的第三个第二片段YYYY进行匹配之后，可以确定身份证图像信息中的身份证号对应的第二个第一片段19930721与手工录入的身份证中的身份证号对应的第二个第二片段19930924不匹配，则可以向用户输出用于指示该片段审核不通过，并提醒用户修改片段的提示信息。

由此可见，本申请实施例提供的信息处理方法，在对商户上传的包括相同目标文本的证件图像信息和商户手工录入的信息进行一致性对比时，不是像现有技术中直接对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行全字段对比，而是通过对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，并将切片处理得到的M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配，细化了匹配的内容，并根据字符匹配结果，输出字符匹配结果对应的提示信息，这样无需采用人工的方式进行审核，从而提高了信息的处理效率。

基于图1所示的实施例，为了更清楚地说明在本申请实施例中，上述S202中如何对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段。示例的，请参见图3所示，图3为本申请实施例提供的另一种信息处理方法的流程示意图，该信息处理方法还可以包括：

S301、确定目标文本对应的目标切片规则。

可以理解的是，在对某一个目标文本进行切片处理时，需要先确定对应的目标切片规则，而不是对该目标文本进行任意切片处理，并且，不同的目标文本对应的目标切片规则不同。

示例的，以身份证图像信息中的身份证号对应的字符串为610XXX19930721YYYY，手工录入的身份证中的身份证号对应的字符串为610XXX19930924YYYY为例，在确定目标文本身份证号对应的目标切片规则时，可以结合身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则，当然，也可以不结合身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则，例如，可以结合身份证号对应的字符串的个数，对个数进行均分确定该目标文本身份证号对应的目标切片规则，在此，本申请实施例只是以结合身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则为例进行说明，但并不代表本申请实施例仅局限于此。可以理解的是，之所以需要结合身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则，是考虑到后期再匹配时，若匹配结果指示不匹配，则可以直接提示用户某一个片段指示的文本内容审核不通过。

众所周知，身份证号对应的字符串包括18个字符，前4个字符代表用户所在的省市，第5个和第6个字符代表用户所在的区/县，第7个字符到第14个字符代表用户的出生年月日，第15个字符到第17个字符表示的是地址码所标识的区域范围内，对同年、月、日出生的人员编定的顺序号。其中第十七位奇数分给男性，偶数分给女性，第18个字符表示的是校验码，是由号码编制单位按统一的公式计算出来的，如果某人的尾号是0-9，都不会出现X，但如果尾号是10，那么就得用X来代替。在充分了解了身份证号对应的字符串中各部分字符片段代表的文本内容之后，就可以结合各部分字符片段代表的文本内容确定目标文本身份证号对应的目标切片规则，该目标切片规则可以为：将前6个字符切片处理为第一个片段，第7个字符到第14个字符切片处理为第二个片段，第15个字符到第18个字符切片处理为第三个片段，从而确定文本内容确定目标文本身份证号对应的目标切片规则。其中，第一个片段代表的文本内容为出生地，第二个片段代表用户的出生年月日，第三个片段代表的是用户的编定的顺序号和检验码。

需要注意的是，在本申请实施例中，在结合身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则之前，执行该信息处理方法的信息处理装置需要先获取到身份证号对应的字符串中各部分字符片段对应的文本内容。示例的，在获取身份证号对应的字符串中各部分字符片段对应的文本内容时，可以先获取上传的多个历史身份证图像信息、每一个身份证图像信息对应的至少一个历史手工录入的身份证信息，以及每一个历史手工录入的身份证信息对应的审核结果；并采用机器学习的方法对多个历史身份证图像信息、每一个身份证图像信息对应的至少一个历史手工录入的身份证信息，以及每一个历史手工录入的身份证信息对应的审核结果进行训练，训练得到各部分字符片段对应的文本内容。

这样就可以结合目标文本身份证号对应的字符串所表示的文本内容确定该目标文本身份证号对应的目标切片规则，并在确定目标文本对应的目标切片规则之后，基于该目标切片规则，分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，即执行下述S302：

S302、根据目标切片规则，分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段。

结合上述S301中的描述，在确定目标文本身份证号对应的目标切片规则：将前6个字符切片处理为第一个片段，第7个字符到第14个字符切片处理为第二个片段，第15个字符到第18个字符切片处理为第三个片段之后，就可以基于该目标切片规则对图像信息中的身份证号对应的字符串和手工录入的身份证中的身份证号对应的字符串进行切片处理，得到身份证图像信息中的身份证号对应的三个第一片段，该三个第一片段分别为第一片段610XXX、第一片段19930721以及第一片段YYYY，以及手工录入的身份证中的身份证号对应的三个第二片段，该三个第二片段分别为第二片段610XXX、第二片段19930924以及第二片段YYYY。

由此可见，在本申请实施例中，在对商户上传的包括相同目标文本的证件图像信息和商户手工录入的信息进行一致性对比时，不是像现有技术中直接对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行全字段对比，而是根据目标切片规则，分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，并将切片处理得到的M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配，细化了匹配的内容，并根据字符匹配结果，输出字符匹配结果对应的提示信息，这样无需采用人工的方式进行审核，从而提高了信息的处理效率。

基于上述图2或图3所示的实施例，在分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段之后，就可以根据字符匹配结果，输出字符匹配结果对应的提示信息。为了更清楚地描述在本申请实施例中，如何根据字符匹配结果，输出字符匹配结果对应的提示信息，示例的，请参见图4所示，图4为本申请实施例提供的又一种信息处理方法的流程示意图，该信息处理方法还可以包括：

S401、若字符匹配结果指示第i个第一片段与第i个第二片段不匹配，则根据第i个片段和片段与文本内容之间的映射关系，确定第i个片段指示的目标文本内容。

可以理解的是，在根据第i个片段和映射关系，确定第i个片段指示的目标文本内容之前，必然需要先确定片段与文本内容之间的映射关系。示例的，在获取片段与文本内容之间的映射关系时，可以先获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果；并根据多个历史证件图像信息、至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果，训练得到片段与文本内容之间的映射关系。

示例的，可以采用机器学习的方法，对多个历史证件图像信息、至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果进行训练，得到片段与文本内容之间的映射关系。示例的，该机器学习的方法可以为逻辑回归、决策树或者随机森林，当然，也可以为其他具有类似功能的学习方式。进一步地，在通过逻辑回归、决策树或者随机森林进行对多个历史证件图像信息、至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果进行训练，得到片段与文本内容之间的映射关系之后，对得到的三种不同的映射关系进行准确度的检测，可以发现，通过随机森林的方法训练得到的片段与文本内容之间的映射关系的准确度较高。

示例的，结合上述S204中的相关描述，在将身份证图像信息中的身份证号对应的第一个第一片段610XXX与手工录入的身份证中的身份证号对应的第一个第二片段610XXX进行匹配，将身份证图像信息中的身份证号对应的第二个第一片段19930721与手工录入的身份证中的身份证号对应的第二个第二片段19930924进行匹配，将身份证图像信息中的身份证号对应的第三个第一片段YYYY与手工录入的身份证中的身份证号对应的第三个第二片段YYYY进行匹配之后，可以确定身份证图像信息中的身份证号对应的第二个第一片段19930721与手工录入的身份证中的身份证号对应的第二个第二片段19930924不匹配，说明可能用户手工录入的身份证中的身份证号对应的第二个第二片段19930924输入有误，因此，为了便于商户快速获取到需要修改的内容，可以先根据片段与文本内容之间的映射关系，确定身份证号对应的第二个片段对应的目标文本内容，该身份证号对应的第二个片段对应的目标文本内容为出生年月日。

在确定不匹配的第i个片段指示的目标文本内容之后，就可以执行下述S402：

S402、输出第一提示信息，第一提示信息用于指示目标文本内容审核不通过。

结合上述S401中的相关描述，在确定不匹配的第二个片段对应的目标文本内容出生年月日之后，就可以输出第一提示信息，该第一提示信息用于提示商户出生年月日不正确，以便用户可以及时修改出生年月日信息，并重新上传身份证号，直至证件图像信息和手工录入的信息审核通过。

S403、若字符匹配结果指示第i个第一片段与第i个第二片段匹配，则输出第二提示信息，第二提示信息用于指示证件图像信息和手工录入的信息审核通过。

示例的，若匹配之后，确定身份证图像信息中的身份证号对应的第一个第一片段与手工录入的身份证中的身份证号对应的第一个第二片段匹配，身份证图像信息中的身份证号对应的第二个第一片段与手工录入的身份证中的身份证号对应的第二个第二片段匹配，身份证图像信息中的身份证号对应的第三个第一片段与手工录入的身份证中的身份证号对应的第三个第二片段匹配，则可以输出第二提示信息，该第二提示信息用于指示身份证图像信息和手工录入的身份证信息审核通过。

可以理解的是，在本申请实施例中，只是以身份证图像信息中的身份证号的审核过程为例进行说明，当然，身份证图像信息中的其它信息，例如姓名、性别和住址等信息的审核过程与身份证图像信息中的身份证号的审核过程类似，在此，本申请实施例不再进行赘述。

需要说明的是，上述S401-S402和S403不能同时执行。

需要说明的是，每得到一次信息处理结果，都可以将用于审核的证件图像信息、商户手工录入的信息，以及对应的审核结果存储在数据库中，以便后续训练片段与文本内容之间的映射关系。

图5为本申请实施例提供的一种信息处理装置50的结构示意图，示例的，请参见图5所示，该信息处理装置50可以包括：

接收单元501，用于接收商户上传的证件图像信息和商户手工录入的信息；其中，证件图像信息和手工录入的信息中包括相同的目标文本。

处理单元502，用于分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理，得到证件图像信息对应的M个第一片段，以及手工录入的信息对应的M个第二片段；M为大于或者等于2的整数。

处理单元502，还用于将M个第一片段中第i个第一片段与M个第二片段中第i个第二片段进行字符匹配；i为大于或者等于1，且小于或者等于M的整数。

输出单元503，用于根据字符匹配结果，输出字符匹配结果对应的提示信息。

可选的，处理单元502，具体用于若字符匹配结果指示第i个第一片段与第i个第二片段不匹配，则确定第i个片段指示的目标文本内容。

输出单元503，具体用于输出第一提示信息，第一提示信息用于指示目标文本内容审核不通过。

可选的，处理单元502，具体用于获取片段与文本内容之间的映射关系；并根据第i个片段和映射关系，确定第i个片段指示的目标文本内容。

可选的，处理单元502，具体用于获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果；并根据多个历史证件图像信息、至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果，训练得到片段与文本内容之间的映射关系。

可选的，处理单元502，具体用于采用机器学习的方法，对多个历史证件图像信息、至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果进行训练，得到片段与文本内容之间的映射关系。

可选的，处理单元502，具体用于确定目标文本对应的目标切片规则；并根据目标切片规则，分别对证件图像信息中目标文本对应的字符串和手工录入的信息中目标文本对应的字符串进行切片处理。

可选的，输出单元503，还用于若字符匹配结果指示第i个第一片段与第i个第二片段匹配，则输出第二提示信息，第二提示信息用于指示证件图像信息和手工录入的信息审核通过。

可选的，处理单元502，还用于采用图像识别技术对证件图像信息中目标文本进行识别，得到证件图像信息中目标文本对应的字符串。

本发明实施例所示的信息处理装置50，可以执行上述任一附图所示的实施例中信息处理方法的技术方案，其实现原理以及有益效果与信息处理方法的实现原理及有益效果类似，此处不再进行赘述。

图6为本发明实施例提供的一种电子设备60的结构示意图，示例的，请参见图6所示，该电子设备60可以包括存储器601和处理器602。

存储器601，用于存储计算机程序；

处理器602，用于读取存储器601存储的计算机程序，并根据所述存储器601中的计算机程序执行上述任一实施例所示的信息处理方法。

可选地，存储器601既可以是独立的，也可以跟处理器602集成在一起。当存储器601是独立于处理器602之外的器件时，电子设备还可以包括：总线，用于连接存储器601和处理器602。

可选地，本实施例还包括：通信接口，该通信接口可以通过总线与处理器602连接。处理器602可以控制通信接口来实现上述电子设备的接收和发送的功能。

本发明实施例所示的电子设备60，可以执行上述任一附图所示的实施例中信息处理方法的技术方案，其实现原理以及有益效果与信息处理方法的实现原理及有益效果类似，此处不再进行赘述。

本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上述任一实施例所述的信息处理方法，其实现原理以及有益效果与信息处理方法的实现原理及有益效果类似，此处不再进行赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所展示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元展示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本发明各个实施例方法的部分步骤。

应理解的是，上述处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital SignalProcessor，简称：DSP)、专用集成电路(英文：Application Specific IntegratedCircuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本发明附图中的总线并不限定仅有一根总线或一种类型的总线。

上述计算机可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种信息处理方法，其特征在于，包括：

接收商户上传的证件图像信息和所述商户手工录入的信息；其中，所述证件图像信息和所述手工录入的信息中包括相同的目标文本；

分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，得到所述证件图像信息对应的M个第一片段，以及所述手工录入的信息对应的M个第二片段；M为大于或者等于2的整数；

将所述M个第一片段中第i个第一片段与所述M个第二片段中第i个第二片段进行字符匹配；i为大于或者等于1，且小于或者等于M的整数；

2.根据权利要求1所述的方法，其特征在于，所述根据字符匹配结果，输出所述字符匹配结果对应的提示信息，包括：

若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段不匹配，则确定第i个片段指示的目标文本内容；

3.根据权利要求2所述的方法，其特征在于，所述确定第i个片段指示的目标文本内容，包括：

获取片段与文本内容之间的映射关系；

根据所述第i个片段和所述映射关系，确定所述第i个片段指示的所述目标文本内容。

4.根据权利要求3所述的方法，其特征在于，所述获取片段与文本内容之间的映射关系，包括：

获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果；

5.根据权利要求4所述的方法，其特征在于，所述根据所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果，训练得到所述片段与文本内容之间的映射关系，包括：

6.根据权利要求1-5任一项所述的方法，其特征在于，所述分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，包括：

确定所述目标文本对应的目标切片规则；

7.根据权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1-5任一项所述的方法，其特征在于，对所述证件图像信息中目标文本对应的字符串进行切片处理之前，还包括：

9.一种信息处理装置，其特征在于，包括：

处理单元，用于分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理，得到所述证件图像信息对应的M个第一片段，以及所述手工录入的信息对应的M个第二片段；M为大于或者等于2的整数；

所述处理单元，还用于将所述M个第一片段中第i个第一片段与所述M个第二片段中第i个第二片段进行字符匹配；i为大于或者等于1，且小于或者等于M的整数；

10.根据权利要求9所述的装置，其特征在于，

所述处理单元，具体用于若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段不匹配，则确定第i个片段指示的目标文本内容；

11.根据权利要求10所述的装置，其特征在于，

所述处理单元，具体用于获取片段与文本内容之间的映射关系；并根据所述第i个片段和所述映射关系，确定所述第i个片段指示的所述目标文本内容。

12.根据权利要求11所述的装置，其特征在于，

所述处理单元，具体用于获取上传的多个历史证件图像信息、每一个历史证件图像信息对应的至少一个历史手工录入的信息，以及每一个历史手工录入的信息对应的审核结果；并根据所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果，训练得到所述片段与文本内容之间的映射关系。

13.根据权利要求12所述的装置，其特征在于，

所述处理单元，具体用于采用机器学习的方法，对所述多个历史证件图像信息、所述至少一个历史手工录入的信息，以及所述每一个历史手工录入的信息对应的审核结果进行训练，得到所述片段与文本内容之间的映射关系。

14.根据权利要求9-13任一项所述的装置，其特征在于，

所述处理单元，具体用于确定所述目标文本对应的目标切片规则；并根据所述目标切片规则，分别对所述证件图像信息中目标文本对应的字符串和所述手工录入的信息中目标文本对应的字符串进行切片处理。

15.根据权利要求9-13任一项所述的装置，其特征在于，

所述输出单元，还用于若所述字符匹配结果指示所述第i个第一片段与所述第i个第二片段匹配，则输出第二提示信息，所述第二提示信息用于指示所述证件图像信息和所述手工录入的信息审核通过。

16.根据权利要求9-13任一项所述的装置，其特征在于，

所述处理单元，还用于采用图像识别技术对所述证件图像信息中目标文本进行识别，得到所述证件图像信息中目标文本对应的字符串。

17.一种电子设备，其特征在于，包括存储器和处理器；

存储器，用于存储计算机程序；

处理器，用于读取存储器存储的计算机程序，并根据所述存储器中的计算机程序执行如权利要求1至8任一项所述的信息处理方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至8任一项所述的信息处理方法。