CN112232337A - 特殊语言文字的匹配方法及信息验证方法和装置 - Google Patents

特殊语言文字的匹配方法及信息验证方法和装置 Download PDF

Info

Publication number
CN112232337A
CN112232337A CN202011074846.1A CN202011074846A CN112232337A CN 112232337 A CN112232337 A CN 112232337A CN 202011074846 A CN202011074846 A CN 202011074846A CN 112232337 A CN112232337 A CN 112232337A
Authority
CN
China
Prior art keywords
special language
information
verified
special
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011074846.1A
Other languages
English (en)
Inventor
甘宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Labs Singapore Pte Ltd
Original Assignee
Alipay Labs Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Labs Singapore Pte Ltd filed Critical Alipay Labs Singapore Pte Ltd
Priority to CN202011074846.1A priority Critical patent/CN112232337A/zh
Publication of CN112232337A publication Critical patent/CN112232337A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本说明书公开了一种特殊语言文字的匹配方法及信息验证方法和装置。该方法包括:获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。

Description

特殊语言文字的匹配方法及信息验证方法和装置
技术领域
本文件涉及计算机技术领域,尤其涉及一种特殊语言文字的匹配方法及信息验证方法和装置。
背景技术
目前,在金融领域,越来越多的金融公司或机构选择在线身份验证的方式来验证用户的身份,证明“你是你”。这类验证方式采用拍摄用户的身份证件,并且采集用户的人脸图像进行匹配验证的方式,来验证用户的人脸图像中的人脸是否和用户的身份证件上的人脸一致,以及用户的身份证件中的身份信息是否与预留的身份信息一致,从而证明“你是你”。这类产品也叫企业电子身份认证信息(electronic Know Your Customer,eKYC)系统。
然而,在eKYC系统应用于一些特殊语言文字比如越南文字等小语种文字的场景中时,由于中特殊语言文字比如越南文字等小语种文字会存在大量的音标符号,而且音标种类繁多,这些音标作为文字的修饰,那么,在通过OCR进行文字识别的过程中,这类文字信息则容易受到打印水平、或证件质量等因素导致识别和匹配错误。因此,如何对带音标的字符进行识别和准确地匹配,仍然需要进一步的解决方案。
发明内容
本说明书实施例提供了一种特殊语言文字的匹配方法及信息验证方法和装置,以解决现有技术中在通过OCR对越南文字等带音标的小语种文字进行文字识别的过程中,这类文字信息则容易受到打印水平、或证件质量等因素导致识别和匹配错误的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种特殊语言文字的匹配方法,包括:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
第二方面,提出了一种信息验证方法,包括:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与所述预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
第三方面,提出了一种特殊语言文字的匹配装置,包括:
获取模块,获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
音标编辑距离确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
元音编辑距离确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
匹配结果确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
第四方面,提出了一种缅甸文字的识别装置,包括:
信息获取模块,获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
距离确定模块,确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
信息验证模块,基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
第五方面,提出了一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
第六方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
第七方面,提出了一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
第八方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
本说明书实施例采用上述技术方案至少可以达到下述技术效果:
在对特殊语言文字进行匹配时,能够获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;再基于第一特殊语言文字与第二特殊语言文字的差异音标数量,确定第一特殊语言文字与第二特殊语言文字之间的音标编辑距离;以及基于第一特殊语言文字与第二特殊语言文字之间的差异元音数量,确定第一特殊语言文字与第二特殊语言文字之间的元音编辑距离;最后基于第一特殊语言文字与第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定第一特殊语言文字与第二特殊语言文字之间的匹配结果。从音标的编辑距离和元音的编辑距离两个角度来比较两个特殊语言文字之间的差异,达到优化匹配越南文字等带有音标的小语种文字的准确率的目的。
在对包含有音标和元音的特殊语言文字的信息进行验证时,通过获取待验证的信息,该待验证的信息中包含特殊语言文字,该特殊语言文字中包含音标和元音;确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;基于待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对待验证的信息进行验证,实现了对越南文字等包含有音标和元音等特殊语言文字的信息的验证,从元音编辑距离和音标编辑距离两个方面来对待验证的信息进行验证,也极大地提高了对包含有特殊语言文字的信息验证的准确率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本文件,并不构成对本说明书的不当限定。在附图中:
图1为本说明书一个实施例提供的一种特殊语言文字的匹配方法的实现流程示意图;
图2为本说明书一个实施例提供的特殊语言文字的匹配方法中差异音标数量和差异元音数量的确定过程示意图;
图3为本说明书一个实施例提供的一种信息验证方法的实现流程示意图;
图4为本说明书一个实施例提供的一种特殊语言文字的匹配装置的结构示意图;
图5为本说明书一个实施例提供的一种信息验证装置的结构示意图;
图6为本说明书一个实施例提供的一种电子设备的结构示意图;
图7为本说明书一个实施例提供的另一种电子设备的结构示意图。
具体实施方式
为使本文件的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
为解决在通过OCR对越南文字等带音标的小语种文字进行文字识别的过程中,这类文字信息则容易受到打印水平、或证件质量等因素导致识别和匹配错误的问题,本说明书实施例提供一种特殊语言文字的匹配方法,采用本说明书实施例提供的方法在对特殊语言文字进行匹配时,能够获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;再基于第一特殊语言文字与第二特殊语言文字的差异音标数量,确定第一特殊语言文字与第二特殊语言文字之间的音标编辑距离;以及基于第一特殊语言文字与第二特殊语言文字之间的差异元音数量,确定第一特殊语言文字与第二特殊语言文字之间的元音编辑距离;最后基于第一特殊语言文字与第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定第一特殊语言文字与第二特殊语言文字之间的匹配结果。从音标的编辑距离和元音的编辑距离两个角度来比较两个特殊语言文字之间的差异,达到优化匹配越南文字等带有音标的小语种文字的准确率的目的。
本说明书实施例提供的特殊语言文字的匹配方法的执行主体可以但不限于服务器、个人电脑等能够被配置为执行本发明实施例提供的该方法终端中的至少一种。
为便于描述,下文以该方法的执行主体为能够执行该方法的服务器为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为服务器只是一种示例性的说明,并不应理解为对该方法的限定。
具体地,本说明书一个或多个实施例提供的一种特殊语言文字的匹配方法的实现流程示意图如图1所示,包括:
步骤110,获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量。
其中,第一特殊语言文字和第二特殊语言文字均为包含有音标和元音的特殊语言文字,比如越南文字等包含有音标和元音的小语种文字。这类文字由于既包含有元音字符又包含有音标符号,而且包含的音标符号的种类和数量比较多,因此,在对这类特殊语言文字进行识别和匹配时,可能会因为字体或印刷的问题导致音标符号的细微差异,进而对其识别和匹配造成一些比较大的误差。本说明书实施例为了解决上述问题,将第一特殊语言文字与第二特殊语言文字之间的元音差异和音标差异单独拎出来进行比较。
其中,第一特殊语言文字和第二特殊语言文字之间的差异元音具体可以是指,在不考虑元音上标注的音标的前提下,单独对比第一特殊语言文字和第二特殊语言文字之间的存在差异的元音的数量。应理解,第一特殊语言文字和第二特殊语言文字能够进行匹配的前提是:第一特殊语言文字和第二特殊语言文字的元音数量一致。
如图2所示,为本说明书一个实施例提供的特殊语言文字的匹配方法中差异音标数量和差异元音数量的确定过程示意图。在图2左侧部分,为确定第一特殊语言文字“HO,Siu Tung”和第二特殊语言文字“Ho,Siu Tung”之间的差异元音数量的过程示意图。将第一特殊语言文字“HO,Siu Tung”和第二特殊语言文字“Ho,Siu Tung”中的对应位置的元音逐个进行比较,得到差异元音为第一特殊语言文字中的“O”和第二特殊语言文字中的“o”之间存在差异,因此,该第一特殊语言文字“HO,Siu Tung”和第二特殊语言文字“Ho,Siu Tung”中的差异元音数量为1。第一特殊语言文字“HO,Siu Tung”和第二特殊语言文字“Ho,SiuTung”之间的差异音标数量为0。
可选地,本说明书实施例中差异音标的前提是,在第一特殊语言文字和第二特殊语言文字对应的位置处被该差异音标标注的元音是相同的。具体地,获取第一特殊语言文字与第二特殊语言文字的差异音标数量,包括:
获取第一特殊语言文字与第二特殊语言文字之间相同的元音;
从第一特殊语言文字与第二特殊语言文字之间相同的元音中,确定第一特殊语言文字与第二特殊语言文字的差异音标数量;
基于第一特殊语言文字与第二特殊语言文字的差异音标数量,确定第一特殊语言文字与第二特殊语言文字之间的音标编辑距离。
在图2右侧部分,为确定第一特殊语言文字
Figure BDA0002716377240000081
和第二特殊语言文字
Figure BDA0002716377240000082
之间的差异元音数量和差异音标数量的过程示意图。将第一特殊语言文字
Figure BDA0002716377240000083
和第二特殊语言文字
Figure BDA0002716377240000084
Figure BDA0002716377240000085
中的对应位置的元音逐个进行比较,得到差异元音为第一特殊语言文字中的“C”和第二特殊语言文字中的“O”之间存在差异,因此,该第一特殊语言文字
Figure BDA0002716377240000091
和第二特殊语言文字
Figure BDA0002716377240000092
中的差异元音数量为1。
再确定第一特殊语言文字
Figure BDA0002716377240000093
和第二特殊语言文字
Figure BDA0002716377240000094
Figure BDA0002716377240000095
之间的差异音标数量。首先,确定第一特殊语言文字
Figure BDA0002716377240000096
和第二特殊语言文字
Figure BDA0002716377240000097
之间的相同的元音,如图2中的右侧部分所示,该相同的元音为除第一特殊语言文字
Figure BDA0002716377240000098
和第二特殊语言文字
Figure BDA0002716377240000099
第一个元音以外的其它元音;然后,再逐个确定第一特殊语言文字
Figure BDA00027163772400000910
和第二特殊语言文字
Figure BDA00027163772400000911
第一个元音之后的其它元音上标注的音标中是否存在差异的音标,如图2中的右侧部分所示,该差异的音标为第一特殊语言文字
Figure BDA00027163772400000912
中的
Figure BDA00027163772400000913
以及第二特殊语言文字
Figure BDA00027163772400000914
中的
Figure BDA00027163772400000915
即标注在元音“a”上的音标存在差异,该差异音标的个数为1。
步骤120,基于第一特殊语言文字与第二特殊语言文字的差异音标数量,确定第一特殊语言文字与第二特殊语言文字之间的音标编辑距离。
其中,第一特殊语言文字与第二特殊语言文字之间的音标编辑距离具体可以通过第一特殊语言文字与第二特殊语言文字的差异音标数量来表征。
步骤130,基于第一特殊语言文字与第二特殊语言文字之间的差异元音数量,确定第一特殊语言文字与第二特殊语言文字之间的元音编辑距离。
其中,第一特殊语言文字与第二特殊语言文字之间的元音编辑距离具体可以通过第一特殊语言文字与第二特殊语言文字之间的差异元音数量来表征。
步骤140,基于第一特殊语言文字与第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定第一特殊语言文字与第二特殊语言文字之间的匹配结果。
第一特殊语言文字与第二特殊语言文字之间的匹配结果,具体可以通过第一特殊语言文字与第二特殊语言文字之间的元音编辑距离和音标编辑距离构建的数组来表征,也可以分别对元音编辑距离和音标编辑距离设置权重,将两者距离乘以对应的权重后进行相加,得到第一特殊语言文字与第二特殊语言文字之间的匹配结果。
在实际应用中,以第一特殊语言文字
Figure BDA0002716377240000101
和第二特殊语言文字
Figure BDA0002716377240000102
为例,第一特殊语言文字
Figure BDA0002716377240000103
和第二特殊语言文字
Figure BDA0002716377240000104
之间的元音编辑距离为1,音标编辑距离为1,则第一特殊语言文字与第二特殊语言文字之间的匹配结果可以表示为(1,1);或者,设置元音编辑距离的权重为1,音标编辑距离的权重为0.5,将第一特殊语言文字与第二特殊语言文字之间的匹配结果表示为元音编辑距离1×1+音标编辑距离1×0.5=1.5。
可选地,本说明书实施例提供的特殊语言文字的匹配方法还可应用于eKYC场景中,用于校验采集的身份信息是否为真实的身份信息。具体地,当第一特殊语言文字为待验证的特殊语言文字,第二特殊语言文字为基准特殊语言文字时,在确定第一特殊语言文字与第二特殊语言文字之间的匹配结果之后,本说明书实施例提供的方法还包括:
基于第一特殊语言文字与第二特殊语言文字之间的匹配结果,确定第一特殊语言文字是否通过验证。
其中,第一特殊语言文字在实际的eKYC场景中,可以为采集的待验证的身份信息,第二特殊语言文字也可以称为基准语言文字,可以是预先采集并记录的用户的身份信息。如果第一特殊语言文字与第二特殊语言文字之间的匹配结果在预设范围内,则可通过对第一特殊语言文字的验证,否则,则不通过对第一特殊语言文字的验证。
在对特殊语言文字进行匹配时,能够获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;再基于第一特殊语言文字与第二特殊语言文字的差异音标数量,确定第一特殊语言文字与第二特殊语言文字之间的音标编辑距离;以及基于第一特殊语言文字与第二特殊语言文字之间的差异元音数量,确定第一特殊语言文字与第二特殊语言文字之间的元音编辑距离;最后基于第一特殊语言文字与第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定第一特殊语言文字与第二特殊语言文字之间的匹配结果。从音标的编辑距离和元音的编辑距离两个角度来比较两个特殊语言文字之间的差异,达到优化匹配越南文字等带有音标的小语种文字的准确率的目的。
为解决现有技术中在通过OCR对越南文字等带音标的小语种文字进行文字识别的过程中,这类文字信息则容易受到打印水平、或证件质量等因素导致识别和匹配错误的问题,本说明书实施例还提供一种信息验证方法,采用本说明书实施例提供的方法在对包含有音标和元音的特殊语言文字的信息进行验证时,通过获取待验证的信息,该待验证的信息中包含特殊语言文字,该特殊语言文字中包含音标和元音;确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;基于待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对待验证的信息进行验证,实现了对越南文字等包含有音标和元音等特殊语言文字的信息的验证,从元音编辑距离和音标编辑距离两个方面来对待验证的信息进行验证,也极大地提高了对包含有特殊语言文字的信息验证的准确率。
本说明书实施例提供的信息验证方法的执行主体可以但不限于服务器、个人电脑、终端设备等能够被配置为执行本发明实施例提供的该方法终端中的至少一种。
为便于描述,下文以该方法的执行主体为能够执行该方法的终端设备为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为终端设备只是一种示例性的说明,并不应理解为对该方法的限定。
具体地,本说明书一个或多个实施例提供的一种信息验证方法的实现流程示意图如图3所示,包括:
步骤310,获取待验证的信息,该待验证的信息中包含特殊语言文字,特殊语言文字中包含音标和元音。
其中,该待验证的信息可以包括身份信息,比如可以应用于eKYC系统中,对用户的身份信息进行验证,将采集的用户的身份信息与预留的用户的身份信息进行比对,以确定用户的信息的真实性。
步骤320,确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离。
可选地,为了提高对待验证的信息的验证效率,可从待验证的信息中获取待验证信息的标识,再基于该待验证信息的标识,从预留的信息库中获取与待验证信息的标识相匹配的预留的信息,再基于待验证的信息与预留的信息之间的匹配度,对待验证的信息进行验证。具体地,确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,包括:
确定待验证的信息的标识;
基于待验证的信息的标识,从预留的信息库中确定与待验证的信息的标识相匹配的预留的信息;
确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离。
以身份验证场景为例,待验证的信息中包含身份信息,比如身份证号码,该身份证号码可以作为待验证的信息的标识,可以基于该身份证号码从预留的信息库中获取包含该身份证号码的预留的信息。
可选地,确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,包括:
确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异音标数量和差异元音数量;
基于待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异音标数量,确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的音标编辑距离;
基于待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异元音数量,确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的元音编辑距离。
可选地,基于待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异元音数量,确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的元音编辑距离,包括:
获取待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间相同的元音;
从待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间相同的元音中,确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异音标数量;
基于待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的差异音标数量,确定待验证的信息中的特殊语言文字与预留的信息中的特殊语言文字之间的音标编辑距离。
步骤330,基于待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对待验证的信息进行验证。
具体地,可分别为元音编辑距离和音标编辑距离设置一个误差范围,当待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离均在设置的误差范围内,则可通过对待验证的信息的验证,否则,不通过对待验证的信息的验证;或者,也可以对元音编辑距离和音标编辑距离分别设置一个权重,并预设一个误差范围,比如元音编辑距离的权重设置为1,音标编辑距离的权重设置为0.5,在获取到待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离之后,再计算元音编辑距离×1+音标编辑距离×0.5,如果两者之和在预设的误差范围内,则通过对待验证信息的验证,否则,不通过对待验证信息的验证。
图3所示实施例相关步骤的具体实现可参考图1所示实施例中对应的步骤的具体实现,本说明书一个或多个实施例在此不再赘述。
在对包含有音标和元音的特殊语言文字的信息进行验证时,通过获取待验证的信息,该待验证的信息中包含特殊语言文字,该特殊语言文字中包含音标和元音;确定待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;基于待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对待验证的信息进行验证,实现了对越南文字等包含有音标和元音等特殊语言文字的信息的验证,从元音编辑距离和音标编辑距离两个方面来对待验证的信息进行验证,也极大地提高了对包含有特殊语言文字的信息验证的准确率。
图4是本说明书提供的特殊语言文字的匹配装置400的结构示意图。请参考图4,在一种软件实施方式中,特殊语言文字的匹配装置400可包括获取模块401、音标编辑距离确定模块402、元音编辑距离确定模块403和匹配结果确定模块404,其中:
获取模块401,获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
音标编辑距离确定模块402,基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
元音编辑距离确定模块403,基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
匹配结果确定模块404,基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
可选地,在一种实施方式中,所述获取模块401,用于:
获取所述第一特殊语言文字与所述第二特殊语言文字之间相同的元音;
从所述第一特殊语言文字与所述第二特殊语言文字之间相同的元音中,确定所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量。
可选地,在一种实施方式中,当所述第一特殊语言文字为待验证的特殊语言文字,所述第二特殊语言文字为基准特殊语言文字时,在所述匹配结果确定模块404确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果之后,所述装置还包括:
验证结果确定单元,基于所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果,确定所述第一特殊语言文字是否通过验证。
特殊语言文字的匹配装置400能够实现图1的方法实施例的方法,具体可参考图1所示实施例的特殊语言文字的匹配方法,不再赘述。
图5是本说明书提供的信息验证装置500的结构示意图。请参考图5,在一种软件实施方式中,信息验证装置500可包括信息获取模块501、距离确定模块502和信息验证模块503,其中:
信息获取模块501,获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
距离确定模块502,确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
信息验证模块503,基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
可选地,在一种实施方式中,所述距离确定模块502,用于:
确定所述待验证的信息的标识;
基于所述待验证的信息的标识,从预留的信息库中确定与所述待验证的信息的标识相匹配的所述预留的信息;
确定所述待验证的信息与所述预留的信息之间的元音编辑距离和音标编辑距离。
可选地,在一种实施方式中,所述距离确定模块502,用于:
确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量和差异元音数量;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的音标编辑距离;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异元音数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的元音编辑距离。
可选地,在一种实施方式中,所述距离确定模块502,用于:
获取所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间相同的元音;
从所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间相同的元音中,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的音标编辑距离。
信息验证装置500能够实现图3的方法实施例的方法,具体可参考图3所示实施例的信息验证方法,不再赘述。
图6是本说明书的一个实施例提供的电子设备的结构示意图。请参考图6,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成特殊语言文字的匹配装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
上述如本说明书图1所示实施例揭示的特殊语言文字的匹配方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的特殊语言文字的匹配方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
图7是本说明书的一个实施例提供的电子设备的结构示意图。请参考图7,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成信息验证装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
上述如本说明书图3所示实施例揭示的信息验证方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图3的信息验证方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3所示实施例的方法,并具体用于执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (13)

1.一种特殊语言文字的匹配方法,包括:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
2.如权利要求1所述的方法,获取第一特殊语言文字与第二特殊语言文字的差异音标数量,包括:
获取所述第一特殊语言文字与所述第二特殊语言文字之间相同的元音;
从所述第一特殊语言文字与所述第二特殊语言文字之间相同的元音中,确定所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量。
3.如权利要求1~2中任一所述的方法,当所述第一特殊语言文字为待验证的特殊语言文字,所述第二特殊语言文字为基准特殊语言文字时,在确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果之后,所述方法还包括:
基于所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果,确定所述第一特殊语言文字是否通过验证。
4.一种信息验证方法,包括:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与所述预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
5.如权利要求4所述的方法,确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,包括:
确定所述待验证的信息的标识;
基于所述待验证的信息的标识,从预留的信息库中确定与所述待验证的信息的标识相匹配的所述预留的信息;
确定所述待验证的信息与所述预留的信息之间的元音编辑距离和音标编辑距离。
6.如权利要求5所述的方法,确定所述待验证的信息与所述预留的信息之间的元音编辑距离和音标编辑距离,包括:
确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量和差异元音数量;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的音标编辑距离;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异元音数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的元音编辑距离。
7.如权利要求6所述的方法,基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的音标编辑距离,包括:
获取所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间相同的元音;
从所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间相同的元音中,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量;
基于所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的差异音标数量,确定所述待验证的信息中的特殊语言文字与所述预留的信息中的特殊语言文字之间的音标编辑距离。
8.一种特殊语言文字的匹配装置,包括:
获取模块,获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
音标编辑距离确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
元音编辑距离确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
匹配结果确定模块,基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
9.一种信息验证装置,包括:
信息获取模块,获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
距离确定模块,确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
信息验证模块,基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
10.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
11.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取第一特殊语言文字与第二特殊语言文字的差异音标数量和差异元音数量;
基于所述第一特殊语言文字与所述第二特殊语言文字的差异音标数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的音标编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的差异元音数量,确定所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离;
基于所述第一特殊语言文字与所述第二特殊语言文字之间的元音编辑距离和音标编辑距离,确定所述第一特殊语言文字与所述第二特殊语言文字之间的匹配结果。
12.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
13.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待验证的信息,所述待验证的信息中包含特殊语言文字,所述特殊语言文字中包含音标和元音;
确定所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离;
基于所述待验证的信息与预留的信息之间的元音编辑距离和音标编辑距离,对所述待验证的信息进行验证。
CN202011074846.1A 2020-10-09 2020-10-09 特殊语言文字的匹配方法及信息验证方法和装置 Pending CN112232337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011074846.1A CN112232337A (zh) 2020-10-09 2020-10-09 特殊语言文字的匹配方法及信息验证方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011074846.1A CN112232337A (zh) 2020-10-09 2020-10-09 特殊语言文字的匹配方法及信息验证方法和装置

Publications (1)

Publication Number Publication Date
CN112232337A true CN112232337A (zh) 2021-01-15

Family

ID=74120703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011074846.1A Pending CN112232337A (zh) 2020-10-09 2020-10-09 特殊语言文字的匹配方法及信息验证方法和装置

Country Status (1)

Country Link
CN (1) CN112232337A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420766A (zh) * 2021-07-05 2021-09-21 北京理工大学 一种融合语言信息的低资源语种ocr方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179774A1 (en) * 2014-12-18 2016-06-23 International Business Machines Corporation Orthographic Error Correction Using Phonetic Transcription
CN107301176A (zh) * 2017-06-30 2017-10-27 广东欧珀移动通信有限公司 一种翻译方法、装置及存储介质、电子设备
CN111160044A (zh) * 2019-12-31 2020-05-15 出门问问信息科技有限公司 文语转换方法及装置、终端和计算机可读存储介质
CN111179904A (zh) * 2019-12-31 2020-05-19 出门问问信息科技有限公司 混合文语转换方法及装置、终端和计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179774A1 (en) * 2014-12-18 2016-06-23 International Business Machines Corporation Orthographic Error Correction Using Phonetic Transcription
CN107301176A (zh) * 2017-06-30 2017-10-27 广东欧珀移动通信有限公司 一种翻译方法、装置及存储介质、电子设备
CN111160044A (zh) * 2019-12-31 2020-05-15 出门问问信息科技有限公司 文语转换方法及装置、终端和计算机可读存储介质
CN111179904A (zh) * 2019-12-31 2020-05-19 出门问问信息科技有限公司 混合文语转换方法及装置、终端和计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420766A (zh) * 2021-07-05 2021-09-21 北京理工大学 一种融合语言信息的低资源语种ocr方法
CN113420766B (zh) * 2021-07-05 2022-09-16 北京理工大学 一种融合语言信息的低资源语种ocr方法

Similar Documents

Publication Publication Date Title
CN109977935B (zh) 一种文本识别方法及装置
TWI759536B (zh) 聲紋認證方法、帳號註冊方法及裝置
TWI686757B (zh) 資源轉移方法、資金支付方法、裝置及電子設備
TWI701603B (zh) 輔助物品的圖像合規的方法、裝置和電子設備
CN109033772B (zh) 一种验证信息的输入方法及装置
CN111832535A (zh) 人脸识别方法及装置
CN109271611B (zh) 一种数据校验方法、装置及电子设备
CN111242124A (zh) 一种证件分类方法、装置及设备
CN106250755B (zh) 用于生成验证码的方法及装置
CN111079379A (zh) 形近字获取方法、装置、电子设备及存储介质
CN112232337A (zh) 特殊语言文字的匹配方法及信息验证方法和装置
CN109740336B (zh) 一种图片中的验证信息的识别方法、装置及电子设备
CN112286968A (zh) 一种业务识别方法、设备、介质及电子设备
CN112990940B (zh) 企业认证方法及装置
CN116189215A (zh) 自动审核方法、装置、电子设备及存储介质
US10902106B2 (en) Authentication and authentication mode determination method, apparatus, and electronic device
JP6563001B2 (ja) 補充取引におけるリスクを検出して警告するためのシステムおよび方法
CN115270086A (zh) 账户认证方法、装置及设备
CN110018844B (zh) 决策触发方案的管理方法、装置和电子设备
CN111383124A (zh) 一种用户材料的校验方法和装置
CN112183270A (zh) 身份验证的拍摄参数的优化方法、装置及电子设备
TW201732683A (zh) 資訊識別方法及裝置
CN111324879A (zh) 一种登录状态控制方法、装置和设备
CN112101308B (zh) 一种基于语言模型的文本框的合并方法、装置及电子设备
CN111046658A (zh) 一种乱序文本识别方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination