CN111597802B - 一种业务处理方法、装置及电子设备 - Google Patents

一种业务处理方法、装置及电子设备 Download PDF

Info

Publication number
CN111597802B
CN111597802B CN202010408420.9A CN202010408420A CN111597802B CN 111597802 B CN111597802 B CN 111597802B CN 202010408420 A CN202010408420 A CN 202010408420A CN 111597802 B CN111597802 B CN 111597802B
Authority
CN
China
Prior art keywords
characters
character string
text element
text
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010408420.9A
Other languages
English (en)
Other versions
CN111597802A (zh
Inventor
甘宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Labs Singapore Pte Ltd
Original Assignee
Alipay Labs Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Labs Singapore Pte Ltd filed Critical Alipay Labs Singapore Pte Ltd
Priority to CN202010408420.9A priority Critical patent/CN111597802B/zh
Publication of CN111597802A publication Critical patent/CN111597802A/zh
Application granted granted Critical
Publication of CN111597802B publication Critical patent/CN111597802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本说明书实施例公开了一种业务处理方法、装置及电子设备,采集目标对象;识别所述目标对象中的文本元素;根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。

Description

一种业务处理方法、装置及电子设备
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种业务处理方法、装置及电子设备。
背景技术
在进行业务处理的过程中,通常是根据业务信息中的业务元素与编码字符之间的对应关系,获取与业务元素对应的编码字符后,对获取的编码字符进行编码后得到业务编码,再利用业务编码进行业务处理。
发明内容
有鉴于此,本说明书实施例提供了一种业务处理方法、装置及电子设备,用于解决现有技术中在信息中的一个元素对应多个字符时,对该信息进行业务处理时容易出现误差的问题。
本说明书实施例采用下述技术方案:
本说明书实施例提供一种业务处理方法,包括:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
本说明书实施例还提供一种业务处理方法,包括:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
本说明书实施例还提供一种业务处理方法,包括:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
本说明书实施例还提供一种业务处理装置,包括:
采集模块,采集目标对象;
识别模块,识别所述目标对象中的文本元素;
第一获取模块,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
编码模块,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
本说明书实施例还提供一种业务处理装置,包括:
接收模块,接收目标对象获取请求,所述目标对象获取请求携带对象标识;
第一获取模块,获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的各个文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
解码模块,对所述目标编码进行解码,得到所述第二套字符;
第二获取模块,利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
生成模块,利用所述字符串对应的文本元素生成所述目标对象。
本说明书实施例还提供一种业务处理装置,包括:
采集模块,采集目标对象;
识别模块,识别所述目标对象中的文本元素;
第一获取模块,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
编码模块,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
比对模块,将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取文本元素对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码进行业务处理。
这样,目标编码中的编码字符与各个文本元素一一对应。在利用目标编码进行业务处理时,可以不需要选择邻近的编码字符进行组合,避免了将编码字符进行错误的组合,修正因文本元素与字符串对应而造成的误差,提高业务处理效率。
附图说明
此处所说明的附图用来提供对本说明书实施例的进一步理解,构成本说明书实施例的一部分,本说明书的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例提供的一种业务处理方法的流程示意图;
图2为本说明书实施例提供的一种业务处理方法的流程示意图;
图3为本说明书实施例提供的一种业务处理方法的流程示意图;
图4为本说明书实施例提供的一种业务处理方法的流程示意图;
图5为本说明书实施例提供的一种业务处理方法中孟加拉文的待比对文本的示意图;
图6为本说明书实施例提供的一种业务处理方法中待比对文本与Unicode的对应关系图;
图7为本说明书实施例提供的一种业务处理方法中将单字孟加拉文对应的五位Unicode对应转换为待比对目标字符的对应关系图;
图8为本说明书实施例提供的一种业务处理方法中将单字孟加拉文对应的四位Unicode对应转换为待比对目标字符的对应关系图;
图9为本说明书实施例提供的一种业务处理方法中将单字孟加拉文对应的三位Unicode对应转换为待比对目标字符的对应关系图;
图10为本说明书实施例提供的一种业务处理方法中将单字孟加拉文对应的两位Unicode对应转换为待比对目标字符的对应关系图;
图11为本说明书实施例提供的一种业务处理方法中将单字孟加拉文对应的一位Unicode对应转换为待比对目标字符的对应关系图;
图12为本说明书实施例提供的一种业务处理装置的结构示意图;
图13为本说明书实施例提供的一种业务处理装置的结构示意图;
图14为本说明书实施例提供的一种业务处理装置的结构示意图。
具体实施方式
现有技术中,由于存在一个业务元素对应多位编码字符的情况,在这种情况下,如果业务信息中的其中一个业务元素出现错误,实际影响的可能是该业务元素,但由于该出现错误的业务元素对应多位编码字符,那么在对该业务信息进行业务处理的过程中,对应的多位编码字符可能会对业务处理结果造成较大的误差。
因此,本说明书实施例提供了一种业务处理方法、装置及电子设备,在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取文本元素对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码进行业务处理。
这样,目标编码中的编码字符与各个文本元素一一对应。在利用目标编码进行业务处理时,可以不需要选择邻近的编码字符进行组合,避免了将编码字符进行错误的组合,修正因文本元素与字符串对应而造成的误差,提高业务处理效率。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书实施例提供的一种业务处理方法的流程示意图,本说明书实施例以目标对象的编码过程为具体应用实施例。
S101:采集目标对象。
在本说明书实施例中,目标对象可以理解为需要进行业务处理的对象,该目标对象中可以包含文本元素,具体可以是从图片、文档或者其他类型文件中提取的文本元素作为目标对象,在此不做具体限定。例如,用户在办理业务时,输入的业务信息或者用户信息等,可以提取用户输入的业务信息或者用户信息中的文本元素作为目标对象,以进行进一步的业务处理。
作为一种应用实施例,采集目标对象,可以包括:
在接收到触发事件时,采集所述目标对象。
触发事件可以是用户在终端上的操作信息,该操作信息具体可以是指用户根据业务处理的需要而在终端上执行的操作信息,终端可以在接收到触发事件时,触发采集目标对象。
具体地,接收到触发事件,可以包括如下至少一种方式:
接收到用户输入的目标对象;
接收到用户对所述目标对象的指定操作。
在具体应用场景中,用户在终端上的操作信息可以是指用户在终端上输入目标对象,以进行具体的业务处理。终端在接收到用户输入的目标对象时,可以触发采集该目标对象,根据该目标对象来进行相应业务的处理。
用户对目标对象的指定操作可以是指用户对目标对象的采集指令操作,具体可以是点击操作、输入操作、下载操作等,在此不做具体限定。
S103:识别所述目标对象中的文本元素。
在本说明书实施例中,文本元素可以理解为目标对象中的各个组成对象,具体可以是文字、标点符号、数字、字母等,在此不做具体限定。通过对目标对象中的各个文本元素进行识别,可以确定出各个文本元素的形状特征,从而可以根据形状特征获取各个文本元素对应的编码字符。
作为一种应用实施例,识别所述目标对象中的文本元素,可以包括:
对所述目标对象进行元素切割处理;
对切割后得到的文本元素进行识别。
在本说明书实施例中,终端为确定目标对象中的文本元素的具体含义,需要根据文本元素的具体形状特征来将文本元素转化为对应的编码字符,使得终端可以根据编码字符来对目标对象的具体含义进行确认。
具体的,终端可以采用元素切割的方式进行文本元素识别,根据文本元素的具体特征来对目标对象进行文本元素切割处理,将目标对象进行切割之后,可以对切割后得到的各个文本元素进行识别,从而确定出目标对象中的各个文本元素。在具体应用场景中,可以采用OCR(Optical Character Recognition,光学字符识别)方法对目标对象进行文本元素识别。
例如,对于目标对象为记载有文字信息的文档,终端便可以根据文字信息中的各个文字的字形来对文档进行文本元素切割处理,进而可以根据切割结果来识别出文字信息中的各个文字。
S105:根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符。
在本说明书实施例中,第一套字符可以理解为一种计算机编码字符,通过获取各个文本元素所对应的第一套字符,终端可以通过识别该第一套字符来确认目标对象的具体含义。
对于不同种类的文本元素,不同文本元素对应的第一套字符可能存在文本元素与字符一一对应的情况,也可能存在文本元素与多个第一套字符对应的情况,例如,对于孟加拉文,一个文本元素与五个第一套字符相对应,其对应的五个第一套字符分别是09ae、09cd、09aa、09cd、09b0。
作为一种应用实施例,在获取与所述文本元素对应的第一套字符之后,还可以包括:
若识别到所述目标对象中的至少两个文本元素,则根据所述目标对象所反映信息的类型,获取与所述信息的类型对应的预设排布规则;
按照所述预设排布规则对所述至少两个文本元素分别对应的所述第一套字符进行排序。
在本说明书实施例中,对于不同的信息类型,具有不同的排布规范,即不同的预设排布规则,例如,对于地址信息,需要按照地理层级进行规范化,如(XX省)XX市XX区XX街道XX号XX小区XX栋楼XX室,对于公司名称信息,需要按照公司注册名称进行规范化,如XX股份有限公司,等等。
在具体应用场景中,可能存在没有按照所属信息类型的排布规范进行信息登记的情况,即省略登记的信息,但登记的信息与按照排布规范存储的标准信息代表同一个信息,例如,登记的公司名称信息XX有限公司与排布规范信息XX股份有限公司实际属于同一个公司。
在这种情况下,若以登记的信息作为目标对象,与排布标准信息(标准对象)进行比对处理,由于目标对象虽然与标准对象的含义相同,但是目标对象中的各个待比对的文本元素对应的第一套字符,与标准对象对应的第一套字符存在差异,在进行信息比对等业务处理时,容易出现误差。
在采集目标对象时,是根据目标对象所反映的信息的类型进行采集的,所以,根据目标对象便可以确定其对应的信息的类型。
所以,本说明书实施例在获取与各所述文本元素分别对应的第一套字符之后,可以根据目标对象确定其所反映的信息的类型,从而可以获取与该信息的类型对应的预设排布规则,并可以按照该预设排布规则对各文本元素对应的第一套字符进行排序,使得排序后的第一套字符能够满足预设排布规则的要求,从而避免因编码字符的乱序而影响后续处理。
进一步地,还可以根据预设排布规则判断第一套字符所反映的各个文本元素组成的信息是否存在遗漏,如采集的地址信息中遗漏了区级信息,造成目标对象的不完整,在这种情况下,可以利用预设排布规则对第一套字符进行调整,具体可以是按照所述预设排布规则在指定的位置增加缺失信息对应的第一套字符,或者是按照所述预设排布规则,删除位于指定位置的第一套字符。
这样,可以对目标对象中不符合预设排布规则的文本元素进行调整,使其符合对应信息的类型的排布规范,使得在进行业务处理时,不会因目标对象不符合排布规范而造成错误。
需要说明的是,在对第一套字符进行调整时,不会调整目标对象中的各个文本元素原本的含义。
S107:若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符。
在本说明书实施例中,第二套字符可以理解为不同于第一套字符的其他编码形式,通过获取与字符串对应的第二套字符,将单个文本元素对应的多个第一套字符整体替换为第二套字符,使得文本元素与第一套字符之间一对多的对应关系,变成文本元素与第二套字符之间一对一的对应关系,更直观明了,能够有效避免因文本元素与编码字符之间一对多的对应关系而出现的编码字符的组合错误。
具体的,第一套字符与第二套字符可以属于相同种类的编码形式,也可以属于不同种类的编码形式,在此不做具体限定。
在实际应用过程中,可能会存在一个文本元素对应有至少两个第一套字符的情况,在这种情况下,文本元素与第一套字符之间的对应情况会比较复杂,例如,可能存在一个文本元素对应两个第一套字符、或者三个第一套字符、或者五个第一套字符等。终端在利用第一套字符对目标对象进行业务处理时,由于文本元素与第一套字符之间非唯一的对应关系,可能会出现失误,造成业务处理出现错误。
延续上例,若目标对象中的文本元素出现错误,对于目标对象来说,影响的其实只有这一个文本元素,但在终端进行业务处理时,影响的可能是这五个第一套字符,会造成较大误差。
在这种情况下,通过获取与字符串对应的第二套字符,使得文本元素与第二套字符一一对应,从而可以修正因文本元素与多个第一套字符对应而造成的误差,提高业务处理效率。
作为一种应用实施例,若至少两个所述文本元素分别与字符串对应,则利用所述第二套字符对所述字符串对应的文本元素进行编码,包括:
按照各所述字符串中包含的第一套字符的数量由高到低的顺序,依次将所述字符串对应的文本元素按照所述第二套字符进行编码,得到目标编码。
通过按照各字符串中包含的第一套字符的数量由高到低的顺序来依次获取与字符串对应的第二套字符,可以有序的将文本元素对应的字符串替换为第二套字符,还能避免在替换过程中由于相邻的第一套字符可能对应其他不同的文本元素而出现失误,从而可以准确的将字符串对应的文本元素按照第二套字符进行编码操作。
具体的,在替换过程中,首先将包含第一套字符的数量最多的字符串替换为目标字符,然后再依次替换其他字符串,直至将所有的字符串均替换为对应的第二套字符。这样,目标对象中的各文本元素均一一对应不同的第一套字符或第二套字符。
作为另外一种应用实施例,若识别到所述目标对象中的至少两个文本元素,则在利用所述第二套字符对所述字符串对应的文本元素进行编码之前,还可以包括:
根据其他文本元素各自对应的第一套字符,获取所述第一套字符对应的第二套字符,所述其他文本元素与所述第一套字符一一对应;
利用所述第二套字符对所述字符串对应的文本元素进行编码,还包括:
利用各所述第二套字符分别对各所述文本元素进行编码,得到目标编码。
在本说明书实施例中,其他文本元素可以是指不同于对应有字符串的文本元素,其他文本元素与第一套字符一一对应。
通过获取与其他文本元素对应的第一套字符所对应的第二套字符,这样,将目标对象中的各文本元素对应的第一套字符均替换为对应的第二套字符,使得各文本元素均能够与第二套字符一一对应,这样,便可以利用第二套字符分别对各文本元素进行编码操作。
S109:利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
在本说明书实施例中,目标编码可以理解为终端系统中存储目标对象中的各文本元素的一种表现形式,并能够利用该目标编码进行对应的业务处理。
在将字符串替换为对应的第二套字符之后,可以将剩余的其他文本元素对应的单个第一套字符替换为对应的第二套字符,还可以保留其他文本元素对应的第一套字符,在此不做具体限定。
作为一种应用实施例,若识别到所述目标对象中的至少两个文本元素,则利用所述第二套字符对所述字符串对应的文本元素进行编码,可以包括:
利用所述第二套字符和其他文本元素各自对应的第一套字符对各所述文本元素进行编码,得到目标编码,所述其他文本元素与所述第一套字符一一对应。
在本说明书实施例中,将其他文本元素对应的单个第一套字符保留,使得各文本元素与第一套字符或者第二套字符一一对应,利用第一套字符和第二套字符共同对各文本元素进行编码,得到的目标编码融合有两种字符,增加了破解目标编码的难度,另外还能减少在编码过程中的失误。
具体的,在利用所述第二套字符对所述字符串对应的文本元素进行编码之前,还可以包括:
利用所述第一套字符对所述文本元素进行编码,得到预编码;
利用所述第二套字符对所述字符串对应的文本元素进行编码,包括:
将所述预编码中与文本元素对应的字符串替换为对应的第二套字符,得到目标编码。
通过对各文本元素对应的第一套字符进行编码,得到预编码,以将各文本元素通过编码转换为终端或者服务器能够识别的数码形式,这样,便可以利用预编码进行后续的处理。
若预编码中包含与单个文本元素对应的字符串,则可以将该字符串替换为对应的第二套字符,再利用第二套字符进行编码,使得目标编码中的编码字符与文本元素一一对应。
本说明书实施例提供的一种业务处理方法,在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取各个文本元素分别对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码进行业务处理。
这样,目标编码中的编码字符与各个文本元素一一对应。在利用目标编码进行业务处理时,可以不需要选择邻近的编码字符进行组合,避免了将编码字符进行错误的组合,修正因文本元素与字符串对应而造成的误差,提高业务处理效率。
图2为本说明书实施例通过的一种业务处理方法的流程示意图,本说明书实施例以目标对象的解码过程为具体应用实施例。
S201:接收目标对象获取请求,所述目标对象获取请求携带对象标识。
在本说明书实施例中,目标对象获取请求可以理解为获取存储的目标对象的请求,该目标对象获取请求中包含能够表征目标对象的对象标识。
目标对象获取请求可以是用户向终端发送的,需要获取终端中存储的目标对象;还可以是终端根据用户的操作向服务器发送的请求,以获取存储在服务器中的目标对象,在此不做具体限定。
S203:获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符。
结合上述说明书实施例中目标对象的编码过程,目标对象以目标编码的形式存储,该目标编码与目标对象的对象标识具有关联关系,所以,可以利用对象标识来获取对应的目标编码。
S205:对所述目标编码进行解码,得到所述第二套字符。
目标编码是利用第二套字符进行编码后得到的,在对目标编码进行解码后,可以得到至少一个第二套字符。
在具体应用场景中,若目标编码由第一套字符和第二套字符共同编码得到,那么,在对目标编码进行解码后,可以得到对应的至少一个第一套字符和第二套字符。
若目标编码单独由第二套字符编码得到,表明文本元素对应的第一套字符均替换为对应的第二套字符,对目标编码进行解码后,只能得到多个第二套字符。
S207:利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串。
在本说明书实施例中,第一套字符和第二套字符的具体含义和属性与上述说明书实施例中所记载的相同,在此不再赘述。
在编码过程中,利用第一套字符与第二套字符之间的对应关系,将包含有至少两个第一套字符的字符串替换为第二套字符,使得文本元素能够与单一的第二套字符一一对应。
那么在解码过程中,若其他文本元素对应的单一的第一套字符被保留,则可以仅获取与第二套字符对应的字符串,这样,就可以将各文本元素对应的第一套字符还原。
S209:利用所述字符串对应的文本元素生成所述目标对象。
在得到字符串后,可以确定与字符串对应的文本元素,进一步还可以确定剩余的第二套字符或者第一套字符对应的文本元素,这样,便可以利用得到的各个文本元素来生成目标对象。
作为一种应用实施例,对所述目标编码进行解码,可以包括:
对所述目标编码进行解码,得到至少一个第二套字符和至少一个第一套字符;
利用所述字符串对应的文本元素生成所述目标对象,还包括:
获取所述至少一个第二套字符各自对应的字符串;
利用所述字符串对应的文本元素,及所述至少一个第一套字符各自对应的文本元素,生成所述目标对象。
在本说明书实施例中,目标编码是由第二套字符和第一套字符共同进行编码得到的,在对目标编码进行解码后,可以得到至少一个第二套字符和至少一个第一套字符,那么在确定文本元素的过程中,可以分别根据第二套字符对应的字符串、以及第一套字符来确定对应的文本元素。
作为另外一种应用实施例,利用所述第二套字符与第一套字符之间的对应关系,获取所述第二套字符对应的字符串,还可以包括:
若对所述目标编码进行解码,得到至少两个第二套字符,则利用所述第二套字符与第一套字符之间的对应关系,获取所述第二套字符对应的字符串,和其他第二套字符对应的第一套字符,所述其他第二套字符与所述第一套字符一一对应;
利用所述字符串对应的文本元素生成所述目标对象,还包括:
利用所述字符串对应的文本元素,及所述第一套字符对应的文本元素,生成所述目标对象。
在本说明书实施例中,目标编码可以是由第二套字符单独编码得到的,在对目标编码进行解码后,可以得到第二套字符对应的字符串和单一的第一套字符,进而可以匹配确定对应的文本元素。
本说明书实施例提供的一种业务处理方法,通过利用目标对象获取请求中携带的对象标识来获取对应的目标编码,在对目标编码进行解码后,可以得到至少一个第二套字符,进而可以利用第二套字符与第一套字符之间的对应关系,来获取与第二套字符对应的字符串,以利用该字符串确定对应的文本元素,根据得到的各个文本元素便可以确定目标对象的内容。这样,目标对象以目标编码的形式进行存储或者业务处理,能够减小占用空间和业务处理失误率,还能方便解码,快速地以第一套字符的编码形式获取目标对象。
图3为本说明书实施例提供的一种业务处理方法的流程示意图。
S301:采集目标对象。
在本说明书实施例中,目标对象可以理解为需要进行信息确认比对的待比对对象。具体的,待比对对象可以是用户输入的用户信息,通过确认用户信息的准确性,来进行具体业务的办理,在此不做具体限定。
通过将目标对象与标准对象进行对比,来判断目标对象与标准对象是否一致,进而可以根据比对结果进行进一步的业务处理。例如,若目标对象与标准对象一致,则可以进行下一步的处理流程,若目标对象与标准对象不一致,则可以返回该比对结果,进行目标对象的重新采集。
具体的,在银行办理业务时,客户在完成电子签名之后,业务受理终端接收到客户完成电子签名的触发事件,则可以自动采集获取客户的电子签名作为待比对的目标对象,以将该电子签名与终端中存储的客户的真实姓名进行比对,从而判断客户身份的真实性。
S303:识别所述目标对象中的文本元素。
在本说明书实施例中,文本元素可以是指需要进行比对的具体业务信息,与上述说明书实施例中记载的文本元素的具体含义相同,在此不再赘述。
延续上例,银行业务受理终端在获取到客户的电子签名之后,可以根据电子签名中的文字字形和各文字之间的间距来对电子签名中的文本元素进行元素切割处理,以准确的将各文本元素分割开,从而可以准确的从获取到的电子签名中识别各个文本元素。
S305:根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符。
S307:若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符。
在本说明书实施例中,可以在按照信息的类型对应的预设排布规则对待比对的目标对象对应的第一套字符进行调整后,可以从修改得到的第一套字符中确定与单个文本元素对应的至少一组字符串,再获取与该字符串对应的第二套字符。
例如,若采集的目标对象为XX有限公司,按照预设排布规则进行修改后,修改的目标对象为XX股份有限公司,修改后的目标对象XX股份有限公司中的各个文本元素对应的第一套字符中确定与单个文本元素对应的字符串,再获取与该字符串对应的第二套字符。
S309:利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码。
本说明书实施例中的目标编码的具体编码过程与上述说明书实施例中的具体编码过程相同,在此不再赘述。
S311:将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
在本说明书实施例中,通过将目标编码与标准对象对应的标准编码进行比对,由于编码字符与文本元素之间的一一对应关系,其本质是将待比对的目标对象与标准对象进行比对,从而可以根据比对结果确定两者是否一致,并且不会产生误差。
标准编码的具体编码过程与所述步骤S303至S309中所记载的目标编码的编码过程相同,在此不再赘述。
作为一种应用实施例,将所述目标编码与标准对象对应的标准编码进行比对,可以包括:
对所述目标编码和所述标准编码进行处理,得到所述目标编码和所述标准编码之间的编辑距离;
根据所述编辑距离确定所述目标编码和所述标准编码之间的相似度;
利用所述相似度确定比对结果。
在本说明书实施例中,采用确定目标编码和标准编码之间的编辑距离来判断待比对的目标对象和标准对象是否一致。
编辑距离(Edit Distance,又称Lovenshtein Distance),用于度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两组字符串之间,由其中一组字符串转换为另一组字符串所需要的最少单字符编辑操作次数,从而可以根据该操作次数来确定两组字符串之间的编辑距离。若操作次数越多,编辑距离越大,表明两者之间的差异性越大。
需要说明的是,单字符编辑操作有且仅包括插入、删除和替换三种操作。
进一步地,可以在确定目标编码和标准编码之间的编辑距离之后,根据该编辑距离确定目标编码和标准编码之间的相似度,进而可以利用相似度来判断目标编码和标准编码之间是否一致。
具体的,可以利用编辑距离与标准编码的总位数来确定相似度值,若编辑距离为N,标准编码的总位数为M,则相似度为S=1-N/M。
进一步地,对所述目标编码和所述标准编码进行处理,可以包括:
将所述目标编码依次替换成所述标准编码,得到替换次数;
根据所述替换次数确定所述目标编码和所述标准编码之间的编辑距离。
通过将目标编码依次替换成标准编码,得到替换次数,进而可以根据替换次数来确定两者之间的编辑距离。
本说明书实施例提供的一种业务处理方法,在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取文本元素对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理。
在进行比对时,能够避免因文本元素与第一套字符之间的非一一对应关系而产生的误差,使得目标编码和标准编码之间的差异能够真实反映目标对象和标准对象之间的差异,提高信息比对的准确性和比对效率。
图4为本说明书实施例提供的一种业务处理方法的流程示意图,本说明书实施例以孟加拉文的信息比对为具体应用实施例。
S401:采集孟加拉文的待比对文本。
S403:对所述待比对文本中的各个孟加拉文字进行解析,得到各个孟加拉文字对应的Unicode。
在本说明书实施例中,Unicode可以是上述说明书实施例中记载的字符中的一种字符类型。
S405:按照高位到低位的顺序,依次将单字孟加拉文对应的Unicode替换为相应的第二套字符。
S407:按照高位到低位的顺序,依次将标准文本中的各个孟加拉文字对应的Unicode替换为相应的第二套字符。
S409:利用第二套字符分别对待比对文本和标准文本进行编码,得到待比对编码和标准编码。
S411:确定待比对编码和标准编码之间的字段编辑距离。
S413:根据所述字段编辑距离确定待比对编码和标准编码之间的相似度,得到比对结果。
在本说明书实施例中,孟加拉文的待比对文本的示意图如图5所示,待比对文本与Unicode的对应关系如图6所示,将单字孟加拉文对应的五位Unicode对应转换为待比对目标字符的对应关系如图7所示,将单字孟加拉文对应的四位Unicode对应转换为待比对目标字符的对应关系如图8所示,将单字孟加拉文对应的三位Unicode对应转换为待比对目标字符的对应关系如图9所示,将单字孟加拉文对应的两位Unicode对应转换为待比对目标字符的对应关系如图10所示,将单字孟加拉文对应的一位Unicode对应转换为待比对目标字符的对应关系如图11所示。
如下表1所示为孟加拉文、对应的Unicode及对应的目标字符之间的对应关系表,需要说明的是,表1中为部分孟加拉文字及符号所对应的Unicode和目标字符的对应关系表。
表1 Unicode、孟加拉文和目标字符的对应关系表
图12为本说明书实施例提供的一种业务处理装置的结构示意图。
采集模块1201,采集目标对象;
识别模块1202,识别所述目标对象中的文本元素;
第一获取模块1203,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块1204,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
编码模块1205,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
本说明书实施例提供的一种业务处理装置,在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取文本元素对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码进行业务处理。
这样,目标编码中的编码字符与各个文本元素一一对应。在利用目标编码进行业务处理时,可以不需要选择邻近的编码字符进行组合,避免了将编码字符进行错误的组合,修正因文本元素与字符串对应而造成的误差,提高业务处理效率。
图13为本说明书实施例提供的一种业务处理装置的结构示意图。
接收模块1301,接收目标对象获取请求,所述目标对象获取请求携带对象标识;
第一获取模块1302,获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
解码模块1303,对所述目标编码进行解码,得到所述第二套字符;
第二获取模块1304,利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
生成模块1305,利用所述字符串对应的文本元素生成所述目标对象。
本说明书实施例提供的一种业务处理装置,通过利用目标对象获取请求中携带的对象标识来获取对应的目标编码,在对目标编码进行解码后,可以得到第二套字符,进而可以利用第二套字符与第一套字符之间的对应关系,来获取与第二套字符对应的字符串,以利用该字符串确定对应的文本元素,根据得到的各个文本元素便可以确定目标对象的内容。这样,目标对象以目标编码的形式进行存储或者业务处理,能够减小占用空间和业务处理失误率,还能方便解码,快速地以第一套字符的编码形式获取目标对象。
图14为本说明书实施例提供的一种业务处理装置的结构示意图。
采集模块1401,采集目标对象;
识别模块1402,识别所述目标对象中的文本元素;
第一获取模块1403,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块1405,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
编码模块1406,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
比对模块1407,将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的各文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
本说明书实施例提供的一种业务处理装置,在采集目标对象后,通过对目标对象中的文本元素进行识别,可以获取文本元素对应的第一套字符,若文本元素与字符串对应,即存在文本元素与至少两个第一套字符对应,则可以获取与字符串对应的第二套字符,以利用第二套字符对字符串对应的文本元素进行编码,从而可以利用得到的目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理。
在进行比对时,能够避免因文本元素与第一套字符之间的非一一对应关系而产生的误差,使得目标编码和标准编码之间的差异能够真实反映目标对象和标准对象之间的差异,提高信息比对的准确性和比对效率。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
其中,处理器的其他功能还可以参见上述实施例中记载的内容,这里不再一一赘述。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(例如,对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如,现场可编程门阵列(Field ProgrammableGate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,例如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种模块和/或各种单元分别描述。当然,在实施本申请时可以把各模块和/或各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求保护范围之内。

Claims (21)

1.一种业务处理方法,包括:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;所述文本元素与所述第一套字符之间一对多的对应关系,变成所述文本元素与所述第二套字符之间一对一的对应关系;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
2.如权利要求1所述的方法,采集目标对象,包括:
在接收到触发事件时,采集所述目标对象。
3.如权利要求2所述的方法,接收到触发事件,包括如下至少一种方式:
接收到用户输入的目标对象;
接收到用户对所述目标对象的指定操作。
4.如权利要求1所述的方法,识别所述目标对象中的文本元素,包括:
对所述目标对象进行元素切割处理;
对切割后得到的文本元素进行识别。
5.如权利要求1所述的方法,在利用所述第二套字符对所述字符串对应的文本元素进行编码之前,还包括:
利用所述第一套字符对所述文本元素进行编码,得到预编码;
利用所述第二套字符对所述字符串对应的文本元素进行编码,包括:
将所述预编码中与文本元素对应的字符串替换为对应的第二套字符,得到目标编码。
6.如权利要求1所述的方法,在获取与所述文本元素对应的第一套字符之后,还包括:
若识别到所述目标对象中的至少两个文本元素,则根据所述目标对象所反映信息的类型,获取与所述信息的类型对应的预设排布规则;
按照所述预设排布规则对所述至少两个文本元素分别对应的所述第一套字符进行排序。
7.如权利要求1所述的方法,若至少两个所述文本元素分别与字符串对应,则利用所述第二套字符对所述字符串对应的文本元素进行编码,包括:
按照各所述字符串中包含的第一套字符的数量由高到低的顺序,依次将所述字符串对应的文本元素按照所述第二套字符进行编码,得到目标编码。
8.如权利要求1所述的方法,若识别到所述目标对象中的至少两个文本元素,则在利用所述第二套字符对所述字符串对应的文本元素进行编码之前,还包括:
根据其他文本元素各自对应的第一套字符,获取所述第一套字符对应的第二套字符,所述其他文本元素与所述第一套字符一一对应;
利用所述第二套字符对所述字符串对应的文本元素进行编码,还包括:
利用各所述第二套字符分别对各所述文本元素进行编码,得到目标编码。
9.如权利要求1所述的方法,若识别到所述目标对象中的至少两个文本元素,则利用所述第二套字符对所述字符串对应的文本元素进行编码,包括:
利用所述第二套字符和其他文本元素各自对应的第一套字符对各所述文本元素进行编码,得到目标编码,所述其他文本元素与所述第一套字符一一对应。
10.一种业务处理方法,包括:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
11.如权利要求10所述的方法,对所述目标编码进行解码,包括:
对所述目标编码进行解码,得到至少一个第二套字符和至少一个第一套字符;
利用所述字符串对应的文本元素生成所述目标对象,还包括:
获取所述至少一个第二套字符各自对应的字符串;
利用所述字符串对应的文本元素,及所述至少一个第一套字符各自对应的文本元素,生成所述目标对象。
12.如权利要求10所述的方法,获取所述第二套字符对应的字符串,还包括:
若对所述目标编码进行解码,得到至少两个第二套字符,则利用所述第二套字符与第一套字符之间的对应关系,获取所述第二套字符对应的字符串,和其他第二套字符对应的第一套字符,所述其他第二套字符与所述第一套字符一一对应;
利用所述字符串对应的文本元素生成所述目标对象,还包括:
利用所述字符串对应的文本元素,及所述第一套字符对应的文本元素,生成所述目标对象。
13.一种业务处理方法,包括:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
14.如权利要求13所述的方法,将所述目标编码与标准对象对应的标准编码进行比对,包括:
对所述目标编码和所述标准编码进行处理,得到所述目标编码和所述标准编码之间的编辑距离;
根据所述编辑距离确定所述目标编码和所述标准编码之间的相似度;
利用所述相似度确定比对结果。
15.如权利要求14所述的方法,对所述目标编码和所述标准编码进行处理,包括:
将所述目标编码依次替换成所述标准编码,得到替换次数;
根据所述替换次数确定所述目标编码和所述标准编码之间的编辑距离。
16.一种业务处理装置,包括:
采集模块,采集目标对象;
识别模块,识别所述目标对象中的文本元素;
第一获取模块,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;所述文本元素与所述第一套字符之间一对多的对应关系,变成所述文本元素与所述第二套字符之间一对一的对应关系;
编码模块,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
17.一种业务处理装置,包括:
接收模块,接收目标对象获取请求,所述目标对象获取请求携带对象标识;
第一获取模块,获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
解码模块,对所述目标编码进行解码,得到所述第二套字符;
第二获取模块,利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
生成模块,利用所述字符串对应的文本元素生成所述目标对象。
18.一种业务处理装置,包括:
采集模块,采集目标对象;
识别模块,识别所述目标对象中的文本元素;
第一获取模块,根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
第二获取模块,若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
编码模块,利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
比对模块,将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
19.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;所述文本元素与所述第一套字符之间一对多的对应关系,变成所述文本元素与所述第二套字符之间一对一的对应关系;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码,以利用所述目标编码进行业务处理。
20.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
接收目标对象获取请求,所述目标对象获取请求携带对象标识;
获取与所述对象标识对应的目标编码,所述目标编码是利用第二套字符对所述目标对象中与字符串对应的文本元素进行编码得到的,所述字符串包含至少两个第一套字符;
对所述目标编码进行解码,得到所述第二套字符;
利用所述第二套字符与所述第一套字符之间的对应关系,获取所述第二套字符对应的字符串;
利用所述字符串对应的文本元素生成所述目标对象。
21.一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成至少一个处理器执行以下步骤:
采集目标对象;
识别所述目标对象中的文本元素;
根据所述文本元素与第一套字符之间的对应关系,获取与所述文本元素对应的第一套字符;
若所述文本元素与字符串对应,所述字符串包含至少两个所述第一套字符,则获取与所述字符串对应的第二套字符;
利用所述第二套字符对所述字符串对应的文本元素进行编码,得到目标编码;
将所述目标编码与标准对象对应的标准编码进行比对,以根据比对结果进行对应的业务处理,所述标准编码是在对所述标准对象中的文本元素进行识别后,获取与所述文本元素对应的第一套字符,若所述文本元素与字符串对应,则获取与所述字符串对应的第二套字符,以利用所述第二套字符对所述字符串对应的文本元素进行编码得到所述标准编码。
CN202010408420.9A 2020-05-14 2020-05-14 一种业务处理方法、装置及电子设备 Active CN111597802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010408420.9A CN111597802B (zh) 2020-05-14 2020-05-14 一种业务处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010408420.9A CN111597802B (zh) 2020-05-14 2020-05-14 一种业务处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111597802A CN111597802A (zh) 2020-08-28
CN111597802B true CN111597802B (zh) 2023-08-22

Family

ID=72183725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010408420.9A Active CN111597802B (zh) 2020-05-14 2020-05-14 一种业务处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111597802B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113393296A (zh) * 2021-06-16 2021-09-14 北京沃东天骏信息技术有限公司 一种数据关系的表示方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784071A (en) * 1995-09-13 1998-07-21 Apple Computer, Inc. Context-based code convertor
US6204782B1 (en) * 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
CN105653506A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种基于字符编码转换的gpu内文本处理的方法及装置
CN107122342A (zh) * 2017-04-21 2017-09-01 东莞中国科学院云计算产业技术创新与育成中心 文本编码识别方法和装置
CN109002423A (zh) * 2017-06-06 2018-12-14 北大方正集团有限公司 文本搜索方法及装置
CN110932822A (zh) * 2019-12-02 2020-03-27 泰康保险集团股份有限公司 数据编码方法、数据解码方法、装置、设备及存储介质
CN110990647A (zh) * 2019-11-29 2020-04-10 汉海信息技术(上海)有限公司 数据处理方法以及装置
CN111027283A (zh) * 2019-11-13 2020-04-17 齐德华 一种蒙古文数字化信息处理方法、系统及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10176334B2 (en) * 2016-05-18 2019-01-08 Blackberry Limited Data security using alternative encoding

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784071A (en) * 1995-09-13 1998-07-21 Apple Computer, Inc. Context-based code convertor
US6204782B1 (en) * 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
CN105653506A (zh) * 2015-12-30 2016-06-08 北京奇艺世纪科技有限公司 一种基于字符编码转换的gpu内文本处理的方法及装置
CN107122342A (zh) * 2017-04-21 2017-09-01 东莞中国科学院云计算产业技术创新与育成中心 文本编码识别方法和装置
CN109002423A (zh) * 2017-06-06 2018-12-14 北大方正集团有限公司 文本搜索方法及装置
CN111027283A (zh) * 2019-11-13 2020-04-17 齐德华 一种蒙古文数字化信息处理方法、系统及存储介质
CN110990647A (zh) * 2019-11-29 2020-04-10 汉海信息技术(上海)有限公司 数据处理方法以及装置
CN110932822A (zh) * 2019-12-02 2020-03-27 泰康保险集团股份有限公司 数据编码方法、数据解码方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Procedures of Extending the Alphabet in Combined Coding for Prediction by Partial String Matching in Text Compression;Radu Rădescu ;等;《2017 9th International Conference on Electronics, Computers and Artificial Intelligence (ECAI)》;全文 *

Also Published As

Publication number Publication date
CN111597802A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN110705214A (zh) 一种自动编码方法及装置
CN111597802B (zh) 一种业务处理方法、装置及电子设备
CN110704547A (zh) 基于神经网络的关系抽取数据生成方法、模型及训练方法
CN110888756A (zh) 一种诊断日志生成方法及装置
CN111339910B (zh) 文本的处理、文本分类模型的训练方法及装置
CN117252183B (zh) 一种基于语义的多源表格自动匹配方法、装置及存储介质
CN117975934A (zh) 音频文本对的获取方法和装置、电子设备、存储介质
CN116863484A (zh) 一种字符识别的方法、装置、存储介质及电子设备
CN111538925B (zh) 统一资源定位符url指纹特征的提取方法及装置
CN108804563A (zh) 一种数据标注方法、装置以及设备
CN110134920A (zh) 绘文字兼容显示方法、装置、终端及计算机可读存储介质
CN115221523B (zh) 数据处理方法、装置及设备
CN107943923B (zh) 电报码数据库的构建方法、电报码识别方法及装置
CN115147227B (zh) 一种交易风险的检测方法、装置及设备
CN110008252B (zh) 数据核对方法及装置
CN114926706B (zh) 数据处理方法、装置及设备
CN116522939A (zh) 数据处理方法、装置及设备
CN115859975B (zh) 数据处理方法、装置及设备
CN115827935B (zh) 一种数据处理方法、装置及设备
CN115527227A (zh) 一种文字识别的方法、装置、存储介质及电子设备
CN117574880A (zh) 模型处理方法及装置
CN108038203B (zh) 数据字典的存储装置
CN118484535A (zh) 文本处理方法及装置
CN117493870A (zh) 地址识别模型的训练方法、地址补全方法及装置
CN115905267A (zh) 一种数据处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant