CN116204602A - 字码映射方法、装置、存储介质以及终端 - Google Patents

字码映射方法、装置、存储介质以及终端 Download PDF

Info

Publication number
CN116204602A
CN116204602A CN202310104555.XA CN202310104555A CN116204602A CN 116204602 A CN116204602 A CN 116204602A CN 202310104555 A CN202310104555 A CN 202310104555A CN 116204602 A CN116204602 A CN 116204602A
Authority
CN
China
Prior art keywords
code
code bit
word
target
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310104555.XA
Other languages
English (en)
Inventor
彭少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202310104555.XA priority Critical patent/CN116204602A/zh
Publication of CN116204602A publication Critical patent/CN116204602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/328Management therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)

Abstract

本说明书实施例公开了一种字码映射方法、装置、存储介质以及终端,基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;建立目标生僻字、第一码位以及第二码位之间的字码映射关系。由于通过用户的身份信息卡同时获得了用户姓名中同一生僻字对应的第一码位以及在另外编码体系中的第二码位,那么建立生僻字与第一码位、第二码位之间的映射关系,帮助用户在进行实名认证时,自动将输入法输入的生僻字的第二码位转化为身份系统中的第一码位,完成身份认证。

Description

字码映射方法、装置、存储介质以及终端
技术领域
本说明书实施例涉及信息处理技术领域,尤其涉及一种字码映射方法、装置、存储介质以及终端。
背景技术
目前依托于互联网所提供的很多服务都需要用户进行实名认证,而其中存在部分用户的姓名中包含生僻字。早期这些生僻字为了在计算机系统录入并在身份信息实体证件上印刷打印,都使用了Unicode编码体系中用户自定义码段中的一个第一码位,而后续某编码字库中对收录的每个汉字分配了Unicode另外编码码段中的第二码位,这就导致如今部分生僻字在不同的码段存在两个码位,因此在实名认证过程时,需要解决字形相同的汉字由于码位不一样而造成信息比对失败的问题。
发明内容
本说明书实施例提供一种字码映射方法、装置、存储介质以及终端,可以解决相关技术中生僻字的多码认证的技术问题。
第一方面,本说明书实施例提供一种字码映射方法,该方法包括:
基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及所述目标生僻字的字形图像;
根据所述字形图像以及第二码位数据库确定所述目标生僻字对应的第二码位,所述第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;
建立所述目标生僻字、所述第一码位以及所述第二码位之间的字码映射关系。
第二方面,本说明书实施例提供一种字码映射装置,该装置包括:
第一码位确定模块,用于基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及所述目标生僻字的字形图像;
第二码位确定模块,用于根据所述字形图像以及第二码位数据库确定所述目标生僻字对应的第二码位,所述第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;
字码映射模块,用于建立所述目标生僻字、所述第一码位以及所述第二码位之间的字码映射关系。
第三方面,本说明书实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行上述的方法的步骤。
第四方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
第五方面,本说明书实施例提供一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序适于由处理器加载并执行上述的方法的步骤。
本说明书一些实施例提供的技术方案带来的有益效果至少包括:
本说明书实施例提供一种字码映射方法,基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;建立目标生僻字、第一码位以及第二码位之间的字码映射关系。由于通过用户的身份信息卡同时获得了用户姓名中同一生僻字对应的第一码位以及在另一编码体系中的第二码位,那么建立生僻字与第一码位、第二码位之间的映射关系,可以直接帮助用户在进行实名认证时,自动将输入法输入的生僻字的第二码位转化为身份系统中的第一码位,进而实现身份认证,提升生僻字用户的数字服务使用体验。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的一种字码映射方法的示例性系统架构图;
图2为本说明书实施例提供的一种字码映射方法的流程示意图;
图3为本说明书实施例提供的一种字码映射方法的流程示意图;
图4为本说明书实施例提供的一种建立字码映射的逻辑流程示意图;
图5为本说明书实施例提供的一种字码映射装置的结构框图;
图6为本说明书实施例提供的一种终端的结构示意图。
具体实施方式
为使得本说明书实施例的特征和优点能够更加的明显和易懂,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而非全部实施例。基于本说明书中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书实施例保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本说明书实施例的一些方面相一致的装置和方法的例子。
在计算机的早期发展进程中,当时Unicode编码体系作为计算机科学领域中的业界编码标准,Unicode编码体系给每个字符提供了一个唯一的数字编码,保证了在计算机体系中所有字符编码的唯一性,然而,Unicode编码还提供了一部分空白编码段,供用户进行自定义编码,也即用户自定义区(Private Use Area)码段,用户可以在这个码段自定义字符、表情等。
在社会早期,由于文化、教育等多方面原因,很多人的姓名中包含生僻字,而早期的正式汉字库中没有录入这部分生僻字,导致主流输入法都无法打出这部分生僻字,那么在将人口信息录入计算机系统并且印刷打印在身份实体证件上时,就无法在计算机中打出对应的正确生僻字。在这种情况下,身份信息录入部门利用Unicode编码体系中的用户自定义码段定义了大量的生僻汉字,来实现生僻字与计算机可识别的编码体系的映射。后来随着正式字库文件文件的迭代更新,一些生僻字逐渐被录入该字库文件中,并拥有另外的Unicode第二码位。
然而,在现代数字时代,人们通过移动终端来获取各种数字服务,而随着各种身份验证场景的数字化,人们也逐渐以移动终端中的电子化实名身份认证代替纸质证明和证件证明,这就涉及到用户的实名认证需求。实名认证的步骤通常是将用户输入的身份信息在身份录入部门登记的身份信息库中进行比对,比对内容就包括姓名,而计算机对比姓名时是对比两边的姓名编码,此时对于姓名为常见汉字的用户,输入法所使用的编码与身份信息库中的编码是相同的,则直接比对成功,然而对于姓名为生僻字的用户,输入法使用的是其他编码体系中的第二码位,与其早期在身份信息记录中录入的第一码位进行比对,会直接导致比对失败,例如“
Figure BDA0004076129600000041
”字,其在Unicode编码的用户自定义码段中定义的第一码位为“1234”,而其在后来收录到某字库文件中时对应的第二码位为“ABCD”,此时,第二码位“ABCD”与人口信息库中的第一码位“1234”进行对比,只能得到对比失败的结果,进而使得此类用户无法完成生僻字姓名的实名认证,阻碍了用户的出行等生活日常活动。
因此本说明书实施例提供一种字码映射方法,基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的第二码位;建立目标生僻字、第一码位以及第二码位之间的字码映射关系,以解决上述一字多码的技术问题。
请参阅图1,图1为本说明书实施例提供的一种字码映射方法的示例性系统架构图。
如图1所示,系统架构可以包括终端101、网络102和服务器103。网络102用于在终端101和服务器103之间提供通信链路的介质。网络102可以包括各种类型的有线通信链路或无线通信链路,例如:有线通信链路包括光纤、双绞线或同轴电缆的,无线通信链路包括蓝牙通信链路、无线保真(Wireless-Fidelity,Wi-Fi)通信链路或微波通信链路等。
终端101可以通过网络102与服务器103交互,以接收来自服务器103的消息或向服务器103发送消息,或者终端101可以通过网络102与服务器103交互,进而接收其他用户向服务器103发送的消息或者数据。终端101可以是硬件,也可以是软件。当终端101为硬件时,可以是各种电子设备,包括但不限于智能手表、智能手机、平板电脑、膝上型便携式计算机和台式计算机等。当终端101为软件时,可以是安装在上述所列举的电子设备中,其可以实现呈多个软件或软件模块(例如:用来提供分布式服务),也可以实现成单个软件或软件模块,在此不作具体限定。
在本说明书实施例之后,首先终端101基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;终端101再根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;最终,终端101可以建立目标生僻字、第一码位以及第二码位之间的字码映射关系。
服务器103可以是提供各种服务的处理服务器。需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
或者,该系统架构还可以不包括服务器103,换言之,服务器103可以为本说明书实施例中可选的设备,即本说明书实施例提供的方法可以应用于仅包括终端101的系统结构中,本说明书实施例对此不做限定。
应理解,图1中的终端、网络以及服务器的数目仅是示意性的,根据实现需要,可以是任意数量的终端、网络以及服务器。
请参阅图2,图2为本说明书实施例提供的一种字码映射方法的流程示意图。本说明书实施例的执行主体可以是执行字码映射的终端,也可以是执行字码映射方法的终端中的处理器,还可以是执行字码映射方法的终端中的字码映射服务。为方便描述,下面以执行主体是终端中的处理器为例,介绍字码映射方法的具体执行过程。
如图2所示,字码映射方法至少可以包括:
S202、基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像。
可选地,由于一些用户姓名中使用的生僻字,在身份库中对应的编码Unicode的编码空间内的用户自定义码段,而同一生僻字后期又被收录在Unicode的正式编码体系中,造成一个生僻字既有第一码位又有第二码位的“一字多码”问题,导致用户无法完成数字化的实名认证,从而在数字化生活中收到多重阻碍。那么为了解决生僻字与多个字符编码之间的映射问题,可以将同一个生僻字的各种替代形态,例如多种字库中的不同编码做一个转码映射,将同一个生僻字的所有编码都映射为对应同一个汉字,帮助系统认定两个编码是同一个生僻字,这样就可以实现生僻字用户的实名认证。
可选地,由于用户自定义码段为身份库部门在录入人口身份信息时给生僻字自定义的编码,其所有的编码内容是没有受到公开的,因此无法一次性直接获取所有生僻字在用户自定义码段中的第一码位,而每个用户的身份信息卡的芯片中是能够读取到自己姓名在系统中录入的编码的,在此情况下,可以通过引导生僻字用户使用自己的身份信息卡来帮助系统获取其姓名对应的第一码位和第二码位,便于后续进行生僻字和多个码位之间的映射。具体的,身份信息卡可以是任意搭载有用户公民身份信息的芯片的卡片,例如身份证等。
需要注意的是,对于用户的选择,可以根据用户的行为数据信息、数字服务使用信息等确定出可能需要生僻字字码映射服务的目标用户,并引导此类用户使用自己的身份信息卡提交生僻字的码位信息以及完成该生僻字的字码映射。
具体地,考虑到建立字码映射关系是将用户姓名中的生僻字与其对应的多种码位进行关联,那么当用户使用身份信息卡来主动提供姓名中的生僻字信息时,可以基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位,以及从身份信息卡的印刷信息中获取目标生僻字的字形图像,并与后续将该生僻字的字形与对应的多种码位进行映射,完成一个字形与多码之前的映射,使得用户可以基于多个码位之间的转码映射实现包含生僻字姓名的实名认证,提升生僻字用户的数字服务使用体验。
S204、根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位。
可选地,在某字库文件中,记录了绝大多数汉字的标准字形以及计算机中使用的正式编码的第二码位,并且随着更新迭代,更多的生僻字也逐渐录入这一字库中,得到对应的第二码位。因此得到目标生僻字的字形图像之后,可以基于某字库查找到该字形对应的第二码位,也就查找到目标生僻字对应的第二码位。
可选地,某字库文件中,一个汉字的字形和对应的第二码位是处于一个矩形方框内的,在矩形方框内,汉字的字形图像在上方,第二码位在字形图像下方,矩形方框则限定两者之间的对应关系,那么为了方便根据字形图像来查找对应的第二码位,可以对某字库文件按单字进行裁剪,将每个汉字的字形和对应第二码位裁剪出来,记录每个字的坐标及长宽信息,形成一个矩形,并对矩形区域内的图像数据进行图像文字识别(opticalcharacter recognition,OCR),获取第二码位,以此建立一张二维表形式的第二码位数据库,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位。这样就可以根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位。
S206、建立目标生僻字、第一码位以及第二码位之间的字码映射关系。
可选地,得到目标生僻字的字形图像、第一码位以及第二码位之后,可以建立目标生僻字、第一码位以及第二码位之间的字码映射关系,并且执行数据库存储,完成映射逻辑建立。后续姓名中存在该目标生僻字的用户,进行实名认证时,实名认证系统可以根据用户输入的生僻字的字形,自动根据映射关系找到第二码位对应的第一码位,使用第一码位去做身份验证,在此情况下就可以通过生僻字姓名对应的实名认证,极大便利了生僻字姓名的用户的数字服务使用,帮助生僻字姓名的用户群体融入数字时代,提高用户的使用体验。
在本说明书实施例中,提供一种字码映射方法,基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的第二码位;建立目标生僻字、第一码位以及第二码位之间的字码映射关系。由于通过用户的身份信息卡同时获得了用户姓名中同一生僻字对应的第一码位以及在正式码中的第二码位,那么建立生僻字与第一码位、第二码位之间的映射关系,可以直接帮助用户在进行实名认证时,自动将输入法输入的生僻字的第二码位转化为身份系统中的第一码位,进而实现身份认证,提升生僻字用户的数字服务使用体验。
请参阅图3,图3为本说明书实施例提供的一种字码映射方法的流程示意图。
如图3所示,字码映射方法至少可以包括:
S302、读取用户的身份信息卡的芯片信息,基于芯片信息获取用户姓名中目标生僻字对应的第一码位。
可选地,用户的身份信息卡中通常包含有芯片,芯片中记录中用户在计算机系统的身份信息库中的公民身份,因此通过扫描用户的身份信息卡可以读取身份信息卡的芯片信息,进而基于芯片信息获取用户姓名中目标生僻字对应的第一码位。
具体地,读取身份信息卡的芯片信息时,可以使用近场通信(Near FieldCommunication,NFC)技术,NFC技术能够允许某种设备(通常是手机等终端设备)在一定范围内从另一种设备或NFC标签中收集数据,通常只需通过简单的设备接触,就可建立起无线连接。若身份信息卡中的芯片能够支持NFC扫描读取,那么当系统自动检测当前用户持有的终端设备支持NFC模块,但还未开启,则引导用户开启NFC;进一步,在设备支持NFC、且已开启的前提下,通过动画引导用户将身份信息卡靠近手机背面,建立NFC连接,则可以使用NFC技术实现芯片信息的读取。
可选地,在芯片中,用户的姓名信息并不是直接的明文编码,而是通过特殊加密算法加密后得到的姓名密文编码,因此首先基于芯片信息获取的是用户姓名的姓名密文编码,需要通过对应的解密算法将姓名密文编码还原成明文,得到姓名密文编码得到用户姓名对应的姓名明文编码。
也即,请参阅图4,图4为本说明书实施例提供的一种建立字码映射的逻辑流程示意图。如图4所示,在用户终端的前端交互模块410中,使用NFC技术读取身份信息卡的芯片信息。在读取到身份信息卡的芯片信息中的姓名密文编码之后,在后端服务模块420中处理姓名密文编码,基于后端服务模块420中的芯片解码服务解密姓名密文编码得到用户姓名对应的姓名明文编码。
进一步地,Unicode编码中用户自定义码段为E000-F8FF的固定码段区间,根据用户自定义码段的固定区间特征,将用户自定义码段作为预设第一码位区间,可以根据姓名明文编码确定处于预设第一码位区间内的码位为目标生僻字对应的第一码位。具体的,遍历姓名明文编码中的每个汉字编码,在第一码段区间内的字符编码则是第一码位,并且该第一码位即对应的汉字则为目标生僻字。
S304、获取身份信息卡的卡面图像,基于卡面图像获取目标生僻字的字形图像。
可选地,身份信息卡的卡面印刷有用户的身份信息,那么通过拍照、摄像等方式可以获取身份信息卡上印刷有姓名信息的卡面图像,在卡面图像中就能够获取目标生僻字的字形图像。
具体地,请继续参阅图4,在前端交互模块410中,引导用户拍摄身份信息卡的卡面图像,并上传卡面图像至后端服务模块420中,在身份信息卡的卡面图像中裁剪得到用户姓名的姓名图像;根据姓名明文编码,确定第一码位在姓名明文编码中的位置,进而也确定了目标生僻字在用户姓名中的排序位置;按照排序位置在姓名图像中确定目标生僻字的字形图像。
更进一步地,按照排序位置在姓名图像中确定目标生僻字的字形图像时,是在前述步骤中根据姓名明文编码确定用户姓名包含的汉字数量,基于汉字数量等分裁剪姓名图像,得到用户姓名对应的单字图像数组,数组中就是各汉字单字的字形图像截图;按照第一码位在姓名明文编码中的位置,确定单字图像数组中处于相同位置的单字图像为目标生僻字的字形图像。
S306、识别字形图像,在第二码位数据库中查找字形图像对应的目标样本字形图像,将目标样本字形图像对应的目标样本第二码位作为字形图像的第二码位。
可选地,获取目标生僻字的字形图像之后,考虑到图像文字识别(opticalcharacter recognition,OCR)技术能够识别图像中的文字内容,那么此时同样可以使用OCR来识别字形图像,通过图像获取到目标生僻字的汉字字形。如图4所示,在后端服务模块420中,通过OCR技术,根据目标生僻字的字形文件,在预先设置好的第二码位数据库中进行搜索,确定生僻字字形在第二码位数据库中的坐标,利用此坐标结合第二码位数据库中的单字矩形区域完成目标生僻字字形对应的目标样本字形图像的定位,在目标样本字形图像对应的单字矩形区域中的目标样本第二码位则为目标生僻字的字形图像对应的第二码位;查找到目标生僻字的第二码位之后,可以在后续建立目标生僻字、第一码位以及第二码位之间的字码映射关系并保存至数据库430中,完成字码映射逻辑建立。这样实现字码映射能够帮助实名认证系统认为两个码对应与同一个生僻汉字,姓名中包含该生僻字的用户则在今后可以完成实名认证,极大便利了生僻字姓名的用户的数字服务使用,提高用户的使用体验。
S308、建立目标生僻字、第一码位以及第二码位之间的字码映射关系。
关于步骤S308,请参阅步骤S206中的详细记载,此处不再赘述。
在本说明书实施例中,提供一种字码映射方法,通过近场通信技术读取用户的身份信息卡中的芯片信息,从而根据芯片信息中的姓名密文编码解密得到姓名明文编码,基于用户自定义码段的特性找到对应的目标生僻字的第一码位;另一方面,根据身份信息卡的卡面图像,以及已经确定的目标生僻字在姓名中的位置,确定目标生僻字的字形图像,从而查找第二码位数据库得到目标生僻字的字形图像对应的第二码位;最后,将目标生僻字的字形、第一码位和第二码位建立映射关系,完成目标生僻字的字码映射。帮助用户在进行实名认证时,自动将输入法输入的生僻字的第二码位转化为身份系统中的第一码位,进而实现身份认证,提升生僻字用户的数字服务使用体验。
请参阅图5,图5为本说明书实施例提供的一种字码映射装置的结构框图。如图5所示,字码映射装置500包括:
第一码位确定模块510,用于基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;
第二码位确定模块520,用于根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;
字码映射模块530,用于建立目标生僻字、第一码位以及第二码位之间的字码映射关系。
可选地,第一码位确定模块510,还用于读取用户的身份信息卡的芯片信息,基于芯片信息获取用户姓名中目标生僻字对应的第一码位;获取身份信息卡的卡面图像,基于卡面图像获取目标生僻字的字形图像。
可选地,第一码位确定模块510,还用于基于芯片信息获取芯片信息中的姓名密文编码,解密姓名密文编码得到用户姓名对应的姓名明文编码;根据姓名明文编码确定处于预设第一码位区间内的码位为目标生僻字对应的第一码位。
可选地,第一码位确定模块510,还用于根据第一码位在姓名明文编码中的位置,确定目标生僻字在用户姓名中的排序位置,以及基于身份信息卡的卡面图像获取用户姓名的姓名图像;按照排序位置在姓名图像中确定目标生僻字的字形图像。
可选地,第一码位确定模块510,还用于根据姓名明文编码确定用户姓名包含的汉字数量,基于汉字数量等分裁剪姓名图像,得到用户姓名对应的单字图像数组;按照排序位置确定单字图像数组中处于相同位置的单字图像为目标生僻字的字形图像。
可选地,第二码位确定模块520,还用于识别字形图像,在第二码位数据库中查找字形图像对应的目标样本字形图像,将目标样本字形图像对应的目标样本第二码位作为字形图像的第二码位。
在本说明书实施例中,提供一种字码映射装置,其中,第一码位确定模块,用于基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;第二码位确定模块,用于根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;字码映射模块,用于建立目标生僻字、第一码位以及第二码位之间的字码映射关系。由于通过用户的身份信息卡同时获得了用户姓名中同一生僻字对应的第一码位以及在正式码中的第二码位,那么建立生僻字与第一码位、第二码位之间的映射关系,可以直接帮助用户在进行实名认证时,自动将输入法输入的生僻字的第二码位转化为身份系统中的第一码位,进而实现身份认证,提升生僻字用户的数字服务使用体验。
本说明书实施例提供一种包含指令的计算机程序产品,当计算机程序产品在计算机或处理器上运行时,使得计算机或处理器执行上述实施例中任一项的方法的步骤。
本说明书实施例还提供了一种计算机存储介质,计算机存储介质可以存储有多条指令,指令适于由处理器加载并执行如上述实施例中的任一项的方法的步骤。
请参见图6,图6为本说明书实施例提供的一种终端的结构示意图。如图6所示,终端600可以包括:至少一个终端处理器601,至少一个网络接口604,用户接口603,存储器605,至少一个通信总线602。
其中,通信总线602用于实现这些组件之间的连接通信。
其中,用户接口603可以包括显示屏(Display)、摄像头(Camera),可选用户接口603还可以包括标准的有线接口、无线接口。
其中,网络接口604可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,终端处理器601可以包括一个或者多个处理核心。终端处理器601利用各种接口和线路连接整个终端600内的各个部分,通过运行或执行存储在存储器605内的指令、程序、代码集或指令集,以及调用存储在存储器605内的数据,执行终端600的各种功能和处理数据。可选的,终端处理器601可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。终端处理器601可集成中心处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到终端处理器601中,单独通过一块芯片进行实现。
其中,存储器605可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选的,该存储器605包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器605可用于存储指令、程序、代码、代码集或指令集。存储器605可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器605可选的还可以是至少一个位于远离前述终端处理器601的存储装置。如图6所示,作为一种计算机存储介质的存储器605中可以包括操作系统、网络通信模块、用户接口模块以及字码映射程序。
在图6所示的终端600中,用户接口603主要用于为用户提供输入的接口,获取用户输入的数据;而终端处理器601可以用于调用存储器605中存储的字码映射程序,并具体执行以下操作:
基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像;
根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位,第二码位数据库中至少包括一个样本字形图像以及各样本字形图像对应的样本第二码位;
建立目标生僻字、第一码位以及第二码位之间的字码映射关系。
在一些实施例中,终端处理器601在执行基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及目标生僻字的字形图像时,具体执行以下步骤:读取用户的身份信息卡的芯片信息,基于芯片信息获取用户姓名中目标生僻字对应的第一码位;获取身份信息卡的卡面图像,基于卡面图像获取目标生僻字的字形图像。
在一些实施例中,终端处理器601在执行基于芯片信息获取用户姓名中目标生僻字对应的第一码位时,具体执行以下步骤:基于芯片信息获取芯片信息中的姓名密文编码,解密姓名密文编码得到用户姓名对应的姓名明文编码;根据姓名明文编码确定处于预设第一码位区间内的码位为目标生僻字对应的第一码位。
在一些实施例中,终端处理器601在执行基于卡面图像获取目标生僻字的字形图像时,具体执行以下步骤:根据第一码位在姓名明文编码中的位置,确定目标生僻字在用户姓名中的排序位置,以及基于身份信息卡的卡面图像获取用户姓名的姓名图像;按照排序位置在姓名图像中确定目标生僻字的字形图像。
在一些实施例中,终端处理器601在执行按照排序位置在姓名图像中确定目标生僻字的字形图像时,具体执行以下步骤:根据姓名明文编码确定用户姓名包含的汉字数量,基于汉字数量等分裁剪姓名图像,得到用户姓名对应的单字图像数组;按照排序位置确定单字图像数组中处于相同位置的单字图像为目标生僻字的字形图像。
在一些实施例中,终端处理器601在执行根据字形图像以及第二码位数据库确定目标生僻字对应的第二码位时,具体执行以下步骤:识别字形图像,在第二码位数据库中查找字形图像对应的目标样本字形图像,将目标样本字形图像对应的目标样本第二码位作为字形图像的第二码位。
在本说明书所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。上述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照本说明书实施例上述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者通过上述计算机可读存储介质进行传输。上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DigitalSubscriber Line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(DigitalVersatile Disc,DVD))、或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
另外,需要说明的是,本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的用户行为数据信息、数字服务使用信息等都是在充分授权的情况下获取的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本说明书实施例所提供的一种字码映射方法、装置、存储介质以及终端的描述,对于本领域的技术人员,依据本说明书实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本说明书实施例的限制。

Claims (10)

1.一种字码映射方法,所述方法包括:
基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及所述目标生僻字的字形图像;
根据所述字形图像以及第二码位数据库确定所述目标生僻字对应的第二码位,所述第二码位数据库中至少包括一个样本字形图像以及各样本字形图像对应的样本第二码位;
建立所述目标生僻字、所述第一码位以及所述第二码位之间的字码映射关系。
2.根据权利要求1所述的方法,所述基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及所述目标生僻字的字形图像,包括:
读取用户的身份信息卡的芯片信息,基于芯片信息获取用户姓名中目标生僻字对应的第一码位;
获取所述身份信息卡的卡面图像,基于所述卡面图像获取所述目标生僻字的字形图像。
3.根据权利要求2所述的方法,所述基于芯片信息获取用户姓名中目标生僻字对应的第一码位,包括:
基于芯片信息获取所述芯片信息中的姓名密文编码,解密所述姓名密文编码得到用户姓名对应的姓名明文编码;
根据所述姓名明文编码确定处于预设第一码位区间内的码位为目标生僻字对应的第一码位。
4.根据权利要求3所述的方法,所述基于所述卡面图像获取所述目标生僻字的字形图像,包括:
根据所述第一码位在所述姓名明文编码中的位置,确定所述目标生僻字在所述用户姓名中的排序位置,以及基于所述身份信息卡的卡面图像获取所述用户姓名的姓名图像;
按照所述排序位置在所述姓名图像中确定所述目标生僻字的字形图像。
5.根据权利要求4所述的方法,所述按照所述排序位置在所述姓名图像中确定所述目标生僻字的字形图像,包括:
根据所述姓名明文编码确定所述用户姓名包含的汉字数量,基于所述汉字数量等分裁剪所述姓名图像,得到所述用户姓名对应的单字图像数组;
按照所述排序位置确定所述单字图像数组中处于相同位置的单字图像为所述目标生僻字的字形图像。
6.根据权利要求4所述的方法,所述根据所述字形图像以及第二码位数据库确定所述目标生僻字对应的第二码位,包括:
识别所述字形图像,在第二码位数据库中查找所述字形图像对应的目标样本字形图像,将所述目标样本字形图像对应的目标样本第二码位作为所述字形图像的第二码位。
7.一种字码映射装置,所述装置包括:
第一码位确定模块,用于基于用户的身份信息卡获取用户姓名中目标生僻字对应的第一码位以及所述目标生僻字的字形图像;
第二码位确定模块,用于根据所述字形图像以及第二码位数据库确定所述目标生僻字对应的第二码位,所述第二码位数据库中包括至少一个样本字形图像以及各样本字形图像对应的样本第二码位;
字码映射模块,用于建立所述目标生僻字、所述第一码位以及所述第二码位之间的字码映射关系。
8.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行如权利要求1至6任意一项所述方法的步骤。
9.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1至6任意一项的所述方法的步骤。
10.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至6任一项所述方法的步骤。
CN202310104555.XA 2023-01-31 2023-01-31 字码映射方法、装置、存储介质以及终端 Pending CN116204602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310104555.XA CN116204602A (zh) 2023-01-31 2023-01-31 字码映射方法、装置、存储介质以及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310104555.XA CN116204602A (zh) 2023-01-31 2023-01-31 字码映射方法、装置、存储介质以及终端

Publications (1)

Publication Number Publication Date
CN116204602A true CN116204602A (zh) 2023-06-02

Family

ID=86507251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310104555.XA Pending CN116204602A (zh) 2023-01-31 2023-01-31 字码映射方法、装置、存储介质以及终端

Country Status (1)

Country Link
CN (1) CN116204602A (zh)

Similar Documents

Publication Publication Date Title
CN108665403B (zh) 数字水印嵌入方法、提取方法、装置及数字水印系统
US10181168B2 (en) Personal safety verification system and similarity search method for data encrypted for confidentiality
CN109919244B (zh) 用于生成场景识别模型的方法和装置
CN111343162B (zh) 系统安全登录方法、装置、介质及电子设备
EP2992665A1 (en) Phone number format suggestion
CN110247898B (zh) 身份验证方法、装置、介质及电子设备
CN110738323A (zh) 基于数据共享建立机器学习模型的方法和装置
CN110674331A (zh) 信息处理方法、相关设备及计算机存储介质
CN112784112A (zh) 报文校验方法及装置
CN111222611B (zh) 一种基于颜色的堆叠式三维码编码方法、编码装置、解码方法、解码装置以及存储介质
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
CN110045844B (zh) 位置编码表单数据处理系统
CN111049735B (zh) 群组头像显示方法、装置、设备及存储介质
KR20080048157A (ko) 사용자 폰트 생성 장치, 그 사용자 폰트 생성 방법 및사용자 폰트 서비스 제공 방법
CN116842984A (zh) 一种图形码的解码方法及其制码方法
CN116204602A (zh) 字码映射方法、装置、存储介质以及终端
CN116303888A (zh) 一种生僻字处理方法、装置、存储介质及电子设备
CN110221874A (zh) 快速启动应用的方法、装置及设备
CN108537086A (zh) 信息显示方法、装置、存储介质及移动终端
JP6111346B1 (ja) 電子文書端末、署名認証システム、署名認証方法及び電子文書端末用プログラム
CN108734149B (zh) 一种文本数据扫描方法和装置
CN112364676A (zh) 图像码的处理方法、装置、电子设备及存储介质
CN106843884B (zh) 一种查询数据处理方法及其设备
KR20200002078A (ko) 미션 수행 기반 독자 참여형 웹툰 제공 장치 및 방법
CN110070019A (zh) 位置编码表单数据有效性鉴别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination