CN110728120A - 证件识别过程中自动填入拼音的方法、装置和存储介质 - Google Patents
证件识别过程中自动填入拼音的方法、装置和存储介质 Download PDFInfo
- Publication number
- CN110728120A CN110728120A CN201910846946.2A CN201910846946A CN110728120A CN 110728120 A CN110728120 A CN 110728120A CN 201910846946 A CN201910846946 A CN 201910846946A CN 110728120 A CN110728120 A CN 110728120A
- Authority
- CN
- China
- Prior art keywords
- pinyin
- certificate
- image
- preset
- chinese characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种证件识别过程中自动填入拼音的方法、装置和存储介质,所述方法包括如下步骤:接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。通过上述方式,将待识别的汉字以唯一对应的编码数组进行表示,且通过在拼音音节库中对所述编码数组进行查询,得到其对应的拼音,从而保证拼音识别的准确性。
Description
技术领域
本发明涉及计算机信息处理技术领域,尤其涉及一种证件识别过程中自动填入拼音的方法、装置和存储介质。
背景技术
随着机器学习技术的发展,证件识别技术日趋成熟,证件识别技术是指利用扫描仪、数码相机或手机等拍摄设备拍摄各种证件图像,通过快速扫描并读取证件图像上的联系信息,自动判别证件上的各栏位信息,存入预定的证件信息数据库,从而让用户告别手动输入各种证件信息,为用户提供便利。
然而,由于中国大部分的证件信息包括拼音,当前的证件识别技术对拼音识别的准确率较低,如无法区分出汉字是否带后鼻音,也无法对具备多音字的汉字拼音进行准确的识别。因此,现有的证件识别技术难以保证拼音识别的准确性。
发明内容
本发明的主要目的在于提供了一种证件识别过程中自动填入拼音的方法、装置和存储介质,旨在解决证件识别过程中拼音识别准确率低的问题。
为实现上述目的,本发明提供了一种证件识别过程中自动填入拼音的方法,包括以下步骤:
接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;
将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;
将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;
显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。
可选地,预设汇编表包括汉字编码字符集,所述标准编码包括汉字国际码;
所述将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码的步骤包括:
将待识别的汉字输入至汉字编码字符集中,得到与所述待识别的汉字对应的汉字国标码;
所述将所述标准编码按照预设规则转换为编码数组的步骤包括:
将十六进制的汉字国标码转换为两组十进制的数组,并将所述两组十进制的数组作为编码数组。
可选地,所述将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音的步骤包括:
将编码数组输入至预设音节索引表中查询,以得到对应的音节索引值,其中预设音节索引表存储有所述编码数组和所述音节索引值的映射关系;
将所述音节索引值输入至预设拼音音节库中查询,得到预设拼音音节库中与所述音节索引值对应的拼音。
可选地,所述将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音的步骤之后,还包括:
确定所述拼音的数量;
当所述拼音的数量为多个时,执行步骤:显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置;
当所述拼音的数量不为多个时,将所述拼音填入预设位置。
可选地,所述接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字的步骤包括:
接收证件图像,并对所述证件图像进行图像处理,以得到期望证件图像;
对所述期望证件图像进行汉字识别,并提取出所述期望证件图像中待进行拼音识别的汉字。
可选地,所述对所述证件图像进行图像处理,以得到期望证件图像的步骤包括:
根据所述证件图像中的红色像素值、绿色像素值以及蓝色像素值得到平均像素值,并将所述证件图像中的红色像素值、绿色像素值以及蓝色像素值的数值设置为平均像素值,以得到灰度图像;
通过预设滤波器对所述灰度图像进行降噪,并对降噪后的灰度图像进行去倾斜化处理,以得到期望证件图像。
可选地,所述对所述期望证件图像进行汉字识别的步骤包括:
对所述期望证件图像进行图像分割,得到分割后的多个期望证件图像;
将分割后的多个期望证件图像输入至预设文字图像库中匹配,得到所述期望证件图像中所有的汉字。
可选地,所述提取出所述证件图像中待进行拼音识别的汉字的步骤包括:
判断是否接收到用户输入的汉字提取指令;
当接收到用户输入的汉字提取指令时,根据所述汉字提取指令确定待识别位置,并提取所述待识别位置内的汉字作为待进行拼音识别的汉字;
当未接收到用户输入的汉字提取指令时,确定预设汉字在所述期望证件图像中的位置,并根据所述位置确定待识别位置;
提取所述待识别位置内的汉字,并将所述汉字作为待进行拼音识别的汉字。
此外,为实现上述目的,本发明还提供一种装置,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的证件识别过程中自动填入拼音的程序,所述证件识别过程中自动填入拼音的程序被所述处理器执行时实现如上所述证件识别过程中自动填入拼音的方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有证件识别过程中自动填入拼音的程序,所述证件识别过程中自动填入拼音的程序被处理器执行时实现如上所述证件识别过程中自动填入拼音的方法的步骤。
本发明公开了一种证件识别过程中自动填入拼音的方法、装置和存储介质,所述方法通过接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。通过上述方式,将待识别的汉字以唯一对应的编码数组进行表示,且通过在拼音音节库中对所述编码数组进行查询,得到其对应的拼音,从而保证拼音识别的准确性,此外,即使当待识别的汉字为多音字时,也能将多个拼音显示给用户,根据用户的操作自动填入拼音。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明证件识别过程中自动填入拼音的方法一实施例的流程示意图;
图3为本发明证件识别过程中自动填入拼音的方法另一实施例的流程示意图;
图4为本发明所述提取出所述证件图像中待进行拼音识别的汉字的步骤细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明终端是一种装置,该装置可以是一种手机、电脑、移动电脑等具有存储功能的终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、Wi-Fi模块等等,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要包括输入单元比如键盘,键盘包括无线键盘和有线键盘,用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的证件识别过程中自动填入拼音的程序,并执行以下操作:
接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;
将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;
将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;
显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
将待识别的汉字输入至汉字编码字符集中,得到与所述待识别的汉字对应的汉字国标码;
将十六进制的汉字国标码转换为两组十进制的数组,并将所述两组十进制的数组作为编码数组。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
将编码数组输入至预设音节索引表中查询,以得到对应的音节索引值,其中预设音节索引表存储有所述编码数组和所述音节索引值的映射关系;
将所述音节索引值输入至预设拼音音节库中查询,得到预设拼音音节库中与所述音节索引值对应的拼音。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
确定所述拼音的数量;
当所述拼音的数量为多个时,执行步骤:显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置;
当所述拼音的数量不为多个时,将所述拼音填入预设位置。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
接收证件图像,并对所述证件图像进行图像处理,以得到期望证件图像;
对所述期望证件图像进行汉字识别,并提取出所述期望证件图像中待进行拼音识别的汉字。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
根据所述证件图像中的红色像素值、绿色像素值以及蓝色像素值得到平均像素值,并将所述证件图像中的红色像素值、绿色像素值以及蓝色像素值的数值设置为平均像素值,以得到灰度图像;
通过预设滤波器对所述灰度图像进行降噪,并对降噪后的灰度图像进行去倾斜化处理,以得到期望证件图像。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
对所述期望证件图像进行图像分割,得到分割后的多个期望证件图像;
将分割后的多个期望证件图像输入至预设文字图像库中匹配,得到所述期望证件图像中所有的汉字。
进一步地,处理器1001可以调用存储器1005中存储的证件识别过程中自动填入拼音的程序,还执行以下操作:
判断是否接收到用户输入的汉字提取指令;
当接收到用户输入的汉字提取指令时,根据所述汉字提取指令确定待识别位置,并提取所述待识别位置内的汉字作为待进行拼音识别的汉字;
当未接收到用户输入的汉字提取指令时,确定预设汉字在所述期望证件图像中的位置,并根据所述位置确定待识别位置;
提取所述待识别位置内的汉字,并将所述汉字作为待进行拼音识别的汉字。
本装置的具体实施例与下述证件识别过程中自动填入拼音的方法各实施例基本相同,在此不作赘述。
请参阅图2,图2为本发明证件识别过程中自动填入拼音的方法一实施例的流程示意图,本实施例提供的证件识别过程中自动填入拼音的方法包括如下步骤:
步骤S10,接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;
本实施例所涉及的证件识别过程中自动填入拼音的方法可以应用在手机上,也可以应用在电脑、平板电脑等终端上,出于详尽阐述本实施例的需要,以该证件识别过程中自动填入拼音的方法应用在手机上为例。可以从手机本地相册中接收证件图像,应当理解的是,也可以通过文件传输或与外部设备无线连接的方式接收证件图像。接收到证件图像后,对证件图像进行图像识别,并得到待进行拼音识别的汉字,应当理解的是,待进行拼音识别的汉字,可以是证件图像中所有的汉字,也可以是证件图像中的部分汉字。
步骤S20,将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;
本实施例中预设有汇编表,预设汇编表能反映待识别的汉字与预设标准编码之间的映射关系,将待识别的汉字输入至预设汇编表中得到预设汇编表中对应的标准编码。
步骤S30,将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;
得到标准编码后,按照预设规则对标准编码进行数制转换,得到对应的编码数组。此外,本实施例中还预设有拼音音节库,所述拼音音节库能反映编码数组与对应的拼音的映射关系,将编码数组输入至预设拼音音节库中,得到对应的拼音。容易理解的是,一些汉字存在多音字的情况,因此,在拼音音节库中,一个编码数组可以对应一个拼音,也可以对应多个拼音。
步骤S40,显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。
将得到的拼音显示出来,以使得用户直观的了解汉字拼音识别结果。当待进行拼音识别的汉字存在多个对应拼音时,根据用户输入的选择指令将对应的拼音填入预设位置,完成对汉字的拼音识别。
本实施例通过接收证件图像,并对证件图像进行识别,以得到待识别的汉字;将待识别的汉字输入至预设汇编表中,得到与待识别的汉字对应的标准编码;将标准编码按照预设规则转换为编码数组,并将编码数组输入至预设拼音音节库中,以得到与编码数组对应的拼音;显示拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。通过上述方式,将待识别的汉字以唯一对应的编码数组进行表示,且通过在拼音音节库中对所述编码数组进行查询,得到其对应的拼音,从而保证拼音识别的准确性,此外,即使当待识别的汉字为多音字时,也能将多个拼音显示给用户,根据用户的操作自动填入拼音。
进一步地,预设汇编表包括汉字编码字符集,所述标准编码包括汉字国际码;所述将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码的步骤包括:
步骤S21,将待识别的汉字输入至汉字编码字符集中,得到与所述待识别的汉字对应的汉字国标码;
本实施例中预设的汇编表可以是汉字编码字符集,标准编码可以是汉字国际码,上述汉字国际码即GB2312编码,中国国家标准总局发布的汉字字符集国家标准编码,它采用16位编码方式,简体中文的编码范围从B0A1一直到F7FE。当然,上述预设汇编表也可以是其他数表,对应的标准编码也可以是其他编码,本实施例在此不做限制。
所述将所述标准编码按照预设规则转换为编码数组的步骤包括:
步骤S31,将十六进制的汉字国标码转换为两组十进制的数组,并将所述两组十进制的数组作为编码数组。
本实施例中的汉字国标码为十六进制的一组数组,对得到的汉字国际码进行数制转换,将其转换为两组十进制的数组,并将上述两组十进制的数组作为编码数组。应当理解的是,还可以通过其他数制转换方式对汉字国标码进行相应的转换,本实施例在此不做具体限制。
由于每个中文字符都可用GB2312编码表示,这样就将文字从一种图片信息转换为了一种便于计算机理解的编码信息,从而方便对汉字进行拼音识别的同时,通过采用数组替代待识别汉字减少了计算量。
进一步地,所述将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音的步骤包括:
步骤S32,将编码数组输入至预设音节索引表中查询,以得到对应的音节索引值,其中预设音节索引表存储有所述编码数组和所述音节索引值的映射关系;
本实施例中,还预设有音节索引表,其中预设音节索引表存储有所述编码数组和所述音节索引值的映射关系,将编码数组输入至预设音节索引表中,得到对应的音节索引值。为了确保对汉字进行拼音识别的准确性,上述音节索引表中的编码数组与音节索引值的对应不是唯一的,因此上述的音节索引表应当设置成一个二维数表,以更精准的进行文字信息的拼音识别。
步骤S33,将所述音节索引值输入至预设拼音音节库中查询,得到预设拼音音节库中与所述音节索引值对应的拼音。
得到音节索引值后,将所述音节索引值输入至预设拼音音节库中,得到预设拼音音节库中与所述音节索引值对应的拼音,拼音音节库中中的拼音与音节索引值一一对应。本实施例中,并不是直接将数据量较大的编码数组输入至预设拼音音节库中进行查询,而是先将数据量较大的编码数组转换为数据量较小的音节索引值,再输入至拼音音节库中进行查询。通过这种方式,节约内存资源,避免数据库处理量过大而造成崩溃。
进一步地,请参阅图3,图3为本发明证件识别过程中自动填入拼音的方法另一实施例的流程示意图,上述步骤S30将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音之后,还包括:
步骤S50,确定所述拼音的数量;
在得到与音节索引值对应的拼音后,存在一种情况,当文字的形状较为相近时,其识别出来的GB2312编码可能存在误差,或者,该汉字存在多音字的情况时,与该音节索引值对应的拼音可能存在多个。在此基础上,为了保证拼音识别的准确性,先确定识别出来的拼音的数量。
步骤S60,当所述拼音的数量为多个时,执行步骤:显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置;
当识别得到的拼音为多个时,则将多个拼音显示出来,以便用户进行选择。
步骤S70,当所述拼音的数量不为多个时,将所述拼音填入预设位置。
当识别得到的拼音不为多个时,即只识别到唯一的一个拼音时,表示待识别的汉字不是多音字,则将所述拼音填入至预设位置,以完成证件信息的自动填入。
本实施例通过上述方式,先确定拼音的数量,并根据识别出来的拼音数量的不同执行不同的操作,从而当待识别的汉字为多音字时,也能保证证件识别过程中填入拼音的准确性。
进一步地,所述接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字的步骤包括:
步骤S11,接收证件图像,并对所述证件图像进行图像处理,以得到期望证件图像;
本实施例中通过扫描仪、数码相机或手机等拍摄设备拍摄得到证件图像,或通过其他方式获得证件图像后,对证件图像进行图像处理,将图像处理后的证件图像作为期望证件图像。
步骤S12,对所述期望证件图像进行汉字识别,并提取出所述期望证件图像中待进行拼音识别的汉字。
得到期望证件图像后,可以使用模板匹配法或几何特征提取法对期望证件图像进行文字识别,以识别得到期望证件图像中的汉字,应当理解的是,可以将识别得到的所有汉字都作为带进行识别的汉字,也可以只将位于期望证件图像中预设位置的汉字作为带进行拼音识别的汉字。
本实施例通过对证件图像进行图像处理得到期望证件图像,并以此得到待进行拼音识别的汉字,应当理解的是,得到期望证件图像和确定待进行拼音识别的汉字是进行图像文字识别的前提步骤,进一步的保证文字识别的准确性。
进一步地,所述对所述证件图像进行图像处理,以得到期望证件图像的步骤包括:
步骤S111,根据所述证件图像中的红色像素值、绿色像素值以及蓝色像素值得到平均像素值,并将所述证件图像中的红色像素值、绿色像素值以及蓝色像素值的数值设置为平均像素值,以得到灰度图像;
得到证件图像后,为了便于对图像进行处理,先将证件图像转换为灰度图像。具体的,先确定证件图像中的各个像素点的红色像素值、绿色像素值以及蓝色像素即R值、G值以及B值,并以此得到平均像素值,即将红色像素值、绿色像素值以及蓝色像素的具体数值之和除以三,再将证件图像中的红色像素值、绿色像素值以及蓝色像素值的数值设置为平均像素值,得到灰度图像。此外,还有其他图像处理的方法可以将证件图像转换为灰度图像,本实施例在此不做具体限制。
步骤S112,通过预设滤波器对所述灰度图像进行降噪,并对降噪后的灰度图像进行去倾斜化处理,以得到期望证件图像。
容易理解的是,证件图像在数字化传输过程中容易受到外部环境或其他的干扰而形成含噪图像,证件图像中的噪声来源可能为证件图像采集、证件图像传输和证件图像压缩等各个过程,为此,对灰度化后的证件图像进行降噪处理,以避免后续噪声对证件图像处理的影响。本实施例中,可以采用均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤除器等滤波器对证件图像进行降噪。
此外,用户上传的证件图像,是用户通过扫描仪、数码相机或手机等拍摄设备拍摄证件所形成的证件图像,对于用户而言,进行上述动作的时候,难以保证所拍摄图像一定处于水平状态;或者,用户通过传输方式接收到的证件图像可能出现一定程度的倾斜。因此,将图像做旋转处理,从而找到一个最水平的位置,实现证件图像的去倾斜化,来得到期望证件图像。具体的,可以采用霍夫变换检测方法,霍夫变换被广泛应用在图像分析领域、电脑视觉领域以及数位影像处理领域。霍夫变换算法的流程大致如下,对证件图像进行膨胀处理,将证件图像中断续的文字连成一条直线,便于直线检测,计算出直线的角度后,旋转证件图像,以将倾斜的证件图像矫正到水平位置,完成对证件图像的图像处理,并得到期望证件图像。当然,也可以采用其他去倾斜化的方来得到期望证件图像,本实施例在此不再限制。
将证件图像转换为期望证件图像是进行图像文字识别的前提步骤,进一步的保证文字识别的准确性。
进一步地,所述对所述期望证件图像进行汉字识别的步骤包括:
步骤S121,对所述期望证件图像进行图像分割,得到分割后的多个期望证件图像;
本实施例中,采用模板匹配法对期望证件图像进行汉字识别,当然,也可以采用其他图像采集方法实现对证件图像的分割。具体的,先将期望证件图像进行图像分割,得到分割后的多个期望证件图像。可以理解为,生成采集框采用同步移位的方式对期望证件图像进行扫描,以实现对期望证件图像的图像分割,得到分割后的多个期望证件图像。
步骤S122,将分割后的多个期望证件图像输入至预设文字图像库中匹配,得到所述期望证件图像中所有的汉字。
本实施例中,还预设有文字图像库,上述文字图像库中反映有期望证件图像和汉字的映射关系,将多个期望证件图像输入至预设文字图像库中进行匹配,并计算期望证件图像与预设文字图像库中的文字的相似度,将预设文字图像库中相似度最高的文字,作为当前期望证件图像所表达的文字。
此外,还可以通过几何特征提取法得到期望证件图像中所有的汉字,具体的,通过提取期望证件图像中的一些几何特征,如文字的端点、分叉点、凹凸部分以及水平、垂直、倾斜等各方向的线段、闭合环路等,将这些文字特征输入至预设分类器中,分类器对其进行分类,根据所述文字特征进行文字识别,得到所述期望证件图像中所有的汉字。
本实施例通过对图像进行分割,再将分割后的图像输入至预设文字图像库中匹配,以精准的识别图像中所有的汉字。
进一步地,请参阅图4,图4为本发明所述提取出所述证件图像中待进行拼音识别的汉字的步骤细化流程示意图,所述提取出所述证件图像中待进行拼音识别的汉字的步骤包括:
步骤S123,判断是否接收到用户输入的汉字提取指令;
对期望证件图像的所有文字进行识别后,由于在证件识别过程中只需要识别证件中的部分汉字的拼音信息,因此,通过判断是否接受到用户输入的汉字提取指令,避免处理多余的数据,上述汉字提取指令即用户输入的确定待识别汉字的指令。
步骤S124,当接收到用户输入的汉字提取指令时,根据所述汉字提取指令确定待识别位置,并提取所述待识别位置内的汉字作为待进行拼音识别的汉字;
当接收到用户输入的汉字提取指令时,根据用户输入的汉字提取指令,确定证件图像中用户想要进行拼音识别的用户信息,并得到证件图像中与所述汉字提取指令对应的位置,将上述位置确定为待识别位置,将待识别位置内的汉字作为待进行拼音识别的汉字。
步骤S125,当未接收到用户输入的汉字提取指令时,确定预设汉字在所述期望证件图像中的位置,并根据所述位置确定待识别位置;
当未接收到用户输入的汉字提取指令时,由于在证件识别过程中往往只需要识别用户姓名的拼音,因此只需将识别得到的汉字“姓名”后的文字信息确定为待进行拼音识别的文字信息,先确定识别得到的汉字“姓名”在期望证件图像中的位置,并将处于“姓名”后的位置确定为待识别位置。
步骤S126,提取所述待识别位置内的汉字,并将所述汉字作为待进行拼音识别的汉字。
确定待识别位置后,提取待识别位置内的汉字,并将所述汉字作为待进行拼音识别的汉字。当然,上述预设汉字也可以是其他汉字,如若只需要识别证件中住址信息的拼音,则可以将预设汉字设置为“住址”,本实施例中的预设汉字,可以根据用户需求对应的改变。通过上述方式,满足用户对证件图像中的指定信息进行拼音识别的需求。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有证件识别过程中自动填入拼音的程序,所述证件识别过程中自动填入拼音的程序被处理器执行时实现如上所述证件识别过程中自动填入拼音的方法的操作。
本发明计算机可读存储介质的具体实施例与上述证件识别过程中自动填入拼音的方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种证件识别过程中自动填入拼音的方法,其特征在于,包括以下步骤:
接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字;
将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码;
将所述标准编码按照预设规则转换为编码数组,并将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音;
显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置。
2.如权利要求1所述的证件识别过程中自动填入拼音的方法,其特征在于,预设汇编表包括汉字编码字符集,所述标准编码包括汉字国际码;
所述将待识别的汉字输入至预设汇编表中,得到与所述待识别的汉字对应的标准编码的步骤包括:
将待识别的汉字输入至汉字编码字符集中,得到与所述待识别的汉字对应的汉字国标码;
所述将所述标准编码按照预设规则转换为编码数组的步骤包括:
将十六进制的汉字国标码转换为两组十进制的数组,并将所述两组十进制的数组作为编码数组。
3.如权利要求1所述的证件识别过程中自动填入拼音的方法,其特征在于,所述将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音的步骤包括:
将编码数组输入至预设音节索引表中查询,以得到对应的音节索引值,其中预设音节索引表存储有所述编码数组和所述音节索引值的映射关系;
将所述音节索引值输入至预设拼音音节库中查询,得到预设拼音音节库中与所述音节索引值对应的拼音。
4.如权利要求1所述的证件识别过程中自动填入拼音的方法,其特征在于,所述将所述编码数组输入至预设拼音音节库中,以得到与所述编码数组对应的拼音的步骤之后,还包括:
确定所述拼音的数量;
当所述拼音的数量为多个时,执行步骤:显示所述拼音,并根据用户输入的选择指令将对应的拼音填入预设位置;
当所述拼音的数量不为多个时,将所述拼音填入预设位置。
5.如权利要求1所述的证件识别过程中自动填入拼音的方法,其特征在于,所述接收证件图像,并对所述证件图像进行识别,以得到待识别的汉字的步骤包括:
接收证件图像,并对所述证件图像进行图像处理,以得到期望证件图像;
对所述期望证件图像进行汉字识别,并提取出所述期望证件图像中待进行拼音识别的汉字。
6.如权利要求5所述的证件识别过程中自动填入拼音的方法,其特征在于,所述对所述证件图像进行图像处理,以得到期望证件图像的步骤包括:
根据所述证件图像中的红色像素值、绿色像素值以及蓝色像素值得到平均像素值,并将所述证件图像中的红色像素值、绿色像素值以及蓝色像素值的数值设置为平均像素值,以得到灰度图像;
通过预设滤波器对所述灰度图像进行降噪,并对降噪后的灰度图像进行去倾斜化处理,以得到期望证件图像。
7.如权利要求5所述的证件识别过程中自动填入拼音的方法,其特征在于,所述对所述期望证件图像进行汉字识别的步骤包括:
对所述期望证件图像进行图像分割,得到分割后的多个期望证件图像;
将分割后的多个期望证件图像输入至预设文字图像库中匹配,得到所述期望证件图像中所有的汉字。
8.如权利要求5所述的证件识别过程中自动填入拼音的方法,其特征在于,所述提取出所述证件图像中待进行拼音识别的汉字的步骤包括:
判断是否接收到用户输入的汉字提取指令;
当接收到用户输入的汉字提取指令时,根据所述汉字提取指令确定待识别位置,并提取所述待识别位置内的汉字作为待进行拼音识别的汉字;
当未接收到用户输入的汉字提取指令时,确定预设汉字在所述期望证件图像中的位置,并根据所述位置确定待识别位置;
提取所述待识别位置内的汉字,并将所述汉字作为待进行拼音识别的汉字。
9.一种装置,其特征在于,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的证件识别过程中自动填入拼音的程序,所述证件识别过程中自动填入拼音的程序配置为实现如权利要求1至8中任一项所述的证件识别过程中自动填入拼音的方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有证件识别过程中自动填入拼音的程序,所述证件识别过程中自动填入拼音的程序被处理器执行时实现如权利要求1至8任一项所述的证件识别过程中自动填入拼音的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910846946.2A CN110728120A (zh) | 2019-09-06 | 2019-09-06 | 证件识别过程中自动填入拼音的方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910846946.2A CN110728120A (zh) | 2019-09-06 | 2019-09-06 | 证件识别过程中自动填入拼音的方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110728120A true CN110728120A (zh) | 2020-01-24 |
Family
ID=69218068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910846946.2A Pending CN110728120A (zh) | 2019-09-06 | 2019-09-06 | 证件识别过程中自动填入拼音的方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110728120A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348073A (zh) * | 2020-10-30 | 2021-02-09 | 北京达佳互联信息技术有限公司 | 一种多音字识别方法、装置、电子设备及存储介质 |
-
2019
- 2019-09-06 CN CN201910846946.2A patent/CN110728120A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348073A (zh) * | 2020-10-30 | 2021-02-09 | 北京达佳互联信息技术有限公司 | 一种多音字识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110046529B (zh) | 二维码识别方法、装置及设备 | |
KR102208683B1 (ko) | 문자 인식 방법 및 그 장치 | |
CN114155546B (zh) | 一种图像矫正方法、装置、电子设备和存储介质 | |
CN110717497B (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
CN111290684B (zh) | 图像显示方法、图像显示装置及终端设备 | |
CN107272899B (zh) | 一种基于动态手势的vr交互方法、装置及电子设备 | |
CN110414649B (zh) | Dm码的定位方法、装置、终端及存储介质 | |
CN112784853B (zh) | 端子连接状态检测方法及装置 | |
US10509934B1 (en) | Methods and apparatus for improving QR code locator detectability and/or finding the corners of a locator pattern | |
CN113052754B (zh) | 一种图片背景虚化的方法及装置 | |
CN111080665B (zh) | 图像边框识别方法、装置、设备和计算机存储介质 | |
CN113343958A (zh) | 一种文本识别方法、装置、设备及介质 | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
CN110431563B (zh) | 图像校正的方法和装置 | |
CN108304815A (zh) | 一种数据获取方法、装置、服务器及存储介质 | |
CN113748429A (zh) | 单词识别方法、设备及存储介质 | |
CN110827301A (zh) | 用于处理图像的方法和装置 | |
CN110728120A (zh) | 证件识别过程中自动填入拼音的方法、装置和存储介质 | |
TWI671686B (zh) | 影像數據擷取方法及影像數據擷取裝置 | |
CN108629219B (zh) | 一种识别一维码的方法及装置 | |
JP5051671B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN110245668B (zh) | 基于图像识别的终端信息获取方法、获取装置及存储介质 | |
CN113313642A (zh) | 图像去噪方法、装置、存储介质及电子设备 | |
CN110163203B (zh) | 字符识别方法、装置、存储介质及计算机设备 | |
CN107392205B (zh) | 一种遥控器的码值表生成方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200113 Address after: 2000 15/F, 1333 Lujiazui Ring Road, China (Shanghai) Free Trade Pilot Area, Pudong New Area, Shanghai Applicant after: Weikun (Shanghai) Technology Service Co., Ltd Address before: 200120 13th floor, No. 1333, Lujiazui Ring Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant before: Lujiazui Shanghai international financial assets market Limited by Share Ltd |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |