CN105404624A - 一种汉字识别方法、装置及终端 - Google Patents

一种汉字识别方法、装置及终端 Download PDF

Info

Publication number
CN105404624A
CN105404624A CN201410441700.4A CN201410441700A CN105404624A CN 105404624 A CN105404624 A CN 105404624A CN 201410441700 A CN201410441700 A CN 201410441700A CN 105404624 A CN105404624 A CN 105404624A
Authority
CN
China
Prior art keywords
chinese character
similar word
phonetically similar
phonetic
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410441700.4A
Other languages
English (en)
Inventor
吴尚智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410441700.4A priority Critical patent/CN105404624A/zh
Priority to PCT/CN2015/088212 priority patent/WO2016034066A1/zh
Publication of CN105404624A publication Critical patent/CN105404624A/zh
Priority to HK16109823.6A priority patent/HK1221791A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种汉字识别方法、装置及终端,包括:输入法系统根据接收到的结构序列,在保存的汉字库中查找与该结构序列匹配的汉字并显示,该汉字库中存储汉字、汉字的结构序列、拼音的对应关系;根据接收的在显示的汉字中选择的汉字,在该汉字库中查找选择的汉字的拼音;显示该汉字的拼音。采用本发明提供的上述方案,相比现有技术,简化了汉字识别过程,提高了识别速度。

Description

一种汉字识别方法、装置及终端
技术领域
本发明涉及计算机技术领域,尤其涉及一种汉字识别方法、装置及终端。
背景技术
不同国家的语言由单个字或者词为基本单位组成,每种语言都包括了大量的字或者词。中国的汉字非常多,在《中国字海》中大约收录了85568个汉字,其中常用汉字大约3500个。由于中国的汉字数量庞大,即使是在常用汉字中,也有一些字是大多数人不认识的汉字。当在社交生活中遇到不认识的汉字即生字时,需要及时获知该汉字的读音或者释义。
现有的汉字识别方式主要有以下几种:
第一种方式:采用传统的查字典方式,这种方式由于需要在识别汉字时身边带有字典,很不方便,并且人遇到生字具有随机性,可能随时随地会遇到生字,不可能时刻随身携带字典。
下面是基于现代的通信终端进行汉字识别的方式。
第二种方式:采用特定的工具,如金山词霸的辅助读音功能,用户通过结构化输入汉字方式(例如五笔、笔画输入方式)输入将要识别的汉字,系统在检测到有汉字输入时,通过将当前汉字与汉字库中的汉字进行匹配,在汉字库中查找到该当前汉字后,对应得到该当前汉字的信息,包括该当前汉字的读音。当用户点击交互界面的朗读图标时,系统按照用户发送的触发朗读事件播放该当前汉字的读音。这种方式需要用户安装特定的工具,在采用特定的工具进行汉字识别时,只使用了朗读一项功能,其他的功能可能是用户不经常使用或者不需要的功能,这样造成资源的浪费。并且,如果用户使用的终端上没有安装特定的工具时,需要在网络环境下下载并安装该特定工具,使得汉字识别具有一定的局限性,导致识别速度下降。
第三种方式:使用网页提供的汉字转拼音的方式,通过特定的网页将检测到的汉字转化为拼音显示出来。该方式也需要在网络环境下,并且对于没有系统学习过拼音的用户,仍然不知道该汉字如何读,用户体验差。
发明内容
本发明实施例提供一种汉字识别方法、装置及终端,用以解决现有技术中存在的对汉字进行识别时过程复杂、识别速度慢的问题。
本发明实施例提供一种汉字识别方法,包括:
输入法系统根据接收到的结构序列,在保存的汉字库中查找与所述结构序列匹配的多个并显示,所述汉字库中存储汉字、汉字的结构序列、拼音的对应关系;
根据用户在显示的所述汉字中选择的汉字,在所述汉字库中查找选择的所述汉字的拼音;
显示所述汉字的拼音。
采用本发明实施例提供的方法,使用输入法系统在汉字库中查找汉字的拼音,将该汉字的拼音显示给用户,由于输入法是各种终端上一个常用的应用,在无网络环境下也可以使用,不需要安装其他的应用,使得汉字识别过程简单,提高了识别速度。
进一步的,上述方法,还包括:
在所述汉字库中查找选择的所述汉字的同音字;
显示预设数量的所述同音字。
这样,由于将汉字的同音字也显示给用户,使得对于没有系统学习过拼音的用户也可以通过同音字对该汉字进行识别,简化了汉字识别难度,提高了用户体验。
进一步的,上述方法,还包括:
在所述汉字库中查找与选择的所述汉字的拼音的声调相同的同音字;
显示预设数量的所述同音字。
进一步的,显示预设数量的所述同音字,具体包括:
在选择的所述汉字对应的同音字中,按照获取的各同音字对应的使用频度从大到小的顺序对所述同音字进行排序;
显示排序后的同音字中前预设数量的同音字。
这样,由于使用频度越大表示越常使用,通过显示使用频度从大到小的前预设数量的同音字,可以使得用户更加容易识别该汉字。
进一步的,上述方法,还包括:
当接收到同音字切换请求时,在按照使用频度从大到小的顺序排序的所述同音字中,从当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
这样,通过显示不同的同音字,进一步简化了汉字识别难度。
进一步的,上述方法,还包括:
根据选择的所述汉字的拼音的声调,为显示的同音字标记与该汉字拼音相同的声调;或者
根据显示的同音字的拼音的声调,为显示的同音字标记该同音字的声调。
进一步的,上述方法,还包括:
当接收到对选择的所述汉字的朗读请求时,按照该汉字对应的拼音进行朗读;或者
当接收到对选择的所述汉字的释义显示请求时,将获取的该汉字的释义进行显示。
进一步的,在所述汉字库中查找选择的所述汉字的拼音之前,还包括:
接收汉字拼音识别模式的切换请求并切换到汉字拼音识别模式。
本发明实施例还提供了一种汉字识别装置,包括:
第一查找单元,用于根据接收到的结构序列,在保存的汉字库中查找与所述结构序列匹配的汉字并显示,所述汉字库中存储汉字、汉字的结构序列、拼音的对应关系;
第二查找单元,用于根据用户在显示的所述汉字中选择的汉字,在所述汉字库中查找选择的所述汉字的拼音;
第一显示单元,用于显示所述汉字的拼音。
采用本发明实施例提供的装置,使用输入法系统在汉字库中查找汉字的拼音,将该汉字的拼音显示给用户,由于输入法是各种终端上一个常用的应用,在无网络环境下也可以使用,不需要安装其他的应用,使得汉字识别过程简单,提高了识别速度。
进一步的,上述装置,还包括:
第三查找单元,用于在所述汉字库中查找选择的所述汉字的同音字;
第二显示单元,用于显示预设数量的所述同音字。
这样,由于将汉字的同音字也显示给用户,使得对于没有系统学习过拼音的用户也可以通过同音字对该汉字进行识别,简化了汉字识别难度,提高了用户体验。
进一步的,上述装置,还包括:
第四查找单元,用于在所述汉字库中查找与选择的所述汉字的拼音的声调相同的同音字;
第三显示单元,用于显示预设数量的所述同音字。
进一步的,所述第二显示单元或第三显示单元,具体用于在选择的所述汉字对应的同音字中,按照获取的各同音字对应的使用频度从大到小的顺序对所述同音字进行排序;显示排序后的同音字中前预设数量的同音字。
这样,由于使用频度越大表示越常使用,通过显示使用频度从大到小的前预设数量的同音字,可以使得用户更加容易识别该汉字。
进一步的,上述装置,还包括:
同音字切换单元,用于当接收到同音字切换请求时,在按照使用频度从大到小的顺序排序的所述同音字中,从当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
这样,通过显示不同的同音字,进一步简化了汉字识别难度。
进一步的,上述装置,还包括:
第一标记单元,用于根据选择的所述汉字的拼音的声调,为显示的同音字标记与该汉字拼音相同的声调;或者
第二标记单元,用于根据显示的同音字的拼音的声调,为显示的同音字标记该同音字的声调。
进一步的,上述装置,还包括:
朗读单元,用于当接收到对选择的所述汉字的朗读请求时,按照该汉字对应的拼音进行朗读;或者
释义显示单元,用于当接收到对选择的所述汉字的释义显示请求时,将获取的该汉字的释义进行显示。
进一步的,上述装置,还包括:
拼音识别模式切换单元,用于在所述汉字库中查找选择的所述汉字的拼音之前,接收汉字拼音识别模式的切换请求并切换到汉字拼音识别模式。
本发明实施例还提供了一种终端,包括:
如上述汉字识别装置。
采用本发明实施例提供的终端,由于输入法是各种终端上一个常用的应用,在无网络环境下也可以使用,不需要安装其他的应用,使得汉字识别过程简单,提高了识别速度。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的汉字识别方法的流程图;
图2为本发明实施例1提供的汉字识别方法的流程图;
图3为本发明实施例2提供的汉字识别装置的结构示意图。
具体实施方式
为了给出使得汉字识别过程简单、提高识别速度以及提高用户体验的实现方案,本发明实施例提供了一种汉字识别方法、装置及终端,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种汉字识别方法,如图1所示,包括:
步骤101、输入法系统根据接收到的结构序列,在保存的汉字库中查找与该结构序列匹配的汉字并显示,该汉字库中存储汉字、汉字的结构序列、拼音的对应关系。
步骤102、根据用户在显示的汉字中选择的汉字,在该汉字库中查找选择的汉字的拼音。
步骤103、显示该汉字的拼音。
本发明实施例中,拼音,包括声母、韵母以及声调。结构序列是指一个汉字的每一个笔画结构对应的字符串的组合。输入法系统支持结构化输入方式,例如五笔、笔画、手写等输入方式,并且输入法系统可以安装在各种终端上,其中,该终端可以为电脑,以及带触摸屏的平板电脑和手机等。
下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。
实施例1:
图2为本发明实施例1提供的汉字识别方法的流程图,具体包括如下处理步骤:
步骤201、输入法系统当接收到汉字拼音识别模式的切换请求时,切换到汉字拼音识别模式。
本步骤中,该输入法系统可以安装在各种终端上,用户在打开输入法时,可以通过鼠标等方式选择输入法图标中的汉字拼音识别图标,即相当于用户向输入法系统发送开启汉字拼音识别模式的切换请求,当输入法系统接收到该切换请求时,启动汉字拼音识别模式。
步骤202、在用户在显示的当前结构化输入模式下输入将要识别的汉字之后,输入法系统根据接收到的结构序列,确定该结构序列是否为有效结构序列,如果否,进入步骤203,如果是,进入步骤204。
本步骤中,由于用户当前结构化输入模式下按照结构输入生字,可能会存在结构序列错误不能组成有效结构序列的情况,例如,用户使用笔画输入方式输入生字时,其中对结构其主要作用的一个笔画没有输入,那么其他的笔画不能组成的一个字的结构,或者若当前结构化输入模式为手写方式,即用户使用手写输入法输入将要识别的生字,由于每个用户书写汉字的工整程度不同,手写的笔画结构如果与标准结构相差较多,也不能组成一个字的结构,因此需要判断用户输入的汉字的结构序列是否有效,具体可以按照用户输入的汉字的结构要素即笔画之间的先后顺序是否满足预先存储的可组合的笔画的先后顺序进行判断,如果不满足,进入步骤203,如果满足,进入步骤204,实际上就是判断用户输入的汉字的笔画结构对应的字符串是否与预先存储的字符串匹配,如果匹配,说明用户输入的汉字的结构序列是有效序列,如果不匹配,说明用户输入的汉字的该结构序列是无效序列。
步骤203、当确定该结构序列为无效结构序列时,显示重新输入汉字的提示信息。
具体的,可以通过终端与用户之间的交互界面显示该提示信息,提示用户重新输入汉字,并返回步骤202。
步骤204、当确定该结构序列为有效结构序列时,根据接收到的结构序列,在保存的汉字库中查找与该结构序列匹配的汉字并显示。
其中,该汉字库预先保存在输入法系统中,并且该汉字库中存储汉字、汉字的结构序列、拼音的对应关系。由于每一个笔画结构对应的字符串组合后,组合后的字符串可能会对应不同的汉字,例如,笔画“一”“丨”“一”组合的字符串对应的汉字可能为“土”或者“士”,因此可能在汉字库中查找到与该结构匹配的多个汉字。
步骤205、按照在汉字库中查找的汉字与该用户输入的汉字的匹配度从高到低的顺序进行排列,并按照该顺序对汉字进行显示。
本步骤中,汉字的匹配度越高说明该汉字的结构与该生字的结构越相似,将匹配度最高的汉字排在第一个位置,作为默认的选中字显示给用户。以笔画“一”“丨”“一”为例,匹配出汉字“土”、“士”、“工”、“去”等汉字,对于“土”、“士”、“工”三个字,笔画结构和“一”“丨”“一”完全匹配,因此这三个字在显示时的先后顺序可以按照默认的顺序进行显示,该默认的顺序是针对笔画结构对应的字符串相同的汉字预先设置的排列顺序,例如:该默认的顺序为“土”、“士”、“工”,也就是说,由于“土”、“士”、“工”与用户输入的汉字的匹配度相同且最高,而很明显,“去”字与“土”、“士”、“工”三个字相比匹配度较低,对在汉字库中查找的与笔画结构和“一”“丨”“一”匹配的汉字的顺序为“土”、“士”、“工”、“去”,并按照该顺序显示给用户。其中,第一个显示的“土”作为默认的选中字。
步骤206、根据用户在显示的汉字中选择的汉字,在该汉字库中查找选择的该汉字的拼音并显示。
本步骤中,当显示的默认的选中字为用户将要进行识别的汉字时,该用户可以通过键盘、鼠标或触摸屏触摸等方式直接确定默认的选中字为将要进行识别的汉字;当显示的默认的选中字不是该用户将要进行识别的汉字时,该用户可以通过键盘、鼠标或触摸屏触摸等方式切换当前的选中字,确定将要进行识别的汉字。在将查找到的用户选择的该汉字的拼音后,显示该汉字的拼音,用户可以通过显示的拼音,对该汉字进行识别。
步骤204中在汉字库中查找与该汉字的结构序列匹配的汉字的同时,也可以查找多个汉字各自的拼音,当步骤206确定选择的汉字后,可直接获得该选择的汉字的拼音,但由于只需要查找到用户输入的将要识别的汉字的拼音即可,因此本步骤中为了节省资源,减少生字识别时间,在确定用户选择的汉字以后,再查找该汉字的拼音。
进一步的,为了使得用户识别汉字更加容易,还可以显示该汉字的同音字,使得对于没有系统学习过拼音的用户也可以通过同音字对汉字进行识别。同音字是指现代汉语里语音相同但字形、意义不同的字,所谓语音相同,一般是指声母和韵母完全相同,声调可以不同,例如,与拼音“pin”对应的同音字包括“拼”、“频”、“品”等,这些同音字的声调可以不同。
步骤207、根据该汉字的拼音,在该汉字库中查找用户选择的该汉字的同音字。
由于该汉字库中存储了汉字、汉字的结构序列、拼音的对应关系,因此可以根据该汉字的拼音反查该汉字的同音字。
进一步的,由于同音字的声调可以不同,因此通过显示汉字的同音字对汉字进行识别时,还可以在该汉字库中只查找与选择的汉字的拼音的声调相同的同音字。
步骤208、在用户选择的该汉字的同音字中,按照获取的各同音字对应的使用频度权重从大到小的顺序对同音字进行排序。
其中,该使用频度权重越大,该使用频度权重对应的同音字越常用,同音字越常用,用户进行识别时越容易。并且,同音字各自的使用频度权重是预先设置的,可以将同音字的使用频度权重对应保存在汉字库中,查找到汉字的同音字后,对应得到同音字的使用频度权重;也可以将同音字和使用频度权重单独保存在输入法系统的缓存中,当查找到汉字的同音字后,在该缓存中查找各同音字的使用频度权重。
步骤209、显示排序后的同音字中前预设数量的同音字。
其中,该预设数量可以根据实际经验和需要进行灵活设置,用户可以通过显示的同音字对汉字进行识别。
如果用户系统学习过拼音,则可以直接通过步骤206显示的拼音识别选择的汉字;如果用户没有系统学习过拼音,也可以通过步骤209显示的同音字识别选择的汉字,由于同音字是按照使用频度进行显示,首先显示的是最常用即容易识别的汉字,因此对于使用频度高的预设数量的同音字,用户在进行识别时相对更加容易。但考虑到用户也可能对于显示的预设数量的同音字也不认识的情况,还可以切换显示的同音字,用户可以通过鼠标、键盘等进行操作触发切换当前显示的同音字的切换请求,当预设数量为一个,输入法系统具体可以按照如下步骤210进行处理;当预设数量为多个,输入法系统具体可以按照如下步骤211进行处理。
步骤210、当接收到同音字切换请求时,在按照使用频度权重从大到小的顺序排序的同音字中,选择比当前显示的同音字的使用频度权重小的下一个同音字作为切换显示的同音字。
步骤211、当接收到同音字切换请求时,在按照使用频度权重从大到小的顺序排序的同音字中,从比当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
本步骤中,以预设数量为2为例,当前显示的同音字为按照使用频度权重从大到小排列的同音字的前2个,当接收到同音字切换请求时,从第3个同音字开始,依次选择第3个、第4个同音字显示给用户。通过显示不同的同音字,进一步简化了汉字识别难度。
进一步的,为了能够更加准确的识别汉字,还可以为显示的同音字标记与选择的汉字的拼音相同的声调。由于拼音中包括声调,在查找到用户选择的汉字的拼音后,可以得到该汉字的声调。根据该汉字的拼音的声调,可以在显示的当前同音字后标记与该汉字拼音相同的声调,具体可以通过数字1、2、3、4表示四个声调阴平、阳平、上声、去声,例如:用户输入的生字为“凹”,声调为阴平,显示的同音字为“奥”,可以在奥字后边加数字1,即显示“奥1”,用来表示“凹”的读音。还可以在查找到同音字后,根据同音字的拼音的声调,在显示同音字时,为同音字标记该同音字的声调。
进一步的,还可以根据用户的朗读请求,对用户选择的汉字进行朗读。具体的,用户可以通过点击显示界面的朗读图标,触发发送朗读请求,输入法系统在接收到对该汉字的朗读请求之后,按照该汉字对应的拼音进行朗读。
进一步的,还可以根据用户的释义显示请求,将获取的用户选择的汉字的释义进行显示。具体的,用户可以通过点击显示界面的释义图标,触发发送释义显示请求,输入法系统在接收到对该汉字的朗读请求之后,在该汉字库中查找该汉字对应的释义并显示该释义。获取该汉字的释义并不限于上述在汉字库中查找的方式,也可以通过在网络环境下,通过在网络中查找该汉字的释义并显示该释义。
本发明实施例中的汉字识别方法主要是针对汉字,对于其他类似的语种文字也可以采用与本发明实施例中的方法进行识别。
通过本发明上述实施例1提供的方法,使用输入法系统在汉字库中查找汉字的拼音,将该汉字的拼音显示给用户,由于输入法是各种终端上一个常用的应用,在无网络环境下也可以使用,不需要安装其他的应用,使得汉字识别过程简单,提高了识别速度。并且,将汉字的同音字也显示给用户,使得对于没有系统学习过拼音的用户也可以通过同音字对该汉字进行识别,简化了汉字识别难度,提高了用户体验。
实施例2:
基于同一发明构思,根据本发明上述实施例提供的汉字识别方法,相应地,本发明实施例2还提供了一种汉字识别装置,其结构示意图如图3所示,具体包括:
第一查找单元301,用于根据接收到的结构序列,在保存的汉字库中查找与所述结构序列匹配的汉字并显示,所述汉字库中存储汉字、汉字的结构序列、拼音的对应关系;
第二查找单元302,用于根据用户在显示的所述汉字中选择的汉字,在所述汉字库中查找选择的所述汉字的拼音;
第一显示单元303,用于显示所述汉字的拼音。
进一步的,上述装置,还包括:
第三查找单元304,用于在所述汉字库中查找选择的所述汉字的同音字;
第二显示单元305,用于显示预设数量的所述同音字。
进一步的,上述装置,还包括:
第四查找单元306,用于在所述汉字库中查找与选择的所述汉字的拼音的声调相同的同音字;
第三显示单元307,用于显示预设数量的所述同音字。
所述第二显示单元305或第三显示单元307,具体用于在选择的所述汉字对应的同音字中,按照获取的各同音字对应的使用频度从大到小的顺序对所述同音字进行排序;显示排序后的同音字中前预设数量的同音字。
进一步的,上述装置,还包括:
同音字切换单元308,用于当接收到同音字切换请求时,在按照使用频度从大到小的顺序排序的所述同音字中,从当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
进一步的,上述装置,还包括:
第一标记单元309,用于根据选择的所述汉字的拼音的声调,为显示的同音字标记与该汉字拼音相同的声调;或者
第二标记单元310,用于根据显示的同音字的拼音的声调,为显示的同音字标记该同音字的声调。
进一步的,上述装置,还包括:
朗读单元311,用于当接收到对选择的所述汉字的朗读请求时,按照该汉字对应的拼音进行朗读;或者
释义显示单元312,用于当接收到对选择的所述汉字的释义显示请求时,将获取的该汉字的释义进行显示。
进一步的,上述装置,还包括:
拼音识别模式切换单元313,用于在所述汉字库中查找选择的所述汉字的拼音之前,接收汉字拼音识别模式的切换请求并切换到汉字拼音识别模式。
本发明实施例2还提供了一种终端,包括:
本发明实施例2中提供的上述汉字识别装置。
上述各单元的功能可对应于图1或图2所示流程中的相应处理步骤,在此不再赘述。
综上所述,本发明实施例提供的方案,包括:输入法系统根据接收到的结构序列,在保存的汉字库中查找与该结构序列匹配的汉字并,该汉字库中存储汉字、汉字的结构序列、拼音的对应关系;根据接收的在显示的汉字中选择的汉字,在该汉字库中查找选择的汉字的拼音;显示该汉字的拼音。采用本发明提供的上述方案,相比现有技术,简化了汉字识别过程,提高了识别速度。
本申请的实施例所提供的汉字识别装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要汉字识别装置具有上述功能,都应该在本申请的保护范围之内。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (17)

1.一种汉字识别方法,其特征在于,包括:
输入法系统根据接收到的结构序列,在保存的汉字库中查找与所述结构序列匹配的汉字并显示,所述汉字库中存储汉字、汉字的结构序列、拼音的对应关系;
根据用户在显示的所述汉字中选择的汉字,在所述汉字库中查找选择的所述汉字的拼音;
显示所述汉字的拼音。
2.如权利要求1所述的方法,其特征在于,还包括:
在所述汉字库中查找选择的所述汉字的同音字;
显示预设数量的所述同音字。
3.如权利要求1所述的方法,其特征在于,还包括:
在所述汉字库中查找与选择的所述汉字的拼音的声调相同的同音字;
显示预设数量的所述同音字。
4.如权利要求2或3所述的方法,其特征在于,显示预设数量的所述同音字,具体包括:
在选择的所述汉字对应的同音字中,按照获取的各同音字对应的使用频度从大到小的顺序对所述同音字进行排序;
显示排序后的同音字中前预设数量的同音字。
5.如权利要求4所述的方法,其特征在于,还包括:
当接收到同音字切换请求时,在按照使用频度从大到小的顺序排序的所述同音字中,从当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
6.如权利要求2所述的方法,其特征在于,还包括:
根据选择的所述汉字的拼音的声调,为显示的同音字标记与该汉字拼音相同的声调;或者
根据显示的同音字的拼音的声调,为显示的同音字标记该同音字的声调。
7.如权利要求1所述的方法,其特征在于,还包括:
当接收到对选择的所述汉字的朗读请求时,按照该汉字对应的拼音进行朗读;或者
当接收到对选择的所述汉字的释义显示请求时,将获取的该汉字的释义进行显示。
8.如权利要求1所述的方法,其特征在于,在所述汉字库中查找选择的所述汉字的拼音之前,还包括:
接收汉字拼音识别模式的切换请求并切换到汉字拼音识别模式。
9.一种汉字识别装置,其特征在于,包括:
第一查找单元,用于根据接收到的结构序列,在保存的汉字库中查找与所述结构序列匹配的汉字并显示,所述汉字库中存储汉字、汉字的结构序列、拼音的对应关系;
第二查找单元,用于根据用户在显示的所述汉字中选择的汉字,在所述汉字库中查找选择的所述汉字的拼音;
第一显示单元,用于显示所述汉字的拼音。
10.如权利要求9所述的装置,其特征在于,还包括:
第三查找单元,用于在所述汉字库中查找选择的所述汉字的同音字;
第二显示单元,用于显示预设数量的所述同音字。
11.如权利要求9所述的装置,其特征在于,还包括:
第四查找单元,用于在所述汉字库中查找与选择的所述汉字的拼音的声调相同的同音字;
第三显示单元,用于显示预设数量的所述同音字。
12.如权利要求10或11所述的装置,其特征在于,所述第二显示单元或第三显示单元,具体用于在选择的所述汉字对应的同音字中,按照获取的各同音字对应的使用频度从大到小的顺序对所述同音字进行排序;显示排序后的同音字中前预设数量的同音字。
13.如权利要求12所述的装置,其特征在于,还包括:
同音字切换单元,用于当接收到同音字切换请求时,在按照使用频度从大到小的顺序排序的所述同音字中,从当前显示的同音字之后的同音字开始,依次选择预设数量的同音字作为切换显示的同音字。
14.如权利要求10所述的装置,其特征在于,还包括:
第一标记单元,用于根据选择的所述汉字的拼音的声调,为显示的同音字标记与该汉字拼音相同的声调;或者
第二标记单元,用于根据显示的同音字的拼音的声调,为显示的同音字标记该同音字的声调。
15.如权利要求9所述的装置,其特征在于,还包括:
朗读单元,用于当接收到对选择的所述汉字的朗读请求时,按照该汉字对应的拼音进行朗读;或者
释义显示单元,用于当接收到对选择的所述汉字的释义显示请求时,将获取的该汉字的释义进行显示。
16.如权利要求9所述的装置,其特征在于,还包括:
拼音识别模式切换单元,用于在所述汉字库中查找选择的所述汉字的拼音之前,接收汉字拼音识别模式的切换请求并切换到汉字拼音识别模式。
17.一种终端,其特征在于,包括:
如权利要求9-16任一所述的装置。
CN201410441700.4A 2014-09-01 2014-09-01 一种汉字识别方法、装置及终端 Pending CN105404624A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410441700.4A CN105404624A (zh) 2014-09-01 2014-09-01 一种汉字识别方法、装置及终端
PCT/CN2015/088212 WO2016034066A1 (zh) 2014-09-01 2015-08-27 一种汉字识别方法、装置及终端
HK16109823.6A HK1221791A1 (zh) 2014-09-01 2016-08-17 種漢字識別方法、裝置及終端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410441700.4A CN105404624A (zh) 2014-09-01 2014-09-01 一种汉字识别方法、装置及终端

Publications (1)

Publication Number Publication Date
CN105404624A true CN105404624A (zh) 2016-03-16

Family

ID=55439119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410441700.4A Pending CN105404624A (zh) 2014-09-01 2014-09-01 一种汉字识别方法、装置及终端

Country Status (3)

Country Link
CN (1) CN105404624A (zh)
HK (1) HK1221791A1 (zh)
WO (1) WO2016034066A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354752A (zh) * 2016-08-16 2017-01-25 广东小天才科技有限公司 一种文字查找方法及装置、电子设备
CN113407038A (zh) * 2020-03-16 2021-09-17 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN113486655A (zh) * 2021-06-11 2021-10-08 陈展天 一种有利于远程教育的汉字注音识别法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570180B (zh) * 2016-11-10 2020-05-22 北京百度网讯科技有限公司 基于人工智能的语音搜索方法及装置
CN111737288B (zh) * 2020-06-05 2023-07-25 富途网络科技(深圳)有限公司 搜索控制方法、装置、终端设备、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1841277A (zh) * 2005-03-30 2006-10-04 英华达(上海)电子有限公司 一种在手写输入法中显示汉字拼音的方法
CN101625595A (zh) * 2008-07-07 2010-01-13 英华达(南京)科技有限公司 一种可快速输入中文的手持装置及其中文拼音输入方法
CN102609455A (zh) * 2012-01-12 2012-07-25 北京中科大洋科技发展股份有限公司 一种实现汉语同音字检索的方法
CN103853479A (zh) * 2012-12-06 2014-06-11 袁恒祺 结合手写输入法的双写式汉字识别装置及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1690930A (zh) * 2004-04-30 2005-11-02 英华达(上海)电子有限公司 提供中文输入法的反查功能的装置与方法
CN1786882A (zh) * 2004-12-07 2006-06-14 魏有 五笔全能输入法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1841277A (zh) * 2005-03-30 2006-10-04 英华达(上海)电子有限公司 一种在手写输入法中显示汉字拼音的方法
CN101625595A (zh) * 2008-07-07 2010-01-13 英华达(南京)科技有限公司 一种可快速输入中文的手持装置及其中文拼音输入方法
CN102609455A (zh) * 2012-01-12 2012-07-25 北京中科大洋科技发展股份有限公司 一种实现汉语同音字检索的方法
CN103853479A (zh) * 2012-12-06 2014-06-11 袁恒祺 结合手写输入法的双写式汉字识别装置及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354752A (zh) * 2016-08-16 2017-01-25 广东小天才科技有限公司 一种文字查找方法及装置、电子设备
CN113407038A (zh) * 2020-03-16 2021-09-17 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN113486655A (zh) * 2021-06-11 2021-10-08 陈展天 一种有利于远程教育的汉字注音识别法

Also Published As

Publication number Publication date
WO2016034066A1 (zh) 2016-03-10
HK1221791A1 (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
US9026428B2 (en) Text/character input system, such as for use with touch screens on mobile phones
US10210154B2 (en) Input method editor having a secondary language mode
US7719521B2 (en) Navigational interface providing auxiliary character support for mobile and wearable computers
KR100377432B1 (ko) 문자/단어 생성 방법 및 이를 이용한 정보통신 서비스 방법
CN100587660C (zh) 一种手写字符预测识别的方法和装置
CN102449579B (zh) 一体式中文字输入方法
US8077974B2 (en) Compact stylus-based input technique for indic scripts
KR100790710B1 (ko) 합성 글자들의 자동 완성을 위한 방법 및 장치
CN111052064B (zh) 自动提供基于手势的自动完成建议的方法及其电子设备
KR102249054B1 (ko) 온스크린 키보드에 대한 빠른 작업
US9009624B2 (en) Keyboard gestures for character string replacement
WO2015088669A1 (en) Multiple character input with a single selection
KR102240663B1 (ko) 필기 입력의 진행 디스플레이
CN103026318A (zh) 输入法编辑器
CN102422245A (zh) 输入法编辑器
CN105404624A (zh) 一种汉字识别方法、装置及终端
KR20140128884A (ko) 대체 점수를 사용하여 사전-내에-없는 문자열들의 제스처 키보드 입력
EP3241105B1 (en) Suggestion selection during continuous gesture input
KR20150083173A (ko) 휴대 단말의 텍스트 편집 장치 및 그 방법
CN104133815A (zh) 输入和搜索的方法及系统
CN102375655B (zh) 一种字母输入的处理方法及系统
CN106293115B (zh) 信息处理方法及电子设备
JP2016207036A (ja) 支援装置、支援方法及び支援プログラム
Kyaw Thu Positional prediction: consonant cluster prediction text entry method for Burmese (Myanmar Language)
JP2007241681A (ja) 声調及び筆画によって入力文字を決定する携帯端末及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1221791

Country of ref document: HK

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160316

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1221791

Country of ref document: HK