CN101644961A - 一种编码串排序的方法、装置和一种文字输入方法、装置 - Google Patents

一种编码串排序的方法、装置和一种文字输入方法、装置 Download PDF

Info

Publication number
CN101644961A
CN101644961A CN200910091212A CN200910091212A CN101644961A CN 101644961 A CN101644961 A CN 101644961A CN 200910091212 A CN200910091212 A CN 200910091212A CN 200910091212 A CN200910091212 A CN 200910091212A CN 101644961 A CN101644961 A CN 101644961A
Authority
CN
China
Prior art keywords
coded strings
speech
word frequency
strings
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910091212A
Other languages
English (en)
Inventor
包越千
王天一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN200910091212A priority Critical patent/CN101644961A/zh
Publication of CN101644961A publication Critical patent/CN101644961A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种编码串排序方法和一种文字输入方法,所述文字输入方法可以包括:接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;接收用户对编码串的选择;接收用户对候选项的选择,输出对应文字。本发明可以依据较长编码串中各个词间的二元或多元关系,以及词频或者音节频,以从多条可能的编码串中选出最优结果并实现最优排序;从而减少由于切分、重码等引发的需要用户多次手动选取所需编码串而带来的多余操作。

Description

一种编码串排序的方法、装置和一种文字输入方法、装置
技术领域
本发明涉及输入法技术领域,特别是涉及一种编码串排序的方法、装置和一种文字输入方法和装置。
背景技术
随着手机等移动终端设备的广泛应用,利用数字键盘进行文字输入的情况也越来越多。例如,手机上的中文拼音输入法就是一个典型的应用。在用户连续输入代表拼音的数字串时,该输入法的数字转拼音功能模块,可将其转换为所有拼音串组合的若干可能中的一种。
但是由于手机中通常使用包含0-9的10键位数字键盘,并且通常采用8键位的字母键设定方案,具体的,是将a-z的26个字母映射到2-9数字键上,每个数字键都对应着3~4个字母。所以,在进行拼音输入时,一般均会出现较高几率的重码音节。例如,在手机的数字键盘上输入(4-2-6),相应的会有如下的拼音供用户进行选择:“hao”、“gan”、“gao”、“han”。假设用户需要输入“搞”字,则需要从“hao”、“gan”、“gao”、“han”中选择“gao”,再从“搞、高、告、稿”等候选词中选择“搞”上屏输出。也就是说在输入拼音串的时候,现有的输入法系统把所有在此数字串下的对应可能拼音组合罗列出来,按照字母顺序来进行排列。
公开号为“CN101344888”的中国专利公开文献,公布了一种对上述音节(字母组合)进行排序的方法,即可以按照一定顺序对上述数字键组合对应的多个重码音节(例如,“hao”、“gan”、“gao”、“han”)进行优化排序,以使适合当前用户需求的音节排序在前,减少用户的选择操作,提高用户的输入效率和使用体验。然而,由于单个字词的输入本身效率就比较低,所以用户期望能够实现数字键盘上的短句或者词组输入。
但是对于数字串较长的情况下,例如短句或者词组输入,上述现有技术就无法达到较佳的效果了。参照图1,示出了现有技术的常用处理方案。
步骤101、接收用户输入的数字串。例如“934539843”
步骤102、对数字串按照拼音规则进行切分,得出可能的拼音串;
步骤103、依据切分得到的拼音串检索词表,取得匹配的最长词;
步骤104、显示拼音串。
具体的,步骤104中的一种显示方式为仅仅显示所匹配的最长词的拼音串,例如,对于数字串“934539843”仅仅显示拼音串“weile”、“weike”,后续字母不再切分显示。步骤104的另外一种显示方式为,显示所匹配的最长词的拼音串以及余下的拼音串,例如,对于数字串“934539843”,显示拼音串“weile-wuge”、“weile-zuie”、“weike-wuge”、“weike-zuie”等等;其中,余下的拼音串可以通过字母序进行排列输出。
上述输入方案在短句或者词组输入中,其缺点是非常明显的,由于显示给用户选择的拼音串(音节)都是首先按照所匹配的最长词来排序的,而用户短句或者词组输入的整体转换方案却并不一定会恰好对应最长词的排序,因此,用户需要多次的选择操作才能找到自己所需的短句或者词组。例如,对于前述的数字串“934539843”,用户是希望输入“为了阻隔”,其对应的拼音串为“weilezuge”,在现有技术的实际输入过程中,该拼音串“weilezuge”的排序可能非常靠后,导致用户需要作出多次的点击选择操作,大大降低用户在短句或者词组输入中的效率和体验。实际上,对于数字串“934539843”,其对应的拼音串就至少有8个,如果对于更长的数字串,则会有更多的可能拼音串,让用户从数量众多的拼音串中选择自己所需的,事实上是不可接受的。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够在短句或词组输入中,实现更佳的拼音串排序,以帮助用户能够更快的选择所需文字,更快的完成输入。
发明内容
本发明所要解决的技术问题是提供一种编码串排序的方法、装置,以便在短句或者词组输入中,对展示给用户的编码串进行优化排序,以帮助用户能够更快的选择所需文字,更快的完成输入。
相应的,本发明还提供了一种文字输入方法和装置,通过对展示给用户的编码串进行优化排序,可以帮助用户能够更快的选择所需文字,更快的完成输入。
为了解决上述问题,本发明公开了一种编码串排序的方法,包括:接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述词频参数包括各词频的加权和或者加权倒数和。
优选的,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:计算各个编码串的第一词频参数,对编码串进行粗筛;依据词间的N元关系对编码串进行二次筛选;计算筛选后的各个编码串的第二词频参数,依据所述第二词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述排序输出包括筛选得到最佳结果进行展示。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:将按键组合转换为编码串;依据词间的N元关系和/或词频,对各编码串进行筛选排序;或者,依据词间的N元关系和/或词频,对按键组合进行排序;然后将按键组合转换为编码串依序显示输出。
依据本发明的另一实施例,还公开了一种文字输入方法,包括:接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;接收用户对编码串的选择;接收用户对候选项的选择,输出对应文字。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述词频参数包括各词频的加权和或者加权倒数和。
优选的,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:计算各个编码串的第一词频参数,对编码串进行粗筛;依据词间的N元关系对编码串进行二次筛选;计算各个编码串的第二词频参数,依据所述第二词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:将按键组合转换为编码串;依据词间的N元关系和/或词频,对各编码串进行筛选排序;或者,依据词间的N元关系和/或词频,对按键组合进行排序;然后将按键组合转换为编码串依序显示输出。
依据本发明的另一实施例,还公开了一种编码串排序的装置,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2。
优选的,所述排序处理单元可以包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
优选的,所述排序输出包括筛选得到最佳结果进行展示。
优选的,所述排序处理单元,用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
依据本发明的另一实施例,还公开了一种文字输入装置,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
编码串选择单元,用于接收用户对编码串的选择;
候选项选择单元,用于接收用户对候选项的选择,输出对应文字。
优选的,所述排序处理单元可以包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
优选的,所述排序处理单元,用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
依据本发明的另一实施例,还公开了一种文字输入方法,包括:接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;接收用户对候选项的选择,输出对应文字。
优选的,所述依据词间的N元关系和/或词频进行编码串排序包括:依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
优选的,所述编码串、候选项的输出展现步骤包括:输出排序最靠前的一编码串,展现该编码串的对应文字候选项;或者,输出排序最靠前的一编码串,展现针对排序靠前的多个编码串的对应文字候选项;或者,输出排序靠前的多个编码串,展现排序最靠前的一编码串的对应文字候选项;或者,输出排序靠前的多个编码串,展现针对所述多个编码串的对应文字候选项。
依据本发明的另一实施例,还公开了一种文字输入装置,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
候选项展现单元,用于输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;
候选项选择单元,用于接收用户对候选项的选择,输出对应文字。
优选的,所述候选项展现单元具体用于:输出排序最靠前的一编码串,展现该编码串的对应文字候选项;或者,输出排序最靠前的一编码串,展现针对排序靠前的多个编码串的对应文字候选项;或者,输出排序靠前的多个编码串,展现排序最靠前的一编码串的对应文字候选项;或者,输出排序靠前的多个编码串,展现针对所述多个编码串的对应文字候选项。
优选的,所述排序处理单元可以包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
优选的,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
与现有技术相比,本发明具有以下优点:
本发明针对短句或者词组输入,对展示给用户的编码串进行了优化排序,以便将当前用户所需的编码串尽量靠前显示,以减少用户的选择操作,提高效率。也就是说,在本发明的优选实施例中,可以依据较长编码串中各个词间的二元或多元关系,以及词频或者音节频对所述短句或者词组输入中较长的编码串进行优化排序和筛选,以从多条可能的编码串中选出最优结果并实现最优排序。本发明可以减少由于切分、重码等引发的需要用户多次手动选取所需编码串而带来的多余(不必要)操作。
附图说明
图1是现有技术一种数字键盘拼音输入的技术方案流程图;
图2是本发明一种编码串排序的方法实施例的步骤流程图;
图3是本发明以数字键盘的拼音输入为例的一个优选实施例的步骤流程图;
图4是本发明的一个具体例子的步骤流程图;
图5是本发明一种文字输入方法的实施例的步骤流程图;
图6是本发明一种编码串排序的装置实施例的结构框图;
图7是本发明一种文字输入装置的实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例主要应用在键位少、重码率高的输入硬件上,比如手机小键盘、家用游戏机手柄、电视遥控器,或者其他可以输入文字的非全键盘上。这些非全键盘的特征之一就是其上面存在至少一个按键,其可能对应两个或者两个以上的字符编码,这种非全键盘的一个典型应用就是数字键盘。
以具有数字键盘的手机拼音中文输入为例,通常的数字键盘以2-9的数字键对应a-z的26个字母,每个数字键对应3~4个字母,因此,当用户点击一系列按键组合时,其所对应的拼音重码是非常多的,从而导致用户按下一系列按键后,还需要对重码的拼音串进行选择,然后再选择该拼音串所对应的汉字候选项。尤其当用户进行短句或者词组输入时,由于输入的按键比较多,形成的重码拼音串也会非常多,从而会需要用户进行更复杂或更多次的选择操作,会严重降低用户的输入效率。本发明就是希望针对这种由多词拼音串构成的较长拼音串进行优化排序,减少用户的选择操作(包括翻页操作),提高用户输入效率。
需要说明的是,为了简单起见,上面的举例以及后面实施例均采用拼音串作为编码串的一个典型示例进行说明,但是对于输入汉字存在重码的五笔、自然码、奔腾码、双拼等各种编码均属于本发明的应用范围。虽然各种编码的转换规则不同,但是具体应用过程是基本相似的,因此,本发明在后面的描述中仅仅以拼音编码为例进行说明,其他编码参照即可。
进一步,对于非汉字输入环境,只要存在重码的编码串需要用户选择,就可以应用本发明。例如,当采用罗马音标方式输入日文时,用户点击一系列按键后,需要用户对转换得到的编码串进行选择,之后才可以从所选的编码串对应日文候选项中选择得到所需文字。其中应用本发明对所展现的编码串进行优化排序,就可以提高用户输入日文的效率。
参照图2,示出了本发明一种编码串排序的方法实施例,具体可以包括:
步骤201、接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
步骤202、依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词(短句或者词组输入的典型特征);所述N大于等于2。
以数字键盘的拼音输入为例,则步骤201中用户输入的就是一系列数字按键,然后通过步骤202的优化排序,将数字串所对应的各个拼音串展现给用户。排序靠前的就是通过词间的N元关系和/或词频计算得到的比较适合用户所需的,以减少用户的选择操作。需要说明的是,本发明实施例中的词,包括单字的词“我”、“打”等等,也包括多字词“欢迎”、“误操作”、“一模一样”等等。
例如,对于数字串“934539843”而言,其对应的拼音串包括“weile-wuge”、“weile-zuie”、“weike-wuge”、“weike-zuie”、“weile-zuge”、“weile-zuhe”、“weike-zuge”、“weike-zuhe”等等,可能还会包括“weike-zuid”或“weike-zuif”等其他切分转换结果。本发明就是通过这些拼音串所对应的词与词之间的N元关系,和/或词频对这些拼音串排序,以便在大概率情况下,将用户所需的拼音串靠前排序,即从概率上提高排序在前的拼音串满足用户需要的可能性,提高普通用户的输入效率。
具体的,例如针对拼音串“weile-zuie”,依据其所对应的词“为了”及“罪恶”的二元关系,和/或“为了”及“罪恶”的词频计算得到一个排序参考值;然后同理针对上述其他的拼音串“weike-wuge”、“weike-zuie”、“weile-zuge”、“weile-zuhe”、“weike-zuge”、“weike-zuhe”也进行处理,进而按照排序参考值进行排序展现上述的6个拼音串。在本发明的一个优选实施例中,所述排序也可以是:筛选得到了一个最佳的结果展现给用户。
其中,需要说明的是,以二元关系为例,由于拼音串“weile”可能还对应“喂了”、“围了”、“为乐”等词,所以在二元关系中还需要考虑这些词与“罪恶”的二元关系,因为用户连续输入就是希望输入短句或者词组,即存在二元关系或者二元关系数值较高的结果是用户所需的可能性较大。
对于单独采用词频进行排序的情况,可以采用拼音串“weile”对应的“喂了”、“围了”、“为乐”等词和拼音串“zuie”对应的“罪恶”的词频累积计算得到拼音串“weile-zuie”的一个排序参考值。当然,简单的,也可以采用拼音串“weile”对应的多个词中词频最高的一个,和拼音串“zuie”对应的多个词中词频最高的一个,累积计算得到拼音串“weile-zuie”的一个排序参考值。
上面的示例中采用二元关系进行了说明,实际上对于更长的拼音串,采用多个词之间的多元关系也可以实现拼音串的筛选排序;并且有可能得到更佳的拼音串筛选排序,使得结果更趋向于用户所需。但是,由于三元及以上关系的判断,步骤复杂,对于现有计算资源而言成本相对较高,需要在实际应用中由技术人员具体确定如何应用。例如,将本发明应用于网络输入法,用户输入数字串之后,具体的N元计算过程由服务器端完成,然后返回结果给用户端即可。
另外,上述的示例中采用了词频进行筛选排序,在本发明的其他实施例中,也可以采用编码段频(例如,拼音输入中的音节频)来实现本发明的基本构思,即一个编码串可以切分为多个分别与词相对应的编码段。实际上,通常情况下,编码段频(音节频)也是通过词频获得的。例如,一个简单实现,可以将词频作为与所述字词对应的编码的使用频率,对于一个编码对应多个词的情况,则可以将相应的多个词的词频累加,以累加后的词频作为该编码段的频率。
进一步,对于词之间的二元关系,在本发明的其他实施例中,也可以采用编码段(音节)间的二元关系加以替代。例如,将编码所对应的词间的二元关系或者二元关系的累加作为相应编码段(音节)间的二元关系。
作为一种简单组合,依据词间的N元关系和/或编码段频,对所述按键组合对应的编码串进行排序输出也完全是可行的,其中,所述编码串包括至少两个与词相对应的编码段。其他组合方式,在此不再赘述。
事实上,通过编码段频、编码间的二元关系进行编码串的筛选排序,也仍然是依据词间的二元关系、词频进行的,所以在步骤202中,简单概括为“依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出”。
参照图3,示出了本发明以数字键盘的拼音输入为例的一个优选实施例,具体可以包括:
步骤301、接收用户输入的数字串;
步骤302、对数字串按照拼音规则进行切分;
具体的,可以以全拼音优先,尽量将数字串切分到最末尾;如果无法切分至最末尾,则可以保证尽量少的音节个数。
步骤303、检索词表,对拼音串进行筛选;
通过检索词表,从步骤302所切分得到的拼音串中挑选出尽量可以组成长词的所有拼音串(音节组合);对于在同样切分方式下不能组词的拼音串,可以丢弃(即被筛选掉),因为无法组成词语的切分方式通常情况下不是用户所需的合理结果,因此,可以丢弃。
步骤304、检索词与词的二元关系表,对拼音串进行筛选;
对于前述步骤得到的多个拼音串,以词与词的二元关系进行筛选。具体的例如,对于拼音串对应文字串中的词与词的二元关系数值较低,则可以直接舍弃该拼音串。再例如,对于转换后具有多种组词方式的拼音串,则可以选择同样切分状态下二元关系表中数值较高的词,舍弃同样切分状态下二元关系数值较低的词。
对同样切分方式中二元关系相等(或同时存在或均不存在)的切分方式可以不做处理,即同时保留相应的拼音串。
步骤305、依据词频对步骤304所筛选出的拼音串进行进一步筛选,将筛选结果排序展示给用户,以供选择。其中,排序的一个典型情况就是,得到一个最优结果进行展示,而其他拼音串则忽略即可。
在通常的实现中,可以通过词频来计算步骤304所筛选出的各拼音串的词频参数,进而依据所述词频参数对所述按键组合对应的各个拼音串进行排序。例如,对于一个拼音串,以其对应文字串中各个词的词频进行计算,得到针对该拼音串的词频参数。或者,针对一个拼音串,以其切分后针对词的各个编码段的频率进行计算,得到针对该拼音串的词频参数。
对于词频参数的计算,可以通过词频的加权和或者加权倒数和的方式实现。对于加权倒数和而言,选择加权倒数和最小的作为最优结果输出展示,因为词频越高,词数越少,则得到的加权倒数和最小。当然,也可以采用简单词频累加或者词频倒数累加的方式,本发明对此并不加以限定,只要能够体现总体的使用频率顺序即可。
从上面对本发明的实施例描述可以看出,如果用户输入的数字串在词库中存在完全匹配的结果,则直接输出长词即可,而当用户输入的数字串在词库中没有完全匹配的结果(即用户希望短句或者词组输入),则意味着用户输入的该较长的数字串存在可能的多个切分组合方式,而其中只有一个是用户希望得到的,本发明就是通过N元关系、词频从这些切分组合方式中获得最适合当前用户的,以减少用户的人为选择更改拼音串的操作,减少不必要的按键次数,从而提高用户的输入效率。
参照图4,示出了本发明的一个具体例子,包括:
步骤401、输入数字串。假设用户依次点击了“96546842692674264”。
步骤402、对上述数字串按拼音规则进行切分。
切分规则为全拼音优先,尽量切到最末尾。如果无法切至最末尾,则保证尽量少的拼音音节个数。此例子中,可能的全拼形式切分结果有“WoJinTianWanQiang”、“WoJinTianZaoShang”、“WoJinTiaoWanShang”、“WoLinTiaoWanShang”、“WoJinTianYaoShang”、“WoJinTianWanShaMi”“WoJinTianWanShang”等。
现有技术一般会直接给出上面的所有拼音串作为候选,由用户自行选择,或者现有技术仅仅能够单个字词的输入,即直接给出“Wo”而不关心后续按键。
步骤403、通过检索词表,挑选尽量可以组成长词的所有拼音串组合,并抛弃掉同样切分方式下不能组词的拼音串。
例如“WoJinTianWanShang”和“WoLinTiaoYaoShang”,切分点一致,但前者可在词表分析表中检索到两条结果,即“今天”“晚上”2个词语,或“握紧”、“晚上”2个词语,但后者在词表分析表中检索不到结果,即后者无法组成词语,可见“WoLinTiaoYaoShang”并不是我们期待的合理结果,应该被放弃掉。又如“WoJinTianWanShaMi”,可在词表分析中检索到“今天”、“沙弥”2个词语或“握紧”、“沙弥”,也应该保留。
这样,经过本步的筛选,留下了以下5个拼音串“WoJinTianWanShang”、“WoJinTianZaoShang”、“WoJinTiaoWanShang”、“WoJinTianWanShaMi”、“WoJinTianWanQiang”。
步骤404、对前一步的结果,检索词与词的二元关系表,对拼音串作进一步筛选。例如,选择同样切分状态下二元关系表中数值较高的词,舍弃同样切分状态下二元关系数值较低的词。
这里为方便说明,二元关系使用布尔值型(真或假)。如果使用不同数值表示二元关系的相关程度也可以。
如以上一步结果中的“WoJinTianWanShang”和“WoJinTiaoWanShang”对象为例:
“WoJinTianWanShang”在上一步中,得到“WoJin(握紧)Tian(天)WanShang(晚上)”或“Wo(我)JinTian(今天)WanShang(晚上)”两种形式的可能结果。
但根据第一种形式,符合WoJin的词如“握紧”等与符合Tian的词如“天”等,及符合Tian的词如“天”等与符合WanShang的词如“晚上”等词,在二元关系表中检索,均无二元关系;而根据第二种形式,符合Wo的词如“我”与符合JinTian的词如“今天”,及符合JinTian的词如“今天”与符合WanShang的词“晚上”之间均有二元联系。如此,则保留该拼音串“WoJinTianWanShang”,并保留具有二元关系的词“我”、“今天”、“晚上”。
对于“WoJinTiaoWanShang”,在上一步中,得到“WoJin(握紧)Tiao(条)WanShang(晚上)”或“Wo(我)JinTiao(金条)WanShang(晚上)”两种形式的可能结果。
但根据第一种形式,符合WoJin的词如“握紧”等与符合Tiao的词如“条”等,及符合Tiao的词如“条”等与符合WanShang的词如“晚上”等词,在二元关系表中检索,均无二元关系;而根据第二种形式,符合Wo的词如“我”等与符合JinTiao的词如“金条”等,及符合JinTiao的词如“金条”等与符合WanShang的词“晚上”等词之间也没有二元联系。
通过上述的二元关系比较环节可以得出:“WoJinTianWanShang”比“WoJinTiaoWanShang”得分更高,很可能更符合语言使用的习惯。因此,可以抛弃“WoJinTiaoWanShang”这个结果。
同理抛弃“WoJinTianWanQiang”。
如果同样切分方式中两个拼音串的二元关系比较结果相等,如“WoJinTianWanShang”和“WoJinTianZaoShang”,属于相邻词两两之间都存在二元关系,则可以将相应的两个拼音串全部保留。二元关系比较结果相等的情况可以包括两个拼音串中相邻词两两判断后的结果相同等,例如:两个拼音串都不存在二元关系,或者,两个拼音串存在数量、位置相同的二元关系。
本步骤处理后留下的拼音串为以下3个:“WoJinTianWanShang”、“WoJinTianZaoShang”、“WoJinTianWanShaMi”。
对于不同切分方式下的拼音串排序,采用二元关系比较得到的结果可能不尽准确,例如,对以同一拼音串,一种切分得到两个音节,另一种切分得到四个音节,而相邻二元关系在数量上的不一致会对比较过程造成障碍,影响结果合理性。因此,在本发明的一个优选实施例中,仅仅针对同一切分方式下的各个拼音串进行二元关系的比较。例如,“WoJinTianZaoShang”、“WoJinTianWanShaMi”就属于不同的切分方式,则可以通过下一步的词频计算进行筛选排序,无需对于属于不同切分方式的拼音串进行二元关系的比较。
需要说明的是,在本发明的另一实施例中,如果拼音串“WoJinTianWanShaMi”不存在二元关系,则也可以在步骤404中抛弃。
而在本发明的另一实施例中,即使拼音串“WoJinTianWanShaMi”不存在二元关系,也可以不在本步骤进行筛选,而通过步骤405的词频计算进行筛选排序。即仅仅通过二元关系来筛选排序同一切分方式下的不同拼音串,而不对切分方式本身进行筛选,因为某些情况下,虽然二元关系不强,但是由于新词、口语等使用习惯,可能该切分方式也是用户所需的,需要作进一步的判断。
步骤405、对上一步的结果,计算并比较每一个拼音串中各词频的加权倒数和,选出数值最小的拼音串进行展示。
通过加权倒数和可以选择出词频最高、词数最少的拼音串来。如Wo(我)JinTian(今天)WanShang(晚上)的切分方式,因其词数少,词频高,在同等情况下,比Wo(我)JinTian(今天)Wan(晚)ShaMi(沙弥)这种组合方式的加权倒数和更小。
同样,因为在词频表中WanShang(晚上)比ZaoShang(早上)的词频更高,则经过步骤405后得到的最优结果为“WoJinTianWanShang”。
总之,从图4所示例子中,可以看出,本发明通过拼音切分、词表分析、二元关系以及词频分析等技术组合,可以实现基于词频、二元关系对拼音串的排序处理,减少用户的手动选择操作。
上面给出的是本发明最优的一个实施例,在本发明的另一个实施例中,步骤404也可以省略,即仅仅通过计算各个拼音串的词频参数(例如加权倒数和)也可以实现对多个拼音串的排序,虽然效果上要稍差于图4的实施例,但是也可以在一定程度上提升短句或词组输入中的数字转拼音的效果,比简单的字母排序要好很多。
在本发明的另一个实施例中,省略步骤404,在步骤405中,计算词频参数时,仅仅计算具有二元关系的词的词频。例如,对于拼音串“WoJinTianWanShang”,仅仅以具有二元关系的词“我”、“今天”、“晚上”计算该拼音串的词频参数,而对于词“握紧”、“天”、“晚上”不纳入计算范畴。这样在一定程度上借鉴了二元关系,故也可以较好的提升短句或词组输入中的数字转拼音的效果。
在本发明的另一个实施例中,也可以省略词频参数计算的步骤405,可以直接依据二元关系数值的大小,对多个拼音串进行排序,这样,虽然效果上要稍差于图4的实施例,但是也可以在一定程度上提升短句或词组输入中的数字转拼音的效果。
在本发明的另一个实施例中,还可以采用二元关系和词频的多步混合筛选过程,例如:
首先,计算各个编码串的第一词频参数,对编码串进行粗筛;
其次,依据词间的N元关系对编码串进行二次筛选;或者,依据词间的N元关系对编码串以及编码串所对应的词进行筛选;
再者,计算各个编码串的第二词频参数,依据所述第二词频参数对所述按键组合对应的各个编码串进行排序。
当然,具体如何将“二元关系和词频”进行一系列的混合,本发明对此并不加以限定,本领域技术人员依据需要组合即可。
在图4所示的示例中,首先将数字串转换为编码串,然后依据词间的N元关系和/或词频,对各编码串进行筛选排序。然而,在本发明的另一个实施例中,也可以首先依据词间的N元关系和/或词频,对数字串相对应的各种可能的切分组合进行排序,然后再将数字串按照筛选排序后的切分组合转换为编码串依序显示输出。上面两种实现方式的核心构思都是一样的,只不过是数字-编码转换步骤的执行顺序有所变化而已。下面给出一个简单例子,例如,
首先,输入数字串;
其次,通过检索数字编码的字、词表,挑选尽量符合“最长完整匹配”的数字串切分组合。其中,最长完整匹配”是指切分出的数字编码段均完整对应字词,并且编码尽量长;
然后,选出二元关系满足一定条件的数字串切分组合和相应字词;
再者,计算筛选后的每一数字串切分组合中各词频的加权倒数和,选择最优结果;
最后,将数字串按最优结果的切分方式及拼音编码,转换为拼音串输出。
参照图5,示出了本发明一种文字输入方法的实施例,包括:
步骤501、接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
步骤502、依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
步骤503、接收用户对编码串的选择;
一种实现方式是,当用户选择一编码串后,则展现该编码串的对应文字候选项。
另一种实现方式是,对于第一个编码串,则在展现编码串的同时展现其对应文字候选项,无须用户选择。对于其他编码串,则当用户选择后,再展现其对应文字候选项。
步骤504、接收用户对候选项的选择,输出对应文字。
上述实施例的核心仍然是对编码串的优化排序或筛选,由于在前面的各个实施例中已经详细介绍过程,因此,在此不再赘述,相关之处请参见即可。图5所示实施例的一个典型应用就是通过手机数字键盘拼音输入短句或者词组,从前面的描述易于看出,本发明可以显著改善该输入过程。
需要说明的是,步骤503和步骤504中用户对编码串和候选项的选择可以集成为一个操作,例如,所展示的当前编码串就是用户所需的,则用户可以直接选择所需的候选项输出,即用户对候选项的选择操作就包括了对当前编码串的选择和所需候选项的选择。
参照图6,示出了本发明一种编码串排序的装置实施例,包括:
接口单元601,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元602,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2。优选的,所述排序输出的一个典型应用就是筛选得到一个最佳结果进行展示。
在本发明的一个优选实施例中,所述排序处理单元602可以包括以下两个模块:第一处理模块6021,用于依据词间的N元关系对编码串进行筛选;第二处理模块6022,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
在本发明的另一个优选实施例中,所述排序处理单元602所包括的两个模块也可以稍有变化:第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
在本发明的另一个优选实施例中,所述排序处理单元602所包括的两个模块还可以变化为:第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
需要说明的是,上面的三个实现方式也仅仅是对如何应用词间的N元关系和/或词频进行筛选排序的几个示例,本发明无法一一陈述所有组合,本领域技术人员所基于上述思想进行的变化,都属于本发明的核心构思。
在本发明的另一优选实施例中,所述排序处理单元,也可以用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
参照图7,示出了本发明一种文字输入装置的实施例,包括:
接口单元701,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元702,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;优选的,所述排序输出的一个典型应用就是筛选得到最佳结果进行展示;
编码串选择单元703,用于接收用户对编码串的选择;
候选项选择单元704,用于接收用户对候选项的选择,输出对应文字。
所述排序处理单元702的内部具体模块,第一处理模块7021和第二处理模块7022,也可以采用图6实施例中的构成,在此不再赘述。在本发明的另一优选实施例中,所述排序处理单元702,也可以用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
前面的实施例描述指出,本发明的编码串排序可以直接输出最佳结果。如果在文字输入中应用该方案,则在大多数情况下,可以省略用户选择编码串的步骤,因为应用本发明后,最佳编码串在很大概率上就是用户所需的,无须用户的编码串选择操作;当然,在某些特殊情况下,用户也可以通过选择操作获得其他编码串进行输入。具体的,在本发明的另一优选实施例中,文字输入过程可以包括:
步骤a、接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
步骤b、依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
步骤c、输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;
步骤d、接收用户对候选项的选择,输出对应文字。
其中,步骤c中的所述展现编码串对应文字候选项的步骤的进一步具体实现可以为:展现排序最靠前的一编码串的对应文字候选项。即在本实施例中,由于直接给出了最佳的编码串,并给出了该编码串的候选项,因此,用户可以直接选择相应的候选项输出,而无须进行编码串的选择操作。当然,如果展示的该最佳编码串并不是用户所需的,则用户也可以通过前述实施例的方式,选择其他编码串进行输入。
或者,步骤c中的所述展现编码串对应文字候选项的步骤的进一步具体实现可以为:展现多个分别针对排序靠前的不同编码串的对应文字候选项。即在本实施例中,不仅可以给出针对最佳编码串的对应文字候选项,同时,还会给出针对排序比较靠前的几个编码串的对应文字候选项;从而可以进一步提高用户直接选择文字候选项的几率,避免编码串的选择操作。例如,针对图4的例子,可以展示的候选项包括“我今天晚上”和“我今天早上”,当编码串“wojintianwanshang”不是用户所需时,用户可以直接选择另一编码串的候选项“我今天早上”进行输出,避免了额外的编码串选择操作。
即,在输出排序最靠前的一个编码串时,可以仅仅展现针对该编码串的对应文字候选项,也可以展示针对排序靠前的多个编码串的对应文字候选项;当输出排序靠前的多个编码串时,可以展示针对排序靠前的多个编码串的对应文字候选项,也可以仅仅展现针对排序最靠前的一个编码串的对应文字候选项。总之,本发明对此并不需要加以限制。
相应的装置实施例可以具体包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
候选项展现单元,用于输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;
候选项选择单元,用于接收用户对候选项的选择,输出对应文字。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种编码串排序的方法和装置,以及一种文字输入的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (32)

1、一种编码串排序的方法,其特征在于,包括:
接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2。
2、如权利要求1所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
3、如权利要求2所述的方法,其特征在于,所述词频参数包括各词频的加权和或者加权倒数和。
4、如权利要求2所述的方法,其特征在于,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
5、如权利要求1所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
计算各个编码串的第一词频参数,对编码串进行粗筛;
依据词间的N元关系对编码串进行二次筛选;
计算筛选后的各个编码串的第二词频参数,依据所述第二词频参数对所述按键组合对应的各个编码串进行排序。
6、如权利要求1所述的方法,其特征在于,所述排序输出包括筛选得到最佳结果进行展示。
7、如权利要求1所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
8、如权利要求1所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
将按键组合转换为编码串;依据词间的N元关系和/或词频,对各编码串进行筛选排序;
或者,依据词间的N元关系和/或词频,对按键组合进行排序;然后将按键组合转换为编码串依序显示输出。
9、一种文字输入方法,其特征在于,包括:
接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
接收用户对编码串的选择;
接收用户对候选项的选择,输出对应文字。
10、如权利要求9所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
11、如权利要求10所述的方法,其特征在于,所述词频参数包括各词频的加权和或者加权倒数和。
12、如权利要求10所述的方法,其特征在于,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
13、如权利要求9所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
计算各个编码串的第一词频参数,对编码串进行粗筛;
依据词间的N元关系对编码串进行二次筛选;
计算各个编码串的第二词频参数,依据所述第二词频参数对所述按键组合对应的各个编码串进行排序。
14、如权利要求9所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
15、如权利要求9所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
将按键组合转换为编码串;依据词间的N元关系和/或词频,对各编码串进行筛选排序;
或者,依据词间的N元关系和/或词频,对按键组合进行排序;然后将按键组合转换为编码串依序显示输出。
16、一种编码串排序的装置,其特征在于,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2。
17、如权利要求16所述的装置,其特征在于,所述排序处理单元包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;
第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;
第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;
第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
18、如权利要求17所述的装置,其特征在于,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
19、如权利要求16所述的装置,其特征在于,所述排序输出包括筛选得到最佳结果进行展示。
20、如权利要求17所述的装置,其特征在于,所述排序处理单元,用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
21、一种文字输入装置,其特征在于,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行排序输出;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
编码串选择单元,用于接收用户对编码串的选择;
候选项选择单元,用于接收用户对候选项的选择,输出对应文字。
22、如权利要求21所述的装置,其特征在于,所述排序处理单元包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;
第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;
第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;
第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
23、如权利要求22所述的装置,其特征在于,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
24、如权利要求21所述的装置,其特征在于,所述排序处理单元,用于依据词间的N元关系和/或由词频得到的编码段频,对所述按键组合对应的编码串进行排序输出;所述编码串包括至少两个与词相对应的编码段。
25、一种文字输入方法,其特征在于,包括:
接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;
接收用户对候选项的选择,输出对应文字。
26、如权利要求25所述的方法,其特征在于,所述依据词间的N元关系和/或词频进行编码串排序包括:
依据词间的N元关系对编码串进行筛选;计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,依据词间的N元关系对编码串所转换对应的文字串进行筛选;依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
27、如权利要求26所述的方法,其特征在于,仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
28、如权利要求25所述的方法,其特征在于,所述编码串、候选项的输出展现步骤包括:
输出排序最靠前的一编码串,展现该编码串的对应文字候选项;
或者,输出排序最靠前的一编码串,展现针对排序靠前的多个编码串的对应文字候选项;
或者,输出排序靠前的多个编码串,展现排序最靠前的一编码串的对应文字候选项;
或者,输出排序靠前的多个编码串,展现针对所述多个编码串的对应文字候选项。
29、一种文字输入装置,其特征在于,包括:
接口单元,用于接收用户输入的按键组合;其中,至少有一个按键对应两个或两个以上的编码字符;
排序处理单元,用于依据词间的N元关系和/或词频,对所述按键组合对应的各个编码串进行筛选排序;其中,与所述编码串相对应的文字串包括至少两个词;所述N大于等于2;
候选项展现单元,用于输出排序靠前的一个或者多个编码串,并展现编码串的对应文字候选项;
候选项选择单元,用于接收用户对候选项的选择,输出对应文字。
30、如权利要求29所述的装置,其特征在于,所述候选项展现单元具体用于:
输出排序最靠前的一编码串,展现该编码串的对应文字候选项;
或者,输出排序最靠前的一编码串,展现针对排序靠前的多个编码串的对应文字候选项;
或者,输出排序靠前的多个编码串,展现排序最靠前的一编码串的对应文字候选项;
或者,输出排序靠前的多个编码串,展现针对所述多个编码串的对应文字候选项。
31、如权利要求29所述的装置,其特征在于,所述排序处理单元包括:
第一处理模块,用于依据词间的N元关系对编码串进行筛选;
第二处理模块,用于计算筛选后的各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,依据词间的N元关系对编码串以及编码串所转换对应的文字串进行筛选;
第二处理模块,用于针对筛选后的编码串,依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序;
或者,
第一处理模块,用于依据词间的N元关系对编码串所转换对应的文字串进行筛选;
第二处理模块,用于依据筛选后的文字串所包含的词计算各个编码串的词频参数,依据所述词频参数对所述按键组合对应的各个编码串进行排序。
32、如权利要求31所述的装置,其特征在于,所述第一处理模块仅针对同一切分方式下的编码串和/或相对应的文字串,依据词间N元关系进行筛选。
CN200910091212A 2009-08-14 2009-08-14 一种编码串排序的方法、装置和一种文字输入方法、装置 Pending CN101644961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910091212A CN101644961A (zh) 2009-08-14 2009-08-14 一种编码串排序的方法、装置和一种文字输入方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910091212A CN101644961A (zh) 2009-08-14 2009-08-14 一种编码串排序的方法、装置和一种文字输入方法、装置

Publications (1)

Publication Number Publication Date
CN101644961A true CN101644961A (zh) 2010-02-10

Family

ID=41656870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910091212A Pending CN101644961A (zh) 2009-08-14 2009-08-14 一种编码串排序的方法、装置和一种文字输入方法、装置

Country Status (1)

Country Link
CN (1) CN101644961A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944079A (zh) * 2010-09-16 2011-01-12 西安双捷科技有限责任公司 数据输入的处理方法及装置
CN102541873A (zh) * 2010-12-16 2012-07-04 金蝶软件(中国)有限公司 一种编码的排序方法及系统
CN102768611A (zh) * 2012-03-05 2012-11-07 联想(北京)有限公司 一种信息的显示方法及装置
CN103034340A (zh) * 2012-12-04 2013-04-10 广东国笔科技股份有限公司 词组快速匹配输入方法及系统
US9372568B2 (en) 2012-03-05 2016-06-21 Beijing Lenovo Software Ltd. Method, device and system for interacting
CN107422872A (zh) * 2016-05-24 2017-12-01 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109426358A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109725736A (zh) * 2017-10-27 2019-05-07 北京搜狗科技发展有限公司 一种候选排序方法、装置及电子设备
CN109901725A (zh) * 2017-12-07 2019-06-18 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN110221704A (zh) * 2018-03-01 2019-09-10 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944079A (zh) * 2010-09-16 2011-01-12 西安双捷科技有限责任公司 数据输入的处理方法及装置
CN102541873A (zh) * 2010-12-16 2012-07-04 金蝶软件(中国)有限公司 一种编码的排序方法及系统
CN102541873B (zh) * 2010-12-16 2013-10-23 金蝶软件(中国)有限公司 一种编码的排序方法及系统
US9372568B2 (en) 2012-03-05 2016-06-21 Beijing Lenovo Software Ltd. Method, device and system for interacting
CN102768611A (zh) * 2012-03-05 2012-11-07 联想(北京)有限公司 一种信息的显示方法及装置
CN102768611B (zh) * 2012-03-05 2015-04-29 联想(北京)有限公司 一种信息的显示方法及装置
CN103034340A (zh) * 2012-12-04 2013-04-10 广东国笔科技股份有限公司 词组快速匹配输入方法及系统
CN107422872A (zh) * 2016-05-24 2017-12-01 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN107422872B (zh) * 2016-05-24 2021-11-30 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109426358A (zh) * 2017-09-01 2019-03-05 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN109725736A (zh) * 2017-10-27 2019-05-07 北京搜狗科技发展有限公司 一种候选排序方法、装置及电子设备
CN109901725A (zh) * 2017-12-07 2019-06-18 北京搜狗科技发展有限公司 一种拼音串切分方法和装置
CN110221704A (zh) * 2018-03-01 2019-09-10 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置

Similar Documents

Publication Publication Date Title
CN101644961A (zh) 一种编码串排序的方法、装置和一种文字输入方法、装置
US20080281582A1 (en) Input system for mobile search and method therefor
CN102455845B (zh) 一种文字输入方法和装置
KR20040068031A (ko) 키패드에서의 알파벳 입력장치 및 그 방법
CN101324806B (zh) 用于移动搜寻的输入系统及其方法
CN101720457A (zh) 采用时序歧义编码的解码方法以及采用该方法的装置
CN101303628B (zh) 一种利用数字键盘进行字词输入的方法和装置
CN101256448A (zh) 输入法实现方法及装置、客户端
CN1928860A (zh) 用于校正按键错误的方法、搜索引擎和搜索系统
US8339291B2 (en) Alphabet input device and alphabet recognition system in small-sized keypad
CN101661335A (zh) 一种为嵌入式系统设计的中文输入方法及系统
CN1239041C (zh) 移动通信终端设备的日语输入装置和方法
CN1097766C (zh) 汉字五键输入法
CN1009226B (zh) 调声韵类式拼音输入键盘及输入法
CN1510554B (zh) 一种可嵌入应用的汉字输入法
CN101114196B (zh) 输入中文短语的方法和设备
CN100451929C (zh) 汉字后续字输入方法
CN1367420A (zh) 数码键盘中文输入方法及其键位例
CN101344888A (zh) 生成编码频、输入字符编码的方法、装置和输入文字装置
KR100661457B1 (ko) 이동통신 단말기의 알파벳 입력 시스템
CN102147666B (zh) 一种输入法输出文字信息的处理方法及装置
CN100489745C (zh) 多语言文字和数字输入的系统及方法
CN101105724B (zh) 一种拼音简化、字母数字化汉字混合输入法及键盘
CN101498965B (zh) 一种数字键盘汉字拼音输入方法
KR100858176B1 (ko) 키패드에서의 알파벳 입력장치 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100210