CN101876853B - 拼音输入方法及装置 - Google Patents

拼音输入方法及装置 Download PDF

Info

Publication number
CN101876853B
CN101876853B CN2009100827691A CN200910082769A CN101876853B CN 101876853 B CN101876853 B CN 101876853B CN 2009100827691 A CN2009100827691 A CN 2009100827691A CN 200910082769 A CN200910082769 A CN 200910082769A CN 101876853 B CN101876853 B CN 101876853B
Authority
CN
China
Prior art keywords
user
fuzzy sound
input
entry
pinyin string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100827691A
Other languages
English (en)
Other versions
CN101876853A (zh
Inventor
杨磊
周志华
张军
何立涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN2009100827691A priority Critical patent/CN101876853B/zh
Publication of CN101876853A publication Critical patent/CN101876853A/zh
Application granted granted Critical
Publication of CN101876853B publication Critical patent/CN101876853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种拼音输入方法及装置,所述方法包括:对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;将所述模糊音选项推荐给用户;如果用户接受了所述模糊音选项,则启用所述模糊音选项对应的模糊音规则。从而可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,方便用户使用。

Description

拼音输入方法及装置
技术领域
本发明涉及数据处理技术,具体涉及一种拼音输入方法及装置。
背景技术
在使用拼音输入汉字时,部分用户由于难以区分汉语拼音方案中的前鼻音和后鼻音、鼻音和舌边音,使用标准的拼音会遇到障碍。为了方便这些用户的使用,输入法通常会允许用户以非标准的方式使用输入法,例如用拼音hen输入“横”,这称为模糊音。
模糊音的使用会导致候选项的增加,因而对于能够正确区分这两个音节的用户,同时将“很”和“横”列出,会干扰其选字操作,降低输入效率。因此,输入法需要根据用户的输入习惯,针对不同的用户分别决定是否需要启用模糊音。
很多中文拼音输入法都提供模糊音功能。由于不同的用户具有不同的需求,因此通常提供选项让用户决定是否启用模糊音。例如,提供以下表1所示选项:
Figure GDA00001629362100011
表1
由于不同用户对不同的音节区分能力并不相同,因此大多数输入法还会进一步提供更加细致的选项,让用户指定更详细的模糊音规则。例如,提供以下表2所示选项:
表2
当用户选择了对应的模糊音规则后,输入法就会根据用户的设置启用模糊音。
这种方法主要存在以下两方面的问题:
首先,其依赖于用户的主动设置,即用户必须主动打开输入法的配置界面,通过手工配置,才能够对模糊音选项进行设置,使用上不够灵活方便。
其次,关于模糊音规则设置的粒度太粗。由于需要用户手工设置,因此无法一次性给用户提供太多规则。而且,由于模糊音的个性化非常强,例如,某些用户不区分“hui”和“fei”;某些用户将“eng”发音作“ong”,这些规则不能在上述设置中均得到体现。
发明内容
本发明实施例提供一种拼音输入方法及装置,可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,方便用户的使用。
为此,本发明实施例提供如下技术方案:
一种拼音输入方法,包括:
对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;所述模糊音选项用于指示对应的模糊音规则是否启用;所述模糊音规则用于对拼音串进行解析;
确定所述模糊音选项对应的模糊音规则是否已启用;
如果未启用,则将所述模糊音选项推荐给用户;
如果用户接受了推荐的模糊音选项,则启用所述模糊音选项对应的模糊音规则。
一种拼音输入装置,包括:
解析单元,用于对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;所述模糊音选项用于指示对应的模糊音规则是否启用;所述模糊音规则用于对拼音串进行解析;
确定单元,用于确定所述模糊音选项对应的模糊音规则是否已启用,如果未启用,则通知推荐单元;
所述推荐单元,用于根据所述确定单元的通知将所述模糊音选项推荐给用户;
启用单元,用于在用户接受了推荐的模糊音选项后,启用所述模糊音选项对应的模糊音规则。
本发明实施例提供的拼音输入方法及装置,通过对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;将所述模糊音选项推荐给用户;如果用户接受了推荐的模糊音选项,则启用所述模糊音选项对应的模糊音规则。从而可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,无需用户的主动设置,方便了用户的使用。而且,由于不需要用户手工修改设置,不仅解决了用户由于不了解模糊音而无法使用模糊音的问题,而且还可以更加精确地匹配用户对模糊音的个性化需求。
附图说明
图1是本发明实施例拼音输入方法的流程图;
图2是本发明实施例拼音输入方法中对用户输入的拼音串进行解析的流程图;
图3是本发明实施例拼音输入装置的一种结构示意图;
图4是本发明实施例拼音输入装置的另一种结构示意图;
图5是本发明实施例中解析单元的一种结构示意图;
图6是本发明实施例中解析单元的另一种结构示意图;
图7是本发明实施例中解析子单元的一种优选结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例拼音输入方法及装置,在用户拼音输入过程中,对用户输入的拼音串进行解析,根据解析结果如果确定用户可能需要模糊音时,直接向用户推荐相应的模糊音选项,如果用户接受了推荐的模糊音选项,则启用所述模糊音选项对应的模糊音规则。
如图1所示,是本发明实施例拼音输入方法的流程图,包括以下步骤:
步骤101,对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项。
对于用户输入的拼音串,通常会以正常方式对其进行解析,但某些情况下可能会得到异常的解析结果,例如不能匹配已有的词条,或者匹配的已有的词条的数量很少,或者所匹配的词条的词频很低等。同时,如果以模糊音的方式对用户输入的拼音串进行解析,可能会得到更优的结果。如果出现这种情况,则可以确定用户可能需要模糊音。
例如,用户输入“longmin”,而系统词库中并不存在这样的词条。即使按照预定算法进行组词,所得到的组词结果“龙民”或者“龙敏”的词频也非常低。但是,如果尝试启用模糊音规则“long→nong”,则可将其解析为常用词“农民”。这里“农”的标准发音应该是nong而不是long。但对于不能区分鼻音和舌边音的用户,常将其写作long。据此可以确定,用户真实的输入意图可能就是“农民”。
但为了保证这一判断结果的准确性,可以由用户进一步进行确认,因此可以将其尝试推荐给用户,具体采用何种推荐方式将在后面详细描述。
步骤102,将所述模糊音选项推荐给用户。
具体地,可以采用多种不同的展现方式将所述模糊音选项推荐给用户。比如:
(1)通过消息对话框(比如MessageBox)提示用户是否启用所述模糊音规则。
(2)通过气泡提示用户是否启用所述模糊音规则。气泡和MessageBox的区别在于,如果用户不确认,则在MessageBox方式下无法进行后续操作。因此,气泡方式更加友好。
(3)通过输入法界面展现与所述模糊音选项对应的信息提示。例如,在输入法界面显示文字提示、和/或图标提示、和/或按钮提示等等。用户可以对其进行操作,以决定是否启用模糊音规则。比如,如果用户点击了提示内容,则表示用户接受了系统推荐的模糊音规则。和独立的气泡方式相比,这种方式不占用额外的桌面空间,比独立的气泡提示更友好。
(4)将根据所述模糊音选项得到的词条作为候选项插入到根据用户输入的拼音串得到的词条候选列表中显示。这种方式完全不改变用户的操作习惯,比前面几种方式更加自然。
例如,用户输入“longmin”,在输入法界面中,将“农民”作为一个特殊选项推荐给用户。同时,在该词条的“农”字后而给出“农”的标准读音以提示用户。
如果用户接受了该选项,则确认用户需要启动模糊音规则“long→nong”。这样,当用户下次输入时,就会直接给出模糊音结果。
由于大多数用户已经习惯于从词条候选列表中选择选项,因此这种方式更加直观、方便。
需要说明的是,上述各种展现方式可以独立使用,也可以选择其中的任意几种组合使用。
向用户提示的内容,即所述模糊音选项,可以直接用文字的方式进行描述,比如:“模糊音:long→nong”;也可以直接给出由所述模糊音规则得到的候选词条,在这种情况下,可以通过注音等方式提示用户,表示该词条是一个模糊音选项,比如:“农(nong)民”。
步骤103,如果用户接受了推荐的模糊音选项,则启用所述模糊音选项对应的模糊音规则。
当用户确认了所推荐的模糊音选项,对于直接以选项方式的展现,可以将该选项同时显示在显示屏上,比如通过气泡或者MessageBox告知用户“您已经启用了模糊音long→nong”。
为了提高推荐的准确率,在启用所述模糊音选项对应的模糊音规则时,仍然可以再次向用户确认是否启用该模糊音规则。比如通过气泡或者MessageBox提示用户“您是否要启用模糊音long→nong?”。当然,除此之外,也可以考察用户接受该模糊音选项的次数,当用户多次接受再启用相应的模糊音规则。
这样,在用户后续拼音输入中,就可以使所述模糊音规则参与对用户输入的拼音串的解析。也就是说,在模糊音规则启用后,在所述用户下次使用该拼音输入方法时,所述模糊音规则将进入正常的转换流程。
进一步地,为了减少对用户正常拼音输入的影响,在上述流程的步骤102之前,还可以包括以下步骤:确定所述模糊音选项对应的模糊音规则是否已启用;如果未启用,再执行所述将所述模糊音选项推荐给用户的步骤。
需要说明的是,本发明实施例中所述的模糊音规则,是指模糊音映射关系的一种集合,是一次性启用或禁用的单位。该集合中可以包含一条或多条组合的模糊音映射关系,具体可以根据需要来确定,比如根据对模糊音规则粒度的需求来确定。例如:
long→nong可以是一条单独的规则。对该规则的直观描述是:用户会将nong发音作long,启用该规则并不会打开其他的模糊音映射关系。
long←→nong可以是一条规则。该规则的直观描述是:用户会将long和nong混淆使用,启用该规则会同时打开两条映射关系:long→nong,以及反向的nong→long。
l→n可以是一条规则。该规则直观上的描述是:用户会将鼻音n发作舌边音l,启用该规则会一次性打开多条映射关系:la→na,lan→nan,lang→nang,le→ne,len→nen,等等。
l←→n可以是一条规则。该规则直观上的描述是:用户会将鼻音n和舌边音l混淆使用,启用该规则除了会打开上述la→na,lan→nan,lang→nang,le→ne,len→nen,等映射关系外,还会打开反向的映射关系:na→la,nan→lan,nang→lang,ne→le,nen→len,等等。
还需要说明的是,由于所述模糊音规则不一定对应具体的直观描述,任何映射关系独立的或者组合起来都可以称为规则。因此,不同模糊音规则可以有重叠,例如上述例子中的多条规则可以共存;另外,不同模糊音规则之间也可能存在包含关系。因此可以采取这样的策略:如果某模糊音规则中的多数映射关系已经通过其他模糊音规则启用,则可以直接启动该模糊音规则中的其他备选映射关系。
为了对所述模糊音规则便于管理,在具体实现时,可以为模糊音规则设定一个备选库和一个启用库。其中,启用库中保存了所有当前已经启用的模糊音规则,而备选库中保存了所有用户可能用到但没有确认,需要通过推荐的方式进一步确认的模糊音规则。
当然,还可以有其他管理方式,比如,为每条模糊音规则设定一个状态:备选,或者启用,分别对应于上述两个库中的规则。进一步地,还可以设定一个禁用状态,用于表示均不在上述两个库中的模糊音规则。
另外,还可以采用其他管理方式,比如,仅指定启用库和禁用库,而将同时出现在两个库中的模糊音规则认为是备选状态。
原则上,一项模糊音规则只能同时在一个库中出现,如果同时在多个库中出现,也可以通过优先级的方式来决定该模糊音规则究竟处于什么状态。另外,还可以允许用户手动调整模糊音状态,也就是说,允许某些状态由用户手工指定状态或者修改状态或者通过其他方式修改。当然,也可以允许用户手工禁用某些模糊音选项的情况。
由于任何形式的推荐都可能对用户的正常使用构成影响,因此推荐策略中的参数也可以随着推荐次数、用户打字数量、用户使用输入法的时间、用户接受推荐的次数或者比例等信息进行调整。也就是说,将所述模糊音选项推荐给用户之前,确定历史记录的以下任意一项或多项信息是否满足预定条件:推荐次数、用户输入拼音串的数量、用户输入的时间、用户接受推荐的次数或比例;如果满足,再执行将所述模糊音选项推荐给用户的操作。否则,不执行将所述模糊音选项推荐给用户的操作,以减少对用户正常使用产生的影响。
在上述步骤101中提到,对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项。
具体地,可以通过两个不同的解析过程并比较两次解析的结果,确定相应的模糊音规则。
如图2所示,是该过程的一种实现流程图,包括以下步骤:
步骤201,对用户输入的拼音串进行正常解析,得到第一次解析结果。
对用户输入的拼音串进行正常解析,不仅包括使用标准拼音方式对用户输入的拼音串进行解析,还包括使用已经启用的模糊音规则对用户输入的拼音串进行解析。例如,如果已经启用了模糊音规则“long→nong”,则当用户输入“longmin”时将直接得到“农民”。为了使用户知道其使用了非标准的拼音,可以对通过模糊音规则得到的选项进行特殊提示,但并不影响用户的正常输入。
步骤202,判断所述第一次解析结果是否异常;如果是,则执行步骤203;否则,执行步骤206。
其中,所述在第一次解析结果异常可以是以下一种或多种情况:
●匹配出的词条词频很低;例如,低于某一阈值。
●匹配出的词条数量很少;例如,小于某一阈值。极端情况,没有匹配词。
●调用特定的算法进行组词,组词词频很低。
当然,也可以是其他情况,本发明实施例对此并不做限定。
步骤203,启用全部或部分模糊音规则对所述拼音串重新进行解析,得到第二次解析结果。
需要说明的是,此时的启用只是为了确定用户是否需要使用模糊音而进行的临时使用,在用户后续拼音输入中,这些启用的模糊音规则并不参与对用户输入的拼音串的解析。
步骤204,判断所述第二次解析结果是否优于所述第一次解析结果。如果是,则执行步骤205;否则,执行步骤206。
相应地,根据解析采用的方法的不同,判断方式也会有所不同。比如,可以是以下一种多种情况:
●匹配出的词条词频提高了。例如,词频的差或者商高于某一阈值。
●匹配出的词条变多了。例如,原来没有匹配词,现在有;或者匹配更多的词条。
●调用特定的组词算法,组词词频提高了。例如,组词词频的差或者商高于某一阈值。
当然,也可以是其他情况,本发明实施例对此并不做限定:
步骤205,将所述第二次解析结果使用的相关模糊音选项作为需要向用户推荐的模糊音选项。
步骤206,输出正常解析结果。
需要说明的是,上述所述对用户输入的拼音串进行解析可以是以下任意一种多种解析方式:
(1)对用户输入的拼音串进行词条匹配,得到相匹配的词条。具体地,对词条的匹配可以是全匹配、也可以是部分匹配,或者可以根据应用环境的一些信息动态确定是全匹配还是部分匹配。例如,用户输入了“longqideshanqiu”,虽然并不能直接命中任何词条,但并不能认为用户使用了模糊音规则long→nong,因为拼音片段“longqi”可以对应词条“隆起”。
因此,在本发明实施例中,可以采用以下几种匹配方式:对用户输入的拼音串进行全匹配,确定与所述拼音串完全相匹配的词条;或者,对用户输入的拼音串进行部分匹配,确定与所述拼音串部分相匹配的词条;或者,动态确定对用户输入的拼音串进行全匹配和/或部分匹配,确定与所述拼音串完合和/或部分相匹配的词条。
(2)对用户输入的拼音串按照预定算法进行组词,得到组词后的词条。
另外,为了适应不同的应用环境,上面所述词条可以包括以下任意一种或多种:系统词条、用户词条、用户手工导入的词条、通过特定文本训练获得的词条、通过服务器推送获得的词条。对于这些来自不同环境及主体的词条,在解析中可以统一考虑,也可以分别考虑,或者只考虑一部分而忽略其他部分,以降低实现的复杂度,并提高匹配准确度。
例如在第一次解析中,只要命中用户词条就认为解析正常;只对系统词条考虑词频;不考虑其他来源的词条。又如在第二次解析中,只要命中了用户词条就认为需要推荐;如果命中了系统词条则需要进一步考虑词频是否提高;不考虑其他来源的词条等。
当然,本发明实施例在对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项时,并不仅限于图2所示解析过程。为了减少总的计算量,还可以通过一次解析过程来确定。具体地,对用户输入的拼音串按照正常拼音方式和所有备选的模糊音规则进行解析,并在解析过程中记录解析结果用到的模糊音选项,这样,在所述解析结果用到的模糊音选项满足预置规则时,就可以将该模糊音选项作为需要向用户推荐的模糊音选项。所述预置规则可以根据实际应用需要来确定,比如:
●匹配出的词条词频高于某一阈值。
●匹配出的词条数量高于某一阈值。
●调用特定的算法进行组词,组词词频高于某一阈值。
当然,也可以是其他情况,本发明实施例对此并不做限定。例如,启用备选模糊音规则“long→nong”,则“longmin”可以一次性解析得到使用了该备选模糊音规则的选项“农民”。如果没有其他完全匹配的选项,就可以判定需要推荐该模糊音规则。由此可见,本发明实施例拼音输入方法,通过对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;将所述模糊音选项推荐给用户;如果用户接受了所述模糊音选项,则启用所述模糊音选项对应的模糊音规则。从而可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,无需用户的主动设置,方便了用户的使用。而且,由于不需要用户手工修改设置,不仅解决了用户由于不了解模糊音而无法使用模糊音的问题,而且还可以更加精确地匹配用户对模糊音的个性化需求。
另外,对于用户在击键时,经常会产生击键错误的情况,例如,用户经常将字母序列ng错误地输入为gn,本发明实施例拼音输入方法同样可以适用,从而能够方便快捷地为用户提供准确的解析结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如:ROM/RAM、磁碟、光盘等。
相应地,本发明实施例还提供一种拼音输入装置,如图3所示,是该装置的一种结构示意图。
在该实施例中,所述装置包括:解析单元301、推荐单元302、启用单元303。其中,
解析单元301,用于对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;
推荐单元302,用于将所述模糊音选项推荐给用户;
启用单元303,用于在用户接受了推荐的模糊音选项后,启用所述模糊音选项对应的模糊音规则。
进一步地,为了减少对用户正常拼音输入的影响,在本发明实施例拼音输入装置中,还可进一步包括确定单元304,用于在所述推荐单元302将所述模糊音选项推荐给用户之前,确定所述模糊音选项对应的模糊音规则是否已启用,如果未启用,则通知所述推荐单元302将所述模糊音选项推荐给用户。
在本发明实施例中,所述推荐单元302具体可以有多种实现方式。比如,所述推荐单元302可以包括以下任意一种或多种子单元(未图示):对话框提示子单元、气泡提示子单元、界面提示子单元、列表提示子单元。其中:
所述对话框提示子单元,用于通过消息对话框提示用户是否启用所述模糊音选项;
所述气泡提示子单元,用于通过气泡提示用户是否启用所述模糊音选项;
所述界面提示子单元,用于通过输入法界面展现与所述模糊音选项对应的信息提示;
所述列表提示子单元,用于将根据所述模糊音选项得到的词条作为候选项插入到根据用户输入的拼音串得到的词条候选列表中显示。
上述各子单元具体地提示方式在可参照前面本发明实施例输入方法中的描述,在此不再一一赘述。
本发明实施例拼音输入装置,通过对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;将所述模糊音选项推荐给用户;如果用户接受了所述模糊音选项,则启用所述模糊音选项对应的模糊音规则。从而可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,无需用户的主动设置,方便了用户的使用。而且,由于不需要用户手工修改设置,不仅解决了用户由于不了解模糊音而无法使用模糊音的问题,而且还可以更加精确地匹配用户对模糊音的个性化需求。
如图4所示,是本发明实施例拼音输入装置的另一种结构示意图。
图4所示实施例与图3所示实施例的区别在于,在该实施例中,所述装置不仅包括:解析单元401、推荐单元402、启用单元403和确定单元404,而且还进一步包括条件检测单元405。其中,解析单元401、推荐单元402、启用单元403和确定单元404与图3所示的相应单元相同;条件检测单元405用于在所述推荐单元402将所述模糊音选项推荐给用户之前,确定历史记录的以下任意一项或多项信息是否满足预定条件:推荐次数、用户输入拼音串的数量、用户输入的时间、用户接受推荐的次数或比例;如果满足,则通过所述推荐单元执行将所述模糊音选项推荐给用户的操作。
这样,本发明实施例的拼音输入装置,不仅可以根据用户的输入习惯,自动为用户提供相适应的模糊音功能,满足用户对模糊音的个性化需求,而且可以进一步减少对用户正常使用的影响。
需要说明的是,在图3和图4所示本发明实施例拼音输入装置中,还可进一步包括:模糊音添加单元(未图示),用于在用户后续拼音输入中,将所述模糊音规则提供给所述解析单元参与对用户输入的拼音串的解析。
在本发明实施例中,所述解析单元可以有多种实现方式。
如图5所示,是所述解析单元的一种结构示意图。
在该实施例中,所述解析单元包括:第一解析子单元501、比较子单元502和第一确定子单元503。其中:
第一解析子单元501,用于对用户输入的拼音串进行正常解析,得到第一次解析结果,并在所述第一次解析结果异常时,启用全部或部分模糊音规则对所述拼音串重新进行解析,得到第二次解析结果。详细过程可参照前面本发明实施例输入方法中的描述,在此不再赘述。
比较子单元502,用于比较所述第二次解析结果和所述第一次解析结果;
确定子单元503,用于在所述比较子单元502比较得到所述第二次解析结果优于所述第一次解析结果时,将所述第二次解析结果使用的相关模糊音选项作为需要向用户推荐的模糊音选项。
如图6所示,是所述解析单元的另一种结构示意图。
在该实施例中,所述解析单元包括:第二解析子单元601、记录子单元602和第二确定子单元603。其中:
第二解析子单元601,用于对用户输入的拼音串按照正常拼音方式和所有备选的模糊音规则进行解析;
记录子单元602,用于在所述第二解析子单元601进行解析的过程中,记录解析结果用到的模糊音选项;
第二确定子单元603,用于在所述解析结果用到的模糊音选项满足预置规则时,将其作为需要向用户推荐的模糊音选项。
需要说明的是,在本发明实施例中,所述第一解析子单元501和所述第二解析子单元601的内部结构可以相同。
如图7所示,是所述解析子单元的一种优选结构示意图。
在该实施例中,所述解析子单元700包括:匹配子单元701和/或组词子单元702。其中:
匹配子单元701,用于对用户输入的拼音串进行词条匹配,得到相匹配的词条;具体地,可以是对用户输入的拼音串进行全匹配,确定与所述拼音串完全相匹配的词条;或者,对用户输入的拼音串进行部分匹配,确定与所述拼音串部分相匹配的词条;或者,动态确定对用户输入的拼音串进行全匹配和/或部分匹配,确定与所述拼音串完合和/或部分相匹配的词条。
组词子单元702,用于对用户输入的拼音串按照预定算法进行组词,得到组词后的词条。
当然,本发明实施例中并不仅限于这种结构,根据应用需要,还可以有基于本发明思想实现的其他结构变形。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (22)

1.一种拼音输入方法,其特征在于,包括:
对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;所述模糊音选项用于指示对应的模糊音规则是否启用;所述模糊音规则用于对拼音串进行解析;
确定所述模糊音选项对应的模糊音规则是否已启用;
如果未启用,则将所述模糊音选项推荐给用户;
如果用户接受了推荐的模糊音选项,则启用所述模糊音选项对应的模糊音规则。
2.根据权利要求1所述的方法,其特征在于,所述对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项包括:
对用户输入的拼音串进行正常解析,得到第一次解析结果;
如果所述第一次解析结果异常,则启用全部或部分备选模糊音规则对所述拼音串重新进行解析,得到第二次解析结果;
如果所述第二次解析结果优于所述第一次解析结果,则将所述第二次解析结果使用的相关模糊音选项作为需要向用户推荐的模糊音选项。
3.根据权利要求1所述的方法,其特征在于,所述对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项包括:
对用户输入的拼音串按照正常拼音方式和所有备选的模糊音规则进行解析,并在解析过程中记录解析结果用到的模糊音选项;
在所述解析结果用到的模糊音选项满足预置规则时,将其作为需要向用户推荐的模糊音选项。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对用户输入的拼音串进行解析包括:
对用户输入的拼音串进行词条匹配,得到相匹配的词条;和/或
对用户输入的拼音串按照预定算法进行组词,得到组词后的词条。
5.根据权利要求4所述的方法,其特征在于,所述对用户输入的拼音串进行词条匹配,得到相匹配的词条包括:
对用户输入的拼音串进行全匹配,确定与所述拼音串完全相匹配的词条;或者 
对用户输入的拼音串进行部分匹配,确定与所述拼音串部分相匹配的词条;或者
动态确定对用户输入的拼音串进行全匹配和/或部分匹配,确定与所述拼音串完全和/或部分相匹配的词条。
6.根据权利要求4所述的方法,其特征在于,所述词条包括以下任意一种或多种:
系统词条、用户词条、用户手工导入的词条、通过特定文本训练获得的词条、通过服务器推送获得的词条。
7.根据权利要求2所述的方法,其特征在于,所述第一次解析结果异常包括:得到的词条的词频或数量低于第一阈值。
8.根据权利要求2所述的方法,其特征在于,所述第二次解析结果优于所述第一次解析结果包括:
所述第二次解析结果中得到的词条的词频或数量高于所述第一次解析结果中得到的词条的词频或数量。
9.根据权利要求1至3任一项所述的方法,其特征在于,所述将所述模糊音选项推荐给用户包括:
通过消息对话框提示用户是否启用所述模糊音选项;或者
通过气泡提示用户是否启用所述模糊音选项;或者
通过输入法界面展现与所述模糊音选项对应的信息提示;或者
将根据所述模糊音选项得到的词条作为候选项插入到根据用户输入的拼音串得到的词条候选列表中显示。
10.根据权利要求9所述的方法,其特征在于,所述信息提示包括以下任意一种或多种:文字提示,图标提示,按钮提示。
11.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
如果启用了所述模糊音选项对应的模糊音规则,则在用户后续拼音输入中,将所述模糊音规则参与对用户输入的拼音串的解析。
12.根据权利要求1至3任一项所述的方法,其特征在于,所述模糊音规则:包含一条或多条组合的模糊音映射关系。 
13.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
将所述模糊音选项推荐给用户之前,确定历史记录的以下任意一项或多项信息是否满足预定条件:推荐次数、用户输入拼音串的数量、用户输入的时间、用户接受推荐的次数或比例;
如果满足,则执行将所述模糊音选项推荐给用户的操作。
14.一种拼音输入装置,其特征在于,包括:
解析单元,用于对用户输入的拼音串进行解析,并根据解析结果确定需要向用户推荐的模糊音选项;所述模糊音选项用于指示对应的模糊音规则是否启用;所述模糊音规则用于对拼音串进行解析;
确定单元,用于确定所述模糊音选项对应的模糊音规则是否已启用,如果未启用,则通知推荐单元;
所述推荐单元,用于根据所述确定单元的通知将所述模糊音选项推荐给用户;
启用单元,用于在用户接受了推荐的模糊音选项后,启用所述模糊音选项对应的模糊音规则。
15.根据权利要求14所述的装置,其特征在于,所述解析单元包括:
第一解析子单元,用于对用户输入的拼音串进行正常解析,得到第一次解析结果,并在所述第一次解析结果异常时,启用全部或部分模糊音规则对所述拼音串重新进行解析,得到第二次解析结果;
比较子单元,用于比较所述第二次解析结果和所述第一次解析结果;
第一确定子单元,用于在所述比较子单元比较得到所述第二次解析结果优于所述第一次解析结果时,将所述第二次解析结果使用的相关模糊音选项作为需要向用户推荐的模糊音选项。
16.根据权利要求14所述的装置,其特征在于,所述解析单元包括:
第二解析子单元,用于对用户输入的拼音串按照正常拼音方式和所有备选的模糊音规则进行解析;
记录子单元,用于在所述第二解析子单元进行解析的过程中,记录解析结果用到的模糊音选项; 
第二确定子单元,用于在所述解析结果用到的模糊音选项满足预置规则时,将其作为需要向用户推荐的模糊音选项。
17.根据权利要求15所述的装置,其特征在于,所述第一解析子单元包括:
匹配子单元,用于对用户输入的拼音串进行词条匹配,得到相匹配的词条;和/或
组词子单元,用于对用户输入的拼音串按照预定算法进行组词,得到组词后的词条。
18.根据权利要求16所述的装置,其特征在于,所述第二解析子单元包括:
匹配子单元,用于对用户输入的拼音串进行词条匹配,得到相匹配的词条;和/或
组词子单元,用于对用户输入的拼音串按照预定算法进行组词,得到组词后的词条。
19.根据权利要求17或18所述的装置,其特征在于,所述匹配子单元具体用于:
对用户输入的拼音串进行全匹配,确定与所述拼音串完全相匹配的词条;或者
对用户输入的拼音串进行部分匹配,确定与所述拼音串部分相匹配的词条;或者
动态确定对用户输入的拼音串进行全匹配和/或部分匹配,确定与所述拼音串完全和/或部分相匹配的词条。
20.根据权利要求14至18任一项所述的装置,其特征在于,所述推荐单元包括:
对话框提示子单元,用于通过消息对话框提示用户是否启用所述模糊音选项;或者
气泡提示子单元,用于通过气泡提示用户是否启用所述模糊音选项;或者
界面提示子单元,用于通过输入法界面展现与所述模糊音选项对应的信息提示;或者 
列表提示子单元,用于将根据所述模糊音选项得到的词条作为候选项插入到根据用户输入的拼音串得到的词条候选列表中显示。
21.根据权利要求14至18任一项所述的装置,其特征在于,所述装置还包括:
模糊音添加单元,用于在用户后续拼音输入中,将所述模糊音规则提供给所述解析单元参与对用户输入的拼音串的解析。
22.根据权利要求14至18任一项所述的装置,其特征在于,所述装置还包括:
条件检测单元,用于在所述推荐单元将所述模糊音选项推荐给用户之前,确定历史记录的以下任意一项或多项信息是否满足预定条件:推荐次数、用户输入拼音串的数量、用户输入的时间、用户接受推荐的次数或比例;如果满足,则通过所述推荐单元执行将所述模糊音选项推荐给用户的操作。 
CN2009100827691A 2009-04-29 2009-04-29 拼音输入方法及装置 Active CN101876853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100827691A CN101876853B (zh) 2009-04-29 2009-04-29 拼音输入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100827691A CN101876853B (zh) 2009-04-29 2009-04-29 拼音输入方法及装置

Publications (2)

Publication Number Publication Date
CN101876853A CN101876853A (zh) 2010-11-03
CN101876853B true CN101876853B (zh) 2012-11-14

Family

ID=43019423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100827691A Active CN101876853B (zh) 2009-04-29 2009-04-29 拼音输入方法及装置

Country Status (1)

Country Link
CN (1) CN101876853B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102478968B (zh) * 2010-11-23 2016-02-17 深圳市世纪光速信息技术有限公司 中文拼音输入方法和中文拼音输入系统
CN103064825B (zh) * 2011-10-18 2016-03-02 阿里巴巴集团控股有限公司 模糊音对建立、设置方法和输入法及其装置和系统
CN103514236B (zh) * 2012-06-30 2017-06-09 重庆新媒农信科技有限公司 检索应用中基于拼音的检索条件纠错提示处理方法
CN104813257A (zh) * 2012-08-31 2015-07-29 微软技术许可有限责任公司 用于输入法编辑器的浏览历史语言模型
CN102929401A (zh) * 2012-09-27 2013-02-13 百度国际科技(深圳)有限公司 基于输入行为的输入法应用资源或功能的处理方法及装置
CN103616959A (zh) * 2013-12-03 2014-03-05 广东欧珀移动通信有限公司 一种输入法切换模糊音的方法
CN105589573A (zh) * 2015-12-18 2016-05-18 魅族科技(中国)有限公司 文字输出方法及文字输出装置
CN105653061B (zh) * 2015-12-29 2020-03-31 北京京东尚科信息技术有限公司 针对拼音输入法的词条检索及错词检测的方法和系统
CN105549760B (zh) * 2016-01-27 2018-07-20 百度在线网络技术(北京)有限公司 信息输入方法和装置
CN106339105A (zh) * 2016-08-25 2017-01-18 百度在线网络技术(北京)有限公司 用于识别拼音信息的方法及装置
CN108304078B (zh) * 2017-01-11 2024-01-30 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN108509057B (zh) * 2017-02-24 2022-07-12 微软技术许可有限责任公司 输入方法与相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192108A (zh) * 2007-03-28 2008-06-04 腾讯科技(深圳)有限公司 一种中文拼音输入方法及系统
CN101334769A (zh) * 2008-06-30 2008-12-31 腾讯科技(深圳)有限公司 调整候选词顺序的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009005492A1 (en) * 2007-06-29 2009-01-08 United States Postal Service Systems and methods for validating an address

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192108A (zh) * 2007-03-28 2008-06-04 腾讯科技(深圳)有限公司 一种中文拼音输入方法及系统
CN101334769A (zh) * 2008-06-30 2008-12-31 腾讯科技(深圳)有限公司 调整候选词顺序的方法和装置

Also Published As

Publication number Publication date
CN101876853A (zh) 2010-11-03

Similar Documents

Publication Publication Date Title
CN101876853B (zh) 拼音输入方法及装置
US20230315266A1 (en) Method for creating short message and portable terminal using the same
CN104516522B (zh) 九宫格键盘输入的方法和装置
AU2014212844B2 (en) Character and word level language models for out-of-vocabulary text input
US8160881B2 (en) Human-assisted pronunciation generation
CN105009064B (zh) 使用语言和空间模型的触摸键盘
US9760560B2 (en) Correction of previous words and other user text input errors
KR101143034B1 (ko) 음성 명령을 명확하게 해주는 중앙집중식 방법 및 시스템
KR101255402B1 (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
US9239824B2 (en) Apparatus, method and computer readable medium for a multifunctional interactive dictionary database for referencing polysemous symbol sequences
CN108369580B (zh) 针对屏幕上项目选择的基于语言和域独立模型的方法
US20160224524A1 (en) User generated short phrases for auto-filling, automatically collected during normal text use
US20070100619A1 (en) Key usage and text marking in the context of a combined predictive text and speech recognition system
US20140035823A1 (en) Dynamic Context-Based Language Determination
US20120290303A1 (en) Speech recognition system and method based on word-level candidate generation
US20040153975A1 (en) Text entry mechanism for small keypads
KR20080063471A (ko) 이동 장치에 대한 조합된 음성 및 교체 입력 양식을 위한정보 입력 방법, 이동 장치 및 사용자 인터페이스
CN104715005B (zh) 信息处理设备以及方法
CN105808197B (zh) 一种信息处理方法和电子设备
KR20090019198A (ko) 음성 인식을 이용한 텍스트 입력 자동 완성 방법 및 장치
CN109791761A (zh) 使用校正的术语的声学模型训练
US10073828B2 (en) Updating language databases using crowd-sourced input
US20170300559A1 (en) Systems and Methods for Facilitating Data Entry into Electronic Devices
TWI475405B (zh) 電子裝置及其文字輸入介面顯示方法
US20070092326A1 (en) Apparatus and method for inputting alphabet characters on keypad

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant