CN103019401A - 一种混合型语句输入方法与装置 - Google Patents

一种混合型语句输入方法与装置 Download PDF

Info

Publication number
CN103019401A
CN103019401A CN201110288020XA CN201110288020A CN103019401A CN 103019401 A CN103019401 A CN 103019401A CN 201110288020X A CN201110288020X A CN 201110288020XA CN 201110288020 A CN201110288020 A CN 201110288020A CN 103019401 A CN103019401 A CN 103019401A
Authority
CN
China
Prior art keywords
retrieval
string
symbol
sebolic addressing
mixed type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110288020XA
Other languages
English (en)
Other versions
CN103019401B (zh
Inventor
魏娜
尹方鸣
王晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201110288020.XA priority Critical patent/CN103019401B/zh
Publication of CN103019401A publication Critical patent/CN103019401A/zh
Application granted granted Critical
Publication of CN103019401B publication Critical patent/CN103019401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明的实施例提供了一种混合语句输入方法。该方法包括:在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串;以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到该检索串对应的字词,将查找到的字词作为该检索串的检索结果;将检索结果呈现到输出终端。本发明的实施例还提供了一种混合语句输入装置。本发明的实施例的技术方案使混合语句的输入具有连贯性,提高了输入效率,增强了信息录入的便捷性。

Description

一种混合型语句输入方法与装置
技术领域
本发明涉及语言输入技术领域,尤其涉及一种混合型语句输入方法与相应的装置。
背景技术
随着信息化处理技术的发展,通过终端设备的键盘(触笔)采集信息的场景和机会逐渐增多,对信息输入的速度和便捷性的要求越来越高。通过终端设备对单一语言形式的信息进行录入能较好地满足人们需求。但是,由于自然语言的网络化、外国语的本土化等因素导致输入终端的信息通常以混合语言形式呈现,传统的信息输入方式受到挑战。常见的混合语言形式有中文、英文两种语言混合,如:晚上去吃KFC、上网用WIFI。面对这种混合型语句的输入,现有输入法的操作流程通常是(参见附图1):在当前输入模式下输入混合型语句的一种语言类型对应的字串;将输入模式切换到另一种语言类型的输入模式;在切换后的输入模式下输入另一种语言类型对应的字串,该语言类型的字串输入完毕后又切换回原来的输入模式进行后续输入。这种方式将一个完整语句的输入过程分割成多种模式下的多次片段输入,破坏了输入过程的连贯性,且需要录入者反复切换输入模式,给输入工作带来极大不方便,降低了输入效率,尤其当输入信息较长、包含的语言类型较多时,其输入效率更低、便捷性更差。
发明内容
有鉴于此,本发明的发明目的在于提供一种混合型语句的输入方法和装置,该方法和装置通过启动混合型语句检索串的自动检索过程,在多种输入模式对应的字词库中完成检索,并将检索结果呈现到输出终端,进而解决在多种输入模式间进行多次切换带来的不便和效率低下问题。
本发明的实施例提供的一种混合型语句输入方法包括:
在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到该检索串对应的字词,将查找到的字词作为该检索串的检索结果;
将检索结果呈现到输出终端。
优选地,所述混合型语句的检索串在输入混合型语句的符号序列过程中识别得到。
进一步优选地,在输入混合型语句的符号序列过程中识别检索串包括:
接收符号串,所述符号串至少包括一个符号;
判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则:接收下一个符号,将所述符号串与该符号组合成符号序列,判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,并执行接收下一个符号串的步骤;若该符号序列符合,则执行接收下一个符号的步骤;如果所述符号串不符合,则将所述符号串作为检索串。
优选地,所述混合型语句的一个检索串按下述方式识别得到:
将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
进一步优选地,所述混合型语句的符号序列还包括数字时,则:从所述符号序列中提取出数字后执行检索串拆分步骤;将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
进一步优选地,所述混合型语句还包括控制符时,则:将所述混合型语句的符号序列按照所述控制符进行初步拆分;对初步拆分后的各符号序列按照当前输入模式对应语言的语法进行拆分。
优选地,执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,则:在将检索结果呈现到输出终端后,将输入模式切换回接收混合型语句的符号序列时的输入模式。
优选地,从字词库中查找到检索串对应的字词包括至少两个以上时,根据字词频率和/或根据该检索串的上下文选择一个字词作为检索串的检索结果,所述检索串的上下文包括与该检索串相邻的检索串的检索结果。
优选地,所述方法还包括检索串合并的步骤,该步骤包括:
计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
本发明的实施例还提供了一种混合型语句输入装置,该装置包括:接收单元、处理单元和输出单元,其中:
所述接收单元,用于在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
所述处理单元,以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到检索串对应的字词,将查找到的字词作为该检索串的检索结果;
输出单元,用于将检索结果呈现到输出终端。
优选地,所述接收单元包括第一检索串识别单元,该单元在输入混合型语句的符号序列过程中识别检索串。
进一步优选地,所述第一检索串识别单元包括:符号串接收子单元、符号序列组合子单元、第一判断子单元和第二判断子单元,其中:
所述符号串接收子单元,用于接收符号串,该符号串至少包括一个符号;
所述第一判断子单元,用于判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则触发符号序列组合子单元;如果所述符号串不符合,则将所述符号串作为检索串;
所述符号序列组合子单元,用于接收下一个符号,将所述符号串与该符号组合成符号序列,触发第二判断子单元;
所述第二判断子单元,用于判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,触发符号串接收子单元;若该符号序列符合,则触发符号序列组合子单元。
优选地,所述接收单元包括第二检索串识别单元,该单元用于将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
优选地,所述装置还包括数字提取单元,用于当所述混合型语句的符号序列包括数字时,从所述符号序列中提取出数字后执行检索串拆分步骤,则:所述输出单元用于在将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
优选地,所述装置还包括符合序列划分单元,用于当所述混合型语句还包括控制符时,将所述混合型语句的符号序列按照所述控制符划分为子符号序列,以便对子符号序列进行拆分以得到检索串。
优选地,所述装置还包括模式切换单元,则:在执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,所述模式切换单元用于在将检索结果呈现到输出终端后,将输入模式切换回接收混合型语句的符号序列时的输入模式。
优选地,该装置还包括检索串合并单元,用于计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
本发明的实施例给出的混合型语句输入方法和相应装置在当前模式下接收混合型语句的符号序列从中识别出检索串后,启动检索串自动检索过程,先在当前模式对应的字词库内进行检索,如果没检索到,则按照预置规则转到下一种输入模式对应的字词库中进行检索,直至检索到该检索串对应的字词,然后将检索结果呈现到输出终端。与现有技术相比,本发明实施例的技术方案仅在一种输入模式下接收混合语句的符号序列,接收过程连续而不中断,对检索串的检索过程按照预置规则自动进行,勿需录入者进行反复的模式切换,提高了混合型语句的输入效率,使得混合语句的输入过程具有较好的便捷性,有效解决了现有技术存在的问题。
附图说明
图1为现有技术的混合型语句的输入流程图;
图2为本发明的方法的一个实施例流程图;
图3为图2所述实施例的一个实例的键盘按键图;
图4为图2所述实施例的一个实例的流程图;
图5(a)~(c)为图2所述实施例的一个实例的实时效果图;
图6为本发明的装置的实施例的组成框图。
具体实施方式
本发明实施例的技术方案在接收混合语句的符号序列后,通过启动混合型语句检索串的自动检索过程,在多种输入模式对应的字词库中完成检索,然后将检索结果呈现到输出终端,较好地解决了多种输入模式间进行多次切换带来的不便和效率低下问题。
为了使本领域技术人员能进一步了解本发明的特征及技术内容,下面结合附图和具体实施例,对本发明的技术方案进行详细描述。
混合型语句是指含有两种或两种以上不同语言字词的语句。混合型语句是随着自然语言网络化、外国语言本土化、世界各国交往密切化等因素出现的,在该种类型的语句中通常包含两种以上语言类型,常见的如中英文、中日文混合,英中、日中文混合,或者其他语言类型之间的混合。由于不同的输入法模式所使用的字词库不同,因此,一种语言形式的语句片段通常只能在本语言的输入模式下才能搜索到用户期望输入的字词,这样,在进行混合型语句的输入时,录入者必须在多种输入语言模式下进行多次切换,反复的切换过程将混合型语句的输入工作人为切割成多段,打破了输入的连贯性,切换过程增加了时间消耗,降低了输入效率。为此,本发明的实施例给出了一种混合型语句输入方法,参见附图2,本实施例包括:
步骤S201;在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
信息输入者进行语句输入时,通常根据待输入语句的起始符号预先选定输入模式,如待输入语句的起始符号为中文字符,则选择中文输入模式,如起始符号为英文字符则选定英文输入模式,本实施例在输入混合语句前根据起始符号选定输入模式,将该选定的输入模式作为当前输入模式;混合语句的接收过程可以是在当前输入模式下一次性接收完混合语句全部符号序列,也可以逐符号串形式对混合语句进行接收,与此相对应,混合语句的检索串有两种形式的来源:一种是在输入混合语句的一段符号串后,立即被判别为检索串;一种是在接收完一个完整混合语句的符号序列后,对混合语句符号序列按照一定规则进行拆分得到检索串,这两种检索串的来源均不影响本发明的发明目的的实现。
步骤S202:以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到该检索串对应的字词,将查找到的字词作为该检索串的检索结果;
获得检索串后,以检索串为处理对象,进行该检索串对应的字词的查找工作:将检索串作为检索关键字在当前输入模式对应的字词库中进行检索,如果在该字词库中存在该检索串对应的字词,说明该检索串表征的是当前模式下的语言类型,将检索到的对应字词作为该检索串的检索结果;如果在该字词库中未能检索到该检索串对应的字词,说明该检索串体现的不是当前模式下的语言类型,这时需要调用别的输入模式(下一种输入模式)对应的字词库进行检索,如果能够检索到对应字词,说明该检索串对应的是这种输入模式下的语言类型,但是,也可能这次检索的字词库仍然不能检索到检索串对应的字词,此时则需要再次进行输入模式对应的字词库的转换,直至检索到检索串对应的字词,并将该对应字词返回作为检索结果;实际应用时,上述检索过程根据情况可能需要在多种输入模式对应的字词库下进行多次检索,而且可能出现在一种输入模式下检索得到的符合要求的对应字词不止一个,这时既可通过选定操作确定需要的字词,也可按照预设规则进行字词选定,比如,一个检索串存在多个对应字词时,选取字词频率最高的一个字词作为检索串的检索结果,或者,根据该检索串的上下文选择一个字词作为检索串的检索结果,这里检索串的上下文包括与该检索串相邻的检索串的检索结果。
步骤S203:将检索结果呈现到输出终端。
一个混合型语句根据其长短不同,可能包含多个检索串,对于每个检索串均按照步骤S202的方式进行检索,得到所有的检索串的检索结果后,按照检索串在混合型语句中的位置将检索结果相应地呈现到输出终端。
本实施例给出的混合型语句输入方法在当前模式下接收混合型语句的符号序列识别出检索串后,启动检索串自动检索过程,先在当前模式对应的字词库内进行检索,如果没检索到,则按照预置规则转到下一种输入模式对应的字词库中进行检索,直至检索到该检索串对应的字词,然后将检索结果呈现到输出终端。与现有技术相比,本实施例仅在一种输入模式下接收混合语句的全部符号序列,接收过程连续而不中断,对检索串的检索过程按照预置规则自动进行,勿需录入者进行反复的模式切换,提高了混合型语句的输入效率,使得混合语句的输入过程具有较好的便捷性,有效解决了现有技术存在的问题。
为了对上述实施例进行更清楚的阐释,下面举一个具体实例予以说明。假设现在需要通过附图3所示的键盘输入“晚上去吃KFC”的混合语句,当前输入法模式设定为中文模式,具体的输入方法可采用拼音输入法、笔画输入法等,本实例选择拼音输入法,同时这个实例中检索串的获得方式是通过接收完整混合语句后进行拆分得到的。参见附图4,本实例包括如下步骤:
步骤S401:在中文输入法模式下输入“晚上去吃KFC”的混合语句,该混合语句对应的符号序列如图5(a)所示,即“WanShanGPuChiKeA”,对应的按键数值是“9267426478244”,这里需要注意的是:由于图3所示的键盘上的每个按键上设置有三个字母,因此,字母组合的结果和中文的拼音可能不完全一致,如“去”的拼音为“Qu”,但在显示的输入框中为“Pu”,实际上,这里的“去”是通过“78”这两个按键数字体现的,该两个按键可能出现四种中文拼音“Pu、Qu、Ru、Su”,这四种拼音均有可能显示在输入框里,如果输入键盘是一个按键对应一个字母的形式,如QWERTY键盘,或者采用笔画输入法则不存在上述问题,下面步骤中为叙述方面将主要以按键数值进行说明。
步骤S402:将上述“晚上去吃KFC”对应符号序列进行拆分以得到检索串。按照当前输入模式对应语言的语法规则,将“晚上去吃KFC”混合语句拆分为“Wan ShanG”、“Pu”、“Chi”、“KeA”四个分组,这里值得注意的是:具体拆分时,对于混合语句中的当前输入模式对应语言的语句部分,按照该输入模式对应的语法进行拆分,如上面的“晚上去吃”部分,对于混合语句中的当前输入模式对应语言以外的语句部分,直接识别为一个分组,如KFC,每个分组构成一个检索串;对应按键数字分组为“92674264”、“78”、“244”、“532”,每个分组构成一个检索串。
步骤S403:形成检索串后,以每个检索串为处理对象,查找中文输入模式对应的中文字词库中是否存在对应的字词,先对“92674264”检索串进行处理,在中文字词库查找到该检索串对应的字词为“晚上”,将该字词作为检索结果,依次对“78”、“244”检索串进行处理,得到“去”、“吃”的检索结果;当处理“532”检索串时,先在中文字词库中查找,虽然有该检索串对应的中文字词,但这些中文字词与之前检索串的检索结果“吃”(或者“去吃”、“晚上去吃”)的相关度太低,则认为该检索串更可能对应于其他语言的字词,此时转到英文模式对应的英文字词库中进行查找,找到该检索串对应的是“KFC(肯德基)”,将“KFC”作为检索结果;值得注意的是这里由中文模式到英文模式的转换通过预设规则进行,该预设规则预先设定了字词库的查找顺序,对查找顺序的规定可根据使用者的使用习惯,比如大多数时候进行的均是“中英文”的信息输入工作,则设置中文输入法字词库→英文输入法字词库的查找顺序,如果大多数时候进行的是“中日文”的信息输入工作,则可设置中文输入法字词库→日文输入法字词库的查找顺序。
步骤S404:处理完“晚上去吃KFC”混合语句的“92674264”、“78”、“244”、“532”四个检索串后,将检索结果呈现到输出终端;
处理完后的混合词句在输入框中显示的结果如图5(b)所示,实际上输入框中是否显示出检索结果可根据实际需要设置,也可不显示,而直接将上述检索结果呈现到输出终端的显示屏上,由此完成混合型语句的输入,如图5(c)所示。
上述实例所举的例子是中文在前英文在后的“晚上去吃KFC”的混合语句,实际上,当混合语句是英文在前中文在后的混合语句其大致过程类似,比如现在需要输入“hello姚明”的混合语句,其流程为:在英文输入模式下先接收该混合语句,混合语句的符号序列为“helloyaoming”,其对应的按键数值为“435569266464”,然后将该混合语句拆分成两个检索串“43556”、“9266464”,在英文输入模式对应的字词库中搜索“43556”对应的字词,查找到该检索串对应的字词为“hello”,再处理“9266464”检索串,查找英文输入模式对应的字词库后发现没有该检索串对应的字词,然后转到中文输入模式对应的字词库中进行查找,查找到该检索串对应的字词为“姚明”,并将该词作为检索结果,完成对混合语句所有检索串的处理后,将检索串对应的字词(hello姚明)呈现到输出终端的显示屏上,完成混合语句的输入。
这里给出了两种语言形式的混合语句,现实运用过程中,可能遇到的混合语句包括两种以上语言类型的混合语句,本领域技术人员知道,其输入过程与上述实施例的实例相同,为避免重复,这里不再赘叙。
上述实施例曾提到检索串可在输入混合语句过程中即时识别得到,实际上,检索串即时识别技术可通过多种方式实现,本发明优选按照如下的方式实现:
步骤A:接收符号串,所述符号串至少包括一个字符;
实际应用场合,一个具有一定意义的检索串通常包含两个以上符号,如“我”字的拼音为“wo”,但在某些特殊情况下,也可能只包含一个符合,如英文中的“I”,因此,这里的符号串的含义是至少包含一个符号;
步骤B:判断所述符号串是否符合当前输入模式对应语言的语法,如果符合,则:执行步骤C;如果不符合,则直接将所述符号串作为检索串;
步骤A接收到的符号串如果符合当前输入模式对应语言的语法规则,则说明该符号串已经构成一个具有相对独立意义的基元,但是该基元还不能直接判别为检索串,如晚上的“上”字拼音“shang”,在接收到“sha”时不能立即认为用户输入的是该词句,而应当继续接收下一个符号,进入步骤C;步骤A接收的符号串如果不满足当前输入模式对应语言的语法规则,则可直接判别为一个检索串。
步骤C:接收下一个符号,将所述符号串与该符号组合成符号序列,判断该符号序列是否符合当前输入模式对应语言的语法,若不符合,则将所述符号串作为检索串,转而执行步骤A;若符合,则继续执行步骤C;
在步骤A接收的符号串满足语法规则要求时,接收下一个符号,将接收的符号与上述符号串进行组合,然后判断组合后的新符号串是否符合当前输入模式对应语言的语法规则,如果不符合,则说明该符合串已是用户输入的具有独立意义的最终符号串,则将步骤A接受的符号串判别为一个检索串,比如,“sha”满足语法规则,接收下一个符号“n”,组合成“shan”,该组合同样符合语法规则,则再接收下一个符号“g”,组合成“shang”,同样符合语法规则,则继续接收下一个符号“q”(“去”的拼音首字母),组合成“shangq”,该组合不再符合语法规则,这时即可将“shang”作为一个检索串。
上述实施例曾提到检索串可以通过对混合语句进行拆分得到,但没有详细给出混合语句拆分的方式,实际上,对一个语句进行分词的技术有多种实现方式,除前述实例介绍的按照当前输入模式对应语言的语法进行检索串拆分外,还可以按照如下的方式进行检索串拆分工作。
步骤A’:以混合型语句的符号序列为对象,按照符号序列的符号数构造多组字符串集,所述字符串集的字符串自符号序列中的一个符号开始到该符号后的另一个符号结束;
以上述实例“hello姚明”为例:“hello姚明”的混合语句的符号序列为“helloyaoming”,该字符序列有13个字符,以该符号序列为对象,构造出13组字符串集,字符串集中的元素为字符串,该字符串以该符号序列的一个符号为起点,到该符号后的另一个符号结束,比如第一组符号集内的符号串均是以h开头,然后依次选择后面的字符作为结尾,则构成第一组字符串集(h组字符串集):he、hel、hell、hello、helloy...helloyaoming等12个字符串,同样地,向后构建e组、l(1)组、l(2)组...g组灯13组字符串集。
步骤B’:从多组字符串集中选出字符串组成混合型语句,组成混合型语句的字符串中至少有一个符合当前输入模式的语法;
构建完成上述字符串集后,从字符串集合中选出能组合成混合型语句的字符串,选择时字符串集合之间应当相互衔接,比如从h组中选出了hello,接下来应当从y组字符串集中选择,选择组成混合型语句的字符串中至少应当有一个符合当前输入模式的语法;
步骤C’:将上述选出的各字符串作为混合型语句的检索串。
检索串形成后,即可按照上述的实施例对检索串进行处理,最后将检索串的检索结果给呈现到输出终端上。
前述内容详细介绍了两种获取检索串的方式,一种是在用户输入混合语句过程中识别出检索串,一种是在输入整个混合语句后对混合语句进行拆分得到检索串,尽管这些检索串已能用于检索,并返回用户需要的字词,但是,根据上述方式得到的检索串可能过于“零碎”,如上述实例中的“晚上去吃”,将被划分为“晚/上/去/吃”四个检索串,然而,为加快检索速度,实际上划分为“晚上/去/吃”三个检索串更好,因此,有必要对当前输入模式下接收到的检索串进行合并操作,以减少检索串的数量,进而提高输入混合型语句的整体效率。本发明提供这样一种检索串的合并步骤:
计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
符号串之间相关度的计算在现有技术已经存在相关技术,检索串作为符号串的一种形式,其相关度的计算这里不再详细介绍,这里的预设阀值可根据各种语言的特点进行设定。上述合并步骤可以反复多次进行,直至合并出符合要求的最长的检索串。
上述实施例中混合语句包括至少两种语言类型,在实际应用过程中,经常会遇到混合语句中还包括数字的情形,“我家TEL号是82345678”,由于阿拉伯数字的通用性,在不同的输入法模式中均可直接输入数字,本发明优选按照下述方式对包括数字的混合语句进行处理:
从所述混合型语句的符号序列中提取出数字后执行检索串拆分步骤;在处理完拆分的检索串将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
例如,对于“我家TEL号是82345678”混合语句,先从混合语句中将数字从符号序列“wojiatelhaoshi82345678”中提出出来,然后对剩下的混合语句“wojiatelhaoshi82345678”按照上述实施例的方式进行检索,完成该剩余混合语句的检索结果,在进行检索结果呈现时,将“82345678”数字串按照在符号序列中的位置,一并予以呈现到输出终端。
值得注意的是这里给出针对包含数字的混合语句的处理方式,如果混合语句中包含的不是数字,而是特殊的符号,比如书名号、引号、控制符等,也可采用类似的处理方式,均不影响本发明的发明目的的实现。实际上,对于包含特殊符号的混合语句,除上述方式外,可以将这些特殊符号作为检索串的一个分界符,利用这些分界符进行混合语句的初步划分,然后对初步划分形成的子符号序列进行拆分得到检索串。举例而言:假设用户输入的混合语句为“glad to meet姚明”,这里可将其中的“空格”符作为对该混合语句的初步划分,形成子符号序列后,再按照前述介绍的方法进行检索串划分。
上述实施例中曾提到在当前模式对应的字词库中没有检索到检索串的字词,将转到其他输入模式对应的字词库中进行查找,这种转换在有些情况下不会引起输入模式的变化,因为其仅仅调用其对应的字词库即可实现目的,但在某些情况下,要实现字词库之间的转换必须要进行输入模式的变化,实际应用过程中出现何种情形,取决于对输入模式的设定,如果设定为后者,本发明提供如下的处理方式:
执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,则:在将检索结果呈现到输出终端后,将输入模式切换回接收检索串时的输入模式。
通过上述处理过程可确保混合语句输入完成后还保持预先设定的当前输入模式,方便在进行下次混合语句输入时,勿需对输入法模式进行更改,从而在整体提高输入信息的效率。
上面的叙述主要针对本发明的方法实施例,实际上,相应地,本发明的实施例还提供了一种混合型语句输入装置。参见附图6,本装置600实施例包括:接收单元601、处理单元602和输出单元603,其中:
接收单元601,用于在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
处理单元602,以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到检索串对应的字词,将查找到的字词作为该检索串的检索结果;
输出单元603,用于将检索结果呈现到输出终端。
该装置实施例的工作过程是:接收单元601在当前输入模式下接收混合型语句符号序列的一个检索串,然后将检索串发送给处理单元602,由处理单元查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到检索串对应的字词,将查找到的字词作为该检索串的检索结果;处理单元处理完所有混合语句的检索串后,将相应的检索结果发送给输出单元603,由输出单元603将检索结果呈现到输出终端。
本装置实施例给出的混合型语句输入方法在当前模式下接收混合型语句的符号序列识别出检索串后,启动检索串自动检索过程,先在当前模式对应的字词库内进行检索,如果没检索到,则按照预置规则转到下一种输入模式对应的字词库中进行检索,直至检索到该检索串对应的字词,然后将检索结果呈现到输出终端。与现有技术相比,本实施例仅在一种输入模式下接收混合语句的符号序列,接收过程连续而不中断,对检索串的检索过程按照预置规则自动进行,勿需录入者进行反复的模式切换,提高了混合型语句的输入效率,使得混合语句的输入过程具有较好的便捷性,有效解决了现有技术存在的问题。
上述装置实施例中的接收单元601可以包括第一检索串识别单元,该单元在输入混合型语句的符号序列过程中识别检索串,该单元可按照下述的结构组成:符号串接收子单元、符号序列组合子单元、第一判断子单元和第二判断子单元,其中:符号串接收子单元,用于接收符号串,该符号串至少包括一个符号;第一判断子单元,用于判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则触发符号序列组合子单元;如果所述符号串不符合,则将所述符号串作为检索串;符号序列组合子单元,用于接收下一个符号,将所述符号串与该符号组合成符号序列,触发第二判断子单元;第二判断子单元,用于判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,触发符号串接收子单元;若该符号序列符合,则触发符号序列组合子单元。实际上,上述装置实施例的接收单元除上述构成外,还可以包括第二检索串识别单元,该单元用于将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
上述装置实施例还可以包括数字提取单元604,用于当所述混合型语句的符号序列包括数字时,从所述符号序列中提取出数字后执行检索串拆分步骤,则:所述输出单元用于在将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
上述装置实施例还可以包括符合序列划分单元605,用于当所述混合型语句还包括控制符时,将所述混合型语句的符号序列按照所述控制符划分为子符号序列,以便对子符号序列进行拆分以得到检索串。
上述装置实施例中还可以包括模式切换单元606,在执行所述转到下一种输入模式对应的字词库进行查找的步骤时,输入模式发生切换,则:所述模式切换单元用于在将检索结果呈现到输出终端后,将输入模式切换回接收符号序列时的输入模式。通过增加模式切换单元可确保混合语句输入完成后还保持预先设定的当前输入模式,方便在进行下次混合语句输入时,勿需对输入法模式进行更改,从而在整体提高输入信息的效率。
上述装置实施例还可以包括检索串合并单元607,用于计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。对当前输入模式下接收到的检索串进行合并操作,减少了检索串的数量,进而提高了输入混合型语句的整体效率。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在发明的保护范围之内。

Claims (17)

1.一种混合型语句输入方法,其特征在于,该方法包括:
在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到该检索串对应的字词,将查找到的字词作为该检索串的检索结果;
将检索结果呈现到输出终端。
2.根据权利要求1所述的方法,其特征在于,所述混合型语句的检索串在输入混合型语句的符号序列过程中识别得到。
3.根据权利要求2所述的方法,其特征在于,在输入混合型语句的符号序列过程中识别检索串包括:
接收符号串,所述符号串至少包括一个符号;
判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则:接收下一个符号,将所述符号串与该符号组合成符号序列,判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,并执行接收下一个符号串的步骤;若该符号序列符合,则执行接收下一个符号的步骤;如果所述符号串不符合,则将所述符号串作为检索串。
4.根据权利要求1所述的方法,其特征在于,所述混合型语句的检索串按下述方式识别得到:
将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
5.根据权利要求4所述的方法,其特征在于,所述混合型语句的符号序列还包括数字时,则:从所述符号序列中提取出数字后执行检索串拆分步骤;在将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
6.根据权利要求4所述的方法,其特征在于,所述混合型语句还包括控制符时,则:将所述混合型语句的符号序列按照所述控制符划分为子符号序列;对子符号序列进行拆分以得到检索串。
7.根据权利要求1至6中任何一项所述的方法,其特征在于,执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,则:在将检索结果呈现到输出终端后,将输入模式切换回接收混合型语句的符号序列时的输入模式。
8.根据权利要求1至6中任何一项所述的方法,其特征在于,从字词库中查找到检索串对应的字词包括至少两个以上时,根据字词频率和/或根据该检索串的上下文选择一个字词作为检索串的检索结果,所述检索串的上下文包括与该检索串相邻的检索串的检索结果。
9.根据权利要求1至6中任何一项所述的方法,其特征在于,所述方法还包括检索串合并的步骤,该步骤包括:
计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
10.一种混合型语句输入装置,其特征在于,该装置包括:接收单元、处理单元和输出单元,其中:
所述接收单元,用于在当前输入模式下接收混合型语句的符号序列,所述符号序列包括至少一个检索串,所述混合型语句输出至少两种语言类型;
所述处理单元,以检索串为处理对象,查找当前输入模式对应的字词库是否存在该检索串对应的字词,如果不存在,则转到下一种输入模式对应的字词库进行查找,直至查找到检索串对应的字词,将查找到的字词作为该检索串的检索结果;
所述输出单元,用于将检索结果呈现到输出终端。
11.根据权利要求10所述的装置,其特征在于,所述接收单元包括第一检索串识别单元,该单元在输入混合型语句的符号序列过程中识别检索串。
12.根据权利要求11所述的装置,其特征在于,所述第一检索串识别单元包括:符号串接收子单元、符号序列组合子单元、第一判断子单元和第二判断子单元,其中:
所述符号串接收子单元,用于接收符号串,该符号串至少包括一个符号;
所述第一判断子单元,用于判断所述符号串是否符合当前输入模式对应语言的语法,如果所述符号串符合,则触发符号序列组合子单元;如果所述符号串不符合,则将所述符号串作为检索串;
所述符号序列组合子单元,用于接收下一个符号,将所述符号串与该符号组合成符号序列,触发第二判断子单元;
所述第二判断子单元,用于判断该符号序列是否符合当前输入模式对应语言的语法,若该符号序列不符合,则将所述符号串作为检索串,触发符号串接收子单元;若该符号序列符合,则触发符号序列组合子单元。
13.根据权利要求10所述的装置,其特征在于,所述接收单元包括第二检索串识别单元,该单元用于将在当前输入模式下接收的混合型语句的所述符号序列进行拆分,得到混合型语句的各检索串。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括数字提取单元,用于当所述混合型语句的符号序列包括数字时,从所述符号序列中提取出数字后执行检索串拆分步骤,则:所述输出单元用于在将检索结果进行呈现时,根据数字在符号序列中的位置,将数字与检索结果一并呈现到输出终端。
15.根据权利要求13所述的装置,其特征在于,所述装置还包括符合序列划分单元,用于当所述混合型语句还包括控制符时,将所述混合型语句的符号序列按照所述控制符划分为子符号序列,以便对子符号序列进行拆分以得到检索串。
16.根据权利要求10至15中任何一项所述的装置,其特征在于,该装置还包括模式切换单元,则:在执行所述转到下一种输入模式对应的字词库进行查找的步骤时,如果输入模式发生切换,所述模式切换单元用于在将检索结果呈现到输出终端后,将输入模式切换回接收混合语句的符号序列时的输入模式。
17.根据权利要求10至15中任何一项所述的装置,其特征在于,该装置还包括检索串合并单元,用于计算相邻检索串的相关度,判断所述相关度是否超过预设阀值,如果是,则将所述相邻检索串合并为一个检索串。
CN201110288020.XA 2011-09-26 2011-09-26 一种混合型语句输入方法与装置 Active CN103019401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110288020.XA CN103019401B (zh) 2011-09-26 2011-09-26 一种混合型语句输入方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110288020.XA CN103019401B (zh) 2011-09-26 2011-09-26 一种混合型语句输入方法与装置

Publications (2)

Publication Number Publication Date
CN103019401A true CN103019401A (zh) 2013-04-03
CN103019401B CN103019401B (zh) 2016-04-13

Family

ID=47968084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110288020.XA Active CN103019401B (zh) 2011-09-26 2011-09-26 一种混合型语句输入方法与装置

Country Status (1)

Country Link
CN (1) CN103019401B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317416A (zh) * 2014-10-10 2015-01-28 北京搜狗科技发展有限公司 一种输入的方法和装置
CN104656938A (zh) * 2013-11-19 2015-05-27 阿尔派株式会社 文字输入装置及文字输入方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101943952A (zh) * 2010-01-27 2011-01-12 北京搜狗科技发展有限公司 一种至少两种语言混合输入的方法和输入法系统
CN102012748A (zh) * 2010-11-30 2011-04-13 哈尔滨工业大学 语句级中英文混合输入方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101943952A (zh) * 2010-01-27 2011-01-12 北京搜狗科技发展有限公司 一种至少两种语言混合输入的方法和输入法系统
CN102012748A (zh) * 2010-11-30 2011-04-13 哈尔滨工业大学 语句级中英文混合输入方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104656938A (zh) * 2013-11-19 2015-05-27 阿尔派株式会社 文字输入装置及文字输入方法
CN104317416A (zh) * 2014-10-10 2015-01-28 北京搜狗科技发展有限公司 一种输入的方法和装置
CN104317416B (zh) * 2014-10-10 2018-02-06 北京搜狗科技发展有限公司 一种输入的方法和装置

Also Published As

Publication number Publication date
CN103019401B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN102012748B (zh) 语句级中英文混合输入方法
CN102455845B (zh) 一种文字输入方法和装置
CN1296806C (zh) 去多义性的简化键盘系统
CN102135814B (zh) 一种字词输入方法及系统
TWI293455B (en) System and method for disambiguating phonetic input
CN102449579B (zh) 一体式中文字输入方法
CN105917327A (zh) 用于将文本输入到电子设备中的系统和方法
CN102063195B (zh) 一种用于供用户进行中英文混合输入的方法与设备
CN104683845A (zh) 一种智能电视输入法及系统
CN101436308A (zh) 一种用于交互式公式排版软件的公式输入方法及系统
CN102566772A (zh) 一种实现字符混合输入的方法及系统
CN102033614B (zh) 一种智能组合的公式输入方法及系统
CN106354276A (zh) 适于多种输入法的混合输入方法、装置及电子设备
CN104345896B (zh) 拼音文字词组输入方法及系统
CN102567365A (zh) 一种针对于关键词进行标注的输入方法及系统
CN102081464A (zh) 一种用选词模式选择候选词的输入法
CN103019401B (zh) 一种混合型语句输入方法与装置
CN101493729B (zh) 多类型字符的混合输入方法
CN100403239C (zh) 基于英文键盘的藏文输入法
CN104571584B (zh) 文字输入方法和装置
US20110131488A1 (en) Word input method
CN1991743A (zh) 一种语音输入法方法及其装置
CN100394365C (zh) 数字快拼汉字输入法
CN104850242A (zh) 一种汉字拼音输入法及利用该输入法编码汉字的方法
CN101114196B (zh) 输入中文短语的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant