CN103106214A - 一种候选词组输出方法和电子设备 - Google Patents

一种候选词组输出方法和电子设备 Download PDF

Info

Publication number
CN103106214A
CN103106214A CN2011103602150A CN201110360215A CN103106214A CN 103106214 A CN103106214 A CN 103106214A CN 2011103602150 A CN2011103602150 A CN 2011103602150A CN 201110360215 A CN201110360215 A CN 201110360215A CN 103106214 A CN103106214 A CN 103106214A
Authority
CN
China
Prior art keywords
phrase
candidate
classification
database
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103602150A
Other languages
English (en)
Other versions
CN103106214B (zh
Inventor
李晓潇
席燕敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Mobile Communications AB
Original Assignee
Sony Ericsson Mobile Communications AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications AB filed Critical Sony Ericsson Mobile Communications AB
Priority to CN201110360215.0A priority Critical patent/CN103106214B/zh
Priority to US13/611,744 priority patent/US9009031B2/en
Priority to PCT/IB2012/002078 priority patent/WO2013072726A1/en
Priority to EP12799270.9A priority patent/EP2780778A1/en
Publication of CN103106214A publication Critical patent/CN103106214A/zh
Application granted granted Critical
Publication of CN103106214B publication Critical patent/CN103106214B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Abstract

本发明实施例提供一种候选词组输出方法和电子设备,所述方法包括:根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类;如果包含,则提高包含所述词组的分类在候选输入列表中的候选优先级;如果不包含,则将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。通过本发明实施例的方法和电子设备,提高了使用者利用电子设备输入中文词组的效率,并降低了输入复杂度。

Description

一种候选词组输出方法和电子设备
技术领域
本发明涉及文本输出,尤其涉及一种候选词组输出方法和电子设备。
背景技术
随着电子技术和通信技术的飞速发展,通过电子设备进行信息交换已经成为人们日常生活中不可或缺的组成部分,例如,人们经常通过手机、计算机等电子设备收发短信、电子邮件等,这给人们的生活和工作带来了极大的方便。其中,当人们通过这些电子设备输入信息时,候选字或词的输出就显得额外重要,如果这些电子设备能洞悉使用者要输入的内容,有针对性的输出使用者所希望的字或词,将大大提高输入效率,优化使用者的用户体验。
目前,当使用者使用拼音输入法输入中文词组时,他首先要输入音节,然后选择他所希望的中文候选词组。在多数情况下,一个音节对应许多称之为同音字的中文候选词组,如图1所示,音节“shi.shi”对应词组“时事”、“试试”或“事实”等。当使用者使用简拼输入法时还会有更多的候选词组,如图2所示,简拼输入法下的“s.s”对应词组“适时”、“搜索”、“说啥”等,由于一个简拼的组合可能具有许多的匹配词组,使用者有时不得不向下翻页以在很长的候选列表中获取正确的一个。因此,如何根据使用者的输入来输出一个使用者所希望的候选词组,成为业界的研究方向。
目前,许多输入法例如搜狗输入法和百度输入法,能够通过向前移动最常使用的字来自动校正字和词组(前文提到的中文候选)顺序,但是他们仍然不能处理使用者希望在不同的通话上下文中使用不同的字数据库的问题。这些输入法也提供了各种各样的自定义字库(例如一部时尚电影中的所有演员的演员名字组)以供使用者下载,然而,这些字库并不是专用的,使用者仍然需要找出他所希望的那个。这种方式不仅浪费时间而且不够智能。
此外,许多人在输入短信或电子邮件时具有自己的风格,例如,有些人喜欢使用网络流行词,而有些人则更常用到一些专门术语或者方言等。但是,当使用者输入一个非网络常用词或者来自术语、新闻、游戏或者电影等的特殊词时,得到正确的候选并不容易。
发明内容
鉴于现有技术的上述问题,提出了本发明。
本发明致力于提供一种候选词组输出方法和电子设备,以通过分析上下文来帮助使用者简单快速的输入中文词组。
根据本发明的第一方面,提供了一种候选词组输出方法,其中,所述方法包括:
根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类;
如果包含,则提高包含所述词组的分类在候选输入列表中的候选优先级;
如果不包含,则将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
根据本发明的第二方面,提供了一种如第一方面所述的方法,其中,所述方法还包括:
判断所述候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则对用户输入音节后从候选列表中选择的词组进行分类分析。
根据本发明的第三方面,提供了一种如第一方面所述的方法,其中,所述方法还包括:
分析目标用户的语言习惯,根据所述目标用户的语言习惯,将所述词组的同义词显示于候选输入列表的第一页。
根据本发明的第四方面,提供了一种如第一方面所述的方法,其中,根据所述文本输入服务器的指示更新所述词组数据库包括:
接收所述文本服务器发送的更新指示;
根据所述更新指示从所述文本服务器下载词组数据库;
利用从文本服务器上下载的词组数据库更新本地词组数据库。
根据本发明的第五方面,提供了一种如第一方面所述的方法,其中,所述词组数据库包括以下词组分类的任意组合:
网络流行类;方言类;生物化学类;物理数学类;文言类。
根据本发明的第六方面,提供了一种电子设备,其中,所述电子设备包括:
词组数据库,包含多个词组分类,每一个词组分类包含多个具有相同属性的词组;
第一分析单元,其根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类;
调整单元,其在所述第一分析单元的分析结果为,所述词组数据库包含所述词组的分类时,提高包含所述词组的分类在候选输入列表中的候选优先级;
更新单元,其在所述第一分析单元的分析结果为,所述词组数据库不包含所述词组的分类时,将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
根据本发明的第七方面,提供了一种如第六方面所述的电子设备,所述电子设备还包括:
判断单元,其判断所述候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则通过所述第一分析单元对用户输入音节后从候选列表中选择的词组进行分类分析。
根据本发明的第八方面,提供了一种如第六方面所述的电子设备,其中,所述电子设备还包括:
第二分析单元,其分析目标用户的语言习惯;
显示单元,其根据第二分析单元分析出的所述目标用户的语言习惯,将所述词组的同义词显示于所述候选输入列表的第一页。
根据本发明的第九方面,提供了一种如第六方面所述的电子设备,其中,所述更新单元包括:
发送模块,其将未被分类的词组发送到文本输入服务器;
接收模块,其接收所述文本输入服务器发送的更新指示;
更新模块,其根据所述更新指示从所述文本服务器下载词组数据库,利用从文本服务器上下载的词组数据库更新本地词组数据库的词组分类。
根据本发明的第十方面,提供了一种如第六方面所述的电子设备,其中,所述词组数据库包含以下词组分类的任意组合:
网络流行类;方言类;生物化学类;物理数学类;文言类。
本发明实施例的有益效果在于,通过分析上下文输出词组,提高了使用者输入中文词组的效率,并降低了输入复杂度。
参照下面的描述和附图,将清楚本发明的这些和其他方面。在这些描述和附图中,具体公开了本发明的特定实施方式,来表示实施本发明的原理的一些方式,但是应当理解,本发明的范围不受此限制。相反,本发明包括落入所附权利要求书的精神和内涵范围内的所有变化、修改和等同物。
针对一个实施方式描述和/或例示的特征,可以在一个或更多个其它实施方式中以相同方式或以类似方式使用,和/或与其他实施方式的特征相结合或代替其他实施方式的特征使用。
应当强调的是,术语“包括”当在本说明书中使用时用来指所述特征、要件、步骤或组成部分的存在,但不排除一个或更多个其它特征、要件、步骤、组成部分或它们的组合的存在或增加。
参照以下附图,将更好地理解本发明的许多方面。附图中的组成部分不一定按比例绘制,重点在于清楚地例示出本发明的原理。为了便于例示和描述本发明的一些部分,可以将附图中的对应部分在尺寸上放大,例如,放大得相对于其他部分比在根据本发明实际制成的示例性设备中的要大。在本发明的一个图或实施方式中示出的部件和特征可以与一个或更多个其它图或实施方式中示出的部件和特征相结合。此外,在附图中,相同的标号在全部图中都标示对应的部分,并且可以用来标示一个以上实施方式中的相同或类似部分。
附图说明
所包括的附图用来提供对本发明的进一步的理解,其构成了说明书的一部分,例示了本发明的优选实施方式,并与文字说明一起用来解释本发明的原理,其中对于相同的要素,始终用相同的附图标记来表示。
在附图中:
图1是全拼输入法下的音节对应的候选词组示意图;
图2是简拼输入法下的声母对应的候选词组示意图;
图3是本发明实施例的候选词组输出方法的流程图;
图4是图3所述方法中词组数据库的更新的方法流程图;
图5是本发明实施例的电子设备的组成示意图。
具体实施方式
可互换术语“电子设备”和“电子装置”包括便携式无线电通信设备。术语“便携式无线电通信设备”在下面被称为“移动无线电终端”、“便携式电子装置”或“便携式通信装置”,包括所有诸如移动电话、寻呼机、通信装置、电子记事簿、个人数字助理(PDA)、智能电话、便携式通信装置等的设备。
在本申请中,主要就形式为移动电话(也称为“手机”)的便携式电子装置描述了本发明的实施方式。然而,应当理解,本发明不应限于移动电话的情况,而可以涉及任何类型的合适的电子设备,这样的电子设备的示例包括媒体播放器、游戏设备、PDA和计算机、数字摄像机等。
下面参照附图对本发明的优选实施方式进行说明。
实施例1
根据本发明的一个实施方式,提供了一种候选词组输出方法。图3是本发明实施例提供的一种候选词组输出方法的流程图,请参照图3,该方法包括:
步骤301:根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类,如果包含,则执行步骤302,否则执行步骤303;
步骤302:提高包含所述词组的分类在候选输入列表中的候选优先级;
步骤303:将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
通过本发明实施例的方法,当根据步骤301确定用户选择的词组属于词组数据库中的词组分类时,也就是说,实施本实施的方法的电子设备的词组数据库的分类中包含该词组。由于用户从最初的候选列表中选择了该词组,则可以确定该用户比较倾向于这类的词汇的输入,因此,本实施例通过步骤302提高这类词汇的候选优先级,当用户在下一次输入内容时,这类词汇会优先显示,以便于用户快速对应到自己所需要的词汇。
在一个优选实施例中,本实施例的方法还包括以下步骤:
步骤300:判断候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则执行步骤301,否则结束。
其中,第一候选词未被选择超过预定次数,说明当前的候选列表并非是用户目前需要的,因此,可以通过步骤301分析用户之前输入的词组,来查找用户所需要的候选词,通过步骤302将对应用户已输入的词组的分类的候选优先级提高,可以方便用户快速定位到自己所需要的词组。
其中,本实施例并不限制这里的预定次数,优选为2次。
以下通过举例对此加以说明。在该举例中,目标词组在候选输入列表中,但是并非显示于当前候选页。
用户A喜欢和他的同龄朋友们讨论新鲜事物,他可能使用许多流行词语,例如,他使用拼音音节“ji.dong”或者“j.d”以插入单词“鸡动”(网络新词,表示某人非常兴奋,但是通常的词组应为“激动”),然而,当他使用移动电话给其他成员,例如家庭成员写短信或者电子邮件时,则很少使用这种非正规词语,这种情况下,“ji.dong”或者“j.d”的第一个候选词是“激动”,而“鸡动”由于不经常使用,通常显示于候选的第三页或者更靠后页。当他选择完“鸡动”后,移动电话通过本实施例提供的方法,会很快地对应到相关分类,例如“网络流行”,之后,如果该用户继续输入更多的网络词组,该移动电话自动把“网络流行”类对应的词向前推。由此,当输入候选时,网络流行类的词组将会被提高优先权。
通过本发明实施例的方法,当根据步骤301确定用户选择的词组不属于词组数据库中的词组分类时,说明该用户输入的可能是一个比较新的词组,因此词组数据库中没有对应该词组的分类。为避免是由于词组数据库更新不及时导致的上述问题,本实施例通过步骤303将该词组发送到文本输入服务器,通过该文本输入服务器对该词组进行查找,如果查找到对应的分类,则提醒词组数据库进行词组分类的下载和更新;如果没有查找到对应的分类,则提醒词组数据库支持团队,对包含该词组的分类进行整理和添加。
其中,提醒词组数据库支持团队,对包含该词组的分类进行整理和添加,例如可以通过弹出对话框或者弹出显示界面的方式来实现该提醒,具体可以通过文本输入服务器自行设置,本实施例并不以此作为限制。
其中,提醒词组数据库进行词组分类的下载和更新,例如可以向应用本实施例的方法的电子设备发送更新指示,以便该电子设备根据该更新指示从文本输入服务器下载词组数据库,并以此更新其本地的词组数据库。具体的,该电子设备可以通过图4所示的方法来实现词组数据库的更新,请参照图4,该方法包括:
步骤401:接收所述文本服务器发送的更新指示;
其中,这里的更新指示例如是一个提示框(“确认”或者“取消”)或者其他提醒方式,本实施例并不以此作为限制。
步骤402:根据所述更新指示从所述文本服务器下载词组数据库;
其中,更新指示的“确认”可以对应一个下载地址,当用户选择“确认”时,自动从其对应的下载地址下载相应的词组数据库。其中,更新指示的“取消”可以对应关闭该更新指示的操作。以上只是举例说明。
步骤403:利用从文本服务器上下载的词组数据库更新本地词组数据库。
其中,当从文本服务器上下载了词组数据库后,即可采用已有手段更新本地词组数据库,在此不再赘述。
以下通过举例对此加以说明。在该举例中,目标词组不在候选输入列表中。
用户B和他的朋友使用移动电话讨论“植物大战僵尸”游戏,这个移动电话并没有预先安装对应“植物大战僵尸”这个游戏的相关词组,因此,用户B需要通过逐字选择来输入对应“植物大战僵尸”这个游戏的一个词,于是这个移动电话记录这种情况并将该词发送到文本输入服务器。文本输入服务器会判断这个词对应的分类是否已经存在。如果这个词对应的分类已经存在,也就意味着用户B没有将词组数据库与文本输入服务器同步,于是文本输入服务器会给用户B发送信息,提供词组数据库更新信息。当用户B下载完这个新的词组数据库后,这个词也就完成分类了,当用户B接下来再输入对应这个游戏的词时,移动电话经过分析即可对应至该分类,并提高该分类的候选优先级,以便于用户B快速找到自己所希望看到的词。如果这个词也不存在于文本输入服务器,则文本输入服务器可以将其记录下来,以提醒词组数据库的支持团队对该词进行整理收集,并将其更新到文本输入服务器的词组数据库。
在另外一个优选实施例中,本实施例的方法还包括以下步骤:
步骤304:分析目标用户的语言习惯,根据所述目标用户的语言习惯,将所述词组的同义词显示于候选输入列表的第一页。
其中,本实施例并不限制该步骤304与之前的步骤300、301、302之间的先后顺序,例如,该步骤304可以与上述步骤300-302同步进行,也可以在上述步骤300-302执行完毕后执行。
其中,目标用户是指与应用本实施例的方法的电子设备进行信息交换的用户,例如,如果该电子设备的用户通过该电子设备给另外一个用户发送短信,那么这里的目标用户就是接收该短信的用户,此时,分析该目标用户的语言习惯,可以根据该用户的电话号码的所属地来分析,例如,如果该目标用户的电话号码属于北京地区,则确定该目标用户的语言习惯为普通话;如果该目标用户的电话号码属于上海地区,则确定该目标用户的语言习惯为上海话。如果该电子设备的用户通过该电子设备给另外一个用户发送电子邮件,那么这里的目标用户就是接收该电子邮件的用户,此时,分析该目标用户的语言习惯,可以根据该用户的邮件地址来分析,由于用户在注册电子邮箱时,都会设置用户信息,例如籍贯、工作地等,根据该用户信息可以确定该用户的语言习惯。
以上只是举例说明,本实施例并不限制具体的分析方法。
根据语言习惯来显示对应输入词组的同义词,更加人性化。
以下通过举例对此加以说明。
例如,用户A给用户B发短信,则目标用户为用户B,通过对该用户B的分析确定其为上海人,则当用户A输入“你”时,通过本实施例的方法,会把上海话中对应“你”的同义词“侬”显示在候选输入列表的第一页,这样,用户A即可输入一些符合用户B的语言习惯的词汇,增加了双方交流的互动性和友好性。
再例如,用户B给用户A发短信,则目标用户为用户A,通过对该用户A的分析确定其为北京人,由于用户B本身是上海人,他已经习惯输入一些上海方言,则当其输入“结棍”时,通过本实施例的方法,会把普通话中对应“结棍”的同义词“厉害”显示在候选输入列表的第一页,如此,也达到了人性化输入的效果。
在本实施例中,对词组进行分析以确定其具体的分类可以通过现有的分析手段来实现,在现有领域,该技术已经非常成熟,应用范围也很广泛,这里不再赘述。
在本实施例中,词组数据库中的分类视需求而定,例如可以将一些网络流行词归为网络流行类,其中,还可以细化网络流行词,例如将不同的游戏对应的词按照游戏名称进一步归类等;将各地的方言归为方言类,其中,还可以喜欢方言类型,例如将上海话改为一类,将闽南话归为一类,将广东话归为一类等;将生物化学领域的专业输入归为生物化学类;将物理数学领域的专业输入归于物理数学类;将文言文类的词语归为文言类。以上只是举例说明,具体的分类方法也可以参考现有技术,在此不再赘述。
通过本实施例的候选词组输出方法,移动电话能够分析词组(word cell)的分类,当使用者没有选择已被输入超过两次的第一个中文候选词时,移动电话会自动查找使用者已经输入的词组的正确分类。首先,他遍历该移动电话中的已有词组数据库,如果找到匹配的结果,移动电话将会把相应的分类选择出来,这个分类的词在候选列表中的优先级也就被提高。如果没有找到匹配的结果,移动电话将会发送信息(例如包含该词组的请求信息)到文本输入服务器,这个文本输入服务器会确定使用者是否需要更新词组数据库,或者确定是否需要更新文本输入服务器的词组数据库。由此,通过本发明实施例的方法提高了使用者输入中文词组的效率,并降低了输入复杂度。
实施例2
根据本发明的另一实施方式,还提供了一种电子设备。图5为本发明实施例的电子设备的组成示意图,请参照图5,该电子设备包括:词组数据库501、第一分析单元502、调整单元503和更新单元504,其中:
词组数据库501包含多个词组分类,每一个词组分类包含多个具有相同属性的词组。
在本实施例中,词组数据库中的分类视需求而定,例如可以将一些网络流行词归为网络流行类,其中,还可以细化网络流行词,例如将不同的游戏对应的词按照游戏名称进一步归类等;将各地的方言归为方言类,其中,还可以喜欢方言类型,例如将上海话改为一类,将闽南话归为一类,将广东话归为一类等;将生物化学领域的专业输入归为生物化学类;将物理数学领域的专业输入归于物理数学类;将文言文类的词语归为文言类。以上只是举例说明,具体的分类方法也可以参考现有技术,在此不再赘述。
第一分析单元502根据词组数据库501的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库501中是否包含所述词组的分类。
在本实施例中,对词组进行分析以确定其具体的分类可以通过现有的分析手段来实现,这里不再赘述。
调整单元503在所述第一分析单元502的分析结果为,所述词组数据库501包含所述词组的分类时,提高包含所述词组的分类在候选输入列表中的候选优先级。
更新单元504在所述第一分析单元502的分析结果为,所述词组数据库501不包含所述词组的分类时,将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
在一个优选实施例中,所述更新单元504包括:
发送模块5041,其将未被分类的词组发送到文本输入服务器;
接收模块5042,其接收所述文本输入服务器发送的更新指示;
更新模块5043,其根据所述更新指示从所述文本服务器下载词组数据库,利用从文本服务器上下载的词组数据库更新本地词组数据库的词组分类。
在一个优选实施例中,所述电子设备还包括:
判断单元505,其判断所述候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则通过所述第一分析单元502对用户输入音节后从候选列表中选择的词组进行分类分析。
在另外一个优选实施例中,该电子设备还包括:
第二分析单元506,其分析目标用户的语言习惯;
显示单元507,其根据第二分析单元506分析出的所述目标用户的语言习惯,将所述词组的同义词显示于所述候选输入列表的第一页。
在本发明实施例中,所述词组数据库包含以下词组分类的任意组合:网络流行类;方言类;生物化学类;物理数学类;文言类。
在本发明实施例中,电子设备优选为移动电话。
由于本实施例的电子设备解决问题的原理与实施例1的候选词组输出方法类似,因此,该电子设备的实施可以参见实施例1的方法的实施,重复之处不再赘述。
通过本发明实施例的电子设备,提高了使用者输入中文词组的效率,并降低了输入复杂度。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此所附权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
应当理解,本发明的各部分可以用硬件、软件、固件或者它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可以用本领域共知的下列技术中的任一项或者他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
流程图中或在此以其它方式描述的任何过程或方法描述或框可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程中的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中,可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或者按相反的顺序,来执行功能,这应被本发明所述技术领域的技术人员所理解。
在流程图中表示或者在此以其它方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质例如可以是但不限于电子、磁、光、电磁、红外或半导体系统、装置、设备或传播介质。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或更多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM)(电子装置),只读存储器(ROM)(电子装置),可擦除可编程只读存储器(EPROM或闪速存储器)(电子装置),光纤(光装置),以及便携式光盘只读存储器(CDROM)(光学装置)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其它合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
上述文字说明和附图示出了本发明的各种不同的特征。应当理解,本领域普通技术人员可以准备合适的计算机代码来实现上面描述且在附图中例示的各个步骤和过程。还应当理解,上面描述的各种终端、计算机、服务器、网络等可以是任何类型的,并且可以根据公开内容来准备所述计算机代码以利用所述装置实现本发明。
在此公开了本发明的特定实施方式。本领域的普通技术人员将容易地认识到,本发明在其他环境下具有其他应用。实际上,还存在许多实施方式和实现。所附权利要求绝非为了将本发明的范围限制为上述具体实施方式。另外,任意对于“用于......的装置”的引用都是为了描绘要素和权利要求的装置加功能的阐释,而任意未具体使用“用于......的装置”的引用的要素都不希望被理解为装置加功能的元件,即使该权利要求包括了“装置”的用词。
尽管已经针对特定优选实施方式或多个实施方式示出并描述了本发明,但是显然,本领域技术人员在阅读和理解说明书和附图时可以想到等同的修改例和变型例。尤其是对于由上述要素(部件、组件、装置、组成等)执行的各种功能,除非另外指出,希望用于描述这些要素的术语(包括“装置”的引用)对应于执行所述要素的具体功能的任意要素(即,功能等效),即使该要素在结构上不同于在本发明的所例示的示例性实施方式或多个实施方式中执行该功能的公开结构。另外,尽管以上已经针对几个例示的实施方式中的仅一个或更多个描述了本发明的具体特征,但是可以根据需要以及从对任意给定或具体应用有利的方面考虑,将这种特征与其他实施方式的一个或更多个其他特征相结合。

Claims (10)

1.一种候选词组输出方法,其中,所述方法包括:
根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类;
如果包含,则提高包含所述词组的分类在候选输入列表中的候选优先级;
如果不包含,则将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
2.根据权利要求1所述的方法,其中,所述方法还包括:
判断所述候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则对用户输入音节后从候选列表中选择的词组进行分类分析。
3.根据权利要求1所述的方法,其中,所述方法还包括:
分析目标用户的语言习惯,根据所述目标用户的语言习惯,将所述词组的同义词显示于候选输入列表的第一页。
4.根据权利要求1所述的方法,其中,根据所述文本输入服务器的指示更新所述词组数据库包括:
接收所述文本服务器发送的更新指示;
根据所述更新指示从所述文本服务器下载词组数据库;
利用从文本服务器上下载的词组数据库更新本地词组数据库。
5.根据权利要求1所述的方法,其中,所述词组数据库包括以下词组分类的任意组合:
网络流行类;方言类;生物化学类;物理数学类;文言类。
6.一种电子设备,其中,所述电子设备包括:
词组数据库,包含多个词组分类,每一个词组分类包含多个具有相同属性的词组;
第一分析单元,其根据词组数据库的词组分类,对用户输入音节后从候选列表中选择的词组进行分类分析,以判断所述词组数据库中是否包含所述词组的分类;
调整单元,其在所述第一分析单元的分析结果为,所述词组数据库包含所述词组的分类时,提高包含所述词组的分类在候选输入列表中的候选优先级;
更新单元,其在所述第一分析单元的分析结果为,所述词组数据库不包含所述词组的分类时,将所述词组发送到文本输入服务器,以便根据所述文本输入服务器的指示更新所述词组数据库的词组分类。
7.根据权利要求6所述的电子设备,其中,所述电子设备还包括:
判断单元,其判断所述候选输入列表中的第一候选词是否未被选择超过预定次数,如果是,则通过所述第一分析单元对用户输入音节后从候选列表中选择的词组进行分类分析。
8.根据权利要求6所述的电子设备,其中,所述电子设备还包括:
第二分析单元,其分析目标用户的语言习惯;
显示单元,其根据第二分析单元分析出的所述目标用户的语言习惯,将所述词组的同义词显示于所述候选输入列表的第一页。
9.根据权利要求6所述的电子设备,其中,所述更新单元包括:
发送模块,其将未被分类的词组发送到文本输入服务器;
接收模块,其接收所述文本输入服务器发送的更新指示;
更新模块,其根据所述更新指示从所述文本服务器下载词组数据库,利用从文本服务器上下载的词组数据库更新本地词组数据库的词组分类。
10.根据权利要求6所述的电子设备,其中,所述词组数据库包含以下词组分类的任意组合:
网络流行类;方言类;生物化学类;物理数学类;文言类。
CN201110360215.0A 2011-11-14 2011-11-14 一种候选词组输出方法和电子设备 Expired - Fee Related CN103106214B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201110360215.0A CN103106214B (zh) 2011-11-14 2011-11-14 一种候选词组输出方法和电子设备
US13/611,744 US9009031B2 (en) 2011-11-14 2012-09-12 Analyzing a category of a candidate phrase to update from a server if a phrase category is not in a phrase database
PCT/IB2012/002078 WO2013072726A1 (en) 2011-11-14 2012-10-16 Output method for candidate phrase and electronic apparatus
EP12799270.9A EP2780778A1 (en) 2011-11-14 2012-10-16 Output method for candidate phrase and electronic apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110360215.0A CN103106214B (zh) 2011-11-14 2011-11-14 一种候选词组输出方法和电子设备

Publications (2)

Publication Number Publication Date
CN103106214A true CN103106214A (zh) 2013-05-15
CN103106214B CN103106214B (zh) 2016-02-24

Family

ID=48281462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110360215.0A Expired - Fee Related CN103106214B (zh) 2011-11-14 2011-11-14 一种候选词组输出方法和电子设备

Country Status (4)

Country Link
US (1) US9009031B2 (zh)
EP (1) EP2780778A1 (zh)
CN (1) CN103106214B (zh)
WO (1) WO2013072726A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104345899A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 用于输入法的字段转换方法及客户端

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5553866B2 (ja) * 2012-07-23 2014-07-16 東芝テック株式会社 商品認識装置及び認識辞書追加プログラム
CN103077165A (zh) * 2012-12-31 2013-05-01 威盛电子股份有限公司 自然语言对话方法及其系统
JP6028658B2 (ja) * 2013-03-28 2016-11-16 富士通株式会社 端末装置、変換文字候補同期方法及び変換文字候補同期プログラム
CN104809102B (zh) * 2015-04-01 2018-10-16 北京奇虎科技有限公司 一种基于输入的显示候选词的方法和装置
TWI654529B (zh) * 2016-08-02 2019-03-21 財團法人資訊工業策進會 網路裝置及訊息提供方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1089375A (zh) * 1992-12-31 1994-07-13 陈劲松 文字忆频环境输入法
US20070106492A1 (en) * 2001-07-18 2007-05-10 Kim Min K Apparatus and method for inputting alphabet characters
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US20100122164A1 (en) * 1999-12-03 2010-05-13 Tegic Communications, Inc. Contextual prediction of user words and user actions
JP2004280574A (ja) * 2003-03-17 2004-10-07 Internatl Business Mach Corp <Ibm> 翻訳システム、辞書更新サーバ、翻訳方法、及び、これらのプログラムと記録媒体
US20050027534A1 (en) * 2003-07-30 2005-02-03 Meurs Pim Van Phonetic and stroke input methods of Chinese characters and phrases
FI20031566A (fi) 2003-10-27 2005-04-28 Nokia Corp Kielen valitseminen sanantunnistusta varten
US8095364B2 (en) * 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7779009B2 (en) * 2005-01-28 2010-08-17 Aol Inc. Web query classification
CN100530171C (zh) * 2005-01-31 2009-08-19 日电(中国)有限公司 字典学习方法和字典学习装置
CN1834865B (zh) * 2005-03-18 2010-04-28 马贤亮 一种小键盘上数字编码的汉语拼音和注音多字连续输入法
US20070174255A1 (en) * 2005-12-22 2007-07-26 Entrieva, Inc. Analyzing content to determine context and serving relevant content based on the context
US7756708B2 (en) * 2006-04-03 2010-07-13 Google Inc. Automatic language model update
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
TWI336048B (en) * 2007-05-11 2011-01-11 Delta Electronics Inc Input system for mobile search and method therefor
JP5026192B2 (ja) * 2007-08-20 2012-09-12 株式会社リコー ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
US8965835B2 (en) * 2010-03-24 2015-02-24 Taykey Ltd. Method for analyzing sentiment trends based on term taxonomies of user generated content
US8782046B2 (en) * 2010-03-24 2014-07-15 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
TWI443529B (zh) * 2010-04-01 2014-07-01 Inst Information Industry 自動化領域名詞建置方法及系統,及其電腦程式產品
US20120030164A1 (en) * 2010-07-27 2012-02-02 Oracle International Corporation Method and system for gathering and usage of live search trends

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1089375A (zh) * 1992-12-31 1994-07-13 陈劲松 文字忆频环境输入法
US20070106492A1 (en) * 2001-07-18 2007-05-10 Kim Min K Apparatus and method for inputting alphabet characters
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104345899A (zh) * 2013-08-08 2015-02-11 阿里巴巴集团控股有限公司 用于输入法的字段转换方法及客户端
CN104345899B (zh) * 2013-08-08 2018-01-19 阿里巴巴集团控股有限公司 用于输入法的字段转换方法及客户端

Also Published As

Publication number Publication date
US9009031B2 (en) 2015-04-14
US20130124188A1 (en) 2013-05-16
EP2780778A1 (en) 2014-09-24
WO2013072726A1 (en) 2013-05-23
CN103106214B (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
EP2024880B1 (en) Demographic based classification for local word wheeling/web search
CN100483416C (zh) 一种字符输入的方法、输入法系统及词库更新的方法
CN103430232B (zh) 利用设备停靠情境的语音识别
CN102866782B (zh) 一种提高整句生成效率的输入法和输入法系统
CN103106214B (zh) 一种候选词组输出方法和电子设备
US20120290509A1 (en) Training Statistical Dialog Managers in Spoken Dialog Systems With Web Data
CN104823135A (zh) 用于输入法编辑器的个人语言模型
CN102915380A (zh) 用于对数据进行搜索的方法和系统
CN102930054A (zh) 数据搜索方法及系统
CN102163198A (zh) 提供新词或热词的方法及系统
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
CN110543552A (zh) 对话交互方法、装置及电子设备
CN1495641B (zh) 将语音字符转换成书面字符的方法和设备
CN103268313A (zh) 一种自然语言的语义解析方法及装置
CN111651996A (zh) 摘要生成方法、装置、电子设备及存储介质
CN101645087A (zh) 一种分类词库系统及其更新和维护方法、以及客户端
CN103995880A (zh) 交互式搜索方法和装置
CN104573099A (zh) 题目的搜索方法及装置
WO2012158571A2 (en) Training statistical dialog managers in spoken dialog systems with web data
CN112149419B (zh) 字段的规范化自动命名方法、装置及系统
CN108776677B (zh) 平行语句库的创建方法、设备及计算机可读存储介质
CN112417848A (zh) 语料生成方法、装置及计算机设备
CN113449089B (zh) 一种查询语句的意图识别方法、问答方法及计算设备
CN110797012A (zh) 一种信息提取方法、设备及存储介质
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160224

Termination date: 20161114