CN102508554A - 一种通信关联的输入方法、个性语库及系统 - Google Patents

一种通信关联的输入方法、个性语库及系统 Download PDF

Info

Publication number
CN102508554A
CN102508554A CN2011102965477A CN201110296547A CN102508554A CN 102508554 A CN102508554 A CN 102508554A CN 2011102965477 A CN2011102965477 A CN 2011102965477A CN 201110296547 A CN201110296547 A CN 201110296547A CN 102508554 A CN102508554 A CN 102508554A
Authority
CN
China
Prior art keywords
word
information
contact person
individual character
repertorie
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102965477A
Other languages
English (en)
Inventor
马宇尘
刘红梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Liangming Technology Development Co Ltd
Original Assignee
Shanghai Liangming Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Liangming Technology Development Co Ltd filed Critical Shanghai Liangming Technology Development Co Ltd
Priority to CN2011102965477A priority Critical patent/CN102508554A/zh
Publication of CN102508554A publication Critical patent/CN102508554A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提供了一种通信关联的输入方法,属于计算机软件技术领域。该方法包括:采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;当捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;针对于用户当前输入法词库,加载所获取的个性语库;采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。利用本发明,根据用户与联系人的通信信息建立针对该联系人的个性语库,采用所述个性语库,作为用户与联系人通信时的输入法词库,从而提高用户与联系人通信的输入效率。

Description

一种通信关联的输入方法、个性语库及系统
技术领域
本发明属于计算机、软件技术领域。
背景技术
随着通信事业的不断发展,人们使用多种通讯方式进行联系。例如,使用个人数字助理和手机短信进行通讯,或者通过即时通信软件,例如MSN、QQ、skype等软件进行通讯,或者通过EMAIL进行通讯,还有些游戏机或者播放器也具有相互通信的功能。为了方便与联系人联系,个人数字助理、手机上设置有电话本,即时通信软件中有好友名单,EMAILL中有联系人地址薄。
在进行通信的过程中,针对不同的联系人,用户与其通信的信息内容也有所不同。以即时通信工具中不同的联系人类型为例,用户与父母进行聊天时,通信内容会侧重于一些家常话,其中的个性语言会包括一些家乡俗语;当用户与好友进行聊天时,通信内容会偏重于两人的共同爱好,例如篮球或者游戏等,所使用的个性语言也会集中于篮球或者游戏领域。
现有的输入法技术,为了满足用户的个性化需求,提供了用户词库。用户词库的形成方法通常包括以下步骤:记录用户输入的字词,学习某个用户适用的词汇;通过一段时间地不断学习,将词库逐渐收敛到某个用户输入的最佳状态,从而形成用户词库。显然,这种用户词库的形成过程可以得到用户的个性化字词。
但是在通信时,用户的个性化字词往往是针对特定的联系人对象使用的。例如,用户与好友聊天时可能会使用“期待ing”、“好滴”、“哇哈哈”等活泼轻松的词语,但是当用户与上级或客户通信时,则需要使用比较正式的词语。因此,针对不同的联系人建立对应的个性语库,当与联系人通信时启用相对应的个性语库,将有助于提高用户通信时的输入效率。
发明内容
本发明的目的在于,提供一种通信关联的输入方法、个性语库及系统,利用本发明,根据用户与联系人的通信信息建立针对该联系人的个性语库,采用所述个性语库,作为用户与联系人通信时的输入法词库,从而提高用户与联系人通信的输入效率。
本发明的技术方案包括:
一种通信关联的输入方法,该方法包括如下步骤:
步骤1,采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
步骤2,当捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;
步骤3,针对于用户当前输入法词库,加载所获取的个性语库;
步骤4,采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
优选地,所述步骤1中建立针对于该联系人的个性语库的过程包括:
采集用户与联系人的通信信息,获取所述通信信息中的字词信息;
将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;
将所获取的个性字词用来建立针对于该联系人的个性语库。
优选地,在获取所述通信信息中的字词信息的过程中,进一步获取字词对应的词频,所述词频为所述通信信息中字词出现的频率。
优选地,所述获取个性字词的过程为:
判断所获取的字词信息在现有词库中是否存在;
如果不存在,则确定该字词为个性字词。
优选地,所述获取个性字词的过程也可为:
判断所获取的字词信息在现有词库中是否存在;
如果不存在,进一步判断该字词对应的词频;
如果所述词频大于或等于预定阈值,则确定该字词为个性字词。
优选地,所述获取个性字词的过程还可为:
判断所获取的字词信息在现有词库中是否存在;
如果不存在,则确定该字词为个性字词;
如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;
如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
优选地,所述获取个性字词的过程还可以为:
判断所获取的字词信息在现有词库中是否存在;
如果不存在,进一步判断该字词对应的词频;如果对应的词频大于或等于预定阈值,则确定该字词为个性字词。
如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
优选地,所述步骤1中建立针对于该联系人的个性语库的过程包括:
采集用户与联系人的通信信息,获取所述通信信息中的短句信息;
判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
将所获取的个性短句用来建立针对于该联系人的个性语库。
优选地,当采集到用户打开与所述联系人的通信窗口时,即捕获到用户与所述联系人处于通信状态。
优选地,也可采用如下步骤判断用户与所述联系人是否处于通信状态:
采集用户目前打开的与所述联系人的通信窗口;
捕获当前输入信息的光标位置,判断所述光标位置是否在用户与联系人的通信窗口中,如果是,则用户与所述联系人处于通信状态。
优选地,还可采用如下步骤判断用户与所述联系人是否处于通信状态:
采集用户目前打开的与所述联系人的通信窗口;
利用钩子函数捕获用户在通信窗口中的按键键值;
判断所捕获的按键键值是否为通信字符对应的键值,如果是,即捕获到用户与所述联系人处于通信状态。
优选地,所述步骤3中加载所获取的个性语库之后还包括:
判断用户与联系人的通信窗口是否处于焦点窗口状态,如果是,则针对于该联系人对象的个性语库开启;如果否,则针对于该联系人对象的个性语库关闭。
优选地,所述步骤4中基于加载个性语库后的词库进行候选词的生成操作的过程包括:
采集用户针对于所述联系人的输入界面所输入的字符串信息;
在所述个性语库和现有词库中查找所述字符串信息对应的候选词信息;
对于个性语库中查找到的候选词信息,在候选词列表中优先输出。
本发明还提供一种通信关联的个性语库的建立方法,该方法包括如下步骤:
步骤1,采集用户与联系人之间的通信信息;
步骤2,获取所述通信信息的字词信息或/和短句信息;
步骤3,判断所述字词信息或/和短句信息是否满足预置条件,在满足预置条件的情况下确定为个性字词或/和个性短句;
步骤4,将所获取的个性字词或/和个性短句用来建立用户与所述联系人进行通信的个性语库。
本发明还提供一种通信关联的输入系统,该系统包括:
个性语库建立单元,用以采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
个性语库获取单元,与所述个性语库建立单元相连,用以在捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;
个性语库加载单元,与所述个性语库获取单元相连,用以针对于用户当前输入法词库,加载所获取的个性语库;
候选词生成单元,与所述个性语库加载单元相连,用以采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
优选地,所述个性语库建立单元包括:
信息采集模块,用以采集用户与联系人之间的通信信息;
字词获取模块,与所述信息采集模块相连,用以获取所述通信信息中的字词信息;
词频记录模块,与所述字词获取单元相连,用于在获取所述通信信息字词信息的过程中,进一步获取字词对应的词频,所述词频为所述通信信息中字词出现的频率。
个性字词获取模块,与所述字词获取单元和相连词频记录单元,用于将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;
个性语库建立模块,与所述个性字词获取模块相连,用于将所获取的个性字词用来建立针对于该联系人的个性语库。
优选地,所述个性语库建立单元还可以包括:
信息采集模块,用以采集用户与联系人之间的通信信息;
短句获取单元,与所述信息采集模块相连,用以获取所述通信信息中的短句信息;
判断模块,与所述短句获取单元相连,用于判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
个性语库建立模块,与所述判断模块相连,用于将所获取的个性短句用来建立针对于该联系人的个性语库。
与现有技术相比,本发明具有的优点是:本发明通过用户与联系人的通信信息,提取出个性字词或短句,建立与联系人关联的个性语库,当用户进行通信时,开启与对应联系人关联的个性语库,作为输入法的词库。由于通信对象不同,相应的个性语库也不同,通过本发明可以根据不同的聊天对象,开启对应的个性语库作为输入法词库,从而提高用户的输入效率。
附图说明
图1为本发明第一实施例提供的一种通信关联的输入方法的流程图;
图2为本发明第二实施例提供的一种通信关联的个性语库的建立方法的流程图;
图3为本发明第三实施例提供的一种通信关联的个性语库的建立方法的流程图;
图4为本发明第四实施例提供的一种通信关联的输入系统的示意图;
图5为本发明提供的系统中的个性语库建立单元的结构示意图;
图6为本发明提供的系统中的个性语库建立单元的另一种结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的实施方案作进一步详细的说明。
本发明所述通信关联的输入方法可以应用于各种通过输入法编码输入的语言,例如,中文、日文、韩文等,由于本发明在上述几种语言文字中的应用流程都是相似的,所以为了方便说明,下面仅仅对本发明应用在中文的情况进行说明。
参见图1,为本发明第一实施例提供的一种通信关联的输入方法的流程图,具体步骤如下所述。
S11,采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
用户与联系人之间的通信信息存储在通信终端设备中或者服务器中,例如,即时通信消息记录存储在终端设备中或者即时通信服务器中;手机短消息存储于手机设备中。可以通过相应的系统函数获取用户与联系人通信信息的存储路径,然后获取通信内容。另外,还可以在用户与联系人进行通信的初始阶段,即开始采集对应的通信信息;所述初始阶段,即用户最开始与联系人进行通信的阶段,当用户每进行一次通信时即采集此次通信的内容,可通过相应函数获取每次通信时向屏幕输出的数据内容。
其中,建立针对于联系人个性语库的过程可采用如下步骤:采集用户与联系人的通信信息,获取所述通信信息中的字词信息;将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;将所获取的个性字词用来建立针对于该联系人的个性语库。
利用现有技术中的自动分词系统,例如机械分词技术、人工神经网络分词技术等,从所述的通信信息中获取字词信息。在获取字词信息的过程中,进一步获取字词对应的词频,即所述字词在通信信息中出现的次数。
通过将获取的字词信息与现有词库中的字词信息进行比较,获取个性字词的过程包括几种方式:
方式1,可以通过判断所获取的字词信息在现有词库中是否存在;如果不存在,则确定该字词为个性字词。
方式2,判断所获取的字词信息在现有词库中是否存在;如果不存在,进一步判断该字词对应的词频;当所述词频大于或等于预定阈值时,确定该字词为个性字词。
方式3,判断所获取的字词信息在现有词库中是否存在;如果不存在,则确定该字词为个性字词;如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
方式4,判断所获取的字词信息在现有词库中是否存在;如果不存在,进一步判断该字词对应的词频;如果对应的词频大于或等于预定阈值,则确定该字词为个性字词。如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
另外,除了采用用户与联系人之间的个性字词建立个性语库外,还可以获取用户与联系人之间的个性短句来建立个性语库,其具体过程为:采集用户与联系人的通信信息,获取所述通信信息中的短句信息;判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;将所获取的个性短句用来建立针对于该联系人的个性语库。
所述的预置条件可以设置为短句信息出现的次数以及短句信息的字数限制,通过举例说明,如设置十个字以下的短句为有效的短句信息,所获取的有效短句信息出现的次数在两次以上时,为满足预置条件的个性短句。
将通过上述方法获取的个性字词以及个性短句,用以建立针对于该联系人的个性语库。将所建立的个性语库与所述联系人之间建立关联,所建立的个性语库可存储在终端设备中或者通信服务器中。以即时通信工具为例,可以存储在终端设备或服务器中对应所述联系人的存储路径中,用户通过联系人信息即可获取到所对应的个性语库。
建立针对联系人的个性语库后,对于用户与联系人之后的通信信息,可以通过上述步骤继续获取通信信息中的个性字词,然后添加至所建立的个性语库中。
S12,当捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;
以手机终端为例,当捕获到用户通过按键或触发方式打开与联系人的通信界面时,即可判断用户与联系人处于通信状态。
对于即时通信软件工具,则包含几种不同的方式来判断用户与联系人是否处于通信状态。
方式1,当捕获到用户打开与所述联系人的通信窗口时,即判断用户与所述联系人处于通信状态。
方式2,采集用户目前打开的与所述联系人的通信窗口;捕获当前输入信息的光标位置,判断所述光标位置是否在用户与联系人的通信窗口中,如果是,则用户与所述联系人处于通信状态。
方式3,采集用户目前打开的与所述联系人的通信窗口;利用钩子函数捕获用户在通信窗口中的按键键值;判断所捕获的按键键值是否为通信字符对应的键值,如果是,则用户与所述联系人处于通信状态。
当捕获到用户与所述联系人处于通信状态时,通过相应的系统函数获取该联系人对应的存储路径,从所述存储路径中获取对应的个性语库。
S13,针对于用户当前输入法词库,加载所获取的个性语库;
所述用户当前输入法词库是指,用户当前进行信息输入时所采用的用以生成候选词的词库信息,包括系统词库、用户词库、专业词库等等。加载所获取的个性语库,是指将前述步骤中所获取的个性语库,添加至当前输入法词库中,作为生成候选词的其中一个词库。具体加载过程可以是:将所述的个性语库的存储路径加载至输入法系统中,当用户输入字符信息时,通过存储路径即可获取个性语库中的字词或短句信息,用以生成候选词的操作。
对于加载后的个性语库还需设置相应的开启和关闭功能,开启时,个性语库作为生成候选词的词库;关闭时,个性语库不作为生成候选词的词库。由于用户有些情况下会同时打开与多个联系人的通信窗口,只有处于焦点窗口状态的通信窗口,才是用户当前进行通信的窗口,此时其它打开的通信窗口所对应联系人的个性语库则需要关闭。因此,加载所获取的个性语库之后还包括:判断用户与联系人的通信窗口是否处于焦点窗口状态,如果是,则针对于该联系人对象的个性语库启动;如果否,则针对于该联系人对象的个性语库关闭。
S14,采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
基于加载个性语库后的词库进行候选词的生成操作的具体过程为:采集用户针对于所述联系人的输入界面所输入的字符串信息;在所述个性语库和现有词库中查找所述字符串信息对应的候选词信息;对于个性语库中查找到的候选词信息,在候选词列表中优先输出。
下面通过举例具体说明,例如,用户输入字符串“wahaha”,在个性语库中与该字符串对应的词为“哇哈哈”,在现有词库中与该字符串对应的词为“娃哈哈”。那么在生成的候选词列表中,个性语库中的词“哇哈哈”排序在“娃哈哈”的前面。
在本发明实施例中,通过用户与联系人的通信信息,建立针对联系人的个性语库,使得用户与不同联系人通信时,采用各自对应的个性语库,进一步提高用户的输入效率。
参见图2,为本发明第二实施例提供的一种通信关联的个性语库的建立方法的流程图,具体步骤如下所述。
S21,采集用户与联系人之间的通信信息;
可以通过相应的系统函数获取用户与联系人通信信息的存储路径,然后获取通信内容。另外,还可以在用户与联系人进行通信的初始阶段,即开始采集对应的通信信息;所述初始阶段,即用户最开始与联系人通信的时间,当用户每进行一次通信时,即采集此次通信的内容,可通过相应函数获取当前通信时向屏幕输出的数据内容即可。
S22,获取所述通信信息的字词信息;
所获取的通信信息是由连续的字词组成的语句,因此需要首先从通信信息中提取出字词信息,可采用现有的自动分词技术。
目前实用的自动分词系统基本上都是以采用机械分词为主,辅以少量的词法、语法和语义信息的分词系统。机械分词是基于字符串匹配的原理进行的,其基本思想是:事先建立一词库,其中包含所有可能出现的词;对给定的待分词的汉字串S,按照某种确定的原则切取S的子串,若该子串与词库中的某词条相匹配,则该子串是词,继续分割剩余的部分,直到剩余部分为空;否则,该子串不是词,按上述方法重新切取S的子串进行匹配。其中,根据切取S的子串的不同原则,机械匹配法被分为几类:按切取子串的方向来分,可分为正向匹配法和逆向匹配法;按每次匹配时优先考虑长词还是短词来分,可分为最大匹配法和最小匹配法;按匹配不成功时重新切取的策略来分,可分为增字法和减字法。
除了机械分词外,目前还发展了人工智能的分词技术,例如人工神经网络和专家系统技术。人工神经网络是在对人脑组织结构和运行机智的认识理解基础之上模拟其结构和智能行为的一种工程系统,它从模拟人脑的结构出发,构造联接机制,经样本训练后,能快速直观地反应;专家系统是一包含实例与规则的计算机程序,通常针对某一特定的范围可以以专家认定高水准的能力来协助解决问题,它是从模拟人脑的功能出发,构造推理网络,经物理符号描述,能缓慢可解释地处理外界信息。
S23,将获取的字词信息与现有词库中的字词进行比较,根据比对结果获取个性字词;
通过将获取的字词信息与现有词库中的字词信息进行比较,获取个性字词的过程包括以下几种方式:
方式1,可以通过判断所获取的字词信息在现有词库中是否存在;如果不存在,则确定该字词为个性字词。
方式2,判断所获取的字词信息在现有词库中是否存在;如果不存在,进一步判断该字词对应的词频;当所述词频大于或等于预定阈值时,确定该字词为个性字词。
方式3,判断所获取的字词信息在现有词库中是否存在;如果不存在,则确定该字词为个性字词;如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
方式4,判断所获取的字词信息在现有词库中是否存在;如果不存在,进一步判断该字词对应的词频;如果对应的词频大于或等于预定阈值,则确定该字词为个性字词。如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
S24,将所获取的个性字词用来建立用户与所述联系人进行通信的个性语库。
将通过上述方法获取的个性字词,用以建立针对于该联系人的个性语库。将所建立的个性语库与所述联系人之间建立关联,存储在终端设备中或者通信服务器中。以即时通信工具为例,可以存储在终端设备或服务器对应所述联系人的存储路径中,用户通过联系人信息即可获取到所对应的个性语库。
建立针对联系人的个性语库后,对于用户与联系人之后的通信信息,可以继续获取通信中的个性字词,然后添加至所建立的个性语库中。
参见图3,为本发明第三实施例提供的一种通信关联的个性语库的建立方法的流程图,具体步骤如下所述。
S31,采集用户与联系人之间的通信信息;
可通过相应的系统函数获取用户与联系人之间通信信息的数据内容。
S32,获取所述通信信息中的短句信息;
首先采集通信信息中的标点符号,获取每个标点符号之前的语句,然后判断所获取的语句是否满足预设的短句条件,例如预设字数为2-10之间的语句为短句,所获取的语句满足预设条件时,即为短句信息。
S33,判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
所述的预置条件可以设置为短句信息在所述通信信息中出现的次数。例如,可以设置当某个短句信息在用户与联系人的通信信息中出现两次以上时,即满足预置条件,可确定为个性短句。
S34,将所获取的个性短句用来建立针对于该联系人的个性语库;
例如,用户与联系人的通信信息中,满足预置条件的短句信息有“吃饭了吗?”、“身体怎么样?”、“工作顺利吗?”等等,这些即可作为用户与该联系人的个性短句,用来建立针对该联系人的个性语库。
建立针对联系人的个性语库后,对于用户与联系人之后的通信信息,可以继续获取通信中的个性短句,然后添加至所建立的个性语库中。
本发明基于上述一种通信关联的输入方法,还提供一种通信关联的输入系统。参见图4,为本发明第四实施例提供的一种通信关联的输入系统的示意图,该系统包括:
个性语库建立单元41,用以采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
个性语库获取单元42,用以在捕获到用户与所述联系人处于通信状态的情况下,获取所述联系人的个性语库;
个性语库加载单元43,用以针对于用户当前输入法词库,加载所获取的个性语库;
候选词生成单元44,用以采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
个性语库获取单元42与个性语库建立单元41相连,当捕获到用户与所述联系人处于通信状态时,获取个性语库建立单元41所建立的针对该联系人的个性语库;个性语库加载单元43与个性语库获取单元42相连,用于在用户当前的输入法词库中,加载个性语库;候选词生成单元44与个性语库加载单元43相连,基于加载个性语库后的输入法词库进行候选词的生成。
参见图5,为本发明提供的系统中的个性语库建立单元的结构示意图,具体包括:
信息采集模块411,用以采集用户与联系人之间的通信信息;
字词获取模块412,与所述信息采集模块411相连,用以获取所述通信信息中的字词信息;
词频记录模块413,与所述字词获取模块412相连,用于在获取所述通信信息字词信息的过程中,进一步获取字词对应的词频,所述词频为所述通信信息中字词出现的频率。
个性字词获取模块414,与所述字词获取模块412和词频记录模块413相连,用于将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;
个性语库建立模块415,与所述个性字词获取模块414相连,用于将所获取的个性字词用来建立针对于该联系人的个性语库。
参见图6,为本发明提供的系统中的个性语库建立单元的另一种结构示意图,具体包括:
信息采集模块416,用以采集用户与联系人之间的通信信息;
短句获取模块417,与所述信息采集模块416相连,用以获取所述通信信息中的短句信息;
判断模块418,与所述短句获取模块417相连,用于判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
个性语库建立模块419,与所述判断模块418相连,用于将所获取的个性短句用来建立针对于该联系人的个性语库。
以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。

Claims (17)

1.一种通信关联的输入方法,其特征在于该方法包括如下步骤:
步骤1,采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
步骤2,当捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;
步骤3,针对于用户当前输入法词库,加载所获取的个性语库;
步骤4,采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
2.根据权利要求1所述的一种通信关联的输入方法,其特征在于:所述步骤1中建立针对于该联系人的个性语库的过程包括,
采集用户与联系人的通信信息,获取所述通信信息中的字词信息;
将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;
将所获取的个性字词用来建立针对于该联系人的个性语库。
3.根据权利要求2所述的一种通信关联的输入方法,其特征在于:在获取所述通信信息中的字词信息的过程中,进一步获取字词对应的词频,所述词频为所述通信信息中字词出现的频率。
4.根据权利要求2所述的一种通信关联的输入方法,其特征在于:所述获取个性字词的过程为,
判断所获取的字词信息在现有词库中是否存在;
如果不存在,则确定该字词为个性字词。
5.根据权利要求2或3所述的一种通信关联的输入方法,其特征在于:所述获取个性字词的过程为,
判断所获取的字词信息在现有词库中是否存在;
如果不存在,进一步判断该字词对应的词频;
如果所述词频大于或等于预定阈值,则确定该字词为个性字词。
6.根据权利要求2或3所述的一种通信关联的输入方法,其特征在于:所述获取个性字词的过程为,
判断所获取的字词信息在现有词库中是否存在;
如果不存在,则确定该字词为个性字词;
如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;
如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
7.根据权利要求2或3所述的一种通信关联的输入方法,其特征在于:所述获取个性字词的过程为,
判断所获取的字词信息在现有词库中是否存在;
如果不存在,进一步判断该字词对应的词频;如果对应的词频大于或等于预定阈值,则确定该字词为个性字词。
如果存在,则进一步对比该字词的词频和系统词频,所述系统词频为输入法现有词库中现有字词对应的词频信息;如果所述字词的词频与系统词频的比值大于或等于预定阈值,则确定该字词为个性字词。
8.根据权利要求1所述的一种通信关联的输入方法,其特征在于:所述步骤1中建立针对于该联系人的个性语库的过程包括,
采集用户与联系人的通信信息,获取所述通信信息中的短句信息;
判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
将所获取的个性短句用来建立针对于该联系人的个性语库。
9.根据权利要求1所述的一种通信关联的输入方法,其特征在于:当采集到用户打开与所述联系人的通信窗口时,即捕获到用户与所述联系人处于通信状态。
10.根据权利要求1所述的一种通信关联的输入方法,其特征在于:也可采用如下步骤判断用户与所述联系人是否处于通信状态,
采集用户目前打开的与所述联系人的通信窗口;
捕获当前输入信息的光标位置,判断所述光标位置是否在用户与联系人的通信窗口中,如果是,则用户与所述联系人处于通信状态。
11.根据权利要求1所述的一种通信关联的输入方法,其特征在于:还可采用如下步骤判断用户与所述联系人是否处于通信状态,
采集用户目前打开的与所述联系人的通信窗口;
利用钩子函数捕获用户在通信窗口中的按键键值;
判断所捕获的按键键值是否为通信字符对应的键值,如果是,即捕获到用户与所述联系人处于通信状态。
12.根据权利要求1所述的一种通信关联的输入方法,其特征在于:所述步骤3中加载所获取的个性语库之后还包括,
判断用户与联系人的通信窗口是否处于焦点窗口状态,如果是,则针对于该联系人对象的个性语库开启;如果否,则针对于该联系人对象的个性语库关闭。
13.根据权利要求1所述的一种通信关联的输入方法,其特征在于:所述步骤4中基于加载个性语库后的词库进行候选词的生成操作的过程包括,
采集用户针对于所述联系人的输入界面所输入的字符串信息;
在所述个性语库和现有词库中查找所述字符串信息对应的候选词信息;
对于个性语库中查找到的候选词信息,在候选词列表中优先输出。
14.一种通信关联的个性语库的建立方法,其特征在于该方法包括如下步骤:
步骤1,采集用户与联系人之间的通信信息;
步骤2,获取所述通信信息的字词信息或/和短句信息;
步骤3,判断所述字词信息或/和短句信息是否满足预置条件,在满足预置条件的情况下确定为个性字词或/和个性短句;
步骤4,将所获取的个性字词或/和个性短句用来建立用户与所述联系人进行通信的个性语库。
15.一种通信关联的输入系统,其特征在于该系统包括:
个性语库建立单元,用以采集用户与联系人的通信信息,来建立针对于该联系人的个性语库;
个性语库获取单元,与所述个性语库建立单元相连,用以在捕获到用户与所述联系人处于通信状态时,获取所述联系人的个性语库;
个性语库加载单元,与所述个性语库获取单元相连,用以针对于用户当前输入法词库,加载所获取的个性语库;
候选词生成单元,与所述个性语库加载单元相连,用以采集用户针对于所述联系人的输入界面所输入的字符串信息,基于加载个性语库后的词库进行候选词的生成操作。
16.根据权利要求15所述的一种通信关联的输入系统,其特征在于:所述个性语库建立单元包括,
信息采集模块,用以采集用户与联系人之间的通信信息;
字词获取模块,与所述信息采集模块相连,用以获取所述通信信息中的字词信息;
词频记录模块,与所述字词获取单元相连,用于在获取所述通信信息字词信息的过程中,进一步获取字词对应的词频,所述词频为所述通信信息中字词出现的频率。
个性字词获取模块,与所述字词获取单元和相连词频记录单元,用于将获取的字词信息与输入法现有词库中的字词信息进行比较,根据比对结果获取个性字词;
个性语库建立模块,与所述个性字词获取模块相连,用于将所获取的个性字词用来建立针对于该联系人的个性语库。
17.根据权利要求15所述的一种通信关联的输入系统,其特征在于:所述个性语库建立单元包括,
信息采集模块,用以采集用户与联系人之间的通信信息;
短句获取单元,与所述信息采集模块相连,用以获取所述通信信息中的短句信息;
判断模块,与所述短句获取单元相连,用于判断所述短句信息是否满足预置条件,在满足预置条件的情况下确定为个性短句;
个性语库建立模块,与所述判断模块相连,用于将所获取的个性短句用来建立针对于该联系人的个性语库。
CN2011102965477A 2011-10-02 2011-10-02 一种通信关联的输入方法、个性语库及系统 Pending CN102508554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102965477A CN102508554A (zh) 2011-10-02 2011-10-02 一种通信关联的输入方法、个性语库及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102965477A CN102508554A (zh) 2011-10-02 2011-10-02 一种通信关联的输入方法、个性语库及系统

Publications (1)

Publication Number Publication Date
CN102508554A true CN102508554A (zh) 2012-06-20

Family

ID=46220654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102965477A Pending CN102508554A (zh) 2011-10-02 2011-10-02 一种通信关联的输入方法、个性语库及系统

Country Status (1)

Country Link
CN (1) CN102508554A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246703A (zh) * 2013-04-03 2013-08-14 百度在线网络技术(北京)有限公司 一种用于确定应用词库的方法和设备
CN103399906A (zh) * 2013-07-29 2013-11-20 百度在线网络技术(北京)有限公司 在进行输入时基于社会关系提供候选词的方法和装置
CN103488307A (zh) * 2013-09-23 2014-01-01 宇龙计算机通信科技(深圳)有限公司 一种调整输入法的方法、系统及移动终端
WO2014032266A1 (en) * 2012-08-31 2014-03-06 Microsoft Corporation Personal language model for input method editor
CN104281273A (zh) * 2014-09-03 2015-01-14 深圳市金立通信设备有限公司 一种终端
CN104281274A (zh) * 2014-09-03 2015-01-14 深圳市金立通信设备有限公司 一种输入法
CN105159472A (zh) * 2015-06-30 2015-12-16 小米科技有限责任公司 输入法切换方法及装置
CN106371711A (zh) * 2015-07-20 2017-02-01 联想(北京)有限公司 一种信息输入方法及电子设备
CN106681523A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 一种输入法的字库配置方法、装置以及调用处理方法
CN106774983A (zh) * 2016-12-29 2017-05-31 努比亚技术有限公司 一种输入方法和设备
CN106886296A (zh) * 2017-02-15 2017-06-23 中国联合网络通信集团有限公司 输入法的词库的处理方法和装置
CN107832035A (zh) * 2017-11-13 2018-03-23 赵桂银 一种智能终端的语音输入方法
CN108399013A (zh) * 2018-03-16 2018-08-14 北京搜狗科技发展有限公司 一种用户词添加方法及装置
CN109669550A (zh) * 2017-10-17 2019-04-23 北京搜狗科技发展有限公司 一种获取用户词库的方法和装置
CN110413133A (zh) * 2018-04-27 2019-11-05 北京搜狗科技发展有限公司 一种输入方法及装置
CN113504836A (zh) * 2021-09-06 2021-10-15 北京翰凌科技有限公司 一种信息输入方法和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924858A (zh) * 2006-08-09 2007-03-07 北京搜狗科技发展有限公司 一种获取新词的方法、装置以及一种输入法系统
WO2008098507A1 (fr) * 2007-02-13 2008-08-21 Beijing Sogou Technology Development Co., Ltd. Méthode de saisie permettant de combiner des mots de façon intelligente, système associé à la méthode de saisie et méthode de renouvellement
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法系统、方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924858A (zh) * 2006-08-09 2007-03-07 北京搜狗科技发展有限公司 一种获取新词的方法、装置以及一种输入法系统
WO2008098507A1 (fr) * 2007-02-13 2008-08-21 Beijing Sogou Technology Development Co., Ltd. Méthode de saisie permettant de combiner des mots de façon intelligente, système associé à la méthode de saisie et méthode de renouvellement
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101571758A (zh) * 2009-06-04 2009-11-04 腾讯科技(深圳)有限公司 一种输入法系统、方法和装置

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052489A (zh) * 2012-08-31 2018-05-18 微软技术许可有限责任公司 用于输入法编辑器的个人语言模型
US9824085B2 (en) 2012-08-31 2017-11-21 Microsoft Technology Licensing, Llc Personal language model for input method editor
WO2014032266A1 (en) * 2012-08-31 2014-03-06 Microsoft Corporation Personal language model for input method editor
CN104823135A (zh) * 2012-08-31 2015-08-05 微软技术许可有限责任公司 用于输入法编辑器的个人语言模型
CN103246703A (zh) * 2013-04-03 2013-08-14 百度在线网络技术(北京)有限公司 一种用于确定应用词库的方法和设备
CN103399906B (zh) * 2013-07-29 2015-07-29 百度在线网络技术(北京)有限公司 在进行输入时基于社会关系提供候选词的方法和装置
CN103399906A (zh) * 2013-07-29 2013-11-20 百度在线网络技术(北京)有限公司 在进行输入时基于社会关系提供候选词的方法和装置
CN103488307A (zh) * 2013-09-23 2014-01-01 宇龙计算机通信科技(深圳)有限公司 一种调整输入法的方法、系统及移动终端
CN103488307B (zh) * 2013-09-23 2017-10-17 宇龙计算机通信科技(深圳)有限公司 一种调整输入法的方法、系统及移动终端
CN104281274A (zh) * 2014-09-03 2015-01-14 深圳市金立通信设备有限公司 一种输入法
CN104281273A (zh) * 2014-09-03 2015-01-14 深圳市金立通信设备有限公司 一种终端
CN105159472A (zh) * 2015-06-30 2015-12-16 小米科技有限责任公司 输入法切换方法及装置
CN106371711A (zh) * 2015-07-20 2017-02-01 联想(北京)有限公司 一种信息输入方法及电子设备
CN106681523A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 一种输入法的字库配置方法、装置以及调用处理方法
CN106774983A (zh) * 2016-12-29 2017-05-31 努比亚技术有限公司 一种输入方法和设备
CN106886296A (zh) * 2017-02-15 2017-06-23 中国联合网络通信集团有限公司 输入法的词库的处理方法和装置
CN109669550A (zh) * 2017-10-17 2019-04-23 北京搜狗科技发展有限公司 一种获取用户词库的方法和装置
CN107832035A (zh) * 2017-11-13 2018-03-23 赵桂银 一种智能终端的语音输入方法
CN107832035B (zh) * 2017-11-13 2021-03-12 深圳市矽昊智能科技有限公司 一种智能终端的语音输入方法
CN108399013A (zh) * 2018-03-16 2018-08-14 北京搜狗科技发展有限公司 一种用户词添加方法及装置
CN108399013B (zh) * 2018-03-16 2022-08-09 北京搜狗科技发展有限公司 一种用户词添加方法及装置
CN110413133A (zh) * 2018-04-27 2019-11-05 北京搜狗科技发展有限公司 一种输入方法及装置
CN110413133B (zh) * 2018-04-27 2024-04-26 北京搜狗科技发展有限公司 一种输入方法及装置
CN113504836A (zh) * 2021-09-06 2021-10-15 北京翰凌科技有限公司 一种信息输入方法和电子设备

Similar Documents

Publication Publication Date Title
CN102508554A (zh) 一种通信关联的输入方法、个性语库及系统
CN106407178B (zh) 一种会话摘要生成方法、装置、服务器设备以及终端设备
CN107688398B (zh) 确定候选输入的方法和装置及输入提示方法和装置
Jafarpour et al. Filter, rank, and transfer the knowledge: Learning to chat
CN102073704B (zh) 文本分类处理方法和系统以及设备
CN109829039A (zh) 智能聊天方法、装置、计算机设备及存储介质
CN110059169B (zh) 基于语料标注的智能机器人聊天上下文实现方法及系统
US10853716B2 (en) Systems and methods for a mathematical chat bot
CN105975530A (zh) 基于聊天大数据知识库的机器人对话控制方法和系统
CN103189114A (zh) 在线环境中的情境聊天消息生成
CN103956169A (zh) 一种语音输入方法、装置和系统
CN103190124A (zh) 基于行为和运用的情境聊天
CN107977928A (zh) 表情生成方法、装置、终端及存储介质
CN110930980A (zh) 一种中英文混合语音的声学识别模型、方法及系统
CN102651719A (zh) 用于在消息交互环境中跟踪消息话题的方法和设备
CN109035001A (zh) 智能语音应答处理方法及系统
CN108345612A (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN113505198A (zh) 关键词驱动的生成式对话回复方法、装置及电子设备
CN106708950B (zh) 用于智能机器人自学习系统的数据处理方法及装置
Ashok et al. Sarcasm detection using genetic optimization on LSTM with CNN
US20170229118A1 (en) Linguistic model database for linguistic recognition, linguistic recognition device and linguistic recognition method, and linguistic recognition system
CN117173497B (zh) 一种图像生成方法、装置、电子设备及存储介质
CN104166455A (zh) 用于确定目标用户所对应的输入模型的方法与设备
CN106874294A (zh) 一种信息匹配方法及装置
CN117271745A (zh) 一种信息处理方法、装置及计算设备、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120620