CN104133855B - 一种输入法智能联想的方法及装置 - Google Patents

一种输入法智能联想的方法及装置 Download PDF

Info

Publication number
CN104133855B
CN104133855B CN201410332524.0A CN201410332524A CN104133855B CN 104133855 B CN104133855 B CN 104133855B CN 201410332524 A CN201410332524 A CN 201410332524A CN 104133855 B CN104133855 B CN 104133855B
Authority
CN
China
Prior art keywords
keyword
weights
input
dictionary
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410332524.0A
Other languages
English (en)
Other versions
CN104133855A (zh
Inventor
张旭光
郭华朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tancheng Medical Chemical Industry Development Group Co ltd
Original Assignee
China Security and Fire Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Security and Fire Technology Co Ltd filed Critical China Security and Fire Technology Co Ltd
Priority to CN201410332524.0A priority Critical patent/CN104133855B/zh
Publication of CN104133855A publication Critical patent/CN104133855A/zh
Application granted granted Critical
Publication of CN104133855B publication Critical patent/CN104133855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries

Abstract

本发明涉及智能输入技术领域,公开了一种输入法智能联想的方法及装置。所述方法包括:根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级;当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。通过本发明的方法能够提高输入法智能联想的准确性。

Description

一种输入法智能联想的方法及装置
技术领域
本发明涉及智能输入技术领域,尤其涉及一种输入法智能联想的方法及装置。
背景技术
为了便于用户通过输入法输入字符,输入法软件会根据用户输入的字符进行智能联想,以便于提供联想词汇供用户选择。例如,用户通过输入法软件输入“H”时,输入法会推荐“好”、“和”、“或”等联想词汇给用户。多数智能联想输入法采用对用户输入的历史词汇进行分析处理,完成智能联想的,并没有考虑用户当前的需求,因此根据历史词汇进行智能联想的准确性相对较低。因此,如何预测用户当前的需求并根据用户当前的需求实现智能联想,提高智能联想的准确性,是亟需解决的问题。
发明内容
本发明的目的是提供一种输入法智能联想的方法及装置,以克服相关技术中根据历史词汇进行智能联想的准确度较低的问题。
本发明提供一种输入法智能联想的方法,包括:
根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;
根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级;
当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
本发明还提供一种输入法智能联想的装置,,所述装置包括:
分析模块,用于根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;
优先级确定模块,用于根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级;
获取模块,用于当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
本发明至少具有以下有益效果:根据输入法所处的语义环境,确定输入法的至少两个词库的优先级,当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户,从而实现根据输入法所处的语义环境定位词库,通过准确定位词库,可以极大的提高智能输入的预测效率,从而提高输入法智能联想的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
图1为本发明实施例中输入法智能联想的方法的流程图;
图2为本发明实施例中输入法智能联想的方法的另一流程图;
图3为本发明实施例中输入法智能联想的方法的另一流程图;
图4为本发明实施例中输入法智能联想的方法的另一流程图;
图5为本发明实施例中输入法智能联想的装置的示意图;
图6为本发明实施例中输入法智能联想的装置的另一示意图。
具体实施方式
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种输入法智能联想的方法,适用于包含至少两个词库的输入法。本发明实施例提供的输入法智能联想的方法可以单独使用,也可以与现有技术中的根据用户输入的字符联想词汇的智能联想技术结合使用。
用户当前浏览或编辑的内容为用户当前关注的对象,用户通过输入法输入的字符与当前内容所包含的语义环境的关联最为密切,因此可根据根据输入法的语义环境预估用户输入时的需求,本发明实施例中的语义环境指输入法所处的环境上下文,例如用户在浏览一篇介绍计算机的网页时,该输入法所处的语义环境可以认为是计算机相关的内容。在本发明实施例提供的方案中,根据输入法所处的语义环境,确定输入法的至少两个词库的优先级,当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。本发明实施例能够实现根据输入法所处的语义环境定位词库,通过准确定位词库,可以极大的提高智能输入的预测效率,从而提高输入法智能联想的准确性。下面对本发明实施例中输入法智能联想的方法进行详细说明。
实施例一
如图1所示,为本发明实施例提供的输入法智能联想的方法的流程图,该方法包括:
步骤101:根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库。
其中,在一个实施例中,当前界面包括:网页、可编辑文档或输入对话框等,在本发明实施例中,包含字符信息的当前界面均适用于本发明实施例,在此不做限定。
其中,输入法包含的至少两个词库是输入法自身预先根据预设的词库分类规则建立的词库,例如词库可以分为计算机类词库、医学类词库、风景名胜词库等。
其中,字符是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~、!、#、¥、%、……、—、*、()、——、+、以及汉字等等。
步骤102:根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级。
其中,在一个实施例中,输入法包含的至少两个词库是根据语义环境进行优先级的排列。例如当词库分为计算机类词库、医学类词库、通用词库时,若输入法当前的语义环境为计算机方向的内容,则可以设置计算机类词库的优先级最高。
步骤103:当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
其中,在一个实施例中,步骤103可执行为:若词库的优先级顺序依次为计算机类词库、医学类词库、通用词库时,则优先从计算机类词库中获取联想词汇推荐给用户。例如,若预设推荐的联想词汇的数量为6个,若计算机类词库中有7个与用户输入的字符对应的联想词汇,医学类词库中有5个与用户输入的字符对应的联想词汇,通用词库中有3个与用户输入的字符对应的联想词汇,则首先从计算机类词库获取6个与用户输入的字符对应的联想词汇推荐给用户,然后再依次从医学类词库、通用词库获取与用户输入的字符对应的联想词汇推荐给用户。
下面对上述步骤101-103进行详细说明:
其中,在一个实施例中,步骤101可执行为步骤A1-A4:
步骤A1:根据当前界面中的字符信息,获取当前界面中的关键词,并记录各关键词的权值参数;其中,该权值参数用于计算关键词的权值,该权值参数包括各关键词出现的频率和/或各关键词在当前界面中所属的预设分类。其中,当权值参数包括各关键词出现的频率和各关键词在当前界面中所属的预设分类时,可以记录各预设分类下各关键词出现的频率。例如,关键词W属于预设分类A和预设分类B,则可以记录关键词W在预设分类A中出现的频率和预设分类B中出现的频率。
其中,在一个实施例中,当前界面为网页时,预设分类至少包括以下中的一种或几种:网页标题、网页对应网站的网站介绍信息、网页的向导、网页中的链接和网页的正文等。
当前界面为可编辑文档时,预设分类至少包括以下中的一种或几种:可编辑文档的文件名、可编辑文档的主标题、可编辑文档的副标题、可编辑文档的章节的标题、可编辑文档的首段内容、可编辑文档的尾段内容、可编辑文档中除首段内容和尾段内容以外的其他段落的首句内容和尾句内容、可编辑文档的正文等。其中,当可编辑文档中包括目录时,可以用目录代替可编辑文档的章节的标题,即可以理解为将获取目录中的关键词,代替获取可编辑文档的章节的标题中的关键词。
当前界面为输入对话框时,预设分类至少包括以下中的一种或几种:输入对话框对应的进程名称、输入对话框的标题、输入对话框中除标题和按钮以外的字符内容、输入对话框对应的进程的启动命令行、输入对话框对应的进程的父进程的启动命令行、输入对话框的按钮中的字符内容等。
需要说明的是,可以根据当前界面的具体情况设置预设分类,均适用于本发明实施例,在此不做限定
步骤A2:根据各关键词的权值参数和预设规则,确定各关键词的权值。
步骤A3:根据权值从高到低的顺序,对获取的关键词进行排序。
步骤A4:获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
通过获取对当前界面中的关键词,并根据关键词出现的频率和/或位置,确定该关键词的权值,并用权值较高的关键词表示输入法当前所处的语义环境,有利于准确、方便的分析输入法所处的环境上下文,从而准确的预测输入法所处的语义环境。
其中,在一个实施例中,步骤A2可根据以下三种方式执行:
方式一
当权值参数中包括各关键词出现的频率时,将关键词出现的频率作为对应关键词的权值。
通过频率确定关键词的权值,确定关键词的权值的方法较简单快捷,能够提高确定关键词的权值效率。
方式二
当权值参数中包括各关键词对应的预设分类时,根据第一权值计算公式确定各关键词的权值,其中,第一权值计算公式如公式(1)所示:
在第一权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;zij取0或1,其中,当关键词j在预设分类i中时zij取1,当关键词j不在预设分类i中时zij取0;N表示预设分类的总分类数。
通过关键词所属的预设分类确定关键词的权值,例如当关键词所属的预设分类为标题时,因为标题本身为当前界面包含的内容的核心,可以将标题的预设权重设置较大,而正文内容的预设权重相对较低,从而可以从主要的预设分类中,大致确定语义环境,从而利用次要的预设分类对确定的语义环境进行修正,从而使得最终确定的关键词的权值更为合理,进而在用权值较高的关键词表示语义环境时,能够提高确定输入法所处的语义环境的准确性。
方式三
当权值参数中包括各关键词出现的频率和各关键词对应的预设分类时,根据第二权值计算公式确定各关键词的权值,其中,第二权值计算公式如公式(2)所示:
在第二权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;λj表示关键词j在预设分类i中的出现的频率;N表示预设分类的总分类数。
通过综合考虑关键词出现的频率和关键词对应的预设分类确定关键词的权值,实现较全面的将多种能够表示语义环境的因素考虑在内,去确定关键词的权值,从而进一步提高了确定关键词的权值的准确性,进而在用权值较高的关键词表示语义环境时,能够进一步提高确定输入法所处的语义环境的准确性。
其中,在一个实施例中,步骤102可执行为步骤B1-B2:
步骤B1:将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库。
步骤B2:将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高。
通过将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,实现将与语义环境相关性最高的词库设置为优先级最高的词库,以便于在用户输入时,能够从优先级最高的词库(即和输入法所处的语义环境相关性最高)的词库中获取智能联想的词汇,从而能够提高智能联想词汇的准确性。
其中,在一个实施例中,步骤103可以执行为以下步骤:
步骤C1:当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,从输入法包含的各词库中获取预设数量的与用户输入的字符对应的联想词汇;
步骤C2:按照词库的优先级从高到低的顺序,将对应词库的与用户输入的字符对应的联想词汇进行排序,并将排序后的联想词汇推荐给用户。
其中,例如词库的优先级顺序依次为计算机类词库、医学类词库、通用词库时,若预设数量为2,则可以分别从计算机类词库获取2个联想词汇D1、D2,从医学类词库获取2个联想词汇D3、D4、从通用词库中获取2个联想词汇D5、D6。按照词库的优先级从高到低的顺序对联想词汇的排序为:D1、D2、D3、D4、D5、D6,并按照这个顺序推荐给用户。
通过按照词库的优先级从高到低的顺序,为用户推荐联想词汇,优先将优先级最高的词库中的词汇(即与输入法所处的语义环境相关性最高)推荐给用户,从而能够提高智能联想的准确性。
下面通过几个简单的实施例,对本发明实施例中输入法智能联想的方法进行详细说明。
实施例二
如图2所示,以当前界面为网页为例,对本发明实施例中的输入法智能联想的方法进行详细说明,该方法包括以下步骤:
步骤201:分析网页的URL(Uniform Resource Locator,统一资源定位器),并通过网页的URL获取该网页对应网站的网站介绍信息。
其中,可以通过网页的URL获得该网页对应网站的域名,根据网站的域名进入该网站,然后获取该网站的网站介绍信息。例如可以根据网站首页的关键词“站点介绍”等确定网站的介绍信息并获取该介绍信息。任何可以通过当前界面中的字符获取网站介绍信息的方法均适用于本发明实施例,在此不做限定。
步骤202:获取各预设分类中的关键词,并记录各关键词在各预设分类中出现的频率,其中,预设分类包括网页标题、网站介绍信息、网页的向导、网页中的链接和网页的正文。
其中,可以通过网页的源代码获取关键词并确定该关键词所属的预设分类。例如,在HTML(HyperText Markup language,超级文本标记语言)网页中,可以通过分析HTML网页源代码确定预设分类,以及获取预设分类中的关键词。例如可以通过网页源代码中的“<title>”标签确定网页标题位置,并获取网页标题中的关键词。其他预设分类(包括网页的向导、网页中的链接和网页的正文)的关键词获取及确定关键词所属预设分类的方法与上述分析网页源代码获取网页标题中的关键词的方法相同,在此不再赘述。
步骤203:根据各关键词对应的预设分类以及在该分类中的出现的频率,以及第二权值计算公式,确定各关键词的权值。
其中,第二权值计算公式与实施例一种的公式二相同,在此不再赘述。
其中,从各预设分类中获取的关键词如表1所示,表1中列出了各关键词对应的预设分类,以及各预设分类对应的预设权重。在表1中,网页中的链接一般都是对页面内容的一种补充和扩展,和网页内容具有非常好的相关性。这些链接,能够从另一个侧面,准确反映网页所处的环境上下文,有利于准确分析输入法所处的语义环境,所以网页中的链接对应的预设权值相对较高。
表1 关键词相关信息
其中,根据表1,可以得出各关键词对应的权值,如表2所示。
表2 各关键词对应的权值
关键词 权值
Android 320
Activity 115
布局 100
学习 100
计算机 120
程序开发 50
详解 40
步骤204:根据权值从高到低的顺序,对获取的关键词进行排序。
其中,排序后的关键词如表3所示。
表3 关键词排序
序号 关键词 权值
1 Android 320
2 计算机 120
3 Activity 115
4 布局 100
5 学习 100
6 程序开发 50
7 详解 40
步骤205:获取排序靠前的5个的关键词,作为输入法所处的语义环境。
其中,从表3可以看出获取的排序靠前的5个定位关键词分别为:Android、计算机、Activity、布局、学习。
步骤206:将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库。
步骤207:将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高。
其中,各定位关键词对应的词库以及该词库的权值如表4所示。
表4 定位关键词对应词库及词库的权值
步骤208:当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
其中,例如,当用户输入字符为“h”时,则优先从词库A中获取与语义环境最为接近的联想词汇“Handler”,而并不是通用词库中与输入法所处语义环境无关的“好”、“和”、“话”等等。
本发明实施例通过分析输入法所处的网页的语义环境,确定输入法的词库的优先级顺序,使得当用户向该网页输入内容时,可以优先从与该网页的语义环境相关性最高的词库(即优先级最高的词库)中获取智能联想的词汇,从而提高了输入法智能联想的准确性。
需要说明的是,可以先获取预设权重较大的预设分类(可以理解为重要位置)的关键词,然后再依次获取其它预设分类中的关键词,通过不断的获取其它预设分类的关键词并重新计算获取的各关键词的权值,对之前获取的关键词的权值进行调整,从而逐步的调整各关键词对应的权值,以便于能够通过交全面的信息确定关键词的权值,以使用关键词表示的语义环境能够更加准确。该方法的详细说明请参见实施例三。
实施例三
如图3所示,以当前界面为可编辑文档为例,对本发明实施例中的输入法智能联想的方法进行详细说明,该方法包括以下步骤:
其中,在可编辑文档中按照预设权值从高到低的顺序排序的预设分类依次为:可编辑文档的文件名、可编辑文档的主标题、可编辑文档的副标题、可编辑文档的章节的标题、可编辑文档的首段内容、可编辑文档的尾段内容、可编辑文档中除首段内容和尾段内容以外的其他段落的首句内容和尾句内容、可编辑文档的正文。
其中,各预设分类对应的预设权值可以如表5所示。
表5 可编辑文档的预设分类对应的预设权重
步骤301:获取可编辑文档的文件名“关于房地产的项目评估报告”。
步骤302:获取可编辑文档的文件名中的关键词“房地产”、“项目”、“评估”、“报告”,并记录各关键词的权值参数。
步骤303:获取可编辑文档中的主标题和副标题中的关键词,其中:“房地产”1个、“项目”1个、“评估”1个、“报告”1个、“北京”1个,并记录各关键词的权值参数。
步骤304:根据各关键词的权值参数和预设规则,确定步骤302和步骤303中获取的各关键词的权值。
其中,执行步骤304之后,各关键词的权值如表6所示。
表6 可编辑文档关键词及对应权值
关键词 权值
房地产 300
项目 300
评估 300
报告 300
北京 100
步骤305:获取可编辑文档中的章节的标题中的关键词,其中:“房地产”2个、“房屋”20个,并记录该关键词的权值参数。
步骤306:根据权值参数和预设规则,重新确定步骤302-305中获取的各关键词的权值。
其中,执行步骤306之后,可编辑文档的关键词及对应权值如表7所示。
表7 调整后可编辑文档关键词及对应权值
关键词 权值
房地产 340
项目 300
评估 300
报告 300
北京 100
房屋 400
其中,在步骤306之后还可以获取以下两个预设分类中的关键词:可编辑文档中除首段内容和尾段内容以外的其他段落的首句内容和尾句内容、可编辑文档的正文。然后,重新确定各步骤中获取的关键词的权值,以便于为确定语义环境不断的适当的调整关键词的权值。
步骤307:获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
步骤308:将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库。
步骤309:将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高。
步骤310:当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
例如,当检测到用户输入字母“F”后,将从优先级最高的词库中获取“房地产”、“房产”、“房屋”等相关词汇并推荐给用户,而不会优先获取“飞”、“分”、“法”之类的与语义环境无关的通用词库中的词汇。
在本发明实施例中,在步骤310之后,还可以根据用户向可编辑文档中添加的新字符,不断添加新的关键词并重新确定各关键词对应的权值,以便于能够实时的根据用户输入的内容确定各关键词的权值,以便于实时地重新确定词库的优先级,并在下一次用户输入时从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
本发明实施例实现先获取预设权重较大的预设分类的关键词,然后再依找预设权值由高到低的顺序依次获取其它预设分类中的关键词,并不断调整获取的关键词的权值,以便于能够通过交全面的信息确定关键词的权值,以使用关键词表示的语义环境能够更加准确,从而提高输入法智能联想的准确性。
实施例四
如图4所示,以当前界面为输入对话框为例,对本发明实施例中的输入法智能联想的方法进行详细说明,该方法包括以下步骤:
步骤401:获取输入对话框的预设分类中的关键词,并记录各关键词的权值参数,其中,该预设分类至少包括以下中的一种或几种:输入对话框对应的进程名称、输入对话框的标题、输入对话框中除标题和按钮以外的字符内容、输入对话框对应的进程的启动命令行、输入对话框对应的进程的父进程的启动命令行、输入对话框的按钮中的字符内容。
步骤402:根据各关键词的权值参数和预设规则,确定各关键词的权值。
步骤403:根据权值从高到低的顺序,对获取的关键词进行排序。
步骤404:获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
步骤405;将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库。
步骤406:将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高。
步骤407:当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,从输入法包含的各词库中获取预设数量的与用户输入的字符对应的联想词汇。
步骤408:按照词库的优先级从高到低的顺序,将对应词库的与用户输入的字符对应的联想词汇进行排序,并将排序后的联想词汇推荐给用户。
本发明实施例实现对输入对话框的语义环境的分析,并根据语义环境确定输入法包含的各词库的优先级,当检测到用户输入时根据用户的输入,可以按照词库的优先级顺序向用户推荐联想词汇,从而能够提高输入法智能联想的准确性。
需要说明的是,上述各实施例提供的各表格及各表格中的内容仅用于解释说明本发明实施例,并不用于限定本发明实施例。
本发明实施例中还提供一种输入法智能联想的装置,如图5所示,该装置包括:
分析模块501,用于根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;
优先级确定模块502,用于根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级;
获取模块503,用于当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
其中,在一个实施例中,如图6所示,分析模块501包括:
第一获取单元504,用于根据当前界面中的字符信息,获取当前界面中的关键词,并记录各关键词的权值参数;其中,该权值参数用于计算关键词的权值,该权值参数包括各关键词出现的频率和/或各关键词在当前界面中所属的预设分类;
权值确定单元505,用于根据各关键词的权值参数和预设规则,确定各关键词的权值;
排序单元506,用于根据权值从高到低的顺序,对获取的关键词进行排序;
第二获取单元507,用于获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
其中,在一个实施例中,如图6所示,优先级确定模块502包括:
词库确定单元508,用于将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库;
优先级确定单元509,用于将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高。
其中,在一个实施例中,权值确定单元505包括:
第一权值确定子单元,用于当权值参数中包括各关键词出现的频率时,将关键词出现的频率作为对应关键词的权值;
或者,
第二权值确定子单元,当权值参数中包括各关键词对应的预设分类时,根据第一权值计算公式确定各关键词的权值,其中,第一权值计算公式为:
在第一权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;zij取0或1,其中,当关键词j在预设分类i中时zij取1,当关键词j不在预设分类i中时zij取0;N表示预设分类的总分类数;
或者,
第三权值确定子单元,当权值参数中包括各关键词出现的频率和各关键词对应的预设分类时,根据第二权值计算公式确定各关键词的权值,其中,第二权值计算公式为:
在第二权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;λj表示关键词j在预设分类i中的出现的频率;N表示预设分类的总分类数。
其中,在一个实施例中,如图6所示,获取模块503包括:
词汇获取单元510,用于在优先级确定模块根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级之后,当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,从输入法包含的各词库中获取预设数量的与用户输入的字符对应的联想词汇;
词汇排序推荐单元511,用于按照词库的优先级从高到低的顺序,将对应词库的与用户输入的字符对应的联想词汇进行排序,并将排序后的联想词汇推荐给用户。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或至少两个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或至少两个流程和/或方框图一个方框或至少两个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或至少两个流程和/或方框图一个方框或至少两个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或至少两个流程和/或方框图一个方框或至少两个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种输入法智能联想的方法,其特征在于,所述方法包括:
根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;
将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库,并将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高;
当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述根据当前界面中的字符信息,分析输入法所处的语义环境,包括:
根据当前界面中的字符信息,获取当前界面中的关键词,并记录各关键词的权值参数;其中,该权值参数用于计算关键词的权值,该权值参数包括各关键词出现的频率和/或各关键词在当前界面中所属的预设分类;
根据各关键词的权值参数和预设规则,确定各关键词的权值;
根据权值从高到低的顺序,对获取的关键词进行排序;
获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
3.根据权利要求2所述的方法,其特征在于,所述根据各关键词的权值参数和预设规则,确定各关键词的权值,包括:
当权值参数中包括各关键词出现的频率时,将关键词出现的频率作为对应关键词的权值;
或者,
当权值参数中包括各关键词对应的预设分类时,根据第一权值计算公式确定各关键词的权值,其中,第一权值计算公式为:
<mrow> <msub> <mi>Q</mi> <mi>j</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow>
在第一权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;zij取0或1,其中,当关键词j在预设分类i中时zij取1,当关键词j不在预设分类i中时zij取0;N表示预设分类的总分类数;
或者,
当权值参数中包括各关键词出现的频率和各关键词对应的预设分类时,根据第二权值计算公式确定各关键词的权值,其中,第二权值计算公式为:
<mrow> <msub> <mi>Q</mi> <mi>j</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>&amp;lambda;</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow>
在第二权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;λj表示关键词j在预设分类i中的出现的频率;N表示预设分类的总分类数。
4.根据权利要求2-3中任一所述的方法,其特征在于,所述当前界面包括:网页、可编辑文档或输入对话框。
5.根据权利要求4所述的方法,其特征在于,
当前界面为网页时,所述预设分类至少包括以下中的一种或几种:网页标题、网页对应网站的网站介绍信息、网页的向导、网页中的链接和网页的正文;
当前界面为可编辑文档时,所述预设分类至少包括以下中的一种或几种:可编辑文档的文件名、可编辑文档的主标题、可编辑文档的副标题、可编辑文档的章节的标题、可编辑文档的首段内容、可编辑文档的尾段内容、可编辑文档中除首段内容和尾段内容以外的其他段落的首句内容和尾句内容、可编辑文档的正文;
当前界面为输入对话框时,所述预设分类至少包括以下中的一种或几种:输入对话框对应的进程名称、输入对话框的标题、输入对话框中除标题和按钮以外的字符内容、输入对话框对应的进程的启动命令行、输入对话框对应的进程的父进程的启动命令行、输入对话框的按钮中的字符内容。
6.根据权利要求1所述的方法,其特征在于,所述当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户,包括:
当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,从输入法包含的各词库中获取预设数量的与用户输入的字符对应的联想词汇;
按照词库的优先级从高到低的顺序,将对应词库的与用户输入的字符对应的联想词汇进行排序,并将排序后的联想词汇推荐给用户。
7.一种输入法智能联想的装置,其特征在于,所述装置包括:
分析模块,用于根据当前界面中的字符信息,分析输入法所处的语义环境,其中该输入法包含至少两个词库;
优先级确定模块,用于将获取的排序靠前的预设数量的关键词,作为用于定位词库的定位关键词,并确定各个定位关键词所属的词库,并将属于同一词库的定位关键词的权值之和作为对应词库的权值,并根据权值确定对应词库的优先级,其中,权值越高,词库的优先级越高;
获取模块,用于当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,优先从优先级最高的词库中获取与用户输入的字符对应的联想词汇推荐给用户。
8.根据权利要求7所述的装置,其特征在于,所述分析模块包括:
第一获取单元,用于根据当前界面中的字符信息,获取当前界面中的关键词,并记录各关键词的权值参数;其中,该权值参数用于计算关键词的权值,该权值参数包括各关键词出现的频率和/或各关键词在当前界面中所属的预设分类;
权值确定单元,用于根据各关键词的权值参数和预设规则,确定各关键词的权值;
排序单元,用于根据权值从高到低的顺序,对获取的关键词进行排序;
第二获取单元,用于获取排序靠前的预设数量的关键词,作为输入法所处的语义环境。
9.根据权利要求8所述的装置,其特征在于,所述权值确定单元包括:
第一权值确定子单元,用于当权值参数中包括各关键词出现的频率时,将关键词出现的频率作为对应关键词的权值;
或者,
第二权值确定子单元,当权值参数中包括各关键词对应的预设分类时,根据第一权值计算公式确定各关键词的权值,其中,第一权值计算公式为:
<mrow> <msub> <mi>Q</mi> <mi>j</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow>
在第一权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;zij取0或1,其中,当关键词j在预设分类i中时zij取1,当关键词j不在预设分类i中时zij取0;N表示预设分类的总分类数;
或者,
第三权值确定子单元,当权值参数中包括各关键词出现的频率和各关键词对应的预设分类时,根据第二权值计算公式确定各关键词的权值,其中,第二权值计算公式为:
<mrow> <msub> <mi>Q</mi> <mi>j</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>&amp;lambda;</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow>
在第二权值计算公式中,j表示关键词j;Qj表示关键词j的权值;Pi表示关键词j对应的预设分类i的预设权重;λj表示关键词j在预设分类i中的出现的频率;N表示预设分类的总分类数。
10.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
词汇获取单元,用于在所述优先级确定模块根据输入法所处的语义环境,确定该输入法包含的至少两个词库的优先级之后,当检测到通过输入法对当前界面执行输入操作时,根据用户输入的字符,从输入法包含的各词库中获取预设数量的与用户输入的字符对应的联想词汇;
词汇排序推荐单元,用于按照词库的优先级从高到低的顺序,将对应词库的与用户输入的字符对应的联想词汇进行排序,并将排序后的联想词汇推荐给用户。
CN201410332524.0A 2014-07-11 2014-07-11 一种输入法智能联想的方法及装置 Active CN104133855B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410332524.0A CN104133855B (zh) 2014-07-11 2014-07-11 一种输入法智能联想的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410332524.0A CN104133855B (zh) 2014-07-11 2014-07-11 一种输入法智能联想的方法及装置

Publications (2)

Publication Number Publication Date
CN104133855A CN104133855A (zh) 2014-11-05
CN104133855B true CN104133855B (zh) 2017-12-19

Family

ID=51806533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410332524.0A Active CN104133855B (zh) 2014-07-11 2014-07-11 一种输入法智能联想的方法及装置

Country Status (1)

Country Link
CN (1) CN104133855B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104375663A (zh) * 2014-11-11 2015-02-25 广东欧珀移动通信有限公司 一种联想输入方法及装置
CN106202087A (zh) * 2015-05-04 2016-12-07 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
CN105117030A (zh) * 2015-07-31 2015-12-02 Tcl海外电子(惠州)有限公司 输入法中联想词汇的推荐方法及终端
CN105205045A (zh) * 2015-09-21 2015-12-30 上海智臻智能网络科技股份有限公司 一种用于智能交互的语义模型方法
CN107423277A (zh) * 2016-02-16 2017-12-01 中兴通讯股份有限公司 一种表情输入方法、装置及终端
CN109240511A (zh) * 2017-07-04 2019-01-18 北京搜狗科技发展有限公司 一种更新词库的方法、系统和一种用于更新词库的装置
CN109213469A (zh) * 2018-08-27 2019-01-15 四川长虹电器股份有限公司 语音输入法词库优先级自动调整方法及系统
CN109634436B (zh) * 2018-10-25 2023-11-10 平安科技(深圳)有限公司 输入法的联想方法、装置、设备及可读存储介质
CN109669551A (zh) * 2018-11-06 2019-04-23 闽江学院 一种输入法信息处理方法及装置
CN109683723A (zh) * 2018-11-06 2019-04-26 闽江学院 一种在输入法系统中处理文库的控制方法及装置
CN109725740A (zh) * 2018-11-12 2019-05-07 闽江学院 一种文本编辑处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847159A (zh) * 2010-05-11 2010-09-29 中兴通讯股份有限公司 终端设备及其词库更新的方法
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645065B (zh) * 2008-08-05 2016-02-24 北京搜狗科技发展有限公司 确定需要加载的辅助词库的方法、装置及输入法系统
CN103365833B (zh) * 2012-03-28 2016-06-08 百度在线网络技术(北京)有限公司 一种基于上下文场景的输入候选词提示方法及系统
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
CN103116601A (zh) * 2012-12-26 2013-05-22 天津三星通信技术研究有限公司 一种提高输入法智能联想准确度的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847159A (zh) * 2010-05-11 2010-09-29 中兴通讯股份有限公司 终端设备及其词库更新的方法
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备

Also Published As

Publication number Publication date
CN104133855A (zh) 2014-11-05

Similar Documents

Publication Publication Date Title
CN104133855B (zh) 一种输入法智能联想的方法及装置
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CA2777520C (en) System and method for phrase identification
US8311808B2 (en) System and method for advancement of vocabulary skills and for identifying subject matter of a document
CN103544267B (zh) 一种基于搜索建议词进行搜索的方法以及装置
Chen et al. Data-driven proactive policy assurance of post quality in community q&a sites
CN107590219A (zh) 网页人物主题相关信息提取方法
CN106227756A (zh) 一种基于情感分类的股票指数预测方法及系统
CN102609427A (zh) 舆情垂直搜索分析系统及方法
CN105843796A (zh) 一种微博情感倾向分析方法及装置
Finlayson et al. Overview of annotation creation: Processes and tools
CN110147425A (zh) 一种关键词提取方法、装置、计算机设备及存储介质
US11887011B2 (en) Schema augmentation system for exploratory research
CN109255012A (zh) 一种机器阅读理解的实现方法以及装置
CN108153730A (zh) 一种多义词词向量训练方法及装置
CN106294330A (zh) 一种科技文本挑选方法及装置
Hellrich et al. Exploring diachronic lexical semantics with JeSemE
CN107436916A (zh) 智能提示答案的方法及装置
Chinsha et al. Aspect based opinion mining from restaurant reviews
CN109213998A (zh) 中文错字检测方法及系统
CN112307182A (zh) 一种基于问答系统的伪相关反馈的扩展查询方法
US20120317141A1 (en) System and method for ordering of semantic sub-keys
CN103473356B (zh) 一种篇章级情感分类方法及装置
Goree et al. Investigating the homogenization of web design: A mixed-methods approach
US9875298B2 (en) Automatic generation of a search query

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201120

Address after: 224000: west side of Huanghai Road and south side of Lianyungang Road, Haigang new town, Sheyang Economic Development Zone, Yancheng City, Jiangsu Province

Patentee after: Yancheng Manlan Information Technology Service Co.,Ltd.

Address before: Raycom Information Center 2 Beijing City No. 100086 Haidian District road block C academy north building 17 layer 12-13

Patentee before: CHINA SECURITY & FIRE TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230105

Address after: 276000 Development Zone Management Committee of Tancheng County, Linyi City, Shandong Province 707

Patentee after: Tancheng Medical Chemical Industry Development Group Co.,Ltd.

Address before: 224000 west side of Huanghai Road and south side of Lianyungang Road, Haigang new town, Sheyanggang Economic Development Zone, Sheyang County, Yancheng City, Jiangsu Province

Patentee before: Yancheng Manlan Information Technology Service Co.,Ltd.