CN106774969B - 一种输入方法和装置 - Google Patents

一种输入方法和装置 Download PDF

Info

Publication number
CN106774969B
CN106774969B CN201510812489.7A CN201510812489A CN106774969B CN 106774969 B CN106774969 B CN 106774969B CN 201510812489 A CN201510812489 A CN 201510812489A CN 106774969 B CN106774969 B CN 106774969B
Authority
CN
China
Prior art keywords
word
input
user
suggested
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510812489.7A
Other languages
English (en)
Other versions
CN106774969A (zh
Inventor
王东
余浩
张阔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201510812489.7A priority Critical patent/CN106774969B/zh
Publication of CN106774969A publication Critical patent/CN106774969A/zh
Application granted granted Critical
Publication of CN106774969B publication Critical patent/CN106774969B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种输入方法和装置,涉及输入法技术领域。所述方法包括:识别当前的输入环境;接收用户输入的编辑串;如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词。本申请可以利用搜索环境这一特殊输入环境来有针对性的提升用户体验。并且由于将建议词直接作为了候选词,其展示在候选栏中,在用户的视觉焦点之内,容易被观察到,并且无需用户进行额外的触发操作,直接通过候选栏就能输入用户需求的建议词,符合用户的输入习惯,提高输入效率。

Description

一种输入方法和装置
技术领域
本申请涉及输入法技术领域,特别是涉及一种输入方法和装置。
背景技术
在各种计算机系统中,用户在很多环境中均需要用到输入法输入文字信息。输入法的基本流程是用户通过键盘在输入法中输入编辑串,然后输入法利用词库将编辑串转换为默认的各个候选词,用户则可选择具体的候选词上屏,完成输入过程。
在很多搜索环境下,服务器还会为用户输入的搜索词提供搜索建议功能,上述搜索建议功能即用户通过输入法将搜索词输入搜索框,然后在搜索框的下拉框中,服务器会提供与搜索词相关的建议词,供用户选择,从而进行检索。
例如用户通过输入法在搜索框中输入搜索词“淘宝”或“taobao”,下拉框中就会展示“淘宝网”“淘宝网购物”等建议词。当用户确认某个建议词,则会跳转到该建议词对应的搜索结果页。
上述下拉框的方式,需要用户将输入法的候选词上屏输出到搜索框,该候选词即作为搜索词,搜索引擎再针对该搜索词在下拉框中展示推荐的建议词,用户再从下拉框中选择建议词。
在先技术中,存在一种输入法,在输入法的候选栏的基础上,额外生成建议词展示框。基于用户输入的编辑串,根据传统逻辑生成候选词,将该候选词展示在候选栏;同时,基于用户输入的编辑串所对应的候选词,计算以该候选词为开头的各个建议词,然后将这些建议词加载到建议词展示框中展示,用户触发该建议词后,启动搜索过程。
但是,上述方案中,当前展示的候选词与当前的搜索环境可能并不相关,需要用户输入较长的编辑串才能得到与当前搜索环境相关的候选词。另外,在额外的展示框中展示的建议词,其显示位置不在用户的视觉焦点之内,不容易被观察到,而且需要额外的操作才能输入用户需求的建议词,用户的操作繁琐,输入过程也繁琐。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题的输入方法和相应的输入装置。
依据本申请的一个方面,本申请公开了一种输入方法,包括:
识别当前的输入环境;
接收用户输入的编辑串;
如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词。
依据本申请的另一个方面,本申请公开了一种输入装置,其包括:
输入环境识别模块,适于识别当前的输入环境;
编辑串接收模块,适于接收用户输入的编辑串;
意图分析模块,适于如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
建议词转换模块,适于如果存在与所述输入意图相匹配的建议词,则将将所述建议词作为候选词。
依据本申请的另一个方面,本申请公开了一种输入装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别当前的输入环境;
接收用户输入的编辑串;
如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词。
相对现有技术,本申请具备如下优点:
本申请实施例可在搜索环境启动的输入法中,对用户输入的编辑串,利用预置的输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词,如果存在与用户的输入意图相匹配的建议词,则将该建议词作为候选词,使其可以直接在候选栏中展示。
1、在确定输入环境为搜索环境后,对于用户输入的编辑串,可以与该搜索环境对应的建议词作为候选词,使候选词与搜索环境更匹配,前瞻性高,利用了搜索环境这一特殊输入环境来有针对性的提升用户体验。
2、由于将建议词直接作为了候选词,其展示在候选栏中,在用户的视觉焦点之内,容易被观察到,并且无需用户进行额外的触发操作,直接通过候选栏就能输入用户需求的建议词,符合用户的用户输入习惯,提高输入效率。
附图说明
图1是本申请一种输入方法的流程示意图;
图2是本申请另一种输入方法的流程示意图;
图3是本申请的一种输入装置的结构示意图;
图4根据一示例性实施例示出的一种用于输入的装置的框图;
图5是本申请实施例中服务器的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
为了方便对本申请实施例进行描述,首先对本申请实施例涉及的术语进行介绍:
首选词:输入法根据用户当前输入的编辑串,会计算给出多个候选词,然后例如根据各候选词的概率大小进行排序并展示给用户,其中排在第一位的候选词称为首选词。一般来说,首选词可能为用户需要的概率最大的候选词。例如用户输入“meili”,候选词包括“美丽”“魅力”“没理”等,多数情况下,首选词是“美丽”,但如果用户之前刚刚上屏输入了“很有”,那么“魅力”是用户需要的概率就会变大,“魅力”可能就会变成首选词。
搜索环境:在某些环境下,用户输入编辑串的最终意图是为了搜索,这样的输入环境统称为搜索环境。比如搜索引擎的搜索页面,比如百度、搜狗、360、谷歌等搜索引擎的搜索页面;一些导航网页的搜索框,比如hao123、搜狗网址导航页面等;一些网站内部的搜索环境,比如淘宝、京东商城网站内部的搜索框;一些论坛的内部搜索环境,如论坛内部进行搜索的搜索框;以及各种浏览器的地址栏和搜索栏等。这些可以采用搜索框接收用输入的内容,以进行搜索的环境,均可以认为其是搜索环境。
搜索建议:搜索建议(又称:suggestion)功能是当用户在搜索框中输入关键词的同时,可以将以该关键词开头的热门搜索词作为建议词,将上述建议词在搜索框的下拉框中进行展示,供用户参考。例如用户输入“淘宝”或“taobao”,下拉框中就会展示“淘宝网”“淘宝网购物”等热门搜索词作为建议词。当用户用鼠标触发了其中的某一个建议词,就会直接跳转到该建议词的搜索结果页。一般来说,建议词的汇集和排序是从大量用户的搜索行为中挖掘出来的。
本申请的核心思想之一在于,本申请实施例可在搜索环境启动的输入法中,对用户输入的编辑串,利用预置的输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词,如果存在与用户的输入意图相匹配的建议词,则将该建议词作为候选词,使其可以直接在候选栏中展示。本申请实施例的输入法在确定输入环境为搜索环境后,对于用户输入的编辑串,可以与该搜索环境对应的建议词作为候选词,使候选词与搜索环境更匹配,前瞻性高,利用了搜索环境这一特殊输入环境来有针对性的提升用户体验。并且由于将建议词直接作为了候选词,展示在候选栏中,在用户的视觉焦点之内,容易被观察到。并且无需用户进行额外的触发操作,直接通过候选栏就能输入用户需求的建议词,符合用户的输入习惯,提高输入效率。
实施例一
参照图1,其示出了一种输入方法的流程示意图,具体可以包括:
步骤110,识别当前的输入环境。
在本申请实施例中,输入法可以应用于不同的输入环境,比如即时聊天工具的聊天框进行输入的聊天,比如word中进行输入的文档编辑环境,比如搜索网页中进行输入的搜索环境。在本申请实施例中,判断输入法当前的输入环境,可只分为搜索环境或者非搜索环境。
在具体实现中,本申请实施例检测的是网络中的搜索环境。比如检测当前网页如果是搜索引擎的网页,则当前的输入环境为搜索环境;检测当前的网页为网址导航页面时,再判断光标的焦点是否在网址导航页面的搜索框中,如果光标的焦点在网址导航页面的搜索框中,则当前的输入环境为搜索环境,对于其他类型网页中的搜索框,其检测方式类似;当判断光标焦点在浏览器的地址栏和搜索栏中时,也判断当前的输入环境为搜索环境;当判断光标焦点在桌面的搜索应用中时,也判断当前的输入环境为搜索环境等。
在本申请实施例中,在输入法启动后,即可识别输入法所在的输入环境。
步骤120,接收用户输入的编辑串。
在本申请实施例中,用户可通过实体键盘、或者虚拟键盘等方式在输入法中进行编辑串的输入。比如用户输入“wum”。
步骤130,如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;如果存在与所述输入意图相匹配的建议词,则进入步骤140。
在本申请实施例中,进一步可以预置一个输入意图分析库,该输入意图分析库用于针对用户输入的编辑串,分析该编辑串的输入意图。即确定用户输入该编辑串时,是否有动机输入某个建议词。
优选的,在识别当前的输入环境之前,还包括:
步骤100,根据搜索环境下各建议词被触发的历史记录信息构建所述输入意图分析库;所述历史记录信息包括至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词。
用户在网络中进行搜索行为时,在搜索框中输入关键词时,搜索引擎会根据该关键词返回相关的建议词,然后在搜索框的下拉框中展示这些建议词。以汉字为例,比如“淘宝”或“taobao”,下拉框中就会展示“淘宝网”“淘宝网购物”等热门建议词。当用户触发了下拉框中的某个建议词,则会跳转到相应结果页面,那么搜索引擎则会记录该次搜索行为,得到搜索行为历史记录。因此,搜索引擎可得到各个用户基于搜索框的搜索行为历史记录。
那么,本申请实施例则可以从基于搜索框的搜索行为历史记录中,提取历史记录信息,该历史记录信息包括:至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串点触发的建议词。
比如用户AAA,在搜索框中输入的内容为“淘宝”,触发的建议词为“淘宝网”,那么搜索引擎记录该搜索行为历史数据。本申请实施例则可以从中提取得到一条历史记录信息:(用户标识:AAA,编辑串:taobao、建议词:淘宝网)。如此,可得到大量的历史记录信息。
当然,本申请实施例也可以针对其他语言,比如日文、韩文、法语等语言,按照类似原理构建输入意图分析库。本申请不对其加以限制。
当网络中海量用户进行上述搜索行为时,则可得到大量的上述历史记录信息,那么本申请则可根据这些历史记录信息构建输入意图分析库。
优选的,步骤101包括:
子步骤1011,通过搜索引擎获取各建议词被触发的历史记录信息;
在实际应用中,搜索引擎中的根据搜索行为得到的初始历史记录信息可能并不规范,比如初始的历史记录信息包括用户标识“飞翔”,用户“飞翔”在搜索框中输入的关键词“淘宝”,用户“飞翔”在下拉框中触发的建议词为“淘宝网”。而用户“飞翔”是中文字符,在计算时计算量较大。而关键词“淘宝”并不是一个编辑串,需要将其转换为编辑串“taobao”。
子步骤1012,将所述至少一条历史记录信息中用户标识格式化为统一字符格式的至少一个用户标识;
那么对于至少一个用户标识,可将用户标识格式化为统一字符格式的至少一个用户标识。比如对某个用户标识采用MD5(Message-Digest Algorithm5,信息摘要算法5)算法进行转换,转换为一个字符,如类似05D57310F886F010D9633DEFB1E40FE3的字符串,将该字符串作为该用户的用户标识。
子步骤1013,将每条历史记录信息中将用户输入的关键词转换为编辑串;
如前述例子,将关键词“淘宝”转换为编辑串“taobao”。
子步骤1014,以每条历史记录信息为单位,将其中的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词建立对应关系。
即将转换后为统一字符标识的用户标识,与该用户标识的编辑串和基于该编辑串触发的建议词之间,建立对应关系。
经过子步骤1011-1014,得到格式化后的历史记录信息。
在本申请实施例中,可以在表一的一行中,将一条历史记录信息进行记录。参照表一,其为通过子步骤1011-1014统一用户标识的字符格式后的历史记录信息。
表一
用户标识 编辑串 建议词
05D57310F886F010D9633DEFB1E40FE3 y 游戏录像专家
212DFC0D6246885E53B240C328213DDC 4sriban 4s日版三网无锁
212DFC0D6246885E53B240C328213DDC wumei 武媚娘传奇
309ED1EA18DBDFAA486414C424D0E7AF shenzhen 深圳天气
34CCF663DCD26E3092775CEBABE2A237 ouy 欧阳震华
502144240CFD2CF3779D1DC9BD3615F4 ouy 欧元兑换人民币
62635CA4BACFCB5DC0E37BA80F16CE83 guge 谷歌
6FA3A920C68B8EC486767F12A9356949 t 淘宝
7F4FB723FAD1CD41CB2D347A91E60992 wuyou 无忧的天堂
B63D1DADA1B02C408F767E8C0CA773E0 youminxingkong 游民星空
…… …… ……
根据上述历史记录信息构建输入意图分析库。
当然,在实际应用中,表一的各条记录还可包括时间等信息。
优选的,步骤100还包括:
子步骤1015,针对至少一个用户标识,以所述用户标识下的数据为基础,统计该用户标识下的至少一个编辑串对应的被触发的各个建议词(至少一个建议词)的触发比例,并存入第一数据库;所述输入意图分析库包括所述第一数据库。
在本申请实施例中对于表一的历史记录信息,可以针对至少一个用户标识建立各自的统计表,或存储在一个统计表中,其中用户标识可以作为关键字段,在每个关键字段后记录该用户标识的至少一个编辑串所对应的至少一个建议词的触发比例。其统计后可以得到如表二所示的第一数据库:
表二
Figure BDA0000853476420000081
当然,用户标识还可以直接采用用户初始的用户标识,比如“飞翔”,不需要一定转换为字符串的用户标识。
当然,本申请实施例中,基于表一中的至少一条记录,可以选择预定时间段内的至少一个用户标识的记录构建第一数据库。比如选择最近两个月等时间段的数据。
优选的,步骤100还包括:
子步骤1016,针对至少一个编辑串,以预定时间段内触发所述编辑串的至少一个用户的用户标识下的数据为基础,统计至少一个编辑串对应的不同建议词的触发比例,并存入第二数据库;所述输入意图分析库包括所述第二数据库。
在本申请实施例中对于表一的历史记录信息,可以针对至少一个编辑串建立各自的统计表,或存储在一个统计表中,其中编辑串可以作为表三的关键字段,在每个关键字段后记录各个建议词的触发比例。其统计后可以得到如表三的第二数据库:
表三
Figure BDA0000853476420000091
当然,本申请实施例中,基于表三中的各条记录,可以选择预定时间段内的至少一个用户标识的记录构建第二数据库。比如选择最近两个月等预定时间段。
在本申请实施例中,子步骤1015和子步骤1016可以同时采用,其执行的先后顺序本申请不对其加以限制。本申请实施例的输入意图分析库可以只包括第一数据库,也可以只包括第二数据库,也可以同时包括第一数据库和第二数据库。
在构建完输入意图分析库之后,即可执行本申请的输入意图分析过程。
如果步骤110识别当前的输入环境为搜索环境时,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词。然后进入步骤140。
在第一数据库的基础之上,优选的,步骤130可以包括:
子步骤131,判断针对当前用户的用户标识,所述第一数据库中是否有对应所述用户标识的记录;如果第一数据库中有对应所述用户标识的各条记录,则进入子步骤132。
比如用户B63D1DADA1B02C408F767E8C0CA773E0,输入了w,则子步骤131先将B63D1DADA1B02C408F767E8C0CA773E0去第一数据库,例如表二中匹配,可以匹配上多条记录。
如果有第一数据库中没有对应所述用户标识的记录,则可以进入子步骤135,也可以直接根据输入法的常用词库生成候选词进行展示。
子步骤132,判断对应所述用户标识的记录中,是否有包括所述编辑串的记录;如果对应所述用户标识的记录中,有包括所述编辑串的记录,则进入子步骤133。
则对于每一条B63D1DADA1B02C408F767E8C0CA773E0的记录,将w在每条记录中匹配,发现匹配上几条,则对这几条数据进入子步骤133。
如果对应所述用户标识的记录中,没有包括所述编辑串的记录,可以直接根据输入法的常用词库生成候选词进行展示,也可以进入子步骤135。
子步骤133,在包括所述编辑串的记录中,判断是否有触发比例超过第一阈值的建议词;如果有触发比例超过第一阈值的建议词,则进入子步骤134。
比如前述B63D1DADA1B02C408F767E8C0CA773E0和w的一条记录,则查找其中的建议词和相应的触发比例,比如“武媚娘传奇”的触发比例为0.87,“微信网页版”的触发比例为0.103。然后判断各个建议词的触发比例是否大于第一阈值,比如第一阈值设置为0.8,那么发现“武媚娘传奇”符合要求。
如果没有触发比例超过第一阈值的建议词,可以直接根据输入法的常用词库生成候选词进行展示,也可以进入子步骤135。
在本申请实施例中,第一阈值可根据实际需求设置,例如0.5、0.6、0.8等,本申请不对其加以限制。
子步骤134,将所述建议词确定为与用户的输入意图相匹配的建议词。
如前述例子,那么将“武媚娘传奇”作为与用户的输入意图相匹配的建议词。
当然,在本申请实施例中,当对用户标识采用子步骤1012中格式化为统一格式的用户标识时,在后续分析的过程中,也可对使用本申请实施例的用户标识采用同样的格式化方式,将用户标识进行格式。如表二中的格式后的用户标识的形式。
在第二数据库的基础之上,优选的,步骤130可以包括:
子步骤135,判断所述第二数据库中是否有当前接收的编辑串的记录;
以表三为例,本申请实施例还可以直接针对用户当前输入的编辑串去表三中查找是否有记录,比如用户输入的是“wume”,那么查找第二数据库,例如表三中存在相应的记录,则进入子步骤136。
当没有查到相应记录,则可直接根据输入法的常用词库生成候选词进行展示。
子步骤136,如果有当前接收的编辑串的记录,则判断所述编辑串的记录下是否有触发比例超过第二阈值的建议词;
如前述“wume”,该条记录中“武媚娘传奇”的触发比例是0.836,“武媚娘”的触发比例是0.117,“武媚娘传奇全集”的触发比例是0.033,设第二阈值0.8,则“武媚娘传奇”的触发比例超过第二阈值,符合要求,进入子步骤137。
当然,如果没有任何一个建议词的触发比例超过第二阈值,则可直接根据输入法的常用词库生成候选词进行展示。
子步骤137,如果有触发比例超过第二阈值的建议词,则将所述建议词确定为与用户的输入意图相匹配的建议词。
当然,本申请实施例中的第二阈值可以根据实际情况设置,本申请不对其加以限制。
在本申请实施例中,如果有多个触发比例超过第一阈值或第二阈值的建议词,则可以选择触发比例最高或排名前几位(具体可以根据实际需要进行设定)的建议词作为与用户的输入意图相匹配的建议词。
当然,本申请实施例中第一阈值和第二阈值可以设置为同一个值或不同的值。
如前述例子,那么将“武媚娘传奇”作为与用户的输入意图相匹配的建议词。进入步骤140。
步骤140,将所述建议词作为候选词。
在实际应用中,输入法的候选栏提供了N个位置,用于展示N个候选词,比如展示5个。在传统的输入法中,其根据用户输入的编辑串,利用常用词库,去计算各个候选词,在计算时,各个候选词会根据与编辑串的相似程度进行排序,然后输入法将排序靠前的N个作为默认展示的候选词,即输入法将排序靠前的N各展示在候选栏中。而本申请则将建议词转换为候选词,然后将转换后的候选词作为N个默认展示的候选词的一个。如此,建议词则可在输入法的输入过程中在候选栏中进行展示。
当然,在本申请中,由于建议词的属性并不是候选词属性,因此需要将建议词转换为候选词属性,比如将建议词写入候选词缓存区,并将建议词排到上述前N个位置之中。如此,输入法将前N个候选词进行展示时,则可直接将建议词以候选词的身份也展示在候选栏中。
优选的,将所述建议词作为候选词的步骤,包括:
子步骤141,将所述建议词转换为首选词。
一般来说,首选词是用户可能输入概率最高也是输入最方便的词,本申请分析到了与用户输入意图相匹配的建议词之后,也可以理解为用户输入该建议词的输入概率最高。因此为了方便用户输入,本申请实施例中,可将前述步骤中得到的一个建议词转换为首选词,以在候选栏的首项进行展示。当建议词为M个(M为大于1的正整数)时,可以将M个建议词放置在候选栏的前M个位置,以在候选栏的前M项进行展示。
当然,在本申请实施例中在识别当前的输入环境的步骤之前,可以利用输入法的常用词库,直接根据当前接收的编辑串,计算各默认的候选词;所述各默认的候选词的前N个默认的候选词默认展示在候选栏中。
该默认的候选词是输入法根据传统逻辑,从输入法的常用词库中转换得到的候选词。不是从本申请实施例的输入意图分析库中得到的词。
本申请实施例,还保留输入法的传统字词输入功能,即利用输入法的常用词库,直接根据当前接收的编辑串,计算各默认的候选词。在实际的输入法中,输入法的候选栏提供了N个位置,用于展示N个候选词,比如展示5个。比如用户输入“wum”,得到各默认的候选词为:1“雾霾”、2“污蔑”、3“物美”、4“无名”、5“无眠”。其中,候选栏展示5个候选词。在传统的输入法中,在直接根据当前接收的编辑串,计算各默认的候选词时,各个默认的候选词会根据与编辑串的相似程度等进行排序,然后输入法将排序靠前的N个作为默认展示的候选词,即输入法将排序靠前的N各展示在候选栏中。其中,上述N为大于0的整数。
本申请实施例如果将建议词为一个且选择在了首选词位置进行展示,对于输入法直接获取的各个默认的候选词,其展示顺序从第二位开始往后排。本申请实施例如果将建议词为M个(M为大于1且小于N的正整数)时,可以将M个建议词放置在候选栏的前M个位置,以在候选栏的前M项进行展示,可以将第一个默认的候选词从候选栏第M+1个位置开始往后排。
本申请实施例如果将建议词为一个且选择在第二个候选词的位置进行展示,保留输入法直接获取的各个默认的候选词中的首选词,可以将第二个默认的候选词从候选栏第三个位置开始往后排。其他情况以此类推。本申请实施例如果将建议词为M个(M为大于1且小于N的正整数)时,可以将M个建议词分别放置在候选栏中任一个位置,可以将N-M个原默认的候选词与M个建议词重新顺序编号在候选栏进行展示。
本申请实施例对于输入法默认的候选词,不简单将其进行替换,而是在建议词加入默认展示的范围之后,将建议词和默认的候选词重新顺序编号在候选栏进行展示,保证排序靠前的默认的候选词能够靠前展示,方便用户浏览和操作。并且,如果将建议词作为了首选词,则使建议词更符合用户的输入习惯,提高输入效率。
优选的,步骤140,包括:
子步骤142,以所述建议词作为候选词,替换前N个默认的候选词中的一个或多个并将被替换的默认的候选词以及所述默认的候选词之后的各默认的候选词的展示顺序顺延。
如前述例子,候选栏先展示的候选词为:1“雾霾”、2“污蔑”、3“物美”、4“无名”、5“无眠”。那么,如果将“武媚娘传奇”替换第3个默认的候选词,则替换后的由候选栏展示的候选词为:1“雾霾”、2“污蔑”、3“武媚娘传奇”、4“物美”、5“无名”。而“无眠”的排序变为6,则不在候选栏的默认展示范围之内。当然,替换首选词的原理类似,在此不再赘叙。
另外,如果当前的输入环境不是搜索环境,则可直接将根据编辑串,利用常用词库计算各候选词,然后展示到候选栏中。
对于本申请实施例,用户在搜索环境中每输入一个编辑串即执行一次上述过程,可快速的定位与用户输入意图相应的建议词,将该建议词作为默认展示在候选栏中的候选词,从而在候选栏中进行展示。因此,本申请实施例具备如下优点:
1、输入法在确定输入环境为搜索环境后,对于用户输入的编辑串,可以与该搜索环境对应的建议词作为候选词,使候选词与搜索环境更匹配,前瞻性高,利用了搜索环境这一特殊输入环境来有针对性的提升用户体验。
进一步的,用户使用输入法在搜索引擎中构造查询词的时候,往往需要进行多次输入和候选词的选择才能完成查询词的构造,这是因为输入法在计算候选词的时候会尽量与用户当前的拼音输入保持一致。而本申请考虑到用户在搜索环境中进行输入的特殊场景,利用大量用户搜索行为的统计得到输入意图分析库,从而能够根据用户输入的编辑串做出比较准确的预测,可以显著提高输入法候选词的前瞻性,从而降低用户的输入成本,利用了搜索环境这一特殊输入环境来有针对性的提升用户体验。
2、由于将建议词直接作为了候选词,其展示在候选栏中,在用户的视觉焦点之内,容易被观察到。并且无需用户进行额外的触发操作,直接通过候选栏就能输入用户需求的建议词,符合用户的人体输入习惯,提高输入效率。
进一步的,本申请实施例无需用户进行额外的触发操作,可将在视觉范围之外的建议词,在额外生成的展示框中进行输入,比如滑动鼠标、找到建议词扩展按钮,再从所有建议词中进行选择的过程,而是直接将与用户的输入意图最匹配的建议词展示到了候选栏中。而本申请实施例确定的建议词,直接展示在用户使用输入法时的习惯性的视觉范围之内,方便用户通过输入键盘即可快速操作,比如建议词如果确定为首选词,直接按数字键1或光标定位触发后即可完成输入,符合用户的人体输入习惯,提高输入效率。
3、在用户的编辑串的输入过程中,在编辑串较少的时候,也能根据预置输入意图分析库,将与用户编辑串最匹配的建议词转换为默认展示在候选栏中的候选词,降低了用户输入编辑串的位数,提高了用户的输入效率。特别是对于长词的情况,本申请实施例可增加对长词进行联想输入的场景出现频率。例如,当前用户输入“wum”,传统输入法的默认展示的候选词是“雾霾”、“污蔑”、“物美”、“无名”等词,而由于预先通过对用户历史搜索行为的统计,发现绝大多数用户在输入“wum”时都是想要输入当前热播的电视剧“武媚娘传奇”以进行搜索,那么将上述输入意图构建到输入意图分析库,那么对用户当前输入的“wum”,则可匹配到用户的输入意图为“武媚娘传奇”,那么可直接将“武媚娘传奇”转换为候选词展示到候选栏中。
最后,本申请实施例如果同时采用的第一数据库和/或第二数据库作为输入意图分析库,以对用户输入的编辑串进行输入意图分析,其首先通过第一数据库针对当前用户的个性化数据进行判断,即以用户标识+编辑串为维度,分析用户的个性化的输入意图,该种输入意图与当前用户最相匹配,最精确。如果以用户标识和编辑串为维度,没有相匹配的记录,则单独以编辑串为维度,利用所有用户对该编辑串的历史数据信息的统计,分析用户的输入意图,由于利用了编辑串的普遍性,其也可较为精确的判断当前用户的输入意图。两种方式可以结合,使搜索环境的建议词能够更精准、以更高频率的形式在候选栏中展示给用户,方便用户进行输入,从而进行搜索。
实施例二
参照图2,其示出了一种输入方法的流程示意图,具体可以包括:
步骤210,服务器根据搜索环境下各建议词被触发的历史记录信息构建所述输入意图分析库;所述历史记录信息包括至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词;
具体可以包括:
子步骤211,服务器针对每个用户标识,以每个用户标识下的数据为基础,统计该用户标识下的每个编辑串,不同建议词被触发的触发比例,并存入第一数据库;所述输入意图分析库包括所述第一数据库。
子步骤212,服务器针对每个编辑串,以预定时间段内触发的至少一个用户的用户标识下的数据为基础,统计每个编辑串之下,不同建议词的触发比例,并存入第二数据库;所述输入意图分析库包括所述第二数据库。
步骤220,客户端识别当前的输入环境;
步骤230,客户端接收用户输入的编辑串;
步骤240,客户端利用输入法的常用词库,直接根据当前接收的编辑串,计算各默认的候选词。
步骤250,如果当前客户端的输入环境是搜索环境,则将当前的用户标识和所述编辑串发送至服务器;
步骤260,服务器根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;具体包括:
子步骤261,判断针对当前用户的用户标识,所述第一数据库中是否有对应所述用户标识的记录;如果第一数据库中有对应所述用户标识的记录,则进入子步骤262;如果有第一数据库中没有对应所述用户标识的记录,则可以进入子步骤265。
子步骤262;判断对应所述用户标识的记录中,是否有包括所述编辑串的记录;如果对应所述用户标识的记录中,有包括所述编辑串的记录,则进入子步骤263。如果对应所述用户标识的记录中,没有包括所述编辑串的记录,则可以进入子步骤265。
子步骤263,在包括所述编辑串的记录中,判断是否有触发比例超过第一阈值的建议词;如果有触发比例超过第一阈值的建议词,则进入子步骤264。如果没有触发比例超过第一阈值的建议词,则进入子步骤265。
子步骤264,将所述建议词确定为与用户的输入意图相匹配的建议词。进入步骤270。
当然,在本申请实施例中,如果没有触发比例超过第一阈值的建议词,也可以直接进入子步骤267。
子步骤265,判断所述第二数据库中是否有当前接收的编辑串的记录;如果有当前接收的编辑串的记录,则进入子步骤266;如果没有当前接收的编辑串的记录,则进入子步骤267。
子步骤266,判断所述编辑串的记录下是否有触发比例超过第二阈值的建议词;如果有触发比例超过第二阈值的建议词,则进入子步骤264;如果没有触发比例超过第二阈值的建议词,则进入子步骤267。
子步骤267,服务器返回空值至客户端,进入步骤280。
步骤270,客户端接收到所述建议词之后,以所述建议词作为候选词,替换前N个默认的候选词中的一个或多个并将被替换的默认的候选词以及所述默认的候选词之后的各默认的候选词的展示顺序顺延。
步骤280,客户端接收到所述空值后,直接将前N个默认的候选词候选栏按序进行展示。
下面以实际示例对本申请实施例进行描述:
示例1:
1、假如id为B5C5051CA0B05ABB16517756C8C238CC的用户,启动输入法客户端进行输入,那么步骤220中,输入法客户端可识别用户的输入环境,假设用户在搜索环境中输入,则进入步骤230。
2、B5C5051CA0B05ABB16517756C8C238CC的用户在输入法客户端中输入的编辑串为w,那么步骤230输入法客户端接收到用户B5C5051CA0B05ABB16517756C8C238CC输入的该w。
3、在步骤240中,输入法客户端在接收到w后,输入法客户端本地计算默认的候选词为“1.我2.为3.哇……”。
4、在步骤250中,输入法客户端将B5C5051CA0B05ABB16517756C8C238CC和w传到服务器。
5、在子步骤261中,服务器用B5C5051CA0B05ABB16517756C8C238CC和去第一数据库中进行查找,发现有B5C5051CA0B05ABB16517756C8C238CC的记录,则进入子步骤262;
6、子步骤262中,在子步骤261找到的记录中查找是否有w的记录,发现没有,则进入子步骤265。
7、在子步骤265中,服务器用w去第二数据库中进行查找,发现w在第二数据库中,对应的建议词有“我是歌手第三季”、“武媚娘传奇”、“微信网页版”、“微信公众平台”等,但并没有任何一个建议词的搜索比例超过第二阈值80%,于是给输入法客户端返回空。
8、在步骤280中,输入法客户端接收到空的返回数据后,直接在输入法的候选栏中展示“1.我2.为3.哇……”中的前N个。
9、该用户B5C5051CA0B05ABB16517756C8C238CC继续输入,当前输入串为wume,那么步骤230接收到用户输入的编辑串为wume。
10、在步骤240中,输入法本地计算的候选词为“1.无么2.无3.误……”。
11、在步骤250中,输入法客户端将B5C5051CA0B05ABB16517756C8C238CC和w传到服务器。
12、在子步骤261中,服务器用B5C5051CA0B05ABB16517756C8C238CC去第一数据库中进行查找,发现有该用户的记录,则进入子步骤261;
13、在子步骤262中,继续在子步骤261找到的记录中,查找是否包括wume的记录,发现没有,进入步骤子步骤265。
14、在子步骤265中,服务器用wume去第二数据库中进行查找,发现wume在第二数据库中,对应的建议词有武媚娘传奇”、“武媚娘”、“武媚娘传奇全集”等,而“武媚娘传奇”等,而“武媚娘传奇”的搜索比例为83.6%,超过了第二阈值80%,于是给输入法客户端返回“武媚娘传奇”。
15、输入法展示候选词为“1.武媚娘传奇2.无么3.无4.误……”的前N个。
本示例中查到的建议词可以作为首选词进行展示。当然本示例仅例举了第一数据库中没查找用户标识和编辑串的情况下,第二数据库的两种查询情况的执行过程。对于第一数据库查到用户标识和编辑串的后续多种情况,其原理类似,不再赘叙。
本申请实施例在实施例一的基础上,将输入意图的分析过程放到服务器中执行,减轻输入法客户端所在终端的计算量,避免影响终端的性能。
实施例三
参照图3,其示出了一种输入装置的结构示意图,具体可以包括:
输入环境识别模块310,适于识别当前的输入环境;
编辑串接收模块320,适于接收用户输入的编辑串;
意图分析模块330,适于如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
建议词转换模块340,适于如果存在与所述输入意图相匹配的建议词,则将将所述建议词作为候选词。
当然,实际应用中,还包括:
默认的候选词计算模块,适于利用输入法的常用词库,直接根据当前接收的编辑串,计算各默认的候选词;所述各默认的候选词的前N个默认的候选词默认展示在候选栏中。
优选的,在本申请另一实施例中,还包括:
输入意图分析库构建模块,适于根据搜索环境下各建议词被触发的历史数据信息构建所述输入意图分析库;所述历史记录信息包括至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词。
优选的,在本申请另一实施例中,所述输入意图分析库构建模块包括:
第一数据库构建模块,适于针对每个用户标识,以每个用户标识下的数据为基础,统计该用户标识下的每个编辑串,不同建议词被触发的触发比例,并存入第一数据库;所述输入意图分析库包括所述第一数据库。
优选的,在本申请另一实施例中,所述输入意图分析库构建模块包括:
第二数据库构建模块,适于针对每个编辑串,以预定时间段内触发的至少一个用户的用户标识下的数据为基础,统计每个编辑串之下,不同建议词的触发比例,并存入第二数据库;所述输入意图分析库包括所述第二数据库。
优选的,在本申请另一实施例中,所述意图分析模块320包括:
第一记录判断模块,适于以用户标识和当前接收的编辑串为整体,判断所述第一数据库中是否有所述用户标识和编辑串的记录;
第一阈值判断模块,适于如果所述第一数据库中有所述用户标识和编辑串的记录,则判断所述用户标识和编辑串的记录下是否有点击比例超过第一阈值的建议词;
建议词确定模块,适于如果有点击比例超过第一阈值的建议词,则将所述建议词确定为与用户的输入意图相匹配的建议词。
优选的,在本申请另一实施例中,所述意图分析模块320包括:
第二记录判断模块,适于判断所述第二数据库中是否有当前接收的编辑串的记录;
第二阈值判断模块,适于如果有当前接收的编辑串的记录,则判断所述编辑串的记录下是否有点击比例超过第二阈值的建议词;
建议词确定模块,适于如果有点击比例超过第二阈值的建议词,则将所述建议词确定为与用户的输入意图相匹配的建议词。
优选的,在本申请另一实施例中,所述输入意图分析库构建模块包括:
初始数据获取模块,适于通过搜索引擎获取各建议词被触发的历史记录信息;
用户标识转换模块,适于将所述至少一条历史记录信息中用户标识格式化为统一字符格式的至少一个用户标识;
编辑串转换模块,适于将每条历史记录信息中将用户输入的关键词转换为编辑串;
对应模块,适于以每条历史记录信息为单位,将其中的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词建立对应关系。
优选的,在本申请另一实施例中,所述建议词转换模块340包括:
第一转换模块,适于以所述建议词作为第二候选词,替换所述前N个第一候选词中的一个或多个并将被替换的第一候选词以及所述第一候选词之后的各第一候选词的展示顺序顺延。
优选的,在本申请另一实施例中,所述建议词转换模块340包括:
首选词转换模块,适于将所述建议词转换为首选词。
当然,发明实施例的输入意图分析库可以只包括第一数据库,也可以只包括第二数据库,也可以同时包括第一数据库和第二数据库。
当然,在本申请实施例中,输入意图分析模块320可以在服务器侧,也可以在客户端侧,本申请不对其加以限制。
本装置实施例与方法实施例的原理类似,其达到效果也类似。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种输入装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件406为装置400的各种组件提供电力。电力组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:识别当前的输入环境;
接收用户输入的编辑串;
如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词。
图5是本申请实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种输入方法,其特征在于,包括:
识别当前的输入环境;
接收用户输入的编辑串;
如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词,所述候选词在输入法的候选栏展示;
其中,将所述建议词作为候选词的步骤,包括:
以所述建议词作为候选词,替换前N个默认的候选词中的一个或多个并将被替换的默认的候选词以及所述默认的候选词之后的各默认的候选词的展示顺序顺延;
所述默认的候选词是从输入法的常用词库中得到的词;所述输入法的常用词库与所述预置输入意图分析库不同;
其中,将一个建议词转换为首选词,所述首选词为输入法对所述编辑串计算得到的所述多个候选词的排序中排在第一位的词;其中,所述搜索环境是指采用搜索框接收用输入内容,以进行搜索的环境;
如果当前的输入环境不是搜索环境,则根据编辑串,利用常用词库计算各候选词,并展示到候选栏中。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据搜索环境下各建议词被触发的历史记录信息构建所述输入意图分析库;所述历史记录信息包括至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词。
3.根据权利要求2所述的方法,其特征在于,根据所述历史记录信息,构建所述输入意图分析库的步骤,包括:
针对至少一个用户标识,以所述用户标识下的数据为基础,统计该用户标识下的至少一个编辑串对应的被触发的各个建议词的触发比例,并存入第一数据库;所述输入意图分析库包括所述第一数据库。
4.根据权利要求3所述的方法,其特征在于,根据所述历史记录信息,构建所述输入意图分析库的步骤,包括:
针对至少一个编辑串,以预定时间段内触发所述编辑串的至少一个用户的用户标识下的数据为基础,统计至少一个编辑串对应的被触发的各个建议词的触发比例,并存入第二数据库;所述输入意图分析库包括所述第二数据库。
5.根据权利要求3所述的方法,其特征在于,根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词的步骤,包括:
判断针对当前用户的用户标识,所述第一数据库中是否有对应所述用户标识的记录;
如果第一数据库中有对应所述用户标识的记录,则判断对应所述用户标识的记录中,是否有包括所述编辑串的记录;
如果对应所述用户标识的记录中,有包括所述编辑串的记录,则在包括所述编辑串的记录中,判断是否有触发比例超过第一阈值的建议词;
如果有触发比例超过第一阈值的建议词,则将所述建议词确定为与用户的输入意图相匹配的建议词。
6.根据权利要求4或5所述的方法,其特征在于,根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词包括:
判断所述第二数据库中是否有当前接收的编辑串的记录;
如果有当前接收的编辑串的记录,则判断所述编辑串的记录下是否有触发比例超过第二阈值的建议词;
如果有触发比例超过第二阈值的建议词,则将所述建议词确定为与用户的输入意图相匹配的建议词。
7.一种输入装置,其特征在于,包括:
输入环境识别模块,适于识别当前的输入环境;
编辑串接收模块,适于接收用户输入的编辑串;
意图分析模块,适于如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
建议词转换模块,适于如果存在与所述输入意图相匹配的建议词,则将将所述建议词作为候选词;所述候选词在输入法的候选栏展示;
所述将所述建议词作为候选词,包括:
以所述建议词作为候选词,替换前N个默认的候选词中的一个或多个并将被替换的默认的候选词以及所述默认的候选词之后的各默认的候选词的展示顺序顺延;
所述默认的候选词是从输入法的常用词库中得到的词;所述输入法的常用词库与所述预置输入意图分析库不同;
其中,将一个建议词转换为首选词,所述首选词为输入法对所述编辑串计算得到的所述多个候选词的排序中排在第一位的词;其中,所述搜索环境是指采用搜索框接收用输入内容,以进行搜索的环境;
所述输入装置还用于,如果当前的输入环境不是搜索环境,则根据编辑串,利用常用词库计算各候选词,并展示到候选栏中。
8.根据权利要求7所述的装置,其特征在于,还包括:
输入意图分析库构建模块,适于根据搜索环境下各建议词被触发的历史记录信息构建所述输入意图分析库;所述历史记录信息包括至少一个用户的用户标识、对应该用户标识的编辑串、基于所述编辑串触发的建议词。
9.一种输入装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
识别当前的输入环境;
接收用户输入的编辑串;
如果当前的输入环境是搜索环境,则根据当前接收的编辑串,利用预置输入意图分析库,判断是否存在与用户的输入意图相匹配的建议词;
如果存在与所述输入意图相匹配的建议词,则将所述建议词作为候选词;所述候选词在输入法的候选栏展示;
所述将所述建议词作为候选词,包括:
以所述建议词作为候选词,替换前N个默认的候选词中的一个或多个并将被替换的默认的候选词以及所述默认的候选词之后的各默认的候选词的展示顺序顺延;
所述默认的候选词是从输入法的常用词库中得到的词;所述输入法的常用词库与所述预置输入意图分析库不同;
其中,将一个建议词转换为首选词,所述首选词为输入法对所述编辑串计算得到的所述多个候选词的排序中排在第一位的词;其中,所述搜索环境是指采用搜索框接收用输入内容,以进行搜索的环境;
以及,如果当前的输入环境不是搜索环境,则根据编辑串,利用常用词库计算各候选词,并展示到候选栏中。
CN201510812489.7A 2015-11-20 2015-11-20 一种输入方法和装置 Active CN106774969B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510812489.7A CN106774969B (zh) 2015-11-20 2015-11-20 一种输入方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510812489.7A CN106774969B (zh) 2015-11-20 2015-11-20 一种输入方法和装置

Publications (2)

Publication Number Publication Date
CN106774969A CN106774969A (zh) 2017-05-31
CN106774969B true CN106774969B (zh) 2021-12-14

Family

ID=58886160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510812489.7A Active CN106774969B (zh) 2015-11-20 2015-11-20 一种输入方法和装置

Country Status (1)

Country Link
CN (1) CN106774969B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002183B (zh) * 2017-06-07 2022-11-29 北京搜狗科技发展有限公司 一种信息输入的方法及装置
CN109669549B (zh) * 2017-10-16 2023-04-28 北京搜狗科技发展有限公司 候选内容生成方法和装置、用于候选内容生成的装置
CN110134745B (zh) * 2018-02-09 2024-05-07 北京搜狗科技发展有限公司 一种查询路线信息的方法、装置和设备
CN110471538B (zh) * 2018-05-10 2023-11-03 北京搜狗科技发展有限公司 一种输入预测方法及装置
CN112506359B (zh) * 2020-12-21 2023-07-21 北京百度网讯科技有限公司 输入法中候选长句的提供方法、装置及电子设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及系统
CN102096717A (zh) * 2011-02-15 2011-06-15 百度在线网络技术(北京)有限公司 搜索方法及搜索引擎
CN102314461A (zh) * 2010-06-30 2012-01-11 北京搜狗科技发展有限公司 一种导航提示方法及系统
CN102314222A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 一种自适应输入方法、设备及系统
CN102402561A (zh) * 2010-09-19 2012-04-04 中国移动通信集团四川有限公司 一种搜索方法和装置
CN102567408A (zh) * 2010-12-31 2012-07-11 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
KR20120092320A (ko) * 2011-02-11 2012-08-21 에스케이플래닛 주식회사 위치 기반의 검색어 추천 시스템 및 그 방법
CN102646022A (zh) * 2012-04-10 2012-08-22 北京搜狗科技发展有限公司 一种获取候选项的方法和装置
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及系统
CN101334774B (zh) * 2007-06-29 2013-08-14 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN103294670A (zh) * 2012-02-22 2013-09-11 腾讯科技(深圳)有限公司 一种基于词表的搜索方法和系统
CN104423621A (zh) * 2013-08-22 2015-03-18 北京搜狗科技发展有限公司 拼音字符串处理方法和装置
US9009170B1 (en) * 2009-01-09 2015-04-14 Google Inc. Book content item search

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5480058B2 (ja) * 2010-08-03 2014-04-23 ヤフー株式会社 広告マッチング装置、方法及びプログラム
US9026547B2 (en) * 2012-03-05 2015-05-05 Coupons.Com Incorporated Fault-tolerant search
JP2015079460A (ja) * 2013-10-18 2015-04-23 東芝テック株式会社 情報処理装置およびプログラム
CN103995601A (zh) * 2014-05-28 2014-08-20 百度在线网络技术(北京)有限公司 输入法的实现方法和装置
CN104503995A (zh) * 2014-12-04 2015-04-08 百度在线网络技术(北京)有限公司 输入法的实现方法和装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178737A (zh) * 2006-12-12 2008-05-14 北京搜狗科技发展有限公司 一种互联网关键字符相关信息的发布方法和系统
CN101334774B (zh) * 2007-06-29 2013-08-14 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101183281A (zh) * 2007-12-26 2008-05-21 腾讯科技(深圳)有限公司 一种输入法中候选词的相关词输入的方法及系统
US9009170B1 (en) * 2009-01-09 2015-04-14 Google Inc. Book content item search
CN102314461A (zh) * 2010-06-30 2012-01-11 北京搜狗科技发展有限公司 一种导航提示方法及系统
CN102314222A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 一种自适应输入方法、设备及系统
CN102402561A (zh) * 2010-09-19 2012-04-04 中国移动通信集团四川有限公司 一种搜索方法和装置
CN102567408A (zh) * 2010-12-31 2012-07-11 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
KR20120092320A (ko) * 2011-02-11 2012-08-21 에스케이플래닛 주식회사 위치 기반의 검색어 추천 시스템 및 그 방법
CN102096717A (zh) * 2011-02-15 2011-06-15 百度在线网络技术(北京)有限公司 搜索方法及搜索引擎
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及系统
CN103294670A (zh) * 2012-02-22 2013-09-11 腾讯科技(深圳)有限公司 一种基于词表的搜索方法和系统
CN102646022A (zh) * 2012-04-10 2012-08-22 北京搜狗科技发展有限公司 一种获取候选项的方法和装置
CN104423621A (zh) * 2013-08-22 2015-03-18 北京搜狗科技发展有限公司 拼音字符串处理方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"A new phonetic candidate generator for improving search query efficiency";Bo Peng等;《Twelfth Annual Conference of the International Speech Communication Association》;20111231;第1117-1120页 *
"一种建立在对客户端浏览历史进行LDA建模基础上的个性化查询推荐算法";王桂华等;《四川大学学科(自然科学版)》;20150728(第4期);第755-763页 *

Also Published As

Publication number Publication date
CN106774969A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106774969B (zh) 一种输入方法和装置
CN106874308B (zh) 一种推荐方法和装置、一种用于推荐的装置
CN110232137B (zh) 一种数据处理方法、装置和电子设备
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN107315487B (zh) 一种输入处理方法、装置及电子设备
CN110019675B (zh) 一种关键词提取的方法及装置
CN109933714B (zh) 一种词条权重的计算方法、搜索方法及相关装置
CN108073606B (zh) 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN106815291B (zh) 搜索结果项展现方法、装置和用于搜索结果项展现的装置
CN108874827B (zh) 一种搜索方法及相关装置
CN112784142A (zh) 一种信息推荐方法及装置
CN111708943A (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN111382339A (zh) 一种搜索处理方法、装置和用于搜索处理的装置
CN109783244B (zh) 处理方法和装置、用于处理的装置
CN109977293B (zh) 一种搜索结果相关性的计算方法及装置
CN112307281A (zh) 一种实体推荐方法及装置
CN107239462B (zh) 一种搜索方法和装置以及浏览器
CN110175293B (zh) 一种确定新闻脉络的方法、装置及电子设备
CN109799916B (zh) 一种候选项联想方法和装置
CN110020082B (zh) 一种搜索方法及装置
CN108614830B (zh) 一种搜索结果的展示方法和装置
CN107515853B (zh) 一种细胞词库推送方法及装置
CN111597325B (zh) 一种文本查询方法及装置
CN112083811B (zh) 一种候选项展示方法和装置
CN110362686B (zh) 一种词库的生成方法、装置、终端设备和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant