CN110083253A - 一种输入方法和装置 - Google Patents

一种输入方法和装置 Download PDF

Info

Publication number
CN110083253A
CN110083253A CN201810074891.3A CN201810074891A CN110083253A CN 110083253 A CN110083253 A CN 110083253A CN 201810074891 A CN201810074891 A CN 201810074891A CN 110083253 A CN110083253 A CN 110083253A
Authority
CN
China
Prior art keywords
behavior
phrase
candidate item
user
user behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810074891.3A
Other languages
English (en)
Inventor
费腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201810074891.3A priority Critical patent/CN110083253A/zh
Publication of CN110083253A publication Critical patent/CN110083253A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Abstract

本发明实施例提供了一种输入方法和装置,该方法包括:基于用户行为,获取与所述用户行为对应的词组;根据用户的输入字符串,获取与所述字符串匹配的候选项;根据所述词组对所述候选项进行排序处理;展示排序处理之后的候选项。通过用户行为挖掘出较大概率输入的词组,将用户行为转换为参考语料,以此对输入法系统输出的候选项进行排序处理,在用户尚未输入该词组对应的候选项的情况下,可以提高该候选项的排序,减少用户通过翻页操作进行查询的概率,提高输入效率。

Description

一种输入方法和装置
技术领域
本发明涉及输入法的技术领域,特别是涉及一种输入方法和装置。
背景技术
随着计算机技术的普及与发展,输入法已经成为用户与计算机交互的重要工具,不同专业领域、不同兴趣以及使用习惯的用户对于输入法的智能性要求越来越高。
输入法内置有一个或多个词库,词库中存储有多个词条。
目前,为了满足用户个性化的输入需求,输入法通常将用户曾经输入过的词作为词条写入词库中,将其展示在较前的位置。
但是,在日常生活中具有大量用户尚未输入过的词,用户在输入这些词时,排序较后,可能需要多次通过翻页操作进行查询,导致输入效率较低。
发明内容
鉴于上述问题,为了解决上述输入尚未输入过的词排序较后的问题,本发明实施例提出了一种输入方法和装置。
为了解决上述问题,本发明实施例公开了一种输入方法,包括:
基于用户行为,获取与所述用户行为对应的词组;
根据用户的输入字符串,获取与所述字符串匹配的候选项;
根据所述词组对所述候选项进行排序处理;
展示排序处理之后的候选项。
可选地,还包括:
检测用户行为。
可选地,所述检测用户行为,包括:
识别当前运行的应用的应用标识;
查询所述应用标识对应的用户行为。
可选地,所述获取所述用户行为对应的词组,包括:
若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;
对所述文本信息进行分词处理,获得词组;
将所述词组写入缓存中。
可选地,所述获取所述用户行为对应的词组,包括:
若所述用户行为为非文本行为,则查询所述非文本获取行为对应的行为对象;
对所述行为对象进行分析、获取与行为对象相匹配的词组;
将所述词组写入缓存中。
可选地,所述对所述行为对象进行分析、获取与行为对象相匹配的词组,包括:
将所述行为对象发送至服务器;
接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
可选地,所述将所述词组写入缓存中,包括:
在缓存中判断是否存在所述词组;
若是,则累加所述词组的词频;
若否,则在缓存中存储所述词组。
可选地,所述词组包括实体词。
可选地,所述根据所述词组对所述候选项进行排序处理,包括:
对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;
按照所述评分对所述候选项进行排序处理。
可选地,所述提高所述候选项的评分,包括:
查询所述词组对应的词频;
按照所述词频计算权值,其中,所述词频与所述权值正相关;
在所述候选项的评分的基础上,增加所述权值。
可选地,还包括:
确定所述用户行为的行为标识;
在预设的行为队列中判断是否存储所述行为标识;
若是,则忽略所述用户行为;
若否,则将所述行为标识写入所述行为队列;
当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
可选地,还包括:
对所述词组设置超时时间;
当到达所述超时时间时,删除所述词组。
本发明实施例还公开了一种输入装置,包括:
词组获取模块,用于基于用户行为,获取所述用户行为对应的词组;
候选项查询模块,用于根据用户的输入字符串,获取与所述字符串匹配的候选项;
候选项排序模块,用于根据所述词组对所述候选项进行排序处理;
候选项展示模块,用于展示排序处理之后的候选项。
可选地,还包括:
用户行为检测模块,用于检测用户行为。
可选地,所述用户行为检测模块包括:
应用标识识别子模块,用于识别当前运行的应用的应用标识;
用户行为查询子模块,用于查询所述应用标识对应的用户行为。
可选地,所述词组获取模块包括:
文本信息获取子模块,用于若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;
分词处理子模块,用于对所述文本信息进行分词处理,获得词组;
缓存写入子模块,用于将所述词组写入缓存中。
可选地,所述词组获取模块包括:
行为对象查询子模块,用于若所述用户行为为非文本获取行为,则查询所述非文本获取行为对应的行为对象;
行为对象分析子模块,用于对所述行为对象进行分析、获取与行为对象相匹配的词组;
缓存写入子模块,用于将所述词组写入缓存中。
可选地,所述行为对象分析子模块,包括:
行为对象发送单元,用于将所述行为对象发送至服务器;
词组接收单元,用于接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
可选地,所述缓存写入子模块包括:
词组判断单元,用于在缓存中判断是否存在所述词组;若是,则调用累加单元,若否,则调用存储单元;
累加单元,用于累加所述词组的词频;
存储单元,用于在缓存中存储所述词组。
可选地,所述词组包括实体词。
可选地,所述候选项排序模块包括:
相同判断子模块,用于对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则调用评分提高子模块;
评分提高子模块,用于提高所述候选项的评分;
评分排序子模块,用于按照所述评分对所述候选项进行排序处理。
可选地,所述评分提高子模块包括:
词频查询单元,用于查询所述词组对应的词频;
权值计算单元,用于按照所述词频计算权值,其中,所述词频与所述权值正相关;
权值增加单元,用于在所述候选项的评分的基础上,增加所述权值。
可选地,还包括:
行为标识确定模块,用于确定所述用户行为的行为标识;
行为标识判断模块,用于在预设的行为队列中判断是否存储所述行为标识;若是,则调用用户行为忽略模块,若否,则调用行为队列写入模块;
用户行为忽略模块,用于忽略所述用户行为;
行为队列写入模块,用于将所述行为标识写入所述行为队列;
行为标识删除模块,用于当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
可选地,还包括:
超时时间设置模块,用于对所述词组设置超时时间;
词组删除模块,用于当到达所述超时时间时,删除所述词组。
本发明实施例还公开了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于用户行为,获取所述用户行为对应的词组;
根据用户的输入字符串,获取与所述字符串匹配的候选项;
根据所述词组对所述候选项进行排序处理;
展示排序处理之后的候选项。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
检测用户行为。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
识别当前运行的应用的应用标识;
查询所述应用标识对应的用户行为。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
若所述用户行为为文本获取行为,则获取所述文本行为对应应用中的文本信息;
对所述文本信息进行分词处理,获得词组;
将所述词组写入缓存中。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
若所述用户行为为非文本获取行为,则查询所述非文本获取行为对应的行为对象;
接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组对所述行为对象进行分析、获取与行为对象相匹配的词组;
将所述词组写入缓存中。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
将所述行为对象发送至服务器;
接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
在缓存中判断是否存在所述词组;
若是,则累加所述词组的词频;
若否,则在缓存中存储所述词组。
可选地,所述词组包括实体词。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;
按照所述评分对所述候选项进行排序处理。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
查询所述词组对应的词频;
按照所述词频计算权值,其中,所述词频与所述权值正相关;
在所述候选项的评分的基础上,增加所述权值。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
确定所述用户行为的行为标识;
在预设的行为队列中判断是否存储所述行为标识;
若是,则忽略所述用户行为;
若否,则将所述行为标识写入所述行为队列;
当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
可选地,所述一个或者一个以上程序还包含用于进行以下操作的指令:
对所述词组设置超时时间;
当到达所述超时时间时,删除所述词组。
本发明实施例还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得处理器执行上述的一个或多个的方法。
本发明实施例包括以下优点:
本发明实施例基于用户行为,获取该用户行为对应的词组,根据用户的输入字符串,获取与字符串匹配的候选项,根据词组对候选项进行排序处理,展示排序处理之后的候选项,通过用户行为挖掘出较大概率输入的词组,将用户行为转换为参考语料,以此对输入法系统输出的候选项进行排序处理,在用户尚未输入该词组对应的候选项的情况下,可以提高该候选项的排序,减少用户通过翻页操作进行查询的概率,提高输入效率。
附图说明
图1是本发明的一种输入方法实施例的步骤流程图;
图2是本发明的另一种输入方法实施例的步骤流程图;
图3是本发明的一种输入装置实施例的结构框图。
图4是根据一示例性实施例示出的一种用于输入的装置的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种输入方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取所述用户行为对应的词组。
在具体实现中,本发明实施例可以应用于输入法系统中,该输入法系统可以安装在电子设备中,例如,电脑、手机、PDA(Personal Digital Assistant,个人数字助理)、膝上型计算机、掌上电脑等等,本发明实施例对此不加以限制。
该电子设备可以支持Windows、Android(安卓)、IOS、WindowsPhone等操作系统,通常可以在输入法系统中通过虚拟键盘、物理键盘、语音等方式输入字词。
用户行为可以在一定程度上表达用户的兴趣爱好,输入与该用户行为相关的词组的概率较高,因此,如果检测到当前的用户行为,则可以基于该用户行为获取相应的词组。
需要说明的的是,该用户行为可以为当前所检测到的实时行为,也可以是在预设时间段(如在先15天内)的历史行为,本发明实施例对此不加以限制。
在本发明的一个实施例中,步骤101可以包括如下子步骤:
子步骤S11,若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息。
子步骤S12,对所述文本信息进行分词处理,获得词组。
在本发明实施例中,如果当前的用户行为为文本行为,即以获取文本信息的行为,文本行为对应的应用本身可能具有较多的文本信息,因此,可以识别文本行为针对的应用,从该应用中获取相应的文本信息。
在一种实施方式中,可以进行截图操作,截图获得的图像数据中即包含了应用本身的文本信息。
对于图像数据,可以通过OCR(Optical Character Recognition,光学字符识别)识别其中包含的文本信息,从而获得了应用本身的文本信息。
当然,除了截图之后进行OCR识别,若应用提供了API(Application ProgrammingInterface,应用程序编程接口)接口,则可以调用该API接口获取应用本身包含的文本信息,等等,本发明实施例对此不加以限制。
对于应用包含的文本信息,可以对其进行分词处理,从而获得该用户行为对应的词组。
进一步地,可以对分词处理之后的词组进行筛选,过滤“我”、“吃饭”等无意义词,保留实体词。
子步骤S13,将所述词组写入缓存中。
由于用户行为具有时效性,因此,可以将词组写入缓存中,其中,写入缓存的词组包括实体词。
在具体实现中,由于词组可能被多次出现,因此,写入缓存时,在缓存中判断是否存在有该词组。
若是,则累加词组的词频;若否,则在缓存中存储词组。
在本发明的另一个实施例中,步骤101可以包括如下子步骤:
子步骤S21,若所述用户行为为非文本行为,则查询所述非文本获取行为对应的行为对象。子步骤S22,对所述行为对象进行分析、获取与行为对象相匹配的词组。接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
在本发明实施例中,如果当前的用户行为为非文本行为,即并非以获取文本为主的行为,应用本身可能具有较少的文本信息,因此,查询非文本获取行为对应的行为对象,从而获取其相匹配的词组。
所谓行为对象,可以指用户行为的对象。
例如,若非文本行为为玩游戏,行为对象可以指游戏的名称。
又例如,若非文本行为观看电视剧,行为对象可以指电视剧的名称。
又例如,若非文本行为观看电影,行为对象可以指电影的名称。
在一种实施方式中,输入法系统在查询到该行为对象之后,则可以将该行为对象发送至服务器。
服务器可以通过爬虫从网络中抓取网页数据等作为训练文本,在训练文本中统计词与词之间的共现率,即词与词在上下文的范围内共同出现的频率,若该同现率符合预设条件,如高于某个阈值等,则可以认为这两个词相关,可以将其返回输入法系统。
例如,对于游戏而言,游戏名称与游戏里的角色名称、角色机能、装备名称、其他相似角色的名称,同现率较高。
相对而言,输入法系统可以接收服务器返回的、与行为对象之间的共现率符合预设条件的词组。
进一步地,可以对训练文本中的词进行筛选,过滤“我”、“吃饭”等无意义词,保留实体词。
服务器若接收到输入法系统发送的行为对象,则可以查询该行为对象相关的词组,返回输入法系统。
子步骤S23,将所述词组写入缓存中。
由于用户行为具有时效性,因此,可以将词组写入缓存中,其中,写入缓存的词组包括实体词。
在具体实现中,由于词组可能被多次出现,因此,写入缓存时,在缓存中判断是否存在有该词组。
若是,则累加词组的词频;若否,则在缓存中存储词组。
当然,上述获取词组的方式只是作为示例,在实施本发明实施例时,可以根据实际情况(如用户行为的类型)设置其他获取词组的方式,本发明实施例对此不加以限制。另外,除了上述获取词组的方式外,本领域技术人员还可以根据实际需要采用其它获取词组的方式,本发明实施例对此也不加以限制。
步骤102,根据用户的输入字符串,获取与所述字符串匹配的候选项。
在实际应用中,电子设备的虚拟键盘、物理键盘可以包括九宫格键盘、全键盘(如QWERTY键盘)等等。
虚拟键盘、物理键盘通常可以具有一个或多个按键,该按键经常被复用,映射有一个或多个字符,该按键被触发(如按下、点击、滑动等)时,可以用于输入其映射的字符至输入法系统,这些字符可以组成字符串。
对于不同的语言,如中文、英文、日文等等,虚拟键盘、物理键盘的按键所映射的字符会有所不同,具体可以包括、但不限于数字字符、英文字符、中文字符(如拼音字符、笔画字符等)和符号字符中的至少一个。
这些字符串可以显示在输入法系统界面中的编码栏中,以提示用户所输入的字符串。
在中文、日语等语言里,作为基本语言单位的汉字、日文等文字一般不直接与键盘上的按键进行映射,因此,在输入时一般需要进行字符串与字词的转换,将转换后的字词作为候选项。
具体而言,输入法系统通过编码规则将汉字、日文等文字与能够直接输入的字符串建立映射关系,如在中文中通常用的编码是拼音(如简拼、双拼、全拼、模糊音等)、五笔等。
以汉字的拼音输入为例,用户将汉字的字符串通过键盘输入至输入法系统中,由输入法系统进行解码,具体可以包括如下步骤:
a、拼音解析:将字符串切分为拼音的音节。
例如,将字符串“zhuanli”切分为“zhuan”、“li”,将字符串“fangan”切分为“fang”、“an”或“fan”、“gan”。
b、汉字解码:在词库中查找拼音对应的字、词、句。
在本发明实施例中,可以预先设置一个或多个词库,例如,记载基础字词的系统词库,记载扩展字词的细胞词库(细胞词库中的字词至少具有一个共同属性),记载某个游戏专用字词的细胞词库、记载生物专用字词的细胞词库等,记载用户个性化字词(如自造词)的用户词库,等等,本发明实施例对此不加以限制。
在词库中存放了输入法系统所需的语言信息,由于不同的文字可能对应相同的编码,对于特定的字符串,输入法通过词库可以完成字符串与字、词、句的转换,猜测用户真实的输入意图。
在本发明实施例中,词库可以包含各种语言信息,例如:
(1)词条;
由于词是中文中常用的最小表义单位,因此,输入法大量使用了词条,词条包括单字。
例如,用户基于拼音规范输入字符串“zhuan”时,存在多个同音字,较难确定用户想输入“转、专、赚、砖……”中的哪一个单字。
同样,用户基于拼音规范输入字符串“li”时,也存在多个同音字,也较难确定用户想输入的是“里、李、力、利……”中的哪一个单字。
但是,如果用户基于拼音规范连续输入字符串“zhuanli”,输入法可以依据现有的词条规则确定用户较大几率输入的就是“专利”这个词条。
(2)词频。
同音字大量存在,同音词也仍然是存在的,因此,输入法一般把所有候选项列出来供用户选择。
但是,候选项的位置对输入法的易用性有很大影响,把较常用的候选项放到靠前的位置通常会对用户更有利,即词频(即词条的使用频率,包括当前用户的使用频率,群体用户的使用频率)是候选项排序的依据之一。
另外,在输入法中经常集成了自构词、句的功能,此时,词频也是词、句构造的依据之一。
当然,除此之外,词库还可以包括其他信息,如语言连接关系,即词和词之间的连接关系,如“的”常出现在形容词、名词、代词等后面,而“地”则常出现在副词后面,等等,本发明实施例对此不加以限制。
c、将查找到的字、词、句作为候选项进行显示。
由于显示的位置有限,为有限显示较大概率为用户所需的候选项,输入法一般会对查找到的候选项计算评分。
在评分时,通常考虑如下因素:
(1)、用户属性;
不同的用户可能需要用到相同的词,但其重要性却随用户的不同而不同。
例如,同音词“研究”和“烟酒”,前者在学术领域使用较多,而后者则在日常生活中使用较多,但两者都是可能用到的。
因此,当用户输入拼音字符串“yanjiu”时,两者均可能出现在候选项中。但是,若明确当前的用户为学生时,“研究”较大可能是当前用户所需的,则可以提高其权重。
(2)、输入环境;
通过输入法系统的使用环境可以动态调整词库和/或词条的权重。
例如,若输入法系统中具有“办公用语”和“网络用语”两个细胞词库,分别记载有办公常用的词条、网络聊天常用的词条。
一般情况下这两个词库的优先级是相同的,但当输入法系统识别在Word中进行输入时,可以给“办公用语”这个词库增加权重,而当用户在即时通讯工具的会话窗口进行输入时,则可以给“网络用语”这个词库增加权重。
(3)、词频;
一般而言,词频越高,其权重越高,反之,词频越低,其权重越低。
当然,除了词频与权重正相关之外,本领域技术人员还可以根据实际需要设置词频,本发明实施例对此不加以限制。
(4)、位置。
若词库中的词条按照权重进行排序,如权重高的词条排序在前,则词条在词库中的相对位置可以表达词条的权重。
步骤103,根据所述词组对所述候选项进行排序处理。
在具体实现中,输入法系统在词库中调取相应的词条作为候选项之后,可以按照用户行为对应的词组,通过调频等方式对该候选项进行排序处理。
在本发明的一个实施例中,候选项具有评分,则在本发明实施例中,步骤103可以包括如下子步骤:
子步骤S31,对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则执行子步骤S32。
子步骤S32,提高所述候选项的评分。
子步骤S33,按照所述评分对所述候选项进行排序处理。
在本发明实施例中,输入法系统可以按照上述解码的步骤对词库中的词条计算评分,在按照该评分调取相应的词条作为候选项之后,可以将候选项与用户行为对应的词组进行对比。
如果两者相同,则可以提高其评分。
在进行排序处理时,一般是评分越高,排序越前,因此,提高与用户行对应的词组相同的候选项的评分,可以提高其排序。
进一步而言,如果对词组配置了词频,则可以查询词组对应的词频,按照词频计算权值,其中,词频与所述权值正相关,即词频越大,权值越大,反之,词频越小,权值越小。
在候选项的评分的基础上,增加权值,作为提高之后的评分,使得词频越高的词组,其相同的候选项的评分提升越高,因此,在排序时,其排序越靠前。
步骤104,展示排序处理之后的候选项。
在输入法系统中,对于排序之后的快候选项,可以在候选栏中进行显示,如果某个候选项为用户所需的,则用户可以通过点击候选项、输入候选项对应的编号、点击空格键等方式选中该该候选项,则输入法系统可以进行上屏处理。
本发明实施例基于用户行为,获取该用户行为对应的词组,根据用户的输入字符串,获取与字符串匹配的候选项,根据词组对候选项进行排序处理,展示排序处理之后的候选项,通过用户行为挖掘出较大概率输入的词组,将用户行为转换为参考语料,以此对输入法系统输出的候选项进行排序处理,在用户尚未输入该词组对应的候选项的情况下,可以提高该候选项的排序,减少用户通过翻页操作进行查询的概率,提高输入效率。
参照图2,示出了本发明的另一种输入方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201,检测用户行为。
在具体实现中,用户在电子设备进行操作时,输入法系统可以启动一检测线程,检测当前的用户行为,需要说明的是,这些用户行为为非输入行为,即并不是在输入法系统进行输入的行为。
在本发明的一个实施例中,步骤201可以包括如下子步骤:
子步骤S41,识别当前运行的应用的应用标识。
子步骤S42,查询所述应用标识对应的用户行为。
应用本发明实施例,可以对在不同的应用上可以进行的操作进行统计,确定每个应用对应的用户行为,建立该应用与用户行为之间的映射关系。
在一个示例中,用户行为包括文本行为与非文本行为。
其中,文本行为可以指以获取文本信息为主的行为,例如,浏览新闻、聊天,等等。
非文本行为可以指不以获取文本信息为主的行为,例如,观看电视剧、观看电影、玩游戏,等等。
在该映射关系中,应用以其应用标识进行表示,而应用标识可以为一个唯一标识应用的信息。
例如,在电脑中,该应用标识可以为应用的进程ID,在Android系统的移动终端中,该应用标识可以为应用的包名(PackageName)。
在本发明实施例中,该线程可以检测当前运行的应用的应用标识,通过在先建立的映射关系查询该应用标识对应的用户行为。
需要说明的是,该映射关系可以存储在服务器中,则输入法系统可以将应用标识发送至服务器,并接收服务器返回的该应用标识对应的用户行为;此外,该映射关系也可以由服务器推送至输入法系统,则输入法系统可以在本地存储的映射关系中,查询该应用标识对应的用户行为。
步骤202,确定所述用户行为的行为标识。
在具体实现中,用户可能在一段时间段内可能进行多次同一用户行为,为了避免重复统计用户行为,则可以对用户行为的行为进行识别。
所谓行为标识,可以指唯一标示一个确定的用户行为的信息。
对于文本行为,在提取了应用的文本信息之后,可以对文本信息计算内容标识,如MD5(Message Digest Algorithm MD5,消息摘要算法第五版)、HASH(哈希值)等,作为行为标识。
在此情况下,若用户行为为文本行为,则行为标识包括对文本信息计算的内容标识。
对于非文本行为,则可以在提取了用户行为的行为对象之后,即可将行为对象设置为行为标识。
在此情况下,若用户行为为非文本行为,则行为标识包括行为对象。
当然,上述行为标识只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他行为标识,本发明实施例对此不加以限制。另外,除了上述行为标识外,本领域技术人员还可以根据实际需要采用其它行为标识,本发明实施例对此也不加以限制。
步骤203,在预设的行为队列中判断是否存储所述行为标识;若是,则执行步骤204;若否,则执行步骤205。
步骤204,忽略所述用户行为。
步骤205,将所述行为标识写入所述行为队列。
步骤206,当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识。
在本发明实施例中,可以在缓存中设置行为队列,用于存储行为标识。
遍历该行为队列中已存储的行为标识,如果具有当前用户行为对应的行为标识,则表示在一段时间内,该用户操作过相同的用户行为,则可以忽略当前的用户行为,避免重复统计。
如果不具有当前用户行为对应的行为标识,则表示一段时间内,用户首次操作该用户行为,则可以将该行为标识写入在行为队列中。
该行为队列为FIFO(First Input First Output,先进先出)队列,可以存储一定数量(阈值)的行为标识,如果超过了该数量(阈值),则可以将存储的时间最小的行为标识删除,先删除最先进行为队列的行为标识,直至行为队列中的行为标识小于或等于该数量(阈值)。
步骤207,获取所述用户行为对应的词组。
步骤208,对所述词组设置超时时间。
在本发明实施例中,在缓存等存储区域存储了该用户行为对应的词组时,由于用户行为具有时效性,因此,可以对该用户行为对应的词组设置超时时间。
需要说明的是,若在先已存储了某个词组,且具有超时时间,当前存储该词组时,以当前的超时时间为准,及以当前的超时时间更新在先的超时时间。
步骤209,根据用户的输入字符串,获取与所述字符串匹配的候选项。
步骤210,根据所述词组对所述候选项进行排序处理。
步骤211,展示排序处理之后的候选项。
步骤212,当到达所述超时时间时,删除所述词组。
输入法系统可以定时对词组进行检测,如果当前时间到达了超时时间,则可以将其从缓存等存储区域删除。
在一个示例中,可以在缓存中对词组记录存储时间,若当前时间与该存储时间超过了预设的时间阈值,则可以确定达到了超时时间。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种输入装置实施例的结构框图,具体可以包括如下模块:
词组获取模块301,用于基于用户行为,获取所述用户行为对应的词组;
候选项查询模块302,用于根据用户的输入字符串,获取与所述字符串匹配的候选项;
候选项排序模块303,用于根据所述词组对所述候选项进行排序处理;
候选项展示模块304,用于展示排序处理之后的候选项。
在本发明的一个实施例中,还包括:
用户行为检测模块,用于检测用户行为。
在本发明的一个实施例中,所述用户行为检测模块包括:
应用标识识别子模块,用于识别当前运行的应用的应用标识;
用户行为查询子模块,用于查询所述应用标识对应的用户行为。
在本发明的一个实施例中,所述词组获取模块包括:
文本信息获取子模块,用于若所述用户行为为文本获取行为,则获取所述文本行为对应应用中的文本信息;
分词处理子模块,用于对所述文本信息进行分词处理,获得词组;
缓存写入子模块,用于将所述词组写入缓存中。
在本发明的一个实施例中,所述词组获取模块301包括:
行为对象查询子模块,用于若所述用户行为为非文本获取行为,则查询所述非文本获取行为对应的行为对象;
行为对象分析子模块,用于对所述行为对象进行分析、获取与行为对象相匹配的词组;
缓存写入子模块,用于将所述词组写入缓存中。
在本发明的一个实施例中,所述行为对象分析子模块,包括:
行为对象发送单元,用于将所述行为对象发送至服务器;
词组接收单元,用于接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
在本发明的一个实施例中,所述缓存写入子模块包括:
词组判断单元,用于在缓存中判断是否存在所述词组;若是,则调用累加单元,若否,则调用存储单元;
累加单元,用于累加所述词组的词频;
存储单元,用于在缓存中存储所述词组。
在具体实现,所述词组包括实体词。
在本发明的一个实施例中,所述候选项排序模块303包括:
相同判断子模块,用于对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则调用评分提高子模块;
评分提高子模块,用于提高所述候选项的评分;
评分排序子模块,用于按照所述评分对所述候选项进行排序处理。
在本发明的一个实施例中,所述评分提高子模块包括:
词频查询单元,用于查询所述词组对应的词频;
权值计算单元,用于按照所述词频计算权值,其中,所述词频与所述权值正相关;
权值增加单元,用于在所述候选项的评分的基础上,增加所述权值。
在本发明的一个实施例中,还包括:
行为标识确定模块,用于确定所述用户行为的行为标识;
行为标识判断模块,用于在预设的行为队列中判断是否存储所述行为标识;若是,则调用用户行为忽略模块,若否,则调用行为队列写入模块;
用户行为忽略模块,用于忽略所述用户行为;
行为队列写入模块,用于将所述行为标识写入所述行为队列;
行为标识删除模块,用于当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
在本发明的一个实施例中,还包括:
超时时间设置模块,用于对所述词组设置超时时间;
词组删除模块,用于当到达所述超时时间时,删除所述词组。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于输入的装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)的接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理部件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:
基于用户行为,获取所述用户行为对应的词组;
根据用户的输入字符串,获取与所述字符串匹配的候选项;
根据所述词组对所述候选项进行排序处理;
展示排序处理之后的候选项。
可选地,还包括:
检测用户行为。
可选地,所述检测用户行为,包括:
识别当前运行的应用的应用标识;
查询所述应用标识对应的用户行为。
可选地,所述获取所述用户行为对应的词组,包括:
若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;
对所述文本信息进行分词处理,获得词组;
将所述词组写入缓存中。
可选地,所述获取所述用户行为对应的词组,包括:
若所述用户行为为非文本行为,则查询所述非文本获取行为对应的行为对象;
对所述行为对象进行分析、获取与行为对象相匹配的词组;
将所述词组写入缓存中。
可选地,所述对所述行为对象进行分析、获取与行为对象相匹配的词组,包括:
将所述行为对象发送至服务器;
接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
可选地,所述将所述词组写入缓存中,包括:
在缓存中判断是否存在所述词组;
若是,则累加所述词组的词频;
若否,则在缓存中存储所述词组。
可选地,所述词组包括实体词。
可选地,所述根据所述词组对所述候选项进行排序处理,包括:
对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;
按照所述评分对所述候选项进行排序处理。
可选地,所述提高所述候选项的评分,包括:
查询所述词组对应的词频;
按照所述词频计算权值,其中,所述词频与所述权值正相关;
在所述候选项的评分的基础上,增加所述权值。
可选地,还包括:
确定所述用户行为的行为标识;
在预设的行为队列中判断是否存储所述行为标识;
若是,则忽略所述用户行为;
若否,则将所述行为标识写入所述行为队列;
当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
可选地,还包括:
对所述词组设置超时时间;
当到达所述超时时间时,删除所述词组。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
本发明实施例公开了A1、一种输入方法,包括:基于用户行为,获取与所述用户行为对应的词组;根据用户的输入字符串,获取与所述字符串匹配的候选项;根据所述词组对所述候选项进行排序处理;展示排序处理之后的候选项。A2、根据A1所述的方法,还包括:检测用户行为。A3、根据A2所述的方法,所述检测用户行为,包括:识别当前运行的应用的应用标识;查询所述应用标识对应的用户行为。A4、根据A1所述的方法,所述获取所述用户行为对应的词组,包括:若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;对所述文本信息进行分词处理,获得词组;将所述词组写入缓存中。A5、根据A1所述的方法,所述获取所述用户行为对应的词组,包括:若所述用户行为为非文本行为,则查询所述非文本获取行为对应的行为对象;对所述行为对象进行分析、获取与行为对象相匹配的词组;将所述词组写入缓存中。A6、根据A5所述的方法,所述对所述行为对象进行分析、获取与行为对象相匹配的词组,包括:将所述行为对象发送至服务器;接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。A7、根据A4或A5所述的方法,所述将所述词组写入缓存中,包括:在缓存中判断是否存在所述词组;若是,则累加所述词组的词频;若否,则在缓存中存储所述词组。A8、根据A1或A4或A5所述的方法,所述词组包括实体词。A9、根据A1或A2或A3或A4或A5或A6所述的方法,所述根据所述词组对所述候选项进行排序处理,包括:对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;按照所述评分对所述候选项进行排序处理。A10、根据A9所述的方法,所述提高所述候选项的评分,包括:查询所述词组对应的词频;按照所述词频计算权值,其中,所述词频与所述权值正相关;在所述候选项的评分的基础上,增加所述权值。A11、根据A1或A2或A3或A4或A5或A6所述的方法,还包括:确定所述用户行为的行为标识;在预设的行为队列中判断是否存储所述行为标识;若是,则忽略所述用户行为;若否,则将所述行为标识写入所述行为队列;当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;或者,若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。A12、根据A1或A2或A3或A4或A5或A6所述的方法,还包括:对所述词组设置超时时间;当到达所述超时时间时,删除所述词组。
本发明实施例还公开了B13、一种输入装置,包括:词组获取模块,用于基于用户行为,获取所述用户行为对应的词组;候选项查询模块,用于根据用户的输入字符串,获取与所述字符串匹配的候选项;候选项排序模块,用于根据所述词组对所述候选项进行排序处理;候选项展示模块,用于展示排序处理之后的候选项。B14、根据B13所述的装置,还包括:用户行为检测模块,用于检测用户行为。B15、根据B14所述的装置,所述用户行为检测模块包括:应用标识识别子模块,用于识别当前运行的应用的应用标识;用户行为查询子模块,用于查询所述应用标识对应的用户行为。B16、根据B13所述的装置,所述词组获取模块包括:文本信息获取子模块,用于若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;分词处理子模块,用于对所述文本信息进行分词处理,获得词组;缓存写入子模块,用于将所述词组写入缓存中。B17、根据B13所述的装置,所述词组获取模块包括:行为对象查询子模块,用于若所述用户行为为非文本获取行为,则查询所述非文本获取行为对应的行为对象;行为对象分析子模块,用于对所述行为对象进行分析、获取与行为对象相匹配的词组;缓存写入子模块,用于将所述词组写入缓存中。B18、根据B17所述的装置,所述行为对象分析子模块,包括:行为对象发送单元,用于将所述行为对象发送至服务器;词组接收单元,用于接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。B19、根据B16或B17所述的装置,所述缓存写入子模块包括:词组判断单元,用于在缓存中判断是否存在所述词组;若是,则调用累加单元,若否,则调用存储单元;累加单元,用于累加所述词组的词频;存储单元,用于在缓存中存储所述词组。B20、根据B13或B16或B17所述的装置,所述词组包括实体词。B21、根据B13或B14或B15或B16或B17或B18所述的装置,所述候选项排序模块包括:相同判断子模块,用于对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则调用评分提高子模块;评分提高子模块,用于提高所述候选项的评分;评分排序子模块,用于按照所述评分对所述候选项进行排序处理。B22、根据B21所述的装置,所述评分提高子模块包括:词频查询单元,用于查询所述词组对应的词频;权值计算单元,用于按照所述词频计算权值,其中,所述词频与所述权值正相关;权值增加单元,用于在所述候选项的评分的基础上,增加所述权值。B23、根据B 13或B14或B15或B16或B17或B18所述的装置,还包括:行为标识确定模块,用于确定所述用户行为的行为标识;行为标识判断模块,用于在预设的行为队列中判断是否存储所述行为标识;若是,则调用用户行为忽略模块,若否,则调用行为队列写入模块;用户行为忽略模块,用于忽略所述用户行为;行为队列写入模块,用于将所述行为标识写入所述行为队列;行为标识删除模块,用于当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;或者,若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。B24、根据B13或B14或B15或B16或B17或B18所述的装置,还包括:超时时间设置模块,用于对所述词组设置超时时间;词组删除模块,用于当到达所述超时时间时,删除所述词组。
本发明实施例还公开了C25、一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:基于用户行为,获取所述用户行为对应的词组;根据用户的输入字符串,获取与所述字符串匹配的候选项;根据所述词组对所述候选项进行排序处理;展示排序处理之后的候选项。C26、根据C25所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:检测用户行为。C27、根据C26所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:识别当前运行的应用的应用标识;查询所述应用标识对应的用户行为。C28、根据C25所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:若所述用户行为为文本获取行为,则获取所述文本行为对应应用中的文本信息;对所述文本信息进行分词处理,获得词组;将所述词组写入缓存中。C29、根据C25所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:若所述用户行为为非文本获取行为,则查询所述非文本获取行为对应的行为对象;接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组对所述行为对象进行分析、获取与行为对象相匹配的词组;将所述词组写入缓存中。C30、根据C29所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:将所述行为对象发送至服务器;接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。C31、根据C28或C29所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:在缓存中判断是否存在所述词组;若是,则累加所述词组的词频;若否,则在缓存中存储所述词组。C32、根据C25或C28或C29所述的装置,所述词组包括实体词。C33、根据C25或C26或C27或C28或C29或C30所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;按照所述评分对所述候选项进行排序处理。C34、根据C33所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:查询所述词组对应的词频;按照所述词频计算权值,其中,所述词频与所述权值正相关;在所述候选项的评分的基础上,增加所述权值。C35、根据C25或C26或C27或C28或C29或C30所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:确定所述用户行为的行为标识;在预设的行为队列中判断是否存储所述行为标识;若是,则忽略所述用户行为;若否,则将所述行为标识写入所述行为队列;当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;或者,若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。C36、根据C25或C26或C27或C28或C29或C30所述的装置,所述一个或者一个以上程序还包含用于进行以下操作的指令:对所述词组设置超时时间;当到达所述超时时间时,删除所述词组。
C37、一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得处理器执行如A1-A12一个或多个的方法。

Claims (14)

1.一种输入方法,其特征在于,包括:
基于用户行为,获取与所述用户行为对应的词组;
根据用户的输入字符串,获取与所述字符串匹配的候选项;
根据所述词组对所述候选项进行排序处理;
展示排序处理之后的候选项。
2.根据权利要求1所述的方法,其特征在于,检测用户行为,所述检测用户行为,包括:
识别当前运行的应用的应用标识;
查询所述应用标识对应的用户行为。
3.根据权利要求1所述的方法,其特征在于,所述获取所述用户行为对应的词组,包括:
若所述用户行为为文本行为,则获取所述文本行为对应应用中的文本信息;
对所述文本信息进行分词处理,获得词组;
将所述词组写入缓存中。
4.根据权利要求1所述的方法,其特征在于,所述获取所述用户行为对应的词组,包括:
若所述用户行为为非文本行为,则查询所述非文本获取行为对应的行为对象;
对所述行为对象进行分析、获取与行为对象相匹配的词组;
将所述词组写入缓存中。
5.根据权利要求5所述的方法,其特征在于,所述对所述行为对象进行分析、获取与行为对象相匹配的词组,包括:
将所述行为对象发送至服务器;
接收所述服务器返回的、与所述行为对象之间的共现率符合预设条件的词组。
6.根据权利要求4或5所述的方法,其特征在于,所述将所述词组写入缓存中,包括:
在缓存中判断是否存在所述词组;
若是,则累加所述词组的词频;
若否,则在缓存中存储所述词组。
7.根据权利要求1或4或5所述的方法,其特征在于,所述词组包括实体词。
8.根据权利要求1或2或3或4或5或6所述的方法,其特征在于,所述根据所述词组对所述候选项进行排序处理,包括:
对所述候选项评分,判断所述候选项与所述词组是否相同;若是,则提高所述候选项的评分;
按照所述评分对所述候选项进行排序处理。
9.根据权利要求9所述的方法,其特征在于,所述提高所述候选项的评分,包括:
查询所述词组对应的词频;
按照所述词频计算权值,其中,所述词频与所述权值正相关;
在所述候选项的评分的基础上,增加所述权值。
10.根据权利要求1或2或3或4或5或6所述的方法,其特征在于,还包括:
确定所述用户行为的行为标识;
在预设的行为队列中判断是否存储所述行为标识;
若是,则忽略所述用户行为;
若否,则将所述行为标识写入所述行为队列;
当所述行为队列中的行为标识的数量超过预设的阈值时,则删除时间最小的行为标识;
其中,若所述用户行为为文本行为,则所述行为标识包括对所述文本信息计算的内容标识;
或者,
若所述用户行为为非文本行为,则所述行为标识包括所述行为对象。
11.根据权利要求1或2或3或4或5或6所述的方法,其特征在于,还包括:
对所述词组设置超时时间;
当到达所述超时时间时,删除所述词组。
12.一种输入装置,其特征在于,包括:
词组获取模块,用于基于用户行为,获取所述用户行为对应的词组;
候选项查询模块,用于根据用户的输入字符串,获取与所述字符串匹配的候选项;
候选项排序模块,用于根据所述词组对所述候选项进行排序处理;
候选项展示模块,用于展示排序处理之后的候选项。
13.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
基于用户行为,获取所述用户行为对应的词组;
根据用户的输入字符串,获取与所述字符串匹配的候选项;
根据所述词组对所述候选项进行排序处理;
展示排序处理之后的候选项。
14.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得处理器执行如权利要求1-12一个或多个的方法。
CN201810074891.3A 2018-01-25 2018-01-25 一种输入方法和装置 Pending CN110083253A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810074891.3A CN110083253A (zh) 2018-01-25 2018-01-25 一种输入方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810074891.3A CN110083253A (zh) 2018-01-25 2018-01-25 一种输入方法和装置

Publications (1)

Publication Number Publication Date
CN110083253A true CN110083253A (zh) 2019-08-02

Family

ID=67412069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810074891.3A Pending CN110083253A (zh) 2018-01-25 2018-01-25 一种输入方法和装置

Country Status (1)

Country Link
CN (1) CN110083253A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN102073699A (zh) * 2010-12-20 2011-05-25 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102426591A (zh) * 2011-10-31 2012-04-25 北京百度网讯科技有限公司 一种操作用于内容输入的语料库的方法和设备
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN106933801A (zh) * 2017-02-13 2017-07-07 北京奇虎科技有限公司 一种词库的更新方法和装置
CN106951104A (zh) * 2017-02-13 2017-07-14 北京奇虎科技有限公司 一种基于词库的词条处理方法和装置
CN106970949A (zh) * 2017-03-03 2017-07-21 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN107169837A (zh) * 2017-05-19 2017-09-15 北京京东尚科信息技术有限公司 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN107305438A (zh) * 2016-04-21 2017-10-31 北京搜狗科技发展有限公司 候选项的排序方法和装置、用于候选项排序的装置
CN107544684A (zh) * 2016-06-29 2018-01-05 北京搜狗科技发展有限公司 一种候选词显示方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334774A (zh) * 2007-06-29 2008-12-31 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
CN101373468A (zh) * 2007-08-20 2009-02-25 北京搜狗科技发展有限公司 一种加载词库的方法、字符输入的方法和输入法系统
CN101388011A (zh) * 2007-09-13 2009-03-18 北京搜狗科技发展有限公司 一种向用户词库中记录信息的方法和装置
CN102073699A (zh) * 2010-12-20 2011-05-25 百度在线网络技术(北京)有限公司 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102426591A (zh) * 2011-10-31 2012-04-25 北京百度网讯科技有限公司 一种操作用于内容输入的语料库的方法和设备
CN107102746A (zh) * 2016-02-19 2017-08-29 北京搜狗科技发展有限公司 候选词生成方法、装置以及用于候选词生成的装置
CN107305438A (zh) * 2016-04-21 2017-10-31 北京搜狗科技发展有限公司 候选项的排序方法和装置、用于候选项排序的装置
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN107544684A (zh) * 2016-06-29 2018-01-05 北京搜狗科技发展有限公司 一种候选词显示方法及装置
CN106933801A (zh) * 2017-02-13 2017-07-07 北京奇虎科技有限公司 一种词库的更新方法和装置
CN106951104A (zh) * 2017-02-13 2017-07-14 北京奇虎科技有限公司 一种基于词库的词条处理方法和装置
CN106970949A (zh) * 2017-03-03 2017-07-21 阿里巴巴集团控股有限公司 一种信息推荐方法及装置
CN107169837A (zh) * 2017-05-19 2017-09-15 北京京东尚科信息技术有限公司 用于辅助搜索的方法、装置、电子设备及计算机可读介质

Similar Documents

Publication Publication Date Title
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN109522419B (zh) 会话信息补全方法及装置
US20170154104A1 (en) Real-time recommendation of reference documents
CN107608532B (zh) 一种联想输入方法、装置及电子设备
CN107145571B (zh) 一种搜索方法及装置
CN107247519A (zh) 一种输入方法及装置
CN107436691A (zh) 一种输入法进行纠错的方法、客户端、服务器及装置
CN107621886B (zh) 一种输入推荐方法、装置及电子设备
CN108121736A (zh) 一种主题词确定模型的建立方法、装置及电子设备
WO2018090688A1 (zh) 一种输入方法、装置及电子设备
CN108008832A (zh) 一种输入方法和装置、一种用于输入的装置
CN107918496A (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN107092424A (zh) 一种纠错项的显示方法、装置和用于纠错项的显示的装置
CN109710732A (zh) 信息查询方法、装置、存储介质和电子设备
CN107424612B (zh) 处理方法、装置和机器可读介质
CN108803890A (zh) 一种输入方法、输入装置和用于输入的装置
CN109783244A (zh) 处理方法和装置、用于处理的装置
CN111813932A (zh) 文本数据的处理方法、分类方法、装置及可读存储介质
CN108628461A (zh) 一种输入方法和装置、一种更新词库的方法和装置
CN108073293A (zh) 一种目标词组的确定方法和装置
CN110244859A (zh) 一种自定义输入法候选项的方法以及装置
CN110083253A (zh) 一种输入方法和装置
KR102327790B1 (ko) 정보 처리 방법, 장치 및 저장 매체
CN108073294A (zh) 一种智能组词方法和装置、一种用于智能组词的装置
CN110929122B (zh) 一种数据处理方法、装置和用于数据处理的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination