CN114330326A - 个性化词库的处理方法和装置 - Google Patents

个性化词库的处理方法和装置 Download PDF

Info

Publication number
CN114330326A
CN114330326A CN202011053570.9A CN202011053570A CN114330326A CN 114330326 A CN114330326 A CN 114330326A CN 202011053570 A CN202011053570 A CN 202011053570A CN 114330326 A CN114330326 A CN 114330326A
Authority
CN
China
Prior art keywords
user
personalized
state information
entries
word bank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011053570.9A
Other languages
English (en)
Inventor
方悦
唐维
王逢宝
李晓帆
桑天雨
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202011053570.9A priority Critical patent/CN114330326A/zh
Publication of CN114330326A publication Critical patent/CN114330326A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种个性化词库的处理方法、装置和用于处理个性化词库的装置。其中的方法具体包括:确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。本发明实施例可以降低用户逐字选择和上屏的操作成本,进而提高输入效率。

Description

个性化词库的处理方法和装置
技术领域
本发明涉及输入技术领域,尤其涉及一种个性化词库的处理方法和装置。
背景技术
目前,涉及交互的设备,通常需要用户通过输入法系统将自己的操作意图与设备交互识别。例如,用户可以输入输入串,然后由输入法程序依据其预置的映射规则,将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。
目前,输入法程序可以对用户输入的输入串进行解析,如将用户输入的输入串为拼音串,则可以通过查询词库中存储的拼音串与词条之间的映射关系,获得该拼音串对应的词条,然后将查询得到的词条作为候选项展示给用户。
发明人在实施本发明实施例的过程中发现,如果词库中不存在与用户输入的拼音串相对应的词条,则通常需要逐字选择和上屏目标词条所包括的单字,以完成该目标词条的输入;这不仅导致输入过程繁琐,且影响了输入效率。例如,用户欲要通过拼音串“liduanji”输入目标词条“狸端机”,但词库中不存在“狸端机”,因此用户需要逐字选择和上屏“狸”、“端”和“机”等单字,单字的选择和上屏,需要耗费较多的操作成本,导致输入效率较低。
发明内容
本发明实施例提供一种个性化词库的处理方法、装置和用于输入的装置,可以降低用户逐字选择和上屏的操作成本,进而提高输入效率。
为了解决上述问题,本发明实施例公开了一种个性化词库的处理方法,包括:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
另一方面,本发明实施例公开了一种个性化词库的处理装置,包括:
用户状态信息确定模块,用于确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;以及
第一提供模块,用于若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
再一方面,本发明实施例公开了一种用于处理个性化词库的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的个性化词库的处理方法。
本发明实施例包括以下优点:
本发明实施例在用户状态信息符合预设条件的情况下,向用户提供该用户状态信息对应的第一个性化词库。由于该用户状态信息可以为用户使用设备过程中的实时信息,故该第一个性化词库可以满足该用户状态信息对应的实时性个性化需求。将该第一个性化词库用于用户的输入过程,可以基于第一个性化词库与实时性个性化需求相符的特性,提高用户欲要输入的目标词条对于第一个性化词库的命中概率,因此可以降低用户逐字选择和上屏的操作成本,进而提高输入效率。
在用户状态信息包括用户的输入内容与特征词条之间的匹配信息的情况下,本发明实施例可以依据与特征词条相匹配的输入内容,提供用户的实时性个性化需求对应的第一个性化词库。
在用户状态信息包括用户所处的地理位置的更新信息的情况下,用户的实时性个性化需求可以与更新后的地理位置相关,故本发明实施例可以提供更新后的地理位置对应的第一个性化词库,帮助用户提供更新后的地理位置对应词条的输入效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种个性化词库的处理方法的应用环境的示意;
图2是本发明的一种个性化词库的处理方法实施例一的步骤流程图;
图3是本发明的一种个性化词库的处理方法实施例二的步骤流程图;
图4是本发明的一种个性化词库的处理方法实施例三的步骤流程图;
图5是本发明的一种个性化词库的处理方法实施例四的步骤流程图;
图6是本发明的一种个性化词库的处理方法实施例五的步骤流程图;
图7是本发明的一种个性化词库的处理装置实施例的结构框图;
图8是本发明的一种用于处理个性化词库的装置800的框图;及
图9是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术中输入效率低的技术问题,本发明实施例提供了一种个性化词库的处理方案,该方案可以确定用户状态信息;上述用户状态信息具体包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;若上述用户状态信息符合预设条件,则向用户提供上述用户状态信息对应的第一个性化词库。
本发明实施例在用户状态信息符合预设条件的情况下,向用户提供该用户状态信息对应的第一个性化词库。由于该用户状态信息可以为用户使用设备过程中的实时信息,故该第一个性化词库可以满足该用户状态信息对应的实时性个性化需求。将该第一个性化词库用于用户的输入过程,可以基于第一个性化词库与实时性个性化需求相符的特性,提高用户欲要输入的目标词条对于第一个性化词库的命中概率,因此可以降低用户逐字选择和上屏的操作成本,进而提高输入效率。
在用户状态信息包括用户的输入内容与特征词条之间的匹配信息的情况下,本发明实施例可以依据与特征词条相匹配的输入内容,提供用户的实时性个性化需求对应的第一个性化词库。
例如,实时性个性化需求与话题A相关,则在用户输入与话题A相关的输入内容的情况下,本发明实施例提供的第一个性化词库中可以包括:与话题A相关的词条集合,以帮助用户提高话题A相关词条的输入效率。该话题可以表征谈话的题目、或谈论的主题。例如,话题A可以与影视剧、游戏、学车、装修等相关,可以理解,本发明实施例对于具体的话题不加以限制。
在用户状态信息包括用户所处的地理位置的更新信息的情况下,用户的实时性个性化需求可以与更新后的地理位置相关,故本发明实施例可以提供更新后的地理位置对应的第一个性化词库。例如,在用户B在城市X旅行的情况下,向用户B提供城市X对应的第一个性化词库,城市X对应的第一个性化词库可以包括:城市X的景点、酒店、餐馆等POI(信息点,Point of Information)对应的POI词条,以帮助用户提供POI词条的输入效率。
本发明实施例提供的个性化词库的处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序,Application)。
本发明实施例的服务端可以为云服务端(云端)。云端是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。云端的资源信息具有动态性,使得其处理能力可弹性伸缩。
本发明实施例可应用于键盘符号、手写、语音等各种输入方式的输入法程序,即用户可以通过编码字符串进行文字输入,输入串可以指用户输入的编码字符串。在输入法领域,对于例如中文、日文、韩文、或者其它语言的输入法程序,通常可以把用户输入的输入串转换成相应语言的候选项。以下主要以中文为例进行说明,日文、韩文等其它语言相互参照即可。可以理解,所述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等,本发明实施例对于某种语言对应的具体输入法程序不加以限制。
以中文的输入为例,编码字符串的类型可以包括:拼音串、字形串(如五笔串等)。以英文的输入为例,编码字符串的类型可以包括:字母字符串等。
在实际应用中,对于键盘符号的输入方式,用户可以通过实体键盘、或者虚拟键盘等输入上述输入串。例如,对于具有触摸屏的终端,其可以在输入界面中设置虚拟键盘,以使用过通过触发上述虚拟键盘包括的虚拟按键进行输入串的输入。可选地,上述虚拟键盘的例子可以包括:9键键盘和26键键盘等。并且,可以理解,上述输入界面中除了设置有字母对应的虚拟按键之外,还可以设置有符号按键、数字按键、例如中英切换按键的功能按键,或者,还可以设置有工具栏按键等,可以理解,本发明实施例对于输入界面所包含的具体按键不加以限制。
根据一些实施例,上述输入串可以包括但不限于:用户通过按键所输入的一个按键符号或多个按键符号的组合。所述按键符号具体可以包括:拼音、笔画、假名等。
本发明实施例中,候选可用于表示输入法程序提供的待被用户选择的一个或多个字符。候选可以与上下文相应,或者,候选可以与输入串相应,或者,候选可以与输入串和上下文相应。候选可以为中文字符、英文字符、日文字符等语言的字符,候选也可以为颜文字、图片等形式的符号组合。其中,所述颜文字包括但不限于线条、符号、文字所组成的图画,例如,所述颜文字的例子可以包括:“:P”、“:-o”、“:-)”等。
本发明实施例中,可以依据输入串,在词库中进行查找,以得到输入串对应的候选。上述词库可以为传统词库,上述传统词库具体包括:系统词库、用户词库、细胞词库、云词库等。本发明实施例在传统词库的基础上增加了第一个性化词库,以满足用户的实时性个性化需求。
方法实施例一
参照图2,示出了本发明的一种个性化词库的处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、确定用户状态信息;上述用户状态信息具体包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
步骤202、若上述用户状态信息符合预设条件,则向用户提供上述用户状态信息对应的第一个性化词库。
图2所示方法实施例可由客户端和/或服务端执行,可以理解,本发明实施例对于方法实施例的具体执行主体不加以限制。
步骤201中,可以接收用户的输入内容,并对该输入内容与特征词条进行匹配,以得到两者之间的匹配信息。该匹配信息可以包括:匹配或不匹配。
本发明实施例中,特征词可以表征具有专属特性的词,其可以满足用户的某类个性化需求。上述特征词条具体包括领域词条、自造词条和云词条中的至少一种。
其中,领域可以指某一专业性范围,涉及在该范围内的所有事项均可引用。领域词汇可以指领域范围内的词汇,领域词汇可以对应有领域关键词。
本发明实施例可以采用如下确定方式确定领域词汇。
确定方式1、确定个人特征类别的领域词汇,个人特征类别可以对应领域关键词。
个人特征类别的领域词汇具体包括:职业属性类(医生、快递员…);长期兴趣类(动漫二次元、军事…)等。
确定方式2、确定话题类别的领域词汇,话题类别可以对应领域关键词。
话题类别的领域词汇具体包括:临时性话题(养鱼、某电视剧…);阶段性话题(如买保险、买房、学车、装修…)等。
确定方式3、从网站的细胞词库抓取细胞词条,对抓取的细胞词条进行筛选后,标注对应的领域关键词。
确定方式4、对用户输入过的高频词条进行聚类,对应的类别关键词作为领域关键词,类别下的高频词条作为领域词条。
可以理解,确定方式1至确定方式4只是作为领域词汇的确定方式的示例,本发明实施例对于领域词汇的具体确定方式不加以限制,本领域技术人员还可以实际应用需求,采用其他确定方式。例如,可以收集实体词,将实体词作为领域词汇。
本发明实施例中,实体是一个具体事物或概念。实体一般会划分类型,例如人物类实体、电影类实体、动物类实体、历史类实体等。同一个实体可以对应多个实体实例,实体实例可以是在网络(或其它媒介)中对一个实体的描述性页面(内容),例如百科的页面中即包含实体对应的实体实例。
可选地,实体可以包括:命名实体(named entity),命名实体可以指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的命名实体还可以包括:书名、歌曲名、影视剧名、产品名、品牌名、数字、日期、货币、地址等等。
可选地,所述实体类别可以包括如下类别中的至少一种:人物、地点、水果、蔬菜、动物、植物、建筑物、衣物、食物、药物、交通工具、家具、乐器、电器、以及自然现象。实体类别可以作为领域关键词。
自造词条可以为用户自造的词条,以补充传统词库的不足。在实际应用中,可以提供自造词条接口,以接收用户设定的输入串与自造词条之间的映射关系。
云词条可以为云端基于云输入法提供的词条,可以作为传统词库中词条的补充。云输入法是依托于云计算技术的输入法,凭借服务器集群强大的存储和运算能力,拥有传统输入法所不可比拟的优势:更大、更新的词库,更高级的语言模型,这些优势使得输入的准确率有了显著的提升。在实际应用中,可以向云端发送云请求,该云请求中可以包括输入串,并可以接收云端返回的云词条。
本发明实施例中,地理位置一般是用来描述地理事物时间和空间关系。它根据用户不同的需要,可以用不同的方法进行对地理事物的定性定量定位,从而把握地理事物的时空属性和相关特征。
可选地,上述地理位置的类型具体包括如下类型中的至少一种:行政区域、小区、街道、以及楼宇。可以理解,本发明实施例对于地理位置的具体类型不加以限制。
行政区域,是国家为了进行分级管理而实行的区域划分。例如,国家分为省、自治区、直辖市;省、自治区分为市、县、自治州、自治县;县、自治县分为乡、镇、民族乡等。
本发明的一种实施例可以将特征词条集合存储在本地,并对输入内容与特征词条集合进行匹配,以得到对应的匹配信息。然而,特征词条集合通常占用一定的存储空间。
在本发明的另一种实施例中,上述方法还可以包括:针对本地词库中本地词条添加特征词条标记;若用户的输入内容命中的本地词条带有特征词条标记,则所述输入内容与特征词条相匹配。
本发明实施例针对本地词库中与特征词条相匹配的本地词条添加特征词条标记,并依据输入内容命中的本地词条是否带有特征词条标记,判断输入内容是否与特征词条相匹配。本发明实施例可以节省特征词条集合占用的存储空间。
本发明实施例可以依据终端对应的地理位置,确定用户所处的地理位置,并检测用户所处的地理位置是否发生更新。
在本发明的一种可选实施例中,地理位置可以为经纬度信息,可以按照第一周期,确定经纬度信息,第一周期可以为1小时等。并且,可以判断相邻两次经纬度信息之间的距离,若该距离大于距离阈值(如100千米),则可以判断是否发生城市的更新。例如,可以向服务端发送更新检测请求,若服务端返回更新标识,则认为发生了城市更新,若服务端返回未更新标识,则认为未发生城市更新。
步骤202中,预设条件可以作为提供第一个性化词库的条件。
本领域技术人员可以根据实际应用需求,确定上述预设条件。例如,上述预设条件具体包括:
第一预设条件:与特征词条相匹配的输入内容的数量超过阈值;和/或
第二预设条件:用户所处的地理位置发生更新。
第一预设条件可以为,输入内容与特征词条的匹配次数超过阈值。此种情况下,说明用户存在特征词条对应的实时个性化需求,因此可以向用户提供对应的第一个性化词库。本领域技术人员可以根据实际应用需求确定阈值,例如,阈值可以为大于0的自然数,阈值可以为2等。
第二预设条件可以为,用户所处的地理位置发生更新,也即用户到达了新的地理位置。此种情况下,说明用户存在更新后的地理位置对应的实时个性化需求,因此可以向用户提供对应的第一个性化词库。
本发明实施例中,可选的是,上述第一个性化词库具体包括如下词条中的至少一种:
个性化词条1、领域关键词与所述输入内容相匹配的第一目标领域内的领域词条;
个性化词条2、与所述输入内容存在向量匹配关系的相关词条;
个性化词条3、更新后的地理位置对应的词条;
个性化词条4、与所述输入内容及其上下文相匹配的词条。
对于个性化词条1,本发明实施例可以将输入内容与领域关键词相匹配。例如,用户A的输入内容包括:“捕虫网”、“猴子”、“狼蛛岛”等,上述输入内容与了领域关键词“动物之森”相匹配,故可以将领域关键词“动物之森”对应的游戏领域内的领域词条作为个性化词条推荐给用户A。领域关键词“动物之森”对应的游戏领域内的领域词条具体包括:“狸端机”、“扶南”、“吕游”等。
对于个性化词条2,本发明实施例可以将输入内容转换为第一词向量,并依据向量匹配关系,得到与第一词向量相匹配的第二词向量,将第二词向量对应的词条作为个性化词条2。
词向量技术可以将词转化成为稠密向量。并且对于语义和/或语境相似的词,其对应的词向量也相近。维度稠密的词向量能够包含更多信息,并且词向量的单个维度可以具有特定的含义。
例如,词向量的维度数量可以包括:128或256或512或1024等。经过训练之后的词向量,能够表征词语之间的匹配关系。例如,“香蕉”和“苹果”之间的距离,会比“香蕉”和“茄子”之间的距离要近,因此,“香蕉”和“苹果”之间的匹配度大于“香蕉”和“茄子”之间的匹配度。
多个词向量可以融合为一个新的词向量。例如,词向量“女人”+词向量“漂亮”=词向量“女神”。一个词向量减去一个词向量可以得到一个新的向量。例如,例如,词向量“国王”-词向量“男人”+词向量“女人”=词向量“女皇”等。
对于个性化词条3,可以提供更新后的地理位置对应的景点、酒店、餐馆等POI对应的POI词条,以帮助用户提供POI词条的输入效率。
对于个性化词条4,可以将输入内容的上下文用于个性化词条的确定过程,可以提高个性化词条对应领域的精确度。
例如,输入内容包括“猴子”,该输入内容对应“动物”、“动物之森”等领域,本发明实施例可以结合该输入内容的上下文,如“用捕虫网打不同小动物的反应”、“猴子在冷漠后气鼓鼓离去”等,确定该输入内容对应“动物之森”这个领域。
本发明实施例中,上下文可以包括:上文、和/或、下文。可选地,该上文通常为输入内容之前的部分,该下文通常为输入内容之后的部分。
在本发明的一种可选实施例中,上述向用户提供所述用户状态信息对应的第一个性化词库,具体包括:若符合预设条件,则向服务端发送请求;所述请求中可以包括:上述用户状态信息;接收服务端依据所述请求返回的第一个性化词库。
可选地,上述请求中还可以包括:输入内容的上下文。上下文中可以包括:输入内容前后的预设数量的词,预设数量可以为5~10,可以理解,本发明实施例对于具体的预设数量不加以限制。
服务端可以利用推荐方法,确定用户状态信息对应的第一个性化词库。例如,推荐方法可以包括:将输入内容和/或上下文与领域关键词相匹配,以得到个性化词条1。又如,推荐方法可以包括:将输入内容转换为第一词向量,并依据向量匹配关系,得到与第一词向量相匹配的第二词向量,将第二词向量对应的词条作为个性化词条2。再如,推荐方法可以包括:将更新后的地理位置对应的POI词条,作为个性化词条3。可以理解,本发明实施例对于具体的推荐方法不加以限制。
本发明实施例向用户提供所述用户状态信息对应的第一个性化词库,具体包括:从服务端下载第一个性化词库对应的第一词库文件,并将第一词库文件加载到本地,以利用加载后的第一词库文件,向用户提供服务。
本发明实施例中,第一个性化词库可以包括:输入串、个性化词条、标签和词频等信息。其中,标签可以表征对应的推荐方法,若带有标签的个性化词条被命中,则可以依据对应的命中信息,更新对应推荐方法的参数。
在用户的输入过程,可以依据用户的输入串,在第一个性化词库中进行查找,若查找命中,则可以将对应的个性化词条作为候选项。例如,用户A欲要通过拼音串“liduanji”输入目标词条“狸端机”,但传统词库中不存在“狸端机”,但根据用户A的输入内容提供的第一个性化词库中包括“狸端机”,因此可以依据第一个性化词库提供“狸端机”这个候选。由于可以节省单字的选择和上屏所耗费的操作成本,因此能够提高输入效率。
本发明实施例中,可选的是,可以依据候选类型的优先级,对候选进行排序。候选类型可以包括:用户词库类型、纠错类型、系统词库类型、个性化词库类型、云类型、组词类型等。
上述优先级的示例可以包括:用户词库类型>纠错类型>系统词库类型&个性化词库类型>云类型>组词类型等。例如,拼音串“liduanji”命中第一个性化词库,但未命中用户词库和系统词库,且不存在对于的纠错候选,因此,可以将命中的个性化词条“狸端机”对应的候选放在候选的首位。可以理解,本发明实施例对于具体的优先级不加以限制。
本发明实施例中,可选的是,第一个性化词库对应有第一期限值。上述方法还可以包括:若到达所述第一期限值对应的时间,则删除所述第一个性化词库。在上述第一期限值对应的期限到达后,清理第一个性化词库,可以释放第一个性化词库对应的空间。第一期限值的初始值可以为48小时、72小时等时长。
可选地,上述方法还可以包括:若用户的后续输入内容命中所述第一个性化词库,则增加所述第一个性化词库对应的第一期限值。例如,若后续输入内容命中第一个性化词库,则将第一个性化词库对应的第一期限值恢复为初始值。又如,若第一个性化词库的命中次数超过次数阈值,则对第一期限值增加预设值,并对命中次数清零。预设值可以为初始值的预设比例,如1/3。例如,第一个性化词库的命中次数每超过5次,则对第一期限值增加24小时。
若用户的后续输入内容命中所述第一个性化词库,则说明第一个性化词库对应的领域符合用户的实时性个性化需求。此种情况下,增加所述第一个性化词库对应的第一期限值,可以增加第一个性化词库对于用户的服务时长。
需要说明的是,若用户的后续输入内容未命中所述第一个性化词库,则可以依据所述后续输入内容确定用户状态信息,以实现第一个性化词库的持续提供。
可以理解,本发明实施例的终端本地,可以针对用户提供一个或多个第一个性化词库,以向用户提供对应的个性化输入服务。其中,不同第一个性化词库之间可以相互独立。例如,一个第一个性化词库的删除不影响另一个第一个性化词库。又如,一个第一个性化词库的命中不影响另一个第一个性化词库。
综上,本发明实施例的个性化词库的处理方法,在用户状态信息符合预设条件的情况下,向用户提供该用户状态信息对应的第一个性化词库。由于该用户状态信息可以为用户使用设备过程中的实时信息,故该第一个性化词库可以满足该用户状态信息对应的实时性个性化需求。将该第一个性化词库用于用户的输入过程,可以基于第一个性化词库与实时性个性化需求相符的特性,提高用户欲要输入的目标词条对于第一个性化词库的命中概率,因此可以降低用户逐字选择和上屏的操作成本,进而提高输入效率。
在用户状态信息包括用户的输入内容与特征词条之间的匹配信息的情况下,本发明实施例可以依据与特征词条相匹配的输入内容,提供用户的实时性个性化需求对应的第一个性化词库。
在用户状态信息包括用户所处的地理位置的更新信息的情况下,用户的实时性个性化需求可以与更新后的地理位置相关,故本发明实施例可以提供更新后的地理位置对应的第一个性化词库,帮助用户提供更新后的地理位置对应词条的输入效率。
方法实施例二
参照图3,示出了本发明的一种个性化词库的处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤301、确定用户状态信息;上述用户状态信息具体包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
步骤302、若上述用户状态信息符合预设条件,则向用户提供上述用户状态信息对应的第一个性化词库;
相对于图2所示方法实施例一,本实施例的方法还可以包括:
步骤303、依据预设周期,向用户提供第二个性化词库;上述第二个性化词库可以为用户在预设时间段内的输入的历史输入内容、和/或、用户的常用地理位置得到。
本发明实施例可以依据用户在预设时间段内的输入的历史输入内容,向用户提供符合其长期个性化需求的第二个性化词库。
长期个性化需求可以包括:职业需求、兴趣需求等。例如,用户B的职业为“医学”,则可以向其推荐医学相关的个性化词条。又如用户C的兴趣特征包括“二次元”,则可以向其推荐“二次元”相关的个性化词条。
本发明实施例还可以向用户推荐其常用地理位置内的POI词条。常用地理位置具体包括:家或单位等。上述POI词条具体包括:常用地理位置周边的商户、小区、街道等POI的词条。
本发明实施例中,可以依据用户所处的地理位置的维持时长,确定常用地理位置,可以理解,本发明实施例对于常用地理位置的具体确定方式不加以限制。
在实际应用中,客户端可以定期向服务端发送历史输入内容。而服务端可以对预设时间段内的历史输入内容进行分析,以得到对应的第二个性化词库。例如,预设时间段的时长可以为60天,可以依据该时长对用户的历史输入内容进行维护。
服务端可以依据预设周期,向客户对应的客户端提供第二个性化词库。例如,预设周期可以为30天,以使第二个性化词库适应用户的长期个性化需求的变化。
本发明实施例中,可选的是,上述第二个性化词库具体包括如下词条中的至少一种:
领域关键词与所述历史输入内容相匹配的第二目标领域内的领域词条;
与所述历史输入内容存在共现关系的相关词条;
基于所述历史输入内容和兴趣树得到的词条;以及
所述常用地理位置对应的词条。
相应地,本发明实施例可以提供第二个性化词库的如下确定方式:
确定方式1、对历史输入内容与领域关键词进行匹配,以得到相匹配的领域关键词对应的第二目标领域。例如,用户B的职业为“医学”,其历史输入内容中包括大量的与“医学”相关的词,则可以确定其对应的第二目标领域为“医学”,并向其推荐“医学”相关的个性化词条。
确定方式2、基于所述历史输入内容和兴趣树,得到第二个性化词库。
兴趣树中包括根节点以及表示用户兴趣的子节点。兴趣树中的节点表示类目,该节点的权值表示用户对该节点表示的类目的感兴趣程度;叶子节点是指兴趣树中最小的分类类目,非叶子节点是指兴趣树中具有子分类的分类类目。
本发明实施例可以利用兴趣树中层次的类目,对用户的兴趣进行精细化,可以依据历史输入内容确定用户的精细兴趣,进而可以提高第二个性化词库的精确度。
确定方式3、基于语料,得到与所述历史输入内容存在共现关系的相关词条。共现可以指在语句或段落环境下共同出现。共现关系可以包括:历史输入内容与相关词条相邻、或者历史输入内容与相关词条不相邻。本发明实施例可以从相关词条中确定出共现概率超过概率阈值的相关词条,作为个性化词条。
上述语料可以包括:输入法环境的输入语料、即时通讯环境的语聊语料、微博环境的语料、问答环境的语料等。
可以理解,本领域技术人员可以根据实际应用需求,采用确定方式1至确定方式3中的任一或组合。例如,可以组合采用确定方式1和确定方式3,首先依据确定方式1确定第二目标领域内的领域词条,然后依据共现概率,对第二目标领域内的领域词条进行筛选。
本发明实施例向用户提供所述用户状态信息对应的第二个性化词库,具体包括:从服务端下载第二个性化词库对应的第二词库文件,并将第二词库文件加载到本地,以利用加载后的第二词库文件,向用户提供服务。
本发明实施例中,第二个性化词库可以包括:输入串、个性化词条、标签和词频等信息。其中,标签可以表征对应的确定方式,若带有标签的个性化词条被命中,则可以依据对应的命中信息,更新对应确定方式的参数。
在用户的输入过程,可以依据用户的输入串,在第二个性化词库中进行查找,若查找命中,则可以将对应的个性化词条作为候选项。例如,用户B欲要通过拼音串“yasishizonghezheng”输入目标词条“亚斯氏综合症”,但传统词库中不存在“亚斯氏综合症”,但根据用户B的输入内容提供的第二个性化词库中包括“亚斯氏综合症”,因此可以依据第二个性化词库提供“亚斯氏综合症”这个候选。由于可以节省单字的选择和上屏所耗费的操作成本,因此能够提高输入效率。
本发明实施例中,可选的是,可以依据候选类型的优先级,对候选进行排序。候选类型可以包括:用户词库类型、纠错类型、系统词库类型、个性化词库类型、云类型、组词类型等。
上述优先级的示例可以包括:用户词库类型>纠错类型>系统词库类型&个性化词库类型>云类型>组词类型等。例如,拼音串“yasishizonghezheng”命中第二个性化词库,但未命中用户词库和系统词库,且不存在对于的纠错候选,因此,可以将命中的个性化词条“yasishizonghezheng”对应的候选放在候选的首位。可以理解,本发明实施例对于具体的优先级不加以限制。
本发明实施例中,可选的是,第二个性化词库对应有第二期限值,在上述第二期限值对应的期限到达后,可以清理第二个性化词库,以释放第二个性化词库对应的空间。第二期限值的初始值可以为30天等时长。
需要说明的是,若用户的后续输入内容未命中所述第一个性化词库和第二个性化词库,则可以依据所述后续输入内容确定用户状态信息,以实现第二个性化词库的持续提供。由于在后续输入内容命中第二个性化词库的情况下,不将后续输入内容用于用户状态信息的统计,故可以避免个性化词条的重复提供。
可以理解,本发明实施例的终端本地,可以针对用户提供一个或多个第二个性化词库,以向用户提供对应的个性化输入服务。其中,不同第二个性化词库之间可以相互独立。例如,一个第二个性化词库的删除不影响另一个第二个性化词库。又如,一个第二个性化词库的命中不影响另一个第二个性化词库。
综上,本发明实施例的个性化词库的处理方法,依据用户在预设时间段内的输入的历史输入内容,向用户提供符合其长期个性化需求的第二个性化词库。
长期个性化需求可以包括:职业需求、兴趣需求等。例如,用户B的职业为“医学”,则可以向其推荐医学相关的个性化词条。又如用户C的兴趣特征包括“二次元”,则可以向其推荐“二次元”相关的个性化词条。
本发明实施例还可以向用户推荐其常用地理位置内的POI词条。常用地理位置具体包括:家或单位等。上述POI词条具体包括:常用地理位置周边的商户、小区、街道等POI的词条。
方法实施例三
参照图4,示出了本发明的一种个性化词库的处理方法实施例三的步骤流程图,具体可以包括如下步骤:
步骤401、客户端接收输入内容;如“捕虫网”、“猴子”、“狼蛛岛”等。
步骤402、客户端对输入内容与特征词条进行匹配,若匹配成功,则将匹配次数加1;
步骤403、客户端判断匹配次数是否大于阈值,若是,则对匹配次数清零,并向服务端发送请求;
步骤404、服务端针对请求,得到对应的第一个性化词库;例如,第一个性化词库中可以包括:领域关键词“动物之森”对应的个性化词条、以及与与所述输入内容存在向量匹配关系的相关词条;
步骤405、客户端从服务端接收第一个性化词库,并在本地加载第一个性化词库;
步骤406、客户端依据用户的输入串和第一个性化词库,提供候选;
步骤407、客户端判断用户的后续输入内容是否命中第一个性化词库,若是,则执行步骤408,否则执行步骤409;后续输入内容也即用户选择的候选。
步骤408、增加所述第一个性化词库对应的第一期限值;
步骤409、客户端判断用户的后续输入内容是否命中第一个性化词库,若否,则将后续输入内容输入步骤402。
本实施例可以依据用户的输入内容与特征词条之间的匹配信息,向用户提供符合其实时话题需求对应的第一个性化词库。
方法实施例四
参照图5,示出了本发明的一种个性化词库的处理方法实施例四的步骤流程图,具体可以包括如下步骤:
步骤501、客户端向服务端发送最近三次的经纬度信息;
最近的经纬度信息可以表征最新获取的经纬度信息。
步骤502、服务端依据最近三次的经纬度信息,判断用户所处的地理位置是否发生更新,若是,则向客户端发送第一状态值;
第一状态值表征用户所处的地理位置发生更新。可以理解,服务端还可以发送第二状态值,第二状态值可以表征用户所处的地理位置未发生更新。
步骤503、客户端依据第一状态值,向服务端发送最近的经纬度信息;
步骤504、服务端依据最近的经纬度信息,确定对应的城市词包;
步骤505、客户端将城市词包加载到本地;
步骤506、客户端依据用户的输入串和城市词包,提供候选;
步骤507、客户端判断用户的后续输入内容是否命中城市词包,若是,则增加所述城市词包对应的第一期限值。
本实施例可以依据用户所处的地理位置的更新信息,向用户提供符合其地理词需求对应的第一个性化词库。
方法实施例五
参照图6,示出了本发明的一种个性化词库的处理方法实施例五的步骤流程图,具体可以包括如下步骤:
步骤601、服务端确定历史输入内容的持续时长超过预设天数的用户集合;
预设天数可由本领域技术人员根据实际应用需求确定,例如,预设天数为30天。客户端可以天为单位,向服务端上传用户的历史输入内容。
步骤602、服务端针对用户集合中的用户,依据其历史输入内容和环境特征,确定对应的第二个性化词库;
环境特征包括:位置特征、APP(应用程序,Application)特征等,用于辅助确定用户的兴趣特征。例如,多个历史输入内容对应的APP特征包括“篮球”,则可以认为用户的兴趣特征包括“篮球”。
步骤603、服务端依据预设周期,向用户对应的客户端发送第二个性化词库;
步骤604、客户端从服务端接收第二个性化词库,并在本地加载第二个性化词库;
步骤605、客户端依据用户的输入串和第二个性化词库,提供候选。
本发明实施例依据用户在预设时间段内的输入的历史输入内容,向用户提供符合其长期个性化需求的第二个性化词库。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图7,示出了本发明的一种个性化词库的处理装置实施例的结构框图,具体可以包括:
用户状态信息确定模块701,用于确定用户状态信息;上述用户状态信息可以包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;以及
第一提供模块702,用于若上述用户状态信息符合预设条件,则向用户提供上述用户状态信息对应的第一个性化词库。
可选地,上述预设条件,可以包括:
与特征词条相匹配的输入内容的数量超过阈值;和/或
用户所处的地理位置发生更新。
可选地,上述特征词条可以包括如下词条中的至少一种:领域词条、自造词条和云词条。
可选地,上述第一个性化词库可以包括如下词条中的至少一种:
领域关键词与上述输入内容相匹配的第一目标领域内的领域词条;
与上述输入内容存在向量匹配关系的相关词条;
更新后的地理位置对应的词条;以及
与上述输入内容及其上下文相匹配的词条。
可选地,上述第一提供模块702可以包括:
请求发送模块,用于若符合预设条件,则向服务端发送请求;上述请求中可以包括:上述用户状态信息;
词库接收模块,用于接收服务端依据上述请求返回的第一个性化词库。
可选地,上述第一个性化词库对应有第一期限值,上述装置还可以包括:
增加模块,用于若用户的后续输入内容命中上述第一个性化词库,则增加上述第一个性化词库对应的第一期限值。
可选地,上述第一个性化词库对应有第一期限值,上述装置还可以包括:
删除模块,用于若到达上述第一期限值对应的时间,则删除上述第一个性化词库。
可选地,上述装置还可以包括:
标记添加模块,用于针对本地词库中本地词条添加特征词条标记;
匹配模块,用于若用户的输入内容命中的本地词条带有特征词条标记,则上述输入内容与特征词条相匹配。
可选地,上述装置还可以包括:
第二提供模块,用于依据预设周期,向用户提供第二个性化词库;上述第二个性化词库为用户在预设时间段内的输入的历史输入内容、和/或、用户的常用地理位置得到。
可选地,上述第二个性化词库可以包括如下词条中的至少一种:
领域关键词与上述历史输入内容相匹配的第二目标领域内的领域词条;
与上述历史输入内容存在共现关系的相关词条;
基于上述历史输入内容和兴趣树得到的词条;以及
上述常用地理位置对应的词条。
可选地,上述装置还可以包括:
上述用户状态信息确定模块701,还用于在用户的后续输入内容未命中上述第一个性化词库和第二个性化词库的情况下,依据上述后续输入内容确定用户状态信息。
可选地,上述地理位置的类型可以包括如下类型中的至少一种:
行政区域、小区、街道、以及楼宇。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于处理个性化词库的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于进行以下操作的指令:确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
图8是根据一示例性实施例示出的一种用于处理个性化词库的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在上述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音输入模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如上述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID,Radio Frequency Identification)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图9是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2至图6中任一所示的个性化词库的处理方法。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种个性化词库的处理方法,上述方法包括:确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
本发明实施例公开了A1、一种个性化词库的处理方法,上述方法包括:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的域地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
A2、根据A1所述的方法,所述预设条件,包括:
与特征词条相匹配的输入内容的数量超过阈值;和/或
用户所处的地理位置发生更新。
A3、根据A1所述的方法,所述特征词条包括如下词条中的至少一种:领域词条、自造词条和云词条。
A4、根据A1所述的方法,所述第一个性化词库包括如下词条中的至少一种:
领域关键词与所述输入内容相匹配的第一目标领域内的领域词条;
与所述输入内容存在向量匹配关系的相关词条;
更新后的地理位置对应的词条;以及
与所述输入内容及其上下文相匹配的词条。
A5、根据A1至A4中任一所述的方法,所述向用户提供所述用户状态信息对应的第一个性化词库,包括:
若符合预设条件,则向服务端发送请求;所述请求中包括:所述用户状态信息;
接收服务端依据所述请求返回的第一个性化词库。
A6、根据A1至A4中任一所述的方法,所述第一个性化词库对应有第一期限值,所述方法还包括:
若用户的后续输入内容命中所述第一个性化词库,则增加所述第一个性化词库对应的第一期限值。
A7、根据A1至A4中任一所述的方法,所述第一个性化词库对应有第一期限值,所述方法还包括:
若到达所述第一期限值对应的时间,则删除所述第一个性化词库。
A8、根据A1至A4中任一所述的方法,所述方法还包括:
针对本地词库中本地词条添加特征词条标记;
若用户的输入内容命中的本地词条带有特征词条标记,则所述输入内容与特征词条相匹配。
A9、根据A1至A4中任一所述的方法,所述方法还包括:
依据预设周期,向用户提供第二个性化词库;所述第二个性化词库为用户在预设时间段内的输入的历史输入内容、和/或、用户的常用地理位置得到。
A10、根据A9所述的方法,所述第二个性化词库包括如下词条中的至少一种:
领域关键词与所述历史输入内容相匹配的第二目标领域内的领域词条;
与所述历史输入内容存在共现关系的相关词条;
基于所述历史输入内容和兴趣树得到的词条;以及
所述常用地理位置对应的词条。
A11、根据A1至A4中任一所述的方法,所述方法还包括:
若用户的后续输入内容未命中所述第一个性化词库和第二个性化词库,则依据所述后续输入内容确定用户状态信息。
A12、根据A1至A4中任一所述的方法,所述地理位置的类型包括如下类型中的至少一种:
行政区域、小区、街道、以及楼宇。
本发明实施例公开了B13、一种个性化词库的处理装置,包括:
用户状态信息确定模块,用于确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;以及
第一提供模块,用于若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
B14、根据B13所述的装置,所述预设条件,包括:
与特征词条相匹配的输入内容的数量超过阈值;和/或
用户所处的地理位置发生更新。
B15、根据B13所述的装置,所述特征词条包括如下词条中的至少一种:领域词条、自造词条和云词条。
B16、根据B13所述的装置,所述第一个性化词库包括如下词条中的至少一种:
领域关键词与所述输入内容相匹配的第一目标领域内的领域词条;
与所述输入内容存在向量匹配关系的相关词条;
更新后的地理位置对应的词条;以及
与所述输入内容及其上下文相匹配的词条。
B17、根据B13至B16中任一所述的装置,所述第一提供模块包括:
请求发送模块,用于若符合预设条件,则向服务端发送请求;所述请求中包括:所述用户状态信息;
词库接收模块,用于接收服务端依据所述请求返回的第一个性化词库。
B18、根据B13至B16中任一所述的装置,所述第一个性化词库对应有第一期限值,所述装置还包括:
增加模块,用于若用户的后续输入内容命中所述第一个性化词库,则增加所述第一个性化词库对应的第一期限值。
B19、根据B13至B16中任一所述的装置,所述第一个性化词库对应有第一期限值,所述装置还包括:
删除模块,用于若到达所述第一期限值对应的时间,则删除所述第一个性化词库。
B20、根据B13至B16中任一所述的装置,所述装置还包括:
标记添加模块,用于针对本地词库中本地词条添加特征词条标记;
匹配模块,用于若用户的输入内容命中的本地词条带有特征词条标记,则所述输入内容与特征词条相匹配。
B21、根据B13至B16中任一所述的装置,所述装置还包括:
第二提供模块,用于依据预设周期,向用户提供第二个性化词库;所述第二个性化词库为用户在预设时间段内的输入的历史输入内容、和/或、用户的常用地理位置得到。
B22、根据B21所述的装置,所述第二个性化词库包括如下词条中的至少一种:
领域关键词与所述历史输入内容相匹配的第二目标领域内的领域词条;
与所述历史输入内容存在共现关系的相关词条;
基于所述历史输入内容和兴趣树得到的词条;以及
所述常用地理位置对应的词条。
B23、根据B13至B16中任一所述的装置,所述装置还包括:
所述用户状态信息确定模块,还用于在用户的后续输入内容未命中所述第一个性化词库和第二个性化词库的情况下,依据所述后续输入内容确定用户状态信息。
B24、根据B13至B16中任一所述的装置,所述地理位置的类型包括如下类型中的至少一种:
行政区域、小区、街道、以及楼宇。
本发明实施例公开了C25、一种用于处理个性化词库的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
C26、根据C25所述的装置,所述预设条件,包括:
与特征词条相匹配的输入内容的数量超过阈值;和/或
用户所处的地理位置发生更新。
C27、根据C25所述的装置,所述特征词条包括如下词条中的至少一种:领域词条、自造词条和云词条。
C28、根据C25所述的装置,所述第一个性化词库包括如下词条中的至少一种:
领域关键词与所述输入内容相匹配的第一目标领域内的领域词条;
与所述输入内容存在向量匹配关系的相关词条;
更新后的地理位置对应的词条;以及
与所述输入内容及其上下文相匹配的词条。
C29、根据C25至C28中任一所述的装置,所述向用户提供所述用户状态信息对应的第一个性化词库,包括:
若符合预设条件,则向服务端发送请求;所述请求中包括:所述用户状态信息;
接收服务端依据所述请求返回的第一个性化词库。
C30、根据C25至C28中任一所述的装置,所述第一个性化词库对应有第一期限值,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若用户的后续输入内容命中所述第一个性化词库,则增加所述第一个性化词库对应的第一期限值。
C31、根据C25至C28中任一所述的装置,所述第一个性化词库对应有第一期限值,所述装置还包括:
若到达所述第一期限值对应的时间,则删除所述第一个性化词库。
C32、根据C25至C28中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
针对本地词库中本地词条添加特征词条标记;
若用户的输入内容命中的本地词条带有特征词条标记,则所述输入内容与特征词条相匹配。
C33、根据C25至C28中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据预设周期,向用户提供第二个性化词库;所述第二个性化词库为用户在预设时间段内的输入的历史输入内容、和/或、用户的常用地理位置得到。
C34、根据C33所述的装置,所述第二个性化词库包括如下词条中的至少一种:
领域关键词与所述历史输入内容相匹配的第二目标领域内的领域词条;
与所述历史输入内容存在共现关系的相关词条;
基于所述历史输入内容和兴趣树得到的词条;以及
所述常用地理位置对应的词条。
C35、根据C25至C28中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若用户的后续输入内容未命中所述第一个性化词库和第二个性化词库,则依据所述后续输入内容确定用户状态信息。
C36、根据C25至C28中任一所述的装置,所述地理位置的类型包括如下类型中的至少一种:
行政区域、小区、街道、以及楼宇。
本发明实施例公开了D37、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A12中一个或多个所述的个性化词库的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种个性化词库的处理方法、一种个性化词库的处理装置和一种用于处理个性化词库的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种个性化词库的处理方法,其特征在于,所述方法包括:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的域地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
2.根据权利要求1所述的方法,其特征在于,所述预设条件,包括:
与特征词条相匹配的输入内容的数量超过阈值;和/或
用户所处的地理位置发生更新。
3.根据权利要求1所述的方法,其特征在于,所述特征词条包括如下词条中的至少一种:领域词条、自造词条和云词条。
4.根据权利要求1所述的方法,其特征在于,所述第一个性化词库包括如下词条中的至少一种:
领域关键词与所述输入内容相匹配的第一目标领域内的领域词条;
与所述输入内容存在向量匹配关系的相关词条;
更新后的地理位置对应的词条;以及
与所述输入内容及其上下文相匹配的词条。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述向用户提供所述用户状态信息对应的第一个性化词库,包括:
若符合预设条件,则向服务端发送请求;所述请求中包括:所述用户状态信息;
接收服务端依据所述请求返回的第一个性化词库。
6.根据权利要求1至4中任一所述的方法,其特征在于,所述第一个性化词库对应有第一期限值,所述方法还包括:
若用户的后续输入内容命中所述第一个性化词库,则增加所述第一个性化词库对应的第一期限值。
7.根据权利要求1至4中任一所述的方法,其特征在于,所述第一个性化词库对应有第一期限值,所述方法还包括:
若到达所述第一期限值对应的时间,则删除所述第一个性化词库。
8.一种个性化词库的处理装置,其特征在于,包括:
用户状态信息确定模块,用于确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;以及
第一提供模块,用于若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
9.一种用于处理个性化词库的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定用户状态信息;所述用户状态信息包括:用户的输入内容与特征词条之间的匹配信息、和/或、用户所处的地理位置的更新信息;
若所述用户状态信息符合预设条件,则向用户提供所述用户状态信息对应的第一个性化词库。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的个性化词库的处理方法。
CN202011053570.9A 2020-09-29 2020-09-29 个性化词库的处理方法和装置 Pending CN114330326A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011053570.9A CN114330326A (zh) 2020-09-29 2020-09-29 个性化词库的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011053570.9A CN114330326A (zh) 2020-09-29 2020-09-29 个性化词库的处理方法和装置

Publications (1)

Publication Number Publication Date
CN114330326A true CN114330326A (zh) 2022-04-12

Family

ID=81010775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011053570.9A Pending CN114330326A (zh) 2020-09-29 2020-09-29 个性化词库的处理方法和装置

Country Status (1)

Country Link
CN (1) CN114330326A (zh)

Similar Documents

Publication Publication Date Title
US10353975B2 (en) Terminal, server and event suggesting methods thereof
US10402703B2 (en) Training image-recognition systems using a joint embedding model on online social networks
KR102189854B1 (ko) 개인적 엔티티들을 모델링
CN109918669B (zh) 实体确定方法、装置及存储介质
WO2017092198A1 (zh) 一种推荐方法和装置、一种用于推荐的装置
US20160055246A1 (en) Providing automatic actions for mobile onscreen content
CN107305438B (zh) 候选项的排序方法和装置、用于候选项排序的装置
CN107621886B (zh) 一种输入推荐方法、装置及电子设备
CN108073303B (zh) 一种输入方法、装置及电子设备
CN107967271A (zh) 一种信息搜索方法及装置
CN111914113A (zh) 一种图像检索的方法以及相关装置
US20190026281A1 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
CN109783244B (zh) 处理方法和装置、用于处理的装置
CN112784142A (zh) 一种信息推荐方法及装置
CN109521888B (zh) 一种输入方法、装置和介质
CN108803890B (zh) 一种输入方法、输入装置和用于输入的装置
CN112417318A (zh) 一种兴趣点的状态确定方法、装置、电子设备及介质
CN111538830A (zh) 法条检索方法、装置、计算机设备及存储介质
CN113779427A (zh) 日程地址识别方法、设备、存储介质和软件程序产品
CN111752436A (zh) 一种推荐方法、装置和用于推荐的装置
CN110020335B (zh) 收藏夹的处理方法和装置
CN108427508B (zh) 输入方法和装置、建立局域网词库的方法和装置
CN114330326A (zh) 个性化词库的处理方法和装置
CN110362686B (zh) 一种词库的生成方法、装置、终端设备和服务器
CN110471538B (zh) 一种输入预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination