CN114330324A - 个性化词条的处理方法和装置 - Google Patents

个性化词条的处理方法和装置 Download PDF

Info

Publication number
CN114330324A
CN114330324A CN202011053552.0A CN202011053552A CN114330324A CN 114330324 A CN114330324 A CN 114330324A CN 202011053552 A CN202011053552 A CN 202011053552A CN 114330324 A CN114330324 A CN 114330324A
Authority
CN
China
Prior art keywords
user
determining
personalized
word
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011053552.0A
Other languages
English (en)
Inventor
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202011053552.0A priority Critical patent/CN114330324A/zh
Publication of CN114330324A publication Critical patent/CN114330324A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种个性化词条的处理方法、装置和用于处理个性化词条的装置。其中的方法具体包括:从用户的输入内容中确定出多个用户特征词;依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据所述用户向量,确定所述用户对应的个性化词条。本发明实施例可以满足用户的深层兴趣需求,且可以降低存储空间。

Description

个性化词条的处理方法和装置
技术领域
本发明涉及输入技术领域,尤其涉及一种个性化词条的处理方法和装置。
背景技术
随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的词条存在个性化的需求。
为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。
发明人在实施本发明实施例的过程中发现,一个细胞词库中通常包含大量的词条,这使得细胞词库占用较多的存储空间;并且,细胞词库通常基于领域专家对词汇的认知而构建,这使得细胞词库的粒度较粗、以及与用户的相关性较弱,因此无法满足用户的深层兴趣需求。
发明内容
本发明实施例提供一种个性化词条的处理方法、装置和用于输入的装置,可以满足用户的深层兴趣需求,且可以降低存储空间。
为了解决上述问题,本发明实施例公开了一种个性化词条的处理方法,包括:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
另一方面,本发明实施例公开了一种个性化词条的处理装置,包括:
用户特征词确定模块,用于从用户的输入内容中确定出多个用户特征词;
用户向量确定模块,用于依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;以及
个性化词条确定模块,用于依据所述用户向量,确定所述用户对应的个性化词条。
再一方面,本发明实施例公开了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的个性化词条的处理方法。
本发明实施例包括以下优点:
本发明实施例从用户的角度出发,进行个性化词条的确定,可以提高个性推荐词与用户之间的相关性。
并且,本发明实施例依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。因此,本发明实施例能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等,本发明实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
另外,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种个性化词条的处理方法的应用环境的示意;
图2是本发明的一种个性化词条的处理方法实施例的步骤流程图;
图3是本发明的一种个性化词条的处理装置实施例的结构框图;
图4是本发明的一种用于处理个性化词条的装置800的框图;及
图5是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术中细胞词库占用较多的存储空间、且无法满足用户的深层兴趣需求的技术问题,本发明实施例提供了一种个性化词条的处理方案,该方案可以从用户的输入内容中确定出多个用户特征词;依据上述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据上述用户向量,确定上述用户对应的个性化词条。
本发明实施例中,上屏指将预览窗口中的内容输出显示到应用程序窗口的操作。具体到输入法,上屏可以指将候选窗口中的候选输出显示到应用程序窗口的操作。上屏对应的候选可以称为输入内容。本发明实施例的输入内容可以包括:一次或多次的上屏内容。上述输入内容可以对应字词、短语、句子等语言单位。
特征词可以表征具有专属特性的词。本发明实施例依据输入内容中的用户特征词,表征用户特征及用户输入需求。
本发明实施例从用户的角度出发,进行个性化词条的确定,可以提高个性推荐词与用户之间的相关性。
并且,本发明实施例依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。因此,本发明实施例能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等,本发明实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
另外,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
本发明实施例可以应用于个性化词条的推荐场景,以使个性化词条满足用户的深层兴趣需求,且能够降低个性化词条所占用的存储空间。
本发明实施例提供的个性化词条的处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序,Application)。
本发明实施例的服务端可以为云服务端(云端)。云端是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。云端的资源信息具有动态性,使得其处理能力可弹性伸缩。
本发明实施例可应用于键盘符号、手写、语音等各种输入方式的输入法程序,即用户可以通过编码字符串进行文字输入,输入串可以指用户输入的编码字符串。在输入法领域,对于例如中文、日文、韩文、或者其它语言的输入法程序,通常可以把用户输入的输入串转换成相应语言的候选项。以下主要以中文为例进行说明,日文、韩文等其它语言相互参照即可。可以理解,所述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等,本发明实施例对于某种语言对应的具体输入法程序不加以限制。
以中文的输入为例,编码字符串的类型可以包括:拼音串、字形串(如五笔串等)、语音信息(如语音输入方式)。以英文的输入为例,编码字符串的类型可以包括:字母字符串等。
在实际应用中,对于键盘符号的输入方式,用户可以通过实体键盘、或者虚拟键盘等输入上述输入串。例如,对于具有触摸屏的终端,其可以在输入界面中设置虚拟键盘,以使用过通过触发上述虚拟键盘包括的虚拟按键进行输入串的输入。可选地,上述虚拟键盘的例子可以包括:9键键盘和26键键盘等。并且,可以理解,上述输入界面中除了设置有字母对应的虚拟按键之外,还可以设置有符号按键、数字按键、例如中英切换按键的功能按键,或者,还可以设置有工具栏按键等,可以理解,本发明实施例对于输入界面所包含的具体按键不加以限制。
根据一些实施例,上述输入串可以包括但不限于:用户通过按键所输入的一个按键符号或多个按键符号的组合。所述按键符号具体可以包括:拼音、笔画、假名等。
本发明实施例中,候选可用于表示输入法程序提供的待被用户选择的一个或多个字符。候选可以与上下文相应,或者,候选可以与输入串相应,或者,候选可以与输入串和上下文相应。候选可以为中文字符、英文字符、日文字符等语言的字符,候选也可以为颜文字、图片等形式的符号组合。其中,所述颜文字包括但不限于线条、符号、文字所组成的图画,例如,所述颜文字的例子可以包括:“:P”、“:-o”、“:-)”等。
本发明实施例中,可以依据输入串,在词库中进行查找,以得到输入串对应的候选。上述词库可以为传统词库,上述传统词库具体包括:系统词库、用户词库、细胞词库、云词库等。本发明实施例在传统词库的基础上增加了个性化词条,以满足用户的实时性个性化需求。
方法实施例
参照图2,示出了本发明的一种个性化词条的处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤201、从用户的输入内容中确定出多个用户特征词;
步骤202、依据上述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
步骤203、依据上述用户向量,确定上述用户对应的个性化词条。
图2所示方法实施例可由客户端和/或服务端执行,可以理解,本发明实施例对于方法实施例的具体执行主体不加以限制。
步骤201中,特征词可以表征具有专属特性的词。用户的输入内容中可以包括具有专属属性的词,也可以包括不具有专属属性的词。本发明实施例从用户的输入内容中确定出多个用户特征词,其中的单个用户特征词可以表征用户特征或用户输入需求。
输入内容可以位于用户在第一时间范围内的输入语料中。第一时间范围可以反映目标用户的用户输入需求的时效性,第一时间范围可以对应较小的时长,为2周内的时间、1个月内的时间、2个月内的时间等。
可选地,上述从用户的输入内容中确定出多个用户特征词,具体包括:对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。
例如,用户A的输入内容为句子A“今天上午我们去迪卡侬买冲锋衣,下午去滑雪”,可以从句子A中确定出“迪卡侬”、“冲锋衣”、“滑雪”等用户特征词。
本发明实施例中,可选的是,上述特征词条具体包括:领域词条、自造词条和云词条中的至少一种。
其中,领域可以指某一专业性范围,涉及在该范围内的所有事项均可引用。领域词汇可以指领域范围内的词汇,领域词汇可以对应有领域关键词。
本发明实施例可以采用如下确定方式确定领域词汇。
确定方式1、确定个人特征类别的领域词汇,个人特征类别可以对应领域关键词。
个人特征类别的领域词汇具体包括:职业属性类(医生、快递员…);长期兴趣类(动漫二次元、军事…)等。
确定方式2、确定话题类别的领域词汇,话题类别可以对应领域关键词。
话题类别的领域词汇具体包括:临时性话题(养鱼、某电视剧…);阶段性话题(如买保险、买房、学车、装修…)等。
确定方式3、抓取百科词条,对抓取的百科词条进行筛选后,标注对应的领域关键词。例如,可以对百科词条与细胞词条进行融合,并对融合结果进行筛选后,得到领域词条。
确定方式4、对用户输入过的高频词条进行聚类,对应的类别关键词作为领域关键词,类别下的高频词条作为领域词条。
可以理解,确定方式1至确定方式4只是作为领域词汇的确定方式的示例,本发明实施例对于领域词汇的具体确定方式不加以限制,本领域技术人员还可以实际应用需求,采用其他确定方式。例如,可以收集实体词,将实体词作为领域词汇。
本发明实施例中,实体是一个具体事物或概念。实体一般会划分类型,例如人物类实体、电影类实体、动物类实体、历史类实体等。同一个实体可以对应多个实体实例,实体实例可以是在网络(或其它媒介)中对一个实体的描述性页面(内容),例如百科的页面中即包含实体对应的实体实例。
可选地,实体可以包括:命名实体(named entity),命名实体可以指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的命名实体还可以包括:书名、歌曲名、影视剧名、产品名、品牌名、数字、日期、货币、地址等等。
可选地,所述实体类别可以包括如下类别中的至少一种:人物、地点、水果、蔬菜、动物、植物、建筑物、衣物、食物、药物、交通工具、家具、乐器、电器、以及自然现象。实体类别可以作为领域关键词。
自造词条可以为用户自造的词条,以补充传统词库的不足。在实际应用中,可以提供自造词条接口,以接收用户设定的输入串与自造词条之间的映射关系。
云词条可以为云端基于云输入法提供的词条,可以作为传统词库中词条的补充。云输入法是依托于云计算技术的输入法,凭借服务器集群强大的存储和运算能力,拥有传统输入法所不可比拟的优势:更大、更新的词库,更高级的语言模型,这些优势使得输入的准确率有了显著的提升。在实际应用中,可以向云端发送云请求,该云请求中可以包括用户的输入信息,输入信息可以包括:输入串或语音信息等,并可以接收云端返回的云词条。
步骤202中,依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。
词向量技术可以将词转化成为稠密向量。并且对于语义和/或语境相似的词,其对应的词向量也相近。维度稠密的词向量能够包含更多信息,并且词向量的单个维度可以具有特定的含义。
例如,词向量的维度数量可以包括:128或256或512或1024等。经过训练之后的词向量,能够表征词语之间的匹配关系。例如,“香蕉”和“苹果”之间的距离,会比“香蕉”和“茄子”之间的距离要近,因此,“香蕉”和“苹果”之间的匹配度大于“香蕉”和“茄子”之间的匹配度。
多个词向量可以融合为一个新的词向量。例如,词向量“女人”+词向量“漂亮”=词向量“女神”。
本发明实施例基于词向量的多维度含义,依据多个用户特征词对应的多个词向量的组合,得到的用户向量在语义和/或语境方面能够表征出更多的更潜在的信息。
本发明实施例可以利用词向量的生成模型,确定多个用户特征词分别对应的词向量。
可选地,可以对训练数据进行训练,以得到词向量的生成模型,生成模型可以包括:词条与词向量之间的映射关系。上述训练数据可以包括:输入法环境的输入语料、即时通讯环境的语聊语料、微博环境的语料、问答环境的语料等语料。
在本发明的一种可选实施例中,训练数据可以包括:第二时间范围内的输入语料。第二时间范围的时长可由本领域技术人员根据实际应用需求确定,例如,第二时间范围的时长为两年,第二时间范围为最近两年等,可以理解,本发明实施例对于具体的第二时间范围不加以限制。
上述生成模型可以对应一种或多种向量类型。例如,上述向量类型具体包括:word2vec(词到向量,word to vector)类型、图向量类型等。图向量类型可以包括:deepwalk(深度游走)、node2vec(节点到向量)等。
根据一种实施例,本发明实施例可以依据一种向量类型,确定用户特征词对应的词向量。
根据另一种实施例,本发明实施例可以依据多种向量类型,确定一个用户特征词对应的多种词向量,并对多种词向量进行融合,并将融合得到的词向量作为这个用户特征词对应的词向量。
在实际应用中,对于单个词向量类型而言,可能出现由于训练不充分而带来的精度偏差问题,该精度偏差可能使得相关词条与用户特征词之间的匹配度较低。针对上述问题,本发明实施例对多种词向量进行融合,并将融合得到的词向量作为这个用户特征词对应的词向量。由于本发明实施例的至少两种相关词集合源自至少两种词向量类型,故可以在一定程度上克服单个词向量类型的训练不充分而带来的精度偏差问题,因此能够提高词向量的准确度。
假设依据生成模型a和生成模型b分别得到的了一个用户特征词对应的词向量1和词向量2,而生成模型a和生成模型b分别对应权重a和b,则可以依据a和b,对词向量1和词向量2对应向量中维度的数值进行加权平均,并将融合得到的词向量作为这个用户特征词对应的词向量。
本发明实施例中,可选的是,上述确定用户向量,具体包括:依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
权重参数可以表征用户特征词在输入语料中的重要程度。本发明实施例依据权重参数,可以确定不同用户特征词所对应相关词条的重要程度。
可选地,权重参数可以表征用户特征词在输入语料的所有特征词中的重要程度;或者,权重参数可以表征用户特征词在包含特征词的语句输入语料中的重要程度。若语句输入语料k中包含特征词,则可以用于权重参数的确定过程。若语句输入语料p中包含特征词,则不能用于权重参数的确定过程。
可选地,可以利用TF-IDF(词频-逆文档频率,Term Frequency-Inverse DocumentFrequency)技术,确定权重参数。TF-IDF是一种统计方法,用以评估字词对于一个文档集或一个语料库中一份文档的重要程度。字词的重要性随着它在文档中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TFIDF的思想是:如果某个词在一篇文档中出现的频率高,并且在其他文档中很少出现,则认为此词的重要度较高。
相应地,权重参数的确定过程具体包括:确定用户特征词在第一时间范围内的输入语料中的频率参数(TF);确定用户特征词在第二时间范围内的输入语料中的区分参数(IDF);所述第二时间范围大于所述第一时间范围;依据所述频率参数和所述区分参数,确定所述权重参数。
第一时间范围可以反映目标用户的用户输入需求的时效性,可以将目标用户在第一时间范围内的输入语料作为一个文档。因此,第一时间范围可以对应较小的时长,为1个月内的时长、2个月内的时长等。目标用户可以指个性化词条对应的特定用户,也即待推荐的用户,如用户A等。因此,本发明实施例可以依据用户特征词在目标用户的第一时间范围内的输入语料中的出现频率,得到TF。
第二时间范围内的输入语料可以为多个用户的输入语料,可用于提供多个文档。可以将一个用户在第二时间范围内的输入语料作为一个文档,由此可以得到多个文档,用于为权重参数的统计方法提供统计数据。
本发明实施例可以依据第二时间范围内的输入语料对应的用户数量作为总文档数量T,依据输入了用户特征词的用户数量作为包含该用户特征词的文档数量D。可选地,可以将总文档数量T除以文档数量D对应的因数,再将得到的商取对数得到IDF;其中,文档数量D对应的因数可以为文档数量D与与预设正数的和,可以避免在文档数量D为零的情况下、因数为零。可以理解,本发明实施例对于IDF的具体计算方式不加以限制。
上述对所述多个用户特征词分别对应的词向量进行融合,所采用的融合方式可以包括:求和、乘积或加权平均等。
在此通过一个具体的例子,说明对所述多个用户特征词分别对应的词向量进行融合的示例,该示例的处理过程具体包括:
步骤S1、确定目标用户的用户特征词、以及对应的频率参数TF和对应的词向量。
目标用户可以指个性化词条对应的特定用户,也即待推荐的用户,如用户A等。对目标用户在一个月内的输入语料与特征词集合进行匹配,得到了用户特征词及对应的频率参数TF。例如,“迪卡侬”出现3次,“冲锋衣”出现4次,“滑雪”出现4次。
可以利用生成模型,确定用户特征词对应的词向量。生成模型对应的训练数据可以包括:网络中全量用户或部分用户在两年内的输入语料中包含的用户特征词集合。
步骤S2、确定目标用户的用户特征词对应的区分参数IDF。
依据特征词集合,确定网络中全量用户或部分用户在两年内的输入语料中包含的用户特征词集合,依据统计方法,确定该用户特征词集合中单个的用户特征词对应的区分参数IDF。
例如,依据统计方法,确定“迪卡侬”的IDF值为0.03,“冲锋衣”的IDF值为0.01,“滑雪”的IDF值为0.02。
步骤S3、依据用户特征词对应的频率参数TF和区分参数IDF,确定权重参数,并依据权重参数,对多个用户特征词对应的词向量进行融合,以得到用户向量。
在此提供一种用户向量的计算过程的示例。该示例以词向量包含4个维度为例,“迪卡侬”、“冲锋衣”和“滑雪”对应的词向量分别为:[0.1,0.2,0.3]、[0.3,0.2,0.1]和[0.2,0.1,0.2],上述多个词向量的融合过程可以为:3*0.03*[0.1,0.2,0.3]+4*0.01*[0.3,0.2,0.1]+4*0.02*[0.2,0.1,0.2];可选地,还可以对融合向量进行归一化,得到用户向量:[0.54,0.49,0.68]。
步骤203中,依据上述用户向量,确定上述用户对应的个性化词条。能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等组,本发明实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
本发明实施例可以提供确定所述用户对应的个性化词条的如下技术方案:
技术方案1、
技术方案1中,上述确定所述用户对应的个性化词条,具体包括:依据向量检索方法,确定与用户向量相匹配的目标词向量;依据所述目标词向量对应的词条,得到所述用户对应的个性化词条。
技术方案1可以利用向量检索方法,基于用户向量直接召回与用户向量相匹配的目标词向量。
本发明实施例可以利用向量工具,实现向量检索。上述向量工具可以提供向量的索引,并将用户向量与向量的索引进行匹配,以得到与所述用户向量相匹配的目标词向量。可以理解,本发明实施例对于具体的向量检索方法不加以限制。
本发明实施例可以直接将所述目标词向量对应的词条,作为所述用户对应的个性化词条。或者,可以依据用户向量与目标词向量之间的匹配度,对目标词向量对应的词条进行筛选,以得到用户对应的个性化词条。
对应的筛选过程可以包括:依据匹配度从高到低的顺序,对词条进行第一排序,选取排在前面的前M个词条,作为个性化词条,M可以为大于0的自然数;或者,可以选取匹配度超过匹配度阈值的词条,作为个性化词条。
技术方案2、
技术方案2中,上述确定所述用户对应的个性化词条,具体包括:依据多个用户分别对应的用户向量,对用户进行聚类;依据用户对应的用户类别内用户对应的用户特征词,确定所述用户对应的个性化词条。
本发明实施例中,将物理对象或抽象对象等对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的类别是一组数据对象的集合,这些对象与同一个类别中的对象彼此相似,与其他类别中的对象相异。
本发明实施例中,聚类的对象可以为用户,聚类的依据可以为用户向量。聚类得到的用户类别内的用户之间彼此相似。因此,对于目标用户而言,可以将其所在用户类别内的非目标用户对应的用户特征词,作为个性化词条的范围。
可选地,可以将所在用户类别内的非目标用户对应的用户特征词作为备选词条,对备选词条进行第二排序,并从第二排序结果中选取符合预设条件的备选词条,作为个性化词条。
第二排序对应的排序特征具体包括:备选词条与用户向量之间的匹配度、备选词条的频率参数等。
可以依据排序特征对应排序得分从高到低的顺序,对备选词条进行第一排序,选取排在前面的前N个词条,作为个性化词条,N可以为大于0的自然数;或者,可以选取排序得分超过得分阈值的词条,作为个性化词条。
本发明实施例的个性化词条,可用于向用户提供个性化词条对应的输入服务。
在实际应用中,在确定个性化词条后,服务端可以向用户对应的客户端推送个性化词条,以使客户端向用户提供个性化词条对应的输入服务。个性化词条可以对应有输入信息和词频等信息。输入信息可以包括:输入串或语音信息等。
在用户的输入过程,可以对用户的输入信息与个性化词条对应的输入信息进行匹配,若匹配成功,则可以将对应的个性化词条作为候选项。
例如,用户A欲要通过输入串“huaxuebanla”输入目标词条“滑雪板蜡”,但传统词库中不存在“滑雪板蜡”,但根据用户A的用户向量提供的个性化词条中包括“滑雪板蜡”,因此可以依据个性化词条提供“滑雪板蜡”这个候选,因此能够提高输入效率。
或者,即使传统词库中存在“滑雪板蜡”,但可以依据输入信息与个性化词条之间的匹配关系,调整个性化词条对应候选的位置,将个性化词条对应候选的位置提前,例如,可以将个性化词条对应的候选提前在首选、二选、或三选等位置。由于可以优先向用户提供个性化词条对应候选,因此可以提高用户选择候选的效率,进而可以提升输入效率。
综上,本发明实施例的个性化词条的处理方法,从用户的角度出发,进行个性化词条的确定,可以提高个性推荐词与用户之间的相关性。
并且,本发明实施例依据多个用户特征词对应的多个词向量的组合,来表示用户向量,使得用户向量能够表征出用户更多的更潜在的信息。因此,本发明实施例能够依据用户向量挖掘出用户更多的深层兴趣爱好、专业领域等深层兴趣需求对应的词条,进而能够满足用户的深层兴趣需求。
例如,用户A的用户特征词包括“迪卡侬”、“冲锋衣”、“滑雪”等,本发明实施例可以依据多个用户特征词对应的多个词向量的组合,挖掘出“滑雪设备”对应的深层兴趣需求,并可以提供该深层兴趣需求对应的个性化词条,如“多威”、“冲锋裤”、“雪杖”、“护臀”、“护目镜”等。
另外,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图3,示出了本发明的一种个性化词条的处理装置实施例的结构框图,具体可以包括:
用户特征词确定模块301,用于从用户的输入内容中确定出多个用户特征词;
用户向量确定模块302,用于依据上述多个用户特征词分别对应的词向量和权重参数,确定用户向量;以及
个性化词条确定模块303,用于依据上述用户向量,确定上述用户对应的个性化词条。
可选地,用户特征词确定模块301可以包括:
匹配模块,用于对用户的输入内容与特征词集合进行匹配,以得到上述输入内容中包含的多个用户特征词。
可选地,上述特征词集合可以包括领域词条、自造词条和云词条中的至少一种。
可选地,用户向量确定模块302可以包括:
向量融合模块,用于依据上述多个用户特征词分别对应的权重参数,对上述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
可选地,上述装置还可以包括:
频率参数确定模块,用于确定用户特征词在第一时间范围内的输入语料中的频率参数;
区分参数确定模块,用于确定用户特征词在第二时间范围内的输入语料中的区分参数;上述第二时间范围大于上述第一时间范围;
权重参数确定模块,用于依据上述频率参数和上述区分参数,确定上述权重参数。
可选地,个性化词条确定模块303可以包括:
向量检索模块,用于依据向量检索装置,确定与用户向量相匹配的目标词向量;
第一确定模块,用于依据上述目标词向量对应的词条,得到上述用户对应的个性化词条。
可选地,个性化词条确定模块303可以包括:
聚类模块,用于依据多个用户分别对应的用户向量,对用户进行聚类;
第二确定模块,用于依据用户对应的用户类别内用户对应的用户特征词,确定上述用户对应的个性化词条。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于进行以下操作的指令:从用户的输入内容中确定出多个用户特征词;依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据所述用户向量,确定所述用户对应的个性化词条。
图4是根据一示例性实施例示出的一种用于处理个性化词条的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在上述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音输入模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如上述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID,Radio Frequency Identification)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2所示的个性化词条的处理方法。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种个性化词条的处理方法,上述方法包括:从用户的输入内容中确定出多个用户特征词;依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;依据所述用户向量,确定所述用户对应的个性化词条。
本发明实施例公开了A1、一种个性化词条的处理方法,上述方法包括:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
A2、根据A1所述的方法,所述从用户的输入内容中确定出多个用户特征词,包括:
对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。
A3、根据A2所述的方法,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
A4、根据A1至A3中任一所述的方法,所述确定用户向量,包括:
依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
A5、根据A1至A3中任一所述的方法,通过如下步骤确定所述权重参数:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
A6、根据A1至A3中任一所述的方法,所述确定所述用户对应的个性化词条,包括:
依据向量检索方法,确定与用户向量相匹配的目标词向量;
依据所述目标词向量对应的词条,得到所述用户对应的个性化词条。
A7、根据A1至A3中任一所述的方法,所述确定所述用户对应的个性化词条,包括:
依据多个用户分别对应的用户向量,对用户进行聚类;
依据用户对应的用户类别内用户对应的用户特征词,确定所述用户对应的个性化词条。
本发明实施例公开了B8、一种个性化词条的处理装置,包括:
用户特征词确定模块,用于从用户的输入内容中确定出多个用户特征词;
用户向量确定模块,用于依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;以及
个性化词条确定模块,用于依据所述用户向量,确定所述用户对应的个性化词条。
B9、根据B8所述的装置,所述用户特征词确定模块包括:
匹配模块,用于对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。
B10、根据B9所述的装置,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
B11、根据B8至B10中任一所述的装置,所述用户向量确定模块包括:
向量融合模块,用于依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
B12、根据B8至B10中任一所述的装置,所述装置还包括:
频率参数确定模块,用于确定用户特征词在第一时间范围内的输入语料中的频率参数;
区分参数确定模块,用于确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
权重参数确定模块,用于依据所述频率参数和所述区分参数,确定所述权重参数。
B13、根据B8至B10中任一所述的装置,所述个性化词条确定模块包括:
向量检索模块,用于依据向量检索装置,确定与用户向量相匹配的目标词向量;
第一确定模块,用于依据所述目标词向量对应的词条,得到所述用户对应的个性化词条。
B14、根据B8至B10中任一所述的装置,所述个性化词条确定模块包括:
聚类模块,用于依据多个用户分别对应的用户向量,对用户进行聚类;
第二确定模块,用于依据用户对应的用户类别内用户对应的用户特征词,确定所述用户对应的个性化词条。
本发明实施例公开了C15、一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
C16、根据C15所述的装置,所述从用户的输入内容中确定出多个用户特征词,包括:
对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。
C17、根据C16所述的装置,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
C18、根据C15至C17中任一所述的装置,所述确定用户向量,包括:
依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
C19、根据C15至C17中任一所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
C20、根据C15至C17中任一所述的装置,所述确定所述用户对应的个性化词条,包括:
依据向量检索装置,确定与用户向量相匹配的目标词向量;
依据所述目标词向量对应的词条,得到所述用户对应的个性化词条。
C21、根据C15至C17中任一所述的装置,所述确定所述用户对应的个性化词条,包括:
依据多个用户分别对应的用户向量,对用户进行聚类;
依据用户对应的用户类别内用户对应的用户特征词,确定所述用户对应的个性化词条。
本发明实施例公开了D22、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A7中一个或多个所述的个性化词条的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种个性化词条的处理方法、一种个性化词条的处理装置和一种用于处理个性化词条的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种个性化词条的处理方法,其特征在于,所述方法包括:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
2.根据权利要求1所述的方法,其特征在于,所述从用户的输入内容中确定出多个用户特征词,包括:
对用户的输入内容与特征词集合进行匹配,以得到所述输入内容中包含的多个用户特征词。
3.根据权利要求2所述的方法,其特征在于,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定用户向量,包括:
依据所述多个用户特征词分别对应的权重参数,对所述多个用户特征词分别对应的词向量进行融合,以得到用户向量。
5.根据权利要求1至3中任一所述的方法,其特征在于,通过如下步骤确定所述权重参数:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
6.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:
依据向量检索方法,确定与用户向量相匹配的目标词向量;
依据所述目标词向量对应的词条,得到所述用户对应的个性化词条。
7.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:
依据多个用户分别对应的用户向量,对用户进行聚类;
依据用户对应的用户类别内用户对应的用户特征词,确定所述用户对应的个性化词条。
8.一种个性化词条的处理装置,其特征在于,包括:
用户特征词确定模块,用于从用户的输入内容中确定出多个用户特征词;
用户向量确定模块,用于依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;以及
个性化词条确定模块,用于依据所述用户向量,确定所述用户对应的个性化词条。
9.一种用于处理个性化词条的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的输入内容中确定出多个用户特征词;
依据所述多个用户特征词分别对应的词向量和权重参数,确定用户向量;
依据所述用户向量,确定所述用户对应的个性化词条。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的个性化词条的处理方法。
CN202011053552.0A 2020-09-29 2020-09-29 个性化词条的处理方法和装置 Pending CN114330324A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011053552.0A CN114330324A (zh) 2020-09-29 2020-09-29 个性化词条的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011053552.0A CN114330324A (zh) 2020-09-29 2020-09-29 个性化词条的处理方法和装置

Publications (1)

Publication Number Publication Date
CN114330324A true CN114330324A (zh) 2022-04-12

Family

ID=81011344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011053552.0A Pending CN114330324A (zh) 2020-09-29 2020-09-29 个性化词条的处理方法和装置

Country Status (1)

Country Link
CN (1) CN114330324A (zh)

Similar Documents

Publication Publication Date Title
CN109196496B (zh) 未知词预测器和内容整合的翻译器
CN110008401B (zh) 关键词提取方法、关键词提取装置和计算机可读存储介质
CN108304412B (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN110222256B (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN110019675B (zh) 一种关键词提取的方法及装置
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN110391966B (zh) 一种消息处理方法、装置和用于消息处理的装置
WO2019109663A1 (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN112631437A (zh) 信息推荐方法、装置及电子设备
CN112784142A (zh) 一种信息推荐方法及装置
CN109521888B (zh) 一种输入方法、装置和介质
CN107784037B (zh) 信息处理方法和装置、用于信息处理的装置
CN113033163A (zh) 一种数据处理方法、装置和电子设备
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN110020335B (zh) 收藏夹的处理方法和装置
CN114330324A (zh) 个性化词条的处理方法和装置
CN110929122B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114610163A (zh) 推荐方法、装置和介质
CN114330325A (zh) 个性化词条的处理方法和装置
CN114115550A (zh) 联想候选的处理方法、装置和用于处理联想候选的装置
CN112214692A (zh) 基于输入法的数据处理方法、装置和机器可读介质
CN112306252A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN112052395A (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination