CN114330325A - 个性化词条的处理方法和装置 - Google Patents
个性化词条的处理方法和装置 Download PDFInfo
- Publication number
- CN114330325A CN114330325A CN202011053559.2A CN202011053559A CN114330325A CN 114330325 A CN114330325 A CN 114330325A CN 202011053559 A CN202011053559 A CN 202011053559A CN 114330325 A CN114330325 A CN 114330325A
- Authority
- CN
- China
- Prior art keywords
- user
- determining
- entries
- personalized
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种个性化词条的处理方法、装置和用于处理个性化词条的装置,其中的方法具体包括:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。本发明实施例可以满足用户的精细输入需求,且能够降低存储空间。
Description
技术领域
本发明涉及输入技术领域,尤其涉及一种个性化词条的处理方法和装置。
背景技术
随着计算机技术和互联网技术的普及和发展,输入法已经成为用户进行人机交互的重要工具。一般地,评价输入法的性能时,首选词的准确率以及候选排序的准确性是两个重要的评价指标。而记载有词条信息和词频信息的输入法词库是影响这两个评价指标的重要因素。在现有的输入法系统中,系统词库覆盖了绝大部分用户使用的常用词汇。但由于不同用户的专业领域、兴趣以及语言使用习惯的不同,因此对于输入法的词条存在个性化的需求。
为了满足不同用户的个性化输入需求,输入法系统提供了细胞词库。细胞词库一般是指细分化的词库,一个细胞词库就是一个细分类别的词汇集合,细胞词库的类别可以是某个专业领域(如医学领域词库),也可以是某个地区(如北京地名词库),也可以是某个游戏(如魔兽世界词汇)等。
发明人在实施本发明实施例的过程中发现,一个细胞词库中通常包含大量的词条,这使得细胞词库占用较多的存储空间;并且,细胞词库通常基于领域专家对词汇的认知而构建,这使得细胞词库的粒度较粗,进而导致无法满足用户的精细输入需求。
发明内容
本发明实施例提供一种个性化词条的处理方法、装置和用于输入的装置,可以满足用户的精细输入需求,且能够降低存储空间。
为了解决上述问题,本发明实施例公开了一种个性化词条的处理方法,包括:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
另一方面,本发明实施例公开了一种个性化词条的处理装置,包括:
用户特征词确定模块,用于从用户的已输入内容中确定出用户特征词;
相关词条确定模块,用于依据向量关系,确定所述用户特征词对应的相关词条;以及
个性化词条确定模块,用于依据所述相关词条,确定所述用户对应的个性化词条。
再一方面,本发明实施例公开了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的个性化词条的处理方法。
本发明实施例包括以下优点:
本发明实施例利用以词推词的构思,依据向量关系,确定用户特征词对应的相关词条,并依据所述相关词条,确定所述用户对应的个性化词条。由于用户特征词表征用户特征及用户输入需求,故本发明实施例可以基于用户特征词对应的词粒度,进行个性化词条的推荐,因此得到的个性化词条能够满足用户的精细输入需求。
并且,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种个性化词条的处理方法的应用环境的示意;
图2是本发明的一种个性化词条的处理方法实施例一的步骤流程图;
图3是本发明的一种个性化词条的处理方法实施例二的步骤流程图;
图4是本发明的一种个性化词条的处理装置实施例的结构框图;
图5是本发明的一种用于处理个性化词条的装置800的框图;及
图6是本发明的一些实施例中服务端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术中细胞词库占用较多的存储空间、以及无法满足用户的精细输入需求的技术问题,本发明实施例提供了一种个性化词条的处理方案,该方案可以从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。
本发明实施例中,上屏指将预览窗口中的内容输出显示到应用程序窗口的操作。具体到输入法,上屏可以指将候选窗口中的候选输出显示到应用程序窗口的操作。上屏对应的候选可以称为已输入内容。本发明实施例的已输入内容可以包括:一次或多次的上屏内容。上述已输入内容可以对应字词、短语、句子等语言单位。
特征词可以表征具有专属特性的词。本发明实施例依据已输入内容中的用户特征词,表征用户特征及用户输入需求。
本发明实施例依据向量关系,确定用户特征词对应的相关词条,并依据所述相关词条,确定所述用户对应的个性化词条。由于用户特征词表征用户特征及用户输入需求,故本发明实施例可以基于用户特征词对应的词粒度,进行个性化词条的推荐,因此得到的个性化词条能够满足用户的精细输入需求。
并且,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
本发明实施例提供的个性化词条的处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务端200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务端200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序,Application)。
本发明实施例的服务端可以为云服务端(云端)。云端是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。云端的资源信息具有动态性,使得其处理能力可弹性伸缩。
本发明实施例可以应用于个性化词条的推荐场景,以满足用户的精细输入需求,且能够降低存储空间。
本发明实施例可应用于键盘符号、手写、语音等各种输入方式的输入法程序,即用户可以通过编码字符串进行文字输入,输入串可以指用户输入的编码字符串。在输入法领域,对于例如中文、日文、韩文、或者其它语言的输入法程序,通常可以把用户输入的输入串转换成相应语言的候选项。以下主要以中文为例进行说明,日文、韩文等其它语言相互参照即可。可以理解,所述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等,本发明实施例对于某种语言对应的具体输入法程序不加以限制。
以中文的输入为例,编码字符串的类型可以包括:拼音串、字形串(如五笔串等)、语音信息(如语音输入方式)。以英文的输入为例,编码字符串的类型可以包括:字母字符串等。
在实际应用中,对于键盘符号的输入方式,用户可以通过实体键盘、或者虚拟键盘等输入上述输入串。例如,对于具有触摸屏的终端,其可以在输入界面中设置虚拟键盘,以使用过通过触发上述虚拟键盘包括的虚拟按键进行输入串的输入。可选地,上述虚拟键盘的例子可以包括:9键键盘和26键键盘等。并且,可以理解,上述输入界面中除了设置有字母对应的虚拟按键之外,还可以设置有符号按键、数字按键、例如中英切换按键的功能按键,或者,还可以设置有工具栏按键等,可以理解,本发明实施例对于输入界面所包含的具体按键不加以限制。
根据一些实施例,上述输入串可以包括但不限于:用户通过按键所输入的一个按键符号或多个按键符号的组合。所述按键符号具体可以包括:拼音、笔画、假名等。
本发明实施例中,候选可用于表示输入法程序提供的待被用户选择的一个或多个字符。候选可以与上下文相应,或者,候选可以与输入串相应,或者,候选可以与输入串和上下文相应。候选可以为中文字符、英文字符、日文字符等语言的字符,候选也可以为颜文字、图片等形式的符号组合。其中,所述颜文字包括但不限于线条、符号、文字所组成的图画,例如,所述颜文字的例子可以包括:“:P”、“:-o”、“:-)”等。
本发明实施例中,可以依据输入串,在词库中进行查找,以得到输入串对应的候选。上述词库可以为传统词库,上述传统词库具体包括:系统词库、用户词库、细胞词库、云词库等。本发明实施例在传统词库的基础上增加了第一个性化词条,以满足用户的实时性个性化需求。
方法实施例一
参照图2,示出了本发明的一种个性化词条的处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、从用户的已输入内容中确定出用户特征词;
步骤202、依据向量关系,确定上述用户特征词对应的相关词条;
步骤203、依据上述相关词条,确定上述用户对应的个性化词条。
图2所示方法实施例可由客户端和/或服务端执行,可以理解,本发明实施例对于方法实施例的具体执行主体不加以限制。
步骤201中,特征词可以表征具有专属特性的词。用户的已输入内容中可以包括具有专属属性的词,也可以包括不具有专属属性的词。本发明实施例从用户的已输入内容中确定出用户特征词,可以使用户特征词表征用户特征或用户输入需求。
可选地,上述从用户的已输入内容中确定出用户特征词,具体包括:对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。
例如,用户A的已输入内容为句子A“今天上午我们去迪卡侬买冲锋衣,下午去滑雪”,可以从句子A中确定出“迪卡侬”、“冲锋衣”、“滑雪”等用户特征词。
本发明实施例中,可选的是,上述特征词条具体包括:领域词条、自造词条和云词条中的至少一种。
其中,领域可以指某一专业性范围,涉及在该范围内的所有事项均可引用。领域词汇可以指领域范围内的词汇,领域词汇可以对应有领域关键词。
本发明实施例可以采用如下确定方式确定领域词汇。
确定方式1、确定个人特征类别的领域词汇,个人特征类别可以对应领域关键词。
个人特征类别的领域词汇具体包括:职业属性类(医生、快递员…);长期兴趣类(动漫二次元、军事…)等。
确定方式2、确定话题类别的领域词汇,话题类别可以对应领域关键词。
话题类别的领域词汇具体包括:临时性话题(养鱼、某电视剧…);阶段性话题(如买保险、买房、学车、装修…)等。
确定方式3、抓取百科词条,对抓取的百科词条进行筛选后,标注对应的领域关键词。例如,可以对百科词条与细胞词条进行融合,并对融合结果进行筛选后,得到领域词条。
确定方式4、对用户输入过的高频词条进行聚类,对应的类别关键词作为领域关键词,类别下的高频词条作为领域词条。
可以理解,确定方式1至确定方式4只是作为领域词汇的确定方式的示例,本发明实施例对于领域词汇的具体确定方式不加以限制,本领域技术人员还可以实际应用需求,采用其他确定方式。例如,可以收集实体词,将实体词作为领域词汇。
本发明实施例中,实体是一个具体事物或概念。实体一般会划分类型,例如人物类实体、电影类实体、动物类实体、历史类实体等。同一个实体可以对应多个实体实例,实体实例可以是在网络(或其它媒介)中对一个实体的描述性页面(内容),例如百科的页面中即包含实体对应的实体实例。
可选地,实体可以包括:命名实体(named entity),命名实体可以指人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的命名实体还可以包括:书名、歌曲名、影视剧名、产品名、品牌名、数字、日期、货币、地址等等。
可选地,所述实体类别可以包括如下类别中的至少一种:人物、地点、水果、蔬菜、动物、植物、建筑物、衣物、食物、药物、交通工具、家具、乐器、电器、以及自然现象。实体类别可以作为领域关键词。
自造词条可以为用户自造的词条,以补充传统词库的不足。在实际应用中,可以提供自造词条接口,以接收用户设定的输入串与自造词条之间的映射关系。
云词条可以为云端基于云输入法提供的词条,可以作为传统词库中词条的补充。云输入法是依托于云计算技术的输入法,凭借服务器集群强大的存储和运算能力,拥有传统输入法所不可比拟的优势:更大、更新的词库,更高级的语言模型,这些优势使得输入的准确率有了显著的提升。在实际应用中,可以向云端发送云请求,该云请求中可以包括用户的输入信息,输入信息可以包括:输入串或语音信息等,并可以接收云端返回的云词条。
步骤202中,词向量技术可以将词转化成为稠密向量。并且对于语义和/或语境相似的词,其对应的词向量也相近。维度稠密的词向量能够包含更多信息,并且词向量的单个维度可以具有特定的含义。
例如,词向量的维度数量可以包括:128或256或512或1024等。经过训练之后的词向量,能够表征词语之间的匹配关系。例如,“香蕉”和“苹果”之间的距离,会比“香蕉”和“茄子”之间的距离要近,因此,“香蕉”和“苹果”之间的匹配度大于“香蕉”和“茄子”之间的匹配度。
多个词向量可以融合为一个新的词向量。例如,词向量“女人”+词向量“漂亮”=词向量“女神”。一个词向量减去一个词向量可以得到一个新的向量。例如,例如,词向量“国王”-词向量“男人”+词向量“女人”=词向量“女皇”等。
本发明实施例依据向量关系,确定上述用户特征词对应的相关词条,得到的相关词条在语义和/或语境方面可以与用户特征词相匹配,因此能够满足用户输入需求。
本发明实施例可以提供确定所述用户特征词对应的相关词条的如下技术方案:
技术方案A1、
技术方案A1中,上述确定所述用户特征词对应的相关词条,具体包括:确定所述用户特征词对应的第一词向量;依据向量检索方法,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。
本发明实施例中,可以对训练数据进行训练,以得到词向量的生成模型,生成模型可以包括:词条与词向量之间的映射关系。上述训练数据可以包括:输入法环境的输入语料、即时通讯环境的语聊语料、微博环境的语料、问答环境的语料等语料。
在本发明的一种可选实施例中,训练数据可以包括:第二时间范围内的输入语料。第二时间范围的时长可由本领域技术人员根据实际应用需求确定,例如,第二时间范围的时长为两年,第二时间范围为最近两年等,可以理解,本发明实施例对于具体的第二时间范围不加以限制。
本发明实施例可以利用向量工具,实现向量检索。上述向量工具可以提供向量的索引,并将第一词向量与向量的索引进行匹配,以得到与所述第一词向量相匹配的第二词向量。可以理解,本发明实施例对于具体的向量检索方法不加以限制。
例如,用户特征词A为“滑雪”,本发明实施例可以基于向量检索,得到用户特征词A对应的相关词条,如“滑雪板”、“滑雪板蜡”、“盔形帽”、“防风镜”等。
在实际应用中,可以针对用户特征词维护对应的相关词表,该相关词表可以包括该用户特征词对应的相关词条。例如,某用户的n个用户特征词对应n个相关词表,n可以为自然数。或者,某用户的n个用户特征词对应1个相关词表,该相关词表中包括n条数据记录,一条数据记录对应一个用户特征词等。
技术方案A2、
技术方案A2中,上述确定所述用户特征词对应的相关词条,具体包括:依据至少两种词向量类型,确定所述用户特征词对应的至少两种相关词集合;依据所述用户特征词与所述至少两种相关词集合对应的匹配度,确定所述用户特征词对应的相关词条、以及所述用户特征词与对应相关词条之间的匹配度。
本发明实施例中,词向量类型可用于表征词向量的不同类型,其可以包括用于产生词向量的不同模型。词向量类型可以包括:word2vec(词到向量,word to vector)类型、图向量类型等。图向量类型可以包括:deepwalk(深度游走)、node2vec(节点到向量)等。
在实际应用中,对于单个词向量类型而言,可能出现由于训练不充分而带来的精度偏差问题,该精度偏差可能使得相关词条与用户特征词之间的匹配度较低。针对上述问题,本发明实施例依据至少两种词向量类型,分别得到用户特征词对应的至少两种相关词集合,并对上述至少两种相关词集合进行融合,以得到融合后的相关词条、以及对应的匹配度。由于本发明实施例的至少两种相关词集合源自至少两种词向量类型,故可以在一定程度上克服单个词向量类型的训练不充分而带来的精度偏差问题,因此能够提高相关词条与用户特征词之间的匹配度。
假设两种相关词集合包括:相关词集合1和相关词集合2,则依据相关词集合1和相关词集合2分别对应的权重,对相关词集合1和相关词集合2中的相关词条进行融合。
例如,相关词条i在多个相关词集合中出现,假设相关词集合1和相关词集合2分别对应权重a和b,相关词条i在相关词集合1中与用户特征词条之间的匹配度为匹配度1,相关词条i在相关词集合2中与用户特征词条之间的匹配度为匹配度2,则可以依据a和b,对匹配度1和匹配度2进行加权平均,以得到融合后的匹配度。
又如,假设相关词条j仅仅在一个相关词集合中出现,则可以认为相关词条j在其他相关词集合中与用户特征词条之间的匹配度为0,由此可以得到融合后的匹配度。
可以理解,本领域技术人员可以根据实际应用需求,采用技术方案A1至技术方案A2中的任一或组合。例如,在组合采用技术方案A1和技术方案A2的情况下,可以首先利用技术方案A1,利用向量检索方法,在至少两种词向量类型中检索得到至少两种相关词集合,然后利用技术方案A2,依据所述用户特征词与所述至少两种相关词集合对应的匹配度,确定所述用户特征词对应的相关词条、以及所述用户特征词与对应相关词条之间的匹配度。
步骤203中,依据上述相关词条,确定上述用户对应的个性化词条,可以向用户提供个性化词条对应的输入服务。
在实际应用中,在确定个性化词条后,服务端可以向用户对应的客户端推送个性化词条,以使客户端向用户提供个性化词条对应的输入服务。个性化词条可以对应有输入信息和词频等信息。输入信息可以包括:输入串或语音信息等。
在用户的输入过程中,可以对用户的输入信息与个性化词条对应的输入信息进行匹配,若匹配成功,则可以将对应的个性化词条作为候选项。
例如,用户A欲要通过输入串“huaxuebanla”输入目标词条“滑雪板蜡”,但传统词库中不存在“滑雪板蜡”,但根据用户A的用户特征词提供的第一个性化词条中包括“滑雪板蜡”,因此可以依据个性化词条提供“滑雪板蜡”这个候选,因此能够提高输入效率。
或者,即使传统词库中存在“滑雪板蜡”,但可以依据输入信息与个性化词条之间的匹配关系,调整个性化词条对应候选的位置,将个性化词条对应候选的位置提前,例如,可以将个性化词条对应的候选提前在首选、二选、或三选等位置。由于可以优先向用户提供个性化词条对应候选,因此可以提高用户选择候选的效率,进而可以提升输入效率。
在实际应用中,可以直接将上述相关词条,作为上述用户对应的个性化词条;或者,可以对上述相关词条进行筛选,将筛选后的相关词条作为用户对应的个性化词条。
本发明实施例中,可选的是,上述确定所述用户对应的个性化词条,具体包括:依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。
用户特征词与相关词条之间的匹配度,可以表征两者之间的匹配程度,进而可以表征相关词条与用户输入需求的匹配程度。
权重参数可以表征用户特征词在输入语料中的重要程度。本发明实施例依据权重参数,可以确定不同用户特征词所对应相关词条的重要程度。
可选地,权重参数可以表征用户特征词在输入语料的所有特征词中的重要程度;或者,权重参数可以表征用户特征词在包含特征词的语句输入语料中的重要程度。若语句输入语料k中包含特征词,则可以用于权重参数的确定过程。若语句输入语料p中包含特征词,则不能用于权重参数的确定过程。
可选地,可以利用TF-IDF(词频-逆文档频率,Term Frequency-Inverse DocumentFrequency)技术,确定权重参数。TF-IDF是一种统计方法,用以评估字词对于一个文档集或一个语料库中一份文档的重要程度。字词的重要性随着它在文档中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TFIDF的思想是:如果某个词在一篇文档中出现的频率高,并且在其他文档中很少出现,则认为此词的重要度较高。
相应地,权重参数的确定过程具体包括:确定用户特征词在第一时间范围内的输入语料中的频率参数(TF);确定用户特征词在第二时间范围内的输入语料中的区分参数(IDF);所述第二时间范围大于所述第一时间范围;依据所述频率参数和所述区分参数,确定所述权重参数。
第一时间范围可以反映目标用户的用户输入需求的时效性,可以将目标用户在第一时间范围内的输入语料作为一个文档。因此,第一时间范围可以对应较小的时长,为1个月内的时长、2个月内的时长等。目标用户可以指个性化词条对应的特定用户,也即待推荐的用户,如用户A等。因此,本发明实施例可以依据用户特征词在目标用户的第一时间范围内的输入语料中的出现频率,得到TF。
第二时间范围内的输入语料可以为多个用户的输入语料,可用于提供多个文档。可以将一个用户在第二时间范围内的输入语料作为一个文档,由此可以得到多个文档,用于为权重参数的统计方法提供统计数据。
本发明实施例可以依据第二时间范围内的输入语料对应的用户数量作为总文档数量T,依据输入了用户特征词的用户数量作为包含该用户特征词的文档数量D。可选地,可以将总文档数量T除以文档数量D对应的因数,再将得到的商取对数得到IDF;其中,文档数量D对应的因数可以为文档数量D与与预设正数的和,可以避免在文档数量D为零的情况下、因数为零。可以理解,本发明实施例对于IDF的具体计算方式不加以限制。
本发明实施例可以依据依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,确定相关词条对应的得分,然后依据得分从大到小的顺序,对相关词条进行排序。
上述依据排序结果,从所述相关词条中确定出个性化词条,具体包括:选取排在前面的前M个相关词条,作为个性化词条;或者,可以选取得分超过得分阈值的相关词条,作为个性化词条。由此可以提高个性化词条的质量,且可以控制个性化词条的数量。
本发明实施例可以提供如下排序方式中的任一:
排序方式1、依据所述用户特征词与所述相关词条之间的匹配度,对所述相关词条进行第一排序,并依据第一排序结果,从所述相关词条中确定出个性化词条;或者
排序方式2、依据所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
排序方式3、依据所述用户特征词与所述相关词条之间的匹配度、以及所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条。
对于排序方式3,可以对匹配度和权重参数进行融合,以得到相关词条对应的得分。相应的融合方式可以包括:乘积、求和、或者加权平均等。
综上,本发明实施例的个性化词条的处理方法,依据向量关系,确定用户特征词对应的相关词条,并依据所述相关词条,确定所述用户对应的个性化词条。由于用户特征词表征用户特征及用户输入需求,故本发明实施例可以基于用户特征词对应的词粒度,进行个性化词条的推荐,因此得到的个性化词条能够满足用户的精细输入需求。
并且,本发明实施例实施例基于用户特征词对应的词粒度,提供对应的个性化词条。上述个性化词条的数量通常小于细胞词库包含词条的数量,因此能够降低存储空间。
另外,目前细胞词库并未对不同的细胞词条进行排序,使得无法衡量细胞词条与用户输入需求之间的匹配度。而本发明依据匹配度和/或权重参数,对相关词条进行排序,排序结果可以表征相关词条与用户输入需求之间的匹配度,匹配度越高,则越适于推荐,因此本发明实施例可以将匹配度更高的相关词条作为个性化词条,进行推荐,因此能够提高个性化词条的推荐精度。
方法实施例二
参照图3,示出了本发明的一种个性化词条的处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤301、依据特征词集合,从用户的输入语料中,确定出用户的用户特征词,并确定用户特征词对应的权重参数;
步骤302、依据用户的语句输入语料,确定至少两种词向量类型的至少两种生成模型;
用户的语句输入语料可以作为生成模型的训练数据。
步骤303、从目标用户的已输入内容中确定出用户特征词;
步骤304、利用至少两种生成模型和向量检索方法,确定上述用户特征词对应的至少两种相关词集合;
步骤305、对至少两种相关词集合中的相关词条进行融合,以得到用户特征词与对应相关词条之间的匹配度;
步骤306、依据上述权重参数和匹配度,对多个用户特征词对应的相关词条进行排序;
步骤307、从排序结果中选择符合预设条件的相关词条,作为目标用户的个性化词条进行推荐。
本发明实施例利用以词推词的构思,可以针对目标用户在第一时间范围内的输入语料中包含的用户特征词,进行个性化词条的推荐。
本发明实施例依据至少两种词向量类型的至少两种生成模型,得到用户特征词对应的至少两种相关词集合;可以在一定程度上克服单个词向量类型的训练不充分而带来的精度偏差问题,因此能够提高相关词条与用户特征词之间的匹配度。
并且,本发明实施例依据权重参数和匹配度,对多个用户特征词对应的相关词条进行排序,可以依据权重参数和匹配度表征的与用户输入需求之间的匹配度,对不同用户特征词对应的相关词条进行位置的调整,可以将匹配度更高的相关词条作为个性化词条,进行推荐,因此能够提高个性化词条的推荐精度。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图4,示出了本发明的一种个性化词条的处理装置实施例的结构框图,具体可以包括:
用户特征词确定模块401,用于从用户的已输入内容中确定出用户特征词;
相关词条确定模块402,用于依据向量关系,确定上述用户特征词对应的相关词条;以及
个性化词条确定模块403,用于依据上述相关词条,确定上述用户对应的个性化词条。
可选地,用户特征词确定模块401可以包括:
匹配模块,用于对用户的已输入内容与特征词集合进行匹配,以得到上述已输入内容中包含的用户特征词。
可选地,上述特征词集合可以包括领域词条、自造词条和云词条中的至少一种。
可选地,相关词条确定模块402可以包括:
第一词向量确定模块,用于确定上述用户特征词对应的第一词向量;
第二词向量确定模块,用于依据向量检索装置,确定与上述第一词向量相匹配的第二词向量,上述第二词向量对应的词条作为相关词条。
可选地,个性化词条确定模块403可以包括:
排序模块,用于依据上述用户特征词与上述相关词条之间的匹配度、和/或、上述用户特征词对应的权重参数,对上述相关词条进行排序,并依据排序结果,从上述相关词条中确定出个性化词条。
可选地,上述装置还可以包括:
频率参数确定模块,用于确定用户特征词在第一时间范围内的输入语料中的频率参数;
区分参数确定模块,用于确定用户特征词在第二时间范围内的输入语料中的区分参数;上述第二时间范围大于上述第一时间范围;
权重参数确定模块,用于依据上述频率参数和上述区分参数,确定上述权重参数。
可选地,个性化词条确定模块403可以包括:
第一排序模块,用于依据上述用户特征词与上述相关词条之间的匹配度,对上述相关词条进行第一排序,并依据第一排序结果,从上述相关词条中确定出个性化词条;或者
第二排序模块,用于依据上述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从上述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
第三排序模块,用于依据上述用户特征词与上述相关词条之间的匹配度、以及上述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从上述多个用户特征词分别对应的相关词条中确定出个性化词条。
可选地,相关词条确定模块402可以包括:
第一确定模块,用于依据至少两种词向量类型,确定上述用户特征词对应的至少两种相关词集合;
第二确定模块,用于依据上述用户特征词与上述至少两种相关词集合对应的匹配度,确定上述用户特征词对应的相关词条、以及上述用户特征词与对应相关词条之间的匹配度。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行上述一个或者一个以上程序包含用于进行以下操作的指令:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。
图5是根据一示例性实施例示出的一种用于处理个性化词条的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在上述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音输入模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如上述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID,Radio Frequency Identification)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图6是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2或图3所示的个性化词条的处理方法。
一种非临时性计算机可读存储介质,当上述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种个性化词条的处理方法,上述方法包括:从用户的已输入内容中确定出用户特征词;依据向量关系,确定所述用户特征词对应的相关词条;依据所述相关词条,确定所述用户对应的个性化词条。
本发明实施例公开了A1、一种个性化词条的处理方法,上述方法包括:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
A2、根据A1所述的方法,所述从用户的已输入内容中确定出用户特征词,包括:
对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。
A3、根据A2所述的方法,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
A4、根据A1至A3中任一所述的方法,所述确定所述用户特征词对应的相关词条,包括:
确定所述用户特征词对应的第一词向量;
依据向量检索方法,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。
A5、根据A1至A3中任一所述的方法,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。
A6、根据A5所述的方法,通过如下步骤确定所述权重参数:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
A7、根据A1至A3中任一所述的方法,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度,对所述相关词条进行第一排序,并依据第一排序结果,从所述相关词条中确定出个性化词条;或者
依据所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
依据所述用户特征词与所述相关词条之间的匹配度、以及所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条。
A8、根据A1至A3中任一所述的方法,所述确定所述用户特征词对应的相关词条,包括:
依据至少两种词向量类型,确定所述用户特征词对应的至少两种相关词集合;
依据所述用户特征词与所述至少两种相关词集合对应的匹配度,确定所述用户特征词对应的相关词条、以及所述用户特征词与对应相关词条之间的匹配度。
本发明实施例公开了B9、一种个性化词条的处理装置,包括:
用户特征词确定模块,用于从用户的已输入内容中确定出用户特征词;
相关词条确定模块,用于依据向量关系,确定所述用户特征词对应的相关词条;以及
个性化词条确定模块,用于依据所述相关词条,确定所述用户对应的个性化词条。
B10、根据B9所述的装置,所述用户特征词确定模块包括:
匹配模块,用于对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。
B11、根据B10所述的装置,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
B12、根据B9至B11中任一所述的装置,所述相关词条确定模块包括:
第一词向量确定模块,用于确定所述用户特征词对应的第一词向量;
第二词向量确定模块,用于依据向量检索装置,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。
B13、根据B9至B11中任一所述的装置,所述个性化词条确定模块包括:
排序模块,用于依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。
B14、根据B13所述的装置,所述装置还包括:
频率参数确定模块,用于确定用户特征词在第一时间范围内的输入语料中的频率参数;
区分参数确定模块,用于确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
权重参数确定模块,用于依据所述频率参数和所述区分参数,确定所述权重参数。
B15、根据B9至B11中任一所述的装置,所述个性化词条确定模块包括:
第一排序模块,用于依据所述用户特征词与所述相关词条之间的匹配度,对所述相关词条进行第一排序,并依据第一排序结果,从所述相关词条中确定出个性化词条;或者
第二排序模块,用于依据所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
第三排序模块,用于依据所述用户特征词与所述相关词条之间的匹配度、以及所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条。
B16、根据B9至B11中任一所述的装置,所述相关词条确定模块包括:
第一确定模块,用于依据至少两种词向量类型,确定所述用户特征词对应的至少两种相关词集合;
第二确定模块,用于依据所述用户特征词与所述至少两种相关词集合对应的匹配度,确定所述用户特征词对应的相关词条、以及所述用户特征词与对应相关词条之间的匹配度。
本发明实施例公开了C17、一种用于处理个性化词条的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
C18、根据C17所述的装置,所述从用户的已输入内容中确定出用户特征词,包括:
对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。
C19、根据C18所述的装置,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
C20、根据C17至C19中任一所述的装置,所述确定所述用户特征词对应的相关词条,包括:
确定所述用户特征词对应的第一词向量;
依据向量检索装置,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。
C21、根据C17至C19中任一所述的装置,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。
C22、根据C21所述的装置,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
C23、根据C17至C19中任一所述的装置,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度,对所述相关词条进行第一排序,并依据第一排序结果,从所述相关词条中确定出个性化词条;或者
依据所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
依据所述用户特征词与所述相关词条之间的匹配度、以及所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条。
C24、根据C17至C19中任一所述的装置,所述确定所述用户特征词对应的相关词条,包括:
依据至少两种词向量类型,确定所述用户特征词对应的至少两种相关词集合;
依据所述用户特征词与所述至少两种相关词集合对应的匹配度,确定所述用户特征词对应的相关词条、以及所述用户特征词与对应相关词条之间的匹配度。
本发明实施例公开了D25、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A8中一个或多个所述的个性化词条的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种个性化词条的处理方法、一种个性化词条的处理装置和一种用于处理个性化词条的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种个性化词条的处理方法,其特征在于,所述方法包括:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
2.根据权利要求1所述的方法,其特征在于,所述从用户的已输入内容中确定出用户特征词,包括:
对用户的已输入内容与特征词集合进行匹配,以得到所述已输入内容中包含的用户特征词。
3.根据权利要求2所述的方法,其特征在于,所述特征词集合包括领域词条、自造词条和云词条中的至少一种。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户特征词对应的相关词条,包括:
确定所述用户特征词对应的第一词向量;
依据向量检索方法,确定与所述第一词向量相匹配的第二词向量,所述第二词向量对应的词条作为相关词条。
5.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度、和/或、所述用户特征词对应的权重参数,对所述相关词条进行排序,并依据排序结果,从所述相关词条中确定出个性化词条。
6.根据权利要求5所述的方法,其特征在于,通过如下步骤确定所述权重参数:
确定用户特征词在第一时间范围内的输入语料中的频率参数;
确定用户特征词在第二时间范围内的输入语料中的区分参数;所述第二时间范围大于所述第一时间范围;
依据所述频率参数和所述区分参数,确定所述权重参数。
7.根据权利要求1至3中任一所述的方法,其特征在于,所述确定所述用户对应的个性化词条,包括:
依据所述用户特征词与所述相关词条之间的匹配度,对所述相关词条进行第一排序,并依据第一排序结果,从所述相关词条中确定出个性化词条;或者
依据所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第二排序,并依据第二排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条;或者
依据所述用户特征词与所述相关词条之间的匹配度、以及所述用户特征词对应的权重参数,对多个用户特征词分别对应的相关词条进行第三排序,并依据第三排序结果,从所述多个用户特征词分别对应的相关词条中确定出个性化词条。
8.一种个性化词条的处理装置,其特征在于,包括:
用户特征词确定模块,用于从用户的已输入内容中确定出用户特征词;
相关词条确定模块,用于依据向量关系,确定所述用户特征词对应的相关词条;以及
个性化词条确定模块,用于依据所述相关词条,确定所述用户对应的个性化词条。
9.一种用于处理个性化词条的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
从用户的已输入内容中确定出用户特征词;
依据向量关系,确定所述用户特征词对应的相关词条;
依据所述相关词条,确定所述用户对应的个性化词条。
10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的个性化词条的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011053559.2A CN114330325A (zh) | 2020-09-29 | 2020-09-29 | 个性化词条的处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011053559.2A CN114330325A (zh) | 2020-09-29 | 2020-09-29 | 个性化词条的处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330325A true CN114330325A (zh) | 2022-04-12 |
Family
ID=81011293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011053559.2A Pending CN114330325A (zh) | 2020-09-29 | 2020-09-29 | 个性化词条的处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330325A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118246988A (zh) * | 2024-05-30 | 2024-06-25 | 江西财经大学 | 一种基于ai的个性化内容推送方法及系统 |
-
2020
- 2020-09-29 CN CN202011053559.2A patent/CN114330325A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118246988A (zh) * | 2024-05-30 | 2024-06-25 | 江西财经大学 | 一种基于ai的个性化内容推送方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304412B (zh) | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 | |
CN111708943B (zh) | 一种搜索结果展示方法、装置和用于搜索结果展示的装置 | |
CN110222256B (zh) | 一种信息推荐方法、装置和用于信息推荐的装置 | |
CN109101505B (zh) | 一种推荐方法、推荐装置和用于推荐的装置 | |
WO2019109663A1 (zh) | 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置 | |
CN110633017A (zh) | 一种输入方法、装置和用于输入的装置 | |
CN112631437A (zh) | 信息推荐方法、装置及电子设备 | |
CN111538830B (zh) | 法条检索方法、装置、计算机设备及存储介质 | |
CN109521888B (zh) | 一种输入方法、装置和介质 | |
CN110929122B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN113033163B (zh) | 一种数据处理方法、装置和电子设备 | |
CN107784037B (zh) | 信息处理方法和装置、用于信息处理的装置 | |
CN114330325A (zh) | 个性化词条的处理方法和装置 | |
CN111708444A (zh) | 输入方法、装置和用于输入的装置 | |
CN110399468B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN113010768B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN112433622B (zh) | 基于考试的词条处理方法、装置和介质 | |
CN114610163A (zh) | 推荐方法、装置和介质 | |
CN114330324A (zh) | 个性化词条的处理方法和装置 | |
CN114115550A (zh) | 联想候选的处理方法、装置和用于处理联想候选的装置 | |
CN112214692A (zh) | 基于输入法的数据处理方法、装置和机器可读介质 | |
CN112052395A (zh) | 一种数据处理方法及装置 | |
CN112306252A (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN113589950A (zh) | 输入方法、装置和用于输入的装置 | |
CN113221030A (zh) | 一种推荐方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |