CN103886081A - 一种信息发送方法及系统 - Google Patents

一种信息发送方法及系统 Download PDF

Info

Publication number
CN103886081A
CN103886081A CN201410116639.6A CN201410116639A CN103886081A CN 103886081 A CN103886081 A CN 103886081A CN 201410116639 A CN201410116639 A CN 201410116639A CN 103886081 A CN103886081 A CN 103886081A
Authority
CN
China
Prior art keywords
search
attribute item
information
dynamic labels
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410116639.6A
Other languages
English (en)
Inventor
高桂平
王勇进
王峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Original Assignee
Hisense Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd filed Critical Hisense Group Co Ltd
Priority to CN201410116639.6A priority Critical patent/CN103886081A/zh
Publication of CN103886081A publication Critical patent/CN103886081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。本发明提供的一种信息发送方法,包括:获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。

Description

一种信息发送方法及系统
技术领域
本发明涉及智能推荐技术领域,尤其涉及一种信息发送方法及系统。
背景技术
随着互联网技术的快速发展,智能推荐技术在各个领域逐渐兴起。大型的电子商务系统,都不同程度使用了各种形式的推荐。智能推荐在商品交易领域应用广泛,各大商业网站几乎都涵盖了商品推荐的功能。
例如有的电子商务系统提供了“其他用户现在正在看的商品”、“购买了此商品的人还购买了”,都是依据用户的相似性实现推荐;
有的电子商务系统提出了“购买了此商品的人还购买了如下商品”,“看了又看”,也是把相同类型的商品推荐给用户;
有的电子商务系统提供了“最佳拍档”把同一主题的书目组合推荐给用户、也提供了“买过本商品的还买了”,根据用户可能具有的相同购买取向实现推荐的。
以上电子商务智能推荐领域,主流推荐算法是基于内容的推荐算法、协同过滤推荐算法、混合推荐算法。其中,基于内容的推荐算法的思想:记录用户过去的浏览喜好,建立用户的个性化档案,进而向用户推荐相似产品。协同过滤推荐算法的思想:分析大量用户的兴趣,在用户群中找出具有相同兴趣的相似用户,根据其他用户的行为历史进行推荐,综合相似用户对某一信息的评价,预测用户喜好。混合推荐算法,则是结合两者的优势。
在影视推荐领域,由于影视具有主观性,及时性,情感体验强烈、实时评论等特点;电商领域的推荐算法并不适合影视推荐。目前,所用较多的方法是基于提前分好的类别,添加分类筛选条件。如把影视按照类型、国家/地区、艺术家、年代等维度分类,供用户选择。目前一些主流的视频网站均是基于这种分类方法管理影视的。但这种方法存在以下方面的不足:
缺乏用户之间的交互:用户选择的过程是用户和制定分类规则人员之间的交互,而缺少用户与用户之间的交互。虽然有的视频网站提供了贴标签功能,已观看的用户用一个词概括该影视,多个用户评论后生成标签组,把这一组标签显示给其他待观看的用户,实现用户与用户之间的交流。但这种标签为用户找到电影后提供参考,并不能满足用户在检索前的需要;
影视智能推荐技术要求能够准确定位用户搜索意图,对用户的需求做出有效的预测。需要考虑已观者对影视的情感体验,而往往影评是用户充分发挥观后感的平台,通过对评论的分析可以了解观看者对影视的真实感受。但是,目前的智能推荐系统均没有基于情感体验信息的推荐;
另外,如果用户想要搜索“最新的节奏紧张的影视”,在现有技术的影视搜索系统中,并不存在这样的模糊查找,而是需要用户预测出这种影视对应的类别,再去一一查找,或者只有在用户了解到“最新的节奏紧张的影视”的具体影视名称后,再通过名称查找才能找到相应的影视,因此现有技术并不能根据用户的搜索信息做出准确的推荐;
综上,在现有技术的影视搜索系统中,根据用户输入的具体的检索要求,并不能向用户设备发送的准确的满足检索要求的搜索对象。
发明内容
本发明实施例提供了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。
本发明实施例提供了一种信息发送方法,该方法包括:
获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
本发明实施例提供的上述信息发送方法,在用户对搜索对象进行检索时,能够实现用户与用户之间的交互,并且把检索句中包含的信息进行分类,当检索信息中包括属性项信息类别和/或情感评价信息类别的检索关键词时,能够在预设的动态标签集合中对属性项信息类别和/或情感评价信息类别的检索关键词进行匹配,因此,能够实现向用户设备发送更加准确的搜索对象。
较佳的,预先建立搜索对象的动态标签集合,包括:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
通过不断更新预先建立的搜索对象的特征词库,根据当前搜索特征词库生成搜索对象的动态标签集合,能够不断的更新搜索对象的动态标签集合,从而在用户检索时能够更准确的进行信息的匹配。
较佳的,预先建立搜索对象的特征词库,包括:
获取搜索对象的元信息;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
通过预先建立包括搜索对象的元信息、属性项信息、情感评价信息以及关联对象信息的特征词库,保证搜索对象的信息的完整性,从而保证用户搜索时信息匹配的准确性。
较佳的,所述建立搜索对象的属性项信息的向量空间模型,包括:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
对于每一搜索对象,均存在其对应的属性项信息,对于每一属性项词语均存在一定的评论词,每一评论词均代表了用户的情感体验,因此根据所述属性项词、所述属性项词对应的评论词以及所述属性项词对应的评论词的情感极值,建立属性项信息的向量空间模型,能够更加准备的定位搜索对象的属性项信息。
较佳的,所述获取搜索对象的属性项词,包括:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
对于一定类型的搜索对象,均存在相应的表征该搜索对象的属性项信息,因此,预先形成一属性项标注词表,再通过从有效词表中提取属性项词表,将两者进行拟合,能够保证那些能够表征该搜索对象的特征的属性项信息生成到特征词库中,从而保证搜索对象的特征词库的信息完整性。
较佳的,所述建立搜索对象的情感评价信息的向量空间模型,包括:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
在搜索对象的评论信息中,总存在用户对于该对象的主观情感评价信息,以此来表达用户对该对象的情感态度,因此,通过建立搜索对象的情感评价信息的向量空间模型,能够更加准确的获得搜索对象的信息,从而在用户进行检索时,能够更加准确的进行信息的匹配,实现更加准确的推荐。
较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
通过上述的分级匹配顺序,能够保证匹配更加准确。
较佳的,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
通过确定所述检索关键词中属性项词对应的评论词的情感色彩类别,当在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配时,若匹配不成功,可以将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签,从而对用户的检索做出推荐。
较佳的,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
本发明还提供了一种信息发送系统,包括:
检索信息获取单元,用于获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
匹配单元,用于将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
较佳的,所述匹配单元在预先建立搜索对象的动态标签集合时,具体用于:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
较佳的,所述匹配单元在预先建立搜索对象的特征词库时,具体用于:
获取搜索对象的元信息集合;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
较佳的,所述匹配单元在建立搜索对象的属性项信息的向量空间模型时,具体用于:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
较佳的,所述匹配单元在获取搜索对象的属性项词时,具体用于:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
较佳的,所述匹配单元在建立搜索对象的情感评价信息的向量空间模型时,具体用于:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,所述匹配单元将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息时,具体用于:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
较佳的,所述匹配单元将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配时,具体用于:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
较佳的,所述匹配单元将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配时,具体用于:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
附图说明
图1为本发明实施例提供的一种信息发送方法的流程示意图;
图2为本发明实施例提供的另一种信息发送方法的流程示意图;
图3为本发明实施例提供的一种信息发送系统的结构示意图。
具体实施方式
本发明实施例提供了一种信息发送方法及系统,用以实现向用户设备发送更加准确的搜索对象。
首先对本发明中涉及的技术用语进行介绍。
搜索对象的元信息:用于表征搜索对象的基本信息,是固定不变的。例如,若搜索对象为影视,则元信息即可包括影视名、演员、导演、上映时间等;若搜索对象为音乐,则元信息即可包括音乐名、演奏者、发行时间等。
搜索对象的属性项信息:用于表征评论该搜索对象的维度以及其特点。例如,若搜索对象为影视,则属性项信息即可包括场景很宏大、情节好感人、化妆很假等,其中“场景、情节和化妆”为属性项词,“很宏大、好感人、很假”是属性项词对应的评论词,“很、好”为评论词中的程度词;若搜索对象为音乐,则属性项信息即可包括旋律是否动听、歌词是不是经典等。
搜索对象的情感评价信息:用于表征用户对搜索对象的情感体验。例如,开心、喜欢、恶心、恐惧、念念不忘、不能漏掉等。
搜索对象的关联对象信息:用于表征与搜索对象相关联的对象信息。例如,若搜索对象为影视,则关联对象信息即可包括同一导演的影视、同一上映档期的影视等;若搜索对象为音乐,则关联对象信息即可包括同一演奏者的音乐、同一专辑的音乐等。
情感极性:对于给定的一段带有观点的评论性文本,标记出该文本整体上是正面评价或者负面评价,也就是标记某一段评论性文本所代表的倾向性情感是正面还是负面,对所表达的主题是喜爱还是讨厌,是赞同还是反对。例如,若搜索对象为影视,对某一影视的评论中提及很喜欢这部电影,那么很喜欢就是正面评价,很不喜欢就是负面评价。
向量空间模型:把对文本内容的处理简化为向量空间中的向量运算,并且以空间上的相似度表达语义的相似度。当文档被表示为文档空间的向量,就可以通过计算向量之间的相似性来度量文档间的相似性。
文档词频-反向文档频率(TF-IDF,Term Frequency-Inverse DocumentFrequency):是一种统计方法,用以评估某一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
下面对本发明实施例进行说明。
如图1所示,本发明实施例提供的一种信息发送方法,包括:
步骤S101:获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
步骤S102:将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
本发明实施例提供的上述信息发送方法,在用户对搜索对象进行检索时,能够实现用户与用户之间的交互,并且把检索句中包含的信息进行分类,当检索信息中包括属性项信息类别和/或情感评价信息类别的检索关键词时,能够在预设的动态标签集合中对属性项信息类别和/或情感评价信息类别的检索关键词进行匹配,因此,能够实现向用户设备发送更加准确的搜索对象。
较佳的,所述检索信息包括文本信息或语音信息,系统通过分词和语音处理,提取所述检索信息的检索关键词。以对文本信息的分词为例,例如可以通过句法分析进行句式的识别,以及语法分析器识别语法结构来进行分词处理,以获取检索关键词并提取。在提取所述检索信息的检索关键词的过程中,若搜索对象为影视,在进行分词时,还可以引入预设的用户词典,该用户词典包括了影视名称、演员名字、导演名字、影视歌曲名称、上映时间、类型、地区等,在对检索信息进行分词时将该词典导入,能够更加快速的识别检索关键词中的元信息,并将其提取。
较佳的,预先建立搜索对象的动态标签集合,包括:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
其中,所述有效词表中包括元信息类别、属性项信息、情感评价信息和/或关联对象信息类别中的至少一类有效词。
在具体实施过程中,获取搜索对象的评论信息包括:
定期检测评论信息的更新情况,从而获取评论信息,以及评论之间的关联信息,此处,评论之间的关联信息包括针对同一搜索对象的评论信息、针对之前评论追加的评论信息等,从而动态的更新用户对该搜索对象的评价;
进一步,获取搜索对象的评论信息还包括:
按照评论的热度,其中热度参数包括评论的回复数、点击率、被引率的数量等,去掉热度较低的评论,若热度相同,按照评论时间的先后,去掉时间靠前的评论,从而获取搜索对象的评论信息。
提取所述评论信息的有效词表,包括:
将获取的搜索对象的评论信息存储在云端服务器;在获取了搜索对象的评论信息后,对评论信息进行解析,通过过滤无意义词,提取出有效词,并生成有效词表。例如,对于评论信息“电影A的特技很炫”,其中“的”为无意义词,“电影A”、“特技”、“很炫”均为有效词。
进一步,搜索对象的特征词库建立之后,根据所述有效词表,更新预先建立的搜索对象的特征词库;根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
具体实施过程中,可以根据影视的特征词的权重大小的不同,将特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词作为影视的动态标签集合;具体的,针对每一类动态标签,将每一类特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词生成到影视的动态标签集合中。
较佳的,预先建立搜索对象的特征词库,包括:
获取搜索对象的元信息;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
在具体实施过程中,以搜索对象为影视为例,元信息包括时间信息、导演信息、演员信息等,属性项信息包括场景信息、配乐信息等,情感评价信息包括“喜欢”、“经典”、“飙泪”等,关联对象信息包括关联的影视,比如导演相同的影视、类型相同的影视或者影评中提到的对比影视等,其中,元信息一般是相对固定的,而属性项信息、情感评价信息和关联对象信息是根据评论信息的更新不断的变化的。通过预先建立包括搜索对象的元信息类别、属性项信息类别、情感评价信息类别以及关联对象信息类别的特征词库,保证搜索对象的信息的完整性,从而保证用户搜索时信息匹配的准确性。
较佳的,所述建立搜索对象的属性项信息的向量空间模型,包括:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
在具体实施过程中,根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立属性项信息的向量空间模型,能够更加准确的定位搜索对象的属性项信息,同时简化计算,缩短搜索时间。
其中,确定所述属性项词对应的评论词的情感色彩类别,包括:
确定所述属性项词对应的评论词,例如,系统根据前述的属性词集合,定义一定大小的文本窗口,利用词共现的方法,确定属性项词对应的评论词;
进一步,根据预设的情感色彩分类规则,确定所述属性项词对应的评论词的情感色彩类别。例如,将情感色彩类别分为褒义、中性和贬义三种情感色彩类别,对于某一搜索对象A的属性项词“场景”对应的评论词包括2个“非常宏大”、1个“较宏大”、1个“很差”,“宏大”一词的情感色彩类别为褒义,“差”对应的情感色彩类别为贬义;
再进一步,根据预设的关于情感色彩类别的情感极性权重表,计算所述属性项词对应的评论词的情感色彩类别的情感极性值。例如,对于褒义这一情感色彩类别,其对应的程度词有“很、非常”、“比较”、“一般”、“较不”、“很不”等五类,对于贬义这一情感色彩类别,其对应的程度词有“很、非常”、“比较”、“一般”、“较不”、“很不”等五类,依次对应的情感极性权重分别为-10、-5、0、5、10;那么通过计算得出情感极性值10×2+5×1+(-10)×1=15,数值为正,则说明场景一词的情感极性值为15,整体评价为褒义;因此对于属性项信息“场景非常宏大”,在属性项信息的向量空间模型中将表达为“A、场景、褒义、宏大、15”。
较佳的,所述获取搜索对象的属性项词,包括:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
在具体实施过程中,对于一定类型的搜索对象,均存在相应的表征该搜索对象的属性项信息,因此,预先设置一属性项标注词表,再通过从有效词表中提取属性项词表,将两者进行拟合,能够保证那些能够表征该搜索对象的特征的属性项信息生成到特征词库中,从而保证搜索对象的特征词库的信息完整性。例如,以影视为搜索对象为例,预设的属性项标注词表包括了表征影视的一些属性项词,比如“场景、特效、氛围、音效、配乐、配音、画面、魔幻、故事、编剧、情节、场面、制作、化妆、原著、剧情”等,同时从评论信息中获取的有效词表中,通过特征提取算法,提取属性项词表,将两者进行拟合,生成的属性项词集合能够保证那些出现次数少但能表征该搜索对象的特征的属性项信息生成到特征词库中。
较佳的,所述建立搜索对象的情感评价信息的向量空间模型,包括:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
通过建立搜索对象的情感评价信息的向量空间模型,能够更加准确的获得搜索对象的信息,从而在用户进行检索时,能够更加准确的进行信息的匹配,实现更加准确的推荐。在搜索对象的评论信息中,存在用户对于该对象的主观情感评价信息,以此来表达用户对该对象的情感态度,例如,根据心理学对情感类别的分类方法可以将情感类别分为“喜、怒、哀、惧”四种,每一情感类别对应一定的情感词库,例如“喜”类别中包括开心、高兴等。
在此,以影视为搜索对象为例,建立搜索对象的情感评价信息的向量空间模型,包括:
从有效词表中通过特征提取算法提取出情感评价词集合,例如,对于影视B,情感评价词为“非常垃圾”,根据前述的预设的情感分类规则,通过查找情感类别对应的情感词库,确定“垃圾”一词的情感类别为“怒”;
进一步,根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值,例如,“非常”对应的情感极性权重值为10,则确定“垃圾”的情感极性值为10;
再一步,根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立情感评价信息的向量空间模型。那么,对于情感评价词“非常垃圾”,在情感评价信息的向量空间模型中表达为“B、怒、垃圾、10”。
较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
在具体实施过程中,以影视为搜索对象为例,其中搜索对象与该动态标签的对应关系,可以通过建立搜索对象与特征词的倒排索引,进而在生成动态标签集合时搜索对象与动态标签之间也存在同样的倒排索引;例如,电影A的特征词包括“小清新”、“80后”、“爱情”等,将这些特征词与电影A建立倒排索引,若“80后”出现在动态标签集合中,则通过匹配到“80后”,能够迅速的映射到电影A。
又如,如果检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”,其中检索信息中,元信息为“时间(2014)、类型(喜剧)、种类(爱情)”;属性项信息为“场景(好)”、情感评价信息为“轻松愉快”,那么首先根据元信息内容检索到2014年播出的爱情喜剧,再根据属性项信息在已搜索到的2014年播出的爱情喜剧中检索到配乐好的影视,进一步根据情感评价信息在配乐好的2014年播出的爱情喜剧中检索到轻松愉快的影视,最后根据匹配度由高到低的顺序将搜索到的影视以列表信息发送给用户设备。通过上述的信息发送过程,当检索信息中包括多个类别的检索关键词时,能够向用户设备发送更加准确的搜索对象。
较佳的,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
此处,依然以检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”为例,其中检索信息中属性项信息为“场景(好)”,“好”对应的情感色彩类别为褒义,在属于场景的褒义的动态标签中对场景的检索关键词进行匹配时,若匹配到“场景(好)”,则确定“场景(好)”为匹配成功的动态标签;若没有匹配到“场景(好)”,但在属于场景的褒义的动态标签中存在“场景宏大”的标签,则将“场景宏大”作为匹配成功的动态标签;进一步,根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
通过确定所述检索关键词中属性项词对应的评论词的情感色彩类别,当在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配时,若匹配不成功,可以将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签,从而对用户的检索做出推荐。
较佳的,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
此处,依然以检索信息为“2014年播出的配乐好,以爱情为主题轻松愉快的喜剧”为例,其中情感评价信息为“轻松愉快”,“轻松愉快”对应的情感类别为喜,在属于喜类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配,若匹配到“轻松愉快”,则将“轻松愉快”作为匹配成功的动态标签;若没有匹配到“轻松愉快”,但在喜的类别的动态标签中存在“特别乐呵”的动态标签,则将“特别乐呵”作为匹配成功的动态标签;进一步,根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
另外,如果检索信息仅为“节奏紧张的影视”或者“恐惧的影视”,在现有技术的影视搜索系统中,并不存在这样的模糊查找,用户需要预测出这种影视对应的类别,再去一一查找。而本发明提供的方案中,“节奏紧张”为属性项信息,“恐惧”为情感评价信息,因此通过针对属性项信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括该“节奏紧张”的影视;通过针对情感评价信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括“恐惧”的影视。
下面将结合附图和具体实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以影视作为搜索对象为例,对本发明实施例提供的技术方案进行说明。
参见图2,本发明实施例提供的另一种信息发送方法,包括:
步骤S201:获取用户设备发送的影视的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
步骤S202:将所述检索关键词与预先建立的用于表征影视的特征的动态标签集合匹配,并利用预设的影视与动态标签的对应关系,生成影视的列表信息,并发送给所述用户设备。
其中,动态标签集合包括影视的元信息类别、属性项信息类别、情感评价信息类别和关联影视信息类别的动态标签。
在步骤S201中,所述检索信息包括文本信息或语音信息,系统通过分词和语音处理,提取所述检索信息的检索关键词。以对文本信息的分词为例,通过句法分析进行句式的识别以及语法分析器识别语法结构进行分词处理,以获取检索关键词并提取。在进行分词时,引入预设的用户词典,该用户词典包括了影视名称、演员名字、导演名字、影视歌曲名称、上映时间、类型、地区等,在对检索信息进行分词时将该词典导入,能够更加快速的识别检索关键词中的元信息,并将其提取。
在步骤S202中,预先建立影视的动态标签集合,包括:
获取影视的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的影视的特征词库;
根据当前所述特征词库,生成影视的动态标签集合。
其中,所述有效词表中包括影视的元信息类别、属性项信息、情感评价信息和/或关联对象信息类别中的至少一类有效词。
下面对获取影视的评论信息进行说明。
在具体实施过程中,获取影视的评论信息包括:
定期检测影视评论信息的更新情况,从而获取评论信息以及评论之间的关联信息,此处,评论之间的关联信息包括针对同一影视的评论信息、针对之前评论追加的评论信息等,从而动态的更新用户对该搜索对象的评价;
进一步,获取影视的评论信息还包括:
按照评论的热度,其中热度参数包括评论的回复数、点击率、被引率的数量等,去掉热度较低的评论,若热度相同,按照评论时间的先后,去掉时间靠前的评论,从而获取搜索对象的评论信息。
提取所述评论信息的有效词表,包括:
将获取的影视的评论信息存储在云端服务器;在获取了影视的评论信息后,对评论信息进行解析,通过过滤无意义词,提取出有效词,并生成有效词表。例如,对于评论信息“电影A的特技很炫”,其中“的”为无意义词,“电影A”、“特技”、“很炫”均为有效词,生成的有效词表如下面的表一所示:
Figure BDA0000482373050000211
表一
下面对生成动态标签集合的过程进行说明。
在此,首先对对预先建立影视的特征词库进行说明。
预先建立影视的特征词库,包括:
获取影视的元信息;
建立影视的属性项信息的向量空间模型;
建立影视的情感评价信息的向量空间模型;
建立影视的关联对象信息集合;
将所述影视的元信息、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成影视的特征词库。
在具体实施过程中,元信息包括时间信息、导演信息、演员信息等,属性项信息包括场景信息、配乐信息等,情感评价信息包括“喜欢”、“经典”、“飙泪”等,关联对象信息包括关联的影视,比如导演相同的影视、类型相同的影视或者影评中提到的对比影视等,其中,元信息一般是相对固定的,而属性项信息、情感评价信息和关联对象信息是根据评论信息的更新不断的变化的。通过预先建立包括影视的元信息、属性项信息、情感评价信息以及关联对象信息的特征词库,保证影视的信息的完整性,从而保证用户搜索时信息匹配的准确性。
在建立影视特征词库的过程中,其中建立影视的属性项信息的向量空间模型,包括:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
其中,在具体实施过程中,生成属性项词集合的包括:
预设属性项标注词表,包括表征影视的一些属性项词,比如“场景、特效、氛围、音效、配乐、配音、画面、魔幻、故事、编剧、情节、场面、制作、化妆、原著、剧情”等;
从评论信息中获取的有效词表中,通过特征提取算法(例如TF-IDF)提取属性项词表;
进一步,将预设的属性项标注词表和提取的属性项词表进行拟合,生成属性项词集合,能够保证那些出现次数少但能表征该影视的特征的属性项信息生成到特征词库中。需要说明的是,该属性项词集合是一个有限集合,因为随着评论信息的不断更新,属性项词的更新将达到饱和,当自动发现的属性词达到一定数量停止增加,就可以把这些词作为整个属性项词集合,如此,方便处理,简化过程。
确定所述属性项词对应的评论词的情感色彩类别,包括:
确定所述属性项词对应的评论词,例如,系统根据前述的属性词集合,定义一定大小的文本窗口,利用词共现的方法,确定属性项词对应的评论词;
进一步,根据预设的情感色彩分类规则,确定所述属性项词对应的评论词的情感色彩类别。例如,将情感色彩类别分为褒义、中性和贬义三种情感色彩类别,确定属性项词对应的评论词的情感色彩类别,如下面表二所示:
表二
再进一步,根据预设的关于情感色彩类别的情感极性权重表,计算所述属性项词对应的评论词的情感色彩类别的情感极性值。其中,预设关于情感色彩类别的情感极性权重表,如下面表三所示:
Figure BDA0000482373050000241
表三
根据上面表二和表三,对于电影A的属性项词“场景非常宏大”,在属性项信息的向量空间模型中将表达为“A、场景、褒义、宏大、10”;若电影A的属性项词为“场景很差”,则在属性项信息的向量空间模型中将表达为“A、场景、贬义、差、-10”。
在建立影视特征词库的过程中,进一步建立影视的情感评价信息的向量空间模型,包括:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及影视,建立情感评价信息的向量空间模型。
通过建立影视的情感评价信息的向量空间模型,能够更加准确的获得影视的信息,从而在用户进行检索时,能够更加准确的进行信息的匹配,实现更加准确的推荐。在影视的评论信息中,存在用户对于该对象的主观情感评价信息,以此来表达用户对该对象的情感态度,例如,根据心理学对情感类别的分类方法可以将情感类别分为“喜、怒、哀、惧”四种,每一情感类别对应一定的情感词库,如下面表四所示:
Figure BDA0000482373050000251
表四
具体的,从有效词表中通过特征提取算法提取出情感评价词集合,例如,对于电影C的情感评价词“非常垃圾”,根据前述的预设的情感分类规则,通过查找情感类别对应的情感词库,确定“垃圾”一词的情感类别为“怒”;
进一步,根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值。其中,预设的关于情感类别的情感极性权重表,如下面表五所示:
Figure BDA0000482373050000252
表五
那么根据上表五,确定“垃圾”的情感极性值为10;
再一步,根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及影视,建立情感评价信息的向量空间模型。那么,对于情感评价词“非常垃圾”,在情感评价信息的向量空间模型中表达为“C、怒、垃圾、10”。
在建立了影视的特征词库之后,建立影视与特征词库的索引对应关系,例如倒排索引,能够通过匹配结果迅速的关联到对应的影视。
通过建立倒排索引,实现用一系列特征词标志某个影视;例如,电影A的特征词包括“小清新”、“80后”、“爱情”等,将这些特征词与电影A建立倒排索引,与电影A均建立对应关系,从而在匹配到“小清新”、“80后”、“爱情”时,能够迅速的映射到电影A;
在建立了影视的特征词库之后,还建立潜在语义索引,处理近义词、反义词等的语义关系,达到降维,减少计算量的效果。例如,电影A的特征词中包括“节奏欢乐”和“节奏愉快”,通过潜在语义索引,将“节奏欢乐”和“节奏愉快”统一映射到一个维度“节奏欢乐”或“节奏愉快”,从而减少计算的维度。
在特征词库建立之后,根据前述的有效词表,更新预先建立的影视的特征词库,包括对属性项信息的更新、情感评价信息的更新以及关联影视信息的更新。
下面对影视的动态标签集合生成过程进行介绍。
根据当前所述特征词库,生成影视的动态标签集合,具体包括:
可以根据影视的特征词的权重大小的不同,将特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词作为影视的动态标签集合;
具体的,针对每一类动态标签,将每一类特征词按照其权重由大到小的顺序排列,取权重较大的一部分特征词生成到影视的动态标签集合中。其中,元信息类别的动态标签一般是固定不变的,而属性项信息、情感评价信息以及关联影视信息是不断更新的,因此针对某一个属性项信息、情感评价信息或关联影视信息,其权重是随着特征词库的更新而改变的,因此需要根据当前的更新后的特征词库,生成动态标签集合。
其中,确定特征词的权重,例如可以采用如下方法:特征词的权重根据特征词出现的频率来确定,如果特征词是情感评价信息特征词,则还需要根据情感评价信息的情感极性值结合出现频率确定;如果特征词是属性项信息特征词,则还需要根据属性项信息的情感极性值结合出现的频率确定。
在具体实施过程中,例如,在前端界面,动态标签生成采用javascript技术,将特征词根据其权重大小的不同,取权重较大的一部分特征词作为影视的动态标签集合,并展现在每个影视所在的区域,权重越大,动态标签面积越大。
下面对步骤S202中的匹配过程进行说明。
当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联影视类别的检索关键词时,将所述检索关键词与预先建立的用于表征影视的特征的动态标签集合匹配,并利用预设的影视与动态标签的对应关系,生成影视的列表信息,包括:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据影视与该动态标签的对应关系,确定对应的第一组影视;
将属性项信息类别的检索关键词与第一组影视中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据影视与该动态标签的对应关系,确定对应的第二组影视;
将情感评价信息类别的检索关键词与第二组影视中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据影视与该动态标签的对应关系,确定对应的第三组影视;
将关联影视类别的检索关键词与第三组影视中的关联影视类别的动态标签进行匹配,确定匹配成功的动态标签,并根据影视与该动态标签的对应关系,确定对应的第四组影视,将该第四组影视生成影视的列表信息。
在具体实施过程中,其中影视与该动态标签的对应关系,前述通过建立影视与特征词的倒排索引,进而在生成动态标签集合时影视与动态标签之间也存在同样的倒排索引;例如,电影A的特征词包括“小清新”、“80后”、“爱情”等,将这些特征词与电影A建立倒排索引,若“80后”出现在动态标签集合中,则通过匹配到“80后”,能够迅速的映射到电影A。
又如,如果检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”,其中检索信息中,元信息为“时间(2014)、类型(喜剧)、种类(爱情)”;属性项信息为“场景(好)”、情感评价信息为“轻松愉快”,那么首先根据元信息内容检索到2014年播出的爱情喜剧,再根据属性项信息在已搜索到的2014年播出的爱情喜剧中检索到配乐好的影视,进一步根据情感评价信息在配乐好的2014年播出的爱情喜剧中检索到轻松愉快的影视,最后根据匹配度由高到低的顺序将搜索到的影视以列表信息发送给用户设备。通过上述的信息发送过程,实现了多个类别交叉的推荐。
其中,所述将属性项信息类别的检索关键词与第一组影视中的属性项信息类别的动态标签进行匹配,包括:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据影视与该匹配成功的动态标签的对应关系,确定对应的第二组影视。
此处,依然以检索信息为“2014年播出的场景好,以爱情为主题轻松愉快的喜剧”为例,其中检索信息中属性项信息为“场景(好)”,“好”对应的情感色彩类别为褒义,在属于场景的褒义的动态标签中对场景的检索关键词进行匹配时,若匹配到“场景(好)”,则确定“场景(好)”为匹配成功的动态标签;若没有匹配到“场景(好)”,但在属于场景的褒义的动态标签中存在“场景宏大”的标签,则将“场景宏大”作为匹配成功的动态标签;进一步,根据影视与该匹配成功的动态标签的对应关系,确定对应的第二组影视。
通过确定所述检索关键词中属性项词对应的评论词的情感色彩类别,当在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配时,若匹配不成功,可以将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签,从而对用户的检索做出推荐。
其中,将情感评价信息类别的检索关键词与第二组影视中的情感评价信息类别的动态标签进行匹配,包括:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据影视与该匹配成功的动态标签的对应关系,确定对应的第三组影视。
在此,依然以检索信息为“2014年播出的配乐好,以爱情为主题轻松愉快的喜剧”为例,其中情感评价信息为“轻松愉快”,“轻松愉快”对应的情感类别为喜,在属于喜类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配,若匹配到“轻松愉快”,则将“轻松愉快”作为匹配成功的动态标签;若没有匹配到“轻松愉快”,但在喜的类别的动态标签中存在“特别乐呵”的动态标签,则将“特别乐呵”作为匹配成功的动态标签;进一步,根据影视与该匹配成功的动态标签的对应关系,确定对应的第三组影视。
另外,如果检索信息仅为“节奏紧张的影视”或者“恐惧的影视”,在现有技术的影视搜索系统中,并不存在这样的模糊查找,用户需要预测出这种影视对应的类别,再去一一查找。而本发明提供的方案中,“节奏紧张”为属性项信息,“恐惧”为情感评价信息,因此通过针对属性项信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括该“节奏紧张”的影视;通过针对情感评价信息类别的检索关键词-动态标签之间的匹配,即可检索到动态标签中包括“恐惧”的影视。
在优选实施例中,将符合搜索条件的影视以列表信息的形式发送给用户设备以展现给用户时,同时将符合搜索条件的影视的其他动态标签一并展现给用户,例如,将与用户检索信息中匹配的特征词对应的动态标签以高亮的形式展现,影视的其他动态标签用不同颜色和大小区分,更加方便用户根据每一影视的具体特征进行选择。
下面对本发明提供的一种信息发送系统进行说明。
如图3所示,本发明实施例提供的一种信息发送系统Z3,包括:
检索信息获取单元Z301,用于获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
匹配单元Z302,用于将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
其中,动态标签集合包括搜索对象的元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的动态标签。
较佳的,所述匹配单元在预先建立搜索对象的动态标签集合时,具体用于:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
较佳的,所述匹配单元在预先建立搜索对象的特征词库时,具体用于:
获取搜索对象的元信息集合;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
较佳的,所述匹配单元在建立搜索对象的属性项信息的向量空间模型时,具体用于:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
较佳的,所述匹配单元在获取搜索对象的属性项词时,具体用于:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
较佳的,所述匹配单元在建立搜索对象的情感评价信息的向量空间模型时,具体用于:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
较佳的,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,所述匹配单元将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息时,具体用于:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
较佳的,所述匹配单元将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配时,具体用于:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
较佳的,所述匹配单元将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配时,具体用于:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
综上所述,本发明提供的一种信息发送方法及系统,通过获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。本发明实施例提供的信息发送方法及系统,在用户对搜索对象进行检索时,能够实现用户与用户之间的交互,并且当检索信息中包括属性项信息类别和/或情感评价信息类别的检索关键词时,能够在预设的动态标签集合中对属性项信息类别和/或情感评价信息类别的检索关键词进行匹配,因此,能够实现向用户设备发送更加准确的搜索对象。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (18)

1.一种信息发送方法,其特征在于,该方法包括:
获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
2.根据权利要求1所述的方法,其特征在于,预先建立搜索对象的动态标签集合,包括:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
3.根据权利要求2所述的方法,其特征在于,预先建立搜索对象的特征词库,包括:
获取搜索对象的元信息集合;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
4.根据权利要求3所述的方法,其特征在于,所述建立搜索对象的属性项信息的向量空间模型,包括:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
5.根据权利要求4所述的方法,其特征在于,所述获取搜索对象的属性项词,包括:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
6.根据权利要求4所述的方法,其特征在于,所述建立搜索对象的情感评价信息的向量空间模型,包括:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
7.根据权利要求6所述的方法,其特征在于,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,包括:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
8.根据权利要求7所述的方法,其特征在于,所述将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,包括:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
9.根据权利要求7所述的方法,其特征在于,将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,包括:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
10.一种信息发送系统,其特征在于,该系统包括:
检索信息获取单元,用于获取用户设备发送的搜索对象的检索信息,提取所述检索信息的检索关键词;所述检索关键词包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别中的至少一类检索关键词;
匹配单元,用于将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息,并发送给所述用户设备。
11.根据权利要求10所述的系统,其特征在于,所述匹配单元在预先建立搜索对象的动态标签集合时,具体用于:
获取搜索对象的评论信息,并提取所述评论信息的有效词表;
根据所述有效词表,更新预先建立的搜索对象的特征词库;
根据搜索对象的当前的特征词库,生成搜索对象的动态标签集合。
12.根据权利要求11所述的系统,其特征在于,所述匹配单元在预先建立搜索对象的特征词库时,具体用于:
获取搜索对象的元信息集合;
建立搜索对象的属性项信息的向量空间模型;
建立搜索对象的情感评价信息的向量空间模型;
建立搜索对象的关联对象信息集合;
将所述搜索对象的元信息集合、属性项信息的向量空间模型、情感评价信息的向量空间模型以及关联对象信息进行归一化处理,生成搜索对象的特征词库。
13.根据权利要求12所述的系统,其特征在于,所述匹配单元在建立搜索对象的属性项信息的向量空间模型时,具体用于:
获取搜索对象的属性项词集合;
确定每一所述属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述评论词的情感色彩类别;
根据预设的关于情感色彩类别的情感极性权重表,计算所述评论词的关于情感色彩类别的情感极性值;
根据所述属性项词、所述属性项词对应的评论词、所述评论词的情感色彩类别和所述评论词的关于情感色彩类别的情感极性值,以及搜索对象,建立搜索对象的属性项信息的向量空间模型。
14.根据权利要求13所述的系统,其特征在于,所述匹配单元在获取搜索对象的属性项词时,具体用于:
从所述有效词表中提取属性项词表;
将所述属性项词表与预设的属性项标注词表拟合,生成属性项词集合。
15.根据权利要求13所述的系统,其特征在于,所述匹配单元在建立搜索对象的情感评价信息的向量空间模型时,具体用于:
从所述有效词表中提取情感评价词集合;
根据预设的情感分类规则,确定每一所述情感评价词的情感类别;
根据预设的关于情感类别的情感极性权重表,计算每一所述情感评价词的情感极性值;
根据所述情感评价词、情感评价词的情感类别和情感评价词的情感极性值,以及搜索对象,建立搜索对象的情感评价信息的向量空间模型。
16.根据权利要求15所述的系统,其特征在于,当所述检索关键词中包括元信息类别、属性项信息类别、情感评价信息类别和关联对象信息类别的检索关键词时,所述匹配单元将所述检索关键词与预先建立的用于表征搜索对象的特征的动态标签集合匹配,并利用预设的搜索对象与动态标签的对应关系,生成搜索对象的列表信息时,具体用于:
将元信息类别的检索关键词与动态标签集合中的元信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第一组搜索对象;
将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第二组搜索对象;
将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第三组搜索对象;
将关联对象信息类别的检索关键词与第三组搜索对象中的关联对象信息类别的动态标签进行匹配,确定匹配成功的动态标签,并根据搜索对象与该动态标签的对应关系,确定对应的第四组搜索对象,将该第四组搜索对象生成搜索对象的列表信息。
17.根据权利要求16所述的系统,其特征在于,所述匹配单元将属性项信息类别的检索关键词与第一组搜索对象中的属性项信息类别的动态标签进行匹配时,具体用于:
确定所述属性项信息类别的检索关键词中的属性项词对应的评论词;
根据预设的情感色彩分类规则,确定所述检索关键词中属性项词对应的评论词的情感色彩类别;
根据所述检索关键词中属性项词对应的评论词的情感色彩类别,在属于该属性项信息类别的具有相同情感色彩类别的动态标签中对所述属性项信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该属性项信息类别的具有相同情感色彩类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第二组搜索对象。
18.根据权利要求16所述的系统,其特征在于,所述匹配单元将情感评价信息类别的检索关键词与第二组搜索对象中的情感评价信息类别的动态标签进行匹配时,具体用于:
根据预设的情感分类规则,确定所述情感评价信息类别的检索关键词中情感评价词的情感类别;
根据所述检索关键词中情感评价词的情感类别,在属于该情感评价信息类别的具有相同情感类别的动态标签中对所述情感评价信息类别的检索关键词进行匹配;
若匹配成功,确定匹配成功的动态标签;若匹配不成功,则将属于该情感评价信息类别的具有相同情感类别的动态标签作为匹配成功的动态标签;
根据搜索对象与该匹配成功的动态标签的对应关系,确定对应的第三组搜索对象。
CN201410116639.6A 2014-03-26 2014-03-26 一种信息发送方法及系统 Pending CN103886081A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410116639.6A CN103886081A (zh) 2014-03-26 2014-03-26 一种信息发送方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410116639.6A CN103886081A (zh) 2014-03-26 2014-03-26 一种信息发送方法及系统

Publications (1)

Publication Number Publication Date
CN103886081A true CN103886081A (zh) 2014-06-25

Family

ID=50954973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410116639.6A Pending CN103886081A (zh) 2014-03-26 2014-03-26 一种信息发送方法及系统

Country Status (1)

Country Link
CN (1) CN103886081A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391859A (zh) * 2014-10-22 2015-03-04 百度在线网络技术(北京)有限公司 一种向用户提供对象信息的方法和装置
CN105740223A (zh) * 2014-12-08 2016-07-06 联想(北京)有限公司 信息处理设备和信息处理方法
CN106101748A (zh) * 2016-07-20 2016-11-09 东软集团股份有限公司 节目处理方法和装置
CN106682929A (zh) * 2015-11-10 2017-05-17 北京国双科技有限公司 信息分析方法和装置
CN106909635A (zh) * 2017-02-09 2017-06-30 苏州亮磊知识产权运营有限公司 基于多媒体数字影像评论的数据挖掘与处理方法及系统
CN107239452A (zh) * 2016-03-28 2017-10-10 腾讯科技(深圳)有限公司 一种策略调整的方法及装置
CN107577755A (zh) * 2017-08-31 2018-01-12 江西博瑞彤芸科技有限公司 一种搜索方法
CN107871254A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 提供数据对象信息的方法及装置
CN108241646A (zh) * 2016-12-23 2018-07-03 阿里巴巴集团控股有限公司 一种搜索匹配方法和装置、推荐方法和装置
CN108337569A (zh) * 2018-04-03 2018-07-27 优视科技有限公司 一种基于视频的互动讨论方法、装置和终端设备
CN108763278A (zh) * 2018-04-11 2018-11-06 口碑(上海)信息技术有限公司 用户特征标签的统计方法以及装置
CN108984675A (zh) * 2018-07-02 2018-12-11 北京百度网讯科技有限公司 基于评价的数据查询方法和装置
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN109213920A (zh) * 2017-06-29 2019-01-15 阿里巴巴集团控股有限公司 搜索方法、客户端、服务器和存储介质
CN109547840A (zh) * 2018-12-03 2019-03-29 深圳创维数字技术有限公司 影视作品搜索引导方法、电视及计算机可读存储介质
CN110503332A (zh) * 2019-08-21 2019-11-26 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法
CN110929035A (zh) * 2019-11-27 2020-03-27 中国传媒大学 影视作品的信息预测方法及系统
CN112132628A (zh) * 2020-09-28 2020-12-25 科大讯飞股份有限公司 一种用户意图预测方法、信息推荐方法及相关设备
CN112232903A (zh) * 2020-09-27 2021-01-15 北京五八信息技术有限公司 一种业务对象的展示方法和装置
CN112800233A (zh) * 2021-04-13 2021-05-14 成都数联铭品科技有限公司 一种文本立场检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110288956A1 (en) * 2010-05-18 2011-11-24 Alibaba Group Holding Limited Using model information groups in searching
US20130166548A1 (en) * 2006-01-12 2013-06-27 Recommind, Inc. System and Method for Providing Information Navigation and Filtration
CN103577534A (zh) * 2013-08-30 2014-02-12 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130166548A1 (en) * 2006-01-12 2013-06-27 Recommind, Inc. System and Method for Providing Information Navigation and Filtration
US20110288956A1 (en) * 2010-05-18 2011-11-24 Alibaba Group Holding Limited Using model information groups in searching
CN102253936B (zh) * 2010-05-18 2013-07-24 阿里巴巴集团控股有限公司 记录用户访问商品信息的方法及搜索方法和服务器
CN103577534A (zh) * 2013-08-30 2014-02-12 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG ZIQIONG 等: "Sentiment Classification for Chinese Product Reviews Using an Usupervised Internet-based Method", 《2008 INTERNATIONAL CONFERENCE ON MANAGEMENT SCIENCE AND ENGINEERING 15TH ANNUAL CONFERENCE PROCEEDINGS》 *
阳锋: "基于主题模型的情感搜索引擎的研究与实现", 《中国优秀硕士学位论文全文数据库•信息科技辑》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391859B (zh) * 2014-10-22 2019-03-26 百度在线网络技术(北京)有限公司 一种向用户提供对象信息的方法和装置
CN104391859A (zh) * 2014-10-22 2015-03-04 百度在线网络技术(北京)有限公司 一种向用户提供对象信息的方法和装置
CN105740223A (zh) * 2014-12-08 2016-07-06 联想(北京)有限公司 信息处理设备和信息处理方法
CN105740223B (zh) * 2014-12-08 2019-04-26 联想(北京)有限公司 信息处理设备和信息处理方法
CN106682929A (zh) * 2015-11-10 2017-05-17 北京国双科技有限公司 信息分析方法和装置
CN106682929B (zh) * 2015-11-10 2021-01-22 北京国双科技有限公司 信息分析方法和装置
CN107239452B (zh) * 2016-03-28 2021-07-27 腾讯科技(深圳)有限公司 一种策略调整的方法及装置
CN107239452A (zh) * 2016-03-28 2017-10-10 腾讯科技(深圳)有限公司 一种策略调整的方法及装置
CN106101748A (zh) * 2016-07-20 2016-11-09 东软集团股份有限公司 节目处理方法和装置
CN106101748B (zh) * 2016-07-20 2020-04-28 东软集团股份有限公司 节目处理方法和装置
CN107871254A (zh) * 2016-09-23 2018-04-03 阿里巴巴集团控股有限公司 提供数据对象信息的方法及装置
CN108241646A (zh) * 2016-12-23 2018-07-03 阿里巴巴集团控股有限公司 一种搜索匹配方法和装置、推荐方法和装置
CN108241646B (zh) * 2016-12-23 2021-12-17 阿里巴巴集团控股有限公司 一种搜索匹配方法和装置、推荐方法和装置
CN106909635A (zh) * 2017-02-09 2017-06-30 苏州亮磊知识产权运营有限公司 基于多媒体数字影像评论的数据挖掘与处理方法及系统
CN106909635B (zh) * 2017-02-09 2020-05-19 深圳市瑞迪兴智能科技有限公司 基于多媒体数字影像评论的数据挖掘与处理方法及系统
CN109213920A (zh) * 2017-06-29 2019-01-15 阿里巴巴集团控股有限公司 搜索方法、客户端、服务器和存储介质
CN107577755A (zh) * 2017-08-31 2018-01-12 江西博瑞彤芸科技有限公司 一种搜索方法
CN107577755B (zh) * 2017-08-31 2020-06-19 江西博瑞彤芸科技有限公司 一种搜索方法
CN108337569A (zh) * 2018-04-03 2018-07-27 优视科技有限公司 一种基于视频的互动讨论方法、装置和终端设备
CN108763278A (zh) * 2018-04-11 2018-11-06 口碑(上海)信息技术有限公司 用户特征标签的统计方法以及装置
CN108763278B (zh) * 2018-04-11 2021-01-01 口碑(上海)信息技术有限公司 用户特征标签的统计方法以及装置
US11176142B2 (en) 2018-07-02 2021-11-16 Beijing Baidu Netcom Science Technology Co., Ltd. Method of data query based on evaluation and device
CN108984675A (zh) * 2018-07-02 2018-12-11 北京百度网讯科技有限公司 基于评价的数据查询方法和装置
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN109547840A (zh) * 2018-12-03 2019-03-29 深圳创维数字技术有限公司 影视作品搜索引导方法、电视及计算机可读存储介质
CN110503332A (zh) * 2019-08-21 2019-11-26 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法
CN110503332B (zh) * 2019-08-21 2022-12-30 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法
CN110929035A (zh) * 2019-11-27 2020-03-27 中国传媒大学 影视作品的信息预测方法及系统
CN110929035B (zh) * 2019-11-27 2022-09-30 中国传媒大学 影视作品的信息预测方法及系统
CN112232903A (zh) * 2020-09-27 2021-01-15 北京五八信息技术有限公司 一种业务对象的展示方法和装置
CN112232903B (zh) * 2020-09-27 2022-01-11 北京五八信息技术有限公司 一种业务对象的展示方法和装置
CN112132628A (zh) * 2020-09-28 2020-12-25 科大讯飞股份有限公司 一种用户意图预测方法、信息推荐方法及相关设备
CN112132628B (zh) * 2020-09-28 2024-07-09 中国科学技术大学 一种用户意图预测方法、信息推荐方法及相关设备
CN112800233B (zh) * 2021-04-13 2021-06-18 成都数联铭品科技有限公司 一种文本立场检测方法
CN112800233A (zh) * 2021-04-13 2021-05-14 成都数联铭品科技有限公司 一种文本立场检测方法

Similar Documents

Publication Publication Date Title
CN103886081A (zh) 一种信息发送方法及系统
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
US10565313B2 (en) Automatic semantic rating and abstraction of literature
Chehal et al. Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations
US9135255B2 (en) System and method for making gift recommendations using social media data
CN108595660A (zh) 多媒体资源的标签信息生成方法、装置、存储介质及设备
CN101346718A (zh) 用于向用户提供选定内容项的方法
KR20190108838A (ko) 미술 작품 추천 큐레이션 방법 및 시스템
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
TW201905736A (zh) 資訊推送方法及系統
Bringay et al. Towards an on-line analysis of tweets processing
US20140089132A1 (en) System and method for making gift recommendations using social media data
CN101482884A (zh) 一种基于用户偏好评分分布的协作推荐系统
Chiny et al. Netflix recommendation system based on TF-IDF and cosine similarity algorithms
Luo et al. Sentiment analysis
Chen et al. Personalized recommendation model: an online comment sentiment based analysis
CN112749272A (zh) 面向非结构化数据的新能源规划性文本智能推荐方法
CN115374781A (zh) 文本数据信息挖掘方法、装置、设备
Qu et al. A novel approach based on multi-view content analysis and semi-supervised enrichment for movie recommendation
KR101074820B1 (ko) 인터넷을 활용한 추천 검색 시스템 및 그 방법
JP5367872B2 (ja) 選択されたコンテンツアイテムをユーザーに提供する方法
CN118250516A (zh) 一种针对用户的分级处理方法
CN112989053A (zh) 一种期刊推荐方法及装置
Kim et al. Product recommendation system based user purchase criteria and product reviews
Liu et al. Research on demand forecasting method of multi-user group based on big data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140625