CN112765459A - 一种基于话题识别的物品信息推送方法、系统及存储介质 - Google Patents

一种基于话题识别的物品信息推送方法、系统及存储介质 Download PDF

Info

Publication number
CN112765459A
CN112765459A CN202110023421.6A CN202110023421A CN112765459A CN 112765459 A CN112765459 A CN 112765459A CN 202110023421 A CN202110023421 A CN 202110023421A CN 112765459 A CN112765459 A CN 112765459A
Authority
CN
China
Prior art keywords
topic
similarity
user
new
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110023421.6A
Other languages
English (en)
Inventor
张凯
周建设
王伟丽
刘杰
冀俊宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Normal University
Original Assignee
Capital Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Normal University filed Critical Capital Normal University
Priority to CN202110023421.6A priority Critical patent/CN112765459A/zh
Publication of CN112765459A publication Critical patent/CN112765459A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请的技术方案采用话题识别算法获取新的网络话题集合New,并且将其与用户的个人习惯进行比对,如果该话题是用户感兴趣的内容,则将新话题相关的购物信息推送给用户,这样,用户就可以获得与时下热门话题相关且用户也关心该话题的购物信息,极大的提高了用户的购物体验度。

Description

一种基于话题识别的物品信息推送方法、系统及存储介质
技术领域
本申请涉及购物推送技术领域,具体而言,涉及一种基于话题识别的物品信息推送方法、系统及存储介质。
背景技术
随着当今电子商务迅猛发展,用户购买商品时选择的渠道越来越多,网络购物在现今人们的生活中占有越来越大分量,几乎涵盖了所有人群。然而,传统的网络购物通常是用户根据自身的需求输入相关的搜索信息进行搜索,这种方式难以满足用户的使用需求;现在也有一些购物网站可以基于用户的购买习惯来针对性的进行购物信息的推送,然而,这种推送方式会局限于用户的使用习惯,久之会导致用户只能收到特定领域的购物信息,推送内容丰富程度上难以满足用户的使用需求。
如何能够实现既自动向用户推送购物信息,又可以保障推送消息不陷入特定领域即保证其丰富度,是目前亟需解决的技术问题。
发明内容
针对上述技术问题,本申请提供了一种基于话题识别的物品信息推送方法、系统及存储介质。
本申请的第一方面提供了一种基于话题识别的物品信息推送方法,所述方法包括:
S1,基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
S2,基于话题识别算法获取新的网络话题集合New;
S3,逐一计算所述集合U与所述集合New中的各话题的相似度;
S4,若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
优选地,所述步骤S2具体包括如下步骤:
S21,实时采集不同类别的网络文档;
S22,先对每篇所述网络文档进行预料分词,然后保留有实际意义的分词,筛除停用词和单个字,所述有实际意义的分词包括名词、动词、形容词;然后,再从保留的分词中选择特征词构建话题模型,并计算特征词权重,其中,所述特征词包括关键词元和普通特征词;
S23,基于步骤S22获得的数据计算文档S与历史话题的相似度,如果该文档与历史话题相似度小于预设值,则使用文档S建立一个新话题,直至完成所有网络文档的相似度计算,构建出新的网络话题集合New。
优选地,所述步骤S22中采用向量空间模型来构建话题模型:
V(d)=(t1,w1(d);…;ti,wi(d);…;tn,wn(d)
其中,ti是从文档d中选出的特征项,wi(d)为ti在文档d中的权重。
优选地,所述步骤S2中计算特征词权重,包括:
首先根据人工设立的网络热词库筛选出关键词元,对于关键词元按如下公式计算权重:
Wi(keyword)=Wi(d)+Wi(d)/3
其中,
Figure BDA0002889514110000021
式中Len(T)为文章长度,Wi为关键词第i次在文本中出现的位置;
其余特征词的权重采用如下经典的tf-idf权重计算公式:
Figure BDA0002889514110000022
其中,tfi表示关键词ti在文档d中出现的频率;N表示用于特征提取的全部训练文本的文档总数;nti表示出现关键词ti的文档数。
优选地,所述步骤S23中相似度的计算公式为:
Figure BDA0002889514110000023
其中,ωi(d)和ωi(T)分别是文档d和话题T中特征项ti的权重。
优选地,所述步骤S3中采用欧式距离、余弦相似度、Jaccard相似度算法计算话题间的所述相似度。
优选地,所述步骤S4还包括:若所述集合New中存在多个相似度大于阈值的话题,则基于所述多个相似度计算各话题之间的推送比重,并基于所述推送比重确定所述推送购物信息的显示顺序和/或位置。
本申请的第二方面提供了一种基于话题识别的物品信息推送系统,所述系统包括用户画像单元、网络话题识别单元、比对单元、购物信息推送单元;
用户画像单元,用于基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
网络话题识别单元,用于基于话题识别算法获取新的网络话题集合New;
比对单元,用于逐一计算所述集合U与所述集合New中的各话题的相似度;
购物信息推送单元,用于若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
本申请的第三方面提供了一种基于话题识别的物品信息推送设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如前述所述的基于话题识别的物品信息推送方法。
本申请的第四方面提供了一种存储介质,其特征在于,所述存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如前述所述的基于话题识别的物品信息推送方法。
本发明的有益效果在于:
本申请的技术方案采用话题识别算法获取新的网络话题集合New,并且将其与用户的个人习惯进行比对,如果该话题是用户感兴趣的内容,则将新话题相关的购物信息推送给用户,这样,用户就可以获得与时下热门话题相关且用户也关心该话题的购物信息,极大的提高了用户的购物体验度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请实施例公开的一种基于话题识别的物品信息推送方法的流程示意图;
图2是本申请实施例公开的一种基于话题识别的物品信息推送系统的结构示意图;
图3是本申请实施例公开的一种基于话题识别的物品信息推送设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
实施例一
请参阅图1,图1是本申请实施例公开的一种基于关键词元的话题检测方法的流程示意图。如图1所示,本申请实施例的一种基于话题识别的物品信息推送方法,所述方法包括:
S1,基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
S2,基于话题识别算法获取新的网络话题集合New;
S3,逐一计算所述集合U与所述集合New中的各话题的相似度;
S4,若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
本实施例中,首先基于用户的注册信息(例如,性别、年龄、职业等)及使用习惯(例如,购物习惯、搜索习惯、APP使用习惯等等)对用户个人进行针对性的画像,从而获得用户关注的话题类型;然后再采用话题识别算法获取最新的网络话题集合;如果新话题符合用户的画像,即属于用户感兴趣的内容,则将新话题相关的购物信息推送给用户,这样,用户就可以自动且便捷地获得与时下热门话题相关且用户也关心该话题的购物信息,极大的提高了用户的购物体验度。
可选地,所述步骤S2具体包括如下步骤:
S21,实时采集不同类别的网络文档;
S22,先对每篇所述网络文档进行预料分词,然后保留有实际意义的分词,筛除停用词和单个字,所述有实际意义的分词包括名词、动词、形容词;然后,再从保留的分词中选择特征词构建话题模型,并计算特征词权重,其中,所述特征词包括关键词元和普通特征词;
S23,基于步骤S22获得的数据计算文档S与历史话题的相似度,如果该文档与历史话题相似度小于预设值,则使用文档S建立一个新话题,直至完成所有网络文档的相似度计算,构建出新的网络话题集合New。
本实施例中,本申请采用的话题检测算法综合基于了关键词元数量及其优先级,从而解决了话题误判的问题,提高了话题检测的准确度。
可选地,所述步骤S22中采用向量空间模型来构建话题模型:
V(d)=(t1,w1(d);…;ti,wi(d);…;tn,wn(d)
其中,ti是从文档d中选出的特征项,wi(d)为ti在文档d中的权重。
可选地,所述步骤S2中计算特征词权重,包括:
首先根据人工设立的网络热词库筛选出关键词元,对于关键词元按如下公式计算权重:
Wi(keyword)=Wi(d)+Wi(d)/3
其中,
Figure BDA0002889514110000061
式中Len(T)为文章长度,Wi为关键词第i次在文本中出现的位置;
其余特征词的权重采用如下经典的tf-idf权重计算公式:
Figure BDA0002889514110000062
其中,tfi表示关键词ti在文档d中出现的频率;N表示用于特征提取的全部训练文本的文档总数;nti表示出现关键词ti的文档数。
在本实施例中,考虑到对关键词元计算权重时只采用Wi(k)公式会忽略词频对权重值的影响,对关键词元计算tf-idf权重值与Wi(k)公式权重值相加;由于Wi(k)值容易过高,为了更好的平衡权重,应予以消减,关键词元特征词最终权重Wi(keyword)=Wi(d)+Wi(d)/3。
可选地,所述步骤S23中相似度的计算公式为:
Figure BDA0002889514110000071
其中,ωi(d)和ωi(T)分别是文档d和话题T中特征项ti的权重。
在本实施例中,本文采用向量空间模型来表示报道,向量空间模型被广泛用于话题检测中的文本表示,其在转化文本为向量表示的时候有着很强的优势,这大大方便了文本之间的相互计算。但是向量空间模型由于存在特征词之间相互独立的假设,使得文本特征向量经常忽略语义之间的关联。于是,本申请又采用cosine公式来计算话题相似度,即求两个范化矢量之间的夹角余弦,由于本身已进行了归一化,所以cosine相似度不依赖特定的特征加权方法。
可选地,所述步骤S3中采用欧式距离、余弦相似度、Jaccard相似度算法计算话题间的所述相似度。
在本实施例中,本领域技术人员可自由确定合适相似度计算方法来求取步骤S3中的相似度,例如,包括但不限于欧式距离法、余弦相似度、Jaccard相似度算法、曼哈顿距离法、皮尔逊相关系数法等等,本申请对此不做限定。
可选地,所述步骤S4还包括:若所述集合New中存在多个相似度大于阈值的话题,则基于所述多个相似度计算各话题之间的推送比重,并基于所述推送比重确定所述推送购物信息的显示顺序和/或位置。
本实施例中,当存在多个相似度满足阈值的话题时,本申请可以基于相似度值来确定各个话题相关的购物推送消息的显示顺序和/或位置,例如,相似度最高的购物推送消息显示于置顶位置,后续依次显示相似度值低的购物消息。
实施例二
请参阅图2,图2是本申请实施例公开的一种基于话题识别的物品信息推送系统的结构示意图。如图2所示,本申请实施例的一种基于话题识别的物品信息推送系统,所述系统包括用户画像单元、网络话题识别单元、比对单元、购物信息推送单元;
用户画像单元,用于基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
网络话题识别单元,用于基于话题识别算法获取新的网络话题集合New;
比对单元,用于逐一计算所述集合U与所述集合New中的各话题的相似度;
购物信息推送单元,用于若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
实施例三
请参阅图3,图3是本申请实施例公开的一种基于话题识别的物品信息推送设备的结构示意图。如图3所示,本申请实施例的一种基于话题识别的物品信息推送设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如前述所述的基于话题识别的物品信息推送方法。
实施例四
本申请实施例提供一种存储介质,其特征在于,所述存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如前述所述的基于话题识别的物品信息推送方法。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于话题识别的物品信息推送方法,其特征在于:所述方法包括:
S1,基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
S2,基于话题识别算法获取新的网络话题集合New;
S3,逐一计算所述集合U与所述集合New中的各话题的相似度;
S4,若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
2.根据权利要求1所述的方法,其特征在于:所述步骤S2具体包括如下步骤:
S21,实时采集不同类别的网络文档;
S22,先对每篇所述网络文档进行预料分词,然后保留有实际意义的分词,筛除停用词和单个字,所述有实际意义的分词包括名词、动词、形容词;然后,再从保留的分词中选择特征词构建话题模型,并计算特征词权重,其中,所述特征词包括关键词元和普通特征词;
S23,基于步骤S22获得的数据计算文档S与历史话题的相似度,如果该文档与历史话题相似度小于预设值,则使用文档S建立一个新话题,直至完成所有网络文档的相似度计算,构建出新的网络话题集合New。
3.根据权利要求2所述的方法,其特征在于:所述步骤S22中采用向量空间模型来构建话题模型:
V(d)=(t1,w1(d);…;ti,wi(d);…;tn,wn(d)
其中,ti是从文档d中选出的特征项,wi(d)为ti在文档d中的权重。
4.根据权利要求3所述的方法,其特征在于:所述步骤S22中计算特征词权重,包括:
首先根据人工设立的网络热词库筛选出关键词元,对于关键词元按如下公式计算权重:
Wi(keyword)=Wi(d)+Wi(d)/3
其中,
Figure FDA0002889514100000021
式中Len(T)为文章长度,Wi为关键词第i次在文本中出现的位置;
其余特征词的权重采用如下经典的tf-idf权重计算公式:
Figure FDA0002889514100000022
其中,tfi表示关键词ti在文档d中出现的频率;N表示用于特征提取的全部训练文本的文档总数;nti表示出现关键词ti的文档数。
5.根据权利要求4所述的方法,其特征在于:所述步骤S23中相似度的计算公式为:
Figure FDA0002889514100000023
其中,ωi(d)和ωi(T)分别是文档d和话题T中特征项ti的权重。
6.根据权利要求1所述的方法,其特征在于:所述步骤S3中采用欧式距离、余弦相似度、Jaccard相似度算法计算话题间的所述相似度。
7.根据权利要求1所述的方法,其特征在于:所述步骤S4还包括:若所述集合New中存在多个相似度大于阈值的话题,则基于所述多个相似度计算各话题之间的推送比重,并基于所述推送比重确定所述推送购物信息的显示顺序和/或位置。
8.一种基于话题识别的物品信息推送系统,其特征在于:所述系统包括用户画像单元、网络话题识别单元、比对单元、购物信息推送单元;
用户画像单元,用于基于用户的注册信息及使用习惯给用户画像,确定出用户关注的话题集合U;
网络话题识别单元,用于基于话题识别算法获取新的网络话题集合New;
比对单元,用于逐一计算所述集合U与所述集合New中的各话题的相似度;
购物信息推送单元,用于若所述集合New中的话题与所述集合U中的任一话题相似度大于阈值,则向用户推送与所述集合New中的所述话题对应的购物信息。
9.一种基于话题识别的物品信息推送设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7所述的基于话题识别的物品信息推送方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7所述的基于话题识别的物品信息推送方法。
CN202110023421.6A 2021-01-08 2021-01-08 一种基于话题识别的物品信息推送方法、系统及存储介质 Pending CN112765459A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110023421.6A CN112765459A (zh) 2021-01-08 2021-01-08 一种基于话题识别的物品信息推送方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110023421.6A CN112765459A (zh) 2021-01-08 2021-01-08 一种基于话题识别的物品信息推送方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN112765459A true CN112765459A (zh) 2021-05-07

Family

ID=75701003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110023421.6A Pending CN112765459A (zh) 2021-01-08 2021-01-08 一种基于话题识别的物品信息推送方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112765459A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617289A (zh) * 2013-12-12 2014-03-05 北京交通大学长三角研究院 基于用户特征及网络关系的微博推荐方法
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
US20170185601A1 (en) * 2015-12-29 2017-06-29 Facebook, Inc. Identifying Content for Users on Online Social Networks
CN106970923A (zh) * 2016-01-14 2017-07-21 北京国双科技有限公司 话题检测的方法和装置
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN110765285A (zh) * 2019-10-23 2020-02-07 深圳报业集团 基于视觉特征的多媒体信息内容管控方法及系统
CN110929172A (zh) * 2019-11-27 2020-03-27 中科曙光国际信息产业有限公司 信息选择方法、装置、电子设备及可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617289A (zh) * 2013-12-12 2014-03-05 北京交通大学长三角研究院 基于用户特征及网络关系的微博推荐方法
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
US20170185601A1 (en) * 2015-12-29 2017-06-29 Facebook, Inc. Identifying Content for Users on Online Social Networks
CN106970923A (zh) * 2016-01-14 2017-07-21 北京国双科技有限公司 话题检测的方法和装置
CN109492157A (zh) * 2018-10-24 2019-03-19 华侨大学 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN110765285A (zh) * 2019-10-23 2020-02-07 深圳报业集团 基于视觉特征的多媒体信息内容管控方法及系统
CN110929172A (zh) * 2019-11-27 2020-03-27 中科曙光国际信息产业有限公司 信息选择方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
Li et al. A bibliometric analysis of topic modelling studies (2000–2017)
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
US9785888B2 (en) Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information
US20200175047A1 (en) System for determining and optimizing for relevance in match-making systems
US9146915B2 (en) Method, apparatus, and computer storage medium for automatically adding tags to document
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN110019794B (zh) 文本资源的分类方法、装置、存储介质及电子装置
US20080319973A1 (en) Recommending content using discriminatively trained document similarity
JP6381775B2 (ja) 情報処理システム及び情報処理方法
CN108846097B (zh) 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
JP6097126B2 (ja) レコメンド情報生成装置及びレコメンド情報生成方法
CN108090178B (zh) 一种文本数据分析方法、装置、服务器和存储介质
CN110717038B (zh) 对象分类方法及装置
US20150379610A1 (en) Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program
CN107247728B (zh) 文本处理方法、装置及计算机存储介质
US20170323218A1 (en) Method and apparatus for estimating multi-ranking using pairwise comparison data
Angadi et al. Multimodal sentiment analysis using reliefF feature selection and random forest classifier
Vandic et al. A Framework for Product Description Classification in E-commerce.
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
JP6521931B2 (ja) モデル生成装置、クリックログ正解尤度算出装置、文書検索装置、方法、及びプログラム
CN112765459A (zh) 一种基于话题识别的物品信息推送方法、系统及存储介质
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム
JP6970527B2 (ja) コンテンツ選択方法及びコンテンツ選択プログラム
Wang English news text recommendation method based on hypergraph random walk label expansion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210507