CN107992531A - 基于深度学习的新闻个性化智能推荐方法与系统 - Google Patents

基于深度学习的新闻个性化智能推荐方法与系统 Download PDF

Info

Publication number
CN107992531A
CN107992531A CN201711168188.0A CN201711168188A CN107992531A CN 107992531 A CN107992531 A CN 107992531A CN 201711168188 A CN201711168188 A CN 201711168188A CN 107992531 A CN107992531 A CN 107992531A
Authority
CN
China
Prior art keywords
news
user
type
deep learning
personalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711168188.0A
Other languages
English (en)
Other versions
CN107992531B (zh
Inventor
余承乐
洪晶
陈宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin Information Consultancy (shenzhen) Co Ltd
Original Assignee
Jilin Information Consultancy (shenzhen) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Information Consultancy (shenzhen) Co Ltd filed Critical Jilin Information Consultancy (shenzhen) Co Ltd
Priority to CN201711168188.0A priority Critical patent/CN107992531B/zh
Publication of CN107992531A publication Critical patent/CN107992531A/zh
Application granted granted Critical
Publication of CN107992531B publication Critical patent/CN107992531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于深度学习的新闻个性化智能推荐方法与系统,方法包括:获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签;按照用户实时兴趣爱好标签向用户推荐主题与兴趣爱好标签相对应的新闻;获取用户阅读情况;根据用户阅读情况对用户实时兴趣标签进行修正,并进行下一次新闻推荐,从而能够根据用户实时兴趣爱好标签进行新闻推荐,使新用户也能较好的获取到感兴趣的新闻,同时能够根据用户的阅读情况及时对用户实时兴趣标签进行修正,在保证标签精确地同时,丰富了标签的种类,从而能够避免被推荐的新闻主题越来越少,兼顾推荐系统的收敛和发散,提升用户体验度。

Description

基于深度学习的新闻个性化智能推荐方法与系统
技术领域
本发明涉及互联网新闻推送,具体涉及一种基于深度学习的新闻个性化智能推荐方法、一种计算机可读存储介质、一种基于深度学习的新闻个性化智能推荐系统以及一种基于深度学习的新闻个性化智能推荐装置。
背景技术
随着互联网的飞速发展,各种新闻每天都在以亿万级的数量递增,导致用户很难及时浏览到自己感兴趣的新闻,给用户带来了不好的体验,为了解决该问题,通常通过个性化新闻推荐系统将用户感兴趣的新闻及时推荐给他们。
但是,相关技术中当用户历史行为缺失、片面或对历史行为数据的不合理应用时会导致错误推荐,给用户带来不好的体验。例如,当遇到新用户和没有采集到历史行为数据的用户时,通常随机的推荐新闻;又如,当只采集到用户部分感兴趣的新闻时,通常会导致只给该用户推荐单一类型的新闻。
因此,相关技术需要改进。
发明内容
本申请提供一种基于深度学习的新闻个性化智能推荐方法,能够根据用户实时的兴趣爱好进行新闻推荐。
根据第一方面,一种实施例中提供一种基于深度学习的新闻个性化智能推荐方法,获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签;按照所述用户实时兴趣爱好标签向用户推荐主题与所述兴趣爱好标签相对应的新闻;获取用户阅读情况;根据所述用户阅读情况对所述用户实时兴趣标签进行修正,并进行再一次新闻推荐。
可选地,所述用户阅读情况可包括用户阅读的正反馈与负反馈。
可选地,基于深度学习的新闻个性化智能推荐方法可还包括:获取新闻内容,并对所述新闻内容进行文本分词以生成新闻词序列;根据LDA模型和所述新闻词序列提取所述新闻内容的主题词,以形成待计算的新闻;获取新闻类型分类器;对所述待计算的新闻与所述新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取所述新闻内容所属的主题类型。
可选地,获取新闻类型分类器的方法可包括:获取新闻类型正样本;将所述新闻类型正样本进行文本分词,并提取所述新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器。
根据第二方面,一种实施例中提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现所述的方法。
根据第三方面,一种实施例中提供一种基于深度学习的新闻个性化智能推荐系统,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现所述的方法。
根据第四方面,一种基于深度学习的新闻个性化智能推荐装置,包括:用于获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签的装置;用于按照所述用户实时兴趣爱好标签向用户推荐与所述兴趣爱好标签相对应的主题的新闻的装置;用于获取用户阅读情况,并将所述用户阅读情况进行反馈的装置;用于根据所述用户阅读情况对所述用户实时兴趣标签进行修正,并进行再一次新闻推荐的装置。
可选地,所述用户阅读情况可包括用户阅读的正反馈与负反馈。
可选地,基于深度学习的新闻个性化智能推荐装置可还包括:用于获取新闻内容,并对所述新闻内容进行文本分词以生成新闻词序列的装置;用于根据 LDA模型和所述新闻词序列提取所述新闻内容的主题词,以形成待计算的新闻的装置;用于获取新闻类型分类器的装置;用于对所述待计算的新闻与所述新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取所述新闻内容所属的主题类型的装置。
可选地,获取新闻类型分类器可包括:用于获取新闻类型正样本的装置;用于将所述新闻类型正样本进行文本分词,并提取所述新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器的装置。
依据上述实施例的基于深度学习的新闻个性化智能推荐方法及装置,能够根据用户实时兴趣爱好标签进行新闻推荐,从而使新用户也能较好的获取到感兴趣的新闻,同时能够根据用户的阅读情况及时对用户实时兴趣标签进行修正,进而能够避免被推荐的新闻类型越来越少,提升用户的体验。
附图说明
图1为根据本发明实施例的基于深度学习的新闻个性化智能推荐方法的流程图;
图2为根据本发明一个实施例的基于深度学习的新闻个性化智能推荐方法的新闻内容的示意图;
图3为根据本发明一个实施例的基于深度学习的新闻个性化智能推荐方法的新闻内容文本分词后生成新闻词序列的示意图;
图4为根据本发明一个实施例的基于深度学习的新闻个性化智能推荐方法的LDA模型结构示意图;
图5为根据本发明一个实施例的基于深度学习的新闻个性化智能推荐方法获取得到的待计算的新闻的示意图;以及
图6为根据本发明一个实施例的基于深度学习的新闻个性化智能推荐方法的计算两个文档相似度的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
数据挖掘是当前计算机研究的热门领域,随着互联网的飞速发展,各种网络信息不断剧增,智能推荐技术应运而生。衡量一个推荐系统的优劣,关键在于推荐的准确性,核心问题是如何准确获取用户的个性喜好和解析被推荐内容的主题特征。在没有用户的大量历史行为数据,不知道用户个人喜好的情况下,设计出一个让用户对推荐结果满意从而愿意使用的个性化推荐系统,显得尤为重要。
图1为根据本发明实施例的基于深度学习的新闻个性化智能推荐方法的流程图。如图1所示,本发明实施例的基于深度学习的新闻个性化智能推荐方法,包括以下步骤:
S1:获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签。
需要说明的是,可通过用户移动端采集用户的各维度信息,进而分析得到用户的手机型号、品牌类型、运营商、操作系统、设备价值、分辨率、屏幕尺寸、手机上市时间、设备分类、是否有子女、行为性别、婚姻状态、国籍、行为年龄、有无车标识、消费能力水平、收入能力水平、职业类型、工作时段的活动区域、休息时段的活动区域、常住省份、常住城市、人生阶段、公司类型、文化水平、子女阶段、客户信息、金融偏好、旅游目标偏好、旅游品质偏好、应用使用市场、应用使用频度、社交网络活跃度、应用偏好、消费偏好、消费品级、购买方式、上网目的和阅读偏好等基本画像,然后根据这些基本画像数据,利用BP神经网络预测用户当前状态下的兴趣爱好。
具体地,可将基本画像数据作为BP神经网络的输入,在隐含层根据激励函数计算并输出用户实时兴趣爱好标签,其中,xi为第i个输入的基本画像数据,wi为第i个输入的基本画像数据的权重,b为隐含层的偏移量,由此能够根据BP神经网络结构获取用户实时兴趣爱好标签。
S2:按照用户实时兴趣爱好标签向用户推荐主题与兴趣爱好标签相对应的新闻。
S3:获取用户阅读情况。其中,用户阅读情况包括用户阅读的正反馈与负反馈。
需要说明的是,用户阅读情况为用户阅读行为数据,直接反映了用户的阅读偏好。具体地,用户阅读情况包括:用户ID、新闻ID、点击次数、阅读时长、是否收藏、是否转发和是否评论等。其中,正反馈为反馈用户喜欢某篇新闻的信息,例如多次点击阅读、阅读时间长、收藏、转发该新闻等;负反馈为用户不喜欢某篇新闻的信息,例如推荐给用户的某篇新闻从未被点击阅读过,用户点击了新闻标题上的不感兴趣按钮、对新闻做了表达不感兴趣的负面评论等。
S4:根据用户阅读情况对用户实时兴趣标签进行修正,并进行再一次新闻推荐。
具体地,通过用户阅读情况可以分析得到用户的阅读偏好数据,进而通过阅读偏好数据对用户实时兴趣爱好标签进行修正,以在进行再一次新闻推荐时,根据修正后的兴趣爱好标签重新推荐新闻。
举例来说,通过用户阅读行为中的新闻ID可以确定用户实时兴趣爱好标签中的主题类型,通过用户ID可以确定具体的用户,从而可以分析得到具体用户偏爱的具体新闻主题类型,在结合新闻的点击次数、阅读时长、是否收藏、是否转发和是否评论等,可以计算出用户对某具体新闻主题类型的偏好程度,然后利用分析得到的结果修正用户实时兴趣爱好标签,使得用户实时兴趣爱好标签越来越符合用户的当前状态。
根据本发明的一个实施例,基于深度学习的新闻个性化智能推荐方法还包括:
S101:获取新闻内容,并对新闻内容进行文本分词以生成新闻词序列。
需要说明的是,整条的新闻文本(如图2所示)计算机是无法直接读取并理解其中含义的,所以需要用到分词工具,以将文章解析成一个一个的词组序列,为下一步提取新闻主题做准备。
中文分词是将一个由汉字组成的句子按照一定的规范切割成一个个单独的词。现有的分词算法共三类分别为:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。其中,基于字符串匹配的分词方法中jieba(结巴)分词是目前国内最好用的中文分词组件。其基本原理为:基于Trie(字典树)树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图,然后采用动态规划查找最大概率路径,找出基于词频的最大切分组合,对于未登录词,采用基于汉字成词能力的HMM(Hidden MarkovModel, 隐马尔可夫模型)模型,使用Viterbi(维特比)算法。
具体地,系统加载字典,生成trie树,给定带分词的句子,使用正则获取连续的中文字符和英文字符,切分成短语列表,对每个短语使用DAG(查字典) 和动态规划,得到最大概率路径,对DAG中那些没有在字典中查到的字,组合成一个新的片段短语,使用HMM模型进行分词,识别字典外的新词,使用python 的yield语法生成一个词语生成器,逐个返回词语,从而能够将图2中的新闻生成如图3所示的新闻词序列。
S102:根据LDA模型和新闻词序列提取新闻内容的主题词,以形成待计算的新闻。
需要说明的是,LDA(Latent Dirichlet allocation)是三层贝叶斯主题模型,它的目的就是通过无监督的学习方法提取文本中隐含的主题信息。隐性语义分析的实质就是利用文本中词组的共现特征来发现文本的主题结构,这种方法不需要任何关于文本的背景知识。文本的隐性语义表示可以对“一词多义”和“一义多词”的语言现象进行建模,这使得搜索引擎系统得到的搜索结果与用户的查询能够在语义层次上匹配,而不仅仅只是在词汇层次上出现交集。LDA模型结构如图4所示,其中,K为主题个数,M为新闻总数,Nm是第m个新闻的单词总数。β是每个主题下词的多项分布的Dirichlet(狄利克雷)先验参数,ɑ是每个新闻下主题的多项分布的Dirichlet先验参数。Zm,n是第m个新闻中第n 个词的主题,Wm,n是m个新闻中的第n个词。剩下来的两个隐含变量θm和k分别表示第m个新闻下的主题分布和第k个主题下词的分布,前者是k维(k 为主题总数)向量,后者是v维向量,v为词典中term总数。
换言之,根据LDA模型和新闻词序列提取新闻内容的主题词的过程就是循环执行:获取一条新闻——获取一个该新闻的主题——获取一个该主题的词。新闻到主题服从多项式分布,主题到词服从多项式分布,即每篇新闻均代表由一些主题构成的一个概率分布,每一个主题又代表由很多单词多构成的一个概率分布。举例来说,在对图2中新闻内容进行文本分词,并输入LDA模型后,设置K=1,获取到如图5所示的待计算的新闻。
S103:获取新闻类型分类器。
根据本发明的一个实施例,获取新闻分类器包括:
S201:获取新闻类型正样本。例如可获取各类型新闻各1000条,其中,新闻类型可划分为财经、搞笑、国际、军事、科技、历史、旅游、美食、美文、汽车、社会、时尚、探索、体育、养生、游戏、娱乐和育儿共18类。
S202:将新闻类型正样本进行文本分词,并提取新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器。
具体地,利用爬虫工具从网络中获取各类型新闻各1000条,即18000条新闻,文本分此后提取主题词,训练成各主题类型的新闻分类器。
S104:对待计算的新闻与新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取新闻内容所属的主题类型。
需要说明的是,MPCNN(Multi-perspective Convolutional Neural Network) 多粒度卷积神经网络,使用多个粒度窗口大小的卷积滤波器,后面连接着多种类型的池化方式,能够从多个角度去解析新闻文档,尽可能的多提取新闻文档的语义和句子结构,从而更精确地计算两个文档的相似性。卷积神经网络 (Convolutional Neural Networks,CNN)是多层感知机(MLP)的变种。它是一种深度的监督学习下的机器学习模型,具有极强的适应性,善于挖掘数据局部特征,提取全局训练特征和分类,它的权值共享结构网络使之更类似于生物神经网络,在模式识别的各个领域都取得了很好的成果。CNN是一种带有卷积结构的深度神经网络,通常至少有两个非线性可训练的卷积层,两个非线性的固定卷积层和一个全连接层,一共至少5个隐含层。
具体计算两个文档相似度的结构如图6所示,Doc1为待计算的新闻,Doc2 为新闻类型分类器,即18个新闻类型分类器,根据多粒度卷积神经网络能够计算新闻属于各主题类型的概率,由于是从多个角度去解析新闻,所以采用了多个窗口和多个卷积方式来处理新闻,其中,结构化相似度计算层可以使用多种计算相似度的方式,具体可采用余弦(cos)函数计算待计算的新闻与新闻类型分类其的相似度;全连接层的作用是调整输出,以使输出的是新闻属于各类主题类型的可能性大小。在本发明实施例中图2中的新闻的计算结果如表1所示,进一步地,可按照用户实时兴趣爱好标签向用户推荐主题与兴趣爱好标签相对应的新闻。
表1
举例来说,当获取到用户实时兴趣爱好标签为娱乐&0.5|游戏&0.3|体育 &0.2(即50%喜欢娱乐,30%喜欢游戏,20%喜欢体育)时,则根据表1的数据可以计算出新闻ID为112882的这条新闻推荐给该用户的推荐度为:0* 0.0846585+0.5*0.01733325+0.3*0.0521652+0.2*0.0519405+0* 0.1651095+0*0.02069196+0*0.0661809+0*0.02510412+0*0.0524721+0*0.0783807+0*0.0568581+0*0.0360186+0*0.1096407 +0*0.0492717+0*0.397221+0*0.00551148+0*0.02572671+0* 0.1725549=0.034704285。
综上所述,根据本发明实施例的基于深度学习的新闻个性化智能推荐方法,能够根据用户实时兴趣爱好标签进行新闻推荐,从而使新用户也能较好的获取到感兴趣的新闻,同时能够根据用户的阅读情况及时对用户实时兴趣标签进行修正,进而能够避免被推荐的新闻类型越来越少,提升用户的体验。
本发明还提供了一种计算机可读存储介质,包括程序,程序能够被处理器执行以实现基于深度学习的新闻个性化智能推荐方法。
本发明还提供了一种基于深度学习的新闻个性化智能推荐系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现基于深度学习的新闻个性化智能推荐方法。
与上述几种实施例提供的基于深度学习的新闻个性化智能推荐方法相对应, 本发明的一种实施例还提供了基于深度学习的新闻个性化智能推荐装置,由于本发明实施例提供的基于深度学习的新闻个性化智能推荐装置与上述几种实施例提供的基于深度学习的新闻个性化智能推荐方法相对应,因此在前述基于深度学习的新闻个性化智能推荐方法的实施方式也适用于本实施例提供的基于深度学习的新闻个性化智能推荐装置,在本实施例中不再描述。
本发明实施例提供的一种基于深度学习的新闻个性化智能推荐装置,包括:用于获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签的装置;用于按照用户实时兴趣爱好标签向用户推荐与兴趣爱好标签相对应的主题的新闻的装置;用于获取用户阅读情况,并将用户阅读情况进行反馈的装置;用于根据用户阅读情况对用户实时兴趣标签进行修正,并进行再一次新闻推荐的装置。
根据本发明的一个实施例,用户阅读情况包括用户阅读的正反馈与负反馈。
根据本发明的一个实施例,基于深度学习的新闻个性化智能推荐装置还包括:用于获取新闻内容,并对新闻内容进行文本分词以生成新闻词序列的装置;用于根据LDA模型和新闻词序列提取新闻内容的主题词,以形成待计算的新闻的装置;用于获取新闻类型分类器的装置;用于对待计算的新闻与新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取新闻内容所属的主题类型的装置。
根据本发明的一个实施例,获取新闻类型分类器还包括:用于获取新闻类型正样本的装置;用于将新闻类型正样本进行文本分词,并提取新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器的装置。
综上所述,根据本发明实施例的基于深度学习的新闻个性化智能推荐装置,能够根据用户实时兴趣爱好标签进行新闻推荐,从而使新用户也能较好的获取到感兴趣的新闻,同时能够根据用户的阅读情况及时对用户实时兴趣标签进行修正,进而能够避免被推荐的新闻类型越来越少,提升用户的体验。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种基于深度学习的新闻个性化智能推荐方法,其特征在于,包括以下步骤:
获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签;
按照所述用户实时兴趣爱好标签向用户推荐主题与所述兴趣爱好标签相对应的新闻;
获取用户阅读情况;
根据所述用户阅读情况对所述用户实时兴趣标签进行修正,并进行再一次新闻推荐。
2.如权利要求1所述的基于深度学习的新闻个性化智能推荐方法,其特征在于,所述用户阅读情况包括用户阅读的正反馈与负反馈。
3.如权利要求1所述的基于深度学习的新闻个性化智能推荐方法,其特征在于,还包括:
获取新闻内容,并对所述新闻内容进行文本分词以生成新闻词序列;
根据LDA模型和所述新闻词序列提取所述新闻内容的主题词,以形成待计算的新闻;
获取新闻类型分类器;
对所述待计算的新闻与所述新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取所述新闻内容所属的主题类型。
4.如权利要求2所述的基于深度学习的新闻个性化智能推荐方法,其特征在于,获取新闻类型分类器的方法包括:
获取新闻类型正样本;
将所述新闻类型正样本进行文本分词,并提取所述新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器。
5.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-4中任一项所述的方法。
6.一种基于深度学习的新闻个性化智能推荐系统,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一项所述的方法。
7.一种基于深度学习的新闻个性化智能推荐装置,其特征在于,包括:
用于获取用户移动端互联网行为数据,并根据BP神经网络预测用户实时兴趣爱好标签的装置;
用于按照所述用户实时兴趣爱好标签向用户推荐与所述兴趣爱好标签相对应的主题的新闻的装置;
用于获取用户阅读情况,并将所述用户阅读情况进行反馈的装置;
用于根据所述用户阅读情况对所述用户实时兴趣标签进行修正,并进行再一次新闻推荐的装置。
8.如权利要求6所述的基于深度学习的新闻个性化智能推荐装置,其特征在于,所述用户阅读情况包括用户阅读的正反馈与负反馈。
9.如权利要求6所述的基于深度学习的新闻个性化智能推荐装置,还包括:
用于获取新闻内容,并对所述新闻内容进行文本分词以生成新闻词序列的装置;
用于根据LDA模型和所述新闻词序列提取所述新闻内容的主题词,以形成待计算的新闻的装置;
用于获取新闻类型分类器的装置;
用于对所述待计算的新闻与所述新闻类型分类器进行基于数据流图的多粒度卷积神经网络的计算,以获取所述新闻内容所属的主题类型的装置。
10.如权利要求8所述的基于深度学习的新闻个性化智能推荐装置,获取新闻类型分类器还包括:
用于获取新闻类型正样本的装置;
用于将所述新闻类型正样本进行文本分词,并提取所述新闻类型正样本的主题词,以将新闻类型正样本训练成各主题类型的新闻分类器的装置。
CN201711168188.0A 2017-11-21 2017-11-21 基于深度学习的新闻个性化智能推荐方法与系统 Active CN107992531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711168188.0A CN107992531B (zh) 2017-11-21 2017-11-21 基于深度学习的新闻个性化智能推荐方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711168188.0A CN107992531B (zh) 2017-11-21 2017-11-21 基于深度学习的新闻个性化智能推荐方法与系统

Publications (2)

Publication Number Publication Date
CN107992531A true CN107992531A (zh) 2018-05-04
CN107992531B CN107992531B (zh) 2020-11-27

Family

ID=62032464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711168188.0A Active CN107992531B (zh) 2017-11-21 2017-11-21 基于深度学习的新闻个性化智能推荐方法与系统

Country Status (1)

Country Link
CN (1) CN107992531B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765076A (zh) * 2018-05-24 2018-11-06 蜜芽宝贝(北京)网络科技有限公司 母婴内容推荐方法、装置及可读存储介质
CN108984657A (zh) * 2018-06-28 2018-12-11 Oppo广东移动通信有限公司 图像推荐方法和装置、终端、可读存储介质
CN109086393A (zh) * 2018-07-27 2018-12-25 贵州中科恒运软件科技有限公司 一种舆情分析系统及方法
CN109660591A (zh) * 2018-11-02 2019-04-19 北京奇虎科技有限公司 个性化新闻的自动推送方法、装置和计算设备
CN109785034A (zh) * 2018-11-13 2019-05-21 北京码牛科技有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN110083836A (zh) * 2019-04-24 2019-08-02 哈尔滨工业大学 一种文本预测结果的关键证据抽取方法
CN110152298A (zh) * 2018-11-22 2019-08-23 腾讯科技(深圳)有限公司 实现虚拟角色的装备推荐方法、装置及计算机设备
CN110162708A (zh) * 2019-05-23 2019-08-23 网易传媒科技(北京)有限公司 信息输出方法、装置、电子设备以及计算机可读存储介质
CN110555182A (zh) * 2018-05-31 2019-12-10 中国电信股份有限公司 用户画像的确定方法、装置及计算机可读存储介质
CN110555169A (zh) * 2019-09-04 2019-12-10 北京人民在线网络有限公司 一种基于深度学习的新闻数据处理系统及其处理方法
WO2019237461A1 (zh) * 2018-06-13 2019-12-19 杭州数理大数据技术有限公司 一种基于用户需求的稳态标签开发方法及系统
CN110598016A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体信息推荐的方法、装置、设备和介质
CN110704707A (zh) * 2019-09-27 2020-01-17 黄海鹏 基于用户画像的业务推荐方法以及装置
CN110765376A (zh) * 2018-07-09 2020-02-07 江门堂朝网络有限公司 一种智能版面内容生成系统
CN110851712A (zh) * 2019-10-31 2020-02-28 上海连尚网络科技有限公司 书籍信息的推荐方法、设备以及计算机可读介质
CN111310048A (zh) * 2020-02-25 2020-06-19 西安电子科技大学 基于多层感知机的新闻推荐方法
CN111522957A (zh) * 2020-05-09 2020-08-11 支付宝(杭州)信息技术有限公司 一种短语分割模型的训练方法和系统
CN111581359A (zh) * 2020-04-21 2020-08-25 北京龙云科技有限公司 一种新闻推荐方法及装置
CN111601164A (zh) * 2020-05-21 2020-08-28 广州欢网科技有限责任公司 一种智能电视新闻推送方法及系统
CN111597450A (zh) * 2020-05-21 2020-08-28 深圳辉煌明天科技有限公司 大数据的智能分析系统及方法
CN112100432A (zh) * 2020-09-17 2020-12-18 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112182413A (zh) * 2020-12-01 2021-01-05 三盟科技股份有限公司 一种基于教学大数据的智能推荐方法及服务器
CN112307336A (zh) * 2020-10-30 2021-02-02 中国平安人寿保险股份有限公司 热点资讯挖掘与预览方法、装置、计算机设备及存储介质
CN112328861A (zh) * 2020-11-24 2021-02-05 郑州航空工业管理学院 一种基于大数据处理的新闻传播方法
CN113590806A (zh) * 2021-08-02 2021-11-02 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN114996587A (zh) * 2022-07-18 2022-09-02 浙江方正印务有限公司 一种数字报纸搜索及智能推荐与分享方法
CN117056610A (zh) * 2023-09-27 2023-11-14 广州凯迪云信息科技有限公司 一种基于用户标签的个性化推荐方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073704A1 (en) * 2005-09-23 2007-03-29 Bowden Jeffrey L Information service that gathers information from multiple information sources, processes the information, and distributes the information to multiple users and user communities through an information-service interface
CN102622364A (zh) * 2011-01-28 2012-08-01 腾讯科技(深圳)有限公司 一种信息聚合的方法、装置及信息处理系统
CN104199872A (zh) * 2014-08-19 2014-12-10 北京搜狗科技发展有限公司 一种信息推荐的方法以及装置
CN104572797A (zh) * 2014-05-12 2015-04-29 深圳市智搜信息技术有限公司 基于主题模型的个性化服务推荐系统和方法
CN106815369A (zh) * 2017-01-24 2017-06-09 中山大学 一种基于Xgboost分类算法的文本分类方法
CN107038237A (zh) * 2017-04-18 2017-08-11 昆山数泰数据技术有限公司 基于大数据的用户画像系统及画像方法
CN107133569A (zh) * 2017-04-06 2017-09-05 同济大学 基于泛化多标记学习的监控视频多粒度标注方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070073704A1 (en) * 2005-09-23 2007-03-29 Bowden Jeffrey L Information service that gathers information from multiple information sources, processes the information, and distributes the information to multiple users and user communities through an information-service interface
CN102622364A (zh) * 2011-01-28 2012-08-01 腾讯科技(深圳)有限公司 一种信息聚合的方法、装置及信息处理系统
CN104572797A (zh) * 2014-05-12 2015-04-29 深圳市智搜信息技术有限公司 基于主题模型的个性化服务推荐系统和方法
CN104199872A (zh) * 2014-08-19 2014-12-10 北京搜狗科技发展有限公司 一种信息推荐的方法以及装置
CN106815369A (zh) * 2017-01-24 2017-06-09 中山大学 一种基于Xgboost分类算法的文本分类方法
CN107133569A (zh) * 2017-04-06 2017-09-05 同济大学 基于泛化多标记学习的监控视频多粒度标注方法
CN107038237A (zh) * 2017-04-18 2017-08-11 昆山数泰数据技术有限公司 基于大数据的用户画像系统及画像方法

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765076A (zh) * 2018-05-24 2018-11-06 蜜芽宝贝(北京)网络科技有限公司 母婴内容推荐方法、装置及可读存储介质
CN110555182A (zh) * 2018-05-31 2019-12-10 中国电信股份有限公司 用户画像的确定方法、装置及计算机可读存储介质
WO2019237461A1 (zh) * 2018-06-13 2019-12-19 杭州数理大数据技术有限公司 一种基于用户需求的稳态标签开发方法及系统
CN108984657A (zh) * 2018-06-28 2018-12-11 Oppo广东移动通信有限公司 图像推荐方法和装置、终端、可读存储介质
CN108984657B (zh) * 2018-06-28 2020-12-01 Oppo广东移动通信有限公司 图像推荐方法和装置、终端、可读存储介质
CN110765376A (zh) * 2018-07-09 2020-02-07 江门堂朝网络有限公司 一种智能版面内容生成系统
CN109086393A (zh) * 2018-07-27 2018-12-25 贵州中科恒运软件科技有限公司 一种舆情分析系统及方法
CN109660591A (zh) * 2018-11-02 2019-04-19 北京奇虎科技有限公司 个性化新闻的自动推送方法、装置和计算设备
CN109785034A (zh) * 2018-11-13 2019-05-21 北京码牛科技有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN110152298A (zh) * 2018-11-22 2019-08-23 腾讯科技(深圳)有限公司 实现虚拟角色的装备推荐方法、装置及计算机设备
CN110083836A (zh) * 2019-04-24 2019-08-02 哈尔滨工业大学 一种文本预测结果的关键证据抽取方法
CN110162708A (zh) * 2019-05-23 2019-08-23 网易传媒科技(北京)有限公司 信息输出方法、装置、电子设备以及计算机可读存储介质
CN110555169A (zh) * 2019-09-04 2019-12-10 北京人民在线网络有限公司 一种基于深度学习的新闻数据处理系统及其处理方法
CN110555169B (zh) * 2019-09-04 2021-12-03 北京人民在线网络有限公司 一种基于深度学习的新闻数据处理系统及其处理方法
CN110598016A (zh) * 2019-09-11 2019-12-20 腾讯科技(深圳)有限公司 一种多媒体信息推荐的方法、装置、设备和介质
CN110704707A (zh) * 2019-09-27 2020-01-17 黄海鹏 基于用户画像的业务推荐方法以及装置
CN110851712A (zh) * 2019-10-31 2020-02-28 上海连尚网络科技有限公司 书籍信息的推荐方法、设备以及计算机可读介质
CN110851712B (zh) * 2019-10-31 2023-07-21 上海连尚网络科技有限公司 书籍信息的推荐方法、设备以及计算机可读介质
CN111310048A (zh) * 2020-02-25 2020-06-19 西安电子科技大学 基于多层感知机的新闻推荐方法
CN111581359A (zh) * 2020-04-21 2020-08-25 北京龙云科技有限公司 一种新闻推荐方法及装置
CN111522957A (zh) * 2020-05-09 2020-08-11 支付宝(杭州)信息技术有限公司 一种短语分割模型的训练方法和系统
CN111522957B (zh) * 2020-05-09 2023-05-12 支付宝(杭州)信息技术有限公司 一种短语分割模型的训练方法和系统
CN111597450A (zh) * 2020-05-21 2020-08-28 深圳辉煌明天科技有限公司 大数据的智能分析系统及方法
CN111601164A (zh) * 2020-05-21 2020-08-28 广州欢网科技有限责任公司 一种智能电视新闻推送方法及系统
CN112100432A (zh) * 2020-09-17 2020-12-18 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112100432B (zh) * 2020-09-17 2024-04-09 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112307336B (zh) * 2020-10-30 2024-04-16 中国平安人寿保险股份有限公司 热点资讯挖掘与预览方法、装置、计算机设备及存储介质
CN112307336A (zh) * 2020-10-30 2021-02-02 中国平安人寿保险股份有限公司 热点资讯挖掘与预览方法、装置、计算机设备及存储介质
CN112328861A (zh) * 2020-11-24 2021-02-05 郑州航空工业管理学院 一种基于大数据处理的新闻传播方法
CN112182413A (zh) * 2020-12-01 2021-01-05 三盟科技股份有限公司 一种基于教学大数据的智能推荐方法及服务器
CN113590806B (zh) * 2021-08-02 2022-05-27 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN113590806A (zh) * 2021-08-02 2021-11-02 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN114996587A (zh) * 2022-07-18 2022-09-02 浙江方正印务有限公司 一种数字报纸搜索及智能推荐与分享方法
CN117056610A (zh) * 2023-09-27 2023-11-14 广州凯迪云信息科技有限公司 一种基于用户标签的个性化推荐方法及系统

Also Published As

Publication number Publication date
CN107992531B (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN107992531A (zh) 基于深度学习的新闻个性化智能推荐方法与系统
CN109492157B (zh) 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109977413B (zh) 一种基于改进cnn-lda的情感分析方法
Li et al. Document representation and feature combination for deceptive spam review detection
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
WO2019218508A1 (zh) 一种基于主题情感联合概率的电子商务虚假评论识别方法
CN111061962B (zh) 一种基于用户评分分析的推荐方法
CN107357889A (zh) 一种基于内容或情感相似性的跨社交平台图片推荐算法
CN107357793A (zh) 信息推荐方法和装置
CN107688870B (zh) 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置
KR20200007713A (ko) 감성 분석에 의한 토픽 결정 방법 및 장치
CN112861990A (zh) 一种基于关键词和实体的主题聚类方法、设备及计算机可读存储介质
WO2013049529A1 (en) Method and apparatus for unsupervised learning of multi-resolution user profile from text analysis
CN110990670B (zh) 一种成长激励型图书推荐方法及推荐系统
CN113312480A (zh) 基于图卷积网络的科技论文层级多标签分类方法及设备
CN114077661A (zh) 信息处理装置、信息处理方法和计算机可读介质
CN112215629B (zh) 基于构造对抗样本的多目标广告生成系统及其方法
Ghobakhloo et al. Design of a personalized recommender system using sentiment analysis in social media (case study: banking system)
CN116882414B (zh) 基于大规模语言模型的评语自动生成方法及相关装置
Bhatnagar et al. A novel aspect based framework for tourism sector with improvised aspect and opinion mining algorithm
CN116108840A (zh) 一种文本细粒度情感分析方法、系统、介质和计算设备
CN111259228A (zh) 基于大数据深度学习的个性化新闻推荐方法
CN112364666B (zh) 文本表征方法、装置及计算机设备
CN111782964B (zh) 一种社区帖子的推荐方法
CN115269846A (zh) 文本处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant