CN104036038A - 新闻推荐方法和系统 - Google Patents

新闻推荐方法和系统 Download PDF

Info

Publication number
CN104036038A
CN104036038A CN201410307116.XA CN201410307116A CN104036038A CN 104036038 A CN104036038 A CN 104036038A CN 201410307116 A CN201410307116 A CN 201410307116A CN 104036038 A CN104036038 A CN 104036038A
Authority
CN
China
Prior art keywords
news
user
inquiry data
search inquiry
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410307116.XA
Other languages
English (en)
Inventor
周楠
常富洋
秦吉胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410307116.XA priority Critical patent/CN104036038A/zh
Publication of CN104036038A publication Critical patent/CN104036038A/zh
Priority to US15/323,306 priority patent/US20170154116A1/en
Priority to PCT/CN2015/082282 priority patent/WO2016000555A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明关于一种新闻推荐方法和系统,涉及信息技术领域,主要目的在于针对不同类型的用户进行其感兴趣的新闻推送。方法包括:提取搜索查询数据的特征;根据某一类型用户对所述搜索查询数据的行为,计算并记录所述搜索查询数据的特征对于所述类型用户的兴趣权值;提取多个待推送新闻的特征;从已记录的特征及兴趣权值中,查找所述多个待推送新闻的特征的兴趣权值,并计算出所述多个待推送新闻对于所述类型的用户的兴趣得分;根据所述多个待推送新闻对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行新闻推送。通过本发明,可以分析不同类型用户的兴趣所在,并将符合用户兴趣的新闻推送给用户。

Description

新闻推荐方法和系统
技术领域
本发明涉及信息技术领域,具体而言,涉及一种新闻推荐方法和系统。
背景技术
获取新闻是现代社会中人们的生活习惯,随着计算机技术的发展和互联网用户规模的不断扩大,越来越多的人使用通过互联网获得各种各样所需的信息。同时,通过互联网提供新闻服务的网站也越来越多,越来越多的突发新闻和事件是通过互联网得到迅速传播的,互联网信息呈现出爆发式的增长趋势。近些年来,移动互联网的快速发展使得用户的阅读时间变得越来越碎片化,在这种背景下,如何在海量的信息中筛选出最有价值的信息,向用户个性化推荐其最感兴趣的新闻,就变得极其重要。
现在的互联网新闻阅读产品主要包括web(网页)端和移动app(应用程序)端,从新闻的整合方式来看,大部分依然是人工编辑和分类浏览的形式,这种方式的阅读会使用户浏览到大量不感兴趣的新闻,浪费用户的时间,同时产品本身也需要大量的编辑来进行新闻的更新和维护;以google reader为代表的订阅类新闻阅读产品是不同于上述产品的另外一种产品形式,用户可以订阅自己感兴趣的网站的内容进行阅读和浏览,这种阅读形式减少了用户浏览到不感兴趣的内容的可能性,但是用户需要自己寻找自己感兴趣的内容和网站进行一系列设置,而对于大多数互联网用户来说,他们不喜欢这种繁琐的方式。
为了使得用户在短的时间内以便捷的方式获取有价值和感兴趣的新闻,必须采取一种更加智能的方式去提供给用户所需的信息,针对不同的用户推荐用户感兴趣和有价值的新闻。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的新闻推荐方法和系统。
依据本发明的一个方面,提供了一种新闻推荐方法,其包括:提取搜索查询数据的特征;根据某一类型用户对所述搜索查询数据的行为,计算并记录所述搜索查询数据的特征对于所述类型用户的兴趣权值;提取多个待推送新闻的特征;从已记录的特征及兴趣权值中,查找所述多个待推送新闻的特征的兴趣权值,并计算出所述多个待推送新闻对于所述类型的用户的兴趣得分;根据所述多个待推送新闻对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行新闻推送。
可选地,前述的新闻推荐方法,其中,还包括:根据所述类型的用户对所述多个待推送新闻的点击行为,重新确定所述多个待推送新闻的兴趣得分;按重新确定的兴趣得分,计算所述多个待推送新闻的特征的兴趣权值并进行记录。
可选地,前述的新闻推荐方法,其中,所述搜索查询数据包括查询词,所述搜索查询数据的特征包括所述查询词的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的所述查询词的查询行为。
可选地,前述的新闻推荐方法,其中,所述搜索查询数据包括查询结果页上的URL,所述搜索查询数据的特征包括所述URL指向的新闻的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
可选地,前述的新闻推荐方法,其中,所述搜索查询数据包括社交网络账号发布的URL,所述搜索查询数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述搜索查询数据的行为包括对相同类别的域名对应的URL的点击行为。
可选地,前述的新闻推荐方法,其中,第i个待推送新闻的兴趣得分为:
P = a b + e - g ( V i )
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送新闻的N个特征,x1……xN为对应所述N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
依据本发明的另一方面,提供了一种新闻推荐系统,其包括:第一特征提取模块,用于提取搜索查询数据的特征;兴趣权值计算模块,用于根据用户对所述搜索查询数据的行为,计算并记录所述搜索查询数据的特征对于所述类型的用户的兴趣权值;第二特征提取模块,用于提取多个待推送新闻的特征;兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送新闻的特征的兴趣权值,并计算出所述多个待推送新闻对于所述类型的用户的兴趣得分;待推送新闻推荐模块,用于根据所述多个待推送新闻对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行新闻推送。
可选地,前述的新闻推荐系统,其中,还包括:第一重新确定模块,用于根据所述类型的用户对所述多个待推送新闻的点击行为,重新确定所述多个待推送新闻的兴趣得分;第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送新闻的特征的兴趣权值并进行记录。
可选地,前述的新闻推荐系统,其中,所述搜索查询数据包括查询词,所述搜索查询数据的特征包括所述查询词的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的所述查询词的查询行为。
可选地,前述的新闻推荐系统,其中,所述搜索查询数据包括查询结果页上的URL,所述搜索查询数据的特征包括所述URL指向的新闻的类别,所述类型的用户对所述搜索查询数据的行为包括对相同类别的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
可选地,前述的新闻推荐系统,其中,所述搜索查询数据包括社交网络账号发布的URL,所述搜索查询数据的特征包括所述URL中包含的域名的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的域名对应的URL的点击行为。
可选地,前述的新闻推荐系统,其中,第i个待推送新闻的兴趣得分为:
P = a b + e - g ( V i )
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送新闻的N个特征,x1……xN为对应所述N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本发明的新闻推荐方法和系统中,由于不同类型用户对搜索查询数据的行为,能够反映对该类型用户的兴趣所在,所以基于不同类型用户对搜索查询数据行为,分析得到搜索查询数据特征对于不同类型用户的兴趣权值,以及计算出待推送新闻对不同类型用户的兴趣得分,实际上是合理分析出了不同类型用户对待推送新闻的兴趣高低,按兴趣高低对不同类型的用户推荐新闻;本发明的技术方案给用户展示新闻,大大减少了人工编辑的工作量,对用户而言,提升了新闻的可读性,减少了大量用户不喜欢的新闻,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条新闻的点击率,最终带来新闻流量的稳步提升。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明的一个实施例的新闻推荐方法的流程图;
图2示出了根据本发明的一个实施例的新闻推荐方法的流程图;
图3示出了根据本发明的一个实施例的新闻推荐方法的工作流程图;
图4示出了根据本发明的一个实施例的新闻推荐系统的框图;
图5示出了根据本发明的一个实施例的新闻推荐系统的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的一个实施例提供了一种新闻推荐方法,其包括:
步骤110,提取搜索查询数据的特征。本实施例中对于搜索查询数据的类型不做限定,例如,可以是用户对搜索得到的新闻的浏览情况等;本实施例对搜索查询数据的特征也不进行限定,例如,可以是用户浏览的新闻的分类、标题、关键词、新闻来源、网站来源、地域标签、点击率等。
步骤120,根据某一类型用户对搜索查询数据的行为,计算并记录搜索查询数据的特征对于上述类型的用户的兴趣权值。例如,对于浏览行为而言,用户对首先浏览、重复浏览的新闻必然兴趣较高,由此可分析用户的兴趣权值。
步骤130,提取多个待推送新闻的特征。
步骤140,从已记录的特征及兴趣权值中,查找多个待推送新闻的特征的兴趣权值,并计算出多个待推送新闻对于上述类型的用户的兴趣得分。在本实施例的技术方案中,依据前述的搜索查询数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选新闻。
步骤150,根据多个待推送新闻对于上述类型的用户的兴趣得分的高低,对用户进行推送。本实施例中,基于兴趣得分对待推送新闻进行排序,根据排序结果可以确定最终要推荐给用户的新闻集合以及顺序。
在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送新闻的兴趣高低进行新闻推送,大大减少了人工编辑的工作量,对用户而言,提升了新闻的可读性,减少了大量用户不喜欢的新闻,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条新闻的点击率,最终带来新闻流量的稳步提升。
如图2所示,本发明的另一个实施例还提供了一种新闻推荐方法,其中,还包括:
步骤160,根据上述类型的用户对多个待推送新闻的点击行为,重新确定多个待推送新闻的兴趣得分。
步骤170,按重新确定的兴趣得分,计算多个待推送新闻的特征的兴趣权值并进行记录。
在本实施例的技术方案中,用户点击并阅读了推送新闻的话,则说明推送准确;但如用户对推送的某条新闻点击了不感兴趣的按钮或忽略推送新闻,表示用户对于该新闻所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该新闻的兴趣得分,并反向修正该新闻的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。
本发明的另一个实施例还提供了一种新闻推荐方法,其中,搜索查询数据包括查询词,搜索查询数据的特征包括查询词的类别和主题,上述类型的用户对搜索查询数据的行为包括对相同类别或相同主题的查询词的查询行为。
在本实施例的技术方案中,可以预先根据查询词对应的新闻集合中新闻的类别标签和主题标签来确定该查询词的类别标签和主题标签,并建立数据库进行存储,则查询词的类别和主题可以从数据库中的类别标签和主题标签中进行提取。比如搜索查询词abc,获取到新闻中最多的主题标签是t1,则该查询词对应的主题标签是t1,获取到新闻最多的分类标签是c1,则该查询词对应的类别标签是c1,则可以提取t1和c1作为查询词的类别和主题的特征。
本实施例的技术方案中,用户对查询词查询行为的不同主要包括:搜索频次的不同以及搜索时间的不同。搜索某一查询词的频次越高,说明用户的兴趣越高,则可为查询词的类别和主题设置较高的兴趣权值;同时,用户每次搜索该查询词的时间与当前时间越接近,也说明用户的兴趣越高,则可为查询词的类别和主题设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐方法,其中,搜索查询数据包括查询结果页上的URL,搜索查询数据的特征包括URL指向的新闻的类别和主题,上述类型的用户对搜索查询数据的行为包括对相同类别或相同主题的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
在本实施例的技术方案中,可以预先为每个新闻设置一个类别标签和至少一个主题标签,并在其中记载该新闻的一个类别和至少一个主题。
在本实施例的技术方案中,用户点击阅读了搜索到的某条URL指向的新闻,则表示用户对于该新闻的类别和主题感兴趣,则可以设置较高的兴趣权值;或者,用户点击了某个URL指向的新闻分类频道,且该分类频道的新闻具有同一类别标签,则表示用户对该新闻的类别感兴趣,则可以设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐方法,其中,搜索查询数据包括社交网络账号发布的URL,搜索查询数据的特征包括URL中包含的域名的类别,上述类型的用户对搜索查询数据的行为包括对相同类别的域名对应的URL的点击行为。
在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如,一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如sports.abc.com,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。
在本实施例的技术方案中,用户搜索到某社交账号发布的URL,并点击阅读该URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐方法,其中,第i个待推送新闻的兴趣得分为:
P = a b + e - g ( V i )
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送新闻的N个特征,x1……xN为对应N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的输入是一条新闻的特征,输出是一条新闻针对某一类型的用户的兴趣得分,得分越高表示该类型用户对这条新闻可能越感兴趣。每条新闻可以抽象为一个特征向量,向量的每个维度表示该条新闻的主题、分类,甚至关键词、热度等多个特征。
假设我们已经根据上述的兴趣权值得到模型系数向量为X={x1,x2,…,xN},则可将用来进行新闻兴趣值计算的逻辑回归分类器表示为:
P ( Y = 1 | new s i ) = 1 1 + e - g ( V )
其中,V=XW,X表示上述类型的用户对应的模型系数向量,W表示新闻的特征向量,上述等式的左边的意义是当向用户推荐一条新闻newsi时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送新闻的依据。
结合前述的实施例,在用户对推送新闻进行处理的情况下,W已知/X未知,求X。
根据用户的点击行为的反馈,可以得到用户点击过的新闻集合和一批向用户推送过但是用户没有点击的新闻集合,对于用户点击过的新闻newsc,可以得到:
P ( Y = 1 | news c ) = 1 1 + e - g ( V c ) = 1
对于用户没有点击过的新闻newsd,可以得到:
P ( Y = 1 | news d ) = 1 1 + e - g ( V d ) = 0
这样根据一个用户对m条推送新闻点击记录,我们就得到了m个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。
在兴趣权值修正之后,设模型系数向量为{x1,x2,…,xN},将候选的新闻集合中的每一条新闻提取得到对应的特征向量Wi={w1,w2,…,wN},带入到模型中:
P ( Y = 1 | news i ) = 1 1 + e - g ( V i )
其中,Vi=x1*w1+x2*w2+…+xN*wN,计算则可得到P(Y=1|newsi)。这个值就是该用户对此条新闻的兴趣得分。根据候选新闻兴趣得分的高低可以确定给该用户推荐新闻的先后顺序,由此可见,本实施例的技术方案中根据用户对推送新闻的实际点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行新闻推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
如图4所示,本发明的另一实施例还提供了一种新闻推荐系统,其包括:
第一特征提取模块410,用于提取搜索查询数据的特征。本实施例中对于搜索查询数据的类型不做限定,例如,可以是用户对搜索得到的新闻的浏览情况等;本实施例对搜索查询数据的特征也不进行限定,例如,可以是用户浏览的新闻的分类、标题、关键词、新闻来源、网站来源、地域标签、点击率等。
兴趣权值计算模块420,用于根据用户对搜索查询数据的行为,计算并记录搜索查询数据的特征对于上述类型的用户的兴趣权值。例如,对于浏览行为而言,用户对首先浏览、重复浏览的新闻必然兴趣较高,由此可分析用户的兴趣权值。
第二特征提取模块430,用于提取多个待推送新闻的特征。
兴趣得分计算模块440,用于从已记录的特征及兴趣权值中,查找多个待推送新闻的特征的兴趣权值,并计算出多个待推送新闻对于上述类型的用户的兴趣得分。在本实施例的技术方案中,依据前述的搜索查询数据的特征以及相应的兴趣权值可以建立用户的兴趣模型,通过兴趣模型可以选择出需要推送给用户的候选新闻。
待推送新闻推荐模块450,用于根据多个待推送新闻对于上述类型的用户的兴趣得分的高低,按顺序将多个待推送新闻推送给上述类型的用户。本实施例中,基于兴趣得分对待推送新闻进行排序,根据排序结果可以确定最终要推荐给用户的新闻集合以及顺序。
在本实施例的技术方案中,基于兴趣得分的高低,也即不同类型用户对于待推送新闻的兴趣高低进行新闻推送,大大减少了人工编辑的工作量,对用户而言,提升了新闻的可读性,减少了大量用户不喜欢的新闻,节约了用户的时间,推荐质量的提高也会带动更多的用户,提高了每条新闻的点击率,最终带来新闻流量的稳步提升。
如图5所示,本发明的另一个实施例还提供了一种新闻推荐系统,其中,还包括:
第一重新确定模块460,用于根据上述类型的用户对多个待推送新闻的点击行为,重新确定多个待推送新闻的兴趣得分。
第二重新确定模块470,用于按重新确定的兴趣得分,计算多个待推送新闻的特征的兴趣权值并进行记录。
本实施例的技术方案中,用户点击并阅读了推送新闻的话,则说明推送准确;但如用户对推送的某条新闻点击了不感兴趣的按钮或忽略推送新闻,表示用户对于该新闻所对应的分类或主题等特征具有较低兴趣,此时根据用户的实际行为估算该新闻的兴趣得分,并反向修正该新闻的特征的兴趣权值,以便于在以后使得计算的兴趣得分与用户的实际兴趣更符合。
本发明的另一个实施例还提供了一种新闻推荐系统,其中,搜索查询数据包括查询词,搜索查询数据的特征包括查询词的类别和主题,上述类型的用户对搜索查询数据的行为包括对相同类别或相同主题的查询词的查询行为。
在本实施例的技术方案中,可以预先根据查询词对应的新闻集合中新闻的类别标签和主题标签来确定该查询词的类别标签和主题标签,并建立数据库进行存储,则查询词的类别和主题可以从数据库中的类别标签和主题标签中进行提取。比如搜索查询词abc,获取到新闻中最多的主题标签是t1,则该查询词对应的主题标签是t1,获取到新闻最多的分类标签是c1,则该查询词对应的类别标签是c1,则可以提取t1和c1作为查询词的类别和主题的特征。
本实施例的技术方案中,用户对查询词查询行为的不同主要包括:搜索频次的不同以及搜索时间的不同。搜索某一查询词的频次越高,说明用户的兴趣越高,则可为查询词的类别和主题设置较高的兴趣权值;同时,用户每次搜索该查询词的时间与当前时间越接近,也说明用户的兴趣越高,则可为查询词的类别和主题设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐系统,其中,搜索查询数据包括查询结果页上的URL,搜索查询数据的特征包括URL指向的新闻的类别,上述类型的用户对搜索查询数据的行为包括对相同类别的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
在本实施例的技术方案中,可以预先为每个新闻设置一个类别标签和至少一个主题标签,并在其中记载该新闻的一个类别和至少一个主题。
在本实施例的技术方案中,用户点击阅读了搜索到的某条URL指向的新闻,则表示用户对于该新闻的类别和主题感兴趣,则可以设置较高的兴趣权值;或者,用户点击了某个URL指向的新闻分类频道,且该分类频道的新闻具有同一类别标签,则表示用户对该新闻的类别感兴趣,则可以设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐系统,其中,搜索查询数据包括社交网络账号发布的URL,搜索查询数据的特征包括URL中包含的域名的类别和主题,上述类型的用户对搜索查询数据的行为包括对相同类别或相同主题的域名对应的URL的点击行为。
在本实施例的技术方案中,可以预先为不同域名设置类别标签,例如,一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类别,比如sports.abc.com,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”。域名的类别标签可预先存储在数据库中。
在本实施例的技术方案中,用户搜索到某社交账号发布的URL,并点击阅读该URL指向的新闻,则表示用户对于该域名的类别和主题感兴趣,则可以设置较高的兴趣权值。
本发明的另一个实施例还提供了一种新闻推荐系统,其中,第i个待推送新闻的兴趣得分为:
P = a b + e - g ( V i )
其中,Vi=x1×w1+x2×w2+…+xN×wN,其中,w1……wN为第i个待推送新闻的N个特征,x1……xN为对应N个特征的兴趣权值,a为第一常数,b为第二常数,e、g均为固定常数。
在本实施例的技术方案中,基于上述的得分公式,可以实现一排序模型,该模型利用上述公式计算兴趣得分。排序模型实际上是一个逻辑回归分类器,该逻辑回归分类器的输入是一条新闻的特征,输出是一条新闻针对某一类型的用户的兴趣得分,得分越高表示该类型用户对这条新闻可能越感兴趣。每条新闻可以抽象为一个特征向量,向量的每个维度表示该条新闻的主题、分类,甚至关键词、热度等多个特征。
假设我们已经根据上述的兴趣权值得到模型系数向量为X={x1,x2,…,xN},则可将用来进行新闻兴趣值计算的逻辑回归分类器表示为:
P ( Y = 1 | news i ) = 1 1 + e - g ( V )
其中,V=XW,X表示上述类型的用户对应的模型系数向量,W表示新闻的特征向量,上述等式的左边的意义是当向用户推荐一条新闻newsi时,用户点击的可能性,所以计算得到的右边的兴趣得分可以作为对上述类型用户推送新闻的依据。
结合前述的实施例,在用户对推送新闻进行处理的情况下,W已知/X未知,求X。
根据用户的点击行为的反馈,可以得到用户点击过的新闻集合和一批向用户推送过但是用户没有点击的新闻集合,对于用户点击过的新闻newsc,可以得到:
P ( Y = 1 | news c ) = 1 1 + e - g ( V c ) = 1
对于用户没有点击过的新闻newsd,可以得到:
P ( Y = 1 | news d ) = 1 1 + e - g ( V d ) = 0
这样根据一个用户对m条推送新闻点击记录,我们就得到了m个形式如上所述两个表达式的式子,联立求解,即可得到该用户的排序模型系数向量X,也即修正了兴趣权值。
在兴趣权值修正之后,设模型系数向量为{x1,x2,…,xN},将候选的新闻集合中的每一条新闻提取得到对应的特征向量Wi={w1,w2,…,,N},带入到模型中:
P ( Y = 1 | news i ) = 1 1 + e - g ( V i )
其中,Vi=x1*w1+x2*w2+…+xN*wN,计算则可得到P(Y=1|newsi)。这个值就是该用户对此条新闻的兴趣得分。根据候选新闻兴趣得分的高低可以确定给该用户推荐新闻的先后顺序,由此可见,本实施例的技术方案中根据用户对推送新闻的实际点击行为,修正了兴趣权值,有利于再次更加准确地对用户进行新闻推送,最终本实施例结合前述实施例得到的技术方案,其工作流程如图3所示。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,依然落在本发明的范围之内,例如增添参数或倍数值等。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的新闻推荐系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种新闻推荐方法,其包括:
提取搜索查询数据的特征;
根据某一类型用户对所述搜索查询数据的行为,计算并记录所述搜索查询数据的特征对于所述类型用户的兴趣权值;
提取多个待推送新闻的特征;
从已记录的特征及兴趣权值中,查找所述多个待推送新闻的特征的兴趣权值,并计算出所述多个待推送新闻对于所述类型的用户的兴趣得分;
根据所述多个待推送新闻对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行新闻推送。
2.根据权利要求1所述的新闻推荐方法,其中,还包括:
根据所述类型的用户对所述多个待推送新闻的点击行为,重新确定所述多个待推送新闻的兴趣得分;
按重新确定的兴趣得分,计算所述多个待推送新闻的特征的兴趣权值并进行记录。
3.根据权利要求1-2任一项所述的新闻推荐方法,其中,所述搜索查询数据包括查询词,所述搜索查询数据的特征包括所述查询词的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的所述查询词的查询行为。
4.根据权利要求1-3任一项所述的新闻推荐方法,其中,所述搜索查询数据包括查询结果页上的URL,所述搜索查询数据的特征包括所述URL指向的新闻的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
5.根据权利要求1-4任一项所述的新闻推荐方法,其中,所述搜索查询数据包括社交网络账号发布的URL,所述搜索查询数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述搜索查询数据的行为包括对相同类别的域名对应的URL的点击行为。
6.一种新闻推荐系统,其包括:
第一特征提取模块,用于提取搜索查询数据的特征;
兴趣权值计算模块,用于根据用户对所述搜索查询数据的行为,计算并记录所述搜索查询数据的特征对于所述类型的用户的兴趣权值;
第二特征提取模块,用于提取多个待推送新闻的特征;
兴趣得分计算模块,用于从已记录的特征及兴趣权值中,查找所述多个待推送新闻的特征的兴趣权值,并计算出所述多个待推送新闻对于所述类型的用户的兴趣得分;
待推送新闻推荐模块,用于根据所述多个待推送新闻对于所述类型的用户的兴趣得分的高低,对所述类型的用户进行新闻推送。
7.根据权利要求6所述的新闻推荐系统,其中,还包括:
第一重新确定模块,用于根据所述类型的用户对所述多个待推送新闻的点击行为,重新确定所述多个待推送新闻的兴趣得分;
第二重新确定模块,用于按重新确定的兴趣得分,计算所述多个待推送新闻的特征的兴趣权值并进行记录。
8.根据权利要求6-7任一项所述的新闻推荐系统,其中,所述搜索查询数据包括查询词,所述搜索查询数据的特征包括所述查询词的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的所述查询词的查询行为。
9.根据权利要求6-8任一项所述的新闻推荐系统,其中,所述搜索查询数据包括查询结果页上的URL,所述搜索查询数据的特征包括所述URL指向的新闻的类别和主题,所述类型的用户对所述搜索查询数据的行为包括对相同类别或相同主题的新闻的URL的点击行为,或对相同类别或相同主题的新闻上的页面标签的点击行为。
10.根据权利要求6-9任一项所述的新闻推荐系统,其中,所述搜索查询数据包括社交网络账号发布的URL,所述搜索查询数据的特征包括所述URL中包含的域名的类别,所述类型的用户对所述搜索查询数据的行为包括对相同类别的域名对应的URL的点击行为。
CN201410307116.XA 2014-06-30 2014-06-30 新闻推荐方法和系统 Pending CN104036038A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410307116.XA CN104036038A (zh) 2014-06-30 2014-06-30 新闻推荐方法和系统
US15/323,306 US20170154116A1 (en) 2014-06-30 2015-06-25 Method and system for recommending contents based on social network
PCT/CN2015/082282 WO2016000555A1 (zh) 2014-06-30 2015-06-25 基于社交网络的内容、新闻推荐方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410307116.XA CN104036038A (zh) 2014-06-30 2014-06-30 新闻推荐方法和系统

Publications (1)

Publication Number Publication Date
CN104036038A true CN104036038A (zh) 2014-09-10

Family

ID=51466808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410307116.XA Pending CN104036038A (zh) 2014-06-30 2014-06-30 新闻推荐方法和系统

Country Status (1)

Country Link
CN (1) CN104036038A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331419A (zh) * 2014-10-13 2015-02-04 北京奇虎科技有限公司 衡量新闻重要性的方法和装置
CN104331420A (zh) * 2014-10-13 2015-02-04 北京奇虎科技有限公司 判断新闻发布位置的重要性的方法和装置
CN104573054A (zh) * 2015-01-21 2015-04-29 杭州朗和科技有限公司 一种信息推送方法和设备
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
CN104869439A (zh) * 2015-05-14 2015-08-26 无锡天脉聚源传媒科技有限公司 一种视频推送方法及装置
CN104915399A (zh) * 2015-05-29 2015-09-16 百度在线网络技术(北京)有限公司 基于新闻标题的推荐数据处理方法及系统
WO2016000555A1 (zh) * 2014-06-30 2016-01-07 北京奇虎科技有限公司 基于社交网络的内容、新闻推荐方法和系统
CN105528353A (zh) * 2014-09-29 2016-04-27 贝壳网际(北京)安全技术有限公司 新闻搜索方法及装置
CN105554088A (zh) * 2015-12-10 2016-05-04 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105630840A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 一种推送消息的排序方法及装置
CN105721944A (zh) * 2016-01-29 2016-06-29 四川长虹电器股份有限公司 智能电视的新闻资讯推荐方法
CN106294410A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种个性化信息推送时间的确定方法及确定系统
CN106446198A (zh) * 2016-09-29 2017-02-22 北京百度网讯科技有限公司 基于人工智能的新闻推荐方法及装置
CN106471538A (zh) * 2014-09-23 2017-03-01 谷歌公司 通知用户相关内容
CN106534353A (zh) * 2016-12-09 2017-03-22 天脉聚源(北京)传媒科技有限公司 一种新闻推送方法及装置
CN106713486A (zh) * 2017-01-12 2017-05-24 安徽大尺度网络传媒有限公司 一种基于用户数据分析的个性新闻推送服务系统
CN106776697A (zh) * 2016-11-11 2017-05-31 北京小度信息科技有限公司 内容推荐方法及装置
CN106970998A (zh) * 2017-04-06 2017-07-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
CN107203631A (zh) * 2017-05-31 2017-09-26 成都明途科技有限公司 基于互联网技术的高质量新闻推送方法
CN107220336A (zh) * 2017-05-24 2017-09-29 成都明途科技有限公司 通过分析用户喜好的新闻推荐系统
CN107229700A (zh) * 2017-05-24 2017-10-03 成都明途科技有限公司 一种政务资料与新闻的智能推荐系统
CN107885886A (zh) * 2017-12-07 2018-04-06 百度在线网络技术(北京)有限公司 对信息推荐结果排序的方法、装置及服务器
CN108073606A (zh) * 2016-11-10 2018-05-25 北京搜狗科技发展有限公司 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN108874887A (zh) * 2018-05-10 2018-11-23 河海大学常州校区 一种基于用户新闻浏览的大数据分析统计系统及方法
CN109272338A (zh) * 2017-07-18 2019-01-25 上海汽车集团股份有限公司 一种交通信息推送方法、系统和服务器
CN109408735A (zh) * 2018-10-11 2019-03-01 杭州飞弛网络科技有限公司 一种陌生人社交用户画像的生成方法与系统
CN110472021A (zh) * 2018-05-11 2019-11-19 微软技术许可有限责任公司 会话中推荐新闻的技术
CN111601164A (zh) * 2020-05-21 2020-08-28 广州欢网科技有限责任公司 一种智能电视新闻推送方法及系统
CN112685643A (zh) * 2021-01-12 2021-04-20 上海观察者信息技术有限公司 一种新闻信息的推送方法、装置、介质及电子设备
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统
CN114841155A (zh) * 2022-04-21 2022-08-02 科技日报社 主题内容智能聚合方法、装置、电子设备及存储介质
CN114900554A (zh) * 2022-04-28 2022-08-12 北京北春园商贸有限责任公司 一种基于大数据的社交媒体信息精准推送系统及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100281012A1 (en) * 2009-04-29 2010-11-04 Microsoft Corporation Automatic recommendation of vertical search engines
CN101694659B (zh) * 2009-10-20 2012-03-21 浙江大学 基于多主题追踪的个性化网络新闻推送方法
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100281012A1 (en) * 2009-04-29 2010-11-04 Microsoft Corporation Automatic recommendation of vertical search engines
CN101694659B (zh) * 2009-10-20 2012-03-21 浙江大学 基于多主题追踪的个性化网络新闻推送方法
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016000555A1 (zh) * 2014-06-30 2016-01-07 北京奇虎科技有限公司 基于社交网络的内容、新闻推荐方法和系统
US11347818B2 (en) 2014-09-23 2022-05-31 Google Llc Notifying users of relevant content
CN106471538A (zh) * 2014-09-23 2017-03-01 谷歌公司 通知用户相关内容
CN106471538B (zh) * 2014-09-23 2020-01-10 谷歌有限责任公司 通知用户相关内容
US10621250B2 (en) 2014-09-23 2020-04-14 Google Llc Notifying users of relevant content
CN105528353B (zh) * 2014-09-29 2019-10-29 北京猎豹移动科技有限公司 新闻搜索方法及装置
CN105528353A (zh) * 2014-09-29 2016-04-27 贝壳网际(北京)安全技术有限公司 新闻搜索方法及装置
CN104331419A (zh) * 2014-10-13 2015-02-04 北京奇虎科技有限公司 衡量新闻重要性的方法和装置
CN104331420A (zh) * 2014-10-13 2015-02-04 北京奇虎科技有限公司 判断新闻发布位置的重要性的方法和装置
CN105630840A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 一种推送消息的排序方法及装置
CN105630840B (zh) * 2014-11-06 2019-06-28 阿里巴巴集团控股有限公司 一种推送消息的排序方法及装置
CN104573054A (zh) * 2015-01-21 2015-04-29 杭州朗和科技有限公司 一种信息推送方法和设备
CN104573054B (zh) * 2015-01-21 2018-06-01 杭州朗和科技有限公司 一种信息推送方法和设备
CN104809154A (zh) * 2015-03-19 2015-07-29 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
CN104809154B (zh) * 2015-03-19 2019-03-08 百度在线网络技术(北京)有限公司 用于资讯推荐的方法及装置
CN104869439A (zh) * 2015-05-14 2015-08-26 无锡天脉聚源传媒科技有限公司 一种视频推送方法及装置
CN104869439B (zh) * 2015-05-14 2018-03-09 无锡天脉聚源传媒科技有限公司 一种视频推送方法及装置
CN106294410A (zh) * 2015-05-22 2017-01-04 苏宁云商集团股份有限公司 一种个性化信息推送时间的确定方法及确定系统
CN104915399A (zh) * 2015-05-29 2015-09-16 百度在线网络技术(北京)有限公司 基于新闻标题的推荐数据处理方法及系统
CN105554088A (zh) * 2015-12-10 2016-05-04 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105554088B (zh) * 2015-12-10 2019-07-23 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105721944A (zh) * 2016-01-29 2016-06-29 四川长虹电器股份有限公司 智能电视的新闻资讯推荐方法
CN106446198A (zh) * 2016-09-29 2017-02-22 北京百度网讯科技有限公司 基于人工智能的新闻推荐方法及装置
CN108073606B (zh) * 2016-11-10 2021-12-28 北京搜狗科技发展有限公司 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN108073606A (zh) * 2016-11-10 2018-05-25 北京搜狗科技发展有限公司 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN106776697A (zh) * 2016-11-11 2017-05-31 北京小度信息科技有限公司 内容推荐方法及装置
CN106534353A (zh) * 2016-12-09 2017-03-22 天脉聚源(北京)传媒科技有限公司 一种新闻推送方法及装置
CN106713486A (zh) * 2017-01-12 2017-05-24 安徽大尺度网络传媒有限公司 一种基于用户数据分析的个性新闻推送服务系统
CN106970998B (zh) * 2017-04-06 2021-12-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
CN106970998A (zh) * 2017-04-06 2017-07-21 北京奇虎科技有限公司 新闻数据的更新方法及装置
CN107229700A (zh) * 2017-05-24 2017-10-03 成都明途科技有限公司 一种政务资料与新闻的智能推荐系统
CN107220336A (zh) * 2017-05-24 2017-09-29 成都明途科技有限公司 通过分析用户喜好的新闻推荐系统
CN107203631A (zh) * 2017-05-31 2017-09-26 成都明途科技有限公司 基于互联网技术的高质量新闻推送方法
CN109272338A (zh) * 2017-07-18 2019-01-25 上海汽车集团股份有限公司 一种交通信息推送方法、系统和服务器
CN107885886A (zh) * 2017-12-07 2018-04-06 百度在线网络技术(北京)有限公司 对信息推荐结果排序的方法、装置及服务器
CN108874887A (zh) * 2018-05-10 2018-11-23 河海大学常州校区 一种基于用户新闻浏览的大数据分析统计系统及方法
CN110472021A (zh) * 2018-05-11 2019-11-19 微软技术许可有限责任公司 会话中推荐新闻的技术
CN109408735B (zh) * 2018-10-11 2021-06-25 杭州飞弛网络科技有限公司 一种陌生人社交用户画像的生成方法与系统
CN109408735A (zh) * 2018-10-11 2019-03-01 杭州飞弛网络科技有限公司 一种陌生人社交用户画像的生成方法与系统
CN111601164A (zh) * 2020-05-21 2020-08-28 广州欢网科技有限责任公司 一种智能电视新闻推送方法及系统
CN112685643B (zh) * 2021-01-12 2021-10-22 上海观察者信息技术有限公司 一种新闻信息的推送方法、装置、介质及电子设备
CN112685643A (zh) * 2021-01-12 2021-04-20 上海观察者信息技术有限公司 一种新闻信息的推送方法、装置、介质及电子设备
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统
CN114841155A (zh) * 2022-04-21 2022-08-02 科技日报社 主题内容智能聚合方法、装置、电子设备及存储介质
CN114900554A (zh) * 2022-04-28 2022-08-12 北京北春园商贸有限责任公司 一种基于大数据的社交媒体信息精准推送系统及设备
CN114900554B (zh) * 2022-04-28 2023-07-21 河南省中视新科文化产业有限公司 一种基于大数据的社交媒体信息精准推送系统及设备

Similar Documents

Publication Publication Date Title
CN104036038A (zh) 新闻推荐方法和系统
CN104063476A (zh) 基于社交网络的内容推荐方法和系统
US20170154116A1 (en) Method and system for recommending contents based on social network
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US8868621B2 (en) Data extraction from HTML documents into tables for user comparison
US9576251B2 (en) Method and system for processing web activity data
CN1934569B (zh) 集成有用户注释的搜索系统和方法
US9798820B1 (en) Classification of keywords
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN104484431B (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
CN105243087B (zh) It资讯聚合阅读个性化推荐方法
CN102799591B (zh) 一种提供推荐词的方法及装置
CN104008186B (zh) 从目标文本中确定关键词的方法和装置
US20140236954A1 (en) System and method for automating categorization and aggregation of content from network sites
US20110225152A1 (en) Constructing a search-result caption
CN104077388A (zh) 基于搜索引擎的摘要信息提取方法、装置以及搜索引擎
CN104778176A (zh) 一种数据搜索处理方法及装置
CN103514299A (zh) 信息搜索方法和装置
CN101223525A (zh) 关系网络
KR102082208B1 (ko) 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템
CN102298612A (zh) 基于用户社交简档调整搜索结果
CN102375885A (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
US20180096067A1 (en) Creation and optimization of resource contents
US10997264B2 (en) Delivery of contextual interest from interaction information
CN102929939A (zh) 个性化信息的提供方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140910