CN117708434A - 一种基于关键词的用户推荐浏览内容生成方法 - Google Patents
一种基于关键词的用户推荐浏览内容生成方法 Download PDFInfo
- Publication number
- CN117708434A CN117708434A CN202410031554.1A CN202410031554A CN117708434A CN 117708434 A CN117708434 A CN 117708434A CN 202410031554 A CN202410031554 A CN 202410031554A CN 117708434 A CN117708434 A CN 117708434A
- Authority
- CN
- China
- Prior art keywords
- browsing
- paragraph
- keyword
- paragraphs
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims description 37
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000012216 screening Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于关键词的用户推荐浏览内容生成方法,属于数据处理技术领域,包括以下步骤:S1、获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;S2:计算历史浏览新闻文稿中各个段落的关联权重值;S3:为各个历史浏览新闻文稿生成关键浏览段落集合;S4:根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿。该方法可以实现历史浏览新闻文稿内容的多段落融合,高精度地生成推荐内容,同时,限制推荐篇数,避免出现推荐不准确的情况。
Description
技术领域
本发明属于数据处理技术领域,具体涉及一种基于关键词的用户推荐浏览内容生成方法。
背景技术
互联网规模和应用面的迅速增长逐渐产生了越来越严重的信息过载问题。过量信息同时呈现,使得用户无法轻易从中获得对自己有用的部分。例如:在中文谷歌搜索引擎中以“推荐系统”作为关键词进行搜索时可获得超过1000万条查询结果。
目前浏览内容智能推荐技术大多只根据用户浏览文稿的某种偏好需求进行推荐,导致推荐深度不够,且推荐浏览篇数过多,使得推荐效果不佳,影响用户的新闻推荐体验感。
发明内容
本发明为了解决以上问题,提出了一种基于关键词的用户推荐浏览内容生成方法。
本发明的技术方案是:一种基于关键词的用户推荐浏览内容生成方法包括以下步骤:
S1、获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;
S2:计算历史浏览新闻文稿中各个段落的权重序列,并根据各个段落的权重序列确定各个段落的关联权重值;
S3:根据各个段落的关联权重值,筛选存在浏览关键词的关键浏览段落,为各个历史浏览新闻文稿生成关键浏览段落集合;
S4:从各个历史浏览新闻文稿的关键浏览段落集合中提取关键词集合,并根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿。
进一步地,S2包括以下子步骤:
S21、将历史浏览新闻文稿的各个段落拆分为若干个完整的句子,并计算各个句子在所处段落的权重占比值;
S22、根据各个句子在所处段落的权重占比值,筛选各个段落的有效句子,并将所有有效句子对应的权重占比值作为段落的权重序列;
S23、根据各个段落的权重序列,计算历史浏览新闻文稿中各个段落的关联权重值。
进一步地,S21中,句子在所处段落的权重占比值k的计算公式为:;式中,c表示常数,dl表示句子中第l个单词的词频,M表示段落的句子个数,e表示指数,L表示句子的单词个数。
进一步地,S22中,筛选各个段落的有效句子的具体方法为:将段落中所有句子的权重占比值从大到小排序,并将排序中前个权重占比值对应的句子作为有效句子;其中,max(·)表示最大值运算,A表示历史浏览新闻文稿的段落个数,int(·)表示取整运算,ε表示极小值。
进一步地,S23中,段落的关联权重值f的计算公式为:;式中,Kn+1表示段落中第n+1个有效句子的权重占比值,Kn表示段落中第n个有效句子的权重占比值,N表示段落的有效句子个数,Kmax表示段落的最大权重占比值,Kmin表示段落的最小权重占比值。
进一步地,S3中,为各个历史浏览新闻文稿生成关键浏览段落集合的具体方法为:根据各个段落的关联权重值,计算历史浏览新闻文稿的关联阈值,将小于关联阈值的关联权重值对应的段落剔除,将剩余段落作为存在浏览关键词的关键浏览段落,生成关键浏览段落集合。
进一步地,历史浏览新闻文稿的关联阈值η的计算公式为:;式中,A表示历史浏览新闻文稿的段落个数,fa表示第a个段落的关联权重值。
进一步地,S4包括以下子步骤:
S41、利用TextRank算法提取关键浏览段落集合中各个关键浏览段落的关键词,为历史浏览新闻文稿生成关键词集合;
S42、提取关键词集合中各个关键词的词向量,为历史浏览新闻文稿生成关键词矩阵,将关键词矩阵的值作为历史浏览新闻文稿的浏览阈值;
S43、对所有历史浏览新闻文稿的浏览阈值进行取均值运算后再进行取整运算,并将取整运算结果作为推荐浏览新闻文稿的篇数H;
S44、获取用户的未浏览新闻文稿,并计算各个未浏览新闻文稿标题与所有关键词集合的相似度,将相似度最高的前H篇未浏览新闻文稿作为推荐浏览新闻文稿。
进一步地,S42中,关键词矩阵的生成方法具体为:将段落个数作为关键词矩阵的行数,将所有段落中关键词个数的最大值作为关键词矩阵的列数;根据各个关键词的词向量计算各个关键词的矩阵标签值,将各个段落中各个关键词的矩阵标签值从小到大排列,作为关键词矩阵各行的元素,空余处用1补齐,生成关键词矩阵。
进一步地,关键词的矩阵标签值σ的计算公式为:;式中,g表示关键词的字符长度,X表示关键词的词向量。
本发明的有益效果是:本发明提出一种基于关键词的用户推荐浏览内容生成方法,对用户的历史浏览新闻文稿进行分段,通过关联权重值筛选存在关键词的段落,再从关键段落集合中提取关键词集合,根据未浏览新闻文稿标题与关键词集合的相似度生成最终的推荐内容。该方法可以实现历史浏览新闻文稿内容的多段落融合,高精度地生成推荐内容,同时,限制推荐篇数,避免出现推荐不准确的情况。
附图说明
图1为基于关键词的用户推荐浏览内容生成方法的流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
如图1所示,本发明提供了一种基于关键词的用户推荐浏览内容生成方法,包括以下步骤:
S1、获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;
S2:计算历史浏览新闻文稿中各个段落的权重序列,并根据各个段落的权重序列确定各个段落的关联权重值;
S3:根据各个段落的关联权重值,筛选存在浏览关键词的关键浏览段落,为各个历史浏览新闻文稿生成关键浏览段落集合;
S4:从各个历史浏览新闻文稿的关键浏览段落集合中提取关键词集合,并根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿。
在本发明实施例中,S2包括以下子步骤:
S21、将历史浏览新闻文稿的各个段落拆分为若干个完整的句子,并计算各个句子在所处段落的权重占比值;
S22、根据各个句子在所处段落的权重占比值,筛选各个段落的有效句子,并将所有有效句子对应的权重占比值作为段落的权重序列;
S23、根据各个段落的权重序列,计算历史浏览新闻文稿中各个段落的关联权重值。
在本发明中,将历史浏览新闻文稿拆分为若干个段落后,各个段落存在多个句子,并非每个句子都存在关键词,所以需要段落的句子进行有效筛选,得到含有关键词的句子,再根据含有关键词的句子来计算各个段落的关联权重值,由上述过程计算得到的关联权重值可以表征段落在历史浏览新闻文稿中的重要性。
在本发明实施例中,S21中,句子在所处段落的权重占比值k的计算公式为:;式中,c表示常数,dl表示句子中第l个单词的词频,M表示段落的句子个数,e表示指数,L表示句子的单词个数。
在本发明中,一个单词的词频越高,表示该单词在段落中出现的频率越高,可以用于评估句子在整个段落的重要程度。由句子中各个单词的词频确定句子在段落的权重占比值,单词的词频越大,该句子在段落的权重占比值越高,表示该句子在整个段落的重要程度越高。
在本发明实施例中,S22中,筛选各个段落的有效句子的具体方法为:将段落中所有句子的权重占比值从大到小排序,并将排序中前个权重占比值对应的句子作为有效句子;其中,max(·)表示最大值运算,A表示历史浏览新闻文稿的段落个数,int(·)表示取整运算,ε表示极小值。
在本发明中,在确定各个段落中有效句子个数时,在新闻文稿的1/2段落数(取整)与10之间取最大值,将每个段落中可包含的有效句子个数设置为最多10个,可以有效减少整体推荐算法的复杂程度。
在本发明实施例中,S23中,段落的关联权重值f的计算公式为:;式中,Kn+1表示段落中第n+1个有效句子的权重占比值,Kn表示段落中第n个有效句子的权重占比值,N表示段落的有效句子个数,Kmax表示段落的最大权重占比值,Kmin表示段落的最小权重占比值。
在本发明实施例中,S3中,为各个历史浏览新闻文稿生成关键浏览段落集合的具体方法为:根据各个段落的关联权重值,计算历史浏览新闻文稿的关联阈值,将小于关联阈值的关联权重值对应的段落剔除,将剩余段落作为存在浏览关键词的关键浏览段落,生成关键浏览段落集合。
在本发明中,历史浏览新闻文稿虽然存在多个段落,但有些段落起到承上启下的作用,与用户感兴趣的内容不存在太大关系,因此利用所有段落的关联权重值对段落进行筛选,进一步精确对标题生成有影响的段落,减少冗余段落的干扰,使得生成的推荐内容更贴近用户。
在本发明实施例中,历史浏览新闻文稿的关联阈值η的计算公式为:;式中,A表示历史浏览新闻文稿的段落个数,fa表示第a个段落的关联权重值。
在本发明实施例中,S4包括以下子步骤:
S41、利用TextRank算法提取关键浏览段落集合中各个关键浏览段落的关键词,为历史浏览新闻文稿生成关键词集合;
S42、提取关键词集合中各个关键词的词向量,为历史浏览新闻文稿生成关键词矩阵,将关键词矩阵的值作为历史浏览新闻文稿的浏览阈值;
S43、对所有历史浏览新闻文稿的浏览阈值进行取均值运算后再进行取整运算,并将取整运算结果作为推荐浏览新闻文稿的篇数H;
S44、获取用户的未浏览新闻文稿,并计算各个未浏览新闻文稿标题与所有关键词集合的相似度,将相似度最高的前H篇未浏览新闻文稿作为推荐浏览新闻文稿。
在本发明中,在推荐内容生成任务中,根据关键词的词向量,生成整个历史浏览新闻文稿对应的关键词矩阵,由此生成的关键词矩阵的值可以用于约束推荐浏览新闻文稿标题的篇数,防止推荐浏览新闻篇数过多而导致推荐不准确。另外,为防止关键词矩阵的值不是整数,需对关键词矩阵的值进行取整运算。
在本发明实施例中,S42中,关键词矩阵的生成方法具体为:将段落个数作为关键词矩阵的行数,将所有段落中关键词个数的最大值作为关键词矩阵的列数;根据各个关键词的词向量计算各个关键词的矩阵标签值,将各个段落中各个关键词的矩阵标签值从小到大排列,作为关键词矩阵各行的元素,空余处用1补齐,生成关键词矩阵。
在本发明实施例中,关键词的矩阵标签值σ的计算公式为:;式中,g表示关键词的字符长度,X表示关键词的词向量。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (10)
1.一种基于关键词的用户推荐浏览内容生成方法,其特征在于,包括以下步骤:
S1、获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;
S2:计算历史浏览新闻文稿中各个段落的权重序列,并根据各个段落的权重序列确定各个段落的关联权重值;
S3:根据各个段落的关联权重值,筛选存在浏览关键词的关键浏览段落,为各个历史浏览新闻文稿生成关键浏览段落集合;
S4:从各个历史浏览新闻文稿的关键浏览段落集合中提取关键词集合,并根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿。
2.根据权利要求1所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S2包括以下子步骤:
S21、将历史浏览新闻文稿的各个段落拆分为若干个完整的句子,并计算各个句子在所处段落的权重占比值;
S22、根据各个句子在所处段落的权重占比值,筛选各个段落的有效句子,并将所有有效句子对应的权重占比值作为段落的权重序列;
S23、根据各个段落的权重序列,计算历史浏览新闻文稿中各个段落的关联权重值。
3.根据权利要求2所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S21中,句子在所处段落的权重占比值k的计算公式为:;式中,c表示常数,dl表示句子中第l个单词的词频,M表示段落的句子个数,e表示指数,L表示句子的单词个数。
4.根据权利要求2所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S22中,筛选各个段落的有效句子的具体方法为:将段落中所有句子的权重占比值从大到小排序,并将排序中前个权重占比值对应的句子作为有效句子;其中,max(·)表示最大值运算,A表示历史浏览新闻文稿的段落个数,int(·)表示取整运算,ε表示极小值。
5.根据权利要求2所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S23中,段落的关联权重值f的计算公式为:;式中,Kn+1表示段落中第n+1个有效句子的权重占比值,Kn表示段落中第n个有效句子的权重占比值,N表示段落的有效句子个数,Kmax表示段落的最大权重占比值,Kmin表示段落的最小权重占比值。
6.根据权利要求1所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S3中,为各个历史浏览新闻文稿生成关键浏览段落集合的具体方法为:根据各个段落的关联权重值,计算历史浏览新闻文稿的关联阈值,将小于关联阈值的关联权重值对应的段落剔除,将剩余段落作为存在浏览关键词的关键浏览段落,生成关键浏览段落集合。
7.根据权利要求6所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述历史浏览新闻文稿的关联阈值η的计算公式为:;式中,A表示历史浏览新闻文稿的段落个数,fa表示第a个段落的关联权重值。
8.根据权利要求1所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S4包括以下子步骤:
S41、利用TextRank算法提取关键浏览段落集合中各个关键浏览段落的关键词,为历史浏览新闻文稿生成关键词集合;
S42、提取关键词集合中各个关键词的词向量,为历史浏览新闻文稿生成关键词矩阵,将关键词矩阵的值作为历史浏览新闻文稿的浏览阈值;
S43、对所有历史浏览新闻文稿的浏览阈值进行取均值运算后再进行取整运算,并将取整运算结果作为推荐浏览新闻文稿的篇数H;
S44、获取用户的未浏览新闻文稿,并计算各个未浏览新闻文稿标题与所有关键词集合的相似度,将相似度最高的前H篇未浏览新闻文稿作为推荐浏览新闻文稿。
9.根据权利要求8所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述S42中,关键词矩阵的生成方法具体为:将段落个数作为关键词矩阵的行数,将所有段落中关键词个数的最大值作为关键词矩阵的列数;根据各个关键词的词向量计算各个关键词的矩阵标签值,将各个段落中各个关键词的矩阵标签值从小到大排列,作为关键词矩阵各行的元素,空余处用1补齐,生成关键词矩阵。
10.根据权利要求9所述的基于关键词的用户推荐浏览内容生成方法,其特征在于,所述关键词的矩阵标签值σ的计算公式为:;式中,g表示关键词的字符长度,X表示关键词的词向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410031554.1A CN117708434B (zh) | 2024-01-09 | 一种基于关键词的用户推荐浏览内容生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410031554.1A CN117708434B (zh) | 2024-01-09 | 一种基于关键词的用户推荐浏览内容生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708434A true CN117708434A (zh) | 2024-03-15 |
CN117708434B CN117708434B (zh) | 2024-06-28 |
Family
ID=
Citations (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120183A (ja) * | 1997-10-08 | 1999-04-30 | Ntt Data Corp | キーワード抽出方法及び装置 |
JP2002073644A (ja) * | 2000-08-28 | 2002-03-12 | Suuri Giken:Kk | 重要文抽出処理装置、重要文抽出処理方法、および重要文抽出処理プログラムを格納したコンピュータ読み取り可能な記憶媒体 |
JP2002297633A (ja) * | 2001-03-29 | 2002-10-11 | Ricoh Co Ltd | 重要文抽出装置および方法並びにコンピュータプログラム |
US6473730B1 (en) * | 1999-04-12 | 2002-10-29 | The Trustees Of Columbia University In The City Of New York | Method and system for topical segmentation, segment significance and segment function |
CN103295145A (zh) * | 2012-02-28 | 2013-09-11 | 北京星源无限传媒科技有限公司 | 一种基于用户消费特征向量的手机广告投放方法 |
CN104239298A (zh) * | 2013-06-06 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 文本信息推荐方法、服务器、浏览器及系统 |
CN106202150A (zh) * | 2016-06-22 | 2016-12-07 | 北京小米移动软件有限公司 | 信息显示方法及装置 |
CN106227858A (zh) * | 2016-07-28 | 2016-12-14 | 北京橘子文化传媒有限公司 | 一种移动互联网网页或媒体平台文章内容的准确提取方法 |
KR20180049852A (ko) * | 2016-11-03 | 2018-05-14 | 세종대학교산학협력단 | 뉴스 추천 서버 및 이를 이용한 뉴스 추천 방법 |
CN108073606A (zh) * | 2016-11-10 | 2018-05-25 | 北京搜狗科技发展有限公司 | 一种新闻推荐方法和装置、一种用于新闻推荐的装置 |
CN108573411A (zh) * | 2018-04-17 | 2018-09-25 | 重庆理工大学 | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 |
CN109446336A (zh) * | 2018-09-18 | 2019-03-08 | 平安科技(深圳)有限公司 | 新闻筛选的方法、装置、计算机设备和存储介质 |
CN109522402A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网有限公司 | 一种基于电力行业特征关键词的摘要提取方法及存储介质 |
CN110298028A (zh) * | 2019-05-21 | 2019-10-01 | 浙江省北大信息技术高等研究院 | 一种文本段落的关键句提取方法和装置 |
CN110309387A (zh) * | 2018-03-07 | 2019-10-08 | 苏州猫耳网络科技有限公司 | 一种大数据资讯聚合阅读推荐方法 |
CN110532478A (zh) * | 2019-09-04 | 2019-12-03 | 北京人民在线网络有限公司 | 一种基于大数据处理的新闻传播方法 |
CN110929017A (zh) * | 2019-11-25 | 2020-03-27 | 三角兽(北京)科技有限公司 | 文本的推荐方法及装置 |
CN111061939A (zh) * | 2019-12-31 | 2020-04-24 | 西安理工大学 | 基于深度学习的科研学术新闻关键字匹配推荐方法 |
CN111259259A (zh) * | 2020-03-11 | 2020-06-09 | 郑州工程技术学院 | 大学生新闻推荐方法、装置、设备及存储介质 |
CN111435405A (zh) * | 2019-01-15 | 2020-07-21 | 北京行数通科技有限公司 | 一种文章关键句自动标注方法及装置 |
CN112199582A (zh) * | 2020-09-21 | 2021-01-08 | 聚好看科技股份有限公司 | 一种内容推荐方法、装置、设备及介质 |
CN112434232A (zh) * | 2020-11-25 | 2021-03-02 | 浙江兴士烨新材料科技有限公司 | 一种基于互联网的产品关键词广告投放方法及系统 |
CN113268683A (zh) * | 2021-04-15 | 2021-08-17 | 南京邮电大学 | 一种基于多维度的学术文献推荐方法 |
CN113360646A (zh) * | 2021-06-02 | 2021-09-07 | 华院计算技术(上海)股份有限公司 | 基于动态权重的文本生成方法、设备及存储介质 |
CN115858764A (zh) * | 2022-12-28 | 2023-03-28 | 中国南方电网有限责任公司 | 一种文稿推荐方法、装置、设备及介质 |
CN116089738A (zh) * | 2022-11-29 | 2023-05-09 | 长城汽车股份有限公司 | 新闻推荐方法、装置、电子设备及计算机可读存储介质 |
CN116226533A (zh) * | 2023-03-14 | 2023-06-06 | 达而观信息科技(上海)有限公司 | 基于关联性预测模型的新闻关联推荐方法、装置及介质 |
CN116257690A (zh) * | 2023-03-17 | 2023-06-13 | 百度(中国)有限公司 | 一种资源推荐方法、装置、电子设备和存储介质 |
CN116701752A (zh) * | 2023-04-19 | 2023-09-05 | 平安科技(深圳)有限公司 | 基于人工智能的新闻推荐方法、装置、电子设备及介质 |
CN116795947A (zh) * | 2022-03-15 | 2023-09-22 | Tcl科技集团股份有限公司 | 文档推荐方法、装置、电子设备及计算机可读存储介质 |
CN117094291A (zh) * | 2023-10-19 | 2023-11-21 | 济南伊特网络信息有限公司 | 基于智能写作的自动新闻生成系统 |
Patent Citations (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120183A (ja) * | 1997-10-08 | 1999-04-30 | Ntt Data Corp | キーワード抽出方法及び装置 |
US6473730B1 (en) * | 1999-04-12 | 2002-10-29 | The Trustees Of Columbia University In The City Of New York | Method and system for topical segmentation, segment significance and segment function |
JP2002073644A (ja) * | 2000-08-28 | 2002-03-12 | Suuri Giken:Kk | 重要文抽出処理装置、重要文抽出処理方法、および重要文抽出処理プログラムを格納したコンピュータ読み取り可能な記憶媒体 |
JP2002297633A (ja) * | 2001-03-29 | 2002-10-11 | Ricoh Co Ltd | 重要文抽出装置および方法並びにコンピュータプログラム |
CN103295145A (zh) * | 2012-02-28 | 2013-09-11 | 北京星源无限传媒科技有限公司 | 一种基于用户消费特征向量的手机广告投放方法 |
CN104239298A (zh) * | 2013-06-06 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 文本信息推荐方法、服务器、浏览器及系统 |
CN106202150A (zh) * | 2016-06-22 | 2016-12-07 | 北京小米移动软件有限公司 | 信息显示方法及装置 |
CN106227858A (zh) * | 2016-07-28 | 2016-12-14 | 北京橘子文化传媒有限公司 | 一种移动互联网网页或媒体平台文章内容的准确提取方法 |
KR20180049852A (ko) * | 2016-11-03 | 2018-05-14 | 세종대학교산학협력단 | 뉴스 추천 서버 및 이를 이용한 뉴스 추천 방법 |
CN108073606A (zh) * | 2016-11-10 | 2018-05-25 | 北京搜狗科技发展有限公司 | 一种新闻推荐方法和装置、一种用于新闻推荐的装置 |
CN110309387A (zh) * | 2018-03-07 | 2019-10-08 | 苏州猫耳网络科技有限公司 | 一种大数据资讯聚合阅读推荐方法 |
CN108573411A (zh) * | 2018-04-17 | 2018-09-25 | 重庆理工大学 | 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 |
CN109446336A (zh) * | 2018-09-18 | 2019-03-08 | 平安科技(深圳)有限公司 | 新闻筛选的方法、装置、计算机设备和存储介质 |
CN109522402A (zh) * | 2018-10-22 | 2019-03-26 | 国家电网有限公司 | 一种基于电力行业特征关键词的摘要提取方法及存储介质 |
CN111435405A (zh) * | 2019-01-15 | 2020-07-21 | 北京行数通科技有限公司 | 一种文章关键句自动标注方法及装置 |
CN110298028A (zh) * | 2019-05-21 | 2019-10-01 | 浙江省北大信息技术高等研究院 | 一种文本段落的关键句提取方法和装置 |
CN110532478A (zh) * | 2019-09-04 | 2019-12-03 | 北京人民在线网络有限公司 | 一种基于大数据处理的新闻传播方法 |
CN110929017A (zh) * | 2019-11-25 | 2020-03-27 | 三角兽(北京)科技有限公司 | 文本的推荐方法及装置 |
CN111061939A (zh) * | 2019-12-31 | 2020-04-24 | 西安理工大学 | 基于深度学习的科研学术新闻关键字匹配推荐方法 |
CN111259259A (zh) * | 2020-03-11 | 2020-06-09 | 郑州工程技术学院 | 大学生新闻推荐方法、装置、设备及存储介质 |
CN112199582A (zh) * | 2020-09-21 | 2021-01-08 | 聚好看科技股份有限公司 | 一种内容推荐方法、装置、设备及介质 |
CN112434232A (zh) * | 2020-11-25 | 2021-03-02 | 浙江兴士烨新材料科技有限公司 | 一种基于互联网的产品关键词广告投放方法及系统 |
CN113268683A (zh) * | 2021-04-15 | 2021-08-17 | 南京邮电大学 | 一种基于多维度的学术文献推荐方法 |
CN113360646A (zh) * | 2021-06-02 | 2021-09-07 | 华院计算技术(上海)股份有限公司 | 基于动态权重的文本生成方法、设备及存储介质 |
CN116795947A (zh) * | 2022-03-15 | 2023-09-22 | Tcl科技集团股份有限公司 | 文档推荐方法、装置、电子设备及计算机可读存储介质 |
CN116089738A (zh) * | 2022-11-29 | 2023-05-09 | 长城汽车股份有限公司 | 新闻推荐方法、装置、电子设备及计算机可读存储介质 |
CN115858764A (zh) * | 2022-12-28 | 2023-03-28 | 中国南方电网有限责任公司 | 一种文稿推荐方法、装置、设备及介质 |
CN116226533A (zh) * | 2023-03-14 | 2023-06-06 | 达而观信息科技(上海)有限公司 | 基于关联性预测模型的新闻关联推荐方法、装置及介质 |
CN116257690A (zh) * | 2023-03-17 | 2023-06-13 | 百度(中国)有限公司 | 一种资源推荐方法、装置、电子设备和存储介质 |
CN116701752A (zh) * | 2023-04-19 | 2023-09-05 | 平安科技(深圳)有限公司 | 基于人工智能的新闻推荐方法、装置、电子设备及介质 |
CN117094291A (zh) * | 2023-10-19 | 2023-11-21 | 济南伊特网络信息有限公司 | 基于智能写作的自动新闻生成系统 |
Non-Patent Citations (4)
Title |
---|
YE CHEN, YIQUN LIU, MIN ZHANG, AND SHAOPING MA: "User Satisfaction Prediction with Mouse Movement Information in Heterogeneous Search Environment", IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, vol. 29, no. 11, 30 November 2017 (2017-11-30), pages 2470 - 2483 * |
何利益;陆国锋;罗鹏;: "动态新闻主题信息推荐系统设计", 指挥信息系统与技术, no. 04, 28 August 2013 (2013-08-28), pages 37 - 41 * |
张骁逸;苏宇;晏小辉;: "基于用户浏览日志的上下文相关新闻推荐", 计算机工程与应用, no. 22, 26 August 2015 (2015-08-26), pages 103 - 108 * |
申强强,熊泽宇,熊岳山: "一种新的基于段向量的文本自动摘要方法", 计算机工程与科学, vol. 41, no. 6, 30 June 2019 (2019-06-30), pages 1064 - 1070 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133213B (zh) | 一种基于算法的文本摘要自动提取方法与系统 | |
CN104199965B (zh) | 一种语义信息检索方法 | |
CN106484797B (zh) | 基于稀疏学习的突发事件摘要抽取方法 | |
CN108287911B (zh) | 一种基于约束化远程监督的关系抽取方法 | |
CN110413787B (zh) | 文本聚类方法、装置、终端和存储介质 | |
CN109993216B (zh) | 一种基于k最近邻knn的文本分类方法及其设备 | |
CN109902290B (zh) | 一种基于文本信息的术语提取方法、系统和设备 | |
CN111104801B (zh) | 基于网址域名的文本分词方法、系统、设备及介质 | |
CN107885717B (zh) | 一种关键词提取方法及装置 | |
CN111325030A (zh) | 文本标签构建方法、装置、计算机设备和存储介质 | |
CN110866102A (zh) | 检索处理方法 | |
CN111241824A (zh) | 一种用于中文隐喻信息识别的方法 | |
Sabbah et al. | Hybrid support vector machine based feature selection method for text classification. | |
CN111814486A (zh) | 一种基于语义分析的企业客户标签生成方法、系统及装置 | |
CN109509110B (zh) | 基于改进bbtm模型的微博热点话题发现方法 | |
CN102722526B (zh) | 基于词性分类统计的重复网页和近似网页的识别方法 | |
CN112860898A (zh) | 一种短文本框聚类方法、系统、设备及存储介质 | |
CN117708434B (zh) | 一种基于关键词的用户推荐浏览内容生成方法 | |
CN110209765B (zh) | 一种按语义搜索关键词的方法和装置 | |
CN115964495A (zh) | 一种新闻类事件脉络梳理方法及系统 | |
CN117708434A (zh) | 一种基于关键词的用户推荐浏览内容生成方法 | |
CN114996455A (zh) | 一种基于双知识图谱的新闻标题短文本分类方法 | |
CN114691993A (zh) | 基于时间序列的动态自适应话题跟踪方法、系统及装置 | |
CN115309978A (zh) | 一种基于关键长句及正文长度预分类的网页处理方法 | |
CN113934910A (zh) | 一种自动优化、更新的主题库构建方法,及热点事件实时更新方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |