CN112487291B - 一种基于大数据的个性化新闻推荐方法及装置 - Google Patents

一种基于大数据的个性化新闻推荐方法及装置 Download PDF

Info

Publication number
CN112487291B
CN112487291B CN202011362395.1A CN202011362395A CN112487291B CN 112487291 B CN112487291 B CN 112487291B CN 202011362395 A CN202011362395 A CN 202011362395A CN 112487291 B CN112487291 B CN 112487291B
Authority
CN
China
Prior art keywords
feature
news
features
importance
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011362395.1A
Other languages
English (en)
Other versions
CN112487291A (zh
Inventor
王进
张�浩
于新龙
杨小姜
刘彬
孙开伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yami Technology Guangzhou Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011362395.1A priority Critical patent/CN112487291B/zh
Publication of CN112487291A publication Critical patent/CN112487291A/zh
Application granted granted Critical
Publication of CN112487291B publication Critical patent/CN112487291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及自然语言处理,特别涉及一种基于大数据的个性化新闻推荐方法及系统,所述方法包括获取历史数据,对数据集进行预处理操作,并进行预处理;对数据构建特征工程,建立用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;根据特征的重要性对特征进行选择,保留重要性最高的前50%的特征作为选择的特征;根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户;本发明可以对海量特征进行有效地特征选择,在保证效果的前提下,能减小特征维度,加快模型的训练时间,提高效率,同时降低对内存的要求。

Description

一种基于大数据的个性化新闻推荐方法及装置
技术领域
本发明涉及机器学习、深度学习、自然语言处理、大数据技术领域,特别涉及一种基于大数据的个性化新闻推荐方法及装置。
背景技术
近年来,互联网的迅猛发展给用户带来了海量的信息,导致了用户在面对海量信息时无法快速有效的获取对自己最有用的信息,使得用户对信息的使用效率大大降低,而个性化推荐系统就是解决该问题的一个有力工具。以新闻资讯产业为例,为了提升用户的阅读体验,提高用户的留存时长,常常利用个性化推荐算法为用户自动推荐最感兴趣的新闻,极大提升用户体验。个性化新闻推荐系统需要利用用户的行为数据,通过分析大量用户行为日志,给用户推荐最可能阅读的新闻,为用户提供个性化服务,以此来提高新闻资讯产品的点击率和转化率。
发明内容
为了解决上述问题,本发明提出一种基于大数据的个性化新闻推荐方法,如图1,具体包括以下步骤:
获取历史数据,对数据集进行预处理操作;
将历史数据中浏览数和点赞数超过平均值3倍的天数删除,对剩余数据的负样本通过随机采样的方式进行删除,保证正负样本比为1:16;
对数据构建特征工程,建立用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
根据特征的重要性对特征进行选择,保留重要性最高的前50%的特征作为选择的特征;
根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
进一步的,对数据集进行预处理,具体包括以下步骤:
对异常数据进行清洗,包括删除一秒钟内浏览新闻数超过20的用户,删除一个月内每天在同一时间在多个平台同时登录账号的用户,删除浏览次数大于用户数的新闻;
为每一个字段的缺失值生成一个满足正态分布的随机向量来作为特征隐向量,并让该特征隐向量加上一个0到1的随机数作为扰动因子。
进一步的,根据特征的重要性对特征进行选择包括:
使用LightGBM训练模型训练得到每个特征的重要性,得到特征重要性集合w′=(w′1,w′2,...,w′i,...,w′n),其中,w′i表示第i个特征的重要性;
使用Embedding+Attention+Dense神经网络训练模型对特征的重要性训练,一共训练至少m次;
结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型,获取最终的重要性得分。
进一步的,特征k最终的重要性得分表示为:
Figure BDA0002804367500000021
其中,wij表示第i轮中第j个特征的重要性。
进一步的,利用结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型当前的AUC值对特征k最终的重要性得分进行加权,加权后的特征k最终的重要性得分表示为:
Figure BDA0002804367500000022
其中,Wk表示加权后的特征k最终的重要性得分,AUCi表示第i轮模型的AUC值。
进一步的,根据选择的特征建立深度学习模型并进行模型融合操作具体包括:
把用户时序特征构造成一个维度为(8,11)的二维向量,其中8是指时序特征的天数,11是指时序特征的个数,后面接入双向的LSTM层来提取特征的时序信息,得到时序特征;
为离散型特征随机初始化特征嵌入矩阵,通过embedding层得到特征向量,然后分别用长度为2、3、4的卷积核做卷积和池化操作,再把得到的结果拼接起来得到离散特征;
将特征取值个数超过10000的作为连续特征,把时序特征、离散特征和连续特征拼接起来输入到3层的DNN模型中,每一层的神经元个数分别为256、128、64,在该神经网络中的输出层得到点击率。
本发明还提出一种基于大数据的个性化新闻推荐系统,所述系统包括特征获取模块、特征预处理模块、特征工程构建模块、特征选择模块、特征融合模块,其中:
特征获取模块,用于从获取的原始数据中获取用户或者新闻的特征;
特征预处理模块,用于对特征进行预处理,包括对异常数据进行清洗并在清洗后的数据中加入扰动;
特征工程构建模块,用于根据原始数据构建用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
特征选择模块,用于根据LightGBM训练模型和Embedding+Attention+Dense神经网络训练模型分别获取特征的重要性,并根据获取的重要性计算特征最终的重要性,并选择该最终重要性最大的前50%的特征作为选择的特征;
特征融合模块,用于根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
本发明可以对海量特征进行有效地特征选择,在保证效果的前提下,能减小特征维度,加快模型的训练时间,提高效率,同时降低对内存的要求。
附图说明
图1为本发明实施例一提供一种基于大数据的个性化新闻推荐方法的流程图;
图2为本发明实施例一提供一种基于大数据的个性化新闻推荐方法的特征选择模型图;
图3为本发明实施例一提供一种基于大数据的个性化新闻推荐方法的模型融合流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于大数据的个性化新闻推荐方法,如图1,具体包括以下步骤:
获取历史数据,对数据集进行预处理操作;
将历史数据中浏览数和点赞数超过平均值3倍的天数删除,对剩余数据的负样本通过随机采样的方式进行删除,保证正负样本比为1:16;
对数据构建特征工程,建立用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
根据特征的重要性对特征进行选择,保留重要性最高的前50%的特征作为选择的特征;
根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
实施例1
获取用户的历史数据,并对获取的数据集进行以下处理:
对异常数据进行清洗,删除一秒钟内浏览新闻数超过20的用户,删除一个月内每天在同一时间在多个平台同时登录账号的用户,删除浏览次数大于用户数的新闻;
为每一个字段的缺失值生成一个满足正太分布的随机向量来作为CTR模型的特征隐向量,并让该特征隐向量加上一个0到1的随机数作为扰动因子。
根据数据集划分训练集、验证集和测试集操作,具体如下:选取最近一年的数据,统计数据中用户和新闻每天浏览数和点赞数的分布,删除浏览数和点赞数超过平均值3倍的天数,再对剩余数据的负样本通过随机采样的方式进行删除,保证正负样本比为1∶16,最后选择前10个月的数据作为训练集,后2个月的数据作为验证集,线上实时数据作为测试集。
对数据构建特征工程操作,具体如下:
将用户的年龄、性别、职业、学历、家乡、用户等级的onehot特征作为用户属性特征;
将用户最近7、30、60、120天内对某个类别的新闻的浏览、点赞、评论、收藏、转发、举报数,用户对某个类别的新闻的停留时长的最大值、最小值、均值、中位数、总和作为用户的用户行为特征;
将新闻的类别、来源的onehot特征,新闻浏览数、点赞数、评论数、收藏数、转发数、举报数作为新闻属性特征;
将用户所处地理位置、天气、用户所用的产品设备、产品版本号的onehot特征作为上下文特征;
新闻标题输入到XLNet模型来提取新闻标题的语义向量,再用CNN模型对语义向量卷积池化来自动提取特征,最后输入到全连接层来提取高阶特征,得到新闻标题的语义特征。
对特征进行特征选择操作,如图2,具体如包括:
使用LightGBM训练模型,获取训练后的特征重要性,得到特征重要性集合w′=(w′1,w′2,...,w′i,...,w′n),其中,w′i表示第i个特征的重要性;
使用Embedding+Attention+Dense神经网络训练模型,一共训练m(m=10)轮,获取每一轮网络Attention层的特征权重作为特征的重要性,即第i轮的特征重要性集合wi=(wi1,w′i2,...,wij,...,win),其中,wij表示第i轮中第j个特征的重要性;
计算每一个特征的特征重要性,其中第k个特征的特征重要性
Figure BDA0002804367500000061
最后保留特征重要性最高的50%的特征。
作为一种优选的实施方式,本发明对第k个特征的特征重要性进行进一步加权处理,保证筛选的重要性能够更加清晰反映用户行为,利用结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型当前的AUC值对特征k最终的重要性得分进行加权,加权后的特征k最终的重要性得分表示为:
Figure BDA0002804367500000062
其中,Wk表示加权后的特征k最终的重要性得分,AUCi表示第i轮模型的AUC值。
在进行计算特征的重要性后,可以根据特征的类别对特征进行加权,本实施例中包括用户属性特征、用户时序特征、新闻属性特征、上下文属性特征、新闻标题语义特征,将这些特征分别作为一个类别,每个类别下面有更小的特征,针对被选择的某个类别中的特征,随机生成一组和为1的特征权重,分别随机赋值给每个特征,增加随机性。
根据特征建立深度学习模型并进行模型融合操作,如图3,具体包括:
把用户时序特征构造成一个维度为(8,11)的二维向量,其中8是指时序特征的天数,11是指时序特征的个数,后面接入双向的LSTM层来提取特征的时序信息;
为离散型特征随机初始化特征嵌入矩阵,通过embedding层得到特征向量,然后分别用长度为2、3、4的卷积核做卷积和池化操作,再把得到的结果拼接起来;
将得到的特征信息和连续型特征拼接起来,输入到3层的DNN模型中,每一层的神经元个数分别为256、128、64,最后再输入给输出层得到最终的结果。
通过构建的模型,给用户推荐最可能点击的新闻操作,即使用训练后获得的最终模型,预测用户对新闻的点击率,最终保留点击率大于0.75的新闻作为推荐给用户的新闻,点击率越大,推荐位置越靠前。
实施例2
本实施例提出一种基于大数据的个性化新闻推荐系统,所述系统包括特征获取模块、特征预处理模块、特征工程构建模块、特征选择模块、特征融合模块,其中:
特征获取模块,用于从获取的原始数据中获取用户或者新闻的特征;
特征预处理模块,用于对特征进行预处理,包括对异常数据进行清洗并在清洗后的数据中加入扰动;
特征工程构建模块,用于根据原始数据构建用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
特征选择模块,用于根据LightGBM训练模型和Embedding+Attention+Dense神经网络训练模型分别获取特征的重要性,并根据获取的重要性计算特征最终的重要性,并选择该最终重要性最大的前50%的特征作为选择的特征;
特征融合模块,用于根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
在上述系统的基础上,特征选择模块根据特征的重要性对特征进行选择包括:
使用LightGBM训练模型训练得到每个特征的重要性,得到特征重要性集合w′=(w′1,w′2,...,w′i,...,w′n),其中,w′i表示第i个特征的重要性;
使用Embedding+Attention+Dense神经网络训练模型对特征的重要性训练,一共训练至少m次;
结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型,获取最终的重要性得分。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种基于大数据的个性化新闻推荐方法,其特征在于,包括以下步骤:
获取历史数据,对数据集进行预处理操作;
将历史数据中浏览数和点赞数超过平均值3倍的天数删除,对剩余数据的负样本通过随机采样的方式进行删除,保证正负样本比为1:16;
对数据构建特征工程,建立用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
根据特征的重要性对特征进行选择,保留重要性最高的前50%的特征作为选择的特征;选择过程包括以下步骤:
使用LightGBM训练模型训练得到每个特征的重要性,得到特征重要性集合w′=(w′1,w′2,...,w′i,...,w′n),其中,w′i表示第i个特征的重要性;
使用Embedding+Attention+Dense神经网络训练模型对特征的重要性训练,一共训练至少m次;
结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型,获取最终的重要性得分,特征k最终的重要性得分表示为:
Figure FDA0003619825650000011
其中,wij表示第i轮中第j个特征的重要性;
利用结合LightGBM训练模型训练的重要性和Embedding+Attention+Dense神经网络训练模型当前的AUC值对特征k最终的重要性得分进行加权,加权后的特征k最终的重要性得分表示为:
Figure FDA0003619825650000012
其中,Wk表示加权后的特征k最终的重要性得分,AUCi表示第i轮模型的AUC值;
根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
2.根据权利要求1所述的一种基于大数据的个性化新闻推荐方法,其特征在于,对数据集进行预处理,具体包括以下步骤:
对异常数据进行清洗,包括删除一秒钟内浏览新闻数超过20的用户,删除一个月内每天在同一时间在多个平台同时登录账号的用户,删除浏览次数大于用户数的新闻;
为每一个字段的缺失值生成一个满足正态分布的随机向量来作为特征隐向量,并让该特征隐向量加上一个0到1的随机数作为扰动因子。
3.根据权利要求1所述的一种基于大数据的个性化新闻推荐方法,其特征在于,用户属性特征至少包括用户的年龄、性别、职业、学历、家乡、用户等级的one-hot特征;用户时序特征用户至少包括最近1、2、3、7、15、30、60、120天内对某个类别的新闻的浏览、点赞、评论、收藏、转发、举报数和停留时长的最大值、最小值、均值、中位数、总和;新闻属性特征至少包括新闻的类别、来源的one-hot特征,以及新闻浏览数、点赞数、评论数、收藏数、转发数、举报数;上下文属性特征至少包括户所处地理位置、天气、用户所用的产品设备、产品版本号的one-hot特征;新闻标题语义特征为将新闻标题输入到XLNet模型来提取新闻标题的语义向量,用CNN模型对语义向量卷积池化来自动提取特征,并输入到全连接层来提取的高阶特征。
4.根据权利要求1所述的一种基于大数据的个性化新闻推荐方法,其特征在于,根据选择的特征建立深度学习模型并进行模型融合操作具体包括:
把用户时序特征构造成一个维度为(8,11)的二维向量,其中8是指时序特征的天数,11是指时序特征的个数,后面接入双向的LSTM层来提取特征的时序信息,得到时序特征;
为离散型特征随机初始化特征嵌入矩阵,通过embedding层得到特征向量,然后分别用长度为2、3、4的卷积核做卷积和池化操作,再把得到的结果拼接起来得到离散特征;
将特征取值个数超过10000的作为连续特征,把时序特征、离散特征和连续特征拼接起来输入到3层的DNN模型中,每一层的神经元个数分别为256、128、64,在该神经网络中的输出层得到点击率。
5.一种基于大数据的个性化新闻推荐系统,其特征在于,用于实现权利要求1所述的一种基于大数据的个性化新闻推荐方法,所述系统包括特征获取模块、特征预处理模块、特征工程构建模块、特征选择模块、特征融合模块,其中:
特征获取模块,用于从获取的原始数据中获取用户和新闻的特征;
特征预处理模块,用于对特征进行预处理,包括对异常数据进行清洗并在清洗后的数据中加入扰动;
特征工程构建模块,用于根据原始数据构建用户属性特征、用户时序特征、新闻属性特征、上下文属性特征以及新闻标题语义特征;
特征选择模块,用于根据LightGBM训练模型和Embedding+Attention+Dense神经网络训练模型分别获取特征的重要性,并根据获取的重要性计算特征最终的重要性,并选择该最终重要性最大的前50%的特征作为选择的特征;
特征融合模块,用于根据选择的特征建立深度学习模型并进行模型融合操作,利用该模型对实时数据进行预测,将预测的点击率大于0.75的新闻推荐给用户。
CN202011362395.1A 2020-11-28 2020-11-28 一种基于大数据的个性化新闻推荐方法及装置 Active CN112487291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011362395.1A CN112487291B (zh) 2020-11-28 2020-11-28 一种基于大数据的个性化新闻推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011362395.1A CN112487291B (zh) 2020-11-28 2020-11-28 一种基于大数据的个性化新闻推荐方法及装置

Publications (2)

Publication Number Publication Date
CN112487291A CN112487291A (zh) 2021-03-12
CN112487291B true CN112487291B (zh) 2022-06-10

Family

ID=74936550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011362395.1A Active CN112487291B (zh) 2020-11-28 2020-11-28 一种基于大数据的个性化新闻推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112487291B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699309A (zh) * 2021-03-23 2021-04-23 北京搜狐新媒体信息技术有限公司 资源推荐方法、装置、可读介质以及设备
CN112800234B (zh) * 2021-04-15 2021-06-22 腾讯科技(深圳)有限公司 信息处理方法、装置、电子设备和存储介质
CN113066544B (zh) * 2021-04-22 2022-04-15 重庆师范大学 基于CAA-Net与LightGBM的FVEP特征点检测方法
CN113590806B (zh) * 2021-08-02 2022-05-27 山东建筑大学 基于对象三元语言概念的个性化新闻推荐方法及系统
CN116977035A (zh) * 2023-09-25 2023-10-31 临沂大学 一种基于LightGBM和深度学习的农产品推荐方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018065045A1 (en) * 2016-10-05 2018-04-12 Telecom Italia S.P.A. Method and system for estimating energy generation based on solar irradiance forecasting
CN107944913A (zh) * 2017-11-21 2018-04-20 重庆邮电大学 基于大数据用户行为分析的高潜在用户购买意向预测方法
CN107944986A (zh) * 2017-12-28 2018-04-20 广东工业大学 一种o2o商品推荐方法、系统及设备
CN110534164A (zh) * 2019-09-26 2019-12-03 广州费米子科技有限责任公司 基于深度学习的药物分子生成方法
CN110908709A (zh) * 2019-11-25 2020-03-24 中山大学 一种基于代码更改关键类判定的代码提交注释预测方法
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111967267A (zh) * 2020-09-23 2020-11-20 中国科学院计算技术研究所厦门数据智能研究院 一种基于XLNet的新闻文本地域提取的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018065045A1 (en) * 2016-10-05 2018-04-12 Telecom Italia S.P.A. Method and system for estimating energy generation based on solar irradiance forecasting
CN107944913A (zh) * 2017-11-21 2018-04-20 重庆邮电大学 基于大数据用户行为分析的高潜在用户购买意向预测方法
CN107944986A (zh) * 2017-12-28 2018-04-20 广东工业大学 一种o2o商品推荐方法、系统及设备
CN110534164A (zh) * 2019-09-26 2019-12-03 广州费米子科技有限责任公司 基于深度学习的药物分子生成方法
CN110908709A (zh) * 2019-11-25 2020-03-24 中山大学 一种基于代码更改关键类判定的代码提交注释预测方法
CN111209386A (zh) * 2020-01-07 2020-05-29 重庆邮电大学 一种基于深度学习的个性化文本推荐方法
CN111967267A (zh) * 2020-09-23 2020-11-20 中国科学院计算技术研究所厦门数据智能研究院 一种基于XLNet的新闻文本地域提取的方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Yuan Wang 等.Multi-modal Remote Sensing Image Description Based on Word Embedding and Self-Attention Mechanism.《2019 3rd International Symposium on Autonomous Systems (ISAS)》.2019, *
张晓凤 等.基于AUC统计量的随机森林变量重要性评分的研究.《中国卫生统计》.2016,第33卷(第3期), *
张浩.基于BERT模型的中老年个性化新闻推荐系统.《中国优秀硕士学位论文全文数据库 信息科技辑》.2022,(第03期), *

Also Published As

Publication number Publication date
CN112487291A (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
CN112487291B (zh) 一种基于大数据的个性化新闻推荐方法及装置
US11893071B2 (en) Content recommendation method and apparatus, electronic device, and storage medium
CN111008278B (zh) 内容推荐方法及装置
WO2022161202A1 (zh) 多媒体资源分类模型训练方法和多媒体资源推荐方法
CN112749608B (zh) 视频审核方法、装置、计算机设备和存储介质
CN112131350B (zh) 文本标签确定方法、装置、终端及可读存储介质
CN111382361B (zh) 信息推送方法、装置、存储介质和计算机设备
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN110781406B (zh) 一种基于变分自动编码器的社交网络用户多属性推断方法
CN113590948B (zh) 信息推荐方法、装置、设备以及计算机存储介质
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN112085565A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN110390052A (zh) 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN112528163A (zh) 一种基于图卷积网络的社交平台用户职业预测方法
CN112036659B (zh) 基于组合策略的社交网络媒体信息流行度预测方法
CN112148831A (zh) 图文混合检索方法、装置、存储介质、计算机设备
CN111784062A (zh) 点击概率预测方法、系统、电子设备和介质
CN115221396A (zh) 基于人工智能的信息推荐方法、装置及电子设备
CN116542395A (zh) 一种低碳楼宇监测系统及方法
CN114693409A (zh) 产品匹配方法、装置、计算机设备、存储介质和程序产品
CN113409157B (zh) 一种跨社交网络用户对齐方法以及装置
CN112989182A (zh) 信息处理方法、装置、信息处理设备及存储介质
CN116703509A (zh) 一种针对直播营销商品质量感知分析的网购助手构建方法
CN116010696A (zh) 融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230526

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Yami Technology (Guangzhou) Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right