CN109660591A - 个性化新闻的自动推送方法、装置和计算设备 - Google Patents
个性化新闻的自动推送方法、装置和计算设备 Download PDFInfo
- Publication number
- CN109660591A CN109660591A CN201811299563.XA CN201811299563A CN109660591A CN 109660591 A CN109660591 A CN 109660591A CN 201811299563 A CN201811299563 A CN 201811299563A CN 109660591 A CN109660591 A CN 109660591A
- Authority
- CN
- China
- Prior art keywords
- news
- pushed
- user
- user characteristics
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000006399 behavior Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 15
- 238000005065 mining Methods 0.000 claims description 12
- 238000007477 logistic regression Methods 0.000 claims description 10
- 238000000465 moulding Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 description 14
- 238000010801 machine learning Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 241001347978 Major minor Species 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000005441 aurora Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种个性化新闻的自动推送方法和装置。该方法包括:获取待推送的目标用户的用户特征以及待推送新闻的内容特征;将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;将符合所述用户特征的待推送新闻自动推送给所述目标用户。本发明通过将用户特征与新闻的内容特征进行匹配来为用户推荐个性化新闻,能够有效利用所有的内容数据,使推送内容可以覆盖更多的新闻内容,在匹配用户特征的同时不会收敛于用户兴趣类型,为用户带来更佳的阅读体验。同时,通过将符合用户特征的个性化新闻自动推送给目标用户,有效地提高了平台推送新闻的效率。
Description
技术领域
本发明涉及互联网技术领域,特别是一种个性化新闻的自动推送方法、个性化新闻的自动推送装置、计算机存储介质以及计算设备。
背景技术
目前网络传媒发展迅速,用户可以随时随地通过移动设备获取信息。对企业来说,如何在海量的信息中及时为用户推送所需信息成为一个亟待解决的问题。当前背景下,信息流(feed)内容推送,主要有两种形式:第一种是以人工运营为主,大部分中小企业采用该方式。但是,人工运营的推送方式固然可以实现内容推送,但受限于运营人员的经验不同以及人力的成本,内容评价标准及获取内容体量都比较小,且不易扩展。第二种是以自动化运营为代表,部分大型公司采用该方式。但是,自动化运营方式虽然节省了部分运营人力,但推送效果差强人意,且推送内容同质化严重,效果不佳。
现有的信息流内容推送所采用的技术方案主要先根据算法刻画用户的兴趣标签,然后运营人员根据用户的兴趣标签挑选热点文章(新闻),再将所选择的热点文章(新闻)推送给有该兴趣标签的用户。然而,在现有技术方案中,一方面,推送内容只是覆盖到了热点新闻,而热点新闻只占总新闻的很小一部分,不能有效利用除热点新闻外的其他内容,数据利用率低。另一方面,根据用户兴趣做新闻推荐会出现收敛性的问题,导致用户获得有价值内容的概率降低。
因此,亟需一种能够针对用户特征为用户推荐更多有价值的新闻内容,同时又不会收敛于用户兴趣类型的新闻推送方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的个性化新闻的自动推送方法、个性化新闻的自动推送装置、计算机存储介质以及计算设备。
根据本发明实施例的一方面,提供了一种个性化新闻的自动推送方法,包括:
获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;
将符合所述用户特征的待推送新闻自动推送给所述目标用户。
可选地,所述用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
可选地,所述内容特征包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
可选地,获取待推送的目标用户的用户特征,包括:
根据所述目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到所述目标用户的用户特征。
可选地,所述生物特征包括用户的自然属性和/或社会属性。
可选地,所述自然属性包括下列至少之一:
性别、年龄、人生阶段;
所述社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
可选地,所述第一指定算法包括逻辑回归LR模型机器学习算法和embedding聚类算法。
可选地,获取待推送新闻的内容特征,包括:
通过第二指定算法对所述待推送新闻进行挖掘,得到所述待推送新闻的内容特征。
可选地,所述第二指定算法包括embedding聚类算法。
可选地,将符合所述用户特征的待推送新闻自动推送给所述目标用户,包括:
若匹配到多个符合所述用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给所述目标用户。
可选地,所述指定筛选规则包括下列至少之一:
根据与所述用户特征的匹配度进行选择;
根据文章源权威性进行选择;
根据文章点击量进行选择。
可选地,在将符合所述用户特征的待推送新闻自动推送给所述目标用户之前,所述方法还包括:
对符合所述用户特征的待推送新闻的推送参数进行配置;
其中,所述推送参数包括下列至少之一:
发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
根据本发明实施例的另一方面,还提供了一种个性化新闻的自动推送装置,包括:
特征挖掘模块,适于获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
特征匹配模块,适于将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;以及
自动推送模块,适于将符合所述用户特征的待推送新闻自动推送给所述目标用户。
可选地,所述用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
可选地,所述内容特征包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
可选地,所述特征挖掘模块还适于:
根据所述目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到所述目标用户的用户特征。
可选地,所述生物特征包括用户的自然属性和/或社会属性。
可选地,所述自然属性包括下列至少之一:
性别、年龄、人生阶段;
所述社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
可选地,所述第一指定算法包括逻辑回归LR模型机器学习算法和embedding聚类算法。
可选地,所述特征挖掘模块还适于:
通过第二指定算法对所述待推送新闻进行挖掘,得到所述待推送新闻的内容特征。
可选地,所述第二指定算法包括embedding聚类算法。
可选地,所述自动推送模块还适于:
若匹配到多个符合所述用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给所述目标用户。
可选地,所述指定筛选规则包括下列至少之一:
根据与所述用户特征的匹配度进行选择;
根据文章源权威性进行选择;
根据文章点击量进行选择。
可选地,所述装置还包括:
推送配置模块,适于在所述自动推送模块将符合所述用户特征的待推送新闻自动推送给所述目标用户之前,对符合所述用户特征的待推送新闻的推送参数进行配置;
其中,所述推送参数包括下列至少之一:
发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
根据本发明实施例的再一方面,还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行根据上文中任一项所述的个性化新闻的自动推送方法。
根据本发明实施例的又一方面,还提供了一种计算设备,包括:
处理器;以及
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行根据上文中任一项所述的个性化新闻的自动推送方法。
本发明实施例提出的个性化新闻的自动推送方法和装置,首先获取待推送目标用户的用户特征以及待推送新闻的内容特征;然后,通过将用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻;最后,将符合用户特征的待推送新闻自动推送给目标用户。通过将用户特征与新闻的内容特征进行匹配来为用户推荐个性化新闻,能够有效利用所有的内容数据,使推送内容可以覆盖更多的新闻内容,在匹配用户特征的同时不会收敛于用户兴趣类型,为用户带来更佳的阅读体验。同时,通过将符合用户特征的个性化新闻自动推送给目标用户,有效地提高了平台推送新闻的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一实施例的个性化新闻的自动推送方法的流程图;
图2示出了根据本发明一实施例的对待推送新闻的推送参数进行配置的应用场景示意图;
图3示出了根据本发明另一实施例的个性化新闻的自动推送方法的流程图;
图4示出了根据本发明一实施例的个性化新闻的自动推送装置的结构示意图;以及
图5示出了根据本发明另一实施例的个性化新闻的自动推送装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
发明人发现,现有的新闻推送方法主要是根据用户的兴趣标签来选择推送给用户的热点新闻。一种现有的新闻推送方法的具体步骤主要包括:首先,根据相关算法得到用户的兴趣标签。然后,运营人员挑选一个或多个兴趣标签,根据人工经验从全网寻找符合用户的兴趣标签的待推送内容,其中,每个兴趣标签对应一篇文章或统计该标签的热点新闻。最后,根据用户对不同兴趣标签的喜好程度确定热点新闻在推送过程中的比重,将热点新闻进行排序后推送给用户。然而,在该新闻推送方法中,推送内容只是覆盖到了热点新闻,而热点新闻只占总新闻的很小一部分,不能有效利用除热点新闻外的其他内容,数据利用率低。并且,根据用户兴趣做新闻推荐会出现收敛性的问题,导致用户获得有价值内容的概率降低。
为解决上述技术问题,本发明实施例提出一种个性化新闻的自动推送方法。图1示出了根据本发明一实施例的个性化新闻的自动推送方法的流程图。参见图1,该方法至少可以包括以下步骤S102至步骤S106。
步骤S102,获取待推送的目标用户的用户特征以及待推送新闻的内容特征。
步骤S104,将用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻。
步骤S106,将符合用户特征的待推送新闻自动推送给该目标用户。
本发明实施例提出的个性化新闻的自动推送方法,首先获取待推送目标用户的用户特征以及待推送新闻的内容特征;然后,通过将用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻;最后,将符合用户特征的待推送新闻自动推送给目标用户。通过将用户特征与新闻的内容特征进行匹配来为用户推荐个性化新闻,能够有效利用所有的内容数据,使推送内容可以覆盖更多的新闻内容,在匹配用户特征的同时不会收敛于用户兴趣类型,为用户带来更佳的阅读体验。同时,通过将符合用户特征的个性化新闻自动推送给目标用户,有效地提高了平台推送新闻的效率。
上文步骤S102中提及的用户特征表征目标用户的关注点和推送内容需求。优选地,用户特征可以包括性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息中的至少之一。
在一个优选实施例中,可以根据待推送目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到目标用户的用户特征。
上文提及的目标用户的生物特征可以包括用户的自然属性和/或社会属性。
进一步地,用户的自然属性与其自然生理有关,可以包括但不限于性别、年龄和人生阶段等。此处提及的人生阶段可以根据埃里克森人生发展八阶段理论进行划分,包括:婴儿期(0-2岁)、儿童期(2-4岁)、学龄初期(4-7岁)、学龄期(7-12岁)、青春期(12-18岁)、成年早期(18-25岁)、成年期(25-50岁)和成熟期(50岁以上);也可以根据年龄段进行划分,例如,可以包括:童年期(0-6岁)、少年期(7-17岁)、青年期(18-40岁)、中年期(41-65岁)、老年期(66岁以上)等。对于处于不同人生阶段的用户,由于其生理和心理特点的不同,也决定了其关注点和需求的差异。
用户的社会属性与其社会行为有关,可以包括但不限于教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好等。用户的社会属性的不同也决定了其关注点和需求的差异。比如,用户的教育程度越高,则其关注点越倾向于热点新闻、科技信息等。再比如,若用户的社交爱好为旅游,则其需求的推送内容更倾向于旅游、美食资讯等。
可选地,可以从用户的注册信息中提取用户的生物特征。例如,可以从用户在新闻网站或应用程序中填写的注册信息中提取用户的生物特征。
用户的历史浏览行为在一定程度上可以反映用户对不同新闻内容的关注程度和需求,其可以包括但不限于历史点击数、搜索词、阅读时间等。可选地,可以从用户的浏览日志中提取用户的历史浏览行为。
在本发明的可选实施例中,第一指定算法可以包括逻辑回归模型机器学习算法和embedding聚类算法。
逻辑回归(Logistic Regression,LR)模型是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑回归用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,因此,基本上所有的机器学习分类问题都可以使用逻辑回归来求解。
Embedding聚类算法是机器学习分类问题中常用的统计分析方法,用于特征选择和分类。
在实际应用中,可以先采集多个历史用户的生物特征和历史浏览行为,并根据历史用户的生物特征和历史浏览行为,人工进行特征分析。然后,利用历史用户的生物特征和历史浏览行为及其特征分析结果对LR机器学习模型进行训练,得到目标LR模型。进而,利用得到的目标LR模型结合embedding聚类算法,根据目标用户的生物特征和历史浏览行为,挖掘得到目标用户的用户特征。
此外,上文步骤S102中提及的内容特征可以包括文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性中的至少之一。
需要说明的是,本文中所指的新闻应理解为广义上的信息,而不只是电视、或者网络上传播的事件性新闻。具体地,待推送新闻可以包括热点新闻、娱乐信息、社会资讯、小说等等。
在本发明的可选实施例中,第二指定算法可以为embedding聚类算法。
上文步骤S104中,将目标用户的用户特征与待推送新闻的内容特征进行匹配,以得到符合用户特征的待推送新闻。
在一种可选的实施方式中,在进行用户特征与内容特征的匹配之前,先将目标用户的用户特征和待推送新闻的内容特征都标签化。此时,在进行用户特征与内容特征的匹配时,将目标用户的用户特征的标签与待推送新闻的内容特征的标签相比较,若两者相同,则判断该内容特征对应的待推送新闻符合目标用户的用户特征。
例如,对于待推送目标用户a,通过相关算法挖掘得到其用户特征,包括:性别男,教育程度硕士,搜索行为中最高频率搜索词为难民,点击行为中最高点击率内容为叙利亚相关内容。对用户特征进行标签化,可最终得到其用户特征的标签包括“国际_难民_叙利亚”。在将用户a的用户特征与待推送新闻的内容特征匹配时,若待推送新闻b的内容特征的标签也是“国际_难民_叙利亚”,则判断待推送新闻b符合目标用户a的用户特征。需要说明的是,本例中列举的标签仅是示意性的,本发明对标签的内容和形式并不做限制。
在匹配得到符合目标用户的用户特征的待推送新闻之后,进行步骤S106,将符合目标用户的用户特征的待推送新闻自动推送给目标用户。
在本发明的可选实施例中,若匹配到多个符合目标用户的用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给目标用户。
进一步地,在进行待推送新闻的筛选时,可以根据待推送新闻的内容特征与目标用户的用户特征的匹配度来进行选择。具体地,按照待推送新闻的内容特征与目标用户的用户特征的匹配度对多个匹配的待推送新闻进行排序,选择匹配度较高的指定数量个待推送新闻。
在进行待推送新闻的筛选时,还可以根据待推送新闻的文章点击量来进行选择。具体地,按照待推送新闻的文章点击量对多个匹配的待推送新闻进行排序,选择点击量较高的指定数量个待推送新闻。
当目标用户对新闻权威性较为关注时,在进行待推送新闻的筛选时,还可以根据待推送新闻的文章源权威性来进行选择。具体地,按照待推送新闻的文章源权威性对多个匹配的待推送新闻进行排序,选择文章源权威性较高的指定数量个待推送新闻。例如,当目标用户对时事新闻的权威性较为关注时,可以选择权威性最高的新闻媒体(比如路透社)发布的时事新闻推荐给目标用户。
在本发明的可选实施例中,在将符合目标用户的用户特征的待推送新闻自动推送给目标用户之前,该方法还可以包括对符合该用户特征的待推送新闻的推送参数进行配置的步骤,以提高推送的效率,并提升用户的阅读体验。其中,配置的用户参数可以包括发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置等中的至少之一。
图2中示出了根据本发明一实施例对待推送新闻的推送参数进行配置的应用场景示意图。
参照图2所示,在自动化push(推送)配置平台上进行待推送新闻的推送参数的配置。发送方式可以设置为自动发送。进一步地,可以按照平台的配置进行发送。发布系统可以默认设置为Android(安卓)系统,但本发明并不限于此,也可以设置为IOS等其他系统。发布通道可以包括手机浏览器(如360OS、qq手机浏览器等)、浏览器lite版、各厂商的新版浏览器、极光浏览器等。新闻样式可以设置为图标+文字的样式。进一步地,新闻可以包含主副标题,其中主标题可以设为预设信息流名称(比如快咨询),副标题可以设为新闻标题。发送时间可以设置为多个发送时间。例如,可以设置每整点进行一次推送。还可以根据目标用户的职业、阅读时间等设置发送时间。例如,对于上班族的用户,可以设置在早上9点之前、中午12点至1点、下午6点后分别进行推送等。为了保证推送新闻的时效性,还可以设置推送内容的失效时间。例如,将失效时间设为24小时。为了给用户提供更佳、更人性化的使用体验,还可以根据用户的要求设置免打扰和暂停发送配置。
以上介绍了图1所示实施例的各个环节的多种实现方式,下面将通过具体实施例来详细介绍本发明的个性化新闻的自动推送方法的实现过程。
图3示出了根据本发明一具体实施例的个性化新闻的自动推送方法的流程示意图。参见图3所示,该方法可以包括以下步骤S302至步骤S312。
步骤S302,根据待推送的目标用户的生物特征和该目标用户的历史浏览行为,通过LR模型机器学习算法和embedding聚类算法进行挖掘,得到该目标用户的用户特征。
本实施例中,目标用户的生物特征包括用户的自然属性和社会属性。其中,自然属性包括性别、年龄、人生阶段中的至少之一。社会属性包括教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好中的至少之一。所得到的目标用户的用户特征包括性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息中的至少之一。
步骤S304,通过embedding聚类算法对待推送新闻进行挖掘,得到待推送新闻的内容特征。其中,内容特征包括文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性中的至少之一。
步骤S306,将用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻。
在本步骤中,先将目标用户的用户特征和待推送新闻的内容特征都标签化,然后,将目标用户的用户特征的标签与待推送新闻的内容特征的标签相比较,若两者相同,则判断该内容特征对应的待推送新闻符合目标用户的用户特征。
步骤S308,若匹配到多个符合用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻。
在本实施例中,该指定筛选规则包括下列至少之一:根据与用户特征的匹配度进行选择;根据文章源权威性进行选择;根据文章点击量进行选择。
步骤S310,对所选择的符合用户特征的待推送新闻的推送参数进行配置。
在本实施例中,配置的推送参数包括下列至少之一:发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
步骤S312,根据所配置的推送参数将所选择的符合用户特征的待推送新闻自动推送给目标用户。
本发明实施例通过将用户特征与新闻的内容特征标签化进行匹配来为用户推荐个性化新闻,能够有效利用所有的内容数据,使推送内容可以覆盖更多的新闻内容,在准确匹配用户特征的同时不会收敛于用户兴趣类型,为用户带来更佳的阅读体验。同时,通过对符合用户特征的个性化新闻进行筛选后自动推送给目标用户,有效地提高了平台推送新闻的针对性和效率。
基于同一发明构思,本发明实施例还提供了一种个性化新闻的自动推送装置,用于支持上述任意一个实施例或其组合所提供的个性化新闻的自动推送方法。图4示出了根据本发明一实施例的个性化新闻的自动推送装置的结构示意图。参见图4,该装置至少可以包括:特征挖掘模块410、特征匹配模块420以及自动推送模块430。
现介绍本发明实施例的个性化新闻的自动推送装置的各组成或器件的功能以及各部分间的连接关系:
特征挖掘模块410,适于获取待推送的目标用户的用户特征以及待推送新闻的内容特征。
特征匹配模块420,与特征挖掘模块410相连接,适于将该用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻。
自动推送模块430,与特征匹配模块420连接,适于将符合用户特征的待推送新闻自动推送给该目标用户。
在一个可选实施例中,上文提及的用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
在一个可选实施例中,上文提及的内容特征可以包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
在一个可选实施例中,特征挖掘模块410还适于:
根据目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到该目标用户的用户特征。
可选地,上述生物特征可以包括用户的自然属性和/或社会属性。
进一步地,自然属性包括下列至少之一:
性别、年龄、人生阶段;
社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
在一个可选实施例中,第一指定算法可以包括逻辑回归LR模型机器学习算法和embedding聚类算法。
在一个可选实施例中,特征挖掘模块410还适于:
通过第二指定算法对待推送新闻进行挖掘,得到待推送新闻的内容特征。
在一个可选实施例中,第二指定算法可以包括embedding聚类算法。
在一个可选实施例中,自动推送模块430还适于:
若匹配到多个符合用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给目标用户。
进一步地,该指定筛选规则包括下列至少之一:
根据与目标用户的用户特征的匹配度进行选择;
根据文章源权威性进行选择;
根据文章点击量进行选择。
在一个可选实施例中,参见图5所示,图4展示的个性化新闻的自动推送装置还可以包括推送配置模块440。推送配置模块440分别与特征匹配模块420和自动推送模块430连接,适于在自动推送模块430将符合用户特征的待推送新闻自动推送给目标用户之前,对符合用户特征的待推送新闻的推送参数进行配置。其中,配置的推送参数可以包括下列至少之一:发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
基于同一发明构思,本发明实施例还提供了一种计算机存储介质。该计算机存储介质存储有计算机程序代码,当该计算机程序代码在计算设备上运行时,导致计算设备执行根据上述任意一个实施例或其组合所述的个性化新闻的自动推送方法。
基于同一发明构思,本发明实施例还提供了一种计算设备。该计算设备可以包括:
处理器;以及
存储有计算机程序代码的存储器;
当该计算机程序代码被处理器运行时,导致该计算设备执行根据上述任意一个实施例或其组合所述的个性化新闻的自动推送方法。
根据上述任意一个可选实施例或多个可选实施例的组合,本发明实施例能够达到如下有益效果:
本发明实施例提出的个性化新闻的自动推送方法和装置,首先获取待推送目标用户的用户特征以及待推送新闻的内容特征;然后,通过将用户特征与内容特征进行匹配,得到符合用户特征的待推送新闻;最后,将符合用户特征的待推送新闻自动推送给目标用户。通过将用户特征与新闻的内容特征进行匹配来为用户推荐个性化新闻,能够有效利用所有的内容数据,使推送内容可以覆盖更多的新闻内容,在匹配用户特征的同时不会收敛于用户兴趣类型,为用户带来更佳的阅读体验。同时,通过将符合用户特征的个性化新闻自动推送给目标用户,有效地提高了平台推送新闻的效率。
所属领域的技术人员可以清楚地了解到,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
另外,在本发明各个实施例中的各功能单元可以物理上相互独立,也可以两个或两个以上功能单元集成在一起,还可以全部功能单元都集成在一个处理单元中。上述集成的功能单元既可以采用硬件的形式实现,也可以采用软件或者固件的形式实现。
本领域普通技术人员可以理解:所述集成的功能单元如果以软件的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干指令,用以使得一台计算设备(例如个人计算机,服务器,或者网络设备等)在运行所述指令时执行本发明各实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM),磁碟或者光盘等各种可以存储程序代码的介质。
或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的计算设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被计算设备的处理器执行时,所述计算设备执行本发明各实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:在本发明的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明的保护范围。
根据本发明实施例的一方面,提供了A1.一种个性化新闻的自动推送方法,包括:
获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;
将符合所述用户特征的待推送新闻自动推送给所述目标用户。
A2.根据A1所述的方法,其中,所述用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
A3.根据A1所述的方法,其中,所述内容特征包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
A4.根据A1-A3中任一项所述的方法,其中,获取待推送的目标用户的用户特征,包括:
根据所述目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到所述目标用户的用户特征。
A5.根据A4所述的方法,其中,所述生物特征包括用户的自然属性和/或社会属性。
A6.根据A5所述的方法,其中,所述自然属性包括下列至少之一:
性别、年龄、人生阶段;
所述社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
A7.根据A4所述的方法,其中,所述第一指定算法包括逻辑回归LR模型机器学习算法和embedding聚类算法。
A8.根据A1-A3中任一项所述的方法,其中,获取待推送新闻的内容特征,包括:
通过第二指定算法对所述待推送新闻进行挖掘,得到所述待推送新闻的内容特征。
A9.根据A8所述的方法,其中,所述第二指定算法包括embedding聚类算法。
A10.根据A1-A3中任一项所述的方法,其中,将符合所述用户特征的待推送新闻自动推送给所述目标用户,包括:
若匹配到多个符合所述用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给所述目标用户。
A11.根据A10所述的方法,其中,所述指定筛选规则包括下列至少之一:
根据与所述用户特征的匹配度进行选择;
根据文章源权威性进行选择;
根据文章点击量进行选择。
A12.根据A1-A3中任一项所述的方法,其中,在将符合所述用户特征的待推送新闻自动推送给所述目标用户之前,还包括:
对符合所述用户特征的待推送新闻的推送参数进行配置;
其中,所述推送参数包括下列至少之一:
发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
根据本发明实施例的另一方面,还提供了B13.一种个性化新闻的自动推送装置,包括:
特征挖掘模块,适于获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
特征匹配模块,适于将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;以及
自动推送模块,适于将符合所述用户特征的待推送新闻自动推送给所述目标用户。
B14.根据B13所述的装置,其中,所述用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
B15.根据B13所述的装置,其中,所述内容特征包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
B16.根据B13-B15中任一项所述的装置,其中,所述特征挖掘模块还适于:
根据所述目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到所述目标用户的用户特征。
B17.根据B16所述的装置,其中,所述生物特征包括用户的自然属性和/或社会属性。
B18.根据B17所述的装置,其中,所述自然属性包括下列至少之一:
性别、年龄、人生阶段;
所述社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
B19.根据B16所述的装置,其中,所述第一指定算法包括逻辑回归LR模型机器学习算法和embedding聚类算法。
B20.根据B13-B15中任一项所述的装置,其中,所述特征挖掘模块还适于:
通过第二指定算法对所述待推送新闻进行挖掘,得到所述待推送新闻的内容特征。
B21.根据B20所述的装置,其中,所述第二指定算法包括embedding聚类算法。
B22.根据B13-B15中任一项所述的装置,其中,所述自动推送模块还适于:
若匹配到多个符合所述用户特征的待推送新闻,则根据指定筛选规则选择指定数量个待推送新闻,并将所选择的待推送新闻自动推送给所述目标用户。
B23.根据B22所述的装置,其中,所述指定筛选规则包括下列至少之一:
根据与所述用户特征的匹配度进行选择;
根据文章源权威性进行选择;
根据文章点击量进行选择。
B24.根据B13-B15中任一项所述的装置,其中,还包括:
推送配置模块,适于在所述自动推送模块将符合所述用户特征的待推送新闻自动推送给所述目标用户之前,对符合所述用户特征的待推送新闻的推送参数进行配置;
其中,所述推送参数包括下列至少之一:
发送方式、发布系统、发布通道、新闻样式、发送时间、失效时间、免打扰设置、暂停发送设置。
根据本发明实施例的再一方面,还提供了C25.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行根据A1-A12中任一项所述的个性化新闻的自动推送方法。
根据本发明实施例的又一方面,还提供了D26.一种计算设备,包括:
处理器;以及
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行根据A1-A12中任一项所述的个性化新闻的自动推送方法。
Claims (10)
1.一种个性化新闻的自动推送方法,包括:
获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;
将符合所述用户特征的待推送新闻自动推送给所述目标用户。
2.根据权利要求1所述的方法,其中,所述用户特征包括下列至少之一:
性别、年龄、教育程度、职业、地理位置、点击行为、搜索行为、阅读兴趣、阅读时间、操作系统、客户端机型、用户点击的不喜欢信息。
3.根据权利要求1所述的方法,其中,所述内容特征包括下列至少之一:
文章标题、文章关键词、文章兴趣分类、正文质量、标题质量、时效性、标题与内容匹配度、文章源权威性。
4.根据权利要求1-3中任一项所述的方法,其中,获取待推送的目标用户的用户特征,包括:
根据所述目标用户的生物特征和/或历史浏览行为,通过第一指定算法进行挖掘,得到所述目标用户的用户特征。
5.根据权利要求4所述的方法,其中,所述生物特征包括用户的自然属性和/或社会属性。
6.根据权利要求5所述的方法,其中,所述自然属性包括下列至少之一:
性别、年龄、人生阶段;
所述社会属性包括下列至少之一:
教育程度、职业、经济收入、消费能力、常驻地、上网时段、消费习惯、社交爱好。
7.根据权利要求4所述的方法,其中,所述第一指定算法包括逻辑回归LR模型机器学习算法和embedding聚类算法。
8.一种个性化新闻的自动推送装置,包括:
特征挖掘模块,适于获取待推送的目标用户的用户特征以及待推送新闻的内容特征;
特征匹配模块,适于将所述用户特征与所述内容特征进行匹配,得到符合所述用户特征的待推送新闻;以及
自动推送模块,适于将符合所述用户特征的待推送新闻自动推送给所述目标用户。
9.一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行根据权利要求1-7中任一项所述的个性化新闻的自动推送方法。
10.一种计算设备,包括:
处理器;以及
存储有计算机程序代码的存储器;
当所述计算机程序代码被所述处理器运行时,导致所述计算设备执行根据权利要求1-7中任一项所述的个性化新闻的自动推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811299563.XA CN109660591A (zh) | 2018-11-02 | 2018-11-02 | 个性化新闻的自动推送方法、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811299563.XA CN109660591A (zh) | 2018-11-02 | 2018-11-02 | 个性化新闻的自动推送方法、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109660591A true CN109660591A (zh) | 2019-04-19 |
Family
ID=66110609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811299563.XA Pending CN109660591A (zh) | 2018-11-02 | 2018-11-02 | 个性化新闻的自动推送方法、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109660591A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929018A (zh) * | 2019-12-04 | 2020-03-27 | Oppo(重庆)智能科技有限公司 | 文本处理方法、装置、存储介质及电子设备 |
CN112149037A (zh) * | 2020-09-28 | 2020-12-29 | 微梦创科网络科技(中国)有限公司 | 基于逻辑回归的实时识别异常关注的方法及系统 |
CN113220734A (zh) * | 2021-05-13 | 2021-08-06 | 平安普惠企业管理有限公司 | 课程推荐方法、装置、计算机设备及存储介质 |
CN113722498A (zh) * | 2021-06-17 | 2021-11-30 | 武汉理工数字传播工程有限公司 | 一种数字资源管理的方法、装置、设备及存储介质 |
CN113868528A (zh) * | 2021-09-29 | 2021-12-31 | 平安银行股份有限公司 | 资讯推荐方法、装置、电子设备及可读存储介质 |
CN114841155A (zh) * | 2022-04-21 | 2022-08-02 | 科技日报社 | 主题内容智能聚合方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210010A (ja) * | 2007-02-23 | 2008-09-11 | Kddi Corp | コンテンツ配信方法およびシステム |
CN104166668A (zh) * | 2014-06-09 | 2014-11-26 | 南京邮电大学 | 基于folfm模型的新闻推荐系统及方法 |
CN107038184A (zh) * | 2016-10-14 | 2017-08-11 | 厦门大学 | 一种基于分层隐变量模型的新闻推荐方法 |
CN107562939A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市傲天科技股份有限公司 | 垂直领域新闻推荐方法、装置及可读储存介质 |
CN107818156A (zh) * | 2017-10-31 | 2018-03-20 | 广东思域信息科技有限公司 | 一种实时个性化新闻推荐方法及系统 |
CN107992531A (zh) * | 2017-11-21 | 2018-05-04 | 吉浦斯信息咨询(深圳)有限公司 | 基于深度学习的新闻个性化智能推荐方法与系统 |
-
2018
- 2018-11-02 CN CN201811299563.XA patent/CN109660591A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210010A (ja) * | 2007-02-23 | 2008-09-11 | Kddi Corp | コンテンツ配信方法およびシステム |
CN104166668A (zh) * | 2014-06-09 | 2014-11-26 | 南京邮电大学 | 基于folfm模型的新闻推荐系统及方法 |
CN107038184A (zh) * | 2016-10-14 | 2017-08-11 | 厦门大学 | 一种基于分层隐变量模型的新闻推荐方法 |
CN107562939A (zh) * | 2017-09-21 | 2018-01-09 | 深圳市傲天科技股份有限公司 | 垂直领域新闻推荐方法、装置及可读储存介质 |
CN107818156A (zh) * | 2017-10-31 | 2018-03-20 | 广东思域信息科技有限公司 | 一种实时个性化新闻推荐方法及系统 |
CN107992531A (zh) * | 2017-11-21 | 2018-05-04 | 吉浦斯信息咨询(深圳)有限公司 | 基于深度学习的新闻个性化智能推荐方法与系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929018A (zh) * | 2019-12-04 | 2020-03-27 | Oppo(重庆)智能科技有限公司 | 文本处理方法、装置、存储介质及电子设备 |
CN110929018B (zh) * | 2019-12-04 | 2023-03-21 | Oppo(重庆)智能科技有限公司 | 文本处理方法、装置、存储介质及电子设备 |
CN112149037A (zh) * | 2020-09-28 | 2020-12-29 | 微梦创科网络科技(中国)有限公司 | 基于逻辑回归的实时识别异常关注的方法及系统 |
CN112149037B (zh) * | 2020-09-28 | 2024-03-19 | 微梦创科网络科技(中国)有限公司 | 基于逻辑回归的实时识别异常关注的方法及系统 |
CN113220734A (zh) * | 2021-05-13 | 2021-08-06 | 平安普惠企业管理有限公司 | 课程推荐方法、装置、计算机设备及存储介质 |
CN113722498A (zh) * | 2021-06-17 | 2021-11-30 | 武汉理工数字传播工程有限公司 | 一种数字资源管理的方法、装置、设备及存储介质 |
CN113722498B (zh) * | 2021-06-17 | 2024-10-11 | 武汉理工数字传播工程有限公司 | 一种数字资源管理的方法、装置、设备及存储介质 |
CN113868528A (zh) * | 2021-09-29 | 2021-12-31 | 平安银行股份有限公司 | 资讯推荐方法、装置、电子设备及可读存储介质 |
CN114841155A (zh) * | 2022-04-21 | 2022-08-02 | 科技日报社 | 主题内容智能聚合方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109660591A (zh) | 个性化新闻的自动推送方法、装置和计算设备 | |
US10635853B2 (en) | Deployable tag management in computer data networks | |
CN108733706B (zh) | 热度信息的生成方法和装置 | |
CN109934619A (zh) | 用户画像标签建模方法、装置、电子设备及可读存储介质 | |
US8346782B2 (en) | Method and system of information matching in electronic commerce website | |
Eom et al. | A survey of decision support system applications (1995–2001) | |
CN104685490B (zh) | 结构化和非结构化数据自适应分组的系统和方法 | |
CN104834641B (zh) | 网络媒介信息的处理方法和相关系统 | |
CN105760400B (zh) | 一种基于搜索行为的推送消息排序方法及装置 | |
US20090299998A1 (en) | Keyword discovery tools for populating a private keyword database | |
CN109165975A (zh) | 标签推荐方法、装置、计算机设备及存储介质 | |
Pérez-Amaral et al. | E-commerce by individuals in Spain using panel data 2008–2016 | |
CN105447186A (zh) | 一种基于大数据平台的用户行为分析系统 | |
CN112288464A (zh) | 商品推荐方法、装置、计算机设备和存储介质 | |
CN108230026A (zh) | 广告推荐方法和装置、电子设备、存储介质、程序 | |
CN104077707B (zh) | 一种推广呈现方式的优化方法和装置 | |
CN109241455B (zh) | 一种推荐对象的展示方法及装置 | |
Goswami et al. | Sentiment analysis based potential customer base identification in social media | |
Kagan et al. | Probabilistic Search for Tracking Targets: Theory and Modern Application | |
Felfernig et al. | Recommender systems for sustainability: overview and research issues | |
CN102411589A (zh) | 一种监控和管理关键词的方法和设备 | |
Hagsten | Distributed access to linked microdata: the example of ICT and exports | |
CN109727109A (zh) | 涉税服务机构推荐方法、装置、计算机设备及存储介质 | |
Guo et al. | Global network centrality of university rankings | |
CN110471721A (zh) | 页面展示方法及系统、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190419 |