CN111885399A - 内容分发方法、装置、电子设备以及存储介质 - Google Patents

内容分发方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN111885399A
CN111885399A CN202010609192.1A CN202010609192A CN111885399A CN 111885399 A CN111885399 A CN 111885399A CN 202010609192 A CN202010609192 A CN 202010609192A CN 111885399 A CN111885399 A CN 111885399A
Authority
CN
China
Prior art keywords
account
distribution
content
information
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010609192.1A
Other languages
English (en)
Other versions
CN111885399B (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Wuhan Co Ltd
Original Assignee
Tencent Technology Wuhan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Wuhan Co Ltd filed Critical Tencent Technology Wuhan Co Ltd
Priority to CN202010609192.1A priority Critical patent/CN111885399B/zh
Publication of CN111885399A publication Critical patent/CN111885399A/zh
Application granted granted Critical
Publication of CN111885399B publication Critical patent/CN111885399B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4751End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for defining user accounts, e.g. accounts for children

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种内容分发方法、装置、电子设备以及存储介质,包括:获取内容分发系统中与用户账号对应的订阅账号信息,所述订阅账号为用户账号订阅的分发账号,采集所述用户账号针对多个分发账号下已发布内容的互动信息,根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型,基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,该方案可以提高内容审核的效率。

Description

内容分发方法、装置、电子设备以及存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种内容分发方法、装置、电子设备以及存储介质。
背景技术
随着现代科技的发展,媒体发布信息的方式越来越便捷。这些媒体可以在网络平台上注册账号,然后基于账号发布信息,例如文本信息、音频信息以及视频信息等。这些媒体还包括自媒体,自媒体是指普通大众通过网络等途径向外发布他们本身的事实和新闻的传播方式。近几年是内容创作的风口,各大互联网公司都积极进入内容市场,各种自媒体如雨后春笋般涌出,人人都可以通过写作打造自己的自媒体。数量庞大的自媒体每天都会创作海量的文章,但是,一些自媒体账号所发布的内容可能是从自媒体平台抄袭而来的,或者对自媒体账号的原创内容做再次加工和拼凑,因此,需要对自媒体账号分发的内容进行审核。
目前,是采用人工审核的方案审核自媒体账号发布的内容,然而,由于自媒体账号的数量庞大,对于每天大量的投稿,运营人员进行逐条审核费时费力且效率很低。
发明内容
本申请提供一种内容分发方法、装置、电子设备以及存储介质,可以提高内容审核的效率。
本申请提供了一种内容分发方法,包括:
获取内容分发系统中与用户账号对应的订阅账号信息,所述订阅账号为用户账号订阅的分发账号;
采集所述用户账号针对多个分发账号下已发布内容的互动信息;
根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表;
识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型;
基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
相应的,本申请还提供了一种内容分发装置,包括:
获取模块,用于获取内容分发系统中与用户账号对应的订阅账号信息,所述订阅账号为用户账号订阅的分发账号;
采集模块,用于采集所述用户账号针对多个分发账号下已发布内容的互动信息;
召回模块,用于根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表;
识别模块,用于识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型;
分发模块,用于基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
可选的,在本申请的一些实施例中,所述召回模块包括:
识别子模块,用于识别所述互动信息的意图;
召回子模块,用于根据意图识别结果、所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在本申请的一些实施例中,所述召回子模块包括:
第一确定单元,用于根据意图识别结果,将意图为正向意图对应的互动信息确定为正向互动信息,以及将意图为负向意图对应的互动信息确定为负向互动信息;
检测单元,用于检测所述分发账号中所述正向互动信息的数量是否大于负向互动信息的数量;
第二确定单元,用于将所述正向互动信息的数量大于负向互动信息的数量对应的分发账号,确定为正向分发账号;
召回单元,用于基于确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在本申请的一些实施例中,所述召回单元包括:
提取子单元,用于从所述订阅账号信息中提取与所述用户账号对应的订阅账号;
第一选择子单元,用于在多个分发账号中选择与所述订阅账号之间的大于第一预设值的分发账号,得到第一候选账号集;
第一构建子单元,用于根据所述第一候选账号集中各分发账号与所述订阅账号之间的相似度,构建所述第一候选账号集的拓扑结构图,得到第一拓扑结构图;
第二选择子单元,用于在多个分发账号中选择与所述正向分发账号之间的相似度大于第二预设值的分发账号,得到第二候选账号集;
第二构建子单元,用于根据所述第二候选账号集中各分发账号与所述正向分发账号之间的相似度,构建所述第二候选账号集的拓扑结构图,得到第二拓扑结构图;
召回子单元,用于基于所述第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在本申请的一些实施例中,所述召回子单元具体用于:
分别对所述第一拓扑结构图和第二拓扑结构图进行向量化处理,得到第一嵌入式向量和第二嵌入式向量;
对所述第一嵌入式向量和第二嵌入式向量进行拼接;
从多个分发账号中选择与拼接后向量对应的分发账号,并将选择的分发账号确定为目标分发账号,得到目标分发账号列表。
可选的,在本申请的一些实施例中,还包括选择单元,所述选择单元具体用于:
根据所述订阅账号信息从确定的正向分发账号中,选择与所述用户账号具有订阅关系的正向分发账号,得到正向订阅分发账号;
在所述正向订阅分发账号已发布内容中,将所述正向互动信息对应的内容确定为互动内容;
从所述正向订阅分发账号已发布内容中去除所述互动内容,得到所述正向订阅分发账号的保留内容;
在内容分发系统中获取与所述保留内容之间相似度大于第三预设值的内容,得到相似内容;
识别所述相似内容对应的分发账号,得到参考账号;
所述召回单元具体用于:基于所述参考账号、确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在本申请的一些实施例中,所述分发模块包括:
生成单元,用于基于所述内容类型和分发账号下已发布内容的内容数量,生成目标分发账号列表中目标分发账号的内容分布信息;
分发单元,用于根据所述内容分布信息对目标分发账号列表中目标分发账号进行内容分发。
可选的,在本申请的一些实施例中,所述分发单元具体用于:
根据所述内容分布信息,对目标分发账号列表中目标分发账号的顺序进行调整;
对调整后的分发列表中的分发账号进行内容分发。
本申请在获取内容分发系统中与用户账号对应的订阅账号信息后,所述订阅账号为用户账号订阅的分发账号,采集所述用户账号针对多个分发账号下已发布内容的互动信息,然后,根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,接着,识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。因此,该方案可以提高内容审核的效率。
附图说明
为了更清楚地说明本申请中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请提供的内容分发方法的场景示意图;
图1b是本申请提供的内容分发方法的流程示意图;
图1c是本申请提供的内容分发方法中发文垂直度的示意图;
图2a是本申请提供的内容分发方法的另一流程示意图;
图2b是本申请提供的内容分发方法的另一场景示意图;
图2c至图2e是本申请提供的内容分发方法构建图嵌入向量的示意图;
图3是本申请提供的内容分发装置的结构示意图;
图4是本申请提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供一种内容分发方法、装置、电子设备和存储介质。
其中,该内容分发装置具体可以集成在服务器中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
例如,请参阅图1a,该内容分发装置集成在服务器上,服务器获取内容分发系统中与用户账号对应的订阅账号信息,其中,用户账号为内容分发系统中分配给用户的账号,以便用户通过该用户账号获取内容分发系统中不同分发账号所分发的内容,比如,分发账号K为自媒体平台X的账号,用户可以通过用户账号订阅分发账号K,即,分发账号K为用户账号的订阅账号,然后,服务器可以采集用户账号针对多个分发账号下已发布内容的互动信息,其中,用户不仅可以与订阅账号(如分发账号K)下已发布内容进行互动行为,还可以与非订阅账号下已发布内容进行互动行为,接着,服务器根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,再然后,服务器识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,服务器基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
本申请提供的内容分发方法,可以根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,然后,基于目标分发账号已发布内容对应的内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,即,在目标分发账号召回时,考虑到用户账号与分发账号下已发布内容的互动信息,使得召回的分发账号更准确,并且,整个过程无需人工干预,减少了人力资源的浪费,提高了内容审核的效率,进而提高了内容分发的效率。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
一种内容分发方法,包括:获取内容分发系统中与用户账号对应的订阅账号信息,采集用户账号针对多个分发账号下已发布内容的互动信息,根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
请参阅图1b,图1b为本申请提供的内容分发方法的流程示意图。该内容分发方法的具体流程可以如下:
101、获取内容分发系统中与用户账号对应的订阅账号信息。
其中,分发账号指的是内容分发系统(又称内容分发平台)认证的账号,可以包括企业账号和私人账号,比如,企业账号可以为新闻媒体的分发账号,私人账号可以是某个作家的分发账号,订阅账号为用户账号订阅的分发账号,例如,具体的,可以通过访问网络接口获取内容分发系统中与用户账号对应的订阅账号信息,其中,分发账号是具有内容发布功能的账号,分发账号可以是自媒体账号。可以理解,自媒体(We Media),是指私人化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称,自媒体账号可以是在独立的内容分发平台中注册的、能够自主化发布内容的账号(比如微博账号),也可以是在集成于社交平台中的内容分发平台中注册的、能够自主化发布内容的账号。集成于社交平台中的内容分发平台可以是即时通信平台中集成的内容分发平台。
102、采集用户账号针对多个分发账号下已发布内容的互动信息。
其中,用户账号针对分发账号下已发布内容的互动行为可以包括评论、收藏、转发、举报以及点赞等等,用户账号可以与订阅的分发账号(即订阅账号)下已发布内容进行互动,也可以对未订阅的分发账号下已发布内容进行互动。
103、根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
其中,互动信息可以包括正向互动行为对应的互动信息和负向互动行为对应的互动信息,正向互动行为指的是正面的互动行为,如收藏、转发、分享点赞、以及针对内容的正面评论等等,负向互动行为指的是负面的互动行为,如举报以及针对内容的负面评论,可选的,在一些实施例中,可以识别互动信息的意图,再基于意图识别结果、互动信息和订阅账号信息,进行目标分发账号的召回,也即,步骤“根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表”,具体可以包括:
(11)识别互动信息的意图;
(12)根据意图识别结果、互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
例如,对于分发账号H的历史内容A(分发账号在过去时间段已发布的内容)而言,不同的用户针对该历史内容A可能会触发不同的互动行为,即,每个用户账号针对该历史内容A的互动信息不同,因此,历史内容A对应的互动信息的数量可能有很多,具体的,可以采用自然语言处理技术识别互动信息的意图,其中,自然语言处理(Nature Languageprocessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
对于自然语言处理中的文本处理来说,通常会用到机器学习(Machine Learning,ML)技术来实现文本的处理。其中,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术,在识别出互动信息的意图后,可以根据意图识别结果、互动信息和订阅账号信息召回目标分发账号,比如,历史内容A对应的正向互动信息的数量为10个,历史内容A对应的负向互动信息的数量为5个,那么,可以将历史内容A对应的分发账号确定为正向分发账号,并基于该正向分发账号以及订阅账号信息从多个分发账号中,召回目标分发账号,即,可选的,在一些实施例中,步骤“根据意图识别结果、互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表”,具体可以包括:
(21)根据意图识别结果,将意图为正向意图对应的互动信息确定为正向互动信息,以及将意图为负向意图对应的互动信息确定为负向互动信息;
(22)检测分发账号中正向互动信息的数量是否大于负向互动信息的数量;
(23)将正向互动信息的数量大于负向互动信息的数量对应的分发账号,确定为正向分发账号;
(24)基于确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
其中,基于确定的正向分发账号以及订阅账号信息召回目标分发账号的方式有很多,比如,可以计算各分发账号与正向分发账号之间的相似度,将相似度大于预设阈值的分发账号确定为正向分发账号的相似账号,然后,将该正向分发账号以及正向分发账号的相似账号确定为目标分发账号,然而,这种方式仅仅只考虑到分发账号之间的相似度,并没有考虑到用户账号的订阅账号信息,可能会导致后续的内容分发不精准。
在本申请中,考虑到订阅账号与其他分发账号之间的关联关系、以及正向分发账号与其他分发账号之间的关联关系,可以提高目标分发账号的召回率,即,可选的,在一些实施例中,步骤“基于确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表”,具体可以包括:
(31)从订阅账号信息中提取与用户账号对应的订阅账号;
(32)在多个分发账号中选择与订阅账号之间的相似度大于第一预设值的分发账号,得到第一候选账号集;
(33)根据第一候选账号集中各分发账号与订阅账号之间的相似度,构建第一候选账号集的拓扑结构图,得到第一拓扑结构图;
(34)在多个分发账号中选择与正向分发账号之间的相似度大于第二预设值的分发账号,得到第二候选账号集;
(35)根据第二候选账号集中各分发账号与正向分发账号之间的相似度,构建第二候选账号集的拓扑结构图,得到第二拓扑结构图;
(36)基于第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表。
考虑到内容分发系统中用户账号的订阅账号信息以及用户账号针对多个分发账号下已发布内容的互动信息的数量繁多,即数据量庞大,在此,本申请提供一种基于图嵌入的方法进行目标分发账号的召回,图嵌入(Graph Embedding)是一种将图数据映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题,因此,可以分别对第一拓扑结构图和第二拓扑结构图进行向量化处理,得到第一嵌入式向量和第二嵌入式向量,然后,根据第一嵌入式向量和第二嵌入式向量从多个分发账号中召回目标分发账号,即,可选的,在一些实施例中,步骤“基于第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表”,具体可以包括:
(41)分别对第一拓扑结构图和第二拓扑结构图进行向量化处理,得到第一嵌入式向量和第二嵌入式向量;
(42)对第一嵌入式向量和第二嵌入式向量进行拼接;
(43)从多个分发账号中选择与拼接后向量对应的分发账号,并将选择的分发账号确定为目标分发账号,得到目标分发账号列表。
其中,在第一拓扑结构图中,第一候选账号集中各分发账号与订阅账号均作为图中的节点,节点与节点之间的关联边用于衡量各分发账号与订阅账号之间相似度,越靠近的节点则表示这些节点越相似,即,可以根据各分发账号与订阅账号之间相似度赋予每条关联边对应的权重,基于关联边边的权重去采样(又称加权行走),使采样尽量往热门节点的方向游走,从而提高采样得到的样本置信度,最后采用随机游走的方式,构建第一拓扑结构图对应的嵌入式向量(第一嵌入式向量),同理,对于第二拓扑结构图可以采用同样的方式,以得到第二拓扑结构图对应的嵌入式向量(第二嵌入式向量)。
此外,在一些实施例中,还可以通过从确定的正向分发账号中,选择与用户具有订阅关系的正向分发账号,得到正向订阅分发账号,然后,通过正向订阅分发账号进行目标分发账号的召回,即,可选的,在一些实施例中,具体还包括:
(51)根据订阅账号信息从确定的正向分发账号中,选择与用户账号具有订阅关系的正向分发账号,得到正向订阅分发账号;
(52)在正向订阅分发账号已发布内容中,将正向互动信息对应的内容确定为互动内容;
(53)从正向订阅分发账号已发布内容中去除互动内容,得到正向订阅分发账号的保留内容;
(54)在内容分发系统中获取与保留内容之间相似度大于第三预设值的内容,得到相似内容;
(55)识别相似内容对应的分发账号,得到参考账号。
具体的,当采集到用户账号针对订阅账号触发的正向互动信息时,比如,采集到用户账号针对订阅账号下的内容Q触发的正向互动信息,将该分发账号确定为正向订阅分发账号,然后,获取该分发账号除内容Q以外的内容,得到分发账号的保留内容,接着,在内容分发系统中获取与保留内容之间相似度大于第三预设值的内容,得到相似内容,最后,识别相似内容对应的分发账号,得到参考账号,进一步的,还可以利用参考账号召回目标分发账号,即,可选的,在一些实施例中,步骤“基于确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表”,具体可以包括:基于参考账号、确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表,具体的,可以采用图嵌入的方法对参考账号进行处理,与前面实施例类似,在此不再赘述。
104、识别目标分发账号列表中目标分发账号已发布内容对应的内容类型。
例如,具体的,采集分发账号已发布内容的数量,如分发账号总共发布过10个文章,其中,3个文章的文章类型属于军事类,2个文章的文章类型属于生活类,5个文章的文章类型属于医药类。
105、基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
需要说明的是,对于一些搬运账号而言,其在内容上的分布可能是非常丰富的,比如,可能会涉及到多个领域,并且,这些领域还是不相关的领域,如某个分发账号在内容上的分布为:医药、金属制造、军事、汽车制造以及体育,那么,这个分发账号则很有可能是搬运账号,而对于原创账号而言,其所发布的内容往往是针对某些特定的领域,因此,其在内容上的分布会相对集中,并且,原创账号会在针对的领域中,发布大量的内容,在此,需要引出一个概念:发文垂直度,发文垂直度体现的是分发账号在擅长领域发表内容的专注程度,请参阅图1c,发文垂直度可以使用正态分布和峰度来解释核心原理:是一个账号发文垂类的分布情况,横轴是发文垂类(可以用发文内容的一级分类来表示),纵轴是对应垂类发文比例,将之比作一个正态分布,那么阴影部分面积为1(所有垂类发文比例之和为1),即发文垂直情况一(左图):正态分布峰度越小(发文最多的垂类比例越小),面积不变的情况下,标准差越大(发文垂类越分散),即发文不垂直,那么,情况二(右图):正态分布峰度越大(发文最多的垂类比例越大),面积不变的情况下,标准差越小(发文垂类越集中)。
因此,可选的,在一些实施例中,可以根据发文垂直度(即内容分布信息)对目标分发账号列表中目标分发账号进行内容分发,比如,分发账号总共发布过10个文章,其中,3个文章的文章类型属于军事类,2个文章的文章类型属于生活类,5个文章的文章类型属于医药类,因此,该分发账号在的内容分布信息为:军事、生活以及医药,在其他领域上则没有分布,然后,再根据该内容分布信息目标分发账号列表中目标分发账号进行内容分发,即,可选的,在一些实施例中,步骤“基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发”,具体可以包括:
(61)基于内容类型和分发账号下已发布内容的内容数量,生成目标分发账号列表中目标分发账号的内容分布信息;
(62)根据内容分布信息对目标分发账号列表中目标分发账号进行内容分发。
进一步的,可以根据分布信息确定分发账号在内容上占最大比例的内容占比,并将该内容占比对应的比例赋予分布信息,比如,分发账号在内容上占最大比例的内容类型为“军事”类型,“军事”类型在在内容上的占比为80%,那么赋予分布信息的值为80%,然后,按照由大到小的顺序排列赋值后的目标分发账号,并基于排列后的顺序对目标分发账号进行内容分发,即,可选的,在一些实施例中,步骤“根据内容分布信息对目标分发账号列表中目标分发账号进行内容分发”,具体可以包括:
(71)根据内容分布信息,对目标分发账号列表中目标分发账号的顺序进行调整;
(72)对调整后的分发列表中的目标分发账号进行内容分发。
对于一个原创内容丰富的内容分发系统,可以优先分发位于调整后的分发列表中前5个的目标分发账号的内容,而对于一个缺乏原创内容(即原创内容的数量少)的内容分发系统,可以优先分发位于调整后的分发列表中前10个的目标分发账号的内容,具体根据实际情况进行设置,在此不做赘述。
本申请在获取内容分发系统中与用户账号对应的订阅账号信息后,采集用户账号针对多个分发账号下已发布内容的互动信息,接着,根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,再然后,识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,本申请提供的内容分发方法,在目标分发账号召回时,考虑到用户账号与分发账号下已发布内容的互动信息,使得召回的分发账号更准确,并且,整个过程无需人工干预,减少了人力资源的浪费,提高了内容审核的效率,进而提高了内容分发的效率。
根据实施例所述的方法,以下将举例进一步详细说明。
在本实施例中将以该内容分发装置具体集成在服务器中为例进行说明。
请参阅图2a,一种内容分发方法,具体流程可以如下:
201、服务器获取内容分发系统中与用户账号对应的订阅账号信息。
例如,具体的,服务器可以通过访问网络接口获取内容分发系统中与用户账号对应的订阅账号信息,其中,分发账号是具有内容发布功能的账号,分发账号可以是自媒体账号。可以理解,自媒体(We Media),是指私人化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称,自媒体账号可以是在独立的内容分发平台中注册的、能够自主化发布内容的账号(比如微博账号),也可以是在集成于社交平台中的内容分发平台中注册的、能够自主化发布内容的账号。集成于社交平台中的内容分发平台可以是即时通信平台中集成的内容分发平台。
202、服务器采集用户账号针对多个分发账号下已发布内容的互动信息。
其中,用户账号针对分发账号下已发布内容的互动行为可以包括评论、收藏、转发、举报以及点赞等等,用户账号可以与订阅的分发账号(即订阅账号)下已发布内容进行互动,也可以对未订阅的分发账号下已发布内容进行互动,服务器可以采集用户账号针对多个分发账号下已发布内容的互动信息。
203、服务器根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
其中,互动信息可以包括正向互动行为对应的互动信息和负向互动行为对应的互动信息,正向互动行为指的是正面的互动行为,如收藏、转发、分享点赞、以及针对内容的正面评论等等,负向互动行为指的是负面的互动行为,如举报以及针对内容的负面评论,服务器可以采用自然语言处理技术识别互动信息的意图,服务器在识别出互动信息的意图后,可以根据意图识别结果、互动信息和订阅账号信息召回目标分发账号。
204、服务器识别目标分发账号列表中目标分发账号已发布内容对应的内容类型。
205、服务器基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
对于一些搬运账号而言,其在内容上的分布可能是非常丰富的,比如,可能会涉及到多个领域,并且,这些领域还是不相关的领域,如某个分发账号在内容上的分布为:医药、金属制造、军事、汽车制造以及体育,那么,这个分发账号则很有可能是搬运账号,而对于原创账号而言,其所发布的内容往往是针对某些特定的领域,因此,其在内容上的分布会相对集中,并且,原创账号会在针对的领域中,发布大量的内容,因此,可选的,在一些实施例中,服务器可以根据发文垂直度(即内容分布信息)对目标分发账号列表中目标分发账号进行内容分发。
为了便于进一步理解本申请的内容分发方案,请参阅图2b,如上图所示基于图嵌入的内容分发系统的流程图。在自媒体生产和发文的主流程链路上,对于优质账号作者支持内容分发的主要目的:1)培养平台有识别度的头部优质账号;2)打击搬运账号和劣质账号,降权流量。3)从自媒体账号角度建立内容与用户账号的关系,提升分发的效果,对于一个分发账号,先定义分发账号的垂直度,分发账号的垂直度越高,说明分发账号创作的内容专业度越高,对于搬运账号而言,如果固定搬运一个分发账号的内容会非常容易被识别,所以通常会搬运很多不同账号的不同内容,发文分散,这里采用信息熵来衡量作者的垂直度,信息熵解决对信息的量化度量问题。信息熵这个词是从热力学中借用过来的,在热力学中,热熵是表示分子状态混乱程度的物理量。信息熵的概念来描述信源的不确定度。信息论中熵的概念:熵度量了事物的不确定性,越不确定的事物,它的熵就越大,具体的,随机变量X的熵的表达式如下:
Figure BDA0002560289680000151
其中n代表X的n种不同的离散取值。而pi代表了X取值为i的概率,log为以2或者e为底的对数。对一个特征而言,系统有该特征和没该特征时信息量将发生变化,而前后信息量的差值就是这个特征给系统带来的信息量。信息增益是用来选择特征的指标,信息增益越大,则这个特征的选择性越好。在概率中定义为:待分类的集合的熵和选定某个特征的条件熵之差。在本发明当中,用信息熵来衡量账号的垂直度,这里n代表作者发布的内容的类别个数,通常是指一级分类,pi是指第i个内容的分布总发布内容占比,通常内容发布周期选择是最近的一个月内的统计值,具体周期可以根据实际情况进行调整。
另外,在本申请中,考虑到分发账号与用户账号之间的关联关系,可以构建分发账号的图嵌入向量:订阅账号相似队列召回、正向分发账号召回以及正向分发账号召回,召回的主要方法就是计算向量的相似度,通常采用度量学习,计算向量的距离比如余弦相似度,大于或等于预设阈值则可以确定为相似。
(1)订阅账号,就是与用户账号具有订阅关系的分发账号,构建订阅账号的图嵌入向量;
(2)正向行为对应的分发账号(正向分发账号),构建正向分发账号的图嵌入向量,构造的算法和1类似,然后召回与正向分发账号相似的分发账号;
(3)对于正向行为的订阅账号发布的其他内容,可以认为用户账号喜欢这个订阅账号,那么可以采集与这个订阅账号的其他内容相似度大于预设值的内容,并召回采集的内容对应的分发账号。
进一步的,请参阅图2c,如上图所示,用户账号u1和分发账号p1(poster,有很多不同的用户账号和不同分发账号),一个分发账号会被很多不同的用户账号关注,它们之间的订阅关系构成了一个图,包括了节点和边,同样类似,对于用户账号针对分发账号已发布内容的正向行为(比如正向评论,收藏,转发,分享,点赞,如果是视频账号,对账号视频内容的平均播放完成度,图文内容的平均阅读完成率数据),这些行为的权重程度是不一样,所以在用户账号的正向行为当中构建的是一个带有权重的拓扑结构图,基于边的权重去采样(又称加权游走),使采样尽量往热门节点方向游走,这样采样出来的样本置信度才更高。另外在图结构当中,利用分发账号的账号属性(权威度、内容质量以及账号活跃度),这对一些长尾稀疏分发账号是非常友好的,一定程度解决了冷启动的问题。最后采用DeepWalk&Skip-gram方式来构建分发账号的图嵌入向量。DeepWalk就是Random Walk与Skip-gram的组合。Random Walk负责对图结构进行采样,获得图中节点与节点的邻接关系,Skip-gram从采样的序列中训练节点的图嵌入向量,如图2d所示。
由于节点类型不同,有如下两种构图方法:
(1)同构图:使用行为类型的节点,生成只包含行为的同构图。基于同构图进行RandomWalk+Word2Vec,训练即可得到action的embedding表述。然后可以使用与action2vec同样池化方法,生成poster embedding,其中,Word2Vec又称文本向量化模型是用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。
(2)异构图:使用action、action attributes、poster等多种类型的节点,生成包含多类节点的异构图。Action attributes节点的加入,可以通过side info缓解低频item训练不充分的问题;poster节点的加入,使得模型可以通过训练直接得到posterembedding。账号图嵌入的过程如下,为了得到poster的特征表示,从发布者被关注的关系网络中抽取数据集,采用Randomwalk方法抽样有序的节点,从而将关注网络转化为有序节点进行学习,将Skip-gram神经语言模型应用于这些随机游走来得到图嵌入
具体步骤如下:
(1)采样:对每个节点生成多个随机游走;
(2)训练Skip-gram:将这些随机游走当成word2vec中的句子。Skip-gram神经网络将随机游走中的一个节点作为输入,试图预测其邻居节点;
(3)计算poster Embedding向量
这里对账号图文和视频消费完成度的引入,可以更好代表用户账号对该分发账号的感兴趣程度不同。在建模时考虑完成度因素,可以得到更准确的分发账号的表述,如图2e所示。
最后为了保证新的优质的分发账号能够比较快地被感兴趣的内容消费者消费到,实现时候采用一个离线流水线来解决这个问题,使用spark streaming来实现了posterembedding和正向行为的poster embedding的批量更新。采集线上的用户账号的行为数据,根据线上内容的分发状况,以及用户账号对这些内容账号的行为反馈情况,通过离线方式快速更新这些优质作者的向量信息,更新的周期可以是计算资源和行为的密集程度,如果资源允许可以按照小时更新,离线计算优先按照天更新,实时更新效果最好,但是需要大量的计算资源。上述步骤的目的最终得到了分发账号的图嵌入向量,用于和推荐结合作为向量召回的内容分发。
以下介绍图2b中各个服务模块的主要功能如下:
一.C端发布系统或者web发布系统(生产端)和内容消费端
(1)PGC或者UGC,MCN或者PUGC的内容生产者,通过移动端或者后端接口API系统,提供本地或者web发布系统提供的图文内容或者上传视频内容包括短视频和小视频,这些都是分发内容的主要内容来源;
(2)通过和上下行内容接口服务器的通讯,先获取上传服务器接口地址,然后在发布内容;
(3)作为消费者,和上下行内容接口服务器通讯,获取访问内容的索引信息,然后和上下行内容接口服务器和内容出口服务通讯直接消费内容,消费的前提通过Feeds推荐分发获得内容的索引;
(4)Feeds及用户点击行为和环境上报模块,收集用户当前网络环境及用户对Feeds中间信息的点击操作行为和Feeds内容的曝光数据,上报给统计上报接口服务器;
(5)如果是视频内容上报视频播放过长的播放时长,缓存时间及内容的各种互动行为比如转发,分享,收藏,点赞等。
二.上下行内容接口服务器和内容出口服务
(1)和内容生产端直接通讯,从前端提交的内容,通常是内容的标题,发布者,摘要,封面图,发布时间,将内容存储数据库;
(2)内容出库服务和推荐分发系统通许,获取推荐分发的结果,下发到消费端展示在用户的Feeds列表当中;
(3)内容出口服务通常是一组地域上就近部署在用户附近的接入服务;
(4)在内容入库出依据发布者的账号来源,通过运营的配置设定账号的初审账号等级,这个主要是和运营策略密切相关的;
(5)同时给统计接口服务器上报每个账号的发文流水信息,包括发文时间,内容类型,同时也把号主提供内容标记信息比如分类,标签,选择的封面图,标题作为扩展信息保存在内容数据库当中;
三.内容数据库
(1)内容的核心数据库,所有生产者发布内容的元信息都保存在这个业务数据库当中,重点是内容本身的元信,比如大小,封面图链接,标题,发布时间,账号作者,来源渠道,入库实践,还包括人工审核过程中对内容的分类(包括一,二,三级别分类和标签信息,比如一篇讲解华为手机的文章,一级分科是科技,二级分类是智能手机,三级分类是国内手机,标签信息是华为,mate30);
(2)人工审核过程当中会会读取内容数据库当中的信息,同时人工审核的结果和状态也会回传进入内容数据库当中保存,人工审核结果也是后续衡量算法过滤模型效率的一个重要依据;
(3)整个业务流程当中内容处理主要包括机器处理和人工审核处理,依据不同的内容标记内容库分为不同的内容池,推荐分发服务器和排重服务器,内容特征建模服务都需要从内容数据库当中获取内容。比如图文排重服务器会依据业务需求加载过去一段时间(如一周)已经入库启用的内容,对于重复重新入库的内容将加上过滤标记不再提供给内容推荐服务输出到用户;
(4)排重服务和搬运账号识别服务都是机器处理过程,处理的结果保存在内容数据库当中;
四.调度中心
(1)负责内容流转的整个调度过程,通过上下行内容接口服务器接收入库的内容,然后从内容数据库中获取内容的元信息;
(2)调度排重服务器,对重复入库的内容进行标记和过滤,同时把去重流水信息同步给搬运特征挖掘模型模块作为输入;
(3)调度搬运账号识别服务,评估计算每一发文账号账号的搬运(人工已经标记和认证为原创账号的账号可以豁免不经过这个过程)分数排名,用于后续的人工审核调度或者分发过程降权等实际应用场景当中;
(4)对于机器无法处理的内容,比如政治敏感,安全问题需要人工审核的,调用人工审核系统进行人工审核的处理;
五.人工审核服务系统
(1)需要读取内容数据库中视频内容本身的原始信息,通常是一个业务复杂的基于web数据库开发的系统,主要是确保推送的内容符合当地法律和政策允许的访问,比如是否涉及色情,赌博,政治敏感的特性进行一轮初步过滤;
(2)审核的内容来自自媒体主动发布和网络爬虫从公共网络上获取的;
(3)审核的结果最后通过调度中心,写入内容数据库当中;
六.排重服务
(1)和内容调度服务器通讯主要包括标题去重,封面图的图片去重,内容正文去重及视频指纹和音频指纹去重,通常是将图文内容标题和正文向量化,采用simmhash及BERT正文向量,图片向量去重,对于视频内容抽取视频指纹和音频指纹构建向量,然后计算向量之间的距离比如欧式距离来确定是否重复,这个会有单独的发明和方案来介绍,不是本发明重点,本发明主要利用这里判断的结果;
(2)和搬运特征模型挖掘模块通讯,提供排重流水原始信息;
七.统计上报接口服务器
(1)接收内容消费端用户当前网络环境及用户对Feeds中间信息的点击操作行为和Feeds文章的曝光数据的上报;
(2)将上报的统计数据结果写入统计数据库;
(3)接受内容生产入口上报的账号发文原始流水‘’
八.搬运特征模型挖掘
(1)按照上面描述的具体无监督模型,通过内容处理构建账号冲突特征,抄袭特征和垂直度特征。
(2)建模的内容数据通过读取内容数据库当中的内容元数据,统计数据库和排重服务。
九.账号向量召回服务
(1)工程化实现上述三路自媒体账号向量的相似内容召回,将三路自媒体向量召回结果汇总一起;
(2)接收内容消费端的统计数据上报,为后续的统计分析和挖掘提供数据支撑;
十.统计数据库
(1)接收内容消费端的统计数据上报,为后续的统计分析和挖掘提供数据支撑;
(2)接收内容生产端的发文流水上报。
十一推荐召回系统
(1)实现推荐系统当中的多种内容召回算法比如协同召回、分类、主题召回、用户历史行为以及用户的长短期兴趣点召回等各种不同的召回算法;
(2)主要与账号向量召回服务通讯,使用自媒体向量召回作为单独一路召回,同时实现优质账号分发的策略调权;
十二推荐排序服务
(1)通常包括粗排和精排,将推荐召回系统的结果作为属于,依据推荐的核心目标,比如点击率和用户时长多目标作为优化目标,来结合用户上下文环境信息,通过点击率预估对召回的内容进行打分;
(2)依据打分计算的结果排序,同时结合一定业务的规则策略,最后输出内容推荐分发的结果。
本申请的服务器在获取内容分发系统中与用户账号对应的订阅账号信息后,服务器采集用户账号针对多个分发账号下已发布内容的互动信息,接着,服务器根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,再然后,服务器识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,服务器基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,本申请的服务器在目标分发账号召回时,考虑到用户账号与分发账号下已发布内容的互动信息,使得召回的分发账号更准确,并且,整个过程无需人工干预,减少了人力资源的浪费,提高了内容审核的效率,进而提高了内容分发的效率。
为便于更好的实施本申请的内容分发方法,本申请还提供一种基于上述内容分发装置(简称分发装置)。其中名词的含义与上述内容分发方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请提供的内容分发装置的结构示意图,其中该分发装置可以包括获取模块301、采集模块302、召回模块303、识别模块304以及分发模块305,具体可以如下:
获取模块301,用于用于获取内容分发系统中与用户账号对应的订阅账号信息。
订阅账号为用户账号订阅的分发账号
例如,具体的,获取模块301可以通过访问网络接口获取内容分发系统中与用户账号对应的订阅账号信息,其中,分发账号是具有内容发布功能的账号,分发账号可以是自媒体账号。可以理解,自媒体(We Media),是指私人化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称,自媒体账号可以是在独立的内容分发平台中注册的、能够自主化发布内容的账号(比如微博账号),也可以是在集成于社交平台中的内容分发平台中注册的、能够自主化发布内容的账号。集成于社交平台中的内容分发平台可以是即时通信平台中集成的内容分发平台。
采集模块302,用于采集用户账号针对多个分发账号下已发布内容的互动信息。
其中,用户账号针对分发账号下已发布内容的互动行为可以包括评论、收藏、转发、举报以及点赞等等,用户账号可以与订阅的分发账号(即订阅账号)下已发布内容进行互动,也可以对未订阅的分发账号下已发布内容进行互动,服务器可以采集用户账号针对多个分发账号下已发布内容的互动信息。
召回模块303,用于根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表;
其中,互动信息可以包括正向互动行为对应的互动信息和负向互动行为对应的互动信息,正向互动行为指的是正面的互动行为,如收藏、转发、分享点赞、以及针对内容的正面评论等等,负向互动行为指的是负面的互动行为,如举报以及针对内容的负面评论,服务器可以采用自然语言处理技术识别互动信息的意图,服务器在识别出互动信息的意图后,可以根据意图识别结果、互动信息和订阅账号信息召回目标分发账号
可选的,在一些实施例中,召回模块303具体可以包括:
识别子模块,用于识别互动信息的意图;
召回子模块,用于根据意图识别结果、互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在一些实施例中,召回子模块具体可以包括:
第一确定单元,用于根据意图识别结果,将意图为正向意图对应的互动信息确定为正向互动信息,以及将意图为负向意图对应的互动信息确定为负向互动信息;
检测单元,用于检测分发账号中所述正向互动信息的数量是否大于负向互动信息的数量;
第二确定单元,用于将正向互动信息的数量大于负向互动信息的数量对应的分发账号,确定为正向分发账号;
召回单元,用于基于确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在一些实施例中,召回单元具体可以包括:
提取子单元,用于从订阅账号信息中提取与用户账号对应的订阅账号;
第一选择子单元,用于在多个分发账号中选择与订阅账号之间的大于第一预设值的分发账号,得到第一候选账号集;
第一构建子单元,用于根据第一候选账号集中各分发账号与订阅账号之间的相似度,构建第一候选账号集的拓扑结构图,得到第一拓扑结构图;
第二选择子单元,用于在多个分发账号中选择与正向分发账号之间的相似度大于第二预设值的分发账号,得到第二候选账号集;
第二构建子单元,用于根据第二候选账号集中各分发账号与正向分发账号之间的相似度,构建第二候选账号集的拓扑结构图,得到第二拓扑结构图;
召回子单元,用于基于第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表。
可选的,在一些实施例中,召回子单元具体可以用于:分别对第一拓扑结构图和第二拓扑结构图进行向量化处理,得到第一嵌入式向量和第二嵌入式向量,对第一嵌入式向量和第二嵌入式向量进行拼接,从多个分发账号中选择与拼接后向量对应的分发账号,并将选择的分发账号确定为目标分发账号,得到目标分发账号列表。
可选的,在一些实施例中,还包括选择单元,选择单元具体可以用于:根据订阅账号信息从确定的正向分发账号中,选择与用户账号具有订阅关系的正向分发账号,得到正向订阅分发账号,在正向订阅分发账号已发布内容中,将正向互动信息对应的内容确定为互动内容,从正向订阅分发账号已发布内容中去除互动内容,得到正向订阅分发账号的保留内容,在内容分发系统中获取与保留内容之间相似度大于第三预设值的内容,得到相似内容,识别相似内容对应的分发账号,得到参考账号;
召回单元具体可以用于:基于参考账号、确定的正向分发账号以及订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
识别模块304,用于识别目标分发账号列表中目标分发账号已发布内容对应的内容类型。
例如,具体的,采集分发账号已发布内容的数量,如分发账号总共发布过10个文章,其中,3个文章的文章类型属于军事类,2个文章的文章类型属于生活类,5个文章的文章类型属于医药类。
分发模块305,用于基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
对于一些搬运账号而言,其在内容上的分布可能是非常丰富的,比如,可能会涉及到多个领域,并且,这些领域还是不相关的领域,如某个分发账号在内容上的分布为:医药、金属制造、军事、汽车制造以及体育,那么,这个分发账号则很有可能是搬运账号,而对于原创账号而言,其所发布的内容往往是针对某些特定的领域,因此,其在内容上的分布会相对集中,并且,原创账号会在针对的领域中,发布大量的内容,因此,可选的,在一些实施例中,服务器可以根据发文垂直度(即内容分布信息)对目标分发账号列表中目标分发账号进行内容分发。
可选的,在一些实施例中,分发模块305具体可以包括:
生成单元,用于基于内容类型和分发账号下已发布内容的内容数量,生成目标分发账号列表中目标分发账号的内容分布信息;
分发单元,用于根据内容分布信息对目标分发账号列表中目标分发账号进行内容分发。
可选的,在一些实施例中,分发单元具体可以用于:根据内容分布信息,对目标分发账号列表中目标分发账号的顺序进行调整,对调整后的分发列表中的分发账号进行内容分发。
本申请的获取模块301在获取内容分发系统中与用户账号对应的订阅账号信息后,采集模块302采集用户账号针对多个分发账号下已发布内容的互动信息,接着,召回模块303根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,再然后,识别模块304识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,分发模块305基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,本申请的内容分发装置在目标分发账号召回时,考虑到用户账号与分发账号下已发布内容的互动信息,使得召回的分发账号更准确,并且,整个过程无需人工干预,减少了人力资源的浪费,提高了内容审核的效率,进而提高了内容分发的效率。
此外,本申请还提供一种电子设备,如图4所示,其示出了本申请所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取内容分发系统中与用户账号对应的订阅账号信息,采集用户账号针对多个分发账号下已发布内容的互动信息,根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本申请在获取内容分发系统中与用户账号对应的订阅账号信息后,采集用户账号针对多个分发账号下已发布内容的互动信息,接着,根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,再然后,识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,最后,基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,本申请提供的内容分发方法,在目标分发账号召回时,考虑到用户账号与分发账号下已发布内容的互动信息,使得召回的分发账号更准确,并且,整个过程无需人工干预,减少了人力资源的浪费,提高了内容审核的效率,进而提高了内容分发的效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请所提供的任一种内容分发方法中的步骤。例如,该指令可以执行如下步骤:
获取内容分发系统中与用户账号对应的订阅账号信息,采集用户账号针对多个分发账号下已发布内容的互动信息,根据互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,识别目标分发账号列表中目标分发账号已发布内容对应的内容类型,基于内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请所提供的任一种内容分发方法中的步骤,因此,可以实现本申请所提供的任一种内容分发方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
以上对本申请所提供的一种内容分发方法、装置、电子设备以及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种内容分发方法,其特征在于,包括:
获取内容分发系统中与用户账号对应的订阅账号信息,所述订阅账号为用户账号订阅的分发账号;
采集所述用户账号针对多个分发账号下已发布内容的互动信息;
根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表;
识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型;
基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
2.根据权利要求1所述的方法,其特征在于,所述根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,包括:
识别所述互动信息的意图;
根据意图识别结果、所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表。
3.根据权利要求2所述的方法,其特征在于,所述根据意图识别结果、所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表,包括:
根据意图识别结果,将意图为正向意图对应的互动信息确定为正向互动信息,以及;
将意图为负向意图对应的互动信息确定为负向互动信息;
检测所述分发账号中所述正向互动信息的数量是否大于负向互动信息的数量;
将所述正向互动信息的数量大于负向互动信息的数量对应的分发账号,确定为正向分发账号;
基于确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
4.根据权利要求3所述的方法,其特征在于,所述基于确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表,包括:
从所述订阅账号信息中提取与所述用户账号对应的订阅账号;
在多个分发账号中选择与所述订阅账号之间的相似度大于第一预设值的分发账号,得到第一候选账号集;
根据所述第一候选账号集中各分发账号与所述订阅账号之间的相似度,构建所述第一候选账号集的拓扑结构图,得到第一拓扑结构图;
在多个分发账号中选择与所述正向分发账号之间的相似度大于第二预设值的分发账号,得到第二候选账号集;
根据所述第二候选账号集中各分发账号与所述正向分发账号之间的相似度,构建所述第二候选账号集的拓扑结构图,得到第二拓扑结构图;
基于所述第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一拓扑结构图和第二拓扑结构图从多个分发账号中召回目标分发账号,得到目标分发账号列表,包括:
分别对所述第一拓扑结构图和第二拓扑结构图进行向量化处理,得到第一嵌入式向量和第二嵌入式向量;
对所述第一嵌入式向量和第二嵌入式向量进行拼接;
从多个分发账号中选择与拼接后向量对应的分发账号,并将选择的分发账号确定为目标分发账号,得到目标分发账号列表。
6.根据权利要求4所述的方法,其特征在于,还包括:
根据所述订阅账号信息从确定的正向分发账号中,选择与所述用户账号具有订阅关系的正向分发账号,得到正向订阅分发账号;
在所述正向订阅分发账号已发布内容中,将所述正向互动信息对应的内容确定为互动内容;
从所述正向订阅分发账号已发布内容中去除所述互动内容,得到所述正向订阅分发账号的保留内容;
在内容分发系统中获取与所述保留内容之间相似度大于第三预设值的内容,得到相似内容;
识别所述相似内容对应的分发账号,得到参考账号;
所述基于确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表,包括:基于所述参考账号、确定的正向分发账号以及所述订阅账号信息从多个分发账号中召回目标分发账号,得到目标分发账号列表。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发,包括:
基于所述内容类型和分发账号下已发布内容的内容数量,生成目标分发账号列表中目标分发账号的内容分布信息;
根据所述内容分布信息对目标分发账号列表中目标分发账号进行内容分发。
8.根据权利要求7所述的方法,其特征在于,所述根据所述内容分布信息对目标分发账号列表中目标分发账号进行内容分发,包括:
根据所述内容分布信息,对目标分发账号列表中目标分发账号的顺序进行调整;
对调整后的分发列表中的目标分发账号进行内容分发。
9.一种内容分发装置,其特征在于,包括:
获取模块,用于获取内容分发系统中与用户账号对应的订阅账号信息,所述订阅账号为用户账号订阅的分发账号;
采集模块,用于采集所述用户账号针对多个分发账号下已发布内容的互动信息;
召回模块,用于根据所述互动信息和订阅账号信息,从多个分发账号中召回目标分发账号,得到目标分发账号列表;
识别模块,用于识别所述目标分发账号列表中目标分发账号已发布内容对应的内容类型;
分发模块,用于基于所述内容类型和目标分发账号下已发布内容的内容数量,对目标分发账号列表中目标分发账号进行内容分发。
10.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-9任一项所述内容分发方法的步骤。
11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-9任一项所述内容分发方法的步骤。
CN202010609192.1A 2020-06-29 2020-06-29 内容分发方法、装置、电子设备以及存储介质 Active CN111885399B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010609192.1A CN111885399B (zh) 2020-06-29 2020-06-29 内容分发方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010609192.1A CN111885399B (zh) 2020-06-29 2020-06-29 内容分发方法、装置、电子设备以及存储介质

Publications (2)

Publication Number Publication Date
CN111885399A true CN111885399A (zh) 2020-11-03
CN111885399B CN111885399B (zh) 2023-06-13

Family

ID=73157320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010609192.1A Active CN111885399B (zh) 2020-06-29 2020-06-29 内容分发方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111885399B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818113A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于异构图网络的文本自动摘要方法
CN112989167A (zh) * 2021-04-15 2021-06-18 腾讯科技(深圳)有限公司 搬运账号的识别方法、装置、设备及计算机可读存储介质
CN113360657A (zh) * 2021-06-30 2021-09-07 安徽商信政通信息技术股份有限公司 一种公文智能分发办理方法、装置及计算机设备
CN114124490A (zh) * 2021-11-11 2022-03-01 北京搜房科技发展有限公司 新媒体内容的发布方法及装置、存储介质及电子设备
CN114172957A (zh) * 2021-12-02 2022-03-11 Oppo广东移动通信有限公司 订阅系统、方法、电子设备、服务器、存储介质及产品
CN114547435A (zh) * 2020-11-24 2022-05-27 腾讯科技(深圳)有限公司 内容质量的识别方法、装置、设备及可读存储介质
CN114691970A (zh) * 2020-12-30 2022-07-01 北京达佳互联信息技术有限公司 数据处理方法、装置、服务器及存储介质
CN115061836A (zh) * 2022-08-16 2022-09-16 浙江大学滨海产业技术研究院 一种接口层面的基于图嵌入算法的微服务拆分方法
CN115730111A (zh) * 2021-09-01 2023-03-03 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN114172957B (zh) * 2021-12-02 2024-05-14 Oppo广东移动通信有限公司 订阅系统、方法、电子设备、服务器、存储介质及产品

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020029384A1 (en) * 2000-07-20 2002-03-07 Griggs Theodore L. Mechanism for distributing content data
US20120191599A1 (en) * 2011-01-24 2012-07-26 Psonar Limited On-line content distribution system
US20130097685A1 (en) * 2011-10-14 2013-04-18 Sean Kennedy Method and system for content distribution management
CN103618668A (zh) * 2013-12-18 2014-03-05 清华大学 微博推送、接收方法及装置
US20150082170A1 (en) * 2013-09-18 2015-03-19 ModioNews, LLC Method and system for creation and distribution of narrated content
CN106168971A (zh) * 2016-07-08 2016-11-30 北京麒麟合盛网络技术有限公司 信息订阅方法及装置
CN107135145A (zh) * 2017-04-19 2017-09-05 努比亚技术有限公司 消息推送控制方法及装置
US20170339020A1 (en) * 2016-05-23 2017-11-23 Tivo Solutions Inc. Subscription optimizer
US20180165770A1 (en) * 2016-12-09 2018-06-14 MeadCon LLC Providing targeted content
CN108390933A (zh) * 2018-02-26 2018-08-10 广州华多网络科技有限公司 消息分发方法、装置、服务器及存储介质
CN108573391A (zh) * 2017-03-09 2018-09-25 腾讯科技(北京)有限公司 一种推广内容的处理方法、装置及系统
CN109544396A (zh) * 2019-01-10 2019-03-29 腾讯科技(深圳)有限公司 账号推荐方法、装置、服务器、终端及存储介质
CN110019800A (zh) * 2017-11-30 2019-07-16 腾讯科技(深圳)有限公司 分发内容处理方法、装置、计算机设备和存储介质
CN110325986A (zh) * 2017-12-15 2019-10-11 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN111090813A (zh) * 2019-12-20 2020-05-01 腾讯科技(深圳)有限公司 一种内容处理方法、装置和计算机可读存储介质
CN111327514A (zh) * 2020-01-15 2020-06-23 广州新居网家居科技有限公司 微信图文消息群发方法、系统、服务器及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020029384A1 (en) * 2000-07-20 2002-03-07 Griggs Theodore L. Mechanism for distributing content data
US20120191599A1 (en) * 2011-01-24 2012-07-26 Psonar Limited On-line content distribution system
US20130097685A1 (en) * 2011-10-14 2013-04-18 Sean Kennedy Method and system for content distribution management
US20150082170A1 (en) * 2013-09-18 2015-03-19 ModioNews, LLC Method and system for creation and distribution of narrated content
CN103618668A (zh) * 2013-12-18 2014-03-05 清华大学 微博推送、接收方法及装置
US20170339020A1 (en) * 2016-05-23 2017-11-23 Tivo Solutions Inc. Subscription optimizer
CN106168971A (zh) * 2016-07-08 2016-11-30 北京麒麟合盛网络技术有限公司 信息订阅方法及装置
US20180165770A1 (en) * 2016-12-09 2018-06-14 MeadCon LLC Providing targeted content
CN108573391A (zh) * 2017-03-09 2018-09-25 腾讯科技(北京)有限公司 一种推广内容的处理方法、装置及系统
CN107135145A (zh) * 2017-04-19 2017-09-05 努比亚技术有限公司 消息推送控制方法及装置
CN110019800A (zh) * 2017-11-30 2019-07-16 腾讯科技(深圳)有限公司 分发内容处理方法、装置、计算机设备和存储介质
CN110325986A (zh) * 2017-12-15 2019-10-11 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN108390933A (zh) * 2018-02-26 2018-08-10 广州华多网络科技有限公司 消息分发方法、装置、服务器及存储介质
CN109544396A (zh) * 2019-01-10 2019-03-29 腾讯科技(深圳)有限公司 账号推荐方法、装置、服务器、终端及存储介质
CN111090813A (zh) * 2019-12-20 2020-05-01 腾讯科技(深圳)有限公司 一种内容处理方法、装置和计算机可读存储介质
CN111327514A (zh) * 2020-01-15 2020-06-23 广州新居网家居科技有限公司 微信图文消息群发方法、系统、服务器及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁媛;: "类信息流模式下传统媒体微信订阅号的发展策略", 编辑学刊, no. 06 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547435A (zh) * 2020-11-24 2022-05-27 腾讯科技(深圳)有限公司 内容质量的识别方法、装置、设备及可读存储介质
CN114691970A (zh) * 2020-12-30 2022-07-01 北京达佳互联信息技术有限公司 数据处理方法、装置、服务器及存储介质
CN112818113A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于异构图网络的文本自动摘要方法
CN112989167A (zh) * 2021-04-15 2021-06-18 腾讯科技(深圳)有限公司 搬运账号的识别方法、装置、设备及计算机可读存储介质
CN113360657B (zh) * 2021-06-30 2023-10-24 安徽商信政通信息技术股份有限公司 一种公文智能分发办理方法、装置及计算机设备
CN113360657A (zh) * 2021-06-30 2021-09-07 安徽商信政通信息技术股份有限公司 一种公文智能分发办理方法、装置及计算机设备
CN115730111A (zh) * 2021-09-01 2023-03-03 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN115730111B (zh) * 2021-09-01 2024-02-06 腾讯科技(深圳)有限公司 内容分发方法、装置、设备及计算机可读存储介质
CN114124490A (zh) * 2021-11-11 2022-03-01 北京搜房科技发展有限公司 新媒体内容的发布方法及装置、存储介质及电子设备
CN114124490B (zh) * 2021-11-11 2023-11-24 北京搜房科技发展有限公司 新媒体内容的发布方法及装置、存储介质及电子设备
CN114172957A (zh) * 2021-12-02 2022-03-11 Oppo广东移动通信有限公司 订阅系统、方法、电子设备、服务器、存储介质及产品
CN114172957B (zh) * 2021-12-02 2024-05-14 Oppo广东移动通信有限公司 订阅系统、方法、电子设备、服务器、存储介质及产品
CN115061836A (zh) * 2022-08-16 2022-09-16 浙江大学滨海产业技术研究院 一种接口层面的基于图嵌入算法的微服务拆分方法

Also Published As

Publication number Publication date
CN111885399B (zh) 2023-06-13

Similar Documents

Publication Publication Date Title
CN111885399B (zh) 内容分发方法、装置、电子设备以及存储介质
Alp et al. Identifying topical influencers on twitter based on user behavior and network topology
Macedo et al. Context-aware event recommendation in event-based social networks
Tavares et al. Scaling-laws of human broadcast communication enable distinction between human, corporate and robot twitter users
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
CN105794154A (zh) 用于分析传输社交通信数据的系统和方法
CN112153426B (zh) 一种内容账号管理方法、装置、计算机设备及存储介质
Cuomo et al. A cultural heritage case study of visitor experiences shared on a social network
CN110309114B (zh) 媒体信息的处理方法、装置、存储介质和电子装置
Chamberlain Using social media for biomonitoring: how Facebook, Twitter, Flickr and other social networking platforms can provide large-scale biodiversity data
CN111639291A (zh) 内容分发方法、装置、电子设备以及存储介质
CN112131472A (zh) 信息推荐方法、装置、电子设备和存储介质
CN111382190A (zh) 一种基于智能的对象推荐方法、装置和存储介质
CN113392331A (zh) 文本处理方法及设备
CN112131430A (zh) 视频聚类方法、装置、存储介质和电子设备
CN105308591A (zh) 来自社交交互的关系强度的动态性
CN112165639B (zh) 内容分发方法、装置、电子设备以及存储介质
CN110069686A (zh) 用户行为分析方法、装置、计算机装置及存储介质
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
Yang et al. BMP: A blockchain assisted meme prediction method through exploring contextual factors from social networks
CN104111964A (zh) 一种社区内用户阅读应用数据处理方法
CN112989167B (zh) 搬运账号的识别方法、装置、设备及计算机可读存储介质
Chen et al. Sentiment analytics of Chinese social media posts
CN116150470A (zh) 内容推荐方法、装置、设备、存储介质及程序产品
CN114996435A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40031404

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant