CN110990720A - 作品传播预测方法、装置及存储介质 - Google Patents

作品传播预测方法、装置及存储介质 Download PDF

Info

Publication number
CN110990720A
CN110990720A CN201911284346.8A CN201911284346A CN110990720A CN 110990720 A CN110990720 A CN 110990720A CN 201911284346 A CN201911284346 A CN 201911284346A CN 110990720 A CN110990720 A CN 110990720A
Authority
CN
China
Prior art keywords
behavior
user
state
determining
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911284346.8A
Other languages
English (en)
Inventor
刘杉
董瑶
唐瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201911284346.8A priority Critical patent/CN110990720A/zh
Publication of CN110990720A publication Critical patent/CN110990720A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种作品传播预测方法、装置及存储介质,所述方法包括:根据多个用户针对待预测的目标作品的行为状态,确定多个用户处于各个行为状态的行为状态密度,行为状态包括未接触状态以及接触状态;根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对目标作品的行为转换概率,第一类别为目标作品所属的类别;根据行为状态密度以及行为转换概率,确定目标作品的传播预测结果。根据本公开的实施例的作品传播预测方法能够提高作品传播预测的准确性。

Description

作品传播预测方法、装置及存储介质
技术领域
本公开涉及信息处理技术领域,尤其涉及一种作品传播预测方法、装置及存储介质。
背景技术
大规模在线社交网络的发展为互联网资源传播带来了极大便利,也为传播动力学在复杂网络中的研究提供了丰富的数据来源。
一般而言,互联网的信息传播是建立在两种用户行为的基础之上的:用户交互的资源项目和用户之间的社会联系。其中,用户交互的资源项目可以包括对信息的浏览、评论以及转发等行为。在用户面对大量的信息时,发现用户的兴趣偏好有利于促进对用户行为的研究。但是现有技术的方法并不涉及作品传播领域,而且现有技术的方法无法准确地预测作品的传播情况。
发明内容
有鉴于此,本公开提出了一种作品传播预测方法,能够提高作品传播预测的准确性。
根据本公开的一方面,提出了一种作品传播预测方法,包括:
根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,所述行为状态包括未接触状态以及接触状态;
根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,所述第一类别为所述目标作品所属的类别;
根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
在一种可能的实现方式中,所述方法还包括:
根据第一用户针对多个类别的作品的历史行为信息,确定所述第一用户针对所述多个类别的作品的用户偏好信息,所述第一用户是所述多个用户中的任意一个。
在一种可能的实现方式中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在第二用户针对所述目标作品的行为状态为未接触状态时,根据所述第二用户针对多个类别的作品的用户偏好信息,以及所述目标作品的第一类别,确定所述第二用户的第一行为转换概率,
其中,所述第一行为转换概率用于表示用户的行为状态由未接触状态向接触状态转换的概率,所述第二用户是所述多个用户中的任意一个。
在一种可能的实现方式中,所述接触状态包括接触且未传播状态、接触且传播状态以及屏蔽状态,
其中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在所述第二用户针对所述目标作品的行为状态为接触状态时,根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户的第二行为转换概率,
其中,所述第二行为转换概率用于表示用户的行为状态在各个接触状态之间转换的概率。
在一种可能的实现方式中,所述传播预测结果包括所述多个用户的预测行为状态密度,根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果,包括:
针对所述多个用户中处于未接触状态的第三用户,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态;
针对所述多个用户中处于接触状态的第四用户,根据所述第四用户的第二行为转换概率,确定所述第四用户的预测行为状态;
根据所述多个用户的预测行为状态,确定所述多个用户的预测行为状态密度。
在一种可能的实现方式中,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态,包括:
在所述第三用户的第一行为转换概率小于预设的第一阈值时,确定所述第三用户的预测行为状态为屏蔽状态;
在所述第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,确定所述第三用户的预测行为状态为接触且未传播状态;
在所述第三用户的第一行为转换概率大于或等于所述第二阈值时,确定所述第三用户的预测行为状态为接触且传播状态。
在一种可能的实现方式中,根据所述第二用户针对所述第一类别作品的历史行为信息,确定所述第二用户的第二行为转换概率,包括:
根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户针对第一类别的文艺作品的行为转变特征;
根据所述行为转变特征以及所述第二用户针对所述目标作品的行为状态,确定所述第二用户的第二行为转换概率。
根据本公开的另一方面,提供了一种作品传播预测装置,包括:
状态密度确定模块,用于根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,所述行为状态包括未接触状态以及接触状态;
转换概率确定模块,用于根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,所述第一类别为所述目标作品所属的类别;
预测结果确定模块,用于根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
在一种可能的实现方式中,所述装置还包括偏好信息确定模块,用于:
根据第一用户针对多个类别的作品的历史行为信息,确定所述第一用户针对所述多个类别的作品的用户偏好信息,所述第一用户是所述多个用户中的任意一个。
在一种可能的实现方式中,所述转换概率确定模块还用于:
在第二用户针对所述目标作品的行为状态为未接触状态时,根据所述第二用户针对多个类别的作品的用户偏好信息,以及所述目标作品的第一类别,确定所述第二用户的第一行为转换概率,
其中,所述第一行为转换概率用于表示用户的行为状态由未接触状态向接触状态转换的概率,所述第二用户是所述多个用户中的任意一个。
在一种可能的实现方式中,所述接触状态包括接触且未传播状态、接触且传播状态以及屏蔽状态,所述转换概率确定模块还用于:
在所述第二用户针对所述目标作品的行为状态为接触状态时,根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户的第二行为转换概率,
其中,所述第二行为转换概率用于表示用户的行为状态在各个接触状态之间转换的概率。
在一种可能的实现方式中,所述传播预测结果包括所述多个用户的预测行为状态密度,所述预测结果确定模块还包括:
第三用户预测行为状态确定子模块,用于针对所述多个用户中处于未接触状态的第三用户,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态;
第四用户预测行为状态确定子模块,用于针对所述多个用户中处于接触状态的第四用户,根据所述第四用户的第二行为转换概率,确定所述第四用户的预测行为状态;
状态密度预测子模块,用于根据所述多个用户的预测行为状态,确定所述多个用户的预测行为状态密度。
在一种可能的实现方式中,第三用户预测行为状态确定子模块还用于:
在所述第三用户的第一行为转换概率小于预设的第一阈值时,确定所述第三用户的预测行为状态为屏蔽状态;
在所述第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,确定所述第三用户的预测行为状态为接触且未传播状态;
在所述第三用户的第一行为转换概率大于或等于所述第二阈值时,确定所述第三用户的预测行为状态为接触且传播状态。
在一种可能的实现方式中,转换概率确定模块还用于:
根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户针对第一类别的文艺作品的行为转变特征;
根据所述行为转变特征以及所述第二用户针对所述目标作品的行为状态,确定所述第二用户的第二行为转换概率。
根据本公开的另一方面,提供了一种作品传播预测装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的实施例,根据多个用户针对待预测的目标作品的行为状态,确定多个用户处于各个行为状态的行为状态密度;根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对目标作品的行为转换概率,根据行为状态密度以及行为转换概率,确定目标作品的传播预测结果,从而能够准确地预测目标作品的传播情况。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
图1示出根据本公开实施例的作品传播预测方法的流程图。
图2示出根据本公开实施例的行为状态转换的示意图。
图3示出根据本公开实施例的作品传播预测装置的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开实施例的作品传播预测方法的流程图。如图1所示,所述方法包括:
步骤S100,根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度;
步骤S200,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率;
步骤S300,根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
根据本公开的实施例,根据多个用户针对待预测的目标作品的行为状态,确定多个用户处于各个行为状态的行为状态密度;根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对目标作品的行为转换概率,根据行为状态密度以及行为转换概率,确定目标作品的传播预测结果,从而能够准确地预测目标作品的传播情况。
本公开的实施例所述的目标作品可以包括影视作品、文学作品等。以文学作品为例,文学作品是指文学、艺术和科学领域内具有独创性并能够以某种有形形式复制的智力成果,例如小说等。为了说明的方便,本公开的实施例的目标作品均以文学作品为例进行说明,本公开的实施例对目标作品的具体内容不作限制。
在一种可能的实现方式中,可以使用例如网络爬虫、语音识别、字幕识别等数据采集技术以及现有的官方数据,从互联网门户网站、社交平台、移动应用程序以及传统媒体等多种渠道、多种终端中获取与目标作品相关的用户评论以及用户针对目标作品所发表信息的文本内容。
在一种可能的实现方式中,得到多个文本内容之后,可以使用分词工具对各个文本内容进行分词,例如,使用Python的中文分词组件jieba分词工具对各个文本内容进行分词:在jieba词库中载入编写的自定义词典,使用jieba分词工具对各个文本内容进行分词,并根据停用词词典,删除各个文本内容中的停用词,得到多个词语。本公开对分词的具体方式不作限制。
在一种可能的实现方式中,得到文本内容中多个词语后,可以进一步确定文本内容中各个词语的重要度。其中,词语的重要度可以根据词语在文本内容中的词频以及词语的逆文本频率指数确定,也即文本内容中各个词语的重要度可以通过词语的TF-IDF值来确定。其中,TF(Term Frequency)为词频,是指一个词语在文本内容中出现的次数,IDF(Inverse Document Frequency)为一个词语的逆文本频率指数。词语的TF-IDF值越大,说明该词语在文本内容中出现的频率越高,且在其他文本内容中很少出现,可认为该词语具有很好的区分能力。
在一种可能的实现方式中,可通过如下方式(1)所示的方法来确定各个文本内容中各个词语的TF-IDF权重值:
公式(1):
Figure BDA0002317587590000081
Figure BDA0002317587590000082
TFIDFi,j=TFi,j×IDFi
wT=eTFIDF
其中,TFi,j表示词语i在文本内容j中词频,i和j均为正整数,i的取值为1,…,q(q为文本内容j中的词语总数),ni,j表示词语i在文本内容j中出现的次数,nk,j表示词语k在文本内容j中出现的次数,词语k表示在文本内容j中出现次数最多的词语,IDFi表示词语i的逆文本频率指数,|D|表示文本内容的总数,|{j:ti∈dj}|为包括第i个词语ti的文本内容的数量,dj表示文本内容j中的所有词语,wT表示词语i在文本内容j的权重值。
在一种可能的实现方式中,得到文本内容中多个词语后,还可以进一步确定文本内容中词语的位置信息的权重值。可选地,可以通过如下公式(2)所示的方法确定文本内容中词语的位置信息的权重值:
公式(2):
Figure BDA0002317587590000083
position=[标题,摘要,内容]
其中,position=[标题,摘要,内容]表示词语在文本内容中出现的位置。词语在文本内容中出现的位置对于提取目标作品的标签具有较大价值。示例性地,文本内容的标题和摘要在一定程度上就能够体现文本内容所要表达的意思,若词语出现在标题或摘要中,则其对确定目标作品的标签所占的比重就更大。
在一种可能的实现方式中,得到文本内容中多个词语后,还可以进一步确定文本内容中词语的跨度因素的权重值。可选地,可以通过如下公式(3)所示的方法确定文本内容中词语的跨度因素的权重值:
公式(3):
Figure BDA0002317587590000091
其中,lasti表示词语i在文本内容中最后出现的位置,firsti表示词语i在文本内容中首次出现的位置,sum表示文本内容中词语的总数。
需要说明的是,文本内容中词语的跨度因素是指一个词语在文本内容中首次出现和最后出现的距离,词语所对应的跨度因素的权重值越大,说明该词语越能反映文本内容所要表达的意思。
在一种可能的实现方式中,得到文本内容中各个词语的TF-IDF权重值、位置信息的权重值以及跨度因素的权重值之后,可以通过如下公式(4)所示的方法确定文本内容对应的目标作品的标签的权重值:
公式(4):
Figure BDA0002317587590000092
其中,w表示文本内容对应的标签的权重值。
根据文本内容的多个参数值确定文本内容对应的目标作品的标签,该标签能够反映出用户的偏好信息。一个目标作品可以同时拥有多个标签,示例性地,以目标作品为文学作品为例进行说明,一部文学作品的标签可以包括武侠、言情、穿越、推理等,通过文学作品的标签能够确定用户喜欢的文学作品类型。可以理解的是,文本内容对应的目标作品的标签的权重值可以有多个,在实际应用中,可以将权重值靠前的标签作为文本内容对应的目标作品的标签,例如,将权重值位于前10的标签作为文本内容对应的目标作品的标签。
在一种可能的实现方式中,根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度。
本公开的实施例所述的行为状态包括未接触状态以及接触状态。其中,接触状态又包括屏蔽状态、接触且未传播以及接触且传播状态。为了说明的方便,本公开实施例用对应的参数代表对应的行为状态,具体说明如下:
图2示出根据本公开实施例的行为状态转换示意图。假定各个用户的初始行为状态均为未接触状态,可以表示为S。根据用户对文学作品的偏好程度,用户在对文学作品接触后会做出不同的行为。在作品传播过程中,用户接触到文学作品后,若对其不感兴趣,则不再参与对该文学作品的传播,且后续也不再希望接触到该类型的文学作品,该用户可能屏蔽该类型的文学作品,则可以认定该用户的行为状态为屏蔽状态,其中,屏蔽状态可以表示为R;若用户对接触到的文学作品较为感兴趣或兴趣一般,例如对接触到的文学作品进行评论等,但是该用户可能没有转发信息的用户习惯,或者该文学作品还不足以让用户进行转发等,则可以认定该用户的行为状态为接触且未传播状态,即休眠状态,可以表示为D;若用户对接触到的文学作品很感兴趣,并且对该文学作品进行转发,则可以认定该用户的行为状态为接触且传播状态,其中,接触且传播状态可以表示为I。需要说明的是,用户的行为状态会根据用户偏好信息、文学作品的资源热度以及文学作品的传播情况等影响因素动态变化,在各个行为状态之间进行动态地转换。
在一种可能的实现方式中,根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,具体如下:
假定当前网络中用户的数量为10人,各个用户对待预测的目标作品的行为状态分别为:3人对待预测的目标作品的行为状态为未接触状态S,2人对待预测的目标作品的行为状态为屏蔽状态R,3人对待预测的目标作品的行为状态为接触且未传播状态D,2人对待预测的目标作品的行为状态为接触且传播状态I,则根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度分别为:未接触状态S的行为状态密度为3/10,屏蔽状态R的行为状态密度为2/10,接触且未传播状态D的行为状态密度为3/10,接触且传播状态I的行为状态密度为2/10。
在一种可能的实现方式中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率。其中,第一类别为目标作品所述的类别。
在实际应用中,用户对作品类型的偏好程度会直接影响到作品的传播结果。可以理解的是,用户群体行为是基于用户的个性和需求而形成的,每个用户都可能有不同的需求,有相同需求的用户也是大量存在的,所以造成用户行为多样化和具有复杂性。因此,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对目标作品的行为转换概率,能够有利于准确地预测各个用户如何在不同的状态之间动态进行转换。
在一种可能的实现方式中,在确定各个用户针对所述目标作品的行为转换概率之前,本公开的实施例还可以包括根据第一用户针对多个类别的作品的历史行为信息,确定第一用户针对多个类别的作品的用户偏好信息。其中,第一用户是多个用户中的任意一个。
可选地,可以通过获取用户对目标作品的点击量、转发量以及评论量等行为数据衡量用户对目标作品的偏好程度。示例性地,若某个用户是文学作品爱好者,该用户点击的文学作品都是玄幻、推理类型的,而从未点击过言情、武侠类型的作品,则可以根据用户的文学作品的点击量推定该用户偏好玄幻、推理类型的文学作品,而对言情、武侠类型的作品不感兴趣。
具体地,可以按照如下公式(5)所示的方法确定第一用户针对多个类别的作品的用户偏好信息:
公式(5):
Figure BDA0002317587590000111
其中,
Figure BDA0002317587590000112
表示用户偏好信息对应的特征向量,v表示第一用户,ci表示第i个作品类型,C表示作品类型集合,r表示作品类型的总数量,
Figure BDA0002317587590000113
表示第一用户参与第r个作品类型的行为次数,Nv,C表示第一用户参与所有作品类型的行为次数。
示例性地,假定共有玄幻、推理、言情以及武侠四种类型的文学作品,若第一用户浏览、点击玄幻类型作品的次数为40次,分享推理类型作品的次数为10次,则可以确定该第一用户对玄幻类型作品的偏好信息为0.8,对推理类型作品的偏好信息为0.2。
在一种可能的实现方式中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在第二用户针对所述目标作品的行为状态为未接触状态时,根据所述第二用户针对多个类别的作品的用户偏好信息,以及所述目标作品的第一类别,确定所述第二用户的第一行为转换概率,
其中,所述第一行为转换概率用于表示用户的行为状态由未接触状态向接触状态转换的概率,所述第二用户是所述多个用户中的任意一个。
在一种可能的实现方式中,可以按照如下公式(6)所示的方法确定所述第二用户的第一行为转换概率:
公式(6):
Figure BDA0002317587590000121
其中,pup表示第一行为转换概率,
Figure BDA0002317587590000122
表示用户偏好信息对应的特征向量,Sub T表示作品类型对应的特征向量的转置。
示例性地,以目标作品为文学作品为例进行说明,目标作品的作品类型可以包括武侠、言情、玄幻、推理等,则作品类型对应的特性向量Sub可以表示为[1,0,0,1]。
在一种可能的实现方式中,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态,包括:
在所述第三用户的第一行为转换概率小于预设的第一阈值时,确定所述第三用户的预测行为状态为屏蔽状态;
在所述第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,确定所述第三用户的预测行为状态为接触且未传播状态;
在所述第三用户的第一行为转换概率大于或等于所述第二阈值时,确定所述第三用户的预测行为状态为接触且传播状态。
其中,第三用户是多个用户中处于未接触状态的用户。
示例性地,预设的第一阈值和预设的第二阈值可以分别表示为p1和p2。假定各个用户的初始行为状态均为未接触状态S,结合附图2可知,在所述第三用户的第一行为转换概率小于预设的第一阈值时,即pup<p1,则可以确定第三用户的预测行为状态将由未接触状态S转换为屏蔽状态R;在第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,即p1≤pup<p2,则可以确定第三用户的预测行为状态将由未接触状态S转换为接触且未传播状态D;在第三用户的第一行为转换概率大于或等于第二阈值时,即p2≤p2,则可以确定第三用户的预测行为状态将由未接触状态S转换为接触且传播状态I。
在一种可能的实现方式中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在所述第二用户针对所述目标作品的行为状态为接触状态时,根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户的第二行为转换概率,
其中,所述第二行为转换概率用于表示用户的行为状态在各个接触状态之间转换的概率。
在一种可能的实现方式中,根据所述第二用户针对所述第一类别作品的历史行为信息,确定所述第二用户的第二行为转换概率,包括:
根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户针对第一类别的文艺作品的行为转变特征;
根据所述行为转变特征以及所述第二用户针对所述目标作品的行为状态,确定所述第二用户的第二行为转换概率。
需要说明的是,用户的行为状态具有时序性,用户对某一作品的态度根据其偏好程度可以分为:喜欢、不喜欢以及中立的态度,用户对作品的态度可以分别用2表示喜欢、1表示不喜欢以及0表示中立。示例性地,可以根据用户的转发、点击、评论等行为建立该用户的态度序列,例如:0、1、2、0、2、2、1、1、0……根据用户的态度序列可以确定用户的行为转变特征。
根据用户的行为转变特征以及第二用户针对目标作品的行为状态可以确定第二用户的第二行为概率,具体地:
结合附图2可知,若第二用户针对目标作品的行为状态为接触且传播状态I,并且该第二用户的态度序列由不喜欢转变为中立,则第二用户的第二行为概率可以表示为b1=p1→0;若第二用户针对目标作品的行为状态为接触且传播状态I,并且第二用户的态度序列由喜欢转变为中立,则第二用户的第二行为概率可以表示为b2=p2→1;若第二用户针对目标作品的行为状态为接触且未传播状态D,并且第二用户的态度序列由喜欢转变为中立,则第二用户的第二行为概率可以表示为c1=p2→0;若第二用户针对目标作品的行为状态为接触且未传播状态D,并且第二用户的态度序列由中立转变为不喜欢,则第二用户的第二行为概率可以表示为c2=p0→1
在一种可能的实现方式中,根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果,包括:
针对所述多个用户中处于接触状态的第四用户,根据所述第四用户的第二行为转换概率,确定所述第四用户的预测行为状态。
示例性地,结合附图2,假定第四用户处于接触且传播状态I,该第四用户对应的第二行为转换概率分别为b1=p1→0和b2=p2→1,可选地,可以根据第二行为概率的比值大小确定第四用户的预测行为状态。示例性地,若b1>b2,则可以确定第四用户的预测行为状态为接触且未传播状态D,若b1<b2,则可以确定第四用户的预测行为状态为屏蔽状态R;假定第四用户处于接触且未传播状态D,该第四用户对应的第二行为转换概率分别为c1=p2→0和c2=p0→1,若c1>c2,则可以确定第四用户的预测行为状态为接触且传播状态I;若c1<c2,则可以确定第四用户的预测行为状态为屏蔽状态R。需要说明的是,本公开的实施例对根据第二行为转换概率确定第四用户的预测行为状态不作具体限制。
可以理解的是,用户的预测行为状态会根据用户偏好信息、文学作品的资源热度以及文学作品的传播情况等影响因素动态变化,在各个行为状态之间进行动态地转换。根据行为状态密度以及行为转换概率,确定目标作品的传播预测结果,从而能够准确地预测目标作品的传播情况。
在一种可能的实现方式中,根据所述多个用户的预测行为状态,确定所述多个用户的预测行为状态密度。
假定当前网络中用户的数量为10人,其中5名用户的初始行为状态为未接触状态S,5名用户的初始行为状态为接触状态,5名处于接触状态的用户中,3名用户处于接触且未传播状态D,2名用户处于接触且传播状态I,根据多个用户的预测行为状态,确定多个用户的预测行为状态密度,具体如下:
示例性地,假定处于未接触状态S的5名用户中,有1名用户的预测行为状态为屏蔽状态R,有2名用户的预测行为状态为接触且传播状态I,有1名用户的预测行为状态为接触且未传播状态D,剩下的用户依旧保持未接触状态S;处于接触且未传播状态D的3名用户中,有1名用户的预测行为状态为接触且传播状态I,有1名用户的预测行为状态为屏蔽状态R,剩下的用户依旧保持接触且未传播状态D;处于接触且传播状态I的2名用户中,有1名用户的预测行为状态为接触且未传播状态D,剩下的用户依旧保持接触且传播状态I;综上可知,处于未接触状态S的用户数量为1名,处于接触且传播状态I的用户数量为4名,处于接触且未传播状态D的用户数量为3名,处于屏蔽状态R的用户数量为2名,则每个用户的预测行为状态密度分别为:未接触状态S的预测行为状态密度为1/10,屏蔽状态R的预测行为状态密度为2/10,接触且未传播状态D的预测行为状态密度为3/10,接触且传播状态I的预测行为状态密度为4/10。
图3示出根据本公开实施例的作品传播预测装置的框图。如图3所示,所述作品传播预测装置,包括:
状态密度确定模块31,用于根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,所述行为状态包括未接触状态以及接触状态;
转换概率确定模块32,用于根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,所述第一类别为所述目标作品所属的类别;
预测结果确定模块33,用于根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
在一种可能的实现方式中,所述装置还包括偏好信息确定模块,所述偏好信息确定模块用于:
根据第一用户针对多个类别的作品的历史行为信息,确定所述第一用户针对所述多个类别的作品的用户偏好信息,所述第一用户是所述多个用户中的任意一个。
在一种可能的实现方式中,所述转换概率确定模块32还用于:
在第二用户针对所述目标作品的行为状态为未接触状态时,根据所述第二用户针对多个类别的作品的用户偏好信息,以及所述目标作品的第一类别,确定所述第二用户的第一行为转换概率,
其中,所述第一行为转换概率用于表示用户的行为状态由未接触状态向接触状态转换的概率,所述第二用户是所述多个用户中的任意一个。
在一种可能的实现方式中,所述接触状态包括接触且未传播状态、接触且传播状态以及屏蔽状态,所述转换概率确定模块32还用于:
在所述第二用户针对所述目标作品的行为状态为接触状态时,根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户的第二行为转换概率,
其中,所述第二行为转换概率用于表示用户的行为状态在各个接触状态之间转换的概率。
在一种可能的实现方式中,所述传播预测结果包括所述多个用户的预测行为状态密度,所述预测结果确定模块33还包括:
第三用户预测行为状态确定子模块,用于针对所述多个用户中处于未接触状态的第三用户,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态;
第四用户预测行为状态确定子模块,用于针对所述多个用户中处于接触状态的第四用户,根据所述第四用户的第二行为转换概率,确定所述第四用户的预测行为状态;
状态密度预测子模块,用于根据所述多个用户的预测行为状态,确定所述多个用户的预测行为状态密度。
在一种可能的实现方式中,第三用户预测行为状态确定子模块还用于:
在所述第三用户的第一行为转换概率小于预设的第一阈值时,确定所述第三用户的预测行为状态为屏蔽状态;
在所述第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,确定所述第三用户的预测行为状态为接触且未传播状态;
在所述第三用户的第一行为转换概率大于或等于所述第二阈值时,确定所述第三用户的预测行为状态为接触且传播状态。
在一种可能的实现方式中,转换概率确定模块32还用于:
根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户针对第一类别的文艺作品的行为转变特征;
根据所述行为转变特征以及所述第二用户针对所述目标作品的行为状态,确定所述第二用户的第二行为转换概率。
根据本公开的另一方面,提供了一种作品传播预测装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。
根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种作品传播预测方法,其特征在于,所述方法包括:
根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,所述行为状态包括未接触状态以及接触状态;
根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,所述第一类别为所述目标作品所属的类别;
根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据第一用户针对多个类别的作品的历史行为信息,确定所述第一用户针对所述多个类别的作品的用户偏好信息,所述第一用户是所述多个用户中的任意一个。
3.根据权利要求1所述的方法,其特征在于,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在第二用户针对所述目标作品的行为状态为未接触状态时,根据所述第二用户针对多个类别的作品的用户偏好信息,以及所述目标作品的第一类别,确定所述第二用户的第一行为转换概率,
其中,所述第一行为转换概率用于表示用户的行为状态由未接触状态向接触状态转换的概率,所述第二用户是所述多个用户中的任意一个。
4.根据权利要求3所述的方法,其特征在于,所述接触状态包括接触且未传播状态、接触且传播状态以及屏蔽状态,
其中,根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,包括:
在所述第二用户针对所述目标作品的行为状态为接触状态时,根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户的第二行为转换概率,
其中,所述第二行为转换概率用于表示用户的行为状态在各个接触状态之间转换的概率。
5.根据权利要求4所述的方法,其特征在于,所述传播预测结果包括所述多个用户的预测行为状态密度,根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果,包括:
针对所述多个用户中处于未接触状态的第三用户,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态;
针对所述多个用户中处于接触状态的第四用户,根据所述第四用户的第二行为转换概率,确定所述第四用户的预测行为状态;
根据所述多个用户的预测行为状态,确定所述多个用户的预测行为状态密度。
6.根据权利要求5所述的方法,其特征在于,根据所述第三用户的第一行为转换概率,确定所述第三用户的预测行为状态,包括:
在所述第三用户的第一行为转换概率小于预设的第一阈值时,确定所述第三用户的预测行为状态为屏蔽状态;
在所述第三用户的第一行为转换概率大于或等于所述第一阈值且小于预设的第二阈值时,确定所述第三用户的预测行为状态为接触且未传播状态;
在所述第三用户的第一行为转换概率大于或等于所述第二阈值时,确定所述第三用户的预测行为状态为接触且传播状态。
7.根据权利要求4所述的方法,其特征在于,根据所述第二用户针对所述第一类别作品的历史行为信息,确定所述第二用户的第二行为转换概率,包括:
根据所述第二用户针对第一类别的作品的历史行为信息,确定所述第二用户针对第一类别的文艺作品的行为转变特征;
根据所述行为转变特征以及所述第二用户针对所述目标作品的行为状态,确定所述第二用户的第二行为转换概率。
8.一种作品传播预测装置,其特征在于,包括:
状态密度确定模块,用于根据多个用户针对待预测的目标作品的行为状态,确定所述多个用户处于各个行为状态的行为状态密度,所述行为状态包括未接触状态以及接触状态;
转换概率确定模块,用于根据多个用户针对多个类别的作品的用户偏好信息,以及针对第一类别的作品的历史行为信息,分别确定各个用户针对所述目标作品的行为转换概率,所述第一类别为所述目标作品所属的类别;
预测结果确定模块,用于根据所述行为状态密度以及所述行为转换概率,确定所述目标作品的传播预测结果。
9.一种作品传播预测装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1至7中任意一项所述的方法。
10.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
CN201911284346.8A 2019-12-13 2019-12-13 作品传播预测方法、装置及存储介质 Pending CN110990720A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911284346.8A CN110990720A (zh) 2019-12-13 2019-12-13 作品传播预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911284346.8A CN110990720A (zh) 2019-12-13 2019-12-13 作品传播预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN110990720A true CN110990720A (zh) 2020-04-10

Family

ID=70093426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911284346.8A Pending CN110990720A (zh) 2019-12-13 2019-12-13 作品传播预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110990720A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280610A1 (en) * 2013-03-13 2014-09-18 International Business Machines Corporation Identification of users for initiating information spreading in a social network
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN106156030A (zh) * 2014-09-18 2016-11-23 华为技术有限公司 社交网络中预测信息传播的方法及设备
CN110059882A (zh) * 2019-04-19 2019-07-26 金陵科技学院 一种基于移动社交网络的内容流行度预测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140280610A1 (en) * 2013-03-13 2014-09-18 International Business Machines Corporation Identification of users for initiating information spreading in a social network
CN106156030A (zh) * 2014-09-18 2016-11-23 华为技术有限公司 社交网络中预测信息传播的方法及设备
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN110059882A (zh) * 2019-04-19 2019-07-26 金陵科技学院 一种基于移动社交网络的内容流行度预测方法和装置

Similar Documents

Publication Publication Date Title
CN107832433B (zh) 基于对话交互的信息推荐方法、装置、服务器和存储介质
CN110598157B (zh) 目标信息识别方法、装置、设备及存储介质
CN107241260B (zh) 基于人工智能的新闻推送的方法和装置
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN110633423B (zh) 目标账号识别方法、装置、设备及存储介质
CN108121814B (zh) 搜索结果排序模型生成方法和装置
CN110717069A (zh) 视频推荐方法及装置
CN113268560A (zh) 用于文本匹配的方法和装置
CN111984775A (zh) 问答质量确定方法、装置、设备和存储介质
CN111444335B (zh) 中心词的提取方法及装置
CN112148958A (zh) 用于信息推荐的方法、设备和计算机存储介质
CN110826327A (zh) 情感分析方法、装置、计算机可读介质及电子设备
CN112329454A (zh) 语种识别方法、装置、电子设备及可读存储介质
CN114036397B (zh) 数据推荐方法、装置、电子设备和介质
CN110990720A (zh) 作品传播预测方法、装置及存储介质
CN113051381B (zh) 信息质检方法、装置、计算机系统和计算机可读存储介质
CN115563281A (zh) 基于文本数据增强的文本分类方法及装置
Shinde et al. A Comprehensive Survey on Recommender Systems Techniques and Challenges in Big Data Analytics with IOT Applications
CN113360761A (zh) 信息流推荐方法、装置、电子设备和计算机可读存储介质
CN114492400A (zh) 标题实体识别模型训练方法、标题实体识别方法和装置
CN112905885A (zh) 向用户推荐资源的方法、装置、设备、介质和程序产品
CN112148865A (zh) 信息推送方法和装置
CN112395510A (zh) 基于活跃度确定目标用户的方法和装置
CN111027281A (zh) 划词方法、装置、设备及存储介质
CN111897910A (zh) 信息推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination