CN112632364A - 新闻传播速度测评方法和系统 - Google Patents

新闻传播速度测评方法和系统 Download PDF

Info

Publication number
CN112632364A
CN112632364A CN202110255656.8A CN202110255656A CN112632364A CN 112632364 A CN112632364 A CN 112632364A CN 202110255656 A CN202110255656 A CN 202110255656A CN 112632364 A CN112632364 A CN 112632364A
Authority
CN
China
Prior art keywords
news
propagation speed
propagation
media
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110255656.8A
Other languages
English (en)
Inventor
杨次光
李云轶
夏维
刘芊芊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Tone Communication Technology Co ltd
Original Assignee
Global Tone Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Tone Communication Technology Co ltd filed Critical Global Tone Communication Technology Co ltd
Priority to CN202110255656.8A priority Critical patent/CN112632364A/zh
Publication of CN112632364A publication Critical patent/CN112632364A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种新闻传播速度测评方法和系统,核心是基于新闻媒体权重计算新闻事件主题的传播速度,再通过聚类分析确定传播速度测评体系,最后评定新闻事件主题的传播等级。其中方法包括:确定待测评的新闻事件主题,获取新闻事件主题的新闻数据;基于新闻数据中每一新闻文本的传播媒体信息,计算新闻事件主题的初始传播速度;基于初始传播速度,以及预先设定的传播速度测评体系,确定新闻事件主题的传播速度等级;其中,传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系。本发明实施例提供的方法和系统,实现了基于大数据的新闻事件舆情监测,能够有效提高新闻事件舆情响应效率,有利于决策管理者及时做出舆情应对。

Description

新闻传播速度测评方法和系统
技术领域
本发明涉及舆情分析技术领域,尤其涉及一种新闻传播速度测评方法和系统。
背景技术
随着互联网技术在全球迅猛发展,新闻事件的传播主体和传播媒介发生了变革,传播主体不仅仅限于传统媒体人士,个人社交、自媒体也纷纷加入了传播主体行列,传播媒介也不再限于报纸、电视、电台等传统形式。社交平台、网媒占据了新闻事件的主流传播渠道,新闻传播日益社交化、网络化、多元化。
新闻事件传播速度的测评,是新闻事件舆情分析中非常重要的部分,对于新闻事件的舆情响应效率的提高具有重要意义。而如何在网络化的新闻传播场景下进行新闻传输速度测评,仍然是舆情分析领域亟待解决的问题。
发明内容
本发明实施例提供一种新闻传播速度测评方法和系统,用以解决现有的问题。
第一方面,本发明实施例提供一种新闻传播速度测评方法,包括:
确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;
基于所述新闻数据中每一新闻文本的传播媒体信息及媒体权重,计算所述新闻事件主题的初始传播速度;
将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;
基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
可选地,所述基于所述新闻数据中每一新闻文本的传播媒体信息及媒体权重,计算所述新闻事件主题的初始传播速度,具体包括:
基于任一新闻文本的传播媒体信息,确定所述任一新闻文本的传播媒体类型和媒体权重;
统计所述新闻数据中属于两个时刻的各个传播媒体类型的新闻文本数量;
基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算所述新闻事件主题的初始传播速度。
可选地,所述各个传播媒体类型包括最小影响力媒体、较小影响力媒体、一般影响力媒体、较高影响力媒体和最高影响力媒体。
可选地,所述媒体权重从低到高依次分为1-5级;其中,所述传播媒体类型与所述媒体权重存在一一对应关系。
可选地,所述基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算所述新闻事件主题的初始传播速度,具体包括:
基于属于两个时刻的各个传播媒体类型的新闻文本数量、各个传播媒体类型的媒体权重,以及所述新闻数据的传播总数,计算所述新闻事件主题的初始传播速度。
可选地,将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,具体包括:
对所述样本新闻事件主题的初始传播速度进行聚类,得到预设传播等级数量个簇,以及每个簇的初始传播速度范围;
基于任一簇中包含的所有样本新闻事件主题的传播速度等级标签,确定所述任一簇的传播速度等级,建立所述任一簇的传播速度等级和所述初始传播速度范围之间的对应关系;
对每一簇的传播速度等级和初始传播速度范围之间的对应关系进行调整,得到所述传播速度测评体系。
可选地,所述基于新闻事件主题的初始传播速度,以及传播速度测评体系,确定所述新闻事件主题的传播速度等级,具体包括:
将任一新闻事件主题的初始传播速度,输入到所述传播速度测评体系中;
根据所述传播速度测评体系的传播速度范围,评定所述新闻事件主题的传播速度等级。
可选地,所述传播速度测评体系中,任一传播速度等级越高,所述任一传播速度等级与前一传播速度等级分别对应的初始传播速度的跨度越大。
可选地,所述多个传播速度等级具体为11个传播速度等级,所述11个传播速度等级从低到高顺次对应的事件影响递增。
可选地,所述获取所述新闻事件主题的新闻数据,具体包括:
采集所述新闻事件主题的候选新闻数据;
对所述候选新闻数据进行预处理,得到所述新闻数据;
所述预处理包括数据清洗、数据统一、质量评估和数据治理中的至少一种。
可选地,所述基于所述初始传播速度,以及预先设定的传播速度测评体系,确定所述新闻事件主题的传播速度等级,之后还包括:
执行所述新闻事件主题的传播速度等级对应的预警操作。
第二方面,本发明实施例提供一种新闻传播速度测评系统,包括:
数据采集单元,用于确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;
初始计速单元,用于基于所述新闻数据中的每一新闻文本,以及每一新闻文本的传播媒体信息及媒体权重,计算所述新闻事件主题的初始传播速度;
体系构建单元,用于将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;
等级确定单元,用于基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
第三方面,本发明实施例提供一种电子设备,包括处理器、通信接口、存储器和总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信,处理器可以调用存储器中的逻辑命令,以执行如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的一种新闻传播速度测评方法和系统,计算新闻事件主题的初始传播速度,进而得到新闻事件主题的传播速度等级。新闻事件主题传播速度等级,能快速反映出事件的状态及发展态势,实现了基于大数据的新闻事件舆情监测,将新闻传播速度测评方法应用到社会各领域,能够有效提高新闻事件舆情响应效率,有利于决策管理者及时做出舆情应对。其中,通过参考每一新闻文本的传播媒体信息,计算初始传播速度,提高了传播速度计算的客观性和可靠性,进一步提高了新闻传播速度测评的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的新闻传播速度测评方法的流程示意图;
图2为本发明实施例提供的新闻传播速度测评系统的结构示意图;
图3为本发明实施例提供的新闻事件主题传播速度监测的流程示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
互联网背景下,社交平台、网媒逐步占据了新闻事件的主流传播渠道,新闻传播日益社交化、网络化、多元化。在此场景下,针对新闻事件的传播速度的测评,能够为经济、文化等各个领域的决策提供舆论判断依据,从解决目前的舆情分析客观性不足且时效性差的问题。
针对上述问题,本发明实施例提供了一种新闻传播速度测评方法。图1为本发明实施例提供的新闻传播速度测评方法的流程示意图,如图1所示,该方法包括:
步骤110,确定待测评的新闻事件主题,获取新闻事件主题的新闻数据。
具体地,待测评的新闻事件主题可以是经过媒体报道传播的各种类型的舆情事件。此处媒体具体可以是新闻媒体或者社交媒体,也可以既包括新闻媒体也包括社交媒体。其中,新闻媒体可以包括新闻网站、新闻APP、论坛、博客及平面媒体等,社交媒体可以包括微博、微信等。
此处获取的新闻事件主题的新闻数据,可以包括各个媒体针对该新闻事件主题进行报道的内容、时间、传播量、媒体类型、媒体数量等。新闻数据可以通过常用的搜索引擎对基于新闻事件主题确定的检索词进行检索得到,也可以通过网络爬虫进行抓取得到,本发明实施例对此不作具体限定。
步骤120,基于新闻数据中每一新闻文本的传播媒体信息,计算新闻事件主题的初始传播速度。
具体地,采集得到的新闻数据中包含大量的新闻文本,每一新闻文本对应一次针对该新闻事件主题进行的报道。任一新闻文本的传播媒体信息用于表征此处针对该新闻事件主题进行报道的媒体的信息,具体可以是媒体的名称、媒体的类型、媒体的影响力和权威性等。
在计算新闻传播主题的初始传播速度时,不仅可以考虑针对该新闻事件主题的报道在一段时间内的数量变化情况,还可以进一步考虑不同传播媒体在针对该新闻事件主题进行报道时的数量变化情况,由此得到的初始传播速度在反映传播主体在针对该新闻事件主题关注度的变化情况的同时,还可以反映出不同影响力的媒体在传播该新闻事件主题时作出的贡献。例如,在一段时间内新闻传播增量越大,则初始传播速度越快,传播过程中影响力大的媒体传播增量越大,则初始传播速度越快。
步骤130,将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系。
具体地,任一新闻事件主题的传播速度是随事件的发展而变化的,在不同的时间,传播速度可能是不同的,因此,新闻事件主题的传播等级的状态也是变化的。通过大量随机的样本事件主题的传播速度,在确定传播速度测评体系时,不仅考虑同一新闻事件主题传播速度的时间变化情况,还针对不同领域、不同事件的传播速度差异构建样本数据,保证了样本的随机性、客观性及可靠性。
由此得到的传播速度测评体系是用于评估新闻事件主题的传播速度等级的体系,传播速度测评体系中可以包含预先设定好的多个传播速度等级,每个传播速度等级均对应有各自的初始传播速度范围。
步骤140,基于初始传播速度,以及传播速度测评体系,确定新闻事件主题的传播速度等级。
具体地,在通过步骤120得到待测评的新闻事件主题的初始传播速度后,可以通过步骤130获取的传播速度测评体系中包括多个传播速度等级与初始传播速度之间的对应关系,得到待测评的新闻事件主题的初始传播速度所对应的传播速度等级,作为该新闻事件主题的传播速度等级。
本发明实施例提供的方法,计算新闻事件主题的初始传播速度,进而得到新闻事件主题的传播速度等级,实现了基于大数据的新闻事件舆情监测,将新闻传播速度测评方法应用到社会各领域,能够有效提高新闻事件舆情响应效率,有利于决策管理者及时做出舆情应对。其中,通过参考每一新闻文本的传播媒体信息,计算初始传播速度,提高了传播速度计算的客观性和可靠性,进一步提高了新闻传播速度测评的准确性。
基于上述实施例,步骤110中,所述获取新闻事件主题的新闻数据,具体包括:
采集新闻事件主题的候选新闻数据;
对候选新闻数据进行预处理,得到新闻数据;
预处理包括数据清洗、数据统一、质量评估和数据治理中的至少一种。
此处,候选新闻数据用于表征直接采集得到的新闻数据,从而与预处理后的新闻数据相区分。
预处理操作中,数据清洗包括去除噪音、去除无效文本和去重中至少一种。其中,去除噪音是指去除采集到的候选新闻数据中出现乱码的文本,去除无效文本是指去除采集到的候选新闻数据中与待测评的新闻事件主题无关的文本,去重是指去除采集到的候选新闻数据中用于不同采集渠道导致重复采集的文本。
数据统一是指针对采集到的候选新闻数据中的每一条文本进行信息统一,具体包括对每一条文本的源名称、行业、媒体等信息进行统一治理,从而使得数据统一后的每一条文本均表示为相同格式结构。
质量评估是指针对采集到的候选新闻数据中的每一条文本进行质量评估,从而滤除低质文本,保留高质文本。此处的质量评估具体可以是判断文本中是否存在乱码、伪代码、代码片段等。
数据治理是指对候选新闻数据中对每一条文本添加与新闻传播相关的标签。数据治理可以在数据清洗、数据统一、质量评估等操作之后执行,添加的与新闻传播相关的标签具体可以是每一条文本的传播媒体信息对应的标签,例如可以首先确定任意一条文本的传播媒体,并根据预先对传播媒体的分类,判断该传播媒体是权重媒体还是非权重媒体,并设置对应的标签用于表示该文本的传播媒体是否是权重媒体,此外,还可以设置标签表示该传播媒体的权重值。
经过数据清洗及治理等预处理操作后,得到的新闻数据的特征具体可以包括时间、事件主题、标题、正文、媒体、媒体类型和媒体权重中一种或者多种。上述各种特征具体可以表示为如下表格:
Figure 541957DEST_PATH_IMAGE001
基于上述任一实施例,步骤120具体包括:
基于任一新闻文本的传播媒体信息,确定该新闻文本的传播媒体类型;
统计新闻数据中属于两个时刻的各个传播媒体类型的新闻文本数量;
基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算新闻事件主题的初始传播速度。
此处,针对任一新闻文本,该新闻文本的传播媒体信息可以是该新闻文本的传播媒体,该新闻文本的传播媒体类型即该新闻文本的传播媒体的具体类型。传播媒体类型包括权重媒体或非权重媒体,其中非权重媒体可以进一步包括最小影响力媒体和较小影响力媒体,权重媒体可以进一步包括一般影响力媒体、较高影响力媒体及最高影响力媒体,传播媒体的影响力等级均是预先设定好的。例如,传播媒体类型的划分可以体现为下表:
Figure 833261DEST_PATH_IMAGE002
初始传播速度的计算可以通过斜率法实现,具体通过统计各个传播媒体类型在两个不同时刻的新闻文本数量的差值和两个不同时刻的间隔之间的比值确定。此处的两个时刻可以是预先选定的,两个时刻之间的间隔可以是预先设定的单位间隔,也可以是任意间隔,本发明实施例对此不做具体限定。需要说明的是,针对其中任一时刻,该时刻的新闻文本数量等于该时刻下各个传播媒体类型的新闻文本数量之和。
在统计得到新闻数据中属于两个时刻的各个传播媒体类型的新闻文本数量后,即可通过如下公式计算新闻事件主题的初始传播速度:
Figure 693770DEST_PATH_IMAGE003
式中,
Figure 158249DEST_PATH_IMAGE004
为第
Figure 764811DEST_PATH_IMAGE005
个时刻的新闻事件主题的初始传播速度,
Figure 628948DEST_PATH_IMAGE006
Figure 648857DEST_PATH_IMAGE007
分别表示第
Figure 589131DEST_PATH_IMAGE008
和第
Figure 378096DEST_PATH_IMAGE009
个时刻;
Figure 135836DEST_PATH_IMAGE010
Figure 377461DEST_PATH_IMAGE011
分别表示第
Figure 387006DEST_PATH_IMAGE012
和第
Figure 358373DEST_PATH_IMAGE013
个时刻下第
Figure 959118DEST_PATH_IMAGE014
个传播媒体类型的新闻文本数量,
Figure 891302DEST_PATH_IMAGE015
为第
Figure 235696DEST_PATH_IMAGE016
个传播媒体类型的媒体权重。
假设共存在5个传播媒体类型,
Figure 327149DEST_PATH_IMAGE017
分别表示最小影响力媒体、较小影响力媒体、一般影响力媒体、较高影响力媒体、最高影响力媒体,各个传播媒体类型分别对应的媒体权重依次增大,即影响力越高的传播媒体类型,对应媒体权重越大。
本发明实施例提供的方法,在计算初始传播速度时结合了新闻文本的传播媒体类型,提高了传播速度计算的客观性和可靠性,进一步提高了新闻传播速度测评的准确性。
基于上述任一实施例,所述基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算新闻事件主题的初始传播速度,具体包括:
基于属于两个时刻的各个传播媒体类型的新闻文本数量、各个传播媒体类型的媒体权重,以及新闻数据的传播媒体总数,计算新闻事件主题的初始传播速度。
具体地,在计算新闻事件主题的初始传播速度时,处理考虑在两个时刻之间各个传播媒体类型的新闻文本增量,还可以考虑两个时刻的新闻数据的传播媒体总量。通过两个时刻之间对该新闻事件主题进行报道的传播媒体数量的变化,也可以在一定程度上反映新闻事件主题的传播速度。
考虑到传播媒体数量本身和新闻文本数量之间存在正相关关系,为了计算的简便性可以不将传播媒体数量的变化纳入初始传播速度的计算之中。另一方面,从对传播速度产生影响的因素上进行考虑,传播媒体数量的增加,尤其是权重媒体数量的增加,也可以从媒体影响力的方向上体现新闻事件主题的传播速度。
本发明实施例中,不将传播媒体总数纳入初始传播速度的计算,避免了因子的显著性问题,从而更加全面地分析影响初始传播速度的因素,进一步提高了初始传播速度的计算准确性。
基于上述任一实施例,步骤130中,传播速度测评体系由样本新闻事件主题的初始传播速度聚类得到的。
具体地,预先建立海量样本新闻事件主题,并分别采集与每个样本新闻事件主题相关的新闻数据,进而基于任一样本新闻事件主题的新闻数据,计算该样本新闻事件主题的初始传播速度。最后,对各个样本新闻事件主题的初始传播速度进行聚类,得到多个簇,每个簇可以对应一个传播速度等级,由此得到每个传播速度等级分别对应的初始传播速度的范围,进而得到包含多个传播速度等级的传播速度测评体系。
进一步地,传播速度测评体系是基于如下步骤确定的:
对样本新闻事件主题的初始传播速度进行聚类,得到预设传播等级数量个簇,以及每个簇的初始传播速度范围;基于任一簇中包含的所有样本新闻事件主题的传播速度等级标签,确定该簇的传播速度等级,建立该簇的传播速度等级和初始传播速度范围之间的对应关系;对每一簇的传播速度等级和初始传播速度范围之间的对应关系进行调整,得到传播速度测评体系。
特别地,在进行聚类分级前,可以先综合测评最高级(10级)的传播速度等级对应的初始传播速度范围。例如,先通过人工建立多个十级传播速度等级的样本新闻事件主题,例如COVID-19事件主题,并分别计算其初始传播速度,再基于各个十级样本新闻事件主题的初始传播速度聚类测评十级传播速度等级的初始传播速度的范围。完成十级传播速度等级的初始传播速度范围值的测评后,再对海量样本新闻事件主题进行完整体系的聚类分级。
在对海量样本新闻事件主题进行完整体系的聚类分级后,可以得到与预先设定的传播速度等级数量相同个数的簇。随后,可以根据各个样本新闻事件主题的初始传播速度在初步聚类后得到对应的簇的初步传播速度范围,以及预先设定好的各个样本新闻事件的传播速度等级标签,对聚类得到的各个簇与预先设定的各个传播速度等级进行一一对应,从而完成传播速度测评体系的优化。
对海量样本新闻传播事件主题的初步传播速度进行聚类分级后,大致得到单位时间内初始的新闻传播速度监测体系的评级关系如下
Figure 36479DEST_PATH_IMAGE018
。实验设置的单位时间为6小时为一单位。每个评级分别对应
Figure 518276DEST_PATH_IMAGE019
向量的初始传播速度,如下:
Figure 728677DEST_PATH_IMAGE020
随后验证初始的传播速度监测体系评级临界值的合理性及清晰度,通过核验、校正,再调整、优化初始传播速度测评体系,最终构建传播速度测评体系,如下:
Figure 346740DEST_PATH_IMAGE021
参考上述传播速度测评体系可知,传播速度测评体系中,任一传播速度等级越高,则该传播速度等级与前一传播速度等级分别对应的初始传播速度的跨度越大。
基于上述任一实施例,步骤140中,基于初始传播速度,以及传播速度测评体系,确定新闻事件主题的传播速度等级。
具体地,可以将任一新闻事件主题的传播速度,输入到传播速度测评体系中,从而对新闻事件主题的传播速度与传播速度测评体系的速度范围作比较;比较可以是自下而上或者自上而下逐级比较;若在比较中发现,新闻事件主题的传播速度大于或等于某个速度范围的下限,且小于该速度范围的上限,则确定该速度的等级即为该新闻事件主题的传播速度等级。
基于上述传播速度测评体系确定新闻事件主题的传播速度等级的方法,可以表示为如下公式:
Figure 492551DEST_PATH_IMAGE022
具体地,若第
Figure 196065DEST_PATH_IMAGE023
个时刻的新闻事件主题的初始传播速度
Figure 944578DEST_PATH_IMAGE024
小于传播速度等级0的初始传播速度上限
Figure 885989DEST_PATH_IMAGE025
,则确定传播速度等级
Figure 999439DEST_PATH_IMAGE026
为0;否则,判断
Figure 252565DEST_PATH_IMAGE027
是否大于等于传播速度等级9的初始传播速度上限
Figure 742453DEST_PATH_IMAGE028
,如果大于,则确定传播速度等级
Figure 272791DEST_PATH_IMAGE026
为10,如果小于,则进一步判断
Figure 822721DEST_PATH_IMAGE027
与各个传播速度等级的上限之间的大小关系,如果
Figure 563144DEST_PATH_IMAGE029
小于第j个传播速度等级的初始传播速度上限
Figure 591143DEST_PATH_IMAGE030
,且大于等于第j-1个传播速度等级的初始传播速度上限
Figure 241567DEST_PATH_IMAGE031
,则确定传播速度等级
Figure 24715DEST_PATH_IMAGE032
为j。
基于上述任一实施例,传播速度测评体系中,多个传播速度等级从低到高顺次对应0-10级,传播速度等级越高,新闻传播速度越快,市场影响越大。
例如,多个传播速度等级为顺次从低到高的11个传播速度等级,其中传播速度等级为0表示该事件基本不被市场关注。等级顺次从低到高表示事件被市场关注的程度依次增大。具体关系可以体现为下表:
Figure 190117DEST_PATH_IMAGE033
基于上述任一实施例,步骤140之后还包括:执行新闻事件主题的传播速度等级对应的预警操作。
具体地,在通过传播速度测评体系得到初始传播速度对应的传播速度等级作为带测评的新闻事件主题的传播速度等级后,可以基于该传播速度等级监测到该新闻事件主题的状态,从而了解该新闻事件主题的舆情影响范围,进而指导启动相对应的预警操作,此处的预警操作可以是具体的舆情对应措施。此外,在回溯事件新闻传播周期时,可以根据传播速度等级来判断新闻事件的社会影响力。
基于上述任一实施例,图2为本发明实施例提供的新闻传播速度测评系统的结构示意图,如图2所示,新闻传播速度测评系统包括:
数据采集单元210,用于确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;
初始计速单元220,用于基于所述新闻数据中的每一新闻文本,以及每一新闻文本的传播媒体信息,计算所述新闻事件主题的初始传播速度;
体系构建单元230,用于将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;
等级确定单元240,用于基于所述初始传播速度,以及传播速度测评体系,确定所述新闻事件主题的传播速度等级。
本发明实施例提供的系统,计算新闻事件主题的初始传播速度,进而得到新闻事件主题的传播速度等级,实现了基于大数据的新闻事件舆情监测,将新闻传播速度测评方法应用到社会各领域,能够有效提高新闻事件舆情响应效率,有利于决策管理者及时做出舆情应对。其中,通过参考每一新闻文本的传播媒体信息,计算初始传播速度,提高了传播速度计算的客观性和可靠性,进一步提高了新闻传播速度测评的准确性。
基于上述任一实施例,数据采集单元210具体包括:
采集所述新闻事件主题的候选新闻数据;
对所述候选新闻数据进行预处理,得到所述新闻数据;预处理包括数据清洗、数据统一、质量评估和数据治理中的至少一种。
基于上述任一实施例,初始计速单元220包括:
类型确定子单元,用于基于任一新闻文本的传播媒体信息,确定所述任一新闻文本的传播媒体类型;
数量统计子单元,用于统计所述新闻数据中属于两个时刻的各个传播媒体类型的新闻文本数量;
速度计算子单元,用于基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算所述新闻事件主题的初始传播速度。
基于上述任一实施例,所述各个传播媒体类型包括最小影响力媒体、较小影响力媒体、一般影响力媒体、较高影响力媒体和最高影响力媒体;
所述媒体权重从低到高依次分为1-5级;其中,所述传播媒体类型与所述媒体权重存在一一对应关系。
基于上述任一实施例,速度计算子单元具体用于:
基于属于两个时刻的各个传播媒体类型的新闻文本数量、各个传播媒体类型的媒体权重,以及所述新闻数据的传播媒体总数,计算所述新闻事件主题的初始传播速度。
基于上述任一实施例,所述传播速度测评体系是由样本新闻事件主题的初始传播速度聚类得到的。
基于上述任一实施例,体系构建单元230具体用于:
对所述样本新闻事件主题的初始传播速度进行聚类,得到预设传播等级数量个簇,以及每个簇的初始传播速度范围;
基于任一簇中包含的所有样本新闻事件主题的传播速度等级标签,确定所述任一簇的传播速度等级,建立所述任一簇的传播速度等级和所述初始传播速度范围之间的对应关系;
对每一簇的传播速度等级和初始传播速度范围之间的对应关系进行调整,得到所述传播速度测评体系。
基于上述任一实施例,所述传播速度测评体系中,任一传播速度等级越高,所述任一传播速度等级与前一传播速度等级分别对应的初始传播速度的跨度越大。
基于上述任一实施例,所述多个传播速度等级具体为11个传播速度等级,所述11个传播速度等级从低到高顺次对的事件影响递增。
基于上述任一实施例,等级确定单元240包括:
将任一新闻事件主题的传播速度,输入到所述设定的传播速度测评体系中,将新闻事件主题的传播速度与传播速度测评体系的速度范围作比较;
所述比较可以是自下而上或者自上而下逐级比较;
若在比较中发现,新闻事件主题的传播速度大于或等于某个速度范围的下限,且小于该速度范围的上限,则确定该速度的等级即为该新闻事件主题的传播等级。
基于上述任一实施例,该装置还包括监测单元,所述监测单元用于:实时监测新闻事件主题的传播态势。
基于以上实施例提供的新闻传播速度测评系统,可实时监测新闻事件传播态势。对于任一新闻事件主题,图3为新闻事件主题传播速度监测的流程示意图。如图,当任一新闻事件发生,
310)首先通过数据采集单元采集新闻事件主题的新闻数据;
320)通过初始计速单元计算新闻事件主题的新闻传播速度;
330)通过等级确定单元确定新闻事件主题的传播等级;
340)实时计算新闻事件主题的传播速度并判断其传播等级的变化趋势。若传播等级上升,则事态升级;若传播等级保持不变,则事件保存相对稳定的发展态势;若传播等级下降,则事态降级,事件发展放缓;
350)重复循环执行步骤330和步骤340,直至监控类别降级为0级并逐渐平息,新闻事件监测周期结束。
图4为本发明实施例提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑命令,以执行如下方法:确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;基于所述新闻数据中每一新闻文本的传播媒体信息,计算所述新闻事件主题的初始传播速度;将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
此外,上述的存储器430中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;基于所述新闻数据中每一新闻文本的传播媒体信息,计算所述新闻事件主题的初始传播速度;将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种新闻传播速度测评方法,其特征在于,包括:
确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;
基于所述新闻数据中每一新闻文本的传播媒体信息及媒体权重,计算所述新闻事件主题的初始传播速度;
将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;
基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
2.根据权利要求1所述的新闻传播速度测评方法,其特征在于,所述基于所述新闻数据中每一新闻文本的传播媒体信息及媒体权重,计算所述新闻事件主题的初始传播速度,具体包括:
基于任一新闻文本的传播媒体信息,确定所述任一新闻文本的传播媒体类型及媒体权重;
统计所述新闻数据中属于两个时刻的各个传播媒体类型的新闻文本数量;
基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算所述新闻事件主题的初始传播速度。
3.根据权利要求2所述的新闻传播速度测评方法,其特征在于,所述各个传播媒体类型包括最小影响力媒体、较小影响力媒体、一般影响力媒体、较高影响力媒体和最高影响力媒体;
所述媒体权重从低到高依次分为1-5级;其中,所述传播媒体类型与所述媒体权重存在一一对应关系。
4.根据权利要求2所述的新闻传播速度测评方法,其特征在于,所述基于属于两个时刻的各个传播媒体类型的新闻文本数量,以及各个传播媒体类型的媒体权重,计算所述新闻事件主题的初始传播速度,具体包括:
基于属于两个时刻的各个传播媒体类型的新闻文本数量、各个传播媒体类型的媒体权重,以及所述新闻数据的传播媒体总数,计算所述新闻事件主题的初始传播速度。
5.根据权利要求1所述的新闻传播速度测评方法,其特征在于,所述将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,具体包括
对所述样本新闻事件主题的初始传播速度进行聚类,得到预设传播等级数量个簇,以及每个簇的初始传播速度范围;
基于任一簇中包含的所有样本新闻事件主题的传播速度等级标签,确定所述任一簇的传播速度等级,建立所述任一簇的传播速度等级和所述初始传播速度范围之间的对应关系;
对每一簇的传播速度等级和初始传播速度范围之间的对应关系进行调整,得到所述传播速度测评体系。
6.根据权利要求1所述的新闻传播速度测评方法,其特征在于,所述基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级,具体包括:
将任一新闻事件主题的初始传播速度,输入到所述传播速度测评体系中;
根据所述传播速度测评体系的传播速度范围,评定所述新闻事件主题的传播速度等级。
7.根据权利要求1所述的新闻传播速度测评方法,其特征在于,所述传播速度测评体系中,任一传播速度等级越高,所述任一传播速度等级与前一传播速度等级分别对应的初始传播速度的跨度越大。
8.根据权利要求1所述的新闻传播速度测评方法,其特征在于,所述多个传播速度等级具体为11个传播速度等级,所述11个传播速度等级从低到高顺次对应的事件影响递增。
9.根据权利要求1至8中任一项所述的新闻传播速度测评方法,其特征在于,所述获取所述新闻事件主题的新闻数据,具体包括:
采集所述新闻事件主题的候选新闻数据;
对所述候选新闻数据进行预处理,得到所述新闻数据;
所述预处理包括数据清洗、数据统一、质量评估和数据治理中的至少一种。
10.一种新闻传播速度测评系统,其特征在于,包括:
数据采集单元,用于确定待测评的新闻事件主题,获取所述新闻事件主题的新闻数据;
初始计速单元,用于基于所述新闻数据中的每一新闻文本,以及每一新闻文本的传播媒体信息,计算所述新闻事件主题的初始传播速度;
体系构建单元,用于将样本新闻事件主题的初始传播速度输入到传播速度聚类模型,确定传播速度测评体系,所述传播速度测评体系包括多个传播速度等级与初始传播速度之间的对应关系;
等级确定单元,用于基于所述新闻事件主题的初始传播速度,以及所述传播速度测评体系,确定所述新闻事件主题的传播速度等级。
CN202110255656.8A 2021-03-09 2021-03-09 新闻传播速度测评方法和系统 Pending CN112632364A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110255656.8A CN112632364A (zh) 2021-03-09 2021-03-09 新闻传播速度测评方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110255656.8A CN112632364A (zh) 2021-03-09 2021-03-09 新闻传播速度测评方法和系统

Publications (1)

Publication Number Publication Date
CN112632364A true CN112632364A (zh) 2021-04-09

Family

ID=75297784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110255656.8A Pending CN112632364A (zh) 2021-03-09 2021-03-09 新闻传播速度测评方法和系统

Country Status (1)

Country Link
CN (1) CN112632364A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254764A (zh) * 2021-05-13 2021-08-13 天津大学 基于综合传播影响力增长指数的新闻推荐方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521763B1 (en) * 2005-09-09 2013-08-27 Minnesota Public Radio Computer-based system and method for processing data for a journalism organization
CN106776841A (zh) * 2016-11-28 2017-05-31 福建亿榕信息技术有限公司 一种互联网舆情事件传播指数的获取方法和系统
CN107943905A (zh) * 2017-11-17 2018-04-20 北京锐安科技有限公司 一种热点话题分析方法及系统
CN109325524A (zh) * 2018-08-31 2019-02-12 中国科学院自动化研究所 事件追踪与变化阶段划分方法、系统及相关设备
CN111949848A (zh) * 2020-08-06 2020-11-17 国家计算机网络与信息安全管理中心 一种基于特定事件的跨平台传播态势评估及分级方法
CN112348279A (zh) * 2020-11-18 2021-02-09 武汉大学 资讯传播趋势的预测方法、装置、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521763B1 (en) * 2005-09-09 2013-08-27 Minnesota Public Radio Computer-based system and method for processing data for a journalism organization
CN106776841A (zh) * 2016-11-28 2017-05-31 福建亿榕信息技术有限公司 一种互联网舆情事件传播指数的获取方法和系统
CN107943905A (zh) * 2017-11-17 2018-04-20 北京锐安科技有限公司 一种热点话题分析方法及系统
CN109325524A (zh) * 2018-08-31 2019-02-12 中国科学院自动化研究所 事件追踪与变化阶段划分方法、系统及相关设备
CN111949848A (zh) * 2020-08-06 2020-11-17 国家计算机网络与信息安全管理中心 一种基于特定事件的跨平台传播态势评估及分级方法
CN112348279A (zh) * 2020-11-18 2021-02-09 武汉大学 资讯传播趋势的预测方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254764A (zh) * 2021-05-13 2021-08-13 天津大学 基于综合传播影响力增长指数的新闻推荐方法及系统
CN113254764B (zh) * 2021-05-13 2022-05-27 天津大学 基于综合传播影响力增长指数的新闻推荐方法及系统

Similar Documents

Publication Publication Date Title
KR102061987B1 (ko) 위험 평가 방법 및 시스템
CN105184315A (zh) 一种质检处理方法及系统
CN109598534A (zh) 信息确定方法及装置、电子设备及存储介质
CN104050197B (zh) 一种信息检索系统评测方法和装置
CN116955092B (zh) 基于数据分析的多媒体系统监控方法及系统
CN104965784B (zh) 自动测试方法及装置
CN101957845B (zh) 一种在线应用系统及其实现方法
CN111796957B (zh) 基于应用日志的交易异常根因分析方法及系统
CN104182457A (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
CN103530347A (zh) 一种基于大数据挖掘的互联网资源质量评估方法及系统
CN105260913A (zh) 用于互联网广告投放的ctr预估方法、dsp服务器、系统
CN104113452A (zh) 网络质量预测方法和装置
Xiujuan et al. Machine Learning Techniques for Multi-media Communications in Business Marketing.
CN110909230A (zh) 一种网络热点分析方法及系统
CN114912510A (zh) 一种线上调研样本质量评估系统
CN112632364A (zh) 新闻传播速度测评方法和系统
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN111314690A (zh) 一种视频用户感知评估方法和装置
WO2021262344A1 (en) Method and apparatus to detect scripted network traffic
CN116385045A (zh) 一种用于收寄附加服务的数据处理方法、装置和设备
CN111625720A (zh) 数据决策项目执行策略的确定方法、装置、设备和介质
CN111143688B (zh) 一种基于移动新闻客户端的评估方法及其系统
CN109213922A (zh) 一种对搜索结果排序的方法和装置
CN113962216A (zh) 文本处理方法、装置、电子设备及可读存储介质
CN106027291B (zh) 基于韦伯费希纳定理的BE业务QoE评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210409

RJ01 Rejection of invention patent application after publication