CN108875018A - 新闻影响力评估方法、装置及电子设备 - Google Patents
新闻影响力评估方法、装置及电子设备 Download PDFInfo
- Publication number
- CN108875018A CN108875018A CN201810634493.2A CN201810634493A CN108875018A CN 108875018 A CN108875018 A CN 108875018A CN 201810634493 A CN201810634493 A CN 201810634493A CN 108875018 A CN108875018 A CN 108875018A
- Authority
- CN
- China
- Prior art keywords
- news
- targeted
- reprinting
- report
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 101710198693 Invasin Proteins 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000037396 body weight Effects 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000000644 propagated effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种新闻影响力评估方法、装置及电子设备,涉及新闻价值评估技术领域,该方法包括:获取目标新闻的各条目标新闻报道;根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重;根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻;根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度;根据各条原发新闻对应的媒体权重以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。这样从新闻数量、新闻媒体、新闻转载传播三个维度来度量新闻的影响力,提高了评估新闻影响力的准确度。
Description
技术领域
本发明涉及新闻价值评估技术领域,尤其是涉及一种新闻影响力评估方法、装置及电子设备。
背景技术
新闻指的是一个事件,新闻报道指的是该事件的具体报道。新闻作为一种特殊的人类信息活动,是人们主动地对事实进行的非盈利再现和传播,是人类社会特有信息传播活动,具有很强的社会性,所以不能从新闻的形式来简单地看待新闻的价值。
目前,通常将新闻的转载率和回复率作为评价网页新闻影响力的重要指标,但是衡量新闻的影响力没有绝对的标准。现有技术中通过计算新闻的转载率和回复率来计算新闻的影响力,然而采用该方法获取的新闻影响力准确率较低,很难对新闻的重要性做出准确的评价。
发明内容
有鉴于此,本发明的目的在于提供一种新闻影响力评估方法、装置及电子设备,以提高评估新闻影响力的准确度。
第一方面,本发明实施例提供了一种新闻影响力评估方法,包括:
获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系;
根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重;
根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻;
根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度;
根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系,包括:
通过网络爬虫抓取目标新闻的各条初始新闻报道;所述初始新闻报道包括报道内容、新闻媒体和转载关系;
对相同新闻媒体对应的各条所述初始新闻报道的报道内容进行判重,得到两两之间的相似度;
对相似度大于设定值的两条所述初始新闻报道进行合并,得到相同新闻媒体下没有重复报道内容的各条目标新闻报道。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重,包括:
对于每条所述目标新闻报道,确定所述目标新闻报道的新闻媒体的排名等级;
通过在预设的等级权重对照表中查找所述排名等级,确定所述目标新闻报道对应的媒体权重。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻,包括:
对于每条所述目标新闻报道,根据所述目标新闻报道的转载关系中是否携带有转载标识,确定所述目标新闻报道是否为转载新闻。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度,包括:
根据各条所述目标新闻报道的转载关系,生成所述目标新闻的转载关系网络;
对于每条所述转载新闻,采用最短路径算法基于所述转载关系网络确定所述转载新闻对应的最短转发路径长度。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力,包括:
根据各条所述转载新闻对应的媒体权重和最短转发路径长度,确定所述目标新闻的传播能量;
根据各条所述原发新闻对应的媒体权重和所述传播能量,确定所述目标新闻的影响力。
结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述根据各条所述转载新闻对应的媒体权重和最短转发路径长度,确定所述目标新闻的传播能量,包括:
通过以下公式计算所述目标新闻的传播能量E:
其中,i表示所述转载新闻的编号,i=1,2,···,N2,N2表示所述转载新闻的转载数量;li表示编号为i的转载新闻对应的最短转发路径长度;wi表示编号为i的转载新闻对应的媒体权重;p表示设定的新闻影响力的扩散因子,k表示设定的新闻影响力的衰减因子。
结合第一方面的第五种可能的实施方式,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述根据各条所述原发新闻对应的媒体权重和所述传播能量,确定所述目标新闻的影响力,包括:
通过以下公式计算所述目标新闻的影响力NI:
其中,α表示原发新闻在所述目标新闻中的权重;j表示所述原发新闻的编号,j=1,2,···,N1,N1表示所述原发新闻的原发数量;wj表示编号为j的原发新闻对应的媒体权重;E表示所述传播能量。
第二方面,本发明实施例还提供一种新闻影响力评估装置,包括:
新闻报道获取模块,用于获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系;
媒体权重确定模块,用于根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重;
新闻报道分类模块,用于根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻;
路径长度确定模块,用于根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度;
影响力评估模块,用于根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面或其任一种可能的实施方式所述的方法。
本发明实施例带来了以下有益效果:
本发明实施例中,获取目标新闻的各条目标新闻报道,目标新闻报道包括报道内容、新闻媒体和转载关系;根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重;根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻;根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度;根据各条原发新闻对应的媒体权重、以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。本发明实施例提供的新闻影响力评估方法、装置及电子设备,从新闻数量、新闻媒体、新闻转载传播三个维度来度量新闻的影响力,提高了评估新闻影响力的准确度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种新闻影响力评估方法的流程示意图;
图2为本发明实施例提供的一种转载关系网络的示意图;
图3为本发明实施例提供的一种新闻影响力评估装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,通常将新闻的转载率和回复率作为评价网页新闻影响力的重要指标,然而采用现有方法获取的新闻影响力的准确率低。基于此,本发明实施例提供的一种新闻影响力评估方法、装置及电子设备,可以提高评估新闻影响力的准确度。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种新闻影响力评估方法进行详细介绍。
实施例一:
图1为本发明实施例提供的一种新闻影响力评估方法的流程示意图如图1所示,该方法包括以下几个步骤:
步骤S101,获取目标新闻的各条目标新闻报道,目标新闻报道包括报道内容、新闻媒体和转载关系。
具体地,在一些可能的实施例中,可以先通过现有的网络爬虫等技术,对目标新闻的信息总量进行抓取,即抓取目标新闻的各条初始新闻报道;该初始新闻报道包括报道内容、新闻媒体和转载关系,转载关系包括是否携带转载标识和转载信息。然后对相同新闻媒体对应的各条初始新闻报道的报道内容进行判重,得到两两之间的相似度;可以采用现有的技术诸如MD5(Message-Digest Algorithm 5,信息-摘要算法5)散列值方法对整篇文档(报道内容)进行判重,确定相同新闻媒体对应的各条初始新闻报道内两两之间报道内容的相似度。最后对相似度大于设定值的两条初始新闻报道进行合并,得到相同新闻媒体下没有重复报道内容的各条目标新闻报道。该设定值可以根据实际需求设置,如参考论文的重复判别标准,设定值可以在10%-30%范围内选取。
例如,设定值为30%,若新闻媒体M1对应两条新闻报道A1和A2,A1转载自新闻报道B1,A2转载自新闻报道B2,A1和A2的相似度为40%,则将A1和A2合并为一条目标新闻报道A,且A转载自B1和B2。
步骤S102,根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重。
具体地,在一些可能的实施例中,对于每条目标新闻报道,先确定该目标新闻报道的新闻媒体的排名等级,然后通过在预设的等级权重对照表中查找该排名等级,确定目标新闻报道对应的媒体权重。媒体权重的设定原则是:新闻媒体的等级越高,媒体权重越大。
进一步地,新闻媒体的排名等级可以按照中央网信办公布的《互联网新闻信息服务单位名单》进行分级,媒体权重可以设为一个区间[a,b]内的数值。例如,媒体权重的取值范围为[0,1]或[1,10]。
步骤S103,根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻。
具体地,对于每条目标新闻报道,根据目标新闻报道的转载关系中是否携带有转载标识,确定该目标新闻报道是否为转载新闻。即当目标新闻报道携带有转载标识时,该目标新闻报道为转载新闻,反之则为原发新闻。然后可以统计原发新闻的原发数量和转载新闻的转载数量,其中,转载数量还可以根据每个原发新闻的媒体网页统计数量确定转载新闻的转载数量。
步骤S104,根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度。
最短转发路径长度计算的依据是从任意原发新闻到一个给定转载新闻所有可能路径中,长度最短(边最少)的路径。
本实施例提供一种最短转发路径长度的确定方法,如下:根据各条目标新闻报道的转载关系,生成目标新闻的转载关系网络;对于每条转载新闻,采用最短路径算法基于转载关系网络确定转载新闻对应的最短转发路径长度。转载关系网络中每条目标新闻报道为一个节点,以各个目标新闻报道之间的转载关系为边,各条边连接各个节点就形成了转载关系网络。最短路径算法可以采用Dijkstra算法、Bellman-Ford算法、Floyd算法、SPFA(Shortest Path Faster Algorithm,队列优化)算法等中的任一种。
步骤S105,根据各条原发新闻对应的媒体权重、以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。
具体地,可以先根据各条转载新闻对应的媒体权重和最短转发路径长度,确定目标新闻的传播能量;再根据各条原发新闻对应的媒体权重和传播能量,确定目标新闻的影响力。
在一些可能的实施例中,通过以下公式计算目标新闻的传播能量E:
其中,i表示转载新闻的编号,i=1,2,···,N2,N2表示转载新闻的转载数量;li表示编号为i的转载新闻对应的最短转发路径长度;wi表示编号为i的转载新闻对应的媒体权重;p表示设定的新闻影响力的扩散因子,k表示设定的新闻影响力的衰减因子。
具体地,衰减因子k表示新闻随着转发其影响力的逐步递减程度,递减程度越重,k值越大,k可以从区间[0,1]中选取,例如k选取为0.2。扩散因子p表示新闻随着转发路径越长,受众越来越多,影响范围逐步增加,扩散因子p越大,p可以从区间[0,1]中选取,例如p选取为0.5。
在一些可能的实施例中,通过以下公式计算目标新闻的影响力NI:
其中,α表示原发新闻在目标新闻中的权重;j表示原发新闻的编号,j=1,2,···,N1,N1表示原发新闻的原发数量;wj表示编号为j的原发新闻对应的媒体权重;E表示传播能量。
具体地,权重α表示原发新闻的权重,则1-α表示传播能量的权重。α为区间[0,1]之间的参数,一般选取为0.5。对于社会热点新闻,α可以较小,对于政治新闻,α可以较大。
上述方法通过新闻数量、新闻媒体、新闻转载传播三个维度,能够及时、快速地评价出给定新闻的价值;新闻报道的数量越多,影响力越大;新闻报道的媒体越多,影响力越大;新闻报道的深度(转发路径)越深,影响力越大;新闻报道的原发新闻越多,影响力越大。
本发明实施例中,获取目标新闻的各条目标新闻报道,目标新闻报道包括报道内容、新闻媒体和转载关系;根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重;根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻;根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度;根据各条原发新闻对应的媒体权重、以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。本发明实施例提供的新闻影响力评估方法,从新闻数量、新闻媒体、新闻转载传播三个维度来度量新闻的影响力,提高了评估新闻影响力的准确度。
图2为本发明实施例提供的一种转载关系网络的示意图,图2包括7条新闻报道对应的7个节点编号:1-7,其中,3条原发新闻对应节点1、2、3,4条转载新闻对应节点4、5、6、7,节点6的两条转发路径表示相同新闻媒体对应的两条新闻报道的来源相同(均来自节点3),一共有7个新闻媒体(后续简称为媒体)。
为了便于说明,这里将节点编号作为对应的新闻编号和媒体编号,例如节点1对应新闻1和媒体1。从图2中可以看出,新闻4的最短转发路径长度为1;新闻5的最短转发路径长度为1;新闻6有2条转发路径,长度分别是1、2,所以最短转发路径为1;新闻7有4条转发路径,长度分别是2、2、3、2,所以最短转发路径长度为2。
下面结合图2所示的转载关系网络,以两种不同的媒体权重按照上述方法计算该目标新闻的影响力。
(1)媒体1-3的权重设为1,媒体4、5的权重设为0.5,媒体6、7的权重设为0.3。
步骤一、通过现有网络爬虫等技术,对目标新闻的信息总量进行抓取统计,获取目标新闻报道总体数量N=7。
步骤二、通过现有的技术对整篇文档进行判重,文档完全一致,则直接确定网页之间的转载关系;如果文档并不完全一致,则进一步采用基于网页主体内容间的相似程度(相似度)来判断他们是否为近似网页。通过判重之后获取目标新闻原发数量N1=3。根据目标新闻所在的媒体,得到目标新闻的媒体数量M=7。
步骤三、通过原发新闻的媒体网页统计数量,获取目标新闻的转载数量N2=4。
步骤四、获取目标新闻对应的媒体权重wj和wi,新闻1-3对应的媒体权重为1,新闻4、5对应的媒体权重设为0.5,新闻6、7对应的媒体权重为0.3;给定新闻影响力的衰减因子k,k为0.2;给定新闻影响力的扩散因子p,p为0.5。
步骤五、通过Dijkstra算法计算新闻4-7对应的最短转发路径长度li,得到新闻4-7对应的最短转发路径长度依次为1、1、1、2。
步骤六、计算目标新闻的传播能量E:
步骤七、给定原发新闻的权重α值,α为0.5,计算目标新闻的影响力NI:
(2)媒体1、3的权重设为1,媒体2、4、6的权重设为0.5,媒体5、7的权重设为0.3。
通过与(1)同样的步骤,可得:
由此(1)和(2)的结果可以看出,媒体权重对目标新闻的影响力具有较大的影响。
实施例二:
图3为本发明实施例提供的一种新闻影响力评估装置的结构示意图,如图3所示,该装置包括:
新闻报道获取模块31,用于获取目标新闻的各条目标新闻报道,目标新闻报道包括报道内容、新闻媒体和转载关系;
媒体权重确定模块32,用于根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重;
新闻报道分类模块33,用于根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻;
路径长度确定模块34,用于根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度;
影响力评估模块35,用于根据各条原发新闻对应的媒体权重、以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。
进一步地,上述新闻报道获取模块31具体用于:通过网络爬虫抓取目标新闻的各条初始新闻报道;初始新闻报道包括报道内容、新闻媒体和转载关系;对相同新闻媒体对应的各条初始新闻报道的报道内容进行判重,得到两两之间的相似度;对相似度大于设定值的两条初始新闻报道进行合并,得到相同新闻媒体下没有重复报道内容的各条目标新闻报道。
上述媒体权重确定模块32具体用于:对于每条目标新闻报道,确定目标新闻报道的新闻媒体的排名等级;通过在预设的等级权重对照表中查找该排名等级,确定该目标新闻报道对应的媒体权重。
上述新闻报道分类模块33具体用于:对于每条目标新闻报道,根据目标新闻报道的转载关系中是否携带有转载标识,确定该目标新闻报道是否为转载新闻。
上述路径长度确定模块34具体用于:根据各条目标新闻报道的转载关系,生成目标新闻的转载关系网络;对于每条转载新闻,采用最短路径算法基于转载关系网络确定该转载新闻对应的最短转发路径长度。
上述影响力评估模块35具体用于:根据各条转载新闻对应的媒体权重和最短转发路径长度,确定目标新闻的传播能量;根据各条原发新闻对应的媒体权重和传播能量,确定目标新闻的影响力。
本发明实施例中,获取目标新闻的各条目标新闻报道,目标新闻报道包括报道内容、新闻媒体和转载关系;根据每条目标新闻报道的新闻媒体确定目标新闻报道对应的媒体权重;根据每条目标新闻报道的转载关系,将目标新闻报道确定为原发新闻或转载新闻;根据各条目标新闻报道的转载关系,确定每条转载新闻到对应的原发新闻的最短转发路径长度;根据各条原发新闻对应的媒体权重、以及各条转载新闻对应的媒体权重和最短转发路径长度,评估目标新闻的影响力。本发明实施例提供的新闻影响力评估装置,从新闻数量、新闻媒体、新闻转载传播三个维度来度量新闻的影响力,提高了评估新闻影响力的准确度。
实施例三:
参见图4,本发明实施例还提供一种电子设备100,包括:处理器40,存储器41,总线42和通信接口43,所述处理器40、通信接口43和存储器41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。
其中,存储器41可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。
处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。
本发明实施例提供的新闻影响力评估装置及电子设备,与上述实施例提供的新闻影响力评估方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置及电子设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
附图中的流程图和框图显示了根据本发明的多个实施例的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本发明实施例所提供的进行新闻影响力评估方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置及电子设备,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种新闻影响力评估方法,其特征在于,包括:
获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系;
根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重;
根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻;
根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度;
根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力。
2.根据权利要求1所述的方法,其特征在于,所述获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系,包括:
通过网络爬虫抓取目标新闻的各条初始新闻报道;所述初始新闻报道包括报道内容、新闻媒体和转载关系;
对相同新闻媒体对应的各条所述初始新闻报道的报道内容进行判重,得到两两之间的相似度;
对相似度大于设定值的两条所述初始新闻报道进行合并,得到相同新闻媒体下没有重复报道内容的各条目标新闻报道。
3.根据权利要求1所述的方法,其特征在于,所述根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重,包括:
对于每条所述目标新闻报道,确定所述目标新闻报道的新闻媒体的排名等级;
通过在预设的等级权重对照表中查找所述排名等级,确定所述目标新闻报道对应的媒体权重。
4.根据权利要求1所述的方法,其特征在于,所述根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻,包括:
对于每条所述目标新闻报道,根据所述目标新闻报道的转载关系中是否携带有转载标识,确定所述目标新闻报道是否为转载新闻。
5.根据权利要求1所述的方法,其特征在于,所述根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度,包括:
根据各条所述目标新闻报道的转载关系,生成所述目标新闻的转载关系网络;
对于每条所述转载新闻,采用最短路径算法基于所述转载关系网络确定所述转载新闻对应的最短转发路径长度。
6.根据权利要求1所述的方法,其特征在于,所述根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力,包括:
根据各条所述转载新闻对应的媒体权重和最短转发路径长度,确定所述目标新闻的传播能量;
根据各条所述原发新闻对应的媒体权重和所述传播能量,确定所述目标新闻的影响力。
7.根据权利要求6所述的方法,其特征在于,所述根据各条所述转载新闻对应的媒体权重和最短转发路径长度,确定所述目标新闻的传播能量,包括:
通过以下公式计算所述目标新闻的传播能量E:
其中,i表示所述转载新闻的编号,i=1,2,…,N2,N2表示所述转载新闻的转载数量;li表示编号为i的转载新闻对应的最短转发路径长度;wi表示编号为i的转载新闻对应的媒体权重;p表示设定的新闻影响力的扩散因子,k表示设定的新闻影响力的衰减因子。
8.根据权利要求6所述的方法,其特征在于,所述根据各条所述原发新闻对应的媒体权重和所述传播能量,确定所述目标新闻的影响力,包括:
通过以下公式计算所述目标新闻的影响力NI:
其中,α表示原发新闻在所述目标新闻中的权重;j表示所述原发新闻的编号,j=1,2,…,N1,N1表示所述原发新闻的原发数量;wj表示编号为j的原发新闻对应的媒体权重;E表示所述传播能量。
9.一种新闻影响力评估装置,其特征在于,包括:
新闻报道获取模块,用于获取目标新闻的各条目标新闻报道,所述目标新闻报道包括报道内容、新闻媒体和转载关系;
媒体权重确定模块,用于根据每条所述目标新闻报道的新闻媒体确定所述目标新闻报道对应的媒体权重;
新闻报道分类模块,用于根据每条所述目标新闻报道的转载关系,将所述目标新闻报道确定为原发新闻或转载新闻;
路径长度确定模块,用于根据各条所述目标新闻报道的转载关系,确定每条所述转载新闻到对应的原发新闻的最短转发路径长度;
影响力评估模块,用于根据各条所述原发新闻对应的媒体权重、以及各条所述转载新闻对应的媒体权重和最短转发路径长度,评估所述目标新闻的影响力。
10.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810634493.2A CN108875018B (zh) | 2018-06-19 | 2018-06-19 | 新闻影响力评估方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810634493.2A CN108875018B (zh) | 2018-06-19 | 2018-06-19 | 新闻影响力评估方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108875018A true CN108875018A (zh) | 2018-11-23 |
CN108875018B CN108875018B (zh) | 2021-06-29 |
Family
ID=64339736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810634493.2A Active CN108875018B (zh) | 2018-06-19 | 2018-06-19 | 新闻影响力评估方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108875018B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062202A (zh) * | 2019-11-04 | 2020-04-24 | 中证征信(深圳)有限公司 | 信源影响力的评估方法、装置、设备及可读介质 |
CN112287195A (zh) * | 2020-08-21 | 2021-01-29 | 国家电网有限公司 | 新闻媒体处理方法及系统、计算机存储介质、处理器 |
CN113190683A (zh) * | 2021-07-02 | 2021-07-30 | 平安科技(深圳)有限公司 | 基于聚类技术的企业esg指数确定方法及相关产品 |
JP7481050B1 (ja) | 2023-11-07 | 2024-05-10 | 株式会社内外切抜通信社 | 情報処理装置、情報処理方法、およびプログラム |
JP7481051B1 (ja) | 2023-11-07 | 2024-05-10 | 株式会社内外切抜通信社 | 情報処理装置、情報処理方法、およびプログラム |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101409634A (zh) * | 2007-10-10 | 2009-04-15 | 中国科学院自动化研究所 | 基于信息检索的互联网新闻影响力定量分析工具及方法 |
CN101814171A (zh) * | 2009-02-24 | 2010-08-25 | 李晓萌 | 一种面向媒体的网络影响力指数计算方法 |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
CN102662956A (zh) * | 2012-03-05 | 2012-09-12 | 西北工业大学 | 一种基于用户话题链接行为的社交网络意见领袖识别方法 |
US20140156673A1 (en) * | 2012-11-30 | 2014-06-05 | International Business Machines Corporation | Measuring and altering topic influence on edited and unedited media |
CN103927365A (zh) * | 2014-04-21 | 2014-07-16 | 武汉大学 | 一种基于能量函数的网页时间敏感性度量方法 |
US20160055253A1 (en) * | 2014-08-20 | 2016-02-25 | International Business Machines Corporation | Identifying Influencers in Computer Networks |
US20160117328A1 (en) * | 2013-06-03 | 2016-04-28 | Hewlett-Packard Development Company, L.P. | Influence score of a social media domain |
CN107577688A (zh) * | 2017-04-25 | 2018-01-12 | 上海市互联网信息办公室 | 基于媒体信息采集的原创文章影响力分析系统 |
CN107967364A (zh) * | 2017-12-22 | 2018-04-27 | 新华网股份有限公司 | 网络文章传播力评估方法及装置 |
-
2018
- 2018-06-19 CN CN201810634493.2A patent/CN108875018B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101409634A (zh) * | 2007-10-10 | 2009-04-15 | 中国科学院自动化研究所 | 基于信息检索的互联网新闻影响力定量分析工具及方法 |
CN101814171A (zh) * | 2009-02-24 | 2010-08-25 | 李晓萌 | 一种面向媒体的网络影响力指数计算方法 |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
CN102662956A (zh) * | 2012-03-05 | 2012-09-12 | 西北工业大学 | 一种基于用户话题链接行为的社交网络意见领袖识别方法 |
US20140156673A1 (en) * | 2012-11-30 | 2014-06-05 | International Business Machines Corporation | Measuring and altering topic influence on edited and unedited media |
US20160117328A1 (en) * | 2013-06-03 | 2016-04-28 | Hewlett-Packard Development Company, L.P. | Influence score of a social media domain |
CN103927365A (zh) * | 2014-04-21 | 2014-07-16 | 武汉大学 | 一种基于能量函数的网页时间敏感性度量方法 |
US20160055253A1 (en) * | 2014-08-20 | 2016-02-25 | International Business Machines Corporation | Identifying Influencers in Computer Networks |
CN107577688A (zh) * | 2017-04-25 | 2018-01-12 | 上海市互联网信息办公室 | 基于媒体信息采集的原创文章影响力分析系统 |
CN107967364A (zh) * | 2017-12-22 | 2018-04-27 | 新华网股份有限公司 | 网络文章传播力评估方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062202A (zh) * | 2019-11-04 | 2020-04-24 | 中证征信(深圳)有限公司 | 信源影响力的评估方法、装置、设备及可读介质 |
CN111062202B (zh) * | 2019-11-04 | 2023-10-13 | 中证征信(深圳)有限公司 | 信源影响力的评估方法、装置、设备及可读介质 |
CN112287195A (zh) * | 2020-08-21 | 2021-01-29 | 国家电网有限公司 | 新闻媒体处理方法及系统、计算机存储介质、处理器 |
CN113190683A (zh) * | 2021-07-02 | 2021-07-30 | 平安科技(深圳)有限公司 | 基于聚类技术的企业esg指数确定方法及相关产品 |
CN113190683B (zh) * | 2021-07-02 | 2021-09-17 | 平安科技(深圳)有限公司 | 基于聚类技术的企业esg指数确定方法及相关产品 |
JP7481050B1 (ja) | 2023-11-07 | 2024-05-10 | 株式会社内外切抜通信社 | 情報処理装置、情報処理方法、およびプログラム |
JP7481051B1 (ja) | 2023-11-07 | 2024-05-10 | 株式会社内外切抜通信社 | 情報処理装置、情報処理方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN108875018B (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875018A (zh) | 新闻影响力评估方法、装置及电子设备 | |
Pan et al. | Proactive vehicular traffic rerouting for lower travel time | |
CN103246985B (zh) | 一种广告点击率预测方法及装置 | |
CN108053673A (zh) | 一种路况预报方法、存储介质和服务器 | |
CN110149225B (zh) | 网络拓扑结构评估方法及装置 | |
CN109087079A (zh) | 数字货币交易信息分析方法 | |
US10158522B2 (en) | Network monitor and method for event based prediction of radio network outages and their root cause | |
CN107809766B (zh) | 一种用于网络优化的机器学习样本的生成方法及装置 | |
CN101375282A (zh) | 用于对电路进行评估的方法、系统和程序产品 | |
CN107045794A (zh) | 路况处理方法及装置 | |
EP4167540A1 (en) | Availability slo-aware network optimization | |
CN106789948A (zh) | 一种网络web页面异常检测方法 | |
CN108234227A (zh) | 网络节点设备的时延测量方法、装置及网络节点设备 | |
CN107679201B (zh) | 隐匿人挖掘方法、装置及电子设备 | |
CN109410626A (zh) | 站点标示方法、装置、电子设备及计算机可读存储介质 | |
Perati et al. | Self-Similar behavior of highway road traffic and performance analysis at toll plazas | |
CN106157603B (zh) | 一种衡量公交网络交通流空间分布不均衡程度的方法 | |
Witono et al. | Portrait of Indonesia’s internet topology at the autonomous system level | |
CN106789951A (zh) | 一种网络web页面异常检测实现系统 | |
CN107294812B (zh) | 网络检测方法、网络检测装置及智能终端 | |
CN107517474B (zh) | 一种网络分析优化方法及装置 | |
CN109448380A (zh) | 道路阻断发现方法、装置、设备及计算机可读介质 | |
CN113076451B (zh) | 异常行为识别和风险模型库的建立方法、装置及电子设备 | |
CN108121710A (zh) | 一种关键用户的判定方法及装置 | |
CN103632557B (zh) | 一种vms事件信息发布方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |