CN111062202B - 信源影响力的评估方法、装置、设备及可读介质 - Google Patents
信源影响力的评估方法、装置、设备及可读介质 Download PDFInfo
- Publication number
- CN111062202B CN111062202B CN201911066574.8A CN201911066574A CN111062202B CN 111062202 B CN111062202 B CN 111062202B CN 201911066574 A CN201911066574 A CN 201911066574A CN 111062202 B CN111062202 B CN 111062202B
- Authority
- CN
- China
- Prior art keywords
- evaluated
- information source
- information
- source
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种信源影响力的评估方法、装置、设备以及可读介质,所述方法包括:获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。本发明提高了信源影响力的评估的效率和准确率。
Description
技术领域
本发明涉及计算机处理技术领域,尤其涉及一种信源影响力的评估方法、装置、设备及可读介质。
背景技术
互联网时代是一个信息爆炸的时代,媒体数量暴增,舆情信息也随之同步激增,在热点事件爆发之后,往往大量有效的信息被淹没在海量的舆情信息中。若能对信源(如发布媒体)的影响力进行评估,优先向用户推送影响力大的信源的信息,则可以提升用户阅读体验,将为用户节省获取信息的成本和提高决策的效率。
而目前针对信源影响力的评估,主要是基于业务知识和日常的经验进行固定式评估,难以根据该信源的发布情况及时进行调整。同时,依靠依靠专家经验对信源影响力进行评估的成本较高、准确率较低。
发明内容
基于此,有必要针对上述问题,提出一种信源影响力的评估方法、装置、计算机设备及可读介质。
一种信源影响力的评估方法,其特征在于,所述方法包括:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
其中,对所述信源数据进行预设的规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源的步骤,包括:
对所述信源数据进行预设的规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源的步骤,包括:
根据所述信源数据确定多个待处理信源主体,分别确定每一个待处理信源主体对应的信源主体词;
根据所述信源主体词对所述多个待处理信源主体进行合并处理,以使得对应的信源主体词相匹配的待处理信源主体关联到一个待评估信源上。
所述分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定所述多个待评估信源的影响力权重特征值,包括:
根据所述被转发数据分别确定每一个待评估信源的转发和/或被转发信息,其中,所述转发和/或被转发信息包括每一个待评估信源的转发的文本数量、转发的各个文本的信源信息、被转发的文本数量和/或转发每一个所述被转发的文本的信源信息;
根据所述多个待评估信源的转发和/或被转发信息确定每一个待评估信源分别转发其他每一个待评估信源发布的文本数量作为第一数量和/或该待评估信源转发其他所有待评估信源发布的文本数量作为第二数量;
根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值。
确定所述多个待评估信源的影响力权重特征值的步骤,还包括:
获取所述多个待评估信源对应的待评估信源总数、所发布的文本总数和/或所述多个待评估信源中的每一个待评估信源所发布的文本总数作为评估基准信息;
根据所述评估基准信息分别确定每一个待评估信源的影响力权重特征值。
所述获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值以及历史影响力分值分别确定每一个待评估信源的目标影响力分值,包括:
根据所述多个待评估信源的影响力权重特征值分别确定每一个待评估信源与其他每一个待评估信源之间的关联系数;
根据所述每一个待评估信源的历史影响力分值和每一个待评估信源与其他每一个待评估信源之间的关联系数、通过预设的动态评估模型确定每一个待评估信源的目标影响力分值。
更进一步的,在确定每一个待评估信源的目标影响力分值的步骤之后,还包括:
获取专家经验参考数据,根据所述专家经验参考数据确定所述多个待评估信源中每一个待评估信源对应的专家评分;
根据所述每一个待评估信源对应的专家评分对所述每一个待评估信源的目标影响力分值进行校正。
一种信源影响力的评估装置,其特征在于,所述装置包括:
获取单元:用于获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
第一确定单元:用于分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
第二确定单元:用于获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
在本发明实施例中,首先获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与该信源数据对应的多个信源主体作为多个待评估信源;再分别获取上述每一个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值。与此同时,也先获取每一个待评估信源的历史影响力分值,根据这个历史影响力分值和之前确定出的所述每一个待评估信源的影响力权重特征值分别确定出每一个待评估信源的目标影响力分值;从而在之前确定的影响力分值的基础上以不断迭代式更新的方式,根据各个待评估信源的权重特征值确定出最新的影响力分值,使得每一次的评估结果更加精准。
相较于现有技术中信源影响力的评估依靠人工专家确定一个固定的影响力权重特征值,从而无法及时根据各个信源的实时发布数据进行更新,从而导致信源影响力评估的准确率较低的问题,在本发明实施例中,通过每隔一定时长获取各个信源的动态发布数据并据其确定出各个信源最新的影响力权重特征值,再基于每个信源的历史分值根据上述每一个信源最新的影响力权重特征值进行不断的迭代动态更新,从而提高了信源影响力评估的效率和准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1示出了一个实施例中信源影响力的评估方法的流程图;
图2示出了一个实施例中对获取的信源数据进行规范化处理,确定与其对应的待评估信源的流程图;
图3示出了一个实施例中确定每一个待评估信源的影响力权重特征值的流程图;
图4示出了另一个实施例中确定每一个待评估信源的影响力权重特征值的流程图;
图5示出了一个实施例中确定每一个待评估信源的目标影响力分值的流程图;
图6示出了另一个实施例中对所述目标影响力分值进行校正的流程图;
图7示出了一个实施例中输出的多个待评估信源的目标影响力分值的示意图;
图8示出了一个实施例中信源影响力的评估装置的结构框图;
图9示出了一个实施例中计算机设备的内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种信源影响力的评估方法,在一个实施例中,上述信源影响力的评估方法的实现可以基于一包括智能手机或者PC等计算机处理终端等。
参考图1,本发明实施例提供了一种信源影响力的评估方法。
图1示出了一个实施例中信源影响力的评估方法的流程图。本发明中所述的信源影响力的评估方法至少包括如图1所示的步骤S1022-S1026,详细介绍如下:
在步骤S1022中,获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源。
而具体的,步骤S1022又可以包括如图2示出的步骤S1032-S1034,下面结合图2进行说明。图2示出了一个实施例中对获取的信源数据进行规范化处理,确定与其对应的待评估信源的流程图。
在步骤S1032中,根据所述信源数据确定多个待处理信源主体,分别确定每一个待处理信源主体对应的信源主体词。
首先,可选的,此处的信源数据可以是获取的某特定领域(如财经领域、科技领域等)的各大媒体机构(如报社、电视台、杂志等)或者自媒体个人所发布的多媒体信息(可以是文字、视频、图片、音频等形式)。
而确定出的待处理信源主体即可以是上述的各大信息发布源头的机构或个人。举例进行说明,多个待处理信源主体中可以包括如“A经济日报周末报”“A经济日报”这两个媒体机构。
另外需要说明的是,在实际的媒体运作中,经常会出现一个大的媒体机构下面关联和管理着具有差异性的分支机构(如用于覆盖不同的信息领域或不同时间/空间区域的分支媒体机构)。更进一步地,为了让受众加深品牌信赖度以及品牌黏性,上述分支机构的命名和其所关联的信源主体的命名一般是存在很大程度的相关性的,如某新闻网站的总发布站点命名为“B新闻网”,而这个“B新闻网”旗下的分领域网站则可以命名为“B财经网”、“B股票网”、“B科技网”等。
而容易理解的是,在确定各个信源的影响力的时候,主信源机构和其分支机构的信源数据(如所分别发布的新闻报道)应该被作为同一个待评估信源统一进行处理和评估。因此需要根据其对应的信源主体词对待处理信源进行合并处理。
具体的,在步骤S1034中,根据所述信源主体词对所述多个待处理信源主体进行合并处理,以使得对应的信源主体词相匹配的待处理信源主体关联到一个待评估信源上。
具体进行说明,确定与待处理信源主体对应的信源主体词可以是通过对待处理信源的信源名称进行自然语言处理,提取出其关键词(可以是预设的关键词语料库中的词条相匹配),如上述举例中的“A经济日报周末报”“A经济日报”所对应确定出的信源主体词可以都是“A经济日报”。
同样的,上述举例中的“B财经网”、“B股票网”、“B科技网”由于其主体词均存在“B网”都可以关联到“B新闻网”这一待评估信源上。
另外,在可选的实施例中,可以是预设一个存有多个主流信源主体词(如上述的“B网”)的信源数据库,将各个待处理信源对应的主体词在库中进行匹配,将匹配到的预设信源主体词即作为待评估信源。
在步骤S1024中,分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值。
更进一步的,上述步骤S1024可以包括如图3示出的步骤S1042-S1046。图3示出了一个实施例中确定每一个待评估信源的影响力权重特征值的流程图。
在步骤S1042中,根据所述被转发数据分别确定每一个待评估信源的转发和/或被转发信息,其中,所述转发和/或被转发信息包括每一个待评估信源的转发的文本数量、转发的各个文本的信源信息、被转发的文本数量和/或转发每一个所述被转发的文本的信源信息。
首先这里获取每一个待评估信源的转发和/或被转发数据的原因在于:在实际的消息传播和舆情制造过程中,所有的发声主体如媒体、个人等均可被视作信源,都是互为信息源头和中间传递者的。
也就是说每个信源在发布原创/始发消息的同时也可以作为中间消息传递者,转发别的信源的原创/始发消息。
而结合传播学原理容易理解的是,在广大的信息受众(同时也是舆情参与者和制造者)中往往会出现(自发推举或者由于离信息发布源头较近)一些意见领袖(即KOL:KeyOpinion Leader)。信息一般是先经由这些意见领袖被处理和发布向更广大的离信息源头较远的受众。
因此,被转发的量占该信源所发布的所有文本数量的比例越大,即可以认为该信源主体在相关的热点事件的舆论构成中越有话语权和被关注度,该信源主体的影响力也就越大。
在步骤S1044中,根据所述多个待评估信源的转发和/或被转发信息确定每一个待评估信源分别转发其他每一个待评估信源发布的文本数量作为第一数量和/或该待评估信源转发其他所有待评估信源发布的文本数量作为第二数量。
下面举例进行说明,可以是存在“X新闻社”、“Y周刊”和“Z电视台”这三个待评估信源。
而“X新闻社”可以是转发自“Y周刊”10篇,转发自“Z电视台”5篇(共同作为“X新闻社”对应的第一数量)。
以及“X新闻社”一共转发自所有的待评估信源(包括“Y周刊”、“Z电视台”以及其他待评估信源)100篇(作为其对应的第二数量)。“Y周刊”与“Z电视台”分别转发自其它本举例中其他两个待评估信源的数据同样以此类推。
在步骤S1046中,根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值。
另外,可选的,要确定影响力权重分值还可以是包括如图4示出的步骤S1052-S1054。图4示出了另一个实施例中确定每一个待评估信源的影响力权重特征值的流程图。
在步骤S1052中,获取所述多个待评估信源对应的待评估信源总数、所发布的文本总数和/或所述多个待评估信源中的每一个待评估信源所发布的文本总数作为评估基准信息。
在步骤S1054中,根据所述评估基准信息分别确定每一个待评估信源的影响力权重特征值。
下面就继续结合步骤S1044中的举例对于步骤S1046以及步骤S1052-S1054一并进行说明。
在说明之前,先对影响力权重值的来源与作用进行说明。首先一般来说,新闻等所发布的信息被(其他信源)转载或转发的越多,即可说明该信源影响力的越大。
与此同时很重要的另一点时,所发布的信息被越高影响力的信源转载,这也可反映出该信源影响力越大。也就是说在利用转发以及被转发数据判断信源的影响力时,所有的信源是相互影响的,相互确定的,这就与搜索引擎技术中的PageRank(网页排名)算法的思想基本一致。
下面也简要对PageRank算法进行说明。PageRank是一种由搜索引擎根据网页之间相互的超链接计算的技术。其主要思想是:如果一个网页被很多其他网页链接到,则说明这个网页比较重要,也就是其对应的PageRank值(记为PR)会相对较高。而同样的,如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页PageRank值会相应地因此而提高。
因此可以参考PageRank算法的思想对信源的影响力进行排序。
具体的,在PageRank中,信源间有向边(如从信源M到信源N的关联权重为一条有向边,以及信源N到信源M的权重为另一条反向的有向边)的权重值为
wi=1/n
其中,n为转载该信源发布的文本的其他信源数,i为待评估信源的某一个。
则信源M的PageRank得分可以通过下列公式进行确定:
PR(M)=(1-d)+d(PR(N)×wN+PR(L)×wL)
其中,d为预设的默认值,而PR(N)、PR(M)、PR(L)分别为信源N、M、L的基础影响力分值(可以是最近一次评估出的分值作为基础,也可以是每次评估之前通过专家等确定的)。
但是,从上面对PageRank应用到信源影响力评估过程的说明可以看出每一个信源之间的影响权重仅仅被转载该信源的其他信源个数有关(wi=1/n),但不同于网站链接之间的相关关联,信源之间的关联程度的衡量还可以基于具体所转载的文本的数量所占自己所发布的全部文本数量的比例,而这一点在上述权重系数的确定中是有所忽略的。
因此,回到对本发明实施例中的说明,首先,根据步骤S1044中获取的第一数量和第二数量确定出各个待评估信源与其他各个待评估信源之间的第一权重系数,
具体的可以是将第一数量与第二数量的比例作为上述第一权重系数。如“X新闻社”针对“Y周刊”的第一权重系数则为0.1(10/100),而对应的若“Y周刊”总发布50篇文本,其中转载自“X新闻社”的是2篇,因而“Y周刊”针对“X新闻社”的第一权重系数则对应为0.04(2/50)。
第二方面,根据步骤S1042中的确定的每个待评估信源的转发和/或被转发数据确定第二权重系数,具体的确定过程可以如下:
同样以待评估信源“X新闻社”为例,第二权重系数的确定又可以分为两个子系数(分别记为a、b)的确定。
首先,根据转载“X新闻社”的所有信源主体的数量占全部的待评估信源的数量的比例作为子系数a。
再根据“X新闻社”被转载的文本数量占“X新闻社”所发布的全部文本数量的比例作为子系数b,最后根据子系数a与b确定出“X新闻社”的第二权重系数。
最后则可以将上述第一权重系数和第二权重系数作为“X新闻社”的影响力权重特征值。
在步骤S1026中,获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
具体的,步骤S1026又可以包括如图5示出的步骤S1062-S1064。图5示出了一个实施例中确定每一个待评估信源的目标影响力分值的流程图。
在步骤S1062中,根据所述多个待评估信源的影响力权重特征值分别确定每一个待评估信源与其他每一个待评估信源之间的关联系数。
结合前述步骤中的说明,可以将上述第一权重系数和第二权重系数的乘积(作为影响力权重特征值)确定出每一个待评估信源与其他每一个待评估信源之间的关联系数。
在步骤S1064中,根据所述每一个待评估信源的历史影响力分值和每一个待评估信源与其他每一个待评估信源之间的关联系数、通过预设的动态评估模型确定每一个待评估信源的目标影响力分值。
需要特别说明的是,此处的历史影响力分值可以是最近一次影响力评估中各个待评估信源的影响力分值。基于前述步骤中对PageRank算法的说明,本发明通过将被引用的文本数(而不只是信源数)引入各个信源与其他每一个信源的关联系数的计算中,并且在根据最新获取到的信源数据按照前述过程对关联系数进行更新后,即可基于这一更新后的关联系数对各个信源的影响力分值进行不断的迭代式更新,由此提高了信源影响力的评估的准确性。
最后,考虑到某些网站由于其领域或者功能比较专业化或者小众(如政府网站、学校网站等),可能不同于商业性质的主流媒体的相互引用和转发的传播极值,因此需要进行专家对信源影响力的评分进行一定的校正和补充。
具体的这个根据专家评分进行校正的过程可以包括如图6中示出的步骤S1072-S1074。图6示出了另一个实施例中对所述目标影响力分值进行校正的流程图。
在步骤S1072中,获取专家经验参考数据,根据所述专家经验参考数据确定所述多个待评估信源中每一个待评估信源对应的专家评分。
具体的专家经验参考数据可以是专家对某些特定领域的标杆式网站给出的评分或者校正后的关联系数。
在步骤S1074中,根据所述每一个待评估信源对应的专家评分对所述每一个待评估信源的目标影响力分值进行校正。
结合上一步骤中的说明,具体的校正可以是通过对各个待评估信源之间的关联系数进行校正,从而影响到最后的各信源评估结果。
最后,在实际的实施例中,在得出了各个待评估信源的影响力分值之后,还可以根据这个分值进行一个排序操作,按照预设的格式进行输出等。
综上所述,在一个具体的应用场景中,经过上述各个步骤后得出的各个待评估信源的影响力分值的步骤的输出结果可以如图7所示。图7示出了一个实施例中输出的多个待评估信源的目标影响力分值的示意图。
图8示出了一个实施例中信源影响力的评估装置的结构框图。
参考图8所示,根据本发明的一个实施例的信源影响力的评估装置1080,包括:获取单元1082、第一确定单元1084、第二确定单元1086。
其中,获取单元1082:用于获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
第一确定单元1084:用于分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
第二确定单元1086:用于获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器和通信模块、处理模块、获取模块。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现本信源影响力的评估方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行本信源影响力的评估方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种信源影响力的评估方法,其特征在于,所述方法包括:
获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值;
其中,所述分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定所述多个待评估信源的影响力权重特征值,包括:
根据所述被转发数据分别确定每一个待评估信源的转发和/或被转发信息,其中,所述转发和/或被转发信息包括每一个待评估信源的转发的文本数量、转发的各个文本的信源信息、被转发的文本数量和/或转发每一个所述被转发的文本的信源信息;
根据所述多个待评估信源的转发和/或被转发信息确定每一个待评估信源分别转发其他每一个待评估信源发布的文本数量作为第一数量和/或该待评估信源转发其他所有待评估信源发布的文本数量作为第二数量;
根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值;
其中,所述根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值,具体包括:
将所述第一数量与所述第二数量的比例作为第一权重系数;
将转载所述待评估信源的信源主体占所有信源主体的比例记为子系数a;
将所述待评估信源被转载的文本数量占发布的全部文本数量的比例为子系数b;
根据所述子系数a与所述子系数b确定出所述待评估信源的第二权重系数;
将所述第一权重系数和所述第二权重系数作为所述待评估信源的所述影响力权重特征值。
2.根据权利要求1所述的方法,其特征在于,对所述信源数据进行预设的规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源的步骤,包括:
根据所述信源数据确定多个待处理信源主体,分别确定每一个待处理信源主体对应的信源主体词;
根据所述信源主体词对所述多个待处理信源主体进行合并处理,以使得对应的信源主体词相匹配的待处理信源主体关联到一个待评估信源上。
3.根据权利要求1所述的方法,其特征在于,确定所述多个待评估信源的影响力权重特征值的步骤,还包括:
获取所述多个待评估信源对应的待评估信源总数、所发布的文本总数和/或所述多个待评估信源中的每一个待评估信源所发布的文本总数作为评估基准信息;
根据所述评估基准信息分别确定每一个待评估信源的影响力权重特征值。
4.根据权利要求1所述的方法,其特征在于,所述获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值,包括:
根据所述多个待评估信源的影响力权重特征值分别确定每一个待评估信源与其他每一个待评估信源之间的关联系数;
根据所述每一个待评估信源的历史影响力分值和每一个待评估信源与其他每一个待评估信源之间的关联系数、通过预设的动态评估模型确定每一个待评估信源的目标影响力分值。
5.根据权利要求1所述的方法,其特征在于,在确定每一个待评估信源的目标影响力分值的步骤之后,还包括:
获取专家经验参考数据,根据所述专家经验参考数据确定所述多个待评估信源中每一个待评估信源对应的专家评分;
根据所述每一个待评估信源对应的专家评分对所述每一个待评估信源的目标影响力分值进行校正。
6.一种信源影响力的评估装置,其特征在于,所述装置包括:
获取单元:用于获取信源数据,对所述信源数据进行规范化处理,根据规范化处理后的信源数据确定与所述信源数据对应的多个信源主体作为多个待评估信源;
第一确定单元:用于分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值;
第二确定单元:用于获取每一个待评估信源的历史影响力分值,根据所述每一个待评估信源的影响力权重特征值、历史影响力分值以及预设的动态评估模型分别确定每一个待评估信源的目标影响力分值;
其中,所述第一确定单元,用于分别获取所述多个待评估信源在预设时间区间内的被转发数据,根据所述被转发数据分别确定每一个待评估信源的影响力权重特征值,具体包括:
根据所述被转发数据分别确定每一个待评估信源的转发和/或被转发信息,其中,所述转发和/或被转发信息包括每一个待评估信源的转发的文本数量、转发的各个文本的信源信息、被转发的文本数量和/或转发每一个所述被转发的文本的信源信息;
根据所述多个待评估信源的转发和/或被转发信息确定每一个待评估信源分别转发其他每一个待评估信源发布的文本数量作为第一数量和/或该待评估信源转发其他所有待评估信源发布的文本数量作为第二数量;
根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值;
其中,所述根据所述第一数量和第二数量确定所述每一个待评估信源的影响力权重特征值,具体包括:
将所述第一数量与所述第二数量的比例作为第一权重系数;
将转载所述待评估信源的信源主体占所有信源主体的比例记为子系数a;
将所述待评估信源被转载的文本数量占发布的全部文本数量的比例为子系数b;
根据所述子系数a与所述子系数b确定出所述待评估信源的第二权重系数;
将所述第一权重系数和所述第二权重系数作为所述待评估信源的所述影响力权重特征值。
7.根据权利要求6所述的装置,其特征在于,所述第二确定单元包括:
第三确定单元:用于根据所述多个待评估信源的影响力权重特征值分别确定每一个待评估信源与其他每一个待评估信源之间的关联系数;
第四确定单元:用于根据所述每一个待评估信源的历史影响力分值和每一个待评估信源与其他每一个待评估信源之间的关联系数、通过预设的动态评估模型确定每一个待评估信源的目标影响力分值。
8.一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911066574.8A CN111062202B (zh) | 2019-11-04 | 2019-11-04 | 信源影响力的评估方法、装置、设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911066574.8A CN111062202B (zh) | 2019-11-04 | 2019-11-04 | 信源影响力的评估方法、装置、设备及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062202A CN111062202A (zh) | 2020-04-24 |
CN111062202B true CN111062202B (zh) | 2023-10-13 |
Family
ID=70298550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911066574.8A Active CN111062202B (zh) | 2019-11-04 | 2019-11-04 | 信源影响力的评估方法、装置、设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062202B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115280A (zh) * | 2020-06-18 | 2020-12-22 | 科技日报社 | 一种全媒体影响力传播分析方法及装置 |
CN111859074B (zh) * | 2020-07-29 | 2023-12-29 | 东北大学 | 基于深度学习的网络舆情信息源影响力评估方法及系统 |
CN116450757A (zh) * | 2023-06-19 | 2023-07-18 | 深圳索信达数据技术有限公司 | 数据资产的评价指标的确定方法及装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107153908A (zh) * | 2017-03-24 | 2017-09-12 | 国家计算机网络与信息安全管理中心 | 移动新闻App影响力评级方法 |
CN108256740A (zh) * | 2017-12-22 | 2018-07-06 | 北京智慧星光信息技术有限公司 | 一种获取互联网信息传播指标的控制方法 |
CN108875018A (zh) * | 2018-06-19 | 2018-11-23 | 网智天元科技集团股份有限公司 | 新闻影响力评估方法、装置及电子设备 |
CN108959364A (zh) * | 2018-05-21 | 2018-12-07 | 大连理工大学 | 一种社交媒体事件级新闻中新闻媒体影响力评估方法 |
CN109063010A (zh) * | 2018-07-11 | 2018-12-21 | 成都爱为贝思科技有限公司 | 一种基于PageRank的意见领袖挖掘方法 |
CN109359857A (zh) * | 2018-10-12 | 2019-02-19 | 网智天元科技集团股份有限公司 | 一种媒体影响力评估方法、装置及电子设备 |
CN110263234A (zh) * | 2019-05-06 | 2019-09-20 | 平安科技(深圳)有限公司 | 企业家影响力评估方法、装置、计算机设备及存储介质 |
CN110287442A (zh) * | 2019-06-28 | 2019-09-27 | 秒针信息技术有限公司 | 一种影响力排名的确定方法、装置、电子设备及存储介质 |
-
2019
- 2019-11-04 CN CN201911066574.8A patent/CN111062202B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107153908A (zh) * | 2017-03-24 | 2017-09-12 | 国家计算机网络与信息安全管理中心 | 移动新闻App影响力评级方法 |
CN108256740A (zh) * | 2017-12-22 | 2018-07-06 | 北京智慧星光信息技术有限公司 | 一种获取互联网信息传播指标的控制方法 |
CN108959364A (zh) * | 2018-05-21 | 2018-12-07 | 大连理工大学 | 一种社交媒体事件级新闻中新闻媒体影响力评估方法 |
CN108875018A (zh) * | 2018-06-19 | 2018-11-23 | 网智天元科技集团股份有限公司 | 新闻影响力评估方法、装置及电子设备 |
CN109063010A (zh) * | 2018-07-11 | 2018-12-21 | 成都爱为贝思科技有限公司 | 一种基于PageRank的意见领袖挖掘方法 |
CN109359857A (zh) * | 2018-10-12 | 2019-02-19 | 网智天元科技集团股份有限公司 | 一种媒体影响力评估方法、装置及电子设备 |
CN110263234A (zh) * | 2019-05-06 | 2019-09-20 | 平安科技(深圳)有限公司 | 企业家影响力评估方法、装置、计算机设备及存储介质 |
CN110287442A (zh) * | 2019-06-28 | 2019-09-27 | 秒针信息技术有限公司 | 一种影响力排名的确定方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
杨戌初.社交网络中突发事件的态势感知算法研究与实现.《中国优秀硕士学位论文全文数据库 信息科技辑》.2019,(第01期),第I139-302页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111062202A (zh) | 2020-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062202B (zh) | 信源影响力的评估方法、装置、设备及可读介质 | |
CN111159546B (zh) | 事件推送方法、装置、计算机可读存储介质和计算机设备 | |
CN109543007A (zh) | 提问数据生成方法、装置、计算机设备和存储介质 | |
WO2021120627A1 (zh) | 数据搜索匹配方法、装置、计算机设备和存储介质 | |
US10318617B2 (en) | Methods and apparatus for extraction of content from an email or email threads for use in providing implicit profile attributes and content for recommendation engines | |
US20210182043A1 (en) | App pushing method, device, electronic device and computer-readable storage medium | |
US20140143241A1 (en) | Internet news platform and related social network | |
CN112559895B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN110597951B (zh) | 文本解析方法、装置、计算机设备和存储介质 | |
CN111930980B (zh) | 图像检索模型的训练方法及图像检索方法、装置、及介质 | |
CN111368061B (zh) | 短文本过滤方法、装置、介质及计算机设备 | |
CN112102093B (zh) | 主体身份及关联关系识别方法、装置、设备和介质 | |
US8782078B2 (en) | Systematic process for creating large numbers of relevant, contextual marginal comments based on existing discussions of quotations and links | |
CN113434763A (zh) | 搜索结果的推荐理由生成方法、装置、设备及存储介质 | |
CN113065940A (zh) | 基于人工智能的发票报销的方法、装置、设备及存储介质 | |
WO2020057014A1 (zh) | 对话分析评价的方法、装置、计算机设备和存储介质 | |
CN111310451B (zh) | 敏感词词典生成方法、装置及存储介质和电子设备 | |
CN109918661B (zh) | 同义词获取方法及装置 | |
CN111027310A (zh) | 文本影响力的评估方法、装置、设备及可读介质 | |
CN116226560A (zh) | 一种短链接生成方法及装置 | |
CN113515628B (zh) | 文档检测方法、装置、设备及存储介质 | |
CN109410069A (zh) | 结算数据处理方法、装置、计算机设备和存储介质 | |
CN115269765A (zh) | 账号识别方法、装置、电子设备和存储介质 | |
CN114169331A (zh) | 地址解析方法、装置、计算机设备和存储介质 | |
CN111382382B (zh) | 数据的展示方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |