CN116501836A - 电力舆情风险等级确定方法、装置和计算机设备 - Google Patents
电力舆情风险等级确定方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN116501836A CN116501836A CN202310444306.5A CN202310444306A CN116501836A CN 116501836 A CN116501836 A CN 116501836A CN 202310444306 A CN202310444306 A CN 202310444306A CN 116501836 A CN116501836 A CN 116501836A
- Authority
- CN
- China
- Prior art keywords
- historical data
- data
- public opinion
- similarity
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000013598 vector Substances 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 13
- 229910052799 carbon Inorganic materials 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000012502 risk assessment Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请涉及一种电力舆情风险等级确定方法、装置和计算机设备。所述方法包括:获取待确定风险等级的电力舆情数据;确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。采用本方法能够更准确地确定舆情风险等级。
Description
技术领域
本申请涉及智能电网技术领域,特别是涉及一种电力舆情风险等级确定方法、装置和计算机设备。
背景技术
现有技术中,通常基于神经网络构建舆情风险评估模型,将从网页中抓取到的关键词输入舆情风险评估模型,识别关键词对应的舆情风险等级,并根据识别到的舆情风险等级确定是否发出预警。然而,由于舆情风险评估模型通常基于电力数据进行模型训练,而实际情况中影响舆情风险等级的因素复杂多样,容易导致舆情风险评估模型对于舆情风险等级的确定不准确。
因此,目前电网企业的舆情风险等级确定技术存在不准确的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种较为准确的电力舆情风险等级确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种电力舆情风险等级确定方法。所述方法包括:
获取待确定风险等级的电力舆情数据;
确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
在其中一个实施例中,所述至少两个历史数据集包括存储第一历史数据的第一历史数据集和存储第二历史数据的第二历史数据集,所述电力舆情数据与所述第一历史数据之间的相似性高于所述电力舆情数据与所述第二历史数据之间的相似性。
在其中一个实施例中,所述第一历史数据包括直接历史数据,所述第二历史数据包括间接历史数据。
在其中一个实施例中,所述根据所述相似性,从各所述历史数据集中确定出目标历史数据,包括:
从所述电力舆情数据与所述历史数据集中的各历史数据之间的相似性中,确定出目标相似性;所述历史数据集包括所述第一历史数据集和所述第二历史数据集;
将所述目标相似性对应的历史数据,确定为所述目标历史数据。
在其中一个实施例中,所述目标相似性包括所述第一历史数据集对应的第一相似性和所述第二历史数据集对应的第二相似性,所述目标历史数据包括所述第一历史数据集对应的第一目标历史数据和所述第二历史数据集对应的第二目标历史数据;
所述确定各所述目标历史数据对应的风险等级权重,包括:
将所述第一相似性与所述第二相似性之和,确定为总相似性;
根据所述第一相似性与所述总相似性之比,得到所述第一目标历史数据对应的第一风险等级权重,以及,根据所述第二相似性与所述总相似性之比,得到所述第二目标历史数据对应的第二风险等级权重。
在其中一个实施例中,所述确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性,包括:
对所述电力舆情数据进行向量化处理,得到所述电力舆情数据对应的电力舆情向量;
将所述电力舆情向量与所述历史数据对应的历史舆情向量进行相关处理,得到所述电力舆情数据与所述历史数据之间的所述相似性。
在其中一个实施例中,在获取待确定风险等级的电力舆情数据之前,还包括:
从历史网页中提取候选关键词,并确定所述候选关键词的词频;
在所述词频超过预设阈值的情况下,将所述候选关键词作为原始舆情数据;
对所述原始舆情数据进行分类,得到所述第一历史数据集和所述第二历史数据集。
第二方面,本申请还提供了一种电力舆情风险等级确定装置。所述装置包括:
数据获取模块,用于获取待确定风险等级的电力舆情数据;
数据计算模块,用于确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
权重确定模块,用于根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
等级确定模块,用于根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待确定风险等级的电力舆情数据;
确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待确定风险等级的电力舆情数据;
确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待确定风险等级的电力舆情数据;
确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
上述电力舆情风险等级确定方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待确定风险等级的电力舆情数据,确定电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性,根据相似性,从各历史数据集中确定出目标历史数据,并确定各目标历史数据对应的风险等级权重,根据风险等级权重,对各目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级;可以分别采集与电力舆情直接相关的历史数据和间接相关的历史数据,形成至少两个历史数据集,每个历史数据集中均包含历史数据及其对应的历史风险等级,针对待确定风险等级的电力舆情数据,通过从每个历史数据集中确定出与其相似性最高的目标历史数据,进而根据目标历史数据对应的历史风险等级确定电力舆情数据的目标风险等级,由于同时使用了与电力舆情直接相关的历史数据和间接相关的历史数据,可以更准确地确定舆情风险等级。
附图说明
图1为一个实施例中电力舆情风险等级确定方法的流程示意图;
图2为另一个实施例中电力舆情风险等级确定方法的流程示意图;
图3为一个实施例中电力舆情风险等级确定装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种电力舆情风险等级确定方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤S110,获取待确定风险等级的电力舆情数据。
其中,电力舆情数据可以是从网络中抓取到的关键词。
其中,风险等级可以是预先设置的舆情风险的级别。
具体实现中,终端可以在预设时刻,从网络中抓取关键词,将抓取到的关键词作为待确定风险等级的电力舆情数据。
例如,在每天24时,终端针对微博、论坛和短视频平台中的文字内容进行抓取,将出现频率高于预设阈值的词语确定为关键词,将其作为待确定风险等级的电力舆情数据。此外,为了提高效率,终端还可以仅针对微博、论坛和短视频平台中新增和修改过的文字内容进行关键词抓取。
步骤S120,确定电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性。
具体实现中,至少两个历史数据集可以包括直接历史数据集和间接历史数据集,直接历史数据集中包含与电力舆情直接相关的直接历史数据,间接历史数据集中包含与电力舆情间接相关的间接历史数据。分别确定电力舆情数据与直接历史数据集中各直接历史数据之间的相似性,以及电力舆情数据与间接历史数据集汇总各间接历史数据之间的相似性。
例如,直接历史数据集Rm={mi,i=1,2,…,M},其中mi为直接历史数据,间接历史数据集Rn={nj,j=1,2,…,N},其中nj为间接历史数据,对于电力舆情数据x,确定x与各直接历史数据之间的相似性,得到相似性x*mi,i=1,2,…,M,确定电力舆情数据x与各间接历史数据之间的相似性,得到相似性x*nj,j=1,2,…,N。
步骤S130,根据相似性,从各历史数据集中确定出目标历史数据,并确定各目标历史数据对应的风险等级权重。
其中,目标历史数据可以为历史数据集中与电力舆情数据相似性最大的历史数据。
其中,风险等级权重可以为风险等级的权重系数。
具体实现中,可以根据相似性从直接历史数据集中确定出第一目标历史数据,还可以根据相似性从间接历史数据集中确定出第二目标历史数据,将第一目标历史数据与电力舆情数据之间的相似性作为第一相似性,将第二目标历史数据与电力舆情数据之间的相似性作为第二相似性,计算第一相似性与第二相似性的和,得到总相似性,根据第一相似性与总相似性之比得到第一目标历史数据对应的第一风险等级权重,根据第二相似性与总相似性之比得到第二目标历史数据对应的第二风险等级权重。
例如,从每个历史数据集中分别选取出与电力舆情数据相似性最大的历史数据,作为目标历史数据,具体地,针对直接历史数据集,通过计算argmax{x*mi},得到第一目标历史数据为m2,第一目标历史数据与电力舆情数据之间的第一相似性为x*m2,针对间接历史数据集,通过计算argmax{x*nj},得到第二目标历史数据为n3,第二目标历史数据与电力舆情数据之间的第二相似性为x*n3,假设第一相似性x*m2=0.8,第二相似性x*n3=0.4,可以得到第一风险等级权重为0.8/(0.8+0.4)=0.67,第二风险等级权重为0.4/(0.8+0.4)=0.33。
步骤S140,根据风险等级权重,对各目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级。
其中,历史风险等级可以为历史数据集中的历史数据的风险等级。
其中,目标风险等级可以为电力舆情数据的风险等级。
具体实现中,可以预先确定历史数据集中各历史数据的历史风险等级,获取各目标历史数据对应的历史风险等级,用风险等级权重对各目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级。
例如,预先确定直接历史数据集中各直接历史数据的历史风险等级li,i=1,2,…,M,以及间接历史数据集中各间接历史数据的历史风险等级kj,j=1,2,…,N,则第一目标历史数据m2的历史风险等级为l2,相应的第一风险等级权重为0.67,第二目标历史数据n3的历史风险等级为k3,相应的第二风险等级权重为0.33,假设l2=8,k3=4,根据风险等级权重对历史风险等级进行加权求和,可以得到电力舆情数据x的目标风险等级为0.67*l2+0.33*k3=0.67*8+0.33*4=6.68,即电力舆情数据x的目标风险等级为6.68级,还可以对目标风险等级进行取整,例如,进行四舍五入取整,得到电力舆情数据x的目标风险等级为7级。
设置风险等级阈值,当电力舆情数据的目标风险等级超过风险等级阈值时,发出告警信号,例如,设置风险等级阈值为6级,在得到电力舆情数据x的风险等级为7级后,生成告警信号。
上述电力舆情风险等级确定方法,通过获取待确定风险等级的电力舆情数据,确定电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性,根据相似性,从各历史数据集中确定出目标历史数据,并确定各目标历史数据对应的风险等级权重,根据风险等级权重,对各目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级;可以分别采集与电力舆情直接相关的历史数据和间接相关的历史数据,形成至少两个历史数据集,每个历史数据集中均包含历史数据及其对应的历史风险等级,针对待确定风险等级的电力舆情数据,通过从每个历史数据集中确定出与其相似性最高的目标历史数据,进而根据目标历史数据对应的历史风险等级确定电力舆情数据的目标风险等级,由于同时使用了与电力舆情直接相关的历史数据和间接相关的历史数据,可以更准确地确定舆情风险等级。
在一个实施例中,上述至少两个历史数据集包括存储第一历史数据的第一历史数据集和存储第二历史数据的第二历史数据集,电力舆情数据与第一历史数据之间的相似性高于电力舆情数据与第二历史数据之间的相似性。
其中,第一历史数据可以为与电力舆情直接相关的历史关键词,例如,智能电网、电网产能等。
其中,第二历史数据可以为与电力舆情间接相关的历史关键词,例如,碳排放量、温室效应等。
具体实现中,可以从历史网页中抓取关键词,作为历史数据,并确定历史数据的舆情风险等级,将历史数据及其对应的舆情风险等级存储在数据库中。还可以对历史数据进行分类,将与电力舆情直接相关的历史数据作为第一历史数据,存储在第一历史数据集中,将与电力舆情间接相关的历史数据作为第二历史数据,存储在第二历史数据集中。
本实施例中,通过使上述至少两个历史数据集包括存储第一历史数据的第一历史数据集和存储第二历史数据的第二历史数据集,电力舆情数据与第一历史数据之间的相似性高于电力舆情数据与第二历史数据之间的相似性,可以利用与电力舆情直接相关的历史数据构建第一历史数据集,利用与电力舆情间接相关的历史数据构建第二历史数据集,基于两个历史数据集确定电力舆情数据的风险等级,可以提高舆情风险等级确定的准确性。
在一个实施例中,上述第一历史数据包括直接历史数据,第二历史数据包括间接历史数据。
其中,直接历史数据可以为与电力舆情直接相关的历史数据。
其中,间接历史数据可以为与电力舆情间接相关的历史数据。
具体实现中,可以对历史数据进行分类,将与电力舆情直接相关的历史数据作为直接历史数据,存储在第一历史数据集中,将与电力舆情间接相关的历史数据作为间接历史数据,存储在第二历史数据集中。
本实施例中,通过使第一历史数据包括直接历史数据,第二历史数据包括间接历史数据,可以利用与电力舆情直接相关的历史数据构建第一历史数据集,利用与电力舆情间接相关的历史数据构建第二历史数据集,基于两个历史数据集确定电力舆情数据的风险等级,可以提高舆情风险等级确定的准确性。
在一个实施例中,上述步骤S130,可以具体包括:从电力舆情数据与历史数据集中的各历史数据之间的相似性中,确定出目标相似性;历史数据集包括第一历史数据集和第二历史数据集;将目标相似性对应的历史数据,确定为目标历史数据。
其中,目标相似性可以为历史数据集中各历史数据所对应相似性中的最大值。
其中,目标历史数据可以为从历史数据集中选中的历史数据。
具体实现中,在确定电力舆情数据与历史数据集中各历史数据之间的相似性后,可以从中选取最大相似性,将最大相似性作为目标相似性,还可以将最大相似性对应的历史数据确定为目标历史数据。
例如,针对第一历史数据集Rm={mi,i=1,2,…,M},其中mi为第一历史数据,确定电力舆情数据x与各第一历史数据mi之间的相似性,得到x*mi,i=1,2,…,M,相似性x*mi与第一历史数据mi相对应。查找{x*mi}中的最大值,得到x*m2,将x*m2作为目标相似性,则将目标相似性x*m2对应的第一历史数据为m2作为目标历史数据。相似地,针对第二历史数据集Rn={nj,j=1,2,…,N},其中nj为第二历史数据,确定电力舆情数据x与各第二历史数据nj之间的相似性x*nj,查找{x*nj}中的最大值,得到x*n3,将x*n3作为目标相似性,相应的第二历史数据为n3目标历史数据。
本实施例中,通过从电力舆情数据与历史数据集中的各历史数据之间的相似性中,确定出目标相似性,将目标相似性对应的历史数据,确定为目标历史数据,可以从历史数据集中选取出与电力舆情数据相似性最大的历史数据,进而利用该历史数据对应的风险等级确定电力舆情数据的风险等级,便于快速确定电力舆情数据的风险等级。
在一个实施例中,上述目标相似性包括第一历史数据集对应的第一相似性和第二历史数据集对应的第二相似性,目标历史数据包括第一历史数据集对应的第一目标历史数据和第二历史数据集对应的第二目标历史数据;上述步骤S130,具体还可以包括:将第一相似性与第二相似性之和,确定为总相似性;根据第一相似性与总相似性之比,得到第一目标历史数据对应的第一风险等级权重,以及,根据第二相似性与总相似性之比,得到第二目标历史数据对应的第二风险等级权重。
其中,第一相似性可以为第一历史数据集中的历史数据与电力舆情数据之间的相似性。第二相似性可以为第二历史数据集中的历史数据与电力舆情数据之间的相似性。
其中,第一目标历史数据可以为第一历史数据集中与电力舆情数据相似性最大的历史数据。第二目标历史数据可以为第二历史数据集中与电力舆情数据相似性最大的历史数据。
具体实现中,可以计算第一相似性与第二相似性的和,得到总相似性,将第一相似性与总相似性之比,确定为第一目标历史数据对应的第一风险等级权重,将第二相似性与总相似性之比,确定为第二目标历史数据对应的第二风险等级权重。
本实施例中,通过将第一相似性与第二相似性之和,确定为总相似性;根据第一相似性与总相似性之比,得到第一目标历史数据对应的第一风险等级权重,以及,根据第二相似性与总相似性之比,得到第二目标历史数据对应的第二风险等级权重,可以根据相似性,确定各历史数据集中的目标历史数据所对应的风险等级权重,在已知目标历史数据对应的历史风险等级的情况下,可以根据风险等级权重对历史风险等级进行加权求和,快速确定电力舆情数据的风险等级,提高电力舆情数据风险等级确定的效率。
在一个实施例中,上述步骤S120,可以具体包括:对电力舆情数据进行向量化处理,得到电力舆情数据对应的电力舆情向量;将电力舆情向量与历史数据对应的历史舆情向量进行相关处理,得到电力舆情数据与历史数据之间的相似性。
其中,向量化处理可以为自然语言处理中将词转换为向量的处理过程。
其中,电力舆情向量可以为电力舆情数据对应的词向量。历史舆情向量可以为历史舆情数据对应的词向量。
具体实现中,可以对电力舆情数据进行向量化处理,得到电力舆情向量,还可以对历史数据进行向量化处理,得到历史舆情向量,将电力舆情向量与历史舆情向量进行相关运算,得到电力舆情数据与历史舆情数据之间的相似性。
例如,利用word2vec(用来产生词向量的相关模型)对电力舆情数据x进行向量化处理,得到列向量利用word2vec对历史数据mi进行向量化处理,得到列向量/>对/>与进行相关运算,具体地,根据下述公式可以得到电力舆情数据x与历史数据mi之间的相似性s:
其中,T表示转置。
本实施例中,通过对电力舆情数据进行向量化处理,得到电力舆情数据对应的电力舆情向量;将电力舆情向量与历史数据对应的历史舆情向量进行相关处理,得到电力舆情数据与历史数据之间的相似性,可以确定电力舆情向量与历史舆情向量之间的相似性,进而根据相似性,从历史舆情向量对应的风险等级中确定出电力舆情向量的风险等级,降低电力舆情风险等级确定的复杂度。
在一个实施例中,在上述步骤S110之前,具体还可以包括:从历史网页中提取候选关键词,并确定候选关键词的词频;在词频超过预设阈值的情况下,将候选关键词作为原始舆情数据;对原始舆情数据进行分类,得到第一历史数据集和第二历史数据集。
其中,候选关键词可以为历史网页中的关键词。
其中,原始舆情数据可以为历史网页中存在舆情风险的关键词。
具体实现中,可以从历史网页中提取关键词,将提取到的关键词作为候选关键词,统计候选关键词在历史网页中的词频,将词频与预设阈值相比较,若未超过预设阈值,则无需进行处理,否则,若超过预设阈值,则可以将候选关键词确定为原始舆情数据。通过上述方法确定出多个原始舆情数据,根据与电力舆情数据是否直接相关,对原始舆情数据进行分类,得到与电力舆情直接相关的第一历史数据集,以及与电力舆情间接相关的第二历史数据集。
例如,针对从历史网页中提取到的候选关键词:智能电网、电网产能、碳排放量、温室效应、天气、教育,其中天气和教育的词频低于预设阈值,因此可以得到原始舆情数据:智能电网、电网产能、碳排放量、温室效应,根据与电力舆情是否直接相关进行分类,得到第一历史数据集{智能电网,电网产能}和第二历史数据集{碳排放量,温室效应}。
本实施例中,通过从历史网页中提取候选关键词,并确定候选关键词的词频;在词频超过预设阈值的情况下,将候选关键词作为原始舆情数据;对原始舆情数据进行分类,得到第一历史数据集和第二历史数据集,可以确定出历史数据集,根据历史数据集确定电力舆情数据的风险等级,降低了风险等级确定的复杂度。
为了便于本领域技术人员深入理解本申请实施例,以下将结合一个具体示例进行说明。
负面舆情会给企业形象、公信力带来损害,甚至会直接影响企业的正常生产经营秩序,不利于企业长期稳定发展。对舆情信息的风险性进行分析,评估监测到的信息是否会引发舆情危机、会带来何种舆情危机及舆情危机会带来何种后果。对于已经出现的舆情事件,将其风险分类并定级,为后续制定干预措施提供参考。从而,使得可以主动了解当前互联网舆论,及时发现负面舆情,并针对负面舆情主动生成应对内容,第一时间占领舆论阵地。
具体地,可以预先基于历史数据,构建与电力舆情直接相关的第一历史数据集,以及与电力舆情间接相关的第二历史数据集,并确定第一历史数据集中各第一历史数据的历史风险等级,以及第二历史数据集中各第二历史数据的历史风险等级,例如,第一历史数据集为{智能电网,电网产能},其中,智能电网和电网产能的风险等级分别为6和7,第二历史数据集为{碳排放量,温室效应},其中,碳排放量和温室效应的风险等级分别为4和5。
从电网企业的微博、论坛或者公众号中确定出待确定风险等级的电力舆情数据x,针对第一历史数据集,确定出x与智能电网的相似性为s1,与电网产能的相似性为s2,针对第二历史数据集,确定出x与碳排放量的相似性为s3,与温室效应的相似性为s4。
从{s1,s2}中选取最大相似性s2,即x与电网产能相似性较高,相应地,电网产能的风险等级为7;从{s3,s4}中选取最大相似性s3,即x与碳排放量相似性较高,相应地,碳排放量的风险等级为4。
根据s2和s3确定电网产能和碳排放量在计算x的风险等级时所占的权重,得到电网产能的权重为s2/(s2+s3),碳排放量的权重为s3/(s2+s3)。
因此,电力舆情数据x的风险等级为s2/(s2+s3)×7+s3/(s2+s3)×4。
在一个实施例中,如图2所示,提供了一种电力舆情风险等级确定方法,包括以下步骤:
步骤S201,获取待确定风险等级的电力舆情数据;
步骤S202,确定电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;历史数据集包括第一历史数据集和第二历史数据集;
步骤S203,从相似性中确定出目标相似性,将目标相似性对应的历史数据,确定为目标历史数据;目标相似性包括第一历史数据集对应的第一相似性和第二历史数据集对应的第二相似性,目标历史数据包括第一历史数据集对应的第一目标历史数据和第二历史数据集对应的第二目标历史数据;
步骤S204,将第一相似性与第二相似性之和,确定为总相似性;
步骤S205,根据第一相似性与总相似性之比,得到第一目标历史数据对应的第一风险等级权重,以及,根据第二相似性与总相似性之比,得到第二目标历史数据对应的第二风险等级权重;
步骤S206,根据第一风险等级权重和第二风险等级权重,对第一目标历史数据对应的历史风险等级和第二目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级。
具体实现中,可以从电力舆情数据与第一历史数据集中各第一历史数据之间的相似性中确定出第一相似性,将第一相似性对应的第一历史数据确定为第一目标历史数据,还可以从电力舆情数据与第二历史数据集中各第二历史数据之间的相似性中确定出第二相似性,将第二相似性对应的第二历史数据确定为第二目标历史数据。其中,第一目标历史数据和第二目标历史数据分别对应各自的历史风险等级。
计算第一相似性与第二相似性的和,得到总相似性,将第一相似性与总相似性之比确定为第一目标历史数据对应的第一风险等级权重,将第二相似性与总相似性之比确定为第二目标历史数据对应的第二风险等级权重。
根据第一风险等级权重和第二风险等级权重,对第一目标历史数据对应的历史风险等级和第二目标历史数据对应的历史风险等级进行加权求和,可以得到电力舆情数据的目标风险等级。
本实施例中,通过获取待确定风险等级的电力舆情数据,确定电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性,从相似性中确定出目标相似性,将目标相似性对应的历史数据,确定为目标历史数据,将第一相似性与第二相似性之和,确定为总相似性,根据第一相似性与总相似性之比,得到第一目标历史数据对应的第一风险等级权重,以及,根据第二相似性与总相似性之比,得到第二目标历史数据对应的第二风险等级权重,根据第一风险等级权重和第二风险等级权重,对第一目标历史数据对应的历史风险等级和第二目标历史数据对应的历史风险等级进行加权求和,得到电力舆情数据的目标风险等级;可以分别采集与电力舆情直接相关的历史数据和间接相关的历史数据,形成至少两个历史数据集,每个历史数据集中均包含历史数据及其对应的历史风险等级,针对待确定风险等级的电力舆情数据,通过从每个历史数据集中确定出与其相似性最高的目标历史数据,进而根据目标历史数据对应的历史风险等级确定电力舆情数据的目标风险等级,由于同时使用了与电力舆情直接相关的历史数据和间接相关的历史数据,可以更准确地确定舆情风险等级。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电力舆情风险等级确定方法的电力舆情风险等级确定装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电力舆情风险等级确定装置实施例中的具体限定可以参见上文中对于电力舆情风险等级确定方法的限定,在此不再赘述。
在一个实施例中,如图3所示,提供了一种电力舆情风险等级确定装置,包括:数据获取模块310、数据计算模块320、权重确定模块330和等级确定模块340,其中:
数据获取模块310,用于获取待确定风险等级的电力舆情数据;
数据计算模块320,用于确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
权重确定模块330,用于根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
等级确定模块340,用于根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
在一个实施例中,所述至少两个历史数据集包括存储第一历史数据的第一历史数据集和存储第二历史数据的第二历史数据集,所述电力舆情数据与所述第一历史数据之间的相似性高于所述电力舆情数据与所述第二历史数据之间的相似性。
在一个实施例中,所述第一历史数据包括直接历史数据,所述第二历史数据包括间接历史数据。
在一个实施例中,上述权重确定模块330,还用于从所述电力舆情数据与所述历史数据集中的各历史数据之间的相似性中,确定出目标相似性;所述历史数据集包括所述第一历史数据集和所述第二历史数据集;将所述目标相似性对应的历史数据,确定为所述目标历史数据。
在一个实施例中,上述权重确定模块330,还用于将所述第一相似性与所述第二相似性之和,确定为总相似性;根据所述第一相似性与所述总相似性之比,得到所述第一目标历史数据对应的第一风险等级权重,以及,根据所述第二相似性与所述总相似性之比,得到所述第二目标历史数据对应的第二风险等级权重。
在一个实施例中,上述数据计算模块320,还用于对所述电力舆情数据进行向量化处理,得到所述电力舆情数据对应的电力舆情向量;将所述电力舆情向量与所述历史数据对应的历史舆情向量进行相关处理,得到所述电力舆情数据与所述历史数据之间的所述相似性。
在一个实施例中,上述电力舆情风险等级确定装置,还包括:
提取模块,用于从历史网页中提取候选关键词,并确定所述候选关键词的词频;
确定模块,用于在所述词频超过预设阈值的情况下,将所述候选关键词作为原始舆情数据;
分类模块,用于对所述原始舆情数据进行分类,得到所述第一历史数据集和所述第二历史数据集。
上述电力舆情风险等级确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种电力舆情风险等级确定方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种电力舆情风险等级确定方法,其特征在于,所述方法包括:
获取待确定风险等级的电力舆情数据;
确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
2.根据权利要求1所述的方法,其特征在于,所述至少两个历史数据集包括存储第一历史数据的第一历史数据集和存储第二历史数据的第二历史数据集,所述电力舆情数据与所述第一历史数据之间的相似性高于所述电力舆情数据与所述第二历史数据之间的相似性。
3.根据权利要求2所述的方法,其特征在于,所述第一历史数据包括直接历史数据,所述第二历史数据包括间接历史数据。
4.根据权利要求2所述的方法,其特征在于,所述根据所述相似性,从各所述历史数据集中确定出目标历史数据,包括:
从所述电力舆情数据与所述历史数据集中的各历史数据之间的相似性中,确定出目标相似性;所述历史数据集包括所述第一历史数据集和所述第二历史数据集;
将所述目标相似性对应的历史数据,确定为所述目标历史数据。
5.根据权利要求4所述的方法,其特征在于,所述目标相似性包括所述第一历史数据集对应的第一相似性和所述第二历史数据集对应的第二相似性,所述目标历史数据包括所述第一历史数据集对应的第一目标历史数据和所述第二历史数据集对应的第二目标历史数据;
所述确定各所述目标历史数据对应的风险等级权重,包括:
将所述第一相似性与所述第二相似性之和,确定为总相似性;
根据所述第一相似性与所述总相似性之比,得到所述第一目标历史数据对应的第一风险等级权重,以及,根据所述第二相似性与所述总相似性之比,得到所述第二目标历史数据对应的第二风险等级权重。
6.根据权利要求1所述的方法,其特征在于,所述确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性,包括:
对所述电力舆情数据进行向量化处理,得到所述电力舆情数据对应的电力舆情向量;
将所述电力舆情向量与所述历史数据对应的历史舆情向量进行相关处理,得到所述电力舆情数据与所述历史数据之间的所述相似性。
7.根据权利要求2所述的方法,其特征在于,在获取待确定风险等级的电力舆情数据之前,还包括:
从历史网页中提取候选关键词,并确定所述候选关键词的词频;
在所述词频超过预设阈值的情况下,将所述候选关键词作为原始舆情数据;
对所述原始舆情数据进行分类,得到所述第一历史数据集和所述第二历史数据集。
8.一种电力舆情风险等级确定装置,其特征在于,所述装置包括:
数据获取模块,用于获取待确定风险等级的电力舆情数据;
数据计算模块,用于确定所述电力舆情数据与至少两个历史数据集中的各历史数据之间的相似性;
权重确定模块,用于根据所述相似性,从各所述历史数据集中确定出目标历史数据,并确定各所述目标历史数据对应的风险等级权重;
等级确定模块,用于根据所述风险等级权重,对各所述目标历史数据对应的历史风险等级进行加权求和,得到所述电力舆情数据的目标风险等级。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310444306.5A CN116501836A (zh) | 2023-04-23 | 2023-04-23 | 电力舆情风险等级确定方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310444306.5A CN116501836A (zh) | 2023-04-23 | 2023-04-23 | 电力舆情风险等级确定方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116501836A true CN116501836A (zh) | 2023-07-28 |
Family
ID=87324169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310444306.5A Pending CN116501836A (zh) | 2023-04-23 | 2023-04-23 | 电力舆情风险等级确定方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116501836A (zh) |
-
2023
- 2023-04-23 CN CN202310444306.5A patent/CN116501836A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108491817B (zh) | 一种事件检测模型训练方法、装置以及事件检测方法 | |
US9092725B2 (en) | Classifying attribute data intervals | |
CN111898247A (zh) | 滑坡位移预测方法、设备及存储介质 | |
CN117972579A (zh) | 窃电行为检测方法、装置、设备及存储介质 | |
CN117389780A (zh) | 换流站故障分析方法、装置、计算机设备和存储介质 | |
CN116186295A (zh) | 基于注意力的知识图谱链接预测方法、装置、设备及介质 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN116191398A (zh) | 负荷预测方法、装置、计算机设备和存储介质 | |
CN116501836A (zh) | 电力舆情风险等级确定方法、装置和计算机设备 | |
CN116776932A (zh) | 用户的电商行为识别方法及装置 | |
CN116258068A (zh) | 电力系统的暂态稳定评估方法、装置和计算机设备 | |
CN118095958A (zh) | 业务等级的确定方法、装置、计算机设备、存储介质 | |
CN117152428A (zh) | 模型训练方法、装置、计算机设备及计算机可读存储介质 | |
CN116881122A (zh) | 测试案例生成方法、装置、设备、存储介质和程序产品 | |
CN117150311A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN115658899A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN117539833A (zh) | 阅读完整性校验方法、装置、计算机设备和存储介质 | |
CN117764313A (zh) | 资源借调决策方法、装置、计算机设备、存储介质和产品 | |
CN117436972A (zh) | 资源对象推荐方法、装置、计算机设备和存储介质 | |
CN118411033A (zh) | 污闪应对措施确定方法、装置、计算机设备、介质和产品 | |
CN116932761A (zh) | 文本数据标注模型的构建方法、装置和计算机设备 | |
CN115618288A (zh) | 等级确定方法、装置、设备、存储介质和程序产品 | |
CN117435910A (zh) | 一种异常数据的检测方法、装置、计算机设备 | |
CN117034181A (zh) | 一种数据预测方法、设备及可读存储介质 | |
CN118313789A (zh) | 抽水蓄能电站项目管理方案筛选方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |