CN112925884A - 一种基于自然语言处理的调度应急知识管理的方法 - Google Patents
一种基于自然语言处理的调度应急知识管理的方法 Download PDFInfo
- Publication number
- CN112925884A CN112925884A CN202110254752.0A CN202110254752A CN112925884A CN 112925884 A CN112925884 A CN 112925884A CN 202110254752 A CN202110254752 A CN 202110254752A CN 112925884 A CN112925884 A CN 112925884A
- Authority
- CN
- China
- Prior art keywords
- text
- scheduling
- emergency knowledge
- emergency
- knowledge text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003058 natural language processing Methods 0.000 title claims abstract description 23
- 238000007726 management method Methods 0.000 title description 28
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 4
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000033228 biological regulation Effects 0.000 abstract description 3
- 206010063385 Intellectualisation Diseases 0.000 abstract description 2
- 238000012795 verification Methods 0.000 abstract 1
- 238000012549 training Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000018893 Cercis canadensis var canadensis Nutrition 0.000 description 1
- 240000000024 Cercis siliquastrum Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 241000646858 Salix arbusculoides Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本发明提供一种基于自然语言处理的调度应急知识管理的方法,所述方法包括以下步骤:S1、获取调度应急知识文本并对其进行预处理;S2、对调度应急知识文本进行分词和注释;S3、对调度应急知识文本进行语义分类和识别;S4、对调度应急知识文本进行语义解析,提取调度应急知识文本中的有效信息及其语义成分类型,生成计算机可识别的对象化信息。通过本发明可以提高电网调度应急管理水平,自动跟踪电网状态变化,辅助调控人员了解、掌握电力系统实时运行状态,以保证电网安全稳定运行,有效实现对电网设备的自动校验与控制,减少系统的局限性及危险性,准确识别人工输入或其他方式导入的电网控制指令,提高电网控制的自动化、智能化以及交互能力。
Description
技术领域
本发明涉及电网调度技术领域,尤其涉及一种基于自然语言处理的调度应急知识管理的方法。
背景技术
现今,由于电网技术的快速提高,我国明确了未来朝智能电网生产方式变革的行动方向,致力发展人工智能、大数据等新技术在电网调度领域中的应用。由于电网规模及结构都日趋扩大,导致电网调度应急管理的复杂性也不断加大,传统经验的调度应急管理方法现已很难实现电网调度运行的要求,需要在这方面作出更高的要求,打造智能化的电网调度应急管理系统。
随着国内电力系统的日趋完善,电网调度累积的数据量不断增加,这给人工智能技术的应用提供了广阔的前景。目前,对于在电网调度里应用自然语言处理等人工智能技术的研究仍处于初期探索阶段,还没有成熟可用的案例,先面临的主要难点是现在还没有出现能够满足像电力行业这种对文本处理结果要求很高的传统工业领域的成熟自然语言处理算法、工具或者平台,而且多数方法是根据日常生活中使用频率较高的自然语言特点设计的,具有较强的泛化能力却并不能较好地适用于电力领域文本特点。
发明内容
鉴于此,本发明的目的在于提供一种基于自然语言处理的调度应急知识管理的方法,以克服或至少部分解决现有技术所存在的上述问题。
本发明第一方面提供一种基于自然语言处理的调度应急知识管理的方法,包括以下步骤:
S1、获取调度应急知识文本并对其进行预处理;
S2、对调度应急知识文本进行分词和注释;
S3、对调度应急知识文本进行语义分类和识别;
S4、对调度应急知识文本进行语义解析,提取调度应急知识文本中的有效信息及其语义成分类型,生成计算机可识别的对象化信息。
进一步的,所述步骤S1中,对调度应急知识文本进行预处理具体为:建立调度应急管理词库,通过统一规则表达对调度应急知识文本进行预处理。
进一步的,所述调度应急管理词库包括基本词库和组合词库,所述基本词库用于存储电气专业术语和特殊命名词,所述组合词库用于存储长度超过预设阈值且包含完整学术性语言描述的文本。
进一步的,所述步骤S2中,对调度应急知识文本进行分词和注释具体为:结合调度应急管理词库、分词规则和注释规则,对调度应急知识进行向量化。
进一步的,所述分词规则具体包括:
将符号与设备装置归为不同单元;
将长度最小的包含完整学术性语言描述的文本归为一个单元;
当调度应急管理文本为自然语言里出现频率最低的文本组合时,查询对应的电力调度常用说明作为分词依据;
若文本后出现包含于括号内的注释内容,将注释内容作为文本进行分词。
进一步的,所述注释规则具体为:使用条件随机场模型,根据调度应急知识文本生成一个长度为M的序列A=(a1,a2,…,aN),以及对应的标记序列B=(b1,b2,…,bN),条件随机场模型的表达式为:
其中λs表示第s个特征式的权数,fs为特征式,假设出现了一个特征满足解释第s个特征函数的内容,则该fs为1。
进一步的,步骤S3中对调度应急知识文本进行语义分类和识别具体为:将向量化的调度应急知识文本作为输入信息,根据建模产生全句的语义表示,结合事件语义方法预测调度应急知识文本所属的与任务相关的类别。
进一步的,所述事件语义方法具体为:根据调度应急知识文本全句的语义表示,判断其属于何种语句类型,所述语句类型包括调度操作安排、监控操作指示、开关跳闸信息、监控异常信息、现场异常信息、告警信号内容。
本发明第二方面提供一种基于自然语言处理的调度应急知识管理的系统,所述系统包括:
预处理模块,用于获取调度应急知识文本并对其进行预处理;
分词注释模块,用于对调度应急知识文本进行分词和注释;
语句分类模块,用于对调度应急知识文本进行语义分类和识别;
语义解析模块,用于提取调度应急知识文本中的有效信息及其语义成分类型。
本发明第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述第一方面所述的方法。
与现有技术相比,本发明的有益效果是:
本发明所提供的一种基于自然语言处理的调度应急知识管理的方法,通过融合语义解析技术和电力领域知识,提出了适用于电力调度应急的语义解析框架。实验分析表明此方法能提取电网文本中的设备、控制、状态、交互等有效信息,形成计算机可识别的对象化信息,给进一步实现系统智能控制与交互建立基础。通过本发明可以提高电网调度应急管理水平,可以自动跟踪电网状态变化,辅助调控人员了解、掌握电力系统实时运行状态,并提供当前电网状态的应急管理方案,以保证电网安全稳定运行。有效实现对电网设备的自动校验与控制,减少系统的局限性及危险性,准确识别人工输入或其他方式导入的电网控制指令,提高电网控制的自动化、智能化以及交互能力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于自然语言处理的调度应急知识管理的方法整体流程示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所列举实施例只用于解释本发明,并非用于限定本发明的范围。
参照图1,本发明实施例提供一种基于自然语言处理的调度应急知识管理的方法,所述方法包括以下步骤:
S1、获取调度应急知识文本并对其进行预处理;
S2、对调度应急知识文本进行分词和注释;
S3、对调度应急知识文本进行语义分类和识别;
S4、对调度应急知识文本进行语义解析,提取调度应急知识文本中的有效信息及其语义成分类型,生成计算机可识别的对象化信息。
步骤S1中,调度应急知识文本可以是从电网调度应急管理系统中获取,由于电网调度应急管理系统内的大多数文本都是依靠人工录入的未经处理的文字描述内容,很容易出现格式不规范的情况,导致直接对这些文本进行划分的准确率较低,因此需要对获取到的调度应急知识文本进行预处理。
作为本实施例一种可选的实施方式,步骤S1中,对调度应急知识文本进行预处理具体为:建立调度应急管理词库,通过统一规则表达对调度应急知识文本进行预处理。
示例性地,所述调度应急管理词库包括基本词库和组合词库。其中,所述基本词库用于存储电气专业术语和特殊命名词,例如,所述电气专业术语可以包括电流、电压、跳闸、检修等;所述特殊命名词通常是由某个电力应急调度管理区域的地点组合方式作为命名,重复率低,例如定忠变、紫荆站、玄丰线等。基本词库中包含了关于词性和词频的内容,以便于进行后续的分词和注释步骤。基本词库中的每一行均为“词语名称,词性字母,词频次数”的格式,每一项均遵从此格式并通过空格划分开来。
在进行分词处理时,在电网调度应急管理系统中经常存在长度较长且包含完整学术性语言描述的文本,例如说明装置信息的“带消弧线圈的接地变压器”、描述运行变化的“旁路运行转母联运行”,所述组合词库用于存储此类长度超过预设阈值且包含完整学术性语言描述的文本。组合词库中每一行只有一个组合文本。
作为本实施例的一种可选实施方式,所述步骤S2中,对调度应急知识文本进行分词和注释具体为:结合调度应急管理词库、分词规则和注释规则,对调度应急知识进行向量化。
示例性地,本实施例中根据电力调度应急管理系统的特点对分词规则进行了设计,所述分词规则具体包括:
(1)将符号与设备装置归为不同单元,所述符号可以是分段号、电压电流参数等;所述设备装置可以是线路、变压器等。
(2)将长度最小的包含完整学术性语言描述的文本归为一个单元。
(3)当调度应急管理文本为自然语言里出现频率最低的文本组合时,查询对应的电力调度常用说明作为分词依据。
(4)若文本后出现包含于括号内的注释内容,将注释内容作为文本进行分词,其中括号部分划分为标点。
另外,所述注释规则具体为:使用条件随机场模型,根据调度应急知识文本生成一个长度为M的序列A=(a1,a2,…,aN),aN表示调度应急知识文本中第N个词,以及对应的标记序列B=(b1,b2,…,bN),bN表示调度应急知识文本中第N个标记,条件随机场模型的表达式为:
其中λs表示第s个特征式的权数,fs为特征式,假设出现了一个特征满足解释第s个特征函数的内容,则该fs为1。
示例性地,本实施例结合调度应急管理词库、分词规则和注释规则,对训练样本进行向量化,在分词过程中的建模参数设置如表1所示。
表1分词建模参数内容
本实施例以调度应急知识库中的某异常记录为例,其具体的分词、词性注释结果如表2所示:
表2分词、词性注释结果
根据上述结果可知,和原注释法相比,本实施例所提供的结合自定义词库以及利用语料库里的样本重新训练后的分词、注释方法对调度应急知识文本的分词以及注释效果有明显提高。
同时本实施例还采用116句电力调度文本语句作为模板,分别对原操作自带的通用语义方法、实验中训练的电网文本方法还有添加了自组织的电力调度文本词库方法进行分词注释测试,得到召回率如表3所示。
表3分词注释试验结果(召回率)
通过表3可以看出,添加词库的姿训练方法在分词和词性注释上都达到了90%以上的召回率,明显可以看出其效果相对于通用方法和未添加词库的自训练方法更佳。
作为本实施例的一种可选实施方式,步骤S3中对调度应急知识文本进行语义分类和识别具体为:将向量化的调度应急知识文本作为输入信息,根据建模产生全句的语义表示,结合事件语义方法预测调度应急知识文本所属的与任务相关的类别。
示例性地,所述事件语义方法具体为:根据调度应急知识文本全句的语义表示,判断其属于何种语句类型,所述语句类型包括调度操作安排、监控操作指示、开关跳闸信息、监控异常信息、现场异常信息、告警信号内容。本实施例以上述事件语义方法作为基础结合数据特征生成句子的表达方法,以此作为基础对调度应急知识文本进行分类和识别。
在本实施例的一个具体实施方式中,采用前述实施例所述的方法对调度应急知识文本进行语句分类试验,对语句分类建模参数设置如表4所示。
表4语句分类建模参数内容
同时从调度应急知识库中选择了1323句与调度应急相关的指令、记录等文本数据,并将其分为训练集样本和测试集样本进行试验,结果如表5所示。
表5语句分类试验结果
通过表5可以看出,采用本实施例所提供的方法进行注释召回率更高,效果更佳。
本实施例中,以经过人工注释的调度应急知识文本作为训练样本进行训练可以获得建模的中间结果,对中间结果进行电力环境语义成分注释并结合前述实施例所述的条件随机场模型进行训练,最终可得出基于自然语言处理的调度应急文本。迭代训练结果如表6所示。
表6迭代训练结果
键名 | 具体参数 | 定义 |
currentLearningTimes | 42 | 迭代训练次数 |
correctCount | 1185 | 正确指令 |
totalCount | 1185 | 总指令 |
taggingPrecision | 1.0 | 精度 |
learningStep | 0.01916 | 学习步长 |
以上述实施例所述方法为基础,添加词库内容,结合事件语义方法和条件随机场模型对任意两条指令进行语义解析,结果如下所示:
A、语句:500kV蝶五105线路由检修转运行。
事件:调度应急操作指令。
A_VOLTAGE:500kV。
A_EQUIPMENT:蝶五105线路。
A_OPRATE_TYPE:检修转运行。
B、语句:220kV柳城124、柳新120、柳铜128线路由运行转冷备用;用220kV待用130、尔海135、湘潭140开关及线路由运行转检修。
事件:调度应急操作指令。
A_VOLTAGE:220kV。
A_EQUIPMENT:柳城124线路。
A_EQUIPMENT:柳新120线路。
A_EQUIPMENT:柳铜128线路。
A_OPRATE_TYPE:运行转冷备用。
A_VOLTAGE:220kV。
A_EQUIPMENT:待用130开关及线路。
A_EQUIPMENT:尔海135开关及线路。
A_EQUIPMENT:湘潭140开关及线路。
A_OPRATE_TYPE:运行转冷备用。
根据上述实验结果可以发现通过本发明所提供的方法能够有效识别出电力调控应急语句,提取出文本中有效信息及其语义成分类型,证明了本方法能应用于电力调度应急领域,具有可行性和有效性。
本发明另一实施例还提供一种基于自然语言处理的调度应急知识管理的系统,所述系统包括:
预处理模块,用于获取调度应急知识文本并对其进行预处理;
分词注释模块,用于对调度应急知识文本进行分词和注释;
语句分类模块,用于对调度应急知识文本进行语义分类和识别;
语义解析模块,用于提取调度应急知识文本中的有效信息及其语义成分类型。
本发明另一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述方法实施例所述的方法。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述方法包括以下步骤:
S1、获取调度应急知识文本并对其进行预处理;
S2、对调度应急知识文本进行分词和注释;
S3、对调度应急知识文本进行语义分类和识别;
S4、对调度应急知识文本进行语义解析,提取调度应急知识文本中的有效信息及其语义成分类型,生成计算机可识别的对象化信息。
2.根据权利要求1所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述步骤S1中,对调度应急知识文本进行预处理具体为:建立调度应急管理词库,通过统一规则表达对调度应急知识文本进行预处理。
3.根据权利要求2所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述调度应急管理词库包括基本词库和组合词库,所述基本词库用于存储电气专业术语和特殊命名词,所述组合词库用于存储长度超过预设阈值且包含完整学术性语言描述的文本。
4.根据权利要求2所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述步骤S2中,对调度应急知识文本进行分词和注释具体为:结合调度应急管理词库、分词规则和注释规则,对调度应急知识进行向量化。
5.根据权利要求4所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述分词规则具体包括:
将符号与设备装置归为不同单元;
将长度最小的包含完整学术性语言描述的文本归为一个单元;
当调度应急管理文本为自然语言里出现频率最低的文本组合时,查询对应的电力调度常用说明作为分词依据;
若文本后出现包含于括号内的注释内容,将注释内容作为文本进行分词。
7.根据权利要求4所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,步骤S3中对调度应急知识文本进行语义分类和识别具体为:将向量化的调度应急知识文本作为输入信息,根据建模产生全句的语义表示,结合事件语义方法预测调度应急知识文本所属的与任务相关的类别。
8.根据权利要求7所述的一种基于自然语言处理的调度应急知识管理的方法,其特征在于,所述事件语义方法具体为:根据调度应急知识文本全句的语义表示,判断其属于何种语句类型,所述语句类型包括调度操作安排、监控操作指示、开关跳闸信息、监控异常信息、现场异常信息、告警信号内容。
9.一种基于自然语言处理的调度应急知识管理的系统,其特征在于,所述系统包括:
预处理模块,用于获取调度应急知识文本并对其进行预处理;
分词注释模块,用于对调度应急知识文本进行分词和注释;
语句分类模块,用于对调度应急知识文本进行语义分类和识别;
语义解析模块,用于提取调度应急知识文本中的有效信息及其语义成分类型。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110254752.0A CN112925884A (zh) | 2021-03-09 | 2021-03-09 | 一种基于自然语言处理的调度应急知识管理的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110254752.0A CN112925884A (zh) | 2021-03-09 | 2021-03-09 | 一种基于自然语言处理的调度应急知识管理的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112925884A true CN112925884A (zh) | 2021-06-08 |
Family
ID=76172038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110254752.0A Pending CN112925884A (zh) | 2021-03-09 | 2021-03-09 | 一种基于自然语言处理的调度应急知识管理的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112925884A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991179A (zh) * | 2019-11-13 | 2020-04-10 | 国网山东省电力公司临沂供电公司 | 基于电力专业术语的语义分析方法 |
CN111489748A (zh) * | 2019-10-18 | 2020-08-04 | 广西电网有限责任公司 | 一种调度智能语音辅助系统 |
CN112860872A (zh) * | 2021-03-17 | 2021-05-28 | 广东电网有限责任公司 | 基于自学习的配电网操作票语义合规性的校验方法及系统 |
CN113269271A (zh) * | 2021-04-30 | 2021-08-17 | 清华大学 | 用于人工智能文本分析的双词典模型的初始化方法及设备 |
-
2021
- 2021-03-09 CN CN202110254752.0A patent/CN112925884A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111489748A (zh) * | 2019-10-18 | 2020-08-04 | 广西电网有限责任公司 | 一种调度智能语音辅助系统 |
CN110991179A (zh) * | 2019-11-13 | 2020-04-10 | 国网山东省电力公司临沂供电公司 | 基于电力专业术语的语义分析方法 |
CN112860872A (zh) * | 2021-03-17 | 2021-05-28 | 广东电网有限责任公司 | 基于自学习的配电网操作票语义合规性的校验方法及系统 |
CN113269271A (zh) * | 2021-04-30 | 2021-08-17 | 清华大学 | 用于人工智能文本分析的双词典模型的初始化方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800310B (zh) | 一种基于结构化表达的电力运维文本分析方法 | |
CN111950264B (zh) | 文本数据增强方法及知识元抽取方法 | |
CN112860872A (zh) | 基于自学习的配电网操作票语义合规性的校验方法及系统 | |
CN112905804B (zh) | 一种电网调度知识图谱的动态更新方法及装置 | |
CN111222330B (zh) | 一种中文事件的检测方法和系统 | |
CN110222192A (zh) | 语料库建立方法及装置 | |
CN115017425B (zh) | 地点检索方法、装置、电子设备以及存储介质 | |
CN111090730A (zh) | 智能语音调度系统及方法 | |
CN113065341A (zh) | 一种环境类投诉举报文本自动标注和分类方法 | |
Li et al. | A method for resume information extraction using bert-bilstm-crf | |
CN115859980A (zh) | 一种半监督式命名实体识别方法、系统及电子设备 | |
CN116028646A (zh) | 一种基于机器学习的电网调度领域知识图谱构建方法 | |
CN115409018A (zh) | 基于大数据的公司舆情监测系统及其方法 | |
CN112559741B (zh) | 核电设备缺陷记录文本分类方法、系统、介质及电子设备 | |
CN112765314B (zh) | 一种基于电力本体知识库的电力信息检索方法 | |
CN112925884A (zh) | 一种基于自然语言处理的调度应急知识管理的方法 | |
Sun et al. | Power fault preplan text information extraction based on NLP | |
CN115238093A (zh) | 一种模型训练的方法、装置、电子设备及存储介质 | |
CN115238077A (zh) | 基于人工智能的文本分析方法、装置、设备及存储介质 | |
CN114969334A (zh) | 异常日志检测方法、装置、电子设备及可读存储介质 | |
Zhang et al. | Research and Application of Construction Method of Power Grid Dispatching Professional Corpus | |
CN113656592B (zh) | 基于知识图谱的数据处理方法、装置、电子设备和介质 | |
Gu et al. | Named Entity Recognition Based on Deep Learning for Power Grid Information | |
Sun et al. | Ensemble Machine Learning Identification of Power Fault Countermeasure Text Considering Word String TF-IDF Feature | |
Rubtsova et al. | An approach to construction and analysis of a corpus of short Russian texts intended to train a sentiment classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210608 |
|
RJ01 | Rejection of invention patent application after publication |