CN105184514A - 一种基于序列标注的电网设计指标抽取方法 - Google Patents

一种基于序列标注的电网设计指标抽取方法 Download PDF

Info

Publication number
CN105184514A
CN105184514A CN201510679783.5A CN201510679783A CN105184514A CN 105184514 A CN105184514 A CN 105184514A CN 201510679783 A CN201510679783 A CN 201510679783A CN 105184514 A CN105184514 A CN 105184514A
Authority
CN
China
Prior art keywords
index
sequence labelling
mark
report
design
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510679783.5A
Other languages
English (en)
Inventor
陈锟
陈清财
邓小玉
汤步洲
吴小蕙
曾兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Power Grid Program Research Center of Guangdong Power Grid Co Ltd
Original Assignee
Power Grid Program Research Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Power Grid Program Research Center of Guangdong Power Grid Co Ltd filed Critical Power Grid Program Research Center of Guangdong Power Grid Co Ltd
Priority to CN201510679783.5A priority Critical patent/CN105184514A/zh
Publication of CN105184514A publication Critical patent/CN105184514A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的目的在于提供一种基于序列标注的电网评审设计指标抽取方法,该指标抽取方法包括如下步骤:指标体系构建、特征选择方法、序列标注方法、后处理方法。本发明方法从电网工程可行性研究报告和电网工程初步设计报告中自动化提取大量指定设计指标的智能方法,从而提高电网评审人员的工作效率和工作质量,以达到降低编码器复杂度的目的。

Description

一种基于序列标注的电网设计指标抽取方法
技术领域
本发明涉及数据处理领域和电力系统设计领域,尤其涉及基于序列标注的电网设计评审报告指标抽取方法。
背景技术
近年来,随着用电需求快速增长,电网工规模迅速扩大,电网公司大力优化电网结构、强化管理能力、提高投资效益的需求越来越强烈。就电网工程设计报告评审而言,结构复杂的电网中,输变电项目建设影响因素多,导致不同设计规模、不同参数条件、不同地区的输变电工程设计方案千差万别。同时,电网工程初步设计说明书和可行性研究报告中的关键工程技术指标繁多,报告内容丰富篇幅较长,电网初步设计说明书和可行性研究报告评审人员需要花费大量的人力物力进行评审。倘若可以从这些研究报告中提取关键技术指标将使得评审人员轻松且高效。针对质量参差不齐的电网工程设计报告,现有完全依赖专家的评审方式,要求评审专家现场获取大量关键技术指标信息,存在评审标准不统一、评审效率低、评审效果差等缺点。因此,迫切需要建立科学的评审体系、开发智能的关键工程技术指标提取系统来辅助专家进行评审。
从有大量包含结构化或半结构化数据的文本开始,人们就希望从这些文本中提取结构化数据。通常情况下,文本中需要提取的指标不多且不复杂,且通常情况下拥有的训练语料较多。但部分实际应用面临单篇文档中的文本很长且需要提取的指标多,比如电网系统中的研究报告文本,文本很长,需要提取的各类指标数量上百,且有部分指标是同一指标在不同限定条件下的取值。这导致人工标注费用高,不能人工标注大量文本。在有限的标注语料下,抽取出所要的信息,达到用户满意的效果。对于需要提取的指标不多且不复杂的问题,一般结合使用规则和正则匹配就能获得一定效果。但由于人工构建大量规则和正则表达式不现实,所以规则和正则匹配方法对于长文本的大量复杂指标提取并不能够适用于电网评审设计指标的抽取。如何高效的从长文本中自动化提取大量技术指标的智能方法,从而提高电网评审人员的工作效率和工作质量是一个亟待解决的问题。
发明内容
为了解决现有技术中的问题,本发明提供了一种基于序列标注的电网设计评审报告指标抽取方法
本发明的目的可通过以下的技术措施来实现:
一种基于序列标注的电网设计评审报告抽取方法,其特征在于,包括如下步骤:
指标体系构建:根据电网评审设计指标列表和指标类型,重新构建指标体系,以适应专家人工标注和系统自动标注;
人工标注指标:构建专家指标标注系统,使专家对少量电网设计评审报告进行人工标注;专家对电网设计评审报告进行人工标注的数量为约200份。
对评审报告进行序列标注:构建电网评审设计报告标注工具,对电网评审设计报告进行专家人工标注的结果转换为序列标注形式,采用序列标注方法学习指标和特征的对应关系,对未经人工标注的文档进行自动化标注;对评审报告进行特征抽取提高序列标注效果;
指标后处理:将序列标注结果转换为人工标注一致的格式,将序列标注方法应用于电网评审设计报告时产生的边界性问题进行规则修正。
所述指标体系构建包括如下步骤:
指标和属性归并:对电网评审设计指标的类型按照同类指标归并、同类指标相同属性归并的原则进行归并。所述电网评审设计指标的类型包括数值型、句子型。
指标体系层次构建:将归并后的各个不同的指标之间定义指标层级关系,每个指标和属性之间定义从属关系。
所述人工标注指标包括如下步骤:
人工标注系统构建:构建一个满足电网评审专家对电网设计报告指标标注的交互式人工标注系统;
人工标注系统的指标体系构建:根据已构建完成的指标体系,针对人工标注按照层次查找、后标注属性的习惯,构建符合人工标注系统的标注指标体系;
人工标注获取训练样例:专家在人工标注系统上对少量电网设计报告指标进行标注,得到电网设计指标体系下每个指标的取值和位置信息作为训练样例。
所述对评审报告进行序列标注包括如下步骤:
获取序列标注格式文本:将评审报告进行格式转换成序列标注格式;
对评审报告进行特征抽取:针对电网评审设计指标体系,根据不同类别指标特点分别选取特征,以提高序列标注方法的效果;
获取序列标注模型:利用人工标注完成的训练样例和特征抽取步骤获取的特征,按照指标体系分类,采用序列标注方法进行训练,得到序列标注模型。
所述对评审报告进行特征抽取包括如下步骤:
通用特征抽取:对每一个字符的通用特征进行抽取。所述通用特征包括上下文、词性、所属字词。
电网行业词典特征抽取:构建电网设计工程行业词典,对评审报告中的词典内词语进行特征抽取;
规则特征抽取:根据指标常出现的特点,人工定义规则模版,对符合这些规则模版的文本片段进行特征抽取;
获取序列标注结果:对评审报告根据序列模型对序列标注格式的评审报告进行序列标注,得到初步序列标注结果;
所述指标后处理包括如下步骤:
序列标注标号修复:对初步序列标注结果采用规则方法修正断裂和混乱的序列标号,得到标号修复后的序列标注结果;
句子型指标重标注:根据句子型指标标注的证据结果,重定位到指标句子上,对标号修复后的序列标注结果中句子型指标进行重新标注,得到重标注修复后的序列标注结果;
获取指标值:将重标注修复后的序列标注结果转换成人工标注一致的指标格式,得到电网设计指标值。
本发明的有益效果是:本发明提出一种基于序列标注的电网设计评审报告指标抽取方法,构建电网设计指标体系和人工标注系统,利用人工标注系统标注少量数据通过序列标注方法自动的对电网设计评审报告中的相关指标进行抽取,避免了评审专家人工抽取指标的重复劳动。
附图说明
图1是本发明基于序列标注的电网设计指标抽取方法的流程图;
图2是本发明方法的指标体系构建流程图;
图3是本发明方法的指标和属性合并图流程图;
图4是本发明方法的人工标注指标方法流程图;
图5是本发明方法的对评审报告进行序列标注流程图;
图6是本发明方法的指标后处理流程图。
具体实施方式
如图1所示,本发明公开了一种基于序列标注的电网设计指标抽取方法,包括如下步骤:
步骤100:指标体系构建:根据电网评审设计指标列表和指标类型,重新构建指标体系,以适应专家人工标注和系统自动标注。如图2所示,在指标体系构建步骤中,包括如下步骤:
步骤110:指标和属性归并:按照同类指标归并、同类指标相同属性归并的原则进行归并。如图3所示,在指标和属性归并中,包括如下步骤:
步骤111:指标归并:对相同类型(如“数值型”,“句子型”等)的电力设计指标进行归并。
步骤112:属性归并:对同类指标起描述性作用的相同类型的属性进行归并。
步骤120:指标体系层次构建:电网评审设计指标具有一定的层次关系,将归并后的各个不同的指标之间定义指标层级关系,每个指标和属性之间定义从属关系。
步骤200:人工标注指标:构建专家指标标注系统,使专家对少量(约200份)电网设计评审报告进行人工标注。如图4所示,用户人工标注指标包括如下步骤:
步骤210:构建专家指标标注系统:构建一个满足电网评审专家对电网设计报告指标标注的交互式人工标注系统。
步骤220:人工标注系统的指标体系构建:根据已构建完成的指标体系,针对人工标注按照层次查找、后标注属性的习惯,构建符合人工标注系统的标注指标体系。
步骤230:人工标注获取训练样例:专家在人工标注系统上对少量电网设计报告指标进行标注,得到电网设计指标体系下每个指标的取值和位置信息作为训练样例。
步骤300:对评审报告进行序列标注:对评审报告进行序列标注:构建电网评审设计报告标注工具,对电网评审设计报告进行专家人工标注的结果转换为序列标注形式,采用序列标注方法学习指标和特征的对应关系,对未经人工标注的文档进行自动化标注。如图5所示,对评审报告进行序列标注包括如下步骤:
步骤310:获取序列标注格式文本:将评审报告进行格式转换成序列标注格式。
步骤320:对评审报告进行特征抽取:针对电网评审设计指标体系,根据不同类别指标特点分别选取特征,以提高序列标注方法的效果。对评审报告进行特征抽取中包括如下步骤:
1.步骤321:通用特征抽取:对每一个字符抽取其上下文、词性、所属字词等通用特征进行抽取。
2.步骤322:电网行业词典特征抽取:构建电网设计工程行业词典,对评审报告中的词典内词语进行特征抽取。
3.步骤323:规则特征抽取:根据指标常出现的特点,人工定义规则模版,对符合这些规则模版的文本片段进行特征抽取。
步骤330:获取序列标注模型:利用人工标注完成的训练样例和特征抽取步骤获取的特征,按照指标体系分类,采用序列标注方法进行训练,得到序列标注模型。
步骤340:获取序列标注结果:对评审报告根据序列模型对序列标注格式的评审报告进行序列标注,得到初步序列标注结果。
步骤400:指标后处理:将序列标注结果转换为人工标注一致的的格式,将序列标注方法应用于电网评审设计报告时产生的一些边界性问题进行规则修正。如图6所示,指标后处理包括如下步骤:
步骤410:序列标注标号修复:对初步序列标注结果采用规则方法修正断裂和混乱的序列标号,得到标号修复后的序列标注结果。
步骤420:句子型指标重标注:根据句子型指标标注的证据结果,重定位到指标句子上,对标号修复后的序列标注结果中句子型指标进行重新标注,得到重标注修复后的序列标注结果。
步骤430:获取指标值:将重标注修复后的序列标注结果转换成人工标注一致的指标格式,得到电网设计指标值。
下面结合具体实例说明本发明方法的具体流程及其效果。
通过以下文本片段为例说明步骤100指标体系构建步骤的实施效果:
“电气一次系统
根据接入系统方案结果,解口220kV龙门站至110kV下桥站110kV线路接入110kV英利站,形成110kV英利站至220kV龙门站1回、110kV英利站至110kV下桥站1回。
110kV英利站最终规模按3台40MVA主变压器考虑,分期建设,本期先上2台。
110kV出线终期为4回,本期上2回(其中1回线路由110kV下桥输变电工程建设),采用架空出线,向西面方向出线;10kV出线终期为24回,本期上16回,采用电缆出线;10kV无功补偿终期为3×2×4008kVar电容器组,本期先上2×2×2004kVar。
……
电气总平面
水平接地体采用-50×5的热镀锌扁钢,垂直接地极采用63×63×6mm的热镀锌角钢。”
根据指标体系构建步骤,观察指标类型,按照同类指标归并、同类指标相同属性归并的原则进行步骤110指标属性归并。归并结果分别如下表1-3所示:
步骤111指标归并:
指标 指标类型 上级指标
主变数量 数值型 主变
主变容量 数值型 主变
出线规模 数值型 建设规模
无功补偿数量 数值型 无功补偿
无功补偿容量 短语型 无功补偿
接地材质 句子型 接地
表1
步骤112属性归并:
属性 属性取值范围 对应指标类型
工期 本期、终期 主变数量、出线回路、无功补偿
电压 10kV、110kV 出线
表2
步骤120指标体系层次构建:
表3
根据步骤200人工标注指标方法,对文章进行标注:
步骤210构建专家指标标注系统,系统能够满足电网评审专家对电网设计报告指标标注的交互式人工标注的需求,能够标注出指标的内容、指标的类型、指标对应的属性值、指标属性的类型、指标内容所在文本的偏移量(位置),指标对应属性值所在文本的偏移量(位置)。
步骤220采用人工标注工具获取标注结果如表4所示:
表4
根据步骤300对评审报告进行序列标注:
步骤310获取序列标注格式文本,以单句“110kV英利站最终规模按3台40MVA主变压器考虑,分期建设,本期先上2台。”为例,得到如下结果(其中“_B”、“_L”、“_I”、“_S”分别表示每个标注的起始、末尾、中间、单字):
“110/电压_BkV/电压_L英/O利/O站/O最/工期_B终/工期_L规/O模/O按/O3/主变数量_S台/O40/主变容量_SMVA/O主/O变/O压/O器/O考/O虑/O,/O分/O期/O建/O设/O,/O本/工期_L期/工期_L先/O上/O2/主变数量_S台/O。/O”。
步骤320对评审报告进行特征抽取:
步骤321通用特征抽取,以单句“110kV英利站最终规模按3台40MVA主变压器考虑,分期建设,本期先上2台。”的词性标注特征为例,得到如下结果:
“110kV/ws英利站/n最终/d规模/d按/p3/m台/q40MVA/ws主变/n压器/n考虑/v,/wp分期/d建设/v,/wp本期/r先/d上/v2/m台/q。/wp”
步骤322电网行业词典特征抽取,得到如下特征:
“110kV/O英利站/O最终/O规模/O按/O3/O台/O40/OMVA/NE主变压器/NE考虑/O,/O分期/O建设/O,/O本期/NE先/O上/O2/O台/O。/O”
步骤323规则特征抽取,得到如下特征,其中“DY”表示电压、“GQ”表示工期、“ZD”表示站点、“NUM”表示数值、“DW”表示单位:
“110kV/DY英利站/ZD最终/GQ规模/O按/O3/NUM台/DW40/NUMMVA/DW主变/ZB压器/O考虑/O,/O分期/O建设/O,本期/GQ先/O上/O2/NUM台/DW。/O”
步骤230获取序列标注模型,对序列标注格式文本和抽取得到的特征采用序列标注训练算法进行训练,得到序列标注模型。
步骤340获取序列标注结果步骤,根据获取的序列标注模型和序列标注测试算法,对评审报告根据序列模型对任意待抽取(即未经人工标注的)指标的序列标注格式的评审报告进行序列标注,得到初步序列标注结果。该结果的格式和序列标注格式相同。如输入:
“110/OkV/O英/O利/O站/O最/O终/O规/O模/O按/O3/O台/O40/OMVA/O主/O变/O压/O器/O考/O虑/O,/O分/O期/O建/O设/O,/O本/O期/O先/O上/O2/O台/O。/O”
得到:
“110/电压_BkV/电压_L英/O利/O站/O最/工期_B终/工期_L规/O模/O按/O3/主变数量_S台/O40/主变容量_SMVA/O主/O变/O压/O器/O考/O虑/O,/O分/O期/O建/O设/O,/O本/工期_L期/工期_L先/O上/O2/主变数量_S台/O。/O”
步骤400指标后处理步骤,该步骤修复如下问题:
步骤410序列标注标号修复:序列标号出现断裂和混乱的问题。若模型标注出的序列实体出现了标号不连贯的现象,例如,一个实体_B_I_I_I_I_L被识别成了_B_I_L_O_I_L。在后处理使用了一系列规则去修正这一问题。主要基于以下3个规则:
(1)一个句子中(已经断句,句子之间用空行分割),标号出现单个_I,将_I转为_O;
(2)一个句子中,多个_I出现(连续或不连续)或出现_B但未出现L,将这个句子标注为一个实体;
(3)一个句子中,出现_B和_L,例如_B_I…_O…_I_L将_O转为_I,即取_B和_L之间。
将该词所在的分词结果加入到特征中有助于解决此类问题的出现。例如在分词后的句子“架空线路采用2根OPGW光缆。”,“架”字的分词特征为POS_B,“空”字的分词特征为POS_I,“线”字的分词特征为POS_I,“路”字的分词特征为POS_L。
步骤420句子型指标重标注,对于句子型指标“系统继电保护及安全自动装置—安全自动装置”的某个描述“一套安稳装置,本期主要完成就地控制功能,装置具有低频低压自动切负荷、满载告警、过载自动切负荷等功能,并预留通信接口”。若仅标注其中的“安稳装置”、“自动切负荷”、“满载告警”、“通信接口”等,可自动修复成整个句子。
步骤430获取指标值步骤,将序列标注格式文档转换成指标值。如输入:
“110/电压_BkV/电压_L英/O利/O站/O最/工期_B终/工期_L规/O模/O按/O3/主变数量_S台/O40/主变容量_SMVA/O主/O变/O压/O器/O考/O虑/O,/O分/O期/O建/O设/O,/O本/工期_L期/工期_L先/O上/O2/主变数量_S台/O。/O”
最后输出如表5所示:
指标/属性 指标/属性值
电压 110kV
工期 最终
主变数量 3
主变容量 40
工期 本期
主变数量 2
表5
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种基于序列标注的电网设计评审报告抽取方法,其特征在于,包括如下步骤:
指标体系构建:根据电网评审设计指标列表和指标类型,重新构建指标体系,以适应专家人工标注和系统自动标注;
人工标注指标:构建专家指标标注系统,使专家对少量电网设计评审报告进行人工标注;
对评审报告进行序列标注:构建电网评审设计报告标注工具,对电网评审设计报告进行专家人工标注的结果转换为序列标注形式,采用序列标注方法学习指标和特征的对应关系,对未经人工标注的文档进行自动化标注;对评审报告进行特征抽取提高序列标注效果;
指标后处理:将序列标注结果转换为人工标注一致的格式,将序列标注方法应用于电网评审设计报告时产生的边界性问题进行规则修正。
2.根据权利要求1所述的方法,其特征在于:所述指标体系构建包括如下步骤:
指标和属性归并:对电网评审设计指标的类型按照同类指标归并、同类指标相同属性归并的原则进行归并;
指标体系层次构建:将归并后的各个不同的指标之间定义指标层级关系,每个指标和属性之间定义从属关系。
3.根据权利要求1所述的方法,其特征在于:所述人工标注指标包括如下步骤:
人工标注系统构建:构建一个满足电网评审专家对电网设计报告指标标注的交互式人工标注系统;
人工标注系统的指标体系构建:根据已构建完成的指标体系,针对人工标注按照层次查找、后标注属性的习惯,构建符合人工标注系统的标注指标体系;
人工标注获取训练样例:专家在人工标注系统上对少量电网设计报告指标进行标注,得到电网设计指标体系下每个指标的取值和位置信息作为训练样例。
4.根据权利要求1所述的方法,其特征在于:所述对评审报告进行序列标注包括如下步骤:
获取序列标注格式文本:将评审报告进行格式转换成序列标注格式;
对评审报告进行特征抽取:针对电网评审设计指标体系,根据不同类别指标特点分别选取特征,以提高序列标注方法的效果;
获取序列标注模型:利用人工标注完成的训练样例和特征抽取步骤获取的特征,按照指标体系分类,采用序列标注方法进行训练,得到序列标注模型。
5.根据权利要求4所述的方法,其特征在于:所述对评审报告进行特征抽取包括如下步骤:
通用特征抽取:对每一个字符的通用特征进行抽取;
电网行业词典特征抽取:构建电网设计工程行业词典,对评审报告中的词典内词语进行特征抽取;
规则特征抽取:根据指标常出现的特点,人工定义规则模版,对符合这些规则模版的文本片段进行特征抽取;
获取序列标注结果:对评审报告根据序列模型对序列标注格式的评审报告进行序列标注,得到初步序列标注结果。
6.根据权利要求1所述的方法,其特征在于:所述指标后处理包括如下步骤:
序列标注标号修复:对初步序列标注结果采用规则方法修正断裂和混乱的序列标号,得到标号修复后的序列标注结果;
句子型指标重标注:根据句子型指标标注的证据结果,重定位到指标句子上,对标号修复后的序列标注结果中句子型指标进行重新标注,得到重标注修复后的序列标注结果;
获取指标值:将重标注修复后的序列标注结果转换成人工标注一致的指标格式,得到电网设计指标值。
7.根据权利要求1所述的选择方法,其特征在于:所述专家对电网设计评审报告进行人工标注的数量为约200份。
8.根据权利要求2所述的选择方法,其特征在于:所述电网评审设计指标的类型包括数值型、句子型。
9.根据权利要求5所述的选择方法,其特征在于:所述通用特征包括上下文、词性、所属字词。
CN201510679783.5A 2015-10-19 2015-10-19 一种基于序列标注的电网设计指标抽取方法 Pending CN105184514A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510679783.5A CN105184514A (zh) 2015-10-19 2015-10-19 一种基于序列标注的电网设计指标抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510679783.5A CN105184514A (zh) 2015-10-19 2015-10-19 一种基于序列标注的电网设计指标抽取方法

Publications (1)

Publication Number Publication Date
CN105184514A true CN105184514A (zh) 2015-12-23

Family

ID=54906577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510679783.5A Pending CN105184514A (zh) 2015-10-19 2015-10-19 一种基于序列标注的电网设计指标抽取方法

Country Status (1)

Country Link
CN (1) CN105184514A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975449A (zh) * 2016-04-27 2016-09-28 中国南方电网有限责任公司 电力企业技术标准差异化检测方法
CN106484920A (zh) * 2016-11-21 2017-03-08 北京恒华伟业科技股份有限公司 一种评审文档指标的抽取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987869A (zh) * 2005-12-20 2007-06-27 鸿富锦精密工业(深圳)有限公司 尺寸号码自动标注系统及方法
EP2657866A1 (en) * 2012-04-24 2013-10-30 Koninklijke Philips N.V. Creating a radiology report
CN103593334A (zh) * 2012-08-15 2014-02-19 中国电信股份有限公司 一种用于判断文本情感程度的方法和系统
CN103914440A (zh) * 2014-03-06 2014-07-09 广东电网公司电网规划研究中心 输变电工程word文档表格内容中工程特性指标的智能提取方法
CN104881488A (zh) * 2015-06-05 2015-09-02 焦点科技股份有限公司 基于关系表的可配置信息抽取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987869A (zh) * 2005-12-20 2007-06-27 鸿富锦精密工业(深圳)有限公司 尺寸号码自动标注系统及方法
EP2657866A1 (en) * 2012-04-24 2013-10-30 Koninklijke Philips N.V. Creating a radiology report
CN103593334A (zh) * 2012-08-15 2014-02-19 中国电信股份有限公司 一种用于判断文本情感程度的方法和系统
CN103914440A (zh) * 2014-03-06 2014-07-09 广东电网公司电网规划研究中心 输变电工程word文档表格内容中工程特性指标的智能提取方法
CN104881488A (zh) * 2015-06-05 2015-09-02 焦点科技股份有限公司 基于关系表的可配置信息抽取方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975449A (zh) * 2016-04-27 2016-09-28 中国南方电网有限责任公司 电力企业技术标准差异化检测方法
CN105975449B (zh) * 2016-04-27 2019-03-22 中国南方电网有限责任公司 电力企业技术标准差异化检测方法
CN106484920A (zh) * 2016-11-21 2017-03-08 北京恒华伟业科技股份有限公司 一种评审文档指标的抽取方法

Similar Documents

Publication Publication Date Title
CN104820629B (zh) 一种智能的舆情突发事件应急处理系统及方法
CN107798435A (zh) 一种基于文本信息抽取的电力物资需求预测方法
CN107908671A (zh) 基于法律数据的知识图谱构建方法及系统
CN103886080B (zh) 一种从互联网非结构化文本提取道路交通信息方法
CN110472235A (zh) 一种面向中文文本的端到端实体关系联合抽取方法
CN108470282A (zh) 客户服务中心投诉工单智能分类方法
CN107169079A (zh) 一种基于Deepdive的领域文本知识抽取方法
CN112241623B (zh) 一种接触网施工技术文档内容自动生成装置及方法
CN106250934A (zh) 一种缺陷数据的分类方法及装置
CN105630772A (zh) 一种网页评论内容的抽取方法
CN105389302B (zh) 一种电网设计评审指标结构信息识别方法
CN105184514A (zh) 一种基于序列标注的电网设计指标抽取方法
CN109800435A (zh) 一种语言模型的训练方法及装置
CN111177323B (zh) 基于人工智能的停电计划非结构化数据提取与识别方法
CN107590229A (zh) 一种构建学习资源多标签标注模型的方法
CN113761927B (zh) 电网故障处置实时辅助决策方法、系统、设备及存储介质
CN110232121A (zh) 一种基于语义网的管制指令分类方法
CN112036179B (zh) 基于文本分类与语义框架的电力预案信息抽取方法
CN109684460A (zh) 一种基于深度学习的负面网络舆情指数的计算方法及系统
Lee et al. A study on standardization of the public use of disaster and safety information
CN115310429B (zh) 一种多轮倾听对话模型中的数据压缩与高性能计算方法
CN113673219B (zh) 一种停电计划文本解析方法
CN113157866B (zh) 一种数据分析方法、装置、计算机设备及存储介质
CN114996494A (zh) 图像处理方法、装置、电子设备及存储介质
CN114757191A9 (zh) 基于深度学习的电力舆情领域命名实体识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151223

RJ01 Rejection of invention patent application after publication