CN114757191A - 基于深度学习的电力舆情领域命名实体识别方法系统 - Google Patents

基于深度学习的电力舆情领域命名实体识别方法系统 Download PDF

Info

Publication number
CN114757191A
CN114757191A CN202210319638.6A CN202210319638A CN114757191A CN 114757191 A CN114757191 A CN 114757191A CN 202210319638 A CN202210319638 A CN 202210319638A CN 114757191 A CN114757191 A CN 114757191A
Authority
CN
China
Prior art keywords
data
sequence
public opinion
text
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210319638.6A
Other languages
English (en)
Other versions
CN114757191A9 (zh
CN114757191B (zh
Inventor
朱峰
邹云峰
祝宇楠
刘云鹏
范环宇
张青川
金庆雨
范晓宣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Jiangsu Electric Power Co ltd Marketing Service Center
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co ltd Marketing Service Center, State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Jiangsu Electric Power Co ltd Marketing Service Center
Priority to CN202210319638.6A priority Critical patent/CN114757191B/zh
Publication of CN114757191A publication Critical patent/CN114757191A/zh
Publication of CN114757191A9 publication Critical patent/CN114757191A9/zh
Application granted granted Critical
Publication of CN114757191B publication Critical patent/CN114757191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,整理电力舆情的文本数据,标记出所述文本数据中的实体词;将数据预处理标注为位置索引标注序列;对预处理后的数据进行特征提取;根据数据标注结果抽取新的电力舆情文本数据中的实体词。本发明的位置索引标注方式很好地解决了实体之间交叉包含的问题;结合文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本包含的实体;通过使用CRF层对得到的位置索引序列标签进行约束,大大减少不规则标签出现的概率,从而可以获得较好的实体标签序列。

Description

基于深度学习的电力舆情领域命名实体识别方法系统
技术领域
本发明涉及自然语言处理、实体识别、电力舆情分析领域,更具体地,涉及一种基于深度学习的电力舆情领域命名实体识别方法与系统。
背景技术
作为与国民生活息息相关的电力行业,电价调整、电力供应、电力设施维修、安全生产等一系列问题极易给国有特大型电力企业带来极大的影响,使其迫切需要探索出科学的舆情管理方案,做好舆情危机应对工作。在新媒体不断发展的大环境下,信息传播速度在不断增长,同时也使得舆情危机的爆发呈现出不可控性。而电网企业是非常容易成为舆论攻击点的,因此从电力舆情文本中快速的发现人们的关注点,即数据中的实体词是十分重要的。
命名实体识别(Named Entity Recognition,NER)是自然语言处理的一项基本处理任务,命名实体一般指的是文本中具有特定意义或者指代性的实体,通常包括人名、地名、机构名、日期时间、专有名词等。实体识别还可以根据业务需求识别出更多的实体,例如产品的名称、型号、规格大小等。目前命名实体识别的方法主要包括基于规则的命名实体识别和基于统计的命名实体识别。基于规则的命名实体识别,通过利用构造实体规则模板来过滤实体词的方法,在模板制定过程中,使用标点符号、关键词、指示词等的含有关键特征的字符,并结合预先整理的实体词库,来进行文本中实体词的过滤。但上述方法准确度不高,且需要不断进行模板更新,稳定性欠佳。基于统计的命名实体识别方法主要有隐马尔科夫模型(Hidden Markov Model,HMM)、最大熵模型(Maximum Entropy,ME)、支持向量机(Support Vector Machine,SVM)和条件随机场(Conditional Random Field,CRF)等方法,通过大量的人工标注数据来标注数据语料,通过标注的数据进行训练获得实体标注模型。但该方法需要通过人工选取的方式从大量的文本中选取每条文本中所包含的关注的实体词,人力成本高。此外,上述方法对于文本中存在实体之间相互交叉包含的情况,不能准确地抽取实体词。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供一种本方法实现了一种基于深度学习的电力舆情领域命名实体识别方法与系统,可以自动从文本中标注出包含的实体,并且可以解决标注实体之间相互包含的问题。本发明采用如下的技术方案。本发明通过使用一种基于深度学习的电力舆情领域命名实体识别方法与系统解决上述问题,其技术方案主要包括以下步骤:
S1:整理电力舆情的文本数据,标记出所述文本数据中的实体词;
S2:对整理的数据进行数据预处理,标注为位置索引标注序列;
S3:对预处理后的文本数据进行特征提取;
S4:根据数据标注结果抽取新的电力舆情文本数据中的实体词。
进一步地,所述步骤S1包括:获取电力舆情文本的数据;通过人工标记的方式,标注出每一条文本中所包含的实体词。
进一步地,所述步骤S2包括:
S21:数据清洗:将文本数据中的空格以及特殊的字符去除,并将每一条文本数据进行单个字的拆分;
S22:处理数据格式:将数据清洗后的数据转换成模型输入的格式,将文本数据标注成位置索引标注序列;位置索引标注的方式是将文本中的每个实体的长度标注到实体开始索引的位置,从开始位置向右经过实体长度个字符结束,得到所需要的实体。
进一步地,所述步骤S3包括:
S31:将文本数据拆分成单个字形式,通过使用BERT预训练模型来对电力舆情文本进行特征提取,得到其对应的BERT特征向量;
S32:获得电力舆情文本数据中每个字对应的五笔顺序与偏旁部首,通过使用One-Hot编码将其对应的五笔顺序与偏旁部首进行编码获得编码后的五笔顺序特征向量与偏旁部首特征向量;
S33:将五笔顺序+偏旁部首特征向量与BERT特征向量进行融合,将融合后的特征向量经过线性层得到序列中每个字对应的位置索引标注序列的标签概率;
S34:将最终获得的标签概率输入CRF层中得到最终标注好的位置索引标注序列的标签序列。
进一步地,所述步骤S4包括:通过命名实体识别模型得到的位置索引标注的标签序列;从标签序列中不为0的位置开始,到标示数字大小的长度结束,表示一个实体词从开始到结束的全部,根据这些非0标签的位置从电力舆情文本中提取出所包含的实体词。
本发明还提出一种基于深度学习的电力舆情领域命名实体识别系统,包括:
数据获取模块:整理电力舆情的文本数据,标记出所述文本数据中的实体词;
数据预处理模块:对整理的数据进行数据预处理,标注为位置索引标注序列;
特征提取模块:对预处理后的文本数据进行特征提取;
识别模块:根据数据标注结果抽取新的电力舆情文本数据中的实体词。
本发明还提出一种终端,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据本发明所述方法的步骤。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明所述方法的步骤。
本发明中提出并使用的位置索引标注方式可以很好的解决实体之间交叉包含的问题,在实体抽取结果上,可以提出更多的且更准确的实体词;同时结合文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,可以得到更全的上下文语义特征,并与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本中所包含的实体;通过使用CRF层对得到的位置索引序列标签进行约束,可以避免出现不符合规则的标签数据,大大减少不规则标签出现的概率,从而可以获得较好的实体标签序列。
与现有技术相比,本发明具有以下有益的技术效果:
第一,高效的实体词抽取,通过使用该模型可以快速抽出实体词,从大量的电力舆情文本中标注出每条电力舆情文本所含有的实体词。
第二,节省人工量,通过人工选取的方式从大量的电力舆情文本中选取每条文本中所包含的关注的实体词是非常费事费力的一项工作,通过使用该模型进行电力舆情文本的实体标注可以节省大量的人工工作量,从而降低运营成本。
第三,相互包含实体的抽取,在同一条电力舆情文本中存在实体之间相互交叉包含的情况,该模型考虑到该种情况,可以从中抽取出更为准确的实体词。
第四,稳定性较好,且需要更新时简单易操作。在电力舆情文本没有太大改动的情况下模型可以长期稳定使用,如果有新的类型的实体需要标注,只需要标注一部分训练数据添加到原有的训练数据中重新训练一个实体标注模型出来即可,更新模型也操作简单方便。
附图说明
图1是基于深度学习的命名实体识别方法的基本流程示意图。
图2是本发明基于深度学习的电力舆情领域命名实体识别方法与系统流程图。
图3为本发明所述位置索引标注序列的方法示意图。
图4为本发明所述的文本数据特征提取示意图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
基于深度学习的命名实体识别,通过使用多种神经网络组合的方式来进行命名实体识别。
基于深度学习的命名实体识别方法的基本流程如图1所示。典型的基于深度学习的命名实体识别步骤包括:文本编码,特征提取处理和标签解码。
文本编码,常用的编码结构有卷积神经网络(Convolutional Neural Network,CNN)、递归神经网络(Recursive Neural Network,RNN)和transformer等的神经网络结构。特征提取处理,一般单一的一种神经网络的特征提取结果存在某些缺陷和不足之处,在实际应用过程中使用两种或者更多种的神经网络共同来提取文本的特征。标签解码,将特征向量作为特征标签解码部分的输入来预测相应的标签序列,从而得到最终的标注实体结果。
本发明提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,首先获取电力舆情的文本数据,通过人工标记的方式标注出每条文本数据中的实体词;将电力舆情文本数据进行数据清洗,去除一些无关的特殊字符,例如:网页标签,表情字符等;将文本数据进行位置索引标注序列标注,得到实体模型输入需要的格式;将电力舆情文本通过BERT预训练模型,对其句子序列进行编码,提取其中的语义特征,得到BERT特征向量;获得电力舆情文本数据中每个字对应的五笔顺序与偏旁部首,通过使用One-Hot编码将其对应的五笔顺序与偏旁部首进行编码获得编码后的五笔顺序特征向量与偏旁部首特征向量;将融合后的特征向量经过线性层得到序列中每个字对应的位置索引标注序列的标签概率,最终得到含有位置索引标注的电力舆情文本,根据标注序列得到文本中的实体词。
本发明所述的基于深度学习的电力舆情领域命名实体识别方法与系统主要包括文本数据的获取、数据的预处理、特征向量的提取和实体词的抽取几部分,其流程如图2所示,下面进行具体阐述:
一、文本数据的获取:
本步骤是实体词提取使用的原始数据,数据主要是电力舆情文本数据,对文本数据中包含实体词进行抽取。具体步骤如下:
步骤一:数据获取:根据提供的电力舆情文本数据,进行数据的筛选,进行去重的操作;
步骤二:人工标注:对电力舆情文本数据的训练集部分进行人工标注,标注出文本中包含的实体词。例如:南方电网智能电网发展规划研究报告。其中包含的实体词有“智能电网”和“电网发展规划”。
二、文本数据预处理:
本步骤主要是对电力舆情文本数据进行预处理,并将人工标记的文本中包含的实体词转换成位置索引标注序列,最终将数据格式转为实体模型需要的输入格式,具体步骤如下:
步骤一:数据清洗:将文本数据中的空格以及特殊的字符去除,例如:网页标签字符、表情符号等,并将每一条文本数据进行单个字的拆分。
步骤二:处理数据格式:将数据清洗后的数据转换成模型输入的格式,将文本数据标注成位置索引标注序列。位置索引标注的方式是将文本中的每个实体的长度标注到实体开始索引的位置,从开始位置向右经过实体长度个字符结束,得到所需要的实体。实体开始的索引位置为一个非0的数字,这个数字的大小代表从该索引位置开始向右所经过的字符长度,从索引下标开始到经过长度结束,得到最终的实体结果。不是实体开始的索引位置都标0。具体的数据位置索引标注实例如图3所示。
三、文本数据的特征提取:
本步骤主要是更加准确的提取用户问句中的特征,通过文本对应的五笔顺序、偏旁部首和字本身所含有的语义特征来进行每条文本中的语义特征的提取。将电力舆情文本拆分成单个字的格式,获得文本中每个字的五笔顺序与偏旁部首的特征,通过BiLSTM模型进行特征的提取,可以得到更全的上下文语义特征,并与BERT预训练模型得到的BERT特征相融合,增强了特征向量中语义的表征,可以更好、更准确的抽取文本中所包含的实体,在最后一层中通过使用CRF层来对每一条文本数据进行标注。具体的部门语义信息抽取模型如图4所示。具体步骤如下:
步骤一:将文本数据拆分成单个字形式,通过使用BERT预训练模型来对电力舆情文本进行特征提取,得到其对应的BERT特征向量;
步骤二:获得电力舆情文本数据中每个字对应的五笔顺序与偏旁部首,通过使用One-Hot编码将其对应的五笔顺序与偏旁部首进行编码获得编码后的五笔顺序特征向量与偏旁部首特征向量;
步骤三:将五笔顺序+偏旁部首特征向量与BERT特征向量进行融合,将融合后的特征向量经过线性层得到序列中每个字对应的位置索引标注序列的标签概率;
步骤四:将最终获得的标签概率输入CRF层中得到最终标注好的位置索引标注序列的标签序列。
四、实体词的抽取
根据模型的预测结果,可以得到文本对应的标注好的位置索引标注序列,通过标注的规则从每一条文本中获得抽取出来的实体词。
进一步地,本发明还提出一种基于深度学习的电力舆情领域命名实体识别方法与系统,包括:
数据获取模块:整理电力舆情的文本数据,标记出所述文本数据中的实体词;
数据预处理模块:对整理的数据进行数据预处理,标注为位置索引标注序列;
特征提取模块:对预处理后的文本数据进行特征提取;
识别模块:根据数据标注结果抽取新的电力舆情文本数据中的实体词。
进一步地,本发明还提出一种终端,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据本发明所述基于深度学习的电力舆情领域命名实体识别方法的步骤。
进一步地,本发明还提出计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明所述基于深度学习的电力舆情领域命名实体识别方法的步骤。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims (12)

1.一种基于深度学习的电力舆情领域命名实体识别方法,其特征在于,包括以下步骤:
S1:整理电力舆情的文本数据,标记出所述文本数据中的实体词;
S2:对整理的数据进行数据预处理,标注为位置索引标注序列;
S3:对预处理后的文本数据进行特征提取;
S4:根据数据标注结果抽取新的电力舆情文本数据中的实体词。
2.根据权利要求1所述的基于深度学习的电力舆情领域命名实体识别方法,所述步骤S1包括:获取电力舆情文本的数据;通过人工标记的方式,标注出每一条文本中所包含的实体词。
3.根据权利要求2所述的基于深度学习的电力舆情领域命名实体识别方法,其中所述步骤S2包括:
S21:数据清洗:将文本数据中的空格以及特殊的字符去除,并将每一条文本数据进行单个字的拆分;
S22:处理数据格式:将数据清洗后的数据转换成模型输入的格式,将文本数据标注成位置索引标注序列;位置索引标注的方式是将文本中的每个实体的长度标注到实体开始索引的位置,从开始位置向右经过实体长度个字符结束,得到所需要的实体。
4.根据权利要求1所述的基于深度学习的电力舆情领域命名实体识别方法,其中所述步骤S3包括:
S31:将文本数据拆分成单个字形式,通过使用BERT预训练模型来对电力舆情文本进行特征提取,得到其对应的BERT特征向量;
S32:获得电力舆情文本数据中每个字对应的五笔顺序与偏旁部首,通过使用One-Hot编码将其对应的五笔顺序与偏旁部首进行编码获得编码后的五笔顺序特征向量与偏旁部首特征向量;
S33:将五笔顺序+偏旁部首特征向量与BERT特征向量进行融合,将融合后的特征向量经过线性层得到序列中每个字对应的位置索引标注序列的标签概率;
S34:将最终获得的标签概率输入CRF层中得到最终标注好的位置索引标注序列的标签序列。
5.根据权利要求1所述的基于深度学习的电力舆情领域命名实体识别方法,其中所述步骤S4包括:通过命名实体识别模型得到的位置索引标注的标签序列;从标签序列中不为0的位置开始,到标示数字大小的长度结束,表示一个实体词从开始到结束的全部,根据这些非0标签的位置从电力舆情文本中提取出所包含的实体词。
6.一种基于深度学习的电力舆情领域命名实体识别系统,其特征在于,包括:
数据获取模块:整理电力舆情的文本数据,标记出所述文本数据中的实体词;
数据预处理模块:对整理的数据进行数据预处理,标注为位置索引标注序列;
特征提取模块:对预处理后的文本数据进行特征提取;
识别模块:根据数据标注结果抽取新的电力舆情文本数据中的实体词。
7.根据权利要求6所述的基于深度学习的电力舆情领域命名实体识别系统,所述数据获取模块获取电力舆情文本的数据,通过人工标记的方式,标注出每一条文本中所包含的实体词。
8.根据权利要求7所述的基于深度学习的电力舆情领域命名实体识别系统,其中数据预处理模块将文本数据中的空格以及特殊的字符去除,并将每一条文本数据进行单个字的拆分,将数据清洗后的数据转换成模型输入的格式,将文本数据标注成位置索引标注序列;位置索引标注的方式是将文本中的每个实体的长度标注到实体开始索引的位置,从开始位置向右经过实体长度个字符结束,得到所需要的实体。
9.根据权利要求8所述的基于深度学习的电力舆情领域命名实体识别系统,其中特征提取模块中对预处理后的文本数据进行特征提取包括:
S31:将文本数据拆分成单个字形式,通过使用BERT预训练模型来对电力舆情文本进行特征提取,得到其对应的BERT特征向量;
S32:获得电力舆情文本数据中每个字对应的五笔顺序与偏旁部首,通过使用One-Hot编码将其对应的五笔顺序与偏旁部首进行编码获得编码后的五笔顺序特征向量与偏旁部首特征向量;
S33:将五笔顺序+偏旁部首特征向量与BERT特征向量进行融合,将融合后的特征向量经过线性层得到序列中每个字对应的位置索引标注序列的标签概率;
S34:将最终获得的标签概率输入CRF层中得到最终标注好的位置索引标注序列的标签序列。
10.根据权利要求9所述的一种基于深度学习的电力舆情领域命名实体识别系统,其中识别模块通过命名实体识别模型得到的位置索引标注的标签序列;从标签序列中不为0的位置开始,到标示数字大小的长度结束,表示一个实体词从开始到结束的全部,根据这些非0标签的位置从电力舆情文本中提取出所包含的实体词。
11.一种终端,其特征在于,包括处理器及存储介质;所述存储介质用于存储指令;所述处理器用于根据所述指令进行操作以执行根据权利要求1-5任一项所述方法的步骤。
12.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述方法的步骤。
CN202210319638.6A 2022-03-29 2022-03-29 基于深度学习的电力舆情领域命名实体识别方法及系统 Active CN114757191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210319638.6A CN114757191B (zh) 2022-03-29 2022-03-29 基于深度学习的电力舆情领域命名实体识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210319638.6A CN114757191B (zh) 2022-03-29 2022-03-29 基于深度学习的电力舆情领域命名实体识别方法及系统

Publications (3)

Publication Number Publication Date
CN114757191A true CN114757191A (zh) 2022-07-15
CN114757191A9 CN114757191A9 (zh) 2022-11-01
CN114757191B CN114757191B (zh) 2024-09-17

Family

ID=82327951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210319638.6A Active CN114757191B (zh) 2022-03-29 2022-03-29 基于深度学习的电力舆情领域命名实体识别方法及系统

Country Status (1)

Country Link
CN (1) CN114757191B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227496A (zh) * 2023-05-06 2023-06-06 国网智能电网研究院有限公司 一种基于深度学习的电力舆情实体关系抽取方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190012377A1 (en) * 2017-07-05 2019-01-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating text tag
CN110347898A (zh) * 2019-06-28 2019-10-18 北京牡丹电子集团有限责任公司宁安智慧工程中心 一种网络舆情监控的应答生成方法及系统
CN110705293A (zh) * 2019-08-23 2020-01-17 中国科学院苏州生物医学工程技术研究所 基于预训练语言模型的电子病历文本命名实体识别方法
CN111695346A (zh) * 2020-06-16 2020-09-22 广州商品清算中心股份有限公司 一种提升金融风险防控领域舆情实体识别率的方法
CN111695033A (zh) * 2020-04-29 2020-09-22 平安科技(深圳)有限公司 企业舆情分析方法、装置、电子设备及介质
CN112149421A (zh) * 2020-09-23 2020-12-29 云南师范大学 一种基于bert嵌入的软件编程领域实体识别方法
US20210089594A1 (en) * 2019-09-25 2021-03-25 Microsoft Technology Licensing, Llc Inter-document attention mechanism
US20220092100A1 (en) * 2020-09-18 2022-03-24 Ascender AI LLC Search Engine UI systems and processes

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190012377A1 (en) * 2017-07-05 2019-01-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating text tag
CN110347898A (zh) * 2019-06-28 2019-10-18 北京牡丹电子集团有限责任公司宁安智慧工程中心 一种网络舆情监控的应答生成方法及系统
CN110705293A (zh) * 2019-08-23 2020-01-17 中国科学院苏州生物医学工程技术研究所 基于预训练语言模型的电子病历文本命名实体识别方法
US20210089594A1 (en) * 2019-09-25 2021-03-25 Microsoft Technology Licensing, Llc Inter-document attention mechanism
CN111695033A (zh) * 2020-04-29 2020-09-22 平安科技(深圳)有限公司 企业舆情分析方法、装置、电子设备及介质
WO2021217843A1 (zh) * 2020-04-29 2021-11-04 平安科技(深圳)有限公司 企业舆情分析方法、装置、电子设备及介质
CN111695346A (zh) * 2020-06-16 2020-09-22 广州商品清算中心股份有限公司 一种提升金融风险防控领域舆情实体识别率的方法
US20220092100A1 (en) * 2020-09-18 2022-03-24 Ascender AI LLC Search Engine UI systems and processes
CN112149421A (zh) * 2020-09-23 2020-12-29 云南师范大学 一种基于bert嵌入的软件编程领域实体识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张晓;李业刚;王栋;史树敏;: "基于ERNIE的命名实体识别", 智能计算机与应用, no. 03, 1 March 2020 (2020-03-01) *
罗凌;杨志豪;宋雅文;李楠;林鸿飞;: "基于笔画ELMo和多任务学习的中文电子病历命名实体识别研究", 计算机学报, no. 10, 15 October 2020 (2020-10-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227496A (zh) * 2023-05-06 2023-06-06 国网智能电网研究院有限公司 一种基于深度学习的电力舆情实体关系抽取方法及系统
CN116227496B (zh) * 2023-05-06 2023-07-14 国网智能电网研究院有限公司 一种基于深度学习的电力舆情实体关系抽取方法及系统

Also Published As

Publication number Publication date
CN114757191A9 (zh) 2022-11-01
CN114757191B (zh) 2024-09-17

Similar Documents

Publication Publication Date Title
CN109857990B (zh) 一种基于文档结构与深度学习的金融类公告信息抽取方法
CN110110054B (zh) 一种基于深度学习的从非结构化文本中获取问答对的方法
CN109284400B (zh) 一种基于Lattice LSTM和语言模型的命名实体识别方法
CN111783399B (zh) 一种法律裁判文书信息抽取方法
CN110929149B (zh) 一种工业设备故障维修推荐方法和系统
CN112101028A (zh) 一种多特征双向门控领域专家实体抽取方法及系统
CN111680154B (zh) 一种基于深度学习的评论文本属性级情感分析方法
CN111274804A (zh) 基于命名实体识别的案件信息提取方法
CN114580424B (zh) 一种用于法律文书的命名实体识别的标注方法和装置
CN112036179B (zh) 基于文本分类与语义框架的电力预案信息抽取方法
CN114153978A (zh) 模型训练方法、信息抽取方法、装置、设备及存储介质
CN111967267A (zh) 一种基于XLNet的新闻文本地域提取的方法及系统
CN109446523A (zh) 基于BiLSTM和条件随机场的实体属性抽取模型
CN116737922A (zh) 一种游客在线评论细粒度情感分析方法和系统
CN114757191B (zh) 基于深度学习的电力舆情领域命名实体识别方法及系统
CN115098673A (zh) 基于变体注意力及层次结构的业务文书信息抽取方法
CN113836315A (zh) 一种电力标准知识抽取系统
CN117131856A (zh) 一种基于问题引导的交通事故文本因果关系抽取方法
CN115270774B (zh) 一种半监督学习的大数据关键词词典构建方法
CN115408506B (zh) 联合语义解析和语义成分匹配的nl2sql的方法
CN114186565B (zh) 一种it运维服务领域用户语义解析方法
CN116049437A (zh) 基于自标签与prompt的文档级低资源场景的要素抽取方法
CN113505207B (zh) 一种金融舆情研报的机器阅读理解方法及系统
CN115062615A (zh) 一种金融领域事件抽取方法和装置
CN116306506A (zh) 一种基于内容识别的智能邮件模板方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CI02 Correction of invention patent application
CI02 Correction of invention patent application

Correction item: Denomination of Invention|Description

Correct: Named entity recognition method and system in electric power public opinion field based on deep learning|correct

False: Named entity recognition method system of electric power public opinion field based on deep learning|error

Number: 28-02

Page: ??

Volume: 38

Correction item: Denomination of Invention

Correct: Named entity recognition method and system in electric power public opinion field based on deep learning

False: Named entity recognition method system of electric power public opinion field based on deep learning

Number: 28-02

Volume: 38

GR01 Patent grant
GR01 Patent grant