CN112182205A - 一种利用文字识别识别电气设备中监测数据的处理方法 - Google Patents
一种利用文字识别识别电气设备中监测数据的处理方法 Download PDFInfo
- Publication number
- CN112182205A CN112182205A CN202010860366.1A CN202010860366A CN112182205A CN 112182205 A CN112182205 A CN 112182205A CN 202010860366 A CN202010860366 A CN 202010860366A CN 112182205 A CN112182205 A CN 112182205A
- Authority
- CN
- China
- Prior art keywords
- text
- fault
- classification
- layer
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000012544 monitoring process Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000013145 classification model Methods 0.000 claims abstract description 16
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 230000002457 bidirectional effect Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000007547 defect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000012423 maintenance Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种利用文字识别识别电气设备中监测数据的处理方法,其包括如下步骤:建立故障文本空间向量模型,进行文本特征提取;机器学习算法应用,采用机器学习建立分类模型,将电气设备故障文本分类;采用DA‑BiLSTM分类模型进行故障文本识别;本发明利用OCR技术实现了自动识别文本记录的故障数据,可以为电力系统故障文本分类提供了有力支撑,不仅能够提高故障文本分类的准确率,而且减少了人工分类的成本。
Description
技术领域
本发明涉及一种利用文字识别识别电气设备中监测数据的处理方法。
背景技术
电力系统的复杂性与日俱增,电气设备的故障信息也正在以前所未有的速度增长,并且这些故障数据呈现出多元化的发展方向。原来都是通过人工的方式对故障进行记录,但是这种方式记录速度非常慢,无法满足当前信息快速增长下对故障的记录需求,目前对设备故障记录方式有文本、图片、视频、音频等口,其中文本记录为故障数据的主要记录方式,这些数据中往往记录着电气设备中隐藏的重要故障,而这些故障不易被发现又对设备及其重要。因此,对这些文本故障信息进行快速有效的识别分类非常困难。
发明内容
本发明所要解决的技术问题是提供一种利用文字识别识别电气设备中监测数据的处理方法,可以实现检测数据的自动识别,减少人工分类成本。
本发明所采用的技术方案是:一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于其包括如下步骤:
建立故障文本空间向量模型,进行文本特征提取;
机器学习算法应用,采用机器学习建立分类模型,将电气设备故障文本分类;
采用DA-BiLSTM分类模型进行故障文本识别。
进一步的,建立故障文本空间向量模型时,首先分析电气设备故障文本特点,根据特点选择文本预处理方法,然后对预处理后的文本进行特征提取。
进一步的,所述文本预处理方法包括分词、去除停用词。
进一步的,在对文本进行特征提取时,采用卡方统计量、互信息法以及MCHI方法。
进一步的,机器学习算法应用过程中,首先对故障数据进行人工筛选,将存在明显误差、稀疏的故障数据去除,然后将处理后的数据按照预处理流程进行筛选,分别应用到支持向量机、k-最近邻、Logistic回归、Gradicnt Boosting、朴素贝叶斯机器学习分类模型中,对文本进行分类。
进一步的,在对文本分类之前,对模型进行预定义分类评估指标,根据电力设备缺陷的分类标准,将电力系统故障评估分为一般、重要、紧急3个等级。
进一步的,采用DA-BiLSTM分类模型进行故障文本识别的具体方法为:
语映射为一组向量实现对文本的分类;
DA-BiLSTM模型是将深层注意力机制和双层双向LSTM模型融合,能判断重要文本信息并进行分类,DA-BiLSTM模型结构包含嵌入层、双向LSTM层、注意力层和输出层;
嵌入层:该层的输入是由一组文本序列组成的故障文本信息,将不同的文本序列Y={y1,y2,...,yn}映射到文本词向量空间RE;其中,E是嵌入层的长度,n是文本中词的个数;
BiLSTM层:LSTM将文本词向量作为输入,隐藏状态H=(h1,h2,...ht)是对词向量的注释;其中,ht是LSTM在时间步骤t的隐藏状态,总结从y1到yt所有词向量的信息;BiLSTM从前后两个方向获得词向量信息,BiLSTM模型包括前向LSTMf和后向LSTMf,前向LSTMF读取y1到yn向量,后向LSTMf读取yn到y1向量,并从两个方向上的向量注释获得最终向量表示:
注意力层:所有词向量对文本分类贡献率是不同的,注意力机制可以判断不同词向量的重要程度。该过程能基于隐藏状态ht而获得注意力权重a;特征向量s可以由当前状态ht和前面的状态ht-1得出。
输出层:s作为特征向量进行分类,并将分类结果反馈到最终连接的sofmax分类器层,该层输出所有类的概率分布。
本发明的积极效果为:
本发明利用OCR技术实现了自动识别文本记录的故障数据,可以为电力系统故障文本分类提供了有力支撑,不仅能够提高故障文本分类的准确率,而且减少了人工分类的成本。
附图说明
图1为本发明方法流程图;
图2为本发明算法分词步骤图;
图3为本发明DA-BiLSTM分类模型训练过程。
具体实施方式
如附图1所示,本发明的处理方法包括:
S01:故障文本空间向量模型建立。主要从三个方面对空间向量模型进行建立。首先分析电气设备故障文本特点,根据特点选择文本预处理的方法,预处理包括分词、去除停用词等,分词步骤如附图2。
一般情况下,为了增强数据的可用性,提高分类模型的准确度,首先要对收集的故障文本进行人工处理,如①对于纯文文本档的处理,需要清除文档中的某些标记、图画、视频、音频等,减少噪声污染;②中文文本需要经过分词、去停用词和字典中未登录词的处理;③剔除意义不大的噪声文本。接着对人工处理后的文本采用HMM方法进行分词预处理。
使复杂的文本变为可以划分特征项的相对简单的文本,接着对预处理后的文本进行特征提取,使用3种特征提取方法,分别为:卡方统计量、互信息法和MCHI方法,MCHI法是通过卡方统计量和互信息法融合而来,有效改进了这两种方法的缺陷,提高了特征提取准确率,最后对文本分类流程和分类评价指标进行描述。
S02:机器学习算法应用。首先对这些故障数据进行人工筛选,将存在明显误差的、稀疏的故障数据全部去除,降低噪音数据的干扰,然后将处理后的數据按照预处理流程进行筛选,特征提取是技术的关键,使用3种提取方法,包括CHI、MI、MCHI,分别应用到支持向量机、k-最近邻、Logistic回归、Gradicnt Boosting.朴素贝叶斯这5种经典的机器学习分类模型中。在对文本分类之前,所有模型都必须预定义分类评估指标。根据电力设备缺陷的分类标准,电力系统故障评估-.般被描述为3个等级“一般”、“重要”、“紧急”,基本上总结了故障的严重程度。MCHI方法不仅保留了CHI法和MI法的优点,还减少了CHI法没有统计特征项频数的缺点和MI法没有测量特征项本身频度的缺点,从而可有效识别权重较大的词汇。
S03:采用DA-BiLSTM分类模型进行故障文本识别。
采用机器学习模型对文本进行分类时,如果建立的文本词向量集合维度很高,分类模型的参数调节、训练时长等都会导致文本特征提取的准确率较差,从而影响最终分类结果。而深度学习模型不需要对文本进行特征提取,擅长解决词向量维度过高问题。深度学习的分类评价指标与传统的机器学习分类指标相同,由召回率、正确率和F-测度值表示。深度学习分类模型的过程首先需要收集电力缺陷文本,然后对缺陷文本进行分词、词向量训练,最后构建DA-BiLSTM模型对缺陷文本分类,其过程如图3所示。
语映射为一组向量实现对文本的分类;
DA-BiLSTM模型是将深层注意力机制和双层双向LSTM模型融合,能判断重要文本信息并进行分类,DA-BiLSTM模型结构包含嵌入层、双向LSTM层、注意力层和输出层;
嵌入层:该层的输入是由一组文本序列组成的故障文本信息,将不同的文本序列Y={y1,y2,...,yn}映射到文本词向量空间RE;其中,E是嵌入层的长度,n是文本中词的个数;
BiLSTM层:LSTM将文本词向量作为输入,隐藏状态H=(h1,h2,...ht)是对词向量的注释;其中,ht是LSTM在时间步骤t的隐藏状态,总结从y1到yt所有词向量的信息;BiLSTM从前后两个方向获得词向量信息,BiLSTM模型包括前向LSTMf和后向LSTMf,前向LSTMF读取y1到yn向量,后向LSTMf读取yn到y1向量,并从两个方向上的向量注释获得最终向量表示:
注意力层:所有词向量对文本分类贡献率是不同的,注意力机制可以判断不同词向量的重要程度。该过程能基于隐藏状态ht而获得注意力权重a;特征向量s可以由当前状态ht和前面的状态ht-1得出。
输出层:s作为特征向量进行分类,并将分类结果反馈到最终连接的sofmax分类器层,该层输出所有类的概率分布。
提出一种融合深层注意力机制的双层双向LSTM模型。双向LSTM图在隐藏层保存2个值,一个参与正向计算,一个参与反向计算,最终的输出值由2个计算过程决定,这就可以将上下文信息有效关联在一起,从而获得更全面、更准确的文本信息。双层LSTMI通过将一个句子分割为几部分,对于每部分都使用双向LSTM结合注意力机制将小句子映射为一个向量,然后对于映射得到的一组序列向量,我们再通过一层双向LSTM结合注意力机制将词语映射为--组向量实现对文本的分类。DA-BiLSTM模型是将深层注意力机制和双层双向LSTM模型融合,能判断重要文本信息并进行分类.DA-BiLSTM模型结构包含嵌入层、双向LSTM层、注意力层和输出层。
电气设备故障识别一般分为两种,一种是故障发生后对故障进行记录分析,另一种是定期对设备进行检查,对检查状况进行记录识别。第一种方法无论对电气设备还是用户部会造成很大的利益损失,而第二种方法会在故障发生之前识别出来,对电气设备进行了强有力的保护,预防重大事故的发生,也不会给用户带来不便。因此,电力产业公司一般采用第二种故障识别的方法,对电气设备进行有效维护以及对故障进行及时预测识别。电力系统的故障文本中记录了设备整个生命周期各个阶段的缺陷等数据,为了深入研究电力系统故障文本的应用价值,以电力变压器运维环节中的故障文本为例,其记录了变压器设备中不同组件或部位运行时的故障数据,以及变压器的健康状况、运行效果、在维护环节中某个部件出现的差错记录或设备维修后对系统的影响等,这些故障文本大多是短文本形式,其中夹杂着大量的数字、符号和字母,这些记录的内容能对电力系统可靠性分析提供重要的参考价值。但是,由于文本内容具有难切分、有歧义等特点,对故障文本的挖掘带来很大影响,从而影响了文本分类的准确性口。随着一种利用文字识别识别电气设备中监测数据的处理方法的应用,可以为电力系统故障文本分类提供了有力支撑,不仅能够提高故障文本分类的准确率,而且减少了人工分类的成本。
Claims (7)
1.一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于其包括如下步骤:
建立故障文本空间向量模型,进行文本特征提取;
机器学习算法应用,采用机器学习建立分类模型,将电气设备故障文本分类;
采用DA-BiLSTM分类模型进行故障文本识别。
2.根据权利要求1所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于建立故障文本空间向量模型时,首先分析电气设备故障文本特点,根据特点选择文本预处理方法,然后对预处理后的文本进行特征提取。
3.根据权利要求2所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于所述文本预处理方法包括分词、去除停用词。
4.根据权利要求2所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于在对文本进行特征提取时,采用卡方统计量、互信息法以及MCHI方法。
5.根据权利要求1所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于机器学习算法应用过程中,首先对故障数据进行人工筛选,将存在明显误差、稀疏的故障数据去除,然后将处理后的数据按照预处理流程进行筛选,分别应用到支持向量机、k-最近邻、Logistic回归、Gradicnt Boosting、朴素贝叶斯机器学习分类模型中,对文本进行分类。
6.根据权利要求5所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于在对文本分类之前,对模型进行预定义分类评估指标,根据电力设备缺陷的分类标准,将电力系统故障评估分为一般、重要、紧急3个等级。
7.根据权利要求1所述的一种利用文字识别识别电气设备中监测数据的处理方法,其特征在于采用DA-BiLSTM分类模型进行故障文本识别的具体方法为:
语映射为一组向量实现对文本的分类;
DA-BiLSTM模型是将深层注意力机制和双层双向LSTM模型融合,能判断重要文本信息并进行分类,DA-BiLSTM模型结构包含嵌入层、双向LSTM层、注意力层和输出层;
嵌入层:该层的输入是由一组文本序列组成的故障文本信息,将不同的文本序列Y={y1,y2,...,yn}映射到文本词向量空间RE;其中,E是嵌入层的长度,n是文本中词的个数;
BiLSTM层:LSTM将文本词向量作为输入,隐藏状态H=(h1,h2,...ht)是对词向量的注释;其中,ht是LSTM在时间步骤t的隐藏状态,总结从y1到yt所有词向量的信息;BiLSTM从前后两个方向获得词向量信息,BiLSTM模型包括前向LSTMf和后向LSTMf,前向LSTMF读取y1到yn向量,后向LSTMf读取yn到y1向量,并从两个方向上的向量注释获得最终向量表示:
注意力层:所有词向量对文本分类贡献率是不同的,注意力机制可以判断不同词向量的重要程度;该过程能基于隐藏状态ht而获得注意力权重a;特征向量s可以由当前状态ht和前面的状态ht-1得出;
输出层:s作为特征向量进行分类,并将分类结果反馈到最终连接的sofmax分类器层,该层输出所有类的概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010860366.1A CN112182205A (zh) | 2020-08-24 | 2020-08-24 | 一种利用文字识别识别电气设备中监测数据的处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010860366.1A CN112182205A (zh) | 2020-08-24 | 2020-08-24 | 一种利用文字识别识别电气设备中监测数据的处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112182205A true CN112182205A (zh) | 2021-01-05 |
Family
ID=73925435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010860366.1A Pending CN112182205A (zh) | 2020-08-24 | 2020-08-24 | 一种利用文字识别识别电气设备中监测数据的处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182205A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113157889A (zh) * | 2021-04-21 | 2021-07-23 | 韶鼎人工智能科技有限公司 | 一种基于主题损失的视觉问答模型构建方法 |
CN113191074A (zh) * | 2021-04-13 | 2021-07-30 | 北京中大科慧科技发展有限公司 | 一种用于数据中心的机房供电参数检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363810A (zh) * | 2018-03-09 | 2018-08-03 | 南京工业大学 | 一种文本分类方法及装置 |
CN109740164A (zh) * | 2019-01-09 | 2019-05-10 | 国网浙江省电力有限公司舟山供电公司 | 基于深度语义匹配的电力缺陷等级识别方法 |
CN110232395A (zh) * | 2019-03-01 | 2019-09-13 | 国网河南省电力公司电力科学研究院 | 一种基于故障中文文本的电力系统故障诊断方法 |
-
2020
- 2020-08-24 CN CN202010860366.1A patent/CN112182205A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363810A (zh) * | 2018-03-09 | 2018-08-03 | 南京工业大学 | 一种文本分类方法及装置 |
CN109740164A (zh) * | 2019-01-09 | 2019-05-10 | 国网浙江省电力有限公司舟山供电公司 | 基于深度语义匹配的电力缺陷等级识别方法 |
CN110232395A (zh) * | 2019-03-01 | 2019-09-13 | 国网河南省电力公司电力科学研究院 | 一种基于故障中文文本的电力系统故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
GANG LI: "Defect Text Analysis Method of Electric Power Equipment Based on Double-Layer Bidirectional LSTM Model", 《2019 IEEE 3RD INTERNATIONAL ELECTRICAL AND ENERGY CONFERENCE (CIEEC)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191074A (zh) * | 2021-04-13 | 2021-07-30 | 北京中大科慧科技发展有限公司 | 一种用于数据中心的机房供电参数检测方法 |
CN113191074B (zh) * | 2021-04-13 | 2023-11-21 | 北京中大科慧科技发展有限公司 | 一种用于数据中心的机房供电参数检测方法 |
CN113157889A (zh) * | 2021-04-21 | 2021-07-23 | 韶鼎人工智能科技有限公司 | 一种基于主题损失的视觉问答模型构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232395B (zh) | 一种基于故障中文文本的电力系统故障诊断方法 | |
CN112732934B (zh) | 电网设备分词词典和故障案例库构建方法 | |
Khalilian et al. | Pcb defect detection using denoising convolutional autoencoders | |
CN107577702B (zh) | 一种社交媒体中交通信息的辨别方法 | |
CN111930939A (zh) | 一种文本检测的方法及装置 | |
CN112182205A (zh) | 一种利用文字识别识别电气设备中监测数据的处理方法 | |
CN112966088B (zh) | 未知意图的识别方法、装置、设备及存储介质 | |
CN115758183A (zh) | 日志异常检测模型的训练方法及装置 | |
CN115953123A (zh) | 机器人自动化流程的生成方法、装置、设备及存储介质 | |
CN115269870A (zh) | 一种基于知识图谱实现数据中台数据链路故障分类预警的方法 | |
CN114997169A (zh) | 一种实体词识别方法、装置、电子设备及可读存储介质 | |
CN113343701B (zh) | 一种电力设备故障缺陷文本命名实体的抽取方法及装置 | |
CN113157918B (zh) | 一种基于注意力机制的商品名称短文本分类方法和系统 | |
CN112732863B (zh) | 电子病历标准化切分方法 | |
CN112579730A (zh) | 高扩展性、多标签的文本分类方法和装置 | |
CN112541082A (zh) | 一种文本情感分类方法及系统 | |
CN112685374B (zh) | 日志分类方法、装置及电子设备 | |
CN115357718B (zh) | 主题集成服务重复材料发现方法、系统、设备和存储介质 | |
Schwenker et al. | EXSCLAIM!--An automated pipeline for the construction of labeled materials imaging datasets from literature | |
CN111160756A (zh) | 基于二次人工智能算法的景区评估方法及模型 | |
CN115858781A (zh) | 一种文本标签提取方法、装置、设备及介质 | |
CN116150635A (zh) | 基于跨域关联性表示的滚动轴承未知故障检测方法 | |
CN116186266A (zh) | Bert、ner实体抽取以及知识图谱的物料分类优化方法及系统 | |
CN113326371B (zh) | 一种融合预训练语言模型与抗噪声干扰远程监督信息的事件抽取方法 | |
CN114896402A (zh) | 一种文本关系抽取方法、装置、设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210105 |
|
RJ01 | Rejection of invention patent application after publication |