CN109359291A - 一种命名实体识别方法 - Google Patents
一种命名实体识别方法 Download PDFInfo
- Publication number
- CN109359291A CN109359291A CN201810984155.1A CN201810984155A CN109359291A CN 109359291 A CN109359291 A CN 109359291A CN 201810984155 A CN201810984155 A CN 201810984155A CN 109359291 A CN109359291 A CN 109359291A
- Authority
- CN
- China
- Prior art keywords
- name
- entity recognition
- word
- name entity
- recognition method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 8
- 230000011218 segmentation Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 9
- 241001269238 Data Species 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims 1
- 238000013179 statistical model Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 description 2
- 206010028916 Neologism Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种命名实体识别方法,属于信息技术领域。首先建立命名实体识别语料库,利用语料库训练已引入LSTM神经网络的命名实体识别模型;然后对待识别的文本数据进行分词;接着利用CRF模型对已分好词的文本数据进行人名识别;最后用训练好的命名实体识别模型进行地名和机构名的识别,结合人名通过去重操作得到命名实体识别的最终结果。本发明通过引入LSTM神经网络,解决了单一的基于统计模型的命名实体识别技术对边界的识别不够准确,新词识别率低,从而使得命名实体识别结果准确率低的现象,以提高命名实体识别的准确性。
Description
技术领域
本发明涉及一种命名实体识别方法,属于信息技术领域。
背景技术
随着互联网和信息产业的高速发展,海量的文本数据不断产生,如何高效地从海量的文本数据中获得有用的信息成为现在的研究热点,信息抽取技术应运而生,而命名实体识别是信息抽取的一项子任务,其目的是从海量的文本数据中抽取出指定的实体。在自然语言处理应用领域中,命名实体识别是信息检索、机器翻译、情感分析等多项自然语言处理应用的基础任务,因此,对它的研究具有重要意义和价值。
一般地,命名实体类型多样,数量众多,不断有新的命名实体出现,传统的命名实体识别技术不能有效地识别出新词;同时,命名实体构成结构比较复杂,命名实体的长度没有一定的限制,不同的实体有不同的结构,实体之间可能存在大量的嵌套、别名、缩略词等问题,所以单一的基于统计模型的命名实体识别技术对边界的识别会变得不够准确,以上所述都会给命名实体识别造成困难。
发明内容
本发明要解决的技术问题是针对现有技术的局限和不足,提供一种命名实体识别方法,引入LSTM神经网络,解决了单一的基于统计模型的命名实体识别技术对边界的识别不够准确,新词识别率低,从而使得命名实体识别结果准确率低的现象,以提高命名实体识别的准确性。
本发明的技术方案是:一种命名实体识别方法,该方法引入了LSTM神经网络对单一的基于统计模型的命名实体识别技术进行改进,具体包括以下6个步骤:
①建立命名实体识别语料库。
②对待识别的文本数据进行分词。
③利用语料库训练已引入LSTM神经网络的命名实体识别模型。
④利用CRF模型对已分好词的文本数据进行人名识别。
⑤用训练好的命名实体识别模型进行地名和机构名的识别。
⑥对人名、地名和机构名分别进行去重操作得到最后的命名实体识别结果。
进一步地,步骤①所述的命名实体识别语料库用于训练命名实体识别模型,语料库为已标注好的字构成的库。
进一步地,所述的标注采用的为BMES标注集,其中B标签表示词首,M标签表示词中,E标签表示词尾,S标签表示单字。
进一步地,步骤②所述的分词采用的方法为半监督的方式,即将每次输出的分词结果存入分词词典中,以供下次分词使用,具体实现为:取五分之一的文本数据进行分词,将分词结果加入分词词典,再取五分之一的文本数据进行分词,将分词结果加入分词词典,以此类推,按照此方式将所有文本数据进行分词。
进一步地,步骤③所述的引入LSTM神经网络的命名实体识别模型共包含三层,第一层为预处理层,即利用随机初始化的矩阵将分词结果中的每个字由one-hot向量映射为低维稠密的字向量,然后将字向量初始化为该字所在词的词向量;第二层为双向LSTM层,用来自动提取文本数据的特征,将每个词的词向量序列作为双向LSTM各个时间步的输入,再将正向LSTM输出的隐状态序列与反向LSTM的在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列,从而得到双向LSTM的输出矩阵A;第三层为CRF层,用来对整个文本数据进行序列标注,从而得到CRF的转移矩阵B。
进一步地,所述的one-hot向量为通过one-hot编码将离散的特征数字化得到的特征向量。
进一步地,一个长度为n的标签序列通过模型计算后的总得分S(x,y)的计算公式为:
其中,y为一个长度等于n的标签序列。
进一步地,步骤④所述的人名识别通过CRF模型的特征模板来实现,所述特征模板可以自定义。
进一步地,步骤⑤所述的地名和机构名的识别通过已训练好的命名实体识别模型来实现,模型在预测过程中使用viterbi算法来求解最优路径。
进一步地,步骤⑥所述的去重操作的实施原因是由于通过模型进行命名实体识别会将相同的实体识别出来,造成信息冗余;所述的去重操作的实现是分别将每一个文本数据识别出来的人名、地名和机构名进行遍历,去除相同的实体。
本发明的有益效果是:与现有技术相比,通过引入LSTM神经网络,解决了单一的基于统计模型的命名实体识别技术对边界的识别不够准确,新词识别率低,从而使得命名实体识别结果准确率低的现象,以提高命名实体识别的准确性。
附图说明
图1是本发明步骤流程图;
图2是本发明步骤③流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-2所示,一种命名实体识别方法,首先建立命名实体识别语料库,利用语料库训练已引入LSTM神经网络的命名实体识别模型;然后对待识别的文本数据进行分词;接着利用CRF模型对已分好词的文本数据进行人名识别;最后用训练好的命名实体识别模型进行地名和机构名的识别,结合人名得到命名实体识别的最终结果。
具体步骤为:
①建立命名实体识别语料库。
②对待识别的文本数据进行分词。
③利用语料库训练已引入LSTM神经网络的命名实体识别模型。
④利用CRF模型对已分好词的文本数据进行人名识别。
⑤用训练好的命名实体识别模型进行地名和机构名的识别。
⑥对人名、地名和机构名分别进行去重操作得到最后的命名实体识别结果。
进一步地,步骤①所述的命名实体识别语料库用于训练命名实体识别模型,语料库为已标注好的字构成的库。
进一步地,所述的标注采用的为BMES标注集,其中B标签表示词首,M标签表示词中,E标签表示词尾,S标签表示单字。
进一步地,步骤②所述的分词采用的方法为半监督的方式,即将每次输出的分词结果存入分词词典中,以供下次分词使用,具体实现为:取五分之一的文本数据进行分词,将分词结果加入分词词典,再取五分之一的文本数据进行分词,将分词结果加入分词词典,以此类推,按照此方式将所有文本数据进行分词。
进一步地,步骤③所述的引入LSTM神经网络的命名实体识别模型共包含三层,第一层为预处理层,即利用随机初始化的矩阵将分词结果中的每个字由one-hot向量映射为低维稠密的字向量,然后将字向量初始化为该字所在词的词向量;第二层为双向LSTM层,用来自动提取文本数据的特征,将每个词的词向量序列作为双向LSTM各个时间步的输入,再将正向LSTM输出的隐状态序列与反向LSTM的在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列,从而得到双向LSTM的输出矩阵A;第三层为CRF层,用来对整个文本数据进行序列标注,从而得到CRF的转移矩阵B。
进一步地,所述的one-hot向量为通过one-hot编码将离散的特征数字化得到的特征向量。
进一步地,一个长度为n的标签序列通过模型计算后的总得分S(x,y)的计算公式为:
其中,y为一个长度等于n的标签序列。
进一步地,步骤④所述的人名识别通过CRF模型的特征模板来实现,所述特征模板可以自定义。
进一步地,步骤⑤所述的地名和机构名的识别通过已训练好的命名实体识别模型来实现,模型在预测过程中使用viterbi算法来求解最优路径。
进一步地,步骤⑥所述的去重操作的实施原因是由于通过模型进行命名实体识别会将相同的实体识别出来,造成信息冗余;所述的去重操作的实现是分别将每一个文本数据识别出来的人名、地名和机构名进行遍历,去除相同的实体。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (10)
1.一种命名实体识别方法,其特征在于:
①建立命名实体识别语料库;
②对待识别的文本数据进行分词;
③利用语料库训练已引入LSTM神经网络的命名实体识别模型;
④利用CRF模型对已分好词的文本数据进行人名识别;
⑤用训练好的命名实体识别模型进行地名和机构名的识别;
⑥对人名、地名和机构名分别进行去重操作得到最后的命名实体识别结果。
2.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤①的命名实体识别语料库用于训练命名实体识别模型,语料库为已标注好的字构成的库。
3.根据权利要求2所述的命名实体识别方法,其特征在于:所述的标注采用的为BMES标注集,其中B标签表示词首,M标签表示词中,E标签表示词尾,S标签表示单字。
4.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤②的分词采用的方法为半监督的方式,即将每次输出的分词结果存入分词词典中,以供下次分词使用,具体实现为:取五分之一的文本数据进行分词,将分词结果加入分词词典,再取五分之一的文本数据进行分词,将分词结果加入分词词典,以此类推,按照此方式将所有文本数据进行分词。
5.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤③的引入LSTM神经网络的命名实体识别模型共包含三层,第一层为预处理层,即利用随机初始化的矩阵将分词结果中的每个字由one-hot向量映射为低维稠密的字向量,然后将字向量初始化为该字所在词的词向量;第二层为双向LSTM层,用来自动提取文本数据的特征,将每个词的词向量序列作为双向LSTM各个时间步的输入,再将正向LSTM输出的隐状态序列与反向LSTM的在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列,从而得到双向LSTM的输出矩阵A;第三层为CRF层,用来对整个文本数据进行序列标注,从而得到CRF的转移矩阵B。
6.根据权利要求5所述的命名实体识别方法,其特征在于:所述的one-hot向量为通过one-hot编码将离散的特征数字化得到的特征向量。
7.根据权利要求5所述的命名实体识别方法,其特征在于:所述序列中,一个长度为n的标签序列通过模型计算后的总得分S(x,y)的计算公式为:
其中,y为一个长度等于n的标签序列。
8.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤④的人名识别通过CRF模型的特征模板来实现,所述特征模板可以自定义。
9.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤⑤的地名和机构名的识别通过已训练好的命名实体识别模型来实现,模型在预测过程中使用viterbi算法来求解最优路径。
10.根据权利要求1所述的命名实体识别方法,其特征在于:所述步骤⑥的去重操作的实现是分别将每一个文本数据识别出来的人名、地名和机构名进行遍历,去除相同的实体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810984155.1A CN109359291A (zh) | 2018-08-28 | 2018-08-28 | 一种命名实体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810984155.1A CN109359291A (zh) | 2018-08-28 | 2018-08-28 | 一种命名实体识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109359291A true CN109359291A (zh) | 2019-02-19 |
Family
ID=65349903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810984155.1A Pending CN109359291A (zh) | 2018-08-28 | 2018-08-28 | 一种命名实体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359291A (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960728A (zh) * | 2019-03-11 | 2019-07-02 | 北京市科学技术情报研究所(北京市科学技术信息中心) | 一种开放域会议信息命名实体识别方法及系统 |
CN110032737A (zh) * | 2019-04-10 | 2019-07-19 | 贵州大学 | 一种基于神经网络的边界组合命名实体识别方法 |
CN110162795A (zh) * | 2019-05-30 | 2019-08-23 | 重庆大学 | 一种自适应的跨领域命名实体识别方法与系统 |
CN110210023A (zh) * | 2019-05-23 | 2019-09-06 | 竹间智能科技(上海)有限公司 | 一种实用有效的命名实体识别的计算方法 |
CN110222338A (zh) * | 2019-05-28 | 2019-09-10 | 浙江邦盛科技有限公司 | 一种机构名实体识别方法 |
CN110399452A (zh) * | 2019-07-23 | 2019-11-01 | 福建奇点时空数字科技有限公司 | 一种基于实例特征建模的命名实体列表生成方法 |
CN110569510A (zh) * | 2019-09-17 | 2019-12-13 | 四川长虹电器股份有限公司 | 一种对用户请求数据的命名实体识别的方法 |
CN110688854A (zh) * | 2019-09-02 | 2020-01-14 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置及计算机可读存储介质 |
CN110705272A (zh) * | 2019-08-28 | 2020-01-17 | 昆明理工大学 | 一种面向汽车发动机故障诊断的命名实体识别方法 |
CN110705293A (zh) * | 2019-08-23 | 2020-01-17 | 中国科学院苏州生物医学工程技术研究所 | 基于预训练语言模型的电子病历文本命名实体识别方法 |
CN110826330A (zh) * | 2019-10-12 | 2020-02-21 | 上海数禾信息科技有限公司 | 人名识别方法及装置、计算机设备及可读存储介质 |
CN110826331A (zh) * | 2019-10-28 | 2020-02-21 | 南京师范大学 | 基于交互式与迭代式学习的地名标注语料库智能构建方法 |
CN110941720A (zh) * | 2019-09-12 | 2020-03-31 | 贵州耕云科技有限公司 | 一种基于知识库的特定人员信息纠错方法 |
CN111125378A (zh) * | 2019-12-25 | 2020-05-08 | 同方知网(北京)技术有限公司 | 一种基于自动样本标注的闭环实体抽取方法 |
CN111160032A (zh) * | 2019-12-17 | 2020-05-15 | 浙江大华技术股份有限公司 | 一种命名实体提取方法、装置、电子设备及存储介质 |
CN111160023A (zh) * | 2019-12-23 | 2020-05-15 | 华南理工大学 | 一种基于多路召回的医疗文本命名实体识别方法 |
CN112364654A (zh) * | 2020-11-11 | 2021-02-12 | 安徽工业大学 | 一种面向教育领域的实体和关系联合抽取方法 |
WO2021082370A1 (zh) * | 2019-10-28 | 2021-05-06 | 南京师范大学 | 基于百科知识库和词向量的中文地名语义消歧方法 |
CN112861533A (zh) * | 2019-11-26 | 2021-05-28 | 阿里巴巴集团控股有限公司 | 实体词识别方法及装置 |
WO2022048210A1 (zh) * | 2020-09-03 | 2022-03-10 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、电子设备及可读存储介质 |
CN114330349A (zh) * | 2022-01-05 | 2022-04-12 | 北京航空航天大学 | 一种特定领域命名实体识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106569998A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法 |
CN107644014A (zh) * | 2017-09-25 | 2018-01-30 | 南京安链数据科技有限公司 | 一种基于双向lstm和crf的命名实体识别方法 |
CN107704500A (zh) * | 2017-08-28 | 2018-02-16 | 昆明理工大学 | 一种基于语义分析与多重余弦定理的新闻分类方法 |
CN107885721A (zh) * | 2017-10-12 | 2018-04-06 | 北京知道未来信息技术有限公司 | 一种基于lstm的命名实体识别方法 |
-
2018
- 2018-08-28 CN CN201810984155.1A patent/CN109359291A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106569998A (zh) * | 2016-10-27 | 2017-04-19 | 浙江大学 | 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法 |
CN107704500A (zh) * | 2017-08-28 | 2018-02-16 | 昆明理工大学 | 一种基于语义分析与多重余弦定理的新闻分类方法 |
CN107644014A (zh) * | 2017-09-25 | 2018-01-30 | 南京安链数据科技有限公司 | 一种基于双向lstm和crf的命名实体识别方法 |
CN107885721A (zh) * | 2017-10-12 | 2018-04-06 | 北京知道未来信息技术有限公司 | 一种基于lstm的命名实体识别方法 |
Non-Patent Citations (1)
Title |
---|
DETERMINED22: "DL4NLP——序列标注:BiLSTM-CRF模型做基于字的中文命名实体识别", 《HTTPS://WWW.CNBLOGS.COM/DETERMINED22/P/7238342.HTML》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960728A (zh) * | 2019-03-11 | 2019-07-02 | 北京市科学技术情报研究所(北京市科学技术信息中心) | 一种开放域会议信息命名实体识别方法及系统 |
CN110032737A (zh) * | 2019-04-10 | 2019-07-19 | 贵州大学 | 一种基于神经网络的边界组合命名实体识别方法 |
CN110032737B (zh) * | 2019-04-10 | 2022-03-22 | 贵州大学 | 一种基于神经网络的边界组合命名实体识别方法 |
CN110210023A (zh) * | 2019-05-23 | 2019-09-06 | 竹间智能科技(上海)有限公司 | 一种实用有效的命名实体识别的计算方法 |
CN110222338A (zh) * | 2019-05-28 | 2019-09-10 | 浙江邦盛科技有限公司 | 一种机构名实体识别方法 |
CN110162795A (zh) * | 2019-05-30 | 2019-08-23 | 重庆大学 | 一种自适应的跨领域命名实体识别方法与系统 |
CN110399452A (zh) * | 2019-07-23 | 2019-11-01 | 福建奇点时空数字科技有限公司 | 一种基于实例特征建模的命名实体列表生成方法 |
CN110705293A (zh) * | 2019-08-23 | 2020-01-17 | 中国科学院苏州生物医学工程技术研究所 | 基于预训练语言模型的电子病历文本命名实体识别方法 |
CN110705272A (zh) * | 2019-08-28 | 2020-01-17 | 昆明理工大学 | 一种面向汽车发动机故障诊断的命名实体识别方法 |
CN110688854A (zh) * | 2019-09-02 | 2020-01-14 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置及计算机可读存储介质 |
CN110941720B (zh) * | 2019-09-12 | 2023-06-09 | 贵州耕云科技有限公司 | 一种基于知识库的特定人员信息纠错方法 |
CN110941720A (zh) * | 2019-09-12 | 2020-03-31 | 贵州耕云科技有限公司 | 一种基于知识库的特定人员信息纠错方法 |
CN110569510A (zh) * | 2019-09-17 | 2019-12-13 | 四川长虹电器股份有限公司 | 一种对用户请求数据的命名实体识别的方法 |
CN110826330B (zh) * | 2019-10-12 | 2023-11-07 | 上海数禾信息科技有限公司 | 人名识别方法及装置、计算机设备及可读存储介质 |
CN110826330A (zh) * | 2019-10-12 | 2020-02-21 | 上海数禾信息科技有限公司 | 人名识别方法及装置、计算机设备及可读存储介质 |
CN110826331A (zh) * | 2019-10-28 | 2020-02-21 | 南京师范大学 | 基于交互式与迭代式学习的地名标注语料库智能构建方法 |
JP2022532451A (ja) * | 2019-10-28 | 2022-07-14 | 南京師範大学 | 百科知識ベースと単語の埋め込みに基づく中国語地名語義の曖昧性解消方法 |
CN110826331B (zh) * | 2019-10-28 | 2023-04-18 | 南京师范大学 | 基于交互式与迭代式学习的地名标注语料库智能构建方法 |
WO2021082370A1 (zh) * | 2019-10-28 | 2021-05-06 | 南京师范大学 | 基于百科知识库和词向量的中文地名语义消歧方法 |
JP7228946B2 (ja) | 2019-10-28 | 2023-02-27 | 南京師範大学 | 百科知識ベースと単語の埋め込みに基づく中国語地名語義の曖昧性解消方法 |
CN112861533A (zh) * | 2019-11-26 | 2021-05-28 | 阿里巴巴集团控股有限公司 | 实体词识别方法及装置 |
CN111160032A (zh) * | 2019-12-17 | 2020-05-15 | 浙江大华技术股份有限公司 | 一种命名实体提取方法、装置、电子设备及存储介质 |
CN111160032B (zh) * | 2019-12-17 | 2023-03-17 | 浙江大华技术股份有限公司 | 一种命名实体提取方法、装置、电子设备及存储介质 |
CN111160023A (zh) * | 2019-12-23 | 2020-05-15 | 华南理工大学 | 一种基于多路召回的医疗文本命名实体识别方法 |
CN111160023B (zh) * | 2019-12-23 | 2023-06-20 | 华南理工大学 | 一种基于多路召回的医疗文本命名实体识别方法 |
CN111125378A (zh) * | 2019-12-25 | 2020-05-08 | 同方知网(北京)技术有限公司 | 一种基于自动样本标注的闭环实体抽取方法 |
WO2022048210A1 (zh) * | 2020-09-03 | 2022-03-10 | 平安科技(深圳)有限公司 | 命名实体识别方法、装置、电子设备及可读存储介质 |
CN112364654A (zh) * | 2020-11-11 | 2021-02-12 | 安徽工业大学 | 一种面向教育领域的实体和关系联合抽取方法 |
CN114330349A (zh) * | 2022-01-05 | 2022-04-12 | 北京航空航天大学 | 一种特定领域命名实体识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359291A (zh) | 一种命名实体识别方法 | |
Farahani et al. | Parsbert: Transformer-based model for persian language understanding | |
CN109902145B (zh) | 一种基于注意力机制的实体关系联合抽取方法和系统 | |
CN110110054B (zh) | 一种基于深度学习的从非结构化文本中获取问答对的方法 | |
CN109684648B (zh) | 一种多特征融合的古今汉语自动翻译方法 | |
Cao et al. | A joint model for word embedding and word morphology | |
CN109635279B (zh) | 一种基于神经网络的中文命名实体识别方法 | |
CN109766277B (zh) | 一种基于迁移学习与dnn的软件故障诊断方法 | |
CN109543181B (zh) | 一种基于主动学习和深度学习相结合的命名实体模型和系统 | |
CN109753660B (zh) | 一种基于lstm的中标网页命名实体抽取方法 | |
Alwehaibi et al. | Comparison of pre-trained word vectors for arabic text classification using deep learning approach | |
CN108804612B (zh) | 一种基于对偶神经网络模型的文本情感分类方法 | |
CN110134946B (zh) | 一种针对复杂数据的机器阅读理解方法 | |
CN108829684A (zh) | 一种基于迁移学习策略的蒙汉神经机器翻译方法 | |
CN110532554A (zh) | 一种中文摘要生成方法、系统及存储介质 | |
CN109960728B (zh) | 一种开放域会议信息命名实体识别方法及系统 | |
CN110598203A (zh) | 一种结合词典的军事想定文书实体信息抽取方法及装置 | |
CN110414009B (zh) | 基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置 | |
CN110717331A (zh) | 一种基于神经网络的中文命名实体识别方法、装置、设备以及存储介质 | |
CN110688862A (zh) | 一种基于迁移学习的蒙汉互译方法 | |
CN109635288A (zh) | 一种基于深度神经网络的简历抽取方法 | |
CN107247703A (zh) | 基于卷积神经网络和集成学习的微博情感分析方法 | |
Hamed et al. | Deep learning approach for translating arabic holy quran into italian language | |
CN106610937A (zh) | 一种基于信息论的中文自动分词算法 | |
CN111222329B (zh) | 句向量训练方法及模型、句向量预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190219 |
|
RJ01 | Rejection of invention patent application after publication |