CN108664474B - 一种基于深度学习的简历解析方法 - Google Patents

一种基于深度学习的简历解析方法 Download PDF

Info

Publication number
CN108664474B
CN108664474B CN201810489651.XA CN201810489651A CN108664474B CN 108664474 B CN108664474 B CN 108664474B CN 201810489651 A CN201810489651 A CN 201810489651A CN 108664474 B CN108664474 B CN 108664474B
Authority
CN
China
Prior art keywords
resume
vector
text
row
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810489651.XA
Other languages
English (en)
Other versions
CN108664474A (zh
Inventor
马龙
雷画雨
姚卓君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongan Information Technology Service Co Ltd
Original Assignee
Zhongan Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongan Information Technology Service Co Ltd filed Critical Zhongan Information Technology Service Co Ltd
Priority to CN201810489651.XA priority Critical patent/CN108664474B/zh
Publication of CN108664474A publication Critical patent/CN108664474A/zh
Application granted granted Critical
Publication of CN108664474B publication Critical patent/CN108664474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的简历解析方法,其包括以下步骤:数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;模型训练:利用神经网络将简历文本按行表达为一个固定长度的向量,在获得行向量后,根据所述行向量对简历进行内容分段;信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。通过本技术方案,能够提高解析简历以及信息提取准确度。

Description

一种基于深度学习的简历解析方法
技术领域
本发明涉及信息提取技术领域,尤其涉及一种基于深度学习的简历解析方法。
背景技术
现实生活中,许多公司的人力资源部门都会囤积到大量人才的简历,经整理收集成为简历库。但是简历文本并不是一个完全结构化的内容,它的模板多种多样,格式花样层出不穷,因而在分类整理和精确检索上存在非常多的困难。因此,许多公司花大价值收集而来的简历库,通常难以充分发挥价值。为了能够充分利用简历库,需要将简历按照标签整理为结构化的内容,例如:姓名,电话,邮箱,学历,毕业院校,工作经历,职业标签,职位意向,技术特征,等等。而这,催生了简历解析技术的需求。简历解析,就是针对各种不同格式的简历,按照要求提取结构化字段的过程,是后续进一步的人才职位匹配工作的基础,也是充分利用简历库,节约成本的有效方式。
但是简历文本在逻辑上,有着它固有的特点:内容上它通常是呈分段排列。目前,有通过传统的机器学习技术来对文本进行分段,但这种分段方法和提取信息的错误率较高,不能满足于相关技术领域对于准确率的要求。
因此,一种更准确科学的分段方法,在根据此分段方法从不同内容的分段中提取相应的实体信息,成为相关领域需要解决的技术问题之一。
发明内容
为了克服现有技术的不足,本发明所解决的技术问题是提供一种能够提高信息提取效率的基于深度学习的简历解析方法。
为解决上述技术问题,本发明所采用的技术方案内容具体如下:
一种基于深度学习的简历解析方法,其包括以下步骤:
数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;
模型训练:利用RNN神经网络将简历文本按行表达为一个固定长度的向量从而获得行向量,并根据所述行向量对简历进行内容分段;
信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。
为提高简历解析的效率,提高信息提取的准确度,在本技术方案中,发明人通过利用RNN神经网络,将简历文本中的每一行文本都通过深度学习模型编码为行向量。利用行向量实现对简历进行内容分段,其好处在于能够将语义特征用一个实数向量的方式表达出来,从而方便后续处理,提高信息处理的效率。
进一步地,利用行向量进行表述,能够对任意不规范形式的简历进行信息提取,不需局限于简历的格式,一方面方便后续处理,另一方面也提高了处理方法的适用性;
更进一步地,采用此方案,还能达到降低人工特征工程工作量的技术目的,无需通过人工对简历信息进行分类,提高提取效率。在本技术方案中,并不需要通过特定的格式文件的标记,例如xml,html等各种特殊标记来作为特征,也不需要通过特征工程来提取特征,我们只需要通过深度学习模型训练出每个符号对应的符号向量。这样的好处是既减少了特征工程的工作量,又充分利用了语言的有序性特点,对提高准确性和减少工作量很有帮助。
优选地,在所述模型训练步骤中,将简历文本按行表达为一个固定长度的向量的步骤包括:
获取符号向量:对所述简历文本中的每个符号表示为一个固定长度的实数向量;
获取行向量:通过神经网络根据构成该行文本的所述符号向量,依据时序来训练成一个固定长度的向量,得到行向量。
作为一种优选的实施方式,在本方案中,发明人一方面通过对所述简历文本中的每个符号表示为一个固定长度的实数向量,这一过程可以达到的有益效果是每个符号表达的特征及其相关性能够通过实数向量完整表达出来;另一方面,在得到行向量的是通过神经网络根据构成该行文本的所述符号向量,依据时序来训练而获得,这种方式能够在不丢失句子序列信息的情况下,提取特征。
更优选地,在所述获取符号向量步骤中,简历文本中的所述符号包括中文字符、英文字符、数字字符、标点字符、制表符、空格符中的一种或多种。
需要说明的是,采用符号向量能够最大化利用简历文本中的各种特征,因为不同的内容段,不仅仅是表达的内容有区别,采用的标点符号,空格多少,制表符美化等,都成为了构成差异的特征。采用符号向量则充分提取了这些特征,使得提取的准确率和效果更好。
优选地,在所述模型训练步骤中,在将简历文本按行表达为一个固定长度的向量时,还对该行文本设定一个上下文窗口k。
更优选地,所述内容分段的步骤包括:
以所述行向量对应的行为基准,获取该行的前k行文本,以及获取该行的后k行文本;
通过神经网络将所述文本行表达成2k+1个行向量,然后将所述2k+1个行向量合并成一个向量,并输入到分类器中进行类别判定以实现内容分段。
作为一种优选的实施方式,在获取行向量的过程当中,还包括对该行文本设定一个上下文窗口k,即结合该行文本的前k行(上文),以及后k行(下文)进行类别判定,从而完成该行文本的内容分段。通过本技术方案,能够充分利用该行文本的上下文内容来进行分类决策,由于人类的行文习惯,通常一行句子都会和上下文构成关系,或承前,或启后,因此采取此种方式可以大幅提高了预测结果的准确性。
进一步地,将所述2k+1个行向量合并成一个向量的方式是加权求和或者直接串联。
需要说明的是,在合并向量的过程中,采用加权求和的方式具有的有益效果是降低参数数量,减少训练时间;采用直接串联的方式具有的有益效果是充分利用了每行文本的特征,将会有更高的准确率。
优选地,在信息提取步骤中,提取标签字段的方法是NER。NER是提取标签字段的标准方式。
优选地,在所述模型训练步骤中所述RNN神经网络是LSTM或GRU。
优选地,在所述数据预处理步骤中,所述文本格式是txt格式。
需要说明的是,采用txt的格式可以使得后续处理更为简便,处理速度更高。在其他的一些实施方式中,其他文本格式如doc、docx、wps等,也均可适用在本技术方案当中。
与现有技术相比,本发明的有益效果在于:
1、本发明基于深度学习的简历解析方法,利用行向量实现对简历进行内容分段,从而能够将语义特征用一个实数向量的方式表达出来,从而方便后续处理,提高信息处理的效率;进一步地,能够对任意不规范形式的简历进行信息提取,不需局限于简历的格式,进而更进一步地方便后续处理。
2、本发明基于深度学习的简历解析方法,一方面通过对所述简历文本中的每个符号表示为一个固定长度的实数向量,这一过程可以达到的有益效果是每个符号表达的特征及其相关性能够通过实数向量完整表达出来;
3、本发明基于深度学习的简历解析方法,在得到行向量的是通过神经网络根据构成该行文本的所述符号向量,依据时序来训练而获得,这种方式能够在不丢失句子序列信息的情况下,提取特征;
4、本发明基于深度学习的简历解析方法,采用符号向量能够最大化利用简历文本中的各种特征,。采用符号向量则充分提取了这些特征,使得提取的准确率和效果更好;
5、本发明基于深度学习的简历解析方法,采用上下文窗口的模式,充分利用了简历文本的上下文相关性,大大提高了预测结果准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明基于深度学习的简历解析方法的基础实施方式的流程步骤示意图;
图2为本发明基于深度学习的简历解析方法获取符号向量方式的一种优选实施方式的示意图;
图3为本发明基于深度学习的简历解析方法获取行向量方式的一种优选实施方式的示意图;
图4为本发明基于深度学习的简历解析方法所述行向量对简历进行内容分段方式的一种优选实施方式的示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下:
实施例1
如图1所示是为本发明基于深度学习的简历解析方法的基础实施方式的流程步骤示意图,该方法包括:
数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;
模型训练:利用RNN神经网络将简历文本按行表达为一个固定长度的向量从而获得行向量,并根据所述行向量对简历进行内容分段;
信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息。
在本技术方案中,发明人通过利用RNN神经网络,将简历文本中的每一行文本都通过深度学习模型编码为行向量。利用行向量实现对简历进行内容分段,其好处在于能够将语义特征用一个实数向量的方式表达出来,从而方便后续的内容分段处理,提高信息处理的效率,进而实现提高简历解析的效率。
实施例2
本实施例列举在一种具体的实施方式当中,上述过程实现方式:
(1)数据预处理:
首先将简历统一转换为txt文本格式(仅仅是内容文本,不包含格式文件的标记字符,例如xml标记,html标记等,这样具有通用性,不局限于某种特定格式的简历),并确定简历的内容分段标签(例如:可分为个人信息段,教育经历段,项目经历段,工作经历段等),将简历文本按行进行数据标记,例如:
内容 标签
姓名:xx性别:男 个人信息
电话:15573223342 个人信息
2000.9-2004.6清华大学自动化本科 教育经历
2004.9-2006.6北京大学理论物理硕士 教育经历
(2)模型训练:
首先获取符号向量:对所述简历文本中的每个符号表示为一个固定长度的实数向量;即简历文本中的每个符号(包括汉字,英文符号,标点,序号,空格等)都可表示为一个固定长度的实数向量,如图2所示,以“我”字为例,被表达成了一个向量。
然后,获取行向量:通过神经网络根据构成该行文本的所述符号向量,依据时序来训练成一个固定长度的向量,得到行向量。例如图3,一行文字“毕业院校”由符号向量X0,X1,X2,X3根据时序一次输入RNN单元,进而编码成行向量h3
接着进行内容分段,在获得了行向量后,我们根据得到的行向量来进行简历的内容分段。假设我们对简历文本中的某一行进行分类,取窗口大小为K,那么模型的输入分别为:该行文本的前K行(上文),该行文本,以及该行文本的后K行(下文)。通过RNN将这些文本行表达成2K+1个行向量,继而通过加权求和或者直接串联等方式,将这2K+1个行向量合并成一个向量,并输入到分类器中进行类别判定,这样就完成了该行文本的内容分段,这样做的一个好处就是充分利用了该行文本的上下文内容来进行分类决策。如图4所示是取K=1的情况(包含当前行文本,以及一行上文和一行下文)。
图4为判断“电话:15573223342”这行文本的类别,它的上文为“姓名:xx性别:男”,下文为:“2000.9-2004.6清华大学自动化本科”,三行文本一起输入到深度学习模型中,最终得出“电话:15573223342”的类别为“个人信息”。
(3)信息提取:对已有的内容分段后,从指定的内容段中提取标签。可以采用基于规则和基于命名实体识别的方法,并结合领域知识从指定的内容段中提取特定实体标签。例如从个人信息中提取姓名,电话,性别等信息,从教育经历中提取学历、学位等。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims (6)

1.一种基于深度学习的简历解析方法,其特征在于,其包括以下步骤:
数据预处理:将简历统一转换为文本格式,确定简历的内容分段标签,并将简历文本按行进行数据标记;
模型训练:利用RNN神经网络将简历文本按行表达为一个固定长度的向量从而获得行向量,并根据所述行向量对简历进行内容分段;
信息提取:在完成内容分段后,从指定的内容段中提取标签字段,获得相关信息;
其中,利用RNN神经网络将简历文本按行表达为一个固定长度的向量从而获得行向量,包括:
获取符号向量:对所述简历文本中的每个符号表示为一个固定长度的实数向量;
获取行向量:通过神经网络根据构成该行文本的所述符号向量,依据时序来训练成一个固定长度的向量,得到行向量;
在所述模型训练步骤中,在将简历文本按行表达为一个固定长度的向量时,还对该行文本设定一个上下文窗口k;
其中,所述内容分段的步骤包括:
以所述行向量对应的行为基准,获取该行的前k行文本,以及获取该行的后k行文本;
通过神经网络将所述文本行表达成2k+1个行向量,然后将所述2k+1个行向量合并成一个向量,并输入到分类器中进行类别判定以实现内容分段。
2.如权利要求1所述的基于深度学习的简历解析方法,其特征在于,在所述获取符号向量步骤中,简历文本中的所述符号包括中文字符、英文字符、数字字符、标点字符、制表符、空格符中的一种或多种。
3.如权利要求1所述的基于深度学习的简历解析方法,其特征在于,将所述2k+1个行向量合并成一个向量的方式是加权求和或者直接串联。
4.如权利要求1所述的基于深度学习的简历解析方法,其特征在于,在信息提取步骤中,提取标签字段的方法是NER。
5.如权利要求1-4任一项所述的基于深度学习的简历解析方法,其特征在于,在所述模型训练步骤中,所述RNN神经网络是LSTM或GRU。
6.如权利要求1-4任一项所述的基于深度学习的简历解析方法,其特征在于,在所述数据预处理步骤中,所述文本格式是txt格式。
CN201810489651.XA 2018-05-21 2018-05-21 一种基于深度学习的简历解析方法 Active CN108664474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810489651.XA CN108664474B (zh) 2018-05-21 2018-05-21 一种基于深度学习的简历解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810489651.XA CN108664474B (zh) 2018-05-21 2018-05-21 一种基于深度学习的简历解析方法

Publications (2)

Publication Number Publication Date
CN108664474A CN108664474A (zh) 2018-10-16
CN108664474B true CN108664474B (zh) 2023-04-18

Family

ID=63776302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810489651.XA Active CN108664474B (zh) 2018-05-21 2018-05-21 一种基于深度学习的简历解析方法

Country Status (1)

Country Link
CN (1) CN108664474B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241270A (zh) * 2018-11-12 2020-06-05 马上消费金融股份有限公司 一种简历处理方法及装置
CN109766438A (zh) * 2018-12-12 2019-05-17 平安科技(深圳)有限公司 简历信息提取方法、装置、计算机设备和存储介质
CN109710930A (zh) * 2018-12-20 2019-05-03 重庆邮电大学 一种基于深度神经网络的中文简历解析方法
CN109753909B (zh) * 2018-12-27 2021-08-10 广东人啊人网络技术开发有限公司 一种基于内容分块和BiLSTM模型的简历解析方法
CN110442841B (zh) * 2019-06-20 2024-02-02 平安科技(深圳)有限公司 识别简历的方法及装置、计算机设备、存储介质
CN110390324A (zh) * 2019-07-27 2019-10-29 苏州过来人科技有限公司 一种融合视觉与文本特征的简历版面分析算法
CN110533511A (zh) * 2019-08-29 2019-12-03 欧冶国际电商有限公司 基于电子邮件的贸易询单自动生成方法、装置及存储介质
CN111428480B (zh) * 2020-03-06 2023-11-21 广州视源电子科技股份有限公司 简历识别方法、装置、设备及存储介质
CN111126607B (zh) * 2020-04-01 2020-09-29 阿尔法云计算(深圳)有限公司 一种模型训练的数据处理方法、装置与系统
CN112214572B (zh) * 2020-10-20 2022-11-01 山东浪潮科学研究院有限公司 一种简历解析中二次提取实体的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573046B (zh) * 2015-01-20 2018-07-31 成都品果科技有限公司 一种基于词向量的评论分析方法及系统
CN105550278A (zh) * 2015-12-10 2016-05-04 天津海量信息技术有限公司 基于深度学习的网页区域识别算法
CN105955952A (zh) * 2016-05-03 2016-09-21 成都数联铭品科技有限公司 一种基于双向递归神经网络的信息提取方法
US10621486B2 (en) * 2016-08-12 2020-04-14 Beijing Deephi Intelligent Technology Co., Ltd. Method for optimizing an artificial neural network (ANN)
CN106408262A (zh) * 2016-09-27 2017-02-15 吉林码帝科技有限公司 一种招聘和应聘匹配方法
CN106570148B (zh) * 2016-10-27 2019-07-23 浙江大学 一种基于卷积神经网络的属性抽取方法
CN107291795B (zh) * 2017-05-03 2020-06-19 华南理工大学 一种结合动态词嵌入和词性标注的文本分类方法
CN107392143B (zh) * 2017-07-20 2019-12-27 中国科学院软件研究所 一种基于svm文本分类的简历精确解析方法

Also Published As

Publication number Publication date
CN108664474A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
CN108664474B (zh) 一种基于深度学习的简历解析方法
CN107392143B (zh) 一种基于svm文本分类的简历精确解析方法
CN109284400B (zh) 一种基于Lattice LSTM和语言模型的命名实体识别方法
WO2018032937A1 (zh) 一种文本信息分类方法及其装置
CN109460551B (zh) 签名信息提取方法及装置
CN110598203A (zh) 一种结合词典的军事想定文书实体信息抽取方法及装置
CN110991163B (zh) 一种文档比对分析方法、装置、电子设备及存储介质
CN111159356B (zh) 基于教学内容的知识图谱构建方法
CN114297987B (zh) 基于文本分类和阅读理解的文档信息抽取方法及系统
CN116205211A (zh) 基于大规模预训练生成模型的文档级简历解析方法
CN113987125A (zh) 基于神经网络的文本结构化信息提取方法、及其相关设备
CN112749283A (zh) 一种面向法律领域的实体关系联合抽取方法
CN115718792A (zh) 一种基于自然语义处理和深度学习的敏感信息提取方法
CN109446523A (zh) 基于BiLSTM和条件随机场的实体属性抽取模型
CN111967267A (zh) 一种基于XLNet的新闻文本地域提取的方法及系统
CN111401004B (zh) 一种基于机器学习的文章断句方法
CN112036330A (zh) 一种文本识别方法、文本识别装置及可读存储介质
CN115730603A (zh) 基于人工智能的信息提取方法、装置、设备及存储介质
Shirke et al. Handwritten Gujarati script recognition
CN110414000B (zh) 一种基于模板文档对比的关键词提取方法及系统
CN116306506A (zh) 一种基于内容识别的智能邮件模板方法
CN110362803B (zh) 一种基于领域特征词法组合的文本模板生成方法
CN110826330B (zh) 人名识别方法及装置、计算机设备及可读存储介质
CN110096574B (zh) 电商评论分类任务中数据集的建立和后续优化及扩充方案
CN113919355B (zh) 一种适用于少训练语料场景的半监督命名实体识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant