CN113792545A - 一种基于深度学习的新闻事件活动名称抽取方法 - Google Patents
一种基于深度学习的新闻事件活动名称抽取方法 Download PDFInfo
- Publication number
- CN113792545A CN113792545A CN202111354123.1A CN202111354123A CN113792545A CN 113792545 A CN113792545 A CN 113792545A CN 202111354123 A CN202111354123 A CN 202111354123A CN 113792545 A CN113792545 A CN 113792545A
- Authority
- CN
- China
- Prior art keywords
- news
- text
- labeling
- event
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度学习的新闻事件活动名称抽取方法,包括步骤:S1,收集新闻文本数据并标注其中的新闻事件活动名称,构建新闻事件活动名称数据集;S2,利用预训练模型与深度学习方法构建新闻事件活动名称抽取模型,并利用所述新闻事件活动名称数据集训练所述新闻事件活动名称抽取模型;S3,利用步骤S2中训练好的新闻事件活动名称抽取模型,对输入的新闻文本进行预测,获得新闻文本中包含的新闻事件活动名称;本发明具有抽取新闻事件活动名称完整、准确和高效的优点。
Description
技术领域
本发明涉及新闻文本内容信息抽取领域,更为具体的,涉及一种基于深度学习的新闻事件活动名称抽取方法。
背景技术
新媒体时代下,我们每天接收到的新闻资讯数据呈现爆炸式增长,快速掌握新闻资讯内容成为迫切任务。自动抽取新闻事件活动名称能够满足用户便捷查看当前发生各个热点事件的需求,也可用于推荐、去重、提升事件排行榜单等业务场景,具有十分重要的实际意义。
目前新闻事件活动名抽取多采用序列标注技术方向来实现,是一个类似于实体识别但又难于实体识别的任务。实际生产中面临着许多难点问题:如中文分词问题,错误的分词会导致最后抽取的事件活动名称不完整,出现中文词语被错误截断的问题;另外由于事件活动名相对实体而言往往更长,较长的文本信息就需要考虑上下文信息捕捉与传递误差的问题,否则容易出现信息抽取不完全;事件活动名称往往包含更复杂的语法特征,结构信息相对于实体而言也更复杂更多变。
发明内容
本发明的目的在于克服现有技术的不足,为解决上述问题,提供一种基于深度学习的新闻事件活动名称抽取方法,解决背景中的问题,具有抽取新闻事件活动名称完整、准确和高效的优点。
本发明的目的是通过以下方案实现的:
一种基于深度学习的新闻事件活动名称抽取方法,包括步骤:
S1,收集新闻文本数据并标注其中的新闻事件活动名称,构建新闻事件活动名称数据集;
S2,利用预训练模型与深度学习方法构建新闻事件活动名称抽取模型,并利用所述新闻事件活动名称数据集训练所述新闻事件活动名称抽取模型;
S3,利用步骤S2中训练好的新闻事件活动名称抽取模型,对输入的新闻文本进行预测,获得新闻文本中包含的新闻事件活动名称。
进一步地,步骤S1包括子步骤:
S11,对收集的新闻文本数据,根据中文语句分割符号进行分句后,记录分句后的新闻文本数量K,K为正整数;
S12,将完成分句的K条新闻文本数据,复制N份并分发给N个相互独立的标注系统进行数据标注,N为正整数;
S13,构建评价中心服务,收集N个标注系统的已标注数据,对N个标注系统的标注质量进行评价并将存在标注争议的数据回退给标注系统,直至标注争议消除,并在满足预选设定的条件后生成新闻事件活动名称数据集。
进一步地,步骤S2中所述构建新闻事件活动名称抽取模型包括构建:文本字符编码层、文本分词编码层、文本词语编码层、文本特征融合层和事件活动名称抽取层。
进一步地,步骤S3包括子步骤:
S31,按照中文语句分割符号对收集到的新闻文本数据进行分句,将分句后的新闻文本数据输入到所述新闻事件活动名称抽取模型;
S33,对新闻事件活动名称进行后处理,得到输入新闻文本数据中所包含的事件名称预测结果。
进一步地,步骤S12中在所述复制N份并分发给N个相互独立的标注系统后,由N位新闻从业人员进行数据标注。
进一步地,步骤S13中包括子步骤:
S132,基于N个标注系统的相同文本内容的已标注数据,若N个标注系统对于同一
条数据产生M种不同的标注结果,M为正整数;第i种标注结果的数量为mi,i=1,2,...,M,计
算标注争议判定权重如下:
S133,判定当前新闻文本的标注结果是否存在争议,判定方法如下:
S134,基于步骤S133的判断结果进行处理:若当前新闻文本的标注结果有争议,则
将N个系统对于当前新闻文本的标注全部清除并返回到N个系统进行再标注,若当前新闻文
本的标注结果无争议,则记录为无争议标注文本数据并统计无争议标注文本数据数量,记
为;
数量最多的第i个标注结果;若S135的计算结果不满足条件,则重复步骤
S132至S135,直至满足条件后将K条新闻文本数据,及其最优标注结果导出为新闻事
件活动名称数据集,其中,最优标注结果的定义为:每一条新闻文本数据在全部N个标注系
统的M种标注结果中,数量最多的第i个标注结果。
进一步地,构建所述文本分词编码层包括子步骤:
S2A1,对输入的新闻文本进行分词,并根据BMES规则进行分词标注;
进一步地,构建所述文本词语编码层包括子步骤:
S2B1,统计输入新闻文本的字符数量L;
进一步地,构建文本特征融合层包括子步骤:
进一步地,步骤S2B4包括子步骤:
进一步地,步骤S33中所述后处理包括子步骤:
本发明的有益效果是:
本发明实施例,解决了背景中提成的问题,具有抽取新闻事件活动名称完整、准确和高效的优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于深度学习的新闻事件活动名称抽取方法的框架图。
图2为本发明实施例中构建自动评价中心服务的步骤流程图。
图3为利用基于深度学习的新闻事件活动名称抽取系统进行新闻事件活动名称抽取过程示意图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
如图1所示,一种基于深度学习的新闻事件活动名称抽取方法,包括步骤:
S1,收集新闻文本数据并标注其中的新闻事件活动名称,构建新闻事件活动名称数据集;
S2,利用预训练模型与深度学习方法构建新闻事件活动名称抽取模型,并利用所述新闻事件活动名称数据集训练所述新闻事件活动名称抽取模型;
S3,利用步骤S2中训练好的新闻事件活动名称抽取模型,对输入的新闻文本进行预测,获得新闻文本中包含的新闻事件活动名称。
在本发明的其他可选实施例中,需要进一步说明的是,步骤S1包括子步骤:
S11,对收集的新闻文本数据,根据中文语句分割符号进行分句后,记录分句后的新闻文本数量K,K为正整数;可以通过互联网、广播电视、报刊杂志收集新闻文本数据;中文语句分割符号包括:句号(“。”)、感叹号(“!”)、问号、省略号(“……”);
S12,将完成分句的K条新闻文本数据,复制N份并分发给N个相互独立的标注系统进行数据标注,N为正整数;
S13,构建评价中心服务,收集N个标注系统的已标注数据,对N个标注系统的标注质量进行评价并将存在标注争议的数据回退给标注系统,直至标注争议消除,并在满足预选设定的条件后生成新闻事件活动名称数据集。
在本发明的其他可选实施例中,需要进一步说明的是,步骤S2中所述构建新闻事件活动名称抽取模型包括构建:文本字符编码层、文本分词编码层、文本词语编码层、文本特征融合层和事件活动名称抽取层。
在本发明的其他可选实施例中,需要进一步说明的是,步骤S3包括子步骤:
S31,按照中文语句分割符号对收集到的新闻文本数据进行分句,将分句后的新闻文本数据输入到所述新闻事件活动名称抽取模型;中文语句分割符号包括:句号(“。”)、感叹号(“!”)、问号、省略号(“……”);
S33,对新闻事件活动名称进行后处理,得到输入新闻文本数据中所包含的事件名称预测结果。
在本发明的其他可选实施例中,需要进一步说明的是,步骤S12中在所述复制N份并分发给N个相互独立的标注系统后,由N位新闻从业人员进行数据标注。
在本发明的其他可选实施例中,需要进一步说明的是,如图2所示,步骤S13中包括子步骤:
S132,基于N个标注系统的相同文本内容的已标注数据,若N个标注系统对于同一
条数据产生M种不同的标注结果,M为正整数,;,第i种标注结果的数量为mi,i=1,2,...,M,
计算标注争议判定权重如下:
S133,判定当前新闻文本的标注结果是否存在争议,判定方法如下:
S134,基于步骤S133的判断结果进行处理:若当前新闻文本的标注结果有争议,则
将N个系统对于当前新闻文本的标注全部清除并返回到N个系统进行再标注,若当前新闻文
本的标注结果无争议,则记录为无争议标注文本数据并统计无争议标注文本数据数量,记
为;
数量最多的第i个标注结果;若S135的计算结果不满足条件,则重复步骤
S132至S135,直至满足条件后将K条新闻文本数据,及其最优标注结果导出为新闻事
件活动名称数据集,其中,最优标注结果的定义为:每一条新闻文本数据在全部N个标注系
统的M种标注结果中,数量最多的第i个标注结果。
在本发明的其他可选实施例中,需要进一步说明的是,如图3所示,构建所述文本分词编码层包括子步骤:
S2A1,对输入的新闻文本进行分词,并根据BMES规则进行分词标注;在该步骤中所述对输入的新闻文本进行分词,可使用开源工具包jieba;,其中,“BMES”规则是指:多字符组合而成的词语,第一个字符标记为“B”,中间字符标记为“M”,结束字符标记为“E”;单字符形成的词语或标点标记为“S”;
在本发明的其他可选实施例中,需要进一步说明的是,构建所述文本词语编码层包括子步骤:
S2B1,统计输入新闻文本的字符数量L;
在本发明的其他可选实施例中,需要进一步说明的是,如图3所示,构建文本特征融合层包括子步骤:
在本发明的其他可选实施例中,需要进一步说明的是,步骤S2B4包括子步骤:
在本发明的其他可选实施例中,需要进一步说明的是,步骤S33中所述后处理包括子步骤:
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。
Claims (13)
1.一种基于深度学习的新闻事件活动名称抽取方法,其特征在于,包括步骤:
S1,收集新闻文本数据并标注其中的新闻事件活动名称,构建新闻事件活动名称数据集;
S2,利用预训练模型与深度学习方法构建新闻事件活动名称抽取模型,并利用所述新闻事件活动名称数据集训练所述新闻事件活动名称抽取模型;
S3,利用步骤S2中训练好的新闻事件活动名称抽取模型,对输入的新闻文本进行预测,获得新闻文本中包含的新闻事件活动名称。
2.根据权利要求1所述的基于深度学习的新闻事件活动名称抽取方法,其特征在于,步骤S1包括子步骤:
S11,对收集的新闻文本数据,根据中文语句分割符号进行分句后,记录分句后的新闻文本数量K,K为正整数;
S12,将完成分句的K条新闻文本数据,复制N份并分发给N个相互独立的标注系统进行数据标注,N为正整数;
S13,构建评价中心服务,收集N个标注系统的已标注数据,对N个标注系统的标注质量进行评价并将存在标注争议的数据回退给标注系统,直至标注争议消除,并在满足预选设定的条件后生成新闻事件活动名称数据集。
3.根据权利要求1所述的基于深度学习的新闻事件活动名称抽取方法,其特征在于,步骤S2中所述构建新闻事件活动名称抽取模型包括构建:文本字符编码层、文本分词编码层、文本词语编码层、文本特征融合层和事件活动名称抽取层。
5.根据权利要求2所述的基于深度学习的新闻事件活动名称抽取方法,其特征在于,步骤S12中在所述复制N份并分发给N个相互独立的标注系统后,由N位新闻从业人员进行数据标注。
6.根据权利要求2所述的基于深度学习的新闻事件活动名称抽取方法,其特征在于,步骤S13中包括子步骤:
S132,基于N个标注系统的相同文本内容的已标注数据,若N个标注系统对于同一条数
据产生M种不同的标注结果,M为正整数;第i种标注结果的数量为mi,i=1,2,...,M,计算标
注争议判定权重如下:
S133,判定当前新闻文本的标注结果是否存在争议,判定方法如下:
S134,基于步骤S133的判断结果进行处理:若当前新闻文本的标注结果有争议,则将N个系统对于当前新闻文本的标注全部清除并返回到N个系统进行再标注,若当前新闻文本的标注结果无争议,则记录为无争议标注文本数据并统计无争议标注文本数据数量,记为;
13.根据权利要求4所述的基于深度学习的新闻事件活动名称抽取方法,其特征在于,步骤S33中所述后处理包括子步骤:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111354123.1A CN113792545B (zh) | 2021-11-16 | 2021-11-16 | 一种基于深度学习的新闻事件活动名称抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111354123.1A CN113792545B (zh) | 2021-11-16 | 2021-11-16 | 一种基于深度学习的新闻事件活动名称抽取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113792545A true CN113792545A (zh) | 2021-12-14 |
CN113792545B CN113792545B (zh) | 2022-03-04 |
Family
ID=78955221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111354123.1A Active CN113792545B (zh) | 2021-11-16 | 2021-11-16 | 一种基于深度学习的新闻事件活动名称抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792545B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795039A (zh) * | 2023-02-08 | 2023-03-14 | 成都索贝数码科技股份有限公司 | 基于深度学习的风格标题生成方法、设备及介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995015538A1 (en) * | 1993-11-30 | 1995-06-08 | Polaroid Corporation | Coding methods and apparatus for scaling and filtering images using discrete cosine transforms |
CN107239445A (zh) * | 2017-05-27 | 2017-10-10 | 中国矿业大学 | 一种基于神经网络的新闻事件抽取的方法及系统 |
CN108959305A (zh) * | 2017-05-22 | 2018-12-07 | 北京国信宏数科技有限公司 | 一种基于互联网大数据的事件抽取方法及系统 |
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN110209815A (zh) * | 2019-05-23 | 2019-09-06 | 国家计算机网络与信息安全管理中心 | 一种卷积神经网络的新闻用户兴趣挖掘方法 |
CN110633409A (zh) * | 2018-06-20 | 2019-12-31 | 上海财经大学 | 一种融合规则与深度学习的汽车新闻事件抽取方法 |
CN110737812A (zh) * | 2019-09-20 | 2020-01-31 | 浙江大学 | 一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法 |
CN111931775A (zh) * | 2020-09-28 | 2020-11-13 | 成都索贝数码科技股份有限公司 | 自动获取新闻标题方法、系统、计算机设备及存储介质 |
CN112269949A (zh) * | 2020-10-19 | 2021-01-26 | 杭州叙简科技股份有限公司 | 一种基于事故灾害新闻的信息结构化方法 |
CN112347245A (zh) * | 2020-09-29 | 2021-02-09 | 徐佳慧 | 面向投融资领域机构的观点挖掘方法、装置和电子设备 |
KR20210036318A (ko) * | 2020-03-20 | 2021-04-02 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 |
CN112967144A (zh) * | 2021-03-09 | 2021-06-15 | 华泰证券股份有限公司 | 一种金融信用风险事件抽取方法、可读存储介质及设备 |
CN112989841A (zh) * | 2021-02-24 | 2021-06-18 | 中国搜索信息科技股份有限公司 | 一种用于突发事件新闻识别与分类的半监督学习方法 |
CN113128232A (zh) * | 2021-05-11 | 2021-07-16 | 济南大学 | 一种基于albert与多重词信息嵌入的命名实体识别方法 |
-
2021
- 2021-11-16 CN CN202111354123.1A patent/CN113792545B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995015538A1 (en) * | 1993-11-30 | 1995-06-08 | Polaroid Corporation | Coding methods and apparatus for scaling and filtering images using discrete cosine transforms |
CN108959305A (zh) * | 2017-05-22 | 2018-12-07 | 北京国信宏数科技有限公司 | 一种基于互联网大数据的事件抽取方法及系统 |
CN107239445A (zh) * | 2017-05-27 | 2017-10-10 | 中国矿业大学 | 一种基于神经网络的新闻事件抽取的方法及系统 |
CN110633409A (zh) * | 2018-06-20 | 2019-12-31 | 上海财经大学 | 一种融合规则与深度学习的汽车新闻事件抽取方法 |
CN109992664A (zh) * | 2019-03-12 | 2019-07-09 | 平安科技(深圳)有限公司 | 争议焦点的标注分类方法、装置、计算机设备和存储介质 |
CN110209815A (zh) * | 2019-05-23 | 2019-09-06 | 国家计算机网络与信息安全管理中心 | 一种卷积神经网络的新闻用户兴趣挖掘方法 |
CN110737812A (zh) * | 2019-09-20 | 2020-01-31 | 浙江大学 | 一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法 |
KR20210036318A (ko) * | 2020-03-20 | 2021-04-02 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 |
CN111931775A (zh) * | 2020-09-28 | 2020-11-13 | 成都索贝数码科技股份有限公司 | 自动获取新闻标题方法、系统、计算机设备及存储介质 |
CN112347245A (zh) * | 2020-09-29 | 2021-02-09 | 徐佳慧 | 面向投融资领域机构的观点挖掘方法、装置和电子设备 |
CN112269949A (zh) * | 2020-10-19 | 2021-01-26 | 杭州叙简科技股份有限公司 | 一种基于事故灾害新闻的信息结构化方法 |
CN112989841A (zh) * | 2021-02-24 | 2021-06-18 | 中国搜索信息科技股份有限公司 | 一种用于突发事件新闻识别与分类的半监督学习方法 |
CN112967144A (zh) * | 2021-03-09 | 2021-06-15 | 华泰证券股份有限公司 | 一种金融信用风险事件抽取方法、可读存储介质及设备 |
CN113128232A (zh) * | 2021-05-11 | 2021-07-16 | 济南大学 | 一种基于albert与多重词信息嵌入的命名实体识别方法 |
Non-Patent Citations (5)
Title |
---|
DU JINLIAN 等: "Chinese Word Segmentation in Electronic Medical Record Text via Graph Neural Network-Bidirectional LSTM-CRF Model", 《2020 IEEE INTERNATIONAL CONFERENCE ON BIOINFORMATICS AND BIOMEDICINE (BIBM)》 * |
ZHAO XINCHUN: "Research and Application of Event Finding based on massive Internet Imagine Tag", 《2014 INTERNATIONAL CONFERENCE ON COMPUTATIONAL INTELLIGENCE AND COMMUNICATION NETWORKS》 * |
丁兆云 等: "微博数据挖掘研究综述", 《计算机研究与发展》 * |
杨文浩 等: "基于BERT和深层等长卷积的新闻标签分类", 《计算机与现代化》 * |
钟华帅: "基于深度学习的实体和关系联合抽取模型研究与应用", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795039A (zh) * | 2023-02-08 | 2023-03-14 | 成都索贝数码科技股份有限公司 | 基于深度学习的风格标题生成方法、设备及介质 |
CN115795039B (zh) * | 2023-02-08 | 2023-06-02 | 成都索贝数码科技股份有限公司 | 基于深度学习的风格标题生成方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113792545B (zh) | 2022-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109472033B (zh) | 文本中的实体关系抽取方法及系统、存储介质、电子设备 | |
CN111966917B (zh) | 一种基于预训练语言模型的事件检测与摘要方法 | |
US20200073882A1 (en) | Artificial intelligence based corpus enrichment for knowledge population and query response | |
CN112070138B (zh) | 多标签混合分类模型的构建方法、新闻分类方法及系统 | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN111143571B (zh) | 实体标注模型的训练方法、实体标注方法以及装置 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN113792545B (zh) | 一种基于深度学习的新闻事件活动名称抽取方法 | |
WO2022143608A1 (zh) | 语言标注方法、装置、计算机设备和存储介质 | |
CN114782965A (zh) | 基于布局关联性的视觉富文档信息抽取方法、系统及介质 | |
CN117034948B (zh) | 基于多特征自适应融合的段落识别方法、系统及存储介质 | |
CN107783958B (zh) | 一种目标语句识别方法及装置 | |
CN112561530A (zh) | 一种基于多模型融合的交易流水处理方法及系统 | |
CN111736804A (zh) | 一种基于用户评论识别App关键功能的方法及装置 | |
CN107274077B (zh) | 课程先后序计算方法和设备 | |
CN110941713A (zh) | 基于主题模型的自优化金融资讯版块分类方法 | |
CN115526176A (zh) | 文本识别方法及装置、电子设备、存储介质 | |
CN113297482A (zh) | 基于多模型的搜索引擎数据的用户画像刻画方法及系统 | |
CN113934922A (zh) | 一种智能推荐的方法、装置、设备及计算机存储介质 | |
CN114049528B (zh) | 一种品牌名称识别的方法及设备 | |
CN112287184B (zh) | 基于神经网络的迁移标注方法、装置、设备及存储介质 | |
US20240086452A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems | |
CN114996394A (zh) | 知识图谱中知识点的抽取方法、系统、电子设备 | |
Marcé Gomis | Comparison of active learning methods for automatic document classification | |
CN118069789A (zh) | 一种面向立法意见的关键信息抽取方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |