CN106407387A - 一种针对医疗诊断文本的概念连接方法 - Google Patents

一种针对医疗诊断文本的概念连接方法 Download PDF

Info

Publication number
CN106407387A
CN106407387A CN201610828326.2A CN201610828326A CN106407387A CN 106407387 A CN106407387 A CN 106407387A CN 201610828326 A CN201610828326 A CN 201610828326A CN 106407387 A CN106407387 A CN 106407387A
Authority
CN
China
Prior art keywords
concept
medical
attachment according
span
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610828326.2A
Other languages
English (en)
Other versions
CN106407387B (zh
Inventor
朱佳
武兴成
肖菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong SUCHUANG Data Technology Co.,Ltd.
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201610828326.2A priority Critical patent/CN106407387B/zh
Publication of CN106407387A publication Critical patent/CN106407387A/zh
Application granted granted Critical
Publication of CN106407387B publication Critical patent/CN106407387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • G06F19/324
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明一种针对医疗诊断文本的概念连接方法涉及利用循环神经网络模型,模拟基于规则的系统采用的一系列复杂的形态和句法的转换,并使用向量式概念符号在测试时概括整理不可见的概念,共有其特征,然后沿图谱多层预测整个遍历,进行概念连接。该方法包括:第一步,构建循环神经网络系统(RNNs),所述的循环神经网络系统包括span编码器,概念编码器,解码器;第二步,对模型进行训练,所述的模型的基本数据源取自知识图谱中的医学系统命名法——临床术语(SNOMED‑CT)和输入‑输出数值;第三步,采用基于规则的算法,应用一系列复杂的形态和句法的转换,准确识别医疗记录的spans,并加注标签,形成相关概念的大数据集;第四步,对上述步骤的结果进行概念连接。该发明可实现了较高的精确率和召回率。

Description

一种针对医疗诊断文本的概念连接方法
技术领域
本发明涉及一种概念连接方法,尤其涉及一种针对医疗诊断文本的概念连接方法。
背景技术
知识图谱(KG)以符号方式整理收纳了大量知识,易于演算和推论。但是,它也有先天缺陷。由于知识图谱是经多人手工制作的,符号性导致其相对难处理,要知道,使用经过编码的知识并不是轻而易举的事。通常,使用知识图谱面临几项挑战:有些概念或者是太专业,或者是太宽泛;同一属性的概念出现在图谱的不同部分前后矛盾;一些概念模糊不清。此外,知识图谱一般只有通过加进新的概念和关系才能扩充,由此重构成本也相当昂贵。
在医学领域中,术语和词汇表使用得特别多,因为在该领域,重大的工程努力已造就了海量的使用标准词汇表的知识图谱。这些知识图谱保存有大量的重要数据,其中包括医生看病时写下的原始文本医疗诊断记录。如需搜寻、索引、特征化相关病例,通常的预处理步骤是对知识图谱进行相关的概念连接。
概念连接:亦称文本spans和概念的连接,是开发知识图谱中储存的信息财富的重要的第一步。常用的快捷概念连接方法是直接从同义词数据库中提取与之相配的字符串,这样做的优点是精确率比较高,但缺点是召回率低。众所周知,召回率是检索出的相关文档数和数据库中所有的相关文档数的比率,而精确率是检索出的相关文档数与检索出的文档总数的比率。凡是设计到大规模数据集合的检索和选取,都涉及到“召回率”和“精确率”这两个指标。由于这两个指标相互制约,召回率高时,精确率低,精确率高时,召回率低,人们通常也会根据需要为检索策略选择一个合适的度,不能太严格也不能太松,寻求在召回率和精确率中间的一个平衡点。这个平衡点由具体需求决定。
在医疗诊断文本的概念连接中,更看重的是精确率,但召回率也不能过低。
发明内容
有鉴于此,提供一种对医疗诊断文本进行概念连接的新方法。该方法利用循环神经网络模型,模拟基于规则的系统采用的一系列复杂的形态和句法的转 换,并使用向量式概念符号在测试时概括整理不可见的概念,共有其特征,然后沿图谱多层预测整个遍历,进行概念连接。
其中,一系列复杂的形态和句法的转换包括词根提取、后缀替换、首字母缩写词扩展。
所述的针对医疗诊断文本的概念连接方法包括以下步骤:
第一步,构建循环神经网络系统(RNNs),所述的循环神经网络系统包括span编码器,概念编码器,解码器;
第二步,对模型进行训练,所述的模型的基本数据源取自知识图谱中的医学系统命名法——临床术语(SNOMED-CT)和输入-输出数值;
第三步,采用基于规则的算法,应用一系列复杂的形态和句法的转换,准确识别医疗记录的spans,并加注标签,形成相关概念的大数据集;
第四步,对上述步骤的结果进行概念连接。
本发明实施技术方案的有益效果包括:
1、方案易实现和移植,采用了通用的循环神经网络系统(RNNs)基于规则的算法,包括一个span编码器,一个概念编码器和一个解码器,这套基本框架是通用的,可以很容易的移植到如不同医院的信息系统里并根据实际疾病的情况进行二次开发和升级。
2、本方案的实验基于大量的医学文本数据,体现了技术方案的可行性。
3、方案的其中一个重要目的是对医疗记录加注标签,从而形成相关概念的数据集为下一步的概念连接做准备。而本方案对训练好的模型采用基于规则的算法,应用一系列复杂的形态和句法的转换如词根提取、后缀替换、首字母缩写词扩展等,准确识别医疗记录的spans,并加注标签,形成相关概念的大数据集。规则引用了专家知识,而专家知识可以根据不同疾病的实际情况添加修改,从另一角度也体现了方案可移植性的优点。而经实验证明可以达到对医疗记录spans识别的需求,从而实现了较高的精确率和召回率。
附图说明
图1一种针对医疗诊断文本的概念连接方法的模型的结构图。
图2一种针对医疗诊断文本的概念连接方法的步骤图。
具体实施方式
下面结合具体实施例对本发明进行详细的说明。
一种针对医疗诊断文本的概念连接方法,该方法利用循环神经网络(RNNs)处理概念连接问题,特别着眼于用向量式概念符号在测试时概括整理不可见的概念,共有其特征,然后沿图谱多层预测整个遍历,使模型能满意地取得较好的连接效果。该方法包括以下步骤,如图2所示,
第一步201,构建循环神经网络系统(RNNs),如图1所示,组成件包含:
一个span编码器101,这是一个2层256单位的长短时记忆编码器,输入的span用词向量(由GloVe预训练)表示,产生256维的元素嵌入es,该输出对应于上一时间步的隐状态。
一个概念编码器102:该编码器通过平均每一概念的4-grams嵌入(此4-grams嵌入为随机初始化),产生一个256维的嵌入ec,然后将这些向量叠加为矩阵Ec。
一个解码器,本实施例设计了两种可能的解码器,一种是扁平解码器104,一种是序列解码器103,用于读取span和概念嵌入,以预测输出概念。
第二步202,对模型进行训练。本模型的基本数据源取自知识图谱中的医学系统命名法——临床术语(SNOMED-CT)和输入-输出数值,而后者包括大量文本和注释概念,分别取自ShARe/CLEF或者Synthetic。其中,SNOMED包括有疾病、症状和其它医学发现在内的共182,719个概念的子集。而输入-输出数值为合成数据集,包括美国MIMIC-III(重症监护医疗信息中心)的ICU医生搜集的约50,000例医疗记录。每种模型的训练约需8-12小时。
第三步203,采用基于规则的算法,应用一系列复杂的形态和句法的转换如词根提取、后缀替换、首字母缩写词扩展等,准确识别医疗记录的spans,并加注标签,形成相关概念的大数据集。
第四步204,按前面步骤的结果进行概念连接。
如图1为本发明的模型结构图,该模型分成三个主要部分:span编码器101、 概念编码器102和解码器(103和104)。输入模型的是医疗诊断文本的span,标签是代表遍历的分层概念表(由根概念起,到实际概念止)。
span编码器101:这是一个2层256单位的长短时记忆编码器,输入的span用词向量(由GloVe预训练)表示,产生256维的元素嵌入es,该输出对应于上一时间步的隐状态。
设xt代表词向量输入的序列。
h1,t=GRU1(xt,h1,t-1)
h2,t=GRU2(h1,t,h2,t-1)
es=[h1,T,h2,T]T
概念编码器102:该编码器通过平均每一概念的4-grams嵌入(此4-grams嵌入为随机初始化),产生一个256维的嵌入ec,然后将这些向量叠加为矩阵Ec。
设一个概念的ngrams(型)标注为n1到nk,则:
eci=mean(ni1,ni2,…nik)
Ec=[ec1,ec2,…]T
解码器(103和104):本申请设计了两种可能的解码器,用于读取span和概念嵌入,以预测输出概念。这两种解码器都采用了抽样的叉熵损失函数(扁平解码器使用0-1叉熵,序列解码器使用多级叉熵)总结训练样本,在序列解码器的场合,还需平均各个时间步的均值。需要注意的是,每次使用的时候只需用一种解码器。
扁平解码器104简单地取每个span(转换为256维后)和概念嵌入的点积,并将其代入sigmoid函数,产生每个概念的或然率。
Es,proj=Wprojes
在此解码器中,标签是一个沿遍历对应于各概念位置的稀疏向量。
序列解码器103是在解码时运行一个2层256单位的长短时记忆编码器,产生对应于遍历的概念序列。每一层的隐状态是由编码器中各层的最终隐状态初始化的。
h0=es
h1,t=GRU1(xt,h1,t-1)
h2,t=GRU2(h1,t,h2,t-1)
这里,m是沿遍历对应于有效子集位置含有1的掩码。
本申请采用了门控性单位(GRU)——特定形式的包含结构修改以减少消失的梯度问题的循环神经网络。GRU的正向传播方程是:
初态:h0=0
门:
输出:ct=tanh(Wxt+rt⊙Uht-1)
ht=zt⊙ht-1+(1-zt)⊙ct
此处,X1,……Xt是输入序列,⊙表示元素相乘。
本申请模型的基本数据源取自知识图谱中的医学系统命名法——临床术语(SNOMED-CT)和输入-输出数值,而后者包括大量文本和注释概念,分别取自ShARe/CLEF或者Synthetic。
使用的SNOMED中包括有疾病、症状和其它医学发现在内的共182,719个概念的子集。为去除SNOMED数据库可用性组的继承结构,选择带有大部分叶子节点的节点。
输入-输出数值为合成数据集,包括美国MIMIC-III(重症监护医疗信息中心)的ICU医生搜集的约50,000例医疗记录,由麻省理工学院计算生理学 实验室提供。这些记录是原始文本,无注释和概念标签。与之相对应的是ShARe/CLEF数据组,包含spans和人为标签的注释。本申请对UMLS(统一医学语言系统)词表的同义词集应用了扩展规则,包括插入停用词、后缀转换(如“dilated”转换为“dilation”)、词序颠倒等,得到了大约80,000个带标签的独特spans。
本发明的实验效果:本申请的模型在谷歌人工智能系统Tensorflow上完成,并在装有NVIDIAGTX 970显卡和4GB内存的计算机上接受训练。训练每个模型约需8-12小时。
本申请对两种模型(扁平解码器、序列解码器)执行四种不同任务进行评估:
1、合成数据组:这一评估在训练的700,000个spans中,测试了300,000个。
2、ShARe/CLEF:这一评估共有199个训练文本,99个测试文本。训练组包含5,816个spans,测试组包含5,351个spans。
3、ShARe/CLEF新概念:这一评估基于对训练组之外的ShARe/CLEF概念进行测试。
4、ShARe/CLEF新概念(Relax):这一评估测度新概念的表现。
每种评估的结果显示在表1中。
表1:两种模型在每项评价任务中的精确率/召回率/F1得分
实验结果表明,两种循环神经网络模型在处理合成数据组时,有着较高的精确率和召回率,达到了预期的效果,在大型数据库的概念连接方面潜力无限。序列解码器在处理ShARe/CLEF数据组时表现糟糕,主要原因是它的任务难得多(它必须依序预测遍历),更重要的是,当下的概念嵌入缺乏与层次相关的信 息。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种针对医疗诊断文本的概念连接方法,其特征在于,利用循环神经网络模型,模拟基于规则的系统采用的一系列复杂的形态和句法的转换,并使用向量式概念符号在测试时概括整理不可见的概念,共有其特征,然后沿图谱多层预测整个遍历,进行概念连接。
2.根据权利要求1所述的概念连接方法,其特征在于,所述的一系列复杂的形态和句法的转换包括词根提取、后缀替换、首字母缩写词扩展。
3.根据权利要求1所述的概念连接方法,其特征在于,所述的针对医疗诊断文本的概念连接方法包括以下步骤:
第一步,构建循环神经网络系统(RNNs),所述的循环神经网络系统包括span编码器,概念编码器,解码器;
第二步,对模型进行训练,所述的模型的基本数据源取自知识图谱中的医学系统命名法——临床术语(SNOMED-CT)和输入-输出数值;
第三步,采用基于规则的算法,应用一系列复杂的形态和句法的转换,准确识别医疗记录的spans,并加注标签,形成相关概念的大数据集;
第四步,对上述步骤的结果进行概念连接。
4.根据权利要求3所述的概念连接方法,其特征在于,所述span编码器为2层256单位的长短时记忆编码器,输入的span用词向量(由GloVe预训练)表示,产生256维的元素嵌入es,该输出对应于上一时间步的隐状态。
5.根据权利要求3所述的概念连接方法,其特征在于,所述概念编码器通过平均每一概念的4-grams嵌入,此4-grams嵌入为随机初始化,产生一个256维的嵌入ec,然后将这些向量叠加为矩阵Ec。
6.根据权利要求3所述的概念连接方法,其特征在于,所述解码器包括两种解码器,一种是扁平解码器,一种是序列解码器,用于读取span和概念嵌入,以预测输出概念。
7.根据权利要求6所述的概念连接方法,其特征在于,所述扁平解码器简单地取每个span和概念嵌入的点积,并将其代入sigmoid函数,产生每个概念的或然率。
8.根据权利要求6所述的概念连接方法,其特征在于,所述序列解码器是在解码时运行一个2层256单位的长短时记忆编码器,产生对应于遍历的概念序列。
9.根据权利要求3所述的概念连接方法,其特征在于,所述SNOMED包括有疾病、症状和其它医学发现在内的共182,719个概念的子集。
10.根据权利要求3所述的概念连接方法,其特征在于,所述输入-输出数值为合成数据集,包括美国MIMIC-III(重症监护医疗信息中心)的ICU医生搜集的约50,000例医疗记录。
CN201610828326.2A 2016-09-18 2016-09-18 一种针对医疗诊断文本的概念连接方法 Active CN106407387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610828326.2A CN106407387B (zh) 2016-09-18 2016-09-18 一种针对医疗诊断文本的概念连接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610828326.2A CN106407387B (zh) 2016-09-18 2016-09-18 一种针对医疗诊断文本的概念连接方法

Publications (2)

Publication Number Publication Date
CN106407387A true CN106407387A (zh) 2017-02-15
CN106407387B CN106407387B (zh) 2019-11-22

Family

ID=57997581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610828326.2A Active CN106407387B (zh) 2016-09-18 2016-09-18 一种针对医疗诊断文本的概念连接方法

Country Status (1)

Country Link
CN (1) CN106407387B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197290A (zh) * 2018-01-19 2018-06-22 桂林电子科技大学 一种融合实体和关系描述的知识图谱表示学习方法
CN108461152A (zh) * 2018-01-12 2018-08-28 平安科技(深圳)有限公司 医疗模型训练方法、医疗识别方法、装置、设备及介质
CN110275936A (zh) * 2019-05-09 2019-09-24 浙江工业大学 一种基于自编码神经网络的相似法律案例检索方法
WO2021184552A1 (zh) * 2020-03-19 2021-09-23 平安科技(深圳)有限公司 医疗文本搜索方法、装置、计算机设备及存储介质
CN114444504A (zh) * 2022-04-11 2022-05-06 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1696933A (zh) * 2005-05-27 2005-11-16 清华大学 基于动态规划的文本概念关系自动提取方法
US20150112664A1 (en) * 2010-12-09 2015-04-23 Rage Frameworks, Inc. System and method for generating a tractable semantic network for a concept
CN105677640A (zh) * 2016-01-08 2016-06-15 中国科学院计算技术研究所 一种面向开放文本的领域概念抽取方法
CN105701083A (zh) * 2014-11-28 2016-06-22 国际商业机器公司 文本表示方法和装置
US20160180215A1 (en) * 2014-12-19 2016-06-23 Google Inc. Generating parse trees of text segments using neural networks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1696933A (zh) * 2005-05-27 2005-11-16 清华大学 基于动态规划的文本概念关系自动提取方法
US20150112664A1 (en) * 2010-12-09 2015-04-23 Rage Frameworks, Inc. System and method for generating a tractable semantic network for a concept
CN105701083A (zh) * 2014-11-28 2016-06-22 国际商业机器公司 文本表示方法和装置
US20160180215A1 (en) * 2014-12-19 2016-06-23 Google Inc. Generating parse trees of text segments using neural networks
CN105677640A (zh) * 2016-01-08 2016-06-15 中国科学院计算技术研究所 一种面向开放文本的领域概念抽取方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108461152A (zh) * 2018-01-12 2018-08-28 平安科技(深圳)有限公司 医疗模型训练方法、医疗识别方法、装置、设备及介质
WO2019136806A1 (zh) * 2018-01-12 2019-07-18 平安科技(深圳)有限公司 医疗模型训练方法、医疗识别方法、装置、设备及介质
CN108197290A (zh) * 2018-01-19 2018-06-22 桂林电子科技大学 一种融合实体和关系描述的知识图谱表示学习方法
CN108197290B (zh) * 2018-01-19 2021-08-03 桂林电子科技大学 一种融合实体和关系描述的知识图谱表示学习方法
CN110275936A (zh) * 2019-05-09 2019-09-24 浙江工业大学 一种基于自编码神经网络的相似法律案例检索方法
CN110275936B (zh) * 2019-05-09 2021-11-23 浙江工业大学 一种基于自编码神经网络的相似法律案例检索方法
WO2021184552A1 (zh) * 2020-03-19 2021-09-23 平安科技(深圳)有限公司 医疗文本搜索方法、装置、计算机设备及存储介质
CN114444504A (zh) * 2022-04-11 2022-05-06 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质
CN114444504B (zh) * 2022-04-11 2022-08-05 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN106407387B (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN111415740B (zh) 问诊信息的处理方法、装置、存储介质及计算机设备
CN106980683B (zh) 基于深度学习的博客文本摘要生成方法
CN111078836B (zh) 基于外部知识增强的机器阅读理解方法、系统、装置
US20190347269A1 (en) Structured report data from a medical text report
CN106407387B (zh) 一种针对医疗诊断文本的概念连接方法
CN110472229A (zh) 序列标注模型训练方法、电子病历处理方法及相关装置
CN107977361A (zh) 基于深度语义信息表示的中文临床医疗实体识别方法
CN106295186A (zh) 一种基于智能推理的辅助疾病诊断的方法与系统
CN106776711A (zh) 一种基于深度学习的中文医学知识图谱构建方法
CN110459282A (zh) 序列标注模型训练方法、电子病历处理方法及相关装置
CN110162779A (zh) 病历质量的评估方法、装置及设备
CN110442840A (zh) 序列标注网络更新方法、电子病历处理方法及相关装置
CN106874279A (zh) 生成应用类别标签的方法及装置
Schmidt et al. Data mining in clinical trial text: Transformers for classification and question answering tasks
CN111145913B (zh) 基于多重注意力模型的分类方法、装置及设备
Islam et al. A comprehensive survey on applications of transformers for deep learning tasks
CN112071429A (zh) 一种基于知识图谱的医疗自动问答系统构建方法
CN112000778A (zh) 一种基于语义识别的自然语言处理方法、装置和系统
Isljamovic et al. Predicting students’ academic performance using artificial neural network: a case study from faculty of organizational sciences
CN114298314A (zh) 一种基于电子病历的多粒度因果关系推理方法
Behnisch et al. Urban data-mining: spatiotemporal exploration of multidimensional data
Sandra et al. Social network analysis algorithms, techniques and methods
Hakimov et al. Evaluating architectural choices for deep learning approaches for question answering over knowledge bases
CN113761188A (zh) 文本标签确定方法、装置、计算机设备和存储介质
CN117216617A (zh) 文本分类模型训练方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220325

Address after: 510000 5548, floor 5, No. 1023, Gaopu Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: Guangdong SUCHUANG Data Technology Co.,Ltd.

Address before: 510631 No. 55, Zhongshan Avenue, Tianhe District, Guangdong, Guangzhou

Patentee before: SOUTH CHINA NORMAL University

TR01 Transfer of patent right