CN113434700A - 水产动物疾病诊断与防治知识图谱构建方法 - Google Patents

水产动物疾病诊断与防治知识图谱构建方法 Download PDF

Info

Publication number
CN113434700A
CN113434700A CN202110777475.1A CN202110777475A CN113434700A CN 113434700 A CN113434700 A CN 113434700A CN 202110777475 A CN202110777475 A CN 202110777475A CN 113434700 A CN113434700 A CN 113434700A
Authority
CN
China
Prior art keywords
aquatic product
name
disease
nam
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110777475.1A
Other languages
English (en)
Other versions
CN113434700B (zh
Inventor
于红
刘巨升
杨惠宁
杨鹤
孙哲涛
张思佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Ocean University
Original Assignee
Dalian Ocean University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Ocean University filed Critical Dalian Ocean University
Priority to CN202110777475.1A priority Critical patent/CN113434700B/zh
Publication of CN113434700A publication Critical patent/CN113434700A/zh
Application granted granted Critical
Publication of CN113434700B publication Critical patent/CN113434700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种水产动物疾病诊断与防治知识图谱构建方法,包括:对现实生产中数据的收集,并对收集到的数据进行预处理变成标准数据集;对标准数据集进行数据类别划分并根据相应规则对数据进行标注;将经过预处理后的文本分为训练部分和应用部分,根据标注规则对训练部分文本进行人工标注,并进行模型训练;将得到的实体与关系进行知识的融合;最后将融合后的具有重要含义的融合知识送入Neo4j图数据库中自动构建出包含水产动物疾病诊断与防治的医学知识图谱,便于生产者获取水产养殖相关知识。

Description

水产动物疾病诊断与防治知识图谱构建方法
技术领域
本发明涉及水产医学知识图谱构建领域,尤其是一种水产动物疾病诊断及防治图谱构建方法。
背景技术
水产动物病害是影响水产养殖产业发展的主要原因之一,水产动物病害防治成为提高水产养殖质量、提升水产养殖业发展水平的关键,而水产动物病害的有效防治需要对水产动物病害信息即水产医学知识进行有效的利用。
目前,知识图谱构建是提高领域知识利用率的主流方法,在农业、医学等领域都有广泛应用。昝红英等针对多源的临床医学文本,构建了CMeKG知识图谱,涉及20余万医学实体以及100余万概念关系实例和属性三元组,为医疗问答系统和智能辅助诊疗等领域奠定了知识基础(昝红英,窦华溢,贾玉祥,关同峰,奥德玛,张坤丽,穗志方.基于多来源文本的中文医学知识图谱的构建.郑州大学学报(理学版),2020,2:45-51);华东理工大学构建了中医药知识图谱,汇集了大量国内外现有药品的种类和介绍,为患者和医师提供查询便利(阮彤,孙程琳,王昊奋等.中医药知识图谱构建与应用[J].医学信息学杂志,2016 ,37(4):8-13)。中国发明专利公开号为CN 112635071 A公开了一种融合中西医知识的糖尿病知识图谱构建方法,通过构建疾病层、症状症候层和治疗层,组成关于糖尿病的融合中西医知识的实体概念层;将获得数据填入融合中西医知识的实体概念层,对中西医数据进行标注并识别,从而获得中医医学实体和西医医学实体;又设立了概念定义模块、实体分类模块、属性划分模块、关系匹配模块、构建模块,对得到的中西医实体进行处理,最终构建出知识图谱。中国发明专利公开号为CN 111816273 B 公开了一种海量电子病历的大规模医学知识图谱构建方法,是采用并行的构建方式,为每一个子数据源构建一个对应的子图谱;采用并行的方式对子图谱进行融合,直到最后只有一个图谱,可以大量节省构建所需的时间,用最快的速度实现对电子病历文本的构建。
综上所述均是针对生物医学知识图谱的构建,而没有针对水产生物医学知识图谱的构架,以至于现有的水产动物病害诊断及防治服务主要通过关键字匹配的方式进行,即只能找到与关键字相关的信息,而且获取的信息大多是根据个人经验给出的答案,用户获取的知识不具有准确性和实时性。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种水产动物疾病诊断及防治图谱构建方法。
本发明的技术解决方案是:一种水产动物疾病诊断与防治知识图谱构建方法,其特征在于按照如下步骤进行:
步骤1.收集水产动物疾病诊断与防治相关的医学文本;
步骤2.将收集到的医学文本进行预处理;
步骤3.将经过预处理后的文本分为训练部分和应用部分,根据标注规则对训练部分文本进行人工标注,并进行模型训练;
所述标注规则如下:
(1)医学文本为如下6类实体时,则分别标注如下:
水产品名称,标注为B-NAM;
水产品病灶部位,标注为B-BOD;
水产品患病病原体,标注为B-PAT;
水产品患病临床表现,标注为B-SYM;
水产品患病名称,标注为B-DIS;
治疗疾病所需药品名称,标注为B-MED;
(2)医学文本为如下7类实体关系时,则分别标注如下:
水产品名称-水产品病灶部位-从属关系,标注为NAM-BOD-CS;
水产品名称-水产品患病病原体-病原关系,标注为NAM-PAT-BY;
水产品名称-水产品患病名称-患病关系,标注为NAM-DIS-HB;
水产品名称-治疗疾病所需药品名称-使用关系,标注为NAM-MED-SY;
水产品名称-水产品患病临床表现-症状关系,标注为NAM-SYM-ZZ;
水产品患病病原体-水产品患病名称-引起关系,标注为PAT-DIS-YQ;
水产品患病名称-治疗疾病所需药品名称-治疗关系,标注为DIS-MED-ZL;
(3)当水产品名称与患病名称嵌套时,将水产品名称标注为B-NAM,将患病名称标注为B-DIS;
(4)当水产品病灶部位与临床症状表现嵌套时,将病灶部位标注为NAM-BOD-CS、临床症状表现NAM-SYM-ZZ;
(5)当水产品病灶部位与形容词和患病临床表现嵌套时,将描述病灶部位形容词与病灶部位混合作为病灶部位进行标注,标注为NAM-BOD-CS,患病临床表现标注为NAM-SYM-ZZ;
(6)当患病病原体与病原体身体部位嵌套时,只标注患病病原体,标注为NAM-PAT-BY;
(7)当患病病原体与大量寄生嵌套时,将患病病原体与大量寄生作为整体进行标注,标注为NAM-PAT-BY;
(8)当出现死亡一词时,不作为临床症状进行标注;
步骤4.用训练好的模型对应用部分文本进行实体的识别和实体关系的抽取,分别得到实体和实体关系的标签序列,具体如下:
步骤4.1采用BERT的词嵌入方法,将文本序列变成机器可识别的向量矩阵;
步骤4.2将获得的向量矩阵送入BiLSTM+CRF中进行特征提取和标签预测;
步骤4.3将提取到的特征矩阵进行特征整合,获得整合特征矩阵;
步骤4.4将整合特征矩阵计入Attention,得到添加Attention的整合特征矩阵;
步骤4.5将添加Attention的整合特征矩阵送入下一层BiLSTM+CRF中进行特征提取和标签预测,分别得到实体和实体关系的标签序列;
步骤5. 将得到的实体和实体关系的标签序列进行知识融合,并将融合后的实体和实体关系的标签序列送入Neo4j图数据库中,形成水产动物疾病诊断与防治的医学知识图谱。
本发明可将水产动物疾病诊断与防治知识以图谱的形式呈现出来,与传统的水产养殖病害知识获取相比,会更加准确和快捷;本发明与其他命名实体识别和关系抽取的方法相比,能够有效地解决水产医学文本中出现的一词多义、模糊边界、长距离依赖不足等问题,识别效果较高,其识别准确率、召回率及F1值均能达到90%以上,明显高于现有技术,可以满足用户需求。
附图说明
图1是本发明实施例所构建的图谱查询效果图。
具体实施方式
本发明的一种水产动物疾病诊断与防治知识图谱构建方法,按照如下步骤进行:
步骤1.收集水产动物疾病诊断与防治相关的医学文本,获取的来源是水产养殖网上近5年发表的400篇关于水产动物疾病诊断及防治的文章,共计20万余字的语料;在正规出本社出版的最近10年的20本关于水产动物疾病防治相关的书籍,共计80万余字的语料;
步骤2.将收集到的医学文本进行预处理,即将PDF版的文本内容通过识别的方法转换为word版的文档并进行修复,去掉其中的乱码和错别字以及作者署名、出版地、出版日期、停用词等与构建知识图谱无关的文本,再将文本转化为一字一行的单列文本,通过UltraEdit文本编辑器中的正则表达式以及字符格式规范,获取规范的语料库文本,在每一句文本的句号后面添加一行空行作为电脑可识别的断点;
步骤3.将经过预处理后的文本的40%为训练部分,剩余60%为应用部分,根据标注规则对训练部分文本进行人工标注,并进行模型训练;
所述标注规则如下:
(1)医学文本为如下6类实体时,则分别标注如下:
水产品名称,标注为B-NAM;
水产品病灶部位,标注为B-BOD;
水产品患病病原体,标注为B-PAT;
水产品患病临床表现,标注为B-SYM;
水产品患病名称,标注为B-DIS;
治疗疾病所需药品名称,标注为B-MED;
(2)医学文本为如下7类实体关系时,则分别标注如下:
水产品名称-水产品病灶部位-从属关系,标注为NAM-BOD-CS;
水产品名称-水产品患病病原体-病原关系,标注为NAM-PAT-BY;
水产品名称-水产品患病名称-患病关系,标注为NAM-DIS-HB;
水产品名称-治疗疾病所需药品名称-使用关系,标注为NAM-MED-SY;
水产品名称-水产品患病临床表现-症状关系,标注为NAM-SYM-ZZ;
水产品患病病原体-水产品患病名称-引起关系,标注为PAT-DIS-YQ;
水产品患病名称-治疗疾病所需药品名称-治疗关系,标注为DIS-MED-ZL;
(3)当水产品名称与患病名称嵌套时,分别将水产品名称标注为B-NAM,将患病名称标注为B-DIS;如“胡子鲶黏孢子虫病”,则将“胡子鲶”标为水产品名称,标注为B-NAM ,“黏孢子虫病”标为疾病名称,标注为B-DIS;
(4)当水产品病灶部位与临床症状表现嵌套时,将病灶部位标注为NAM-BOD-CS、将临床症状表现标注为NAM-SYM-ZZ;如“皮肤表面溃烂,腹穿孔”,则将“皮肤表面”标为病灶部位,标注为NAM-BOD-CS ,“溃烂”标为临床症状表现,标注为NAM-SYM-ZZ;
(5)当水产品病灶部位与形容词和患病临床表现嵌套时,将描述病灶部位形容词与病灶部位混合作为病灶部位进行标注,如“使背鳍基部肿胀,充血”,将形容词“充血”与“背鳍基部”标为病灶部位,标注为NAM-BOD-CS,将“肿胀”标为患病临床表现,标注为NAM-SYM-ZZ;
(6)当患病病原体与病原体身体部位嵌套时,只标注患病病原体,标注为NAM-PAT-BY,避免与发病部位重合,如“成螨体黑色,背部有花纹”,只将“成螨标为患病病原体,标注为NAM-PAT-BY;
(7)当患病病原体与大量寄生嵌套时,将患病病原体与大量寄生作为整体进行标注,如“斜管虫大量寄生”整体标注为患病病原体,标注为NAM-PAT-BY;
(8)当出现死亡一词时,不作为临床症状进行标注;
本发明实施例使用的标注方法是BIO标注方法,BIO标注模式中将每个元素标注为“B-X”、“I-X”或者“O”。其中,“B-X”表示元素所在片段属于X类型并且元素在此片段开头,“I-X”表示元素所在的片段属于X类型并且元素在此片段的中间和结尾位置,“O”表示不属于任何类型;
步骤5.用训练好的模型对应用部分文本进行实体的识别和实体关系的抽取,分别得到实体和实体关系的标签序列,具体如下:
步骤5.1采用BERT的词嵌入方法,将文本序列变成机器可识别的向量矩阵:
例如Bert模型将文本序列中的每个字即“鲤 鱼 骨 骼 肌 点 状 出 血”这个序列中每个字进行编码,并且将其分为三部分特征,分别是字映射的向量、字的在文本序列中位置向量特征、这段文本在整个文章中的位置向量信息,Bert将这三部分特征进行整合作为每个字的字向量矩阵。
Bert中设置了Q、K、V三个向量矩阵,通过这三个向量矩阵的计算得到最终的每个字的特征向量矩阵。
Q、K、V三个向量矩阵具体的计算过程如下:
Figure 402412DEST_PATH_IMAGE001
式中Q、K、V分别代表Bert定义的三个向量矩阵,Q矩阵代表当前词查询其他词需要的权重值,K矩阵表示当前词被其他词查询是需要的权重值,V矩阵表示整体的词的权重矩阵。
式中softmax表示激活函数做归一化处理得到概率值,式中根号d是对矩阵进行降维处理。
步骤5.2将获得的向量矩阵送入BiLSTM+CRF中进行特征提取和标签预测:
在BiLSTM模型中,通过LSTM来提取实体的特征,具体的实体提取的计算过程如下:
Figure 938085DEST_PATH_IMAGE002
(1)
Figure 779002DEST_PATH_IMAGE003
(2)
Figure 256251DEST_PATH_IMAGE004
(3)
Figure 575237DEST_PATH_IMAGE005
(4)
Figure 821542DEST_PATH_IMAGE006
(5)
Figure 833360DEST_PATH_IMAGE007
(6)
式中其中f、i、o分别为LSTM模型中的输入门、遗忘门、输出门;x为输入,h为输出,
Figure 532326DEST_PATH_IMAGE008
为sigmod激活函数、tanh为双曲面正切函数;
Figure 592686DEST_PATH_IMAGE009
Figure 818131DEST_PATH_IMAGE010
为训练参数,Ct
Figure 876217DEST_PATH_IMAGE011
、Ct-1表示记忆单元,通过三个记忆单元就可以实现对特征的提取,将有用的信息保留,将无用的信息遗忘,并将有用的信息传递给下一层,最终获得包含上下文特征的特征向量,然后传入CRF中进行标签的预测。
步骤5.3将提取到的特征矩阵进行特征整合,获得整合特征矩阵;
特征整合的具体计算过程:
Figure 187112DEST_PATH_IMAGE012
(1)
式中mi实体合并表示,Zi是第i个来自BiLSTM网络的单词,end是实体的结束字符,start是实体的开始字符。将识别的部分的实体特征末尾减去实体头获得实体长度,然后求和取平均获得这段实体的混合表示,即mi,此时表示的是一段实体的特征表示,而不是一个词的特征表示。
步骤5.4将整合特征矩阵计入Attention,得到添加Attention的整合特征矩阵;
步骤5.5将添加Attention的整合特征矩阵送入下一层BiLSTM+CRF中进行特征提取和标签预测,分别得到实体和实体关系的标签序列;
使用传统的BiLSTM+CRF方法,用BiLSTM提取特征CRF预测标签序列的结果发现,出现了实体边界模糊的问题,即不能够准确地找到实体边界,而找不到实体准确的边界位置会影响最终实体的识别和关系抽取的效果,通过对实验结果的分析发现,实体边界模糊问题的主要特征是只能识别实体的部分,而不能识别实体的全部,因此考虑使用双层BiLSTM+CRF,在第一层只能识别实体部分的情况下,进行二次识别,以找到准确的实体边界。因此模型在第一层识别的基础上,对只识别了部分的实体特征进行整合,例如:“胡子鲶垂死前表现呆滞”在第一层BiLSTM+CRF识别后,只能将“表现呆滞”识别为实体,而实际应该将“垂死前表现呆滞”整体识别为实体,所以将第一层BiLSTM+CRF识别的“表现呆滞”进行特征的整合,将“表现呆滞”整合为整体特征,再用第二层BiLSTM+CRF识别时,会将“表现呆滞”识别为整体特征,在与其它字符特征整合进行识别,提高识别的效果。
将整合实体特征加入Attention,增加整合实体在全文的特征表示,因为整合实体特征本身就是需要的实体特征,所以增加整合的实体特征能够在二次识别过程中更好的被识别。
步骤6. 将得到的实体和实体关系的标签序列进行知识融合,并将融合后的实体和实体关系的标签序列送入Neo4j图数据库中,形成水产动物疾病诊断与防治的医学知识图谱,图数据库会根据输入的实体和关系对通过图的方式将知识呈现出来,如图1所示。
所述知识融合主要包括实体对齐、本体构建、质量评估、知识更新。
实体对齐(entity alignment)主要是用于消除异构数据中实体冲突、指向不明等不一致性问题,形成高质量的知识。
本体构建中的本体是同一领域内不同主体之间进行交流、连通的语义基础。
质量评估主要用于评估生成的知识图谱的质量。
知识更新也就是知识库对知识的更正和知识的增加是有需求的。
实验过程中使用的效果评判标准是采用准确率(Precision,P)、召回率(Recall,R)和F1值作为评价指标,当且仅当实体类别和实体边界均正确才认定识别正确。准确率、召回率和F1值的计算过程如(1)、(2)、(3)所示。
Figure 988846DEST_PATH_IMAGE013
(1)
Figure 404216DEST_PATH_IMAGE014
(2)
Figure 961100DEST_PATH_IMAGE015
(3)
式中TP——预测的实体是正确实体的个数
FP——预测的实体是非实体的个数
FN——没有预测出来的实际实体个数
为了证明本发明实施例的效果,将本发明与本技术领域内常用的实体识别和关系抽取的方法相比较,结果如下:
表1 不同方法的试验结果对比
Figure 369078DEST_PATH_IMAGE017
结果表明,本发明实施例的准确率、召回率及F1值均高于现有技术。

Claims (1)

1.一种水产动物疾病诊断与防治知识图谱构建方法,其特征在于按照如下步骤进行:
步骤1.收集水产动物疾病诊断与防治相关的医学文本;
步骤2.将收集到的医学文本进行预处理;
步骤3.将经过预处理后的文本分为训练部分和应用部分,根据标注规则对训练部分文本进行人工标注,并进行模型训练;
所述标注规则如下:
(1)医学文本为如下6类实体时,则分别标注如下:
水产品名称,标注为B-NAM;
水产品病灶部位,标注为B-BOD;
水产品患病病原体,标注为B-PAT;
水产品患病临床表现,标注为B-SYM;
水产品患病名称,标注为B-DIS;
治疗疾病所需药品名称,标注为B-MED;
(2)医学文本为如下7类实体关系时,则分别标注如下:
水产品名称-水产品病灶部位-从属关系,标注为NAM-BOD-CS;
水产品名称-水产品患病病原体-病原关系,标注为NAM-PAT-BY;
水产品名称-水产品患病名称-患病关系,标注为NAM-DIS-HB;
水产品名称-治疗疾病所需药品名称-使用关系,标注为NAM-MED-SY;
水产品名称-水产品患病临床表现-症状关系,标注为NAM-SYM-ZZ;
水产品患病病原体-水产品患病名称-引起关系,标注为PAT-DIS-YQ;
水产品患病名称-治疗疾病所需药品名称-治疗关系,标注为DIS-MED-ZL;
(3)当水产品名称与患病名称嵌套时,将水产品名称标注为B-NAM,将患病名称标注为B-DIS;
(4)当水产品病灶部位与临床症状表现嵌套时,将病灶部位标注为NAM-BOD-CS、临床症状表现NAM-SYM-ZZ;
(5)当水产品病灶部位与形容词和患病临床表现嵌套时,将描述病灶部位形容词与病灶部位混合作为病灶部位进行标注,标注为NAM-BOD-CS,患病临床表现标注为NAM-SYM-ZZ;
(6)当患病病原体与病原体身体部位嵌套时,只标注患病病原体,标注为NAM-PAT-BY;
(7)当患病病原体与大量寄生嵌套时,将患病病原体与大量寄生作为整体进行标注,标注为NAM-PAT-BY;
(8)当出现死亡一词时,不作为临床症状进行标注;
步骤4.用训练好的模型对应用部分文本进行实体的识别和实体关系的抽取,分别得到实体和实体关系的标签序列,具体如下:
步骤4.1采用BERT的词嵌入方法,将文本序列变成机器可识别的向量矩阵;
步骤4.2将获得的向量矩阵送入BiLSTM+CRF中进行特征提取和标签预测;
步骤4.3将提取到的特征矩阵进行特征整合,获得整合特征矩阵;
步骤4.4将整合特征矩阵计入Attention,得到添加Attention的整合特征矩阵;
步骤4.5将添加Attention的整合特征矩阵送入下一层BiLSTM+CRF中进行特征提取和标签预测,分别得到实体和实体关系的标签序列;
步骤5. 将得到的实体和实体关系的标签序列进行知识融合,并将融合后的实体和实体关系的标签序列送入Neo4j图数据库中,形成水产动物疾病诊断与防治的医学知识图谱。
CN202110777475.1A 2021-07-09 2021-07-09 水产动物疾病诊断与防治知识图谱构建方法 Active CN113434700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110777475.1A CN113434700B (zh) 2021-07-09 2021-07-09 水产动物疾病诊断与防治知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110777475.1A CN113434700B (zh) 2021-07-09 2021-07-09 水产动物疾病诊断与防治知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN113434700A true CN113434700A (zh) 2021-09-24
CN113434700B CN113434700B (zh) 2023-07-11

Family

ID=77759743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110777475.1A Active CN113434700B (zh) 2021-07-09 2021-07-09 水产动物疾病诊断与防治知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN113434700B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180322954A1 (en) * 2017-05-08 2018-11-08 Hefei University Of Technology Method and device for constructing medical knowledge graph and assistant diagnosis method
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN111538845A (zh) * 2020-04-03 2020-08-14 肾泰网健康科技(南京)有限公司 一种构建肾病专科医学知识图谱的方法、模型及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180322954A1 (en) * 2017-05-08 2018-11-08 Hefei University Of Technology Method and device for constructing medical knowledge graph and assistant diagnosis method
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN111538845A (zh) * 2020-04-03 2020-08-14 肾泰网健康科技(南京)有限公司 一种构建肾病专科医学知识图谱的方法、模型及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李灵芳;杨佳琦;李宝山;杜永兴;胡伟健;: "基于BERT的中文电子病历命名实体识别", 内蒙古科技大学学报, no. 01 *

Also Published As

Publication number Publication date
CN113434700B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
CN112131393B (zh) 一种基于bert和相似度算法的医疗知识图谱问答系统构建方法
CN104516942B (zh) 概念驱动的自动分节标识
CN110032648A (zh) 一种基于医学领域实体的病历结构化解析方法
CN111078875B (zh) 一种基于机器学习的从半结构化文档中提取问答对的方法
CN113707297A (zh) 医疗数据的处理方法、装置、设备及存储介质
CN111723570A (zh) 药品知识图谱的构建方法、装置和计算机设备
CN105138864B (zh) 基于生物医学文献的蛋白质交互关系数据库构建方法
CN116682553A (zh) 一种融合知识与患者表示的诊断推荐系统
CN112635071B (zh) 融合中西医知识的糖尿病知识图谱构建方法
CN114595344A (zh) 面向农作物品种管理的知识图谱构建方法及装置
CN115293161A (zh) 基于自然语言处理和药品知识图谱的合理用药系统及方法
CN116541472B (zh) 一种医疗领域知识图谱构建的方法
Zhang et al. VetTag: improving automated veterinary diagnosis coding via large-scale language modeling
CN114004237A (zh) 一种基于膀胱癌知识图谱的智能问答系统构建方法
Singh et al. Multichannel CNN model for biomedical entity reorganization
CN116340544B (zh) 一种基于知识图谱的中医药古籍可视分析方法与系统
Fang et al. Knowledge-enhanced ensemble learning for word embeddings
CN116227594A (zh) 面向多源数据的医疗行业高可信度知识图谱的构建方法
CN112149411A (zh) 一种抗生素临床使用领域本体构建方法
CN116881336A (zh) 一种用于医学大数据的高效多模态对比深度哈希检索方法
CN110299194B (zh) 基于综合特征表示与改进宽深度模型的相似病例推荐方法
Bijari et al. Assisted neuroscience knowledge extraction via machine learning applied to neural reconstruction metadata on NeuroMorpho. Org
CN112667781A (zh) 一种恶性肿瘤文献获取方法及装置
CN116682536A (zh) 基于改进Bert4Rec的中医药方推荐方法
Huang et al. EMSI-BERT: Asymmetrical entity-mask strategy and symbol-insert structure for drug–drug interaction extraction based on BERT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant