CN115563286B - 一种基于知识驱动的奶牛疾病文本分类方法 - Google Patents
一种基于知识驱动的奶牛疾病文本分类方法 Download PDFInfo
- Publication number
- CN115563286B CN115563286B CN202211404120.9A CN202211404120A CN115563286B CN 115563286 B CN115563286 B CN 115563286B CN 202211404120 A CN202211404120 A CN 202211404120A CN 115563286 B CN115563286 B CN 115563286B
- Authority
- CN
- China
- Prior art keywords
- disease
- text
- entity
- features
- cow disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 159
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 159
- 235000013365 dairy product Nutrition 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 31
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 26
- 238000013145 classification model Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 9
- 241000283690 Bos taurus Species 0.000 claims description 82
- 238000000605 extraction Methods 0.000 claims description 13
- 208000024891 symptom Diseases 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000013589 supplement Substances 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 2
- 230000036285 pathological change Effects 0.000 claims description 2
- 231100000915 pathological change Toxicity 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 230000000153 supplemental effect Effects 0.000 claims description 2
- 230000009469 supplementation Effects 0.000 claims description 2
- 230000006806 disease prevention Effects 0.000 claims 1
- 230000007787 long-term memory Effects 0.000 abstract description 5
- 230000006403 short-term memory Effects 0.000 abstract description 4
- 238000003745 diagnosis Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 201000004813 Bronchopneumonia Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000036528 appetite Effects 0.000 description 1
- 235000019789 appetite Nutrition 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007160 gastrointestinal dysfunction Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000004767 rumen Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于知识驱动的奶牛疾病文本分类方法,包括以下步骤:获取奶牛病情描述文本的疾病特征,并将所述疾病特征转化为词向量;基于卷积神经网络和长短期记忆网络,构建疾病文本分类模型;将所述词向量输入到所述疾病文本分类模型中进行处理,获得奶牛疾病文本的最终疾病特征;基于所述最终疾病特征对奶牛疾病文本进行分类。本发明捕捉了奶牛疾病文本的隐性特征和显性特征,为奶牛疾病文本分类提供了更多的鉴别性特征。
Description
技术领域
本发明属于深度学习技术领域,特别是涉及一种基于知识驱动的奶牛疾病文本分类方法。
背景技术
目前,关于动物疾病文本的相关研究仍以专家系统为主,猪、牛、马等动物的各类专家系统已经被发表(Nusai等,2015;Suharjito等,2017;Gao等,2019)。然而,这些系统在很大程度上依赖难以获得和扩展的人工规则,非专业用户也很难操作它们。而且,这些系统的推理能力与规则的数量和质量密切相关,几乎找不到症状与疾病,症状与症状,以及疾病与病原体等之间隐含的复杂关系。
随着深度学习越来越流行,Cheng等人(2016)构建了一个四层卷积神经网络模型来提取电子病历的表型信息。Oumaima等(2020)利用神经网络对动脉硬化患者的电子病历进行训练。Hu等人(2019)研究了基于迁移学习的模型。他们使用卷积神经网络模型,在呼吸道感染、支气管肺炎、胃肠道功能紊乱等疾病上取得了良好的表现。Lipton等人(2017)利用多标签医疗记录构建了一个基于长短期记忆网络(LSTM)的疾病预测模型。Yu等人(2021)通过变压器网络训练患者的电子医疗记录来预测住院病人的资源利用。Philipp等人(2022)学习了健康记录的信息,并使用多层前馈神经网络来实现成本预测。上述研究采用了不同类型的神经网络来提取人类电子病历的高级语义特征。然而,这些模型只能提取医疗记录所呈现的典型特征,而不能学习其隐含的非典型特征,而这些非典型特征通常要由医生通过专业知识或专家经验来识别。因此,亟需提出一种基于知识驱动的奶牛疾病文本分类方法。
发明内容
本发明的目的是提供一种基于知识驱动的奶牛疾病文本分类方法,该方法能够同时捕捉显性特征和隐性特征来增强特征表示,一旦这些特征被确定,特征的融合将被送入文本分类模型进行文本分类,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了一种基于知识驱动的奶牛疾病文本分类方法,包括以下步骤:
获取奶牛病情描述文本的疾病特征,并将所述疾病特征转化为词向量;
基于卷积神经网络和长短期记忆网络,构建疾病文本分类模型;
将所述词向量输入到所述疾病文本分类模型中进行处理,获得奶牛疾病文本的最终疾病特征;
基于所述最终疾病特征对奶牛疾病文本进行分类。
可选的,获取奶牛病情描述文本的疾病特征的过程包括:对奶牛病情描述文本进行特征提取,获得奶牛的特征关键词;将所述特征关键词与奶牛疾病知识图谱相结合,获得奶牛的实体特征信息和上下文实体信息。
可选的,获得奶牛的实体特征信息和上下文实体信息的过程包括:基于实体链接技术将奶牛的特征关键词与奶牛疾病知识图谱中的三元组实体进行相似度计算,获得奶牛的实体特征信息,进而对所述实体特征信息进行上下文信息补充,获得上下文实体信息。
可选的,将所述词向量输入到所述疾病文本分类模型中进行处理的过程包括:基于长短期记忆网络获取所述词向量中的隐藏特征,将所述隐藏特征输入到所述卷积神经网络中进行特征提取,进而获得奶牛疾病文本的最终疾病特征。
可选的,基于长短期记忆网络获取所述词向量中的隐藏特征的过程包括:将所述词向量输入到所述长短期记忆网络中进行单向传播处理,获取若干个级联输出,所述若干个级联输出即为所述词向量中的隐藏特征。
可选的,将所述隐藏特征输入到所述卷积神经网络中进行特征提取的过程包括:所述卷积神经网络对所述隐藏特征进行特征提取,获得所述隐藏特征对应的特征图,捕获所述特征图的最大特征,连接所有的最大特征获得奶牛疾病文本的最终疾病特征。
可选的,对疾病文本分类方法进行评估的过程包括:基于正确分类的正样本数量、正确分类的负样本数量、负样本误分类为正样本的数量和正样本误分类为负样本的数量,获得分类结果的准确率、精确度、召回率和F1分数,进而对疾病文本分类方法进行评估。
本发明的技术效果为:
本发明提出了一种基于卷积神经网络和长短期记忆网络的疾病文本分类模型,捕捉了奶牛疾病文本的隐性特征和显性特征,为奶牛疾病文本分类提供了更多的鉴别性特征,大大提高了奶牛疾病文本分类的准确性。
本发明采用奶牛疾病的外部知识图谱,能够获得更多与病牛状态相对应的隐性信息,从而提高奶牛疾病文本分类的准确性。
本发明利用智能化的疾病文本分类方法代替了人工分类,在节约人力的同时,也大大节约了奶牛疾病诊断前期的准备时间,为更好的辅助奶牛疾病诊断工作提供了可能性。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例中的奶牛疾病知识图谱示意图;
图2为本发明实施例中的疾病文本分类模型架构示意图;
图3为本发明实施例中的结构化疾病知识提取流程图;
图4为本发明实施例中的隐式上下文实体提取示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一
本实施例采用的奶牛疾病知识图谱(Knowledge Graph of Dairy Cow Disease,DCDKG)涉及疾病名称、疾病类型、症状、病因、易发群体、病理变化、治疗方法、预防手段等8类实体以及疾病-疾病类型、疾病-病因、疾病-易发群体、疾病-症状、疾病-病理变化等7类实体关系,其中,奶牛疾病知识图谱的部分示例图如图1所示,其详细描述如表1所示。
表1
本实施例提出的融合奶牛疾病知识图谱的Bi-LSTM-CNN网络模型如图2所示。它主要包括疾病特征选择、隐藏知识提取、词嵌入以及Bi-LSTM-CNN网络四个部分。奶牛病情描述文本经过疾病特征选择生成疾病特征词;然后疾病特征词连接奶牛疾病知识图谱提取隐藏知识作为补充,共同构成病情描述文本的疾病特征;采用词嵌入模型,将疾病特征转化成词向量输入到Bi-LSTM-CNN混合神经网络进行训练,实现端到端的奶牛疾病分类。
奶牛病情描述是兽医或养殖户对观察到的病牛症状及病牛近期表现、养殖手段或环境变化等情况进行说明的一段文本语句,为了识别语句中与奶牛疾病特征相关的关键词,对文本数据进行切分、分词、词性标注、去除停用词及无意义的单字和提取关键词等文本预处理操作。一条由m个特征词构成的病情描述文本为x=[x1,x2,…,xm],其中xi为一条完整疾病语句中第i个位置的词汇。
兽医或养殖户观察到的症状或情况变化是疾病状态文本报告中反映的显性和主导特征,而奶牛疾病知识图(DCDKG)包含了症状与症状、症状与疾病、疾病与病原体等之间复杂的语义关系和逻辑结构。通过将特征关键词[x1,x2,…,xm]与DCDKG相连,本实施例可以进一步获得与患病奶牛显性特征相关的结构性隐性知识。
奶牛疾病特征结构化知识提取过程如图3所示。首先使用实体链接技术将文本中的疾病特征词x1:m与DCDKG中的三元组实体head或tail(统一记为实体e)进行相似度计算以消歧,获得相关的实体知识。为每个实体提供额外的上下文信息,实体e的“上下文”定义为其在DCDKG中相邻的结点集合,即:
context(e)={ei|<e,r,ei>∈DCDKG,<ei,r,e>∈DCDKG} (1)
其中,r为实体间的关系。使用上下文实体可以提供更多的补充知识,有助于提高奶牛疾病文本分类的准确度。
x1:m为原始病情描述文本的特征词,xm+1:n为补充后的上下文实体特征信息,形成x=[x1,x2,…,xm,xm+1,…,xn]为病情描述文本最终的疾病特征,其中n为原特征和补充特征的总个数。本实施例使用word2vec的CBOW(continuous bag-of-words)模型将选择得到的每个疾病特征词转换为词向量,即映射为对应的d维向量x1:n∈Rd。再通过疾病特征xi找到与之匹配的词向量[w1,w2,…,wm,wm+1,…,wn],其中wi∈Rd×1,d为生成词向量的维数。为避免上下文实体向量的偶然性,通过计算上下文实体向量平均值得到计算公式如式(2)所示。
其中wi是上下文实体通过奶牛疾病知识图谱嵌入方法学习得到的实体向量。
给定文本报告中的某个特征词,本实施例从知识图谱中提取其隐含的上下文实体,如图4所示。DCDKG中的"食欲异常"是与对应特征词相关的实体,本实施例的方法进一步提取其上下文实体作为文本分类的补充知识。如"瘤胃积食-疾病"、"采食劣质饲料-病因"和"应激反应-病因"。
经过疾病特征选择和隐性知识提取,本实施例得到了一份文本报告的融合性特征。本实施例用S=[w1,w2,…,wT]表示经结构化知识补充后的词向量w1: 并作为Bi-LSTM-CNN混合神经网络模型的输入。
卷积神经网络(CNN)能够通过卷积许多块来捕获重要特征,实现基于病情描述文本的奶牛疾病分类,但由于部分奶牛病情描述实体样本前后间距较长,所以在处理时较难提取到有效特征,甚至出现错误特征。双向长短期记忆网络(Bi-LSTM)是一种强大的序列数据提取网络,适用于处理和预测时间序列中间隔和延迟相对较长的奶牛病情描述文本,采用该网络能够从奶牛病情描述文本中通过向前和向后映射来捕获有意义的隐藏特征。本实施例提出的Bi-LSTM-CNN模型将两种强大的特征提取方法与单词嵌入相结合,通过Bi-LSTM编码层来增强CNN捕捉上下文信息的能力,从而实现较好的奶牛疾病分类效果。
如图2所示,文本报告的特征词和相应的上下文实体都被输入到词嵌入层,输出S=[w1,w2,…,wT]通过BiLSTM层进一步映射到隐藏特征为了计算每个单词的隐藏表示,/>被定义为BiLSTM网络的级联输出。在一个简单的双向设置中,当从左到右读取输入短语序列时,LSTM单向传播计算和相应的公式如下:
其中it是输入门,ft是遗忘门,ot是输出门,[ht-1,wt]是上一序列的隐藏状态和本序列单词嵌入作为输入的串联向量,是候选输入向量,Ct-1是上一时刻细胞状态,Ct是当前细胞状态,ht是当前状态的输出,WC和bC都是可学习的参数,tanh是非线性转换函数。
Bi-LSTM提取的隐藏特征是CNN网络的输入,CNN网络包括卷积、池化和全连接层。本实施例应用多个不同的卷积核尺寸来提取不同的有意义的特征,例如,从隐藏特征的窗口生成卷积隐藏特征/>的函数如下:
其中是卷积后的特征,bcnn∈R是偏置项,Wcnn和bcnn∈R是可学习参数,σ是校正线性元素的relu函数。CNN应用于Bi-LSTM隐藏特征/> 中的每个隐藏特征生成特征图/>
对特征图上使用max-over-time pooling操作来捕获最大的特征:
将所有特征连接在一起,作为输入奶牛疾病描述文本x的最终表示e(x),其中m为卷积核的数量:
将奶牛疾病描述文本表示e(x)输入给softmax分类器,p(yk)为病情描述文本e(xk)在第k种疾病上的输出概率,经softmax归一化后如公式(9)为:
其中,wi和bi分别代表对于输出yi的权重和偏置参数,n=7为疾病的类别数。
本实施例的BLCKG模型的超参数描述如表2所示。
表2
本实施例采用准确度(Accuracy)、精度(Precision)、召回率(Recall)和F1值4个指标来评价疾病文本分类方法的性能,相应计算公式如式(10)—式(13):
其中,TP、TN分别表示正确分类下的正样本数和负样本数,FP、FN分别表示负样本误分类为正样本的数量、正样本误分类为负样本的数量。
本实施例提出了一种与奶牛疾病专业知识图(BLCKG)相结合的混合BiLSTM-CNN模型,以实现基于病牛患病状态文本报告的奶牛疾病的准确快速分类。通过采用包含兽医主观经验和专业知识的奶牛疾病知识图谱(DCDKG),混合BiLSTM-CNN网络可以更全面地学习训练数据上的相关特征。从DCDKG中提取的隐性特征的补充可以为深度模型学习提供更多的特征信息,从而提高对不同类型奶牛疾病文本的分类准确度。对7种奶牛疾病的实验表明,在基于文本的病牛数据集上,本实施例提出的BLCKG模型的准确率和F1值分别为94.57%和94.89%。
本实施例的智能疾病文本分类方法代替了人工分类,在节约人力的同时,也大大节约了奶牛疾病诊断前期的准备时间。值得注意的是,本实施例是在奶牛疾病诊断前期为检测到的奶牛疾病文本进行提前分类,从而辅助后续的疾病诊断工作,但并不能直接对奶牛疾病进行诊断,其分类结果也不能作为一个最终的诊断结果。除此之外,本实施例中构建的奶牛疾病文本分类方法,也能够为其它动物的疾病文本分类提供新的思路。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (3)
1.一种基于知识驱动的奶牛疾病文本分类方法,其特征在于,包括以下步骤:
获取奶牛病情描述文本的疾病综合特征,并将所述疾病综合特征转化为词向量;
基于双向长短期记忆网络和卷积神经网络,构建疾病文本分类模型;
将所述词向量输入到所述疾病文本分类模型中进行处理,获得奶牛疾病文本的最终疾病特征;
基于所述最终疾病特征对奶牛疾病文本进行分类;
获取奶牛病情描述文本的疾病综合特征的过程包括:对奶牛病情描述文本进行特征提取,获得奶牛病情描述文本的特征关键词;由m个特征词构成的病情描述文本为x=[x1,x2,…,xm],其中xi为一条完整疾病语句中第i个位置的词汇;
将所述特征关键词与奶牛疾病知识图谱相结合,奶牛疾病知识图谱即DCDKG,获得奶牛病情描述文本的实体特征信息和上下文实体特征信息:首先使用实体链接技术将文本中的疾病特征词x1:m与DCDKG中的三元组实体head或tail进行相似度计算以消歧,获得相关的实体知识;为每个实体提供额外的上下文信息,x1:m为原始病情描述文本的特征词,xm+1:n为补充后的上下文实体特征信息,形成x=[x1,x2,…,xm,xm+1,…,xn]为病情描述文本最终的疾病特征,其中n为原特征和补充特征的总个数;通过疾病特征xi找到与之匹配的词向量[w1,w2,…,wm,wm+1,…,wn],其中wi∈Rd×1,d为生成词向量的维数;再通过计算上下文实体向量平均值得到计算公式如式(2)所示;
用S=[w1,w2,…,wT]表示经结构化知识补充后的词向量并作为双向长短期记忆网络Bi-LSTM-CNN混合神经网络模型的输入;
将所述词向量输入到所述疾病文本分类模型中进行处理的过程包括:基于双向长短期记忆网络Bi-LSTM-CNN获取所述词向量中的隐藏特征,将所述隐藏特征输入到所述卷积神经网络中进行二次特征提取,进而获得奶牛病情描述文本的最终疾病特征;
基于双向长短期记忆网络获取所述词向量中的隐藏特征的过程包括:将所述词向量输入到所述双向长短期记忆网络中进行单向传播处理,获取若干个级联输出,所述若干个级联输出即为所述词向量中的隐藏特征;
将所述隐藏特征输入到所述卷积神经网络中进行特征提取的过程包括:所述卷积神经网络对所述隐藏特征进行特征提取,获得所述隐藏特征对应的特征图,捕获所述特征图的最大特征,连接所有的最大特征获得奶牛病情描述文本的最终疾病特征;
所述奶牛疾病知识图谱包括:疾病名称、疾病类型、症状、病因、易发群体、病理变化、治疗方法和预防手段8类实体以及疾病-疾病类型、疾病-病因、疾病-易发群体、疾病-症状、疾病-病理变化、疾病-治疗方法和疾病-预防手段7类实体关系。
2.根据权利要求1所述的基于知识驱动的奶牛疾病文本分类方法,其特征在于,
获得奶牛的实体特征信息和上下文实体信息的过程包括:基于实体链接技术将奶牛病情描述文本的特征关键词与奶牛疾病知识图谱中的三元组实体进行相似度计算,获得奶牛的实体特征信息,进而对所述实体特征信息进行上下文信息补充,获得上下文实体特征信息。
3.根据权利要求1所述的基于知识驱动的奶牛疾病文本分类方法,其特征在于,
对疾病文本分类方法进行评估的过程包括:基于正确分类的正样本数量、正确分类的负样本数量、负样本误分类为正样本的数量和正样本误分类为负样本的数量,获得分类结果的准确率、精确度、召回率和F1分数,进而对疾病文本分类方法进行评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211404120.9A CN115563286B (zh) | 2022-11-10 | 2022-11-10 | 一种基于知识驱动的奶牛疾病文本分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211404120.9A CN115563286B (zh) | 2022-11-10 | 2022-11-10 | 一种基于知识驱动的奶牛疾病文本分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115563286A CN115563286A (zh) | 2023-01-03 |
CN115563286B true CN115563286B (zh) | 2023-12-01 |
Family
ID=84770533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211404120.9A Active CN115563286B (zh) | 2022-11-10 | 2022-11-10 | 一种基于知识驱动的奶牛疾病文本分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563286B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169035A (zh) * | 2017-04-19 | 2017-09-15 | 华南理工大学 | 一种混合长短期记忆网络和卷积神经网络的文本分类方法 |
CN110569511A (zh) * | 2019-09-22 | 2019-12-13 | 河南工业大学 | 基于混合神经网络的电子病历特征提取方法 |
CN110580955A (zh) * | 2019-07-31 | 2019-12-17 | 平安科技(深圳)有限公司 | 疾病信息识别方法、装置、计算机设备及存储介质 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
CN112151188A (zh) * | 2020-10-19 | 2020-12-29 | 科技谷(厦门)信息技术有限公司 | 一种基于医疗知识图谱的智能疾病预测系统 |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
CN113972010A (zh) * | 2021-10-27 | 2022-01-25 | 广东工业大学 | 一种基于知识图谱和自适应机制的辅助疾病推理系统 |
CN114155962A (zh) * | 2022-02-10 | 2022-03-08 | 北京妙医佳健康科技集团有限公司 | 一种数据清洗方法和利用知识图谱构建疾病诊断方法 |
CN114188024A (zh) * | 2021-12-14 | 2022-03-15 | 扬州大学 | 基于畜禽疾病知识图谱的畜禽疾病的预测分类方法 |
CN114510579A (zh) * | 2022-02-08 | 2022-05-17 | 吾征智能技术(北京)有限公司 | 一种基于医疗知识图谱的疾病自动问答系统、设备及介质 |
CN114610902A (zh) * | 2022-03-25 | 2022-06-10 | 南京市畜牧兽医站(南京市动物疫病预防控制中心) | 一种基于知识图谱的家禽疾病诊断系统 |
CN114758743A (zh) * | 2022-04-20 | 2022-07-15 | 平安科技(深圳)有限公司 | 信息预测方法、装置、存储介质及计算机设备 |
CN115171871A (zh) * | 2022-05-06 | 2022-10-11 | 东南大学 | 一种基于知识图谱与注意力机制的心血管疾病预测方法 |
-
2022
- 2022-11-10 CN CN202211404120.9A patent/CN115563286B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169035A (zh) * | 2017-04-19 | 2017-09-15 | 华南理工大学 | 一种混合长短期记忆网络和卷积神经网络的文本分类方法 |
CN110580955A (zh) * | 2019-07-31 | 2019-12-17 | 平安科技(深圳)有限公司 | 疾病信息识别方法、装置、计算机设备及存储介质 |
CN110569511A (zh) * | 2019-09-22 | 2019-12-13 | 河南工业大学 | 基于混合神经网络的电子病历特征提取方法 |
CN111538845A (zh) * | 2020-04-03 | 2020-08-14 | 肾泰网健康科技(南京)有限公司 | 一种构建肾病专科医学知识图谱的方法、模型及系统 |
CN112151188A (zh) * | 2020-10-19 | 2020-12-29 | 科技谷(厦门)信息技术有限公司 | 一种基于医疗知识图谱的智能疾病预测系统 |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
CN113972010A (zh) * | 2021-10-27 | 2022-01-25 | 广东工业大学 | 一种基于知识图谱和自适应机制的辅助疾病推理系统 |
CN114188024A (zh) * | 2021-12-14 | 2022-03-15 | 扬州大学 | 基于畜禽疾病知识图谱的畜禽疾病的预测分类方法 |
CN114510579A (zh) * | 2022-02-08 | 2022-05-17 | 吾征智能技术(北京)有限公司 | 一种基于医疗知识图谱的疾病自动问答系统、设备及介质 |
CN114155962A (zh) * | 2022-02-10 | 2022-03-08 | 北京妙医佳健康科技集团有限公司 | 一种数据清洗方法和利用知识图谱构建疾病诊断方法 |
CN114610902A (zh) * | 2022-03-25 | 2022-06-10 | 南京市畜牧兽医站(南京市动物疫病预防控制中心) | 一种基于知识图谱的家禽疾病诊断系统 |
CN114758743A (zh) * | 2022-04-20 | 2022-07-15 | 平安科技(深圳)有限公司 | 信息预测方法、装置、存储介质及计算机设备 |
CN115171871A (zh) * | 2022-05-06 | 2022-10-11 | 东南大学 | 一种基于知识图谱与注意力机制的心血管疾病预测方法 |
Non-Patent Citations (3)
Title |
---|
Disease Diagnosis of Dairy Cow by Deep learning Based on Knowledge Graph and Transfer Learning;Meng Gao 等;Int. J. BIO AUTOMATION;第51卷(第1期);87-100 * |
Self-Supervised Feature Learning via Expoiting Multi-Modal Data for Retinal Disease Diagnosis;Xiaomeng Li 等;IEEE Transactions on Medical Imaging;第39卷(第12期);4023-4033 * |
融合知识图谱与深度学习的疾病诊断方法研究;董丽丽 等;计算机科学与探索;第14卷(第05期);815-824 * |
Also Published As
Publication number | Publication date |
---|---|
CN115563286A (zh) | 2023-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111274373B (zh) | 一种基于知识图谱的电子病历问答方法及系统 | |
CN112784801A (zh) | 基于文本和图片的双模态胃部疾病分类方法及装置 | |
CN117077786A (zh) | 一种基于知识图谱的数据知识双驱动智能医疗对话系统和方法 | |
WO2023029502A1 (zh) | 基于问诊会话构建用户画像的方法、装置、设备和介质 | |
CN111651991B (zh) | 一种利用多模型融合策略的医疗命名实体识别方法 | |
CN112489740B (zh) | 病历检测方法及相关模型的训练方法和相关设备、装置 | |
CN113707339B (zh) | 一种多源异质数据库间概念对齐与内容互译方法及系统 | |
CN111243729B (zh) | 一种肺部x线胸片检查报告自动生成方法 | |
CN111859938B (zh) | 基于位置向量降噪和丰富语义的电子病历实体关系抽取方法 | |
CN112232065A (zh) | 挖掘同义词的方法及装置 | |
CN118098482B (zh) | 基于5g技术的智慧医疗管理系统及方法 | |
CN114299551A (zh) | 模型训练方法、动物行为识别方法、装置、设备 | |
CN115658886A (zh) | 基于语义文本的智能肝癌分期方法、系统及介质 | |
CN113538334A (zh) | 一种胶囊内窥镜图像病变识别装置及训练方法 | |
CN117891958B (zh) | 一种基于知识图谱的标准数据处理方法 | |
CN116168825A (zh) | 基于知识图谱增强的自动可解释性疾病自动诊断装置 | |
Wang et al. | Diagnosis of dairy cow diseases by knowledge-driven deep learning based on the text reports of illness state | |
CN112990270B (zh) | 一种传统特征与深度特征的自动融合方法 | |
CN115563286B (zh) | 一种基于知识驱动的奶牛疾病文本分类方法 | |
CN116738992B (zh) | 基于图注意力网络和字词融合的医疗命名实体识别方法 | |
CN116610846A (zh) | 用于牛养殖的配种筛选方法及其系统 | |
CN116403706A (zh) | 一种融合知识扩展和卷积神经网络的糖尿病预测方法 | |
CN116168828A (zh) | 基于知识图谱和深度学习的疾病预测方法、装置及计算机设备 | |
CN112562819B (zh) | 一种针对先心病的超声多切面数据的报告生成方法 | |
CN116994695A (zh) | 报告生成模型的训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |