CN113299388B - 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 - Google Patents
基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 Download PDFInfo
- Publication number
- CN113299388B CN113299388B CN202110515814.9A CN202110515814A CN113299388B CN 113299388 B CN113299388 B CN 113299388B CN 202110515814 A CN202110515814 A CN 202110515814A CN 113299388 B CN113299388 B CN 113299388B
- Authority
- CN
- China
- Prior art keywords
- fever
- rash
- sample
- classifier
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010037660 Pyrexia Diseases 0.000 title claims abstract description 61
- 208000010201 Exanthema Diseases 0.000 title claims abstract description 59
- 201000005884 exanthem Diseases 0.000 title claims abstract description 59
- 206010037844 rash Diseases 0.000 title claims abstract description 59
- 208000010877 cognitive disease Diseases 0.000 title claims abstract description 8
- 239000000523 sample Substances 0.000 claims abstract description 50
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 36
- 201000010099 disease Diseases 0.000 claims abstract description 29
- 230000001149 cognitive effect Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 15
- 239000012472 biological sample Substances 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 20
- 208000024891 symptom Diseases 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 208000017520 skin disease Diseases 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 208000023275 Autoimmune disease Diseases 0.000 claims description 4
- 230000000172 allergic effect Effects 0.000 claims description 4
- 208000010668 atopic eczema Diseases 0.000 claims description 4
- 208000022362 bacterial infectious disease Diseases 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 238000010438 heat treatment Methods 0.000 description 4
- 230000019771 cognition Effects 0.000 description 3
- 206010015150 Erythema Diseases 0.000 description 2
- 208000024780 Urticaria Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 231100000321 erythema Toxicity 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 231100000046 skin rash Toxicity 0.000 description 2
- 206010012455 Dermatitis exfoliative Diseases 0.000 description 1
- 208000019872 Drug Eruptions Diseases 0.000 description 1
- 208000017701 Endocrine disease Diseases 0.000 description 1
- 201000000297 Erysipelas Diseases 0.000 description 1
- 206010015218 Erythema multiforme Diseases 0.000 description 1
- 206010015226 Erythema nodosum Diseases 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000002291 Histiocytic Sarcoma Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 208000003623 Hypoalbuminemia Diseases 0.000 description 1
- 208000032514 Leukocytoclastic vasculitis Diseases 0.000 description 1
- 208000008771 Lymphadenopathy Diseases 0.000 description 1
- 206010025421 Macule Diseases 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 208000000112 Myalgia Diseases 0.000 description 1
- 206010037575 Pustular psoriasis Diseases 0.000 description 1
- 206010039587 Scarlet Fever Diseases 0.000 description 1
- 208000028227 Viral hemorrhagic fever Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 208000002352 blister Diseases 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 201000001981 dermatomyositis Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000002497 edematous effect Effects 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 201000008825 fibrosarcoma of bone Diseases 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 206010019847 hepatosplenomegaly Diseases 0.000 description 1
- 201000006747 infectious mononucleosis Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 208000018555 lymphatic system disease Diseases 0.000 description 1
- 201000006812 malignant histiocytosis Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036473 myasthenia Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种基于发热伴皮疹的跨模态医学生物特征认知疾病的系统、设备及存储介质,所述系统包括:预处理模块,用于获取多个患者发热伴皮疹的多模态医学生物样本并进行预处理;特征提取模块,用于提取各个样本的特征信息并进行特征筛选和病因分类,根据病因构建样本数据集;模型组建模块,用于利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型;病因分析模块,用于通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析。本发明通过构建疾病认知系统模型对发热伴皮疹的跨模态医学生物特征进行病因分析,能够充分发挥各模态医学生物特征指标的优势,增加认知发热伴皮疹类疾病的效果和能力。
Description
技术领域
本发明属于人工智能领域,尤其涉及一种基于发热伴皮疹的跨模态疾病认知的系统、设备、存储介质。
背景技术
发热伴全身或局部皮疹是很多疾病都可能出现的症状。临床工作中一般通过观察皮疹的形态、分布、与发热出现的时间顺序以及症状等,再结合病史、体检和实验室检查综合分析,将症状相似的疾病进行鉴别,做出诊断。这种疾病筛查过程繁杂,疾病的病因分析需借助多种手段或途径才能得到准确结果。
发明内容
有鉴于此,本发明提出了种基于发热伴皮疹的跨模态疾病认知的系统、设备、存储介质,用于解决现有的发热伴皮疹疾病的病因分析过程繁杂的问题。
本发明第一方面,提出一种基于发热伴皮疹的跨模态医学生物特征认知疾病的系统,所述系统包括:
预处理模块:用于首先获取多个患者发热伴皮疹的多模态医学生物样本并进行预处理;
特征提取模块:用于提取各个样本的特征信息并进行特征筛选和病因分类,根据病因构建样本数据集;
模型组建模块:用于利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型;
病因分析模块:用于通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析。
优选的,所述预处理模块中,所述发热伴皮疹的多模态医学生物样本包括至少两个模态的数据:发热分度与热型信息、皮疹症状文本信息,发热分度与热型信息包括发热分度与发热的热型。
优选的,所述特征提取模块具体包括:
特征提取单元:基于TextRank算法对发热分度与热型信息、皮疹症状文本信息进行关键词提取,分别对病例样本和待诊断病例样本的特征信息进行向量化表示,采集并处理发热分度与热型信息以及皮疹症状文本信息对应的疾病和病因;
数据集制作单元:基于样本的特征信息,以病因为标签构建样本数据集,发热伴皮疹发病的病因分类包括病毒、细菌感染性疾病、变态反应性皮肤病、自身免疫性疾病、特殊性皮肤病和恶性肿瘤。
优选的,所述模型组建模块中,AdaBoost算法的基本分类器包括SVM分类器和KNN分类器,基于样本数据集训练多个基本分类器的SVM分类器和KNN分类器,SVM分类器和KNN分类器根据各自权重组合成弱分类器,最后根据多个弱分类器加权投票组合成一个强分类器作为疾病认知系统模型。
优选的,所述模型组建模块中,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优,寻优过程如下:
设定网格搜索变量(C,g,k)的范围及搜索步距,其中C为SVM分类器的惩罚因子,g为SVM分类器的的高斯核函数,k为KNN分类器的超参数,k表示选取距离某一样本最近的k个样本,取这k个样本出现最多的类别作为预测的此类类别;
采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为5,得到使弱分类准确率最高的局部最优参数,最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,直到找到最优全局参数。
优选的,所述利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优的优化目标为:
其中,w 1、w 2分别为SVM分类器、KNN分类器的权重,f(x i )为SVM分类器对样本x i 的分类结果,A、B为对SVM分类器分类的结果作为新的训练集,用logistics回归再训练得到的拟合参数;N k (x)为KNN算法中样本x i 最近邻的k训练实例点构成集合,y i 为KNN分类器的输出类别,c j 为涵盖N k (x)的区域的类别,表示样本x i 分类正确的概率。
优选的,所述系统还包括方案解决模块,用于基于病因分析模块的分析结果,提供与发热伴皮疹的病因相对应的解决方案。
本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明第一方面所述的系统。
本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。
本发明相对于现有技术具有以下有益效果:
1)本发明通过发热伴皮疹的多模态融合后的医学生物特征信息集合对待识别样本进行发热伴皮疹类疾病的认知和判定,不仅能考虑患者发热分度与热型信息和发热伴皮疹的特征信息与疾病发生固有的医学生物特征各模态数据间的交互作用,同时也能够充分发挥各模态医学生物特征指标的优势,增加认知发热伴皮疹类疾病的效果和能力。
2)本发明利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型,通过SVM分类器和KNN分类器加权组合成弱分类器,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优,快速定位参数空间,最后根据多个弱分类器加权投票组合成一个强分类器作为疾病认知系统模型,提高了通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于发热伴皮疹的跨模态医学生物特征认知疾病的姿态结构示意图;
图2为本发明特征提取模块的结构示意图。
实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
请参阅图1,本发明公开一种基于发热伴皮疹的跨模态医学生物特征认知疾病的系统,所述系统包括:预处理模块10、特征提取模块20、模型组建模块30、病因分析模块40、方案解决模块50;
所述预处理模块10,用于首先多个患者发热伴皮疹的多模态医学生物样本并进行预处理;
所述预处理模块中,所述发热伴皮疹的多模态医学生物样本包括至少两个模态的数据:发热分度与热型信息、皮疹症状文本信息,发热分度与热型信息包括发热分度与发热的热型。
发热伴皮疹数据集包括至少两个模态的数据:一个是发热分度与热型特征信息样本;一个是皮疹医学生物特征信息即皮疹症状文本特征信息。其中,患者发热分度与热型特征信息包括:1)、发热分度:一般分为低热37.2℃-38℃、中度发热38.1℃-39℃、高热39.1℃-41℃、超过41℃称为超高热;2)、发热的热型即类型。包括稽留热、弛张热、间歇热、回归热、波状热和不规则热等;另外,皮疹症状文本特征信息包括:1)、皮疹颜色、形状等。例如,水肿性红斑、水疱、大疱、血疱、淡红色斑疹、斑丘疹、红斑、风团样等;2)、皮疹的部位。包括全身、整个颜面、颈前V型区、四肢、躯干、后颈部、小腿、肘、膝以下及掌跖等;3)、皮疹发生发展的时间。包括24小时、一天、两天、一周等;4)皮疹的伴随症状特征。包括头痛、乏力、肌痛、肌无力、寒战、水电解质紊乱、低蛋白血症、内分泌紊乱、淋巴结肿大、肝脾肿大等。其中,患者发热分度直接分为四种:低、中、和超高;热型直接分为稽留热、弛张热、间歇热、回归热、波状热和不规则热六种,并进行预处理和标注;由于患者皮疹医学生物特征文本信息主要是描述性文本或者文章,所以其提取方法为:基于TextRank算法进行关键词提取,分别对病例样本和待诊断病例进行向量化表示。
特征提取模块20,用于提取各个样本的特征信息并进行特征筛选和病因分类,根据病因构建样本数据集;所述特征提取模块具体包括:
特征提取单元,用于基于TextRank算法对发热分度与热型信息、皮疹症状文本信息进行关键词提取,分别对病例样本和待诊断病例样本的特征信息进行向量化表示,采集并处理发热分度与热型信息以及皮疹症状文本信息对应的疾病和病因;
数据集制作单元,用于基于样本的特征信息,以病因为标签构建样本数据集,发热伴皮疹发病的病因分类包括病毒、细菌感染性疾病、变态反应性皮肤病、自身免疫性疾病、特殊性皮肤病和恶性肿瘤。具体分类包括:1)、病毒和细菌感染性疾病,包括水痘、风疹、麻疹、幼儿急疹、传染性单核细胞增多症、病毒性出血热、猩红热、丹毒病原菌等;2)、变态反应性皮肤病,包括药疹、急性荨麻疹、重症多形红斑等;3)、自身免疫性疾病,包括系统性红斑狼疮、皮肌炎、结节性红斑和变应性血管炎等;4)、某些特殊性皮肤病,包括脓疱型、红皮病型银屑病等;5)、恶性肿瘤,包括淋巴瘤何杰金病、恶性组织细胞增生症等。
所述模型组建模块30,用于利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型;
所述模型组建模块中,AdaBoost算法的基本分类器包括SVM分类器和KNN分类器,基于样本数据集训练多个基本分类器的SVM分类器和KNN分类器,SVM分类器和KNN分类器根据各自权重组合成弱分类器,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优,寻优过程包括:
分别设定三维网格搜索变量(C,g,k)的范围及搜索步距,其中C为SVM分类器的惩罚因子,g为SVM分类器的高斯核函数,k为KNN分类器的超参数,k表示选取距离某一样本最近的k个样本,取这k个样本出现最多的类别作为预测的此类类别;
设定优化目标,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优的优化目标为:
其中,w 1、w 2分别为SVM分类器、KNN分类器的权重,f(x i )为SVM分类器对样本x i 的分类结果,A、B为对SVM分类器分类的结果作为新的训练集,用logistics回归再训练得到的拟合参数;N k (x)为KNN算法中样本x i 最近邻的k训练实例点构成集合,y i 为KNN分类器的输出类别,c j 为涵盖N k (x)的区域的类别,表示样本x i 分类正确的概率,
采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为5,得到使弱分类准确率最高的局部最优参数,最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,直到H小于设定阈值T则找到最优全局参数,结束寻优。上述过程具有不易过早收敛且易于快速定位参数空间等特点,可高效实现参数调优。
最后根据多个弱分类器加权投票组合成一个强分类器作为疾病认知系统模型。
所述病因分析模块40,用于通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析。
本发明利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型,通过SVM分类器和KNN分类器加权组合成弱分类器,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优,并对SVM分类器进行概率校准,然后以弱分类器误分类概率最小为优化目标,快速定位参数空间,最后根据多个弱分类器加权投票组合成一个强分类器作为疾病认知系统模型,提高了通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析的准确率。
所述方案解决模块50,用于基于病因分析模块的分析结果,提供与发热伴皮疹的病因相对应的解决方案。
本发明通过发热伴皮疹的多模态融合后的医学生物特征信息集合对待识别样本进行发热伴皮疹类疾病的认知和判定,不仅能考虑患者发热分度与热型信息和发热伴皮疹的特征信息与疾病发生固有的医学生物特征各模态数据间的交互作用,同时也能够充分发挥各模态医学生物特征指标的优势,增加认知发热伴皮疹类疾病的效果和能力。
本发明还公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明前述的系统。
本发明还公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明实施例所述系统的全部或部分功能模块。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于发热伴皮疹的跨模态医学生物特征认知疾病的系统,其特征在于,所述系统包括:
预处理模块:用于获取多个患者发热伴皮疹的多模态医学生物样本并进行预处理;
特征提取模块:用于提取各个样本的特征信息并进行特征筛选和病因分类,根据病因构建样本数据集;
模型组建模块:用于利用AdaBoost算法分别对样本数据集进行训练,组建疾病认知系统模型;
病因分析模块:用于通过疾病认知系统模型对待识别的发热伴皮疹的多模态医学生物样本进行病因分析;
所述预处理模块中,所述发热伴皮疹的多模态医学生物样本包括至少两个模态的数据:发热分度与热型信息、皮疹症状文本信息,发热分度与热型信息包括发热分度与发热的热型;
所述特征提取模块具体包括:
特征提取单元:基于TextRank算法对发热分度与热型信息、皮疹症状文本信息进行关键词提取,分别对病例样本和待诊断病例样本的特征信息进行向量化表示,采集并处理发热分度与热型信息以及皮疹症状文本信息对应的疾病和病因;
数据集制作单元:基于样本的特征信息,以病因为标签构建样本数据集,发热伴皮疹发病的病因分类包括病毒、细菌感染性疾病、变态反应性皮肤病、自身免疫性疾病、特殊性皮肤病和恶性肿瘤;
所述模型组建模块中,AdaBoost算法的基本分类器包括SVM分类器和KNN分类器,基于样本数据集训练多个基本分类器的SVM分类器和KNN分类器,SVM分类器和KNN分类器根据各自权重组合成弱分类器,最后根据多个弱分类器加权投票组合成一个强分类器作为疾病认知系统模型;
所述模型组建模块中,利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优,寻优过程如下:
设定网格搜索变量(C,g,k)的范围及搜索步距,其中C为SVM分类器的惩罚因子,g为SVM分类器的的高斯核函数,k为KNN分类器的超参数,k表示选取距离某一样本最近的k个样本,取这k个样本出现最多的类别作为预测的此类类别;
采用K-CV交叉验证方式对各训练集进行训练测试,其中K值设定为5,得到使弱分类准确率最高的局部最优参数,最后根据得到的最优局部参数,选择临近搜索区间进行二次寻优,直到找到最优全局参数;
所述利用三维网格搜索法对SVM分类器及KNN分类器进行超参数调优的优化目标为:
;
其中,w 1、w 2分别为SVM分类器、KNN分类器的权重,f(x i )为SVM分类器对样本x i 的分类结果,A、B为对SVM分类器分类的结果作为新的训练集,用logistics回归再训练得到的拟合参数;N k (x)为KNN算法中样本x i 最近邻的k训练实例点构成集合,y i 为KNN分类器的输出类别,c j 为涵盖N k (x)的区域的类别,表示样本x i 分类正确的概率。
2.根据权利要求1所述基于发热伴皮疹的跨模态医学生物特征认知疾病的系统,其特征在于,所述系统还包括方案解决模块,用于基于病因分析模块的分析结果,提供与发热伴皮疹的病因相对应的解决方案。
3.一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如权利要求1~2任一项所述的系统。
4.一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现权利要求1~2任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110515814.9A CN113299388B (zh) | 2021-05-12 | 2021-05-12 | 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110515814.9A CN113299388B (zh) | 2021-05-12 | 2021-05-12 | 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113299388A CN113299388A (zh) | 2021-08-24 |
CN113299388B true CN113299388B (zh) | 2023-09-29 |
Family
ID=77321638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110515814.9A Active CN113299388B (zh) | 2021-05-12 | 2021-05-12 | 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113299388B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102341039A (zh) * | 2009-01-27 | 2012-02-01 | 科学基础有限公司 | 用于诊断受试者的组织中的疾病状况的方法和装置 |
CN103703371A (zh) * | 2011-04-29 | 2014-04-02 | 癌症预防和治疗有限公司 | 使用分类系统及其试剂盒识别和诊断肺部疾病的方法 |
CN109117861A (zh) * | 2018-06-29 | 2019-01-01 | 浙江大学宁波理工学院 | 一种顾及空间位置的点集多层次聚集性分析方法 |
CN109273093A (zh) * | 2018-09-14 | 2019-01-25 | 苏州贝斯派生物科技有限公司 | 一种川崎病风险评估模型的构建方法及构建系统 |
CN110073220A (zh) * | 2016-09-29 | 2019-07-30 | 米密德诊断学有限公司 | 风险评估和疾病分类的方法 |
CN110472676A (zh) * | 2019-08-05 | 2019-11-19 | 首都医科大学附属北京朝阳医院 | 基于深度神经网络的胃早癌组织学图像分类系统 |
CN111095261A (zh) * | 2017-04-27 | 2020-05-01 | 视网膜病答案有限公司 | 眼底图像自动分析系统和方法 |
CN111110192A (zh) * | 2019-12-26 | 2020-05-08 | 北京中润普达信息技术有限公司 | 一种皮肤异常症状辅助诊断系统 |
CN111193734A (zh) * | 2019-12-27 | 2020-05-22 | 杭州安恒信息技术股份有限公司 | 基于http流量态势的用户行为分析方法 |
CN111210023A (zh) * | 2020-01-13 | 2020-05-29 | 哈尔滨工业大学 | 数据集分类学习算法自动选择系统及方法 |
CN112292697A (zh) * | 2018-04-13 | 2021-01-29 | 弗里诺姆控股股份有限公司 | 用于生物样品的多分析物测定的机器学习实施方式 |
CN112365931A (zh) * | 2020-09-18 | 2021-02-12 | 昆明理工大学 | 一种用于预测蛋白质功能的数据多标签分类方法 |
CN112786192A (zh) * | 2021-01-18 | 2021-05-11 | 吾征智能技术(北京)有限公司 | 一种手足口病智能认知系统、设备、存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9075796B2 (en) * | 2012-05-24 | 2015-07-07 | International Business Machines Corporation | Text mining for large medical text datasets and corresponding medical text classification using informative feature selection |
WO2021034677A1 (en) * | 2019-08-16 | 2021-02-25 | OptimDosing, LLC | Application for tracking progression and isolating causes of adverse medical conditions |
-
2021
- 2021-05-12 CN CN202110515814.9A patent/CN113299388B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102341039A (zh) * | 2009-01-27 | 2012-02-01 | 科学基础有限公司 | 用于诊断受试者的组织中的疾病状况的方法和装置 |
CN103703371A (zh) * | 2011-04-29 | 2014-04-02 | 癌症预防和治疗有限公司 | 使用分类系统及其试剂盒识别和诊断肺部疾病的方法 |
CN110073220A (zh) * | 2016-09-29 | 2019-07-30 | 米密德诊断学有限公司 | 风险评估和疾病分类的方法 |
CN111095261A (zh) * | 2017-04-27 | 2020-05-01 | 视网膜病答案有限公司 | 眼底图像自动分析系统和方法 |
CN112292697A (zh) * | 2018-04-13 | 2021-01-29 | 弗里诺姆控股股份有限公司 | 用于生物样品的多分析物测定的机器学习实施方式 |
CN109117861A (zh) * | 2018-06-29 | 2019-01-01 | 浙江大学宁波理工学院 | 一种顾及空间位置的点集多层次聚集性分析方法 |
CN109273093A (zh) * | 2018-09-14 | 2019-01-25 | 苏州贝斯派生物科技有限公司 | 一种川崎病风险评估模型的构建方法及构建系统 |
CN110472676A (zh) * | 2019-08-05 | 2019-11-19 | 首都医科大学附属北京朝阳医院 | 基于深度神经网络的胃早癌组织学图像分类系统 |
CN111110192A (zh) * | 2019-12-26 | 2020-05-08 | 北京中润普达信息技术有限公司 | 一种皮肤异常症状辅助诊断系统 |
CN111193734A (zh) * | 2019-12-27 | 2020-05-22 | 杭州安恒信息技术股份有限公司 | 基于http流量态势的用户行为分析方法 |
CN111210023A (zh) * | 2020-01-13 | 2020-05-29 | 哈尔滨工业大学 | 数据集分类学习算法自动选择系统及方法 |
CN112365931A (zh) * | 2020-09-18 | 2021-02-12 | 昆明理工大学 | 一种用于预测蛋白质功能的数据多标签分类方法 |
CN112786192A (zh) * | 2021-01-18 | 2021-05-11 | 吾征智能技术(北京)有限公司 | 一种手足口病智能认知系统、设备、存储介质 |
Non-Patent Citations (2)
Title |
---|
Deep Learning Based Person Authentication Using Hand Radiographs: A Forensic Approach;Joshi, SV等;IEEE ACCESS;第8卷;第95424-95434页 * |
基于改进GA-SVM的智能推荐诊断挂号算法;陈俊梅;周晋阳;张慧英;;现代电子技术(第11期);第123-126页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113299388A (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kashyap et al. | Glaucoma detection and classification using improved U-Net Deep Learning Model | |
Mehmood et al. | Machine learning assisted cervical cancer detection | |
Sun et al. | Diagnosis and analysis of diabetic retinopathy based on electronic health records | |
Huang et al. | A ViT-AMC network with adaptive model fusion and multiobjective optimization for interpretable laryngeal tumor grading from histopathological images | |
Hernández-Julio et al. | Framework for the development of data-driven Mamdani-type fuzzy clinical decision support systems | |
Khezri et al. | A fuzzy rule-based expert system for the prognosis of the risk of development of the breast cancer | |
Chattopadhyay et al. | An automated system to diagnose the severity of adult depression | |
Addeh et al. | Early detection of breast cancer using optimized ANFIS and features selection | |
Ribera et al. | Shape variation analyzer: a classifier for temporomandibular joint damaged by osteoarthritis | |
Livieris et al. | Identification of blood cell subtypes from images using an improved SSL algorithm | |
Singh et al. | A stack autoencoders based deep neural network approach for cervical cell classification in pap-smear images | |
Jena et al. | An integrated novel framework for coping missing values imputation and classification | |
Yahyaoui et al. | Performance Comparison of Deep and Machine Learning Approaches Toward COVID-19 Detection | |
Logeshwaran et al. | Optimizing the Capacity of Extreme Learning Machines for Biomedical Informatics Applications | |
Liu et al. | MTFIL-Net: automated Alzheimer’s disease detection and MMSE score prediction based on feature interactive learning | |
CN113299388B (zh) | 基于发热伴皮疹的跨模态医学生物特征认知疾病的系统 | |
Harika et al. | Alzheimers disease detection using different machine learning algorithms | |
Niu et al. | Cattle disease auxiliary diagnosis and treatment system based on data analysis and mining | |
Mohapatra et al. | Automated invasive cervical cancer disease detection at early stage through deep learning | |
Ahmed et al. | A Weight Based Labeled Classifier Using Machine Learning Technique for Classification of Medical Data. | |
Londhe | Classification of eye diseases using hybrid CNN-RNN models | |
Kothandaraman et al. | Dynamic model for assisted reproductive technology outcome prediction | |
Magade et al. | Automating Decision Process of Overnight Patient Care Using Hybrig Machine Learning Algorithms | |
Maddipatla | Classaphasia: an ensemble machine learning network to improve aphasia diagnosis and determine severity | |
Bhardwaj et al. | Machine Learning-Based Approaches for the Prognosis and Prediction of Multiple Diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |