CN113450905A - 医疗辅助诊断系统、方法及计算机可读存储介质 - Google Patents
医疗辅助诊断系统、方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113450905A CN113450905A CN202010214602.2A CN202010214602A CN113450905A CN 113450905 A CN113450905 A CN 113450905A CN 202010214602 A CN202010214602 A CN 202010214602A CN 113450905 A CN113450905 A CN 113450905A
- Authority
- CN
- China
- Prior art keywords
- medical
- information
- diagnosis
- disease
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 223
- 238000000034 method Methods 0.000 title claims abstract description 66
- 201000010099 disease Diseases 0.000 claims abstract description 135
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 135
- 238000012549 training Methods 0.000 claims abstract description 89
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000004590 computer program Methods 0.000 claims description 10
- 229940079593 drug Drugs 0.000 claims description 8
- 239000003814 drug Substances 0.000 claims description 8
- 238000003058 natural language processing Methods 0.000 claims description 7
- 238000007477 logistic regression Methods 0.000 claims description 6
- 238000003556 assay Methods 0.000 claims description 5
- 208000024891 symptom Diseases 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 20
- 238000012545 processing Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种医疗辅助诊断系统、方法及计算机可读存储介质,包括:信息接收模块,用于接收用户的医疗诊断信息;医疗专业知识数据库,用于存储医疗专业知识;解析模块,用于对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;训练模块,用于基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型;诊断模块,用于在输入医疗信息时,基于所述医疗辅助诊断模型输出诊断结果。采用本发明,在进行诊断辅助时能够提供更全面的支持。
Description
技术领域
本发明涉及医疗技术领域,特别涉及一种医疗辅助诊断系统、方法及计算机可读存储介质。
背景技术
在医疗辅助诊断问题中,现有的技术方案通常分别只注重于其中的某一个方面,因此不能全面的、有效的对信息进行整理,不能对医疗辅助诊断提供全面的支持。
发明内容
本发明提供了一种医疗辅助诊断系统、方法及计算机可读存储介质,用以解决现有辅助诊断系统不能全面的、有效的对信息进行整理的问题。
本发明实施例中提供了一种医疗辅助诊断系统,包括:
信息接收模块,用于接收用户的医疗诊断信息;
医疗专业知识数据库,用于存储医疗专业知识;
解析模块,用于对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
训练模块,用于基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型;
诊断模块,用于在输入医疗信息时,基于所述医疗辅助诊断模型输出诊断结果。
可选的,所述用户的医疗诊断信息包括如下信息之一或者其组合:
病历主诉信息、医疗检查结果、医疗检验报告、个人用药史、家族病史、与医疗诊断相关的信息。
可选的,所述医疗专业知识包括如下信息之一或者其组合:
医疗常识、医疗专业概念、医疗处置流程、医学手册。
可选的,所述疾病信息包括如下信息之一或者其组合:
疾病症状、化验指标、体征、并发症。
可选的,诊断模块进一步用于在基于所述医疗辅助诊断模型输出诊断结果时,基于预训练语言模型,将输入的医疗信息及疾病信息作为输入进行训练后,通过多标签回归模型输出包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果。
可选的,训练模块进一步用于使用应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型作为预训练语言模型。
可选的,训练模块进一步用于将输入所述诊断模块的医疗信息作为输入进行训练。
可选的,多标签回归模型包括以下模型之一:多层感知机、逻辑斯蒂回归模型、梯度提升树。
可选的,训练模块包括:
对应单元,用于从解析模块获取医疗概念文本,并确定医疗诊断信息对应的疾病;
关联单元,用于从医疗专业知识数据库获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
训练单元,用于将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
本发明实施例中提供了一种医疗辅助诊断方法,包括:
接收医疗信息;
基于医疗辅助诊断模型输出诊断结果,其中,医疗辅助诊断模型是按如下方式获得的:
接收用户的医疗诊断信息;
对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型。
可选的,所述用户的医疗诊断信息包括如下信息之一或者其组合:
病历主诉信息、医疗检查结果、医疗检验报告、个人用药史、家族病史、与医疗诊断相关的信息。
可选的,所述医疗专业知识包括如下信息之一或者其组合:
医疗常识、医疗专业概念、医疗处置流程、医学手册。
可选的,所述疾病信息包括如下信息之一或者其组合:
疾病症状、化验指标、体征、并发症。
可选的,进一步包括:
在基于所述医疗辅助诊断模型输出诊断结果时,基于预训练语言模型,将输入的医疗信息及疾病信息作为输入进行训练后,通过多标签回归模型输出包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果。
可选的,预训练语言模型是应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型。
可选的,进一步包括:
将输入的医疗信息作为输入进行训练。
可选的,多标签回归模型包括以下模型之一:多层感知机、逻辑斯蒂回归模型、梯度提升树。
可选的,基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,包括:
获取医疗概念文本,并确定医疗诊断信息对应的疾病;
获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
本发明实施例中提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述医疗辅助诊断方法的计算机程序。
本发明有益效果如下:
在本发明实施例提供的技术方案中,在进行诊断前,先将医疗概念文本中的医疗诊断信息与疾病信息作为输入,基于预训练语言模型训练出了医疗辅助诊断模型,而医疗诊断信息与疾病信息是在按自然语言规则解析出医疗概念文本后,根据医疗专业知识将相同的医疗概念文本归类后作为输入去训练的,由于医疗辅助诊断模型的信息是基于大量的用户的医疗诊断信息,因而在进行诊断辅助时能够提供更全面的支持。
进一步的,在获得医疗辅助诊断模型时,还基于医疗专业知识确定出各疾病之间的并发症关系及出现并发症的概率,这样,在进行诊断辅助时,不仅能辅助诊断出医疗信息所对应的疾病,还能够提供包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果,由于还能提供与并发症有关的诊断辅助信息,因而在进行诊断辅助时能够更进一步的提供更全面的支持。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例中医疗辅助诊断系统结构示意图;
图2为本发明实施例中医疗辅助诊断系统工作流程示意图;
图3为本发明实施例中医疗辅助诊断系统一种可能的结构示意图;
图4是本发明实施例中基于医疗专业知识解析用户医疗诊断信息流程示意图;
图5为本发明实施例中医疗辅助诊断模型训练流程示意图;
图6为本发明实施例中医疗辅助诊断模型训练过程中信息处理示意图;
图7为本发明实施例中医疗辅助诊断系统对疾病的预测过程示意图;
图8为本发明实施例中医疗辅助诊断方法实施流程示意图。
具体实施方式
发明人在发明过程中注意到:
在涉及医疗辅助诊断的方案中,一种现有的方案是,使用解析器(parser),然后将用户查询转换为关键词。这些关键词可基于对应的基于图结构的机器学习模型,查询得到更多相关的专有关键词。
但其不足在于,该方案只利用了基于用户查询得到的关键词信息,忽略了候选集中的疾病之间的联系。
另一种现有的方案是,在进行诊疗方案预测时,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。该方案在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失。
但是其不足在于:将不同疾病单独考虑,这一做法切断了疾病之间的联系。
另有一现有的方案是,应用BERT模型将文本表示与对应知识图谱信息有机结合起来。更具体的,在该方案中,根据任务的需求,每一个层次所包含的数据类型是不同的,而且根据具体层次的数据又有对应的标签。其中标题、作者列表和描述性文本所对应的类别数为8、93和242。因此,针对于具体层次的分类难度是不同的。方案中使用BERT(基于Transformer模型的双向编码器,Bidirectional Encoder Representations fromTransformers)来获取文档的表示,同时通过统计样本的元数据(如作者的个数、是否为学术性标题、标题所包含的单词数等)和基于维基百科的图嵌入模型(Graph embeddingmodel)来为最后的分类提供额外的信息,从而最终提升分类模型的性能。
但是其不足在于,方案直接应用相关知识图谱信息,未进行相关挖掘,削弱了模型的可解释性。
在医疗辅助诊断问题中,医疗专业知识以及病历与对应疾病描述文件的相似程度至关重要。但先有相关技术通常分别只注重于其中的一个方面,然而这两方面重要信息的结合将有助于增强医疗辅助诊断模型的推理及语义理解能力。
基于此,本发明实施例中提供了一种医疗辅助诊断系统,用以为医疗诊断过程提供更为全面的信息支持。下面结合附图对本发明的具体实施方式进行说明。
图1为医疗辅助诊断系统结构示意图,如图所示,可以包括:
信息接收模块101,用于接收用户的医疗诊断信息;
医疗专业知识数据库102,用于存储医疗专业知识;
解析模块103,用于对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
训练模块104,用于基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型;
诊断模块105,用于在输入医疗信息时,基于所述医疗辅助诊断模型输出诊断结果。
具体实施中,信息接收模块可以借助电子设备,接收用户的医疗诊断信息;借助电子设备接收用户的医疗诊断信息过程,包括通过网络等相关媒介,实现用户与宿主设备、专家系统及医疗辅助诊断模型的交互。
解析模块可以基于医疗专业知识解析相关医疗诊断信息;用户医疗诊断信息,包括但不仅限于病历主诉信息,检查结果,个人用药史及其他有助于医疗诊断的信息。医疗专业知识包括但不限于以任意形式存储的基本医疗常识、医疗相关概念,医疗处置流程等。
也即,实施中,所述用户的医疗诊断信息可以包括如下信息之一或者其组合:
病历主诉信息、医疗检查结果、医疗检验报告、个人用药史、家族病史、与医疗诊断相关的信息。
所述医疗专业知识可以包括如下信息之一或者其组合:
医疗常识、医疗专业概念、医疗处置流程、医学手册。
所述疾病信息包括如下信息之一或者其组合:
疾病症状、化验指标、体征、并发症。
训练模块可以基于预训练语言模型及医疗专业知识训练医疗辅助诊断系统;
诊断模块可以基于训练得到医疗辅助诊断系统输出当前输入医疗诊断信息的诊断结果;将输入诊断信息划分为多个子部分过程中,输入诊断信息可被划分为但不限于主诉、检验报告、家族病史等。
为了描述的方便,以上所述装置的各部分以功能分为各种模块或单元分别描述。当然,在实施本发明时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。
下面结合实例再进行具体说明。
图2为医疗辅助诊断系统工作流程示意图,如图所示,可以包括:
步骤201、借助电子设备,从相关电子设备中接收用户医疗诊断信息;
步骤202、基于医疗专业知识,对用户的相关医疗诊断信息进行解析;
步骤203、基于预训练语言模型及医疗专业知识训练医疗辅助诊断系统;
步骤204、输入患者的医疗诊断信息,基于训练得到的医疗辅助诊断模型,输出该患者的诊断结果。
需要说明的是,该过程是示意的,并不是每一次对患者进行诊断之前都需要执行步骤201-步骤203,事实上,医疗辅助诊断系统模型是可以预先训练好的,当然也可以在使用过程中输入新的医疗诊断信息进行训练。
图3为医疗辅助诊断系统一种可能的结构示意图,如图所示,包括作为信息接收模块的宿主设备、通信网络、存放医疗专业知识数据库的计算机数据库、供解析模块以及训练模块、诊断模块运行的计算机服务器,图中示意的宿主设备可为任意类型的电子设备例如个人计算机、智能手机等。必要的医疗诊断信息可以以文档形式从宿主设备中获取后,通过通信网络传输给服务器端进行后续处理。结合在数据库上以任一形式存储的医疗专业知识,在计算机服务器上预测任一对应疾病。
图4是基于医疗专业知识解析用户医疗诊断信息流程示意图,如图所示,可以包括:
步骤401、输入用户的医疗诊断信息;
步骤402、对文本进行常规处理;
具体的,可以按照自然语言领域常规预处理方式进行处理,具体的自然语言领域常规预处理可以包括分词、词干化、去除标点符号及去除其他停用词等。当用户的医疗诊断信息输入时,相关处理过程可由自然语言领域常规预处理软件实现。
步骤403、将文本分为不同子组分;
具体的,可以将输入的医疗诊断信息划分为多个子组分,例如,可以将相关子组分为:主诉、检查结果、用药史等。这一过程可以依赖于医疗专业知识进行划分,也即,按照行业内的约定分类方式进行划分,便于标准化、便于医学专业人员识别沟通等。具体的,如文本中出现“血糖为100mg/ml”,可以通过医疗专业知识将该文本划分为检查结果。
步骤404、将文本中的子组分所指的相关实体概念基于医疗专业知识进行统一表述、归并;
具体的,可以将医疗诊断信息中涉及的相同医疗概念,基于医疗专业知识链接到同一文本,也即将其进行归并。例如,“发热”、“高烧”,“体温偏高”等均为描述发热的不同表述,但往往在医疗诊断信息中常常会出现这样的多种表述,此时可以基于医疗专业知识,将相关表述统一为“发热”后进行后续处理,从而有利于后续模型的训练和验证过程。
步骤405、输出解析后的医疗诊断信息。
下面对模型的训练实施进行说明。
在模型训练过程中,主要包括,基于医疗专业知识抽取疾病相关标签,将用户的医疗诊断信息及疾病信息作为医疗辅助诊断模型的输入,训练模型直至收敛。
实施中,训练模块进一步用于使用应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型作为预训练语言模型。具体的,采用的预训练语言模型可以是基于通用或单一领域语料训练得到的语言模型,且可以应用于自然语言处理过程的模型即可。
实施中的预训练语言模型与医疗专业知识相结合,主要包括引入表明疾病间相互关系的疾病相关标签来标识各疾病之间的并发症关系及出现并发症的概率。其中,并发症关系可根据输出疾病概率判断,如疾病a概率为1,疾病b概率为0.8,则可以判断疾病b为a的一种并发症。
也即,实施中,训练模块可以包括:
对应单元,用于从解析模块获取医疗概念文本,并确定医疗诊断信息对应的疾病;
关联单元,用于从医疗专业知识数据库获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
训练单元,用于将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
实施中,多标签回归模型可以包括以下模型之一:多层感知机、逻辑斯蒂回归模型、梯度提升树。
基于输入,多标签回归模型可输出多个对应标签的概率。多标签回归模型包括但不限于:MLP(多层感知机,Multi-Layer Perceptron),LR(逻辑斯蒂回归模型,LogisticRegression),GBDT(梯度提升树,Gradient Boosting Decision Tree)等。在具体实施方式中,将主要以多层感知机为例进行说明。
下面对具体实施方式进行说明。
图5为医疗辅助诊断模型训练流程示意图,如图所示,可以包括:
步骤501、输入解析后的医疗诊断信息;
步骤502、基于医疗专业知识,生成疾病相关标签;
具体的,在训练过程中,在得到解析后用户医疗诊断信息及其对应的疾病信息后,可以借助医疗专业知识抽取到相关疾病对应的并发症,并同时得到已知疾病的情况,相关的并发症发生的概率。
相关并发症以及各并发症的发生概率可用于表示当前疾病与其并发症的联系紧密程度,实施例中将这一概率命名为当前疾病的疾病相关概率。在此情况下,不仅可以通过学习得到当前疾病与医疗诊断信息之间的联系,同时也能通过学习得到疾病之间的相关联系。
步骤503、将病例信息及疾病信息作为预训练语言模型输入;
图6为医疗辅助诊断模型训练过程中信息处理示意图,在将医疗诊断信息及疾病信息作为医疗辅助诊断模型的输入的过程中,如图所示为训练过程的一个示例,包括:
训练过程可分为两部分:
第一部分即为图中左半部分(含有拼接处理的部分)。这一部分主要抽取用户的医疗诊断信息及疾病信息的语义特征(在本示例中,包括用户的医疗诊断信息及疾病A描述文档,疾病A描述文档分别为病历A和对应的疾病A描述文本)。
第二部分即右半部分,也即对疾病B描述文档的处理部分,这部分主要目的是抽取疾病之间的相互关系,并生成疾病相关标签用于训练。疾病相关标签的抽取依赖于医疗专业知识对于疾病及其并发症的可能性描述和其他数据挖掘方法。
上述过程中涉及的语义特征抽取可以依赖于预训练语言模型。由于BERT为现阶段比较先进的预训练语言模型,实施中可以采用BERT作为预训练语言模型。
在抽取得到相关语义特征后,以多标签回归模型中的多层感知机为例,可以选择这一模型来预测疾病A与疾病B的相关程度。需要指出的是,任意基于特征向量输入的机器学习模型均可作为这里的模型选择对象,具体应视任务而定。
步骤504、训练模型直至收敛;
训练模型直至收敛,这是机器学习训练过程中的通用做法。
步骤505、输出医疗辅助诊断模型。
下面对诊断过程进行说明。
诊断过程中,在输入医疗信息时,基于所述医疗辅助诊断模型输出诊断结果。主要包括:将医疗诊断信息作为预训练语言模型输入,然后基于输入医疗诊断信息输出对应疾病列表。
图7为医疗辅助诊断系统对疾病的预测过程示意图,如图所示,主要包括:将用户的医疗诊断信息作为医疗诊断辅助模型输入,然后输出用户医疗诊断信息对应的疾病列表。
具体的,医疗辅助诊断模型的诊断过程与医疗辅助诊断模型的训练过程类似。将病人的病历文本及医疗专业知识作为模型输入,然后预训练语言模型用于抽取相关文本语义特征;之后再将相关的医疗概念文本特征拼接作为后续多层感知机输入,最后输出疾病列表及其每种可能的并发症对应的概率分数。
基于同一发明构思,本发明实施例中还提供了一种医疗辅助诊断方法、计算机可读存储介质,由于这些方法、设备解决问题的原理与医疗辅助诊断系统相似,因此这些方法、设备的实施可以参见系统的实施,重复之处不再赘述。
图8为医疗辅助诊断方法实施流程示意图,如图所示,可以包括:
步骤801、接收医疗信息;
步骤802、基于医疗辅助诊断模型输出诊断结果;
其中,医疗辅助诊断模型是按如下方式获得的:
接收用户的医疗诊断信息;
对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型。
可选的,所述用户的医疗诊断信息包括如下信息之一或者其组合:
病历主诉信息、医疗检查结果、医疗检验报告、个人用药史、家族病史、与医疗诊断相关的信息。
可选的,所述医疗专业知识包括如下信息之一或者其组合:
医疗常识、医疗专业概念、医疗处置流程、医学手册。
可选的,所述疾病信息包括如下信息之一或者其组合:
疾病症状、化验指标、体征、并发症。
可选的,进一步包括:
在基于所述医疗辅助诊断模型输出诊断结果时,基于预训练语言模型,将输入的医疗信息及疾病信息作为输入进行训练后,通过多标签回归模型输出包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果,也即,通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
可选的,预训练语言模型是应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型。
可选的,进一步包括:
将输入的医疗信息作为输入进行训练。
可选的,基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,包括:
获取医疗概念文本,并确定医疗诊断信息对应的疾病;
获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
本发明实施例中提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述医疗辅助诊断方法的计算机程序。
具体实施可以参见前述医疗辅助诊断方法、医疗辅助诊断系统的具体实施方式。
综上所述,在本发明实施例提供的技术方案中,引入了基于通用语料训练得到的预训练语言模型,有助于提升医疗辅助诊断系统的语义能力。
由于诊断模型还依据了医疗专业知识,因而可以提升医疗辅助诊断系统的预测能力。
由于疾病相关标签是借助医疗专业知识得到的,因而有利于量化疾病之间的相互联系,为医疗辅助诊断模型提供可解释性的视野。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (15)
1.一种医疗辅助诊断系统,其特征在于,包括:
信息接收模块,用于接收用户的医疗诊断信息;
医疗专业知识数据库,用于存储医疗专业知识;
解析模块,用于对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
训练模块,用于基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型;
诊断模块,用于在输入医疗信息时,基于所述医疗辅助诊断模型输出诊断结果。
2.如权利要求1所述的系统,其特征在于,所述用户的医疗诊断信息包括如下信息之一或者其组合:
病历主诉信息、医疗检查结果、医疗检验报告、个人用药史、家族病史、与医疗诊断相关的信息。
3.如权利要求1所述的系统,其特征在于,所述医疗专业知识包括如下信息之一或者其组合:
医疗常识、医疗专业概念、医疗处置流程、医学手册。
4.如权利要求1所述的系统,其特征在于,所述疾病信息包括如下信息之一或者其组合:
疾病症状、化验指标、体征、并发症。
5.如权利要求1所述的系统,其特征在于,诊断模块进一步用于在基于所述医疗辅助诊断模型输出诊断结果时,基于预训练语言模型,将输入的医疗信息及疾病信息作为输入进行训练后,通过多标签回归模型输出包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果。
6.如权利要求5所述的系统,其特征在于,所述多标签回归模型包括以下模型之一:多层感知机、逻辑斯蒂回归模型、梯度提升树。
7.如权利要求1所述的系统,其特征在于,训练模块进一步用于使用应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型作为预训练语言模型。
8.如权利要求1所述的系统,其特征在于,训练模块进一步用于将输入所述诊断模块的医疗信息作为输入进行训练。
9.如权利要求1至8任一所述的系统,其特征在于,训练模块包括:
对应单元,用于从解析模块获取医疗概念文本,并确定医疗诊断信息对应的疾病;
关联单元,用于从医疗专业知识数据库获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
训练单元,用于将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出相关疾病发病概率,表征相关输入信息与疾病之间的关系,以及出现疾病及其并发症的概率。
10.一种医疗辅助诊断方法,其特征在于,包括:
接收医疗信息;
基于医疗辅助诊断模型输出诊断结果,其中,医疗辅助诊断模型是按如下方式获得的:
接收用户的医疗诊断信息;
对接收到的医疗诊断信息按自然语言规则解析出医疗概念文本,并根据医疗专业知识将相同的医疗概念文本归类,其中,所述医疗概念文本中包括医疗诊断信息与疾病信息;
基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型。
11.如权利要求10所述的方法,其特征在于,进一步包括:
在基于所述医疗辅助诊断模型输出诊断结果时,基于预训练语言模型,将输入的医疗信息及疾病信息作为输入进行训练后,通过多标签回归模型输出包含疾病列表医疗辅助诊断结果和/或包含疾病列表以及表中每一疾病的发生概率的医疗辅助诊断结果。
12.如权利要求10所述的方法,其特征在于,预训练语言模型是应用于自然语言处理过程的基于通用或单一领域语料训练得到的语言模型。
13.如权利要求10所述的方法,其特征在于,进一步包括:
将输入的医疗信息作为输入进行训练。
14.如权利要求10至13任一所述的方法,其特征在于,基于预训练语言模型,将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,包括:
获取医疗概念文本,并确定医疗诊断信息对应的疾病;
获取医疗专业知识,并确定各疾病之间的并发症关系及出现并发症的概率;
将所述医疗概念文本中的医疗诊断信息与疾病信息作为输入进行训练后,获得医疗辅助诊断模型,其中,所述医疗辅助诊断模型中包括:通过多标签回归模型输出疾病与当前医疗诊断信息相关的概率。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求10至14任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010214602.2A CN113450905A (zh) | 2020-03-24 | 2020-03-24 | 医疗辅助诊断系统、方法及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010214602.2A CN113450905A (zh) | 2020-03-24 | 2020-03-24 | 医疗辅助诊断系统、方法及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113450905A true CN113450905A (zh) | 2021-09-28 |
Family
ID=77806574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010214602.2A Withdrawn CN113450905A (zh) | 2020-03-24 | 2020-03-24 | 医疗辅助诊断系统、方法及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113450905A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114822880A (zh) * | 2022-06-30 | 2022-07-29 | 北京超数时代科技有限公司 | 一种基于国产自主可控的医院诊疗信息系统 |
CN115148323A (zh) * | 2022-09-06 | 2022-10-04 | 北京鹰瞳科技发展股份有限公司 | 基于医学图像进行疾病预测的装置、方法和可读存储介质 |
CN115631868A (zh) * | 2022-11-17 | 2023-01-20 | 神州医疗科技股份有限公司 | 一种基于提示学习模型的传染病预警直报方法和系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7379885B1 (en) * | 2000-03-10 | 2008-05-27 | David S. Zakim | System and method for obtaining, processing and evaluating patient information for diagnosing disease and selecting treatment |
US20180137250A1 (en) * | 2016-11-15 | 2018-05-17 | Hefei University Of Technology | Mobile health intelligent medical guide system and method thereof |
WO2019155267A1 (en) * | 2018-02-12 | 2019-08-15 | Iota Medtech Pte. Ltd. | Integrative medical technology artificial intelligence platform |
CN110263164A (zh) * | 2019-06-13 | 2019-09-20 | 南京邮电大学 | 一种基于模型融合的情感倾向分析方法 |
US10426442B1 (en) * | 2019-06-14 | 2019-10-01 | Cycle Clarity, LLC | Adaptive image processing in assisted reproductive imaging modalities |
US20190311807A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
US20190311814A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
US20200051694A1 (en) * | 2018-08-10 | 2020-02-13 | Tal Goldberg | Hybrid knowledge graph for healthcare applications |
WO2020037454A1 (zh) * | 2018-08-20 | 2020-02-27 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
-
2020
- 2020-03-24 CN CN202010214602.2A patent/CN113450905A/zh not_active Withdrawn
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7379885B1 (en) * | 2000-03-10 | 2008-05-27 | David S. Zakim | System and method for obtaining, processing and evaluating patient information for diagnosing disease and selecting treatment |
US20180137250A1 (en) * | 2016-11-15 | 2018-05-17 | Hefei University Of Technology | Mobile health intelligent medical guide system and method thereof |
WO2019155267A1 (en) * | 2018-02-12 | 2019-08-15 | Iota Medtech Pte. Ltd. | Integrative medical technology artificial intelligence platform |
US20190311807A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
US20190311814A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
US20200051694A1 (en) * | 2018-08-10 | 2020-02-13 | Tal Goldberg | Hybrid knowledge graph for healthcare applications |
WO2020037454A1 (zh) * | 2018-08-20 | 2020-02-27 | 深圳市全息医疗科技有限公司 | 智能辅助诊疗系统及方法 |
CN110263164A (zh) * | 2019-06-13 | 2019-09-20 | 南京邮电大学 | 一种基于模型融合的情感倾向分析方法 |
US10426442B1 (en) * | 2019-06-14 | 2019-10-01 | Cycle Clarity, LLC | Adaptive image processing in assisted reproductive imaging modalities |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114822880A (zh) * | 2022-06-30 | 2022-07-29 | 北京超数时代科技有限公司 | 一种基于国产自主可控的医院诊疗信息系统 |
CN115148323A (zh) * | 2022-09-06 | 2022-10-04 | 北京鹰瞳科技发展股份有限公司 | 基于医学图像进行疾病预测的装置、方法和可读存储介质 |
CN115631868A (zh) * | 2022-11-17 | 2023-01-20 | 神州医疗科技股份有限公司 | 一种基于提示学习模型的传染病预警直报方法和系统 |
CN115631868B (zh) * | 2022-11-17 | 2023-04-21 | 神州医疗科技股份有限公司 | 一种基于提示学习模型的传染病预警直报方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7157758B2 (ja) | モデル支援コホート選択を行うシステム及び方法 | |
CN109213870B (zh) | 文档处理 | |
CN112786194A (zh) | 基于人工智能的医学影像导诊导检系统、方法及设备 | |
US9965548B2 (en) | Analyzing natural language questions to determine missing information in order to improve accuracy of answers | |
US20140181128A1 (en) | Systems and Methods for Processing Patient Data History | |
CN113450905A (zh) | 医疗辅助诊断系统、方法及计算机可读存储介质 | |
CN112241457A (zh) | 一种融合扩展特征的事理知识图谱事件检测方法 | |
EP4018353A1 (en) | Systems and methods for extracting information from a dialogue | |
US20140129246A1 (en) | Extension of clinical guidelines based on clinical expert recommendations | |
WO2022068160A1 (zh) | 基于人工智能的重症问诊数据识别方法、装置、设备及介质 | |
CN113724819B (zh) | 医疗命名实体识别模型的训练方法、装置、设备及介质 | |
CN111145903A (zh) | 获取眩晕症问诊文本的方法、装置、电子设备及问诊系统 | |
CN112017744A (zh) | 电子病例自动生成方法、装置、设备及存储介质 | |
Goryachev et al. | Identification and extraction of family history information from clinical reports | |
Krishna et al. | Extracting structured data from physician-patient conversations by predicting noteworthy utterances | |
Ozyegen et al. | Word-level text highlighting of medical texts for telehealth services | |
CN114298314A (zh) | 一种基于电子病历的多粒度因果关系推理方法 | |
WO2015023031A1 (ko) | 전문분야 검색 지원 방법 및 그 장치 | |
Funkner et al. | Negation Detection for Clinical Text Mining in Russian. | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
Zaghir et al. | Real-world patient trajectory prediction from clinical notes using artificial neural networks and UMLS-based extraction of concepts | |
MacPhaul et al. | Classifying firearm injury intent in electronic hospital records using natural language processing | |
CN115662562A (zh) | 病历诊疗数据管理方法、装置、设备及存储介质 | |
CN112561714B (zh) | 基于nlp技术的核保风险预测方法、装置及相关设备 | |
Cui et al. | Intelligent recommendation for departments based on medical knowledge graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210928 |
|
WW01 | Invention patent application withdrawn after publication |