CN114708965B - 诊断推荐方法及装置、电子设备和存储介质 - Google Patents

诊断推荐方法及装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114708965B
CN114708965B CN202210631085.8A CN202210631085A CN114708965B CN 114708965 B CN114708965 B CN 114708965B CN 202210631085 A CN202210631085 A CN 202210631085A CN 114708965 B CN114708965 B CN 114708965B
Authority
CN
China
Prior art keywords
text
sample
disease
diagnosis
texts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210631085.8A
Other languages
English (en)
Other versions
CN114708965A (zh
Inventor
张书通
李珊珊
鲍溪荷
赵景鹤
胡加学
贺志阳
鹿晓亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iflytek Medical Technology Co ltd
Original Assignee
Anhui Xunfei Medical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Xunfei Medical Co ltd filed Critical Anhui Xunfei Medical Co ltd
Priority to CN202210631085.8A priority Critical patent/CN114708965B/zh
Publication of CN114708965A publication Critical patent/CN114708965A/zh
Application granted granted Critical
Publication of CN114708965B publication Critical patent/CN114708965B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请公开了一种诊断推荐方法及装置、电子设备和存储介质,其中,诊断推荐方法包括:基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;再基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病。上述方案,能够提高推荐准确率。

Description

诊断推荐方法及装置、电子设备和存储介质
技术领域
本申请涉及智慧医疗技术领域,特别是涉及一种诊断推荐方法及装置、电子设备和存储介质。
背景技术
随着信息技术的发展,通过推荐系统进行智能化推荐服务,已经在各行各业得到广泛应用。以诊断推荐为例,在患者问诊过程中格外重要。例如,在医生与患者沟通过程中,通过诊断推荐,有助于辅助医生快速地对患者进行诊断。
研究发现,诸如医疗领域中诊断推荐等现有推荐系统通常受到特征工程及拟合不足或过量等因素影响,推荐准确率难免会降低。有鉴于此,如何提高推荐准确率成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种诊断推荐方法及装置、电子设备和存储介质,能够提高推荐准确率。
为了解决上述技术问题,本申请第一方面提供了一种诊断推荐方法,包括:基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病。
为了解决上述技术问题,本申请第二方面提供了一种诊断推荐装置,包括预测模块、匹配模块和确定模块,预测模块用于基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;匹配模块用于基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;确定模块用于基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病。
为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的诊断推荐方法。
为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的诊断推荐方法。
上述方案,通过基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在诊断推荐的过程中,通过综合各候选疾病的第一分值和第二分值两者,共同确定目标患者推荐诊断的最终疾病,能够尽可能地降低诊断推荐产生的偏差。故此,能够在医疗领域,提高辅助诊断的推荐准确率。
附图说明
图1是本申请诊断推荐方法一实施例的流程示意图;
图2是从病历文本提取关键文本一实施例的示意图;
图3是由样本关键文本融合得到参考文本一实施例的示意图;
图4是对样本训练文本进行分配一实施例的示意图;
图5是本申请诊断推荐方法一实施例的示意图;
图6是本申请推荐方法一实施例的流程示意图;
图7是本申请诊断推荐装置一实施例的框架示意图;
图8是本申请推荐装置一实施例的框架示意图;
图9是本申请电子设备一实施例的框架示意图;
图10是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请诊断推荐方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值。
本公开实施例中,目标患者的关键文本可以提取自目标患者的病历文本。需要说明的是,病历文本包括影响诊断推荐结果的相关信息,示例性地,可以包括患者的一般情况(如性别、年龄、职业、籍贯、学历等)、主诉(如主要症状、发病时间等)、现病史(如对主诉的进一步描述)、既往史(如既往患病及治疗情况)、个人史、家族史、体格检查、检验、检查等信息,病历文本所包含的具体信息,在此不再一一赘述。
在一个实施场景中,在使用深度学习模型之前,可以先基于样本病历文本对深度学习模型进行训练。具体地,可以先提取各样本病历文本的样本关键文本,并且样本病历文本标注有第二诊断疾病,再基于样本关键文本和样本病历文本标注的第二诊断疾病调整深度学习模型的网络参数。样本病历文本可以是从医院以往病历文本抽样获取。当然,为了提升深度学习模型对不同疾病类别诊断推荐的泛化能力,样本病历文本还可以是根据不同第二诊断疾病选择得到,示例性地,标注不同第二诊断疾病的样本病历文本的数量可以基本持平。需要说明的是,以上几种选择方式仅仅是实际应用过程中样本病历文本可能的选择方式,本公开实施例中,样本病历文本可以根据实际情况进行选择,在此不做具体限定。此外,第二诊断疾病是样本病历文本的诊断结果,示例性地,若样本病历文本是从医院以往病历文本抽样获取,则该目标患者诊断的最终疾病已确定,则最终疾病为第二诊断疾病。
在一个实施场景中,深度学习模型可以是BERT(Bidirectional EncoderRepresentations from Transformers,语言表征模型),深度学习模型还可以是GPT(Generative Pre-Training,生成式预训练模型),深度学习模型也可以是GCN(GraphConvolutional Network,图卷积神经网络模型),深度学习模型可以根据实际情况进行选择,在此不做具体限定。
请参阅图2,图2是从病历文本提取关键文本一实施例的示意图,如图2所示,关键文本22提取自目标患者的病历文本21,即病历文本21是关于目标患者的问诊信息,再通过对病历文本21提取关键信息得到关键文本22,提取关键文本22不仅可以通过自然语言处理(NLP,Natural Language Processing)技术实现,也可以使用正则表达式(又称规则表达式,Regular Expression,在代码中常简写为regex或RE,是计算机科学的一个概念;正则表达式通常被用来检索、替换符合某个模式或规则的文本)进行检索实现,还可以通过人工检索的方式进行提取,提取病历文本21中关键文本22的方式可以根据实际情况进行选择,在此不做具体限定。
在一个具体实施场景中,基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值,不同候选疾病对应的第一分值之间可能存在相同的情况,也可能存在不同的情况,具体不同候选疾病对应的第一分值之间的大小关系在此不做具体限定。
在一个实施场景中,在基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值之前,还可以提取样本病历文本的样本关键文本;且样本病历文本标注有第二诊断疾病;再基于标注有相同第二诊断疾病的样本病历文本所提取的样本关键文本进行融合,得到第二诊断疾病的参考文本。上述方式,通过对样本关键文本进行分类并融合,得到第二诊断疾病的参考文本,有助于提高逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配时的效率,进而提高目标患者推荐诊断的最终疾病的准确率。
在一个具体实施场景中,样本关键文本包括若干关键字段的样本子文本,基于标注有相同第二诊断疾病的样本病历文本所提取的样本关键文本进行融合,为了得到第二诊断疾病的参考文本,可以对于从标注有相同第二诊断疾病的样本病历文本分别所提取的样本关键文本,分别将相同关键字段的样本子文本进行融合,得到对应关键字段的融合子文本;再基于若干关键字段的融合子文本,得到第二诊断疾病的参考文本。示例性地,第二诊断疾病为肺炎,若干关键字段可以包括年龄、性别、是否吸烟、高血压指数、血脂是否异常等等,关键字段可以根据实际情况进行选择,在此不做具体限定。不同的第二诊断疾病可以设置相同的关键字段,也可以设置不同的关键字段,可以根据实际情况进行选择,在此不作具体限定。此外,可以对相同关键字段的样本子文本进行融合,示例性地,目标患者张三和李四的样本病历文本标注有相同的第二诊断疾病,且第二诊断疾病为肺炎,对目标患者为张三的样本关键文本,从主诉中提取出主要症状和发病时间,例如:咳嗽#主要症状,3天#发病时间;从体格检查中提取出查体信息,例如:双下肺湿啰音#体征;从检查中提取出检查信息,例如:胸部CT#检查项目,双下肺少许炎性浸润#检查描述,双侧肺炎#检查结论。对目标患者为李四的样本关键文本,从主诉中提取出主要症状和发病时间,例如:咳嗽、咳痰、咯血#主要症状,3天#发病时间;在此过程中,得到关键字段为“主症状”的融合子文本为“发热、咳嗽、咳痰、咯血等”,则第二诊断疾病为肺炎的主症状为发热、咳嗽、咳痰、咯血等,其他关键字段的融合方式可以参阅主症状的融合过程,在此不再赘述。上述方式,第二诊断疾病的参考文本包括若干关键字段的融合子文本,有助于提高匹配的准确性,进而提高最终的诊断推荐的准确性。
请参阅图3,图3是由样本关键文本融合得到参考文本一实施例的示意图,请参阅图3,图3中样本病历文本1、样本病历文本2和样本病历文本3的第二诊断疾病均为类风湿关节炎,且样本病历文本1的样本关键文本31、样本病历文本2的样本关键文本32和样本病历文本3的样本关键文本33均可以参照图2以及相关描述提取得到,在此不再赘述。在此基础上,可以将各样本病历文本的主症状、查体、检验等进行融合,得到第二诊断疾病“类风湿关节炎”的参考文本34。
步骤S12:基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值。
在一个实施场景中,在使用逻辑回归模型之前,可以先基于样本病历文本对逻辑回归模型进行训练。具体地,可以先提取各样本病历文本的样本关键文本,并且样本病历文本标注有第二诊断疾病,基于样本关键文本和样本病历文本标注的第二诊断疾病调整逻辑回归模型的网络参数。本公开实施例中,样本病历文本可以根据实际情况进行选择,在此不做具体限定。
在一个实施场景中,逻辑回归模型可以是二项逻辑回归模型,逻辑回归模型还可以是无序多类逻辑回归模型,逻辑回归模型也可以是有序多分类逻辑回归模型,逻辑回归模型的形式可以根据实际情况进行选择,在此不做具体限定。
在一个实施场景中,基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值,即在匹配的过程中,不同候选疾病对应的第二分值之间可能存在相同的情况,也可能存在不同的情况,具体不同候选疾病对应的第二分值之间的大小关系在此不做具体限定。
在一个具体实施场景中,关键文本包括若干关键字段的子文本,不同的病历文本对应的关键文本可以包括不同的关键字段,也可以包括相同的关键字段,可以根据实际情况进行设置,在此不做具体限定。基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,为了得到各候选疾病的第二分值,可以对于每种候选疾病的参考文本,基于逻辑回归模型将若干关键字段的子文本分别与候选疾病的参考文本进行匹配,得到若干关键字段命中候选疾病的子分值,示例性地,关键字段包括主要症状、检查描述等,关键字段的子文本包括咳嗽#主要症状、双下肺炎性浸润#检查描述,候选疾病的参考文本包括咳嗽、发热、咳血、咳痰#主要症状、双下肺炎性浸润#检查描述,根据关键字段的子文本分别与候选疾病的参考文本之间的命中率,确定候选疾病的子分值,如关键字段为主要症状的子文本与参考文本之间的重合率为1,对应的子分值为1,当然,对应分值也可以设置为0.1、0.2等,对应分值的设置可以根据实际情况进行设置,在此不做具体限定。再基于若干关键字段分别命中同种候选疾病的子分值进行融合,得到对应候选疾病的第二分值,子分值之间进行融合的方式可以为相加,也可以是加权相乘,子分值进行融合的方式可以根据实际情况进行选择,在此不做具体限定。上述方式,通过基于若干关键字段分别命中同种候选疾病的子分值进行融合,通过融合有助于提高诊断推荐的准确率。
在一个实施场景中,为了提升深度学习模型和逻辑回归模型的模型性能,可以尽可能多地获取用于模型训练的样本训练文本。需要说明的是,样本训练文本具体可以包括用于模型训练阶段的样本病历文本和用于模型测试阶段的测试病历文本,并且样本病历文本标注有第二诊断疾病,测试病历文本标注有测试患者的第一诊断疾病,在对深度学习模型和逻辑回归模型进行效果优化的过程中,可以不断增加新的样本训练文本。示例性地,请参阅图4,图4是对样本训练文本进行分配一实施例的示意图,首先可以分别获取医院以往病历文本和新增病历文本作为样本训练文本,新增病历文本可以是医院近期新增病历文本,且新增病历文本标注有第三诊断疾病,将医院以往病历文本中70%样本训练文本用于模型训练阶段的样本病历文本,其余30%样本训练文本用于模型测试阶段的测试病历文本,通过深度学习模型获取各测试病历文本的预测诊断疾病,若测试病历文本中标注的第一诊断疾病和预测诊断疾病相同,则对应测试病历文本标记为第一预测诊断正确文本,其余标记为第一预测诊断错误文本。再通过深度学习模型获取新增病历文本的预测诊断疾病,若新增病历文本中标注的第三诊断疾病和预测诊断疾病相同,则对应新增病历文本标记为第二预测诊断正确文本,其余标记为第二预测诊断错误文本。通过第一预测诊断错误文本和第二预测诊断错误文本组成逻辑回归模型干预组,通过第二预测诊断正确文本和样本病历文本组成逻辑回归模型对照组,并且逻辑回归模型对照组的数量是逻辑回归模型干预组的2~3倍,逻辑回归模型干预组和逻辑回归模型对照组组成逻辑回归模型训练组,逻辑回归模型训练组用于对逻辑回归模型进行训练并调整网络参数,进而使逻辑回归模型具有更好的准确性。需要说明的是,对样本训练文本进行分配的方式可以根据实际情况进行设置,在此不做具体限定。
步骤S13:基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病。
在一个实施场景中,为了得到目标患者推荐诊断的最终疾病,可以基于候选疾病的第一分值和第二分值进行融合,得到候选疾病的融合分值;对第一分值与第二分值进行融合的方式可以是将第一分值与第二分值进行相加的方式,也可以是将第一分值与第二分值进行相乘的方式,第一分值与第二分值进行融合的方式可以根据实际进行选择,在此不做具体限定。基于各候选疾病的融合分值,选择一个候选疾病作为目标患者推荐诊断的最终疾病,目标患者推荐诊断的最终疾病可以根据融合分值的大小关系进行选择,也可以通过第一分值最高且融合分值满足预设条件的方式选择,还可以是通过第一分值、第二分值与融合分值之间的大小关系进行选择,选择目标患者推荐诊断的最终疾病的方式可以根据实际情况进行设置,在此不作具体限定。
在另一个实施场景中,为了得到目标患者推荐诊断的最终疾病,可以基于候选疾病的第一分值和第二分值进行加权,得到候选疾病的加权分值;基于各候选疾病的加权分值,选择至少一个候选疾病作为目标患者推荐诊断的最终疾病。需要说明的是,可以选择满足预设条件且加权分值最高的一者为目标患者推荐诊断的最终疾病,预设条件可以是第一分值不小于预设阈值,预设条件也可以是第二分值不小于预设阈值,预设条件可以根据实际情况进行设置,在此不做具体限定,当然,也可以选择加权分值中最高的一者为目标患者推荐诊断的最终疾病。选择最终疾病的方式可以根据实际情况进行选择,在此不做具体限定。上述方式,通过对第一分值和第二分值进行加权处理,进而得到各候选疾病的加权分值,可以进一步使深度学习模型和逻辑回归模型更好的实现诊断推荐的效率,最终提高诊断推荐的准确率。
在一个实施场景中,加权分值基于第一权重的权重值、第二权重的权重值分别对第一分值、第二分值加权得到,第一权重的权重值和第二权重的权重值基于深度学习模型和逻辑回归模型在测试数据中测试得到,且测试数据包括若干测试患者的测试病历文本,测试病历文本标注有测试患者的第一诊断疾病,第一诊断疾病是测试病历文本的诊断结果,示例性地,若测试病历文本是从医院以往病历文本抽样获取,则该目标患者诊断的最终疾病已确定,最终疾病为第一诊断疾病。并且在测试的过程中,可以基于深度学习模型和逻辑回归模型对第一权重的权重值和第二权重的权重值不断地调整,示例性地,第一权重的权重值为k,可以通过对比测试病历文本的效果自动计算,如k的初始值为0.01,在0到10的范围内以步长0.01递增,取测试病历文本诊断效果最好的值作为k值。对第一权重的权重值和第二权重的权重值进行调整的方式可以根据实际情况进行选择,在此不做具体限定。上述方式,通过对第一分值和第二分值进行加权处理,有助于提高深度学习模型和逻辑回归模型对目标患者推荐诊断的推荐效果,进而提高最终的诊断推荐的准确率。
在一个实施场景中,为了提升第一权重的权重值和第二权重的权重值的准确性,可以先基于第一权重的参数值、第二权重的参数值分别对样本候选疾病的样本第一分值、样本第二分值进行样本分值加权,得到样本候选疾病的样本加权分值。需要说明的是,样本候选疾病的样本第一分值、样本第二分值可以分别基于深度学习模型、逻辑回归模型对测试病历文本处理得到,具体可以参阅第一分值和第二分值的获取过程,在此不再赘述。在此基础上,可以响应于各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对不满足预设条件,调整第一权重的参数值和第二权重的参数值(具体调整方式可以参阅前述相关描述),并重新执行样本分值加权的步骤以及后续步骤。示例性地,预设条件可以设置为包括:测试病历文本所标注的第一诊断疾病与最高样本加权分值所对应的样本候选疾病不同。当然,预设条件也可以根据实际情况进行设置,在此不做具体限定。例如,在推荐精度要求相对宽松的情况下,预设条件也可以设置为包括:在各样本候选疾病按照各自的样本加权分值由高到低排序之后,与测试病历文本所标注的第一诊断疾病相同的样本候选疾病排在前预设序位(如前3位、前5位等)之外。反之,响应于各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对满足预设条件,可以将第一权重最新的参数值作为第一权重的权重值,并将第二权重最新的参数值作为第二权重的权重值。上述方式,通过不断地对第一权重和第二权重进行调整,进而使各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对满足预设条件,有助于诊断推荐的结果更准确,进而提高用户的使用体验。
在一个具体实施场景中,可以通过深度学习模型对患者的关键文本进行预测,得到若干候选疾病的第一分值,示例性地,样本病历文本标注的诊断疾病为肺炎,通过深度学习模型对患者的关键文本进行预测,分别得到候选疾病为肺炎的样本第一分值为9,候选疾病为肺结核的样本第一分值为6,候选疾病为肝炎的样本第一分值为2。在此过程中,不同的候选疾病对应的第一分值可能相同,也可能不同,具体情况在此不做具体限定。
在一个具体实施场景中,可以通过逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值,示例性地,关键字段包括主要症状、检查描述等,关键字段的子文本包括关节疼痛#主要症状、骨质增生#检查描述,候选疾病为类风湿关节炎的参考文本包括关节疼痛、关节畸形、关节肿胀#主要症状、骨质增生#检查描述,根据关键字段的子文本分别与候选疾病的参考文本之间的命中率,确定候选疾病的子分值,关键字段为主要症状的子分值为0.3,关键字段为检查描述的子分值为0.5,基于若干关键字段分别命中同种候选疾病的子分值进行融合,例如,融合方式为相加,则得到候选疾病为类风湿关节炎的样本第二分值为0.8,候选疾病为慢性痛风可以参阅前述相关描述,候选疾病为慢性痛风的样本第二分值可能为0.2。不同的候选疾病对应的第二分值可能相同,也可能不同,具体情况在此不做具体限定。
请参阅图5,图5是本申请诊断推荐方法一实施例的示意图,先获取目标患者的病历文本,在对目标患者的病历文本进行诊断推荐之前,先对目标患者的病历文本进行关键文本提取,在此过程中,可以通过NLP技术或正则处理方式提取目标患者的关键文本,得到目标患者的关键文本,在得到目标患者的关键文本之后,先基于深度学习模型对目标患者的关键文本进行预测,进而得到若干候选疾病的第一分值,并通过若干候选疾病对应的参考文本和关键文本进行匹配,得到各候选疾病的第二分值,再基于各候选疾病的第一分值和第二分值进行加权处理,得到各候选疾病的加权分值,最终输出加权分值最高的候选疾病作为目标患者推荐诊断的最终疾病。在此过程中,可以有效减少因特征工程、拟合问题等因素而产生的错误,进而提高诊断推荐的准确率。
上述方案,通过基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在诊断推荐的过程中,通过综合各候选疾病的第一分值和第二分值两者,共同确定目标患者推荐诊断的最终疾病,能够尽可能地降低诊断推荐产生的偏差。故此,能够在医疗领域,提高辅助诊断的推荐准确率。
请参阅图6,图6是本申请推荐方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S51:基于深度学习模型对目标对象的关键数据进行预测,得到若干候选推荐的第一分值。
本公开实施例中,关键数据提取自目标对象的个人数据,示例性地,当目标对象为目标患者时,个人数据可以是病历文本,关键数据可以是各种字段,例如:年龄、性别、既往史等;当目标对象为目标客户时,个人数据可以是购物记录,关键数据可以是各种字段,例如:电子产品、零食饮料、米面粮油、水果蔬菜、肉食生鲜等采购量。目标对象可以根据实际情况进行选择,在此不做具体限定,根据目标对象的不同,目标对象的个人数据与关键数据随之改变,在此不做具体限定,可以根据情况进行选择。
在一个实施场景中,若干候选推荐的第一分值的获取方式,可以参照前述公开实施例中若干候选疾病的第一分值的获取方式,在此不再一一赘述。
步骤S52:基于逻辑回归模型将关键数据分别与各候选推荐的参考数据进行匹配,得到各候选推荐的第二分值。
在一个实施场景中,各候选推荐的第二分值的获取方式,可以参照前述公开实施例中各候选疾病的第二分值获取方式,在此不再一一赘述。此外,参考数据的获取方式,可以参照前述公开实施例中参考文本的获取方式,在此不再赘述。
步骤S53:基于各候选推荐的第一分值和第二分值,得到目标对象的最终推荐。
在一个实施场景中,得到目标对象的最终推荐的方式与上述得到目标患者推荐诊断的最终疾病的方式相同,可以参阅上述目标患者推荐诊断的最终疾病的相关描述,在此不再一一赘述。此外,如前述公开实施例中,对于每个候选推荐而言,可以通过第一权重的权重值、第二权重的权重值分别对该候选推荐的第一分值、第二分值进行加权,得到该候选推荐的加权分值,在此基础上,可以基于各个候选推荐的加权分值,选择至少一个候选推荐作为目标对象的最终推荐。需要说明的是,本公开实施例中,第一权重的权重值和第二权重的权重值两者的具体获取方式,可以参阅前述公开实施例,在此不再赘述。
上述方案,通过基于深度学习模型对目标对象的关键数据进行预测,得到若干候选推荐的第一分值;且关键数据提取自目标对象的个人数据;基于逻辑回归模型将关键数据分别与各候选推荐的参考数据进行匹配,得到各候选推荐的第二分值;基于各候选推荐的第一分值和第二分值,得到目标对象的最终推荐,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在推荐的过程中,通过综合各候选推荐的第一分值和第二分值两者,共同确定目标对象的最终推荐,能够尽可能地降低推荐过程产生的偏差,进而能够提高辅助推荐的准确率。
请参阅图7,图7是本申请诊断推荐装置一实施例的框架示意图。诊断推荐装置60包括预测模块61、匹配模块62和确定模块63。其中,预测模块61用于基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;且关键文本提取自目标患者的病历文本;匹配模块62用于基于逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配,得到各候选疾病的第二分值;确定模块63用于基于各候选疾病的第一分值和第二分值,得到目标患者推荐诊断的最终疾病。
上述方案,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在诊断推荐的过程中,通过综合各候选疾病的第一分值和第二分值两者,共同确定目标患者推荐诊断的最终疾病,能够尽可能地降低诊断推荐产生的偏差。故此,能够在医疗领域,提高辅助诊断的推荐准确率。
在一些公开实施例中,确定模块63包括加权子模块,加权子模块用于基于候选疾病的第一分值和第二分值进行加权,得到候选疾病的加权分值;确定模块63还包括选择子模块,选择子模块用于基于各候选疾病的加权分值,选择至少一个候选疾病作为目标患者推荐诊断的最终疾病。
因此,通过对第一分值和第二分值进行加权处理,进而得到各候选疾病的加权分值,可以进一步使深度学习模型和逻辑回归模型更好的实现诊断推荐的效率,最终提高诊断推荐的准确率。
在一些公开实施例中,加权分值基于第一权重的权重值、第二权重的权重值分别对第一分值、第二分值加权得到,第一权重的权重值和第二权重的权重值基于深度学习模型和逻辑回归模型在测试数据中测试得到,且测试数据包括若干测试患者的测试病历文本,测试病历文本标注有测试患者的第一诊断疾病。
因此,通过对第一分值和第二分值进行加权处理,有助于提高深度学习模型和逻辑回归模型对目标患者推荐诊断的推荐效果,进而提高最终的诊断推荐的准确率。
在一些公开实施例中,加权子模块包括加权单元,加权单元用于基于第一权重的参数值、第二权重的参数值分别对样本候选疾病的样本第一分值、样本第二分值进行样本分值加权,得到样本候选疾病的样本加权分值;其中,样本候选疾病的样本第一分值、样本第二分值分别基于深度学习模型、逻辑回归模型对测试病历文本处理得到;加权子模块包括调整单元,调整单元用于响应于各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对不满足预设条件,调整第一权重的参数值和第二权重的参数值,并重新执行样本分值加权的步骤以及后续步骤;加权子模块还包括确定单元,确定单元用于响应于各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对满足预设条件,将第一权重最新的参数值作为第一权重的权重值,并将第二权重最新的参数值作为第二权重的权重值。
因此,通过不断地对第一权重和第二权重进行调整,进而使各个样本候选疾病的样本加权分值与测试病历文本所标注的第一诊断疾病之间的差异比对满足预设条件,有助于诊断推荐的结果更准确,进而提高用户的使用体验。
在一些公开实施例中,关键文本包括若干关键字段的子文本,匹配模块62包括匹配子模块,匹配子模块用于对于每种候选疾病的参考文本,基于逻辑回归模型将若干关键字段的子文本分别与候选疾病的参考文本进行匹配,得到若干关键字段命中候选疾病的子分值;匹配模块62还包括融合子模块,融合子模块用于基于若干关键字段分别命中同种候选疾病的子分值进行融合,得到对应候选疾病的第二分值。
因此,通过基于若干关键字段分别命中同种候选疾病的子分值进行融合,通过融合有助于提高诊断推荐的准确率。
在一些公开实施例中,诊断推荐装置包括提取模块,提取模块用于提取样本病历文本的样本关键文本;且样本病历文本标注有第二诊断疾病;诊断推荐装置还包括融合模块,融合模块用于基于标注有相同第二诊断疾病的样本病历文本所提取的样本关键文本进行融合,得到第二诊断疾病的参考文本。
因此,通过对样本关键文本进行分类并融合,得到第二诊断疾病的参考文本,有助于提高逻辑回归模型将关键文本分别与各候选疾病的参考文本进行匹配时的效率,并提高目标患者推荐诊断的最终疾病的准确率。
在一些公开实施例中,样本关键文本包括若干关键字段的样本子文本,融合模块包括融合子模块,融合子模块用于对于从标注有相同第二诊断疾病的样本病历文本分别所提取的样本关键文本,分别将相同关键字段的样本子文本进行融合,得到对应关键字段的融合子文本;融合模块还包括确定子模块,确定子模块用于基于若干关键字段的融合子文本,得到第二诊断疾病的参考文本。
因此,第二诊断疾病的参考文本包括若干关键字段的融合子文本,有助于提高匹配的准确性,进而提高最终的诊断推荐的准确性。
请参阅图8,图8是本申请推荐装置一实施例的框架示意图。推荐装置70包括预测模块71、匹配模块72和确定模块73。其中,预测模块71用于基于深度学习模型对目标对象的关键数据进行预测,得到若干候选推荐的第一分值;且关键数据提取自目标对象的个人数据;匹配模块72用于基于逻辑回归模型将关键数据分别与各候选推荐的参考数据进行匹配,得到各候选推荐的第二分值;确定模块73用于基于各候选推荐的第一分值和第二分值,得到目标对象的最终推荐。
上述方案,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在推荐的过程中,通过综合各候选推荐的第一分值和第二分值两者,共同确定目标对象的最终推荐,能够尽可能地降低推荐过程产生的偏差,进而能够提高辅助推荐的准确率。
请参阅图9,图9是本申请电子设备一实施例的框架示意图。电子设备80包括相互耦接的存储器81和处理器82,存储器81中存储有程序指令,处理器82用于执行程序指令以实现上述任一诊断推荐方法或任一推荐方法实施例中的步骤。具体地,电子设备80可以包括但不限于:台式计算机、笔记本电脑、服务器、手机、平板电脑等等,在此不做限定。
具体而言,处理器82用于控制其自身以及存储器81以实现上述任一诊断推荐方法或任一推荐方法实施例中的步骤。处理器82还可以称为CPU(Central Processing Unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor, DSP)、专用集成电路(Application Specific Integrated Circuit, ASIC)、现场可编程门阵列(Field-Programmable Gate Array, FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由集成电路芯片共同实现。
上述方案,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在推荐的过程中,通过综合各候选推荐的第一分值和第二分值两者,共同确定目标对象的最终推荐,能够尽可能地降低推荐过程产生的偏差,进而能够提高辅助推荐的准确率。
请参阅图10,图10是本申请计算机可读存储介质一实施例的框架示意图。计算机可读存储介质90存储有能够被处理器运行的程序指令91,程序指令91用于实现上述任一诊断推荐方法或任一推荐方法实施例中的步骤。
上述方案,一方面在深度学习模型的基础上结合逻辑回归模型,能够尽可能地减少因特征工程、拟合问题等因素而产生的错误,另一方面由于在推荐的过程中,通过综合各候选推荐的第一分值和第二分值两者,共同确定目标对象的最终推荐,能够尽可能地降低推荐过程产生的偏差,进而能够提高辅助推荐的准确率。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。

Claims (10)

1.一种诊断推荐方法,其特征在于,包括:
基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;其中,所述关键文本提取自所述目标患者的病历文本;
基于逻辑回归模型将所述关键文本分别与各所述候选疾病的参考文本进行匹配,得到各所述候选疾病的第二分值;其中,每个所述参考文本预先由标注有相同第二诊断疾病的各个样本病历文本分别所提取的样本关键文本融合得到,且与所述关键文本输入所述逻辑回归模型进行匹配的参考文本所属的候选疾病,由所述深度学习模型预测得到;
基于各所述候选疾病的第一分值和第二分值,得到所述目标患者推荐诊断的最终疾病;
其中,所述深度学习模型在对所述目标患者的关键文本进行预测之前,基于样本病历文本标注的第二诊断疾病和样本关键文本进行训练;用于模型测试阶段的测试病历文本标注有测试患者的第一诊断疾病;在深度学习模型和逻辑回归模型的优化过程中,添加新增病历文本,新增病历文本标注有第三诊断疾病;获取深度学习模型预测测试病历文本的预测诊断疾病,并响应于第一诊断疾病和预测诊断疾病不同,将测试病历文本作为第一预测诊断错误文本;再获取深度学习模型预测新增病历文本的预测诊断疾病,并响应于第三诊断疾病和预测诊断疾病相同,将新增病历文本作为第二预测诊断正确文本,响应于第三诊断疾病和预测诊断疾病不同,将新增病历文本作为第二预测诊断错误文本;通过第一预测诊断错误文本和第二预测诊断错误文本组成逻辑回归模型干预组,并通过第二预测诊断正确文本和样本病历文本组成逻辑回归模型对照组,且逻辑回归模型干预组和逻辑回归模型对照组,组成逻辑回归模型训练组,逻辑回归模型训练组用于对逻辑回归模型进行优化训练。
2.根据权利要求1所述的方法,其特征在于,所述基于各所述候选疾病的第一分值和第二分值,得到所述目标患者推荐诊断的最终疾病,包括:
基于所述候选疾病的第一分值和第二分值进行加权,得到所述候选疾病的加权分值;
基于各所述候选疾病的加权分值,选择至少一个所述候选疾病作为所述目标患者推荐诊断的最终疾病。
3.根据权利要求2所述的方法,其特征在于,所述加权分值基于第一权重的权重值、第二权重的权重值分别对所述第一分值、所述第二分值加权得到,所述第一权重的权重值和所述第二权重的权重值基于所述深度学习模型和所述逻辑回归模型在测试数据中测试得到,且所述测试数据包括若干测试患者的测试病历文本,所述测试病历文本标注有所述测试患者的第一诊断疾病。
4.根据权利要求3所述的方法,其特征在于,所述第一权重的权重值、所述第二权重的权重值的获取步骤包括:
基于所述第一权重的参数值、所述第二权重的参数值分别对样本候选疾病的样本第一分值、样本第二分值进行样本分值加权,得到所述样本候选疾病的样本加权分值;其中,所述样本候选疾病的样本第一分值、样本第二分值分别基于所述深度学习模型、所述逻辑回归模型对所述测试病历文本处理得到;
响应于各个所述样本候选疾病的样本加权分值与所述测试病历文本所标注的第一诊断疾病之间的差异比对不满足预设条件,调整所述第一权重的参数值和所述第二权重的参数值,并重新执行所述样本分值加权的步骤以及后续步骤;
响应于各个所述样本候选疾病的样本加权分值与所述测试病历文本所标注的第一诊断疾病之间的差异比对满足预设条件,将所述第一权重最新的参数值作为所述第一权重的权重值,并将所述第二权重最新的参数值作为所述第二权重的权重值。
5.根据权利要求1所述的方法,其特征在于,所述关键文本包括若干关键字段的子文本;所述基于逻辑回归模型将所述关键文本分别与各所述候选疾病的参考文本进行匹配,得到各所述候选疾病的第二分值,包括:
对于每种所述候选疾病的参考文本,基于所述逻辑回归模型将所述若干关键字段的子文本分别与所述候选疾病的参考文本进行匹配,得到所述若干关键字段命中所述候选疾病的子分值;
基于所述若干关键字段分别命中同种所述候选疾病的子分值进行融合,得到对应所述候选疾病的第二分值。
6.根据权利要求1所述的方法,其特征在于,在所述基于逻辑回归模型将所述关键文本分别与各所述候选疾病的参考文本进行匹配,得到各所述候选疾病的第二分值之前,所述方法还包括:
提取样本病历文本的样本关键文本;其中,所述样本病历文本标注有第二诊断疾病;
基于标注有相同所述第二诊断疾病的样本病历文本所提取的样本关键文本进行融合,得到所述第二诊断疾病的参考文本。
7.根据权利要求6所述的方法,其特征在于,所述样本关键文本包括若干关键字段的样本子文本,所述基于标注有相同所述第二诊断疾病的样本病历文本所提取的样本关键文本进行融合,得到所述第二诊断疾病的参考文本,包括:
对于从标注有相同所述第二诊断疾病的样本病历文本分别所提取的样本关键文本,分别将相同所述关键字段的样本子文本进行融合,得到对应所述关键字段的融合子文本;
基于所述若干关键字段的融合子文本,得到所述第二诊断疾病的参考文本。
8.一种诊断推荐装置,其特征在于,包括:
预测模块,用于基于深度学习模型对目标患者的关键文本进行预测,得到若干候选疾病的第一分值;其中,所述关键文本提取自所述目标患者的病历文本;
匹配模块,用于基于逻辑回归模型将所述关键文本分别与各所述候选疾病的参考文本进行匹配,得到各所述候选疾病的第二分值;其中,每个所述参考文本预先由标注有相同第二诊断疾病的各个样本病历文本分别所提取的样本关键文本融合得到,且与所述关键文本输入所述逻辑回归模型进行匹配的参考文本所属的候选疾病,由所述深度学习模型预测得到;
确定模块,用于基于各所述候选疾病的第一分值和第二分值,得到所述目标患者推荐诊断的最终疾病;
其中,所述深度学习模型在对所述目标患者的关键文本进行预测之前,基于样本病历文本标注的第二诊断疾病和样本关键文本进行训练;用于模型测试阶段的测试病历文本标注有测试患者的第一诊断疾病;在深度学习模型和逻辑回归模型的优化过程中,添加新增病历文本,新增病历文本标注有第三诊断疾病;获取深度学习模型预测测试病历文本的预测诊断疾病,并响应于第一诊断疾病和预测诊断疾病不同,将测试病历文本作为第一预测诊断错误文本;再获取深度学习模型预测新增病历文本的预测诊断疾病,并响应于第三诊断疾病和预测诊断疾病相同,将新增病历文本作为第二预测诊断正确文本,响应于第三诊断疾病和预测诊断疾病不同,将新增病历文本作为第二预测诊断错误文本;通过第一预测诊断错误文本和第二预测诊断错误文本组成逻辑回归模型干预组,并通过第二预测诊断正确文本和样本病历文本组成逻辑回归模型对照组,且逻辑回归模型干预组和逻辑回归模型对照组,组成逻辑回归模型训练组,逻辑回归模型训练组用于对逻辑回归模型进行优化训练。
9.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至7任一项所述的诊断推荐方法。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至7任一项所述的诊断推荐方法。
CN202210631085.8A 2022-06-06 2022-06-06 诊断推荐方法及装置、电子设备和存储介质 Active CN114708965B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210631085.8A CN114708965B (zh) 2022-06-06 2022-06-06 诊断推荐方法及装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210631085.8A CN114708965B (zh) 2022-06-06 2022-06-06 诊断推荐方法及装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN114708965A CN114708965A (zh) 2022-07-05
CN114708965B true CN114708965B (zh) 2023-03-28

Family

ID=82178054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210631085.8A Active CN114708965B (zh) 2022-06-06 2022-06-06 诊断推荐方法及装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114708965B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816303A (zh) * 2020-07-08 2020-10-23 深圳承启生物科技有限公司 一种基于机器学习的难治性精神分裂症风险的预测方法
CN113836892A (zh) * 2021-09-08 2021-12-24 灵犀量子(北京)医疗科技有限公司 样本量数据提取方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020037454A1 (zh) * 2018-08-20 2020-02-27 深圳市全息医疗科技有限公司 智能辅助诊疗系统及方法
CN110111887A (zh) * 2019-05-15 2019-08-09 清华大学 临床辅助决策方法及装置
WO2021101694A1 (en) * 2019-11-18 2021-05-27 Mandometer Ab Eating disorder diagnosis
CN111180061B (zh) * 2019-12-09 2023-05-02 广东工业大学 融合区块链与联邦学习的共享医疗数据智能辅助诊断系统
CN112002413B (zh) * 2020-08-23 2023-09-29 吾征智能技术(北京)有限公司 一种心血管系统感染智能认知系统、设备及存储介质
CN114334065B (zh) * 2022-03-07 2022-06-28 阿里巴巴达摩院(杭州)科技有限公司 病历处理方法、计算机可读存储介质及计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816303A (zh) * 2020-07-08 2020-10-23 深圳承启生物科技有限公司 一种基于机器学习的难治性精神分裂症风险的预测方法
CN113836892A (zh) * 2021-09-08 2021-12-24 灵犀量子(北京)医疗科技有限公司 样本量数据提取方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Artificial intelligence,machine learning, and deep learning for clinical outcome prediction;R.W. Pettit 等;《Emering Topics in Life Sciences》;20211231;第729-745页 *
利用机器学习预测术前护理对手术压疮预防的效果;张倩莹 等;《新技术应用》;20210430;第45-49页 *
组学时代下机器学习方法在临床决策支持中的应用;赵学彤 等;《遗传》;20180930;第693-703页 *

Also Published As

Publication number Publication date
CN114708965A (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
US20200334416A1 (en) Computer-implemented natural language understanding of medical reports
Johnson et al. A new severity of illness scale using a subset of acute physiology and chronic health evaluation data elements shows comparable predictive accuracy
AU2012245343B2 (en) Predictive modeling
EP3956901A1 (en) Computer-implemented natural language understanding of medical reports
JP2016181255A (ja) 個別化予測モデルを用いた、個人レベルのリスク・ファクタの識別およびランク付け
US20200258639A1 (en) Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population
Duggal et al. Predictive risk modelling for early hospital readmission of patients with diabetes in India
US11527312B2 (en) Clinical report retrieval and/or comparison
US20200082945A1 (en) Scoring and mitigating health risks
CN114610865A (zh) 召回文本推荐方法、装置、设备及存储介质
Lin et al. Deep learning for the dynamic prediction of multivariate longitudinal and survival data
Pham et al. Predicting hospital readmission patterns of diabetic patients using ensemble model and cluster analysis
US20170154157A1 (en) Data analysis device, control method for data analysis device, and control program for data analysis device
CN114334065A (zh) 病历处理方法、计算机可读存储介质及计算机设备
CN113096756A (zh) 病情演变分类方法、装置、电子设备和存储介质
CN114708965B (zh) 诊断推荐方法及装置、电子设备和存储介质
US20230060794A1 (en) Diagnostic Tool
CN111640517A (zh) 病历编码方法、装置、存储介质及电子设备
US20150347695A1 (en) Physician attribution for inpatient care
Nirmalraj et al. Permutation feature importance-based fusion techniques for diabetes prediction
Özkan et al. Effect of data preprocessing on ensemble learning for classification in disease diagnosis
Fierro et al. Predicting unplanned readmissions with highly unstructured data
US20240071623A1 (en) Patient health platform
Hossain et al. A novel application of finite Gaussian mixture model (GMM) using real and simulated biomarkers of cardiovascular disease to distinguish adolescents with and without obesity
Gunasekaran et al. An efficient cardio vascular disease prediction using multi-scale weighted feature fusion-based convolutional neural network with residual gated recurrent unit

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 230000 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei City, Anhui Province

Patentee after: IFLYTEK Medical Technology Co.,Ltd.

Address before: 230000 floor 23-24, building A5, No. 666, Wangjiang West Road, high tech Zone, Hefei City, Anhui Province

Patentee before: Anhui Xunfei Medical Co.,Ltd.

CP01 Change in the name or title of a patent holder