CN114420298A - 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备 - Google Patents

一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备 Download PDF

Info

Publication number
CN114420298A
CN114420298A CN202210102904.XA CN202210102904A CN114420298A CN 114420298 A CN114420298 A CN 114420298A CN 202210102904 A CN202210102904 A CN 202210102904A CN 114420298 A CN114420298 A CN 114420298A
Authority
CN
China
Prior art keywords
model
matching
patient
stage
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210102904.XA
Other languages
English (en)
Other versions
CN114420298B (zh
Inventor
刘丽萍
聂曦明
李鑫鑫
詹天茗
刘东冬
龚国扬
吴振洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ande Yizhi Technology Co ltd
Beijing Tiantan Hospital
Original Assignee
Beijing Ande Yizhi Technology Co ltd
Beijing Tiantan Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ande Yizhi Technology Co ltd, Beijing Tiantan Hospital filed Critical Beijing Ande Yizhi Technology Co ltd
Priority to CN202210102904.XA priority Critical patent/CN114420298B/zh
Publication of CN114420298A publication Critical patent/CN114420298A/zh
Application granted granted Critical
Publication of CN114420298B publication Critical patent/CN114420298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Signal Processing (AREA)
  • Veterinary Medicine (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Psychiatry (AREA)
  • Surgery (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computing Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Fuzzy Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

本发明涉及一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备。预测方法步骤包括:获取患者的临床数据;根据所述临床数据提取得到患者的治疗阶段信息;根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。本申请立足临床场景,针对患者治疗流程的不同节点,建立一种多阶段的急性缺血性卒中血管内治疗无效再通预测方法,在多个阶段全面评估患者无效再通的发生,准确模拟患者在治疗过程。

Description

一种多阶段的急性缺血性卒中血管内治疗无效再通预测系 统、设备
技术领域
本发明涉及智能医疗技术领域,更具体地,涉及一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备及计算机可读存储介质。
背景技术
血管内治疗是急性大血管闭塞性患者的重要治疗手段。研究表明,超过40%接受血管内治疗的患者虽然术后血管造影显示闭塞的血管已实现再通,却不能获得90d功能独立,即发生无效再通。无效再通严重影响血管内治疗的疗效,近年来受到越来越多的关注。
多种因素可能影响无效再通的发生,包括患者的基线特征、影像特征、化验指标、血管内治疗操作、术后随访临床和影像特征等,分析这些因素有助于预防无效再通,提前干预,改善患者预后,或者筛选出不能从血管内治疗中获益的患者,协助医生制定个体化血管内治疗策略。现有AI或传统预后预测模型研究更关注全体患者而非良好灌注人群的预后,且预后预测模型特征选取存在局限性,没有考虑到患者的不同阶段变化。另外,尚未有一套完整的数据质控系统,常规的临床预测模型需要几个预测特征都完整才能给出预测结果,若有缺失值则无法预测,不能应对复杂的现实情况。
发明内容
本申请立足临床场景,针对患者治疗流程的不同节点,建立一种多阶段的急性缺血性卒中血管内治疗无效再通预测方法,在多个阶段全面评估患者无效再通的发生,准确模拟患者在治疗过程,一方面可以反映患者在治疗全过程中血管内治疗无效再通情况,另一方面对某一些信息有限的患者,可以选择合适的缺失值填补模型和无效再通预测模型。
本申请的目的在于提供一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统,包括:
信息获取单元,用于获取患者的临床数据;信息提取单元,用于根据所述临床数据提取得到患者的治疗阶段信息;
模块匹配单元,用于根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
风险预测单元,用于将上述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
进一步,所述患者治疗阶段信息是指临床数据中是否含有以下治疗阶段的信息:入院就诊信息、影像检查信息、实验室检查信息、手术前信息、手术后信息、手术后24h信息。
进一步,所述待匹配的多阶段模型包括入院就诊模型、影像检查后模型、实验室检查后模型、手术前模型、手术后即刻模型、手术后24h模型;
可选的,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则顺延至前一个模型进行匹配;
优选的,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后即刻模型进行匹配,若匹配成功,则手术后即刻模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若匹配成功,则入院就诊模型为最优模型。
优选的,所述模块匹配单元从手术后24h模型开始匹配,若患者治疗阶段信息含有手术后24h信息就匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后模型进行匹配,若患者治疗阶段信息含有手术后信息就匹配成功,则手术后模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若患者治疗阶段信息含有手术前信息就匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若患者治疗阶段信息含有实验室检测、查信息就匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若患者治疗阶段信息含有影像检查信息就匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若患者治疗阶段信息含有入院检测信息就匹配成功,则入院就诊模型为最优模型。
进一步,所述待匹配的多阶段模型包括缺失值填补模型和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果;
可选的,模块匹配单元匹配到最优模型后,将患者的临床数据输入缺失值填补模型对患者的缺失特征进行填补,将填补后的数据输入无效再通预测模型预测患者的风险评估结果。
进一步,所述缺失值填补模型是基于链式方程的多重插补方法对所述患者的临床数据进行填补;
优选的,所述缺失值填补模型训练方法包括以下步骤:
步骤1:首先对数据集中的缺失数据填补初始的插补值,所述初始的插补值使用原始训练集特征的均值进行填补;
步骤2对插补前有缺失的特征进行以下循环:假设缺失特征为v,则训练集中无缺失特征v部分定义为y_obs,训练集中除特征v以外的所有变量中对应v特征无缺失索引的部分定义为x_obs;
步骤3:使用LightGBM模型拟合y_obs和x_obs,通过LightGBM模型对缺失特征v进行预测,将特征v预测值更新到数据集中;
步骤4循环完所有缺失值的特征后,比较更新后的数据集与原始数据集,判断收敛函数是否满足收敛,如果满足则停止迭代,否则返回步骤2继续迭代。
进一步,所述无效再通预测模型中的模型算法是根据挑选指标从已有的机器学习模型中挑选出的,所述挑选指标选自下列中的一种或几种:假阳率、假阴率、准确度、敏感性、特异性或G-mean;
可选的,所述模型算法选自下列机器学习模型中的一种或几种:支持向量机、逻辑回归、随机森林、gcforest;
可选的,所述无效再通预测模型中的模型算法是使用嵌套交叉验证法从已有的机器学习模型中挑选出的。
进一步,所述无效再通预测模型在训练的过程中,采用嵌套交叉验证法从多种组合中选择最适合的特征选择方法和模型算法;
优选的,所述无效再通预测模型训练方法包括以下步骤:
步骤1:首先构建多阶段的训练数据集;
步骤2:采用嵌套交叉验证法从多种特征选择方法中选择每个阶段最适合的特征选择方法;
步骤3:采用嵌套交叉验证法从多种模型算法中选择每个阶段最适合的机器学习模型;
步骤4:使用每个阶段的训练数据集,选择每个阶段最适合的特征选择方法和机器学习模型,训练得到每个阶段对应的无效再通预测模型;
更优选的,所述特征选择方法包括单变量相关性、递归特征消除法;
更优选的,所述模型算法包括支持向量机、逻辑回归、随机森林、gcforest。
进一步,所述待匹配的多阶段模型包括缺失值填补模型、数据预处理模块和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果,所述数据预处理模块用于对缺失值填补模型填补后的患者的临床数据中离散变量进行编码以及对数值变量进行标准化;
优选的,所离散变量进行编码包括对有序离散变量进行数值的映射以及对无序离散变量进行one-hot编码;所述对数值变量进行标准化包括对数值变量进行高斯标准化。
本申请的目的在于提供一种多阶段的急性缺血性卒中血管内治疗无效再通预测设备,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
本申请的目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
本申请的优势:
1、本申请立足临床场景,针对患者治疗流程的不同节点,建立一种多阶段的急性缺血性卒中血管内治疗无效再通预测方法,在每个治疗阶段构建该阶段的无效再通预测模型,通过多个阶段全面评估患者无效再通的发生,准确模拟患者在治疗过程;
2、本申请基于患者临床数据提取得到患者的治疗阶段信息,匹配到最优的模型中,所述模块匹配从手术后24h模型开始匹配,如果匹配成功,则手术后24h模型为最优模型;若匹配不成功,则顺延至前一个模型进行匹配,通过从后到前的阶段匹配,能从多阶段模型中选择最优的;
3、在每个阶段的模型中都包含了缺失值填补模型和无效再通预测模型,所述缺失值填补模型用于对当前阶段患者的临床数据缺失特征进行填补;所述无效再通预测模型用于预测当前阶段患者的风险评估结果;
4、本申请在无效再通预测模型训练的过程中,采用嵌套交叉验证法从多种特征选择方法中选择每个阶段最适合的特征选择方法和从多种模型算法中选择每个阶段最适合的机器学习模型,该方法能够使得所选择到的机器学习模型是泛化性最好的
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测方法的示意流程图;
图2是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测设备的示意框图;
图3是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统的示意框图;
图4是多阶段的急性缺血性卒中血管内治疗无效再通预测设备使用的流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S101、S102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测方法的示意流程图,具体地,所述方法包括如下步骤:
S101:获取患者的临床数据;
在一个实施例中,所述临床数据是包括多项临床指标的数据。临床数据包含患者基本信息、人口学特征、院前急救(静脉溶栓、血管内治疗)、既往史、家族史、既往用药、入院查体、入院诊断、基线NIHSS评分、住院期间辅助检查、住院期间治疗、最终诊断、出院带药、出院NIHSS评分等信息,影像数据包含常规T1、T2、DWI、PWI等,影像判读包括以影像科为基础对于基本影像信息进行盲法判读、利用Rapid及OLea软件进行灌注参数判读、采用3D-slicer软件对于病灶体积等进行标注判读、采用人工标注方法对于CMI、ILT、SVS、BS、TAI等特殊影像指标进行人工判读4种判读方式。
S102:根据所述临床数据提取得到患者的治疗阶段信息;
在一个实施例中,所述患者治疗阶段信息是指临床数据中是否含有以下治疗阶段的信息:入院就诊信息、影像检查信息、实验室检查信息、手术前信息、手术后信息、手术后24h信息。
S103:根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
所述多阶段模型含义为,根据患者从发病到手术后的不同阶段获取的不同临床变量,构建的不同阶段模型。
在一个实施例中,所述待匹配的多阶段模型包括入院就诊模型、影像检查后模型、实验室检查后模型、手术前模型、手术后即刻模型、手术后24h模型;可选的,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则顺延至前一个模型进行匹配。
在一个具体实施例中,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后即刻模型进行匹配,若匹配成功,则手术后即刻模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若匹配成功,则入院就诊模型为最优模型。所述匹配成功是指所述。
在一个实施例中,所述模块匹配单元从手术后24h模型开始匹配,若患者治疗阶段信息含有手术后24h信息就匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后模型进行匹配,若患者治疗阶段信息含有手术后信息就匹配成功,则手术后模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若患者治疗阶段信息含有手术前信息就匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若患者治疗阶段信息含有实验室检测、查信息就匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若患者治疗阶段信息含有影像检查信息就匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若患者治疗阶段信息含有入院检测信息就匹配成功,则入院就诊模型为最优模型。
在一个实施例中,所述待匹配的多阶段模型包括缺失值填补模型和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果;可选的,模块匹配单元匹配到最优模型后,将患者的临床数据输入缺失值填补模型对患者的缺失特征进行填补,将填补后的数据输入无效再通预测模型预测患者的风险评估结果。
S104:将上述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
在一个实施例中,患者的临床数据输入匹配到的最优模型中,所述最优模型包括缺失值填补模型和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果。
在一个实施例中,所述缺失值填补模型是基于链式方程的多重插补方法对所述患者的临床数据进行填补;优选的,所述缺失值填补模型训练方法包括以下步骤:
步骤1:首先对数据集中的缺失数据填补初始的插补值,所述初始的插补值使用原始训练集特征的均值进行填补;
步骤2对插补前有缺失的特征进行以下循环:假设缺失特征为v,则训练集中无缺失特征v部分定义为y_obs,训练集中除特征v以外的所有变量中对应v特征无缺失索引的部分定义为x_obs;
步骤3:使用LightGBM模型拟合y_obs和x_obs,通过LightGBM模型对缺失特征v进行预测,将特征v预测值更新到数据集中;
步骤4循环完所有缺失值的特征后,比较更新后的数据集与原始数据集,判断收敛函数是否满足收敛,如果满足则停止迭代,否则返回步骤2继续迭代
在一个实施例中,所述无效再通预测模型中的模型算法是根据挑选指标从已有的机器学习模型中挑选出的,所述挑选指标选自下列中的一种或几种:假阳率、假阴率、准确度、敏感性、特异性或G-mean;可选的,所述模型算法选自下列机器学习模型中的一种或几种:支持向量机、逻辑回归、随机森林、gcforest和深度森林;可选的,所述无效再通预测模型中的模型算法是使用嵌套交叉验证法从已有的机器学习模型中挑选出的。
在一个实施例中,所述无效再通预测模型在训练的过程中,采用嵌套交叉验证法选择最适合的特征选择方法和模型算法;
优选的,所述无效再通预测模型训练方法包括以下步骤:
步骤1:首先构建多阶段的训练数据集;
步骤2:采用嵌套交叉验证法从多种特征选择方法中选择每个阶段最适合的特征选择方法;
步骤3:采用嵌套交叉验证法从多种模型算法中选择每个阶段最适合的机器学习模型;
步骤4:使用每个阶段的训练数据集,选择每个阶段最适合的特征选择方法和机器学习模型,训练得到每个阶段对应的无效再通预测模型;
更优选的,所述特征选择方法包括单变量相关性、递归特征消除法;所述模型算法包括支持向量机、逻辑回归、随机森林、gcforest。
在一个具体实施例中,使用每个阶段的训练数据集,选择每个阶段最适合的特征选择方法和机器学习模型:先通过单变量P-value进行特征筛选,其中,针对分类变量采用卡方统计计算P值,针对数值变量采用双样本T检验计算P值,对于P值小于阈值的特征进行排除;之后将剩余特征输入随机森林模型中,根据特征重要性进行排序,选择排名前N的特征,训练得到每个阶段对应的无效再通预测模型。
在一个实施例中,所述待匹配的多阶段模型包括缺失值填补模型、数据预处理模块和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果,所述数据预处理模块用于对缺失值填补模型填补后的患者的临床数据中离散变量进行编码以及对数值变量进行标准化;优选的,所离散变量进行编码包括对有序离散变量进行数值的映射以及对无序离散变量进行one-hot编码;所述对数值变量进行标准化包括对数值变量进行高斯标准化。
在一个具体实施例中,对数据进行Z-Score标准化处理的计算公式为:
Figure BDA0003493020310000101
其中,x为原始的特征数据,
Figure BDA0003493020310000102
为特征数据的均值,xnew为标准化后的特征数据,δ为训练集特征的标准差。具体的,所述训练集特征的标准差δ计算公式为:
Figure BDA0003493020310000103
在一个实施例中,将上述患者的临床数据输入匹配到的最优模型前进行异常值处理,将异常值置为空值。具体为:异常值检测通过检测样本各个特征数值是否超过界定阈值,如超过,则判定样本该特征为异常数据并且将异常特征置于空值。所述界定阈值被定义为观察值和平均值的偏差小于3倍标准差的值,即[QL-3IQR,QU+3IQR],其中,QL为下四分位数,QU为上四分位数,IQR为四分位距。具体的,四分位距计算公式为IQR=QU-QL,进一步地,QU和QL的选取基于训练集中特征数值的排列。以单个特征为例,将训练集中所检测特征从小到大进行排序,取出第25%的数值作为下分位数QL,同样的,取出第75%数值作为上分位数QU。
在一个实施例中,所述多阶段模型的训练过程如下:
S1:构建训练数据集。
S2:对训练数据进行异常值检测,将异常值置为空值。
S3:使用多重插补法对训练数据中的缺失值进行填补,构建完整的训练数据集。
S4:为了保证特征的尺度统一,对训练数据进行预处理,预处理方法包括对分类变量进行one-hot编码,对数值变量进行高斯标准化。
S5:使用嵌套交叉验证法从多种特征选择方法中选择最合适的特征选择方法减少特征维度。
S6:使用嵌套交叉验证法从多种模型算法中选择每个阶段最适合的机器学习模型。其中机器学习模型包括支持向量机、逻辑回归、随机森林、gcforest等。
S7:在全部的训练数据上训练最终的缺失值填补模型和多阶段无效再通预测模型。具体做法为:针对每一个阶段模型,先在填补后的训练数据上使用S5和S6中的最终特征选择方法和机器学习模型选取该阶段的特征组合;之后使用仅包含特征组合的未填补的训练数据,训练缺失值填补模型;最后在填补缺失值之后,使用填补缺失值之后的数据训练无效再通预测模型,得到该阶段的无效再通预测模型。
图2是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测设备,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将上述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
在一个具体实施例中,如图4所示,对被测的患者临床数据进行如下处理实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
步骤1:获取患者的临床数据;
步骤2:根据所述临床数据提取得到患者的治疗阶段信息;
步骤3:根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型,所述最优模型选自下列模型中的一种:就诊模型、影像检查后模型、实验室检查后模型、手术前模型、手术后即刻模型、手术后24h模型;
步骤4:将所述患者的临床数据进行异常值处理,将异常值置为空值;
步骤5:使用所述的缺失值填补模型,对该样本的缺失特征进行填补;
步骤6:对缺失值填补后的临床数据进行预处理,得到预处理后的临床数据;
步骤7:将预处理后的临床数据输入无效再通预测模型,获得风险预测结果。
每个最优模型都包括该模型特有的缺失值填补模型和无效再通预测模型:就诊模型包括就诊模型的缺失值填补模型和就诊模型的无效再通预测模型;影像检查后模型包括影像检查后模型的缺失值填补模型和影像检查后模型的无效再通预测模型;实验室检查后模型包括实验室检查后模型的缺失值填补模型和实验室检查后模型的无效再通预测模型;手术前模型包括手术前模型的缺失值填补模型和手术前模型的无效再通预测模型;手术后即刻模型包括手术后即刻模型的缺失值填补模型和手术后即刻模型的无效再通预测模型;手术后24h模型包括手术后24h模型的缺失值填补模型和手术后24h模型的无效再通预测模型。
图3是本发明实施例提供的一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统,包括:
信息获取单301元,用于获取患者的临床数据;
信息提取单元302,用于根据所述临床数据提取得到患者的治疗阶段信息;
模块匹配单元303,用于根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
风险预测单元304,用于将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以适度改善本方法的性能。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统,包括:
信息获取单元,用于获取患者的临床数据;
信息提取单元,用于根据所述临床数据提取得到患者的治疗阶段信息;
模块匹配单元,用于根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
风险预测单元,用于将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
2.根据权利要求1所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述待匹配的多阶段模型包括入院就诊模型、影像检查后模型、实验室检查后模型、手术前模型、手术后即刻模型、手术后24h模型;
可选的,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则顺延至前一个模型进行匹配;
优选的,所述模块匹配单元从手术后24h模型开始匹配,若匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后即刻模型进行匹配,若匹配成功,则手术后即刻模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若匹配成功,则入院就诊模型为最优模型。
3.根据权利要求1所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述患者治疗阶段信息是指临床数据中是否含有以下治疗阶段的信息:入院就诊信息、影像检查信息、实验室检查信息、手术前信息、手术后信息、手术后24h信息;
优选的,所述模块匹配单元从手术后24h模型开始匹配,若患者治疗阶段信息含有手术后24h信息就匹配成功,则手术后24h模型为最优模型;若匹配不成功,则与手术后模型进行匹配,若患者治疗阶段信息含有手术后信息就匹配成功,则手术后模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若匹配成功,则手术前模型为最优模型;若匹配不成功,则与手术前模型进行匹配,若患者治疗阶段信息含有手术前信息就匹配成功,则手术前模型为最优模型;若匹配不成功,则与实验室检查后模型进行匹配,若患者治疗阶段信息含有实验室检测、查信息就匹配成功,则实验室检查后模型为最优模型;若匹配不成功,则与影像检查后模型进行匹配,若患者治疗阶段信息含有影像检查信息就匹配成功,则影像检查后模型为最优模型;若匹配不成功,则与入院就诊模型进行匹配,若患者治疗阶段信息含有入院检测信息就匹配成功,则入院就诊模型为最优模型。
4.根据权利要求1所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述待匹配的多阶段模型包括缺失值填补模型和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果;
可选的,模块匹配单元匹配到最优模型后,将患者的临床数据输入缺失值填补模型对患者的缺失特征进行填补,将填补后的数据输入无效再通预测模型预测患者的风险评估结果。
5.根据权利要求4所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述缺失值填补模型是基于链式方程的多重插补方法对所述患者的临床数据进行填补;
优选的,所述缺失值填补模型训练方法包括以下步骤:
步骤1:首先对数据集中的缺失数据填补初始的插补值,所述初始的插补值使用原始训练集特征的均值进行填补;
步骤2对插补前有缺失的特征进行以下循环:假设缺失特征为v,则训练集中无缺失特征v部分定义为yobs,训练集中除特征v以外的所有变量中对应v特征无缺失索引的部分定义为xobs
步骤3:使用LightGBM模型拟合yobs和xbos,通过LightGBM模型对缺失特征v进行预测,将特征v预测值更新到数据集中;
步骤4循环完所有缺失值的特征后,比较更新后的数据集与原始数据集,判断收敛函数是否满足收敛,如果满足则停止迭代,否则返回步骤2继续迭代。
6.根据权利要求4所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述无效再通预测模型中的模型算法是根据挑选指标从已有的机器学习模型中挑选出的,所述挑选指标选自下列中的一种或几种:假阳率、假阴率、准确度、敏感性、特异性或G-mean;
可选的,所述模型算法选自下列机器学习模型中的一种或几种:支持向量机、逻辑回归、随机森林、gcforest;
可选的,所述无效再通预测模型中的模型算法是使用嵌套交叉验证法从已有的机器学习模型中挑选出的。
7.根据权利要求4所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述无效再通预测模型在训练的过程中,采用嵌套交叉验证法选择最适合的特征选择方法和模型算法;
优选的,所述无效再通预测模型训练方法包括以下步骤:
步骤1:首先构建多阶段的训练数据集;
步骤2:采用嵌套交叉验证法从多种特征选择方法中选择每个阶段最适合的特征选择方法;
步骤3:采用嵌套交叉验证法从多种模型算法中选择每个阶段最适合的机器学习模型;
步骤4:使用每个阶段的训练数据集,选择每个阶段最适合的特征选择方法和机器学习模型,训练得到每个阶段对应的无效再通预测模型;
更优选的,所述特征选择方法包括单变量相关性、递归特征消除法;所述模型算法包括支持向量机、逻辑回归、随机森林、gcforest。
8.根据权利要求1所述的多阶段的急性缺血性卒中血管内治疗无效再通预测系统,其特征在于,所述待匹配的多阶段模型包括缺失值填补模型、数据预处理模块和无效再通预测模型,所述缺失值填补模型用于对患者的缺失特征进行填补;所述无效再通预测模型用于预测患者的风险评估结果,所述数据预处理模块用于对缺失值填补模型填补后的患者的临床数据中离散变量进行编码以及对数值变量进行标准化;
优选的,所离散变量进行编码包括对有序离散变量进行数值的映射以及对无序离散变量进行one-hot编码;所述对数值变量进行标准化包括对数值变量进行高斯标准化。
9.一种多阶段的急性缺血性卒中血管内治疗无效再通预测设备,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现下述的多阶段的急性缺血性卒中血管内治疗无效再通预测方法步骤:
获取患者的临床数据;
根据所述临床数据提取得到患者的治疗阶段信息;
根据所述患者的治疗阶段信息从待匹配的多阶段模型中匹配到最优模型;
将所述患者的临床数据输入匹配到的最优模型中,得到预测的风险评估结果。
CN202210102904.XA 2022-01-27 2022-01-27 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备 Active CN114420298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210102904.XA CN114420298B (zh) 2022-01-27 2022-01-27 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210102904.XA CN114420298B (zh) 2022-01-27 2022-01-27 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备

Publications (2)

Publication Number Publication Date
CN114420298A true CN114420298A (zh) 2022-04-29
CN114420298B CN114420298B (zh) 2023-08-25

Family

ID=81278633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210102904.XA Active CN114420298B (zh) 2022-01-27 2022-01-27 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备

Country Status (1)

Country Link
CN (1) CN114420298B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109637663A (zh) * 2018-11-14 2019-04-16 浙江大学山东工业技术研究院 一种基于机器学习的经皮冠状动脉介入治疗心血管不良事件的预测装置
CN109670653A (zh) * 2018-12-29 2019-04-23 北京航天数据股份有限公司 一种基于工业模型预测引擎进行预测的方法及装置
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN110364261A (zh) * 2019-07-17 2019-10-22 上海派兰数据科技有限公司 一种建立急性冠脉综合征在介入治疗术后的出血风险预测模型的方法
CN111949937A (zh) * 2020-07-17 2020-11-17 东南大学 一种基于链式方程的分布式光伏数据多重插补方法
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
CN113380413A (zh) * 2021-06-24 2021-09-10 首都医科大学附属北京天坛医院 一种构建无效再通fr预测模型的方法和装置
CN113854951A (zh) * 2021-09-28 2021-12-31 天津医科大学总医院 无光感眼预后分析的预测系统、方法、介质、在线服务平台

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN109637663A (zh) * 2018-11-14 2019-04-16 浙江大学山东工业技术研究院 一种基于机器学习的经皮冠状动脉介入治疗心血管不良事件的预测装置
CN109670653A (zh) * 2018-12-29 2019-04-23 北京航天数据股份有限公司 一种基于工业模型预测引擎进行预测的方法及装置
CN110364261A (zh) * 2019-07-17 2019-10-22 上海派兰数据科技有限公司 一种建立急性冠脉综合征在介入治疗术后的出血风险预测模型的方法
CN111949937A (zh) * 2020-07-17 2020-11-17 东南大学 一种基于链式方程的分布式光伏数据多重插补方法
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
CN113380413A (zh) * 2021-06-24 2021-09-10 首都医科大学附属北京天坛医院 一种构建无效再通fr预测模型的方法和装置
CN113854951A (zh) * 2021-09-28 2021-12-31 天津医科大学总医院 无光感眼预后分析的预测系统、方法、介质、在线服务平台

Also Published As

Publication number Publication date
CN114420298B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
Dai et al. Deep learning for automated cerebral aneurysm detection on computed tomography images
Danilov et al. Classification of intracranial hemorrhage subtypes using deep learning on CT scans
EP2365471B1 (en) Diagnosis assisting apparatus, coronary artery analyzing method and recording medium having a coronary artery analzying program stored therein
WO2019008798A1 (en) DEVICE FOR PREDICTING DISEASE APPEARANCE, METHOD FOR PREDICTING DISEASE DISEASE, AND PROGRAM
CN111524598A (zh) 一种围术期并发症预测方法及系统
CN111210441A (zh) 肿瘤预测方法、装置、云平台及计算机可读存储介质
KR20240054248A (ko) 의료 영상 분석 장치 및 방법, 의료 영상 시각화 장치 및 방법
US20200395126A1 (en) A medical intervention control system
JP2023548253A (ja) 医学検査値分析を実行するためのコンピュータ実装された方法、及び、装置
CN111128327B (zh) 一种低血糖预警方法和装置
CN113066574A (zh) 基于神经网络的动脉瘤破裂预测方法、装置及存储介质
CN113628761B (zh) 抗血管生成药物联合免疫检查点抑制剂治疗疗效预测方法
CN115222674A (zh) 基于多维特征融合的颅内动脉瘤破裂风险的检测装置
Bajpai et al. Early prediction of cardiac arrest using hybrid machine learning models
CN117133461B (zh) 一种老年肺癌患者术后短期死亡风险评估的方法及装置
CN113988680A (zh) 一种疼痛等级评估系统
CN114420298A (zh) 一种多阶段的急性缺血性卒中血管内治疗无效再通预测系统、设备
CN116052882A (zh) 基于机器学习的嗜铬细胞瘤术后高血压并发症预测系统
CN116453694A (zh) 基于有放回欠采样集成框架的疾病风险预测方法及系统
US11734915B2 (en) Automated and assisted identification of stroke using feature-based brain imaging
CN117672495B (zh) 基于人工智能的房颤合并冠心病患者远期死亡率预测方法
KR102676569B1 (ko) 의료 영상 분석 장치 및 방법, 의료 영상 시각화 장치 및 방법
Wiantari et al. Implementation of the CBR (Case-Based Reasoning) Method in Cases of Caesarean section
CN116504407B (zh) 一种冠脉左主干分叉的分支闭塞风险预测方法及系统
US20230377319A1 (en) Automated and assisted identification of stroke using feature-based brain imaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant