CN116487049A - 基于决策分析的非计划重返事件处理系统 - Google Patents
基于决策分析的非计划重返事件处理系统 Download PDFInfo
- Publication number
- CN116487049A CN116487049A CN202310735831.2A CN202310735831A CN116487049A CN 116487049 A CN116487049 A CN 116487049A CN 202310735831 A CN202310735831 A CN 202310735831A CN 116487049 A CN116487049 A CN 116487049A
- Authority
- CN
- China
- Prior art keywords
- data
- reentry
- returning
- feature
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 26
- 238000004458 analytical method Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000003745 diagnosis Methods 0.000 claims abstract description 27
- 238000013507 mapping Methods 0.000 claims description 34
- 238000011282 treatment Methods 0.000 claims description 28
- 230000008859 change Effects 0.000 claims description 23
- 201000010099 disease Diseases 0.000 claims description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 13
- 238000013139 quantization Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 8
- 238000013501 data transformation Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 229940079593 drug Drugs 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000006793 arrhythmia Effects 0.000 description 3
- 206010003119 arrhythmia Diseases 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000013499 data model Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000002980 postoperative effect Effects 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012274 Preoperative evaluation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000004159 blood analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000000554 physical therapy Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及医疗数据分析处理技术领域,尤其涉及一种基于决策分析的非计划重返事件处理系统,包括第一数据获取模块、第二数据获取模块、数据重构模块、特征标定模块、重返特征识别模块以及重返诊断匹配模块,通过第一重返数据集中的数据进行数据训练,生成重返预测模型,通过第二重返数据集的重返数据进行数据训练,生成重返类型识别模型,能够通过区分训练样本数据提高模型训练效率,并且,通过扩充样本数据量,能够提高模型训练精度,通过分析第二重返数据集中的各特征指标对应的超差百分比对应的特征指标与重返类型的匹配结果对各特征指标的标定值进行调整,提高了重返预测模型的准确度。
Description
技术领域
本发明涉及医疗数据分析处理技术领域,尤其涉及一种基于决策分析的非计划重返事件处理系统。
背景技术
非计划重返事件是医疗行业通用的反映手术质量安全的指标之一。其发生可能涉及术前评估不足、手术设计缺陷、手术操作失误或患者术后管理不到位等多种原因。降低非计划重返事件发生率对提高整体医疗质量安全水平具有重要意义。因此对于非计划重返事件进行分析能够对入院诊疗过程中的支持术前评估、手术设计、手术操作质量以及患者术后管理的指导提供针对性的提升方向,提高医疗质量安全,从而降低非计划重返事件的发生几率。
中国专利公开号CN114203306A公开了一种医疗事件预测模型训练方法、医疗事件预测方法及装置,预测模型训练方法包括:获取多个对象的健康档案的多个特征变量数据以及事件结果数据并构建样本集合,进一步根据样本集合,构建多个决策树,从而根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量,由此,基于多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。规则特征向量是基于至少两个特征变量的多个生物标志物,据此来预测医疗事件,具有更高的预测准确性。并且可以利用基于多个变量的规则特征进行模型训练,使得预测模型具有非常直观的可解释性。中国专利公开号CN107408144B一种用于医疗先兆事件估计的系统和方法,包括一个或多个处理器,所述一个或多个处理器用于进行包括以下的操作:获取被检者的第一生理信息集和第二时间段内所接收到的被检者的第二生理信息集;基于将第一生理信息集和所述第二生理信息集应用于一个或多个机器学习分类器模型来计算与估计被检者的潜在心律失常事件的风险相关联的第一风险评分和第二风险评分;至少提供与潜在心律失常事件相关联的第一风险评分和第二风险评分作为时变序列的风险评分;以及基于一个或多个阈值来对与被检者的潜在心律失常事件的风险相关联的第一风险评分和第二风险评分进行分类。
由此可见,上述技术方案在对医疗事件在进行样本统计中,需要获取丰富、足量的样本数据用于模型训练,若样本事件的数量不足,则严重影响模型训练的精度和准确性。
发明内容
为此,本发明提供一种基于决策分析的非计划重返事件处理系统,用以克服现有技术中由于对非计划重返事件的发生频次低,进而采用常规样本数据处理后的样本量不足以进行非计划重返事件模型训练的数据训练和常规样本训练后模型精度低的问题。
为实现上述目的,发明提供一种基于决策分析的非计划重返事件处理系统,包括:
第一数据获取模块,用以根据设定的有效数据周期在医疗信息数据库中获取第一目标数据以及与第一目标数据对应的医疗特征信息生成第一重返数据集;
第二数据获取模块,其与所述第一数据获取模块相连,用以根据重返数据获取规则从所述医疗信息数据库中获取若干第二目标数据以及与第二目标数据对应的医疗特征信息生成第二重返数据集,以及,获取从所述第一目标数据中剔除第二目标数据后形成的第三目标数据以及与第三目标数据对应的医疗特征信息生成第三重返数据集;
数据重构模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以将医疗信息中的自然语言进行处理形成结构语言,以使所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的数据标准化;
特征标定模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以存储医疗特征信息中的各特征指标对应的标定值,并对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的数据进行标定值转化;
重返特征识别模块,其与所述数据重构模块相连,用以对所述第一重返数据集中的数据进行数据训练,生成重返预测模型,并根据所述第二重返数据集的重返数据进行数据训练,生成重返类型识别模型;
重返诊断匹配模块,其与所述重返特征识别模块以及所述特征标定模块相连,用以计算所述第二重返数据集中的各特征指标对应的超差百分比,并根据超差百分比对应的特征指标与重返类型的匹配结果对各特征指标的标定值进行调整,以提高重返预测模型的准确度;
其中,所述第一目标数据为已出院患者对应的标记信息,第二目标数据为重返患者对应的标记信息,医疗特征信息包括入院时间、出院时间、诊断信息和治疗信息,所述标记信息用以确定对应的医疗事件目标主体。
进一步地,所述数据重构模块对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的医疗特征信息中的自然语言依次进行数据清洗和数据变换生成词向量,将医疗特征信息转化为结构化数据,以使第一重返数据集、第二重返数据集及第三重返数据集中的各项数据标准化;
所述数据变换包括分词、词性标注和去停用词。
进一步地,所述重返特征识别模块根据所述第一重返数据集中各第一目标数据对应的预设时段的医疗特征信息与重返结果的映射关系,对第一重返数据集进行数据训练,以生成所述重返预测模型,重返预测模型的输入值为医疗特征信息,重返预测模型的输出值为重返结果标签;
其中,所述预设时段为各第一目标数据入院时间到出院时间对应的时间段,所述医疗特征信息包括并不限于病种类型、治疗科室、用药数据、首次化验数据、末次化验数据,所述重返结果标签包括非重返事件和重返事件。
进一步地,所述重返特征识别模块根据所述第二重返数据集中各第二目标数据对应的重返触发时段的医疗特征信息与重返结果的映射关系,对第二重返数据集进行数据训练,以生成所述重返类型识别模型,重返类型识别模型的输入值为医疗特征信息,重返预测模型的输出值为重返类型标签;
其中,所述重返触发时段为各第二目标数据出院时间到再次入院时间对应的时间段,所述重返类型标签存储于医疗信息数据库中。
进一步地,所述特征标定模块设置有用以将数据进行标定值转化的特征指标的标定规则,包括:
分别对各特征指标按是否为数值型数据进行分类以划分为量化指标和语义指标;
将量化指标的指标值按实际数值或范围区间记为对应的数值;
将语义指标的指标值记为对应的映射标定值;
其中,所述映射标定值存储于所述特征标定模块。
进一步地,所述映射标定值根据映射初始值确定,或,在调整条件下,根据所述超差百分比对应的特征指标与重返类型的匹配结果对映射初始值调整后确定;
其中,所述调整条件为所述超差百分与重返类型不匹配。
进一步地,所述映射初始值根据所述第一重返数据集中与语义指标形成映射关系的各量化指标的变化程度和/或变化趋势的平均值确定。
进一步地,所述重返诊断匹配模块根据所述超差百分比确定超差特征指标,并根据超差特征指标确定与重返类型的匹配结果,其中确定超差特征指标的方式包括:
根据单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值确定超差特征指标;
根据所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定超差特征指标;
所述超差为超出对应指标的变化程度和/或变化趋势阈值。
进一步地,所述重返诊断匹配模块在第一调整条件下,将单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值对应的单个特征指标的标定值调小;
其中,所述第一调整条件为单个所述第二目标数据对应的各特征指标的单项最大超差百分比对应的特征指标与对应的单个重返类型标签不匹配。
进一步地,所述重返诊断匹配模块在第二调整条件下,将所述第二重返数据集各重返类型占比最大的重返类型标签对应的各特征指标的标定值调小;
所述第二调整条件为所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定对应的特征指标与第二重返数据集各重返类型占比最大的重返类型标签不匹配。
与现有技术相比,本发明的有益效果在于,本发明通过将非计划重返数据样本在医疗全局信息中进行数据学习和数据训练,获得重返预测模型,能够克服非计划重返事件样本数据少引起的训练不成功或训练模型精度低的问题,提高了重返预测模型训练的成功率和模型的精度。
进一步地,本发明通过数据重构模块将自然语言处理为结构语言,避免了自然语言无法进行数据训练造成的对历史数据使用不充分造成的模型训练精度差的弊端,有效的利用历史数据进行数据训练,提升了模型训练的精度。
进一步地,本发明通过采用不同的数据集训练重返预测模型和重返类型识别模型,通过第一重返数据集中的数据进行数据训练,生成重返预测模型,通过第二重返数据集的重返数据进行数据训练,生成重返类型识别模型,能够通过区分训练样本数据提高模型训练效率,并且,通过扩充样本数据量,能够提高模型训练精度。
进一步地,本发明通过计算所述第二重返数据集中的各特征指标对应的超差百分比,并根据超差百分比对应的特征指标与重返类型的匹配结果对各特征指标的标定值进行调整,通过针对历史重返数据的校正调整,能够提高重返预测模型的准确度。
进一步的,本发明调整后的特征指标的标定值能够用来指导诊疗中的术前分析和手术/诊疗策略制定,能够达到提升治疗质量降低非计划重返的目的。
附图说明
图1为本发明实施例基于决策分析的非计划重返事件处理系统的连接示意图;
图2为本发明实施例数据重构模块的工作示意图;
图3为本发明实施例数据模型的训练逻辑图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
为便于理解,在此对本发明相关术语做简要解释如下:
非计划重返手术室再手术率是行业通用的反映手术质量安全的指标之一。
本发明提及的非计划重返事件包括非计划再住院、非计划再手术和非计划再入监护室,并按常规共识定义了再入院(包括非计划再住院、非计划再手术和非计划再入监护室)的间隔时间为≤3l天,间隔大于31天的非再住院、再手术和再入监护室不作为非计划重返事件考察。
为简化描述,以下统称非计划重返事件为非计划再住院,及非计划再住院对应的各诊疗特征描述,其不作为限定非计划重返事件及其诊疗特征的范围,仅为描述方便做的简化。
请参阅图1至图3所示,图1为本发明实施例基于决策分析的非计划重返事件处理系统的结构框图,本发明提供一种基于决策分析的非计划重返事件处理系统,包括:
第一数据获取模块,用以根据设定的有效数据周期在医疗信息数据库中获取第一目标数据以及与第一目标数据对应的医疗特征信息生成第一重返数据集;
第二数据获取模块,其与所述第一数据获取模块相连,用以根据重返数据获取规则从所述医疗信息数据库中获取若干第二目标数据以及与第二目标数据对应的医疗特征信息生成第二重返数据集,以及,获取从所述第一目标数据中剔除第二目标数据后形成的第三目标数据以及与第三目标数据对应的医疗特征信息生成第三重返数据集;
数据重构模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以将医疗信息中的自然语言进行处理形成结构语言,以使所述第二重返数据集及所述第三重返数据集中的数据标准化;
特征标定模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以存储医疗特征信息中的各特征指标对应的标定值,并对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的数据进行标定值转化;
重返特征识别模块,其与所述数据重构模块相连,用以对所述第一重返数据集中的数据进行数据训练,生成重返预测模型,并根据所述第二重返数据集的重返数据进行数据训练,生成重返类型识别模型;
重返诊断匹配模块,其与所述重返特征识别模块以及所述特征标定模块相连,用以计算所述第二重返数据集中的各特征指标对应的超差百分比,并根据超差百分比对应的特征指标与重返类型的匹配结果对各特征指标的标定值进行调整,以提高重返预测模型的准确度;
其中,所述第一目标数据为已出院患者对应的标记信息,第二目标数据为重返患者对应的标记信息,医疗特征信息包括入院时间、出院时间、诊断信息和治疗信息,所述标记信息用以确定对应的医疗事件目标主体。
在一般的实施中,非计划重返事件按单个医院进行考核,从而有效数据周期根据医院的医疗设施是否变动、诊疗手段是否更新、诊疗人员是否变动以及各变动更新的幅度确定,优选的,有效数据周期不超过1年,且有效数据周期内至少包括1个非计划重返事件。
可以理解的是,标记信息一般设置为患者姓名或治疗卡识别号等身份信息,特征指标包括患者确诊的疾病名称、病种、患者就诊科室、病种对应的再手术率、主治医师的治疗质量、治疗硬件达成率、首次出院符合率以及患者出院管理符合率,其中,治疗质量采用量化指标,例如患者病种对应的重点指标体征的回归率。
可以理解的是,重返数据获取规则为获取医疗信息数据库中的医疗事件中重返事件对应的目标主体,因而,重返数据获取规则可以为标记了重返标签或关键字的筛选,也可以为根据出院至再入院时间进行的诊疗信息的匹配筛选。
因此,在一般的实施中,第一目标数据为有效数据周期内各入院患者的身份信息,第一目标数据对应的医疗特征信息一般包括患者从入院至出院或当前获取时间点发生入院时间、出院时间、诊断信息和治疗信息,诊断信息包括患者的就诊科室、就诊医生、医生对病历记载的诊断信息、设备检查生理指标过程中判定的诊断信息,治疗信息包括用药信息、外科操作等介入信息以及理疗等非介入信息。
第二目标数据根据重返数据获取规则从第一目标数据中筛选,重返数据获取规则一般根据医疗指南中确定的非计划重返定义进行筛选,第二目标数据为非计划重返患者的身份信息,与第二目标数据对应的医疗特征信息包括非计划重返患者从入院至出院或当前获取时间点发生入院时间、出院时间、诊断信息和治疗信息。
可以理解的是,第三目标数据为从有效数据周期内各入院患者中剔除非计划重返患者后各患者的身份信息,相应地,与第三目标数据对应的医疗特征信息为剔除非计划重返患者后各患者的医疗特征信息。
特征指标为本发明基于决策分析的非计划重返事件处理系统通过数据训练需学习的数据对象,标定值转化为将数据对象的特征通过量化的数值进行表征,进而,在获取到的重返预测模型中通过输入或改变特征指标的数值,能够预测患者是否发生非计划重返事件以及通过重返类型识别模型预测患者的非计划重返类型,从而能够通过改变特征指标的数值避免非计划重返事件的发生,可以理解的是,改变特征指标的数值需要在同一类别内通过数据对象的替换实现,例如一般医疗设备替换为高精度医疗设备,或治疗同一疾病的药物间的替换。
例如,特征指标可以是病种对应的再手术率、主治医师的治疗质量,治疗质量为客观的指标,例如该主治医生历史诊疗的各患者病种对应的重点指标体征数据的回归率,以及治疗硬件达成率、首次出院符合率或患者出院管理符合率等。
请参阅图2所示,其为本发明实施例数据重构模块的工作示意图,所述数据重构模块对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的医疗特征信息中的自然语言依次进行数据清洗和数据变换生成词向量,将医疗特征信息转化为结构化数据,以使第一重返数据集、第二重返数据集及第三重返数据集中的各项数据标准化;
所述数据变换包括分词、词性标注和去停用词。
由于各医疗特征信息中同时存在数据型数据、标签型数据以及描述型数据,例如,血液检查报告为通常为数据型结构化数据,就诊科室通常为标签型数据,而病历中的疾病描述及严重程度通常为半结构化或非结构的描述型数据。其中,结构数据型数据、标签型数据能够直接转化为结构化数据,描述型数据为非结构化数据或半结构化数据,因而医疗特征信息的数据类型会存在半结构化数据或非结构化数据,此类数据无法直接传入模型进行训练,故而,数据重构模块的标准化过程需要对这类半结构化数据或非结构化数据进行处理,通过数据清洗、分词、词性标注、去停用词等操作,生成词向量,转化为结构化数据,便于模型训练。
请参阅图3所示,其为本发明实施例数据模型的训练逻辑图,所述重返特征识别模块根据所述第一重返数据集中各第一目标数据对应的预设时段的医疗特征信息与重返结果的映射关系,对第一重返数据集进行数据训练,以生成所述重返预测模型,重返预测模型的输入值为医疗特征信息,重返预测模型的输出值为重返结果标签;
其中,所述预设时段为各第一目标数据入院时间到出院时间对应的时间段,所述医疗特征信息包括并不限于病种类型、治疗科室、用药数据、首次化验数据、末次化验数据,所述重返结果标签包括非重返事件和重返事件。
所述重返特征识别模块根据所述第二重返数据集中各第二目标数据对应的重返触发时段的医疗特征信息与重返结果的映射关系,对第二重返数据集进行数据训练,以生成所述重返类型识别模型,重返类型识别模型的输入值为医疗特征信息,重返预测模型的输出值为重返类型标签;
其中,所述重返触发时段为各第二目标数据出院时间到再次入院时间对应的时间段,所述重返类型标签存储于医疗信息数据库中。
在实施中,用于进行数据训练的医疗特征信息中需包含标定值转化后的所述特征指标,以使训练后的重返预测模型能够建立特征指标与重返结果标签的指向模型,使训练后的重返类型识别模型能够建立特征指标与重返类型的指向模型。
预设时段用于确定单个医疗事件,例如,同一名患者,在有效数据周期(例如1年)内两次住院并经治疗后出院,两次住院中前次出院时间与后次住院时间的间隔大于31天,此时,认为其为独立的两个医疗事件,可以分别统计各医疗事件的医疗特征信息。
同理的,重返触发时段用于确定非计划重返事件,此时段的医疗特征信息包括并不限于历史病历信息、出院前最后一次检查数据以及重返入院后第一次检查数据。
实施中,重返结果标签包括非重返事件和重返事件,重返类型标签包括硬件类、治疗类、病种类以及对象管理类,其中,对象管理类也可以认为是非诊疗类,一般指患者主观因素造成的重返事件的分类类型。
具体而言,所述特征标定模块设置有用以将数据进行标定值转化的特征指标的标定规则,包括:
分别对各特征指标按是否为数值型数据进行分类以划分为量化指标和语义指标;
将量化指标的指标值按实际数值或范围区间记为对应的数值;
将语义指标的指标值记为对应的映射标定值;
其中,所述映射标定值存储于所述特征标定模块。
例如,数值型数据的数据精度高,或数据的医疗指征敏感度低或数据合格区间较宽泛时,将量化指标的指标值按范围区间记为对应的数值;
数据位于合格区间时,记为对应合格区间的指定数值,高于或低于合格区间,记为对应高区间或低区间对应的指定数值。
又如,数值型数据的数据精度低,或数据的医疗指征敏感度高或数据合格区间较窄时,将量化指标的指标值按实际数值记为对应的实际数值。
可以理解的是,这里的医疗指征敏感度指对应疾病分级或确定病种的敏感程度,医疗指征敏感度越高,其数据与对应疾病的关联性越强。
数据标准化后的非结构数据或半结构能够根据划分为具有相同数据信息的若干分组,此时成为结构化数据,具有能划分为若干分组的结构化数据对应的单个特征指标也就是本发明中称的语义指标,通过为语义指标中的各对应分组的数据映射标定值,能够将语义指标转化为量化指标,从而简化数据训练的复杂程度。
具体而言,所述映射标定值根据映射初始值确定,或,在调整条件下,根据所述超差百分比对应的特征指标与重返类型的匹配结果对映射初始值调整后确定;
其中,所述调整条件为所述超差百分与重返类型不匹配。
所述映射初始值根据所述第一重返数据集中与语义指标形成映射关系的各量化指标的变化程度和/或变化趋势的平均值确定。
映射初始值以及映射初始值的调整后均在0~100%的数值范围内,模型训练前,映射标定值直接设定为映射初始值,映射初始值能够根据普遍的治疗经验、设备精度、药效达成率确定,或根据具体的场景医院的具体指标进行确定,一般认为,各量化指标的变化程度向健康指标的变化程度越显著、变化趋势越向健康水平靠近,映射初始值越接近100%。
具体而言,所述重返诊断匹配模块根据所述超差百分比确定超差特征指标,并根据超差特征指标确定与重返类型的匹配结果,其中确定超差特征指标的方式包括:
根据单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值确定超差特征指标;
根据所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定超差特征指标;
所述超差为超出对应指标的变化程度和/或变化趋势阈值。
相应的,超差百分比在单个所述第二目标数据中指单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值,在所述第二重返数据集中指数据集中各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值。
例如,单个非计划重返事件的患者的各特征指标中白细胞数据变化量占合格数据范围的百分比为最大值,则,认为超差特征指标为白细胞数据对应的特征指标,例如预设对应至感染指标;
各个非计划重返事件的全部患者的特征指标按类别进行超差个数统计,计算出的最大值对应的特征指标为超差特征指标,
相应的,超差特征指标预设对应至一个或以上的重返类型标签;
若单个所述第二目标数据对应的各特征指标的单项最大超差百分比对应的超差特征指标预设对应至第一重返类型标签,与单个所述第二目标数据对应的单个重返类型标签相同,记为匹配,反之,记为不匹配,触发第一调整条件;
若所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定对应的特征指标预设对应至第二重返类型标签,与所述第二目标数据集各重返类型占比最大的重返类型标签相同,记为匹配,反之,记为不匹配,触发第二调整条件。
具体而言,所述重返诊断匹配模块在第一调整条件下,将单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值对应的单个特征指标的标定值调小,在实施中优选的,将单个特征指标的标定值按预设调整幅度逐渐调小直至符合匹配条件;
所述重返诊断匹配模块在第二调整条件下,将所述第二重返数据集各重返类型占比最大的重返类型标签对应的各特征指标的标定值调小,在实施中优选的,将所述第二重返数据集各重返类型占比最大的重返类型标签对应的各特征指标的标定值按预设调整幅度逐渐调小直至符合匹配条件。
此时,调整后输出的调整后的标定值能够精确反映各特征指标与医疗事件的对应关系,进一步的,可以提取任一个特征指标与非计划重返事件发生与否的模型映射关系,从而,通过调整各特征指标值,指导医疗处理中术前分析和手术/诊疗策略制定,能够达到提升治疗质量降低非计划重返事件发生的目的。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于决策分析的非计划重返事件处理系统,其特征在于,包括:
第一数据获取模块,用以根据设定的有效数据周期在医疗信息数据库中获取第一目标数据以及与第一目标数据对应的医疗特征信息生成第一重返数据集;
第二数据获取模块,其与所述第一数据获取模块相连,用以根据重返数据获取规则从所述医疗信息数据库中获取若干第二目标数据以及与第二目标数据对应的医疗特征信息生成第二重返数据集,以及,获取从所述第一目标数据中剔除第二目标数据后形成的第三目标数据以及与第三目标数据对应的医疗特征信息生成第三重返数据集;
数据重构模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以将医疗信息中的自然语言进行处理形成结构语言,以使所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的数据标准化;
特征标定模块,其分别与所述第一数据获取模块和所述第二数据获取模块相连,用以存储医疗特征信息中的各特征指标对应的标定值,并对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的数据进行标定值转化;
重返特征识别模块,其与所述数据重构模块相连,用以对所述第一重返数据集中的数据进行数据训练,生成重返预测模型,并根据所述第二重返数据集的重返数据进行数据训练,生成重返类型识别模型;
重返诊断匹配模块,其与所述重返特征识别模块以及所述特征标定模块相连,用以计算所述第二重返数据集中的各特征指标对应的超差百分比,并根据超差百分比对应的特征指标与重返类型的匹配结果对各特征指标的标定值进行调整,以提高重返预测模型的准确度;
其中,所述第一目标数据为已出院患者对应的标记信息,第二目标数据为重返患者对应的标记信息,医疗特征信息包括入院时间、出院时间、诊断信息和治疗信息,所述标记信息用以确定对应的医疗事件目标主体。
2.根据权利要求1所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述数据重构模块对所述第一重返数据集、所述第二重返数据集及所述第三重返数据集中的医疗特征信息中的自然语言依次进行数据清洗和数据变换生成词向量,将医疗特征信息转化为结构化数据,以使第一重返数据集、第二重返数据集及第三重返数据集中的各项数据标准化;
所述数据变换包括分词、词性标注和去停用词。
3.根据权利要求2所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述重返特征识别模块根据所述第一重返数据集中各第一目标数据对应的预设时段的医疗特征信息与重返结果的映射关系,对第一重返数据集进行数据训练,以生成所述重返预测模型,重返预测模型的输入值为医疗特征信息,重返预测模型的输出值为重返结果标签;
其中,所述预设时段为各第一目标数据入院时间到出院时间对应的时间段,所述医疗特征信息包括并不限于病种类型、治疗科室、用药数据、首次化验数据、末次化验数据,所述重返结果标签包括非重返事件和重返事件。
4.根据权利要求3所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述重返特征识别模块根据所述第二重返数据集中各第二目标数据对应的重返触发时段的医疗特征信息与重返结果的映射关系,对第二重返数据集进行数据训练,以生成所述重返类型识别模型,重返类型识别模型的输入值为医疗特征信息,重返预测模型的输出值为重返类型标签;
其中,所述重返触发时段为各第二目标数据出院时间到再次入院时间对应的时间段,所述重返类型标签存储于医疗信息数据库中。
5.根据权利要求3或4所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述特征标定模块设置有用以将数据进行标定值转化的特征指标的标定规则,包括:
分别对各特征指标按是否为数值型数据进行分类以划分为量化指标和语义指标;
将量化指标的指标值按实际数值或范围区间记为对应的数值;
将语义指标的指标值记为对应的映射标定值;
其中,所述映射标定值存储于所述特征标定模块。
6.根据权利要求5所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述映射标定值根据映射初始值确定,或,在调整条件下,根据所述超差百分比对应的特征指标与重返类型的匹配结果对映射初始值调整后确定;
其中,所述调整条件为所述超差百分与重返类型不匹配。
7.根据权利要求6所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述映射初始值根据所述第一重返数据集中与语义指标形成映射关系的各量化指标的变化程度和/或变化趋势的平均值确定。
8.根据权利要求5所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述重返诊断匹配模块根据所述超差百分比确定超差特征指标,并根据超差特征指标确定与重返类型的匹配结果,其中确定超差特征指标的方式包括:
根据单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值确定超差特征指标;
根据所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定超差特征指标;
所述超差为超出对应指标的变化程度和/或变化趋势阈值。
9.根据权利要求8所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述重返诊断匹配模块在第一调整条件下,将单个所述第二目标数据对应的各特征指标在所述预设时段的数据变化距离百分比中的最大值对应的单个特征指标的标定值调小;
其中,所述第一调整条件为单个所述第二目标数据对应的各特征指标的单项最大超差百分比对应的特征指标与对应的单个重返类型标签不匹配。
10.根据权利要求8所述的基于决策分析的非计划重返事件处理系统,其特征在于,所述重返诊断匹配模块在第二调整条件下,将所述第二重返数据集各重返类型占比最大的重返类型标签对应的各特征指标的标定值调小;
所述第二调整条件为所述第二重返数据集各特征指标中各类特征指标的超差个数占本类特征数总数的百分比中的最大值确定对应的特征指标与第二重返数据集各重返类型占比最大的重返类型标签不匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310735831.2A CN116487049B (zh) | 2023-06-21 | 2023-06-21 | 基于决策分析的非计划重返事件处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310735831.2A CN116487049B (zh) | 2023-06-21 | 2023-06-21 | 基于决策分析的非计划重返事件处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116487049A true CN116487049A (zh) | 2023-07-25 |
CN116487049B CN116487049B (zh) | 2023-09-08 |
Family
ID=87212228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310735831.2A Active CN116487049B (zh) | 2023-06-21 | 2023-06-21 | 基于决策分析的非计划重返事件处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116487049B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105512477A (zh) * | 2015-12-03 | 2016-04-20 | 万达信息股份有限公司 | 基于降维组合分类算法非计划性再入院风险评估预测模型 |
CN110347837A (zh) * | 2019-07-17 | 2019-10-18 | 电子科技大学 | 一种心血管疾病非计划再住院风险预测方法 |
CN110691548A (zh) * | 2017-07-28 | 2020-01-14 | 谷歌有限责任公司 | 用于从电子健康记录中预测和总结医疗事件的系统和方法 |
US20200243197A1 (en) * | 2014-09-05 | 2020-07-30 | University Of Cincinnati | Methods for determining risk and treating diseases and conditions that correlate to weather data |
-
2023
- 2023-06-21 CN CN202310735831.2A patent/CN116487049B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200243197A1 (en) * | 2014-09-05 | 2020-07-30 | University Of Cincinnati | Methods for determining risk and treating diseases and conditions that correlate to weather data |
CN105512477A (zh) * | 2015-12-03 | 2016-04-20 | 万达信息股份有限公司 | 基于降维组合分类算法非计划性再入院风险评估预测模型 |
CN110691548A (zh) * | 2017-07-28 | 2020-01-14 | 谷歌有限责任公司 | 用于从电子健康记录中预测和总结医疗事件的系统和方法 |
CN110347837A (zh) * | 2019-07-17 | 2019-10-18 | 电子科技大学 | 一种心血管疾病非计划再住院风险预测方法 |
Non-Patent Citations (2)
Title |
---|
姚远等: ""左心室射血分数降低心力衰竭患者1年内再入院的危险因素分析"", 《解放军预防医学杂志》, no. 08 * |
杜国栋: ""基于梯度提升决策树的患者30天再入院预测模型研究"", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, no. 01 * |
Also Published As
Publication number | Publication date |
---|---|
CN116487049B (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110838118B (zh) | 用于医疗过程中异常检测的系统和方法 | |
CN110473615B (zh) | 一种信息处理方法及装置 | |
US20180082042A1 (en) | System for laboratory values automated analysis and risk notification in intensive care unit | |
CN113808738B (zh) | 一种基于自识别影像的疾病识别系统 | |
CN114639478B (zh) | 一种基于心脏瓣膜病的超声监测系统 | |
CN115185936B (zh) | 一种基于大数据的医疗临床数据质量分析系统 | |
CN108492886B (zh) | 微创手术相似病案推荐方法、装置、设备及介质 | |
US20080234973A1 (en) | Method and System for Detecting Artifacts in Icu Patient Records by Data Fusion and Hypothesis Testing | |
CN117038050A (zh) | 生理参数异常处理方法、系统及医疗设备 | |
CN115762769A (zh) | 一种ercp术后风险智能预警系统 | |
Zhang et al. | Phase I study of surgical performances with risk-adjusted Shewhart control charts | |
CN116487049B (zh) | 基于决策分析的非计划重返事件处理系统 | |
US6941288B2 (en) | Online learning method in a decision system | |
Bahar et al. | Model Structure of Fetal Health Status Prediction | |
CN114242239B (zh) | 一种vte风险监测及结果质控系统 | |
CN114864029A (zh) | 一种医院DRGs分组判断方法及工作系统 | |
CN114550930A (zh) | 疾病预测方法、装置、设备及存储介质 | |
CN111968747A (zh) | Vte智能防治管理系统 | |
CN118197522B (zh) | 一种急诊重症患者生命体征实时监控预警方法及系统 | |
CN117809791A (zh) | 一种基于数据分析的患者标签识别方法 | |
CN115132351B (zh) | 基于真实世界研究的诊断数据反馈评价系统及方法 | |
KR102652325B1 (ko) | 가우시안 프로세스 회귀 분석을 이용한 심정지 예측 장치 | |
Schmidt et al. | A 3-staged approach to identifying patients at risk of deterioration in emergency departments | |
Schmidt et al. | Clustering Emergency Department patients-an assessment of group normality | |
Ağlarcı et al. | Effect of various factors on classification performance of ordinal logistic regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |