CN117334347B - 评估治疗效果方法、装置、设备及存储介质 - Google Patents
评估治疗效果方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117334347B CN117334347B CN202311632339.9A CN202311632339A CN117334347B CN 117334347 B CN117334347 B CN 117334347B CN 202311632339 A CN202311632339 A CN 202311632339A CN 117334347 B CN117334347 B CN 117334347B
- Authority
- CN
- China
- Prior art keywords
- data
- patient
- real world
- clinical trial
- external real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000000694 effects Effects 0.000 title claims abstract description 46
- 238000003062 neural network model Methods 0.000 claims abstract description 79
- 238000011160 research Methods 0.000 claims abstract description 43
- 238000007405 data analysis Methods 0.000 claims abstract description 21
- 239000003814 drug Substances 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 18
- 239000002131 composite material Substances 0.000 claims abstract description 7
- 230000001225 therapeutic effect Effects 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 12
- 150000001875 compounds Chemical class 0.000 claims description 10
- 229940079593 drug Drugs 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 abstract description 14
- 206010028980 Neoplasm Diseases 0.000 description 14
- 201000011510 cancer Diseases 0.000 description 11
- 238000003745 diagnosis Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000013517 stratification Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000092 prognostic biomarker Substances 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Pharmacology & Pharmacy (AREA)
- Computational Linguistics (AREA)
- Medicinal Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Toxicology (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据处理技术领域,公开了一种评估治疗效果方法、装置、设备及存储介质,该方法包括:对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征;根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值。解决了现有技术中由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种评估治疗效果方法、装置、设备及存储介质。
背景技术
目前,通过平衡随机对照试验(randomized controlled trial, RCT)和真实世界数据(real world data,RWD)之间患者的协变量,RWD在生成关于药物有效性和安全性的大量证据中发挥了关键作用。此外,新型分子靶向药物的复杂性创新临床试验设计,如适应性标记设计,纳入了预测性生物标志物检测,这大大增加了协变量的维度。
现有的技术方案以倾向评分为分析工具,使RWD患者在基线协变量方面更类似于RCT人群。但它只能适用于相对较少数量的基线协变量,当数据维度较高或建模没有适当考虑交互项时,可能容易出错或无法收敛。
因此,亟需一种评估治疗效果方法能够解决现有技术中由于协变量的增加而产生的复杂性,进而影响治疗效果评估准确性的技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种评估治疗效果方法、装置、设备及存储介质,旨在解决现有技术中由于协变量的增加而产生的复杂性,进而影响治疗效果评估准确性的技术问题。
为实现上述目的,本发明提供了一种评估治疗效果方法,所述方法包括以下步骤:
对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;
将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;
根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;
利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
可选地,所述对临床试验数据和外部真实世界数据进行预处理,获得研究数据集的步骤之前,还包括:
获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源;
构建自编码神经网络模型,并基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
可选地,所述基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型的步骤,包括:
通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;
通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;
通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
可选地,所述根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果的步骤,包括:
根据所述研究数据集中每一个患者的特征变量和所述预设自编码神经网络模型的模型参数估计所述每一个患者的潜在特征对应的特征评分;
根据临床试验患者的所述潜在特征对应的特征评分选取目标外部真实世界患者数据,所述目标外部真实世界患者数据为与所述临床试验数据相关的所述外部真实世界数据的患者数据子集;
基于所述每一个患者的潜在特征对应的特征评分将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
可选地,所述利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值的步骤,包括:
通过所述分层结果的重叠系数,确定所述分层结果中各层患者之间的相似度;
基于所述相似度确定所述目标外部真实世界患者数据中各层患者对应的目标权重;
根据所述目标权重,通过复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
可选地,所述预设自编码神经网络模型包括3层隐藏层,所述隐藏层的维度分别是100、10和100,所述预设自编码神经网络模型包括编码器模块和解码器模块;
所述编码器模块,用于对输入至所述预设自编码神经网络模型的所述研究数据集进行数据维度压缩,获得低维中间结果;
所述解码器模块,用于根据所述研究数据集的维度对所述低维中间结果进行数据重构,并通过反复迭代获得所述研究数据集中每一个患者的所述预设自编码神经网络模型中网络中间层的潜在特征。
可选地,所述对临床试验数据和外部真实世界数据进行预处理,获得研究数据集的步骤,包括:
筛选临床试验数据中患者的有效信息,并将所述有效信息作为协变量;
根据所述临床试验数据中患者的协变量对外部真实世界数据进行处理,以使所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量相一致;
将所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量进行整合后,对整合后的数据进行预处理,获得临床研究数据集。
此外,为实现上述目的,本发明还提出一种评估治疗效果装置,所述装置包括:
数据处理模块,用于对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;
特征提取模块,用于将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;
数据选取模块,用于根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;
数据分析模块,用于利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
此外,为实现上述目的,本发明还提出一种评估治疗效果设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的评估治疗效果程序,所述评估治疗效果程序配置为实现如上文所述的评估治疗效果方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有评估治疗效果程序,所述评估治疗效果程序被处理器执行时实现如上文所述的评估治疗效果方法的步骤。
在本发明中,公开了对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。相比于现有技术中通过倾向评分使RWD患者在基线协变量方面更类似于RCT患者,但是当数据维数较高或建模没有适当考虑交互项时,可能容易出错或无法收敛,进而影响治疗效果评估的准确性,本发明将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征,然后根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,最后利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值,从而解决了现有技术由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的评估治疗效果设备的结构示意图;
图2为本发明评估治疗效果方法第一实施例的流程示意图;
图3为本发明预设自编码神经网络模型的模型结构示意图;
图4为本发明评估治疗效果方法第二实施例的流程示意图;
图5为本发明评估治疗效果方法第三实施例的流程示意图;
图6为本发明评估治疗效果装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的评估治疗效果设备结构示意图。
如图1所示,该评估治疗效果设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM),也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对评估治疗效果设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及评估治疗效果程序。
在图1所示的评估治疗效果设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明评估治疗效果设备中的处理器1001、存储器1005可以设置在评估治疗效果设备中,所述评估治疗效果设备通过处理器1001调用存储器1005中存储的评估治疗效果程序,并执行本发明实施例提供的评估治疗效果方法。
本发明实施例提供了一种评估治疗效果方法,参照图2,图2为本发明评估治疗效果方法第一实施例的流程示意图。
本实施例中,所述评估治疗效果方法包括以下步骤:
步骤S10:对临床试验数据和外部真实世界数据进行预处理,获得研究数据集。
需要说明的是,本实施例的方法的执行主体可以为对药物或医疗产品的研究和开发过程中从真实世界数据中选取的信息的治疗效果进行评估的评估治疗效果设备,或者是其他能够实现相同或相似功能的、包含了该评估治疗效果设备的评估治疗效果系统。此处以评估治疗效果系统(以下简称系统)对本实施例和下述各实施例提供的治疗效果评估方法进行具体说明。
应理解的是,上述研究数据可以是临床试验或真实世界研究中产生或记载的数据。
需要解释的是,上述临床试验数据和外部真实世界数据可以是肿瘤患者的临床试验数据,临床试验数据的内容可以包括患者的年龄、癌症实体、性别、分期、组织学、最初癌症诊断到治疗的数据以及与肿瘤相关的特异基因等。
需要说明的是,上述外部真实世界数据包含至少一个真实世界数据源,真实世界数据源即从真实世界获取的数据源,本实施例中对真实世界数据源的数量不做限制。
可理解的是,上述临床试验数据和外部真实世界数据由于是临床试验或科研实践中产生或记载的数据,因此有些患者对应的数据可能存在一部分的数据项的缺失,为了保证评估治疗效果的准确性可以对所述临床试验数据进行预处理,删除或填补存在数据项缺失的患者,保留数据项完整的患者对应的数据,并将数据项完整的患者对应的数据作为研究数据集。
应当理解的是,上述临床试验数据和外部真实世界数据包含的数据项可以是试验人员或研究人员自定义设置的,也可以是通过其他方式设置的,本实施例对此不加以限制。
在具体实现中,上述研究数据集中可以包括但不限于,患者的年龄、癌症实体、性别、分期、组织学、医疗保健提供者、种族或民族、从最初癌症诊断到治疗开始的时间、最初癌症诊断年份和与肿瘤相关的特异基因等。
步骤S20:将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征。
需要说明的是,上述预设自编码神经网络模型包括3层隐藏层,所述隐藏层的维度分别是100、10和100,所述预设自编码神经网络模型包括编码器模块和解码器模块;
所述编码器模块,用于对输入至所述预设自编码神经网络模型的所述研究数据集进行数据维度压缩,获得低维中间结果;
所述解码器模块,用于根据所述研究数据集的维度对所述低维中间结果进行数据重构,并通过反复迭代获得所述研究数据集中每一个患者的所述预设自编码神经网络模型中网络中间层的潜在特征。
例如,参考图3,图3为本发明预设自编码神经网络模型的模型结构示意图。
图中,表示数据输入,/>表示隐藏层,/>为数据输出。编码器将输入压缩为潜在空间表征,可以用函数f(x)来表示,解码器将潜在空间表征重构为输出,可以用函数g(x)来表示,编码函数f(x)和解码函数g(x)都是具有非线性仿射映射的神经网络模型。
需要说明的是,所在的预设自编码神经网络模型的隐藏层,/>为输入数据,/>为输出数据。
需要解释的是,上述每一个患者的潜在特征为将临床研究数据集中各患者信息对应的输入向量输入至预设自编码神经网络模型,通过对研究数据集进行数据维度压缩获得低维中间结果,然后对低维中间结果进行数据重构获得的与输入向量相同维度的输出向量。
步骤S30:根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
在具体实现中,可以根据所述研究数据集中每一个患者的特征变量和所述预设自编码神经网络模型的模型参数估计所述每一个患者的潜在特征对应的特征评分;根据临床试验患者的所述潜在特征对应的特征评分选取目标外部真实世界患者数据,所述目标外部真实世界患者数据为与所述临床试验数据相关的所述外部真实世界数据的患者数据子集;基于所述每一个患者的潜在特征对应的特征评分将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
需要解释的是,上述分层结果中,各层的临床试验患者数量都是相等的。
步骤S40:利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
在具体实现中,可以通过所述分层结果的重叠系数,确定所述分层结果中各层患者之间的相似度;基于所述相似度确定所述目标外部真实世界患者数据中各层患者对应的目标权重;根据所述目标权重,通过复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
需要说明的是,上述重叠系数是英曼和布拉德利在1989年提出的重叠系数,通过所述重叠系数计算所述分层结果中各层患者之间的相似度。
需要解释的是,上述复合似然方法可以是加权相乘的方法,基于所述目标权重,通过加权相乘的方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值,可以有效降低来自外部数据集的信息的权重,进而提高了治疗效果评估的准确性。
在本实施例中,公开了对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。相比于现有技术中通过倾向评分使RWD患者在基线协变量方面更类似于RCT患者,但是当数据维数较高或建模没有适当考虑交互项时,可能容易出错或无法收敛,进而影响治疗效果评估的准确性,本实施例将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征,然后根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,最后利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值,从而解决了现有技术由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
参考图4,图4为本发明评估治疗效果方法第二实施例的流程示意图。
基于上述第一实施例,在本实施例中,所述步骤S10之前,还包括:
步骤S01:获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源。
需要解释的是,上述真实世界数据源即从真实世界获取的数据源,本实施例中对真实世界数据源的数量不做限制。上述临床试验数据可以是临床试验中产生或记载的数据。
步骤S02:构建自编码神经网络模型,并基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
在具体实现中,可以通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
需要说明的是,通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化具体可以是基于预设损失函数计算最小化所述当前结果特征与所述模型重构特征之间的损失,然后根据所述损失对所述自编码神经网络模型进行参数优化,最后获得预设自编码神经网络模型。
本实施例通过获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源;构建自编码神经网络模型,并通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。从而可以提高预设自编码神经网络模型的稳定性,进而提高了治疗效果评估的准确性。
参考图5,图5为本发明评估治疗效果方法第三实施例的流程示意图。
基于上述各实施例,在本实施例中,所述步骤S10,包括:
步骤S101:筛选临床试验数据中患者的有效信息,并将所述有效信息作为协变量。
需要说明的是,上述临床试验数据中患者的有效信息可以包括但不限于,患者的年龄、癌症实体、性别、分期、组织学、医疗保健提供者、种族或民族、从最初癌症诊断到治疗开始的时间以及最初癌症诊断年份等信息。
步骤S102:根据所述临床试验数据中患者的协变量对外部真实世界数据进行处理,以使所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量相一致。
需要说明的是,外部真实世界数据中患者的协变量和临床试验患者有效信息应相一致,包括但不限于,患者的年龄、癌症实体、性别、分期、组织学、医疗保健提供者、种族或民族、从最初癌症诊断到治疗开始的时间以及最初癌症诊断年份等信息。
步骤S103:将所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量进行整合后,对整合后的数据进行预处理,获得临床研究数据集。
需要说明的是,对整合后的数据进行预处理,删除或填补存在协变量缺失的患者,使患者协变量完整,整理成使用的数据集,保证了试验结果的可信度。
本实施例公开了筛选临床试验数据中患者的有效信息,并将所述有效信息作为协变量;根据所述临床试验数据中患者的协变量对外部真实世界数据进行处理,以使所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量相一致;将所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量进行整合后,对整合后的数据进行预处理,获得研究数据集。从而为下一步研究奠定基础,提高了数据处理的效率和准确率,进而保证了试验结果的可信度。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有评估治疗效果程序,所述评估治疗效果程序被处理器执行时实现如上文所述的评估治疗效果方法的步骤。
参照图6,图6为本发明评估治疗效果装置第一实施例的结构框图。
如图6所示,本发明实施例提出的评估治疗效果装置包括:数据处理模块601、特征获取模块602、数据选取模块603和数据分析模块604。
所述数据处理模块601,用于对临床试验数据和外部真实世界数据进行预处理,获得研究数据集。
所述特征获取模块602,用于将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征。
所述数据选取模块603,用于根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
所述数据分析模块604,用于利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
所述数据选取模块603,还用于根据所述研究数据集中每一个患者的特征变量和所述预设自编码神经网络模型的模型参数估计所述每一个患者的潜在特征对应的特征评分;根据临床试验患者的所述潜在特征对应的特征评分选取目标外部真实世界患者数据,所述目标外部真实世界患者数据为与所述临床试验数据相关的所述外部真实世界数据的患者数据子集;基于所述每一个患者的潜在特征对应的特征评分将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
所述数据分析模块604,还用于通过所述分层结果的重叠系数,确定所述分层结果中各层患者之间的相似度;基于所述相似度确定所述目标外部真实世界患者数据中各层患者对应的目标权重;根据所述目标权重,通过复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
本实施例的评估治疗效果装置公开了对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。相比于现有技术中通过倾向评分使RWD患者在基线协变量方面更类似于RCT患者,但是当数据维数较高或建模没有适当考虑交互项时,可能容易出错或无法收敛,进而影响治疗效果评估的准确性,本实施例将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征,然后根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,最后利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值,从而解决了现有技术由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
基于本发明上述评估治疗效果装置第一实施例,提出本发明评估治疗效果装置的第二实施例。
在本实施例中,所述数据处理模块601,还用于获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源;构建自编码神经网络模型,并基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
所述数据处理模块601,还用于通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
本实施例的评估治疗效果装置通过获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源;构建自编码神经网络模型,并通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。从而可以提高预设自编码神经网络模型的稳定性,进而提高了治疗效果评估的准确性。
基于上述各装置实施例,提出本发明治疗效果评估装置的第三实施例。
在本实施例中,所述数据处理模块601,还用于筛选临床试验数据中患者的有效信息,并将所述有效信息作为协变量;根据所述临床试验数据中患者的协变量对外部真实世界数据进行处理,以使所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量相一致;将所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量进行整合后,对整合后的数据进行预处理,获得研究数据集。
本实施例提高了数据处理的效率和准确率,进而保证了实验结果的可信度。
本发明评估治疗效果装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种评估治疗效果方法,其特征在于,所述评估治疗效果方法包括以下步骤:
对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;
将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;
根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;
利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值;
其中,所述根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果的步骤,包括:
根据所述研究数据集中每一个患者的特征变量和所述预设自编码神经网络模型的模型参数估计所述每一个患者的潜在特征对应的特征评分;
根据临床试验患者的所述潜在特征对应的特征评分选取目标外部真实世界患者数据,所述目标外部真实世界患者数据为与所述临床试验数据相关的所述外部真实世界数据的患者数据子集;
基于所述每一个患者的潜在特征对应的特征评分将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
2.如权利要求1所述的评估治疗效果方法,其特征在于,所述对临床试验数据和外部真实世界数据进行预处理,获得研究数据集的步骤之前,还包括:
获取外部真实世界数据和临床试验数据,所述外部真实世界数据包含至少一个真实世界数据源;
构建自编码神经网络模型,并基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
3.如权利要求2所述的评估治疗效果方法,其特征在于,所述基于所述外部真实世界数据和所述临床试验数据对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型的步骤,包括:
通过多层神经网络模型对所述外部真实世界数据和所述临床试验数据进行特征提取,获得当前结果特征;
通过所述多层神经网络模型对所述当前结果特征进行特征重构,获得模型重构特征;
通过最小化所述当前结果特征与所述模型重构特征之间的差距对所述自编码神经网络模型进行迭代优化,获得预设自编码神经网络模型。
4.如权利要求1所述的评估治疗效果方法,其特征在于,所述利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值的步骤,包括:
通过所述分层结果的重叠系数,确定所述分层结果中各层患者之间的相似度;
基于所述相似度确定所述目标外部真实世界患者数据中各层患者对应的目标权重;
根据所述目标权重,通过复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值。
5.如权利要求1所述的评估治疗效果方法,其特征在于,所述预设自编码神经网络模型包括3层隐藏层,所述隐藏层的维度分别是100、10和100,所述预设自编码神经网络模型包括编码器模块和解码器模块;
所述编码器模块,用于对输入至所述预设自编码神经网络模型的所述研究数据集进行数据维度压缩,获得低维中间结果;
所述解码器模块,用于根据所述研究数据集的维度对所述低维中间结果进行数据重构,并通过反复迭代获得所述研究数据集中每一个患者的所述预设自编码神经网络模型中网络中间层的潜在特征。
6.如权利要求1-5任一项所述的评估治疗效果方法,其特征在于,所述对临床试验数据和外部真实世界数据进行预处理,获得研究数据集的步骤,包括:
筛选临床试验数据中患者的有效信息,并将所述有效信息作为协变量;
根据所述临床试验数据中患者的协变量对外部真实世界数据进行处理,以使所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量相一致;
将所述外部真实世界数据中患者的协变量与所述临床试验数据中患者的协变量进行整合后,对整合后的数据进行预处理,获得研究数据集。
7.一种评估治疗效果装置,其特征在于,所述评估治疗效果装置包括:
数据处理模块,用于对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;
特征提取模块,用于将所述研究数据集输入至预设自编码神经网络模型,获得所述研究数据集中每一个患者的潜在特征;
数据选取模块,用于根据临床试验患者的所述潜在特征对应的特征评分从所述研究数据集中选取目标外部真实世界患者数据,并将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果;
数据分析模块,用于利用复合似然方法对所述分层结果进行数据分析,获得当前临床研究药物的治疗效果值;
所述数据选取模块,还用于根据所述研究数据集中每一个患者的特征变量和所述预设自编码神经网络模型的模型参数估计所述每一个患者的潜在特征对应的特征评分;根据临床试验患者的所述潜在特征对应的特征评分选取目标外部真实世界患者数据,所述目标外部真实世界患者数据为与所述临床试验数据相关的所述外部真实世界数据的患者数据子集;基于所述每一个患者的潜在特征对应的特征评分将所述临床试验数据和所述目标外部真实世界患者数据进行分层,获得分层结果。
8.一种评估治疗效果设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的评估治疗效果程序,所述评估治疗效果程序配置为实现如权利要求1至6中任一项所述的评估治疗效果方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有评估治疗效果程序,所述评估治疗效果程序被处理器执行时实现如权利要求1至6任一项所述的评估治疗效果方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311632339.9A CN117334347B (zh) | 2023-12-01 | 2023-12-01 | 评估治疗效果方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311632339.9A CN117334347B (zh) | 2023-12-01 | 2023-12-01 | 评估治疗效果方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117334347A CN117334347A (zh) | 2024-01-02 |
CN117334347B true CN117334347B (zh) | 2024-03-22 |
Family
ID=89293901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311632339.9A Active CN117334347B (zh) | 2023-12-01 | 2023-12-01 | 评估治疗效果方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117334347B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117954114B (zh) * | 2024-03-26 | 2024-08-13 | 北京大学 | 基于倾向性评分和幂先验的真实世界数据借用方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110459328A (zh) * | 2019-07-05 | 2019-11-15 | 梁俊 | 一种评估心脏骤停的临床决策支持系统 |
CN111696678A (zh) * | 2020-06-15 | 2020-09-22 | 中南大学 | 一种基于深度学习的用药决策方法和系统 |
CN112233810A (zh) * | 2020-10-20 | 2021-01-15 | 武汉华大基因科技有限公司 | 一种基于真实世界临床数据的治疗方案综合疗效评估方法 |
CN112309576A (zh) * | 2020-09-22 | 2021-02-02 | 江南大学 | 基于深度学习ct影像组学的结直肠癌生存期预测方法 |
KR20210043764A (ko) * | 2019-10-11 | 2021-04-22 | 서울여자대학교 산학협력단 | 딥 러닝 기반 종양 치료 반응 예측 방법 |
CN115148375A (zh) * | 2022-08-31 | 2022-10-04 | 之江实验室 | 一种高通量真实世界药物有效性与安全性评价方法及系统 |
EP4141693A1 (en) * | 2021-08-27 | 2023-03-01 | Feedzai - Consultadoria e Inovação Tecnológica, S.A. | Method and device for obtaining a generated dataset with a predetermined bias for evaluating algorithmic fairness of a machine learning model |
CN115775635A (zh) * | 2022-11-22 | 2023-03-10 | 长沙砝码柯数据科技有限责任公司 | 基于深度学习模型的药品风险识别方法、装置及终端设备 |
CN116013403A (zh) * | 2022-11-29 | 2023-04-25 | 西安交通大学医学院第二附属医院 | 宫颈癌甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途 |
CN117116490A (zh) * | 2023-08-04 | 2023-11-24 | 杭州劲膳美健康管理有限公司 | 心血管病评估模型构建方法、膳食食疗及健康管理系统 |
-
2023
- 2023-12-01 CN CN202311632339.9A patent/CN117334347B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110459328A (zh) * | 2019-07-05 | 2019-11-15 | 梁俊 | 一种评估心脏骤停的临床决策支持系统 |
KR20210043764A (ko) * | 2019-10-11 | 2021-04-22 | 서울여자대학교 산학협력단 | 딥 러닝 기반 종양 치료 반응 예측 방법 |
CN111696678A (zh) * | 2020-06-15 | 2020-09-22 | 中南大学 | 一种基于深度学习的用药决策方法和系统 |
CN112309576A (zh) * | 2020-09-22 | 2021-02-02 | 江南大学 | 基于深度学习ct影像组学的结直肠癌生存期预测方法 |
CN112233810A (zh) * | 2020-10-20 | 2021-01-15 | 武汉华大基因科技有限公司 | 一种基于真实世界临床数据的治疗方案综合疗效评估方法 |
EP4141693A1 (en) * | 2021-08-27 | 2023-03-01 | Feedzai - Consultadoria e Inovação Tecnológica, S.A. | Method and device for obtaining a generated dataset with a predetermined bias for evaluating algorithmic fairness of a machine learning model |
CN115148375A (zh) * | 2022-08-31 | 2022-10-04 | 之江实验室 | 一种高通量真实世界药物有效性与安全性评价方法及系统 |
CN115775635A (zh) * | 2022-11-22 | 2023-03-10 | 长沙砝码柯数据科技有限责任公司 | 基于深度学习模型的药品风险识别方法、装置及终端设备 |
CN116013403A (zh) * | 2022-11-29 | 2023-04-25 | 西安交通大学医学院第二附属医院 | 宫颈癌甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途 |
CN117116490A (zh) * | 2023-08-04 | 2023-11-24 | 杭州劲膳美健康管理有限公司 | 心血管病评估模型构建方法、膳食食疗及健康管理系统 |
Non-Patent Citations (3)
Title |
---|
基于电子医疗数据的真实世界仙灵骨葆胶囊对肝功能影响临床实效研究;李彦楠;谢雁鸣;张寅;郭政亿;庄严;;辽宁中医杂志;20181218(第12期);全文 * |
基于自编码的特征提取方法在生物医学领域中的应用进展;王策等;中国卫生统计;第37卷(第2期);全文 * |
浅析神经元网络算法在中医药真实世界研究中应用可行性;高睿;刘智;王辉;刘春香;夏彤;姚杨;;天津中医药大学学报(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117334347A (zh) | 2024-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110459324B (zh) | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 | |
Huang et al. | A regularized deep learning approach for clinical risk prediction of acute coronary syndrome using electronic health records | |
CN117334347B (zh) | 评估治疗效果方法、装置、设备及存储介质 | |
CN108109700B (zh) | 一种慢性病药物疗效评价方法和装置 | |
CN110119775B (zh) | 医疗数据处理方法、装置、系统、设备和存储介质 | |
US8793144B2 (en) | Treatment effect prediction system, a treatment effect prediction method, and a computer program product thereof | |
Mandair et al. | Prediction of incident myocardial infarction using machine learning applied to harmonized electronic health record data | |
JP2014512624A (ja) | 予測モデリング | |
CN102405473A (zh) | 医护点动作医疗系统和方法 | |
US20160321402A1 (en) | Data-Enriched Electronic Healthcare Guidelines For Analytics, Visualization Or Clinical Decision Support | |
CN113706442A (zh) | 基于人工智能的医疗图像处理方法、装置及电子设备 | |
KR102274072B1 (ko) | 사용자의 치매 정도 결정 방법 및 장치 | |
CN114693671B (zh) | 基于深度学习的肺结节半自动分割方法、装置、设备及介质 | |
CN113673710A (zh) | 用于训练评估算法的计算机实现的方法和系统 | |
CN117012380A (zh) | 事件预估方法、装置、设备、存储介质及程序产品 | |
CN116469545A (zh) | 使用医学图像进行辅助疾病预测的方法、装置及设备 | |
CN118277573A (zh) | 基于ChatGLM模型的院前急救文本分类标注方法、电子设备、存储介质及计算机程序产品 | |
CN113345564B (zh) | 一种基于图神经网络的患者住院时长早期预测方法及装置 | |
CN113724185B (zh) | 用于图像分类的模型处理方法、装置及存储介质 | |
CN117746201A (zh) | 基于交叉Transformer和MLIF的多模态融合生存预后方法 | |
Ly et al. | Scar-related ventricular arrhythmia prediction from imaging using explainable deep learning | |
CN113449797B (zh) | 目标状态预测方法、装置、计算机设备及存储介质 | |
CN110992312A (zh) | 医学图像处理方法、装置、存储介质及计算机设备 | |
CN108197706B (zh) | 残缺数据深度学习神经网络方法、装置、计算机设备及存储介质 | |
CN115439478A (zh) | 基于肺灌注的肺叶灌注强度评估方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |