CN116580797B - 一种临床试验数据的快速比对方法 - Google Patents
一种临床试验数据的快速比对方法 Download PDFInfo
- Publication number
- CN116580797B CN116580797B CN202310544046.9A CN202310544046A CN116580797B CN 116580797 B CN116580797 B CN 116580797B CN 202310544046 A CN202310544046 A CN 202310544046A CN 116580797 B CN116580797 B CN 116580797B
- Authority
- CN
- China
- Prior art keywords
- treatment
- data
- comparison
- patient
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000012360 testing method Methods 0.000 title claims abstract description 29
- 238000011282 treatment Methods 0.000 claims abstract description 261
- 230000000694 effects Effects 0.000 claims abstract description 73
- 238000004458 analytical method Methods 0.000 claims abstract description 66
- 238000011269 treatment regimen Methods 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 238000011157 data evaluation Methods 0.000 claims abstract description 8
- 239000003814 drug Substances 0.000 claims description 46
- 230000004083 survival effect Effects 0.000 claims description 37
- 229940079593 drug Drugs 0.000 claims description 36
- 238000011156 evaluation Methods 0.000 claims description 32
- 238000001356 surgical procedure Methods 0.000 claims description 27
- 230000001225 therapeutic effect Effects 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 10
- 230000005855 radiation Effects 0.000 claims description 10
- 238000001959 radiotherapy Methods 0.000 claims description 10
- 238000011285 therapeutic regimen Methods 0.000 claims description 9
- 201000010099 disease Diseases 0.000 claims description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000000692 Student's t-test Methods 0.000 claims description 2
- 238000000546 chi-square test Methods 0.000 claims description 2
- 238000013211 curve analysis Methods 0.000 claims description 2
- 238000012353 t test Methods 0.000 claims description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011221 initial treatment Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011369 optimal treatment Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/20—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种临床试验数据的快速比对方法,包括:确定临床试验数据评价指标;收集和整理治疗组和对照组患者的病历数据作为参照数据集;基于参照数据集进行临床治疗方案分析比对模型的训练;收集和整理比对数据集;将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,主治医生对得出的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案。本发明采用机械学习算法进行临床试验数据的快速比对,机器学习算法可以自动化地处理大量的临床试验数据,相较于传统手工或者半自动化分析方法节省了耗时、人力和成本。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种临床试验数据的快速比对方法。
背景技术
临床试验数据的快速比对方法的主要目的是加速对临床试验数据的分析和比对,以快速获得治疗方案的疗效和安全性信息。具体来说,临床试验数据的快速比对方法可以实现以下作用:评估治疗方案的疗效:快速将治疗组的疗效结果与对照组的结果进行比较,为医生、临床研究员和患者提供有效的治疗方案;评估治疗方案的可靠性:快速比较不同治疗方案的疗效及安全性,对治疗方案的可靠性进行评估;加速临床试验的数据采集和分析:能够对多个临床试验数据进行快速处理和分析,提高分析速度和准确度,从而加速临床试验的数据分析和研究进展;提高临床决策的准确性:通过有效的数据分析和比对,提高医生对治疗方案的决策准确性,帮助医生更好地选择最佳治疗方案,从而提高治疗效果和患者的生存质量;
传统的比对方法通常是通过手工或者半自动化的方式来完成的,手工方法需要人们在电子表格或文本文档中查找和比对数据,而半自动化方法则需要人们编写脚本或程序来处理数据,这种方法需要花费大量的时间和劳动力,并且容易出现错误,由于人为因素的影响,比对结果的准确性无法得到保证。
因此,本发明提出一种基于临床试验数据的快速比对方法。
发明内容
本发明提供一种临床试验数据的快速比对方法,用以解决上述提出的至少一项技术问题。
本发明提供一种临床试验数据的快速比对方法,包括以下步骤:
步骤1:确定临床试验数据评价指标,临床试验数据评价指标包括治疗组和对照组的主要疗效终点和次要疗效终点;
步骤2:收集和整理治疗组和对照组患者的病历数据作为参照数据集,参照数据集包括基线数据、治疗方案数据和疗效终点数据;
步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型;
步骤4:收集和整理待治疗病人的基线数据,并由主治医生拟定若干种可行的治疗方案数据,将待治疗病人的基线数据和主治医生拟定若干种可行的治疗方案数据作为比对数据集;
步骤5:将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,主治医生对得出的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案。
在一种可能实现的方式中,步骤1中主要疗效终点为病人无进展生存时间,次要疗效终点包括病人总生存时间和疼痛缓解情况;步骤2和步骤5中的疗效终点数据包括主要疗效终点数据和次要疗效终点数据,其中主要疗效终点数据包括病人无进展生存时间,次要疗效终点数据包括病人总生存时间和疼痛缓解情况。
在一种可能实现的方式中,基线数据为患者的年龄、性别、身高和体重中的任意一种或多种;
治疗方案数据为每次治疗的方式及其疗程数量以及每个疗程对应的剂量,每次治疗的方式包括药物治疗、手术治疗和放射治疗中的任意一种或多种;
疗效终点数据包括病人无进展生存时间、病人总生存时间和疼痛缓解情况。
在一种可能实现的方式中,步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型包括:
步骤30:基于主要疗效终点和次要疗效终点选择合适的比较方法;
步骤31:对参照数据集中缺失值和异常值进行处理,增加数据可信度,并对参照数据集进行数据隐私保护;
步骤32:将参照数据集划分为训练集和测试集,划分比例为2:1或3:1中的任意一种;
步骤33:通过选择的比较方法进行建模,并基于训练集进行临床治疗方案分析比对模型的训练,并基于测试集对临床治疗方案分析比对模型进行验证,最终形成训练好的临床治疗方案分析比对模型。
在一种可能实现的方式中,还包括:重复步骤30-步骤33,通过选择不同的比较方法进行建模,训练得到多个临床治疗方案分析比对模型,对多个临床治疗方案分析比对模型进行评估,选出最佳的临床治疗方案分析比对模型。
在一种可能实现的方式中,数据隐私保护的方法采用利用数据加密技术进行数据保护或采用差分隐私技术保护。
在一种可能实现的方式中,步骤5还包括:
步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,主治医生根据修正提示对比对数据集进行修正,从而保证比对数据集的合理性;
步骤51:训练好的临床治疗方案分析比对模型对合理的比对数据集进行处理得出每种治疗方案对应的疗效终点数据;
步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数,并将综合评价指标系数排名最高的前三种治疗方案对应的疗效终点数据输出给主治医生;
步骤53:主治医生对输出的三种治疗方案对应的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案。
在一种可能实现的方式中,步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,从而保证比对数据集的合理性,包括:
主治医生拟定的第N个可行的治疗方案对应第N个比对数据集,第N个比对数据集的合理性判断结果用表示;
若=0,则证明第N个比对数据集在合理范围内,对应的主治医生拟定的第N个可行的治疗方案合理;
若=-1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过大;
若=1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过小。
在一种可能实现的方式中,第N个比对数据集的合理性判断过程包括:
其中,表示第N个比对数据集的合理性判断结果,/>为采用第i种药物进行药物治疗的总疗程数,u为药物治疗时采用的药物的种类总数,/>为第i种药物的药物剂量数,/>为第i种药物单位药物剂量对应的疗效系数,e为自然数,取值为2.72,/>为药物治疗过程中第i种药物的预设药物剂量波动影响系数,/>为采用第i种手术进行手术治疗的总疗程数,v为手术治疗时采用的手术治疗的种类总数,/>为第i种手术的手术剂量数,为第i种手术单位手术剂量对应的疗效系数,/>为药物治疗过程中第i种手术的预设手术剂量波动影响系数,w为放射治疗的总疗程数,/>为第i个疗程放射治疗的剂量数,为单位放射治疗剂量对应的疗效系数,/>为基于患者年龄、患者性别、患者身高、患者体重得出的患者身体机能自愈能力评估系数,/>为主治医生拟定的第N个可行的治疗方案的预设疗效系数,/>为最小预设疗效边界系数,/>为最大预设疗效边界系数,/>表示第N个比对数据集的疗效表示系数。
在一种可能实现的方式中,步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数包括:
其中,为主治医生拟定的第N种治疗方案的综合评价指标系数,/>为第N种治疗方案得出的疗效终点数据中主要疗效终点在综合评价指标系数中占的比重,/>为第N种治疗方案得出的疗效终点数据中次要疗效终点在综合评价指标系数中占的比重,/>为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点对综合评价指标系数的影响因子,/>为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点在全部主要疗效终点数据中的重要性占比,/>表示第N种治疗方案得出的疗效终点数据中主要疗效终点的总个数,/>表示第N种治疗方案得出的疗效终点数据中次要疗效终点的总个数,/>为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点对综合评价指标系数的影响因子,/>为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点在全部次要疗效终点数据中的重要性占比。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种临床试验数据的快速比对方法的流程图;
图2为本发明实施例中步骤3流程图;
图3为本发明实施例中步骤5流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供一种临床试验数据的快速比对方法,如图1所示,包括以下步骤:
步骤1:确定临床试验数据评价指标,临床试验数据评价指标包括治疗组和对照组的主要疗效终点和次要疗效终点;
步骤2:收集和整理治疗组和对照组患者的病历数据作为参照数据集,参照数据集包括基线数据、治疗方案数据和疗效终点数据;
步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型;
步骤4:收集和整理待治疗病人的基线数据,并由主治医生拟定若干种可行的治疗方案数据,将待治疗病人的基线数据和主治医生拟定若干种可行的治疗方案数据作为比对数据集;
步骤5:将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,主治医生对得出的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案。
该实施例中,治疗组为得病患者中进行过临床治疗的患者,对照组为得病患者中未进行过临床治疗的患者;
该实施例中,疗效终点是指观察或评价治疗的关键有效性指标,研究者根据自己的研究目的和研究对象选择一个或多个疗效终点作为研究结果;
该实施例中,主要疗效终点是指最关键的研究结果,被认为是设计临床试验的核心,次要疗效终点是指次要关注的研究结果,是在主要疗效终点得到的结果之外的或是用来补充主要疗效终点的结果,如将主要疗效终点设置为病人无进展生存时间(即病情未恶化的持续时间),次要疗效终点包括病人总生存时间(从病情开始到病情结束病人的生存时间)和疼痛缓解情况。
该实施例中,基线数据可为患者的年龄、性别、身高和体重;治疗方案数据为每次治疗的方式及其疗程数量以及每个疗程对应的剂量;疗效终点数据与临床试验数据评价指标的主要疗效终点和次要疗效终点相对应,如步骤1中设置的主要疗效终点为病人无进展生存时间,次要疗效终点为病人总生存时间和疼痛缓解情况,则此处的疗效终点数据也为治疗组和对照组患者的病人无进展生存时间、病人总生存时间和疼痛缓解情况;
其中,每次治疗的方式包括药物治疗、手术治疗和放射治疗,每个疗程对应的剂量代表药物、手术和放疗的施加程度,如在第一个疗程用药为100mg、在第二疗程用药为110mg,此处的100mg和110mg代表不同的剂量;
在该实施例中,参照数据集为进行临床治疗方案分析比对模型训练使用的数据集,比对数据集为待治疗病人的一些基础数据,为用于输入临床治疗方案分析比对模型的数据。
在该实施例中,待治疗病人的基线数据与参照数据集中的基线数据相对应,如参照数据集中的基线数据为患者的年龄、性别、身高和体重,则待治疗病人的基线数据也为患者的年龄、性别、身高和体重;
在该实施例中,主治医生拟定若干种可行的治疗方案数据包括每次治疗的方式及其疗程数量以及每个疗程对应的剂量;
在该实施例中,将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,这里的疗效终点数据与步骤一中治疗组和对照组的主要疗效终点和次要疗效终点相对应,若步骤一中治疗组和对照组的主要疗效终点和次要疗效终点为病人无进展生存时间、病人总生存时间和疼痛缓解情况,则步骤5中的疗效终点数据也为病人无进展生存时间、病人总生存时间和疼痛缓解情况。
在该实施例中,病人的实际情况如病人个人的治疗意愿(是选择药物治疗、手术治疗和放射治疗中的任意一种还是相互间的组合搭配)、病人自身的身体耐受程度等。
该实施例中,步骤5:将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,得出的数据可以通过数据可视化、表格展示等方式将分析结果清晰地呈现,如主要疗效终点-病人无进展生存时间可制作生存曲线图进行展示。
上述技术方案的有益效果是:本发明通过将机械学习算法应用到临床试验数据的快速比对中,将临床试验中得出的大量数据用于临床治疗方案分析比对模型的训练,之后通过将待治疗病人的基线数据和主治医生拟定若干种可行的治疗方案数据输入该临床治疗方案分析比对模型中,得出每种治疗方案对应的预测治疗结果,其中每种治疗方案对应的预测治疗结果通过该临床治疗方案分析比对模型输出的每种治疗方案对应的疗效终点数据得以体现;
采用机械学习算法进行临床试验数据的快速比对,机器学习算法不仅可以自动化地处理大量的临床试验数据,省去了传统手工或者半自动化分析方法的耗时、人力和成本,另外,传统的临床试验数据需要医生一个个对数据进行比对并通过比对得出最佳的治疗方案,医生需要处理和分析的数据量巨大,在比对过程中由于疲劳出错的概率也会大大增加,从而在一定程度上降低了医生的决策可靠性,本发明可以基于其自身的临床试验数据直接预测医生拟定的每种治疗方案的治疗结果,从而协助医生进行治疗方案的决策,为医生节省更多精力在治疗方案的分析上,极大的提高了医生决策的可靠性。
实施例2:
基于实施例1的基础上,如图2所示,步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型包括:
步骤30:基于主要疗效终点和次要疗效终点选择合适的比较方法;
步骤31:对参照数据集中缺失值和异常值进行处理,增加数据可信度,并对参照数据集进行数据隐私保护;
步骤32:将参照数据集划分为训练集和测试集,划分比例为2:1或3:1中的任意一种;
步骤33:通过选择的比较方法进行建模,并基于训练集进行临床治疗方案分析比对模型的训练,并基于测试集对临床治疗方案分析比对模型进行验证,最终形成训练好的临床治疗方案分析比对模型。
该实施例中,选择比较方法包括t检验、卡方检验、Cox回归分析、Kaplan-Meier生存曲线分析等,例如,对于主要疗效终点-病人无进展生存时间可以选择使用Kaplan-Meier生存曲线进行分析,或使用Cox回归分析方法观察影响因素,以及是否存在差异。
该实施例中,数据预处理包括针对缺失值和异常值进行自动剔除(如治疗组中若某个患者的某个治疗疗程数据缺失则将该患者的所有数据进行剔除、如研究组中某个患者的某个病历数据明显异常,则将该患者的所有数据进行剔除),从而增加数据可信度等,还可以对数据进行去噪、标准化(标准化差异性参数)、特征选择(减少特征及变量处理)、数据归一化、平滑化等操作。
该实施例中,例如对于主要疗效终点-病人无进展生存时间可以选择使用Kaplan-Meier进行建模,使用Cox回归模型比较治疗组和对照组之间的差异。
该实施例中,基于测试集对临床治疗方案分析比对模型进行验证时,可使用测试集进行存活曲线的绘制和差异性的计算来验证模型的有效性、可靠性及泛化能力。
该实施例中,关于隐私的保护除数据隐私保护外还可以通过控制临床治疗方案分析比对模型的访问权限达到对患者隐私保护的目的。
上述技术方案的有益效果是:对参照数据进行数据隐私保护保护患者的个人隐私,在数据对比过程中可反复进行步骤30到33:尝试使用不同的比较方法,比较不同的主要疗效终点和次要疗效终点,以获得更准确、可靠的结果。
实施例3:
基于实施例2的基础上,还包括:重复步骤30-步骤33,通过选择不同的比较方法进行建模,训练得到多个临床治疗方案分析比对模型,对多个临床治疗方案分析比对模型进行评估,选出最佳的临床治疗方案分析比对模型;
数据隐私保护的方法采用利用数据加密技术进行数据保护或采用差分隐私技术保护。
该实施例中,数据加密技术为选择合适的机密算法和加密密匙对参照数据集进行加密保护。
该实施例中,差分隐私技术保护是将对参照数据集的个人信息通过加噪的方式同化成群体的信息来保护个人隐私。
上述技术方案的有益效果是:通过重复步骤30-步骤33,通过选择不同的比较方法进行建模,训练得到多个临床治疗方案分析比对模型,对多个临床治疗方案分析比对模型进行评估,选出最佳的临床治疗方案分析比对模型可以极大的提高临床治疗方案分析比对模型的可靠性,数据隐私保护可保护病人和患者的个人隐私。
实施例4:
基于实施例1的基础上,如图3所示,步骤5还包括:
步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,主治医生根据修正提示对比对数据集进行修正,从而保证比对数据集的合理性;
步骤51:训练好的临床治疗方案分析比对模型对合理的比对数据集进行处理得出每种治疗方案对应的疗效终点数据;
步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数,并将综合评价指标系数排名最高的前三种治疗方案对应的疗效终点数据输出给主治医生;
步骤53:主治医生对输出的三种治疗方案对应的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案。
上述技术方案的有益效果是:在临床治疗方案分析比对模型对比对数据集进行正式分析之前先对其的合理性进行评估判断,可有效避免人为因素对输出结果的干扰,确保比对数据集的合理性,在主治医生拟定的众多治疗方案中经过评估选取排名前三的治疗方案对应的疗效终点数据输出给主治医生,而不是将其全部输出给主治医生,很大程度上减轻了医生的工作压力,增加了临床医学上数据比对的效率。
实施例5:
基于实施例4的基础上,步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,从而保证比对数据集的合理性,包括:
主治医生拟定的第N个可行的治疗方案对应第N个比对数据集,第N个比对数据集的合理性判断结果用表示;
若=0,则证明第N个比对数据集在合理范围内,对应的主治医生拟定的第N个可行的治疗方案合理;
若=-1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过大;
若=1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过小;
第N个比对数据集的合理性判断过程包括:
其中,表示第N个比对数据集的合理性判断结果,/>为采用第i种药物进行药物治疗的总疗程数,u为药物治疗时采用的药物的种类总数,/>为第i种药物的药物剂量数,/>为第i种药物单位药物剂量对应的疗效系数,e为自然数,取值为2.72,/>为药物治疗过程中第i种药物的预设药物剂量波动影响系数,/>为采用第i种手术进行手术治疗的总疗程数,v为手术治疗时采用的手术治疗的种类总数,/>为第i种手术的手术剂量数,为第i种手术单位手术剂量对应的疗效系数,/>为药物治疗过程中第i种手术的预设手术剂量波动影响系数,w为放射治疗的总疗程数,/>为第i个疗程放射治疗的剂量数,为单位放射治疗剂量对应的疗效系数,/>为基于患者年龄、患者性别、患者身高、患者体重得出的患者身体机能自愈能力评估系数,/>为主治医生拟定的第N个可行的治疗方案的预设疗效系数,/>为最小预设疗效边界系数,/>为最大预设疗效边界系数,/>表示第N个比对数据集的疗效表示系数。
其中,第N个比对数据集包括如下因素:患者年龄、患者性别、患者身高、患者体重、药物治疗方案、手术治疗方案和放射治疗方案;
药物治疗方案、手术治疗方案和放射治疗方案分别用A、B和C表示。
在该实施例中,治疗方案的疗效过大,证明该治疗方案会对患者造成过度治疗,可能会对患者的身体造成损伤或加速病情恶化等情况,治疗方案的疗效过小,证明该治疗方案不能达到彻底根除病情的效果。
在该实施例中,治疗方案可随意组合如只采用药物治疗和手术治疗、采用药物治疗和放射治疗、采用药物治疗、手术治疗结合放射治疗等。
在该实施例中,表示药物治疗方案的相关参数;
表示手术治疗的相关参数;
表示放射治疗的相关参数;
可根据实际治疗方案对进行调整,第N个治疗方案只包括药物治疗和放射治疗,则/>。
上述技术方案的有益效果是:通过对输入的每个比对数据集进行合理性判断,可剔除一些明显不合理的治疗方案,这些不合理的方案可能是由于主治医生个人的疏忽所致也可能是由于操作失误所致,通过对比对数据集合理性的判断可以及时提醒主治医生对数据集进行修正,避免其影响临床治疗方案分析比对模型的最终输出结果,提高临床治疗方案分析比对模型使用的安全性和可靠性,若=0,则证明第N个比对数据集在合理范围内,对应的主治医生拟定的第N个可行的治疗方案合理,若/>=-1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过大,此时可以提示医生对治疗方案重新进行调整避免过度治疗,若/>=1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过小,此时可以提示医生对治疗方案重新进行调整避免治疗效果不佳的情况;
在进行的计算时,考虑到了药物治疗过程中用药的种类、剂量数和对应的疗效系数,同时考虑到了药物在使用过程中的剂量的波动,考虑到了手术治疗过程中手术的种类、手术的剂量数和对应的疗效系数,同时考虑到了手术剂量的波动,基于患者年龄、患者性别、患者身高、患者体重考虑到了患者身体机能自愈能力评估系数,从而增加了计算结果的可靠性。
实施例6:
基于实施例4的基础上,步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数包括:
其中,为主治医生拟定的第N种治疗方案的综合评价指标系数,/>为第N种治疗方案得出的疗效终点数据中主要疗效终点在综合评价指标系数中占的比重,/>为第N种治疗方案得出的疗效终点数据中次要疗效终点在综合评价指标系数中占的比重,/>为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点对综合评价指标系数的影响因子,/>为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点在全部主要疗效终点数据中的重要性占比,/>表示第N种治疗方案得出的疗效终点数据中主要疗效终点的总个数,/>表示第N种治疗方案得出的疗效终点数据中次要疗效终点的总个数,/>为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点对综合评价指标系数的影响因子,/>为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点在全部次要疗效终点数据中的重要性占比。
在该实施例中,治疗方案的疗效终点数据包括主要疗效终点数据和次要疗效终点数据,其中主要疗效终点数据中又包含个主要疗效终点,次要疗效终点数据中包含/>个次要疗效终点;
如步骤1中主要疗效终点为病人无进展生存时间;次要疗效终点为病人总生存时间和疼痛缓解情况;
则步骤52中输出的主要疗效终点为病人无进展生存时间;次要疗效终点为病人总生存时间和疼痛缓解情况;此时=1,/>=2。
上述技术方案的有益效果是:通过对每种治疗方案的综合评价指标系数的计算最终比较每种治疗方案的综合评价指标系数的大小,可得出所有治疗方案中较优异的三种治疗方案,在计算过程中涉及到了每一个主要疗效终点和次要疗效终点的计算,从而保证了计算结果的可靠性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种临床试验数据的快速比对方法,其特征在于,包括以下步骤:
步骤1:确定临床试验数据评价指标,临床试验数据评价指标包括治疗组和对照组的主要疗效终点和次要疗效终点;
步骤2:收集和整理治疗组和对照组患者的病历数据作为参照数据集,参照数据集包括基线数据、治疗方案数据和疗效终点数据;
步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型;
步骤4:收集和整理待治疗病人的基线数据,并由主治医生拟定若干种可行的治疗方案数据,将待治疗病人的基线数据和主治医生拟定若干种可行的治疗方案数据作为比对数据集;
步骤5:将比对数据集输入训练好的临床治疗方案分析比对模型中,得出每种治疗方案对应的疗效终点数据,主治医生对得出的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案;
步骤1中主要疗效终点为病人无进展生存时间,即病情未恶化的持续时间,次要疗效终点包括病人总生存时间和疼痛缓解情况,病人总生存时间即从病情开始到病情结束病人的生存时间;步骤2和步骤5中的疗效终点数据包括主要疗效终点数据和次要疗效终点数据,其中主要疗效终点数据包括病人无进展生存时间,次要疗效终点数据包括病人总生存时间和疼痛缓解情况;
步骤3:基于参照数据集选择适宜的算法进行临床治疗方案分析比对模型的训练,最终形成训练好的临床治疗方案分析比对模型包括:
步骤30:基于主要疗效终点和次要疗效终点选择比较方法;
步骤31:对参照数据集中缺失值和异常值进行处理,增加数据可信度,并对对参照数据集进行数据隐私保护;
步骤32:将参照数据集划分为训练集和测试集,划分比例为2:1或3:1中的任意一种;
步骤33:通过选择的比较方法进行建模,并基于训练集进行临床治疗方案分析比对模型的训练,并基于测试集对临床治疗方案分析比对模型进行验证,最终形成训练好的临床治疗方案分析比对模型;
选择的比较方法包括t检验、卡方检验、Cox回归分析和Kaplan-Meier生存曲线分析;
步骤5还包括:
步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,主治医生根据修正提示对比对数据集进行修正,从而保证比对数据集的合理性;
步骤51:训练好的临床治疗方案分析比对模型对合理的比对数据集进行处理得出每种治疗方案对应的疗效终点数据;
步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数,并将综合评价指标系数排名最高的前三种治疗方案对应的疗效终点数据输出给主治医生;
步骤53:主治医生对输出的三种治疗方案对应的疗效终点数据进行分析,并结合病人的实际情况,选择合理的治疗方案;
步骤52:训练好的临床治疗方案分析比对模型基于每种治疗方案对应的疗效终点数据,计算每种治疗方案的综合评价指标系数包括:
其中,TN为主治医生拟定的第N种治疗方案的综合评价指标系数,αN1为第N种治疗方案得出的疗效终点数据中主要疗效终点在综合评价指标系数中占的比重,αN2为第N种治疗方案得出的疗效终点数据中次要疗效终点在综合评价指标系数中占的比重,ηNj为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点对综合评价指标系数的影响因子,ENj为第N种治疗方案对应的主要疗效终点数据中的第j个主要疗效终点在全部主要疗效终点数据中的重要性占比,mN表示第N种治疗方案得出的疗效终点数据中主要疗效终点的总个数,sN表示第N种治疗方案得出的疗效终点数据中次要疗效终点的总个数,μNk为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点对综合评价指标系数的影响因子,DNk为第N种治疗方案对应的次要疗效终点数据中的第k个次要疗效终点在全部次要疗效终点数据中的重要性占比。
2.如权利要求1所述的临床试验数据的快速比对方法,其特征在于,
基线数据为患者的年龄、性别、身高和体重中的任意一种或多种;
治疗方案数据为每次治疗的方式及其疗程数量以及每个疗程对应的剂量,每次治疗的方式包括药物治疗、手术治疗和放射治疗中的任意一种或多种;
疗效终点数据包括病人无进展生存时间、病人总生存时间和疼痛缓解情况。
3.如权利要求1所述的临床试验数据的快速比对方法,其特征在于,还包括:重复步骤30-步骤33,通过选择不同的比较方法进行建模,训练得到多个临床治疗方案分析比对模型,对多个临床治疗方案分析比对模型进行评估,选出最佳的临床治疗方案分析比对模型。
4.如权利要求1所述的临床试验数据的快速比对方法,其特征在于,数据隐私保护的方法采用利用数据加密技术进行数据保护或采用差分隐私技术保护。
5.如权利要求1所述的临床试验数据的快速比对方法,其特征在于,
步骤50:训练好的临床治疗方案分析比对模型对输入的比对数据集进行数据合理性判断,并对判断结果为不合理的比对数据集进行修正提示,从而保证比对数据集的合理性,包括:
主治医生拟定的第N个可行的治疗方案对应第N个比对数据集,第N个比对数据集的合理性判断结果用HN表示;
若HN=0,则证明第N个比对数据集在合理范围内,对应的主治医生拟定的第N个可行的治疗方案合理;
若HN=-1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过大;
若HN=1,则证明第N个比对数据集不在合理范围内,对应的主治医生拟定的第N个可行的治疗方案的疗效过小。
6.如权利要求5所述的临床试验数据的快速比对方法,其特征在于,第N个比对数据集的合理性判断过程包括:
其中,HN表示第N个比对数据集的合理性判断结果,YAi为采用第i种药物进行药物治疗的总疗程数,u为药物治疗时采用的药物的种类总数,XAi为第i种药物的药物剂量数,为第i种药物单位药物剂量对应的疗效系数,e为自然数,取值为2.72,/>为药物治疗过程中第i种药物的预设药物剂量波动影响系数,YBi为采用第i种手术进行手术治疗的总疗程数,v为手术治疗时采用的手术治疗的种类总数,XBi为第i种手术的手术剂量数,/>为第i种手术单位手术剂量对应的疗效系数,/>为药物治疗过程中第i种手术的预设手术剂量波动影响系数,w为放射治疗的总疗程数,XCi为第i个疗程放射治疗的剂量数,/>为单位放射治疗剂量对应的疗效系数,/>为基于患者年龄、患者性别、患者身高、患者体重得出的患者身体机能自愈能力评估系数,/>为主治医生拟定的第N个可行的治疗方案的预设疗效系数,/>为最小预设疗效边界系数,/>为最大预设疗效边界系数,/>表示第N个比对数据集的疗效表示系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310544046.9A CN116580797B (zh) | 2023-05-15 | 2023-05-15 | 一种临床试验数据的快速比对方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310544046.9A CN116580797B (zh) | 2023-05-15 | 2023-05-15 | 一种临床试验数据的快速比对方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116580797A CN116580797A (zh) | 2023-08-11 |
CN116580797B true CN116580797B (zh) | 2023-10-31 |
Family
ID=87540741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310544046.9A Active CN116580797B (zh) | 2023-05-15 | 2023-05-15 | 一种临床试验数据的快速比对方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116580797B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002051354A2 (en) * | 2000-12-26 | 2002-07-04 | Becker Robert E | Method for drug development using individual patient response |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 |
CN111210890A (zh) * | 2020-02-14 | 2020-05-29 | 成都木老仁康软件信息有限公司 | 一种基于临床数据的抗凝药学监护管理方法 |
CN115035969A (zh) * | 2022-05-31 | 2022-09-09 | 郑州佰科柏澍医学科技有限公司 | 一种中医诊断医疗器械的临床有效性和安全性评价方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2770834A4 (en) * | 2011-10-26 | 2015-11-25 | Chimerix Inc | HEXADECYLOXYPROPYL-CIDOFOVIR FOR THE TREATMENT OF DOUBLE-STRAND DNA VIRUS INFECTION |
US11270023B2 (en) * | 2017-05-22 | 2022-03-08 | International Business Machines Corporation | Anonymity assessment system |
-
2023
- 2023-05-15 CN CN202310544046.9A patent/CN116580797B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002051354A2 (en) * | 2000-12-26 | 2002-07-04 | Becker Robert E | Method for drug development using individual patient response |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 |
CN111210890A (zh) * | 2020-02-14 | 2020-05-29 | 成都木老仁康软件信息有限公司 | 一种基于临床数据的抗凝药学监护管理方法 |
CN115035969A (zh) * | 2022-05-31 | 2022-09-09 | 郑州佰科柏澍医学科技有限公司 | 一种中医诊断医疗器械的临床有效性和安全性评价方法 |
Non-Patent Citations (4)
Title |
---|
中医药治疗老年人社区获得性肺炎临床研究要点的思考;李建生;余学庆;;中华中医药杂志(第10期);2193-2198 * |
复脉定胶囊治疗室性早搏多中心、随机、双盲、阳性药与安慰剂双对照临床研究方案;王薇等;中西医结合心脑血管病杂志;第14卷(第18期);2094-2097 * |
对中药新药治疗糖尿病周围神经病临床疗效评价的思考;罗露露;唐健元;刘振杰;范冠杰;;中国中西医结合杂志(第08期);990-995 * |
慢性便秘治疗药物临床试验设计和评价考虑要点;林琳; 陈颖;中国临床药理学杂志;第38卷(第11期);1287-1292 * |
Also Published As
Publication number | Publication date |
---|---|
CN116580797A (zh) | 2023-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Boboridis et al. | Surgical orbital decompression for thyroid eye disease | |
Pratt | Meta-analysis in criminal justice and criminology: What it is, when it's useful, and what to watch out for | |
Saeedi et al. | Agreement and predictors of discordance of 6 visual field progression algorithms | |
van Veen et al. | Patient-perceived severity of synkinesis reduces quality of life in facial palsy: A cross-sectional analysis in 92 patients | |
Schmidt et al. | Interpreting PET scans by structured patient data: a data mining case study in dementia research | |
Chamberlin et al. | Skin conductance at 24 source (Yuan) acupoints in 8637 patients: influence of age, gender and time of day | |
Kowalski | Behavior within a clinical trial and implications for mammography guidelines | |
Chartogne et al. | Neuromuscular, psychological, and sleep predictors of cancer-related fatigue in cancer patients | |
CN116580797B (zh) | 一种临床试验数据的快速比对方法 | |
Damato | Legacy of the collaborative ocular melanoma study | |
Wu et al. | Efficacy and safety of acupuncture and moxibustion for primary tinnitus: a systematic review and meta-analysis | |
Aydın et al. | Lymphedema information and prevention practices of women after breast cancer surgery | |
Bhatia et al. | Effectiveness of progressive muscle relaxation therapy on physical symptoms among cancer patients receiving chemotherapy admitted in Cancer Unit of Institute of Liver and Biliary Sciences, Delhi | |
Bader et al. | Patterns of change in pain-related physical, mental, and social health outcomes in a military population | |
van Heugten | Apraxia in stroke patients: assessment and treatment | |
CN110675930A (zh) | 一种针对非小细胞肺癌的决策方法、系统及装置 | |
CN113707247B (zh) | 基于区块链的机器学习定量预测间充质干细胞疗法后软骨修复率的方法 | |
Poddighe et al. | Effects of soft tissue mobilisation on subacute adherent linear scars: A single-group intervention study | |
CN118072966A (zh) | 用于预测针刺治疗失眠症疗效的Relief-NDPGWO-WSVM分类模型的构建方法 | |
CN113674820B (zh) | 机器学习定量预测间充质干细胞疗法后软骨修复率的方法 | |
Lee et al. | Structural model of psychosocial adjustment for cancer patients in Korea | |
Achunair et al. | The role of artificial intelligence in treating musculoskeletal disorders | |
Khalil et al. | Nurses' Attitude, Practices and Barriers towards PainManagement of Elderly Patients with Cancer | |
Uysal et al. | Turkish adaptation of attention function index: A validity and reliability study | |
Finkelstein et al. | Data mining approaches to identify predictors of frequent malpractice claims against dentists |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |