CN112233809A - 一种分析个体治疗效果的亚群分析方法 - Google Patents

一种分析个体治疗效果的亚群分析方法 Download PDF

Info

Publication number
CN112233809A
CN112233809A CN202011063749.2A CN202011063749A CN112233809A CN 112233809 A CN112233809 A CN 112233809A CN 202011063749 A CN202011063749 A CN 202011063749A CN 112233809 A CN112233809 A CN 112233809A
Authority
CN
China
Prior art keywords
variable
algorithm
clustering
parameter
subgroup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011063749.2A
Other languages
English (en)
Other versions
CN112233809B (zh
Inventor
孙世权
宁津
孙茜放
周岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202011063749.2A priority Critical patent/CN112233809B/zh
Publication of CN112233809A publication Critical patent/CN112233809A/zh
Application granted granted Critical
Publication of CN112233809B publication Critical patent/CN112233809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明开发了一种分析个体治疗效果的亚群分析方法,其目的是在临床试验治疗效果评估阶段识别和描述亚群和个体成员的治疗效果,并通过亚群对治疗效果做出统计推断和说明。本发明包括提出了一种通过交替方向乘子法(ADMM)和期望最大化(EM)算法实现的协同监督聚类分析的方法。本发明提出的程序称为亚群分析的混合操作(HOSA),包括基于交替方向乘子法(ADMM)得到的良好性质的初值和基于初值的期望最大化(EM)算法得出相应估计的程序,并编制相应软件R包。该方法具有良好的计算速度和数值稳定性,可解释性和重现性,并为提出的聚类和推理程序建立了关键的理论性质。

Description

一种分析个体治疗效果的亚群分析方法
技术领域
本发明涉及临床试验技术领域,特别涉及一种分析个体治疗效果的亚群分析方法。
背景技术
医学研究依靠临床试验来评估治疗效果,验证性临床试验通常与标准治疗方法进行比较,其基本目的是提供关于新药的有效性和安全性的决定性证据。此类研究的结论通常被认为适用于整个研究人群。然而,随着生物和药理学的发展,一方面,个性化药物和靶向治疗越来越多,一种新药的治疗效果在研究人群中可能不一致;另一方面,从人群平均治疗水平看,临床试验的成功率非常低,据报道,从2000年到2015年的16年间,成功率只有5%左右。
精准医疗这一新兴领域正在将统计分析从群体平均治疗效果的经典范式转变为个人治疗效果的范式。这项新的科学任务要求采用适当的统计方法来评估回归分析中的异质协变效应。慢慢地,人们意识到亚群分析对于解释临床试验的结果至关重要。为了解决第三阶段大量临床试验失败的问题,研究是否在同一治疗组中存在一些患者会比同组其他患者体验到更强的治疗效果,这样的分析和评估患者亚群水平中治疗效果的异质性将有助于设计一项后续的确认性临床研究,使得该临床研究针对特定的患者亚群,而不是作为潜在药物使用者的一般人群。以下文献提供了可参考的对个体治疗效果进行分析和描述的亚群分析模型:
文献1.Burke JF,Sussman JB,Kent DM,and Hayward RA.Three simple rulesto ensure reasonably credible subgroup analyses.BMJ.2015,351:h5651;
文献2.Cuzick J.Forest plots and the interpretation of subgroups.TheLancet.2005,365:1308。
文献1应用贝叶斯规则来确定一个阳性亚群分析为真阳性的概率。并且从这个框架中,推导出三条简单的规则来确定亚群分析可以作为假设检验分析来执行的情形,从而告知什么情形下执行亚群分析能带来可靠的信息。文献2指出由于亚群数目较小,亚群对应的置信区间总是比总群体平均效应的置信区间宽;如果一个亚群的置信区间覆盖了无效果点,这被广泛地误解为在该群体缺少亚群结构。正确的方法是通过异质性检验来确定不同亚群的效果是否与主效应有显著差异。因此文献2提出一种修改森林图的方案,使得更容易看到子组置信区间是否与整体效应有显著差异,从而有助于解释子组效应。
以上文献所述方法主要存在以下问题:一方面,亚群分析方法目前是不完善、不统一的。例如,在大约三分之二的已发表的试验中,我们不清楚所报道的亚群分析是预先指定的还是事后指定的;在超过一半的试验中,不清楚是否使用了交互测试,在大约三分之一的试验中,内部水平的结果没有以一致的方式呈现;另一方面,亚群分析方法缺少可靠的统计方法和稳定的、速度高的数值计算方法做出估计和推断,因此很难在亚群结构中对个体治疗效果做出相应的识别和分析。
发明内容
为了克服以上技术问题,本发明的目的在于提供一种分析个体治疗效果的亚群分析方法,能够识别和描述亚群和个体成员的治疗效果,并通过亚群对治疗效果做出统计推断和说明,具有良好的计算速度和数值稳定性,可解释性和重现性,为提出的聚类和推理程序建立了基础。
为了实现上述目的,本发明采用的技术方案是:
一种分析个体治疗效果的亚群分析方法,包括:
步骤1:确定亚群数量:
通常根据先验的临床假设或分析的目标确定亚群数量K,分析所有的成员之间关系和结构,构建并识别不同亚群;
步骤2:提取表现变量∶
确定亚群数量后,提取表现变量,表现变量指用于表示不同疗效水平的变量,记为yi
步骤3:提取关联变量;
步骤4:建立统计学模型。
所述步骤3具体包含以下步骤:
第一步:确定关联变量,选择治疗水平相关联的、感兴趣的变量,分为四大类型:表现不同治疗的变量xi、对全部个体的在评估治疗效果时需要调整的潜在混杂变量Z0i、对各个亚群内的与该亚群平均疗效相关的变量Z1i、对全部个体的影响该个体对不同亚群的隶属度的变量Z2i,所述关联变量为连续变量或分类变量;
第二步:统计关联变量维数;为后续便于建立精确的统计模型,在确定关联变量之后自然的得到相应变量Z0i、Z1i和Z2i的维数,分别记为q0、q1和q2
所述步骤4包括以下步骤:
第一步:建立个人治疗水平的亚群模型,确定亚群数量、表现变量和关联变量后,整理n个患者的样本数据,对应建立以下模型;
Figure BDA0002713088520000041
Figure BDA0002713088520000042
其中
Figure BDA0002713088520000043
在上述模型中,δi∈{1,2,…,K}是一个分类变量,分别表示第i个样本属于第k个亚群,且对应事件的概率用πik表示,α、ζ1k和ζ2k分别为Z0i、Z1i和Z2i的线性系数,维数为q0、q1和q2
Figure BDA0002713088520000044
Figure BDA0002713088520000045
分别表示K个亚群内部的差异程度,∈i表示n个样本误差,
Figure BDA0002713088520000046
表示n个样本测量误差的差异程度;
第二步:确定待估计的参数,根据以上模型,确定待估计的参数为
Figure BDA0002713088520000047
所述步骤4的估计的参数具体为:
1、由ADMM算法估计稳定的初值,主要包括以下步骤:
(1)由ADMM算法估计η1i,估计参数η1i时,考虑优化目标函数;
Figure BDA0002713088520000048
其中各参数的含义是:
Figure BDA0002713088520000051
Z1i如前定义;如果病人i属于第k个亚群,那么
Figure BDA0002713088520000052
就表示ζ1k;n是实验中样本数量,即参与实验的病人总数;λ是待调节的参数;pγ是MCP惩罚函数。理论成果表明,选择适当的参数λ,ADMM算法在优化上述目标函数时展现了良好的收敛性并对参数η1i给出理想的估计;
(2)由聚类方法估计ζ1k,由上一步骤得到对参数η1i的估计后,由经典的聚类方法,通过K-means方法得到参数
Figure BDA0002713088520000053
作为EM算法中ζ1k的初值;
其中K均值聚类算法是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,聚类中心以及分配给它们的对象就代表一个聚类,每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算,这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类、没有(或最小数目)聚类中心再发生变化,或误差平方和局部最小;
2、由EM算法估计其余参数,在个体治疗水平的亚群分析模型中,为估计模型中各参数,采用最大似然估计方法,输入由ADMM算法及其聚类结果中得到的ζ1k的初值以及其余参数的设定的初值,经过有限多次迭代计算,EM-算法将给出对应参数的最终估计值;
其中,期望最大化算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量,最大期望算法经过两个步骤交替进行计算:
第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行直到满足某个终止条件。
3、通过子组对治疗效果进行统计推断,根据HOSA程序给出的结果,对试验组进行相应的统计推断;包括:
(1)HOSA结果给出如何的亚群结构,是否能确定各个个体的标签;
(2)HOSA结果有怎样的统计学意义,如何指导后续临床试验的设计和进行。
本发明通过建立统计学模型,根据统计学模型,通过ADMM算法估计稳定的初值,然后由EM算法估计其余参数,最终根据各参数估值结果做出统计推断。
本发明的有益效果:
提出了通过K个混合正态分布表现亚群结构的用于分析个体治疗水平的亚群分析模型,该模型具有良好的可解释性和重现性,对精准医疗和临床试验具有指导意义。
设计了子群分析的混合操作程序(HOSA),设计良好的优化目标并创造地利用交替方向乘子法(ADMM算法)计算最优解,并用期望-最大化算法(EM算法)给出后续参数估计。HOSA具有良好的计算速度和数值稳定性。
附图说明
图1为现实数据建立用于分析个体治疗效果的亚群分析模型流程图。
图2为现实数据中提取关联变量的流程图。
图3为由数据建立统计学模型的流程图。
图4为子群模型混合操作程序HOSA的流程图。
图5为用ADMM算法估计ζ1k初值的流程图。
图6为本实施例中亚群分析模型的HOSA计算结果图。
图7为一种鉴别临床试验疗效亚型分群的统计方法整体对应流程图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
第一方面,本发明提供了一种精准医疗领域内用于分析个体治疗水平的亚群分析模型。本实施例中,通过评估吡格列酮和格列齐特两种药物在治疗2型糖尿病患者中的亚组效应,我们进行了个体化治疗分析。实验数据来自Charbonnel等人,在为期52周的研究期间,共招募的1,270名2型糖尿病患者;随机将他们分为两个治疗组。本试验是一项多中心、随机对照、双盲、双假、平行组的比较试验,旨在评估吡格列酮与格列齐特在2型糖尿病患者中的长期疗效和安全性。
以下结合附图1-3,对本发明方法的各步骤详细描述:
实施例:
如图1所示,建立用于分析个体治疗水平的亚群分析模型,包括下述步骤:
S101.确定亚群数量
通常根据先验的临床假设或分析的目标确定亚群数量K。例如,本实施例中,为分析吡格列酮和格列齐特两种药物对2型糖尿病的疗效差异,选择K为3,即将全部患者分为三个亚群,分别对应表现出吡格列酮疗效优于格列齐特的亚群、与格列齐特相同的亚群和低于格列齐特的亚群。
S102.提取表现变量
确定亚群数量后,提取表现变量,表现变量指研究中用于表示不同疗效水平的变量,记为yi。例如,本实施例中,在不同治疗方案下、第52周测定的糖化血红蛋白降幅(d.HbA1C)即为表现变量。
S103.提取关联变量
如图2所示,提取关联变量包含以下步骤:
S201:确定关联变量
确定亚群数量和表现变量后,确定关联变量,关联变量指研究中与治疗水平相关联的、感兴趣的变量,大致分为四大类型:表现不同治疗的变量xi、对全部个体的在评估治疗效果时需要调整的潜在混杂变量Z0i、对各个亚群内的与该亚群平均疗效相关的变量Z1i、对全部个体的影响该个体对不同亚群的隶属度的变量Z2i。例如,本实施例中,选择类别变量xi体现不同治疗,xi=0表示使用格列齐特,xi=1表示使用吡格列酮;选择基准体重指数(BMI)和年龄(AGE)作为待研究的变量Z0i;选择在第0周测定的基准糖化血红蛋白水平(bA1C)作为待研究的Z1i;选择均在第0周测定的基准糖化血红蛋白(bA1C)和基准血糖水平(bpG)作为待研究的Z2i
S202:统计关联变量维数
为后续便于表示统计模型,在S201之后自然的得到Z0i、Z1i和Z2i的维数,分别记为q0、q1和q2
S104建立统计学模型
如图3所示,建立统计学模型,包含以下步骤:
S301.建立个人治疗水平的亚群模型。确定亚群数量、表现变量和关联变量后,整理n个患者的样本数据,对应建立以下模型,
Figure BDA0002713088520000091
Figure BDA0002713088520000092
其中
Figure BDA0002713088520000093
在上述模型中,δi∈1,2,…,K是一个分类变量,分别表示第i个样本属于第k个亚群,且对应事件的概率用πik表示。α、ζ1k和ζ2k分别为Z0i、Z1i和Z2i的线性系数,维数为q0、q1和q2
Figure BDA0002713088520000094
Figure BDA0002713088520000095
分别表示K个亚群内部的差异程度。
Figure BDA0002713088520000096
表示n个样本测量误差的差异程度。
在本实施例中,具体模型如下:
Figure BDA0002713088520000097
其中
Figure BDA0002713088520000098
且有logit(πik)=ζ2k,12k,2bA1Ci2k,3bPGi
S302.确定待估计的参数。根据以上模型,确定待估计的参数为
Figure BDA0002713088520000101
估计S302中的参数的程序,根据附图4-5,各步骤详细描述如下:
S401.由ADMM算法估计稳定的初值。根据附图5,用ADMM算法确定稳定的初值主要包括以下步骤:
S501由ADMM算法估计η1i。估计参数η1i时,考虑优化目标函数
Figure BDA0002713088520000102
其中pγ是MCP惩罚函数。理论成果表明,选择适当的参数λ,ADMM算法在优化上述目标函数时展现了良好的收敛性并对参数η1i给出理想的估计。
S502由聚类方法估计ζ1k。由S501得到对参数η1i的估计后,由经典的聚类方法,如K-means方法得到参数
Figure BDA0002713088520000103
作为EM算法中ζ1k的初值。
S402.由EM算法估计其余参数。在个体治疗水平的亚群分析模型中,为估计S302中各参数,本发明采用最大似然估计方法。EM-算法在计算参数和潜在参数的最大似然估计方面展现了良好的性能。输入S502中得到的ζ1k的初值以及其余参数的设定的初值,经过有限多次迭代计算,EM-算法将给出对应参数的最终估计值。在本实施例中,HOSA程序对各参数的估计值结果如图6所示。
S403.通过子组对治疗效果进行统计推断。根据HOSA程序给出的结果,对试验组进行相应的统计推断。例如,在本实施例中,结合各参数和统计学理论,HOSA证实服用吡格列酮的实验人群中确实存在疗效优于格列齐特、与格列齐特等疗效和疗效低于格列齐特的亚群结构。进一步,对于吡格列酮疗效较差的亚组,根据ζ11,2对应的p值为0.993可知,该亚组疗效水平与个人的基准糖化血红蛋白水平(bA1C)无关;对于等疗效的亚组,根据ζ12,2对应的p值小于0.001可知,组内个人效应的变化可以用基准糖化血红蛋白水平(bA1C)的函数来解释;对于疗效较好的亚组,组内疗效平均水平及其与基准糖化血红蛋白水平(bA1C)的关系是个体治疗效果亚组变化的驱动因素。
如图7所示:一种分析个体治疗效果的亚群分析系统,包括建立统计学模型,根据统计学模型,通过ADMM算法估计稳定的初值,然后由EM算法估计其余参数,最终根据各参数估值结果做出统计推断。
本发明在于识别和描述亚群和个体成员的治疗效果,并通过亚群对治疗效果做出统计推断和说明,为达到上述目的,本发明提出了一种通过交替方向乘子法(ADMM)和期望最大化(EM)算法实现的协同监督聚类分析的方法。本发明提出的程序称为子群分析的混合操作(HOSA),具有良好的计算速度和数值稳定性,可解释性和重现性,为提出的聚类和推理程序建立了关键的理论性质。

Claims (5)

1.一种分析个体治疗效果的亚群分析方法,其特征在于,包括:
步骤1:确定亚群数量:
通常根据先验的临床假设或分析的目标确定亚群数量K,分析所有的成员之间关系和结构,构建并识别不同亚群;
步骤2:提取表现变量:
确定亚群数量后,提取表现变量,表现变量指用于表示不同疗效水平的变量,记为yi
步骤3:提取关联变量;
步骤4:建立统计学模型。
2.根据权利要求1所述的一种分析个体治疗效果的亚群分析方法,其特征在于,所述步骤3具体包含以下步骤:
第一步:确定关联变量,选择治疗水平相关联的、感兴趣的变量,分为四大类型:表现不同治疗的变量xi、对全部个体的在评估治疗效果时需要调整的潜在混杂变量Z0i、对各个亚群内的与该亚群平均疗效相关的变量Z1i、对全部个体的影响该个体对不同亚群的隶属度的变量Z2i,所述关联变量为连续变量或分类变量;
第二步:统计关联变量维数;为后续便于建立精确的统计模型,在确定关联变量之后自然的得到相应变量Z0i、Z1i和Z2i的维数,分别记为q0、q1和q2
3.根据权利要求1所述的一种分析个体治疗效果的亚群分析方法,其特征在于,所述步骤4包括以下步骤:
第一步:建立个人治疗水平的亚群模型,确定亚群数量、表现变量和关联变量后,整理n个患者的样本数据,对应建立以下模型,
Figure FDA0002713088510000021
Figure FDA0002713088510000022
其中
Figure FDA0002713088510000023
在上述模型中,δi∈{1,2,…,K}是一个分类变量,分别表示第i个样本属于第k个亚群,且对应事件的概率用πik表示,α、ζ1k和ζ2k分别为Z0i、Z1i和Z2i的线性系数,维数为q0、q1和q2
Figure FDA0002713088510000024
Figure FDA0002713088510000025
分别表示K个亚群内部的差异程度,∈i表示n个样本误差,
Figure FDA0002713088510000026
表示n个样本测量误差的差异程度;
第二步:确定待估计的参数,根据以上模型,确定待估计的参数为
Figure FDA0002713088510000027
4.根据权利要求1所述的一种分析个体治疗效果的亚群分析方法,其特征在于,所述步骤4的估计的参数具体为:
1、由ADMM算法估计稳定的初值,主要包括以下步骤:
(1)由ADMM算法估计η1i,估计参数η1i时,考虑优化目标函数;
Figure FDA0002713088510000028
其中各参数的含义是:
Figure FDA0002713088510000029
Z1i如前定义;如果病人i属于第k个亚群,那么
Figure FDA00027130885100000210
就表示ζ1k;n是实验中样本数量,即参与实验的病人总数;λ是待调节的参数;pγ是MCP惩罚函数。理论成果表明,选择适当的参数λ,ADMM算法在优化上述目标函数时展现了良好的收敛性并对参数η1i给出理想的估计;
(2)由聚类方法估计ζ1k,由上一步骤得到对参数η1i的估计后,由经典的聚类方法,通过K-means方法得到参数
Figure FDA0002713088510000031
作为EM算法中ζ1k的初值;
其中K均值聚类算法是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,聚类中心以及分配给它们的对象就代表一个聚类,每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算,这个过程将不断重复直到满足某个终止条件,终止条件是没有(或最小数目)对象被重新分配给不同的聚类、没有聚类中心再发生变化,或误差平方和局部最小;
2、由EM算法估计其余参数,在个体治疗水平的亚群分析模型中,为估计模型中各参数,采用最大似然估计方法,输入由ADMM算法及其聚类结果中得到的ζ1k的初值以及其余参数的设定的初值,经过有限多次迭代计算,EM-算法将给出对应参数的最终估计值;
其中,期望最大化算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量,最大期望算法经过两个步骤交替进行计算:
第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值,M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行直到满足某个终止条件;
3、通过子组对治疗效果进行统计推断,根据HOSA程序给出的结果,对试验组进行相应的统计推断;包括:
(1)HOSA结果给出如何的亚群结构,是否能确定各个个体的标签;
(2)HOSA结果有怎样的统计学意义,如何指导后续临床试验的设计和进行。
5.一种分析个体治疗效果的亚群分析系统,其特征在于,包括建立统计学模型,根据统计学模型,通过ADMM算法估计稳定的初值,然后由EM算法估计其余参数,最终根据各参数估值结果做出统计推断。
CN202011063749.2A 2020-09-30 2020-09-30 一种分析个体治疗效果的亚群分析方法 Active CN112233809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011063749.2A CN112233809B (zh) 2020-09-30 2020-09-30 一种分析个体治疗效果的亚群分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011063749.2A CN112233809B (zh) 2020-09-30 2020-09-30 一种分析个体治疗效果的亚群分析方法

Publications (2)

Publication Number Publication Date
CN112233809A true CN112233809A (zh) 2021-01-15
CN112233809B CN112233809B (zh) 2023-08-01

Family

ID=74121093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011063749.2A Active CN112233809B (zh) 2020-09-30 2020-09-30 一种分析个体治疗效果的亚群分析方法

Country Status (1)

Country Link
CN (1) CN112233809B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112735542A (zh) * 2021-01-18 2021-04-30 北京大学 基于临床试验数据的数据处理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107251028A (zh) * 2014-12-18 2017-10-13 弗雷塞尼斯医疗保健控股公司 进行计算机模拟临床试验的系统和方法
US20170299595A1 (en) * 2014-09-26 2017-10-19 The Regents Of The University Of California Method of assessing disease condition of cancer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170299595A1 (en) * 2014-09-26 2017-10-19 The Regents Of The University Of California Method of assessing disease condition of cancer
CN107407626A (zh) * 2014-09-26 2017-11-28 加利福尼亚大学董事会 评估癌症的疾病状况的方法
CN107251028A (zh) * 2014-12-18 2017-10-13 弗雷塞尼斯医疗保健控股公司 进行计算机模拟临床试验的系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SUN SHIQUAN ET AL.: "a classification of alternatively spliced cassette exons using adaboost-based algorithm", 2014 IEEE INTERNATIONAL CONFERENCE ON INFORMATION AND AUTOMATION, pages 370 - 375 *
仝晓云: "交互Lasso模型及改进ADMM算法研究", 中国优秀硕士学位论文全文数据库信息科技辑, no. 1, pages 138 - 11 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112735542A (zh) * 2021-01-18 2021-04-30 北京大学 基于临床试验数据的数据处理方法及系统
CN112735542B (zh) * 2021-01-18 2023-08-22 北京大学 基于临床试验数据的数据处理方法及系统

Also Published As

Publication number Publication date
CN112233809B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
Orellana et al. Dynamic regime marginal structural mean models for estimation of optimal dynamic treatment regimes, part I: main content
AU2006210430B2 (en) Method for defining virtual patient populations
Harder et al. Propensity score techniques and the assessment of measured covariate balance to test causal associations in psychological research.
Meyer et al. Industrial methodology for process verification in research (IMPROVER): toward systems biology verification
US20080294692A1 (en) Synthetic Events For Real Time Patient Analysis
CA2542460A1 (en) Method for predicting the onset or change of a medical condition
WO2021114624A1 (zh) 基于人工智能的用药推荐方法、装置、设备及存储介质
JP2001508573A (ja) 治療結果を予測する方法および装置
Buri et al. Unbiased recursive partitioning enables robust and reliable outcome prediction in acute spinal cord injury
Salgado et al. Mixed fuzzy clustering for misaligned time series
WO2022106074A1 (en) Method and system for quantifying cellular activity from high throughput sequencing data
Luo et al. Improvement of APACHE II score system for disease severity based on XGBoost algorithm
Eyvazlou et al. Prediction of metabolic syndrome based on sleep and work-related risk factors using an artificial neural network
CN116864139A (zh) 疾病风险评估方法、装置、计算机设备及可读存储介质
CN112233809A (zh) 一种分析个体治疗效果的亚群分析方法
Sudharson et al. Enhancing the Efficiency of Lung Disease Prediction using CatBoost and Expectation Maximization Algorithms
Cheong et al. Towards gender fairness for mental health prediction
Patnaik Intelligent Decision Support System in Healthcare using Machine Learning Models
Zhang et al. Identifying the predictors of severe psychological distress by auto-machine learning methods
Guerra et al. Model selection for clustering of pharmacokinetic responses
Ferrato Predicting Outcomes for Rare Diseases Using Machine Learning Techniques
Huber Identification of biomarker-defined populations in precision medicine
Dickhaus False discovery rate and asymptotics
Milton MS Statistical Concepts in Clinical Research
Shen et al. A quantitative quality control method of big data in cancer patients using artificial neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant