CN104091094A - Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 - Google Patents
Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 Download PDFInfo
- Publication number
- CN104091094A CN104091094A CN201410376311.8A CN201410376311A CN104091094A CN 104091094 A CN104091094 A CN 104091094A CN 201410376311 A CN201410376311 A CN 201410376311A CN 104091094 A CN104091094 A CN 104091094A
- Authority
- CN
- China
- Prior art keywords
- missing
- meta
- data
- mcmc
- meta analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特点是:以贝叶斯概率论为基点,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规Meta分析中缺失数据集的一体化整合。该方法可最大程度的拟合缺失数据,以尽可能地保证提取数据的完整性和后续标准统计的可行性,显著提升Meta分析的统计检验效能,增强系统评价结果的稳健性和可靠性,增强对系统综述评价的科学性和全面性。
Description
技术领域
本发明涉及医学统计学领域,尤其涉及一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法。
背景技术
在生物医学领域,Meta分析是对具有相同研究目的的多个独立小样本的临床试验及基础实验研究的结果进行系统分析和定量综合,以提高统计检验的效能和增加效应值估计的精确度,解决各研究结果的不一致性以及寻求新的假说。Meta分析在临床诊断技术准确性的评估和优选、临床治疗效果的评价和优化、病因学因果关联的评估、疾病预防干预的评价、疾病防治的成本效益分析、卫生经济学研究、卫生服务评价、卫生决策及卫生管理评价中有着广泛而深刻的应用价值,有助于将有限的医疗资源更为合理地运用在那些已经在适当设计的评估中表现出有效的卫生健康服务的方式上。
在Meta分析中,对纳入的独立小样本的临床试验及基础实验研究进行数据提取及分析过程中,因个别临床研究在采集、填写、录入等过程中的随机因素或人为因素,往往有部分数据的删失以至于不能提取到需要研究的全部相关数据。缺失数据对Meta分析的统计和研究推论往往造成不利影响:由于受试者部分数据的缺失,使得受试者的数据在统计分析时无效或不可靠,以致有效样本量减少,继而导致临床结果的可靠性难以得到保障和研究结论出现偏差。当前对于研究数据的缺失,常规采取联系其研究的原作者,以索取更为详细的相关资料和数据,但是因为研究发表的年代差距因素或者实验本身的局限性因素等诸多因素,缺失的数据往往未能得以完好的补充;有时在联系原作者索取未果情况下,不得已要将有缺失数据的某研究排除。尤其当完全观测数据和不完全观测数据存在系统差异时,常规处理方法得到的结果通常不能代表整体,这样可增大Meta分析的统计方差,降低检验效能,影响系统评价的稳定性和可信度,降低评估的精确性和损耗随机化的效果,以致作出偏倚性结论,无法得到科学合理的解释。
发明内容
本发明主要目的在于提供一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特征在于以贝叶斯概率论为基点,以马尔可夫蒙特卡洛(Markov Chain Monte Carlo algorithm,MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规Meta分析中数据提取缺失的一体化整合。在Meta分析对数据提取的过程中,基于Meta分析数据缺失状态下的假设,以贝叶斯理论为原理,以缺失值处理分析为解决策略,以缺失的定量及等级资料为填充对象,以马尔可夫蒙特卡洛随机模拟方法为导向,以多重填补法作为缺失数据处理与模型的契合点,最大程度的拟合缺失数据集,弥补纳入研究数据缺失的不足,以尽可能地保证提取数据的完整性和后续标准统计的可行性,显著提升Meta分析的统计检验效能,增强系统评价结果的稳健性和可靠性,避免了在Meta分析中独立研究因数据缺失而被排除的局限性,增强对系统综述评价的科学性和全面性。
本发明的有益效果为:Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,有效论证了缺失值处理在Meta分析数据缺失状态下应用的可行性,强化了马尔可夫蒙特卡洛随机模拟方法在多重填补缺失处理中应用,也开创了在Meta分析数据缺失状态下缺失值处理的先例。缺失值处理在Meta分析的数据处理中的应用,最大程度的保证提取数据的完整性,能够解决有缺失数据资料中相对普遍的问题,尤其当数据呈任意缺失模式时,可以运用MCMC模型来处理复杂的数据缺失问题,提高统计效率;还可有效避免均值填充法易使变量分布扭曲,使替代后的分布更接近真值。该方法是对缺失处理在循证医学领域的拓展和创新,也是对现有Meta分析的发展和完善,有利于使Meta分析更加科学规范化、精确具体化和综合全面化。
附图说明
附图1为本发明的一种实施例的示意图。
具体实施方式
本发明的具体方法由以下实施例及其附图1给出。
附图1是根据本发明提出的Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法的流程图。下面结合图1详细说明依据本发明提出的具体方法。
(1) 马尔可夫蒙特卡洛(MCMC)导向的多重填补法主要包括3个关键步骤:分别是对目标估计量的估计(即对研究变量的某种估计),嵌入借补值、创建完全数据集(即主要完成对借补值的估计),以及合并对目标估计量的估计结果。其中,对缺失数据的借补值的估计正是目标估计量的估计的关键所在。
(2)从贝叶斯概率论出发,多重填补用Ymis的后验预测分布表征Ymis的相关信息,MCMC 方法可借助马尔可夫链构造或者模拟该后验分布。应用 MCMC方法构造一个有效的马尔可夫链, 从而获得对该概率分布伪随机抽样。根据给定的参数θ初始值θ(0)及Yobs,多次迭代得到马氏链(Y(1) mis,θ(1)),(Y(2) mis,θ(2)),…,(Y(k) mis,θ(k)),…。从马氏链中可抽得一个数据扩充链Y(k) mis,Y(2k) mis,Y(3k) mis,…,Y(nk) mis…。可从数据扩充链中得到Ymis,当k足够大时马氏链在(Ymis,θ | Yobs)处收敛,并且得到邻近的、相互独立的两个借补值。
(3)当预处理服从多元正态分布的数据时,MCMC 须进行以下三步:
初始值:计算已有观测数据的均值与协方差矩阵,以便估计参数的后验分布;I-步:依据Yobs与既定Ymis分布进行伪随机抽样,从中逐次收集借补值;P-步:根据Yobs与缺失数据借补值Y(k+1) mis求得θ(k+1)。
(4)多重借补的有限次借补:在理想状态下,重复借补理论认为,无限次的借补时,该估计的均值正是对缺失数据的估计。基于论证有限次借补公式RE=1/(1+λ/m)为有限次借补时相对效率,MI的高效估计与借补的数量、缺失数据的比率之间关系密切。优良的估计参数还要求尽可能小的标准误估计、尽量窄的置信区间等。实践中, 良好的置信区间与假设检验均需要进行一定数量的借补,那么允许的条件下应用多重填补法处理数据时应进行10次或者更多次的借补。
Claims (2)
1.一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特征在于,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规Meta分析中缺失数据集的一体化整合。
2.如权利要求1所述的一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,特征在于,在Meta分析对纳入研究的数据提取的过程中,基于Meta分析数据缺失状态下的假设,以贝叶斯概率论为基点,以缺失值处理分析为解决策略,以缺失的定量及等级资料为填充对象,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,以多重填补作为缺失数据处理与模型的契合点,以尽可能最大程度的拟合Meta分析缺失数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410376311.8A CN104091094A (zh) | 2014-08-03 | 2014-08-03 | Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410376311.8A CN104091094A (zh) | 2014-08-03 | 2014-08-03 | Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104091094A true CN104091094A (zh) | 2014-10-08 |
Family
ID=51638810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410376311.8A Pending CN104091094A (zh) | 2014-08-03 | 2014-08-03 | Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104091094A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107357982A (zh) * | 2017-06-30 | 2017-11-17 | 华北水利水电大学 | 一种水沙系列数据缺失借补方法 |
CN107368543A (zh) * | 2017-06-28 | 2017-11-21 | 国网辽宁省电力有限公司 | 一种基于mcmc算法的电力采集数据修复方法 |
CN112613192A (zh) * | 2021-01-04 | 2021-04-06 | 湘潭大学 | 基于探索性因子分析的电源设计能力测量方法 |
CN112784744A (zh) * | 2021-01-22 | 2021-05-11 | 北京航空航天大学 | 一种具有缺失值的机械构件振动信号预处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073746A (ja) * | 2000-08-30 | 2002-03-12 | Honda Motor Co Ltd | 部品在庫管理における需要予測方法 |
CN103310105A (zh) * | 2013-06-13 | 2013-09-18 | 浙江加州国际纳米技术研究院绍兴分院 | 筛选非小细胞肺癌治疗疗效生物标记物的方法 |
-
2014
- 2014-08-03 CN CN201410376311.8A patent/CN104091094A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073746A (ja) * | 2000-08-30 | 2002-03-12 | Honda Motor Co Ltd | 部品在庫管理における需要予測方法 |
CN103310105A (zh) * | 2013-06-13 | 2013-09-18 | 浙江加州国际纳米技术研究院绍兴分院 | 筛选非小细胞肺癌治疗疗效生物标记物的方法 |
Non-Patent Citations (4)
Title |
---|
孙鑫等: "使用个体病例数据进行Meta分析评价医疗干预措施的效果", 《中国循证医学杂志》 * |
廖炜圻: "多处理因素meta分析与间接比较的模拟研究", 《中国优秀硕士学位论文全文数据库》 * |
茅群霞等: "多重填补法Markov Chain Monte Carlo模型在有缺失值的妇幼卫生纵向数据中的应用", 《四川大学学报(医学版)》 * |
赵飞等: "疾病监测资料中缺失值最佳填充次数的研究", 《中国卫生统计》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368543A (zh) * | 2017-06-28 | 2017-11-21 | 国网辽宁省电力有限公司 | 一种基于mcmc算法的电力采集数据修复方法 |
CN107368543B (zh) * | 2017-06-28 | 2021-10-22 | 国网辽宁省电力有限公司 | 一种基于mcmc算法的电力采集数据修复方法 |
CN107357982A (zh) * | 2017-06-30 | 2017-11-17 | 华北水利水电大学 | 一种水沙系列数据缺失借补方法 |
CN107357982B (zh) * | 2017-06-30 | 2020-08-04 | 华北水利水电大学 | 一种水沙系列数据缺失借补方法 |
CN112613192A (zh) * | 2021-01-04 | 2021-04-06 | 湘潭大学 | 基于探索性因子分析的电源设计能力测量方法 |
CN112784744A (zh) * | 2021-01-22 | 2021-05-11 | 北京航空航天大学 | 一种具有缺失值的机械构件振动信号预处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mirams et al. | Prediction of thorough QT study results using action potential simulations based on ion channel screens | |
Atkins et al. | Assessing clinical significance: Does it matter which method we use? | |
Yuan et al. | Bayesian mediation analysis. | |
Huang et al. | On mining clinical pathway patterns from medical behaviors | |
Peng et al. | Cure models | |
CN105653846A (zh) | 基于集成的相似性度量和双向随机游走的药物重定位方法 | |
CN104091094A (zh) | Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法 | |
Jirsa et al. | Personalised virtual brain models in epilepsy | |
Craven et al. | Efficient argumentation for medical decision-making | |
Poon et al. | A novel approach in discovering significant interactions from TCM patient prescription data | |
Erisoglu et al. | Pak. j. statist. 2012 vol. 28 (1), 115-130 mixture model approach to the analysis of heterogeneous survival data | |
Karuppiah Ramachandran et al. | Towards an online seizure advisory system—an adaptive seizure prediction framework using active learning heuristics | |
Xu et al. | Semi-parametric joint modeling of survival and longitudinal data: the r package JSM | |
Tan et al. | A case study of model‐based Bayesian dose response estimation | |
Spreafico et al. | Functional modeling of recurrent events on time‐to‐event processes | |
Fucci et al. | Impact of process conformance on the effects of test-driven development | |
CN104268144A (zh) | 一种电子病历查询语句的构造方法 | |
Lambri et al. | Multicentric evaluation of a machine learning model to streamline the radiotherapy patient specific quality assurance process | |
Wang et al. | Virtual Epileptic Patient (VEP): Data-driven probabilistic personalized brain modeling in drug-resistant epilepsy | |
Metaxas et al. | AITION: A scalable KDD platform for Big Data Healthcare | |
Sadeghifar et al. | The application of Poisson hidden Markov model to forecasting new cases of congenital hypothyroidism in Khuzestan province | |
CN113707247B (zh) | 基于区块链的机器学习定量预测间充质干细胞疗法后软骨修复率的方法 | |
WO2012142076A1 (en) | System and method for monitoring glucose or other compositions in an individual | |
Barrett | Modeling and simulation in pediatric research and development | |
Sükei et al. | Continuous Assessment of Function and Disability via Mobile Sensing: Real-World Data-Driven Feasibility Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141008 |