CN108804494A - 一种药品不良反应信号检测中最小化数据遮蔽效应的方法 - Google Patents

一种药品不良反应信号检测中最小化数据遮蔽效应的方法 Download PDF

Info

Publication number
CN108804494A
CN108804494A CN201810275118.3A CN201810275118A CN108804494A CN 108804494 A CN108804494 A CN 108804494A CN 201810275118 A CN201810275118 A CN 201810275118A CN 108804494 A CN108804494 A CN 108804494A
Authority
CN
China
Prior art keywords
data
signal
adr
detection
subsample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810275118.3A
Other languages
English (en)
Other versions
CN108804494B (zh
Inventor
魏建香
刘美含
倪菲
郭林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810275118.3A priority Critical patent/CN108804494B/zh
Publication of CN108804494A publication Critical patent/CN108804494A/zh
Application granted granted Critical
Publication of CN108804494B publication Critical patent/CN108804494B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种药品不良反应信号检测中最小化数据遮蔽效应的方法,所述方法以中国药品不良反应(ADR)报告数据为基础,研究药品不良反应信号检测中最小化数据遮蔽效应的问题,设计了基于标准库的检测指标并提出了适应于中国最小化数据遮蔽效应的策略,以MHRA检测方法来比较不同子样本之间ADR数据信号检测的差异性,最终给出了实现药品不良反应信号检测时最小化数据遮蔽效应的数据移除策略。本发明为中国药品不良反应报告进行信号检测时最小化数据遮蔽效应提供了一种可参考方法。

Description

一种药品不良反应信号检测中最小化数据遮蔽效应的方法
技术领域
本发明属于信号检测领域,具体涉及一种用于我国药品不良反应信号检测中最小化数据遮蔽效应的方法。
背景技术
目前国际上主要采用报告移除法、分层法、Lasso Logistic回归法等,这些方法并不适用于我国药品不良反应(ADR,Adverse Drug Reaction)报告数据的特点。目前,我国药品不良反应信号检测中有关数据遮蔽效应的问题主要包括:
(1)我国自发呈报系统中报告组合形式多样,潜在着报告数量过多的组合,导致许多重要的信号被遮蔽,从而影响信号检测的及时性与准确性;
(2)国外的最小化数据遮蔽效应方法都集中在某一种药物或一类药物上,数据遮蔽效应并没有从整体上改善。
发明内容
解决的技术问题:本发明从对国际主流的信号消除方法在我国ADR数据中的应用结果的分析入手,通过对移除不同数量的数据后的数据库进行遮蔽率的性能评估,并将此方法用于药品不良反应数据中以检验效果。
技术方案:一种药品不良反应信号检测中最小化数据遮蔽效应的方法,所述方法包括以下步骤:
1)数据的采集与处理:数据的采集包括原始ADR数据的采集和标准库的采集;数据的处理包括对所述原始ADR数据按照不良反应组合出现的频率从高到低排序,标记为总样本,并从所述总样本中删除前百分之i的数据后得到新数据集,标记为子样本;
2)数据的信号检测:通过ADR信号检测方法对所述子样本进行信号检测;
3)基于标准库设计多个决策指标来判断所述不同子样本之间信号检测的差异性,利用查全率R、查准率P和F指标作为数据移除百分比的决策指标,利用收益率指标BR作为遮蔽效应消除的性能评价指标,具体如下;
301)设计基于标准库的四格表:用标准库中药品-不良反应组合对所述总样本和子样本的检测结果进行标注,若该组合出现在标准库中,则标注为1,否则标注为0;
所述四格表中的元素分别为a(a1)、b(b1)、c(c1)和d(d1);其中,a代表总样本与子样本检出均为阳性信号的ADR组合数;b代表总样本检出为阳性信号,子样本检出为阴性信号的ADR组合数;c代表总样本检出为阴性信号,子样本检出为阳性信号的ADR组合数;d代表总样本和子样本检出均为阴性信号的ADR组合数;a1、b1、c1和d1分别表示a、b、c和d中出现在标准库中的ADR组合数;
302)所述检测指标查全率R,由公式1表示,
303)所述检测指标查准率P,由公式2表示,
304)所述检测指标F,由公式3表示,
F指标为P和R的简单调和平均数,当F指标达到最大值时,查准率和查全率保持相对平衡,数据遮蔽效应消除性能最好;
305)所述检测指标收益率BR,由公式4表示,
其中,分母表示在不同数据库中已知信号的综合,分子表示两个数据库中已知信号的差异;BR值表示子样本已知信号的收益率,不良反应BR值越大,表明数据遮蔽消除性能越好。
优选的,所述原始ADR数据从国家药品不良反应监测中心获得;所述标准库是通过网络采集相关药物的说明书、国家食品药品监督管理局发布的各期药品不良反应信息通报以及药物警戒快讯和各种法规文件建立的ADR已知库。
优选的,所述步骤1)中的不良反应为急性肾衰竭、皮肤脱落、晕厥、白细胞减少和抽搐。
优选的,所述步骤1)中i的取值为0、1、2、3、4、5、6、7、8、9或10。
优选的,所述步骤2)中的ADR信号检测方法为基于不对称测定原理的MHRA方法。
有益效果:本发明以中国ADR报告数据为基础,研究药品不良反应信号检测中数据遮蔽效应的消除问题,提出了适应于中国数据库遮蔽效应最小化方法,并定义了检验指标,最终形成的建议为:将ADR数据库中的数据按照药品不良反应组合数降序排列并删除前6%数据时,遮蔽效应将得到最好的消除。
附图说明
图1为数据移除流程;
图2为随着i的变化子样本的P值和R值变化趋势图;
图3为随着i的变化子样本的F值变化趋势图;
图4为随着i的变化子样本的BR值变化趋势图;
图5为不同子样本的已知信号占比;
图6为实施例1中五种不良反应的BR值。
具体实施方式
下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
实施例1
1ADR监测数据分析与选择
1.1数据集的选取和处理
选取2010年1月1日和2011年12月31日之间的不良反应报告,共1,771,304条,其中包括34,757个不良反应,1,546个药物以及632个药品不良反应组合,不良反应占总数据库的36.31%。由MHRA方法检测出来的信号有14,100个,其中6,314个在标准数据库中出现,占比44.78%。也就是说,有55.22%的数据被遮蔽了。
1.2不良反应的选取
为了验证实验的有效性,选择了五种典型的涉及不同系统或器官的严重不良反应进行实验测试。它们是急性肾衰竭,皮肤剥落、晕厥、白细胞减少和抽搐。它们所涉及的系统如表1所示:
表1不良反应涉及的系统与器官
2最小化方法应用分析
2.1信号检测方法
本发明中采取MHRA方法作为信号检测方法。MHRA是英国药品和保健产品管理局(Medicines and Healthcare products RegulatoryAgency,MHRA)采用的综合标准法,即结合PRR值、绝对报告数及皮尔森x2值来评估信号的关联强度,简称为MHRA法,信号判断的临界值:PRR≥2,a≥3,x2≥4。
2.2信号移除方法
移除少量数据是掩蔽效应的基本解决方案。在本发明中,数据移除策略设计如下:(1)对原始ADR数据按照不良反应的频率从高到低排序,标记为总样本;(2)从数据库中删除前百分之i的数据获得新数据库,标记为子样本;(3)通过MHRA方法对每一个所述子样本进行信号检测;(4)根据不同指标检测所述子样本的性能。数据移除流程如图1所示:
2.3设计基于标准库的四格表
标准库为分类决策提供了客观的依据。为了比较总样本和子样本的有效性,选择标准库作为检验的标准。用标准库中药品-不良反应组合对基于总样本和子样本的检测结果进行标注,如果该组合出现在标准库中,则标注为“1”,否则标注为“0”。利用两个样本分别进行信号检测并与标准库进行比较,可构成如表2所示的四格表。
表2基于标准库的列联表
在表2中,a代表总样本与子样本检出均为阳性信号的ADR组合数;b代表总样本检出为阳性信号,子样本检出为阴性信号的ADR组合数;c代表总样本检出为阴性信号,子样本检出为阳性信号的ADR组合数;d代表总样本和子样本检出均为阴性信号的ADR组合数;a1、b1、c1和d1分别表示a、b、c和d中出现在标准库中的ADR组合数,可将b1看作子样本中漏检的标准库的信号数,将c1看作总样本中漏检的标准库的信号数。
2.4设计检测指标
(1)检测指标R-查全率
查全率是指从标准库的已知信号中检测出信号的比例,是一种对已知信号覆盖率的度量。用查全率R描述检测出已知信号的能力,如公式1所示:
通过对新老数据库查全率的比较可以区分两者检出已知ADR信号的能力,也体现了在以标准库为基准的条件下两个样本的检出信号的灵敏度的差异。因此查全率是一个关键指标。
(2)检测指标P-查准率
查准率是指基于某个样本进行信号检测得到的结果中已知信号所占的比例,是对已知信号检测准确率的一种度量。用查准率P描述样本检测出已知信号的能力,用公式2表示:
(3)检测指标F
由于查准率和查全率之间存在反向依赖关系。如果查准率增加,查全率将降低,反之亦然。因此,引入F指标,即P和R的简单调和平均数,定义如公式3:
当F指标达到最大值时,表明当前系统达到了较好的状态。换句话说,查准率和查全率保持相对平衡,数据遮蔽效应消除最好。
(4)检测指标BR-收益率
为了更好地评估性能的揭露,我们定义了收益率BR,它的定义如公式4:
其中,分母表示在不同数据库中已知信号的综合,分子表示两个数据库中已知信号的差异。因此,公式4可以被认为是数据删除后已知信号的收益率。显然,其值越大,表明数据遮蔽消除的效果越好。
3结果分析
我们用Microsoft Visual FoxPro(6.0)总共进行了十一次实验。当n=i(i=0,1,......,9,10)时,表示前i%的数据将从总样本中移除。
由图2和图3可知,随着数据去除率i值的增加,R值逐渐增大,P值逐渐减小,F值先增大后减小;当i=6时F值达到峰值,然后只见减小。也就是说,当删除前6%的数据时,系统达到平衡。结合图4和图5可知,当i>6时,BR值和已知信号的比例呈继续增加的趋势,但是增加的趋势趋于平缓。同时,F值开始下降,删除的数据量过大,会导致信号丢失。综上所述,当i=6时是数据删除策略的最佳之处。
当i=6时,F值达到最大值为50.63%,其中总报告数为530919,删除的数据量为32662.与原始数据库相比,新数据库中检测到的已知信号从6314变更为6787,比例由50.04%变为61%,增加了10.96%;同时,BR值从第一数据删除的10.72%增加为52.12%。
由图6所示,当i=6时,所关心的五种不良反应都能得到更好的BR值,但又存在一些差异。可分为以下四类:
第一类是晕厥,在十一个实验中,当i=6时,BR达到60%最大值。
第二类包括急性肾衰竭和皮肤脱落,BR的值为100%,每个数据删除,其中b1=0,这意味着所有已知的信号都检测到。
第三类是白细胞减少,当i=1或2时,效果不好,BR值为负值,已知信号的数量比初始数据库中的数量少,但当i从3增大到9时,BR值不断增加,i=9时达到峰值90%。
第四类是抽搐,与第三类相似,实验没有达到最佳效果。但当去除6%个数据后,得到第一个峰值,然后逐渐衰减。去掉10%个数据后,得到第二峰,其值等于第一峰的值。
整体而言,当i=6时,五种不良反应都取得了比较理想的性能。

Claims (5)

1.一种药品不良反应信号检测中最小化数据遮蔽效应的方法,其特征在于,所述方法包括以下步骤:
1)数据的采集与处理:数据的采集包括原始ADR数据的采集和标准库的采集;数据的处理包括对所述原始ADR数据按照不良反应组合出现的频率从高到低排序,标记为总样本,并从所述总样本中删除前百分之i的数据后得到新数据集,标记为子样本;
2)数据的信号检测:通过ADR信号检测方法对所述子样本进行信号检测;
3)基于标准库设计多个决策指标来判断所述不同子样本之间信号检测的差异性,利用查全率R、查准率P和F指标作为数据移除百分比的决策指标,利用收益率指标BR作为遮蔽效应消除的性能评价指标,具体如下;
301)设计基于标准库的四格表:用标准库中药品-不良反应组合对所述总样本和子样本的检测结果进行标注,若该组合出现在标准库中,则标注为1,否则标注为0;
所述四格表中的元素分别为a(a1)、b(b1)、c(c1)和d(d1);其中,a代表总样本与子样本检出均为阳性信号的ADR组合数;b代表总样本检出为阳性信号,子样本检出为阴性信号的ADR组合数;c代表总样本检出为阴性信号,子样本检出为阳性信号的ADR组合数;d代表总样本和子样本检出均为阴性信号的ADR组合数;a1、b1、c1和d1分别表示a、b、c和d中出现在标准库中的ADR组合数;
302)所述检测指标查全率R,由公式1表示,
303)所述检测指标查准率P,由公式2表示,
304)所述检测指标F,由公式3表示,
F指标为P和R的简单调和平均数,当F指标达到最大值时,查准率和查全率保持相对平衡,数据遮蔽效应消除性能最好;
305)所述检测指标收益率BR,由公式4表示,
其中,分母表示在不同数据库中已知信号的综合,分子表示两个数据库中已知信号的差异;BR值表示子样本已知信号的收益率,BR值越大,表明数据遮蔽消除性能越好。
2.根据权利要求1所述的一种药品不良反应信号检测中最小化数据遮蔽效应的方法,其特征在于:所述原始ADR数据从国家药品不良反应监测中心获得;所述标准库是通过网络采集相关药物的说明书、国家食品药品监督管理局发布的各期药品不良反应信息通报以及药物警戒快讯和各种法规文件建立的ADR已知库。
3.根据权利要求1所述的一种药品不良反应信号检测中最小化数据遮蔽效应的方法,其特征在于:所述步骤1)中的不良反应为急性肾衰竭、皮肤脱落、晕厥、白细胞减少和抽搐。
4.根据权利要求1所述的一种药品不良反应信号检测中最小化数据遮蔽效应的方法,其特征在于:所述步骤1)中i的取值为0、1、2、3、4、5、6、7、8、9或10。
5.根据权利要求1所述的一种药品不良反应信号检测中最小化数据遮蔽效应的方法,其特征在于:所述步骤2)中的ADR信号检测方法为基于不对称测定原理的MHRA方法。
CN201810275118.3A 2018-03-29 2018-03-29 一种药品不良反应信号检测中最小化数据遮蔽效应的方法 Active CN108804494B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810275118.3A CN108804494B (zh) 2018-03-29 2018-03-29 一种药品不良反应信号检测中最小化数据遮蔽效应的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810275118.3A CN108804494B (zh) 2018-03-29 2018-03-29 一种药品不良反应信号检测中最小化数据遮蔽效应的方法

Publications (2)

Publication Number Publication Date
CN108804494A true CN108804494A (zh) 2018-11-13
CN108804494B CN108804494B (zh) 2021-03-16

Family

ID=64095401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810275118.3A Active CN108804494B (zh) 2018-03-29 2018-03-29 一种药品不良反应信号检测中最小化数据遮蔽效应的方法

Country Status (1)

Country Link
CN (1) CN108804494B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110879822A (zh) * 2019-11-15 2020-03-13 南京邮电大学 一种基于关联规则分析的药品不良反应信号检测方法
CN112133450A (zh) * 2019-10-15 2020-12-25 南京邮电大学 基于决策树分层的药品不良反应数据遮蔽效应消除的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004203532A1 (en) * 2003-08-07 2005-03-17 Timothy John Frendin Drug Prescription and Management System
CN105891498A (zh) * 2015-01-12 2016-08-24 南京中医药大学 一种组合指标区分药物过敏反应和类过敏反应的方法
CN107543891A (zh) * 2017-03-29 2018-01-05 中国检验检疫科学研究院 一种洗护用品中雄激素化学风险物质的筛查方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004203532A1 (en) * 2003-08-07 2005-03-17 Timothy John Frendin Drug Prescription and Management System
CN105891498A (zh) * 2015-01-12 2016-08-24 南京中医药大学 一种组合指标区分药物过敏反应和类过敏反应的方法
CN107543891A (zh) * 2017-03-29 2018-01-05 中国检验检疫科学研究院 一种洗护用品中雄激素化学风险物质的筛查方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FRANÇOIS MAIGNEN等: "A mathematical framework to quantify the masking effect associated with the confidence intervals of measures of disproportionality", 《THERAPEUTIC ADVANCES IN DRUG SAFETY》 *
叶小飞: "药品不良反应信号检测中遮蔽效应的影响及消除方法", 《国药物警戒》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133450A (zh) * 2019-10-15 2020-12-25 南京邮电大学 基于决策树分层的药品不良反应数据遮蔽效应消除的方法
CN110879822A (zh) * 2019-11-15 2020-03-13 南京邮电大学 一种基于关联规则分析的药品不良反应信号检测方法
CN110879822B (zh) * 2019-11-15 2022-11-15 南京邮电大学 一种基于关联规则分析的药品不良反应信号检测方法

Also Published As

Publication number Publication date
CN108804494B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
Balion et al. Reproducibility of impaired glucose tolerance (IGT) and impaired fasting glucose (IFG) classification: a systematic review
JP5636381B2 (ja) 細胞集団識別のための機器間の方法およびシステム
Xu et al. Inflammatory biomarkers in older adults with frailty: a systematic review and meta-analysis of cross-sectional studies
CN108831563B (zh) 一种用于判别药品不良反应信号分类检测的决策方法
Battistini et al. New globular cluster candidates in the inner regions of M31 and the projected density profile of the cluster system
CN108804494A (zh) 一种药品不良反应信号检测中最小化数据遮蔽效应的方法
Tan et al. Evaluation of the Beckman Coulter UniCel DxH 800, Beckman Coulter LH 780, and Abbott Diagnostics Cell-Dyn Sapphire hematology analyzers on adult specimens in a tertiary care hospital
Park et al. Evaluation of the CellaVision advanced RBC application for detecting red blood cell morphological abnormalities
Milanez et al. A scoping review on the GLIM criteria for malnutrition diagnosis: Understanding how and for which purpose it has been applied in studies on hospital settings
Labini et al. Power law correlations in galaxy distribution and finite volume effects from the Sloan Digital Sky Survey Data Release Four
CN114121275A (zh) 一种基于大数据遗传代谢病筛查效率提升的智能分析方法
CN107122590B (zh) 一种油浸式变压器故障相关指标筛选方法
Wheeler et al. Delta check tables for the Technicon SMA 6 continuous-flow analyzer.
Zini et al. Artificial intelligence and the blood film: Performance of the MC‐80 digital morphology analyzer in samples with neoplastic and reactive cell types
Dzeroski et al. Using data mining and OLAP to discover patterns in a database of patients with Y-chromosome deletions.
CN112133450B (zh) 基于决策树分层的药品不良反应数据遮蔽效应消除的方法
CN110849795B (zh) 一种利用流式细胞仪快速检测大白菜倍性的方法
CN101034057A (zh) 检测液态奶中是否含有复原奶的方法
CN110609030A (zh) 一种基于检出概率模型的拉曼快检性能综合评价方法
Douville et al. Evaluation of the average of patients: application to endocrine assays
CN117805375B (zh) 一种分析nk细胞分化分期及nk细胞肿瘤免疫分型的抗体组合物及其应用
CN111855930B (zh) 粮食营养素检测装置及方法
KC SR et al. Prevalence of hemoglobinopathies and hemoglobin variants
CN115905273B (zh) 一种数仓表中的数据检测方法、电子设备及存储介质
JPS61162734A (ja) カ−ボンブラツクの等級判定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant