CN114694770A - 一种构建药物肝毒性预测模型的方法及其用途 - Google Patents

一种构建药物肝毒性预测模型的方法及其用途 Download PDF

Info

Publication number
CN114694770A
CN114694770A CN202011616758.XA CN202011616758A CN114694770A CN 114694770 A CN114694770 A CN 114694770A CN 202011616758 A CN202011616758 A CN 202011616758A CN 114694770 A CN114694770 A CN 114694770A
Authority
CN
China
Prior art keywords
drug
cell
hepatotoxicity
lec
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011616758.XA
Other languages
English (en)
Inventor
王莉莉
魏爱丽
李武举
李治
徐华
郭磊
谢剑炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Academy of Military Medical Sciences AMMS of PLA
Original Assignee
Academy of Military Medical Sciences AMMS of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Academy of Military Medical Sciences AMMS of PLA filed Critical Academy of Military Medical Sciences AMMS of PLA
Priority to CN202011616758.XA priority Critical patent/CN114694770A/zh
Publication of CN114694770A publication Critical patent/CN114694770A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5014Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing toxicity
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Hematology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Microbiology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及药学与医学领域,具体涉及一种构建药物肝毒性预测模型的方法及其在预测药物肝毒性的应用,还涉及一种预测药物肝毒性的方法、系统和装置,还涉及细胞表型参数组合在预测药物肝毒性中的用途。本公开提供的预测药物肝毒性的方法可通过对肝细胞进行最少3组(7个参数),最多6组(13个参数)的高内涵分析测试实验,结合药物人体体内暴露Cmax值,即可鉴定待测药物对肝细胞的毒性,并且该方法的准确性最高可达87%,敏感性和特异性最高分别为84%、94%,显著高于已报道的基于HCA甚至是其他技术构建的预测方法。

Description

一种构建药物肝毒性预测模型的方法及其用途
技术领域
本公开涉及药学与医学领域,具体涉及一种构建药物肝毒性预测模型的方法及其在预测药物肝毒性的应用,还涉及一种预测药物肝毒性的方法、系统和装置,还涉及细胞表型参数组合在预测药物肝毒性中的用途。
背景技术
药物性肝损伤(drug induced liver injury,DILI)是指处方药、非处方药或者中草药导致的肝脏损伤。在临床上表现为各类急慢性肝脏疾病,严重者导致急性肝衰竭、肝移植,是最常见的药物不良反应(Hamilton LA,Collins-Yoder A,Collins RE,AACNadvanced critical care 2016,27(4):430-40)。DILI不仅严重危害用药者健康,还是药物研发晚期失败、限制使用、撤市的主要原因,导致药物研发投资的巨大损耗。据统计,在2013至2015年间进入临床开发的候选药物中,有近四分之一的药物由于安全性而导致最终的失败(Segall MD,Chris BJDDT.Addressing toxicity risk when designing andselecting compounds in early drug discovery[J].2014;19(5):688-93;HarrisonRK.Phase II and phase III failures:2013-2015[J].Nature reviews Drug discovery2016;15(12):817-8),DILI是其中重要原因之一。截至2015年,因诱导肝毒性而被撤市的药物占所有撤市药物的21%(Watkins PB,Merz M,Avigan MI,Kaplowitz N,Regev A,SeniorJRJDS.The Clinical Liver Safety Assessment Best Practices Workshop:Rationale,Goals,Accomplishments and the Future[J].2014;37(1):1-7;Siramshetty VB,NickelJ,Omieczynski C,Gohlke B-O,Drwal MN,Preissner R.WITHDRAWN—a resource forwithdrawn and discontinued drugs[J].Nucleic Acids Research 2015;44(D1):D1080-D6)。因此,DILI已成为新药研发企业、监管机构及临床医生严密关切的问题(HoofnagleJH,Serrano J,Knoben JE,Navarro VJ.LiverTox:a website on drug-induced liverinjury[J].Hepatology 2013;57(3):873-4;Bjornsson ES.Hepatotoxicity by Drugs:The Most Common Implicated Agents[J].Int J Mol Sci 2016;17(2):224)。如何在新药研发早期高效识别候选化合物的肝毒性,建立临床转化效率更高的药物肝毒性预测方法成为医药业的迫切需求。
一直以来,传统的DILI临床前预测主要依靠于几十年前发展起来动物安全性评价,通过观察啮齿和非啮齿类动物长期服药后肝脏的变化进行DILI的评价,然后进入临床Ⅰ-Ⅲ期实验进一步评价。然而,动物与人类间存在的种属差异使得采用动物模型的评价结果预测人类临床反应具有局限性(Martignoni M,Groothuis GM,de Kanter R.Speciesdifferences between mouse,rat,dog,monkey and human CYP-mediated drugmetabolism,inhibition and induction[J].Expert Opin Drug Metab Toxicol 2006;2(6):875-94)。早有研究显示,非啮齿和啮齿类动物的安全评价结果在预测人类毒性事件上的准确率仅为63%,43%,对于DILI,动物模型的评价结果的准确率约为55%(Olson H,Betton G,Robinson D,et al.Concordance of the toxicity of pharmaceuticals inhumans and in animals[J].Regulatory toxicology and pharmacology:RTP 2000;32(1):56-67)。而且其预测的肝毒性基本上是固有型的DILI(Intrinsic drug inducedliver injury),又称为非特异性DILI,且对于特异质DILI(Idiosyncratic drug inducedliver injury,IDILI)的预测率更低(Funk C,Roth A.Current limitations and futureopportunities for prediction of DILI from in vitro[J].Arch Toxicol 2017;91(1):131-42)。即使候选药物通过临床Ⅲ期实验,然而由于暴露的人群有限,大多数IDILI仍难于发现,最终导致药物上市后被撤市(Seung-Hyun K,Naisbitt DJ.Update on Advancesin Research on Idiosyncratic Drug-Induced Liver Injury[J].Allergy Asthma&Immunology Research 2016;8(1):3-11)。鉴于传统肝毒性预测方法本质上的局限性,并且动物安全性评价方法耗时长、耗费高、用药量大,不适用于现代药物研发早期的高通量筛选,加之国际上对于动物福利的日益重视,倡导3R原则(减少、替代、优化),因此寻找动物替代的毒性评价方法成为药物肝毒性评价方法发展的策略(Macdonald JS,RobertsonRTJTS.Toxicity testing in the 21st century:a view from the pharmaceuticalindustry[J].2009;110(1):40-6;Krewski D,Andersen ME,Tyshenko MG,et al.Toxicitytesting in the 21st century:progress in the past decade and futureperspectives[J].Archives of Toxicology 2020;94(1):1-58)。
近十余年来,随着现代生命科学、计算机、生物信息学等技术的快速发展,毒理学科的发展也进入了新的阶段。基于已有对DILI机制的认识,以人源细胞为模型发展体外测试方法已经成为DILI药物预测技术的发展方向,科学家们进行了各种尝试,并将生命组学包括基因组学、蛋白组学、代谢组学等技术应用其中,建立了各种体外肝毒性测试预测系统,包括以肝细胞组分(如代谢酶、转运体等)、2D或3D细胞、类肝组织、微肝芯片、肝切片等为测试模型,以及整合了化合物各类信息的计算机预测方法。然而,一方面,由于DILI机制的复杂性导致DILI,特别是特异质DILI(iDILI)的机制的认识还十分有限,另一方面,一些类生理的体外模型尚有许多技术上的瓶颈有待突破,截止目前,尚没有一种药物肝毒性筛选方法被业界和监管机构广泛接受和许可。
高内涵分析(HCA,High Content Analysis)技术是为了满足高效新药筛选需求而开发的基于细胞图像定量测定的分析技术,能在单次实验获得受试药物毒性机制与效应相关的多维信息。目前,只有基于各类人肝细胞HCA的药物肝毒性测试方法经过了批量药物验证,也适合于新药研发早期候选药物肝毒性的筛选的方法。然而,现有的方法主要是基于几个简单、非特异的细胞毒参数的测试,这些指标既与临床DILI因果关系不明确,不能反映多样复杂的DILI药物特点,也未经过系统的筛选。并且,由于在建模过程中,不同研究者使用的药物选择和分类标准不一,直接影响了已有方法预测的一致性与可信性,更是无法预测具有iDILI的药物。因此,新的基于2D细胞HCA技术的药物肝毒性预测方法有待发现和发展。
公开内容
本公开通过批量已知DILI药物肝细胞毒表型谱的HCA测定,结合药物的人体暴露水平,利用机器学习方法识别和验证与DILI具有最强相关性的机制模式(由特定细胞表型组合),从而构建一个全新的基于2D人源细胞HCA、适合药物发现与临床研究早期、高效的DILI药物识别和预测的体系。该体系可以为降低新药研发成本、提高新药研发效率、保证临床用药安全提供技术支撑。
本公开提供一种构建药物肝毒性预测模型的方法,包括:
收集n个已知的具有严重DILI(severe DILI,sDILI)和非DILI(non-DILI,nDILI)药物,收集药物的Cmax信息;
用不同浓度的药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值;
利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练,以构建药物肝毒性预测模型,
其中,n为大于或等于10的整数(例如大于或等于50,大于或等于60,例如55,60,65,70,80),
LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度,
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h,
优选地,所述机器学习模型为Fisher线性判别分析模型或朴素贝叶斯(
Figure BDA0002872477860000041
Bayes)分类模型。
在一个实施中,所述构建药物肝毒性预测模型的方法,其中利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练包括:
从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,利用训练集对机器学习模型进行训练,构建药物肝毒性预测模型。
在一个实施中,所述构建药物肝毒性预测模型的方法,其中利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练包括:
从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,随机提取m次,得到m个训练集,利用m个训练集分别对机器学习模型进行训练,构建得到m个药物肝毒性预测模型,将m个药物肝毒性预测模型集成为药物肝毒性集成预测模型,
其中m为大于或等于200的整数,例如300,400,600,800,1000,1200,1500,2000,
优选地,所述机器学习模型为Fisher线性判别分析模型或朴素贝叶斯(
Figure BDA0002872477860000051
Bayes)分类模型。
在一个实施中,所述构建药物肝毒性预测模型的方法,其中所述细胞选自肝细胞(例如HepG2细胞)、P65-EGFP_CHO、Hif1a-EGFP_CHO、ATF6-EGFP_U2OS、Nrf2-EGFP_A549或其任意组合,
优选地,所述细胞为肝细胞(例如HepG2细胞),细胞表型的参数变化率=(药物处理组荧光强度-溶剂对照组荧光强度)/溶剂对照组荧光强度×100%,或者细胞表型的参数变化率=(受试药物处理组荧光强度-溶剂对照组荧光强度)/(阳性药物处理组荧光强度-溶剂对照组荧光强度)×100%;
优选地,所述细胞为P65-EGFP_CHO和/或ATF6-EGFP_A549时,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度);
优选地,所述细胞为Hif1a-EGFP_CHO和/或Nrf2-EGFP_A549时,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=受试药物处理细胞/细胞核内荧光蛋白的荧光强度-背景荧光强度。
本公开还提供一种药物肝毒性预测模型,其由本公开所述的构建药物肝毒性预测模型的方法构建而成。
本公开还提供所构建的药物肝毒性预测模型在预测药物肝毒性中的用途。
本公开还提供一种预测药物肝毒性的方法,包括:
用不同浓度的待测药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,LEC),利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值;
将待测药物的特定细胞表型的TILEC值输入本公开所构建的药物肝毒性预测模型,判定待测药物是否具有肝毒性,或者
将待测药物的特定细胞表型的TILEC值输入本公开所构建的药物肝毒性集成预测模型,根据m个药物肝毒性预测模型输出的结果,得到m个预测值(即,判定药物的肝毒性为阳性或阴性),如果在m个预测值中,有50%以上判定为肝毒性为阳性,则判断该待测药物具有肝毒性,
其中LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度,
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
本公开还提供一种预测药物肝毒性的系统,包括:高内涵分析(HCA)仪、计算模块和预测模块,
高内涵分析(HCA)仪用于测定用不同浓度的待测药物处理后细胞的细胞表型的参数变化率;
计算模块用于确定药物最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax计算TILEC值;
预测模块包括本公开所构建的药物肝毒性预测模型或药物肝毒性集成预测模型,用于预测待测药物的肝毒性。
本公开还提供一种预测药物肝毒性的装置,包括:
存储器,被配置为存储指令;
处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如本公开所述的预测药物肝毒性的方法。
本公开还提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如本公开所述的预测药物肝毒性的方法。
本公开还提供特定细胞表型组合在预测药物肝毒性中的用途,其中所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
在一个实施例中,所述特定细胞表型组合为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h的组合。
在一个实施例中,所述特定细胞表型组合为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h的组合。
在一个实施例中,所述的特定细胞表型组合在预测药物肝毒性中的用途,其中在预测药物肝毒性时,用不同浓度的药物处理细胞,通过高内涵分析(HCA)测定所述特定细胞表型组合中每个细胞表型的参数变化率,确定每个细胞表型的药物最低起效浓度(lowesteffective concentration,LEC),利用公式TILEC=LEC/Cmax,计算每个细胞表型的TILEC值,利用特定细胞表型组合中每个细胞表型的TILEC值预测药物的肝毒性。
术语定义
在本公开中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的细胞培养、分子遗传学、核酸化学、免疫学实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本公开,下面提供相关术语的定义和解释。
如本文中所使用的,术语“LC3B_16h”为待测药物孵育HepG2细胞16h后,荧光标记的微管相关蛋白1轻链3B蛋白通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
如本文中所使用的,术语“MMP_72h”为待测药物孵育HepG2细胞72h后,线粒体膜电位通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的发光值-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的发光值-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度);
如本文中所使用的,术语“MnSOD_24h”为待测药物孵育HepG2细胞24h后,荧光标记的锰超氧化物歧化酶通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
如本文中所使用的,术语“Nuclear_24h”为待测药物孵育HepG2细胞24h后,荧光标记的细胞核通过高内涵分析输出的反映细胞核形态参数的数值的变化率,所述反映细胞核形态参数的数值的变化率的计算方法如下:
(待测药物组的数值-溶剂对照组的数值)/溶剂对照组的数值;
(受试药物组的数值-溶剂对照组的数值)/(阳性药物组的数值-溶剂对照组的数值)。
如本文中所使用的,术语“α-Tubulin_24h”为待测药物孵育HepG2细胞24h后,荧光标记的β微管蛋白通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
如本文中所使用的,术语“Nuclear_72h”为待测药物孵育HepG2细胞72h后,荧光标记的细胞核通过高内涵分析输出的反映细胞核形态的参数数值的变化率,所述反映细胞核形态的参数数值的变化率的计算方法如下:
(待测药物组的数值-溶剂对照组的数值)/溶剂对照组的数值;
(受试药物组的数值-溶剂对照组的数值)/(阳性药物组的数值-溶剂对照组的数值)。
如本文中所使用的,术语“GSH_24h”为待测药物孵育HepG2细胞24h后,荧光标记的谷胱甘肽通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
如本文中所使用的,术语“pH2AX_16h”为待测药物孵育HepG2细胞16h后,荧光标记的磷酸化组蛋白H2AX通过高内涵分析输出的荧光强度的变化率,所述荧光强度的变化率的计算方法如下:
(待测药物组的荧光强度-溶剂对照组的荧光强度)/溶剂对照组的荧光强度;
(受试药物组的荧光强度-溶剂对照组的荧光强度)/(阳性药物组的荧光强度-溶剂对照组的荧光强度)。
如本文中所使用的,术语“ATF6_5h”为待测药物孵育ATF6-EGFP_U2OS细胞5h后内质网应激的程度(R)。ATF6-EGFP_U2OS细胞为活化转录因子6核转位的激活反应模式,细胞静息状态下,荧光标记的转录因子蛋白在胞浆中分布,被激活时,荧光标记标志分子转位至细胞核中,因此,通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度(R)。内质网应激的程度(R)可通过高内涵分析输出的细胞核中荧光蛋白和细胞胞质荧光蛋白的荧光强度来计算,具体计算方法如下:
R=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
如本文中所使用的,术语“Hif1α_24h”为待测药物孵育Hif1α-EGFP_CHO细胞24h后缺氧应激反应通路被激活的程度(R)。Hif1a-EGFP_CHO细胞为低氧诱导因子-1α细胞内积累的激活反应模式,细胞静息状态下,荧光标记蛋白低表达,被激活时,荧光标记蛋白表达量升高甚至转移至细胞核中,表现为细胞中荧光强度增加,因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(R)。缺氧应激反应通路被激活的程度(R)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算,具体计算方法如下:
R=待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
如本文中所使用的,术语“Hif1α_3h”为待测药物孵育Hif1α-EGFP_CHO细胞3h后缺氧应激反应通路被激活的程度(R)。Hif1a-EGFP_CHO细胞为Hif1a细胞内积累的激活反应模式,细胞静息状态下,荧光标记蛋白低表达,被激活时,荧光标记蛋白表达量升高甚至转移至细胞核中,表现为细胞中荧光强度增加,因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(R)。缺氧应激反应通路被激活的程度(R)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算,具体计算方法如下:R=待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
如本文中所使用的,术语“Nrf2_6h”为待测药物孵育Nrf2-EGFP_A549细胞6h后氧化应激通路被激活的程度(R)。Nrf2-EGFP_A549细胞为Nrf2(nuclear factor erythroid-2related factor 2,核因子E2相关因子2)细胞内积累的激活反应模式,细胞静息状态下,荧光标记蛋白低表达,被激活时,荧光标记蛋白表达量升高甚至转移至细胞核中,表现为细胞中荧光强度增加,因此通过分析细胞核或细胞内累积荧光蛋白含量来表征相应通路的激活程度(R)。氧化应激通路被激活的程度(R)可通过高内涵分析输出的细胞和/或细胞核内荧光蛋白的荧光强度来计算,具体计算方法如下:
R=待测药物组处理的细胞和/或待测药物组处理的细胞的细胞核内荧光蛋白的荧光强度-背景荧光强度。
如本文中所使用的,术语“NF-κB_0.67h”为待测药物孵育P65-EGFP_CHO细胞0.67h后炎性应激NF-κB通路被激活的程度细胞(R)。P65-EGFP_CHO细胞为P65转录因子核转位的激活反应模式,细胞静息状态下,荧光标记的P65蛋白在胞浆中分布,被激活时,荧光标记的P65转位至细胞核中,因此,通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度(R)。炎性应激NF-κB通路被激活的程度细胞(R)可通过高内涵分析输出的细胞核中荧光蛋白和细胞胞质荧光蛋白的荧光强度来计算,具体计算方法如下:
R=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
如本文中所使用的,术语“Cmax”为药物在人体体内暴露的最大浓度。
本公开的有益效果
本公开提供的预测药物肝毒性的方法可通过对肝细胞进行最少3组(7个参数),最多6组(13个参数)的高内涵分析测试实验,结合药物人体体内暴露Cmax值,即可鉴定待测药物对肝细胞的毒性,并且该方法的准确性最高可达87%,敏感性和特异性最高分别为84%、94%,显著高于已报道的基于HCA甚至是其他技术构建的预测方法。
附图说明
图1显示了本公开的构建药物肝毒性预测模型的方法的一个实施例的流程示意图;
图2显示了本公开的预测药物肝毒性的方法的一个实施例的流程示意图;
图3显示了本公开的预测药物肝毒性的系统的一个实施例的结构示意图;
图4显示了本公开的预测药物肝毒性的装置的一个实施例的结构示意图;
图5显示了建立本公开预测药物肝毒性的方法的流程;
图6显示了受试药物分组特征。其中,A显示了受试药物涵盖的适应症类型及数量;B显示了测试集药物的肝损伤类型、logP值和每日给药剂量、Cmax值分布图;C显示了验证集药物的肝损伤类型、logP值和每日给药剂量、Cmax值分布图;CAD代表cardiovasculardiseases心血管疾病药物;GID代表Gastrointestinal diseases胃肠疾病药物。
图7显示了应用Tclass分类系统构建基于特定细胞表型组合的药物肝毒性预测模型的流程图。
图8显示了测试集药物HepG2细胞表型参数初筛结果;
图9显示了测试集药物细胞应激反应表型参数初筛结果;
图10显示了测试集药物细胞表型参数效应的测定结果。其中,A显示了药物细胞表型参数EC50和LEC值热图;B显示了基于药物细胞表型参数的TI50和TILEC值热图;C显示了不同DILI损伤类型药物的TI50值分布;图D显示了不同DILI损伤类型药物的TILEC值分布;TI50=EC50/Cmax,TILEC=LEC/Cmax;*P<0.05,**P<0.01,***P<0.001vs nDILI类药物;
图11显示了测试集药物基于药物表型TI50和TILEC值的DILI判定。其中,A显示了sDILI、mDILI和nDILI药物肝毒性阳性参数热图;B和E显示了三类药物肝毒性阳性参数的数量及比较;C和F显示了基于TI50和TILEC值判断DILI的敏感性和特异性;D和G显示了基于药物TI50和TILEC值,单细胞表型参数对sDILI、mDILI和nDILI类药物的敏感性;*P<0.05,**P<0.01,***P<0.001vs nDILI类药物;
图12显示了基于药物影响细胞表型参数的TI50和TILEC值的ROC曲线分析,其中基于TI50预测时,所用细胞表型参数为全部的23个参数,基于TILEC预测时,所用细胞表型参数为去除IR_72h、F-actin_24h、MMP_24h这三个参数后剩余的20个参数;
图13显示了Tclass分类系统确定优化的测试组合盘及特性。其中A显示了不同测试组合盘的参数组成;B显示了不同测试组合盘的ROC曲线分析;
图14显示了验证集药物优化测试组合盘参数初筛结果;
图15显示了验证集药物优化表型测试组合参数结果。其中,A显示了药物优化测试组合盘参数LEC值热图;B显示了药物优化测试组合盘参数TILEC值热图;C显示了sDILI、mDILI、aDILI和nDILI类药物肝毒性阳性参数热图;
图16显示了基于细胞表型参数组合1和组合4的受试药物阳性参数的分布图;
图17显示了预测方法对不同肝损伤类型的受试药物的敏感性。其中,C为胆汁淤积型损伤,H为肝细胞型损伤,M为混合型损伤。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1为本公开的构建药物肝毒性预测模型的方法的一个实施例的流程示意图,其中:
步骤1,收集n个已知的具有严重DILI(severe DILI,sDILI)和非DILI(non-DILI,nDILI)药物,收集药物的Cmax信息。其中n为大于或等于10的整数(例如大于或等于50,大于或等于60,例如55,60,65,70,80)。
步骤2,用不同浓度的药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值。其中LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度,所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
步骤3,利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练,以构建药物肝毒性预测模型。
步骤3中的机器学习模型可以为Fisher线性判别分析模型,也可以为朴素贝叶斯(
Figure BDA0002872477860000141
Bayes)分类模型。
步骤3中,利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练时,可以先从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,再利用所得训练集对机器模型进行训练,从而构建药物肝毒性预测模型。
步骤3中,利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练时,还可以是从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,随机提取m次,得到m个训练集,利用所得m个训练集分别对机器学习模型进行训练,构建得到m个药物肝毒性预测模型,将m个药物肝毒性预测模型集成为药物肝毒性集成预测模型。其中m可以为大于或等于200的整数,例如300,400,600,800,1000,1200,1500或2000,等等。
步骤2中,所述细胞可以选自肝细胞(例如HepG2细胞)、P65-EGFP_CHO、Hif1a-EGFP_CHO、ATF6-EGFP_U2OS、Nrf2-EGFP_A549或其任意组合。
步骤2中,所述细胞可以为肝细胞(例如HepG2细胞),此时细胞表型的参数变化率=(药物处理组荧光强度-溶剂对照组荧光强度)/溶剂对照组荧光强度×100%,或者细胞表型的参数变化率=(受试药物处理组荧光强度-溶剂对照组荧光强度)/(阳性药物处理组荧光强度-溶剂对照组荧光强度)×100%,其中,所述细胞表型参数选自LC3B,MnSOD,α-Tubulin,GSH,pH2AX,MMP。
步骤2中,所述细胞可以为所述细胞为肝细胞(例如HepG2细胞),细胞表型的参数变化率=(药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/溶剂对照组反应细胞核形态的数值×100%,或者细胞表型的参数变化率=(受试药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/(阳性药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)×100%,其中,所述细胞表型参数为细胞核。
步骤2中,所述细胞可以为所述细胞为P65-EGFP_CHO和/或ATF6-EGFP_U2OS,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
步骤2中,所述细胞可以为Hif1a-EGFP_CHO和/或Nrf2-EGFP_A549,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=受试药物处理细胞或细胞核内荧光蛋白的荧光强度-背景荧光强度。
由上述构建药物肝毒性预测模型的方法构建而成的药物肝毒性预测模型或药物肝毒性集成预测模型可以用于预测新药物的肝毒性。
图2为本公开的预测药物肝毒性的方法的一个实施例的流程示意图。其中
步骤1,用不同浓度的待测药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effectiveconcentration,LEC),利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值。
步骤1中LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度。
步骤1中特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
步骤2,将待测药物的每一个细胞表型的TILEC值输入所构建的药物肝毒性预测模型,判定待测药物是否具有肝毒性,或者
将待测药物的每一个细胞表型的TILEC值输入所构建的药物肝毒性集成预测模型,根据m个药物肝毒性预测模型输出的结果,得到m个预测值(肝毒性阳性或阴性),如果在m个预测值中,有50%以上判定为肝毒性为阳性,则判断该待测药物具有肝毒性。
图3为本公开的预测药物肝毒性的系统的一个实施例的结构示意图。如图3所示,预测药物肝毒性的系统包括:高内涵分析(HCA)仪、计算模块和预测模块。其中:
高内涵分析(HCA)仪用于测定用不同浓度的待测药物处理后细胞的细胞表型的参数变化率;
计算模块用于确定药物最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax计算TILEC值;
预测模块包括本公开所构建的药物肝毒性预测模型或药物肝毒性集成预测模型,用于预测待测药物的肝毒性。
图4为本公开的预测药物肝毒性的装置的一个实施例的结构示意图。如图4所示,预测药物肝毒性的装置包括:存储器41和处理器42。
存储器41用于存储指令,处理器42耦合到存储器41,处理器42被配置为基于存储器存储的指令执行实现如图2中任一实施例涉及的方法。
如图4所示,该预测药物肝毒性的装置还包括通信接口43,用于与其它设备进行信息交互。同时,该预测药物肝毒性的装置还包括总线44,处理器42、通信接口43、以及存储器41通过总线44完成相互间的通信。
存储器41可以包含高速RAM存储器,也可还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。存储器41也可以是存储器阵列。存储器41还可能被分块,并且块可按一定的规则组合成虚拟卷。
此外,处理器42可以是一个中央处理器CPU,或者可以是专用集成电路ASIC,或是被配置成实施本公开实施例的一个或多个集成电路。
本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图2中任一实施例涉及的方法。
本公开还涉及特定细胞表型组合在预测药物肝毒性中的用途,其中所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
例如,所述特定细胞表型组合可以为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h的组合。
再例如,所述特定细胞表型组合可以为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h的组合。
在预测药物肝毒性时,用不同浓度的药物处理细胞,通过高内涵分析(HCA)测定所述特定细胞表型组合中每个细胞表型的参数变化率,确定每个细胞表型的药物最低起效浓度(lowest effective concentration,LEC),利用公式TILEC=LEC/Cmax,计算每个细胞表型的TILEC值,利用特定细胞表型组合中每个细胞表型参数的TILEC值预测药物的肝毒性。
下面通过一个具体实施例对本公开进行详细说明。
除非特别指明,本公开中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本公开,且不意欲限制本公开所要求保护的范围。
实施例:药物肝毒性预测模型的构建
本实施例基于细胞表型参数的高内涵技术分析平台,HepG2细胞为实验测试模型,以规范定义肝损伤严重程度的四类不同肝损伤程度(严重,中等、定义不明确、非毒)的223个上市药物为研究对象,分为测试集(120个药物)和验证集(103个药物)两组,通过定量测定药物处理肝细胞不同时间点对全细胞毒相关表型(共计23个)特征的影响,建立药物肝细胞毒表型谱数据库,再结合人体最大血药浓度(maximum total concentration,Cmax),构建DILI相关肝细胞表型特征谱。采用Tclass分类识别软件,结合测试集药物临床肝损伤程度和体外肝细胞表型谱特征数据通过逐步工作流程(stepwise workflow)和ROC回归分析,识别和验证用于预测sDILI药物的最佳细胞表型组合。利用最佳细胞表型组合构建DILI集成预测模型。最后用验证集药物的细胞表型进行验证,最终确定DILI预测组合及预测模型。具体的工作流程如图5所示。
一、实验材料
1.1主要药品与试剂:
1)药品
223个受试药物购自美国Selleck公司和中国EFEBIO公司(FDA-approved DrugLibrary,L1300)。工具药二联吡啶(2,2’-Bipyridyl,BP)、衣霉素(tunicamycin,TM)、苯二酚(Tertiary butylhydroquinone,TBHQ)、羟氯喹(Hydroxychloroquine,HCQ),依托泊苷(Etoposide,Ept)购自美国Sigma公司;工具药白细胞介素1β(Interleukin-1β,IL-1β)购自美国PEPROTECH公司。
2)荧光染料和抗体
染料:细胞核染料Hoechst 33342、微丝F-actin染料Alexa Flour 488-phalloidin、线粒体膜电位染料Mito Tracker Red CMXRos、溶酶体pH染料Lyso TrackerdeepRed、GSH染料CM-H2DCFDA、死细胞核染料TOTO-3、谷胱甘肽染料mBCI均购买于美国LifeTechnologies公司。
抗体:兔抗LC3B单克隆抗体、小鼠抗a-微管蛋白单克隆抗体、小鼠抗MnSOD单克隆抗体、小鼠抗pH2AX单克隆抗体以及Alexa Fluor 488标记的驴抗小鼠IgG二抗、AlexaFluor 549标记的驴抗小鼠IgG二抗、Alexa Fluor 549标记的驴抗兔IgG二抗均购买于美国Life Technologies公司。
3)细胞培养相关试剂
DMEM高糖培养基、RPMI1640基础培养基、F12培养基、胎牛血清(fetal bovineserum,FBS)和Hank's平衡盐溶液(Hank's Balanced Salt Solution,HBSS)购买于美国Thermo Scientific HyClone公司;牛血清白蛋白(bovine serum albumin,BSA)购自美国Sigma-Aldrich公司;G418、L-Glutamine和HEPES缓冲液购买于美国Life Technologies公司。胰蛋白酶购买于美国Merk公司;DMSO溶液、甲醛溶液、TritonX-100、青霉素、链霉素及其他常规化学试剂为国产试剂。
1.2主要仪器及耗材
高内涵成像系统(In Cell Analyzer 1000或者In Cell Analyzer 2000)及分析工作站(In Cell Analyzer Workstation 3.7.2)购买于美国GE healthcare lifescience。
黑边底透的96孔板购买于美国corning公司。
1.3细胞系
肝癌细胞系HepG2细胞(由中国人民解放军军事科学院军事医学科学院提供)、Hif1α-EGFP_CHO(CHO细胞系稳定表达HiF1α-EGFP荧光蛋白)、P65-EGFP_CHO(CHO细胞系稳定表达NF-κB-EGFP荧光蛋白)和ATF6-EGFP_U2OS(U2OS细胞系稳定表达ATF6-EGFP荧光蛋白)细胞株购自美国Thermo Fisher Scientific公司;Nrf2-EGFP_A549(A549细胞系稳定表达Nrf2-EGFP荧光蛋白)细胞株按照文献方法(Angela Schoolmeesters,Daniel D Brown,Yuriy Fedorov.Kinome-wide functional genomics screen reveals a novelmechanism of TNFα-induced nuclear accumulation of the HIF-1αtranscriptionfactor in cancer cells.PLoS One.2012;7(2):e31270.doi:10.1371/journal.pone.0031270)构建。
二、实验方法
2.1受试药物选择、分类和分组
由美国NIH Pubmed数据库和肝毒性网站(http://www.livertox.nih.gov)livertox数据库,中国肝毒性专业网站(http://www.hepatox.org/)hepatox数据库,结合实验室药物实体子库,选取223个受试药物。并从drug bank数据库(https://www.drugbank.ca/)收集受试药物化学结构SMILES表达式、脂溶性系数logP值、适应症、每日服药剂量、Cmax、药物靶点等信息。
目前DILI损伤分类主要有两大体系,一是livertox数据库依据肝损伤的“可能性分值(likelihood score)”将药物肝毒性损伤程度分为A到E,分别定义为明确可能、高度可能、很可能、可能及不可能等级。另一个是Minjun Chen教授等人依据药物FDA发布的药品使用说明书,建立的DILIrank数据库将其中的药物分为DILI最相关(Most-DILI concern,)、DILI较相关(Less-DILI concern)、DILI不相关(No-DILI concern)和不明确(Ambiguous-DILI concern)四类(Chen M,Suzuki A,Thakkar S,Yu K,Hu C,Tong W.DILIrank:thelargest reference drug list ranked by the risk for developing drug-inducedliver injury in humans[J].Drug Discovery Today 2016;21(4):648-53;Chen M,VijayV,Shi Q,Liu Z,Fang H,Tong W.FDA-approved drug labeling for the study of drug-induced liver injury[J].Drug Discov Today 2011;16(15-16):697-703.)。本申请兼顾上述两类分类体系的优势,将入选受试药物分为严重DILI(severe DILI,sDILI)、中度DILI(moderate DILI,mDILI)、不明确(ambiguous DILI,aDILI)和非DILI(non-DILI,nDILI)四类,具体的分类准则如表1所示。入选药物中有81个sDILI、81个mDILI、30个aDILI和31个nDILI药物。
此外,根据建模和验证需求,本研究将223个受试药物随机分为测试集和验证集两部分。测试集共120个药物,其中sDILI、mDILI和nDILI分别50、50和20个;验证集包含了31个sDILI、31个mDILI、30个aDILI和11个nDILI药物。测试集和验证集药物名称见表2,表3。
受试药物涉及抗生素、非甾体抗炎药、抗精神病药(主要为抗抑郁和抗躁狂)、抗肿瘤药物、抗病毒药、心血管疾病药物,降脂药、抗真菌药物和激素类药物等,各类药物所占比例如图6中A所示。对比两组药物肝损伤类型、logP值、给药剂量及Cmax值分布,结果如图6中B和C所示,可以看出,本实验两组药物的上述特性基本均衡,无明显的偏向性。
表1.受试药物肝损伤程度分类及准则
Figure BDA0002872477860000211
表2.测试集药物清单
Figure BDA0002872477860000212
Figure BDA0002872477860000221
表3.验证集药物清单
Figure BDA0002872477860000222
Figure BDA0002872477860000231
2.2细胞培养与药物处理
2.2.1药物溶液配置
药物干粉溶解于DMSO溶液中,配置成10~30mM的储存液,分装并储存于-20℃冰箱备用。每次实验时,取相应药物储存液用培养液稀释成3×终浓度的工作液。
2.2.2细胞株培养
Hif1a-EGFP_CHO和P65-EGFP_CHO细胞用F12完全培养基(含有10%的胎牛血清(FBS)、100kU/L青霉素及链霉素、氨苄霉素和0.5mg/ml的遗传霉素(G418))、ATF6-EGFP_U2OS和Nrf2-EGFP_A549细胞用DMEM完全培养基(含有10%的FBS、100kU/L的青霉素及链霉素、氨苄霉素、0.5mg/ml的G418和2mM L-谷氨酰胺)、HepG2用RPMI 1640完全培养基(含有10%的FBS、100kU/L青霉素及链霉素、氨苄霉素)在37℃,5%CO2条件的细胞培养箱中培养。ATF6-EGFP_U2OS和P65-EGFP_CHO细胞系进行药物测试时使用分析培养基,分别为含有1%FBS的DMEM培养液和含有0.1%FBS、10mM HEPES的F12培养液。
2.2.3HepG2细胞药物孵育处理
用RPMI 1640完全培养基(含有10%FBS、100kU/L青霉素、链霉素和氨苄霉素)在37℃,5%CO2的细胞培养箱中培养。实验前,将生长接近融合的HepG2细胞消化成单个细胞,使用完全培养基稀释,并以合适的密度种于黑边底透的96孔板中。16、24、72h药物处理的种板密度分别为8×103、8×103、4×103/100μL/孔;细胞种板培养18-24h后,HepG2细胞加入受试药物前16、24、72h,分别用新鲜培养基100、100、150μL/孔换液,再分别加入50、50、75μL/孔3×终浓度的受试药物工作液,培养箱中孵育。不同测试组合中受试药物孵育时间和使用的阳性对照药物详见表4。
表4.HepG2细胞表型参数实验检测条件
Figure BDA0002872477860000241
2.2.4应激反应细胞药物孵育处理
Hif1a-EGFP_CHO和P65-EGFP_CHO细胞用F12完全培养基(含10%胎牛血清(FBS)、100kU/L青/链霉素和0.5mg/ml G418),ATF6-EGFP_U2OS和Nrf2-EGFP_A549细胞用DMEM完全培养基(含10%FBS、100kU/L青/链霉素、0.5mg/mlG418和2mM L-谷氨酰胺)在37℃、5%CO2的细胞培养箱中培养。实验前,根据实验目的以合适的密度种于黑壁底透的96孔细胞培养板中。在短时间药物处理实验中,P65-EGFP_CHO、Hif1a-EGFP_CHO、ATF6-EGFP_U2OS、Nrf2-EGFP_A549细胞的种板密度分别为1×104、1×104、8×103、8×103/100μL/孔;24h药物处理实验,细胞种板密度分别为8×104,8×104,6×103/100μL/孔;细胞培养18-24h后,Hif1a-EGFP_CHO和Nrf2-EGFP_A549细胞用100μL/孔的新鲜培养液换液,ATF6-EGFP_U2OS细胞和P65-EGFP_CHO细胞用100μL/孔的分析培养液换液,并根据各个细胞系的测试要求,分别加入50μL/孔3×终浓度的受试药物\阳性对照药物工作液及溶剂(含与工作液相同浓度DMSO的培养液),再置于细胞培养箱中孵育相应的时间。不同细胞系具体实验条件见表5。
表5.应激反应通路细胞系实验条件
Figure BDA0002872477860000251
2.3细胞表型参数的荧光标记
2.3.1 HepG2细胞多参数荧光标记
在药物处理细胞后直接进行荧光标记,荧光标记方法可参见Long L,Li W,ChenW,Li FF,Li H,Wang L.Dynamic Cytotoxic Profiles of Sulfur Mustard in HumanDermal Cells Determined with Multiparametric High-Content Analysis[J].Toxicology Research 2016;5(2):583-93。
1)细胞核、微管相关蛋白1轻链3B(LC3B)蛋白、溶酶体和磷酸化组蛋白(pH2AX)荧光标记
药物处理细胞16h后直接加入50L/孔含细胞核(4M Hoechst33342)和溶酶体(200nM LysoTracker deepRed)染料的培养液,置于细胞培养箱中孵育30min;直接加入100L/孔固定液(含12%甲醛的PBS)室温固定20min;弃液,加入200L/孔透膜液(含0.1%Triton X-100的PBS溶液)透膜30min;弃液,使用200L/孔PBS溶液洗1次,再加入200L/孔封闭液(含5%的BSA的PBS溶液)室温孵育1h;弃液,加入40L/孔含小鼠抗pH2AX单克隆抗体的封闭液(1:1000封闭液稀释),4℃避光孵育过夜;弃液,使用100L/孔封闭液洗3次后加入40L/孔含兔抗LC3B单克隆抗体的封闭液(1:1000封闭液稀释),室温孵育1h;弃液,加入50L/孔含Alexa Flour 488标记的驴抗小鼠IgG二抗和Alexa Flour 549标记的驴抗兔IgG二抗的封闭液(均为1:500封闭液稀释),室温避光孵育1h;弃液,使用200L/孔PBS溶液洗3次,最后加入200L/孔PBS溶液,上机检测分析。
2)细胞核、线粒体膜电位(MMP)、锰超氧化物歧化酶(MnSOD)、核膜通透性(NMP)荧光标记
具体实验操作步骤如1)中所述。药物暴露处理细胞24h后加入50L/孔含细胞核、线粒体(2M MitoTracker Red CMXRos)和死细胞核(0.4M TOTO-3)染料的培养液,置于细胞培养箱中孵育30min;固定20min,透膜30min,封闭1h;分别使用含小鼠抗MnSOD单克隆抗体的封闭液(1:500封闭液稀释)和含Alexa Flour 488标记的驴抗小鼠IgG二抗的封闭液(1:500封闭液稀释)进行MnSOD的标记;最后标记好的细胞置于200L的PBS溶液中,上机检测分析。
3)细胞核、谷胱甘肽(GSH)和细胞骨架荧光标记
药物孵育24h后,使用HBSS溶液100L/孔洗1次,再加入100L/孔含细胞核和GSH染料的HBSS溶液(细胞核染料10mM Hoechst33342按每10mLHBSS溶液加入1L,GSH染料1mM CM-H2DCFDA按每10mL HBSS溶液加入10L),37℃孵育45min;室温固定液(含0.1%Triton X-100的HBSS溶液)固定20min,使用HBSS溶液洗1次,透膜30min,加入50L/孔含488标记鬼笔环肽微丝染料(27.5L Alexa 488-Phalloidin甲醇母液溶于5.5mL PBS溶液中)的PBS溶液,室温避光孵育1h;封闭1h,使用含40L/孔含小鼠a-抗微管蛋白单克隆抗体的封闭液(1:500封闭液稀释)和含Alexa Flour 549标记的驴抗小鼠IgG二抗的封闭液(1:500封闭液稀释)标记α-tubulin;最后标记好的细胞置于200L的PBS溶液中,上机检测分析。
4)细胞核、MMP、溶酶体(lysosome)和pH2AX检测标记
具体实验操作步骤如1)中所述。药物暴露处理72h后加入75L/孔含细胞核、线粒体和溶酶体染料的培养液,置于细胞培养箱中孵育30min;固定20min,透膜30min,封闭1h;使用含小鼠抗pH2AX单克隆抗体和含Alexa Flour 488标记的驴抗小鼠IgG二抗的封闭液标记pH2AX;最后标记好的细胞置于200L的PBS溶液中,上机检测分析。
2.3.2应激反应通路细胞的核标记
四种应激反应通路细胞在药物处理后,先加入75μL/孔室温预暖固定液(含12%甲醛的PBS),室温20min;PBS缓冲溶液洗后,加入1μM Hochst 33342的PBS,室温孵育1h,上机检测分析。
2.4图像采集及分析
使用高内涵成像系统In Cell Analyzer 1000/2000采集细胞荧光图像,各细胞表型对应的荧光检测通道设置如表6所示;采用20×物镜,每孔采集9个视野。使用IN CellAnalyzer Workstation中的Multi Target Analysis分析模块对采集的细胞图像进行分析,每个测试分析3孔共27个视野,不少200个细胞,各表型输出参数如表6所示,具体分析与表示方法如下:
HepG2细胞各参数测试值均是通过分析细胞荧光成像中特定表型的荧光强度、面积、数量获得。受试药物影响每个细胞表型的参数变化率(%)=(药物处理组-溶剂对照组)/溶剂对照组×100%或为(受试药物处理组-溶剂对照组)/(阳性药物处理组-溶剂对照组)×100%。
P65-EGFP_CHO和ATF6-EGFP_U2OS细胞为转录因子核转位的激活反应模式,细胞静息状态下,荧光标记的转录因子蛋白在胞浆中分布,被激活时,荧光标记标志分子转位至细胞核中,因此,通过定量分析细胞荧光蛋白的核转位数量即可表征该通路激活的程度。荧光蛋白的细胞核转位系数的计算公式为:R=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度)。
Hif1a-EGFP_CHO和Nrf2-EGFP_A549细胞为转录因子细胞内积累的激活反应模式。细胞静息状态下,荧光标记蛋白低表达,被激活时,荧光标记蛋白表达量升高甚至转移至细胞核中,表现为细胞中荧光强度增加。因此可以通过分析细胞核和/或细胞内累积荧光蛋白含量来表征相应通路的激活程度,蛋白细胞核或细胞的累积系数的计算公式为:R=受试药物处理细胞和/或细胞核内荧光蛋白的荧光强度-背景荧光强度。
表6.各个表型参数实验检测条件
Figure BDA0002872477860000271
Figure BDA0002872477860000281
2.5数据处理及统计学分析
2.5.1数据处理及主要分析方法
采用Excel软件进行数据处理,实验结果以3复孔的平均值及标准差(Means±sd)表示,并以每个96孔板的阴性和阳性对照组为标准,进行数据归一化处理。细胞抑制率IR(%)=(对照组细胞数-受试药物处理组细胞数)/对照组细胞数×100%;受试药物荧光蛋白激活率(%)=(受试药物处理组R值-溶剂对照组R值)/(阳性药处理组R值-溶剂对照组R值)×100%。细胞表型参数变化率(%)=(药物处理组-溶剂对照组)/溶剂对照组×100%或为(受试药物处理组-溶剂对照组)/(阳性药物处理组-溶剂对照组)×100%。
使用Origin 6.1软件(Sigmoidal Fit方法)计算EC50/IC50值,绘制ROC曲线(receiver operating characteristic curve)考察和评价表型参数及其组合与sDILI相关性。
表型参数高内涵测试方法的可靠性用Z'因子(Z'factor)评价,Z'因子=1-(3×阳性对照标准差-3×阴性对照标准差)/(对照均值-阴性对照均值)(参见Zhang XD,EspesethAS,Johnson EN,et al.Integrating experimental and analytic approaches toimprove data quality in genome-wide RNAi screens[J].J Biomol Screen 2008;13(5):378-89)。此外,分别采用GraphPad Prism 6.0、R语言、Mev软件进行实验结果散点图和柱状图等、热图、聚类图的绘制,采用单因素方差分析(One-way ANOVA)进行统计学检验,p<0.05视为有显著差异。
2.5.2敏感性、特异性和准确性计算方法
本研究使用两种方法对构建的肝毒性预测方法进行评价。第一种方法通过ROC(receiver operating characteristic curve)曲线分析获得方法的敏感性和特异性。ROC曲线分析得到的曲线越接近坐标轴左上角,方法的敏感性和特异性越高。另一种方法采用公式计算得到方法的敏感性、特异性及准确性结果(Parikh R,Mathai A,Parikh S,Chandra Sekhar G,Thomas R.Understanding and using sensitivity,specificity andpredictive values[J].Indian J Ophthalmol 2008,56(1):45-50):
敏感性=检出DILI阳性药物数量/DILI阳性药物总数×100%;
特异性=检出DILI阴性药物数量/DILI阴性药物总数×100%;
准确性为100%×(检出DILI阳性药物数量+DILI阴性药物数量)/(DILI阳性药物总数+DILI阴性药物总数)。
2.6预测sDILI药物的最佳细胞表型组合的识别和验证
Tclass系统是一个整合了Fisher线性判别分析方法和特征向前选择(featureforward selection)方法的分类系统(Wuju L,Momiao X.Tclass:tumor classificationsystem based on gene expression profile[J].Bioinformatics(Oxford,England)2002;18(2):325-6)。Tclass系统中的Fisher线性判别分析方法也可以替换为朴素贝叶斯(
Figure BDA0002872477860000302
Bayes)分类方法。为了获得预测sDILI药物的最佳表型组合,首先以测试集药物中sDILI和nDILI药物细胞表型LEC/Cmax值作为训练数据集,运用Tclass系统寻找一个或多个具有最强分类能力的特征组合。然后,将测试集数据按照3:1的比例随机分为两个部分,以较大部分数据作为训练数据构建分类器,以较小部分数据作为测试数据评价模型,该过程重复1000次,通过选择稳定性指数最高的候选特征组合,建立一个具有1000个分类器的DILI集成预测模型。最后用验证集药物的细胞表型LEC/Cmax值进行验证,最终确定DILI预测组合。具体的操作流程如图7所示。
三、实验结果
3.1基于细胞表型的HCA测试方法的可靠性分析
细胞表型的HCA测定内容包括:HepG2细胞11个细胞表型(cell count、nuclear、α-tubulin、F-actin、GSH、MnSOD、pH2AX、MMP、NMP、Lysosome、LC3B),细胞应激反应通路的4个通路(Hif1α、Nrf2、ATF6、NF-κB),考虑到一些细胞表型在药物处理不同时间其反映的细胞毒机制有所不同,因此,还在药物处理不同时间测定这些参数的变化,包括cell count、nuclear、pH2AX、MMP、Lysosome,Hif1α、Nrf2、NF-κB。为了考察上述细胞表型的HCA方法是否适合HTS(高通量药物筛选),我们计算了各测试方法的Z'因子值,如表7所示。
结果显示,除了Nrf2_6h为0.43,其它测试方法的Z'因子均大于0.5,表明本实验所采用的基于HCA细胞表型谱的测试方法是可靠的。
表7.基于HCA的细胞表型测试方法的Z'因子值
Figure BDA0002872477860000301
Figure BDA0002872477860000311
3.2测试集药物细胞表型谱的测定
首先,根据药物溶解性及细胞毒性,分别采用10、100μM或3、30μM的药物浓度分别在HepG2细胞和4个报告细胞系上进行进行了初筛。以同一测试中药物的细胞抑制率为横坐标,表型参数变化率为纵坐标绘制药物初筛结果的散点图,结果如图8、图9所示。以细胞表型参数变化率≥25%(纵坐标)为阳性反应、细胞抑制率(inhibition rate,IR)(纵坐标)≥15%为毒性临界值,判断药物影响细胞表型效应的类型。结果显示,在每一表型效应中,药物导致的阳性效应有两类:一是细胞毒非依赖的即特异性反应,也就是说,表型参数出现阳性变化不伴随细胞毒效应(IR<15%)出现;另一种是细胞毒依赖的即非特异性反应,即该表型参数出现阳性变化伴随细胞毒效应(IR≥15%)。测试集药物对20个细胞表型参数的初筛结果如表8所示,可以看出,相同表型在不同细胞状态(出现毒性和非毒性)下,有影响的药物数量不同;一些表型在药物处理早期引发变化的药物较多,如Hif1、Actin、LC3B,提示这些表型参数了药物引发的细胞扰动或适应性反应机制;此外,随着药物处理细胞时间的延长,细胞毒依赖的细胞表型参数改变增多,这与药物处理时间增加,细胞毒增强的结果相一致,但细胞毒依赖表型变化的药物与细胞毒非依赖表型变化的药物并不完全相同,说明时间点的表型变化代表的细胞毒的机制并不完全相同。
以细胞表型参数变化率≥45%为复检标准,各表型复筛的药物数量如表8所示,约占初筛阳性药物50%以上。这些药物选择5~7个浓度进行复筛,并计算EC50或IC50值。考虑到未进入复筛的药品数量占比较大,因此结合初复筛结果,确定药物最低起效浓度(lowesteffective concentration,LEC)。在本实验中,LEC为表型参数变化率约25%(而细胞抑制率是15%)的浓度。对EC50和LEC负对数值做热图(参见图10中的A),可以看出,在EC50/IC50图中,可获得EC50或IC50的数据点有493个,仅占总数据点的17.86%;可测出LEC的数据点为823个,占总数据点的29.82%。在两图中sDILI、mDILI两类药物可测得的比率相当,稍高于nDILI类药物,但差异有限,说明不同类型DILI药物,包括nDILI药物都会在体外影响多个细胞表型,也说明,仅基于药物在体外细胞表型的效应是不能区分DILI和非DILI药物。
表8.测试集药物细胞表型谱初筛结果汇总
Figure BDA0002872477860000321
3.3建模用细胞表型参数的选择
体外实验预测药物人体效应有一个体外效应内推体内效应的过程。一般认为,药物体外细胞毒浓度小于在体内暴露最大浓度(Cmax)的100倍为安全浓度(Falgun S,LouisL,Barton HA,et al.Setting Clinical Exposure Levels of Concern for Drug-Induced Liver Injury(DILI)Using Mechanistic in vitro Assays[J].ToxicologicalSciences An Official Journal of the Society of Toxicology 2015,147(2):500-14;O'Brien PJ,Irwin W,Diaz D,et al.High concordance of drug-induced humanhepatotoxicity with in vitro cytotoxicity measured in a novel cell-basedmodel using high content screening[J].Arch Toxicol 2006,80(9):580-604)。因此,我们用Cmax校正体外表型效应浓度,以TI(in vivo Toxicity Idex)表示,TI=体外表型效应浓度/Cmax。相应的,EC50和LEC对应的TI值分别以TI50和TILEC表示,数据绘制热图如图10中B所示。可以看出,sDILI、mDILI、nDILI类药物的TI50和TILEC值具有较强规律性,sDILI药物的TI值最低(以黄色为主)、mDILI次之,而nDILI药物值则较高(以蓝色为主);三类药物TI50和TILEC值分布(参见图10中的C和D)和统计学分析也证实上述事实,且sDILI、mDILI药物与nDILI药物间具有统计学差异。由此可见,药物体外细胞表型效应结合Cmax与临床DILI程度具有较好的相关性,说明,这些数据可以作为DILI预测建模的基础数据。
为了提高建模基础数据的质量,我们进一步考察了TI50、TILEC以及每个细胞表型与DILI相关性。以TI≥100,为体内肝毒性阴性,TI<100,为体内肝毒性阳性为标准,对测试集药物各个细胞表型效应进行定性判定,结果如图11中的A所示,红色表示DILI阳性。该结果与TI热图(图10中的C和D)基本一致,无论是以TI50还是TILEC为基础数据判定体内肝毒性阳性,都是sDILI药物最多,mDILI次之,而nDILI极少,sDILI和mDILI类与nDILI类相比具有统计学差异(参见图11的B和E);在此基础上,首先,我们以全部表型数据比较了基于TI50、TILEC数据预测临床DILI的特异性,结果如图11的D和G所示,可以看到,基于TI50数据,预测sDILI和mDILI类的敏感性较低,特异性较高(80%),而基于TILEC数据的敏感性较高,对于sDILI类药物最高可达90%,但特异性明显降低仅为39%;进一步考察所有参数的特异性,发现,基于TILEC数据预测时,除表型参数IR_72h、F-actin_24h、MMP_24h的特异性分别为70%、60%、75%,假阳性率较高外,其他参数特异性均95%及以上(参见图11的G)。提示,在以TILEC数据进行预测时,这三个参数的过于敏感。据此,我们去除这三个参数,并采用剩余参数的数据进行了表型与DILI的ROC曲线分析,结果与如图12和表9所示,相比于基于TI50数据,优化的基于TILEC值预测方法的ROC的AUC值更大,敏感性和特异性更高。因此,本实验将去除IR_72h、F-actin_24h、MMP_24h三个参数,用其它20个细胞表型参数的TILEC值作为建模数据。20个细胞表型参数为:1,nuclear_72h;2,MMP_72h;3,lysosome_72h;4,pH2AX_72h;5,nuclear_24h;6,α-tubulin_24h;7,GSH_24h;8,MnSOD_24h;9,NMP_24h;10,NF-κB_24h;11,Hif1α_24h;12,Nrf2_24h;13,nuclear_16h;14,LC3B_16h;15,Lysosome_16h;16,pH2AX_16h;17,NF-κB_0.67h;18,Hif1α_3h;19,ATF6_5h;20,Nrf2_6h。
表9.细胞表型参数TI50和TILEC值与临床DILI的ROC分析结果
Figure BDA0002872477860000341
3.4最优表型测试组合的识别及预测模型的构建
为了获得最优预测效能、且实用性、便捷性更强的细胞表型测试组合和预测模型,我们以DILI损伤效应最为明确的sDILI和肝损伤阴性(nDILI)两类药物的20个表型参数的TILEC值作为建模训练数据(包括50个sDILI样本和20个nDILI样本),采用Tclass分类系统,通过Fisher线性判别分析或朴素贝叶斯(
Figure BDA0002872477860000342
Bayes)分类结合特征向前选择(featureforward selection)方法对细胞表型参数进行识别和分类。将样本随机分为训练集(例如样本的75%)和测试集,计算在训练和测试集中正确分类的样本数,并计算精度(Train_ac)和稳定性(Test_ac)。精度定义为训练集样本中正确分类的样本的百分比;稳定性定义为测试集样本中正确分类的样本的百分比。选取训练精准度(Train_ac)和检测稳定性值(Test_ac)最高的一系列组合,如图13的A所示。由13个参数组成的测试组合1的Train_ac和Test_ac值最高,之后,随着测定组合参数的减少,精准度有所减低,稳定性至5个参数仍保持最高的水平,但7参数以上组合达到了近84%的精准度;ROC及统计学分析(参见图13的B)显示趋势一致(表10),13和11个参数组成的测试组合1和2的AUC曲线下面积最高,几乎一致,二者的敏感性和特异性相同,分别为86%和90%;而9,7,5,3个参数组合的特异性也都能达到90%,但敏感性逐步降低,分别为84%、82%、78%、74%。另外,根据多参数测试的便利性,如图13的A所示,相同颜色测试指标同一测试中实施,组合4(7个参数)仅由三个独立的测试实验组成,而组合3(9个参数)则需要4个实验,组合1(13个参数)组合2(11参数)均由6个测试实验组成;因此,我们确定组合1和组合4作为最佳的DILI预测检测组合,从而满足不同灵敏度需求时使用。
从样本中随机提取75%作为训练集,剩下25%作为测试集,随机提取1000次,得到“训练”和“测试”集的1000种不同分配,利用Fisher线性判别分析模型或朴素贝叶斯(
Figure BDA0002872477860000352
Bayes)分类模型构建1000个分类器,将这1000个分类器集成为DILI集成预测模型,将未知药物在上述确定的测试组合上获得的实验结果,输入模型,根据1000个分类器输出的结果,即可预测其DILI的潜力。根据1000个分类器输出的结果,得到1000个预测值(阳性或阴性),如果在1000个预测值中,有500个或500个以上的阳性值,则判断该样本为阳性,其概率为P/1000(P值为预测值为阳性的个数),否则为阴性。
表10.不同细胞表型参数组合盘ROC分析结果
Figure BDA0002872477860000351
注:CI为confidence interval。
3.5预测模型的验证
为了验证上述构建的模型的有效性,本实验用优选的表型测试组合测定了验证集药物(103个),分别进行了初筛和复筛,方法同3.2,结果见见表11和图14,获得了相应EC50、LEC,并结合人体暴露Cmax获得了TILEC值。验证集不同损伤类型药物中LEC和TILEC值热图如图15的A和B所示,与测试集药物相同,TILEC值与DILI损伤程度具有相关性。我们将验证集药物TILEC值输入DILI集成预测模型,进行DILI阳性参数判断,结果如图15的C所示,sDILI药物肝毒性阳性参数明显多于mDILI和aDILI药物,nDILI药物无肝毒性阳性参数。进一步,计算了验证集药物以2个最佳测试组合盘1和4测试的敏感性、特异性和准确率,结果如表12所示。测试组合盘1和4的特异性均为100%,准确性分别为88.1%和85.7%;此外,测试组合盘1对于验证组sDILI、mDILI和aDILI药物的敏感性分别为83.87%、54.84%和66.67%,而组合盘4也分别达到80.65%、51.61%和63.33%;与建模使用的测试组合的预测性能相当。表明,本公开建立的方法既具有良好的预测能力还具有重复性,是成功的。
表11.验证集药物在最佳测试组合盘初筛小结
Figure BDA0002872477860000361
Figure BDA0002872477860000371
表12.最佳测试组合对于测试集和验证集药物预测性能的比较
Figure BDA0002872477860000372
3.6预测模型的综合评价
本公开的测试组合1对于测试集和验证集药物sDILI和mDILI类预测的准确性在85.7~88.1%,特异性在90~100%,灵敏度分别在83.87~84%和54~54.84%之间;组合4虽略低,但特异性同组合1,对于测试集和验证集药物sDILI和mDILI类预测的准确性在82.86~85.7%,灵敏度分别在80~80.65%和48~51.61%之间。为了综合评价预测模型的能力,我们合并全部受试药物,考察了预测方法对于不同类型药物预测的敏感性。图16显示了基于组合1和组合4测试数据的DILI阳性参数的分布情况,可以看出本预测方法与DILI损伤类型具有较强的相关性。统计结果显示基于组合1(13参数)预测时,对于sDILI、mDILI和aDILI药物的敏感性分别为83.95%、54.32%和66.67%,特异性为93.55%,准确性为86.61%,其中iDILI类别药物的敏感性为70.97%;基于组合4(7参数)预测时,sDILI、mDILI和aDILI药物的敏感性分别为80.25%、49.38%和63.33%,特异性为93.55%,准确性为83.95%;其中对于iDILI类别药物的敏感性为61.29%,仅略低于组合1的结果。
RO2原则是指每日剂量daily dose≥100mg/day及logP≥3(Chen M,Tung CW,ShiQ,et al.A testing strategy to predict risk for drug-induced liver injury inhumans using high-content screen assays and the'rule-of-two'model[J].ArchToxicol 2014;88(7):1439-49)。为了考察RO2是否有助提高本模型的预测精度,将RO2作为一个独立参数纳入预测方法中,比较了结合RO2后对于预测性能的影响。结果如表13所示,RO2结合测试组合1,对于各类药物预测的灵敏度有轻度的提升,如对于sDILI、mDILI和aDILI类药物分别提高了1.24%,8.64%和3.33%,但对于iDILI药物影响相明显,增加了12.9%,但特异性和准确性有所下降;RO2结合测试组合4的结果类似。可见,RO2作为独立因素纳入预测参数组合,对预测的精准度影响不大,也提示,本公开基于细胞毒全表型谱测定获得的DILI药物的最佳测试组合已涵盖了DILI药物的RO2特性。鉴于iDILI危害极大,而评价iDILI药物时,RO2的结合可显著提高预测方法的敏感性,因此,对于iDILI药物预测可以结合药物RO2值。
表13.基于最佳测试组合1和4及结合RO2的预测方法的比较
Figure BDA0002872477860000381
此外,本公开还考察基于组合1测试预测模型对不同肝损伤类型药物的敏感性。结果如图17所示,对于胆汁淤积、肝细胞损伤与混合损伤型共有的药物敏感性最高(83.7%),其次是肝细胞损伤型(75.9%)、未知类型(73.1%),而胆汁淤积与混合型共有、胆汁淤积型、胆汁淤积与肝细胞损伤型共有药物的敏感性则分别为60%、58.3%、54.8%。结果提示,本实验建立的预测方法对胆汁淤积、肝细胞损伤与混合损伤型共有和肝细胞损伤型的药物预测能力较强。
3.7结论:
总之,本公开通过对临床肝损伤类型基本明确的223个药物细胞毒全表型谱的分析,结合人类暴露Cmax,采用HCA、基于机器学习TCLASS分类识别系统、ROC分析等技术和方法,通过建模、验证以及综合分析,创新性地建立了基于特定细胞表型组合(特定细胞表型模式)分析的体外肝毒性预测体系,具体而言构建了由7或13个细胞表型参数测试组合和由1000分类器组成的用于药物肝毒性预测的集成分类模型。该方法的敏感性、特异性和准确性分别为84%、94%、87%。该预测方法最多可通过3组细胞表型参数(LC3B+pH2AX、Nuclear+MnSOD+GSH+α-tubulin、Nuclear+MMP)和3个应激通路(Hif1a、ATF6和Nrf2)检测完成;当结合RO2原则时,对IDILI类药物预测的敏感性最高可达84%,本公开方法实现了基于体外细胞测试预测DILI,特别是iDILI预测的突破。
尽管本公开的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本公开的保护范围之内。本公开的全部分为由所附权利要求及其任何等同物给出。

Claims (12)

1.一种构建药物肝毒性预测模型的方法,包括:
收集n个已知的具有严重DILI(severe DILI,sDILI)和非DILI(non-DILI,nDILI)药物,收集药物的Cmax信息;
用不同浓度的药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值;
利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练,以构建药物肝毒性预测模型,
其中,n为大于或等于10的整数(例如大于或等于50,大于或等于60,例如55,60,65,70,80),
LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度,
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h,
优选地,所述机器学习模型为Fisher线性判别分析模型或朴素贝叶斯(
Figure FDA0002872477850000011
Bayes)分类模型。
2.权利要求1所述的方法,其中利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练包括:
从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,利用训练集对机器学习模型进行训练,构建药物肝毒性预测模型。
3.权利要求2所述的方法,其中利用sDILI和nDILI药物的特定细胞表型的TILEC值对机器学习模型进行训练包括:
从n个药物样本中随机提取55%~95%(例如60%,65%,75%,85%或90%)的样本作为训练集,随机提取m次,得到m个训练集,利用m个训练集分别对机器学习模型进行训练,构建得到m个药物肝毒性预测模型,将m个药物肝毒性预测模型集成为药物肝毒性集成预测模型,
其中m为大于或等于200的整数,例如300,400,600,800,1000,1200,1500,2000,
优选地,所述机器学习模型为Fisher线性判别分析模型或朴素贝叶斯(
Figure FDA0002872477850000021
Bayes)分类模型。
4.权利要求1-3任一项所述的方法,其中所述细胞选自肝细胞(例如HepG2细胞)、P65-EGFP_CHO、Hif1a-EGFP_CHO、ATF6-EGFP_U2OS、Nrf2-EGFP_A549或其任意组合,
优选地,所述细胞为肝细胞(例如HepG2细胞),细胞表型的参数变化率=(药物处理组荧光强度-溶剂对照组荧光强度)/溶剂对照组荧光强度×100%,或者细胞表型的参数变化率=(受试药物处理组荧光强度-溶剂对照组荧光强度)/(阳性药物处理组荧光强度-溶剂对照组荧光强度)×100%,其中,所述细胞表型参数选自LC3B,MnSOD,α-Tubulin,GSH,pH2AX,MMP;
优选地,所述细胞为肝细胞(例如HepG2细胞),细胞表型的参数变化率=(药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/溶剂对照组反应细胞核形态的数值×100%,或者细胞表型的参数变化率=(受试药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)/(阳性药物处理组反应细胞核形态的数值-溶剂对照组反应细胞核形态的数值)×100%,其中,所述细胞表型参数为细胞核;
优选地,所述细胞为P65-EGFP_CHO和/或ATF6-EGFP_U2OS,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=(受试药物处理细胞核中荧光蛋白的荧光强度-背景荧光强度)/(受试药物处理细胞胞质荧光蛋白的荧光强度-背景荧光强度);
优选地,所述细胞为Hif1a-EGFP_CHO和/或Nrf2-EGFP_A549,细胞表型的参数变化率=(药物处理组R值-溶剂对照组R值)/溶剂对照组R值×100%,或者细胞表型的参数变化率=(受试药物处理组R值-溶剂对照组荧光强度)/(阳性药物处理组R值-溶剂对照组R值)×100%,其中R值=受试药物处理细胞或细胞核内荧光蛋白的荧光强度-背景荧光强度。
5.一种药物肝毒性预测模型或药物肝毒性集成预测模型,其中:
药物肝毒性预测模型由权利要求1-2任一项所述的构建药物肝毒性预测模型的方法构建而成;
药物肝毒性集成预测模型由权利要求3所述的构建药物肝毒性预测模型的方法构建而成。
6.权利要求5所述的药物肝毒性预测模型或药物肝毒性集成预测模型在预测药物肝毒性中的用途。
7.一种预测药物肝毒性的方法,包括:
用不同浓度的待测药物处理细胞,通过HCA测定细胞的特定细胞表型的参数变化率,确定药物对每一个细胞表型的最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax,计算每一个细胞表型的TILEC值;
将待测药物的特定细胞表型的TILEC值输入权利要求1-2任一项所构建的药物肝毒性预测模型,判定待测药物是否具有肝毒性,或者
将待测药物的特定细胞表型的TILEC值输入权利要求3所构建的药物肝毒性集成预测模型,根据m个药物肝毒性预测模型输出的结果,得到m个预测值(即,判定药物的肝毒性为阳性或阴性),如果在m个预测值中,有50%以上判定为肝毒性为阳性,则判断该待测药物具有肝毒性,
其中LEC为引起细胞表型的参数变化率大于或等于25%的药物浓度,
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h。
8.一种预测药物肝毒性的系统,包括:高内涵分析(HCA)仪、计算模块和预测模块,
高内涵分析(HCA)仪用于测定用不同浓度的待测药物处理后细胞的细胞表型的参数变化率;
计算模块用于确定药物最低起效浓度(lowest effective concentration,LEC),并利用公式TILEC=LEC/Cmax计算TILEC值;
预测模块包括权利要求1-3任一项所构建的药物肝毒性预测模型或药物肝毒性集成预测模型,用于预测待测药物的肝毒性。
9.一种预测药物肝毒性的装置,包括:
存储器,被配置为存储指令;
处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如权利要求7所述的方法。
10.一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如权利要求7所述的方法。
11.特定细胞表型组合在预测药物肝毒性中的用途,其中所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h,或者
所述特定细胞表型组合包括:LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h,
优选地,所述特定细胞表型组合为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h和GSH_24h的组合,或者
所述特定细胞表型组合为LC3B_16h,MMP_72h,MnSOD_24h,nuclear_24h,α-tubulin_24h,nuclear_72h,GSH_24h,pH2AX_16h,ATF6_5h,Hif1α_3h,Nrf2_6h,Hif1α_24h和Nrf2_24h的组合。
12.权利要求11所述的用途,其中在预测药物肝毒性时,用不同浓度的药物处理细胞,通过HCA测定所述特定细胞表型组合中每个细胞表型的参数变化率,确定每个细胞表型的药物最低起效浓度(lowest effective concentration,LEC),利用公式TILEC=LEC/Cmax,计算每个细胞表型的TILEC值,利用特定细胞表型组合中每个细胞表型的TILEC值预测药物的肝毒性。
CN202011616758.XA 2020-12-30 2020-12-30 一种构建药物肝毒性预测模型的方法及其用途 Pending CN114694770A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011616758.XA CN114694770A (zh) 2020-12-30 2020-12-30 一种构建药物肝毒性预测模型的方法及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011616758.XA CN114694770A (zh) 2020-12-30 2020-12-30 一种构建药物肝毒性预测模型的方法及其用途

Publications (1)

Publication Number Publication Date
CN114694770A true CN114694770A (zh) 2022-07-01

Family

ID=82132390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011616758.XA Pending CN114694770A (zh) 2020-12-30 2020-12-30 一种构建药物肝毒性预测模型的方法及其用途

Country Status (1)

Country Link
CN (1) CN114694770A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480254A (zh) * 2022-02-25 2022-05-13 华中科技大学 HepaRG和HepG2构建的体外肝毒性替代模型及其构建方法与应用
CN115662538A (zh) * 2022-12-27 2023-01-31 北京晶泰科技有限公司 毒性预测模型的构建方法及预测模型、预测方法及装置
CN116026892A (zh) * 2023-03-29 2023-04-28 河北农业大学 水质检测方法、控制终端、水质检测系统及存储介质
CN116110509A (zh) * 2022-11-15 2023-05-12 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480254A (zh) * 2022-02-25 2022-05-13 华中科技大学 HepaRG和HepG2构建的体外肝毒性替代模型及其构建方法与应用
CN116110509A (zh) * 2022-11-15 2023-05-12 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置
CN116110509B (zh) * 2022-11-15 2023-08-04 浙江大学 基于组学一致性预训练的药物敏感性预测方法和装置
CN115662538A (zh) * 2022-12-27 2023-01-31 北京晶泰科技有限公司 毒性预测模型的构建方法及预测模型、预测方法及装置
CN116026892A (zh) * 2023-03-29 2023-04-28 河北农业大学 水质检测方法、控制终端、水质检测系统及存储介质

Similar Documents

Publication Publication Date Title
Proctor et al. Utility of spherical human liver microtissues for prediction of clinical drug-induced liver injury
CN114694770A (zh) 一种构建药物肝毒性预测模型的方法及其用途
Atienzar et al. Key challenges and opportunities associated with the use of in vitro models to detect human DILI: integrated risk assessment and mitigation plans
Persson et al. A high content screening assay to predict human drug-induced liver injury during drug discovery
Wink et al. High-content imaging-based BAC-GFP toxicity pathway reporters to assess chemical adversity liabilities
AU2015249113B2 (en) Lung cancer biomarkers and uses thereof
US9766249B2 (en) Compositions and methods for prediction of drug sensitivity, resistance, and disease progression
Tolosa et al. High-content screening technology for studying drug-induced hepatotoxicity in cell models
Chen et al. A testing strategy to predict risk for drug-induced liver injury in humans using high-content screen assays and the ‘rule-of-two’model
US20200309767A1 (en) High-throughput imaging-based methods for predicting cell-type-specific toxicity of xenobiotics with diverse chemical structures
Lee et al. Building predictive in vitro pulmonary toxicity assays using high-throughput imaging and artificial intelligence
US8658351B2 (en) Determining liver toxicity of an agent using metabolite biomarkers
US9201062B2 (en) Predicting toxicity of a compound over a range of concentrations
Howarth et al. HighVia—a flexible live-cell high-content screening pipeline to assess cellular toxicity
Ramm et al. A systems toxicology approach for the prediction of kidney toxicity and its mechanisms in vitro
Grimm et al. Multi-dimensional in vitro bioactivity profiling for grouping of glycol ethers
Rinaudo et al. 1 H NMR based profiling of spent culture media cannot predict success of implantation for day 3 human embryos
LU101772B1 (en) Non-invasive biomarkers for identification/prewarning of dairy cows with fatty liver disease
CN109781763A (zh) 一种卵母细胞质量评价方法
Montague et al. Screen for small molecules increasing the mitochondrial membrane potential
Gundert-Remy et al. Molecular approaches to the identification of biomarkers of exposure and effect—report of an expert meeting organized by COST Action B15
US20160138110A1 (en) Glioma biomarkers
CN109781764A (zh) 一种分析卵泡液代谢物与卵母细胞质量之间关系的方法
Reynolds et al. NMR spectroscopy of live human asthenozoospermic and normozoospermic sperm metabolism
US20240118291A1 (en) Diagnosis and treatment of autism spectrum disorders using altered ratios of metabolic concentrations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination