CN108885204B - 用于预测具有不同化学结构的异生物的细胞类型特异性毒性的基于高通量成像的方法 - Google Patents

用于预测具有不同化学结构的异生物的细胞类型特异性毒性的基于高通量成像的方法 Download PDF

Info

Publication number
CN108885204B
CN108885204B CN201680079245.5A CN201680079245A CN108885204B CN 108885204 B CN108885204 B CN 108885204B CN 201680079245 A CN201680079245 A CN 201680079245A CN 108885204 B CN108885204 B CN 108885204B
Authority
CN
China
Prior art keywords
cell
dna
h2ax
actin
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680079245.5A
Other languages
English (en)
Other versions
CN108885204A (zh
Inventor
L-H·洛
J·Y·李
R·苏
D·辛
S·熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN108885204A publication Critical patent/CN108885204A/zh
Application granted granted Critical
Publication of CN108885204B publication Critical patent/CN108885204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5014Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing toxicity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • G01N2001/302Stain compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10064Fluorescence image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Toxicology (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Cell Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了预测化合物的体内细胞特异性毒性的方法,该方法联合了培养细胞的高通量成像、定量表型概况分析和机器学习方法。更具体而言,本发明提供了预测可溶性或粒子化合物的体内近端肾小管、支气管上皮和肺泡细胞特异性毒性的方法,该方法包括使培养的人肾细胞和肺细胞与一个浓度范围内的该化合物接触,然后用DNA、yH2AX和肌动蛋白标志物标记该细胞,并且获得纹理特征、空间相关特征、标志物比率、强度特征、细胞计数和形态学,估计剂量反应曲线,并且使用随机森林算法进行该化合物的自动分类。

Description

用于预测具有不同化学结构的异生物的细胞类型特异性毒性 的基于高通量成像的方法
发明领域
本发明提供了联合培养细胞的高通量成像的预测化合物的体内细胞特异性毒性的方法。更具体而言,本发明提供了预测可溶性或粒子化合物的体内近端肾小管、支气管上皮和肺泡细胞特异性毒性的方法,该方法联合了培养的人肾细胞和肺细胞的高通量成像。
发明背景
肾脏和肺在从血浆中代谢和/或消除异生物中起重要作用。源自医药、食物或环境的外来化合物通过肾近端小管细胞(PTC)、支气管上皮细胞(BEC)和肺泡细胞(AVC)转运和代谢。摄取后,异生物及其代谢物/中间体可能会损害PTC、BEC和AVC;并导致急性肾/肺损伤或慢性肾/肺疾病。因此,预测PTC、BEC和AVC特异性毒性的准确方法对于异生物的安全性评估以及健康管理和这些化合物所造成的环境危害是至关重要的。
现有几种预测人体中异生物毒性的方法。动物试验是一种标准方法,但是存在周转时间长、通量低以及有时预测人体毒性差的问题(Krewski et al.,J Toxicol EnvironHealth Part B 13:51–138(2010))。这种方法特别不适于评价大量现有的且不断增加的新型合成化合物,比如化学品和纳米粒子。事实上,目前对动物试验替代方案的兴趣是由对大量具有不同化学结构和损伤机制的化合物进行有效测试的需求所驱动的。例如,这反映在现行立法中,例如欧盟的“《关于化学品注册、评估、许可和限制法案》”(REACH)(Lilienblumet al.,Arch Toxicol 82:211–236(2008))。定量结构-活性关系(QSAR)的计算建模是一种快速方法,适用于具有特定或彻底了解的化学结构或机制的化合物(Cherkasov et al.,JMed Chem 57:4977–5010(2014))。然而,大多数QSAR模型没有考虑化合物暴露的生物学背景,因此在预测具有不同化学结构的化合物的复杂生物反应(比如器官特异性毒性)方面具有有限的应用。最后,基于永生化的原代或干细胞衍生的人细胞的体外测定法可以提供在通量和生理相关性之间的平衡。
大多数现有的基于细胞的肾毒性测定法的基础是细胞死亡/健康终点(Lin andWill Toxicol Sci 126:114–127(2012);Jang et al.,Integr Biol 5:1119–1129(2013))或基因表达标志物(Hoffmann et al.,Toxicol Sci 116:8–22(2010))。然而,大多数目前的基于细胞的测定法要么测试的肾毒物很少(通常<5种)(Jang et al.,Integr Biol 5:1119–1129(2013);Tiong et al.,Mol Pharm 11:1933–1948(2014)),要么在大规模研究中对器官特异性毒性的预测很差(Lin and Will Toxicol Sci 126:114–127(2012))。因此,肾毒性的准确预测仍然具有挑战性,并且目前尚无监管批准的肾毒性体外试验。最近,我们开发了在永生化和原代人PTC(Li et al.,Toxicol Res 2:352–365(2013);Su etal.2014)、人胚胎干细胞(Li et al.,Mol Pharm 11:1982–1990(2014))和iPSC衍生的PTC样细胞(Kandasamy et al,.Sci Rep.doi:10.1038/srep12337(2015))中的基于化合物诱导的白细胞介素(IL)-6/8表达水平的肾毒性模型。我们使用大量(约30-40种)结构不同的化合物严格评估了这些模型的性能,其中包括非PTC毒性肾毒物和非肾毒性化合物作为阴性参考化合物。由于这些模型的测试准确度相对较高(约75.3%),我们假设可能存在通常由具有不同结构和靶标的PTC毒物引起的PTC特异性损伤。此外,对于高通量应用而言,在我们之前的研究中使用的IL-6/8测量的RNA分离和qPCR步骤的自动化是困难且昂贵的。因此,仍然需要开发替代的高通量、成本有效且准确的肾毒性预测方法,其还可以对由这些化合物诱导的细胞损伤和反应提供新的认识。
类似地,若干研究组已经尝试建立基于永生化细胞系和原代细胞的体外肺毒性模型(Seagrave等人,Exp Toxicol Pathol 57:233-238(2005);Sayes等人,Toxicol Sci 97(1):163-180(2007))。大多数这些模型使用乳酸脱氢酶(LDH)的释放或3-(4,5-二甲基噻唑-2-基)2,5-二苯基-四唑溴化物(MTT)还原的抑制作为毒性终点。然而,即使对于中等数量的肺毒性化合物(约5-10种),它们对体内毒性的预测也很差(Seagrave等人,ExpToxicol Pathol 57:233-238(2005);Sayes等人,Toxicol Sci 97(1):163-180(2007))。据我们所知,目前还没有能够准确预测大量(>20种)化合物的体内毒性的体外肺毒性模型。
异生物诱导的损伤损害了细胞功能并导致细胞表型的变化,比如细胞和亚细胞结构的重组和变化。在细胞表型的基础上预测毒性的主要优点之一是细胞损伤机制不需要预先定义。这对于建立可诱导相同类型的损伤和反应但生化机制不同的多种异生化合物的模型特别有用。基于特定机制的模型可能仅涵盖特定类别的化合物,并且通常不适用于其他化合物(Tiong et al.,Mol Pharm 11:1933–1948(2014))。以前的一些研究(O’Brien etal.,Arch Toxicol 80:580–604(2006);Abraham et al.J Biomol Screen 13:527–537(2008);Xu et al.,Toxicol Sci 105:97–105(2008);Tolosa et al.,Toxicol Sci 127:187–198(2012))和专利(Hong and Ghosh,Patent application number US 14/334,453(2015))已经使用成像来测量细胞表型的变化并预测异生化合物的毒性。这些先前的基于成像的毒性测定法有两个关键局限性。首先,它们中的大多数仅从细胞图像中提取空间独立性特征。两种最常用的空间独立性特征是细胞或亚细胞区中所有像素的强度值之和以及细胞或亚细胞区的面积(O’Brien et al.,Arch Toxicol 80:580–604(2006);Abraham etal.J Biomol Screen 13:527–537(2008);Xu et al.,Toxicol Sci 105:97–105(2008);Tolosa et al,.Toxicol Sci 127:187–198(2012);Hong and Ghosh,Patent applicationnumber US 14/334,453(2015))。在这些特征中,未考虑到各个像素的位置,即使底层像素的位置随机改组,也将给出完全相同的值。其次,这些测定法中的大多数仅基于提取特征的剂量反应曲线的半最大抑制浓度(IC50)、最小有效浓度(MEC)或其他基于浓度的参数或细胞死亡读出(O’Brien et al.,Arch Toxicol 80:580–604(2006);Abraham et al.J BiomolScreen 13:527–537(2008);Tolosa et al,.Toxicol Sci127:187–198(2012))。由于这两种局限性,这些先前的大多数工作在预测器官特异性毒性方面要么未予评价,要么获得非常差的性能。例如,O’Brien等人开发的基于成像的测定法将50种测试的对肝脏无毒但对其他器官有毒的化合物中的45种错误分类为肝毒性的(特异性=仅10%)。
发明概述
本发明提供了另一种高通量、成本有效且准确的细胞类型特异性毒性预测方法。
在本发明的第一方面,提供了预测测试化合物是否在体内会对特定细胞类型有毒的体外方法,该方法包括:
(a)使至少一个测试细胞群与单一浓度或一个浓度范围的该测试化合物接触,
(b)用一种或多种生物分子标志物标记该细胞并使其成像,
(c)分割该细胞并鉴定来自该细胞的全细胞区和一个或多个亚细胞区,
(d)确定在最高测试浓度下是否发生细胞丢失或死亡(如果是,则停止,并预测该化合物是有毒的),
(e)在该测试群体中获得一个或多个定量的空间依赖性表型特征和空间独立性表型特征,
(f)从这些特征获得多个剂量反应曲线(DRC),
(g)获得该DRC的经定量的参数,并且
(h)将该经定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
(i)对该细胞类型具有已知体内毒性的化合物,和(ii)未知对该细胞类型具有体内毒性的化合物。
在本发明的优选实施方案中,该方法包括:
(a)使多个测试细胞群接触;
(b)用一种或多种生物分子标志物标记该细胞并使其成像,
(c)分割该细胞并鉴定来自该细胞的全细胞区和一个或多个亚细胞区,
(d)确定在最高测试浓度下是否发生细胞丢失或死亡(如果是,则停止,并预测该化合物是有毒的),
(e)在该测试群体中获得一个或多个定量的空间依赖性表型特征和空间独立性表型特征,
(f)从这些特征获得多个剂量反应曲线(DRC),
(g)获得该DRC的经定量的参数,并且
(h)将该经定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
(i)对该细胞类型具有已知体内毒性的化合物,和(ii)未知对该细胞类型具有体内毒性的化合物。
在本发明方法的一个优选实施方案中,所述特定细胞类型选自下组,该组包括近端肾小管细胞(PTC)、支气管上皮细胞(BEC)和/或肺泡细胞(AVC)。
在本发明方法的一个优选实施方案中,步骤(h)包括将定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
在PTC的情况下;(i)具有已知体内PTC毒性的化合物,和(ii)具有肾毒性但未知体内PTC毒性的化合物以及未知体内肾毒性的化合物;或者
在BEC或AVC的情况下;(i)具有已知体内BEC或AVC毒性的化合物,和(ii)具有肺毒性但未知体内BEC或AVC毒性的化合物以及未知体内肺毒性的化合物。
本发明的优选实施方案提出了利用细胞的空间依赖性染色体和细胞骨架特征的测量、其最大反应值和级联自动分类算法来预测体内细胞特异性毒性的方法。
在本发明方法的一个优选实施方案中,所述一个或多个定量表型特征与选自下组的特性相关,该组包括DNA损伤反应、肌动蛋白丝完整性、全细胞形态和细胞计数。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征的定量基于(i)一个或多个选自下组的空间依赖性特征,该组包括在不同亚细胞区的纹理特征、空间相关特征和标志物比率;以及(ii)一个或多个选自下组的空间依赖性特征,该组包括强度特征、细胞计数和形态学。
在本发明方法的另一个优选实施方案中,细胞标志物选自下组,该组包括DNA、肌动蛋白以及在丝氨酸139上磷酸化的DNA损伤反应标志物组蛋白H2AX(γH2AX)。
在本发明方法的另一个优选实施方案中,使用针对每个表型特征的测试化合物的DRC的最大反应值Δmax来定量DRC参数。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征由以下项组成:内胞质区的总肌动蛋白强度水平、核区的DNA GLCM的平均角二阶矩(ASM)、全细胞区的γH2AX GLCM的相关性信息度量2的标准差和细胞计数。
在本发明方法的另一个优选实施方案中,使用随机森林算法预测肾毒性。
在本发明的第二方面,提供了使用体外经受测试化合物处理的测试细胞群来预测测试化合物的体内细胞毒性的计算机实施的方法,该方法包括:
(a)通过计算机处理器接收该测试细胞群的图像;
(b)通过该计算机处理器从该图像提取与该测试细胞群相关的一个或多个空间依赖性表型特征,该一个或多个空间依赖性表型特征表征了与该细胞相关的生物分子的空间分布;
(c)获得描述对应的一个或多个空间依赖性表型特征的剂量反应曲线(DRC)的一个或多个定量的DRC参数;并且
(d)将所述一个或多个定量的DRC参数输入到预测模型中,以生成该测试化合物的体内细胞毒性的预测。
在本发明方法的另一个优选实施方案中,所述图像包括多个图像,每个图像代表使用对应的成像通道成像的测试细胞群,该成像通道强调与细胞相关的一类生物分子。例如,对应的成像通道用于使靶向细胞内特定类型的生物组合物或分子的一类荧光标志物成像。
在本发明方法的另一个优选实施方案中,多个图像中的每一个代表靶向相应类型的生物分子的一类生物标志物的分布。
在本发明方法的另一个优选实施方案中,步骤(b)包括使用图像来分割细胞,并且使用对应于分割细胞的图像的强度值来提取一个或多个空间依赖性表型特征。
在本发明方法的一个优选实施方案中,一个或多个空间依赖性表型特征选自下组,该组包括表征细胞的DNA结构改变、染色质结构改变和肌动蛋白丝结构改变的特征。
在本发明方法的一个优选实施方案中,步骤(d)包括将测试化合物分类为对细胞有毒性或无毒性。
在本发明方法的优选实施方案中,使用经过一组训练数据训练的监督学习算法获得预测模型。
本发明的另一方面提供了具有计算机处理器和数据存储设备的计算机系统,所述数据存储设备存储由处理器操作的非临时性指令,以执行根据本发明任一方面的计算机实施的方法。
本发明的另一方面提供了非临时性计算机可读介质,所述计算机可读介质具有在其上存储的程序指令,用于使至少一个处理器执行根据本发明任一方面的计算机实施的方法。
附图简述
图1.显示参考异生化合物具有不同的化学结构。a)参考异生化合物的根据其来源或应用的分类。b)显示基于所有参考化合物之间的Tanimoto系数的化学结构相异性的多维标度图(MDS1/2=多维标度的第一和第二坐标,虚线=具有简单和相似化学结构的化合物簇。所有工业化学品与其他化合物一起被分组到这个簇中,而不考虑其已知的PTC毒性。该簇中的许多化合物彼此重叠。
图2.显示图像和数据分析程序的概述。
图3.显示用参考化合物处理的原代人近端小管细胞的基于定量图像的表型谱。a)免疫荧光图像,其显示在用DMSO对照或500μg/mL顺铂处理的原代PTC的HPTC-A数据集中使用的四种荧光标志物(比例尺=20μm)。b)从用不同浓度的桔霉素或DMSO处理的原代PTC测量的肌动蛋白强度值的初始变异系数(CV)的单细胞概率分布函数。肌动蛋白染色的示例性荧光图像显示在分布函数图上方(比例尺=20μm)。c)由三种参照化合物诱导的肌动蛋白强度的CV变化的剂量反应曲线(DRC)(赭曲霉毒素A和桔霉素是PTC毒性化合物,利巴韦林是非PTC毒性化合物)。每种化合物的最大反应值(Δmax)由其在5mM的反应曲线确定。d)显示从用44种参照化合物(列)处理的原代人PTC测量的所有129个表型特征(行)的Δmax值的热图。(树状图=基于Δmax值的化合物或特征的层次聚类,虚线=根据化合物聚类鉴定的两个主要簇之间的分离)。
图4.显示自动细胞分割。全帧免疫荧光图像的一个例子,显示了自动识别的原代人近端小管细胞的细胞边界(白线)和核边界(灰线)。触及图像边界的细胞不包括在我们的分析中。
图5.显示基于PTC的体外DNA和细胞骨架特征的人体内肾毒性预测。a)显示从所有129个表型特征中鉴定最佳单一特征(f最佳)的程序的示意图。基于最佳单一特征的分类器的测试平衡准确度,所述最佳单一特征来自HPTC-A数据集中的不同的b)特征标志物组或c)特征类型组。d)显示从所有129个表型特征中鉴定最佳特征子集(Fs)的程序的示意图。e)从10个交叉验证倍数之一中消除自动特征的输出的例子。显示了在我们的递归特征消除算法的每次迭代期间选择的特征子集的性能,从所有特征开始到最后保留的特征(灰点=在每次迭代期间保留的特征子集的测试平衡准确度,黑线=所有测试平衡准确度值的样条插值,黑点=具有最小数量的特征的局部最大值,水平虚线=以最后局部最大值为中心的高斯分布的上下5个百分位数或极限,白点=最终选择的特征子集的测试平衡准确度,其为具有最小数量的特征和在上限和下限之间的准确度值的子集。在这个例子中,最终选择的特征数量是四个(垂直虚线)。特征的任何进一步消除都会降低分类器的性能。f)在HPTC-A数据集的不同单特征分类器和多特征分类器之间的测试平衡准确度的比较。使用10x10倍交叉验证(误差条=平均值的标准误差)估计准确度值。g)显示HPTC-A数据集中所有参考化合物之间的基于它们的以Fs表示的欧几里德距离的表型相异性的多维标度图(MDS1/2=多维标度的第一和第二坐标)。
图6.显示由最佳单一特征表示的空间分布模式。显示由所有三个数据集的最佳单一特征(f最佳)表示的空间分布模式的示例性免疫荧光图像;a)DNA GLCM的平均熵,b)核区与全细胞区的总γH2AX水平的比率和c)DNA GLCM的平均相关性。显示了具有不同(左=低,中间=中等,和右=高)特征值的细胞。从图像定量的特征值显示在对应图像的下面。
图7.显示最终选择特征的平均重要值。使用针对三个数据集的10x10交叉验证程序估计的平均特征重要值。仅显示了前十个特征(黑条=最终选择特征(F最终),白条=其他十大特征。)特征名称以cellXpress格式显示,最终选择特征的详细说明包括在表3中。
图8.显示在体外条件下PTC毒物诱导的DNA损伤反应。来自HPTC-B数据集的示例性免疫荧光图像,其显示用环孢菌素A处理的原代人PTC的a)DNA和b)γH2AX染色水平(比例尺=20μm)。DNA的CV、DNA GLCM的ASM和平均核γH2AX水平的定量值显示在细胞下方的括号中。c)显示用不同剂量的环孢菌素A或DMSO处理的原代PTC的DNA的初始CV和平均核γH2AX水平的散点图(圆点=从图像定量的单细胞测量)。显示针对d)HPTC-B或e)HK-2数据集的以DNA的CV和平均核γH2AX水平表示的最大反应(Δmax)的散点图(圆形=化合物,Δμ=在PTC毒性和非PTC毒性化合物的平均值之间的差异,虚线=数据的最佳线性回归拟合,r=Pearson相关系数;显示的所有p值均从单侧t检验获得)。将选择的用于研究DNA损伤反应和细胞死亡之间的关系的六种化合物突出显示。f)标志物的分布,g)测试平衡准确度,h)测试灵敏度,和i)所有三个数据集的最佳单个和多个特征的测试特异性。
图9.显示用PTC毒性和非PTC毒性化合物处理的人HK-2细胞中的γH2AX和DNA染色模式。显示用五种PTC毒性化合物(左小图)、三种非PTC毒性化合物(右小图)和两种溶剂对照(右小图)处理的人HK-2细胞中的γH2AX和DNA染色模式的免疫荧光显微镜图像。来自相同标志物的所有图像具有相同的暴露时间和显示强度范围(比例尺=20μm)。
图10.显示PTC毒物诱导了可变的细胞死亡反应。a)显示用DMSO、顺铂和赭曲霉毒素A处理的原代人PTC的γH2AX、乙锭同型二聚体III、膜联蛋白V和切割的半胱天冬酶3染色水平的免疫荧光图像(比例尺=20μm)。b)显示如何确定乙锭III-、膜联蛋白V-和半胱天冬酶3-阳性细胞的阈值(垂直虚线)的概率密度函数图。c)显示乙锭III-、膜联蛋白V-或半胱天冬酶3-阳性细胞的百分比变化相对于平均核γH2AX水平的变化的散点图(圆形=化合物,误差条=平均值的标准误差,Δμ=在PTC毒性和非PTC毒性化合物的平均值之间的差异,虚线=数据的最佳线性回归拟合,r=Pearson相关系数;显示的所有p值均从单侧t检验获得)。
图11.参考肺毒性和非肺毒性化合物及其应用或来源的列表。
图12.显示肺毒性可溶性和粒子化合物诱导了我们的体外肺毒性模型的表型变化。a)显示用四种荧光标志物染色并用DMSO(溶剂对照,顶部)、2mM硝基呋喃托英(中间)和1mg/mL气相二氧化硅(底部)处理的人肺细胞的免疫荧光图像。这些化合物诱导了DNA损伤反应标志物γH2AX的磷酸化的变化和肌动蛋白的重塑。已知硝基呋喃托英和气相二氧化硅在人类中分别引起肺部疾病和矽肺。b)从七个亚细胞区自动测量表型特征。
图13.显示基于BEC和AVC的体外DNA、γH2AX和肌动蛋白特征的人体内肺毒性预测。可溶性和粒子状化合物分别在a)A549和b)BEAS-2B中的五个最佳单一特征f最佳
图14.显示可溶性化合物在BEAS-2B细胞中的以f最佳表示的空间分布模式的免疫荧光图像。显示了用不同浓度的硝基呋喃托英处理的细胞的图像(左=对照,中间=低,右=高)。从细胞测量的相应特征值显示在图像下方。
图15.显示粒子化合物在BEAS-2B细胞中的以f最佳表示的空间分布模式的免疫荧光图像。显示了用不同浓度的二氧化硅粒子处理的细胞的图像(左=对照,中间=低,右=高)。从细胞测量的相应特征值显示在图像下方。
发明详述
在本发明中,我们使用空间依赖性特征来自动预测异生化合物的体内PTC毒性。在本文提供的实施例中,我们使用空间依赖性特征来自动预测异生化合物的体内肾毒性和肺毒性。
为了方便,以参考文献列表的形式列出在本说明书中提及的参考文献并附加在实施例的末尾处。将这样的参考文献的全部内容通过提述并入本文。
定义
为方便起见,在此收集了在说明书、实施例和所附权利要求中使用的某些术语。
如本文中使用的,如本文中使用的“测试灵敏度”是指根据测试为阳性的已知具有肾毒性、肺毒性或对另一种特定组织的体内毒性的化合物的数量,其为所有已知具有肾毒性、肺毒性或经测试对所述另一种特定组织具有毒性的化合物的百分比。
如本文中使用的,如本文中使用的“测试特异性”是指根据测试为阴性的已知没有肾毒性、肺毒性或对另一种特定组织的体内毒性的化合物的数量,其为所有已知非肾毒性、非肺毒性或经测试对所述另一种特定组织无毒性的化合物的百分比。例如,所述另一种组织可包括心脏细胞、神经元细胞或癌细胞。
如本文中使用的,“空间依赖性表型特征”是从用生物分子标志物标记的细胞的显微镜图像鉴定的全细胞或亚细胞区中的像素强度值的定量的空间依赖性测量或统计。换句话说,空间依赖性表型特征表征与细胞相关的生物分子的空间分布。这样的特征的值取决于像素的亚细胞定位和空间分布。如果像素的位置被修改(例如通过随机改组),则这样的特征的值将改变。否则,它们被称为“空间独立性表型特征”。空间依赖性特征的例子是纹理特征、标志物之间的空间相关性、以及在不同亚细胞区的标志物的强度比。空间独立性特征的实例是细胞计数、形态学、以及全细胞或亚细胞区的强度的总和、平均值、标准差或变异系数。
在本发明的上下文中使用的术语“包含”是指可以在实施本发明中共同使用的各种组分、成分或步骤的情况。因此,术语“包含”涵盖更具限制性的术语“基本上由……组成”和“由……组成”。关于术语“基本上由……组成”,应理解的是,本发明的表型特征“基本上”包括作为“必需”要素的指示特征。
虽然在本文中公开的实施方案涉及预测化合物是否具有肾毒性或肺毒性,但是也可以使用本文中公开的方法确定其他类型的细胞毒性。例如,可以使用癌细胞来筛选抗癌剂,可以使用心肌细胞来研究心脏毒性,可以使用真皮细胞来研究皮肤毒性,并且可以使用神经元细胞来研究神经毒性。
在本发明的第一方面,提供了预测测试化合物是否在体内会对特定细胞类型有毒的体外方法,该方法包括:
(a)使至少一个测试细胞群与单一浓度或一个浓度范围内的该测试化合物接触,
(b)用一种或多种生物分子标志物标记该细胞并使其成像,
(c)分割该细胞并鉴定来自该细胞的全细胞区和一个或多个亚细胞区,
(d)确定在最高测试浓度下是否发生细胞丢失或死亡(如果是,则停止,并预测该化合物是有毒的),
(e)获得在该测试群体中的一个或多个定量的空间依赖性表型特征和空间独立性表型特征,
(f)从这些特征获得多个剂量反应曲线(DRC),
(g)获得该DRC的经定量的参数,并且
(h)将该经定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
(i)对该细胞类型具有已知体内毒性的化合物,和(ii)未知对该细胞类型具有体内毒性的化合物。
在本发明的优选实施方案中,该方法包括:
(a)使多个测试细胞群接触;
(b)用一种或多种生物分子标志物标记该细胞并使其成像,
(c)分割该细胞并鉴定来自该细胞的全细胞区和一个或多个亚细胞区,
(d)确定在最高测试浓度下是否发生细胞丢失或死亡(如果是,则停止,并预测该化合物是有毒的),
(e)在该测试群体中获得一个或多个定量的空间依赖性表型特征和空间独立性表型特征,
(f)从这些特征获得多个剂量反应曲线(DRC),
(g)获得该DRC的经定量的参数,并且
(h)将该经定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
(i)对该细胞类型具有已知体内毒性的化合物,和(ii)未知对该细胞类型具有体内毒性的化合物。
在本发明方法的一个优选实施方案中,所述特定细胞类型选自下组,该组包括近端肾小管细胞(PTC)、支气管上皮细胞(BEC)和/或肺泡细胞(AVC)。
在本发明方法的一个优选实施方案中,步骤(h)包括将定量的DRC参数与一组参考定量的DRC参数数据进行比较;所述参考定量的DRC参数数据衍生自两个组;
在PTC的情况下;(i)具有已知体内PTC毒性的化合物,和(ii)具有肾毒性但未知体内PTC毒性的化合物以及未知体内肾毒性的化合物;或者
在BEC或AVC的情况下;(i)具有已知体内BEC或AVC毒性的化合物,和(ii)具有肺毒性但未知体内BEC或AVC毒性的化合物以及未知体内肺毒性的化合物。
在本发明方法的一个优选实施方案中,所述一个或多个定量表型特征与选自下组的特性相关,该组包括DNA损伤反应、肌动蛋白丝完整性、全细胞形态和细胞计数。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征的定量基于(i)一个或多个选自下组的空间依赖性特征,该组包括在不同亚细胞区的纹理特征、空间相关特征和标志物比率;以及(ii)一个或多个选自下组的空间依赖性特征,该组包括强度特征、细胞计数、形态学。纹理特征可以包括但不限于Haralick特征、Gabor特征或小波特征。
在本发明方法的另一个优选实施方案中,使用针对来自测试化合物的DRC的每个特征的最大反应值Δmax来定量DRC参数。优选地,将三次重复测试的中位值Δmax值用于预测分析。
在本发明方法的另一个优选实施方案中,所述纹理特征包括下列各项的统计数据的一项或多项:在特定亚细胞或全细胞区的Haralick灰度共生矩阵(GLCM),即,核区的DNAGLCM的平均相关性;核区的DNA GLCM的平均熵;核区的DNA GLCM的平均角二阶矩;核区的DNA GLCM的和方差的标准差;全细胞区的肌动蛋白GLCM的平均和熵;全细胞区的肌动蛋白GLCM的平均熵;全细胞区的丝氨酸139上磷酸化的DNA损伤反应标志物组蛋白H2AX(γH2AX)的γH2AX GLCM的相关性信息度量2的标准差;以及全细胞区的γH2AX GLCM的平均和平均值。优选地,肌动蛋白标志物是F-肌动蛋白。
在本发明方法的另一个优选实施方案中,所述染色强度特征选自下组的一项或多项,该组包括全细胞区的DNA和肌动蛋白强度之间的归一化空间相关系数;内胞质区的总肌动蛋白强度水平;全细胞区的DNA和γH2AX强度之间的归一化空间相关系数;以及核区的DNA强度的变异系数。
在本发明方法的另一个优选实施方案中,所述染色强度比特征选自下组的一项或多项,该组包括全细胞区的总γH2AX与DNA强度的比值;核区的总γH2AX与肌动蛋白强度的比值;以及核区与全细胞区的总γH2AX强度水平的比值。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征选自下组,该组包括全细胞区的肌动蛋白GLCM的平均和熵;核区的DNA强度的变异系数(CV);全细胞区的肌动蛋白GLCM的平均熵;以及核区的DNA GLCM的平均角二阶矩(ASM)。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征选自下组,该组包括:内胞质区的总肌动蛋白强度水平、核区的DNA GLCM的平均角二阶矩(ASM)、全细胞区的γH2AX GLCM的相关性信息度量2的标准差和细胞计数。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征选自下组,该组包括全细胞区的DNA和γH2AX强度之间的归一化空间相关系数;全细胞区的DNA和肌动蛋白强度之间的归一化空间相关系数;全细胞区的γH2AX GLCM的平均和平均值;全细胞区的总γH2AX与DNA强度的比值;以及核区的DNA GLCM的和方差的标准差。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征选自下组,该组包括核区的DNA GLCM的平均熵;核区与全细胞区的总γH2AX强度水平的比值;肌动蛋白GLCM的平均相关性;以及核区的DNA GLCM的平均相关性。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征由下组组成:全细胞区的肌动蛋白GLCM的平均和熵;核区的DNA强度的变异系数(CV);全细胞区的肌动蛋白GLCM的平均熵;以及核区的DNA GLCM的平均角二阶矩(ASM)。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征由下组组成:内胞质区的总肌动蛋白强度水平、核区的DNA GLCM的平均角二阶矩(ASM)、全细胞区的γH2AX GLCM的相关性信息度量2的标准差和细胞计数。
在本发明方法的另一个优选实施方案中,所述一个或多个表型特征由下组组成:全细胞区的DNA和γH2AX强度之间的归一化空间相关系数;全细胞区的DNA和肌动蛋白强度之间的归一化空间相关系数;全细胞区的γH2AX GLCM的平均和平均值;全细胞区的总γH2AX与DNA强度的比值;以及核区的DNA GLCM的和方差的标准差。
在本发明方法的另一个优选实施方案中,步骤(b)包括使用荧光、同位素或比色标志物和成像技术获得定量的表型特征。标志物可用于检测DNA、染色质、肌动蛋白丝,并且通常使全细胞染色。例如,这些生物分子可以通过用荧光蛋白将它们加标签来进行遗传标记。例如,可使用抗体来检测在丝氨酸139上磷酸化的DNA损伤反应标志物组蛋白H2AX(γH2AX),或者可以用如下染料将细胞染色:标记DNA的4',6-二脒基-2-苯基吲哚(DAPI)或2,5'-Bi-1H-苯并咪唑(Hoechst 33342);标记肌动蛋白细胞骨架的罗丹明鬼笔环肽或DylightTM 554鬼笔环肽;以及HCS CellMaskTM深红染料或全细胞红染料;活性染料,其与细胞表面和内容物结合,为荧光成像中的固定细胞提供完整均匀的可视化。可以使用全细胞染料来鉴定单独的细胞并计数,并且定义应用图像分析的细胞区。
优选地,所述成像技术包括高通量显微镜图像捕获,其后可以进行计算机辅助定量和处理。本文中公开了代表性例子。
在本发明方法的另一个优选实施方案中,使用任何适合的监督学习算法预测了细胞毒性,更优选肾毒性或肺毒性。优选地,使用随机森林算法(参见实施例以及图1和图2)、支持向量机或神经网络来执行预测。更优选地,使用随机森林算法来执行预测。
在本发明方法的另一个优选实施方案中,至少一个测试细胞群(更优选近端肾小管细胞、BEC和AVC)可以衍生自体细胞。更优选地,包括近端肾小管细胞、BEC和AVC的至少一个测试细胞群来自哺乳动物体细胞,并且是原代细胞或来自稳定细胞系的细胞。
在本发明方法的另一个优选实施方案中,近端肾小管细胞是人原代近端肾小管细胞、HK-2细胞或本领域已知的任何其他适合的细胞系。
在本发明方法的另一个优选实施方案中,至少一个测试细胞群是人原代细胞、永生化细胞、胚胎干细胞衍生的细胞、诱导的多能干细胞衍生的细胞或本领域已知的任何其他适合的细胞系。
在本发明方法的另一个优选实施方案中,BEC和AVC是人原代肺泡或支气管上皮细胞、永生化细胞、胚胎干细胞衍生的细胞、诱导的多能干细胞衍生的细胞或本领域已知的任何其他适合的细胞系。
在本发明方法的另一个优选实施方案中,所述接触进行至少1-48小时或更长的一段时间。优选地,使细胞与测试化合物接触约8-24小时的时间,更优选约16小时的时间。
与细胞接触的测试化合物的实际浓度将取决于待测试的特定化合物的性质。在本发明方法的一个优选实施方案中,所述接触包括将测试化合物以约1μg/ml至约1000μg/ml的浓度添加至近端肾小管细胞的测试群;或者,将约31μM至约2mM的可溶性化合物和约16μg/mL至约1mg/mL的粒子化合物添加至支气管上皮细胞和肺泡细胞的测试群。优选地,使用这样的浓度,以便从测试化合物的剂量反应曲线获得每个特征的最大反应值Δmax。在根据本发明的方法中,有可能使用单剂量的测试化合物;不过同时在一些列浓度范围内测试化合物是优选的。
在本发明的另一个实施方案中,提供了使用体外经受测试化合物处理的测试细胞群来预测测试化合物的体内细胞毒性的计算机实施的方法,该方法包括:
(a)通过计算机处理器接收该测试细胞群的图像;
(b)通过该计算机处理器从该图像提取与该测试细胞群相关的一个或多个空间依赖性表型特征,该一个或多个空间依赖性表型特征表征了与该细胞相关的生物分子的空间分布;
(c)获得描述对应的一个或多个空间依赖性表型特征的DRC的一个或多个定量的DRC参数;和
(d)将所述一个或多个定量的DRC参数输入到预测模型中,以生成该测试化合物的体内细胞毒性的预测。
在本发明方法的一个优选实施方案中,所述细胞是近端肾小管细胞(PTC)、支气管上皮细胞(BEC)或肺泡细胞(AVC)。
在本发明方法的一个优选实施方案中,一个或多个空间依赖性表型特征选自下组,该组包括表征细胞的DNA结构改变、染色质结构改变和肌动蛋白丝结构改变的特征。
在另一个例子中,该方法可以进一步包括提取与测试细胞群相关的一个或多个空间独立性表型特征,其中进一步使用一个或多个空间独立性表型特征获得一个或多个定量的DRC参数。
在如图2所示的又另一个例子中,在计算定量的表型特征之前评估由于测试化合物的毒性导致的细胞死亡水平。具体而言,该方法可以包括在执行步骤(c)和(d)之前评估一个或多个最高浓度的测试化合物的细胞死亡水平是否满足预定标准例如细胞死亡水平是否超过预定阈值的步骤。例如,这种方法可以应用于与特定细胞类型如肺细胞相关的细胞数据。
在本发明方法的一个优选实施方案中,步骤(d)包括将测试化合物分类为对细胞有毒性或无毒性。
本发明的另一方面提供了具有计算机处理器和数据存储设备的计算机系统,所述数据存储设备存储由处理器操作的非临时性指令,以执行根据本发明任一方面的计算机实施的方法。
本发明的另一方面提供了非临时性计算机可读介质,所述计算机可读介质具有在其上存储的程序指令,用于使至少一个处理器执行根据本发明任一方面的计算机实施的方法。
本领域技术人员将理解,可以根据本文中给出的方法在不进行过度实验的情况下实施本发明。所述方法、技术和化学品正如在给出的参考文献中或在标准生物技术、细胞生物学和免疫组织化学教科书中的方案中所述。
实施例
用于肾毒性研究的参考化合物
对于HPTC-A数据集(DNA/RelA/肌动蛋白/WCS),我们使用了44种异生化合物。“PTC毒性”组有已知损伤人近端小管细胞(PTC)的24种肾毒物,“非PTC毒性”组有未知损伤PTC的12种肾毒物和8种非肾毒物(关于大多数化合物的PTC毒性的详细信息可以在我们的报告中找到(Li et al.,Mol Pharm11:1982–1990(2014);Kandasamy et al.,Sci Rep.doi:10.1038/srep12337(2015))。对于HPTC-B和HK-2数据集(DNA/γH2AX/肌动蛋白/WCS),使用了42种化合物(不包括醋酸铅和氢化可的松)。将化合物以50mg/mL的储备浓度溶解在DMSO中,或以10mg/mL的储备浓度溶解在水中。表1中提供了参考化合物及其来源、溶剂和已知的人肾和肝毒性的完整列表。
表1:参考肾毒性化合物.
Figure BDA0001733500480000171
Figure BDA0001733500480000181
Figure BDA0001733500480000191
细胞培养和化合物处理
对于HPTC-A和-B数据集两者,我们使用来自三个不同供体的三个不同批次的原代人PTC。其中两个(HPTC1和HPTC10;批号分别为58488852和61247356)购自美国典型培养物保藏中心(ATCC,Manassas,VA,USA)。从人肾切除术样品(National University HealthSystem,Singapore)分离第三批细胞(HPTC6)。仅使用由病理学家确定的没有异常病理变化的正常组织。获得了处理原代人肾样品(DSRB-E/11/143)和细胞(NUS-IRB参考代码:09-148E)的伦理审批。所有三批原代PTC都在补充有肾上皮细胞生长试剂盒(ATCC)和1%青霉素/链霉素(Gibco,Carlsbad,CA,USA)的肾上皮细胞基础培养基(ATCC)中培养。在本研究中仅使用原代PTC的传代(P)4和P5。对于HK-2数据集,将HK-2细胞系(ATCC)维持在补充有10%胎牛血清(FBS)(Gibco)和1%青霉素/链霉素的达尔伯克改良伊格尔培养基(DMEM)中。
将细胞接种到具有透明底部的384孔黑色平板(Greiner,Kremsmünster,Austria)中。在过夜药物处理(16小时)之前,将所有细胞培养3天以实现分化肾上皮的形成(Li etal.,Toxicol Res 2:352–365(2013))。测试化合物的剂量为1.6、16、63、125、250、500、1000μg/mL。每个平板上包括阳性对照、阴性对照和媒介物对照(DMSO或水,取决于测试化合物的溶剂)和未处理的细胞。对每一化合物和剂量进行四次技术重复。
免疫染色
在化合物处理16小时后,使用含3.7%甲醛的磷酸盐缓冲盐水(PBS)固定细胞。用含有5%牛血清白蛋白(BSA)和0.2%Triton X-100的PBS封闭细胞1小时。将样品与2μg/mL的针对γH2AX(磷酸化S139)的小鼠单克隆抗体(Abcam,Cambridge,MA,USA)或1μg/mL的针对RelA的兔多克隆抗体(Abcam)在室温下温育1小时。随后,将细胞与5μg/mL的与Alexa488缀合的山羊抗小鼠二级抗体(Abcam)或与Alexa488缀合的山羊抗兔二级抗体(LifeTechnologies,Carlsbad,CA,USA)温育。最后,用4ng/mL的DAPI(Merck Millipore,Darmstadt,Germany)、罗丹明鬼笔环肽(Life Technologies)和全细胞红色染料(LifeTechnologies)将细胞染色。
细胞凋亡和坏死测定
将细胞接种到具有透明底部的96孔黑色平板(Falcon,Corning,NY,USA)中,并在过夜药物处理(16小时)之前培养3天。用1000μg/mL的顺铂、环孢菌素A、赭曲霉毒素A、林可霉素、氯化锂和利巴韦林处理它们。在每个平板上包括未处理的细胞和媒介物对照(DMSO和水)以及阳性对照(25μg/mL氧化砷(III))和阴性对照(100μg/mL地塞米松)。对每种处理条件进行三次技术重复。
使用切割的半胱天冬酶3(Abcam)和凋亡/坏死/健康细胞检测试剂盒(PromoKine,Heidelberg,Germany)来鉴定凋亡的和坏死的细胞。对于切割的半胱天冬酶3,使用与上文概述相同的免疫染色方案。将兔多克隆抗切割的半胱天冬酶3抗体在封闭缓冲液中稀释,并与固定的细胞在室温下温育1小时。然后将细胞与5μg/mL的与Alexa 488缀合的山羊抗兔二级抗体温育。最后,将细胞用4μg/mL的DAPI和全细胞红色染料复染。对于凋亡/坏死/健康细胞检测试剂盒,使用制造商提供的方案。
图像采集
使用ImageXpress Micro XLS系统(Molecular Devices,Sunnyvale,CA,USA)用20x物镜进行成像。使用四种不同的通道对DAPI、Alexa 488、德克萨斯红(Texas Red)和Cy5荧光成像。以每孔九个部位成像。图像以16位TIFF格式保存。
图像分割和特征提取
为了减少不均匀的背景照明,我们使用ImageJ(NIH,v1.48)中实施的“滚球”算法校正了图像(Sternberg Computer 16:22–34(1983))。使用cellXpress软件平台(Bioinformatics Institute,v1.2)进行细胞分割和特征测量(Laksameethanasan etal.,BMC Bioinformatics 14Suppl 16:S4(2013))。我们从图像中提取了129个特征,其中包括78个Haralick纹理特征、29个强度特征、9个强度比特征、6个相关性特征、6个形态学特征和细胞计数。
Haralick纹理特征
在Haralick的原创论文中描述了所有Haralick纹理特征的数学定义(Haralicket al.,IEEE Trans Syst Man Cybern SMC-3:610–621(1973))。在这里,我们仅提供包括在最终特征集中的Haralick特征的数学定义。灰度共生矩阵(GLCM)是描述具有Ng灰度的Nx×Ny图像I(x,y)中处于给定偏移(Δx,Δy)的共生灰度值的分布的矩阵。在我们的符号中,x和y分别是行和列索引。GLCM矩阵如下定义
Figure BDA0001733500480000211
其中i和j是图像的灰度值或强度值。归一化的GLCM矩阵是
Figure BDA0001733500480000212
然后,我们将边缘概率矩阵及和概率矩阵设为
Figure BDA0001733500480000213
Figure BDA0001733500480000214
Figure BDA0001733500480000215
其中k=2,3,…,2Ng.
Haralick特征为:
a)角二阶矩:
Figure BDA0001733500480000221
b)相关性:μx,其中μx、μy、σx和σy分别是px(j,Δx,Δy)和py(i,Δx,Δy)的平均值和标准差。
c)和平均:
Figure BDA0001733500480000222
d)和方差:
Figure BDA0001733500480000223
e)和熵:
Figure BDA0001733500480000224
f)熵:
Figure BDA0001733500480000225
g)相关性信息度量2:
Figure BDA0001733500480000226
其中
Figure BDA0001733500480000227
在我们的研究中,图像是分割细胞周围的边界框,其中所有背景像素都设置为零。我们将图像定量为Ng=256个灰度,并计算了0度(Δx=0,Δy=1)、45度(Δx=1,Δy=1)、90度(Δx=1,Δy=0)和135度(Δx=1,Δy=-1)偏移的所有Haralick特征。对于每个特征,使用在所有偏移值上的特征的平均值和标准差。我们已经使用在cellXpress软件平台(Bioinformatics Institute,v1.2)中的C++实现了所有特征能的提取程序(Laksameethanasan et al,.BMC Bioinformatics 14Suppl 16:S4(2013))。
浓度反应曲线和Δmax估计
在特征提取之后,我们用所有测试化合物浓度下的特征值除以在相应媒介物对照条件下的特征值。然后,将比值进行log2转换(Δ)。所有进一步的数据分析,包括建立浓度反应曲线和毒性分类器在内,都是在R统计环境(R基础,v3.0.2)和Windows 7操作系统(Microsoft,USA)下使用定制脚本进行的。
对于每个特征,我们使用标准对数逻辑模型估计其浓度反应曲线(DRC):
Figure BDA0001733500480000228
其中x是异生化合物浓度,e是下限c和上限d之间的反应半程,b是周围的相对斜率。我们使用在R环境下的“drc”库(v2.3-96)来拟合b、c、d和e的值。之后,使用估计的反应曲线确定最大反应值(Amax)。理论上,Δmax应等于上限d。然而,在实践中,即使在最高测试剂量下,一些化合物的反应也可能不平稳,因此估计的d值可能不准确。相反,我们将Δmax固定为5mM的反应值,这大致是我们大多数化合物的最高测试浓度。最后,计算三个生物学重复的Δmax的中位值。最终结果是Δmax值的129×44(或42)矩阵,其用于训练和测试分类器。矩阵的每个列是特征向量,fi,其中i=1,2,…,129。
特征归一化
在数据分类之前,每个特征向量fi被归一化到相同的范围[-1,1]:
Figure BDA0001733500480000231
其中fmin和fmax是特征的最小值和最大值。为了确保训练数据集和测试数据集彼此独立,这两个归一化系数仅使用训练数据加以估计,但是其适用于训练数据集和测试数据集两者。
随机森林分类
我们使用随机森林算法(Breiman Mach Learn 45:5-32(2001))来预测异生物诱导的肾毒性,因为我们之前已经证明该算法优于其他常用的分类器,包括支持向量机、k-最近邻和朴素贝叶斯(Su et al.,BMC Bioinformatics 15:S16(2014))。随机森林有两个主要参数:N和N试验。第一个参数指定构建的决策树的数量,第二个参数指定在决策树的每个级别使用的随机特征的数量。在交叉验证期间,我们使用N={10,50,150,250,400,500}和N试验={1,2,3,4,5}的网格搜索自动确定最佳分类器参数。基于训练数据集
Figure BDA0001733500480000232
使用所有可能的参数组合训练一系列临时随机森林,并且基于独立的测试数据集
Figure BDA0001733500480000233
估计这些组合的测试准确度。选择具有最高测试准确度值的N和N试验的组合来训练最终分类器,然后使用第三独立测试数据集
Figure BDA0001733500480000234
估计其性能。我们使用在R环境下的“randomForest”库(v4.6-10)。
自动特征选择
我们使用贪婪搜索算法,即递归特征消除(RFE)(Loo et al.,NatMethods4:445-453(2007)),从所有提取的特征
Figure BDA0001733500480000235
中选择特征的子集。
主要观念是从所有特征开始;迭代地对当前特征集进行排序,去除最不重要的特征子集,评估保留的特征子集Fj的准确度accj;最后选择具有最高准确度的特征子集。为了减少数据过拟合,分别在两个独立的数据集
Figure BDA0001733500480000241
Figure BDA0001733500480000242
中进行特征子集的排序和评价。通过置换袋外数据和特征,我们根据随机森林算法估计的特征的重要性值对特征进行排序(Breiman Mach Learn 45:5-32(2001))。
在具有小样本量的数据集中,accj曲线(作为Fj的函数)可能不平滑。因此,accj的全局最大值可能不是用于选择最终特征子集的稳健标准。相反,我们设计了一个自动程序,以便使用高斯混合建模(GMM)选择特征子集(Trevor Hastie et al.,Data Mining,Inference,and Prediction,2nd edn.Springer(2009))。我们将所有accj值聚类成2-4个组。它们中的每一个都被建模为高斯分布。然后,我们选择了具有最高平均预测准确度的组中的最小特征子集。还基于贝叶斯信息准则(BIC)BIC=-2Lm+Ndlog(Ns)自动确定最佳组数,其中Ns是样本大小,Lm是通过GMM算法计算的最大对数似然,并且Nd是参数的数量。
分类性能评估
我们使用分层的10倍交叉验证程序(Trevor Hastie et al.,Data Mining,Inference,and Prediction,2nd edn.Springer(2009))来估计我们的表型特征的PTC毒性预测性能。
这个程序有两个主要的交叉验证循环。第一个交叉验证循环旨在识别最佳特征子集F最终,而第二个交叉验证循环旨在估计F最终的广义预测性能。为了保持训练数据和测试数据彼此独立,我们将所有处理条件分为四个非重叠集:X训练(F全部、xFS测试(F全部、XRF测试(F全部)和X测试(F全部)。此外,归一化系数和分类器参数的估计一直只以训练数据集为基础,但其适用于训练数据集和测试数据集两者。
我们使用了以下性能测量:
Figure BDA0001733500480000243
Figure BDA0001733500480000244
Figure BDA0001733500480000245
其中TP是真阳性的数量,TN是真阴性的数量,FP是假阳性的数量,FN是假阴性的数量。对于HPTC-A、HPTC-B和HK-2数据集使用相同的性能评估程序。
多维标度图
为了在化学结构空间上比较化合物,我们使用ChemmieR库来计算在所有参考化合物的结构之间的成对的Tanimoto系数。为了在表型特征空间上比较化合物,我们首先将所有表型特征标度为同一个范围[0,1],然后计算在所有参考化合物的特征值之间的成对的欧几里德距离。最后,我们使用在R环境中的cmdscale函数(Torgerson,Psychometrika 17:401–419(1952))来生成多维标度图。
参考化合物列表
为了使我们的计算模型更加全面,我们将参考肾脏异生化合物的数量增加到44种(表1),其中38种化合物以前用于我们的基于IL-6/8的模型中(Li et al.,Toxicol Res 2:352–365(2013);Li et al.,Mol Pharm 11:1982–1990(2014);Su et al.,BMCBioinformatics 15:S16(2014);Kandasamy et al.,Sci Rep.doi:10.1038/srep12337(2015))。这些参考化合物包括常用的工业化学品、抗生素、抗病毒药、化疗药物、真菌毒素、农业化学品和其他化合物(图1a)。根据发表的临床和/或动物研究中的它们的已知体内毒性将它们分成两个组(大多数化合物的详细信息可在我们之前的报告中找到)(Li et al.,Mol Pharm 11:1982–1990(2014);Kandasamy et al.,Sci Rep.doi:10.1038/srep12337(2015)。“PTC毒性”组有已知损伤PTC的24种肾毒物,“非PTC毒性”组有未知损伤人PTC的12种肾毒物和未知损伤人肾脏的8种化合物。此外,已知分别在PTC毒性和非PTC毒性组中的10种和8种化合物具有肝毒性(表1)。参考化合物列表的这种设计确保我们一般不会偏向非PTC特异性毒性的表型特征。我们对化合物的二元分类简化了预测问题,并允许我们使用完善的预测性能标准来评价不同的表型特征和细胞类型。我们的参考化合物具有不同的化学结构,并且我们发现在PTC毒性和非PTC毒性化合物之间没有明显的结构差异(图1b)。例如,所有工业化学品都以化学空间聚类到一起,而不管其已知的PTC毒性如何(图1b中的虚线)。它们中的大多数是金属化合物,比如顺铂(PTC毒性)和氯化锂(非PTC毒性),其具有非常简单且因此难以分辨的分子结构。我们用七个不同的剂量(1.6-1000μg/mL)的这些化合物将来自三个不同供体的原代人PTC处理16小时。
用于肺毒性研究的参考化合物
对于肺毒性研究,我们使用49种异生化合物,其中39种是可溶的,10种是粒子化合物(表2)。基于发表的体内和/或临床数据,选择了19种肺毒性化合物和30种非肺毒性化合物。这些参考化合物涉及常见的或常用的药物、工业化学品、食品、个人护理和其他,如香烟烟雾等(图11)。
表2:参考肺毒性化合物.
Figure BDA0001733500480000261
Figure BDA0001733500480000271
Figure BDA0001733500480000281
细胞培养和化合物处理
我们使用来自美国典型培养物保藏中心(ATCC)的两种可商购的永生化细胞系A549(CCL-185TM)和BEAS-2B(CRL-9609TM)。在补充有10%胎牛血清(HyCloneTM)和1%青霉素/链霉素(Gibco)的Roswell Park Memorial Institute(RPMI)1640培养基(Gibco)中培养A549。将BEAS-2B维持在支气管上皮细胞生长培养基(BEGM)(Lonza/CloneticsTM)和1%青霉素/链霉素(Gibco)中;除了GA-1000(庆大霉素-两性霉素B混合物)外,使用了BEGMBullet Kit中提供的所有补充剂。在本研究中仅使用在A549和BEAS-2B的P15之前的传代。
将细胞接种到具有透明盖玻片底部的384孔黑色平板(Nunc)中。将所有细胞培养48小时,然后用对应的化合物处理过夜(16小时)。对于可溶性化合物,测试化合物的浓度为31.3、62.5、125、250、500、1000、2000μM,对于粒子化合物,测试化合物的浓度为16.13、31.3、62.5、125、250、500、1000μg/mL。对每一化合物和剂量进行阳性对照、阴性对照和媒介物对照(DMSO、乙醇或水,取决于测试化合物的溶剂)以及四次技术重复。
免疫染色
在化合物处理16小时后,使用含4%多聚甲醛的磷酸盐缓冲盐水(PBS)固定细胞。用含0.1%triton-X(TBST)的tris缓冲盐水渗透化处理细胞,并用含有5%牛血清白蛋白(BSA)的TBST封闭1小时。将样品与针对γH2AX(磷酸化S139)的兔单克隆抗体(CellSignaling Technology)以1:500在4℃温育过夜。随后,将细胞用与Alexa488(Invitrogen)和HCS CellMaskTM深红色缀合的山羊抗兔二级抗体分别以1:500和1:2000温育约1小时。最后,将细胞用Hoechst 33342(Invitrogen)以1:800和DyLightTM 554鬼笔环肽(CellSignaling Technology)染色。
图像采集
使用具有确定激光焦点的Zeiss Axio Observer Z1系统(Zeiss),用20x物镜进行成像。使用四种不同的通道对蓝色(DAPI)、绿色(488)、红色(DsRed)和远红(Cy5)荧光成像。以每孔四个部位成像。图像以16位TIFF格式保存。
自动细胞表型概况分析
我们的表型概况分析策略(图2)为:在体外条件下自动测量原代人PTC的大量定量表型特征,然后系统地筛选最能预测体内PTC毒性的表型特征子集。我们的特征基于四种荧光标志物(图3a)。我们用4',6-二脒基-2-苯基吲哚(DAPI)和罗丹明鬼笔环肽分别标记DNA和肌动蛋白细胞骨架。核和染色质结构改变涉及许多基本细胞过程,比如转录、有丝分裂和细胞死亡。肌动蛋白丝在维持PTC的细胞功能中起重要作用(Kellerman et al.,Am JPhysiol259:F279–285(1990))。我们还用对核因子(NF)-κB复合物RelA的亚基特异的抗体标记细胞。这受到我们之前的基于IL-6/8的模型(Li et al.,Toxicol Res 2:352–365(2013);Li et al.,Mol Pharm 11:1982–1990(2014);Su et al.,BMC Bioinformatics15:S16(2014);Kandasamy et al.,Sci Rep.doi:10.1038/srep12337(2015))的启发,这些模型受NF-κB复合物的调节(Matsusaka et al.,Proc Natl Acad Sci 90:10193–10197(1993))。最终标志物是全细胞染料(WCS),用于促进自动细胞分割和细胞形态学特征的测量。
在化合物处理后,我们用这四种荧光标志物对PTC进行染色,并使用高通量成像系统对它们进行成像。我们从每个化合物和处理剂量捕获的36个显微镜图像中自动鉴定了约500-1000个细胞(图4)。然后,对于每个细胞,我们提取了129个定量表型特征(图3b),其中包括78个Haralick纹理特征(Haralick et al.,IEEE Trans Syst Man Cybern SMC-3:610–621(1973))(量度标志物的空间共生模式的统计数据)、29个强度特征(量度在不同的亚细胞区的标志物的染色水平)、9个强度比特征(量度在强度特征之间的比值)、6个相关性特征(量度单细胞水平上的两个标志物之间的空间相关性)和6个形态学特征(量度核区和细胞区的形状属性)。我们还将细胞计数作为一个特征。以前使用了相似的表型特征和概况分析方法根据小分子的靶标/机制对大量小分子进行分类(Loo et al.,Nat Methods 4:445–453(2007))。因此,我们假设这些特征的子集对于预测PTC毒性也可能具有足够的识别力。
对于每个表型特征,我们首先计算在所有测试剂量下其值相对于媒介物对照的比值的log2(“Δ”)。然后,我们使用标准对数逻辑模型估计特征的剂量反应曲线(DRC),并从该曲线估计其最大反应值(“Δmax”)(图3c)。最后,计算三个生物学重复的中位Δmax值。最终数据集(“HPTC-A”)是129个表型特征(F全部={f1,f2,…,f129},行)的Δmax值和44种异生化合物(列)的矩阵(图3d)。为简洁起见,除非另外指明,否则我们在本文中提及的所有特征均指对应特征的Δmax参数,而不是原始测量特征值。基于表型特征值的化合物的层次聚类揭示了两大簇(图3d)。其中一个显著富集PTC毒性化合物(83%的簇是PTC毒性化合物;P=1.59x10-3,超几何检验),另一个显著富集非PTC毒性化合物(65%的簇是非PTC毒性化合物;P=1.59x10-3,超几何检验)。大多数表型特征在第一簇下显示出比第二簇更大的变化,表明非PTC毒性化合物仅在原代人PTC中诱导了小的变化或没有变化。我们还对表型特征进行了相似的聚类分析,发现相应于在用PTC毒性化合物处理后特征值增加或减少的两大簇(图3d)。所有标志物的特征都描述在两个簇中。因此,我们的大多数表型特征是不同的,并且捕获增加和减少的标志物特性。
核特征和细胞骨架特征具有高度预测性
为了测试每个单独的特征,我们使用随机森林算法(Breiman Mach Learn45:5–32(2001);Su et al.,BMC Bioinformatics 15:S16(2014))构建了基于特征的二元分类器,并使用10倍交叉验证程序估计了预测准确度(图5a和方法)。二元分类器的平衡准确度(敏感性和特异性的平均)的范围为从50%(平凡随机分类器的性能)到100%(最大值)。训练准确度是对用于构建分类器的训练数据进行分类的准确度,并且测试准确度是对训练过程中未使用的独立测试数据进行分类的准确度。我们的评价程序确保训练数据和测试数据在统计学上独立。在我们对表型概况分析的无偏方法中,我们从大量的一般表型特征开始,但只预期少数特征具有辨别力。因此,在比较不同的特征组时,我们仅考虑特征组的最大准确度(基于组内的最佳单一特征)而不是该组的平均准确度。对于HPTC-A数据集,我们发现所有单一特征具有约97%及以上的训练准确度,表明大多数训练样本可根据其已知的体内PTC毒性得以分离。具有最高的最大测试准确度的特征标志物组是DNA(75.8%),其次是肌动蛋白(73.7%)和RelA(72.6%)(图5b)。令人惊讶的是,RelA特征对于PTC毒性并非具有高度预测性。例如,RelA核-全细胞强度比,其作为NF-κB核转位和其下游效应子(Deptala et al.,Cytometry 33:376–382(1998))转录激活的指标,具有98.8%的训练准确度,但仅有61.0%的测试准确度。具有最高的最大测试准确度的特征类型组是Haralick纹理(Haralick etal.,IEEE Trans Syst Man Cybern SMC-3:610–621(1973))(75.8%),其次是强度(73.7%)和强度比(69.9%)(图5c)。实际上,十个表现最佳的单一特征中的六个都是Haralick纹理特征,它们的基础是荧光标志物的灰度共生矩阵(GLCM)(Haralick et al.,IEEE Trans Syst Man Cybern SMC-3:610–621(1973))。标志物的GLCM总结了在细胞图像中标志物的不同强度水平之间的空间跃迁的分布(Haralick et al.,IEEE Trans SystMan Cybern SMC-3:610–621(1973))。Haralick特征描述了GLCM的各种统计特性,可用于表示图像中所见的纹理模式(方法)。所有129个特征中的最佳单一特征f最佳是DNA GLCM的“平均熵”(99.3%训练准确度和75.8%测试准确度)。该特征是DNA GLCM的同质性的量度。在所有强度水平之间的跃迁更可能更均等的情况下,具有更多“随机”DNA染色模式的细胞图像具有更同质的GLCM并因此具有更高的GLCM熵值(图6)。总体而言,DNA纹理和肌动蛋白细胞骨架定位模式的变化对于具有不同化学结构的异生物的体内PTC毒性具有高度预测性。高准确度强调了使用基于图像的表型特征作为体外毒性终点的重要性和优势。
多个特征比单一特征更具预测性
异生化合物可诱发不同类型的PTC损伤和反应。因此,基于多个不同表型终点的分类器更可能给出更高的总体预测准确度。为了保持特征之间的依存关系,我们同时在多个特征的基础上训练了多维分类器(图5d)。然后,使用递归特征消除算法(Loo et al.,NatMethods 4:445–453(2007))自动去除不相关和/或冗余特征(图5e和方法)。仅根据训练数据自动确定保留特征的数量。因此,对于具有不同训练数据的每个交叉验证倍数重复该过程。根据特征的重要性值对其进行排序,所述重要性值通过随机森林算法(Breiman MachLearn 45:5–32(2001))加以估计并在所有交叉验证倍数中取平均值。对于HPTC-A数据集,我们发现了一组具有最高平均重要性值的四个特征(Fs)(图7)。这些特征是核区DNA强度的“变异系数(CV)”、DNA GLCM的“平均角二阶矩(ASM)”、肌动蛋白GLCM的“平均熵和”和“平均熵”(图5f和表3)。
表3:所有三个数据集的单特征分类器和多特征分类器的总体肾毒性预测性能总结.
Figure BDA0001733500480000321
Figure BDA0001733500480000322
Figure BDA0001733500480000331
与单特征分类结果相似,这些顶部特征都基于DNA和细胞骨架标志物,其中三个是纹理特征。我们使用这四个特征训练了多特征分类器,并获得了99.5%的训练准确度和78.3%的测试准确度,这高于所有单特征分类器的性能(图5f)。这四个特征的单独测试准确度仅在65.5%-74.4%之间的范围。因此,将特征联合在一起增加了预测性能。我们还发现将f最佳包含在Fs中并没有进一步增加我们模型的预测准确度(图5f),表明我们的递归特征消除算法非常有效。
在Fs的特征空间中,我们发现大多数无毒化合物形成了一个紧密的簇,它们彼此之间比与有毒化合物更接近(图5g)。现在可以将具有简单化学结构的八种有毒工业化学品中的六种与无毒化合物清楚地分离(图5g)。这种分离在原始化学结构空间方面并不明显(图1b)。在所有测试化合物中,22种化合物在单特征和多特征分类器方面一致地具有100%的平均测试准确度(表4)。
表4:单独化合物的平均肾毒性测试准确度.
Figure BDA0001733500480000332
Figure BDA0001733500480000341
只有三种化合物,即环丙沙星(抗生素)、左旋多巴(精神活性药物)和氯化铜(II)(工业化学品),在两种类型的分类器中都一致地具有<50%的测试准确度。这些结果显示,我们的计算模型是通用的,并不偏向特定类别的化合物。
最重要的特征指示DNA损伤反应法诱导
为了进一步研究由我们的表型特征所代表的细胞损伤和损伤反应的类型,我们关注Fs中的两个DNA特征,即1)DNA GLCM的平均ASM,其在四个选择的特征中具有最高的单特征测试准确度,和2)核区的DNA强度的CV(图5f)。ASM是DNA GLCM的异质性的量度(方法和图8a)。当在某些强度水平之间的跃迁占优势时(例如,当强度值形成某些规则形状时),该特征给出高值,或者当所有跃迁同等可能时(例如,当强度值扩散并随机分布时),该特征给出低值。CV等于标准差除以平均值,是一组值的离散性的标准化量度,所述值在我们的例子中是核区内的DNA染色强度水平。通过检查细胞的荧光显微镜图像,我们发现具有这两个特征的高值的细胞具有断开的、高度不规则的和点状的DNA染色水平(图8a),表明染色质结构的深刻变化和不同染色质结构域的形成。然而,这些细胞的总体核和细胞形态仍然大致保持完整,并不像典型的凋亡细胞那样碎裂。因此,我们假设这些特征可指示DNA损伤反应,已知DNA损伤反应与兆碱基大小范围内的不同染色质结构域的形成和大规模染色质重组相关(Rogakou et al.,J Biol Chem 273:5858–5868(1998);Jakob et al.,Nucleic AcidsRes 39:6489–6499(2011))。
为了检验我们的假设,我们重复了42种参考化合物的处理实验,但用对丝氨酸139上磷酸化的组蛋白H2AX(γH2AX)特异的抗体替换了RelA标志物,所述组蛋白H2AX是DNA损伤反应标志物(Rogakou et al.,J Biol Chem 273:5858–5868(1998))(图8b)。在内源性或异生性DNA损伤条件下,γH2AX被诱导并将修复因子募集到双链断裂位点(Paull et al.,Curr Biol 10:886–895(2000))。我们在原代人PTC(“HPTC-B”数据集)和永生化人PT细胞系人肾2(“HK-2”数据集,图9)中重复实验。在单细胞水平,我们发现由异生化合物诱导的具有较高原始DNA CV水平的细胞倾向于具有较高的原始平均γH2AX核水平,但是反应可能是高度异质的(图8b)。例如,500μg/mL环孢菌素A引起原始平均γH2AX核水平增加约40倍,但仅在约13%的细胞中增加(图8c)。然而,由于在等级上的大幅增加,在群体平均水平上仍然可以检测到这种效应。在用其他PTC毒性化合物处理的细胞中也观察到γH2AX核水平的类似增加(图9)。在所有测试化合物中,DNA CV的最大增加(即Δmax)与平均核γH2AX水平在原代和HK-2细胞两者中呈彼此强烈正相关(分别为r=0.639和0.667;图8d和e)。此外,在用PTC毒性化合物处理的细胞中的两个特征都显著高于用非PTC毒性化合物处理的细胞中的两个特征(所有P<0.01,单尾t检验;图8d和e)。这些结果表明,大多数PTC毒性化合物诱导了DNA损伤反应,即使未知其中许多化合物与DNA直接结合。
改进的基于γH2AX的计算模型
γH2AX标志物可以提高我们的计算模型的预测性能到什么程度?我们重复相同的表型概况分析程序,但使用基于DNA、γH2AX和肌动蛋白标志物的129个表型特征(图8f和g)。对于HTPC-B数据集,我们发现最佳单一特征f最佳是核区与全细胞区的总γH2AX水平的比值(99.5%训练准确度和77.6%测试准确度),这表明核区的γH2AX激活(图6b)。最佳多特征集Fs是四个核和肌动蛋白细胞骨架特征(99.7%训练准确度和81.6%测试准确度,完整的特征列表参见图7和表2)。对于HK-2数据集,我们发现其f最佳是DNA GLCM的平均相关性(99.8%训练准确度和83.9%测试准确度),其为相邻像素的强度水平的线性依赖性的量度(图6c)。最佳的多特征集Fs是五个染色体和细胞骨架特征(99.9%的训练准确度和88.9%的测试准确度,图7和表2)。对于这两个数据集(HPTC-B和HK-2),我们发现一致的趋势是多特征分类器具有比单特征分类器更高的测试准确度(图8f和g)。然而,单特征分类器具有更高的测试特异性,而多特征分类器具有更高的敏感性(图8h和i)。此外,在单特征分类器和多特征分类器中,能够以100%平均测试准确度预测的化合物数量从22种(HPTC-A)增加到25种(HPTC-B)或28种(HK-2)(表4)。总之,这些结果表明包含γH2AX标志物使我们获得更高的预测准确度。
我们还比较了针对所有三个数据集选择的最佳表型特征(表3),并发现了几个有趣且一致的趋势。首先,针对HPTC-A和-B数据集两者,在Fs中自动选择了DNA GLCM的平均ASM。第二,HPTC-B数据集的f最佳(即,核区与全细胞区的总γH2AX水的比值)和HK-2数据集的Fs中的特征之一(即,全细胞区的总γH2AX和DNA强度水平的比值)是两个密切相关的特征,其指示γH2AX水平的核增加(图6)。第三,虽然最佳单一特征的基础是DNA或γH2AX标志物,但肌动蛋白特征仍被多特征分类器保留,这表明肌动蛋白标志物对于将诱导肌动蛋白重塑的一些化合物正确分类是需要的。总之,这些结果表明我们的预测模型具有高度再现性,并且异生物诱导的DNA损伤反应是人原代和永生化PTC中发生的普遍现象。
细胞死亡反应是可变的
在体外条件下DNA损伤反应与细胞死亡相关吗?根据HPTC-B结果,我们选择了三种诱导γH2AX水平升高的PTC毒性化合物(顺铂、环孢菌素A和赭曲霉毒素A),和三种引起γH2AX水平变化小或没有变化的非PTC毒性化合物(利巴韦林、氯化锂和林可霉素)(图8d)。我们用1000μg/mL的这些化合物处理原代PTC,并用三种不同的细胞死亡标志物标记细胞:膜联蛋白V(磷脂酰丝氨酸外化的标志物,在凋亡细胞和坏死细胞(Sawai and Domae,BiochemBiophys Res Commun 411:569–573(2011)两者中都出现)、切割的半胱天冬酶3(激活半胱天冬酶3的标志物,仅在凋亡细胞中出现)和乙锭同型二聚体III(由于膜崩解而仅渗透晚期凋亡细胞或坏死细胞的DNA标志物)(图10a)。对于每种标志物,我们确定了在这六种化合物和溶剂对照处理下阳性细胞的百分比(图10b)。基于HPTC-B数据集,我们还确定了用1000μg/mL的这些化合物处理的原代PTC的平均γH2AX核水平。与我们先前的Δmax测量一致,三种PTC毒性化合物在测试剂量下诱导了显著高于三种非PTC毒性化合物的平均γH2AX强度水平(P=0.044,图10c)。然而,在PTC毒性化合物和非PTC化合物之间,只有膜联蛋白V阳性细胞百分比的增加是显著的(P=0.047)。乙锭同型二聚体III和半胱天蛋白酶3阳性细胞百分比的增加不太显著(P>0.10,全部为单侧t检验;图10c)。这主要是由于对环孢菌素A和赭曲霉毒素A的细胞死亡反应较低所致。即使对于膜联蛋白V,反应也是高度异质的。例如,环孢菌素A和赭曲霉毒素A仅分别增加约50%和约25%的细胞中的膜联蛋白V水平。这些结果证实了我们早期关于环孢菌素A反应的异质性的结果(图8b和c)。令人惊讶的是,这三种PTC毒性化合物仅诱导了低百分比的半胱天冬酶3阳性细胞(<20%)。先前还观察到一些PTC毒性化合物(比如5-氟尿嘧啶和庆大霉素)在HK-2细胞中的相似的细胞凋亡反应缺乏(Wu etal.,Toxicol In Vitro 23:1170–1178(2009))。在所有六种化合物中,我们发现γH2AX水平与这三种细胞死亡标志物之间没有显著的正相关(所有P>0.20,单侧t检验;图10c)。总之,所有这些结果显示,PTC毒物在测试的体外条件下诱导了可变的细胞死亡反应(细胞凋亡和坏死两者)。它们中的一些(比如赭曲霉毒素A,其诱导γH2AX水平的大幅增加)甚至可以在测量期内引起细胞死亡率的非常小的增加或没有增加。这些结果还暗示体外细胞死亡终点可能难以准确预测体内PTC毒性,并且不能用于替代用于肾毒性预测的DNA损伤特征。
使用相似的标志物也可以高度预测肺毒性
我们开发了基于永生化肺泡细胞(AVC)和支气管上皮细胞系(BEC)的体外肺毒性模型。还采用了表型概况分析策略用于预测,并且我们的特征的基础是四种荧光标志物和七个亚细胞区(图12a和b)。分别使用Hoechst33342和DyLightTM 554鬼笔环肽来标记DNA和肌动蛋白细胞骨架。已知硝基呋喃托英和气相二氧化硅在人类中分别引起肺部疾病和矽肺。免疫荧光图像显示了在DMSO(对照,顶部)、2mM硝基呋喃托英(中)和1mg/mL气相二氧化硅(底部)处理下的DNA损伤反应标志物γH2AX的磷酸化的变化以及在我们的细胞模型中的肌动蛋白的重塑。
当应用本发明的方法预测化合物对BEC和AVC细胞的毒性时,获得了与肾毒性分析相似的结果。结果是四种新的DNA特征、染色体特征和细胞骨架特征,所述特征可以预测可溶性化合物或粒子化合物的肺毒性,测试准确度范围为约86%-100%(表5)。针对A549和BEAS-2B细胞的最佳单一特征是不同的。对于A549细胞,我们发现可溶性化合物的最佳单一特征(f最佳)是全细胞区的肌动蛋白GLCM的平均熵(98.0%训练准确度和86.2%测试准确度),并且对于粒子化合物而言是核区的γH2AX染色的相关性信息度量1(100.0%训练准确度和100.0%测试准确度)(图13a)。对于BEAS-2B细胞,可溶性化合物的最佳单一特征(f最佳)是核区与胞质区的总γH2AX与肌动蛋白强度的比值(99.1%训练准确度和86.3%测试准确度)(图13b和14)。粒子化合物有5个最佳单一特征f最佳(100.0%训练准确度和100.0%测试准确度),并且所有这些都与γH2AX和/或肌动蛋白染色有关,即,γH2AX目标的总面积、胞质区的肌动蛋白目标强度的比值,等等(图13b和15)。
表5:最佳单特征分类器的肺毒性预测性能总结.
Figure BDA0001733500480000391
讨论
当前研究表明,由不同的PTC毒性化合物诱导了不同程度的体外培养的PTC的细胞死亡(图10)。这一发现与我们以及其他先前关于预测在人体中肾毒性的结果一致(Wu etal.,Toxicol In Vitro 23:1170–1178(2009);Li et al,.Toxicol Res 2:352–365(2013))。使用细胞死亡作为预测体内器官特异性毒性的体外终点的困难可能与这样的事实有关,即,体内化合物诱导的细胞损伤并不总是与即时的细胞死亡相关。例如,化合物诱导的PTC损伤常常是亚致死的,并且与肾小管功能障碍和慢性肾病相关,而不是急性肾小管坏死(Kroshian et al.,Am J Physiol 266:F21–30(1994);Choudhury and Ahmed NatClin Pract Nephrol 2:80–91(2006))。异生物代谢酶和转运蛋白的表达水平的差异也可能起作用(Van der Hauwaert et al.,Toxicol Appl Pharmacol 279:409–418(2014))。通常,鉴定体外器官特异性毒性模型的高度预测性终点仍然具有挑战性(Lin and WillToxicol Sci 126:114–127(2012))。特别是对于肾脏模型,已经一致地发现使用一般损伤标志物,如ATP耗竭;或潜在的新型肾脏特异性损伤标志物,如肾损伤分子1和中性粒细胞明胶酶相关脂质运载蛋白,具有有限的预测价值(Lin and Will Toxicol Sci 126:114–127(2012);Li et al.,Toxicol Res 2:352–365(2013);Tiong et al.,Mol Pharm 11:1933–1948(2014))。因此,这些当前标志物的价值仍然有争议(Bonventre et al.,NatBiotechnol 28:436–440(2010);Vanmassenhove et al.,Nephrol Dial Transplant 28:254–273(2013))。
解决此类困难的常用策略是实现对器官特异性损伤机制的更好理解,然后选择与这样的机制相关的终点(Jennings et al.,Arch Toxicol 88:2099–2133(2014))。然而,这需要损伤机制的先验知识,这对于新的或未充分表征的化合物可能是未知的。在当前研究中,我们采用更实用的方法进行肾毒性预测,无需对损伤机制进行先验表征,并且直接搜索可以最好地预测体内毒性的体外表型特征。结果是六组核特征和肌动蛋白细胞骨架特征能够在肾细胞中实现约76%-89%的测试准确度(表3);在肺细胞中实现约86%-100%的测试准确度(表5)。我们的结果表明,在体外条件下,大多数PTC毒性化合物、AVC和BEC毒性化合物在细胞核和肌动蛋白细胞骨架中诱导了相似的表型变化,即使这些化合物可能具有相异的化学结构也是如此。
与特定细胞变化相关的特征的鉴定为我们的计算模型提供了机理解释。我们研究中最令人惊讶的发现之一是γH2AX,它是遗传毒性和致癌作用的已知标志物(Mah et al.,Leukemia 24:679–686(2010);Nikolova et al.,Toxicol Sci140:103–117(2014)),也被许多具有不同化学结构的化合物诱导。已知诸如顺铂、5-氟尿嘧啶和马兜铃酸的一些参考化合物直接干扰DNA复制并引起双链断裂(Heidelberger et al.1957;Lieberthal etal.,Am J Physiol-Ren Physiol270:F700–F708(1996);Arlt Mutagenesis 17:265–277(2002))。然而,尚未知我们大多数其他参考PTC毒性化合物直接与核酸相互作用。我们的观察结果与其他最近的研究一致,这些研究发现体内肾缺血再灌注损伤和体外ATP耗竭损伤(Ma et al,.Biochim Biophys Acta BBA -Mol Basis Dis 1842:1088–1096(2014))以及在血管紧张素II处理后诱导了DNA损伤反应,在体外的分离的灌注小鼠肾脏和PTC培养物中,尚未知血管紧张素II与DNA相互作用(Schmid et al.,Cancer Res 68:9239–9246(2008))。这些观察到的DNA损伤反应可能是由于氧化应激和/或氧化性DNA损伤所致(Schmid et al.,Cancer Res 68:9239–9246(2008);Ma et al.,Biochim Biophys ActaBBA-Mol Basis Dis 1842:1088–1096(2014))。已知诸如庆大霉素的一些参考化合物诱导氧化应激并产生活性氧(ROS)诱导的DNA损伤(Quiros et al.,Toxicol Sci 119:245–256(2011))。无论潜在的分子机制如何,我们的研究表明,在原代PTC和永生化PT细胞系中,γH2AX和DNA特征对于异生物诱导的PTC毒性具有高度预测性。重要的是,这也证明了在不关注特定机制的无偏倚方法中可以揭示意外但常见的化合物诱导的细胞反应和损伤。
有趣的是,在我们的最终特征集中保留了细胞骨架特征,表明DNA/γH2AX和肌动蛋白标志物提供了关于细胞对PTC毒性化合物反应的补充和非冗余信息。在PTC中由各种类型的有毒化合物诱导的肌动蛋白细胞骨架的重塑已有报道(Elliget et al.,Cell BiolToxicol 7:263–280(1991);Kroshian et al.,Am J Physiol 266:F21–30(1994))。除细胞质外,肌动蛋白丝也位于细胞核中,肌动蛋白相关蛋白(Arps)是染色质重塑复合物的一部分(Shen et al.,Mol Cell 12:147–155(2003))。因此,肌动蛋白丝在DNA损伤反应中的可能作用将是未来研究的重要课题。
有两个主要因素促成了我们的计算模型的高准确度。第一个因素是使用基于图像的表型特征,这使我们能够定量测量细胞和亚细胞细胞器比如DNA、组蛋白修饰和肌动蛋白细胞骨架的空间组织的变化。我们发现染色质和细胞骨架的Haralick纹理特征包含高度辨别力的信息,这些信息在群体平均或非基于图像的测量中会丢失。我们的研究结果还表明,129个一般表型特征的初始设定是筛选预测性毒性终点的良好起点。促成高准确度的第二个因素是设计我们的参考化合物和性能评价方法。在阴性参考组中包含多种化合物和非PTC毒性毒物使我们能够寻找更具体的表型特征。我们还确保训练数据和测试数据在统计学上彼此独立。例如,特征归一化和消除参数的确定一直仅使用训练数据,但在我们的交叉验证程序的每个单一倍数中其适用于训练数据和测试数据两者。总之,我们的研究证明了使用高通量成像、表型概况分析和机器学习方法预测具有不同化学结构的异生化合物的人体肾毒性的可行性。
参考文献
Abraham VC,Towne DL,Waring JF,et al(2008)Application of a High-Content Multiparameter Cytotoxicity Assay to Prioritize Compounds Based onToxicity Potential in Humans.J Biomol Screen 13:527–537.doi:10.1177/1087057108318428.
Arlt VM(2002)Aristolochic acid as a probable human cancer hazard inherbal remedies:a review.Mutagenesis 17:265–277.doi:10.1093/mutage/17.4.265.
Bonventre JV,Vaidya VS,Schmouder R,et al(2010)Next-generationbiomarkers for detecting kidney toxicity.Nat Biotechnol 28:436–440.doi:10.1038/nbt0510-436.
Breiman L(2001)Random Forests.Mach Learn 45:5–32.doi:10.1023/A:1010933404324.
Cherkasov A,Muratov EN,Fourches D,et al(2014)QSAR Modeling:Where HaveYou Been?Where Are You Going To?J Med Chem 57:4977–5010.doi:10.1021/jm4004285.
Choudhury D,Ahmed Z(2006)Drug-associated renal dysfunction andinjury.Nat Clin Pract Nephrol 2:80–91.doi:10.1038/ncpneph0076.
Deptala A,Bedner E,Gorczyca W,Darzynkiewicz Z(1998)Activation ofnuclear factor kappa B(NF-κB)assayed by laser scanning cytometry(LSC).Cytometry 33:376–382.doi:10.1002/(SICI)1097-0320(19981101)33:3<376::AID-CYTO13>3.0.CO;2-Q.
Elliget KA,Phelps PC,Trump BF(1991)HgCl2-induced alteration of actinfilaments in cultured primary rat proximal tubule epithelial cells labelledwith fluorescein phalloidin.Cell Biol Toxicol 7:263–280.
Feng Y,Mitchison TJ,Bender A,et al(2009)Multi-parameter phenotypicprofiling:using cellular effects to characterize small-molecule compounds.NatRev Drug Discov 8:567–578.doi:10.1038/nrd2876.
Haralick RM,Shanmugam K,Dinstein I(1973)Textural Features for ImageClassification.IEEE Trans Syst Man Cybern SMC-3:610–621.doi:10.1109/TSMC.1973.4309314.
Heidelberger C,Chaudhuri NK,Danneberg P,et al(1957)FluorinatedPyrimidines,A New Class of Tumour-Inhibitory Compounds.Publ Online30 March1957 Doi101038179663a0 179:663–666.doi:10.1038/179663a0.
Hoffmann D,Adler M,Vaidya VS,et al(2010)Performance of NovelKidneyBiomarkers in Preclinical Toxicity Studies.Toxicol Sci 116:8–22.doi:10.1093/toxsci/kfq029.
Hong SJ,Ghosh RN(2015)Predicting toxicity of a compound over a rangeof concentrations.Patent application number US 14/334,453.
Jakob B,Splinter J,Conrad S,et al(2011)DNA double-strand breaks inheterochromatin elicit fast repair protein recruitment,histone H2AXphosphorylation and relocation to euchromatin.Nucleic Acids Res39:6489–6499.doi:10.1093/nar/gkr230.
Jang K-J,Mehr AP,Hamilton GA,et al(2013)Human kidney proximal tubule-on-a-chip for drug transport and nephrotoxicity assessment.Integr Biol 5:1119–1129.doi:10.1039/C3IB40049B.
Jennings P,Schwarz M,Landesmann B,et al(2014)SEURAT-1 liver goldreference compounds:a mechanism-based review.Arch Toxicol88:2099–2133.doi:10.1007/s00204-014-1410-8.
Kandasamy K,Chuah JKC,Su R,et al(2015)Prediction of drug-inducednephrotoxicity and injury mechanisms with human induced pluripotent stemcell-derived cells and machine learning methods.Sci Rep.doi:10.1038/srep12337.
Kellerman PS,Clark RA,Hoilien CA,et al(1990)Role of microfilaments inmaintenance of proximal tubule structural and functional integrity.Am JPhysiol 259:F279–285.
Krewski D,Jr DA,Andersen M,et al(2010)Toxicity Testing in the 21stCentury:A Vision and a Strategy.J Toxicol Environ Health Part B 13:51–138.doi:10.1080/10937404.2010.483176.
Kroshian VM,Sheridan AM,Lieberthal W(1994)Functional and cytoskeletalchanges induced by sublethal injury in proximal tubular epithelial cells.Am JPhysiol 266:F21–30.
Laksameethanasan D,Tan R,Toh G,Loo L-H(2013)cellXpress:a fast anduser-friendly software platform for profiling cellular phenotypes.BMCBioinformatics 14 Suppl 16:S4.doi:10.1186/1471-2105-14-S16-S4.
Lieberthal W,Triaca V,Levine J(1996)Mechanisms of death induced bycisplatin in proximal tubular epithelial cells:apoptosis vs.necrosis.Am JPhysiol-Ren Physiol 270:F700–F708.
Lilienblum W,Dekant W,Foth H,et al(2008)Alternative methods to safetystudies in experimental animals:role in the risk assessment of chemicalsunder the new European Chemicals Legislation(REACH).Arch Toxicol82:211–236.doi:10.1007/s00204-008-0279-9.
Lin Z,Will Y(2012)Evaluation of Drugs With Specific Organ Toxicitiesin Organ-Specific Cell Lines.Toxicol Sci 126:114–127.doi:10.1093/toxsci/kfr339.
Li Y,Kandasamy K,Chuah JKC,et al(2014)Identification of NephrotoxicCompounds with Embryonic Stem-Cell-Derived Human Renal Proximal Tubular-LikeCells.Mol Pharm 11:1982–1990.doi:10.1021/mp400637s.
Li Y,Oo ZY,Chang SY,et al(2013)An in vitro method for the predictionof renal proximal tubular toxicity in humans.Toxicol Res 2:352–365.doi:10.1039/C3TX50042J.
Loo L-H,Wu LF,Altschuler SJ(2007)Image-based multivariate profilingof drug responses from single cells.Nat Methods 4:445–453.doi:10.1038/nmeth1032.
Mah L-J,El-Osta A,Karagiannis TC(2010)γH2AX:a sensitive molecularmarker of DNA damage and repair.Leukemia 24:679–686.doi:10.1038/leu.2010.6.
Matsusaka T,Fujikawa K,Nishio Y,et al(1993)Transcription factors NF-IL6and NF-kappa B synergistically activate transcription of the inflammatorycytokines,interleukin 6 and interleukin 8.Proc Natl Acad Sci90:10193–10197.
Ma Z,Wei Q,Dong G,et al(2014)DNA damage response in renal ischemia–reperfusion and ATP-depletion injury of renal tubular cells.Biochim BiophysActa BBA-Mol Basis Dis 1842:1088–1096.doi:10.1016/j.bbadis.2014.04.002.
Nikolova T,Dvorak M,Jung F,et al(2014)The H2AX Assay for Genotoxicand Nongenotoxic Agents:Comparison of H2AX Phosphorylation with Cell DeathResponse.Toxicol Sci 140:103–117.doi:10.1093/toxsci/kfu066.
O’Brien PJ,Irwin W,Diaz D,et al(2006)High concordance of drug-inducedhuman hepatotoxicity with in vitro cytotoxicity measured in a novel cell-based model using high content screening.Arch Toxicol 80:580–604.doi:10.1007/s00204-006-0091-3.
Paull TT,Rogakou EP,Yamazaki V,et al(2000)A critical role for histoneH2AX in recruitment of repair factors to nuclear foci after DNA damage.CurrBiol10:886–895.doi:10.1016/S0960-9822(00)00610-2.
Quiros Y,Vicente-Vicente L,Morales AI,et al(2011)An IntegrativeOverview on the Mechanisms Underlying the Renal Tubular Cytotoxicity ofGentamicin.Toxicol Sci 119:245–256.doi:10.1093/toxsci/kfq267.
Rogakou EP,Pilch DR,Orr AH,et al(1998)DNA Double-stranded BreaksInduce Histone H2AX Phosphorylation on Serine 139.J Biol Chem273:5858–5868.doi:10.1074/jbc.273.10.5858
Sawai H,Domae N(2011)Discrimination between primary necrosis andapoptosis by necrostatin-1 in Annexin V-positive/propidium iodide-negativecells.Biochem Biophys Res Commun 411:569–573.doi:10.1016/j.bbrc.2011.06.186.
Sayes CM,Reed KL,Warheit.2007.Assessing Toxicity of Fine andNanoparticles:Comparing In Vitro Measurements to In Vivo Pulmonary ToxicityProfiles.Toxicol Sci 97(1):163-180.
Schmid U,Stopper H,Schweda F,et al(2008)Angiotensin II Induces DNADamage in the Kidney.Cancer Res 68:9239–9246.doi:10.1158/0008-5472.CAN-08-1310.
Seagrave J,McDonald JD,Mauderly JL.2005.In vitro versus in vivoexposure to combustion emissions.Exp Toxicol Pathol 57:233-238.
Shen X,Ranallo R,Choi E,Wu C(2003)Involvement of Actin-RelatedProteins in ATP-Dependent Chromatin Remodeling.Mol Cell 12:147–155.doi:10.1016/S1097-2765(03)00264-8.
Sternberg SR(1983)Biomedical Image Processing.Computer 16:22–34.doi:10.1109/MC.1983.1654163.
Su R,Li Y,Zink D,Loo L-H(2014)Supervised prediction of drug-inducednephrotoxicity based on interleukin-6 and-8 expression levels.BMCBioinformatics 15:S16.doi:10.1186/1471-2105-15-S16-S16.
Tiong HY,Huang P,Xiong S,et al(2014)Drug-Induced Nephrotoxicity:Clinical Impact and Preclinical in Vitro Models.Mol Pharm 11:1933–1948.doi:10.1021/mp400720w.
Tolosa L,Pinto S,Donato MT,et al(2012)Development of aMultiparametric Cell-based Protocol to Screen and Classify the HepatotoxicityPotential of Drugs.Toxicol Sci 127:187–198.doi:10.1093/toxsci/kfs083.
Torgerson WS(1952)Multidimensional scaling:I.Theory andmethod.Psychometrika 17:401–419.doi:10.1007/BF02288916
Trevor Hastie,Robert Tibshirani,Jerome Friedman(2009)The Elements ofStatistical Learning-Data Mining,Inference,and Prediction,2nd edn.Springer
Van der Hauwaert C,Savary G,Buob D,et al(2014)Expression profiles ofgenes involved in xenobiotic metabolism and disposition in human renaltissues and renal cell models.Toxicol Appl Pharmacol 279:409–418.doi:10.1016/j.taap.2014.07.007
Vanmassenhove J,Vanholder R,Nagler E,Van Biesen W(2013)Urinary andserum biomarkers for the diagnosis of acute kidney injury:an in-depth reviewof the literature.Nephrol Dial Transplant 28:254–273.doi:10.1093/ndt/gfs380
Wu Y,Connors D,Barber L,et al(2009)Multiplexed assay panel ofcytotoxicity in HK-2 cells for detection of renal proximal tubule injurypotential of compounds.Toxicol In Vitro 23:1170–1178.doi:10.1016/j.tiv.2009.06.003
Xu JJ,Henstock PV,Dunn MC,et al(2008)Cellular Imaging Predictions ofClinical Drug-Induced Liver Injury.Toxicol Sci 105:97–105.doi:10.1093/toxsci/kfn109

Claims (18)

1.一种预测测试化合物是否会在体内对特定细胞类型有毒的体外方法,所述方法包括:
(a)使至少一个测试细胞群与一个浓度范围内的所述测试化合物接触,所述测试细胞群选自肺细胞和肾细胞,
(b)用一种或多种生物分子标志物标记所述细胞并使所述细胞成像,所述一种或多种生物分子标志物选自DNA、F-肌动蛋白和在丝氨酸139上磷酸化的组蛋白H2AX(γH2AX),
(c)分割所述细胞并鉴定来自该细胞的全细胞区和一个或多个亚细胞区,
(d)确定在最高测试浓度下是否发生细胞丢失或死亡;如果是,则停止,并预测该化合物是有毒的,
(e)在所述测试群体中获得一个或多个定量的空间依赖性表型特征和空间独立性表型特征,其包括:
i)获得所述DNA、γH2AX和F-肌动蛋白的Haralick灰度共生矩阵(GLCM);
ii)获得所述GLCM的统计;
iii)获得DNA与γH2AX或γH2AX与F-肌动蛋白之间的归一化空间相关性;
iv)获得DNA与γH2AX或γH2AX与F-肌动蛋白之间的总强度的比率,以及
v)获得DNA、γH2AX和F-肌动蛋白的总强度和强度变异系数;
(f)从所述特征获得多个剂量反应曲线(DRC),
(g)获得所述DRC的经定量的参数,其中使用来自所述测试化合物的DRC的针对每个表型特征的最大反应值Δmax来定量所述DRC参数,并且
(h)在预测模型中,将所得的经定量的DRC参数与一组参考定量的DRC参数数据进行比较,所述预测模型使用选自随机森林、递归特征消除和支持向量机算法中的至少一种算法,以生成所述测试化合物的体内细胞毒性的预测,所述参考定量的DRC参数数据衍生自两个组:
(i)对所述细胞类型具有已知体内毒性的化合物,和(ii)未知对所述细胞类型具有体内毒性的化合物,
其中步骤(e)至(h)在计算机上进行。
2.权利要求1的方法,其中所述特定细胞类型选自下组,该组包括近端肾小管细胞(PTC)、支气管上皮细胞(BEC)和/或肺泡细胞(AVC)。
3.权利要求1的方法,其中所述一个或多个表型特征的定量基于(i)一个或多个选自下组的空间依赖性特征,该组包括在不同亚细胞区的纹理特征、空间相关特征和标志物比率;以及(ii)一个或多个选自下组的空间独立性特征,该组包括强度特征和形态学。
4.权利要求3的方法,其中所述纹理特征包括在特定亚细胞区或全细胞区的Haralick灰度共生矩阵(GLCM)的统计数据的一项或多项,其包括:核区的DNA GLCM的平均相关性;核区的DNA GLCM的平均熵;核区的DNA GLCM的平均角二阶矩;核区的DNA GLCM的和方差的标准差;全细胞区的肌动蛋白GLCM的平均和熵;全细胞区的肌动蛋白GLCM的平均熵;全细胞区的γH2AX GLCM的相关性2信息度量的标准差;以及全细胞区的γH2AX GLCM的平均和平均值。
5.权利要求3的方法,其中所述空间依赖性特征中的一个或多个包括选自下组的一项或多项的染色强度特征,该组包括全细胞区的DNA和肌动蛋白强度之间的归一化空间相关系数;内胞质区的总肌动蛋白强度水平;全细胞区的DNA和γH2AX强度之间的归一化空间相关系数;核区的DNA和γH2AX强度之间的归一化空间相关系数和核区的DNA强度的变异系数。
6.权利要求3的方法,其中所述空间依赖性特征中的一个或多个包含选自下组的一项或多项的染色强度比特征,该组包括全细胞区的总γH2AX与DNA强度的比值;核区的总γH2AX与肌动蛋白强度的比值;以及核区与全细胞区的总γH2AX强度水平的比值。
7.权利要求1的方法,其中所述一个或多个表型特征选自下组,该组包括全细胞区的肌动蛋白GLCM的平均和熵;核区的DNA强度的变异系数(CV);全细胞区的肌动蛋白GLCM的平均熵;以及核区的DNA GLCM的平均角二阶矩(ASM)。
8.权利要求1的方法,其中所述一个或多个表型特征选自下组,该组包括:内胞质区的总肌动蛋白强度水平;核区的DNA GLCM的平均角二阶矩(ASM);全细胞区的γH2AX GLCM的相关性2信息度量的标准差;和细胞计数。
9.权利要求1的方法,其中所述一个或多个表型特征选自下组,该组包括全细胞区的DNA和γH2AX强度之间的归一化空间相关系数;全细胞区的DNA和肌动蛋白强度之间的归一化空间相关系数;全细胞区的γH2AX GLCM的平均和平均值;全细胞区的总γH2AX与DNA强度的比值;以及核区的DNA GLCM的和方差的标准差。
10.权利要求1的方法,其中所述至少一个测试细胞群衍生自体细胞。
11.权利要求1的方法,其中所述接触进行1-48小时的一段时间。
12.权利要求1的方法,其中所述接触包括将所述测试化合物以1μg/ml至1000μg/ml的浓度添加至所述至少一个测试细胞群。
13.一种使用体外经受多个浓度的测试化合物处理的至少一个测试细胞群来预测所述测试化合物的体内细胞毒性的计算机实施的方法,所述方法包括:
(a)通过计算机处理器接收多个图像,每个图像代表肺细胞或肾细胞的测试群,所述肺细胞或肾细胞的测试群的DNA、在丝氨酸139上磷酸化的组蛋白H2AX(γH2AX)和F-肌动蛋白被染色,并且所述肺细胞或肾细胞的测试群在体外经受多个浓度的所述测试化合物的处理;
(b)分割所述细胞并鉴定全细胞区以及来自所述细胞的一个或多个亚细胞区;
(c)通过所述计算机处理器从所述图像提取与所述测试细胞群相关的一个或多个空间依赖性以及空间独立性表型特征,其包括:
i)获得所述DNA、在丝氨酸139上磷酸化的组蛋白H2AX(γH2AX)和F-肌动蛋白的Haralick灰度共生矩阵(GLCM);
ii)获得所述GLCM的统计;
iii)获得DNA与γH2AX或DNA与F-肌动蛋白之间的归一化空间相关性,所述一个或多个空间依赖性表型特征表征了与所述细胞相关的生物分子的空间分布;
iv)获得DNA与γH2AX或γH2AX与F-肌动蛋白之间的总强度的比率,以及
v)获得DNA、γH2AX和F-肌动蛋白的总强度和强度变异系数;
(d)获得与所述多个浓度中的每个浓度相关的响应值,其表示为描述对应的一个或多个表型特征的剂量反应曲线(DRC)的一个或多个定量的DRC参数,其中使用最大反应值Δmax获得所述定量的DRC参数;并且
(e)将所得的定量的DRC参数输入到预测模型中,所述预测模型使用选自随机森林、递归特征消除和支持向量机算法中的至少一种算法,以生成所述测试化合物的体内细胞毒性的预测,
其中参考定量的DRC参数衍生自两个组:
(i)对所述肺细胞或肾细胞具有已知体内毒性的化合物,和(ii)未知对所述肺细胞或肾细胞具有体内毒性的化合物。
14.根据权利要求13的方法,其中所述细胞是近端肾小管细胞(PTC)、支气管上皮细胞(BEC)或肺泡细胞(AVC)。
15.根据权利要求13的方法,其中使用经过训练数据集训练的监督学习算法获得所述预测模型。
16.根据权利要求15的方法,其中所述训练数据集包括多个候选定量的空间依赖性剂量反应曲线(DRC)参数,所述参数表征与对照细胞群相关的相应多个空间依赖性表型特征;所述对照细胞群分别已经经受了下列化合物的处理:(i)已知对所述细胞具有体内毒性的化合物,和(ii)未知对所述细胞具有体内毒性的化合物。
17.根据权利要求13的方法,进一步包括提取与所述至少一个测试细胞群相关的一个或多个空间独立性表型特征,其中所述空间独立性特征选自DNA与γH2AX、γH2AX与肌动蛋白之间的总强度的比率以及DNA,γH2AX与F-肌动蛋白的强度变异系数,并且进一步使用所述一个或多个空间独立性表型特征获得一个或多个定量的剂量反应曲线(DRC)参数。
18.根据权利要求13的方法,其中步骤(d)包括以预定浓度的所述测试化合物获得所述定量的DRC参数。
CN201680079245.5A 2015-11-20 2016-11-09 用于预测具有不同化学结构的异生物的细胞类型特异性毒性的基于高通量成像的方法 Active CN108885204B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201509598X 2015-11-20
SG10201509598X 2015-11-23
PCT/SG2016/050554 WO2017091147A1 (en) 2015-11-20 2016-11-09 High-throughput imaging-based methods for predicting cell-type-specific toxicity of xenobiotics with diverse chemical structures

Publications (2)

Publication Number Publication Date
CN108885204A CN108885204A (zh) 2018-11-23
CN108885204B true CN108885204B (zh) 2021-10-26

Family

ID=58764375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680079245.5A Active CN108885204B (zh) 2015-11-20 2016-11-09 用于预测具有不同化学结构的异生物的细胞类型特异性毒性的基于高通量成像的方法

Country Status (6)

Country Link
US (1) US20200309767A1 (zh)
EP (1) EP3377896A4 (zh)
KR (1) KR20180086438A (zh)
CN (1) CN108885204B (zh)
SG (1) SG11201804144UA (zh)
WO (1) WO2017091147A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388860B (zh) * 2018-02-12 2020-04-28 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
JP6558786B1 (ja) * 2018-09-28 2019-08-14 学校法人東北工業大学 標的の特性の予測を行うための方法、コンピュータシステム、プログラム
US11989960B2 (en) 2019-02-20 2024-05-21 Bluerock Therapeutics Lp Detecting cells of interest in large image datasets using artificial intelligence
CN110992320B (zh) * 2019-11-22 2023-03-21 电子科技大学 一种基于双重交错的医学图像分割网络
KR102369717B1 (ko) * 2019-12-19 2022-03-03 인제대학교 산학협력단 조직학 섹션에서 전립선암 종의 다중 특성 분류 방법
CN113192553B (zh) * 2020-01-14 2022-09-09 北京大学 基于单细胞转录组测序数据预测细胞空间关系的方法
CN111751263A (zh) * 2020-06-08 2020-10-09 西安交通大学 基于灰度共生矩阵的免标记细胞二维散射图像反演方法
CN112395747B (zh) * 2020-11-04 2023-05-09 南京信息工程大学 一种预测复杂联合作用方式的混合污染物毒性的方法
CN115142160B (zh) * 2022-08-22 2023-12-19 无锡物联网创新中心有限公司 一种纱线强力弱环的辨识方法及相关装置
US11874934B1 (en) 2023-01-19 2024-01-16 Citibank, N.A. Providing user-induced variable identification of end-to-end computing system security impact information systems and methods
US11748491B1 (en) * 2023-01-19 2023-09-05 Citibank, N.A. Determining platform-specific end-to-end security vulnerabilities for a software application via a graphical user interface (GUI) systems and methods
CN116595427B (zh) * 2023-07-18 2023-09-19 青岛海关技术中心 一种化学品潜在长期健康危害分类预测方法、介质及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007103406A2 (en) * 2006-03-09 2007-09-13 Cytokinetics, Inc. Cellular predictive models for toxicities
CN104641229A (zh) * 2012-07-20 2015-05-20 新加坡科技研究局 预测肾近曲小管细胞毒性的体外试验
WO2015142288A1 (en) * 2014-03-17 2015-09-24 Agency For Science, Technology And Research METHOD FOR PREDICTING TOXICITY OF A COMPOUND BASED ON NUCLEAR FACTOR-κB TRANSLOCATION

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003286697A1 (en) * 2002-10-25 2004-05-13 Norak Biosciences, Inc. Methods of identifying reduced internalization transmembrane receptor agonists
GB2435925A (en) * 2006-03-09 2007-09-12 Cytokinetics Inc Cellular predictive models for toxicities
US20080195322A1 (en) * 2007-02-12 2008-08-14 The Board Of Regents Of The University Of Texas System Quantification of the Effects of Perturbations on Biological Samples
WO2012118663A1 (en) * 2011-02-28 2012-09-07 Cellomics, Inc. Predicting toxicity of a compound over a range of concentrations
WO2013067498A1 (en) * 2011-11-04 2013-05-10 Tengion, Inc. Drug screening and potency assays

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007103406A2 (en) * 2006-03-09 2007-09-13 Cytokinetics, Inc. Cellular predictive models for toxicities
CN104641229A (zh) * 2012-07-20 2015-05-20 新加坡科技研究局 预测肾近曲小管细胞毒性的体外试验
WO2015142288A1 (en) * 2014-03-17 2015-09-24 Agency For Science, Technology And Research METHOD FOR PREDICTING TOXICITY OF A COMPOUND BASED ON NUCLEAR FACTOR-κB TRANSLOCATION

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Image-based multivariate profiling of drug responses from single cells;Loo Lit-Hsim等;《Nature Methods》;20070531;第4卷(第5期);摘要,图1,第447页右侧第3段,第449页左侧第2段,附加图2,附加方法第4-6页的特征列表 *
Prediction of drug-induced nephrotoxicity and injury mechanisms with human induced pluripotent stem cell-derived cells and machine learning methods;Kandasamy Karthikeyan等;《Scientific Reports》;20150727;第5卷;第7页最后一段-第8页第1段,图4,表1,第13页第1段 *

Also Published As

Publication number Publication date
WO2017091147A1 (en) 2017-06-01
KR20180086438A (ko) 2018-07-31
EP3377896A4 (en) 2019-04-10
SG11201804144UA (en) 2018-06-28
WO2017091147A8 (en) 2017-06-29
CN108885204A (zh) 2018-11-23
EP3377896A1 (en) 2018-09-26
US20200309767A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
CN108885204B (zh) 用于预测具有不同化学结构的异生物的细胞类型特异性毒性的基于高通量成像的方法
Su et al. High-throughput imaging-based nephrotoxicity prediction for xenobiotics with diverse chemical structures
US10886008B2 (en) Methods and systems for determining the biological age of samples
Gaglia et al. HSF1 phase transition mediates stress adaptation and cell fate decisions
Kang et al. Improving drug discovery with high-content phenotypic screens by systematic selection of reporter cell lines
Ramsden et al. Laminar and dorsoventral molecular organization of the medial entorhinal cortex revealed by large-scale anatomical analysis of gene expression
Fetz et al. Target identification by image analysis
JP2022501011A (ja) 細胞を分析する方法
Lee et al. Building predictive in vitro pulmonary toxicity assays using high-throughput imaging and artificial intelligence
Padmanabhan et al. An active learning approach for rapid characterization of endothelial cells in human tumors
Papiez et al. BatchI: Batch effect Identification in high-throughput screening data using a dynamic programming algorithm
Khan et al. Unbiased data analytic strategies to improve biomarker discovery in precision medicine
Doktorova et al. Comparison of hepatocarcinogen-induced gene expression profiles in conventional primary rat hepatocytes with in vivo rat liver
Adams et al. Compound classification using image‐based cellular phenotypes
Liu et al. Pathological prognosis classification of patients with neuroblastoma using computational pathology analysis
WO2023049209A1 (en) Systems and methods for evaluation of mitotic events using machine-learning
Hossain Mollah et al. β-empirical Bayes inference and model diagnosis of microarray data
US20220221460A1 (en) Method of quantifying her2 in breast cancer sample by mass spectrometry and scoring her2 status using the same
Yenkin et al. Pooled image-base screening of mitochondria with microraft isolation distinguishes pathogenic mitofusin 2 mutations
KR20190046940A (ko) 개인의 생물학적 상태를 예측하기 위한 시스템, 방법 및 유전자 시그니처
Zhao et al. Detection of differentially abundant cell subpopulations discriminates biological states in scRNA-seq data
US20230117405A1 (en) Systems and methods for evaluation of chromosomal instability using machine-learning
US11978538B2 (en) Systems and methods for associating compounds with properties using clique analysis of cell-based data
Moraes et al. Predicting Age from Human Lung Tissue Through Multi-modal Data Integration
Mircea et al. A clusterability measure for single-cell transcriptomics reveals phenotypic subpopulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant