KR20180086438A - 다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법 - Google Patents

다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법 Download PDF

Info

Publication number
KR20180086438A
KR20180086438A KR1020187017042A KR20187017042A KR20180086438A KR 20180086438 A KR20180086438 A KR 20180086438A KR 1020187017042 A KR1020187017042 A KR 1020187017042A KR 20187017042 A KR20187017042 A KR 20187017042A KR 20180086438 A KR20180086438 A KR 20180086438A
Authority
KR
South Korea
Prior art keywords
cell
dna
region
glcm
feature
Prior art date
Application number
KR1020187017042A
Other languages
English (en)
Inventor
릿-신 루
지아 잉 리
란 수
다니엘 징크
스징 슝
Original Assignee
에이전시 포 사이언스, 테크놀로지 앤드 리서치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이전시 포 사이언스, 테크놀로지 앤드 리서치 filed Critical 에이전시 포 사이언스, 테크놀로지 앤드 리서치
Publication of KR20180086438A publication Critical patent/KR20180086438A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5014Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing toxicity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G06F19/18
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • G01N2001/302Stain compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10064Fluorescence image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Toxicology (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Cell Biology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Optics & Photonics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 배양된 세포의 고처리량 영상화, 정량적 표현형 프로파일링, 및 머신 러닝 방법을 조합한, 화합물의 생체내 세포 특이적 독성을 예측하는 방법을 제공한다. 더욱 특히, 본 발명은 배양된 인간 신장 및 폐 세포를 가용성 화합물 또는 미립자 화합물과 농도 범위에 걸쳐 접촉시키는 단계, 이어서, 세포를 DNA, γH2AX 및 액틴 마커로 표지화하는 단계, 및 텍스처 피쳐, 공간 상관관계 피쳐, 마커의 비, 강도 피쳐, 세포 계수 및 형태를 수득하는 단계, 용량 반응 곡선을 추정하는 단계, 및 랜덤 포레스트 알고리즘을 사용하여 화합물의 자동 분류를 수행하는 단계를 포함하는, 가용성 화합물 또는 미립자 화합물의 생체내 신장 근위 세뇨관, 기관지 상피, 및 폐포 세포 특이적 독성을 예측하는 방법을 제공한다.

Description

다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법
본 발명은 배양된 세포의 고처리량 영상화를 조합하는, 화합물의 생체내 세포 특이적 독성 예측 방법을 제공한다. 더욱 특히, 본 발명은 배양된 인간 신장 및 폐 세포의 고처리량 영상화 조합하는, 가용성 또는 미립자 화합물의 생체내 신장 근위 세뇨관, 기관지 상피, 및 폐포 세포 특이적 독성 예측 방법을 제공한다.
신장 및 폐는 혈장으로부터의 생체이물질의 대사 및/또는 제거에서 중요한 역할을 한다. 의약, 식품 또는 환경 기원의 외부 화합물은 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 및 폐포 세포 (AVC)에 의해 수송되고, 대사 작용을 한다. 흡수 후, 생체이물질 및 그의 대사산물/중간체는 PTC, BEC, 및 AVC를 손상시킬 수 있고; 급성 신장/폐 손상 또는 만성 신장/폐 질환을 유도할 수 있다. 그러므로, 생체이물질의 안전성 사정, 및 상기 화합물에 의해 제기되는 건강 및 환경상 위험 관리를 위해서는 PTC, BEC, 및 AVC 특이적 독성을 예측하는 정확한 방법이 중요하다.
인간에서 생체이물 독성을 예측하는 현행 접근법이 수개 존재한다. 동물 실험이 표준 접근법이지만, 처리 소요 시간이 길고, 처리량이 낮으며, 종종 인간 동성을 예측하는 데에는 충분하지 않다는 문제를 겪고 있다 (문헌 [Krewski et al., J Toxicol Environ Health Part B 13: 51-138 (2010)]). 이러한 접근법은 특히 다수의 현존하는, 및 그 수가 계속 증가하는 신규 합성 화합물, 예컨대, 화학물질 및 나노입자를 평가하는 데에는 비적합하다. 사실상, 동물 실험에 대한 대안에 관한 현 관심은 다양한 화학 구조 및 손상 기전을 가지는 다수의 화합물을 효율적으로 시험하여야 하는 요건을 통해 주목받게 되었다. 이는 예를 들어, 현재 법령, 예컨대, 유럽 연합의 "화합물에 관한 등록, 평가, 허가 및 제한(Registration, Evaluation, Authorization and restriction of Chemicals: REACH)" (문헌 [Lilienblum et al., Arch Toxicol 82: 211-236 (2008)]) 상의 규제에 의해 반영된다. 정량적 구조-활성 관계 (QSAR)의 연산 모델링은 화학 구조 또는 기전이 특이적이거나, 또는 널리 이해되고 있는 화합물에 대한 신속한 접근법이고, 잘 운영되고 있다 (문헌 [Cherkasov et al., J Med Chem 57: 4977-5010 (2014)]). 그러나, 대부분의 QSAR 모델은 화합물 노출의 생물학적 맥락을 고려하지 않으며, 이에, 다양한 화학 구조를 가지는 화합물의 복잡한 생물학적 반응, 예컨대, 기관 특이적 독성을 예측하는 데 있어 적용이 제한되고 있다. 마지막으로, 무한증식, 1차 또는 줄기 세포 유래의 인간 세포에 기반한 시험관내 검정법은 처리량과 생리학적 적절성 사이에 균형을 제공할 수 있다.
현행 세포 기반 신장독성 검정법 대부분은 세포 사멸/건강 종점 (문헌 [Lin and Will Toxicol Sci 126: 114-127 (2012)]; [Jang et al., Integr Biol 5: 1119-1129 (2013)]) 또는 유전자 발현 마커 (문헌 [Hoffmann et al., Toxicol Sci 116: 8-22 (2010)])에 기반한다. 그러나, 현행 세포 기반 검정법 대부분은 극소수의 신장독성 물질 (일반적으로, < 5개)에 대해 시험하였거나 (문헌 [Jang et al., Integr Biol 5: 1119-1129 (2013)]; [Tiong et al., Mol Pharm 11: 1933-1948 (2014)]), 대규모 연구에서 기관 특이적 독성을 예측하는 데에는 충분하지 못했다 (문헌 [Lin and Will Toxicol Sci 126: 114-127 (2012)]). 그러므로, 신장독성을 정확하게 예측하는 것이 여전히 도전과제로서 남아 있으며, 규제력을 지닌, 승인받은 시험관내 신장독성 시험은 현재 없다. 최근, 본 발명자들은 무한증식 및 1차 인간 PTC- (문헌 [Li et al., Toxicol Res 2: 352-365 (2013)]; [Su et al. 2014]), 인간 배아 줄기 세포- (문헌 [Li et al., Mol Pharm 11: 1982-1990 (2014)]), 및 iPSC-유래 PTC-유사 세포 (문헌 [Kandasamy et al,. Sci Rep. doi: 10.1038/srep12337 (2015)])에서의 화합물 유도성 인터루킨 (IL)-6/8 발현 수준에 기반한 신장독성 모델을 개발하였다. 본 발명자들은, 음성 참조 화합물로서 비-PTC-독성 신장독성 물질 및 비-신장독성 화합물을 포함한, 구조적으로 다양한 화합물로 이루어진 큰 세트 (~30-40)를 사용하여 상기 모델의 성능을 엄격하게 평가하였다. 상기 모델의 시험 정확도가 비교적 높은 것 (~75.3%)에 기인하여, 본 발명자들은 구조 및 표적이 다양한 PTC 독성 물질에 의해 통상 유도되는 PTC 특이적 손상이 존재할 수 있다는 가설을 제기한다. 추가로, 본 발명자들의 이전 연구에서 사용된 IL-6/8 측정의 RNA 단리 및 qPCR 단계는 고처리량 적용을 위해 자동화시키기 어렵고, 비용이 많이 든다. 그러므로, 상기 화합물에 유도되는 세포 손상 및 반응에 새로운 통찰력도 제공할 수 있는, 대안적인 고처리량이고, 비용 효율적이며, 정확한 신장독성 예측 접근법 개발이 여전히 요구되고 있다.
유사하게, 여러 그룹들이 무한증식 세포주 및 1차 세포에 기반하여 시험관내 폐 독성 모델을 구축하기 위해 시도하여 왔다 (문헌 [Seagrave et al., Exp Toxicol Pathol 57: 233-238 (2005)]; [Sayes et al., Toxicol Sci 97(1): 163-180 (2007)]). 이들 모델들 대부분은 독성 종점으로서 락테이트 데히드로게나게 (LDH) 방출 또는 3-(4,5-디메틸티아졸-2-yl)2,5-디페닐-테트라졸륨 브로마이드 (MTT) 환원 억제를 사용하였다. 그러나, 이들 모델은 심지어 중간 정도 개수의 폐 독성 화합 (~5-10개)에 대한 생체내 독성 예측에도 매우 불량하였다 (문헌 [Seagrave et al., Exp Toxicol Pathol 57: 233-238 (2005)]; [Sayes et al., Toxicol Sci 97(1): 163-180 (2007)]). 본 발명자들이 아는 한, 다수의 (>20개) 화합물의 생체내 독성을 정확하게 예측할 수 있는 시험관내 폐 독성 모델은 현재 없다.
생체이물 유도성 손상은 세포 기능을 손상시키고, 예컨대, 재조직화와 같은 세포 표현형을 변화시키고, 세포 및 세포 내(subcellular) 구조를 변화시킨다. 세포 표현형에 기반하여 독성을 예측하는 것이 가지는 주된 이점 중 하나는 세포 손상 기전을 선험적으로 정의할 필요가 없다는 점이다. 이는 동일한 유형의 손상 및 반응을 유도하지만, 상이한 생화학적 기전을 통해 유도할 수 있는 생체이물 화합물로 이루어진 다양한 세트에 대한 모델을 구축하는 데 특히 유용하다. 특이적 기전에 기반한 모델은 특이적 부류의 화합물만을 커버할 수 있고, 일반적으로 다른 화합물에는 적용되지 못할 수 있다 (문헌 [Tiong et al., Mol Pharm 11: 1933-1948 (2014)]). 수개의 이전 연구들 (문헌 [O'Brien et al., Arch Toxicol 80: 580-604 (2006)]; [Abraham et al. J Biomol Screen 13: 527-537 (2008)]; [Xu et al., Toxicol Sci 105: 97-105 (2008)]; [Tolosa et al., Toxicol Sci 127: 187-198 (2012)]) 및 특허 (홍 및 고시(Hong and Ghosh), 특허 출원 번호 US 14/334,453 (2015))는 세포 표현형의 변화를 측정하고, 생체이물 화합물의 독성을 예측하는 데 영상화를 사용하여 왔다. 상기 이전 영상화 기반 독성 검정법에는 2가지 중요한 한계가 존재한다. 첫째, 그들 대부분은 오직 세포 영상으로부터 공간 비의존성 피쳐만을 추출해 낸다. 가장 보편적으로 사용되는 공간 비의존성 피쳐 2가지는 세포 또는 세포 내 영역 중의 모든 픽셀의 강도값의 합, 및 세포 또는 세포 내 영역의 면적이다 (문헌 [O'Brien et al., Arch Toxicol 80: 580-604 (2006)]; [Abraham et al. J Biomol Screen 13: 527-537 (2008)]; [Xu et al., Toxicol Sci 105: 97-105 (2008)]; [Tolosa et al,. Toxicol Sci 127: 187-198 (2012)]; 홍 및 고시, 특허 출원 번호 US 14/334,453 (2015)). 이들 피쳐는 개별 픽셀의 위치는 고려하지 않으며, 설령 기본 픽셀의 위치가 무작위로 셔플링되는 경우에서도 조차 정확하게 같은 값을 제공할 것이다. 둘째, 이들 검정법들은 대부분은 오직 추출된 피쳐 또는 세포 사멸 판독값의 용량 반응 곡선의 반수 최대 억제농도 (IC50), 최소 유효 농도 (MEC), 또는 다른 농도 기반 파라미터에만 기반한다 (문헌 [O'Brien et al., Arch Toxicol 80: 580-604 (2006)]; [Abraham et al. J Biomol Screen 13: 527-537 (2008)]; [Tolosa et al,. Toxicol Sci 127: 187-198 (2012)]). 이들 2가지 한계에 기인하여, 상기의 이전 연구들 대부분은 기관 특이적 독성을 예측하는 데 있어 평가를 하지 못하였거나, 또는 성능이 매우 불량하였다. 예를 들어, 오브라이언(O'Brien)에 의해 개발된 영상화 기반 검정법은 간에는 비독성이지만, 다른 기관에는 독성을 띠는 시험 화합물 50개 중 45개를 간 독성인 것으로 잘못 분류하였다 (특이도 = 단지 10%에 불과).
본 발명은 대안적인 고처리량이고, 비용 효율적이며, 정확한 세포 유형 특이적 독성 예측 접근법을 제공한다.
본 발명의 제1 측면에서,
(a) 적어도 하나의 세포 시험 집단을 시험 화합물과 단일 농도에서, 또는 농도 범위에 걸쳐 접촉시키는 단계,
(b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
(c) 세포를 분절시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역을 확인하는 단계,
(d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
(e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
(f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
(g) DRC의 정량화된 파라미터를 수득하는 단계, 및
(h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
(i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함하는, 시험 화합물이 생체내에서 특이적 세포 유형에 대하여 독성일지 여부를 예측하는 시험관내 방법을 제공한다.
본 발명의 바람직한 실시양태에서, 본 방법은
(a) 다중의 세포 시험 집단을 접촉시키는 단계;
(b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
(c) 세포를 분절시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역을 확인하는 단계,
(d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
(e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
(f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
(g) DRC의 정량화된 파라미터를 수득하는 단계, 및
(h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
(i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함한다.
본 발명의 바람직한 실시양태에서, 상기 특이적 세포 유형은 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 및/또는 폐포 세포 (AVC)를 포함하는 군으로부터 선택된다.
본 발명의 바람직한 실시양태에서, 단계 (h)는 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
PTC인 경우; (i) 생체내 PTC 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 신장독성이지만, PTC 독성인 것으로 공지되어 있지 않은 화합물 및 생체내에서 신장독성인 것으로 공지되어 있지 않은 화합물; 또는
BEC 또는 AVC인 경우; (i) 생체내 BEC 또는 AVC 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 폐독성이지만, BEC 또는 AVC 독성인 것으로 공지되어 있지 않은 화합물 및 생체내에서 폐독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함한다.
본 발명이 바람직한 실시양태는 세포의 공간 의존성 염색체 및 세포골격 피쳐의 측정, 그의 최대 반응 값, 및 연속 자동화 분류 알고리즘을 이용하여 사용하여 생체내 세포 특이적 독성을 예측하는 방법을 제안한다.
본 발명의 바람직한 실시양태에서, 상기 하나 이상의 정량화된 표현형 피쳐는 DNA 손상 반응, 액틴 필라멘트 완전성, 전체 세포 형태, 및 세포 계수로 이루어진 군으로부터 선택되는 특징과 연관이 있다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 (i) 텍스처 피쳐, 공간 상관관계 피쳐, 및 상이한 세포 내 영역에서의 마커의 비를 포함하는 군으로부터 선택되는 공간 의존성 피쳐 중 하나 이상의 것; 및 (ii) 강도 피쳐, 세포 계수 및 형태를 포함하는 군으로부터 선택되는 공간 의존성 피쳐 중 하나 이상의 것에 기초하여 정량화된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 세포 마커는 DNA, 액틴 및 DNA 손상 반응 마커인 세린 139 상에서 인산화된 히스톤 H2AX (γH2AX)를 포함하는 군으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, DRC 파라미터는 각 표현형 피쳐에 대한 시험 화합물의 DRC의 최대 반응 값 Δ최대를 사용하여 정량화된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 내부 세포질 영역에서의 전체 액틴 강도 수준; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM); 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 세포 계수로 이루어진다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 신장독성은 랜덤 포레스트 알고리즘을 사용하여 예측된다.
본 발명의 제2 측면에서,
(a) 컴퓨터 프로세서에 의해 세포 시험 집단의 영상을 수신하는 단계;
(b) 컴퓨터 프로세서에 의해 영상으로부터 세포 시험 집단과 연관된 하나 이상의 공간 의존성 표현형 피쳐를 추출하는 단계로서, 하나 이상의 공간 의존성 표현형 피쳐는 세포와 연관된 생체분자의 공간 분포를 특징으로 하는 것인 단계;
(c) 각각의 하나 이상의 공간 의존성 표현형 피쳐의 용량 반응 곡선 (DRC)을 기술하는 하나 이상의 정량화된 DRC 파라미터를 수득하는 단계; 및
(d) 상기 하나 이상의 정량화된 DRC 파라미터를 예측 모델에 입력하여 시험 화합물의 생체내 세포 독성 예측을 생성하는 단계를 포함하는, 시험관내에서 시험 화합물 처리를 받은 세포 시험 집단을 사용하여 시험 화합물의 생체내 세포 독성을 예측하는 컴퓨터 실행 방법을 제공한다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 영상은, 각각의 영상이 세포와 연관된 한 유형의 생체분자를 강조하는 각각의 영상화 채널을 사용하여 영상화된 세포 시험 집단을 나타내는 것인 복수 개의 영상을 포함한다. 예를 들어, 각각의 영상화 채널은 세포 내의 특이적 유형의 생물학적 조성물 또는 분자를 표적화하는 한 유형의 형광성 마커를 영상화하기 위한 것이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 복수 개의 영상의 각각의 영상은 상응하는 유형의 생체분자를 표적화하는 한 유형의 바이오마커의 분포를 나타낸다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 단계 (b)는 영상을 사용하여 세포를 분절시키고, 분절된 세포에 상응하는 영상의 강도 값을 사용하여 하나 이상의 공간 의존성 표현형 피쳐를 추출하는 것을 포함한다.
본 발명의 바람직한 실시양태에서, 하나 이상의 공간 의존성 표현형 피쳐는 세포의 DNA 구조 변경, 크로마틴 구조 변경 및 액틴 필라멘트 구조 변경을 특징으로 하는 피쳐를 포함하는 군으로부터 선택된다.
본 발명의 바람직한 실시양태에서, 단계 (d)는 시험 화합물을 세포에 대하여 독성 또는 비독성인 것으로 분류하는 것을 포함한다.
본 발명의 바람직한 실시양태에서, 예측 모델은 훈련 데이터 세트로 훈련된 지도 학습 알고리즘을 사용하여 수득된다.
본 발명의 또 다른 측면은 컴퓨터 프로세서 및 데이터 저장 장치를 가지는 컴퓨터 시스템으로서, 데이터 저장 장치는 본 발명의 임의 측면에 따른 컴퓨터 실행 방법을 실행하기 위해 상기 프로세서에 의해 작동되는 비일시적 명령을 저장하는 것인, 컴퓨터 시스템을 제공한다.
본 발명의 또 다른 측면은 적어도 하나의 프로세서가 본 발명의 임의 측면에 따른 컴퓨터 실행 방법을 실행하게 하는 프로그램 명령이 그 위에 저장되어 있는 것인, 비일시적 컴퓨터 판독가능 매체를 제공한다.
도 1은 참조 생체이물 화합물이 다양한 화학 구조를 가진다는 것을 보여주는 것이다. a) 참조 생체이물 화합물의 그의 공급원 또는 적용에 따른 분류. b ) 모든 참조 화합물 사이의 타니모토(Tanimoto) 계수에 기초한 화학 구조 비유사성을 보여주는 다차원 스케일링 플롯 (MDS1/2 = 다차원 스케일링의 제1 및 제2 좌표, 파선 = 간단하고, 유사한 화학 구조를 가진 화합물의 클러스터. 모든 산업용 화학물질은 그의 공지된 PTC 독성과 상관없이 다른 화합물과 함께 상기 클러스터 군으로 분류된다. 클러스터 내의 다수의 화합물이 서로 겹쳐져 있다.
도 2는 영상 및 데이터 분석 절차의 개요를 보여주는 것이다.
도 3은 참조 화합물로 처리된 1차 인간 근위 세뇨관 세포의 정량적 영상 기반 표현형 프로파일을 보여주는 것이다. a ) DMSO 대조군 또는 500 ㎍/mL 시스플라틴으로 처리된 1차 PTC에 대한 HPTC-A 데이터세트에서 사용된 4개의 형광 마커를 보여주는 면역형광 영상 (스케일 막대 = 20 ㎛). b) 상이한 농도의 시트리닌 또는 DMSO로 처리된 1차 PTC로부터 측정된 액틴 강도 값의 원시 변동 계수 (CV)에 대한 단일 세포 확률 분포 함수. 액틴 염색에 대한 예시적인 형광성 영상이 분포 함수 플롯 위에 제시되어 있다 (스케일 막대 = 20 ㎛). c ) 3개의 참조 화합물 (오크라톡신 A 및 시트리닌은 PTC-독성 화합물이고, 리바비린은 비-PTC-독성 화합물이다)에 의해 유도된 액틴 강도의 CV 변화에 관한 용량 반응 곡선 (DRC). 5 mM에서 각 화합물의 반응 곡선으로부터 그에 대한 최대 반응 값 (Δ최대)을 측정하였다. d ) 44개의 참조 화합물 (열)로 처리된 1차 인간 PTC로부터 측정된 129개의 표현형 피쳐 (행) 모두에 대한 Δ최대 값을 보여주는 열 지도. (계통수 = Δ최대 값에 기초한 화합물 또는 피쳐의 계층적 클러스터링, 파선 = 화합물의 클러스터링으로부터 확인된 2개의 주요 클러스터 사이의 분리).
도 4는 자동화된 세포 분절을 보여주는 것이다. 1차 인간 근위 세뇨관 세포의 자동적으로 확인된 세포 경계 (흰색 선) 및 핵 경계 (회색 선)를 보여주는 전 프레임의 면역형광 영상의 예. 영상 경계와 접하고 있는 세포는 본 발명자들의 분석에 포함시키지 않았다.
도 5는 PTC의 시험관내 DNA 및 세포골격 피쳐에 기초한 인간 생체내 신장독성 예측을 보여주는 것이다. a ) 129개의 모든 표현형 피쳐로부터 최고 단일 피쳐 (f 최고 )를 확인하기 위한 절차를 보여주는 개략도. HPTC-A 데이터세트에서의 상이한 b) 피쳐 마커 군 또는 c) 피쳐 유형 군으로부터의 최고 단일 피쳐에 기초한 분류기의 균형 시험 정확도. d ) 129개의 모든 표현형 피쳐로부터 최고 피쳐 서브세트 (F s )를 확인하기 위한 절차를 보여주는 개략도. e ) 10-겹 교차 검증 중 하나로부터의 자동화 피쳐 삭제의 결과의 예. 모든 피쳐로부터 출발하여 마지막 유지된 피쳐까지, 본 발명자들의 반복 피쳐 삭제 알고리즘의 매회 반복 동안 선택된 피쳐 서브세트의 성능이 제시되어 있다 (회색 점 = 매회 반복 동안 유지된 피쳐 서브세트의 균형 시험 정확도, 검은색 선 = 모든 균형 시험 정확도 값의 스플라인 보간, 검은색 점 = 최소 개수의 피쳐의 극댓값, 수평 파선 = 상위 및 하위 5-백분위수, 또는 마지막 극댓값을 중심으로 한 가우시안 분포의 한계, 흰색 점 = 상한과 하한 사이의 정확도 값 및 최소 개수의 피쳐를 가지는 서브세트인, 최종적으로 선택된 피쳐 서브세트의 균형 시험 정확도). 본 실시예에서, 최적으로 선택된 피쳐 개수는 4개였다 (수직 파선). 피쳐의 임의의 추가 삭제가 분류기의 성능을 감소시킬 것이다. f) HPTC-A 데이터세트에 대한 상이한 단일 피쳐 분류기 및 다중 피쳐 분류기 사이의 균형 시험 정확도 비교. 정확도 값은 10x10-겹 교차 검증을 사용하여 추정하였다 (오차 막대 = 평균의 표준 오차). g ) F s 에서의 그의 유클리드 거리(Euclidean distances)에 기초한 HPTC-A 데이터세트 중의 모든 참조 화합물 사이의 표현형 비유사성을 보여주는 다차원 스케일링 플롯 (MDS1/2 = 다차원 스케일링의 제1 및 제2 좌표).
도 6은 최고 단일 피쳐에 의해 제시되는 공간 분포 패턴을 보여주는 것이다. 하기 3개의 모든 데이터세트에 대한 최고 단일 피쳐 (f최고)에 의해 제시된 공간 분포 패턴을 보여주는 예시적인 면역형광 영상; a) DNA GLCM의 평균 엔트로피, b) 핵 영역 대 전체 세포 영역에서의 전체 γH2AX 수준의 비, 및 c) DNA GLCM의 평균 상관관계. 다양한 값 (좌측=낮음, 가운데=중간, 및 우측=높음)의 피쳐를 보이는 세포가 나타났다. 영상으로부터 정량화된 피쳐 값이 각 영상 아래 제시되어 있다.
도 7은 최종적으로 선택된 피쳐의 평균 중요도 값을 보여주는 것이다. 3개의 데이터세트에 대하여 10x10 교차 검증 절차를 사용하여 추정된 평균 피쳐 중요도 값. 오직 상위 10개의 피쳐만 제시되어 있다 (검은색 막대 = 최종적으로 선택된 피쳐 (F 최종), 흰색 막대 = 다른 상위 10개의 피쳐.). 피쳐 명칭은 셀X프레스(CellXpress) 포맷으로 제시되어 있고, 최종적으로 선택된 피쳐에 관한 상세한 설명은 하기 표 3에 포함되어 있다.
도 8은 PTC 독성 물질이 시험관내 조건하에서 DNA 손상 반응을 유도하였다는 것을 보여주는 것이다. 시클로스포린 A로 처리된 1차 인간 PTC의 a) DNA 및 b) γH2AX 염색 수준을 보여주는 HPTC-B 데이터세트로부터의 예시적인 면역형광 영상 (스케일 막대 = 20 ㎛). DNA의 CV, DNA GLCM의 ASM, 및 평균 핵 γH2AX 수준에 대한 정량화된 값은 세포 아래 괄호 안에 제시되어 있다. c) 상이한 투여량의 시클로스포린 A 또는 DMSO로 처리된 1차 PTC의 DNA의 원시 CV 및 평균 핵 γH2AX 수준을 보여주는 산점도 (점 = 영상으로부터 정량화된 단일 세포 측정값). d ) HPTC-B 또는 e) HK-2 데이터세트에 대한 DNA의 CV 및 평균 핵 γH2AX 수준에서의 최대 반응 (Δ최대)을 보여주는 산점도 (동그라미 = 화합물, Δ최대 = PTC-독성 화합물의 평균값과 비-PTC-독성 화합물의 평균값 사이의 차이, 파선 = 데이터의 최적 선형 회귀 피트, r = 피어슨 상관 계수; 제시된 모든 p 값은 단측 t 검정으로부터 구한 값이었다). DNA 손상 반응과 세포 사멸 사이의 관계를 연구하기 위해 선택된 6개의 화합물은 강조 표시되어 있다. f ) 마커의 분포, g) 균형 시험 정확도, h) 시험 민감도, 및 i) 3개의 모든 데이터세트에 대한 최고 단일 및 다중 피쳐의 시험 특이도.
도 9는 PTC-독성 화합물 및 비-PTC-독성 화합물로 처리된 인간 HK-2 세포에서의 γH2AX 및 DNA 염색 패턴을 보여주는 것이다. 5개의 PTC-독성 화합물 (좌측 서브패널), 3개의 비-PTC-독성 화합물 (우측 서브패널), 및 2개의 용매 대조군 (우측 서브패널)으로 처리된 인간 HK-2 세포에서의 γH2AX 및 DNA 염색 패턴을 보여주는 면역형광 현미경 영상. 동일한 마커로부터의 모든 영상은 동일한 노출 시간 및 강도 범위를 가진다 (스케일 막대 = 20 ㎛).
도 10은 PTC 독성 물질이 가변적인 세포 사멸 반응을 유도한다는 것을 보여주는 것이다. a ) DMSO, 시스플라틴, 및 오크라톡신 A로 처리된 1차 인간 PTC의 γH2AX, 에티듐 동종이량체-III, 아넥신-V, 및 절단된 카스파제-3 염색 수준을 보여주는 면역형광 영상 (스케일 막대 = 20 ㎛). b ) 에티듐-III-, 아넥신-V-, 및 카스파제-3-양성 세포에 대한 임계값 (수직 파선)이 어떻게 측정되었는지를 보여주는 확률 밀도 함수 플롯. c ) 평균 핵 γH2AX 수준 변화 대비 에티듐-III-, 아넥신-V-, 또는 카스파제-3-양성 세포 비율(%)의 변화를 보여주는 산점도 (동그라미 = 화합물, 오차 막대 = 평균의 표준 오차, Δ최대 = PTC-독성 화합물의 평균값과 비-PTC-독성 화합물의 평균값 사이의 차이, 파선 = 데이터의 최적 선형 회귀 피트, r = 피어슨 상관 계수; 제시된 모든 p 값은 단측 t 검정으로부터 구한 값이었다).
도 11. 참조 폐독성 화합물 및 비-폐독성 화합물, 및 그의 적용 또는 공급원에 관한 목록.
도 12는 폐독성 가용성 화합물 및 미립자 화합물이 본 발명자들의 시험관내 폐독성 모델의 표현형의 변화를 유도한다는 것을 보여주는 것이다. a ) 4개의 형광 마커로 염색되고, DMSO (용매 대조군, 상단), 2 mM 니트로푸란토인 (중간), 및 1 mg/mL 흄드 실리카 (하단)로 처리된 인간 폐 세포를 보여주는 면역형광 영상. 상기 화합물은 DNA 손상 반응 마커인 γH2AX의 인산화, 및 액틴의 리모델링 변화를 유도한다. 니트로푸란토인 및 흄드 실리카, 둘 모두 인간에서 각각 폐 질환 및 규폐증을 유발하는 것으로 공지되어 있다. b) 표현형 피쳐는 7개의 세포 내 영역으로부터 자동적으로 측정되었다.
도 13은 BEC 및 AVC의 시험관내 DNA, γH2AX 및 액틴 피쳐에 기초한 인간 생체내 폐독성 예측을 보여주는 것이다. 각각 a) A549 및 b) BEAS-2B에서의 가용성 화합물 및 미립자 화합물에 대한 5개의 최고 단일 피쳐 f최고.
도 14는 BEAS-2B 세포에서의 가용성 화합물에 대한 f최고에 의해 제시된 공간 분포 패턴을 보여주는 면역형광 영상. 상이한 농도의 니트로푸란토인 (좌측=대조군, 중간=저농도, 우측=고농도)으로 처리된 세포의 영상이 제시되어 있다. 세포로부터 측정된 상응하는 피쳐 값은 영상 아래 제시되어 있다.
도 15는 BEAS-2B 세포에서의 미립자 화합물에 대한 f최고에 의해 제시된 공간 분포 패턴을 보여주는 면역형광 영상. 상이한 농도의 실리카 입자 (좌측=대조군, 중간=저농도, 우측=고농도)로 처리된 세포의 영상이 제시되어 있다. 세포로부터 측정된 상응하는 피쳐 값은 영상 아래 제시되어 있다.
본 발명에서, 본 발명자들은 생체이물 화합물의 생체내 PTC 독성을 자동적으로 예측하기 위해 공간 의존성 피쳐를 사용하였다. 본원에서 제공된 실시예에서, 본 발명자들은 생체이물 화합물의 생체내 신장독성 및 폐독성을 자동적으로 예측하기 위해 공간 의존성 피쳐를 사용하였다.
본 명세서에서 언급된 서지 참고문헌은 편의상 참고문헌 목록 형태로 열거되어 있으며, 이는 실시예 끝에 첨부되어 있다. 상기 서지 참고문헌의 전체 내용이 본원에서 참조로 포함된다.
정의
편의상, 본 명세서, 실시예 및 첨부된 특허청구범위에서 사용된 특정 용어는 여기 수록되어 있다.
본원에서 사용되는 바, 본원에서 사용되는 "시험 민감도"란, 시험된 모든 공지의 신장독성, 폐독성 또는 또 다른 특이적 조직 독성 화합물에 대한 백분율(%)로서, 시험에 따라 양성 반응을 보인, 생체내에서 신장독성, 폐독성 또는 상기 또 다른 특이적 조직에 대해 독성인 것으로 공지된 화합물의 개수를 지칭한다.
본원에서 사용되는 바, 본원에서 사용되는 "시험 특이도"이란, 시험된 모든 공지의 비-신장독성, 비-폐독성 또는 상기 또 다른 비-특이적 조직 독성 화합물에 대한 백분율(%)로서, 시험에 따라 음성 반응을 보인, 생체내에서 신장독성, 폐독성 또는 상기 또 다른 특이적 조직에 대해 독성이 아닌 것으로 공지된 화합물의 개수를 지칭한다. 예를 들어, 상기 또 다른 조직은 심장 세포, 뉴런 세포 또는 암 세포를 포함할 수 있다.
본원에서 사용되는 바, "공간 의존성 표현형 피쳐"는 생체분자 마커로 표지화된 세포의 현미경 영상으로부터 확인되는 전체 세포 또는 세포 내 영역 중의 픽셀의 강도 값의 정량적, 공간 의존성 측정값 또는 통계치이다. 다시 말해, 공간 의존성 표현형 피쳐는 세포와 연관된 생체분자의 공간 분포를 특징으로 한다. 상기 피쳐 값은 픽셀의 세포내 국재화 및 공간 분포에 의존한다. 상기 피쳐 값은 픽셀 위치가 예를 들어, 무작위로 셔플링에 의해 변형된다면, 변할 것이다. 다르게는, 이는 "공간 비의존성 표현형 피쳐"로 불린다. 공간 의존성 피쳐의 예로는 텍스처 피쳐, 마커 사이의 공간 상관관계, 및 상이한 세포 내 영역에서의 마커의 강도 비가 있다. 공간 비의존성 피쳐의 예로는 세포 계수, 형태, 및 전체 세포 또는 세포 내 영역에서의 강도의 총합, 평균, 표준 편차, 또는 변동 계수가 있다.
본 발명과 관련하여 사용되는 "~을 포함하는"이라는 용어는 본 발명을 실시하는 데 다양한 구성요소, 성분, 또는 단계가 함께 공동으로 사용될 수 있다는 것을 지칭한다. 따라서, "~을 포함하는"이라는 용어는 "본질적으로 ~으로 이루어진" 및 "~으로 이루어진"이라는 더욱 제한적인 용어를 포함한다. "본질적으로 ~으로 이루어진"이라는 용어의 경우, 본 발명의 표현형 피쳐는 실질적으로 명시된 피쳐를 "본질적" 요소로서 포함한다는 것으로 이해된다.
비록 본원에 개시된 실시양태는 화합물이 신장독성인지 또는 폐독성인지 그 여부를 예측하는 것에 관한 것이지만, 다른 유형의 세포 독성 또한 본원에 개시된 프로세스를 사용하여 측정될 수 있다. 예를 들어, 암 세포는 항암제를 스크리닝하는 데 사용될 수 있고, 심장 세포는 심장독성을 연구하는 데 사용될 수 있고, 진피 세포는 진피 독성을 연구하는 데 사용될 수 있고, 뉴런 세포는 신경독성을 연구하는 데 사용될 수 있다.
본 발명의 제1 측면에서,
(a) 적어도 하나의 세포 시험 집단을 시험 화합물과 단일 농도에서, 또는 농도 범위에 걸쳐 접촉시키는 단계,
(b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
(c) 세포를 분절시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역을 확인하는 단계,
(d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
(e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
(f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
(g) DRC의 정량화된 파라미터를 수득하는 단계, 및
(h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
(i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함하는, 시험 화합물이 생체내에서 특이적 세포 유형에 대하여 독성일지 여부를 예측하는 시험관내 방법을 제공한다.
본 발명의 바람직한 실시양태에서, 본 방법은
(a) 다중의 세포 시험 집단을 접촉시키는 단계;
(b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
(c) 세포를 분절시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역을 확인하는 단계,
(d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
(e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
(f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
(g) DRC의 정량화된 파라미터를 수득하는 단계, 및
(h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
(i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함한다.
본 발명의 바람직한 실시양태에서, 상기 특이적 세포 유형은 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 및/또는 폐포 세포 (AVC)를 포함하는 군으로부터 선택된다.
본 발명의 바람직한 실시양태에서, 단계 (h)는 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
PTC인 경우; (i) 생체내 PTC 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 신장독성이지만, PTC 독성인 것으로 공지되어 있지 않은 화합물 및 생체내에서 신장독성인 것으로 공지되어 있지 않은 화합물; 또는
BEC 또는 AVC인 경우; (i) 생체내 BEC 또는 AVC 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 폐독성이지만, BEC 또는 AVC 독성인 것으로 공지되어 있지 않은 화합물 및 생체내에서 폐독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함한다.
본 발명의 바람직한 실시양태에서, 상기 하나 이상의 정량화된 표현형 피쳐는 DNA 손상 반응, 액틴 필라멘트 완전성, 전체 세포 형태, 및 세포 계수를 포함하는 군으로부터 선택되는 특징과 연관이 있다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 (i) 텍스처 피쳐, 공간 상관관계 피쳐, 및 상이한 세포 내 영역에서의 마커의 비를 포함하는 군으로부터 선택되는 공간 의존성 피쳐 중 하나 이상의 것; 및 (ii) 강도 피쳐, 세포 계수 및 형태를 포함하는 군으로부터 선택되는 공간 의존성 피쳐 중 하나 이상의 것에 기초하여 정량화된다. 텍스처 피쳐는 하랄릭(Haralick) 피쳐, 가보(Gabor) 피쳐 또는 웨이블릿(Wavelet) 피쳐를 포함할 수 있지만, 이에 제한되지 않는다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, DRC 파라미터는 시험 화합물의 DRC로부터의 각 피쳐에 대한 최대 반응 값 Δ최대를 사용하여 정량화된다. 바람직하게, 3회에 걸친 반복 실험 시험 간의 Δ최대의 중간값이 예측 분석에 사용된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 텍스처 피쳐는 특이적 세포 내 영역 또는 전체 세포 영역에서의 하랄릭 그레이 레벨 동시 발생 행렬 (GLCM)의 통계치, 즉, 핵 영역에서의 DNA GLCM의 평균 상관관계; 핵 영역에서의 DNA GLCM의 평균 엔트로피; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트; 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차; 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 전체 세포 영역에서의 DNA 손상 반응 마커인 세린 139 상에서 인산화된 히스톤 H2AX (γH2AX) γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균 중 하나 이상의 것을 포함한다. 바람직하게, 액틴 마커는 F-액틴이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 염색 강도 피쳐는 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 내부 세포질 영역에서의 전체 액틴 강도 수준; 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 및 핵 영역에서의 DNA 강도의 변동 계수를 포함하는 군 중 하나 이상의 것으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 염색 강도 비 피쳐는 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 핵 영역에서의 전체 γH2AX 강도 대 액틴 강도의 비; 및 핵 영역에서의 전체 γH2AX 강도 수준 대 전체 세포 영역에서의 전체 γH2AX 강도 수준의 비를 포함하는 군 중 하나 이상의 것으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 핵 영역에서의 DNA 강도의 변동 계수 (CV); 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 및 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM)를 포함하는 군으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 내부 세포질 영역에서의 전체 액틴 강도 수준; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM); 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 세포 계수를 포함하는 군으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균; 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 및 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차를 포함하는 군으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 핵 영역에서의 DNA GLCM의 평균 엔트로피; 핵 영역에서의 전체 γH2AX 강도 수준 대 전체 세포 영역에서의 전체 γH2AX 강도 수준의 비; 액틴 GLCM의 평균 상관관계; 및 핵 영역에서의 DNA GLCM의 평균 상관관계를 포함하는 군으로부터 선택된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 핵 영역에서의 DNA 강도의 변동 계수 (CV); 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 및 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM)로 된 군으로 이루어진다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 내부 세포질 영역에서의 전체 액틴 강도 수준; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM); 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 세포 계수로 된 군으로 이루어진다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 하나 이상의 표현형 피쳐는 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균; 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 및 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차로 된 군으로 이루어진다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 단계 (b)는 형광성, 동위 원소, 또는 비색 마커 및 영상화 기술을 사용하여 정량화된 표현형 피쳐를 수득하는 것을 포함한다. 마커는 DNA, 크로마틴, 액틴 필라멘트를 검출하는 데, 및 일반적으로, 전체 세포를 염색하는 데 사용될 수 있다. 예를 들어, 상기 바이오마커는 그에 형광성 단백질을 태그부착시킴으로써 유전적으로 표지화될 수 있다. 예를 들어, 항체는 DNA 손상 반응 마커인 세린 139 상에서 인산화된 히스톤 H2AX (γH2AX)를 검출하는 데 사용될 수 있거나, 또는 세포는 DNA를 표지화하기 위해 4',6-디아미디노-2-페닐인돌 (DAPI) 또는 2,5'-비-1H-벤즈이미다졸 (훽스트(Hoechst) 33342)로; 액틴 세포골격을 표지화하기 위해 로다민 팔로이딘 또는 딜라이트(Dylight)™ 554 팔로이딘으로; 및 HCS 셀마스크(HCS CellMask)™ 딥 레드 스테인 또는 홀 셀 스테인 레드로; 형광 영상화에서 세포 표면 및 내용물에 결합하여 고정된 세포가 완전하고, 균일한 시각화될 수 있도록 하는 반응성 염료로 염색될 수 있다. 홀 셀 스테인은 개별 세포를 확인하고, 계수하고, 영상 분석이 적용되는 세포 영역을 정의하는 데 사용될 수 있다.
바람직하게, 상기 영상화 기술로는 후속하여 컴퓨터 지원 정량화 및 프로세싱이 수행될 수 있는 고처리량 현미경 영상 포착을 포함한다. 대표적인 예는 본원에 개시되어 있다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 세포 독성, 더욱 바람직하게, 신장독성 또는 폐독성은 임의의 적합한 지도 학습 알고리즘을 사용하여 예측된다. 바람직하게, 예측은 랜덤 포레스트 알고리즘 (실시예, 및 도 1 및 2 참조), 서포트 벡터 머신, 또는 신경망을 사용하여 수행된다. 더욱 바람직하게, 예측은 랜덤 포레스트 알고리즘을 사용하여 수행된다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 적어도 하나의 세포 시험 집단, 및 더욱 바람직하게, 신장 근위 세뇨관 세포, BEC 및 AVC는 체세포로부터 유래된 것일 수 있다. 더욱 바람직하게, 신장 근위 세뇨관 세포, BEC 및 AVC를 포함하는 적어도 하나의 세포 시험 집단은 포유동물 체세포로부터의 유래된 것이고, 1차 세포 또는 안정적인 세포주로부터의 세포이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 신장 근위 세뇨관 세포는 인간 1차 신장 근위 세뇨관 세포, HK-2 세포, 또는 당업계에 공지된 임의의 다른 적합한 세포주이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 적어도 하나의 세포 시험 집단은 인간 1차 세포, 무한증식 세포, 배아 줄기 세포 유래 세포, 유도 만능 줄기 세포 유래 세포, 또는 당업계에 공지된 임의의 다른 적합한 세포주이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, BEC 및 AVC는 인간 1차 폐포 또는 기관지 상피 세포, 무한증식 세포, 배아 줄기 세포 유래 세포, 유도 만능 줄기 세포 유래 세포, 또는 당업계에 공지된 임의의 다른 적합한 세포주이다.
본 발명의 방법의 또 다른 바람직한 실시양태에서, 상기 접촉은 적어도 1-48시간 이상인 기간 동안에 걸쳐 수행된다. 바람직하게, 세포를 약 8-24시간이라는 기간 동안, 더욱 바람직하게, 약 16시간이라는 기간 동안 시험 화합물과 접촉시킨다.
세포와 접촉하는 시험 화합물의 실제 농도는 시험하고자 하는 특이적 화합물의 성질에 의존하게 될 것이다. 본 발명의 바람직한 실시양태에서, 상기 접촉은 시험 화합물을 약 1 ㎍/ml 내지 약 1,000 ㎍/ml인 농도로 신장 근위 세뇨관 세포의 시험 집단에; 또는 가용성 화합물인 경우, 약 31 μM 내지 약 2 mM로, 및 미립자 화합물인 경우, 약 16 ㎍/mL 내지 약 1 mg/mL로 기관지 상피 세포 및 폐포 세포의 시험 집단에 첨가하는 것을 포함한다. 바람직하게, 농도는 시험 화합물의 용량 반응 곡선으로부터 각 피쳐에 대한 최대 반응 값 Δ최대를 달성하는 데 사용된다. 비록 농도 범위에 걸쳐 화합물을 동시에 시험하는 것이 바람직할 수 있지만; 본 발명에 따른 방법에서 단일 용량의 시험 화합물이 사용될 수 있다.
또 다른 실시양태에서,
(a) 컴퓨터 프로세서에 의해 세포 시험 집단의 영상을 수신하는 단계;
(b) 컴퓨터 프로세서에 의해 영상으로부터 세포 시험 집단과 연관된 하나 이상의 공간 의존성 표현형 피쳐를 추출하는 단계로서, 하나 이상의 공간 의존성 표현형 피쳐는 세포와 연관된 생체분자의 공간 분포를 특징으로 하는 것인 단계;
(c) 각각의 하나 이상의 공간 의존성 표현형 피쳐의 DRC를 기술하는 하나 이상의 정량화된 DRC 파라미터를 수득하는 단계; 및
(d) 상기 하나 이상의 정량화된 DRC 파라미터를 예측 모델에 입력하여 시험 화합물의 생체내 세포 독성 예측을 생성하는 단계를 포함하는,
시험관내에서 시험 화합물 처리를 받은 세포 시험 집단을 사용하여 시험 화합물의 생체내 세포 독성을 예측하는 컴퓨터 실행 방법을 제공한다.
본 발명의 바람직한 실시양태에서, 세포는 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 또는 폐포 세포 (AVC)이다.
본 발명의 바람직한 실시양태에서, 하나 이상의 공간 의존성 표현형 피쳐는 세포의 DNA 구조 변경, 크로마틴 구조 변경 및 액틴 필라멘트 구조 변경을 특징으로 하는 피쳐를 포함하는 군으로부터 선택된다.
또 다른 예에서, 본 방법은 세포 시험 집단과 연관된 하나 이상의 공간 비의존성 표현형 피쳐를 추출하는 단계를 추가로 포함할 수 있고, 여기서, 하나 이상의 정량화된 DRC 파라미터는 추가로 하나 이상의 공간 비의존성 표현형 피쳐를 사용하여 수득한다.
도 2에 제시된 추가의 또 다른 예에서, 시험 화합물의 독성에 기인한 세포 사멸 수준은 정량화된 표현형 피쳐를 컴퓨팅하기 전에 사정된다. 특히, 본 방법은 단계 (c) 및 (d)를 수행하기 이전에, 시험 화합물의 최고 농도 중 하나 이상의 것에서 세포 사멸 수준이 미리 결정된 기준에 부합하는지 여부, 예컨대, 세포 사멸 수준이 미리 결정된 임계값을 초과하는지 여부를 사정하는 단계를 포함할 수 있다. 예를 들어, 본 방법은 특이적 세포 유형, 예컨대, 폐 세포와 관련된 세포 데이터에 적용될 수 있다.
본 발명의 바람직한 실시양태에서, 단계 (d)는 시험 화합물을 세포에 대하여 독성 또는 비독성인 것으로 분류하는 것을 포함한다.
본 발명의 또 다른 측면은 컴퓨터 프로세서 및 데이터 저장 장치를 가지는 컴퓨터 시스템으로서, 데이터 저장 장치는 본 발명의 임의 측면에 따른 컴퓨터 실행 방법을 실행하기 위해 프로세서에 의해 작동되는 비일시적 명령을 저장하는 것인, 컴퓨터 시스템을 제공한다.
본 발명의 또 다른 측면은 적어도 하나의 프로세서가 본 발명의 임의 측면에 따른 컴퓨터 실행 방법을 실행하게 하는 프로그램 명령이 그 위에 저장되어 있는 것인, 비일시적 컴퓨터 판독가능 매체를 제공한다.
당업자는 본 발명이 과도한 실험 없이도 본원에서 제공되는 방법에 따라 수행될 수 있다는 것을 이해할 것이다. 방법, 기술 및 화합물질은 제공된 참고문헌에 기술되어 있는 바와 같거나, 또는 표준 생명공학, 세포 생물학 및 면역조직화학 교재 중의 프로토콜로부터의 것이다.
실시예
신장독성 연구를 위한 참조 화합물
HPTC-A 데이터세트 (DNA/RelA/액틴/WCS)를 위해, 본 발명자들은 44개의 생체이물 화합물을 사용하였다. "PTC-독성" 군은 인간 근위 세뇨관 세포 (PTC)를 손상시키는 것으로 공지되어 있는 24개의 신장독성 물질을 가졌고, "비-PTC-독성" 군은 PTC를 손상시키는 것으로 공지되지 않은 12개의 신장독성 물질 및 8개의 비-신장독성 물질을 가졌다 (대부분의 화합물의 PTC 독성에 관한 상세한 정보는 본 발명자들의 보고서 (문헌 [Li et al., Mol Pharm 11: 1982-1990 (2014)]; [Kandasamy et al., Sci Rep. doi: 10.1038/srep12337 (2015)]에서 살펴볼 수 있다). HPTC-B 및 HK-2 데이터세트 (DNA/γH2AX/액틴/WCS)를 위해, 42개의 화합물을 사용하였다 (아세트산납 및 히드로코르티손 제외). 화합물을 DMSO 중에 50 mg/mL인 스톡 농도로, 또는 물 중에 10 mg/mL 스톡 농도로 용해시켰다. 참조 화합물, 및 그의 공급원, 용매, 및 공지된 인간 신장 및 간 독성에 관한 전체 목록을 하기 표 1에서 제공한다.
Figure pct00001
Figure pct00002
Figure pct00003
세포 배양 및 화합물 처리
HPTC-A 및 HPTC-B 데이터세트, 둘 모두를 위해, 본 발명자들은 3명의 상이한 기증자로부터의 1차 인간 PTC로 이루어진 3개의 상이한 배치를 사용하였다. 그 중 2개 (HPTC1 및 HPTC10; 각각 로트 #58488852 및 #61247356)는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection: ATCC: 미국 버지니아주 마나사스)으로부터 구입하였다. 세 번째 배치의 세포 (HPTC6)는 인간 인간 신장절제술 샘플로부터 단리시켰다 (싱가포르 국립 대학교 건강 시스템(National University Health System: 싱가포르)). 병리의사에 의해 측정된 바, 비정상적인 병리학적 변화가 없는 정상 조직만을 사용하였다. 1차 인간 신장 샘플 (DSRB-E/11/143) 및 세포 (NUS-IRB 참조 코드: 09-148E)를 이용하는 연구에 대한 윤리적 승인을 받았다. 1차 PTC의 3개의 배치 모두 신장 상피 세포 성장 키트 (ATCC) 및 1% 페니실린/스트렙토마이신 (기브코(Gibco: 미국 캘리포니아주 칼즈배드))으로 보충된 신장 상피 세포 기초 배지 (ATCC) 중에서 배양하였다. 본 연구에서는 1차 PTC의 계대접종 (P) 4 및 P5인 계대접종물만을 사용하였다. HK-2 데이터세트를 위해, HK-2 세포주 (ATCC)를 10% 우태아 혈청 (FBS) (기브코) 및 1% 페니실린/스트렙토마이신으로 보충된 둘베코스 변형 이글 배지 (DMEM) 중에서 유지시켰다.
세포를 바닥이 투명한 384-웰 검은색 플레이트 (그라니어(Greiner: 오스트리아 크렘스뮨스터))에 시딩하였다. 밤새도록 (16시간) 약물 처리하기 전에, 세포 모두 3일 배양하여 분화된 신장 상피를 형성시켰다 (문헌 [Li et al., Toxicol Res 2: 352-365 (2013)]). 시험되는 화합물의 투여량은 1.6, 16, 63, 125, 250, 500, 1,000 ㎍/mL였다. 양성, 음성, 및 비히클 대조군 (시험되는 화합물의 용매에 의존하여 DMSO 또는 물) 및 비처리 세포를 각 플레이트 상에 포함시켰다. 각 화합물 및 투여량에 대하여 기술상의 반복 실험을 4회에 걸쳐 수행하였다.
면역염색
16시간 동안의 화합물 처리 후, 포스페이트 완충처리된 염수 (PBS) 중 3.7% 포름알데히드를 사용하여 세포를 고정시켰다. 5% 우혈청 알부민 (BSA) 및 0.2% 트리톤 X-100을 함유하는 PBS를 이용하여 1시간 동안 세포를 차단시켰다. 샘플을 2 ㎍/mL의, γH2AX (포스포 S139)에 대한 마우스 모노클로날 항체 (앱캠(Abcam: 미국 매사추세츠주 케임브리지)), 또는 1 ㎍/mL의, RelA에 대한 토끼 폴리클로날 항체 (앱캠)와 함께 실온에서 1시간 동안 인큐베이션시켰다. 이어서, 세포를 5 ㎍/mL의, 알렉사488에 접합된 염소 항-마우스 2차 항체 (앱캠), 또는 알렉사488에 접합된 염소 항-토끼 2차 항체 (라이프 테크놀러지즈(Life Technologies: 미국 캘리포니아주 칼즈배드))와 함께 인큐베이션시켰다. 마지막으로, 세포를 4 ng/mL의 DAPI (머크 밀리포어(Merck Millipore: 독일 다름슈타트)), 로다민 팔로이딘 (라이프 테크놀러지즈), 홀 셀 스테인 레드 (라이프 테크놀러지즈)로 염색하였다.
아폽토시스 및 괴사 검정법
바닥이 투명한 96-웰 검은색 플레이트 (팔콘(Falcon: 미국 뉴욕주 코닝))에 세포를 시딩하고, 밤새도록 (16시간) 약물 처리하기 전 3일 동안 배양하였다. 이를 1,000 ㎍/mL의, 시스플라틴, 시클로스포린 A, 오크라톡신 A, 링코마이신, 염화리튬 및 리바비린으로 처리하였다. 비처리 세포 및 비히클 대조군 (DMSO 및 물) 뿐만 아니라, 양성 대조군 (25 ㎍/mL 산화비소(III)) 및 음성 대조군 (100 ㎍/mL 덱사메타손)도 각 플레이트에 포함시켰다. 각 처리 조건에 대하여 기술상의 반복 실험을 3회에 걸쳐 수행하였다.
절단된 카스파제-3 (앱캠) 및 아폽토시스성/괴사성/건강한 세포 검출용 키트 (프로모킨(PromoKine: 독일 하이델베르크))를 사용하여 아폽토시스성 세포 및 괴사성 세포를 확인하였다. 절단된 카스파제-3의 경우, 상기 개요된 것과 동일한 면역염색 프로토콜을 사용하였다. 토끼 폴리클로날 항-절단된-카스파제-3 항체를 차단 완충제 중에서 희석시키고, 실온에서 1시간 동안 고정된 세포와 함께 인큐베이션시켰다. 이어서, 세포를 5 ㎍/mL의 알렉사488에 접합된 염소 항-토끼 2차 항체와 함께 인큐베이션시켰다. 마지막으로, 세포를 4 ㎍/mL의 DAPI 및 홀 셀 스테인 레드로 대조 염색시켰다. 아폽토시스성/괴사성/건강한 세포 검출 키트의 경우, 제조사가 제공한 프로토콜을 사용하였다.
영상 획득
이미지X프레스 마이크로 XLS 시스템(ImageXpress Micro XLS system) (몰레큘러 디바이시스(Molecular Devices: 미국 캘리포니아주 서니베일))을 사용하여 20x 대물 렌즈로 영상화를 수행하였다. 4개의 상이한 채널을 사용하여 DAPI, 알렉사 488, 텍사스 레드(Texas Red), 및 Cy5 형광을 영상화하였다. 웰당 9개 부위를 영상화하였다. 영상을 16-비트 TIFF 포맷으로 저장하였다.
영상 분절화 피쳐 추출
비균일한 배경 조명을 감소시키기 위해, 본 발명자들은 이미지J(ImageJ) (NIH, v1.48)에서 실행되는 "롤링 볼(rolling ball)" 알고리즘을 사용하여 영상을 보정하였다 (문헌 [Sternberg Computer 16: 22-34 (1983)]). 셀X프레스 소프트웨어 플랫폼 (바이오인포메틱스 인스티튜트(Bioinformatics Institute), v1.2) (문헌 [Laksameethanasan et al., BMC Bioinformatics 14 Suppl 16: S4 (2013)])을 사용하여 세포 분절화 및 피쳐 측정을 수행하였다. 본 발명자들은 영상으로부터, 78개의 하랄릭 텍스처 피쳐, 29개의 강도 피쳐, 9개의 강도-비 피쳐, 6개의 상관관계 피쳐, 6개의 형태 피쳐 및 세포 계수를 포함하는, 129개의 피쳐를 추출하였다.
하랄릭 텍스처 피쳐
모든 하랄릭 텍스처 피쳐에 대한 수학적 정의는 하랄릭의 논문 원본에서 기술되었다 (문헌 [(Haralick et al., IEEE Trans Syst Man Cybern SMC-3: 610-621 (1973)]). 여기서, 본 발명자들은 오직 본 발명자들의 최정 피쳐 세트에 포함된 하랄릭 피쳐에 대한 수학적 정의만을 제공한다. 그레이 레벨 동시 발생 행렬 (GLCM)은 N x X N y 영상, I(x,y)에서 주어진 오프셋 (Δx,Δy)에서의 동시 발생 그레이 레벨 값의 분포를 기술하는 행렬로서, 여기서, N g 가 그레이 레벨이다. 본 발명자들의 표기법에서, x y는 각각 행 및 열이다. GLCM 행렬은 하기에 의해 정의된다:
Figure pct00004
여기서, i j는 영상의 그레이 레벨 또는 강도 값이다. 정규화된 GLCM 행렬은
Figure pct00005
이다.
이때, 본 발명자들은
Figure pct00006
인 한계 및 합 확률 행렬을 가진다.
하랄릭 피쳐는
a) 각 2차 모멘트:
Figure pct00007
b) 상관관계:
Figure pct00008
(여기서, μ x , μ y , σ x , 및 σ y 는 각각 p x (j,Δx,Δy) 및 p y (j,Δx,Δy)의 평균 및 표준 편차이다)
c) 합 평균:
Figure pct00009
d) 합 분산:
Figure pct00010
e) 합 엔트로피:
Figure pct00011
f) 엔트로피:
Figure pct00012
g) 상관관계 2의 정보 척도:
Figure pct00013
(여기서,
Figure pct00014
이다)이다.
본 발명자들의 연구에서, 영상은 분절된 세포 주변의 경계 박스였고, 여기서, 배경 픽셀은 모두 0으로 설정되었다. 본 발명자들은 영상을 N g = 256개의 그레이 레벨로 양자화하고, 0도 (Δx = 0,Δy = 1), 45도 (Δx = 1,Δy = 1), 90도 (Δx = 1,Δy = 0) 및 135도 (Δx = 1,Δy = -1) 오프셋에 대하여 모든 하랄릭 피쳐를 컴퓨팅하였다. 각 피쳐에 대하여, 모든 오프셋 값 간의 피쳐의 평균 및 표준 편차를 사용하였다. 본 발명자들은 셀X프레스 소프트웨어 플랫폼 (바이오인포메틱스 인스티튜트, v1.2) (문헌 [Laksameethanasan et al,. BMC Bioinformatics 14 Suppl 16: S4 (2013)])에서 C++를 사용하여 모든 피쳐에 대한 추출 절차를 실행하였다.
농도 반응 곡선 및 Δ 최대 추정
피쳐 추출 후, 본 발명자들은 모든 시험 화합물 농도에서의 피쳐의 값을 상응하는 비히클 대조군 조건하의 피쳐의 값으로 나누었다. 이어서, 비를 로그2 변환시켰다 (Δ). R 통계 환경 (더 R 파운데이션(the R foundation), v3.0.2) 및 윈도우즈 7 운영 체제(Windows 7 operating system) (마이크로소프트(Microsoft: 미국)) 하에 사용자 정의된 스크립트를 사용하여 농도 반응 곡선 및 독성 분류기를 구축하는 것을 포함하는, 모든 추가 데이터 분석을 수행하였다.
각 피쳐에 대하여, 본 발명자들은 하기 표준 로그-로지스틱 모델을 사용하여 각 피쳐의 농도 반응 곡선 (DRC)을 추정하였다:
Figure pct00015
(여기서, x는 생체이물질 화합물 농도이고, e는 하한 c와 상한 d 사이의 반응 중간 지점이고, b는 대략 e에서의 상대 기울기이다). 본 발명자들은 b, c, d, 및 e의 값을 피팅하기 위해 R 환경 하에서 "drc" 라이브러리 (v 2.3-96)를 사용하였다. 이후, 추정된 반응 곡선을 사용하여 최대 반응 값 (Δ최대)을 측정하였다. 이론상, Δ최대는 상한 d와 같아야 한다. 그러나, 실제로는 일부 화합물의 반응이 심지어는 시험된 최고 투여량에서도 조차 안정기에 도달하지 못할 수 있으며, 그러므로, 추정된 d 값은 정확하지 않을 수도 있다. 대신, 본 발명자들은 Δ최대를 본 발명자들의 화합물 대부분에 대하여 시험된 최고 농도 정도인 5 mM에서의 반응 값인 것으로 고정시켰다. 마지막으로, 3회에 걸친 생물학적 반복 실험 간의 Δ최대의 중간값을 컴퓨팅하였다. 최종 결과는 Δ최대 값의 129 x 44 (또는 42) 행렬이었고, 이는 분류기를 훈련시키고, 시험하는 데 사용되었다. 행렬의 각 열은 피쳐 벡터, f i (여기서, i = 1, 2, …129이다)였다.
피쳐 정규화
데이터 정규화 이전에, 각 피쳐 벡터 f i를 같은 범위 [-1,1]로 정규화하였다:
Figure pct00016
(여기서, f 최소f 최대는 피쳐의 최소값 및 최대값이다). 훈련 및 데이터세트가 서로 독립적이었는지 확인하기 위해, 상기 두 정규화 계수는 오직 훈련 데이터만을 사용하여 추정하였고, 훈련 및 시험 데이터세트, 둘 모두에는 적용시키지 않았다.
랜덤 포레스트 분류
본 발명자들은 생체이물 유도성 신장독성을 예측하는 데 랜덤 포레스트 알고리즘 (문헌 [Breiman Mach Learn 45: 5-32 (2001))을 사용하였는데, 그 이유는 상기 알고리즘이 서포트 벡터 머신, k-최근접 이웃 및 나이브 베이즈 (naive Bayes)를 비롯한, 보편적으로 사용되는 다른 분류기를 능가한다고 본 발명자들에 의해 앞서 밝혀졌기 때문이다 (문헌 [Su et al., BMC Bioinformatics 15: S16 (2014)]). 랜덤 포레스트는 2가지 주요 파라미터를 가진다: N 트리 N 시도 . 첫 번째 파라미터는 구축된 의사 결정 트리의 개수를 나타내고, 두 번째 파라미터는 의사 결정 트리의 각 수준에서 사용된 랜덤 피쳐의 개수를 나타낸다. 교차 검증 동안, 본 발명자들은 N 트리 = {10,50,150,250,400,500} 및 N 시도 = {1,2,3,4,5}에 대한 그리드 검색을 사용하여 자동적으로 최적의 분류기 파라미터를 결정짓는다. 데이터세트,
Figure pct00017
에 기초하여 파라미터의 모든 가능한 조합을 사용하여 임시 랜덤 포레스트 시리즈를 훈련시켰고, 독립 시험 데이터세트
Figure pct00018
에 기초하여 이들 조합의 검정의 정확도를 추정하였다. N 트리 N 시도 와 시험 정확도 최고값과의 조합을 선택하여 최종 분류기를 훈련시키고, 이어서, 제3 독립 시험 데이터세트,
Figure pct00019
을 사용하여 그의 성능을 추정할 것이다. 본 발명자들은 R 환경하에서 "랜덤포레스트(randomForest)" 라이브러리 (v4.6-10)를 사용하였다.
자동화된 피쳐 선별
본 발명자들은 추출된 피쳐 모두 F 모두 = {f1,f2,…f m모두 }로부터 피쳐의 서브세트를 선별하기 위해 그리드 검색 알고리즘, 즉, 반복 피쳐 삭제 (RFE)를 사용하였다 (문헌 [Loo et al., Nat Methods 4: 445-453 (2007)]).
주된 아이디어는 모든 피쳐에서부터 시작되며; 반복하여 현 피쳐 세트를 순위화하고, 중요도가 가장 낮은 피쳐 서브세트를 삭제하고, 유지된 피쳐 서브세트 F j 의 정확도 acc j 를 평가하고; 최종적으로 정확도가 가장 높은 피쳐 서브세트를 선택한다. 데이터 과적합을 감소시키기 위해, 2개의 독립 데이터세트,
Figure pct00020
에서 각각 피쳐 서브세트의 순위화 및 평가를 수행하였다. 본 발명자들은 아웃-오브-백(out-of-bag) 데이터 및 피쳐를 순열화함으로써, 랜덤 포레스트 알고리즘에 의해 추정된 피쳐의 중요도 값에 기초하여 피쳐를 순위화하였다 (문헌 [Breiman Mach Learn 45: 5-32 (2001)]).
샘플 크기가 작은 데이터세트에서, (F j 의 함수로서) acc j 곡선은 매끈한 곡선이 아닐 수 있다. 따라서, acc j 의 전역 최대값은 최종의 피쳐 서브세트를 선택하는 데 강건한 기준이 될 수 없다. 대신, 본 발명자들은 가우시안 혼합 모델 (GMM)을 사용하여 피쳐 서브세트를 선택하는 자동화된 절차를 디자인하였다 (문헌 [Trevor Hastie et al., Data Mining, Inference, and Prediction, 2nd edn. Springer (2009)]). 본 발명자들은 모든 acc j 값을 2-4개 군으로 클러스터링하였다. 이들을 각각 가우시안 분포로 모델링하였다. 이어서, 본 발명자들은 군 중에서 평균 예측 정확도가 가장 높은 최소 피쳐 서브세트를 선택하였다. 최적의 군 개수 또한 베이시안 정보 기준 (BIC),
Figure pct00021
에 기초하여 자동적으로 결정하였다 (여기서, N s 는 샘플 크기이고, L m 은 GMM 알고리즘에 의해 컴퓨팅된 최대 로그-가능도이고, N d 는 파라미터 개수이다).
분류 성능 추정
본 발명자들은 본 발명자들의 표현형 피쳐의 PTC-독성 예측 성능을 추정하기 위해 계층화된 10-겹 교차 검증 절차를 사용하였다 (문헌 [Trevor Hastie et al., Data Mining, Inference, and Prediction, 2nd edn. Springer (2009)]).
본 절차는 2개의 주요 교차 검증 루프를 가진다. 첫 번째 교차 검증 루프는 최적 피쳐 서브세트 F 최종 을 확인하고자 하는 것인 반면, 두 번째 교차 검증 루프는 F 최종 의 일반화된 예측 성능을 추정하고자 하는 것이다. 훈련 및 시험 데이터를 서로 독립 상태로 유지시키기 위해, 본 발명자들은 처리 조건을 모두 4개의 비중복 세트, X 훈련 (F 모두 ), X FS시험 (F 모두 ), X RF시험 (F 모두 ), 및 X 시험 (F 모두 )로 나누었다. 추가로, 정규화 계수 및 분류기 파라미터는 항상 오직 훈련 데이터세트에만 기초하여 추정되었지만, 이는 훈련 및 시험 데이터세트, 둘 모두에 적용되었다.
본 발명자들은 하기 성능 척도를 사용하였다:
Figure pct00022
(여기서, TP는 진 양성 개수이고, TN은 진 음성 개수이고, FP는 위 양성 개수이고, FN은 위 음성 개수이다). HPTC-A, HPTC-B 및 HK-2 데이터세트에 대하여 동일한 성능 추정 절차를 사용하였다.
다차원 스케일링 플롯
화학 구조 공간 내의 화합물을 비교하기 위해, 본 발명자들은 모든 참조 화합물의 구조 사이의 쌍별 타니모토 계수를 컴퓨팅하기 위해 켐미에R(ChemmieR) 라이브러리를 사용하였다. 표현형 피쳐 공간 내의 화합물을 비교하기 위해, 본 발명자들은 먼저 모든 표현형 피쳐를 같은 범위 [0, 1]로 스케일링한 후, 모든 참조 화합물의 피쳐 값 사이의 쌍별 유클리드 거리를 컴퓨팅하였다. 마지막으로, 본 발명자들은 다차원 스케일링 플롯을 작성하기 위해 R 환경에서 cmdscale 함수를 사용하였다 (문헌 [Torgerson, Psychometrika 17: 401-419 (1952)]).
참조 화합물 목록
본 발명자들의 연산 모델을 더욱 포괄적인 목록으로 만들기 위해, 본 발명자들은 참조 신장 생체이물 화합물의 개수를 44개로 증가시켰고 (표 1), 그 중 38개의 화합물은 앞서 본 발명자들의 IL-6/8-기반 모델에서 사용되었다 (문헌 [Li et al., Toxicol Res 2: 352-365 (2013)]; [Li et al., Mol Pharm 11: 1982-1990 (2014)]; [Su et al., BMC Bioinformatics 15: S16 (2014)]; [Kandasamy et al., Sci Rep. doi: 10.1038/srep12337 (2015)]). 이들 참조 화합물은 보편적으로 사용되는 산업용 화학물질, 항생제, 항바이러스제, 화학요법 약물, 진균독, 농업용 화학물질 및 다른 화합물을 포함하였다 (도 1a). 상기 참조 화합물은 공개된 임상 및/또는 동물 연구로부터의 그의 공지된 생체내 독성에 기초하여 2개 군으로 분류되었다 (화합물 대부분에 대한 상세한 정보는 본 발명자들의 이전 보고서 ([Li et al., Mol Pharm 11: 1982-1990 (2014)]; [Kandasamy et al., Sci Rep. doi: 10.1038/srep12337 (2015)])에서 살펴볼 수 있다). "PTC-독성" 군은 PTC를 손상시키는 것으로 공지된 24개의 신장독성 물질을 가졌고, "비-PTC-독성" 군은 인간에서 PTC를 손상시키는 것으로 공지되지 않은 12개의 신장독성 물질 및 인간 신장을 손상시키는 것으로 공지되지 않은 8개의 화합물을 가졌다. 추가로, 각각 PTC-독성 군 및 비-PTC-독성 군 중의 10개의 화합물 및 8개의 화합물이 간독성인 것으로 공지되었다 (표 1). 상기와 같은 참조 화합물 목록 디자인을 통해 본 발명자들은 일반 또는 비-PTC-특이적 독성에 대한 표현형 피쳐에 대해 편향되지 않을 것이라는 것을 확인시켜 주었다. 화합물에 관한 본 발명자들의 2진 분류가 예측 문제를 간소화시켰고, 이를 통해 본 발명자들은 잘 확립된 예측 성능 기준을 사용하여 상이한 표현형 피쳐 및 세포 유형을 평가할 수 있었다. 본 발명자들의 참조 화합물은 다양한 화학 구조를 가졌고, 본 발명자들은 PTC-독성 화합물과 비-PTC-독성 화합물 사이의 명백한 구조적 차이를 발견하지 못했다 (도 1b). 예를 들어, 산업용 화학물질은 모두 그의 공지된 PTC 독성과 상관없이 화학 공간에서 함께 클러스터링되었다 (도 1b에서 파선). 그들 대부분은, 매우 간단하고, 따라서, 구별하기 어려운 분자 구조를 가진 금속성 화합물, 예컨대, 시스플라틴 (PTC-독성) 및 염화리튬 (비-PTC-독성)이었다. 본 발명자들은 3명의 상이한 기증자로부터의 1차 인간 PTC를 16시간 동안 7개의 상이한 용량 (1.6 - 1,000 ㎍/mL)의 상기 화합물로 처리하였다.
폐독성 연구를 위한 참조 화합물
폐독성 연구를 위해, 본 발명자들은 49개의 생체이물 화합물을 사용하였으며, 그 중 39개는 가용성이었고, 10개는 미립자 화합물이었다 (표 2). 공개된 생체내 및/또는 임상 데이터에 기초하여 19개의 폐독성 화합물 및 30개의 비-폐독성 화합물을 선별하였다. 상기 참조 화합물은 보편적으로 발견되거나, 또는 사용되는 제약, 산업용 화학물질, 식품, 개인 관리 용품 및 기타, 예컨대, 담배 연기 등을 포함하였다 (도 11).
Figure pct00023
세포 배양 및 화합물 처리
본 발명자들은 아메리칸 타입 컬쳐 콜렉션 (ATCC)으로부터 입수한 2개의 상업적으로 이용가능한 무한증식 세포주 A549 (CCL-185™) 및 BEAS-2B (CRL-9609™)를 사용하였다. A549를 10% 우태아 혈청 (하이클론(HyClone)™) 및 1% 페니실린/스트렙토마이신 (기브코)으로 보충된 로즈웰 파크 메모리얼 인스티튜트(Roswell Park Memorial Institute: RPMI) 1640 배지 (기브코) 중에서 배양하였다. BEAS-2B는 기관지 상피 세포 성장 배지 (BEGM) (론자(Lonza)/클로네틱스(Clonetics)™) 및 1% 페니실린/스트렙토마이신 (기브코) 중에서 유지시켰고; GA-1000 (젠타마이신-암포테리신 B 믹스)을 제외한, BEGM 불렛트 키트(BEGM Bullet Kit)에 제공된 모든 보충제를 사용하였다. 본 연구에서는 A549 및 BEAS-2B의 P15 이전의 계대접종물만을 사용하였다.
세포를 투명 커버글래스 바닥이 장착된 384-웰 검은색 플레이트 (눈크(Nunc))에 시딩하였다. 밤새도록 (16시간) 각 화합물로 처리하기 전에, 세포 모두 48시간 동안 배양하였다. 시험되는 화합물의 농도는 가용성 화합물인 경우, 31.3, 62.5, 125, 250, 500, 1,000, 2,000 μM이었고, 미립자 화합물인 경우, 16.13, 31.3, 62.5, 125, 250, 500, 1,000 ㎍/mL였다. 양성, 음성, 및 비히클 대조군 (시험되는 화합물의 용매에 의존하여 DMSO, 에탄올 또는 물) 및 4회에 걸친 기술상의 반복 실험을 각 화합물 및 투여량에 대하여 수행하였다.
면역염색
16시간 동안의 화합물 처리 후, 포스페이트 완충처리된 염수 (PBS) 중 4% 파라포름알데히드를 사용하여 세포를 고정시켰다. 세포를 0.1% 트리톤-X를 포함하는 트리스-완충처리된 염수 (TBST)로 투과가능하게 만들고, 5% 우혈청 알부민 (BSA)을 함유하는 TBST를 이용하여 1시간 동안 차단시켰다. 샘플을 1:500으로 γH2AX (포스포 S139)에 대한 토끼 모노클로날 항체 (셀 시그널링 테크놀러지(Cell Signaling Technology))와 함께 4℃에서 밤새도록 인큐베이션시켰다. 이어서, 세포를 각각 1:500 및 1:2,000으로 알렉사488(인비트로겐(Invitrogen)) 및 HCS 셀마스크™ 딥 레드에 접합된 염소 항-토끼 2차 항체와 함께 약 1시간 동안 인큐베이션시켰다. 마지막으로, 세포를 1:800로 훽스트 33342 (인비트로겐)를 이용하여, 및 딜라이트™ 554 팔로이딘 (셀 시그널링 테크놀러지)을 이용하여 염색하였다.
영상 획득
레이저 초점이 뚜렷이 한정된 자이스 악시오 옵저버 Z1 시스템(Zeiss Axio Observer Z1 system) (자이스(Zeiss))을 사용하여 20x 대물 렌즈로 영상화를 수행하였다. 4개의 상이한 채널을 사용하여 청색 (DAPI), 녹색 (488), 적색 (DsRed), 및 근적외선 (Cy5) 형광을 영상화하였다. 웰당 4개 부위를 영상화하였다. 영상을 16-비트 TIFF 포맷으로 저장하였다.
자동화된 세포 표현형 프로파일링
본 발명자들의 표현형 프로파일링 전략법 (도 2)은 시험관내 조건하에서 1차 인간 PTC의 다수의 정량적 표현형 피쳐를 자동적으로 측정한 후, 이어서, 생체내 PTC 독성에 대하여 예측성이 가장 높은 표현형 피쳐의 서브세트에 대해 체계적으로 스크리닝하였다. 본 발명자들의 피쳐는 4개의 형광성 마커에 기초하였다 (도 3a). 본 발명자들은 DNA 및 액틴 세포골격을 표지하기 위해 각각 4',6-디아미디노-2-페닐인돌 (DAPI) 및 로다민 팔로이딘을 사용하였다. 핵 및 크로마틴 구조 변경은 다수의 기본적인 세포 프로세스, 예컨대, 전사, 유사 분열 및 세포 사멸에 관여한다. 액틴 필라멘트는 PTC의 세포 기능을 유지하는 데 중요한 역할을 한다 (문헌 [Kellerman et al., Am J Physiol 259:F279-285 (1990)]). 본 발명자들은 또한 핵 인자 (NF)-κB 복합체의 서브유니트에 대해 특이적인 항체로 세포를 표지하였다. 이는 NF-κB 복합체에 의해 조절되는 (문헌 [Matsusaka et al., Proc Natl Acad Sci 90: 10193-10197 (1993)]) IL-6/8에 기반한 본 발명자들의 이전 모델에 의해 동기화되었다 (문헌 [Li et al., Toxicol Res 2: 352-365 (2013)]; [Li et al., Mol Pharm 11: 1982-1990 (2014)]; [Su et al., BMC Bioinformatics 15: S16 (2014)]; [Kandasamy et al., Sci Rep. doi: 10.1038/srep12337 (2015)]). 최종 마커는 자동화된 세포 분절 및 세포 형태 피쳐 측정을 촉진시키는 데 사용되는 홀 셀 스테인 (WCS)이었다.
화합물 처리 후, 본 발명자들은 PTC를 상기 4개의 형광성 마커로 염색하고, 이를 고처리량 영상화 시스템을 사용하여 영상화하였다. 본 발명자들은 각 화합물 및 처리 투여량에 대하여 포착된 36개의 현미경 영상으로부터 ~500-1,000개의 세포를 자동적으로 확인하였다 (도 4). 이어서, 각 세포에 대하여 본 발명자들은, (마커의 공간 동시 발생 패턴의 통계치를 측정하는) 78개의 하랄릭 텍스처 피쳐 (문헌 [(Haralick et al., IEEE Trans Syst Man Cybern SMC-3: 610-621 (1973]), (상이한 세포 내 영역에서의 마커의 염색 수준을 측정하는) 29개의 강도 피쳐, (강도 피쳐 사이의 비를 측정하는) 9개의 강도-비 피쳐, (단일 세포 수준에서의 두 마커 사이의 공간 상관관계를 측정하는) 6개의 상관관계 피쳐, 및 (핵 및 세포 영역의 형상 특성을 측정하는) 6개의 형태 피쳐를 포함하는, 129개의 정량적 표현형 피쳐를 추출하였다 (도 3b). 본 발명자들 또한 피쳐로서 세포 계수도 포함하였다. 유사한 표현형 피쳐 및 프로파일링 방법은 이전에 그의 표적/기전에 따라 다수의 소형 분자를 분류하는 데 사용되었다 (문헌 [Loo et al., Nat Methods 4: 445-453 (2007)]). 그러므로, 본 발명자들은 상기 피쳐의 서브세트 또한 PTC 독성을 예측할 수 있을 정도로 충분히 차별적일 수 있다는 가설을 제기하였다.
각 표현형 피쳐에 대해, 본 발명자들은 먼저 비히클 대조군 대비로 모든 시험된 투여량에서의 그의 값의 로그2-비 (Δ)를 컴퓨팅하였다. 이어서, 본 발명자들은 표준 로그-로지스틱 모델을 사용하여 피쳐의 용량 반응 곡선 (DRC)을 추정하고, 상기 곡선으로부터 그의 최대 반응 값 (Δ최대)을 추정하였다 (도 3c). 마지막으로, 3회에 걸친 생물학적 반복 실험 간의 Δ최대의 중간값을 컴퓨팅하였다. 최종 데이터세트 (HPTC-A)는 129개의 표현형 피쳐 (F 모두 = {f 1,f 2,…,f 129}, 행) 및 44개의 생체이물 화합물 (열)에 대한 Δ최대 값의 행렬이었다 (도 3d). 간결하게 하기 위해, 본 발명자들이 본 논문에서 언급한 모든 피쳐는 달리 명시되지 않는 한, 피쳐의 원시 측정값이 아니라, 각 피쳐의 Δ최대 파라미터를 지칭한다. 표현형 피쳐 값에 기초한 화합물의 계층 클러스터링을 통해 2개의 주요 클러스터가 밝혀졌다 (도 3d). 그 중 하나는 PTC-독성 화합물이 유의적으로 풍부하였다 (클러스터의 83%가 PTC-독성 화합물이었다; P=1.59x10-3, 초기하 검정), 나머지 다른 것은 비-PTC-독성 화합물이 유의적으로 풍부하였다 (클러스터의 65%가 비-PTC-독성 화합물이었다; P=1.59x10-3, 초기하 검정). 표현형 피쳐는 대부분 두 번째 클러스터보다 첫 번째 클러스터 하에서 더 큰 변화를 보였는데, 이는 비-PTC-독성 화합물은 1차 인간 PTC에서 오직 작은 변화만을 유도하였거나, 또는 변화를 유도하지 않았다는 것을 제안하는 것이다. 본 발명자들 또한 표현형 피쳐에 대하여 유사한 클러스터링 분석을 수행하였고, PTC-독성 화합물 처리 후, 피쳐 값 증가 또는 감소에 상응하는 2개의 주요 클러스터를 발견하였다 (도 3d). 모든 마커로부터의 피쳐는 두 클러스터 모두에서 제시되었다. 그러므로, 본 발명자들의 표현형 피쳐 대부분은 다양하고, 마커의 증가 및 감소 특성, 둘 모두를 포착한다.
핵 및 세포골격 피쳐는 고도의 예측성을 띤다.
각각의 개별 피쳐를 검정하기 위해, 본 발명자들은 랜덤 포레스트 알고리즘 (문헌 [Breiman Mach Learn 45: 5-32 (2001)]; [Su et al., BMC Bioinformatics 15: S16 (2014)]), 및 10-겹 교차 검증 절차를 이용하는 추정된 예측 정확도를 사용하여 피쳐에 기반하여 2진 분류기를 구축하였다 (도 5a 및 방법). 2진 분류기의 균형 정확도 (민감도 및 특이도의 평균) 범위는 50% (명백한 랜덤 분류기의 성능)에서부터 100% (최대)까지이다. 훈련 정확도는 분류기를 구축하는 데 사용된 훈련 데이터 분류에서의 정확도이고, 시험 정확도는 훈련 프로세스 동안 사용되지 않은 독립 시험 데이터 분류에서의 정확도이다. 본 발명자들의 평가 절차를 통해 훈련 및 시험 데이터는 통계학상 독립적인 것을 확인할 수 있었다. 표현형 프로파일링에 대한 본 발명자들의 비편향적 접근법에서, 본 발명자들 다수의 일반 표현형 피쳐로 시작하였지만, 단지 소수의 피쳐는 차별적일 것이라고 예측하였다. 그러므로, 상이한 피쳐 군을 비교하였을 때, 본 발명자들은 피쳐 군의 평균 정확도가 아닌, (군 내 최고의 단일 피쳐에 기초한) 피쳐 군의 최대 정확도만을 고려하였다. HPTC-A 데이터세트의 경우, 본 발명자들은 단일 피쳐 모두 훈련 정확도가 ~97% 이상이라는 것을 발견하게 되었는데, 이는 대부분의 훈련 샘플이 그의 공지된 생체내 PTC 독성에 따라 분리될 수 있다는 것을 시사하는 것이다. 최고 최대 시험 정확도를 가진 피쳐 마커 군은 DNA (75.8%), 다음으로, 액틴 (73.7%) 및 RelA (72.6%)였다 (도 5b). 놀랍게도, RelA 피쳐는 PTC 독성 예측성이 높지 않았다. 예를 들어, NF-κB 핵 전좌 및 그의 하류 이펙터의 전사 활성화의 지표인 RelA 핵 대 전체 세포 강도 비 (문헌 [Deptala et al., Cytometry 33: 376-382 (1998)])의 훈련 정확도는 98.8%이고, 시험 정확도는 단지 61.0%에 불과하였다. 최고 최대 시험 정확도를 가진 피쳐 유형 군은 하랄릭 텍스처 (문헌 [(Haralick et al., IEEE Trans Syst Man Cybern SMC-3: 610-621 (1973)) (75.8%), 다음으로, 강도 (73.7%) 및 강도 비 (69.9%)였다 (도 5c). 실제로, 10개의 최고 성능의 단일 피쳐 중 6개가 모두 형광성 마커의 그레이 레벨 동시 발생 행렬 (GLCM)에 기초한 하랄릭 텍스처 피쳐였다 (문헌 [(Haralick et al., IEEE Trans Syst Man Cybern SMC-3: 610-621 (1973)). 마커의 GLCM은 세포 영상에서 마커의 상이한 강도 수준 사이의 공간 전이의 분포를 합산한다 (문헌 [(Haralick et al., IEEE Trans Syst Man Cybern SMC-3: 610-621 (1973)). GLCM의 다양한 통계적 특성을 기술하는 하랄릭 피쳐는 영상에서 발견되는 텍스처 패턴을 나타내는 데 사용될 수 있다 (방법). 129개의 모든 피쳐 중 최고의 단일 피쳐 f 최고 는 DNA GLCM의 "평균 엔트로피" (훈련 정확도 99.3% 및 시험 정확도 75.8%). 피쳐는 DNA GLCM의 균일성의 척도이다. 모든 강도 수준 사이의 전이가 더욱 똑같은 개연성을 보인, 더욱 "랜덤한" DNA 염색 패턴을 가진 세포 영상은 더욱 균일한 GLCM을 가지고, 따라서, GLCM 엔트로피의 값은 더 높다 (도 6). 전반적으로, DNA 및 액틴 세포골격 국재화 패턴의 텍스처 변화는 다양한 화학 구조를 가지는 생체이물질의 생체내 PTC 독성에 관하여 고도의 예측성을 보였다. 높은 정확도는 시험관내 독성 종점에서 영상 기반 표현형 피쳐 사용의 중요성 및 이점을 강조한다.
다중 피쳐가 단일 피쳐보다 더 높은 예측성을 띤다.
생체이물 화합물은 상이한 유형의 PTC 손상 및 반응을 유도할 수 있다. 그러므로, 다중의 상이한 표현형 조건에 기반한 분류기는 더 높은 전체 예측 정확도를 제공할 가능성이 더 크다. 피쳐들 사이의 의존성을 보존하기 위해, 본 발명자들은 다중 피쳐에 기반하여 동시에 다차원 분류기를 훈련시켰다 (도 5d). 이어서, 반복 피쳐 삭제 알고리즘 (문헌 [Loo et al., Nat Methods 4: 445-453 (2007)])을 사용하여 상관없는 및/또는 중복된 피쳐를 자동적으로 삭제하였다 (도 5e 및 방법). 유지된 피쳐 개수는 오직 훈련 데이터에만 기초하여 자동적으로 측정되었다. 그러므로, 상이한 훈련 데이터를 가진 모든 겹의 교차 검증에 대하여 프로세스를 반복하였다. 피쳐를, 랜덤 포레스트 알고리즘에 의해 추정되고, 모든 겹의 교차 검증 간의 평균값으로 제시된 것인 그의 중요도 값에 따라 순위화하였다 (문헌 [Breiman Mach Learn 45: 5-32 (2001)]). HPTC-A 데이터세트에 대해, 본 발명자들 최고 평균 중요도 값을 가진 4개의 피쳐 세트 (F s )를 발견하였다 (도 7). 이들 피쳐는 핵 영역에서의 DNA 강도의 "변동 계수 (CV)," DNA GLCM의 "평균 각 2차 모멘트 (ASM)," 액틴 GLCM의 "엔트로피의 평균 합" 및 액틴 GLCM의 "평균 엔트로피"였다 (도 5f 및 표 3).
Figure pct00024
Figure pct00025
단일 피쳐 분류 결과와 유사하게, 상기 상위 피쳐는 모두 DNA 및 세포골격 마커에 기초하였고, 그 중 3개는 텍스처 피쳐였다. 본 발명자들은 상기 4개의 피쳐를 사용하여 다중 피쳐 분류기를 훈련시켰고, 99.5%의 훈련 정확도 및 78.3%의 시험 정확도를 얻었으며, 이는 모든 단일 피쳐 분류기의 성능보다 더 높은 값이었다 (도 5f). 상기 4개의 피쳐의 개별 시험 정확도 범위는 단지 65.5 - 74.4%에 불과하였다. 그러므로, 피쳐를 함께 조합시키는 것이 예측 성능을 증가시켰다. 본 발명자들은 또한 f 최고 f s 로 포함시키는 것이 본 발명자들의 모델의 예측 정확도를 추가로 증가시키지 않는다는 것을 발견하였으며 (도 5f), 이는 본 발명자들의 반복 피쳐 삭제 알고리즘이 고도로 효과적이었다는 것을 시사하는 것이다.
f s 의 피쳐 공간에서, 본 발명자들 비-독성 화합물 대부분이 조밀한 클러스터를 형성하였고, 여기서, 상기 비-독성 화합물은 독성 화합물보다는 비-독성 화합물과 서로 더욱 가깝게 위치해 있다는 것을 발견하였다 (도 5g). 화학 구조가 단순한 8개의 독성 산업용 화학물질 중 6개는 이제 비-독성 화합물로부터 명확하게 분리될 수 있다 (도 5g). 상기 분리는 원래의 화학 구조 공간에서는 분명하지 않았다 (도 1b). 모든 시험되는 화합물 중에서, 22개의 화합물이 단일 피쳐 분류기 및 다중 피쳐 분류기, 둘 모두에서 일관되게 100%의 평균 시험 정확도를 보였다 (표 4).
Figure pct00026
오직 3개의 화합물만, 즉, 시프로플록사신 (항생제), 레보도파 (향정신성 약물), 및 염화구리(II) (산업용 화학물질)가 두 유형의 분류기 모두에서 일관되게 <50% 시험 정확도를 보였다. 이러한 결과는 본 발명자들의 연산 모델이 일반적이었고, 특정 부류의 화합물에 대해 편향되어 있지 않았다는 것을 보여주는 것이다.
가장 중요한 피쳐는 DNA 손상 반응의 유도를 나타낸다
본 발명자들의 표현형 피쳐에 의해 제시된 세포 손상 및 손상 반응 유형을 추가로 조사하기 위해, 본 발명자들은 F s 에서의 2가지 DNA 피쳐, 즉, 1) 4개의 선택된 피쳐 중 단일 피쳐 시험 정확도가 가장 높은 DNA GLCM의 평균 ASM, 및 2) 핵 영역에서의 DNA 강도의 CV (도 5f)에 초점을 맞추었다. ASM은 DNA GLCM의 이질성의 척도이다 (방법 및 도 8a). 피쳐는 특정 강도 수준 사이의 전이가 지배적일 때 (예를 들어, 강도 값이 특정의 규칙적인 형상을 형성할 때), 높은 값을 나타내거나, 또는 모든 전이가 똑같은 개연성을 보일 때 (예를 들어, 강도 값이 확산되어 있고, 무작위적으로 분포되어 있을 때) 낮은 값을 나타낸다. 표준 편차를 평균으로 나눈 값과 같은 CV는 값 세트의 분산에 관한 표준화된 척도이며, 본 발명자들의 경우에서는 핵 영역 내의 DNA 염색 강도 수준이었다. 세포의 형광 현미경 영상을 조사함으로써, 본 발명자들은 상기 두 피쳐의 값이 높은 세포는 분리되어 있고, 매우 불규칙적이며, 점 모양의 DNA 염색 수준을 보였다는 것을 발견하였으며 (도 8a), 이는 크로마틴 구조의 큰 변화 및 상이한 크로마틴 도메인의 형성을 시사하는 것이다. 그러나, 상기 세포의 전반적인 핵 및 세포 형태는 전형적인 아폽토시스성 세포에서와 같이, 여전히 대체로 무손상인 상태 그대로 유지되었고, 단편화되지 않았다. 그러므로, 본 발명자들은 피쳐는, 메가베이스 크기 범위의 상이한 크로마틴 도메인의 형성 및 대규모 크로마틴 재조직화와 연관이 있는 것으로 공지된 DNA 손상 반응을 나타낼 수 있다는 가설을 제기하였다 (문헌 [Rogakou et al., J Biol Chem 273: 5858-5868 (1998)]; [Jakob et al., Nucleic Acids Res 39: 6489-6499 (2011)]).
본 발명자들의 가설을 시험하기 위해, 본 발명자들 42개의 참조 화합물에 대한 처리 실험을 반복하되, 단, RelA 마커는 DNA 손상 반응 마커인 세린 139 상에서 인산화된 히스톤 H2AX (γH2AX)에 대해 특이적인 항체로 대체하여 수행하였다 (문헌 [Rogakou et al., J Biol Chem 273: 5858-5868 (1998)]) (도 8b). 내인성 또는 외인성 DNA 손상 조건하에서, γH2AX는 유도되고, 수복 인자를 이중 가닥 파단 부위로 동원한다 (문헌 [Paull et al., Curr Biol 10: 886-895 (2000)]). 본 발명자들은 1차 인간 PTC ("HPTC-B" 데이터세트) 및 무한증식 인간 PT 세포주, 인간 신장 2 ("HK-2" 데이터세트, 도 9), 둘 모두에서 실험을 반복하였다. 단일 세포 수준에서, 본 발명자들은 생체이물 화합물에 의해 유도된 원시 DNA CV 수준이 더 높은 세포는 더 높은 원시 평균 γH2AX 핵 수준을 보이는 경향이 있었지만, 반응은 고도로 이질성일 수 있다는 것을 발견하였다 (도 8b). 예를 들어, 500 ㎍/mL 시클로스포린 A는 원시 평균 γH2AX 핵 수준을 ~40배 증가시켰을 뿐만 아니라, 세포도 ~13% 증가시켰다 (도 8c). 그럼에도 불구하고, 규모가 크게 증가한 것에 기인하여, 효과는 여전히 집단 평균 수준으로 검출될 수 있다. 유사한 γH2AX 핵 수준 증가 또한 다른 PTC-독성 화합물로 처리된 세포에서도 관찰되었다 (도 9). 시험된 모든 화합물 간의, DNA CV 및 평균 핵 γH2AX 수준의 최대 증가 (즉, Δ최대)는 1차 및 HK-2 세포, 둘 모두에서 서로 강력한 양의 상관관계를 보였다 (각각, r = 0.639 및 0.667; 도 8d 및 e). 추가로, 두 피쳐 모두 비-PTC-독성 화합물로 처리된 세포에서보다 PTC-독성 화합물로 처리된 세포에서 유의적으로 더 높았다 (모두 P<0.01, 단측 t-검정; 도 8d 및 e). 이러한 결과는 비록 PTC-독성 화합물 다수가 DNA에 직접 결합한다고 공지되어 있지는 않지만, PTC-독성 화합물 대부분이 DNA 손상 반응을 유도한다는 것을 제안한다.
γH2AX 기반의 개선된 연산 모델
γH2AX 마커가 본 발명자들의 연산 모델의 예측 성능을 어느 정도까지 개선시킬 수 있을까? 본 발명자들은 동일한 표현형 프로파일링 절차를 반복하되, 단, DNA, γH2AX 및 액틴 마커에 기초하여 129개의 표현형 피쳐를 사용함으로써 수행하였다 (도 8f 및 g). HTPC-B 데이터세트의 대해, 본 발명자들 최고 단일 피쳐 f 최고 는 핵 영역에서의 γH2AX의 활성화를 나타내는, 핵 영역에서의 전체 γH2AX 수준 대 전체 세포 영역에서의 전체 γH2AX 수준의 비였다 (99.5% 훈련 정확도 및 77.6% 시험 정확도) (도 6b)는 것을 발견하였다. 최고 다중 피쳐 세트 F s 는 4개의 핵 및 액틴 세포골격 피쳐였다 (99.7% 훈련 정확도 및 81.6% 시험 정확도, 피쳐에 관한 전체 목록에 대해 도 7 및 표 2 참조). HK-2 데이터세트의 대해, 본 발명자들은 그의 f 최고 는 이웃 픽셀의 강도 수준의 1차 종속의 척도인 DNA GLCM의 평균 상관관계 (99.8% 훈련 정확도 및 83.9% 시험 정확도) (도 6c)였다는 것을 발견하였다. 최고 다중 피쳐 세트 F s 는 5개의 염색체 및 세포골격 피쳐였다 (99.9% 훈련 정확도 및 88.9% 시험 정확도, 도 7 및 표 2). 두 데이터세트 (HPTC-B 및 HK-2) 모두에 대해, 본 발명자들은 다중 피쳐 분류기가 단일 피쳐 분류기보다 시험 정확도가 더 높았다는 일관된 경향을 발견하였다 (도 8f 및 g). 그러나, 단일 피쳐 분류기는 더 높은 시험 특이도를 보인 반면, 다중 피쳐 분류기는 더 높은 민간도를 보였다 (도 8h 및 i). 추가로, 단일 및 다중 피쳐 분류기, 둘 모두에서 100%의 평균 시험 정확도로 예측될 수 있는 화합물의 개수는 22개 (HPTC-A)에서 25개 (HPTC-B) 또는 28개 (HK-2)로 증가하였다 (표 4). 종합해 보면, 상기 결과는 γH2AX 마커를 포함함으로써 본 발명자들은 더 높은 예측 정확도를 얻을 수 있었다는 것을 보여주는 것이다.
본 발명자들은 또한 3개의 모든 데이터세트에 대하여 선별된 최적의 표현형 피쳐를 비교하였고 (표 3), 여러 흥미롭고, 일관된 경향을 발견하게 되었다. 첫 번째로, DNA GLCM의 평균 ASM은 두 HPTC-A 및 -B 데이터세트, 모두에 대한 F s 에서 자동적으로 선별되었다. 두 번째로, HPTC-B 데이터세트에 대한 f 최고 (즉, 핵 영역에서의 전체 γH2AX 수준 대 전체 세포 영역에서의 전체 γH2AX 수준의 비) 및 HK-2 데이터세트에 대한 F s 에서 피쳐 중 하나 (즉, 전체 세포 영역에서의 전체 γH2AX 및 DNA 강도 수준의 비)는 핵에서의 γH2AX 수준 증가를 나타내는, 밀접한 관련이 있는 두 피쳐이다 (도 6). 세 번째로, 비록 최고 단일 피쳐는 DNA 또는 γH2AX 마커에 기초하였지만, 액틴 피쳐는 여전히 다중 피쳐 분류기에 의해 유지되었고, 이는 액틴 리모델링을 유도한 일부 화합물을 정확하게 분류하는 데 액틴 마커가 필요하였다는 것을 제안하는 것이다. 종합해 보면, 상기 결과는 본 발명자들의 예측 모델은 고도로 재현가능하고, 생체이물 유도성 DNA 손상 반응은 인간 1차 및 무한증식 PTC, 둘 모두에서 발생하는 일반 현상이라는 것을 보여주는 것이다.
세포 사멸 반응은 가변적이다
DNA 손상 반응이 시험관내 조건하에서 세포 사멸과 연관이 있는가? HPTC-B 결과에 기초하여, 본 발명자들은 γH2AX 수준을 증가를 유도한 3개의 PTC-독성 화합물 (시스플라틴, 시클로스포린 A, 및 오크라톡신 A), γH2AX 수준에 작은 변화를 일으키거나, 또는 그를 변화시키지 않은 3개의 비-PTC-독성 화합물 (리바비린, 염화리튬, 및 링코마이신)을 선택하였다 (도 8d). 본 발명자들 1차 PTC를 1,000 ㎍/mL의 상기 화합물로 처리하고, 세포를 3개의 상이한 세포 사멸 마커: 아넥신-V (아폽토시스성 세포 및 괴사성 세포, 둘 모두에서 발생하는 포스파티딜세린의 외재화에 대한 마커 (문헌 [Sawai and Domae, Biochem Biophys Res Commun 411: 569-573 (2011)]), 절단된 카스파제-3 (오직 아폽토시스성 세포에서만 발생하는 카스파제-3의 활성화에 대한 마커), 및 에티듐 동종이량체 III (막 붕괴에 기인한 후기 아폽토시스성 또는 괴사성 세포에만 오직 투과성을 띠는 DNA 마커)로 표지하였다 (도 10a). 각 마커에 대하여, 본 발명자들은 상기 6개의 화합물 및 용매 대조군 처리하에서 양성 세포의 비율(%)을 측정하였다 (도 10b). HPTC-B 데이터세트에 기초하여, 본 발명자들은 또한 1,000 ㎍/mL의 상기 화합물로 처리된 1차 PTC의 평균 γH2AX 핵 수준도 측정하였다. 본 발명자들의 이전 Δ최대 측정과 일치하여, 3개의 PTC-독성 화합물은 시험된 투여량에서 3개의 비-PTC-독성 화합물보다 유의적으로 더 높은 평균 γH2AX 강도 수준을 유도하였다 (P = 0.044, 도 10c). 그러나, PTC-독성 화합물과 비-PTC 화합물 사이에서는 아넥신-V 양성 세포의 비율(%) 증가만이 유의적이었다 (P = 0.047). 에티듐-동종이량체-III 및 카스파제-3 양성 세포의 비율(%) 증가는 덜 유의적이었다 (둘 모두 P>0.10, 모두 단측 t 검정; 도 10c). 이는 대개 시클로스포린 A 및 오크라톡신 A에 대한 세포 사멸 반응이 더 낮기 때문이었다. 심지어 아넥신-V의 경우에서도, 반응은 고도로 이질성이었다. 예를 들어, 시클로스포린 A 및 오크라톡신 A는 단지 각각 세포의 ~50% 및 ~25%에서 아넥신-V 수준을 증가시켰다. 이러한 결과는 시클로스포린 A 반응에서의 이질성에 관한 본 발명자들의 이전 결과를 확증시켜 주는 것이었다 (도 8b 및 c). 놀랍게도, 3개의 PTC-독성 화합물은 단지 낮은 비율의 카스파제-3 양성 세포 (<20%)를 유도하였다. 아폽토시스성 반응 유사한 결여는 또한 HK-2 세포에서 일부 PTC-독성 화합물, 예컨대, 5-플루오로우라실 및 젠타마이신에 대해서도 관찰되었다 (문헌 [Wu et al., Toxicol In Vitro 23: 1170-1178 (2009)]). 6개의 모두 화합물 간에 걸쳐 본 발명자들은 γH2AX 수준과 상기 3개의 세포 사멸 마커 사이에는 유의적인 양의 상관관계가 없다는 것 (모두 P>0.20, 단측 t 검정; 도 10c)을 발견하게 되었다. 종합해 보면, 이들 결과는 모두, PTC 독성 물질은 시험된 시험관내 조건하에서 가변적인 세포 사멸 반응 (아폽토시스 및 괴사, 둘 모두)을 유도한다는 것을 나타내었다. 그 중 일부 (예컨대, γH2AX 수준의 큰 증가를 유도한 오크라톡신 A)는 측정 기간 이내에 세포 사멸률의 극히 작은 증가도 유발하지 못할 수 있거나, 세포 사멸률을 증가시키지 못할 수 있다. 이러한 결과 또한 시험관내 세포 사멸 종점은 생체내 PTC 독성을 정확하게 예측하는 데 어려움이 있을 수 있고, 신장독성 예측을 위해 DNA 손상 피쳐를 대체하는 데 사용될 수 없다는 것을 암시한다.
폐 독성 또한 유사한 마커를 사용하여 고도의 예측성을 띨 수 있다.
본 발명자들은 무한증식 폐포 세포 (AVC) 및 기관지 상피 세포주 (BEC)에 기반한 시험관내 폐 독성 모델을 개발하였다. 예측을 위해 표현형 프로파일링 전략법 또한 채택하였고, 본 발명자들의 피쳐는 4개의 형광성 마커 및 7개의 세포 내 영역을 기반으로 하였다 (도 12a 및 b). 훽스트 33342 및 딜라이트™ 554 팔로이딘을 사용하여 각각 DNA 및 액틴 세포골격을 표지하였다. 니트로푸란토인 및 흄드 실리카, 둘 모두 인간에서 각각 폐 질환 및 규폐증을 유발하는 것으로 공지되어 있다. 면역형광 영상은 본 발명자들의 세포 모델에서 DMSO (대조군, 상단), 2 mM 니트로푸란토인 (중간), 및 1 mg/mL 흄드 실리카 (하단) 처리하의 DNA 손상 반응 마커인 γH2AX의 인산화, 및 액틴의 리모델링 변화를 보여주는 것이다.
본 발명의 방법을 BEC 및 AVC 세포 상에서의 화합물의 독성을 예측하기 위해 적용시켰을 때, 신장 독성 분석에 대한 것과 유사한 결과를 얻었다. 결과는 ~86%-100% 범위의 시험 정확도로 가용성 화합물 또는 미립자 화합물의 폐 독성을 예측할 수 있는 4개의 신규 DNA, 염색체 및 세포골격 피쳐이다 (표 5). A549 및 BEAS-2B 세포에 대한 최고 단일 피쳐는 상이하다. A549 세포에 대해, 본 발명자들은 가용성 화합물의 경우, 최고 단일 피쳐 (f최고)는 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피였고 (98.0% 훈련 정확도 및 86.2% 시험 정확도), 미립자 화합물의 경우, 최고 단일 피쳐 (f최고)는 핵 영역에서의 γH2AX 염색의 상관관계 1의 정보 척도 (100.0% 훈련 정확도 및 100.0% 시험 정확도)였다는 것을 발견하게 되었다 (도 13a). BEAS-2B 세포의 경우, 가용성 화합물에 대한 최고 단일 피쳐 (f최고)는 핵 영역 대 세포질 영역에서의 전체 γH2AX 대 액틴 강도의 비 (99.1% 훈련 정확도 및 86.3% 시험 정확도) (도 13b 및 14)였다. 미립자 화합물의 경우, 최고 단일 피쳐 f최고는 5개 존재하였고 (100.0% 훈련 정확도 및 100.0% 시험 정확도), 그들 모두 γH2AX 및/또는 액틴 염색, 즉, γH2AX 객체의 총면적, 세포질 영역에서의 액틴 객체 강도의 비 등과 관련이 있었다 (도 13b 및 15).
Figure pct00027
논의
본 연구는 시험관내에서 배양된 PTC의 세포 사멸은 상이한 PTC-독성 화합물에 의해 다양한 정도로 유도된다는 것을 보여주는 것이다 (도 10). 이러한 관찰 결과는 인간에서의 신장독성 예측에 관한 본 발명자들 및 다른 연구원들의 이전 결과와 일치한다 (문헌 [(Wu et al., Toxicol In Vitro 23: 1170-1178 (2009)]; [Li et al,. Toxicol Res 2: 352-365 (2013)]). 생체내 기관-특이적 독성을 예측하기 위해 시험관내 종점으로서 세포 사멸을 사용하는 것에 있어 난점은 생체내 화합물 유도성 세포 손상이 즉각적 세포 사멸과 항상 연관이 있는 것은 아니라는 사실과 관련이 있을 수 있다. 예를 들어, 화합물 유도성 PTC 손상은 대개 준치사 정도이며, 급성 요세관 괴사 대신 요세관 기능 장애 및 만성 신장 질환과 연관이 있다 (문헌 [Kroshian et al., Am J Physiol 266: F21-30 (1994)]; [Choudhury and Ahmed Nat Clin Pract Nephrol 2: 80-91 (2006)]). 생체이물질 대사 효소 및 수송체의 발현 수준의 차이 또한 중요한 역할을 할 수 있다 (문헌 [Van der Hauwaert et al., Toxicol Appl Pharmacol 279: 409-418 (2014)]). 일반적으로, 시험관내 기관-특이적 독성 모델을 위한 고도의 예측성을 띠는 종점을 확인하는 것이 도전 과제로 남아 있다 (문헌 [Lin and Will Toxicol Sci 126: 114-127 (2012)]). 구체적으로, 신장 모델의 경우, 일관되게, 일반 손상 마커, 예컨대, ATP 고갈; 또는 잠재적으로 신규 신장 특이적 손상 마커, 예컨대, 신장 손상 분자-1 및 호중구 겔라티나제 연관 리포칼린을 사용하는 것은 예측 값에 한계가 있는 것으로 나타났다 (문헌 [Lin and Will Toxicol Sci 126: 114-127 (2012)]; [Li et al., Toxicol Res 2: 352-365 (2013)]; [Tiong et al., Mol Pharm 11: 1933-1948 (2014)]). 그러므로, 상기와 같은 현행 마커의 값은 여전히 많은 논란을 가지고 논의되고 있다 (문헌 [Bonventre et al., Nat Biotechnol 28: 436-440 (2010)]; [Vanmassenhove et al., Nephrol Dial Transplant 28: 254-273 (2013)]).
상기와 같은 어려운 문제점을 처리하기 위해 보편적으로 사용되는 전략법은 기관 특이적 손상 기전에 관한 이해 개선을 달성한 후, 이어서, 상기 기전과 관련된 종점을 선택하는 것이다 (문헌 [Jennings et al., Arch Toxicol 88: 2099-2133 (2014)). 그러나, 이는 신규 화합물 또는 특징 규명이 잘 되어 있지 않은 화합물의 경우, 공지되어 있지 않을 수도 있는 손상 기전에 관한 선험적 지식을 필요로 한다. 본 연구에서, 본 발명자들 손상 기전에 관한 선험적 특징 규명을 필요로 하지 않으면서, 신장독성 예측에 더욱 실용적인 접근법을 취하였고, 생체내 독성을 최고로 예측할 수 있는 시험관내 표현형 피쳐를 직접 검색하였다. 결과는 신장 세포에서 ~76-89%의 시험 정확도 (표 3); 및 폐 세포에서 ~86-100% (표 5)를 달성할 수 있는 핵 및 액틴 세포골격 피쳐로 이루어진 6개의 세트였다. 본 발명자들의 결과는 시험관내 조건하에서, PTC-독성, AVC- 및 BEC-독성 화합물 대부분은, 비록 상기 화합물이 유사하지 않은 화학 구조를 가질 수 있어도, 핵 및 액틴 세포골격에서 유사한 표현형의 변화를 유도한다는 것을 나타낸다.
특이적 세포 변화와 연관된 피쳐를 확인함으로써 본 발명자들의 연산 모델을 기계적으로 해석할 수 있다. 본 발명자들의 연구에서 가장 놀라운 관찰 결과 중 하나는 유전독성 및 발암성에 대한 공지된 마커인 γH2AX (문헌 [Mah et al., Leukemia 24: 679-686 (2010)]; [Nikolova et al., Toxicol Sci 140: 103-117 (2014)])는 또한 다양한 화학 구조를 가지는 다수의 화합물에 의해서도 유도되었다는 점이다. 본 발명자들의 참조 화합물 중 일부, 예컨대, 시스플라틴, 5-플루오로우라실 및 아리스토로크산은 DNA 복제를 직접 방해하고, 이중 가닥 파단을 유발하는 것으로 공지되어 있다 (문헌 [Heidelberger et al. 1957]; [Lieberthal et al., Am J Physiol - Ren Physiol 270: F700-F708 (1996)]; [Arlt Mutagenesis 17: 265-277 (2002)]). 그러나, 본 발명자들의 다른 참조 PTC-독성 화합물 대부분은 핵산 직접 상호작용하는 것으로 공지되어 있지 않다. 본 발명자들의 관찰 결과는, DNA 손상 반응이 생체내 신장 허혈-재관류 손상 및 시험관내 ATP-고갈 손상 이후에 (문헌 [Ma et al,. Biochim Biophys Acta BBA - Mol Basis Dis 1842: 1088-1096 (2014)]), 및 또한 시험관내에서 단리된 관류된 마우스 신장 및 PTC 배양물에서 DNA와 상호작용하는 것으로 공지되어 있지 않은 안지오텐신 처리 이후에 (문헌 [Schmid et al., Cancer Res 68: 9239-9246 (2008)]) 유도되었다는 것으로 밝혀진 다른 최근 연구와 일치한다. 상기 관찰된 DNA 손상 반응은 산화적 스트레스 및/또는 산화적 DNA 손상에 기인하는 것일 수 있다 (문헌 [Schmid et al., Cancer Res 68: 9239-9246 (2008)]; [Ma et al., Biochim Biophys Acta BBA - Mol Basis Dis 1842: 1088-1096 (2014)]). 본 발명자들의 참조 화합물 중 일부, 예컨대, 젠타마이신은 산화적 스트레스를 유도하고, 반응성 산소 종 (ROS) 유도성 DNA 손상을 유도하는 것으로 공지되어 있다 (문헌 [Quiros et al., Toxicol Sci 119: 245-256 (2011)]). 기본 분자 기전과 상관없이, 본 발명자들의 연구는 1차 PTC 및 무한증식 PT 세포주, 둘 모두에서, γH2AX 및 DNA 피쳐가 생체이물질 유도성 PTC 독성을 예측하는 데 고도의 예측성을 띠었다는 것을 보여준다. 중요하게, 이는 또한 예상밖의, 그러나, 일반적인 화합물 유도성 세포 반응 및 손상이 특정 기전에 초점을 맞추지 않은 비편향 접근법에서 어떻게 밝혀질 수 있는지를 입증한다.
흥미롭게도, 본 발명자들의 최종 피쳐 세트 중에 세포골격 피쳐가 유지되고 있다는 것은 DNA/γH2AX 및 액틴 마커가 PTC-독성 화합물에 대한 세포 반응성에 관한 상보적(complimentary)이고, 비-중복된 정보를 제공한다는 것을 제안한다. 다양한 유형의 독성 화합물에 의해 유도된 액틴 세포골격의 리모델링이 PTC에서 보고되었다 (문헌 [Elliget et al., Cell Biol Toxicol 7: 263-280 (1991)]; [Kroshian et al., Am J Physiol 266: F21-30 (1994)]). 액틴 필라멘트는 세포질 이외에도, 핵에 국재화되고, 액틴-관련 단백질 (Arp)은 크로마틴 리모델링 복합체의 일부분이다 (문헌 [Shen et al., Mol Cell 12: 147-155 (2003)]). 그러므로, DNA 손상 반응에서 액틴 필라멘트의 가능한 역할은 추후 연구를 위해 중요한 문제가 될 것이다.
2가지 주요 인자가 본 발명자들의 연산 모델의 높은 정확도에 기여하였다. 첫 번째 인자는 영상 기반 표현형 피쳐를 사용하는 것이었는데, 이를 통해 본 발명자들은 세포 및 세포내 세포 소기관, 예컨대, DNA의 공간 조직화, 히스톤 변형 및 액틴 세포골격의 변화를 정량적으로 측정할 수 있었다. 본 발명자들은 크로마틴 및 세포골격의 하랄릭 텍스처 피쳐가, 집단 평균화된 또는 비-영상-기반 측정하에서는 상실될 수 있는, 고도로 차별적인 정보를 함유하였다는 것을 발견하게 되었다. 본 발명자들의 결과는 또한 129개의 일반 표현형 피쳐로 이루어진 초기 세트가 예측 독성 종점을 스크리닝하는 데 우수한 출발점이 되었다는 것을 보여준다. 높은 정확도에 기여한 두 번째 인자는 디자인된 본 발명자들의 참조 화합물 및 성능 평가 방법이었다. 음성 참조 군에 다양한 화합물 및 비-PTC-독성의 독성 물질을 포함시킴으로써 본 발명자들은 더욱 특이적인 표현형 피쳐를 검색할 수 있었다. 본 발명자들은 또한 훈련 데이터 및 시험 데이터가 통계학상 서로 독립적이었다는 것을 확인하였다. 예를 들어, 피쳐 정규화 및 삭제 파라미터는 항상 오직 훈련 데이터만을 사용하여 결정되었고, 본 발명자들의 교차 검증 절차에서 모든 단일 겹으로 훈련 데이터 및 시험 데이터, 둘 모두에 적용되었다. 결론적으로, 본 발명자들의 연구는 고처리량 영상화, 표현형 프로파일링, 및 머신 러닝 방법을 사용하여 다양한 화학 구조를 가지는 생체이물질 화합물의 인간 신장독성을 예측하는 것에 관한 실현가능성을 입증한다.
참고문헌
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031

Claims (37)

  1. (a) 적어도 하나의 세포 시험 집단을 시험 화합물과 단일 농도에서, 또는 농도 범위에 걸쳐 접촉시키는 단계,
    (b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
    (c) 세포를 분절(segmenting)시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역(subcellular region)을 확인하는 단계,
    (d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
    (e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
    (f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
    (g) DRC의 정량화된 파라미터를 수득하는 단계, 및
    (h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
    (i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함하는,
    시험 화합물이 생체내에서 특이적 세포 유형에 대하여 독성일지 여부를 예측하는 시험관내 방법.
  2. 제1항에 있어서,
    (a) 다중의 세포 시험 집단을 접촉시키는 단계;
    (b) 세포를 하나 이상의 생체분자 마커로 표지화하고 영상화하는 단계,
    (c) 세포를 분절시키고, 세포로부터 전체 세포 영역 및 하나 이상의 세포 내 영역을 확인하는 단계,
    (d) 세포 소실 또는 사멸이 최고 시험 농도에서 발생하였는지 여부를 측정하는 단계 (만약 그렇다면, 중단하고, 화합물이 독성인 것으로 예측하는 단계),
    (e) 시험 집단에서 하나 이상의 정량화된 공간 의존성 및 공간 비의존성 표현형 피쳐를 수득하는 단계,
    (f) 피쳐로부터 다중 용량 반응 곡선 (DRC)을 수득하는 단계,
    (g) DRC의 정량화된 파라미터를 수득하는 단계, 및
    (h) 정량화된 DRC 파라미터를 참조 정량화된 DRC 파라미터 데이터 세트와 비교하는 단계로서; 상기 참조 정량화된 DRC 파라미터 데이터는
    (i) 세포 유형에 대한 생체내 독성이 공지되어 있는 화합물, 및 (ii) 생체내에서 세포 유형에 대하여 독성인 것으로 공지되어 있지 않은 화합물인 2개 군으로부터 도출된 것인 단계를 포함하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 상기 특이적 세포 유형이 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 및/또는 폐포 세포 (AVC)를 포함하는 군으로부터 선택되는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 하나 이상의 정량화된 표현형 피쳐가 DNA 손상 반응, 액틴 필라멘트 완전성, 전체 세포 형태 및 세포 계수를 포함하는 군으로부터 선택되는 특징과 연관이 있는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 하나 이상의 표현형 피쳐가 (i) 텍스처 피쳐, 공간 상관관계 피쳐, 및 상이한 세포 내 영역에서의 마커의 비를 포함하는 군으로부터 선택되는 공간 의존성 피쳐 중 하나 이상의 것; 및 (ii) 강도 피쳐, 세포 계수 및 형태를 포함하는 군으로부터 선택되는 공간 비의존성 피쳐 중 하나 이상의 것에 기초하여 정량화되는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 용량 반응 곡선 (DRC) 파라미터가 시험 화합물의 DRC로부터 각 표현형 피쳐에 대한 최대 반응 값 Δ최대를 사용하여 정량화되는 것인 방법.
  7. 제5항 또는 제6항에 있어서, 상기 텍스처 피쳐가 특이적 세포 내 영역 또는 전체 세포 영역에서의 하랄릭 그레이 레벨 동시 발생 행렬 (GLCM)의 통계치, 즉, 핵 영역에서의 DNA GLCM의 평균 상관관계; 핵 영역에서의 DNA GLCM의 평균 엔트로피; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트; 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차; 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균 중 하나 이상의 것을 포함하는 것인 방법.
  8. 제5항 내지 제7항 중 어느 한 항에 있어서, 상기 염색 강도 피쳐가 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 내부 세포질 영역에서의 전체 액틴 강도 수준; 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 핵 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수 및 핵 영역에서의 DNA 강도의 변동 계수를 포함하는 군 중 하나 이상의 것으로부터 선택되는 것인 방법.
  9. 제5항 내지 제8항 중 어느 한 항에 있어서, 상기 염색 강도 비 피쳐가 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 핵 영역에서의 전체 γH2AX 강도 대 액틴 강도의 비; 및 핵 영역에서의 전체 γH2AX 강도 수준 대 전체 세포 영역에서의 전체 γH2AX 강도 수준의 비를 포함하는 군 중 하나 이상의 것으로부터 선택되는 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 하나 이상의 표현형 피쳐가 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 핵 영역에서의 DNA 강도의 변동 계수 (CV); 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 및 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM)를 포함하는 군으로부터 선택되는 것인 방법.
  11. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 하나 이상의 표현형 피쳐가 내부 세포질 영역에서의 전체 액틴 강도 수준; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM); 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 세포 계수를 포함하는 군으로부터 선택되는 것인 방법.
  12. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 하나 이상의 표현형 피쳐가 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균; 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 및 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차를 포함하는 군으로부터 선택되는 것인 방법.
  13. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 하나 이상의 표현형 피쳐가 핵 영역에서의 DNA GLCM의 평균 엔트로피; 핵 영역에서의 전체 γH2AX 강도 수준 대 전체 세포 영역에서의 전체 γH2AX 강도 수준의 비; 액틴 GLCM의 평균 상관관계; 및 핵 영역에서의 DNA GLCM의 평균 상관관계를 포함하는 군으로부터 선택되는 것인 방법.
  14. 제10항에 있어서, 상기 하나 이상의 표현형 피쳐가 전체 세포 영역에서의 액틴 GLCM의 평균 합 엔트로피; 핵 영역에서의 DNA 강도의 변동 계수 (CV); 전체 세포 영역에서의 액틴 GLCM의 평균 엔트로피; 및 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM)로 이루어진 것인 방법.
  15. 제11항에 있어서, 상기 하나 이상의 표현형 피쳐가 내부 세포질 영역에서의 전체 액틴 강도 수준; 핵 영역에서의 DNA GLCM의 평균 각 2차 모멘트 (ASM); 전체 세포 영역에서의 γH2AX GLCM의 상관관계 2의 정보 척도의 표준 편차; 및 세포 계수로 이루어진 것인 방법.
  16. 제12항에 있어서, 상기 하나 이상의 표현형 피쳐가 전체 세포 영역에서의 DNA 및 γH2AX 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 DNA 및 액틴 강도 사이의 정규화된 공간 상관 계수; 전체 세포 영역에서의 γH2AX GLCM의 평균 합 평균; 전체 세포 영역에서의 전체 γH2AX 강도 대 DNA 강도의 비; 및 핵 영역에서의 DNA GLCM의 합 분산의 표준 편차로 이루어진 것인 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 세포 독성이 랜덤 포레스트 알고리즘을 사용하여 예측되는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 세포 시험 집단이 체세포로부터 유래된 것인 방법.
  19. 제18항에 있어서, 적어도 하나의 세포 시험 집단이 1차 세포, 배아 줄기 세포, 유도 만능 줄기 세포 유래 세포 또는 안정적인 세포주를 포함하는 군으로부터 선택되는 포유동물 체세포로부터 유래된 것인 방법.
  20. 제18항 또는 제19항에 있어서, 적어도 하나의 세포 시험 집단이 인간 세포인 것인 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 접촉이 적어도 1 내지 48시간인 기간에 걸쳐 수행되는 것인 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 접촉이 시험 화합물을 약 1 ㎍/ml 내지 약 1,000 ㎍/ml인 농도로 적어도 하나의 세포 시험 집단에 첨가하는 것을 포함하는 것인 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 영상화 기술이 고처리량 현미경 영상 포착을 포함하는 것인 방법.
  24. (a) 컴퓨터 프로세서에 의해 세포 시험 집단의 영상을 수신하는 단계;
    (b) 컴퓨터 프로세서에 의해 영상으로부터 세포 시험 집단과 연관된 하나 이상의 공간 의존성 표현형 피쳐를 추출하는 단계로서, 하나 이상의 공간 의존성 표현형 피쳐는 세포와 연관된 생체분자의 공간 분포를 특징으로 하는 것인 단계;
    (c) 각각의 하나 이상의 공간 의존성 표현형 피쳐의 용량 반응 곡선 (DRC)을 기술하는 하나 이상의 정량화된 DRC 파라미터를 수득하는 단계; 및
    (d) 상기 하나 이상의 정량화된 DRC 파라미터를 예측 모델에 입력하여 시험 화합물의 생체내 세포 독성 예측을 생성하는 단계를 포함하는, 시험관내에서 시험 화합물 처리를 받은 적어도 하나의 세포 시험 집단을 사용하여 시험 화합물의 생체내 세포 독성을 예측하는 컴퓨터 실행 방법.
  25. 제24항에 있어서, 세포가 신장 근위 세뇨관 세포 (PTC), 기관지 상피 세포 (BEC), 또는 폐포 세포 (AVC)인 것인 방법.
  26. 제24항 또는 제25항에 있어서, 상기 영상이, 각각의 영상이 세포와 연관된 한 유형의 생체분자를 강조하는 각각의 영상화 채널을 사용하여 영상화된 세포 시험 집단을 나타내는 것인 복수 개의 영상을 포함하는 것인 방법.
  27. 제26항에 있어서, 복수 개의 영상의 각각의 영상이 상응하는 유형의 생체분자를 표적화하는 한 유형의 바이오마커의 분포를 나타내는 것인 방법.
  28. 제24항 내지 제27항 중 어느 한 항에 있어서, 단계 (b)가 영상을 사용하여 세포를 분절시키고, 분절된 세포에 상응하는 영상의 강도 값을 사용하여 하나 이상의 공간 의존성 표현형 피쳐를 추출하는 것을 포함하는 것인 방법.
  29. 제24항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 공간 의존성 표현형 피쳐가 세포의 DNA 구조 변경, 크로마틴 구조 변경 및 액틴 필라멘트 구조 변경을 특징으로 하는 피쳐를 포함하는 군으로부터 선택되는 것인 방법.
  30. 제24항 내지 제29항 중 어느 한 항에 있어서, 단계 (d)가 시험 화합물을 세포에 대하여 독성 또는 비독성인 것으로 분류하는 것을 포함하는 것인 방법.
  31. 제24항 내지 제30항 중 어느 한 항에 있어서, 예측 모델이 훈련 데이터 세트로 훈련된 지도 학습 알고리즘(supervised learning algorithm)을 사용하여 수득된 것인 방법.
  32. 제24항 내지 제31항 중 어느 한 항에 있어서, 상기 훈련 데이터 세트가 대조군 세포 집단과 연관된 상응하는 복수 개의 공간 의존성 표현형 피쳐를 특징으로 하는 복수 개의 후보 정량화된 공간 의존성 용량 반응 곡선 (DRC) 파라미터를 포함하고; 상기 대조군 세포 집단은 각각 (i) 생체내에서 세포에 대하여 독성인 것으로 공지된 화합물; (ii) 생체내에서 세포에 대하여 독성인 것으로 공지되어 있지 않은 화합물 처리를 받은 것인 방법.
  33. 제24항 내지 제32항 중 어느 한 항에 있어서, 적어도 하나의 세포 시험 집단과 연관된 하나 이상의 공간 비의존성 표현형 피쳐를 추출하고, 추가로 하나 이상의 공간 비의존성 표현형 피쳐를 사용하여 하나 이상의 정량화된 용량 반응 곡선 (DRC) 파라미터를 수득하는 단계를 추가로 포함하는 방법.
  34. 제24항 내지 제33항 중 어느 한 항에 있어서, 단계 (c)가 시험 화합물의 미리 정의된 농도에서 정량화된 DRC 파라미터를 수득하는 것을 포함하는 것인 방법.
  35. 제24항 내지 제33항 중 어느 한 항에 있어서, 세포 시험 집단이 복수 개의 농도의 시험 화합물 처리를 받은 것이고, 단계 (c)는 복수 개의 농도의 각 농도와 연관된 반응 값을 수득하는 것을 포함하고; 여기서, 정량화된 DRC 파라미터는 최대 반응 값 Δ최대를 사용하여 수득되는 것인 방법.
  36. 컴퓨터 프로세서 및 데이터 저장 장치를 가지는 컴퓨터 시스템으로서, 데이터 저장 장치는 제24항 내지 제35항 중 어느 한 항에 따른 방법을 실행하기 위해 프로세서에 의해 작동되는 비일시적 명령을 저장하는 것인, 컴퓨터 시스템.
  37. 적어도 하나의 프로세서가 제24항 내지 제35항 중 어느 한 항에 따른 방법을실행하게 하는 프로그램 명령이 그 위에 저장되어 있는 것인, 비일시적 컴퓨터 판독가능 매체.
KR1020187017042A 2015-11-20 2016-11-09 다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법 KR20180086438A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201509598X 2015-11-20
SG10201509598X 2015-11-20
PCT/SG2016/050554 WO2017091147A1 (en) 2015-11-20 2016-11-09 High-throughput imaging-based methods for predicting cell-type-specific toxicity of xenobiotics with diverse chemical structures

Publications (1)

Publication Number Publication Date
KR20180086438A true KR20180086438A (ko) 2018-07-31

Family

ID=58764375

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187017042A KR20180086438A (ko) 2015-11-20 2016-11-09 다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법

Country Status (6)

Country Link
US (1) US20200309767A1 (ko)
EP (1) EP3377896A4 (ko)
KR (1) KR20180086438A (ko)
CN (1) CN108885204B (ko)
SG (1) SG11201804144UA (ko)
WO (1) WO2017091147A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210079134A (ko) * 2019-12-19 2021-06-29 인제대학교 산학협력단 조직학 섹션에서 전립선암 종의 다중 특성 분류 방법

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388860B (zh) * 2018-02-12 2020-04-28 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
JP6558786B1 (ja) * 2018-09-28 2019-08-14 学校法人東北工業大学 標的の特性の予測を行うための方法、コンピュータシステム、プログラム
CA3130616A1 (en) 2019-02-20 2020-08-27 Bluerock Therapeutics Lp Detecting cells of interest in large image datasets using artificial intelligence
CN110992320B (zh) * 2019-11-22 2023-03-21 电子科技大学 一种基于双重交错的医学图像分割网络
CN113192553B (zh) * 2020-01-14 2022-09-09 北京大学 基于单细胞转录组测序数据预测细胞空间关系的方法
CN111751263A (zh) * 2020-06-08 2020-10-09 西安交通大学 基于灰度共生矩阵的免标记细胞二维散射图像反演方法
CN112395747B (zh) * 2020-11-04 2023-05-09 南京信息工程大学 一种预测复杂联合作用方式的混合污染物毒性的方法
CN115142160B (zh) * 2022-08-22 2023-12-19 无锡物联网创新中心有限公司 一种纱线强力弱环的辨识方法及相关装置
US11874934B1 (en) 2023-01-19 2024-01-16 Citibank, N.A. Providing user-induced variable identification of end-to-end computing system security impact information systems and methods
US11748491B1 (en) * 2023-01-19 2023-09-05 Citibank, N.A. Determining platform-specific end-to-end security vulnerabilities for a software application via a graphical user interface (GUI) systems and methods
CN116595427B (zh) * 2023-07-18 2023-09-19 青岛海关技术中心 一种化学品潜在长期健康危害分类预测方法、介质及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1579212B1 (en) * 2002-10-25 2008-12-31 MDS Analytical Technologies (US) Inc. Methods of identifying reduced internalization transmembrane receptor agonists
GB2435923A (en) * 2006-03-09 2007-09-12 Cytokinetics Inc Cellular predictive models for toxicities
GB2435925A (en) * 2006-03-09 2007-09-12 Cytokinetics Inc Cellular predictive models for toxicities
US20080195322A1 (en) * 2007-02-12 2008-08-14 The Board Of Regents Of The University Of Texas System Quantification of the Effects of Perturbations on Biological Samples
US8818070B2 (en) * 2011-02-28 2014-08-26 Cellomics, Inc. Predicting toxicity of a compound over a range of concentrations
US20140308695A1 (en) * 2011-11-04 2014-10-16 Tengion, Inc. Drug screening and potency assays
SG11201500367WA (en) * 2012-07-20 2015-02-27 Agency Science Tech & Res In vitro assay for predicting renal proximal tubular cell toxicity
EP3120151A4 (en) * 2014-03-17 2017-08-09 Agency For Science, Technology And Research METHOD FOR PREDICTING TOXICITY OF A COMPOUND BASED ON NUCLEAR FACTOR-kB TRANSLOCATION

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210079134A (ko) * 2019-12-19 2021-06-29 인제대학교 산학협력단 조직학 섹션에서 전립선암 종의 다중 특성 분류 방법

Also Published As

Publication number Publication date
CN108885204A (zh) 2018-11-23
US20200309767A1 (en) 2020-10-01
WO2017091147A8 (en) 2017-06-29
EP3377896A1 (en) 2018-09-26
SG11201804144UA (en) 2018-06-28
EP3377896A4 (en) 2019-04-10
WO2017091147A1 (en) 2017-06-01
CN108885204B (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
KR20180086438A (ko) 다양한 화학 구조를 가지는 생체이물질의 세포 유형 특이적 독성을 예측하기 위한 고처리량 영상화 기반 방법
Kang et al. Improving drug discovery with high-content phenotypic screens by systematic selection of reporter cell lines
Way et al. Predicting cell health phenotypes using image-based morphology profiling
Gaglia et al. HSF1 phase transition mediates stress adaptation and cell fate decisions
Way et al. Morphology and gene expression profiling provide complementary information for mapping cell state
Fan et al. Characterizing transcriptional heterogeneity through pathway and gene set overdispersion analysis
Nikolova et al. The γH2AX assay for genotoxic and nongenotoxic agents: comparison of H2AX phosphorylation with cell death response
Su et al. High-throughput imaging-based nephrotoxicity prediction for xenobiotics with diverse chemical structures
Filby et al. An imaging flow cytometric method for measuring cell division history and molecular symmetry during mitosis
US20200020419A1 (en) Methods of analyzing cells
Fetz et al. Target identification by image analysis
Krasemann et al. Assessing and improving the validity of COVID-19 autopsy studies-A multicentre approach to establish essential standards for immunohistochemical and ultrastructural analyses
US20050282208A1 (en) Cellular phenotype
Gupta et al. Population distribution analyses reveal a hierarchy of molecular players underlying parallel endocytic pathways
Rozova et al. Machine learning reveals mesenchymal breast carcinoma cell adaptation in response to matrix stiffness
Harrison et al. Evaluating the utility of brightfield image data for mechanism of action prediction
Lockett et al. Quantitative analysis of F‐actin redistribution in astrocytoma cells treated with candidate pharmaceuticals
Mancia et al. Quantitative methods to characterize morphological properties of cell lines
Yenkin et al. Pooled image-base screening of mitochondria with microraft isolation distinguishes pathogenic mitofusin 2 mutations
US11978538B2 (en) Systems and methods for associating compounds with properties using clique analysis of cell-based data
WO2019173671A1 (en) In vitro assay to predict cardiotoxicity
WO2016061318A1 (en) Smart reporter cells and methods of making and using same
Eksi et al. Single-cell analysis of localized low-and high-grade prostate cancers
WO2022266257A1 (en) Systems and methods for associating compounds with properties using clique analysis of cell-based data
Yenkin et al. Mitochondrial Phenotypes Distinguish Pathogenic MFN2 Mutations by Pooled Functional Genomics Screen

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application