KR20150048909A - 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm) - Google Patents

게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm) Download PDF

Info

Publication number
KR20150048909A
KR20150048909A KR1020157010056A KR20157010056A KR20150048909A KR 20150048909 A KR20150048909 A KR 20150048909A KR 1020157010056 A KR1020157010056 A KR 1020157010056A KR 20157010056 A KR20157010056 A KR 20157010056A KR 20150048909 A KR20150048909 A KR 20150048909A
Authority
KR
South Korea
Prior art keywords
path
cell
pathway
gene
disease
Prior art date
Application number
KR1020157010056A
Other languages
English (en)
Inventor
찰스 제이 바스크
스티븐 씨 벤즈
조슈아 엠 스튜어트
데이비드 하우슬러
Original Assignee
더 리젠츠 오브 더 유니버시티 오브 캘리포니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 filed Critical 더 리젠츠 오브 더 유니버시티 오브 캘리포니아
Publication of KR20150048909A publication Critical patent/KR20150048909A/ko

Links

Images

Classifications

    • G06F19/12
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • G06F19/20
    • G06F19/24
    • G06F19/345
    • G06F19/3456
    • G06F19/3475
    • G06F19/3481
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/40ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

환자 샘플 특이적 동적 경로 맵은 경로 엘리먼트에 대한 속성을 기반으로 하는 확률 경로 모델 및 측정된 환자 데이터를 기반으로 하여 구축되며, 이때 경로 엘리먼트에 대한 일부 속성은 연역적으로 공지된 것이며, 경로 엘리먼트에 대한 다른 속성은 추정된 것이며, 이때 경로 엘리먼트는 교차-상관관계에 있으며 하나 이상의 경로에 대한 인플루언스 수준을 할당한다. 바람직한 동적 경로 맵은 선택된 참조 경로 활성에 대해 측정된 환자 데이터의 내용을 제공한다.

Description

게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (PARADIGM){PATHWAY RECOGNITION ALGORITHM USING DATA INTEGRATION ON GENOMIC MODELS (PARADIGM)}
다른 출원과의 관계
본 출원은 2011 년 10 월 26 일에 발명의 명칭 "PATHWAY RECOGNITION ALGORITHM USING DATA INTEGRATION ON GENOMIC MODELS (PARADIGM)" 으로 출원된 US 가출원 일련 번호 13/317,769 와 관련되고, 이를 우선권 주장하며, 이의 전체가 본원에서 참조인용된다.
본 발명은 일부 하기 미국 연방 기관의 기금을 사용하여 이루었다: NSF CAREER award 0845783, 국제 암 연구소 계약/승인 번호 5R21CA135937-02 및 1U24CA143858-01, 및 국립 건강 훈련 연구소 승인 번호 T32 GM070386-01. 미국 연방 정부는 본 발명에 대한 특정 권리를 갖는다.
발명의 분야
본 발명은 개체 또는 대상에서 생물학적 경로의 성분을 확인하고 개체 또는 대상이 임상 요법 또는 치료의 후보자인지를 결정하는 방법에 관한 것이다. 본 발명은 또한 대상이 암, 자기 면역 질환, 세포 주기 장애 또는 기타 장애에 걸리기 쉬운지를 진단하는 방법을 사용하는 것에 관한 것이다.
현대 암치료에 있어 중심이 되는 전제는 환자 진단, 예후, 위험 평가, 및 치료 반응 예측이 진단시 수집되는 관련 임상 정보 (예를 들어, 환자 이력, 종양 조직학 및 상태) 뿐만 아니라 후속적인 임상 추적 데이터 (예를 들어, 치료 요법 및 질환 재발 사건) 와 함께 종양의 게놈, 전사 및 에피게놈에 기초한 암의 계층화에 의해 개선될 수 있다는 것이다.
여러 고 처리량 기술이 암의 분자 상세를 탐침하는데 이용가능하지만, 소수만이 상기 패러다임에 기초하여 성공하였다. 예를 들어, ERBB2 성장 인자 수용체 티로신 키나아제의 특정 증폭 또는 과다발현을 나타내는 유방암 환자의 25 % 는 현재 트라스투주맙, 상기 수용체를 표적화하는 단일클론 항체를 이용하여 치료될 수 있다 (Vogel C, Cobleigh MA, Tripathy D, Gutheil JC, Harris LN, Fehrenbacher L, Slamon DJ, Murphy M, Novotny WF, Burchmore M, Shak S, Stewart SJ. First-line, single-agent Herceptin(R) (trastuzumab) in metastatic breast cancer. A preliminary report. Eur. J. Cancer 2001 Jan.;37 Suppl 1 :25-29).
그러나, 상기 성공 내력조차 ERBB2-양성 유방암 환자의 50 % 미만이 트라스투주맙으로부터 임의의 치료 이점을 실제 성취했다는 사실로는 명백하지 않으므로, 잘 연구된 발암 경로의 불안전한 이해 및 ERBB2-양성 유방암 고유의 많은 치료-내성 메커니즘을 강조한다 (Park JW, Neve RM, Szollosi J, Benz CC. Unraveling the biologic and clinical complexities of HER2. Clin. Breast Cancer 2008 Oct.;8(5):392-401.)
기본적인 암 생물학에 대한 현대 진보를 해석하기 위한 상기 전반적인 실패는 부분적으로 실질적인 임의의 유형의 암에 대해 현재 기술적으로 획득할 수 있는 오믹 (omic) 특징 모두를 완전히 정리 통합을 못 하는 우리의 능력으로 인한 것이다. 조직학적으로 유사한 암이 실제로는 유의하게 상이한 임상적 거동을 각각 갖는 많은 분자 아류형의 복합물이라는 확실한 증거에도 불구하고, 상기 지식은 예후 및 치료 선택과 관련한 로버스트 신호의 부족으로 인해 실제로는 거의 적용되지 않는다.
암은 세포 시스템의 이상 조절을 야기하는 비정상적 변화와 연관된 게놈의 질환이다. 게놈 변화가 암 표현형의 기저가 되는 유전 경로에 얼마나 반영되는 지는 명확하지 않다. 고 처리량 기능적 게놈 조사는 과거 10 년 동안에 현저한 진보를 이루었다 (Alizadeh AA, Eisen MB, Davis RE, Ma C, Lossos IS, Rosenwald A, Boldrick JC, Sabet H, Tran T, Yu X, Powell JI, Yang L, Marti GE, Moore T, Hudson J, Lu L, Lewis DB, Tibshirani R, SHERLOCK G, Chan WC, Greiner TC, Weisenburger DD, Armitage JO, Warnke R, Levy R, Wilson W, Grever MR, Byrd JC, Botstein D, Brown PO, Staudt LM. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 2000 Feb.;403(6769):503-511.; Golub TR, Slonim DK, Tamayo P, Huard C, Gaasenbeek M, Mesirov JP, Coller H, Loh ML, Downing JR, Caligiuri MA, Bloomfield CD, Lander ES. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 1999 Oct.;286(5439):531-537.; van de Vijver MJ, He YD, van t Veer LJ, Dai H, Hart AAM, Voskuil DW, Schreiber GJ, Peterse JL, Roberts C, Marton MJ, Parrish M, Atsma D, Witteveen A, Glas A, Delahaye L, van der Velde T, Bartelink H, Rodenhuis S, Rutgers ET, Friend SH, Bernards R. A Gene-Expression Signature as a Predictor of Survival in Breast Cancer. N Engl J Med 2002 Dec.;347(25): 1999-2009.).
그러나, 종양형성 및 진행의 재현 및 번역이 가능한 분자 시그니처를 확인하는 다중 데이터 소스의 통합 도전은 여전히 어려운 것으로 남아 있다. 최근 TCGA 및 기타에 의한 예비 연구는 게놈 교란의 경로-레벨 이해가 암 세포에서 관찰되는 변화를 이해하는데 필요되는 것을 명확히 설명한다. 이러한 발견은 환자가 상이한 유전자의 게놈 변화 또는 비정상적인 발현을 갖고 있는 경우에도, 상기 유전자는 종종 통상의 경로에 참여한다는 것을 입증하였다. 추가로, 더욱 현저하게는, 관찰된 변화 (예를 들어, 결실 대 증폭) 가 경로 활성화를 증가시키는 모든 것 또는 감소시키는 모든 것을 동일한 방향으로 경로 출력을 변화시키는 것이다. (참조: Parsons DW, Jones S, Zhang X, Lin JCH, Leary RJ, Angenendt P, Mankoo P, Carter H, Siu I, Gallia GL, Olivi A, McLendon R, Rasheed BA, Keir S, Nikolskaya T, Nikolsky Y, Busam DA, Tekleab H, Diaz LA, Hartigan J, Smith DR, Strausberg RL, Marie SKN, Shinjo SMO, Yan H, Riggins GJ, Bigner DD, Karchin R, Papadopoulos N, Parmigiani G, Vogelstein B, Velculescu VE, Kinzler KW. An Integrated Genome Analysis of Human Glioblastoma Multiforme. Science 2008 Sep.;321(5897): 1807-1812.; Cancer Genome Atlas Research Network. Comprehensive genomic characterization defines human glioblastoma genes and core pathway. Nature 2008 Oct.;455(7216): 1061-1068.)
게놈-전반의 암 데이터를 해석하기 위한 접근법은 특정한 표현형 또는 질환 상태와 매우 관련된 유전자 발현 프로파일을 확인하는데 집중해 왔고, 유망한 결과를 가져왔다. 분산 분석을 사용하는 방법, 오류-발견, 및 비모수 방법의 분석이 제안되어 왔다 (참조: Troyanskaya et al, 2002. Allison DB, Cui X, Page GP, Sabripour M. Microarray data analysis: from disarray to consolidation and consensus. Nat. Rev. Genet. 2006 Jan.;7(l):55-65.; Dudoit S, Fridlyand J. A prediction-based resampling method for estimating the number of clusters in a dataset. Genome Biol 2002 Jun.;3(7):RESEARCH0036-RESEARCH0036.21.; Tusher VG, Tibshirani R, Chu G. Significance analysis of microarrays applied to the ionizing radiation response. Proc. Natl. Acad. Sci. U.S.A. 2001 Apr.;98(9):5116-5121; Kerr MX, Martin M, Churchill GA. Analysis of variance for gene expression microarra data. J. Comput. Biol. 2000;7(6):819-837; Storey JD, Tibshirani R. Statistical significance for genomewide studies. Proc. Natl. Acad. Sci. U.S.A. 2003 Aug.;100(16):9440-9445; and Troyanskaya OG, Garber ME, Brown PO, Botstein D, Altman RB. Nonparametric methods for identifying differentially expressed genes in microarray data. Bioinformatics 2002 Nov.;18(11): 1454-1461.)
여러 경로-레벨 접근법은, 경로가 질환 상태에서 교란되는지를 검출하기 위해 유전자세트의 과잉표현에 기초한 통계적 검정을 사용한다. 이러한 접근법에 있어서, 유전자들은 예를 들어 상이한 발현 또는 카피 수 변화에 의해 검출되기 때문에 그들의 상이한 활성화 서열도에 기초하여 순위가 정해진다. 경로의 유전자가 정리된 리스트의 양끝 근처 순위에 올라와 있는 정도를 반영하는 확률 점수가 지정되고 유전자 세트 농축 분석 (gene set enrichment analysis, GSEA) 에 사용된다 (Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, Paulovich A, Pomeroy SL, Golub TR, Lander ES, Mesirov JP. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc. Natl. Acad. Sci. U.S.A. 2005 Oct.;102(43): 15545-15550.). 다른 접근법은 유전자 온톨로지 (Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, SHERLOCK G. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet 2000 May;25(l):25-29.) 또는 MIPS 포유류 단백질-단백질 상호작용 (Pagel P, Kovac S, Oesterheld M, Brauner B, Dunger-Kaltenbach I, Frishman G, Montrone C, Mark P, Stuempflen V, Mewes H, Ruepp A, Frishman D. The MIPS mammalian protein-protein interaction database. Bioinformatics 2005 Mar.;21(6):832-834.) 상이하게 발현되는 유전자에 풍부한 카테고리 (Tamayo P, Slonim D, Mesirov J, Zhu Q, Kitareewan S, Dmitrovsky E, Lander ES, Golub TR. Interpreting patterns of gene expression with self-organizing maps: methods and application to hematopoietic differentiation. Proc. Natl. Acad. Sci. U.S.A. 1999 Mar.;96(6):2907-2912.) 를 확인하기 위한 초기하 시험-기재 방법을 사용하는 것을 포함한다.
과잉표현 분석은 경로 연관성에 대한 검출 신호를 증가시킬 수 있는 경로에서 유전자들 간의 알려진 상호의존성을 포함하지 않기 때문에 효력에 있어서 제한된다. 또한, 상기 분석은 모든 유전자 변화를 동일하게 다루고, 이는 많은 생물학적 시스템에 유효할 것으로 예상되지 않는다.
추가 복잡한 사안은 많은 유전자 (예를 들어, microRNA) 가 여러 경로에서 상이한 역할을 하는 다면발현성이라는 사실이다 (Maddika S, Ande SR, Panigrahi S, Paranjothy T, Weglarczyk K, Zuse A, Eshraghi M, Manda KD, Wiechec E, Los M. Cell survival, cell death and cell cycle pathway are interconnected: implications for cancer therapy. Drug Resist. Updat. 2007 Jan.;10(l-2): 13-29). 이러한 인자들 때문에, 과잉표현 분석은 종종 기능적으로 관련된 경로의 유전자가 경계선상의 상이한 활성을 갖고 경로를 놓친다. 상기 인자들은 또한 단일 유전자가 작은 경로에서 고도로 변화될 경우 거짓 양성을 생성할 수 있다. 유전자와 이의 표현형 결과 간의 상세한 상호작용에 관한 우리의 축적된 지식은 급성장하고 있다.
이러한 지식은 전통적으로 문헌 곳곳에 퍼져있고 체계적으로 접근하기가 어려웠지만, 경로 지식을 공개 활용 데이터베이스에 목록을 작성하는 새로운 노력이 있었다. 경로 토폴로지를 포함하는 데이터베이스의 일부는 리액톰 (Reactome) (Joshi-Tope G, Gillespie M, Vastrik I, D'Eustachio P, Schmidt E, de Bono B, Jassal B, Gopinath GR, Wu GR, Matthews L, Lewis S, Birney E, Stein L. Reactome: a knowledgebase of biological pathways. Nucleic Acids Res. 2005 Jan.;33(Database issue):D428-32; Ogata H, Goto S, Sato K, Fujibuchi W, Bono H, Kanehisa M. KEGG: Kyoto Encyclopedia of Genes and Genomes. Nucleic Acids Res. 1999 Jan.;27(l):29-34.)) 및 NCI 경로 상호작용 데이터베이스이다. 이러한 데이터베이스에 대한 업데이트는 유전자가 조절하고 서로 통하는 방법을 분명하게 인코딩함으로써 생물학적 시스템의 이해를 향상시키는 것으로 기대된다. 주요 가설은 상기 경로의 상호작용 토폴로지가 고 처리량 데이터세트를 해석하는 목적을 위해 이용될 수 있다는 것이다.
최근까지, 고 처리량 데이터세트를 해석하기 위한 경로 지식을 통합하기 위해 몇몇 계산적 접근법이 이용가능하였다. 그러나, 경로 토폴로지를 통합하는 여러 새로운 접근법이 제시되어 왔다 (Efroni S, Schaefer CF, Buetow KH. Identification of key processes underlying cancer phenotypes using biologic pathway analysis. PLoS ONE 2007;2(5):e425.). 신호화 경로 영향 분석 (SPIA) 로 불리는 하나의 접근법은 경로에서 유전자의 영향력을 측정하기 위한 구글의 페이지랭크 (Google's PageRank) 와 유사한 방법을 사용한다 (Tarca AL, Draghici S, Khatri P, Hassan SS, Mittal P, Kim J, Kim CJ, Kusanovic JP, Romero R. A novel signaling pathway impact analysis. Bioinformatics 2009 Jan.;25(l):75-82.). SPIA 에서, 다른 많은 유전자로 연결되는 유전자에 더 많은 영향이 미친다. SPIA 는 상이한 암 데이터세트 (폐 선암 및 유방암) 에 성공적으로 적용되었고, 상기 암에 포함된 것으로 알려진 경로를 확인하기 위한 과잉표현 분석 및 유전자 세트 강화 분석을 능가하는 것으로 나타났다. SPIA 가 경로 토폴로지를 사용하여 암 데이터세트를 해석하는데 있어서 주요 진보를 나타내지만, 게놈-전반의 데이터의 단일 유형만을 사용하는 것으로 한정된다.
신규 전산적 접근법은 복합적인 게놈 변화, 예컨대 카피 수, DNA 메틸화, 체세포 돌연변이, mRNA 발현 및 마이크로RNA 발현을 연결하기 위해 요구된다. 통합 경로 분석은 어떤 단일 데이터 소스도 저절로 완전한 그림을 제공할 가능성이 없기 때문에, 대량의 관찰에 대한 인과적 해석의 정밀도 및 감수성을 증가시킬 것으로 예상된다.
과거 수년 동안, 확률 그래프 모델 (PGM) 에 관한 접근법은 다양한 레벨의 관찰과 호환가능한 인과 네트워크를 학습하기 위해 발전하여 왔다. 효율적인 알고리즘은 데이터로부터 자동적으로 경로를 학습하는 데 이용가능하고 (Friedman N, Goldszmidt M. (1997) Sequential Update of Bayesian Network Structure. In: Proceedings of the Thirteenth Conference on Uncertainty in Artificial Intelligence (UAI'97), Morgan Kaufmann Publishers, pp. 165-174; Murphy K, Weiss Y. Loopy belief propagation for approximate inference: An empirical study. In: Proceedings of Uncertainty in AI. 1999), 유전 네트워크 추론에서의 문제에 잘 순응된다 (Friedman N. Inferring cellular networks using probabilistic graphical models. Science 2004 Feb.;303(5659):799-805.). 예로서, 그래프 모델이 암 생물학에서 '모듈' 을 형성하는 유전자의 세트를 확인하기 위해 사용되어 왔다 (Segal E, Friedman N, Kaminski N, Regev A, Koller D. From signatures to models: understanding cancer using microarrays. Nat Genet 2005 Jun.;37 Suppl:S38-45.). 상기 모델은 또한 종양 유전자형 및 발현 표현형 간의 관계를 설명하고 (Lee S, Pe'er D, Dudley AM, Church GM, Koller D. Identifying regulatory mechanisms using individual variation reveals key role for chromatin modification. Proc. Natl. Acad. Sci. U.S.A. 2006 Sep.;103(38): 14062-14067.), 단백질 신호 네트워크 (Sachs K, Perez O, Pe'er D, Lauffenburger DA, Nolan GP. Causal protein-signaling networks derived from multiparameter single-cell data. Science 2005 Apr.;308(5721):523-529.) 및 재결합 유전자 조절 코드 (Beer MA, Tavazoie S. Predicting gene expression from sequence. Cell 2004 Apr.;117(2): 185-198.) 를 추론하기 위해 적용되어 왔다. 특히, 인자 그래프가 발현 데이터를 모형화하는데 사용되어 왔다 (Gat-Viks I, Shamir R. Refinement and expansion of signaling pathways: the osmotic response network in yeast. Genome Research 2007 Mar.;17(3):358-367.; Gat-Viks I, Tanay A, Raijman D, Shamir R. The Factor Graph Network Model for Biological Systems. In: Hutchison D, Kanade T, Kittler J, Kleinberg JM, Mattern F, Mitchell JC, Naor M, Nierstrasz O, Pandu Rangan C, Steffen B, Sudan M, Terzopoulos D, Tygar D, Vardi MY, Weikum G, Miyano S, Mesirov J, Kasif S, Is trail S, Pevzner PA, Waterman M, editors. Berlin, Heidelberg: Springer Berlin Heidelberg; 2005 p. 31-47.;Gat-Viks I, Tanay A, Raijman D, Shamir R. A probabilistic methodology for integrating knowledge and experiments on Biological networks. J. Comput. Biol. 2006 Mar.;13(2): 165-181.).
유방암은 임상적 및 유전체적으로 이질적이고, 여러 병리학적 및 분자적으로 다른 아류형으로 구성된다. 통상적이면서 표적화된 치료에 대한 환자 반응은 마커 유도된 치료 전략의 개발을 동기 유발하는 아류형에 따라 다르다. 유방암 세포주의 채집은 종양에서 발견된 많은 분자 아류형 및 경로를 반영하고, 후보 치료 화합물을 사용하는 세포주의 치료가 분자 아류형, 경로 및 약물 반응 간의 연관성의 확인을 보여줄 수 있음을 암시한다. 77 개의 치료 화합물의 시험에 있어서, 거의 모든 약물은 상기 세포주에 대한 상이한 반응을 보여주고, 대략 반정도는 아류형-, 경로 및/또는 게놈 이상-특이적 반응을 보여준다. 이러한 관찰은 임상적 약물 지정뿐만 아니라 약물을 효과적으로 조합하는 노력을 알려줄 수 있는 반응 및 저항성의 메커니즘을 시사한다.
여러 레벨에서의 종양의 고 처리량 분자 프로파일의 축적은 전세계적으로 장기간이면서 고비용의 과정이다. 여러 레벨에서의 유전자 조절의 복합 분석은 다층 상피암에서 탈조절되는 특정 생물학적 기능 및 분자 경로를 나타내고, 맞춤 치료 및 모니터링을 위한 환자의 신규 하위군을 나타낼 수 있다. 본 발명자는 대략 110 명의 유방암 환자로부터의 알려진 미세전이 상태에 있는 원발성 종양, 매치된 혈액의 새로 동결된 샘플로부터 도출된 여러 분자 레벨에서 고처리량 데이터를 수집하였다(MicMa 데이터세트로서 추가로 언급됨). 상기 환자는 파종성 종양 세포 (DTC) 의 존재, 재발의 장기간 추적조사 및 전체 생존에 관한 정보를 갖는 900 건 초과의 유방암 사건의 코호트의 일부이다. MicMa 세트는 하기의 예비 연구와 병행해 사용되어 왔다: 전체 게놈 mRNA 발현 (1 Naume, B. et al., (2007), Presence of bone marrow micrometastasis is associated with different recurrence risk within molecular subtypes of breast cancer, 1: 160-171), 어레이CGH (Russnes HG, Vollan HKM, Lingjaerde OC, Krasnitz A, Lundin P, Naume B, Sorlie T, Borgen E, Rye IH, Langerod A, Chin S, Teschendorff AE, Stephens PJ, Maner S, Schlichting E, Baumbusch LO, Karesen R, Stratton MP, Wigler M, Caldas C, Zetterberg A, Hicks J, Borresen-Dale A. Genomic architecture characterizes tumor progression paths and fate in breast cancer patients. Sci Transl Med 2010 Jun.;2(38):38ra47), DNA 메틸화 (Ronneberg JA, Fleischer T, Solvang HK, Nordgard SH, Edvardsen H, Potapenko I, Nebdal D, Daviaud C, Gut I, Bukholm I, Naume B, Borresen-Dale A, Tost J, Kristensen V. methylation profiling with a panel of cancer related genes: association with estrogen receptor, TP53 mutation status and expression subtypes in sporadic breast cancer. Mol Oncol 2011 Feb.;5(l):61-76), 전체 게놈 SNP 및 SNP-CGH (Van, Loo P. et al., (2010), Allele-specific copy number analysis of tumors, 107: 16910-169154), 전체 게놈 miRNA 발현 분석 (5 Enerly, E. et al., (2011), miRNA-mRNA Integrated Analysis Reveals Roles for miRNAs in Primary Breast Tumors, 6: el6915-), TP53 돌연변이 상태 의존적 경로 및 고-처리량 한쌍의 말단 서열분석 (7 Stephens, P. J. et al., (2009), Complex landscapes of somatic rearrangement in human breast cancer genomes, 462: 1005-1010). 이는 유방의 원발성 종양의 동일한 세트에 대한 단일 랩에 의해 수행되는 고-처리량 분자 데이터의 포괄적 수집이다.
암 연구에 대한 매우 중요한 주제는 암의 발달을 주도하는 게놈 이상의 확인이다. MicMa 코호트로부터 전체-게놈 카피 수 및 발현 프로파일을 활용하여, 본 발명자는 이전 단계에서 선택된 유전자들 중에서 가장 유망한 후보를 확인하도록 각각 설계된 여러 필터 단계를 정의하였다. 제 1 의 두 단계는 발현 유전자, 즉 카피 수 변화가 발현에 미치는 실질적 효과를 갖는 유전자에 연관된 흔한 이상 및 인-시스 (in-cis) 의 확인을 수반한다. 후속적으로, 상기 방법은 잠재적 신규 후보 주도자 유전자를 추가로 줄이기 위해서 선택된 유전자의 인-트랜스 (in-trans) 효과를 고려한다 (Miriam Ragle Aure, Israel Steinfeld Lars Oliver Baumbusch Knut Liestol Doron Lipson Bjorn Naume Vessela N. Kristensen Anne-Lise Borresen-Dale Ole-Christian Lingjaerde and Zohar Yakhini, (2011), robust novel method for the integrated analysis of copy number and expression reveals new candidate driver genes in breast cancer). 최근 본 발명자는 고형 종양의 대립유전자-특이적 카피 수를 정확히 나눌 수 있게 하고 (ASCAT), 동시에 종양 배수성 및 비이상 세포 혼합 둘 모두를 평가하고 조절하는 대립유전자-특이적 카피 수 분석을 개발하였다 (Van, Loo P. et al., (2010), Allele-specific copy number analysis of tumors, 107: 16910-169154). 이는 이득, 손실, 카피 수-중립 이벤트, 및 이형접합성의 소실 (LOH) 이 정확히 측정될 수 있는 게놈-전반의 대립유전자-특이적 카피-수 프로파일의 계산을 가능하게 한다. 대립유전자 특이적 방식에서 DNA 이상을 관찰하여 유방암에서 대립유전자 비대칭도의 게놈-전반의 지도를 구축하였고, 이는 하나의 대립유전자가 우선적으로 손실되나, 다른 대립유전자가 우선적으로 수득되는 위치를 나타낸다. 본 발명자는 대안적인 대립유전자가 유방 암종 발달에 미치는 상이한 영향력을 갖는다는 가설을 세웠다. 본 발명자는 기저-유사 유방 암종이 다른 아류형과 비교하여 LOH 의 상당히 더 높은 빈도를 갖고, 이들의 ASCAT 프로파일은 종양 발달 동안 게놈 물질의 대규모 손실, 이어서 전체-게놈 복제, 그 결과 생성된 거의-3배체 게놈을 보여준다는 것을 볼 수 있었다 (Van et al. (2010) supra). 별개의 전반적인 DNA 메틸화 프로파일은 정상 유방 상피 세포뿐만 아니라 유방 종양에서 보고되어 왔다.
현재 질환 및 장애의 특성화, 진단, 예방, 치료, 및 확정에 사용될 수 있는 방법이 제공될 필요가 있다.
본 발명자들은 다중 경로 엘리먼트 (전형적으로 하나 이상의 경로) 의 다중 속성의 통합이 허용되는 다양한 시스템 및 경로 분석 방법을 밝혀냈으며, 이때 하나 이상의 경로 엘리먼트는 연역적으로 공지된 속성을 갖고, 이때 하나 이상의 또다른 경로 엘리먼트는 가정 속성을 갖고, 이때 경로 엘리먼트는 크로스-상호관계에 있으며 하나 이상의 경로 상에서 할당된 특정 인플루언스 수준은 확률적 경로 모델 (PPM) 을 구축하기 위함이다. 이어서, 환자 샘플의 다중 엘리먼트에 대한 측정 속성은 PPM 과 결합 사용되어 환자 샘플 특이적 동적 경로 맵 (DPM) 을 생성시킨다.
본 발명의 주제의 하나의 양태에 있어서, 본 발명자들은 동적 경로 맵 (DPM) 를 생성하는 방법을 완성하였으며, 이때 하나의 단계에서 복수의 경로 엘리먼트를 저장하고 있는 경로 엘리먼트 데이터베이스에 대한 접근법이 제공되며, 이때 각각의 경로 엘리먼트는 하나 이상의 경로에서 이의 연계를 특징으로 한다. 또다른 단계에서, 경로 엘리먼트 데이터베이스에 커플링된 변형에 대한 접근법이 제공되고, 변형 엔진은 하나 이상의 연역적으로 공지된 속성으로 제 1 경로 엘리먼트와 연계되는데 사용된다. 또다른 단계에 있어서, 변형 엔진은 하나 이상의 가정 속성으로 제 2 경로 엘리먼트와 연계되는데 사용되며, 추가의 단계에서, 변형 엔진은 교차-상호관련되는데 사용되고 공지된 속성 및 가정 속성 각각을 사용하는 하나 이상의 경로에 대한 제 1 및 제 2 경로 엘리먼트의 영향 수준을 할당하는데 사용되어, 이로써 확률적 경로 모델을 형성한다. 최종적으로, 분석 엔진을 통해 확률적 경로 모델이 사용되어, 환자 샘플의 복수의 엘리먼트에 대해 측정 속성 복수개로부터 특정 경로에 대한 참조 경로 활성 정보를 갖는 DPM 을 유도한다.
가장 바람직하게는, 경로는 조절 경로 네트워크 내에 존재하여, 특히 고려되는 조절 경로 네트워크는 노화 경로 네트워크, 세포자멸 경로 네트워크, 항상성 경로 네트워크, 대사 경로 네트워크, 복제 경로 네트워크 및 면역반응 경로 네트워크를 포함한다. 마찬가지로, 경로는 또한 신호 경로 네트워크 및/또는 다른 경로 네트워크 내에서 존재할 수 있다. 예를 들어, 적합한 신호 경로 네트워크는 칼슘/칼모듈린 의존적 신호 경로 네트워크, 사이토카인 중재 신호 경로 네트워크, 케모카인 중재 신호 경로 네트워크, 성장 인자 신호 경로 네트워크, 호르몬 신호 경로 네트워크, MAP 키나아제 신호 경로 네트워크, 포스파타아제 중재 신호 경로 네트워크, Ras 슈퍼패밀리 중재 신호 경로 네트워크, 및 전사인자 중재 신호 경로 네트워크를 포함한다.
추가의 특히 고려되는 양태에 있어서, 바람직한 경로 엘리먼트는 단백질이다. 예를 들어, 바람직한 단백질은 수용체, 호르몬 결합 단백질, 키나아제, 전사 인자, 메틸라아제, 히스톤 아세틸라아제, 및 히스톤 디아세틸라아제를 포함한다. 바람직한 경로 엘리먼트가 핵산인 경우, 이러한 핵산은 전형적으로 단백질 코딩 서열, 게놈 조절 서열, 조절 RNA 및 트랜스활성 서열을 포함할 것이다.
가장 전형적으로는, 참조 경로 활성 정보는 정상 조직, 질병 조직, 노화 조직 및/또는 회복 조직에 대해 특이적이다. 공지 속성 및 가정 속성은 전형적으로 그리고 독립적으로 화합물 속성, 클래스 속성, 유전자 복사수, 전사 수준, 번역 수준, 또는 단백질 활성이며, 측정 속성은 바람직하게는 돌연변이, 차등 유전자 서열 오브젝트, 유전자 복사수, 전사 수준, 번역 수준, 단백질 활성 및/또는 단백질 상호작용이다.
따라서, 본 발명의 주제의 또다른 양태에 있어서, 본 발명자들은 동적 경로 맵 (DPM) 을 생성하는 방법을 고려하였으며, 이때 하나의 단계에서 복수의 경로 엘리먼트를 포함하는 확률 경로 모델을 저장하는 모델 데이터베이스에 대한 접근법이 제공된다. 상기 언급된 바와 같이, 복수의 경로 엘리먼트의 제 1 수치는 교차-상호관련된 것이고 공지 속성을 기초로 하여 하나 이상의 경로에 대한 인플루언스 수준으로 할당된 것이고, 복수의 경로 엘리먼트의 제 2 수치는 교차-상호관련된 것이고 추정 속성을 기초로 하여 하나 이상의 경로에 대한 인플루언스 수준으로 할당된 것이다. 추가의 단계에서, 환자 샘플의 복수의 엘리먼트에 대해 복수의 측정 수준이 분석 엔진을 통해 사용되어, 확률적 경로 모델을 변형하여 DPM 를 수득하고, 이때 DPM 은 특정 경로에 대해 참조 경로 활성을 갖는다.
이러한 방법에서, 일반적으로 경로가 조절 경로 네트워크, 신호 경로 네트워크 및/또는 별개 경로 네트워크이고/이거나, 경로 엘리먼트가 단백질 (예를 들어, 수용체, 호르몬 결합 단백질, 키나아제, 전사 인자, 메틸라아제, 히스톤 아세틸라아제, 히스톤 디아세틸라아제 등) 또는 핵산 (예를 들어, 게놈 조절 서열, 조절 RNA, 트랜스활성 서열 등) 인 것이 바람직하다. 참조 경로 활성 정보에 대해서, 공지 속성, 가정 속성 및 측정 속성은 상기와 같은 고려사항이 적용된다.
따라서, 상이한 전망으로부터의 관점, 생물학적 관련 정보를 분석하는 방법은 동적 경로 맵 (DPM) 을 저장하는 모델 데이터베이스에 대한 접근법을 제공하는 것을 포함할 수 있으며, 이때 DPM 은 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대해서 복수개의 측정 속성을 갖는 확률 경로 모델의 변형에 의해 생성된다. 또다른 단계에 있어서, 제 2 세포 또는 환자 샘플의 복수개의 엘리먼트에 대한 복수개의 측정 속성이 수득되며, DPM 및 제 2 세포 또는 환자 샘플의 복수개의 엘리먼트에 대한 복수개의 측정 속성이 분석 엔진을 통해 사용되어, 제 2 세포 또는 환자 샘플에 대한 예측 경로 활성 정보를 결정한다.
이러한 방법의 특히 바람직한 양태에 있어서, 제 1 세포 또는 환자 샘플의 복수개의 엘리먼트에 대한 측정 속성은 건강한 세포 또는 조직에 대한 특성, 세포 또는 조직의 특정 나이, 세포 또는 조직의 특정 질병, 세포 또는 조직의 질병 단계, 특정 성별, 특정 민족적 그룹, 특정 직업적 그룹 및/또는 특정 종이다. 더욱이, 제 2 세포 또는 환자 샘플의 복수개의 엘리먼트에 대한 측정 속성은 돌연변이, 차등 유전 서열 목표물, 유전자 복사수, 전사 수준, 번역 수준, 단백질 활성 및/또는 단백질 상호작용을 포함할 것이다.
가장 전형적으로는, 제 1 및 제 2 샘플은 동일한 세포 또는 환자로부터 수득되며, 제 2 세포 또는 환자 샘플의 복수개의 엘리먼트에 대한 복수개의 측정 속성을 수득하기 전에 세포 또는 환자에 대한 치료 (예를 들어, 방사선, 약학 제제 투여) 가 제공될 수 있음을 숙지한다. 고려되는 방법이 약물 문헌에서 사용되는 경우, 치료는 세포에 대한 후보 분자의 투여를 포함함을 숙지한다 (예를 들어, 후보 분자가 후보 분자의 라이브러리의 멤버인 경우).
특히 바람직한 양태에 있어서, 예측 경로 활성 정보는 하나 이상의 경로에서 계층적-우세 엘리먼트로서의 엘리먼트를 확인하고/확인하거나 질병에 대해 하나 이상의 경로에서 질병-결정 엘리먼트로서 엘리먼트를 확인한다. 제시를 촉진하기 위해, 예측 경로 활성 정보의 그래프 제시가 제공될 수 있고/있거나, 치료 추천은 예측 경로 활성 정보를 부분 이상 기초하여 생성될 수 있다. 물론, 예측 경로 활성 정보는 질병에 대한 진단, 예후 예측을 위해 사용될 수 있거나, 치료 선택사항 및/또는 식이 안내로 이루어진 군으로부터 선택되는 권고사항에 대해 사용될 수 있거나, 후생 인자, 스트레스 적합화, 유기체 상태 및/또는 손상 또는 치유 상태로 이루어진 군으로부터 선택되는 권고사항에 대해 사용될 수 있다.
하나의 구현예에서, 본 발명은 하기 단계를 포함하는 동적 경로 맵 (DPM) 의 생성 방법을 제공한다: 복수의 경로 엘리먼트를 저장하는 경로 엘리먼트 데이터베이스에의 엑세스를 제공하는 단계 (상기 각 경로 엘리먼트는 하나 이상의 경로에의 관여를 특징으로 함); 상기 경로 엘리먼트 데이터베이스에 커플링된 변형 엔진에 대한 엑세스를 제공하는 단계; 상기 변형 엔진을 사용하여 제 1 경로 엘리먼트를 하나 이상의 선험적 기지의 속성과 연관시키는 단계; 상기 변형 엔진을 사용하여 제 2 경로 엘리먼트를 하나 이상의 가정된 속성과 연관시키는 단계; 상기 기지의 속성 및 가정된 속성을 각각 사용하여 하나 이상의 경로에 대한 제 1 및 제 2 경로 엘리먼트의 영향 레벨을 서로-상관시키고 지정하도록 상기 변형 엔진을 사용하여, 확률적 경로 모델을 형성하는 단계; 및 상기 확률적 경로 모델을 사용하여, 분석 엔진을 통해 환자 샘플의 복수의 엘리먼트들에 대한 복수의 측정된 속성들로부터 특정 경로에 대한 참조 경로 활성 정보를 갖는 상기 DPM 을 도출하는 단계. 하나의 바람직한 구현예에서, 경로 엘리먼트는 단백질이다. 더욱 바람직한 구현예에서, 상기 단백질은 수용체, 호르몬 결합 단백질, 키나아제, 전사 인자, 메틸라아제, 히스톤 아세틸라아제, 및 히스톤 디아세틸라아제로 이루어진 군으로부터 선택된다. 대안적인 바람직한 구현예에서, 경로 엘리먼트는 핵산이다. 더욱 바람직한 구현예에서, 핵산은 단백질 코딩 서열, 게놈 조절 서열, 조절 RNA, 및 트랜스-활성화 서열로 이루어진 군으로부터 선택된다. 더욱 바람직한 다른 구현예에서, 참조 경로 활성 정보는 정상 조직, 이환 조직, 노화 조직, 또는 회복 조직에 대해 특이적이다. 바람직한 구현예에서, 기지의 속성은 화합물 속성, 클래스 속성, 유전자 카피 수, 전사 레벨, 번역 레벨, 및 단백질 활성으로 이루어진 군으로부터 선택된다. 다른 바람직한 구현예에서, 가정된 속성은 화합물 속성, 클래스 속성, 유전자 카피 수, 전사 레벨, 번역 레벨, 및 단백질 활성으로 이루어진 군으로부터 선택된다. 다른 대안적인 구현예에서, 측정된 속성은 돌연변이, 차등 유전자 서열 대상, 유전자 카피 수, 전사 레벨, 번역 레벨, 단백질 활성, 및 단백질 상호작용으로 이루어진 군으로부터 선택된다. 바람직한 구현예에서, 상기 경로는 조절 경로 네트워크 이내에 있다. 더욱 바람직한 구현예에서, 조절 경로 네트워크는 노화 경로 네트워크, 세포자멸사 경로 네트워크, 항상성 경로 네트워크, 대사 경로 네트워크, 복제 경로 네트워크, 및 면역 반응 경로 네트워크로 이루어진 군으로부터 선택된다. 더 더욱 바람직한 구현예에서, 경로는 신호화 경로 네트워크 이내에 있다. 더 더욱 바람직한 대안적인 구현예에서, 경로는 별개의 경로 네트워크의 네트워크 이내에 있다. 가장 바람직한 구현예에서, 신호화 경로 네트워크는 칼슘/칼모듈린 의존적 신호화 경로 네트워크, 사이토카인 매개 신호화 경로 네트워크, 케모카인 매개 신호화 경로 네트워크, 성장 인자 신호화 경로 네트워크, 호르몬 신호화 경로 네트워크, MAP 키나아제 신호화 경로 네트워크, 포스파타아제 매개 신호화 경로 네트워크, Ras 수퍼패밀리 매개 신호화 경로 네트워크, 및 전사 인자 매개 신호화 경로 네트워크로 이루어진 군으로부터 선택된다.
본 발명은 또한 하기 단계를 포함하는 동적 경로 맵 (DPM) 의 생성 방법을 제공한다: 복수의 경로 엘리먼트를 포함하는 확률적 경로 모델을 저장하는 모델 데이터베이스에 엑세스를 제공하는 단계; 제 1 다수의 복수의 경로 엘리먼트는 기지의 속성을 기준으로 하나 이상의 경로에 대한 영향 레벨을 서로-상관시키고 지정시키고; 제 2 다수의 복수의 경로 엘리먼트는 가정된 속성을 기준으로 하나 이상의 경로에 대한 영향 레벨을 서로-상관시키고 지정시킴; 및 확률적 경로 모델을 변형시키기 위해 분석 엔진을 통해 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 사용하여 DPM 을 수득하는 단계, 상기 DPM 은 특정 경로에 대한 참조 경로 활성 정보를 가짐.
하나의 바람직한 구현예에서, 경로가 조절 경로 네트워크, 신호화 경로 네트워크, 및 별개의 경로 네트워크들의 네트워크 이내에 있다. 다른 바람직한 구현예에서, 경로 엘리먼트가 수용체, 호르몬 결합 단백질, 키나아제, 전사 인자, 메틸라아제, 히스톤 아세틸라아제, 및 히스톤 디아세틸라아제로 이루어진 군으로부터 선택되는 단백질이고, 핵산은 게놈 조절 서열, 조절 RNA, 및 트랜스-활성화 서열로 이루어진 군으로부터 선택된다. 추가의 더욱 바람직한 구현예에서, 참조 경로 활성 정보는 정상 조직, 이환 조직, 노화 조직, 또는 회복 조직에 관해 특이적이다. 다른 바람직한 구현예에서, 기지의 속성은 화합물 속성, 클래스 속성, 유전자 카피 수, 전사 레벨, 번역 레벨, 및 단백질 활성으로 이루어진 군으로부터 선택된다. 다른 바람직한 구현예에서, 가정된 속성은 화합물 속성, 클래스 속성, 유전자 카피 수, 전사 레벨, 번역 레벨, 및 단백질 활성으로 이루어진 군으로부터 선택된다. 추가의 더욱 바람직한 구현예에서, 측정된 속성은 돌연변이, 차등 유전자 서열 대상, 유전자 카피 수, 전사 레벨, 번역 레벨, 단백질 활성, 및 단백질 상호작용으로 이루어진 군으로부터 선택된다.
본 발명은 추가로, 하기 단계를 포함하는 생물학적 관련 정보의 분석 방법을 제공한다: 동적 경로 맵 (DPM) 를 저장하는 모델 데이터베이스에 어세스를 제공하는 단계 (상기 DPM 은 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 갖는 확률적 경로 모델의 변형에 의해 생성됨); 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 수득하는 단계; 및 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성 및 DPM 을 사용하여, 분석 엔진을 통해, 제 2 세포 또는 환자 샘플에 대한 예상되는 경로 활성 정보를 결정하는 단계. 하나의 바람직한 구현예에서, 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 측정된 속성이 건강한 세포 또는 조직, 세포 또는 조직의 특정 연령, 세포 또는 조직의 특이 질환, 이환된 세포 또는 조직의 특이 질환 단계, 특정 성별, 특정 민족군, 특정 직업군, 및 특정 종에 대해 특유하다. 다른 바람직한 구현예에서, 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 측정된 속성이 돌연변이, 차등 유전자 서열 대상, 유전자 카피 수, 전사 레벨, 번역 레벨, 단백질 활성, 및 단백질 상호작용으로 이루어진 군으로부터 선택된다. 대안적인 바람직한 구현예에서, 제 1 및 제 2 샘플이 동일한 세포 또는 환자로부터 수득되고, 세포 또는 환자에 치료를 제공한 후 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 수득한다. 더욱 바람직한 구현예에서, 치료가 방사선, 환자에 제약 투여, 및 상기 세포에 후보 분자 투여로 이루어진 군으로부터 선택된다. 더욱 바람직한 다른 구현예에서, 후보 분자는 후보 분자의 라이브러리의 일원이다. 다른 바람직한 구현예에서, 예상되는 경로 활성 정보가 하나 이상의 경로에서 계층적-우성 엘리먼트로서 엘리먼트를 확인한다. 더욱 바람직한 구현예에서, 예상되는 경로 활성 정보가 질환에 관한 하나 이상의 경로에서 질환-결정적 엘리먼트로서 엘리먼트를 확인한다. 대안적인 구현예에서, 상기 방법이 예상되는 경로 활성 정보의 그래픽 표현을 생성하는 단계를 추가로 포함한다. 대안적인 구현예에서, 상기 방법이 예상되는 경로 활성 정보에 적어도 부분적으로 기초한 치료 권고를 생성하는 단계를 추가로 포함한다. 대안적인 구현예에서, 상기 방법이 예상되는 경로 활성 정보를 사용하여 진단, 질환의 예후, 또는 치료 옵션의 선택, 및 식사 지침으로 이루어진 군으로부터 선택되는 권고를 공식화하는 단계를 추가로 포함한다. 대안적인 구현예에서, 상기 방법이 예상되는 경로 활성 정보를 사용하여 유전자 외적 인자, 스트레스 적응, 유기체의 상태, 및 회복 또는 치유 상태를 확인하기 단계를 추가로 포함한다.
다른 구현예에서, 본 발명은 하기 단계를 포함하는, 필요로 하는 개체의 임상 결과를 예측하기 위해 통합 경로 활성 (IPAs) 의 매트릭스의 생성을 위한 변형 방법을 제공한다: (i) 큐레이트된 경로의 세트를 제공하는 단계 (상기 경로는 복수의 독립체를 포함함); (ii) 각 큐레이트된 경로를 별개의 확률적 그래프 모델 (PGM) 로 전환시키는 단계 (상기 PGM 은 각 큐레이트된 경로의 인자 그래프로부터 도출됨), (iii) 개체의 생물학적 샘플을 제공하는 단계 (상기 생물학적 샘플은 큐레이트된 경로들 중 하나에 포함된 하나 이상의 내인성 독립체를 포함함); (iv) 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계; (v) 내인성 독립체의 레벨을 다른 개체의 미리 측정된 대조군 샘플에서의 독립체의 레벨과 비교하는 단계; (vi) 대조 독립체 레벨에 대한 내인성 독립체의 레벨이 활성화, 정상 또는 비활성화되는 것인지를 측정하는 단계; (vii) 내인성 독립체에 수적 상태를 지정하는 단계 (상기 활성화된 것을 나타내는 상태는 +1 이고, 정상 활성을 나타내는 상태는 0 이고, 비활성화된 것을 나타내는 상태는 -1 임); (viii) 다른 내인성 독립체에 대해 (vi) 를 통해 단계 ii 를 반복하는 단계; (x) 각 내인성 독립체의 수적 상태를 통합 경로 활성 (IPA) 의 매트릭스로 컴파일링하는 단계, (x) 통합 경로 활성의 매트릭스가 A 이고, Aij 는 생물학적 샘플 j 에서의 독립체 i 의 추론된 활성을 나타냄; 개체에 대한 임상 결과를 예측하기 위한 통합 경로 활성의 매트릭스를 야기한다.
하나의 구현예에서, IPA 의 매트릭스의 생성 방법은 필요한 개체에게 임상 결과를 예측하고, 진단을 제공하고, 치료를 제공하고, 치료를 전달하고, 치료를 실시하고, 치료를 수행하고, 치료를 관리하고, 또는 치료를 분배하는 것을 포함한다. 다른 구현예에서, 큐레이트된 경로 세트는 인간 생태의 분석 유래이다. 또 다른 대안적인 구현예에서, 큐레이트된 경로 세트는 비인간 생태의 분석 유래이다. 다른 구현예에서, 대조 독립체 레벨에 비례한 내인성 독립체의 레벨의 측정은 스튜던트 t-검정을 사용하여 수행된다. 대안적인 구현예에서, 대조 독립체 레벨에 비례한 내인성 독립체의 레벨의 측정은 ANOVA 를 사용하여 수행된다. 다른 구현예에서, 변환 방법은 하나 초과의 개체로부터의 통합 경로 활성의 복수의 매트릭스가 결합되고, 결합된 복수의 매트릭스가 군집을 생성하고, 생성된 군집의 개체 매트릭스들 간의 거리가 측정되는 단계들을 포함한다. 하나의 구현예에서, 측정된 거리는 K-평균 군집 분석을 사용하여 분석된다. 다른 대안적인 구현예에서, 측정된 거리는 K2-평균 군집 분석을 사용하여 분석된다. 또 다른 구현예에서, 변환 방법은 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하고, 항체를 갖는 내인성 독립체를 검출하여, 내인성 독립체의 레벨을 측정하는 단계를 포함한다. 대안적인 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 핵산 프로브를 이용하여 내인성 독립체를 검출하여 내인성 독립체의 레벨을 측정하는 단계를 포함한다. 다른 대안적인 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 유기 시약을 이용하여 내인성 독립체를 검출하는 단계를 포함하는 것으로서, 상기 유기 시약이 내인성 독립체에 결합하여 검출성 신호를 생성하고 내인성 독립체의 레벨을 측정한다.
다른 추가의 대안적인 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 무기 시약을 이용하여 내인성 독립체를 검출하는 단계를 포함하는 것으로서, 상기 무기 시약이 내인성 독립체에 결합하여 검출성 신호를 생성하고 내인성 독립체의 레벨을 측정한다. 다른 대안적인 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 유기 시약을 이용하여 내인성 독립체를 검출하는 단계를 포함하는 것으로서, 상기 유기 시약이 내인성 독립체와 반응하여 검출성 신호를 생성하고 내인성 독립체의 레벨을 측정한다.
다른 대안적인 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 무기 시약을 이용하여 내인성 독립체를 검출하는 단계를 포함하는 것으로서, 상기 무기 시약은 내인성 독립체와 반응하여 검출성 신호를 생성하고 내인성 독립체의 레벨을 측정한다. 바람직한 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 내인성 독립체에 대한 최적 파장에서 내인성 독립체의 흡광도를 측정하여 내인성 독립체의 레벨을 측정하는 단계를 포함한다. 대안적인 바람직한 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 내인성 독립체에 대한 최적 파장에서 내인성 독립체의 형광을 측정하여 내인성 독립체의 레벨을 측정하는 것을 포함한다. 추가의 대안적인 더욱 바람직한 구현예에서, 생물학적 샘플에서의 내인성 독립체의 레벨을 측정하는 단계는 내인성 독립체를 효소와 반응시키는 단계를 포함하는 것으로서, 상기 효소가 내인성 독립체를 선택적으로 소화시켜서 하나 이상의 생성물을 생성시키고, 하나 이상의 생성물을 검출하여, 내인성 독립체의 레벨을 측정한다. 더욱 바람직한 구현예에서, 내인성 독립체를 효소와 반응시키는 단계는 결과적으로 둘 이상의 생성물을 생성시킨다. 더 더욱 바람직한 구현예에서, 내인성 독립체를 효소와 반응시켜 결과적으로 둘 이상의 생성물을 생성시키는 단계에 이어서, 상기 생성물을 다른 효소로 처리하는 단계가 있고, 상기 효소는 생성물의 하나 이상을 선택적으로 소화시켜서 적어도 세번째 생성물을 생성하고, 상시 적어도 세번째 생성물을 검출하여 내인성 독립체의 레벨을 측정한다.
다른 바람직한 구현예에서, 개체는 건강한 개체, 증상이 없는 개체, 및 증상을 보이는 개체로 이루어진 군으로부터 선택된다. 더욱 바람직한 구현예에서, 개체는 질환 및 장애로 이루어진 군으로부터 선택되는 상태를 갖는 것으로 진단된 개체로 이루어진 군으로부터 선택된다. 바람직한 구현예에서, 상기 상태는 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 전립성 비대증, 기관지염, 체디아크-히가시 증후군, 담낭염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 만성 육아종 질환, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다낭성 난소 증후군, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 중증복합면역결핍증 (SCID), 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염; 및 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암, 정좌불능증, 알츠하이머병, 기억상실증, 루게릭병 (ALS), 운동 실조증, 조울증, 긴장증, 뇌성마비, 뇌혈관 질환, 크로이츠펠트-야콥병, 치매, 우울증, 다운 증후군, 지연성 운동장애, 긴장 이상, 뇌전증, 헌팅턴병, 다발성 경화증, 근이영양증, 신경통, 신경섬유종증, 신경병증, 파킨슨병, 피크병, 망막색소변성증, 정신분열증, 계절성 정서장애, 노인성 치매, 뇌졸중, 투렛 증후군 및 특히 뇌의 선암, 흑색종, 및 기형암종을 포함하는 암으로 이루어진 군으로부터 선택된다. 대안적인 바람직한 구현예에서, 상기 상태는 상태는 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 트라우마, 브루톤의 X-상관관계 무감마글로불린혈증, 공통가변성 면역결핍증 (CVI), 디죠지 증후군 (흉선형성부전), 흉선 형성이상, 단독성 IgA 결핍, 중증복합면역결핍증 (SCID), 혈소판감소증 및 습진을 갖는 면역결핍 (비스코트-알드리히 증후군), 체디아크-히가시 증후군, 만성 육아종 질환, 유전성 결관신경 부종, 및 쿠싱병과 관련된 면역결핍; 및 발달 장애, 예컨대 신세뇨관 산증, 빈혈, 쿠싱 증후군, 연골무형성 왜소증, 뒤시엔느 및 베커 근이영양증, 뇌전증, 생식샘 발생장애, WAGR 증후군 (빌름스 종양, 무홍채증, 비뇨 생식기 기형, 및 정신 지체), 스미스-마제니스 증후군, 골수이형성 증후군, 유전성 점막표피 이형성, 유전성 각피증, 유전성 신경병증, 예컨대 샤르코-마리-투스병 및 신경섬유종증, 갑상선 기능 저하증, 수두증, 발작 장애, 예컨대 시드남 무도증 및 뇌성마비, 척추파열, 무뇌증, 두개척추파열, 선천성 녹내장, 백내장, 감음 신경성 청력 손실, 및 대상의 임의의 조직, 기관, 또는 계, 예를 들어, 뇌, 부신, 신장, 골격 또는 생식계를 포함하는 세포 성장 및 분화, 배아발생, 및 형태발생과 관련된 임의의 장애로 이루어진 군으로부터 선택된다. 다른 바람직한 구현예에서, 상태는 내분비 장애, 예컨대 성선기능저하증, 시한 증후군, 요붕증, 칼라만병, 핸드-쉴러-크리스찬병, 렛테러-시웨병, 유육종증, 공터기안 증후군, 및 왜소증을 포함하는 뇌하수체 기능저하증과 관련된 장애; 말단비대증, 거인증, 및 부적합 항이뇨 호르몬 (ADH) 의 증후군분비 (SIADH) 을 포함하는 뇌하수체기능항진증; 및 갑상선종을 포함하는 갑상선 기능 저하증, 점액수종, 박테리아 감염과 관련된 급성 갑상선염, 바이러스 감염과 관련된 아급성 갑상선염, 자가면역성 갑상선염 (하시모토병), 및 크레틴병과 관련된 장애; 갑상선 중독증 및 이의 다양한 형태를 포함하는 갑상선 기능 항진증, 그레이브스병, 전경골 점액수종, 중독성 다결절 갑상선종, 갑상선암, 및 플러머병과 관련된 장애; 및 콘 질환 (만성 고칼륨혈증) 을 포함하는 부갑상선 기능항진증과 관련된 장애; 호흡기 장애, 예컨대 알레르기, 천식, 급성 및 만성 염증성 폐질환, ARDS, 폐기종, 폐울혈 및 부종, COPD, 간질성 폐질환, 및 폐암; 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 및 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 및 트라우마로 이루어진 군으로부터 선택된다.
본 발명은 또한 매트릭스 A 가 임상 결과와의 관계를 확인하기 위해 원래 구성성분 데이터세트 대신 사용될 수 있는 본원에 개시된 변환 방법을 제공한다. 더욱 바람직한 구현예에서, 큐레이트된 경로는 생화학 경로, 유전 경로, 대사 경로, 유전자 조절 경로, 유전자 전사 경로, 유전자 번역 경로로 이루어진 군으로부터 선택된다. 더욱 바람직한 다른 구현예에서, 독립체는 핵산, 펩티드, 단백질, 펩티드 핵산, 탄수화물, 지질, 프로테오글리칸, 인자, 보조인자, 생화학적 대사물질, 유기 조성물, 무기 조성물, 및 염으로 이루어진 군으로부터 선택된다. 또 다른 바람직한 구현예에서, 생물학적 샘플은 환자 샘플, 대조 샘플, 실험적으로 처리된 동물 샘플, 실험적으로 처리된 조직 배양 샘플, 실험적으로 처리된 세포 배양 샘플, 및 실험적으로 처리된 생체외 생화학 조성물 샘플로 이루어진 군으로부터 선택된다. 더욱 바람직한 구현예에서, 생물학적 샘플은 환자 샘플이다.
본 발명은 또한 환자 샘플에서 변화되는 분자 경로를 뜻하는 출력을 갖는 확률적 그래프 모델 (PGM) 체계를 제공하고, 상기 PGM 은 복수의 인자 그래프를 포함하고, 상기 인자 그래프는 통합된 생물학적 데이터세트를 나타내며, 환자 샘플에서 변화되는 추론된 분자 경로는 데이터로부터 기지된 분자 경로를 포함하고, 상기 분자 경로는 임상적 또는 비임상적 상태 결과를 초래하고, 상기 추론된 분자 경로는 임상 요법 또는 치료에 의해 조절되는 것으로 알려져 있고, 상기 출력은 임상적 요법을 나타낸다. 바람직한 구현예에서, 데이터는 실험 데이터, 임상 데이터, 역학적 데이터, 및 현상학적 데이터로부터 선택된다. 다른 바람직한 구현예에서, 상태는 질환 및 장애로 이루어진 군으로부터 선택된다. 더욱 바람직한 구현예에서, 상태는 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 전립성 비대증, 기관지염, 체디아크-히가시 증후군, 담낭염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 만성 육아종 질환, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다낭성 난소 증후군, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 중증복합면역결핍증 (SCID), 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염; 및 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 특히 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암, 정좌불능증, 알츠하이머병, 기억상실증, 루게릭병 (ALS), 운동 실조증, 조울증, 긴장증, 뇌성마비, 뇌혈관 질환, 크로이츠펠트-야콥병, 치매, 우울증, 다운 증후군, 지연성 운동장애, 긴장 이상, 뇌전증, 헌팅턴병, 다발성 경화증, 근이영양증, 신경통, 신경섬유종증, 신경병증, 파킨슨병, 피크병, 망막색소변성증, 정신분열증, 계절성 정서장애, 노인성 치매, 뇌졸중, 투렛 증후군 및 특히 뇌의 선암, 흑색종, 및 기형암종을 포함하는 암으로 이루어진 군으로부터 선택된다. 더욱 바람직한 대안적인 구현예에서, 상태는 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 트라우마, 브루톤의 X-상관관계 무감마글로불린혈증, 공통가변성 면역결핍증 (CVI), 디죠지 증후군 (흉선형성부전), 흉선 형성이상, 단독성 IgA 결핍, 중증복합면역결핍증 (SCID), 혈소판감소증 및 습진을 갖는 면역결핍 (비스코트-알드리히 증후군), 체디아크-히가시 증후군, 만성 육아종 질환, 유전성 결관신경 부종, 및 쿠싱병과 관련된 면역결핍; 및 발달 장애, 예컨대 신세뇨관 산증, 빈혈, 쿠싱 증후군, 연골무형성 왜소증, 뒤시엔느 및 베커 근이영양증, 뇌전증, 생식샘 발생장애, WAGR 증후군 (빌름스 종양, 무홍채증, 비뇨 생식기 기형, 및 정신 지체), 스미스-마제니스 증후군, 골수이형성 증후군, 유전성 점막표피 이형성, 유전성 각피증, 유전성 신경병증, 예컨대 샤르코-마리-투스병 및 신경섬유종증, 갑상선 기능 저하증, 수두증, 발작 장애, 예컨대 시드남 무도증 및 뇌성마비, 척추파열, 무뇌증, 두개척추파열, 선천성 녹내장, 백내장, 감음 신경성 청력 손실, 및 대상의 임의의 조직, 기관, 또는 계, 예를 들어, 뇌, 부신, 신장, 골격 또는 생식계를 포함하는 세포 성장 및 분화, 배아발생, 및 형태발생과 관련된 임의의 장애로 이루어진 군으로부터 선택된다. 또 다른 더욱 바람직한 구현예에서, 상태는 내분비 장애, 예컨대 성선기능저하증을 포함하는 뇌하수체 기능저하증과 관련된 장애, 시한 증후군, 요붕증, 칼라만병, 핸드-쉴러-크리스찬병, 렛테러-시웨병, 유육종증, 공터기안 증후군, 및 왜소증; 말단비대증, 거인증, 및 부적합 항이뇨 호르몬 (ADH) 분비 증후군 (SIADH) 을 포함하는 뇌하수체기능항진증; 및 갑상선종을 포함하는 갑상선 기능 저하증, 점액수종, 박테리아 감염과 관련된 급성 갑상선염, 바이러스 감염과 관련된 아급성 갑상선염, 자가면역성 갑상선염 (하시모토병), 및 크레틴병과 관련된 장애; 갑상선 중독증 및 이의 다양한 형태를 포함하는 갑상선 기능 항진증, 그레이브스병, 전경골 점액수종, 중독성 다결절 갑상선종, 갑상선암, 및 플러머병과 관련된 장애; 및 콘 질환 (만성 고칼륨혈증) 을 포함하는 부갑상선 기능항진증과 관련된 장애; 호흡기 장애, 예컨대 알레르기, 천식, 급성 및 만성 염증성 폐질환, ARDS, 폐기종, 폐울혈 및 부종, COPD, 간질성 폐질환, 및 폐암; 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 및 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 및 트라우마로 이루어진 군으로부터 선택된다.
도 1 은 PARADIGM 방법의 개요를 나타낸다. PARADIGM 은 추가의 다운스트림 분석을 위해 사용될 수 있는 유전자 활성을 추론하기 위한 기능적 게놈 데이터를 갖는 경로 개략도를 사용한다. TCGA GBM 데이터에서의 NCI 경로 상호작용. 모든 (n=462) 쌍의 경우 A 가 NCI-Nature Pathway Database 에서 유전자 B 의 업스트림 활성자인 것으로 밝혀졌고, TCGA GBM 데이터로부터 계산되는 피어슨 상관계수 (x-축) 는 두 개의 상이한 방식으로 연산되었다. 상기 히스토그램은 A 의 카피수와 B 의 발현 간의 상관관계 (C2E, 적색 실선) 및 A 의 발현과 B 의 발현 간의 상관관계 (E2E, 청색 실선) 를 나타낸다. 상기 무작위 한쌍의 유전자들 간의 상관관계 히스토그램은 C2E (적색 점선) 및 E2E (청색 점선) 을 나타낸다. 화살표는 C2E (적색) 및 E2E (청색) 상관관계에 대해 발견된 양의 상관관계의 풍부를 가리킨다.
도 2 는 유전 경로 다이어그램의 PARADIGM 모델로의 전환을 나타낸다. PARADIGM 방법의 개요. PARADIGM 은 추가의 다운스트림 분석을 위해 사용될 수 있는 유전자 활성을 추론하기 위한 기능적 게놈 데이터을 갖는 경로 개략도를 사용한다. A. 단일 환자에 대한 데이터는 DNA 카피, mRNA 및 단백질 레벨, 및 단백질의 활성을 나타내는 유전자에 대한 4 개의 상이한 생물학적 독립체 세트를 사용하여 단일 유전자에 대해 통합된다. B. PARADIGM 모델 표적으로의 전사 인자를 포함하는 유전자들 간의 여러 유형의 상호작용 (상부-왼쪽), 복합체에서 응집하는 서브유닛 (상부-오른쪽), 후-번역 변형 (하위-왼쪽), 및 이중화 기능을 수행하는 패밀리에서의 유전자 세트 (하위-오른쪽). C. 상기 모델에서 나타낸 바와 같은 P53, 저해자 MDM2, 및 고레벨 과정, 세포자멸사를 포함하는 작은 서브-경로의 모형예.
도 3 은 The Cancer Genome Atlas (TCGA) 프로젝트 (http://cancergenome.nih.gov) 다형성 교모세포종 (GMB) 데이터에서 예시적인 NCI 경로 상호작용을 나타낸다. 모든 (n=462) 쌍의 경우 A 가 NCI-Nature Pathway Database 에서 유전자 B 의 업스트림 활성자인 것으로 밝혀졌고, TCGA GBM 데이터로부터 계산되는 피어슨 상관계수 (x-축) 는 두 개의 상이한 방식으로 연산되었다. 상기 히스토그램은 A 의 카피수와 B 의 발현 간의 상관관계 (C2E, 적색 실선) 및 A 의 발현과 B 의 발현 간의 상관관계 (E2E, 청색 실선) 로 구성되어 있다. 상기 무작위 한쌍의 유전자들 간의 상관관계 히스토그램은 C2E (적색 점선) 및 E2E (청색 점선) 으로 나타냈다. 화살표는 C2E (적색) 및 E2E (청색) 상관관계에 대해 발견된 양의 상관관계의 풍부를 가리킨다.
도 4 는 항세포자멸사적 세린-트레오닌 키나아제 1 (AKTI) 에 대한 예시적인 학습 매개변수를 나타낸다. 통합 경로 활성 (IPA) 은 수렴까지 기대치-최대화 (Expectation-Maximization, EM) 알고리즘의 각 반복에서 보여진다. 점들은 순열배치된 샘플의 IPA 를 나타내고, 원들은 실제 샘플의 IPA 를 나타낸다. 적색 선은 실제 샘플의 평균 IPA 를 나타내고 녹색 선은 공 샘플의 평균 IPA 를 나타낸다.
도 5 는 PARADIGM 및 신호화 경로 영향 분석 (SPIA) 을 이용하여 미끼와 실제 경로의 구별을 나타낸다. 경로에서 각 유전자에 신규 유전자 명칭을 지정함으로써 미끼 경로를 생성하였다. PARADIGM 및 SPIA 는 모든 경로의 교란를 계산하기 위해 사용되었다. 각각의 선은 교란 순위를 사용하여 실제와 미끼 경로를 구별하기 위한 수용체-동작 특성을 보여준다. 유방암에서, 예를 들어, 곡선 아래 면적 (AUC) 은 PARADIGM 및 SPIA 에 대해 0.669 및 0.602 를 각각 나타낸다. 다형성 교모세포종 (GBM) 에서, AUC 는 0.642 및 0.604 를 각각 나타낸다.
도 6 은 유방암에서 Akt 에 의해 매개되는 클래스 I 포스파티딜이노시톨-3-키나아제 (PI3K) 신호화 이벤트에 대한 순열배치된 샘플 내에서와 비교되는 예시적인 환자 샘플 IPA 를 나타낸다.
생물학적 독립체를 환자 샘플의 평균 IPA (적색) 에 의해 분류하였고, 순열배치된 샘플의 평균 IPA 와 비교하였다. 각 평균 주변의 유색 부분은 각 세트의 표준 편차 (SD) 를 나타낸다. 오른쪽의 IPA 는 AKT1, CHUK, 및 MDM2 를 포함한다.
도 7 은 ErbB2 경로의 예시적인 CIRCLEMAP 표시를 나타낸다. 각 노드에 있어서, 에스트로겐 수용체 (ER) 상태, IPA, 발현 데이터, 및 카피-수 데이터는 가장 안쪽에서부터 가장 바깥쪽까지 동심원으로서 각각 표시된다. 세포자멸사 노드 및 ErbB2/ErbB3/뉴레귤린 2 복합체 노드는 상기 독립체들의 직접적인 관찰이 없기 때문에 오로지 ER 상태 및 IPA 에 대한 원을 갖는다. 각 환자의 데이터는 원 중심에서부터 말단까지의 하나의 각을 따라 표시된다.
도 8 은 TCGA GBM 에 대한 IPA 의 예시적인 군집화를 나타낸다. 각 가로줄은 단일 샘플에 해당하고, 각 세로줄은 생체분자의 독립체에 해당한다. 계층적 군집 트리 아래의 유색의 막대는 도 9 에서 사용되는 군집을 나타낸다.
도 9 는 도 8 의 군집들에 대한 카플란-마이어 (Kaplan-Meier) 생존 플롯을 나타낸다.
도 10 은 세포주가 치료 화합물에 대한 광범위한 반응을 나타내는 것을 나타낸다. A. 루미날 및 ERBB2AMP 세포주는 우선적으로 AKT 저해에 대해 반응한다. 각 막대는 시그마 AKT 1-2 저해자에 대한 단일 유방암 세포주의 반응을 나타낸다. 세포주는 감수성 (-log10(GI50)) 의 증가에 따라 배열되고, 아류형에 따라 유색화된다. B. 유사한 매커니즘을 갖는 화합물에 대한 GI50 값은 매우 밀접하게 연관되어 있다. 열지도는 다양한 화합물로 처리된 유방암 세포주 반응들 간의 상관관계의 계층적 군집을 나타낸다. C. 유사한 작용 양식을 갖는 화합물은 세포주 패널에 걸친 유사한 반응의 패턴을 보여준다. 각 컬럼은 하나의 세포주를 나타내고, 각 열은 시험된 화합물을 나타낸다. GI50 값은 계층적 군집화된다. 유의한 아류형 효과를 갖는 화합물만이 포함된다. 동일한 화합물에 대해 반응성임을 나타내는 유사한 아류형의 세포주는 함께 군집을 이루는 경향이 있다. 회색은 결측 값을 나타낸다. D. CNA 는 감수성과 관련된다. 박스플롯은 언급된 게놈 위치에서 비정상적 (A) 및 정상 (N) 카피 수를 갖는 세포주에 대한 반응 감수성의 분포를 보여준다. 약물 반응 및 CNA 간의 연관에 대한 FDR p 값이 언급되어 있다. a. 9p21 (CDKN2A) 결손은 익사베필론, 비노렐빈 및 파스카플리신에 대한 반응과 연관된다. b. 20q13 (STK15/AURKA) 증폭은 VX-680 및 GSK1070916 과 관련된다. c. 11q13 (CCND1) 에서의 증폭은 카보플라틴 및 GSK1070916 에 대한 반응과 연관된다.
도 11 은 세포주 및 TCGA 샘플 둘 모두의 비이중화 PARADIGM 활성의 열지도을 보여준다. 군집 덴드로그램은 샘플간의 유클리디안 거리를 나타내고, 아이젠 군집 (Eisen Cluster) 을 사용하여 생성되었고 자바 트리뷰 (Java Treeview) 를 사용하여 그렸다. 덴드로그램 아래의 유색 막대는 아류형 샘플 (상부) 및 코호트 샘플 (하부) 을 나타낸다.
도 12 은 세포주 아류형이 독특한 네트워크 구조를 갖는 것을 설명한다. 모든 패널에서, 그래프의 각 노드는 단백질 (원형), 다중결합 복합체 (육각형), 또는 추상적인 세포 과정 (사각형) 에 상응하는 상이한 경로 "개념" 을 나타낸다. 더 큰 노드가 비-기저 세포주에 비해 기저 세포주에 더 깊이 관련된 활성을 갖는 경로 개념에 해당하도록, 노드의 크기는 차별적 활성 점수에 비례하여 그렸다. 색은 개념이 기저 아류형과 정의 상관관계 (적색) 또는 역의 상관관계 (청색) 에 있는지를 나타낸다. 연결은 단백질-단백질 레벨 상호작용 (점선) 및 전사 (실선) 를 포함하는 상이한 상호작용을 나타낸다. 상호작용은 차별적 활성의 절대 레벨이 평균 절대 레벨보다 높은 개념을 서로 연결하는 경우에만 지도에 포함되었다. A. MYC/MAX 및 ERK1/2 서브네트는 기저 유방암 세포주에서 우선적으로 활성화된다. B. CTTNB1 네트워크는 클라우딘이 낮은 세포주에서 활성화된다. C. FOXA1/FOXA2 네트워크는 루미날 아류형에서 상향조절된다. D. ERBB2AMP 아류형은 RPS6KB1 경로의 하향 조절을 나타낸다.
도 13 은 경로 다이어그램이 요법에 대한 반응을 예측하기 위해 어떻게 사용될 수 있는지를 나타낸다. A. 상부 패널. 기저 유방암 세포주가 DNA 손상제 시스플라틴에 우선적으로 반응한다. 하부 패널. 기저 세포주는 DNA 손상 반응과 관련된 경로에서 향상된 활성을 보여주면서 시스플라틴이 상기 세포주에서 작용함으로써 가능한 메커니즘을 제공한다. B. 상부 패널. ERBB2AMP 세포주는 HSP90 저해자 겔다나마이신에 대해 감수성이다. 하부 패널. ERBB2-HSP90 네트워크는 ERBBP2AMP 세포주에서 상향조절된다. C. 상부 패널. ERBB2AMP 세포주는 오로라 키나아제 저해자 VX-680 에 내성이다. 하부 패널. 내성은 AURKB 및 CCNB1 의 공동-조절을 통해 매개될 수 있다. 도 12 에서와 같은 규칙.
도 14 는 유방암 세포주의 게놈 및 전사 프로파일의 예를 나타낸다. A. 43 개의 유방암 세포주에 대한 DNA 카피 수 이상은 y-축에는 GISTIC 분석의 log10(FDR) 이 있고 x-축에는 염색체 위치가 있는 플롯으로 구성된다. 카피 수 증가는 붉은 색의 양의 log10(FDR) 으로 나타냈고, 손실은 초록색의 음의 log10(FDR) 으로 나타냈다. B. 유전자 발현 표시에 기초하는 3 개의 (클라우딘-낮음, 루미날, 기저) 군집을 나타내는 55 개의 유방암 세포주에 대한 계층적 교감 군집화 매트릭스. 각 세포주 조합의 경우, 색 강도는 교감에 비례적이다.
도 15 는 GI50 계산이 고도의 재현가능하다는 것을 나타낸다. A. 각각의 막대는 반복된 약물/세포주 조합의 빈도수이다. 대부분의 세포주는 특정 화합물에 대해 오로지 1 회 시험 되었지만 일부 약물/세포주 조합은 다회 시험되었다. B. 각 박스플롯은 3 또는 4 회 반복검증된 약물/세포주 쌍에 대한 중앙 평균 편차의 분포를 나타낸다.
도 16 은 배가 시간이 세포주 아류형에 대해 다양하다는 것을 보여준다. A. 중앙 배가 시간 (h) 으로서 연산된 유방암 세포주 아류형의 성장률을 박스 플롯을 나타냈다. 기저 및 클라우딘-낮은 아류형은 Kruskal-Wallis p 값 (p = 0.006) 으로서 루미날 및 ERBB2AMP 아류형에 비해 더 짧은 중앙 배가 시간을 갖는다. B. ANCOVA 모델은 5'FU 에 대한 반응에 미치는 아류형 및 성장률 둘 모두의 강한 효과를 나타낸다. 루미날 (흑색) 및 기저/클라우딘-낮음 (적색) 유방암 선은 각각 성장률과의 유의한 관련성을 나타내지만 별개의 구배를 갖는다.
도 17 은 추론된 경로 활성이 코호트 내에서 보다 아류형 내에서 더욱 강하게 연관된다는 것을 보여준다. 상이한 아류형 (흑색) 의 세포주들 간의 피어슨 상관계수의 t-통계량과 비교하여 동일한 아류형 (적색) 의 TCGA 샘플과 세포주 간의 계산된 피어슨 상관계수로부터 유도되는 t-통계량의 히스토그램을 나타낸다. x-축은 피어슨 상관계수 t-통계량과 관련되고; y-축은 (세포주, 세포주) 또는 (세포주, TCGA 샘플) 쌍의 밀도를 나타낸다. K-S 시험 (P < 1 x lO-22) 은 세포주를 나타내고 동일한 아류형의 TCGA 샘플은 다른 아류형의 세포주보다 더욱 유사하다.
보충의 도 18-21 은 수퍼경로로부터 확인되는 4 개의 서브네트워크 각각에 대한 예시적인 네트워크 구성을 나타낸다.
도 18 은 기저 경로 지표의 네트워크 다이어그램을 나타낸다. 그래프에서의 각 노드는 단백질 (원형), 다중결합 복합체 (육각형), 또는 추상적인 세포 과정 (사각형) 에 해당하는 상이한 경로 "개념" 을 나타낸다. 더 큰 노드가 비-기저 세포주에 비해 기저 세포주에 더 깊이 관련된 활성을 갖는 경로 개념에 해당하도록, 노드의 크기는 차별적 활성 점수에 비례하여 그렸다. 색은 개념이 기저 아류형과 정의 상관관계 (적색) 또는 역의 상관관계 (청색) 에 있는지를 나타낸다. 연결은 단백질-단백질 레벨 상호작용 (점선) 및 전사 (실선) 를 포함하는 상이한 상호작용을 나타낸다. 상호작용은 차별적 활성의 절대 레벨이 중앙 절대 레벨보다 높은 개념을 서로 연결하는 경우에만 지도에 포함되었다.
도 19 는 클라우딘이 낮은 경로 지표의 예시적인 네트워크 다이어그램을 나타낸다. 도 18 에서와 같은 규칙.
도 21 은 ERBB2AMP 경로 지표의 예시적인 네트워크 다이어그램을 나타낸다. 도 18 에서와 같은 규칙.
도 22 는 루미날, 클라우딘-낮음 및 기저 세포주에서의 예시적인 URKB-FOXM1-CCNB1 네트워크를 나타낸다. A. 루미날 세포주에서 AURKB 및 FOXM1 주변의 네트워크. CCNB1 은 유의하게 하향조절되지 않았으므로 경로 지도에 나타나지 않는다. B. 클라우딘-낮은 세포주에서, AURKB 및 FOXM1 둘 모두는 상향조절된다; CCNB1 에 대한 활성은 유의하지 않았다. C. AURKB, FOXM1 및 CCNB1 은 모두 기저 세포주에서 상향조절된다. 도 18 에서와 같은 규칙.
도 23 은 CNA, mRNA 발현, DNA 메틸화 및 miRNA 발현에 따른 MicMa 코호트의 환자의 비감독된 군집 및 생존 곡선의 예시적인 분포를 나타낸다. 각 유형의 게놈 레벨에 있어서, 각 군집의 크기는 왼쪽에 나타냈고, 오른쪽에는 생존 곡선을 나타냈다. 차별적 생존의 의미는 두 개의 방법에 의해 평가된다 (실시예 참조).
도 24 는 확인된 PARADIGM 군집 및 생존의 예시적인 분포를 나타낸다. A. 각각의 막대는 각 군집의 크기를 나타낸다. B. MicMa 데이터세트에 대한 PARADIGM IPL 의 열지도. C. Chin-Naderi-Caldas 데이터베이스에 대해 지도로 만든 후의 MicMa PARADIGM 군집의 생존 곡선.
도 25 는 각 데이터세트에 대한 PARADIGM IPL 의 예시적인 열지도를 나타낸다. 각각의 세로줄은 3 개 모두의 코호트에 대한 유전자 또는 복합체의 IPL 을 나타낸다. 상부에 대한 유색 막대는 도 2 에서와 같이 MicMa-유래 PARADIGM 군집을 나타낸다. 관심의 경로의 일원들은 그들의 경로에 의해 라벨링된다. 적색은 활성화된 IPL 을 나타내고, 청색은 비활성화된 IPL 을 나타낸다.
도 26 은 FOXM1 전사 인자 네트워크를 나타낸다. 상부 네트워크 다이어그램은 군집 pdgm.3 의 데이터를 요약한 것인, 반면 하부 군집은 다른 군집의 데이터를 요약한 것이다. 노드 형태는 각 군집 내에서의 가장 자주 교란된 데이터 유형을 나타내고, 노드 색은 교란의 방향을 나타낸다. 화살표 끝은 상호작용의 신호를 나타내고, 색은 상호작용의 유형을 나타낸다.
도 27 은 p53 세포자멸사 경로의 작은 조각의 모형 예를 나타낸다. NCI 로부터의 경로 다이어그램은 숨은 및 관찰된 상태 둘 모두를 포함하는 인자 그래프로 전환되었다.
도 28 은 추론된 경로 활성 (IPA) 의 예시적인 열지도를 나타낸다. 활성화 (적색) 또는 비활성화 (청색) 된 추론된 분자 독립체의 1598 개 추론을 나타내는 IPA (세로줄) 는 316 개 환자 종양 샘플 (가로줄) 각각에 대해 구성하였다. IPA 는 경로 독립체 및 종양 샘플에 의해 계층적으로 군집화되었고, 오르쪽의 라벨은 개별 경로의 독립체가 풍부한 열지도의 구획을 나타낸다. 유색의 막대 범례는 로그 베이스 10 이다.
도 29 는 모든 샘플에 대한 FOXM1 통합 경로 활성 (IPA) 을 요약한 것이다. FOXM1 전사 인자 네트워크에서의 각 독립체에 대한 종양 샘플의 IPA 의 산술평균은 적색으로 나타냈고, 음영이 더 진한 적색은 두 개의 표준 편차를 나타낸다. 회색선 및 음영은 1000 개의 "공" 샘플 유래의 IPA 에 대한 평균 및 두 개의 표준 편차를 나타낸다.
도 30 은 NCI 경로 상호작용 데이터베이스에서 다른 시험된 전사 인자 (TF) 의 IPA 에 대한 FOXM1 의 IPA 의 비교를 나타낸다. A. 제거된 비활성 (0-값) IPA 을 갖는 IPA 의 히스토그램. FOXM1 표적은 다른 NCI TF (P < 10-267; Kolmogorov-Smirnov (KS) 시험) 보다 유의하게 더욱 활성화된다. B. 비활성 IPA 를 포함하는 모든 IPA 의 히스토그램. 모든 IPA 를 사용하여, 다른 TF 와 비교한 FOXM1 의 활성이 다소 더 중요한 의미를 갖는 것으로 이해된다 (P < 10-301; KS 시험).
도 31 은 FOXM1 이 장액성 난소암에 비교하여 나팔관 상피에서 발현되지 않는 것을 나타낸다. 나팔관에서 FOXM1 의 발현 레벨은 Tone 등의 데이터 (PMID: 18593983) 를 사용하여 장액성 난소암에서의 레벨과 비교하였다. FOXM1 의 발현은 BRCA 1/2 돌연변이를 운반하는 샘플을 포함하여 나팔관에서 훨씬 낮고, TCGA 장액성 난소암에서 관찰된 FOXM1 의 상승된 발현이 상피 특징으로 인해 단순하지 않는 것을 나타낸다.
도 32 는 높은 등급 대 낮은 등급 암종에서의 FOXM1 전사 인자 네트워크 유전자의 발현을 나타낸다. FOXM1 및 9 개의 선택된 FOXM1 표적 (NCI-PID 에 기초함) 에 대한 발현 레벨을 낮은-등급 (I; 황갈색 박스; 26 개 샘플) 및 높은-등급 (II/III; 청색 박스; 296 개 샘플) 난소암에 대해 나타내었다. 9 개의 표적에서 벗어난 7 개는 높은-등급 암종에서 FOXM1 의 유의하게 높은 발현을 갖는 것을 나타냈다 (스튜던트의 t-검정; 박스플롯 아래에 표시된 p-값). CDKN2A 는 또한 차등적으로 발현될 수도 있지만 경계선상의 t-통계량 (P = 0.01) 을 가졌다. XRCC1 은 차등적으로 발현되는 것과 같이 검출되었다.
도 33 은 세포주가 치료 화합물에 대한 광범위한 반응을 나타내는 것을 보여준다. A. 루미날 및 ERBB2AMP 세포주는 우선적으로 AKT 저해에 반응한다. 각각의 막대는 시그마 AKT1-2 저해자에 대한 단일 유방암 세포주의 반응을 나타낸다. 세포주를 감수성 (-log10(GI50)) 의 증가에 따라 배열하고 아류형에 따라 유색화하였다. B. 유사한 메커니즘을 갖는 화합물에 대한 GI50 값은 높은 상관성이 있다. 열지도는 여러 화합물로 처리된 유방암 세포주 반응들 간의 상관관계의 계층적 군집을 보여준다. C. 유사한 방식의 작용을 갖는 화합물은 세포주의 패널에 대한 반응들의 유사한 패턴을 나타낸다. 각 가로줄은 하나의 세포주를 나타내고, 각 세로줄은 시험된 화합물을 나타낸다. GI50 값은 계층적으로 군집화되어 있다. 유의한 아류형 효과를 갖는 화합물만이 포함된다. 유사한 아류형의 세포주는 함께 군집화하는 경향이 있고, 동일한 화합물에 반응하는 것을 나타낸다. 회색은 결측 값을 나타낸다. D. CNA 는 감수성과 관련되어 있다. 박스플롯은 알려진 게놈 위치에서 비정상적인 (A) 및 정상적인 (N) 카피 수를 갖는 세포주에 대한 반응 감수성의 분포를 나타낸다. 약물 반응과 CNA 간의 관계에 대한 FDR p 값이 언급되어 있다. a. 9p21 (CDKN2A) 결손은 익사베필론, 비노렐빈 및 파스카플리신에 대한 반응과 관련된다. b. 20q13 (STK15/AURKA) 증폭은 VX-680 및 GSK1070916 과 관련된다. c. 11q13 (CCND1) 에서의 증폭은 카보플라틴 및 GSK1070916 에 대한 반응과 관련된다.
도 34. A. 세포주 및 TCGA 샘플 둘 모두의 비이중화 PARADIGM 활성의 열지도. 군집 덴드로그램은 샘플들 간의 유클리디안 거리를 나타내고, 아이젠 군집을 사용하여 생성되었고 자바 트리뷰를 사용하여 그렸다. 덴드로그램 아래의 유색 막대는 샘플 아류형 (상부) 및 샘플 코호트 (하부) 를 나타낸다.
도 35 는 세포주 아류형이 독특한 네트워크 특징을 갖는다는 것을 보여준다. 모든 패널에서, 그래프의 각 노드는 단백질 (원형), 다중결합 복합체 (육각형), 또는 추상적인 세포 과정 (사각형) 에 대해 상응하는 상이한 경로 "개념" 을 나타낸다. 더 큰 노드가 비-기저 세포주에 비해 기저 세포주에 더 깊이 관련된 활성을 갖는 경로 개념에 해당하도록, 노드의 크기는 차별적 활성 점수에 비례하여 그렸다. 색은 개념이 기저 아류형과 정의 상관관계 (적색) 또는 역의 상관관계 (청색) 에 있는지를 나타낸다. 연결은 단백질-단백질 레벨 상호작용 (점선) 및 전사 (실선) 을 포함하는 상이한 상호작용을 나타낸다. 상호작용은 차별적 활성의 절대 레벨이 평균 절대 레벨보다 높은 개념을 서로 연결하는 경우에만 지도에 포함되었다. A. MYC/MAX 및 ERK1/2 서브네트는 기저 유방암 세포주에서 우선적으로 활성화된다. B. CTTNB1 네트워크는 클라우딘이 낮은 세포주에서 활성화된다. C. FOXA1/FOXA2 네트워크는 루미날 아류형에서 상향조절된다. D. ERBB2AMP 아류형은 RPS6KB 1 경로의 하향 조절을 나타낸다.
도 36 은 경로 다이어그램이 요법에 대한 반응을 예측하기 위해 사용될 수 있는지를 나타낸다. A. 상부 패널. 기저 유방암 세포주가 DNA 손상제 시스플라틴에 우선적으로 반응한다. 하부 패널. 기저 세포주는 DNA 손상 반응과 관련된 경로에서 향상된 활성을 보여주면서 시스플라틴이 상기 세포주에서 작용함으로써 가능한 메커니즘을 제공한다. B. 상부 패널. ERBB2AMP 세포주는 HSP90 저해자 겔다나마이신에 대해 감수성이다. 하부 패널. ERBB2-HSP90 네트워크는 ERBBP2AMP 세포주에서 상향조절된다. C. 상부 패널. ERBB2AMP 세포주는 오로라 키나아제 저해자 VX-680 에 내성이다. 하부 패널. 내성은 AURKB 및 CCNB1 의 공동-조절을 통해 매개될 수 있다. 도 36 에서와 같은 규칙.
도 37 은 게놈 카피 수 이상을 나타낸다. (a) 489 HGS-OvCa 의 카피-수 프로파일을 197 다형성 교모세포종 (GBM) 종양46 의 프로파일과 비교하였다. 카피 수 증가 (적색) 및 감소 (청색) 는 정상적인 게놈에 따른 거리의 함수로서 표시하였다. (b) 유의한, 국부적으로 증폭된 (적색) 및 결손된 (청색) 구역을 그놈 (gnome) 에 따라 그렸다. 주석은 20 개의 가장 유의한 증폭되고 결손된 구역, 8 개 이상의 유전자를 갖는 지극히 국소화된 구역, 및 게놈-전반의 기능-상실형 스크린에 의해 확인되는 유전자 또는 공지된 암 유전자를 갖는 구역을 포함한다. 각 구역에 포함된 유전자의 수는 괄호안에 제공하였다. (c) 유의하게 증폭된 (적색) 및 결손된 (청색) 염색체 암 (arm).
도 38 은 HGS- OvCa 에서의 결과 예측 및 분자 아류형의 유전자 및 miRNA 발현 패턴을 나타낸다. (a) 유전자 발현에 기초하여, 4 개의 군집으로 분리된 TCGA 및 Tothill et al. 로부터의 종양. (b) 트레이닝 데이터세트를 사용하여, 예후의 유전자 특성을 정의하고 시험 데이터세트에 적용하였다. (c) 예상되는 고위험 대 저위험 환자의 생존과 비교된, 4 개의 독립적인 발현 프로파일 데이터세트의 카플란-마이어 분석. 위험 지수에 대한 단변량 콕스 p-값이 포함됨. (d) 나타난 바와 같이 유전자-기재 군집과 겹치는, miRNA 발현에 기초한 3 개의 군집으로 분리된 종양. (e) 3 개의 miRNA-기재 군집들 중에서 생존한 환자의 차이.
도 39 는 HGS-OvCa 에서 변화된 경로를 나타낸다. (a) 큐레이트된 분석에 의해 확인되는 RB 및 PI3K RAS 경로, 및 (b) HotNet 분석에 의해 확인되는 NOTCH 경로는 통상적으로 변화된다. 변화는 체세포 돌연변이, DNA 카피-수 변화, 또는 몇몇 경우 이배체 종양에서의 발현과 비교된 유의한 상향- 또는 하향-조절에 의해 정의된다. 변화 빈도는 모든 사례의 백분율이다; 활성화된 유전자는 적색이고, 비활성화된 유전자는 청색이다. (c) HR 경로의 유전자는 사례의 49 % 이하까지 변화된다. BRCA 상태의 생존 분석은 BRCA 야생형보다 BRCA 돌연변이되는 사례 (전반적으로 더 나은 생존을 나타냄) 에 대한 발산적 결과를 나타내고, BRCA1 후성적으로 침묵된 사례는 더욱 불량한 생존을 나타낸다. (d) FOXM1 전사 인자 네트워크는 사례의 87 % 에서 활성화된다. 각 유전자를 다중 고리 원으로서 그렸고, 유전자의 카피 수 (외부 고리) 및 유전자 발현 (내부 고리) 을 표시하였으므로, 고리에서의 각 "스포크" 는 단일 환자 샘플을 나타내고, 상기 샘플은 FOXM1 발현의 증가 순서로 분류되어 있다. 흥분성 (적색 화살표) 및 저해적 상호작용 (청색 선) 을 NCI 경로 상호작용 데이터베이스로부터 가져왔다. 점선은 전사 조절을 나타낸다.
도 40 은 본 발명의 주제에 따른 동적 경로 맵을 생성시키기 위한 예시적인 컴퓨터 시스템을 도식적으로 나타낸 것이다.
본 문헌에 개시된 구현예는 실례가 되고 모법적이며 본 발명을 한정하는 것으로 의도되지 않는다. 다른 구현예가 활용될 수 있고, 본 발명의 청구항의 범주를 벗어나지 않고 구조적으로 변화될 수 있다.
본원 및 첨부된 청구항에 사용되는 바와 같이, 단수 형태는 문맥이 명확히 다르게 나타내지 않는 한 복수 형태를 포함한다. 따라서 예를 들어, "miRNA" 에 대한 언급대상은 복수의 miRNA 들을 포함하고, "제약 담체" 에 대한 언급대상은 하나 이상의 제약 담체 및 그의 동등물들 등을 말한다.
본원에 사용된 바와 같이, 용어 "큐레이트된" 은 당업계에 익히 공지된 방법, 예컨대 분자 생물학적, 생화학적, 생리적, 해부학적, 게놈, 전사체학적, 프로테오믹스, 대사체학적, ADME, 및 생물정보학적 기술 등을 사용하는 과학적 및/또는 임상적 원리에 따라 시험, 분석 및 확인된 한 세트의 생물학적 분자 및/또는 비생물학적 분자간의 관계를 의미한다. 상기 관계는 생화학적, 예컨대 생화학 경로, 유전 경로, 대사 경로, 유전자 조절 경로, 유전자 전사 경로, 유전자 번역 경로, miRNA-조절된 경로, 위유전자-조절된 경로 등일 수 있다.
고 처리량 데이터는 암 조직에서의 분자 변화의 포괄적인 견해를 제공한다. 신 기술은 게놈 카피 수 변이, 유전자 발현, DNA 메틸화, 및 종양 샘플 및 암 세포주의 후성 상태의 동시적인 게놈-전반의 어세이를 참작한다.
The Cancer Genome Atlas (TCGA), Stand Up To Cancer (SU2C), 등과 같은 연구는 머지않아 광범위하게 다양한 종양에 대해 계획된다. 현재 데이터 세트의 분석은 환자들 간의 유전자 변화는 상이하지만 종종 공통의 경로를 연루시킬 수 있음을 밝혀내었다. 따라서 암 진행에 연루된 관련 경로를 확인하고 상이한 환자에서 어떻게 변화되는지를 검출하는 것이 중요하다.
본 발명자들은, 다중 경로 엘리먼트의 다중 속성이 확률 경로 모델에 통합되고 이어서 환자 데이터를 사용하여 변형되어 동적 경로 맵을 생성하는 시스템 및 방법을 개발하였다. 가장 현저하게는, 경로 내에서 경로 엘리먼트에 대한 속성이 공지된 연역적 속성일 필요는 없는 것으로 이해된다. 실제로, 하나 이상의 일부 경로 엘리먼트의 속성 중 일부 이상이 추정된다. 이후, 경로 엘리먼트는 교차-상호관련되고 하나 이상의 경로에 대해 특정 인플루언스 수준이 할당되어 확률 경로 모델을 구축되며, 이는 바람직하게는 특정 참조 상태 (예를 들어, 건강체 또는 질병체) 를 나타낸다. 이어서, 환자 샘플의 다중 엘리먼트에 대한 측정 속성은 확률 경로 모델과 연계되어 사용되어, 하나 이상의 특정 경로에 대한 참조 경로 활성 정보를 제공하는 환자의 샘플 특이적 동적 경로 맵을 생성시킨다.
하나 이상의 경로 엘리먼트에 대한 속성의 가정 다중 유형과 연계되어 (합리적으로) 하나 이상의 경로 엘리먼트에 대한 속성의 다중 유형의 통합이, 현저하게 덜 제한적인 분석을 허용하고 높은 정도의 정확도 및 해상도를 갖는 다중-계승 분석이 허용되는 것으로 고려된다. 실제로, 고려되는 시스템 및 방법은 상대적으로 적은 측정 환자 샘플 속성을 기초로 하여 상세 결과 및 텍스쳐링된 결과과 생성됨을 주목한다. 물론, 고려되는 시스템 및 방법이 하나 이상의 경로 엘리먼트에 대한 1 종 이상의 속성의 입력으로 하나 이상의 경로 엘리먼트에 대한 1 종 이상의 속성의 산출을 생성할 것임을 숙지하며, 이때 입력 및 산출 속성 및 경로 엘리먼트는 완전히 별개일 수 있다. 예를 들어, 상이한 견해로부터 볼 때, 유전자 활성 상태에 대한 환자-특이적 게놈 추론은 복잡하며, 세포성 프로세스는 미리결정된 확률 경로 모델을 기초로 하여 유도될 수 있다.
하기 설명이 컴퓨터/서버 기반 경로 분석 시스템으로 도출한 것이나, 다양한 대안적인 배치가 또한 적합하며, 서버, 인터페이스, 시스템, 데이터베이스, 에이젼트, 피어, 엔진, 콜트롤러 또는 개별적으로 또는 군집적으로 작동하는 임의의 유형의 컴퓨팅 장치를 포함하는 다양한 컴퓨팅 장치를 사용할 수 있다.
컴퓨팅 장치가 명확한, 비-일시적인 컴퓨터 판독가능한 저장 매체 (예를 들어, 하드 드라이브, 고체 상태 드라이브, RAM, 플래시, ROM, 등) 상에서 저장되는 소프트웨어 지시사항을 실행하기 위해 설계되는 프로세서를 포함하는 것으로 평가된다. 소프트웨어 지시사항은 바람직하게는 개시된 장치에 대해 하기 논의되는 바와 같은 역할, 책무 또는 다른 기능을 제공하기 위해 컴퓨팅 장치를 구성한 것이다. 특히 바람직한 구현예에 있어서, 다양한 서버, 시스템, 데이터베이스 또는 인터페이스는, 표준 프로토콜 또는 알고리즘, 가능하게는 HTTP, HTTPS, AES, 공공-사립 핵심 교환, 웹 서비스 API, 공지된 파이낸셜 처리 프로토콜, 또는 다른 전자 정보 교환 방법을 기초로 하여, 데이터를 교환한다. 데이터 교환은 바람직하게는 패킷-스위칭된 네트워크, 인터넷, LAN, WAN, VPN, 또는 다른 유형의 패킷 스위칭된 네트워크 상에서 수행된다.
게다가, 하기 논의는 본 발명의 주제의 많은 예시적 구현예를 제공한다. 각 구현예가 본 발명의 엘리먼트의 단일 조합을 나타내더라도, 본 발명의 주제는 개시된 엘리먼트의 모든 가능한 조합을 포함하는 것으로 고려된다. 따라서, 하나의 구현예가 엘리먼트 A, B 및 C 를 포함하는 경우, 제 2 구현예는 엘리먼트 B 및 D 를 포함하고, 본 발명의 주제는 또한 달리 명시되지 않는 한 A, B, C, 또는 D 의 남아 있는 조합을 포함하는 것으로 고려된다.
본 발명자는 유전자들 중에서 큐레이트된 경로 상호작용을 포함하는 환자-특유의 유전자 활성의 새로운 추정 방법을 제시한다. 유전자는 발현을 인코딩하는 한 세트의 상호연속된 변수, 유전자 및 이의 생성물의 기지의 활성으로서 인자 그래프에 의해 모형화되고, 증거로서 많은 유형의 -오믹 데이터의 통합을 가능하게 한다.
상기 방법은 경로의 활성 (예를 들어, 내부 유전자 상태, 상호작용, 또는 높은-레벨 "출력") 이 환자에서 변화되는 정도를 확률적 추론을 사용하여 예측한다. SPIA 으로 칭하는 경쟁적 경로 활성 추론 접근법과 비교했을 때, 우리의 방법은 비제한적으로 다형성 교모세포종 (GBM) 및 유방암 데이터세트에서 더 적은 거짓-양성을 갖는 암-관련 경로에서 변화된 활성을 확인한다.
게놈 모델에 대한 데이터 통합을 사용하는 경로 인식 알고리즘 (PARADIGM) 은 유전자가 격리된 것으로 여겨지는 경우 간과된 GBM 환자의 서브세트에 대한 일관된 경로-레벨 활성을 찾아냈다. 또한, 상기 알고리즘을 사용하여 유의한 경로 교란에 기초한 집단화된 GBM 환자는 유의하게 상이한 생존 결과를 갖는 임상 관련 하위집단으로 나뉘어진다.
이러한 발견은 환자 집단 또는 개체의 공통의 교란된 경로(들) 에서 임계점의 유전자를 겨냥할 수 있는 치료법이 선택될 수도 있음을 시사한다.
본 발명자는 환자 샘플에서 변화된 분자 경로를 추론하기 위해서 꽤 다수의 게놈 및 기능적 게놈 데이터세트를 통합할 수 있는 인자 그래프에 기초한 확률적 그래프 모델 (PGM) 체계 (Kschischang:2001 supra) 를 기술한다. 본 발명자는 교모세포종 및 유방암 데이터세트 둘 모두에 대해서 카피 수 변화 및 유전자 발현 데이터를 사용하여 모델을 시험하였다. 구조화된 경로 모델을 사용하여 추론된 활성은 교모세포종 환자를 임상-관련 아류형으로 성공적으로 계층화시킨다. 상기 결과는 경로가 알려진 추론이 유전자-레벨 데이터를 단독으로 사용하는 것보다 더욱 유익하다는 것을 시사한다.
더 나은 예후 및 진단을 제공하는 것 이외에, 통합 경로 활성화는 질환 진행을 파기하기 위해 사용될 수 있는 잠재적 치료법에 대한 유력한 단서를 제공한다.
본 발명자는 통합된 환자 데이터로부터 유전 경로의 활성을 추론하기 위해서 PARADIGM (게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘) 로 불리는 접근법을 개발하였다. 도 1 은 상기 접근법의 개요를 설명한다. 단일 환자 샘플에서의 다수의 게놈-규모 측정법들을 조합하여 유전자의 활성, 생성물 및 단일 국제 암 연구소 (National Cancer Institute, NCI) 경로에 대한 추상적 프로세스 입력 및 출력을 추론한다. PARADIGM 은 통합 경로 활성 (IPA) 의 매트릭스 A 를 생성하고, 여기서 Aij 는 환자 샘플 j 에서 독립체 i 의 추론된 활성을 나타낸다. 그리고 나서 매트릭스 A 는 임상 결과와의 관련성을 확인하기 위해서 원래 구성성분 데이터세트 대신에 사용될 수 있다.
본 발명자는 우선 각 NCI 경로를 별개의 확률적 모델로 전환시켰다. p53 세포자멸사 경로의 작은 단편의 모형 예를 도 2(c) 에 나타냈다. NCI 로부터의 경로 다이어그램을 숨은 및 관찰된 상태 둘 모두를 포함하는 인자 그래프로 전환시켰다 (도 2). 인자 그래프는 독립체들 중에서 기지의 상호작용을 나타내는 구조를 갖는 유전자- 및 생물학적 프로세스-관련 상태 정보에 대한 관찰을 통합한다.
인자 그래프를 이용하여 생물학적 경로를 표현하기 위해서, 본 발명자는 세포, 예컨대 특정 mRNA 또는 복합체에서 독립체의 상태를 기술하기 위해 변수를 사용하고, 상기 독립체들 간의 상호작용 및 정보 흐름을 표현하기 위해서 인자를 사용한다. 이러한 변수는 분자 독립체의 직접적인 농도라기 보다는 "대조군" 또는 정상 레벨과 비교했을 때 각 독립체의 차등 상태를 표현한다. 이러한 표현은 많은 고 처리량 데이터세트, 예컨대 종종 유전자의 차별적 상태를 직접 측정하거나 직접적인 측정을 매치된 대조군에 관한 측정으로 전환시키는 DNA 마이크로어레이를 사용하여 검출된 유전자 발현을 모형화시킬 수 있도록 한다. 또한 유전자들 중에서 많은 유형의 조절 관계를 참작한다. 예를 들어, p53 의 MDM2 매개 유비퀴틴-의존적 분해를 나타내는 상호작용은 p53 단백질의 레벨을 저해하는 활성화된 MDM2 로서 모형화될 수 있다.
하나의 구현예에서, 상기 방법은 다양한 진단 및 치료 적용, 예컨대 암 조직의 검출, 암 조직의 병기, 전이 조직의 검출 등; 신경 장애, 예컨대 비제한적으로, 알츠하이머병, 루게릭병 (ALS), 파킨슨병, 정신분열증, 뇌전증, 및 이들의 합병증의 검출; 발달 장애, 예컨대 디조지 증후군, 자폐증, 자가면역 장애, 예컨대 다발성 경화증, 당뇨병, 등; 감염, 예컨대 비제한적으로, 바이러스 감염, 박테리아 감염, 균류 감염, 리슈마니아증, 주혈흡충병, 말라리아, 촌충, 상피병, 선충에 의한 감염, 네마틴, 등의 치료에 사용될 수 있는 임상 정보를 제공하는데 사용될 수 있다.
하나의 구현예에서, 상기 방법은 변화된 유전자 발현, mRNA 의 부재/존재, 과발현을 검출하고 수량화하거나, 치료 개입 동안 mRNA 레벨을 모니터하기 위한 임상 정보를 제공하는데 사용될 수 있다. 변화된 발현과 관련된 상태, 질환 또는 장애는 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 전립성 비대증, 기관지염, 체디아크-히가시 증후군, 담낭염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 만성 육아종 질환, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다낭성 난소 증후군, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 중증복합면역결핍증 (SCID), 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염; 및 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암을 포함한다. 진단 어세이는 변화된 유전자 발현을 검출하기 위해서 교잡 또는 증폭 기술을 사용하여 환자의 생물학적 샘플의 유전자 발현과 표준 샘플을 비교할 수 있다. 상기 비교를 위한 정성적 또는 정량적 방법은 당업계에 잘 알려져 있다.
하나의 구현예에서, 상기 방법은 상기 방법은 변화된 유전자 발현; mRNA 의 부재, 존재, 또는 과발현을 검출하고 수량화하거나, 치료 개입 동안 mRNA 레벨을 모니터하기 위한 임상 정보를 제공하는데 사용될 수 있다. 변화된 발현과 연관된 장애는 정좌불능증, 알츠하이머병, 기억상실증, 루게릭병 (ALS), 운동 실조증, 조울증, 긴장증, 뇌성마비, 뇌혈관 질환, 크로이츠펠트-야콥병, 치매, 우울증, 다운 증후군, 지연성 운동장애, 긴장 이상, 뇌전증, 헌팅턴병, 다발성 경화증, 근이영양증, 신경통, 신경섬유종증, 신경병증, 파킨슨병, 피크병, 망막색소변성증, 정신분열증, 계절성 정서장애, 노인성 치매, 뇌졸중, 투렛 증후군 및 특히 뇌의 선암, 흑색종, 및 기형암종을 포함하는 암을 포함한다.
하나의 구현예에서, 상기 방법은 포유류 단백질의 변화된 발현 또는 활성과 관련된 상태에 대한 임상 정보를 제공하는데 사용될 수 있다. 각 상태의 예는 비제한적으로, 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 전립성 비대증, 기관지염, 체디아크-히가시 증후군, 담낭염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 만성 육아종 질환, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다낭성 난소 증후군, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 중증복합면역결핍증 (SCID), 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염; 및 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암, 정좌불능증, 알츠하이머병, 기억상실증, 루게릭병, 운동 실조증, 조울증, 긴장증, 뇌성마비, 뇌혈관 질환, 크로이츠펠트-야콥병, 치매, 우울증, 다운 증후군, 지연성 운동장애, 긴장 이상, 뇌전증, 헌팅턴병, 다발성 경화증, 근이영양증, 신경통, 신경섬유종증, 신경병증, 파킨슨병, 피크병, 망막색소변성증, 정신분열증, 계절성 정서장애, 노인성 치매, 뇌졸중, 투렛 증후군 및 특히 뇌의 선암, 흑색종, 및 기형암종을 포함하는 암을 포함한다.
하나의 구현예에서, 본원에 개시된 상기 방법은 핵산 서열의 감소된 발현 또는 활성과 관련된 장애의 검출, 병기, 진단 및/또는 치료를 위해 사용될 수 있다. 상기 장애의 예는 비제한적으로, 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 트라우마, 브루톤의 X-상관관계 무감마글로불린혈증, 공통가변성 면역결핍증 (CVI), 디죠지 증후군 (흉선형성부전), 흉선 형성이상, 단독성 IgA 결핍, 중증복합면역결핍증 (SCID), 혈소판감소증 및 습진을 갖는 면역결핍 (비스코트-알드리히 증후군), 체디아크-히가시 증후군, 만성 육아종 질환, 유전성 결관신경 부종, 및 쿠싱병과 관련된 면역결핍; 및 발달 장애, 예컨대 신세뇨관 산증, 빈혈, 쿠싱 증후군, 연골무형성 왜소증, 뒤시엔느 및 베커 근이영양증, 뇌전증, 생식샘 발생장애, WAGR 증후군 (빌름스 종양, 무홍채증, 비뇨 생식기 기형, 및 정신 지체), 스미스-마제니스 증후군, 골수이형성 증후군, 유전성 점막표피 이형성, 유전성 각피증, 유전성 신경병증, 예컨대 샤르코-마리-투스병 및 신경섬유종증, 갑상선 기능 저하증, 수두증, 발작 장애, 예컨대 시드남 무도증 및 뇌성마비, 척추파열, 무뇌증, 두개척추파열, 선천성 녹내장, 백내장, 감음 신경성 청력 손실, 및 대상의 임의의 조직, 기관, 또는 계, 예를 들어, 뇌, 부신, 신장, 골격 또는 생식계에 연루된 세포 성장 및 분화, 배아발생, 및 형태발생과 관련된 임의의 장애를 포함한다.
하나의 구현예에서 본원에 개시된 방법은 핵산 서열의 발현과 관련된 장애의 검출, 병기, 진단 및/또는 치료에 사용될 수 있다. 상기 장애의 예는 비제한적으로, 내분비 장애, 예컨대 성선기능저하증을 포함하는 뇌하수체 기능저하증과 관련된 장애, 시한 증후군, 요붕증, 칼라만병, 핸드-쉴러-크리스찬병, 렛테러-시웨병, 유육종증, 공터기안 증후군, 및 왜소증; 말단비대증, 거인증, 및 부적합 항이뇨 호르몬 (ADH) 의 증후군분비 (SIADH) 을 포함하는 뇌하수체기능항진증; 및 갑상선종을 포함하는 갑상선 기능 저하증, 점액수종, 박테리아 감염과 관련된 급성 갑상선염, 바이러스 감염과 관련된 아급성 갑상선염, 자가면역성 갑상선염 (하시모토병), 및 크레틴병과 관련된 장애; 갑상선 중독증 및 이의 다양한 형태를 포함하는 갑상선 기능 항진증, 그레이브스병, 전경골 점액수종, 중독성 다결절 갑상선종, 갑상선암, 및 플러머병과 관련된 장애; 및 콘 질환 (만성 고칼륨혈증) 을 포함하는 부갑상선 기능항진증과 관련된 장애; 호흡기 장애, 예컨대 알레르기, 천식, 급성 및 만성 염증성 폐질환, ARDS, 폐기종, 폐울혈 및 부종, COPD, 간질성 폐질환, 및 폐암; 암, 예컨대 선암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암; 및 면역 장애, 예컨대 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 기관지염, 담낭염, 접촉성 피부염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 림프구세포독소를 갖는 우발성 림프구감소증, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 암의 합병증, 혈액투석, 및 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염, 및 트라우마를 포함한다. 폴리뉴클레오티드 서열은 서던 또는 노던 분석, 점 블럿, 또는 다른 막-기재 기술; PCR 기술; 딥스틱, 핀, 및 ELISA 어세이; 및 변화된 핵산 서열 발현을 검출하기 위한 환자의 유체 또는 조직을 이용하는 마이크로어레이에서 사용될 수 있다. 상기 정성적 또는 정량적 방법들이 당업계에 익히 공지되어 있다.
발명의 특징 및 최적의 방식
PARADIGM: PARADIGM 을 사용하는 다차원의 암 게놈 데이터로부터의 환자-특이적 경로 활성의 추론.
경로-기재 접근법의 하나의 가설은 경로 데이터베이스에서 발견된 유전자 상호작용이 암에서 검출된 유전자 발현 변화들 간의 상관관계를 해석하기 위한 정보를 전달한다는 것이다. 예를 들어, 암-관련 경로가 전사 활성자 A 에서부터 표적 유전자 T 까지의 연결을 포함하는 경우, A 의 발현이 T 의 발현과 정의 상관관계에 있을 것으로 예상한다 (E2E 상관관계). 마찬가지로, 또한 A 의 카피수 및 T 의 발현 사이에 정의 상관관계가 있을 것으로 예상한다 (C2E 상관관계). 게다가, A 에서의 증폭이 반드시 A 를 암시하지는 않고, 더 높은 레벨에서 발현하기 때문에, C2E 상관관계가 E2E 상관관계 보다 더 약할 것으로 예상하고, 이는 결국 B 를 반드시 상향조절하게 된다. 이런 식으로, 경로에서의 각 연결은 데이터에 대한 예상을 제공한다; 많은 일관된 연결을 갖는 경로는 추가의 검토에 적합할 수 있다. 본 발명자는 이러한 추정들을 시험하였고, NCI 경로가 최근 TCGA GBM 데이터 (The TCGA research network 2008) 을 예측하는 많은 상호작용을 포함한다는 것을 발견하였다.
본 발명자는 통합된 환자 데이터로부터 유전 경로의 활성을 추론하기 위해서 PARADIGM (게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘) 로 칭하는 접근법을 개발하였다.
PARADIGM 방법은 유전자 활성, 복합체 및 세포 과정의 상태에서의 환자-특이적 게놈 추론을 제공하기 위해서 다양한 고-처리량 게놈 정보와 알려진 신호화 경로를 통합시킨다. 방법의 핵심은 다양한 데이터 소스의 조합을 위해 추론을 활용하는데 인자 그래프를 사용한다. 원래의 고-처리량 데이터세트 대신 또는 그와 함께 상기 추론의 사용은 임상 관련 아류형으로 샘플을 분류하는 우리의 능력을 향상시킨다. PARADIGM-통합된 활성에 기초한 GBM 환자의 군집화는 상이한 생존 프로파일과 연관된 환자 아류형을 밝혀냈다. 대조적으로, 발현 데이터 또는 카피-수 데이터를 사용하는 샘플의 군집화는 데이터세트에서 임의의 유의한 군집을 밝혀내지 못했다.
PARADIGM 은 GBM 및 유방암의 종양 샘플에서 유의하게 변화된 유전자 활성의 경로 추론을 생성한다. SPIA 로 불리는 경쟁적 경로 활성 추론 접근법과 비교하여, 우리의 방법은 더 적은 거짓-양성을 이용하여 암-관련 경로에서 변화된 활성을 밝혀낸다. 전산 효율성을 위해서, PARADIGM 은 현재 NCI 경로를 있는 그대로 사용한다.
EM 을 사용하여 숨은 양을 추론하는 동안, NCI 경로에 아직 존재하지 않는 신규 상호작용을 추론하려고 하지 않는다. 우도 함수를 증가시키는 신규 상호작용을 도입하기 위한 접근법을 확장시키는 것을 상상할 수 있다. 상기 문제가 일반적으로 다루기 힘들기는 하지만, 상호작용을 확인하기 위해 전산적 검색 방법을 사용하여 어림법 (heuristics), 예컨대 구조적 EM (Friedman (1997) supra) 을 사용할 수 있다.
신규 접속 데노보를 조사하는 것보다, 다수의 발현 데이터세트에 연관된 단백질-단백질 상호작용 지도 또는 유전자 쌍으로부터 도출된 상호작용을 제안함으로써 조사 속도를 유의하게 높혀줄 수 있다. 경로-기재 접근법의 효력은 관찰된 생존에서의 차이를 기저로 이루는 가능한 메커니즘에 대한 단서를 제공할 수 있다. 유익한 IPA 는 치료 표적을 제시하거나 임상시험을 위해 가장 적절한 환자를 선택하는데 유용할 수 있다. 예를 들어, ErbB2 증폭은 약물 트라스투주맙에 의해 치료가능한 유방암의 특정 형태의 익히 공지된 지표이다.
그러나, ErbB2 증폭을 갖는 일부 환자는 치료가 되지 않는 종양을 갖는다. 원형지도 표시의 검토는 ErbB2 증폭을 갖는 환자를 확인할 수 있지만, PARADIGM 에 의해 추론된 바와 같은 불활성 또는 변화되지 않은 IPA 를 갖는다. ErbB2 증폭을 숨기나 예상되는 활성이 없는 환자는 대안적인 치료에 고려될 수 있다.
더 많은 다차원의 데이터세트가 미래에 이용할 수 있기 때문에, 상기 경로 추론이 코호트를 일반화시키는 강인한 생체지표를 제공하는지를 시험하는 것이 흥미로울 것이다.
유방암에서 항암 화합물에 대한 아류형 및 경로 특이적 반응
800 개 초과의 소형 분자 저해자 및 생물학은 인간 악성종양의 치료를 위해 개발 중에 있다 (New Medicines Database | PHRMA. http://newmeds.phrma.org / (2010)). 이러한 많은 작용제는 정상 세포와 종양을 식별하기 위해 분자 구조 특징을 표적으로 하고, 암 서브세트에서 탈조절된 분자 이벤트 및 경로를 선택적으로 표적화하는 항대사물질 및 DNA 교차 연결제, 예컨대 트라스투주맙 및 라파티닙을 포함하는 넓은-특이적 통상적인 치료법 범위에 있다 (참조: 예를 들어, Slamon, D. J. et al. Use of chemotherapy plus a monoclonal antibody against HER2 for metastatic breast cancer that overexpresses HER2. N Engl J Med 344, 783-792 (2001);Vogel, C. L. et al. Efficacy and safety of trastuzumab as a single agent in first-line treatment of HER2-overexpressing metastatic breast cancer. J Clin Oncol 20, 719-726 (2002); Rusnak, D. W. et al. The effects of the novel, reversible epidermal growth factor receptor/ErbB-2 tyrosine kanase inhibitor, GW2016, on the growth of human normal and tumor-derived cell lines in vitro and in vivo. Mol Cancer Ther 1, 85-94 (2001)). Effects of chemotherapy and hormonal therapy for early breast cancer on recurrence and 15-year survival: an overview of the randomised trials. Lancet 365, 1687-1717 (2005).
약물 개발의 일반적인 경향은 통상적인 작용제 보다 적은 독성 및 효과 증강을 나타내는 표적제를 향해 이동하고 있다 (Sawyers, C. Targeted cancer therapy. Nature 432, 294-297 (2004)). 일부 약물, 예컨대 ERBB2/EGFR 저해자 라파티닙은 높은 표적 선택성을 보여주는 반면, 다른 것, 예컨대 SRC 저해자 다사티닙은 넓은 범위의 키나아제를 저해한다 (Karaman, M. W. et al. A quantitaive analysis of kinase inhibitor selectivity. Nat Biotechnol 26, 127-132 (2008)).
임상시험은 반응의 예측변수를 포함하고 상기 시험에 참가하는 환자를 만족시켜야만 하는 인식이 퍼지고 있다. 많은 분자 표적 치료제가 환자를 만족시키기 위한 확실한 분자 특징을 제공하나 대부분은 아니다. 또한, 종양, 복잡한 교차-결합 및 표적 경로의 피드백 조절 간의 분자 및 생물학적 차이 및 불명확한 표적 특이성은 흔히 기본적인 기계적 예측을 복잡하게 한다. 반응성 서브세트가 분자 마커 기재 임상시험 과정 동안 확인될 수 있는 반면, 이러한 접근법은 로지스틱적으로 어렵고, 고가이며, 실험 화합물이 반응할 것 같은 선별된 부분집단에서 처음 시험 되는 것을 허용하지 않는다. 실로, 현재 개발중에 있는 대부분의 약물은 유방암에 절대 시험되지 않을 것이므로, 유방암 환자의 부분집단에서만 매우 효과적인 화합물을 놓칠 확률이 높다. 유망한 접근법은 임상시험에 참여하는 환자를 만족시키기 위해 임상전 모델로부터 도출된 반응의 예측변수를 이용하는 것이고, 이는 환자의 서브세트에 특히 효과적일 수 있는 약물을 확인하고 개발 비용을 줄일 수 있다.
세포주의 패널에서의 임상전 시험은 초기 임상시험에 대한 지침으로서 반응성 분자 아류형의 빠르고 효율적으로 확인시킬 수 있음을 보증한다. 상기 접근법의 유용성에 대한 증거는 세포주 패널이 하기를 예측하는 것을 보여주는 연구로부터 나온다: (a) 게피티닙에 반응하는 EGFR 돌연변이를 갖는 폐암 (Paez, J. G. et al. EGFR mutations in lung cancer: correlation with clinical response to gefitinib therapy. Science 304, 1497-1500 (2004)), (b) 트라스투주맙 및/또는 라파티닙에 반응하는 HER2/ERBB2 증폭을 갖는 유방암 (Neve, R. M. et al. A collection of breast cancer cell line for the study of functionally distinct cancer subtypes. Cancer Cell 10, 515-527 (2006); Konecny, G. E. et al. Activity of the dual kinase inhibitor lapatinib (GW572016) against HER-2-overexpressing and trastuzumab-treated breast cancer cells. Cancer Res 66, 1630-1639 (2006)), 및 (c) 이매티닙 메실레이트에 대해 내성인 변형되거나 증폭된 BCR-ABL 을 갖는 종양 (Scappini, B. et al. Changes associated with the development of resistance to imatinib (STI571) in two leukemia cell lines expressing p210 Bcr/Abl protein. Cancer 100, 1459-1471 (2004)) 을 예측한다. NCI 의 발견 치료 프로그램 (The NCI's Discovery Therapeutic Program) 은 상기 접근법을 대규모로 수행하여 ~60 암 세포주의 채집물에서 >100,000 화합물에 대한 반응 및 분자 특징 간의 관련성을 확인한다 (Weinstein, J. N. Spotlight on molecular profiling: "Integromic" analysis of the NCI-60 cancer cell lines. Mol Cancer Ther 5, 2601-2605 (2006); Bussey, K. J. et al. Integrating data on DNA copy number with gene expression levels and drug sensitivities in the NCI-60 cell line panel. Mol Cancer Ther 5, 853-867 (2006)). 다양한 반응을 갖는 화합물을 검출하는데 유용하더라도, NCI60 패널은 거의 틀림없이 상기 채집물에서 특이적 암 아류형의 비교적 드문 표현으로 인해 아류형 특이적 반응을 검출하는데 제한된 효력을 갖는다. 예를 들어, 채집물은 오로지 6 개의 유방암 세포주를 운반하고, 이는 알려진 이질성을 적절히 나타내기에 충분하지 않다. 따라서 본 발명자는 생체외 치료 화합물 반응과 분자 아류형 및 유방암에서의 활성화된 신호화 경로 간의 연계의 더 나은 통계적 로버스트 확인을 위한 ~50 유방암 세포주의 채집물의 사용을 촉진하였다. 본 발명자는 FDA 승인된 약물 및 조사용 화합물 둘 모두를 포함하는 77 개의 화합물에 대한 정량적 성장 저해 반응과 분자 특징 결정적 아류형 및 활성화된 경로 사이의 관련성 평가를 기록하였다. 약 반은 이상하거나 아류형 특이성을 보여준다. 본 발명자는 또한 관찰된 아류형-관련 반응의 일부는 특이적 경로 활성에 의해 설명될 수 있음을 유전자 발현 및 카피 수 데이터의 통합적 분석을 통해 보여준다.
통합된 분자 프로파일은 침습성 유방암에서의 향상된 예후력 및 Dcis 에서의 왜곡된 인터루킨 신호를 나타낸다.
다양한 레벨의 종양의 고 처리량 분자 프로파일의 축척은 전세계적으로 장기간에 걸친 고가의 과정이었다. 다양한 레벨의 유전자 조절의 조합된 분석은 다층 상피암에서 탈조절되고 맞춤치료 및 모니터링을 위한 환자의 신규 하위집단을 나타내는 특이적 생물학적 기능 및 분자 경로를 시사할 수 있다. 본 발명자는 대략 110 명의 유방암 환자로부터 도출된 미세전이 상태를 갖는 원발성 종양, 매치된 혈액의 신선한 동결 샘플로부터 도출된 여러 분자 레벨에서 고 처리량 데이터를 수집하였다 (추가로 MicMa 데이터세트로서 언급됨). 이들 환자는 파종성 종양 세포 (DTC) 의 존재, 재발의 장기간 추적조사 및 전체 생존에 대한 정보를 갖는 900 개 초과의 유방암 사건의 코호트의 일부이다. 상기 MicMa 세트는 전체 게놈 mRNA 발현의 파일럿 연구 (Naume, B. et al., (2007), Presence of bone marrow micrometastasis is associated with different recurrence risk within molecular subtypes of breast cancer, 1: 160-17), 어레이 CGH (Russnes, H. G. et al., (2010), Genomic architecture characterizes tumor progression paths and fate in breast cancer patient, 2: 38ra472), DNA 메틸화 (Ronneberg, J. A. et al., (2011), Methylation profiling with a panel of cancer related genes: association with estrogen receptor, TP53 mutation status and expression subtype in sporadic breast cancer, 5: 61-76), 전체 게놈 SNP 및 SNP-CGH (Van, Loo P. et al., (2010), Allele-specific copy number analysis of tumors, 107: 16910-169154), 전체 게놈 miRNA 발현 분석 (Enerly E, Steinfeld I, Kleivi K, Leivonen S, Aure MR, Russnes HG, Ronneberg JA, Johnsen H, Navon R, Rodland E, Makela R, Naume B, Perala M, Kallioniemi O, Kristensen VN, Yakhini Z, Borresen-Dale A. miRNA-mRNA integrated analysis reveals roles for miRNAs in primary breast tumors. PLoS ONE 201 l;6(2):el6915) 와 병행하여 사용되어 왔다. TP53 돌연변이 상태 의존 경로 및 고 처리량 페어 엔드 (paired end) 서열분석 (Stephens, P. J. et al., (2009), Complex landscapes of somatic rearrangement in human breast cancer genomes, 462: 1005-1010). 이것은 유방의 원발성 종양의 동일한 세트에 대한 단일 랩에 의해 수행된 고 처리량 분자 데이터의 포괄적 수집이다.
이하, 본 발명자는 이러한 연구의 발견을 요약하였고, 이들 각각에는 mRNA 발현을 DNA 카피 수, DNA 메틸화의 탈 조절 또는 miRNA 발현과 통합하려는 시도가 있어왔다. 과거에는 본 출원인 및 그 외는 다층 분자 레벨에 대한 유방암 메커니즘을 검토하면서, 경로 상황에서의 mRNA, CNAs, miRNAs, 및 메틸화를 모형화함으로써 상기 견해의 통합시도가 매우 드물게 있었다. 본 문서에서 본 발명자는 교란된 경로 및 별개의 표현형 특징을 갖는 분자 아류형을 검출하기 위해 협력하여 유방암으로부터 상기 데이터를 분석하였다.
본원에서 논의된 MicMa 데이터세트에서 본 발명자는 메틸화 프로파일에 기초한 3 개의 주 군집 (및 하나의 부 군집) 을 정의하였다; 주 군집들 중 하나는 주로 근상피 기원의 종양으로 이루어져 있고, 다른 둘은 대부분 루미날 상피 기원의 종양을 갖는다. 군집은 TP53 돌연변이 및 ER, 및 ErbB2 발현 상태, 뿐만 아니라 등급에 관해서 상이하다. 경로 분석을 통해 EGF, NGFR 및 TNF 와 같은 유전자, 수지상 세포 성숙 및 NF-κΒ 신호화 경로를 포함하는 표준 (큐레이트된) 경로와의 중요한 관련성을 확인하였다. DCIS 및 침습성 암의 샘플에 대한 후보 유전자의 염기서열분석은 DCIS 에서 메틸화된 신규 유전자로서 ABCB1, FOXC1, PPP2R2B 및 PTEN 을 확인하였다. 후성적 변화가 종양 진행을 촉진시키는데 어떻게 연루되는지에 대한 이해는, 병변이 침습성이 되는 위험에 있다는 것을 더욱 잘 위해서 중요하다.
본 발명자는 서로 및 임상 특징과의 상관관계에 관해서, MicMa 데이터세트에서의 miRNA 및 mRNA 발현 사이의 관계를 조사하였다. 본 발명자는 또한 여러 세포 과정, 예컨대 증식, 세포 접착 및 면역 반응이 특정한 miRNA 와 깊이 관련되어 있는 것을 보여줄 수 있다. miRNA 의 통계적으로 유의한 차등적 발현이 분자 고유의 아류형들 간에, 및 상이한 레벨의 증식을 갖는 샘플들 간에 관찰되었다. 본 발명자는 세포주에 대한 고-처리량 용해물-마이크로어레이를 사용하여 증식을 조절하는데 miRNA 의 역할을 입증하였고, 상기 과정에서 잠재적 추진자를 시사한다 (Enerly et al. (2001) supra).
40 개 초과 KEGG 경로가 유방암 환자의 상기 코호트에서의 p-값 컷오프 레벨 10e-6 에서 TP53 돌연변이 상태에 따른 차등적 강화를 나타내는 것으로 확인되었다. 경로의 차등적 강화는 또한 두개의 상이한 마이크로어레이 플랫폼에 기초한, 187 개의 유방암 샘플로 이루어진 교차-플랫폼 데이터세트에서 관찰되었다. 차등적으로 강화된 경로는 여러 알려진 암 경로, 예컨대 TP53 신호화 및 세포 주기, 면역 반응 및 사이토카인 활성화를 포함하는 신호화 경로 및 지방산 물질대사를 포함하는 대사 경로를 포함하였다 (Joshi et al, 2011 supra).
앞서 기술된 연구들 각각은 한쌍 방식 (CNA/mRNA, miRNA/mRNA, DNAmeth/mRNA, TP53/mRNA) 으로 고 처리량 분자 데이터로부터 생물학적 상호작용을 도출하려는 시도가 있었다. 본 연구에서, 본 발명자는 탈조절된 경로에 주력하고, 동시에 모든 분자 레벨을 고려하는 통합된 예후 지수를 개발하는 것을 시도하였다. 본 발명자는 다양한 유전 경로의 관련된 활성을 설명하고, 이의 공동 예후 잠재력을 평가하기 위해 PARADIGM (게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘) 을 적용하였다. PARADIGM 에 의해 확인된 군집 및 탈조절된 경로는 다른 데이터세트 (Chin, S. F. et al., (2007), Using array-comparative genomic hybridization to define molecular portraits of primary breast cancers, 26: 1959-1970) 에 의해 검증되었고, 또한 전암성 종양, 예컨대 DCIS (유관 상피내 암종) 의 데이터세트 (Muggerud, A. A. et al., (2010), Molecular diversity in ductal carcinoma in situ (DCIS) and early invasive breast cancer, 4: 357-368) 에 대해 연구하였다.
난소 장액성 암종에서 흔히 변화되는 경로
카피 수 및 유전자 발현에 의한 통합 분석을 통해 유의하게 변화된 경로를 확인하기 위해서, 본 발명자는 최근 개발된 경로 활성 추론 방법 PARADIGM 을 적용하였다 (PMID: 20529912). 컴퓨터 모델은 경로 데이터베이스에 존재하는 모든 유전자, 복합체, 및 유전 과정에 대한 통합 경로 활성 (IPA) 을 생성하기 위해 카피 수 변화, 유전자 발현 데이터, 및 경로 구조를 포함한다. 본 발명자는 경로에서 임의의 분자인 유전자, 복합체 또는 소형 분자를 지칭하기 위해 용어 "독립체" 를 사용한다. 독립체의 IPA 는 오로지 최종 활성만을 언급한다. 유전자에 있어서, IPA 는 오로지 단백질의 활성 상태의 추론된 활성을 언급하므로, 경로에서 다른 유전자의 신호화, 카피 수 및 유전자 발현으로부터 추론된다. 본 발명자는 PARADIGM 을 난소 샘플에 적용하였고 국립 암 연구소 경로 상호작용 데이터베이스 (NCI-PID) 에 포함된 경로에 존재하는 많은 상이한 유전자 및 과정에서 변화를 발견하였다. 본 발명자는 동일한 구조를 갖는 경로가 사용되었으나 추가적인 유전자가 상기 경로에서 상이한 지점에 배치된 1000 개의 무작위 시뮬레이션을 사용하는 추론된 변화의 유의성을 평가하였다. 즉, 제공된 경로에 대한 하나의 무작위 시뮬레이션은 상호작용의 세트를 고정되게 하여 추가의 유전자 세트가 경로의 상호작용과 함께 연관되었다. 모든 샘플의 IPA 의 유의성을 동일한 영 분포에 대해 평가하여 각 샘플에서 각 독립체에 대한 유의한 레벨을 수득하였다. 0.1 이상의 표준 편차를 갖는 IPA 는 도 28 에 열지도로서 나타내었다.
표 3 은 PARADIGM 에 의해 확인된 순열배치된 샘플에 대한 3 개 이상의 표준 편차에 의해 변화된 경로를 보여준다. FOXM1 전사 인자 네트워크는 시험된 모든 경로들 중 최다수의 샘플에서 변화되었다 - 샘플에 대한 평균화시킨 경우 변화된 활성을 갖는 독립체의 67 %. 대조적으로, 난소 코호트에서 변화된 활성의 다음으로 최고 레벨을 갖는 경로는 PLK1 신호화 이벤트 (27%), 오로라 B 신호화 (24%), 및 트롬복산 A2 수용체 신호화 (20%) 를 포함하였다. 따라서, NCI-PDD 에서의 경로들 중에서, FOXM1 네트워크는 난소 샘플에 대한 다른 경로 보다 더욱 유의하게 변화된 활성을 제공한다.
FOXM1 전사 인자 네트워크가 환자 샘플의 최고 비율로 정상 대조와 비교했을 때 종양 샘플에서 차별적으로 변화되는 것을 발견하였다 (도 29). FOXM1 은 3 개의 알려진 우성 스플라이스 형태를 갖는 다기능적 전사 인자이고, 세포 증식 및 DNA 수선에서 다양한 역할을 하는 별개의 유전자의 서브세트를 각각 조절한다. FOXM1c 이소형은 AUKB, PLK1, CDC25, 및 BIRC5 (PMID:15671063) 를 포함하는 세포 증식에서 알려진 역할을 하는 여러 표적을 직접 조절한다. 한편, FOXM1b 이소형은 DNA 수선 유전자 BRCA2 및 XRCC1 (PMID: 17101782) 을 포함하는 완전히 상이한 유전자의 서브세트를 조절한다. ATM 의 간접적인 제어하에 있는 CHEK2 는 FOXM1s 발현 레벨을 직접적으로 조절한다.
본 발명자는 FOXM1 전사 인자 자체의 IPA 가 다른 전사 인자의 IPA 보다 더욱 고속으로 변화되는지를 물었다. 본 발명자는 활성의 FOXM1 레벨을 NCI-PID 에서 다른 203 개의 전사 인자 모두와 비교하였다. NCI 세트에서 다른 전사 인자와 비교하더라도, FOXM1 전사 인자는 중요한 시그니처일 수도 있음을 추가로 제시하는 유의하게 더 높은 레벨의 활성 (p<0.0001; K-S 시험) 을 가졌다 (도 30).
FOXM1 이 또한 상피 기원의 많은 상이한 정상 조직에서 발현되기 때문에, 본 발명자는 PARADIGM 에 의해 확인된 시그니처가 다른 조직에서 정상인 것으로 여겨진 상피 시그니처로 인한 것인지를 물었다. 이를 답하기 위해서, 본 발명자는 나팔관 상피 및 난소 종양 조직을 현미해부하고 유전자 발현을 어세이한 GEO (GSE10971) (PMTD: 18593983) 의 독립적 데이터세트를 다운로드하였다. 본 발명자는 FOXM1 의 레벨이 정상과 비교했을 때 종양 샘플에서 유의하게 더 높다는 것을 밝혀내었으면서, 이는 FOXM1 조절이 정상 상피 조직에서 보여지는 것 이상의 암 조직에서 확실히 상승된다는 것을 시사한다 (도 31).
TCGA 난소에 대한 전체 코호트가 높은-등급 장액성 종양 유래의 샘플을 포함하였기 때문에, 본 발명자는 FOXM1 시그니처가 높은-등급 장액에 대해 특이적인지를 물었다. 본 발명자는 낮은- 및 높은-등급 장액성 종양 둘 모두가 전사적으로 프로파일링된 Etemadmoghadam 등 (2009) (Etemadmoghadam D, deFazio A, Beroukhim R, Mermel C, George J, Getz G, Tothill R, Okamoto A, Raeder MB, AOCS Study Group, Harnett P, Lade S, Akslen LA, Tinker AV, Locandro B, Alsop K, Chiew YE, Traficante N, Fereday S, Johnson D, Fox S, Sellers W, Urashima M, Salvesen HB, Meyerson M, Bowtell D. Integrated Genome-Wide DNA Copy Number and Expression Analysis Identifies Distinct Mechanisms of Primary Chemoresistance in Ovarian Carcinomas. Clinical Cancer Research 2009 Feb.; 15(4): 1417-1427) 의 데이터세트로부터 FOXM1 및 이의 여러 표적의 로그 식을 수득하였다. 이러한 독립적인 데이터는 FOXM1 및 이의 여러 표적이 낮은-등급 난소암에 대한 장액성 난소에서 유의하게 상향조절된다는 것을 확인하였다 (도 32). FOXM1 전사 인자 네트워크에서 25 개의 유전자가 높은-등급 질환에서 더 높은 발현을 갖는 유의한 비율의 유전자를 함유하는 지를 측정하기 위해서, 본 발명자는 Etemadmoghadam 의 데이터를 사용하여 스튜던트 t-검정을 수행하였다. 게놈에서 723 개의 유전자 (5.4%) 가 (Benjamini-Hochberg 방법을 사용하는 다중 시험에 대해 보정된) 0.05 유의한 레벨에서 낮은-등급에 비해 높은-등급 암에서 유의하게 상향조절된다는 것을 밝혀내었다. FOXM1 네트워크가 차등 조절된 유전자의 13 개 (52%) 를 갖는 것을 밝혀내었고, 이는 초기하 시험에 기초하여 유의한 비율이다 (P < 3.8*10-12). 따라서, FOXM1 네트워크 유전자의 높은 발현은 게놈에서 전형적인 유전자의 발현과 비교했을 때 높은-등급 질환과 유의하게 관련된다는 것으로 드러났다.
유방 및 폐를 포함하는 많은 상이한 암에서 FOXM1 의 역할이 익히 기록되어 있지만 난소암에서의 역할은 조사되지 않았다. FOXM1 은 3 개의 알려진 스플라이스 형태를 갖는 다기능적인 전사 인자이고 각각은 세포 증식 및 DNA 수선에서 다양한 역할을 하는 유전자의 별개의 서브세트를 조절한다. 상기 분석과 관련된 FOXM1 의 상호작용 네트워크의 발췌부분을 도 27 에 나타냈다. FOXM1a 이소형은 AUKB, PLK1, CDC25, 및 BIRC5 를 포함하는 세포 증식에서 알려진 역할을 하는 여러 표적을 직접적으로 조절한다. 대조적으로, FOXM1b 이소형은 DNA 수선 유전자 BRCA2 및 XRCC1 을 포함하는 유전자의 완전히 상이한 서브세트를 조절한다. ATM 의 간접 조절 하에 있는 CHEK2 는 FOXM1 의 발현 레벨을 직접적으로 조절한다. 대부분의 난소 환자에서 FOXM1 의 증가된 발현 이외에, 작은 서브세트는 또한 CBS 에 의해 검출된 카피 수 증폭을 증가시킨다 (측정된 게놈에서 모든 유전자의 상위 5 % 분위수에 있어서 카피 수를 갖는 19 % 가 증가한다). 따라서 FOXM1 의 선택적 스플라이싱 조절은 DNA 수선 및 세포 증식 사이의 제어 스위치에 연루될 수 있다. 그러나, 이소형을 구별하는 엑손 구조 및 엑손 어레이 프로브의 위치는 각각의 이소형 활성을 구별하는 것을 어렵게 하기 때문에 본 청구범위를 지지하기에 현재 데이터는 불충분하다. 상기 샘플의 mRNA 의 미래 고 처리량 서열분석은 FOXM1 이소형의 차등 레벨을 측정하는 것을 도울 수 있다. PARADIGM 이 전사 인자 중심에 있는 최고 레벨의 변화된 활성을 검출한 관찰은 FOXM1 가 세포에서의 임계적 조절 지점에 존재한다는 것을 시사하였다.
진단
본원에 기술된 상기 방법은 변화된 유전자 발현, mRNA 의 부재/존재, 과발현을 검출하고 수량화하거나, 치료 개입 동안 mRNA 레벨을 모니터하기 위해 사용될 수 있다. 변화된 발현과 관련된 상태, 질환 또는 장애는 특발성 폐동맥 고혈압, 2차 폐고혈압, 세포 증식 장애, 특히 악성 핍지교종, 성상세포종, 희돌기성상세포종, 교모세포종, 뇌수막종, 신경절세포종, 뉴런 신생물, 다발성 경화증, 헌팅턴병, 유방 선암, 전립선 선암, 위 선암, 전이성 신경내분비 암종, 비증식성 섬유낭성 및 증식성 섬유낭성 유방 질환, 쓸개 담낭염 및 담석증, 골관절염, 및 류마티스 관절염; 후천성 면역결핍 증후군 (AIDS), 에디슨병, 성인 호흡곤란 증후군, 알레르기, 강직성 척추염, 아밀로이드증, 빈혈, 천식, 죽상동맥경화증, 자가면역성 용혈성 빈혈, 자가면역성 갑상선염, 전립성 비대증, 기관지염, 체디아크-히가시 증후군, 담낭염, 크론병, 아토피 피부염, 피부근염, 진성 당뇨병, 폐기종, 태아적아구증, 결절성 홍반, 위축성 위염, 사구체신염, 굿파스튜어 증후군, 통풍, 만성 육아종 질환, 그레이브스 병, 하시모토 갑상선염, 과호산구증가증, 과민성대장 증후군, 다발성 경화증, 중증 근무력증, 심근 또는 심막 염증, 골관절염, 골다공증, 췌장염, 다낭성 난소 증후군, 다발성근염, 건선, 라이터 증후군, 류마티스 관절염, 강피증, 중증복합면역결핍증 (SCID), 쇼그렌 증후군, 전신과민증, 전신성 홍반성 낭창, 전신 경화증, 혈소판감소성 자반병, 궤양성 대장염, 포도막염, 베르너 증후군, 혈액투석, 체외순환, 바이러스, 박테리아, 균류, 기생충, 원충, 및 연충 감염; 프로락틴 생산의 장애, 난관 질환, 배란 결함, 및 자궁내막증을 포함하는 불임, 발정 주기 파괴, 월경 주기 파괴, 다낭성 난소 증후군, 난소과잉자극 증후군, 자궁 내막 또는 난소 종양, 자궁섬유종, 자가면역 장애, 자궁외 임신, 및 기형발생; 유방의 암, 섬유낭성 유방 질환 및 유즙 분비증; 정자형성의 중단, 이상정자 생리학, 전립성 비대증, 전립선염, 페이로니병, 발기불능, 여성형 유방; 광선 각화증, 동맥경화증, 점액낭염, 간경변, 간염, 혼합 결합 조직병 (MCTD), 골수섬유증, 발작성 야간혈색소 요증, 진성 다혈증, 1차 혈소판혈증, 암의 합병증, 선암을 포함하는 암, 백혈병, 림프종, 흑색종, 골수종, 육종, 기형암종, 및 특히, 부신, 방광, 뼈 골수, 뇌, 유방, 자궁경부, 담낭, 신경절, 위장관, 심장, 신장, 간, 폐, 근육, 난소, 췌장, 부갑상선, 음경, 전립선, 타액선, 피부, 지라, 고환, 흉선, 갑상선, 및 자궁의 암을 포함한다. 다른 양상에서, 본 발명의 핵산.
본원에 기술된 방법은 변화된 유전자 발현, mRNA 의 부재, 존재 또는 과발현을 검출하고 수량화하거나, 치료 개입 동안 mRNA 레벨을 모니터하기 위해 사용될 수 있다. 변화된 발현과 관련된 장애는 정좌불능증, 알츠하이머병, 기억상실증, 루게릭병, 운동 실조증, 조울증, 긴장증, 뇌성마비, 뇌혈관 질환, 크로이츠펠트-야콥병, 치매, 우울증, 다운 증후군, 지연성 운동장애, 긴장 이상, 뇌전증, 헌팅턴병, 다발성 경화증, 근이영양증, 신경통, 신경섬유종증, 신경병증, 파킨슨병, 피크병, 망막색소변성증, 정신분열증, 계절성 정서장애, 노인성 치매, 뇌졸중, 투렛 증후군 및 특히 뇌의 선암, 흑색종, 및 기형암종을 포함하는 암을 포함한다.
유전자 발현과 관련된 상태, 질환 또는 장애의 진단에 대한 기준을 제공하기 위해서, 정상 또는 표준 발현 프로파일을 수립하였다. 이는 동물 또는 사람인 정상 대상으로부터 수득된 생물학적 샘플에 교잡 또는 증폭의 조건 하에 프로브를 결합시킴으로써 완수될 수 있다. 표준 교잡은 공지된 양의 상당히 정제된 표적 서열이 사용되는 실험값을 정상 대상을 사용하여 수득된 값과 비교함으로써 수량화될 수 있다. 상기 방식으로 수득된 표준값은 특정 상태, 질환 또는 장애의 증상을 보이는 환자의 샘플로부터 수득된 값과 비교할 수 있다. 특정 상태와 관련된 것을 향한 표준값의 편차가 사용되어 상기 상태를 진단한다.
상기 어세이는 또한 동물 연구 및 임상시험에서 특정 치료 요법의 효험을 평가하거나, 개별 환자의 치료를 모니터하는데 사용될 수 있다. 일단 조건이 구축되고 치료 프로토콜이 시작되면, 환자에서의 발현 레벨이 정상 대상에서 관찰되는 레벨에 근접해지기 시작하는 지를 측정하기 위해 진단 어세이를 정기적으로 반복할 수 있다. 연속적인 어세이로부터 수득된 결과를 사용하여 수일에서 수개월 간의 기간에 걸쳐 치료 효험을 보여줄 수 있다.
모델 시스템
동물 모델은 인간의 독성 반응과 유사한 독성 반응을 나타내고 노출 조건을 인체 노출에 관련된 바이오어세이로서 사용될 수 있다. 포유동물은 가장 통상적인 모델이고, 대부분의 독성 연구는 저비용, 유용성, 및 풍부한 참조 독성학 때문에 설취류, 예컨대 래트 및 마우스에 대해 수행된다. 동계 설치류 교배는 관심 유전자의 저발현 또는 과발현의 생리적 결과의 조사 및 질환의 진단 및 치료 방법의 개발을 위한 편리한 모델을 제공한다. (예를 들어, 우유에서 분비되는) 특정 유전자를 과발현하는 동계교배된 동물은 또한 상기 유전자에 의해 발현되는 단백질의 편리한 공급원으로서 제공할 수 있다.
독성학
독성학은 생물계에 미치는 작용제의 효과에 대한 학문이다. 독성 연구 대부분은 인간 건강에 미치는 상기 작용제의 효과를 예측하기 위해 래트 또는 마우스에 대해 수행된다. 독성 프로파일을 생성하고 작용제에 대한 노출 후 인간 건강에 미치는 결과를 평가하기 위해 생리학에서의 정성적 및 정량적 변화의 관찰, 거동, 항상성 유지 및 치사율이 사용된다.
유전 독성학은 유전성 돌연변이를 일으키는 작용제의 능력을 확인하고 분석한다. 유전 독성물질은 보통 핵산과 상호작용을 촉진하는 통상적인 화학적 또는 물리적 특성을 갖고, 염색체 이상이 자손까지 유전되는 경우 가장 해롭다. 독성학 연구는 수정 전 부모에게, 임신 중 모체에게, 또는 성장하는 유기체에게 투여되는 경우, 자손에서 구조적 또는 기능적 기형의 빈도를 증가시키는 작용제를 확인할 수 있다. 마우스 및 래트는 통계적 요건을 만족시키기 위해 필요되는 다수의 유기체를 생산하는 그들의 짧은 생식 주기 때문에 상기 시험에서 가장 자주 사용된다.
급성 독성 시험은 작용제를 대상에 단일 투여하여 작용제의 증후 또는 치사율을 측정하는 것에 기초한다. 3 개의 실험이 수행된다: (a) 초기 용량-범위-결과 실험, (b) 효과적인 용량의 범위를 좁히는 실험, 및 (c) 용량-반응 곡선을 구축하기 위한 최종 실험.
장기 독성 시험은 작용제의 반복 투여에 기초한다. 상이한 패밀리의 종으로부터 데이터를 제공하기 위해, 래트 및 개가 상기 연구에 보통 사용된다. 발암과정 외에는, 3 내지 4 개월 기간 동안 고-용량 농도로 작용제를 매일 투여함으로써 성인 동물에서 대부분의 독성 형태가 드러날 것이라는 상당한 증거가 있다.
1 년 이상 동안의 만성 독성 시험은, 독성의 부재 또는 작용제의 발암 가능성을 증명하는데 사용된다. 래트에 대해 연구가 수행되는 경우, 최소 3 개의 시험군 + 하나의 대조군이 사용되고, 동물이 시험되고 초기 및 실험 중 간격을 두고 모니터된다.
형질전환 동물 모델
관심의 유전자를 과다-발현 또는 부족-발현하는 형질전환 설치류는 동계교배될 수 있고, 인간 질환을 모형화하거나 치료 또는 독성 작용제를 시험하는데 사용될 수 있다. (참조: U.S. Pat. Nos. 4,736,866; 5,175,383; 및 5,767,337; 본원에 참조인용됨) 일부 경우, 도입된 유전자는 태아 발육 동안 또는 출생 후에 특정 시간에 특이 조직 유형에서 활성화될 수 있다. 이식유전자의 발현은 실험적 약물 치료를 이용하는 도전 전, 동안, 및 후 형질전환 동물에서 표현형 또는 조직-특정 mRNA 발현의 분석에 의해 모니터링된다.
배아 줄기 세포
설치류 배아에서 분리된 배아 줄기 세포 (ES) 는 배아를 형성할 잠재력을 보유하고 있다. ES 세포가 운반체 배아 안에 위치되는 경우, 정상 발달을 재개하고 살아서 태어난 동물의 모든 조직에 기여한다. ES 세포는 실험적 녹아웃 및 녹인 설치류 계통의 생성에 사용되는 바람직한 세포이다. 마우스 ES 세포, 예컨대 마우스 129/SvJ 세포주는 마우스 초기 배아 유래이고, 당업계에 잘 알려진 배양 조건 하에서 성장된다. 녹아웃 계통의 벡터는 생체내 전사 및/또는 번역을 방해하는 표적 유전자를 포함하도록 조작된 질환 유전자 후보를 함유한다. 상기 벡터는 당업계에 잘 알려져 있는 형질전환 방법, 예컨대 전기천공법, 리포좀 전달, 미량주입법, 등에 의해 ES 세포로 도입된다. 내인성 설치류 유전자는 세포 분열 동안의 상동 재조합 및 통합을 통해 파괴된 질환 유전자에 의해 대체된다. 형질전환된 ES 세포가 확인되고, 바람직하게는 마우스 세포 배반포, 예컨대 C57BL/6 마우스 계통의 것에 미량주입된다. 배반포를 상상임신한 어미에게 외과적으로 이식하고, 그 결과 생성된 키메라 자손은 유전자형이 되고 태어나서 이형접합적 또는 동질접합적 계통을 생성한다.
ES 세포는 또한 생체외 다양한 세포 유형 및 조직, 예컨대 신경 세포, 조혈 혈통, 및 심근세포의 분화를 연구하는데 사용된다 (Bain et al. (1995) Dev. Biol. 168: 342-357; Wiles and Keller (1991) Development 111: 259-267; and Klug et al. (1996) J. Clin. Invest. 98: 216-224). 최근 개발을 통해 인간 배반포 유래의 ES 세포가 생체외 조작되어 또한 내배엽, 중배엽, 및 외배엽 세포 유형을 포함하는 8 개의 부리 세포 혈통으로 분화할 수 있다는 것이 입증되었다 (Thomson (1998) Science 282: 1145-1147).
녹아웃 분석
유전자 녹아웃 분석에서, 인간 질환 유전자 후보의 영역을 비-포유류 유전자, 예컨대 네오마이신 포스포트랜스퍼라아제 유전자를 포함하도록 효소 조작시킨다 (네오;예를 들어, Capecchi (1989) Science 244: 1288-1292 참조). 삽입된 코딩 서열은 표적 유전자의 전사 및 번역을 방해하고 질환 후보 단백질의 생화학 합성을 막는다. 조작된 유전자가 배양된 배아 줄기 세포 (상기 기술됨) 로 변형되고, 변형된 세포가 설치류 포배에 주입되고, 포배가 상상임신한 어미에게 이식된다. 형질전환된 자손을 교배시켜 동질접합적 근교계를 수득한다.
녹인 분석
배발달의 초기 단계에 존재하는 전능 ES 세포는 인간 질환의 형질전환 동물 모델 (마우스 또는 래트) 또는 녹인 인간화 동물 (돼지) 을 생성하는데 사용될 수 있다. 녹인 기술을 이용하여, 인간 유전자 영역이 동물 ES 세포로 주입되고, 인간 서열은 재조합에 의해 동물 세포 게놈에 통합된다. 통합된 인간 유전자를 함유하는 전능 ES 세포는 상술된 바와 같이 취급된다. 유사한 인간 조건에 대한 정보를 수득하기 위해 동계교배된 동물을 연구하고 처리한다. 여러 인간 질환들을 모형화하기 위해 상기 방법들이 사용되어 왔다 (예를 들어, Lee et al. (1998) Proc. Natl. Acad. Sci. 95: 11371-11376; Baudoin et al. (1998) Genes Dev. 12: 1202-1216; and Zhuang et al. (1998) Mol. Cell Biol. 18: 3340-3349 참조).
비인간 영장류 모델
동물 시험 분야는 기초 과학, 예컨대 생리학, 유전학, 화학, 약리학 및 통계학으로부터의 데이터 및 방법론을 취급한다. 이러한 데이터는 인간 건강과 관련될 수 있기 때문에 비인간 영장류에 미치는 치료제의 효과를 평가하는데 있어 최고 중요하다.
백신 및 약물 평가에서 인간 대용으로서 원숭이가 사용되고, 이의 반응은 유사한 조건하에 인간 노출과 관련된다. 사이노몰거스 (Cynomolgus) 원숭이 (Macaca fascicularis, Macaca mulata) 및 코먼 마모셋 (Callithrix jacchus) 이 상기 조사에 사용되는 가장 흔한 비인간 영장류 (NHP) 이다. NHP 집단의 발달 및 유지에 거액의 비용이 관련되기 때문에, 초기 연구 및 독성학 연구는 보통 설치류 모델에서 수행된다. 행동 측정을 사용하는 연구, 예컨대 약물 중독에서, NHP 가 제 1 선택 시험 동물이다. 또한, NHP 및 인간 개체는 많은 약물 및 독성에 대한 차별적 민감성을 나타내고 상기 작용제에 대한 "강대사능력자" 및 "약대사능력자" 로서 분류될 수 있다.
본 발명의 예시적 용도
맞춤형 의약은 효과가 가장 있을 것으로 예상되는 환자에게 특정 치료(들) 를 전달하는 것을 약속한다. 본 발명자는 치료 화합물의 약 반이 우선적으로, 임상-관련 전사 또는 게놈 유방암 아류형의 하나 이상에 효과적임을 보여주었다. 이러한 발견은 유방암 치료에서 반응-관련된 분자 아류형을 정의하는 것의 중요성을 뒷받침한다. 본 발명자는 또한 세포주에 대한 전사 및 게놈 데이터의 경로 통합이 관찰된 아류형 특이적 반응에 대한 기계론적 설명을 제공하는 서브네트워크를 나타낸다는 것을 보여주었다. 세포주 및 종양 간의 서브네트 활성의 비교 분석은 아류형-특이적 서브네트워크의 대부분이 세포주 및 종양 사이에서 보호된다는 것을 보여준다. 이러한 분석들은 잘 특성화된 세포주 패널에서의 실험 화합물의 임상전 스크리닝이 초기 임상시험에서 감수성 강화를 위해 사용될 수 있는 후보 반응-관련 분자 시그니처를 확인시킬 수 있다는 발상을 뒷받침한다. 본 발명자는 상기 생체외 평가 접근법이, 화합물의 임상 개발이 시작하기 전에 반응성 종양 아류형이 확인되고, 그리하여 비용이 감소되고, 궁극적인 FDA 승인의 확률이 증가되고, 아마 반응할 것 같지 않은 환자를 치료하는 것과 관련된 독성을 피할 우도를 증가시킬 것으로 제시한다. 상기 연구에서, 본 발명자는 전사 아류형 및 선택된 반복되는 게놈 CNA 를 정의하는 분자 시그니처만을 평가하였다. 본 발명자는 유전자 돌연변이, 메틸화 및 선택적 스플라이싱과 같은 추가적 분자 특징이 상기 분석에 포함되기 때문에 상기 접근법의 효력 및 정확도가 증가할 것이라 예상한다. 또한, 세포주 패널 크기의 증가는 패널 내의 별로 일반적이지 않은 분자 패턴을 평가하고 인간 유방암에 존재하는 전 범위의 다양성을 나타내는 확률을 증가시키는 효력을 증가시킬 것이다.
유방암 증식은 신생 스트로마에 존재하는 가장 풍부한 백혈구를 나타내는 B 세포, T 세포, 및 대식세포를 갖는 선천적 및 적응 면역 세포 둘 모두의 존재시 유의하게 증가함으로써 특성화된다 (DeNardo DG, Coussens LM. Inflammation and breast cancer Balancing immune response: crosstalk between adaptive and innate immune cells during breast cancer progression. Breast Cancer Res. 2007;9(4):212). 종양 장루 (및 혈청) 에서의 높은 면역글로불린 (Ig) 레벨 및 원발성 종양 또는 림프 노드에서의 난포방 B 세포, T 조절 세포, 및 CD4/CD8 또는 TH2/TH1 T 림프구의 높은 비의 존재의 증가는 종양 등급, 단계 및 전체 환자 생존과 연관되는 것을 나타내어 왔다 (Bates, G. J. et al., (2006), Quantification of regulatory T cells enables the identification of high-risk breast cancer patients and those at risk of late relapse, 24: 5373-5380); 일부 백혈구는 세포독성 T 림프구 (CTL) 및 자연살해 (NK) 세포를 포함하는 항종양 활성을 나타내고 (34 Dunn, G. P., Koebel, C. M., and Schreiber, R. D., (2006), Interferons, immunity and cancer immunoediting, 6: 836-848), 다른 백혈구, 예컨대 비만 세포, B세포, 수지상 세포, 과립구, 및 대식세포는 종양 진행을 방해하거나 강력하게 하는 능력을 통해 더욱 심한 양극성 역할을 나타낸다 (35 de Visser, K. E. and Coussens, L. M., (2006), The inflammatory tumor microenvironment and its impact on cancer development, 13: 118-137). 상기 연구에서 가장 중요한 발견은 예후 값을 갖는 하위부류의 분류화를 이끄는 면역 반응 (TCR) 및 인터루킨 신호화, IL4, IL6, IL12 및 IL23 신호화에서의 교란의 확인이었다. 본 발명자는 상기 이벤트가 고 처리량 분자 데이터에서 반영되고 유방 종양의 분자 하위분류화를 이용하여 강하게 방해한다는 증거를 제공한다.
본 개시물은 또한 HGS-OvCa 에서의 이상에 대한 제 1 대규모 통합적 관점을 제공한다. 종합적으로, 돌연변이 스펙트럼은 놀랍게도 단순하였다. TP53 에서의 돌연변이는 HGS-OvCa 의 96 % 이상에서 발생하는 것이 지배적인 반면, BRCA1/2 는 생식계열 및 체세포 돌연변이의 조합으로 인해 종양의 22 % 에서 돌연변이되었다. 유의하게 돌연변이된 7 개의 다른 유전자가 확인되었지만, 오로지 HGS-OvCa 의 2-6 % 에서만 확인되었다. 대조적으로, HGS-OvCa 는 현저한 게놈 혼란 정도를 입증한다. 빈번한 SCNA 는 훨씬 적은 염색체 암 (arm)-레벨 또는 중심의 SCNA 를 갖는 더욱 반복적으로 돌열변이되는 유전자가 있는 교모세포종46 을 갖는 이전의 TCGA 발견과 현전한 대조를 이룬다 (도 37A). HR 성분을 포함하는 추정 DNA 수선 유전자에서의 촉진제 메틸화 및 돌연변이의 높은 출현율은 SCNA 의 높은 출현율을 설명할 수 있다. 돌연변이 스펙트럼은 다른 OvCa 조직학적 아류형과는 완전한 별개로서 HGS-OvCa 를 표시한다. 예를 들어, 투명-세포 OvCa 는 약간의 TP53 돌연변이를 갖지만, 반복적인 ARID 1A 및 PIK3CA47-49 돌연변이를 갖는다; 자궁내막성 OvCa 는 빈번한 CTTNB1, ARIDIA, 및 PIK3CA 돌연변이 및 더 낮은 비율의 TP5348,49 를 갖는 반면 점액성 OvCa 는 만연된 KRAS 돌연변이50 를 갖는다. 난소암 아류형들 간의 이러한 차이는 병인학적 및 혈통 효과의 조합을 반영하고 아류형-계층 치료를 통한 난소암 결과를 증가시킬 기회를 나타낼 공산이 있다.
신규한 치료 접근법의 확인이 TCGA 의 중심 목표이다. HR 결핍을 갖는 HGS-OvCa 의 ~50 % 는 PARP 저해자로부터 혜택을 받을 수 있다. 이것 이상으로 통상적으로 탈조절된 경로, RB, RAS/PI3K, FOXM1, 및 NOTCH 는 치료 착수에 대한 기회를 제공한다. 최종적으로, 저해자는 이미 반복되는 증폭 영역에서 22 개의 유전자에 대해 존재하므로 (이하 실시예 XIII 참조), 표적 유전자가 증폭되는 HGS-OvCa 에서의 평가를 타당하게 만든다. 종합적으로, 이러한 발견들은 상기 특이적 이상에 대해 효과적인 것으로 선택된 치료법을 이용하여 비정상적인 유전자 또는 네트워크가 검출되고 표적화되는 HGS-OvCa 의 치료에 대한 접근법을 위한 토대를 만든다.
도 40 에서 경로 분석 에코시스템 (100) 의 예시적인 개략도를 제시한다. 에코시스템 (100) 은 경로 엘리먼트 (125) 로서 집합적으로 지칭되는, 바람직하게는 복수의 경로 엘리먼트 (125A) 내지 (125N) 을 저장하는 경로 엘리먼트 데이터베이스 (120) 을 포함할 수 있다. 각각의 경로 엘리먼트 (125) 는 하나 이상의 경로를 갖는 이의 개입을 특징으로 할 수 있다. 엘리먼트 (125) 는 엘리먼트의 특징을 기술하는 하나 이상의 특성 또는 값을 포함하는 관리가능한 데이터 목적체로 별도로 고려될 수 있다. 일부 구현예에 있어서, 엘리먼트 125 는 n-개 한벌 특성 또는 값으로 고려될 수 있는데, 이때 엘리먼트 125 한벌의 각각의 소유 수를 비교하고, 분석하고, 대조비교하거나, 다른 엘리먼트 한벌에서 다른 소유 수에 대해 이를 평가할 수 있다.
변형 엔진 (110) 은 경로 엘리먼트 데이터베이스 (120) 과 소통하여 커플링되고, 가능하게는 네트워크 링크를 통해 커플링된다 (예를 들어, LAN, WAN, 인터넷, VPN, 등). 일부 구현예에 있어서, 경로 엘리먼트 데이터베이스 (120) 은 변형 엔진 (110) 에 대해 지엽적일 수 있으나, 다른 구현예에 있어서, 경로 엘리먼트 데이터베이스 (120) 은 변형 엔진 (110) 으로부터 멀리 떨어질 수 있다. 예를 들어, 경로 엘리먼트 데이터베이스 (120) 은 National Lambda Rail (URL www.nlr.net 참조) 또는 인터넷을 통해 접근될 수 있다. 또한, 변형 엔진 (110) 또는 이를 위한 에코시스템 (100) 은 네트워크 상에서 사용자에 의해 접근될 수 있으며, 가능하게는 교환 수수료를 징수할 수 있다.
변형 엔진 (110) 은 분석을 위한 경로 엘리먼트 데이터베이스 (120) 로부터의 하나 이상의 엘리먼트 (125) 를 수득한다. 바람직하게는, 변형 엔진 (110) 은 하나 이상의 엘리먼트 (125) (예를 들어, 엘리먼트 (125A)) 를 하나 이상의 연역적으로 공지 속성 (133) 과 연계시킨다. 또한, 변형 엔진 (110) 은 또다른 엘리먼트, 엘리먼트 (125N) 를 예를 들어, 가정 속성 (137) 과 연계시킨다. 일부 구현예에 있어서, 변형 엔진 (110) 은 추론 원칙, 프로그램의 지시, 또는 다른 기술을 기초로 하여 자동적으로 연계시킬 수 있다. 예를 들어, 공지 속성 (137) 은 공지되어 있는 조사로부터 수득될 수 있는 반면, 가정 속성 (137) 은 파라미터로 나타낸 스페이스 속성에 따라 맵핑될 수 있었으며, 이때 변형 엔진 (110) 연속적으로, 또는 평행하여, 가정 속성 스페이스를 통과하여 진행한다. 다른 구현예에 있어서, 사용자는 하나 이상의 사용자 인터페이스 (나타내지 않음) 를 통과하여 필요에 따라 속성 (133) 또는 (137) 을 수동적으로 연계시킬 수 있고, 가능하게는 HTTP 서버 또는 다른 적합한 인터페이스 기술을 통해 작동한다.
변형 엔진 (110) 은 공지 속성 (133) 및 가정 속성 (137) 을 사용하여 하나 이상의 경로에 대해 경로 엘리먼트 (125) 를 추가로 교차-관련시킨다. 또한, 변형 엔진 (110) 은 하나 이상의 인플루언스 수준 (145) 을 엘리먼트 (125) 에 할당한다. 교차-상관관계 및 인플루언스 수준 (145) 의 할당을 통해, 변형 엔진 (110) 은, 가정 속성 (137) 또는 다른 인자에 의해 경로가 어떻게 영향을 받는지에 대한 윤곽을 잡아서 확률적 경로 모델 (140) 을 구축한다.
일부 구현예에 있어서, 확률적 경로 모델 (140) 은 나타낸 바와 같이 분석을 위해 또는 아키브 목적을 위해 또는 경로 모델 데이터베이스 (150) 내에서 저장될 수 있다. 엘리먼트 (125) 를 갖는 것으로서, 확률적 경로 모델 (140) 은 또한 모델의 특성을 기술하는 값 또는 특성을 갖는 별도의 조작할 수 있는 데이터로서 저장될 수 있다 (가능하게는 n개 한벌로서). 모델 (145), 또는 심지어 엘리먼트 (125) 는 임의의 바람직한 도표에 따라 저장될 수 있다. 엘리먼트 데이터베이스 (120) 또는 모델 데이터베이스 (140) 를 구축하는데 사용될 수 있는 적합한 데이터베이스의 예는 MySQL, PostgreSQL, Oracle, 또는 다른 적합한 데이터베이스를 포함한다. 일부 구현예에 있어서, 데이터 대상 (예를 들어, 엘리먼트 (125), 확률적 경로 모델 145, 등) 은 용이한 조사 또는 복구를 허용하는 방식으로 이들의 특성 또는 값을 통해 증대되어 인덱스화될 수 있다.
에코시스템 (100) 은 바람직하게는 실제 데이터에 대한 확률적 경로 모델 (150) 을 추가로 분석하기 위해 설계된 분석 엔진 (160) 을 포함한다. 실시예에서 나타낸 바와 같이, 분석 엔진 (160) 은 확률적 경로 모델 (150) 을 수득하여 (가능하게는 사용자 또는 조사자의 지시 하에서) 동적 경로 모델 (165) 을 유도한다. 바람직하게는, 동적 경로 모델 (160) 은, 환자 샘플로부터의 하나 이상의 측정 속성 (173) 을 확률적 경로 모델 (140) 과 연계된 속성과 비교함으로써 유도된다. 따라서, 분석 엔진 (160) 은 변형, 업데이트, 교정 또는 다르게는 확률적 경로 모델 (140) 을 유효하게 하여 동적 경로 모델 (165) 을 형성시킨다. 일단 완료되면, 동적 경로 모델 (165) 은 모델 데이터베이스 내에서 저장될 수 있다. 보다 바람직한 구현예에 있어서, 분석 엔진 (160) 은 하나 이상의 산출 장치 (예를 들어, 디스플레이, 프린터, 웹 서버, 등) 를 설계하여 동적 경로 모델 (165) 을 제시할 수 있다.
분석
따라서, 본 발명의 주제에 따른 시스템은 전형적으로 경로 엘리먼트 데이터베이스를 포함할 것이다. 상기 언급된 바와 같이, 데이터베이스는 단일 컴퓨터 상에 물리적으로 위치할 수 있는 것으로 평가되나, 분산 데이터베이스 또한 본원에 목적에 적합하다. 게다가, 데이터베이스의 특정 포맷은, 데이터베이스가 다중 경로 엘리먼트를 저장하고 복구할 수 있는 한 본 발명의 주제를 한정하지 않으며, 각 경로 엘리먼트가 하나 이상의 경로에서의 이의 관련성을 특징으로 할 수 있는 한 본 발명의 주제를 한정하지 않는다.
고려되는 경로 엘리먼트에 대해서, 경로의 일부인 모든 엘리먼트가 본원에 포함됨을 숙지한다. 결가적으로, 적합한 경로 엘리먼트는 하나 이상의 단백질 (이는 예를 들어 글리코실화, 미리스토일화 등을 통해 변형될 수 있거나 변형되지 않을 수 있음) 단독 또는 다른 세포성 성분, 다양한 핵산 (게놈 DNA, 염색체 이외의 DNA, hnRNA, siRNA, mRNA, rRNA, 등) (이는 자연 핵산 또는 재조합 핵산일 수 있음), 리피드, 호르몬, 제 2 메신저 및 약학적으로 활성 작용제 (치료제 또는 예방제로서 제공됨) 을 포함할 것이다. 따라서, 상이한 관점으로 볼 때, 고려되는 경로 엘리먼트는 다양한 기능을 가질 수 있으며, 특히 바람직한 기능은 다양한 효소 기능을 포함한다. 예를 들어, 적합한 기능은 키나아제.포스파타아제, 폴리머라아제/히드롤라아제, 프로테아제, 히드롤라아제 (특히, GTPase) 히드록실라아제, 메틸 트랜스퍼라아제/메틸라아제 등이다.
따라서, 경로 엘리먼트가 단백질인 경우, 적합한 경로 엘리먼트는 다양한 수용체, 호르몬 결합 단백질, 키나아제, 전사 인자, 개시 인자, 메틸라아제 및 메틸 트랜스퍼라아제, 히스톤 아세틸라아제 및 히스톤 디아세틸라아제를 포함한다. 유사하게는, 경로 엘리먼트가 핵산인 경우, 고려되는 경로 엘리먼트는 단백질 서열을 인코딩하는 것, 하나 이상의 게놈 조절 서열, 조절성 RNA, 및 트랜스활성화 서열을 포함할 것이다.
따라서, 특정 경로 엘리먼트에 의존적으로, 경로의 성질은 상당히 다양할 수 있고, 모든 공지된 경로는 본원에 사용되는데 적합한 것으로 평가된다. 예를 들어, 고려되는 경로는 신호 전환, 세포 순환, 세포 성장 및/또는 대사, 손상 기전 (특히, DNA 손상), 및 신경 신호에 연관될 수 있다. 결과적으로, 특히 바람직한 경로는 칼슘/칼모듈린 의존적 신호화 경로 및 기능적으로 연계된 경로 네트워크, 사이토카인 매개된 신호화 경로 및 기능적으로 연계된 경로 네트워크, 케모카인 매개된 신호화 경로 및 기능적으로 연계된 경로 네트워크, 성장 인자 신호화 경로 및 기능적으로 연계된 경로 네트워크, 호르몬 신호화 경로 및 기능적으로 연계된 경로 네트워크, MAP 키나아제 신호화 경로 및 기능적으로 연계된 경로 네트워크, 포스파타아제 매개된 신호화 경로 및 기능적으로 연계된 경로 네트워크, Ras 슈퍼패밀리 매개된 신호화 경로 및 기능적으로 연계된 경로 네트워크, 및 전사 인자 매개된 신호화 경로 및 기능적으로 연계된 경로 네트워크를 포함한다. 따라서, 경로는 개별 경로 및 경로 네트워크 내 경로, 및 심지어 별도의 경로 네트워크의 네트워크 내 경로일 수 있는 것으로 평가된다. 예를 들어, 본원에서 고려되는 경로는 조절 경로 네트워크 이내에 존재할 수 있다. 예를 들어, 고려되는 경로 네트워크는 노화 경로 네트워크, 세포사멸 경로 네트워크, 항상성 경로 네트워크, 대사성 경로 네트워크, 복제 경로 네트워크, 및 면역 반응 경로 네트워크를 포함한다.
따라서, 경로 엘리먼트의 속성 유형 및 수치는 상당히 다양할 수 있으며, 특정 경로 엘리먼트는 속성의 유형 및 수치 값을 결정하는데 큰 부분을 차지할 것으로 평가된다. 예를 들어, 경로 엘리먼트가 핵산인 경우, 속성은 복수사, 특정 하플로타입 또는 돌연변이, 조절 엘리먼트 (예를 들어, 프로모터, 억제제 등), 전사 수준 또는 번역 수준일 수 있다. 게다가, 고려되는 속성은 또한 클래스 속성 (예를 들어, 유전자는 특정 전사 인자에 의해 활성화되거나, 특정 호르몬 반응 엘리먼트 등에 민감함) 을 포함할 것이며, 화합물 속성 (예를 들어, 2 개 이상의 상이한 속성을 나타냄) 일 수 있다. 유사하게, 경로 엘리먼트가 단백질인 경우, 속성은 번역의 양, 단백질 활성, 보조인자에 대한 요건, 활성을 제공하기 위한 다중 단백질 복합체의 포맷 요건 등) 일 수 있다.
상기로부터 알 수 있듯이, 일부 이상의 경로 엘리먼트에 대한 일부 이상의 속성은 종래 연구로부터 공지될 것이고 공개될 것이고 따라서 특정 경로 엘리먼트에 대한 연역적 공지 속성으로서 고려되는 시스템 및 방법에서 사용될 수 있다. 반면, 수치적 속성은 연역적으로 공지되나, 공지되지 않은 많은 다양한 속성이 정확도의 합당한 양호한 기대치를 가질 수 있는 것으로 평가된다. 예를 들어, 경로 엘리먼트가 수용체에 대한 게놈 서열인 경우, 그리고 서열이 트랜스활성화제 결합 서열 엘리먼트에 의해 진행되는 경우, 경로 엘리먼트 중 하나의 속성은 트랜스활성화제의 결합에 대한 요건으로 가정되는 것이 합당할 수 있다. 게다가, 트랜스활성화의 정도는 유사한 제어 서열에 대해 공지되어 있으며, 경로 엘리먼트의 전사 수준은 합당하게 추론될 수 있다.
따라서, 가정 속성은 임의대로 가정된 값이 아니나, 가정은 부분 이상 공지된 정보를 기초로 하는 것을 평가된다. 게다가, 가정 속성의 종류 및 값은 참조 경로의 기능인 것으로 평가된다. 예를 들어, 가장 전형적으로는, 참조 경로는 건강한 세포의 경로이다. 따라서, 속성의 수치적 범위 및 속성 종류는 전형적으로는 정상 세포의 그것을 반영할 것이다. 그러나, 비-정상 세포 또한 참조 경로로 확립되는데 이용될 수 있는 것으로 이해된다.
경로 엘리먼트의 속성이 하나 이상의 다른 경로 엘리먼트의 하나 이상의 속성에 자주 의존적이기 때문에, 다차원 경로 맵은 개념상 단순하게 구축될 수 있고 각 속성의 정량적 범위에 대한 필요성 없이 효과적인 방식으로 구축될 수 있다. 실제로, 속성에 의해, 발현 수치 선형 값 뿐만 아니라 기능적 정보 및 독립성, 복합 경로 패턴은 이제 현저한 해결 및 정확도를 갖고 수립될 수 있다.
이러한 경로 패턴은 전형적으로는 경로 엘리먼트 데이터베이스에 커플링되는 변형 엔진을 사용하여 생성되며, 이때 변형 엔진은, (1) 제 1 경로 엘리먼트를 하나 이상의 연역적 공지 속성과 연계시키기 위해, (2) 제 2 경로 엘리먼트를 하나 이상의 가정 속성과 연계시키기 위해, 그리고 (3) 각각 공지 속성 및 가정 속성을 사용하여 하나 이상의 경로에 대한 제 1 및 제 2 결로 엘리먼트의 교차-상관관계를 비교하고 인플루언스 수준을 할당하기 위해 사용되어, 최종적으로 확률적 경로 모델을 형성시킨다. 예를 들어, 제 1 경로 엘리먼트를 하나 이상의 연역적 공지 속성과 연계시키는 것은 수많은 방식으로 행해질 수 있다. 그러나, 속성이 경로 엘리먼트와 직접 연계되는 속성의 n개 한벌 속성 중 하나로서 발현되는 것이 특히 바람직하다. 가장 전형적으로는, 공지 속성은 피어-리뷰 공보로부터 유도된다. 그러나, 제 2 의 정보원 (예를 들어, SWISSPROT, EMBL, OMIM, NCI-PID, Reactome, Biocarta, KEGG, 등과 같은 다양한 데이터베이스로부터의 편집되고 공개적으로 입수가능한 정보) 또한 적합한 것이다. 유사하게, 가정 속성은 경로 엘리먼트와 수동적으로 연계될 수 있으며, 보다 바람직하게는 적어도 반자동 방식으로 연계될 수 있다.
교차-상관관계는 수많은 기술을 통해 달성될 수 있다. 일부 구현예에 있어서, 경로 엘리먼트는 수동적으로 교차-상관관계를 비교할 수 있다. 그러나, 보다 바람직한 구현예에 있어서, 엘리먼트는 하나 이상의 자동화 기술을 통해 교차-상관관계를 비교할 수 있다. 예를 들어, 수많은 엘리먼트는 가능한 상관관계를 찾기 위해 변형 엔진을 통해 이들의 특성에 대해 분석될 수 있다. 변형 엔진은 다변량 분석, 유전적 알고리즘, 추론 합리화 또는 다른 기술을 통해 이러한 상관관계를 추구하기 위해 설계될 수 있다. 추론 이유의 예는 연역 논리, 추출 논리, 귀납 논리 또는 다른 형태의 논리를 포함하는 다양한 논리 형태에 적용물을 포함할 수 있다. 상이한 논리 형태의 적용을 통해 (특히, 추출 논리 또는 귀납 논리), 고려되는 엔진은 조사자가 간과할 수 있는 가능한 상관관계를 발견할 수 있다. 추론 합당화의 또다른 예는 약식 보급, 루피 약식 보금, 판단 트리, 합류 트리, 가변 제거 또는 다른 추론법과 같은 확률적 모델 상의 추론법을 이용한 적용물을 포함할 수 있다.
인플루언스 수준은 가정 속성이 공지 속성을 갖는 엘리먼트를 포함하는 경로 상에서 갖는 정량적 값을 나타낸다. 인플루언스 수준은 단일 값 또는 다중 값을 포함할 수 있다. 단일 값의 예는 평가 하의 경로 시스템 내에서 다른 공지된 인플루언스에 대해 절대값 또는 정상화 값으로서, 가중화 인자를 포함할 수 있다. 다중 값의 인플루언스 수준의 예는 가능한 분포 폭을 갖는 값의 범위를 포함할 수 있다. 또한, 인플루언스 수준의 초기 값은 수동적으로 설정되는 것을 포함하는 다양한 기술을 통해 수립될 수 있다. 보다 바람직한 구현예에 잇어서, 초기 값은 변형 엔진에 의해 제형화되는 수동적 추정을 통해 수립될 수 있다. 예를 들어, 하나 이상의 엘리먼트 또는 경로 특성에 따른 상대적인 "거리" 는 인플루언스 수준을 가중화하는데 사용될 수 있다. 거리는 정확한 거리일 수 있거나 거리의 제곱일 수 있다. 다른 예에서, 인플루언스 수준은 경로 시스템 내의 다른 값 중 모든 값 사이에서 인플루언스 수준의 가능성을 최대화함으로써 측정될 수 있다.
인플루언스의 할당 및 교차-상관관계는 경로 엘리먼트에 대해 수득된 가정 속성을 기초로 하여 수립된다. 게다가, 경로 엘리먼트가 이미 공지된 경로 엘리먼트이기 때문에, 각 경로에 대한 엘리먼트의 연계는 연역적으로 수립됨을 주목한다. 그러나, 기존 공지된 시스템 및 방법과는 대조적으로, 이렇게 확립된 확률적 경로 모델은 인플루언스의 교차-상관관계 및 할당을 이용하는 주어진 경로 내에서 각 엘리먼트에 대한 기능적 상호관계의 예측 및 가중화 효과를 허용한다. 물론, 확률적 경로 모델이 건강한 세포 및 조직에 대해 수립될 수 있고 노화된, 장애가 있는 또는 질병이 있는 세포 또는 조직에 대해 수립될 수 있는 것으로 이해된다.
가장 바람직하게는, 분석 엔진은 환자 샘플의 복수의 엘리먼트에 대한 측정 속성 대다수로부터 동적 경로 맵을 유도하는데 확률적 경로 모델을 사용할 것이다. 예를 들어, 환자 샘플은 생물학적 플루이드, 생검 또는 수술 표본으로부터 유래될 수 있고, 이는 당업계에 익히 공지된 방법을 사용하여 전형적으로 분석될 것이다. 따라서, 다른 적합한 속성 중에서, 측정 속성은 돌연변이, 차등 유전자 서열 대상, 하나 이상의 특정 유전자에 대한 유전자 복사수, 하나 이상의 특정 유전자에 대한 전사 수준, 하나 이상의 특정 단백질에 대한 번역 수준, 단백질 활성, 단백질 상호작용, 분석물 (예를 들어, 대사산물) 의 존재 및/또는 양 또는 질병의 마커 등을 포함할 것이다.
특히 바람직한 양태에서, 측정 속성은 확률적 경로 모델로부터 편차를 나타낼 수 있는 동적 경로 맵에 도달하기 위해 확률 경로 모델에 공급된다. 따라서, 특정 경로에 대한 참조 경로 활성 정보 (이는 정상 조직, 질병 조직, 노화 조직 또는 회복 조직 등일 수 있음) 를 사용자에게 제공할 것으로 평가된다. 결과적으로, 상이한 관점으로 볼 때, 동적 경로 맵은 사용자가, 측정 속성의 상대적으로 제한된 수치를 기초로 하여 환자 샘플 중의 하나 이상의 경로에 관련된 정보를 용이하게 확인하도록 할 것이다.
따라서, 본 발명자들은 또한 복수의 경로 엘리먼트를 포함하는 확률 경로 모델을 저장하는 모델 데이터베이스로의 접근법이 사용자에게 제공되는 동적 경로 맵을 생성하는 방법을 고려하였다. 물론, 이러한 접근법은 특성 용도에 따라 부분 이상 결정되는 특정 접근 프로토콜로서 다양한 방식으로 제어될 수 있다. 그러나, 접근법은 페이퍼-사용 접근법 또는 사전 자동화 접근법이 일반적으로 바람직하다. 대안적으로는, 모델 데이터베이스는 또한 공개적으로 접근 가능한 네트워크를 통해 접근될 수 있다. 이미 논의된 바와 같이, 일부 이상의 복수의 경로 엘리먼트를 교차-상관관계 비교하고 공지 속성을 기초로 하여 하나 이상의 경로에 대한 인플루언스 수준에 대해 할당하고, 또다른 수의 복수의 경로 엘리먼트를 교차-상관관계 비교하고 가정 속성을 기초로 하여 하나 이상의 경로에 대한 인플루언스 수준에 대해 할당하고, 분석 엔진이 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정 속성으로 확률적 경로 모델을 변형하여 동적 경로 맵을 수득하는 것이 일반적으로 바람직하며, 이때 동적 경로는 특정 경로에 대한 참조 경로 활성 정보를 포함하는 것이 가장 바람직하다.
물론, 고려되는 시스템 및 방법은 표준 경로 모델에 대한 제 1 샘플 (예를 들어, 건강체 공여체를 나타냄) 의 분석에 적합할 뿐만 아니라, 이러한 시스템 및 방법은 또한 건강 조직과 비교하여 질병 조직의 환자간 분석을 허용하여 조직에 대한 경로 활성 정보가 예측되게 하는 것으로 평가된다. 따라서, 동일한 환자로부터 2 개의 샘플을 사용함으로써 (즉, 질병 조직 및 비-질병 조직으로부터), 특정 약학제제에 대한 질병 조직의 감수성을 예측할 수 있다. 결과적으로, 본 발명자들은 또한, 동적 경로 맵을 저장하는 모델 데이터베이스에 대한 접근이 제공되는 생물학적 관련 정보를 분석하는 방법을 고려하였으며, 이때 DPM 은 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정 속성을 이용하여 확률적 경로 모델의 변형에 의해 생성된다. 이후, 복수의 측정 속성은 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대해 수득되며, 동적 경로 맵 및 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정 속성은 분석 엔진에 의해 사용되어, 제 2 세포 또는 환자 샘플에 대한 예측 경로 활성 정보를 결정한다.
결과적으로, 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 측정 속성은 건강한 세포 또는 조직, 세포 또는 조직의 특정 연령, 세포 또는 조직의 특정 질병, 질병 세포 또는 조직의 특정 질병 단계, 특정 성별, 특정 민족 그룹, 특정 직업 그룹 및 심지어 특정 종에 대한 특징일 수 있다. 이렇게 컴퓨터 작업한 정보는 직업, 약학 치료, 질병에 대한 경향에 대해 실제 또는 가능한 경로 차이에 대한 귀중한 정보를 제공할 수 있다. 따라서, 제 1 및 제 2 샘플은 동일한 세포 또는 환자로부터 동시에 수득될 수 있고, 상이한 시기에 (가장 전형적으로는 치료가 개시된 후) 수득될 수 있다. 본원에 제시되는 시스템 및 방법의 수많은 사용이 고려되나, 특정 바람직한 사용은 환자가 DPM, 및 약물 개발을 기반으로 하는 하나 이상의 약물에 대한 질병 세포의 감수성에 대해 시험된 것이다. 이러한 용도에 있어서, 환자 또는 환자 샘플은 치료되고 (전형적으로는, 수술, 방사선 치료 및 약학 제제 투여), 제 2 의 잠재적인 치료 값을 수용한다.
이러한 시스템 및 방법을 사용하여, 예측 경로 활성 정보로 하나 이상의 경로에서 계층적으로 우세한 엘리먼트로서 경로 엘리먼트를 확인할 수 있으며, 질병에 대해 하나 이상의 경로에서 질환-결정적 엘리먼트로서 경로 엘리먼트를 확인할 수 있다. 결과적으로, 약학적 개입은 원하는 결과를 달성하는 높은 가능성을 갖는 표적화 방식으로 사용될 수 있다. 예측 경로 활성 정보가 의사에게 제공되는 경우, 예측되는 경로 활성 정보의 그래프 제시는 개업의에게 더욱 필요한 것으로 생성되는 것이 바람직하다. 게다가, 예측 경로 활성 정보는 질병 진단, 예후 예측 또는 권고사항 (예를 들어, 치료 선택사항 선택 또는 식이 가이드라인) 을 공식화하기 위해 시스템 및/또는 사용자에 의해 사용될 수 있는 것으로 간주된다. 대안적으로 또는 추가적으로, 예측 경로 활성 정보는 또한 후생 인자, 스트레스 적합화, 유기체 상채 및/또는 손상 또는 치료 상태를 확인하기 위해 사용될 수 있다.
본 발명의 개념에서 벗어나지 않는 한 상기 변형 이외의 많은 변형이 가능함이 당업자에게 명백하다. 따라서, 본 발명의 주제는 첨부된 특허청구범위의 범주 이내에서는 한정되지 않는다. 게다가, 명세서 및 특허청구범위 둘 모두를 설명하는데 있어서, 모든 용어는 문맥과 일치시키는 방식으로 이해되어야 한다. 특히, 용어 "포함하다" 및 "포함하는" 은 비-배제적인 방식으로 엘리먼트, 성분 또는 단계가 참조 엘리먼트, 성분 또는 단계가 참조되지 않은 다른 엘리먼트, 성분 또는 단계와 존재하거나, 이용되거나, 조합될 수 있음을 나타내는 것으로 이해되어야 한다. 명세서에서 A, B, C, .... 및 N 으로 이루어진 군으로부터 선택되는 것을 하나 이상을 지칭하는 경우, A + N, 또는 B + N, 등이 아니라, 상기 군으로부터 오직 하나의 엘리먼트를 요구하는 것으로 이해되어야 한다.
추가의 구현예에서, 아직 개발되지 않은 임의의 분자 생물학 기술에 폴리뉴클레오티드 핵산이 사용될 수 있다, 단 비제한적으로, 트리플릿 유전자 코드 및 특정 염기쌍 상호작용으로서의 특성을 포함하는 현재 알려져 있는 핵산 분자의 특성에 의존한다.
본 발명은 한정으로서가 아닌 본 발명의 특정 양상 및 구현예의 설명만을 목적으로 하는 하기 예를 참조로 더욱 쉽게 이해될 것이다.
실시예
실시예 I: 데이터 소스
NCBI 유전자 발현 옴니버스 (GEO) 로부터 관련된 어레이 플랫폼 주석을 갖는 수납번호 GPL5737 하에 Chin (2007 supra) 의 유방암 카피 수 데이터를 수득하였다.
프로브 주석을 UCSC Cancer Genomics Browser (Zhu:2009, supra) 및 후속 분석에서 디스플레이하기 위해 BED15 포맷으로 전환시켰다. 어레이 데이터를 프로브 ID 를 통해 프로브 주석에 매핑하였다. Naderi (2007, supra) 로부터의 매치된 발현 데이터를 수납 번호 E-UCon-1 을 갖는 EBI 에서 MIAMIExpress 로부터 수득하였다. Agilent 웹사이트로부터 HumanlA (V2) 에 대한 플랫폼 주석 정보 얻었다. 발현 데이터를 프로브-레벨 중앙-정규화시키고, 프로브 ID 를 통해 HUGO 유전자 명칭으로 매핑하였다.
모든 샘플-프로브 값을 포함하는 순위 절차를 사용하여 모든 데이터를 비모수로 정규화하고, 각 유전자-샘플 쌍을 순위에 기초한 부호를 갖는 p-값으로 제공하였다. 유의하게 변화된 유전자-샘플 쌍을 측정하기 위해 최대 p-값인 0.05 를 사용하였다.
Affymetrix U133A 플랫폼에서 230 개의 환자 샘플 및 10 개의 인접한 정상 조직에 대한 유전자 발현을 제공하는 TCGA Data Portal 로부터 TCGA 의 교모세포종 데이터를 얻었다. 환자 샘플의 프로브를, 각 프로브의 중앙 정상 값을 공제함으로써 정상 조직에 대해 정규화하였다. 또한, 환자의 동일한 세트에 대한 CBS 세그먼트화된 (Olshen:2004 supra p1618) 카피 수 데이터를 수득하였다. 유방암 데이터와 동일한 절차를 사용하여 데이터세트 모두를 비모수로 정규화하였다.
실시예 II: 경로 개요
본 발명자는 National Cancer Institute Pathway Interaction Database (NCI PID) (Schaefer:2009 supra) 로부터 입수한 큐레이트된 경로의 세트를 수집하였다. 각 경로는 내적 및 외적 하위-세포-, 세포-, 조직-, 또는 유기체-레벨 이벤트 및 표현형을 기술하는 높은-레벨의 생체분자 과정 주위에 함께 논리적으로 그룹화된 한 세트의 상호작용을 나타낸다. BioPAX 레벨 2 포맷된 경로를 다운로드하였다. Rasqal RDF 엔진을 사용하여 SPARQL 질의로 모든 독립체 및 상호작용을추출하였다.
본 발명자는 3 개의 물리적 독립체 (단백질-코딩 유전자, 소형 분자, 및 복합체), 유전자 패밀리, 및 추상 과정을 포함하는 5 개의 상이한 유형의 생물학적 독립체 (독립체) 를 추출하였다. BioPAX 단백질에 대한 교차-참조가 별개의 유전자로부터의 단백질을 열거할 때마다 유전자 패밀리를 생성하였다. 유전자 패밀리는 유전자의 무리를 나타내고, 이 무리에서 임의의 단일 유전자는 특적 기능을 수행하기에 충분하다. 예를 들어, 서로를 위해 기능적으로 보상하는 것으로 밝혀진 불필요한 역할 및 유전자를 갖는 동족체를 패밀리로 조합한다.
추출은 상이한 유형을 기술하는 주석을 갖는 경로에서 사용되는 모든 독립체의 리스트 및 상호작용을 생성하였다. 본 발명자는 또한 추상 과정, 예컨대 NCI 수집에서 발견될 수 있는 일반적인 과정으로 지칭되는 "세포자멸사" 를 추출하였다. 예를 들어, p53 종양 억제 유전자를 포함하는 상호작용을 상세히 알려주는 경로는 기계-학습 분류화에 대한 특징으로서 레버리지될 수 있는 서열 및 세포자멸사로의 연결을 포함한다.
예상대로, C2E 상관관계는 중간이지만, 우연히 예상되는 것보다 활성 상호작용 중에서 양의 상관관계에 대해 놀라운 강화를 가졌다 (도 3). E2E 상관관계는 더욱 강했고 유사하게 풍부했다. 따라서, 특성화를 이룰 수 없는 암의 예에서조차, 경로 상호작용의 유의한 서브세트가 게놈 변이를 유전자 발현에서의 조절에 접속시키는데, 이는 경로-레벨 접근법이 추구할 가치가 있는다는 발상을 뒷받침한다.
실시예 III: 생물학적 경로의 모형화 및 예측
본 발명자는 우선 각 NCI 경로를 별개의 확률적 모델로 전환시켰다. p53 세포자멸사 경로의 작은 단편의 모형예를 도 2 에 나타냈다. NCI 의 경로 다이어그램을 숨긴 및 관찰된 상태 둘 모두를 포함하는 인자 그래프로 전환시켰다. 상기 인자 그래프는 유전자- 및 생물학적 과정-관련 상태 정보에 대한 관찰을, 독립체들 중에서 알려진 상호작용을 기술하는 구조와 통합시킨다.
생물학적 경로를 인자 그래프로 나타내기 위해서, 세포에서의 독립체의 상태, 예컨대, 특정 mRNA 또는 복합체를 기술하기 위한 변수를 사용하고, 상기 독립체들 간의 상호작용 및 정보 흐름을 나타내기 위해 인자를 사용한다. 이러한 변수들은 분자 독립체의 직접적인 농도보다는 오히려 "대조" 또는 정상 레벨과 비교할 때 각 독립체의 \textit{미분} 상태를 나타낸다. 이러한 표현은 유전자의 차별적 상태를 직접 측정하거나 직접적인 측정을 매치된 대조군에 관한 측정으로 전화시키는 많은 고 처리량 데이터세트, 예컨대 DNA 마이크로어레이로 검출된 유전자 발현을 모형화할 수 있게 한다. 또한 유전자들 중에서 많은 유형의 조절 관계를 고려한다. 예를 들어, p53 의 유비퀴틴-의존성 분해를 매개하는 MDM2 를 기술하는 상호작용은 p53 의 단백질 레벨을 저해하는 활성화된 MDM2 로서 모형화될 수 있다.
인자 그래프는 독립체가 서로의 함수로서 생물학적 유의한 값을 채용하도록 하는, 인자, m 비-음의 함수의 세트 또는 각 독립체 X = {x1, x1,...., xn,} 에 대한 무작위 변수를 사용하여 세포의 상태를 부호화한다. j-th 인자 Φj 는 독립체 X j ⊂X 의 서브세트에 대한 확률 분포를 정의한다.
독립체 및 인자의 전체 그래프는 모든 독립체에 대한 결합 확률 분포를 하기로서 부호화한다:
Figure pat00001
[식 중에서,
Figure pat00002
은 정규화 상수이고 S X 는 S 가 X 에서 변수들의 '세팅' 임을 나타냄].
각 독립체는 (예를 들어, 정상 조직에서 측정된 바와 같은) 대조 레벨에 대해 활성화된, 공칭, 또는 비활성화되는 것에 해당하는 3 가지 상태들 중 하나를 사용하고, 각각 1, 0, 또는 -1 로서 부호화하였다. 상기 상태들은 독립체 (예를 들어, 유전자, 단백질 등) 의 유형에 상이하게 의존하는 것으로 이해될 수 있다. 예를 들어, 활성화된 mRNA 독립체는 과다발현을 나타내는 반면, 활성화된 게놈 카피 독립체는 게놈에 존재하는 2 개 초과의 카피를 나타낸다.
도 2 는 단일 단백질-코딩 유전자에 대한 인자 그래프의 개념적 모델을 나타낸다. 경로에서 각 단백질-코딩 유전자 G 에 있어서, 독립체가 도입되어 게놈의 카피 수 (G DNA), mRNA 발현 (G mRNA), 단백질 레벨 (G 단백질), 및 단백질 활성 (G 단백질) 을 나타냈다 (도 2 에서 타원형으로 표시된 "DNA", "mRNA", "단백질", 및 "활성"). 경로에서 모든 화합물, 단백질 복합체, 유전자 패밀리, 및 추정 과정에 있어서, 본 발명자는 분자 유형 "활성" 을 갖는 단일 변수를 포함한다.
도 2 에서의 예는 오로지 하나의 과정 ("세포자멸사") 만을 보여주는 반면, 실제로는 많은 경로가 유전자 활성의 출력 (예를 들어, "세포자멸사" 및 "노화") 에서부터 입력 (예를 들어, "DNA 손상") 까지 모든 것을 나타내는 복합 과정을 갖는다.
인자의 구성을 간소화하기 위해서, 본 발명자는 우선 경로를 방향 그래프로 전환시키고, 그래프에서 각 엣지를 포지티브 또는 네거티브 영향을 갖도록 라벨링한다. 우선, 모든 단백질 코딩 유전자 G 에 있어서, 본 발명자는 카피 수에서부터 단백질 생성물의 활성화된 형태의 존재까지 유전자의 발현을 반영하기 위해서 G DNA 에서부터 G mRNA 까지 G mRNA 에서부터 G 단백질 까지 및 G 단백질 에서부터 G 단백질 까지 "포지티브" 라벨을 갖는 엣지를 추가한다. 경로에서 모든 상호작용은 방향 그래프에서 단일 엣지로 전환시킨다.
상기 방향 그래프를 사용하여, 본 발명자는 인자 그래프를 명시하기 위해 인자 리스트를 그린다. 모든 변수 xi 의 경우, 본 발명자는 단일 인자 φ(Xi) 를 추가하며, 상기 Xi = {xi} ∪{페어런트}(xi)} 이고 페어런트(xi) 는 방향 그래프에서 xi 의 페어런트 모두를 지칭한다. 모든 값의 설정을 위한 인자의 값은 xi 가 페어런트 (xi) 의 설정으로 인한 예상 값과 일치하는지에 따라 다르다.
이 연구를 위해, 예상된 값을 페어런트의 다수 보트 (vote) 로 설정하였다. 페어런트가 양의 엣지에 의해 연결된다면, 인자의 값에 +1 회 그 자체의 상태의 보트를 기여한다. 반대로, 페어런트가 음의 엣지에 의해 연결된다면, 변수는 -1 회 그 자체의 상태를 보트한다. "최소" 로 라벨링된 엣지에 의해 결합된 변수는 단일 보트를 얻고, 상기 보트 값은 상기 변수의 최소 값이고, AND-유사 결합을 생성한다. 유사하게는 "최대" 로 라벨링된 엣지에 의해 Xj 에 연결된 변수는 단일 보트를 얻고, 상기 보트 값은 상기 변수들의 최대 값이고, OR-유사 연결을 생성한다. 0 의 보트는 기권된 보트로서 처리된다. 보트가 없다면, 예상되는 상태는 0 이다. 그렇지 않으면, 다수의 보트가 예상된 상태이고, 1 과 -1 사이의 타이 (tie) 는 -1 의 예상된 상태를 야기하여 리프레서 및 결실에 더욱 중점을 둔다. 예상된 상태의 정의를 고려하여, φi(xi, 페어런트(xi)) 가 하기와 같이 명시된다:
Figure pat00003
본원에 나타낸 결론에 있어서, ε 를 0.001 로 설정하였으나, 엡실론의 선택에서 자릿수 차이는 결과에 유의한 영향을 미치지 않았다. 최종적으로, 본 발명자는 경로 및 다차원의 기능적 게놈 데이터의 통합을 완료하기 위해서 관찰 변수 및 인자를 인자 그래프에 추가한다 (도 2). 각 이산된 함수적 게놈 데이터세트는 단백질-코딩 유전자의 분자 유형들 중 하나와 관련된다.
카피 수 변동의 어레이 CGH/SNP 추정치는 '게놈' 유형과 관련된다. 유전자 발현 데이터는 'mRNA' 유형과 관련된다. 상기 결과에 나타나지 않더라도, 장래 확장은 'mRNA' 유형을 갖는 DNA 메틸화 데이터 및 '단백질' 및 '활성' 유형을 갖는 프로테오믹스 및 유전자-재서열분석 데이터를 포함할 것이다. 각 관찰 변수는 또한 3진수 값이 된다. 데이터의 각 관찰 유형과 관련된 인자는 다음에 설명되는 바와 같이, 모든 독립체를 공유하고 데이터로부터 학습된다.
실시예 IV: 추론 및 변수 추정
지정 D = {x1 = s1, x2 = s2, ..., xk = sk,} 세트가 관찰 변수 색인된 1 내지 k 에 대한 모체를 위한 데이터의 완전한 세트를 나타내도록 한다. {S D X} 가 D 에서의 지정과 일치하는 변수 X 의 세트의 모든 가능한 지정 세트를 나타내도록 한다; 즉, 임의의 관찰 변수 x1 D 에서의 그들의 지정에 고정되는 반면 숨은 변수는 달라질 수 있다.
환자 데이터를 제공함으로써, 본 발명자는 특정 숨은 독립체 x1 이 상태 a 에 있을 가능성이 있는지, 예를 들어, TP53 의 단백질 활성이 -1 (비활성화됨) 이거나 '세포자멸사' 가 +1 (활성화됨) 인 가능성이 얼마나 되는지를 추정하기를 원한다. 이를 위해서, 본 발명자는 환자의 데이터를 관찰하기 전에 이벤트의 사전 확률을 계산해야만 했다. A i(a) 가 싱글톤 지정 세트 {x1 = a } 를 나타낸다면, Φ 는 충분히 명시된 인자 그래프이고, 상기 사전 확률은 하기와 같다:
Figure pat00004
[식 중에서, Z 는 방정식 (1) 에 도입된 정규화 상수임]. 유사하게는, x1 의 확률은 환자에 대해 관찰된 모든 것에 따른 상태 a 에 있다:
Figure pat00005
.
본 발명자는 경로의 대부분에 대한 HUGIN 업데이트와 함께 접합 트리 추론 알고리즘을 사용하였다. 환자 당 추론이 3 초 보다 더 길게 걸리는 경로의 경우, 본 발명자는 서열 업데이트, 10-9 의 수렴 허용, 및 최대 10,000 반복과 함께 Belief Propagation 을 사용하였다. 모든 추론을 log 도메인이 아니라 실제 도메인에서 수행하였고, libDAI (Mooij:2009 supra) 를 사용하여 수행하였다.
관찰 인자의 변수를 학습하기 위해서, 기대치-최대화 (EM) 알고리즘 (Dempster (1977) supra) 을 사용하였다. 간단히, EM 은 숨은 변수의 확률이 제공된 우도를 최대화하기 위해 모수를 변화시키는 것 사이를 반복함으로써 숨은 변수를 갖는 모델에서의 변수를 학습한다. 본 발명자는 EM 을 수행하기 위해 libDAI 에 코드를 기재하고 제공하였다. 각 경로를 위해, 본 발명자는 각 환자에 대한 인자 그래프를 생성하고, 환자의 데이터를 적용시키고, 우도가 0.1 % 미만으로 변화될 때까지 EM 을 작동시켰다. 본 발명자는 각 경로로부터 학습된 모수를 평균화하였고, 그 후 상기 모수들을 사용하여 각 모수에 대한 최종 사후 신뢰를 계산하였다.
추론 후, "활성" 분자 유형을 갖는 각 변수에 대한 통합 경로 활성을 추론하였다. 페어런트의 데이터가 독립체 i'의 활성이 상승 또는 하락한다는 신념을 증가시키는 정도를 반영하는 방정식 2 및 3 으로부터의 양을 사용하는 log-우도비를 계산하였다:
Figure pat00006
그리고 나서 하기와 같이 log-우도비에 기초하는 유전자에 대한 단일 통합 경로 활성 (IPA) 을 계산하였다:
Figure pat00007
직감적으로, IPA 점수는 log-우도비, L 의 부호화된 아날로그를 반영한다.
유전자가 활성화될 가능성이 더욱 큰 경우, IPA 는 L 에 설정된다. 대안적으로, 유전자가 비활성화될 가능성이 더욱 큰 경우, IPA 는 log 우도비의 음으로 설정된다. 유전자가 변화되지 않을 가능성이 더욱 큰 경우, IPA 는 0 으로 설정된다. 각 경로를 다른 경로와 독립적으로 분석한다. 따라서, 유전자는 복합적인 추론과 관련될 수 있고, 유전자가 나타나는 각 경로에 대해서는 하나이다. 동일한 유전자에 대한 다른 추론은 유전자의 경로 컨텍스트의 함수로서 데이터의 대안적인 해석으로서 여겨질 수 있다.
실시예 V: 중요성 평가
본 발명자는 데이터의 두 개의 상이한 순열에 의해 IPA 점수의 중요성을 평가한다. 순열 "이내" 의 경우, 데이터의 신규 튜플 (즉, 매칭된 유전자 발현 및 유전자 카피 수)을 선택함으로써 순열된 데이터 샘플을 생성하는데, 우선 랜덤 실제 샘플을 선택한 후, 동일한 경로에서 각 유전자에 대한 튜플이 선택될 때까지 동일한 경로 이내로부터 랜덤 유전자를 선택한다. "임의의" 순열의 경우, 절차는 동일하지만, 랜덤 유전자 선택 단계는 게놈의 어디에서라도 유전자를 선택할 수 있다. 두 가지 유형의 순열에 있어서, 1,000 순열배치된 샘플이 생성되며, 각 순열된 샘플에 대한 교란 점수가 계산된다. 순열배치된 샘플로부터의 교란 점수의 분포는 참 샘플의 중요성을 추정하기 위해서 영 분포로서 사용된다.
실시예 VI: 신호화 경로 영향 분석 (SPIA)
Tarca (2009, supra) 의 신호화 경로 영향 분석 (SPIA) 을, 실행시간을 감소시키고 우리의 분석 환경과 호환시키기 위해 C 에서 수행하였다. 본 발명자는 또한 더 많은 버보스 출력을 제공하는 능력을 추가하여서 SPIA 및 PARADIGM 출력을 직접 비교할 수 있었다. SPIA 의 버전은 경로에서 각 독립체의 누적된 교란 및 교란 인자를 출력할 수 있다.
실시예 VII: 미끼 경로
각각의 암 데이터세트에 대한 미끼 경로 세트를 생성하였다. 각 NCI 경로를 사용하여, 동일한 구조로 이루어졌지만 경로의 모든 유전자가 RefGene 에서의 랜덤 유전자에 대해 치환되는 미끼 경로를 생성하였다. 모든 복합어 및 추상 과정을 동일하게 유지시켰고, PARADIGM 및 SPIA 모두에 대한 중요성 분석을 실제 및 미끼 경로 모두를 포함하는 경로의 세트에 대해 작동시켰다. 상기 경로를 각 방법 이내에서 순위화하고 전체 경로에 대한 실제 경로의 부분을 계산하여 시각화하였다.
실시예 VIII: 군집화 및 카플란-마이어 분석
Eisen (1998 supra p1621) 의 방법을 사용하여 교모세포종 데이터에 대해 중심 연결을 갖는 비중심 상관관계 계층적 군집을 수행하였다. 75 명의 환자 샘플에 대한 0.25 이상의 신호를 갖는 IPA 만이 군집화에 사용되었다. 육안 검사로, 4 개의 명확한 군집을 나타냈고, 카플란-마이어 분석에 사용하였다. R 을 사용하여 카플란-마이어 곡선을 계산하였고, 로그-순위 통계량을 통해 p-값을 수득하였다.
실시예 IX: PARADIGM 의 검증
EM 훈련 절차의 품질을 평가하기 위해서, 본 발명자는 유전자 발현 및 카피 수 (E,C) 의 튜플이 유전자 및 환자에 대해 순열 배치되어 있는 공 데이터세트에 대한 실제 환자 데이터를 사용하여 EM 의 수렴을 비교하였다. 예상대로, PARADIGM 은 공 데이터세트에 비해 실제 데이터세트에 훨씬 더 신속히 수렴되었다. 예로서, EM 반복의 함수로서 유전자 AKT1 에 대한 IPA 를 도표로 나타냈다 (도 4). 활성이 제 1 두세번의 반복에서 신속히 수렴하는 것을 볼 수 있다. EM 은 실제 환자 데이터로 훈련되는 경우 활성화된 레벨로 신속히 수렴하였지만, 랜덤 데이터를 제공하는 경우에는 변함없는 활성으로 수렴되었다. 수렴은 경로 구조를 제시하고 추론은 통합된 환자 데이터에서 활성의 패턴을 성공적으로 확인할 수 있다.
이어서 유방암 및 GBM 코호트 둘 모두에 대한 PARADIGM 을 실행하였다. 본 발명자는 음의 분포로부터 예상되는 것보다 IPA 가 유의하게 상이하다는 것을 측정하기 위한 통계적 시뮬레이션 절차를 개발하였다. 본 발명자는 경로에서 환자 모두 및 유전자에 대해 순열배치함으로써 음의 분포를 구축하였다. 실증적으로, 본 발명자는 경로에서 유전자들 중에서만 순열배치하는 것은, 각 유전자가 네트워크에 의해 결정된 상이한 토폴로지 컨텍스트를 갖는다는 사실을 보정하기 위해 필수적임을 밝혀내었다. 유방암 데이터세트에서, 56,172 IPA (전체 중의 7 %) 가 매치된 음의 대조군 보다 유의하게 더 높거나 낮다는 것을 밝혀내었다. 평균적으로, NCI 경로는 환자 당 497 개의 유의한 독립체를 가졌고 127 개 중에서 103 개 경로가 환자의 20 % 이상에서 변화된 하나 이상의 독립체를 가졌다. GBM 데이터세트에서, 141,682 IPA (전체 중의 9 %) 가 매치된 음의 대조군 보다 유의하게 더 높거나 낮다는 것을 밝혀내었다. 평균적으로, NCI 경로는 환자 당 616 개의 유의한 독립체를 가졌고 127 개 중에서 110 개 경로가 환자의 20 % 이상에서 변화된 하나 이상의 독립체를 가졌다.
다른 대조군으로서, 본 발명자는 통합된 활성이 NCI 경로에서 유전자와 동일한 방식으로 연결된 임의적인 유전자로부터 수득될 수 있는지를 물었다. 이를 위해서, 본 발명자는 거짓 발견률을 추정하고 SPIA (Tarca: 2009 supra) 와 비교하였다. 많은 유전 네트워크가 암에 연루되어 있는 것이 밝혀졌기 때문에, 본 발명자는 음의 대조군 세트로서 모조의 "미끼" 경로를 사용하는 것을 선택했다. 각 NCI 경로에 있어서, 본 발명자는 NCI 경로와 동일한 네트워크 구조를 함께 사용하여 게놈에서 랜덤 유전자를 연결함으로써 미끼 경로를 구축하였다.
본 발명자는 NCI 및 미끼 경로 둘 모두에 대한 IPA 를 유도하기 위해 PARADIGM 및 SPIA 를 실행시켰다. PARADIGM 의 경우, 본 발명자는 경로 크기에 의한 정규화 후 환자에 대해 유의한 것으로 밝혀진 다수의 IPA 에 의해 각 경로를 순위화하였다. SPIA 의 경우, 계산된 영향 인자에 따라 경로를 순위화하였다. 본 발명자는 PARADIGM 이 SPIA 에 비해 가장 높은 활성화된 경로로부터 더 많은 미끼 경로를 배제한다는 것을 밝혀내었다 (도 5). 예를 들어, 유방암에서, PARADIGM 은 상위 10 에서 1, 상위 30 에서 2 그리고 상위 50 에서 4 의 미끼를 차지하였다. 대조적으로, SPIA 는 상위 10 에서 3, 상위 30 에서 12 그리고 상위 50 에서 22 의 미끼를 차지하였다. NCI IPA 에 대한 순위의 전체 분포는 순위의 누적 분포를 도표로 만들어 관찰한 바 SPIA 보다 PARADIGM 에서 더 높았다 (P <$ 0.009, K-S 시험).
실시예 X: 유방암 및 GBM 에서의 상위 PARADIGM 경로
본 발명자는 순열 분석에 의해 검출된 독립체 당 유의한 IPA 의 평균 수에 따라 NCI 경로를 분류하고 유방암 (표 1) 및 GBM (표 2) 에서 상위 15 를 계산하였다.
상위 15 중에서 여러 경로는 각 암에 사전에 연루되어 있었다. 유방암에서, SPIA 및 PARADIGM 둘 모두는 에스트로겐- 및 ErbB2-관련된 경로를 검출할 수 있었다. 최근 주요 메타-분석 연구 (Wirapati P, Sotiriou C, Kunkel S, Farmer P, Pradervand S, Haibe-Kains B, Desmedt C, Ignatiadis M, Sengstag T, Schuetz F, Goldstein DR, Piccart M, Delorenzi M. Meta-analysis of gene expression profiles in breast cancer: toward a unified understanding of breast cancer subtyping and prognosis signatures. Breast Cancer Res. 2008;10(4):R65.) 에 있어서, Wirapeti 등은 에스트로겐 수용체 및 ErbB2 상태가 유방암에서 오로지 3 개의 주요 예후 시그니처 중 두개인 것을 밝혀내었다. PARADIGM 은 또한 여러 샘플에서 유의한 IPA 를 갖는 최고 경로로서 AKT1-관련된 PI3K 신호화 경로를 확인할 수 있었다 (도 6 참조).
유방암에서 상위 PARADIGM 경로
순위 명칭 평균a SPIAb
1 Akt 에 의해 매개된 클래스 I PI3K 신호화 이벤트 20.7 아니오
2 넥틴 접착 경로 14.1 아니오
3 인슐린-매개 글루코스 수송 13.8 아니오
4 ErbB2/ErbB3 신호화 이벤트 12.1 예
5 p75(NTR)-매개 신호화 11.5 아니오
6 HIF-1-알파 전사 인자 네트워크 10.7 아니오
7 PTP1B 에 의해 매개된 신호화 이벤트 10.7 아니오
8 원형질막 에스트로겐 수용체 신호화 10.6 예
9 미감작 CD8+ T 세포에서의 TCR 신호화 10.6 아니오
10 안지오포이에틴 수용체 Tie2-매개 신호화 10.1 아니오
11 클래스 IB PDK 비-지질 키나아제 이벤트 10.0 아니오
13 오스테오폰틴-매개 이벤트 9.9 예
12 IL4-매개 신호화 이벤트 9.8 아니오
14 엔도텔린 9.8 아니오
15 신경영양 인자-매개 Trk 신호화 9.7 아니오
a 독립체당 유의한 활성이 검출되는 샘플의 평균 수.
b 경로가 SPIA 의 상위 15 위 내에 있으면 예; 없으면 아니오.
GBM 에서의 상위 PARADIGM 경로
순위 명칭 평균a SPIAb
1 래트 티로신 키나아제에 의한 신호화 46.0 아니오
2 간세포 GFR 에 의해 활성화된 신호화 이벤트 43.7 아니오
3 엔도텔린 42.5 예
4 Arf6 다운스트림 경로 42.3 아니오
5 HDAC 클래스 III 에 의해 매개된 신호화 이벤트 36.3 아니오
6 FOXM1 전사 인자 네트워크 35.9 예
7 IL6-매개 신호화 이벤트 33.2 아니오
8 FoxO 패밀리 신호화 31.3 아니오
9 LPA 수용체 매개 이벤트 30.7 예
10 ErbB2/ErbB3 신호화 이벤트 30.1 아니오
11 p38-알파 및 p3B-베타에 의해 매개된 신호화 28.1 아니오
12 HIF-1-알파 전사 인자 네트워크 27.6 예
13 비-유전자자극 (Non-genotropic) 안드로겐 신호화 27.3 아니오
14 p38 MAPK 신호화 경로 27.2 아니오
15 P13K 에 의해 매개된 IL2 신호화 이벤트 26.9 아니오
a 독립체당 유의한 활성이 검출되는 샘플의 평균 수.
b 경로가 SPIA 의 상위 15 위 내에 있으면 예; 없으면 아니오.
항-세포자멸사적 AKT1 세린-트레오닌 키나아제는 유방암에 연루된 것으로 알려져 있고 ERBB2 경로와 상호작용한다 (Ju X, Katiyar S, Wang C, Liu M, Jiao X, Li S, Zhou J, Turner J, Lisanti MP, Russell RG, Mueller SC, Ojeifo J, Chen WS, Hay N, Pestell RG. Aktl governs breast cancer progression in vivo. Proc. Natl. Acad. Sci. U.S.A. 2007 May;104(18):7438-7443). GBM 에서, FOXM1 및 HIF-1-알파 전사 인자 네트워크 둘 모두는 광범위하게 연구되어 낮은-등급 신경교종에 비해 높은-등급 교모세포종에서 과발현되는 것을 나타냈다 (Liu M, Dai B, Kang S, Ban K, Huang F, Lang FF, Aldape KD, Xie T, Pelloski CE, Xie K, Sawaya R, Huang S. FOXM1B is overexpressed in human glioblastomas and critically regulates the tumorigenicity of glioma cells. Cancer Res. 2006 Apr.;66(7):3593-3602; Semenza GL. HIF-1 and human disease: one highly involved factor. Genes Dev. 2000 Aug.;14(16): 1983-1991).
실시예 XI: 데이터세트의 시각화
PARADIGM 추론의 결과를 시각화하기 위해서, 본 발명자는 경로에서 각 유전자를 중심으로 복합 데이터세트를 표시하기 위한 "원형지도" 시각화를 개발하였다 (도 7). 이러한 표시에서, 각 유전자는 유전자 둘레에 동심 고리를 그려 코호트에 대한 그의 데이터 모두와 관련되고, 각 고리는 단일 유형의 측정 및 전산 추론에 해당한다. 고리에서 각 체크표시는 단일 환자 샘플에 해당하는 반면 색상은 활성의 활성화된 (적색), 비활성화된 (청색), 또는 변함없는 (흰색) 레벨에 해당한다. 본 발명자는 ErbB2 경로의 서브세트에 대한 원형지도를 그리고, 유방암 코호트로부터의 ER 상태, IPA, 발현, 및 카피 수 데이터를 포함시켰다.
유전자 발현 데이터는 여러 암에 대한 분자 아류형을 정의하기 위해서 잘 사용되어 왔다. 암 아류형은 상이한 임상 결과, 예컨대 약물 감수성 및 전생존과 연관되어 있는 것을 밝혀내었다. 본 발명자는 미가공 발현 데이터보다 오히려 PARADIGM IPA 를 사용하여 GBM 에 대한 유익한 아류형을 확인할 수 있는지를 물었다. IPA 를 사용하는 장점은 유전자들 중에서 카피 수, 발현, 및 알려진 상호작용의 요약을 제공하고 따라서 의미있는 환자 하위군을 설명하기 위해서 더 많은 로버스트 시그니처를 제공할 수 있다는 것이다. 본 발명자는 우선 GBM 샘플에 대해 적어도 알맞게 주기적으로 활성화되는 모든 IPA 를 측정하고, 1,755 개의 독립체는 229 개의 샘플 중 75 개 이상에서 IPA 가 0.25 인 것을 밝혀내었다. 본 발명자는 활성 매트릭스에서 상기 독립체들에 대한 IPA 의 모두를 수집하였다. 샘플 및 독립체는 비중심 피어슨 상관계수 및 중심 연결을 갖는 계층적 군집을 사용하여 군집화되었다 (도 8).
육안 검사를 통해 제 1 의 3 개와는 명백히 다른 제 4 아류형을 갖는 IPA 에 기초하는 4 개의 명백한 아류형이 드러났다. 제 4 군집은 HIF-1-알파 전사 인자 네트워크의 확실한 하향조절뿐만 아니라 E2F 전사 인자 네트워크의 과다발현을 나타낸다. HIF-1-알파는 저산소 조건에 대한 반응 조절에 관련된 마스터 전사 인자이다. 대조적으로, 제 1 의 3 개의 군집 중에서 2 개는 상승된 EGFR 시그니처 및 GATA 인터루킨 전자 캐스캐이드를 수반하는 비활성 MAP 키나아제 캐스캐이드를 갖는다. 흥미롭게는, EGFR 에서의 돌연변이 및 증폭은 높은 등급의 신경교종뿐만 아니라 교모세포종과 관련되어 있다 (Kuan CT, Wikstrand CJ, Bigner DD. EGF mutant receptor vIII as a molecular target in cancer therapy. Endocr. Relat. Cancer 2001 Jun.;8(2):83-96). 증폭 및 특정 돌연변이는 이량체의 자기 자극을 통하거나 리간드-독립적인 활성화를 통해 구성적으로 활성인 EGFR 을 생성할 수 있다. EGFR 의 구성 활성화는 고형 종양의 발암 및 진행을 촉진시킬 수 있다. 표적 EGFR 에게 알려진 분자인 게피티닙은 현재 다른 EGFR-주도적 암에서 그의 효험에 대해 조사되고 있다. 따라서, 정성적으로, 상기 군집들이 환자를 계층화할 수 있는 생물학적으로 의미있는 주제 쪽으로 진행되고 있는는 것으로 나타났다.
이러한 관찰을 수량화하기 위해서, 본 발명자는 PARADIGM 에 의해 확인된 상이한 GBM 아류형이 상이한 생존 프로파일과 일치하는지를 물었다. 본 발명자는 초기 진단 후 개월 수에 대한 생존한 환자의 비율을 도표로 그려 4 개의 군집의 각각에 대한 카플란-마이어 곡선을 계산하였다. 본 발명자는 별개의 EPA 시그니처와 관련된 임의의 군집이 생존 결과를 예측하는 지를 보기 위해서 4 개의 군집 각각에 대해 카플란-마이어 생존 곡선을 그렸다 (도 9). 제 4 군집은 다른 군집들과 유의하게 상이하다 (P < 2.11 x 10-5; 콕스 비례 위험 시험 (Cox proportional hazards test)). 제 1 의 3 개의 군집에서 환자의 반이 지난 18 개월을 살았다; 생존자는 군집 4 의 환자가 유의하게 증가하였고 그중 반은 과거 30 개월을 생존하였다. 또한, 20 내지 40 개월 범위를 넘어, 군집 4 에서의 환자의 생존 가능성은 다른 군집의 환자의 2 배이다.
실시예 XII: 군집에 대한 카플란-마이어 생존 플롯
생존 분석을 통해, 군집 4 의 환자가 유의하게 더 나은 생존 프로파일을 갖는다는 것이 밝혀졌다. 군집 4 가 망막아세포종 종양 억제자와 함께 작용하는 E2F 의 상향조절을 갖는 것을 밝혀내었다. 따라서 E2F 의 상향조절은 군집 4 에서 환자의 종양 샘플에서의 세포 주기 진행의 활성 억제와 일치한다. 또한, 군집 4 는 HEF-1-알파 전사 인자의 비활성과 관련되었다. 제 4 군집에서 비활성은 종양이 더 많이 산소화된다는 마커일 수 있으므로 종양이 더 작아지거나 새로운 종양일 수 있다는 것을 암시한다. 따라서, PARADIGM IPA 는 현저하게 상이한 생존 결과를 갖는 아류형을 기술하기 위해 의미있는 프로파일 세트를 제공한다.
비교를 위해서, 본 발명자는 또한 환자 아류형을 유도하기 위해 발현 데이터 또는 CNA 데이터만을 사용하여 환자를 군집화하려는 시도를 하였다. 상기 데이터 소스들의 어떤것을 사용하는 군집화로부터, 상기 데이터세트의 원래 TCGA 분석에서 발견한 것과 일치하는 명백한 군을 찾지 못했다 (TCGA:2008) (도 14 참조). 이는 유전자들 중의 상호작용 및 그 결과 생성되는 각각의 유전자 발현의 결합 출력이 환자 결과로서 복잡한 표현형의 더 나은 예측변수를 제공할 수 있는 것을 암시한다.
실시예 XIII: 난소암의 통합된 게놈 분석: 샘플 및 임상 데이터.
이 보고는 489 임상적으로 주석달린 단계 II-IV HGS-OvCa 및 상응하는 정상 DNA 의 분석을 포함한다. 환자는 HGS-OvCa 을 진단받은 개체의 진단시 연령, 단계, 종양 등급, 및 수술 결과를 반영하였다. 임상 데이터는 2010 년 8 월 25 일자의 현재이다. 모든 환자가 백금제를 받고 94 % 는 탁산을 받은 것을 제외하고는 전신 치료 전에, HGS-OvCa 표본을 외과적으로 절제하였다. 코호트의 무진행 및 전체 생존의 중앙치는 이전에 발표된 시험 11, 12 와 유사하다. 환자의 25 % 는 질환이 없는 채 남아있고, 45 % 는 마지막 후속 조치시에 살아 있었으나, 31 % 는 백금계 치료를 완료한 후 6 개월 이내에 진행하였다. 후속 중앙치는 30 개월이었다 (0 내지 179 범위). TCGA 분석을 위해 > 70 % 종양 세포 핵 및 < 20% 괴사를 갖는 샘플을 선택하였다.
독립적인 부위에서 다각적 분자 어세이를 사용하는 좌표화된 분자 분석을 표 4 에 나열된 바와 같이 2 개의 티어 (Tier) 에서 수행하였다 (데이터는 http://tcga.cancer.gov/dataportal 에서 입수가능). 티어 1 (Tier one) 데이터세트는 공개적으로 입수가능하나, 티어 2 데이터세트는 개체를 확인할 수 있는 임상적 또는 게놈 정보를 포함하므로 http://tcga.cancer.gov/dataportal/data/access/closed/ 에 기술된 바와 같은 자격을 요구한다.
실시예 XIV: 돌연변이 분석.
각 개체의 316 개의 HGS-OvCa 샘플 및 매칭된 정상 샘플로부터 단리된 DNA 에 대해서 엑솜 포획 및 서열분석을 수행하였다. 포획 시약은 비이중화 서열의 총 ~33 메가염기의 ~18,500 유전자로부터 ~180,000 엑손을 표적으로 하였다. Illumina GAIIx 플랫폼 (236 개의 샘플 쌍) 또는 ABI SOLiD 3 플랫폼 (80 개의 샘플 쌍) 에 대한 대량 병렬 서열분석은 샘플 당 ~14 기가염기를 산출하였다 (전체 ~9 x 109 염기). 평균적으로, 코딩 베이스의 76 % 가 돌연변이 검출을 확신하는 종양 및 매치된 정상 샘플 둘 모두에 대해 충분히 심도있게 포함된다 19,356 개의 체세포 돌연변이 (종양 당 ~61) 에 주석을 달고 표 4 에 분류하였다. HGS-OvCa 병태생리에서 중요할 수 있는 돌연변이는 (a) 백그라운드에 비해 상당히 증가된 빈도로 존재하는 비-동의 또는 스플라이스 부위 돌연변이를 조사하고, (b) 본 연구에서의 돌연변이와 COSMIC 및 OMIM 의 돌연변이를 비교하고 (c) 단백질 기능에 대한 영향을 예측함으로써 확인되었다.
두 개의 상이한 알고리즘은 비동의 또는 스플라이스 부위 돌연변이의 수가 돌연변이 분포 모델에 근거하여 예상된 것 이상으로 유의한 9 개의 유전자를 확인하였다 (표 5). 공개된 결과 13 과 일치하는 TP53 는 316 개의 샘플 중 303 개에서 돌연변이가 되었고 (283 은 자동화 방법에 의하고, 20 은 매뉴얼 검토 후임), BRCA1 및 BRCA2 는 각각 9 % 및 8 % 의 경우에서 생식계열 돌연변이를 가졌고, 둘 모두는 추가 3 % 의 경우에서 체세포 돌연변이를 나타냈다. 통계적으로 재발하는 돌연변이되는 6 개의 다른 유전자는 RB1, NF1, FAT3, CSMD3, GABRA6,CDK12 로 확인되었다. CDK12 는 RNA 스플라이싱 조절 14 에 관련되고 이전에는 폐 및 대장 종양 15, 16 에 연루되었었다. 9 개의 CDK12 돌연변이 중 5 개는 기능의 잠재적 손실을 암시하는 넌센스 또는 삽입-결실 (indel) 인 반면, 4 개의 미스센스 돌연변이 (R882L, Y901C, K975E, 및 L996F) 는 이의 단백질 키나아제 도메인에서 군집화되었다. GABRA6 및 FAT3 둘 모두가 상당히 돌연변이된 것으로 나타났지만 HGS-OvCa 또는 나팔관 조직에서는 발현된 것으로 나타나지 않아서, 상기 유전자의 돌연변이가 HGS-OvCa 에서 유의한 역할을 하는 가능성이 덜하다.
덜 보편적으로 돌연변이되는 추가적인 HGS-OvCa 유전자를 확인하기 위해서, 본 연구의 돌연변이를 COSMIC 17 및 OMIM 18 데이터베이스에서의 돌연변이와 비교하였다. 이로부터 BRAF (N581S), PIK3CA (E545K 및 H1047R), KRAS (G12D), 및 NRAS (Q61R) 에서의 돌연변이를 각각 포함하는 477 및 211 것을 산출하였다. 이러한 돌연변이가 변형 활성을 나타내는 것으로 보여져서, 본 발명자는 상기 돌연변이들이 드물기는 하지만 HGS-OvCa 에서 중요한 주도자인 것으로 여긴다.
본 발명자는 전체 척추동물 게놈 및 단백질 패밀리의 서열 정렬로부터의 진화 정보를 조합하고, 국소 단백질 구조를 예측하고, 인간 SwissProt 단백질 특징을 선택하여, 알려진 발암유전자 및 종양 억제자에서 돌연변이에 훈련한 후 CHASM 19,20 을 사용하여 추정되는 주도자 돌연변이 확인하였다. CHASM 확인된 122 미스센스 돌연변이가 발암성인 것으로 예측한다. 단백질 기능에서의 돌연변이-주도 변화는, Mutation Assessor 를 사용하여 알려져 있거나 동족계 3차원 단백질 구조에서 단백질 패밀리 서열 정렬 및 잔여 대체를 비교함으로써 확인된 체세포 미스센스 돌연변이 모두에 대한 진화 정보로부터 추론되었다. 미스센스 돌연변이의 27 % 가 단백질 기능에 영향을 주는 것으로 예측되었다.
실시예 XV: 카피 수 분석
489 HGS-OvCa 게놈에 존재하는 체세포 카피 수 변동 (SCNA) 을 확인하고 도 37A 의 다형성아교모세포종 데이터와 비교하였다. SCNA 는 확장된 염색체 영역에 영향을 주는 영역 일탈 및 더 작은 초점 일탈로 나뉘었다. 영역 일탈의 통계 분석으로 8 개의 재발 습득 및 22 개의 상실을 확인하였고, 이들 모두는 이전에 보고되었다 22 (도 37B). 습득 중 5 개 및 상실 중 18 개는 종양의 50% 초과에서 발생하였다.
GISTIC 는 재발 초점 SCNA 를 확인하기 위해 사용되었다. 이것은 8 개 이하의 유전자를 인코딩하는 26 개를 포함하여 초점 증폭의 63 개 영역 (도 37C) 을 산출하였다. 가장 흔한 초점 증폭은 각각 종양의 20% 초과에서 고도로 증폭된 CCNE1, MYC, 및 MECOM (도 37C) 을 인코딩하였다. HGS-OvCa 중의 새롭게 빽빽하게 위치하는 증폭 피크는 활성화된 C-키나아제, ZMYND8; p53 표적 유전자, IRF2BP2; DNA-결합 단백질 저해자, ID4; 배발달 유전자, PAX8; 및 텔로머라아제 촉매성 서브유닛, TERT 에 대한 수용체를 코딩하였다. 3 가지 데이터 출처: http://www.ingenuity.com/, http://clinicaltrials.gov 및 http://www.drugbank.ca 가 증폭된, 과발현된 유전자의 가능한 치료적 저해자를 확인하는데 사용되었다. 상기 연구로 적어도 10% 의 경우에서 증폭된 MECOM, MAPK1, CCNE1KRAS 를 포함하는 치료 표적인 22 개의 유전자를 확인하였다.
GISTIC 는 또한 50 개의 초점 결실을 확인하였다. 공지된 종양 억제 유전자 PTEN, RB1, 및 NF1 은 종양의 적어도 2% 에서 동질접합적 결실의 영역 내에 있었다. 중요하게는, RB1NF1 은 또한 상당히 돌연변이된 유전자 중에 있었다. 하나의 결실은 필수 세포 주기 조절 유전자, CREBBP 를 포함하여 5 개의 비-동의 및 2 개의 프레임시프트 돌연변이를 갖는 오직 3 개의 유전자만을 함유하였다.
실시예 XVI: mRNA 및 miRNA 발현 및 DNA 메틸화 분석.
3 개의 상이한 플랫폼 (Agilent, Affymetrix HuEx, Affymetrix U133A) 으로부터 11,864 개의 유전자에 대한 발현 측정은 아류형 확인 및 결과 예측에 대해 조합되었다. 개별적인 플랫폼 측정은 제한된, 그러나 통계적으로 유의한 배치 효과로 고생한 반면, 조합된 데이터 세트는 그렇지 않았다. 조합된 데이터세트의 분석으로 NMF 일치 군집화에 대해 사용되었던 약 1,500 개의 본질적으로 가변성인 유전자를 확인하였다. 상기 분석은 4 가지 군집을 산출하였다 (도 38a). Tothill et al. 로부터의 공개 이용가능한 데이터세트에 적용된 동일한 분석 접근법은 또한 4 개의 클러스트를 산출하였다. Tothill 및 TCGA 클러스트의 비교는 명확한 상관관계를 보여주었다. 그러므로 적어도 4 개의 로버스트 발현 아류형이 HGS-OvCa 에 존재한다는 결론을 내렸다.
군집 내 유전자 함량 및 이전 관찰25에 근거하여 4 개의 HGS-OvCa 아류형 면역반응성 (Immunoreactive), 분화성 (Differentiated), 증식성 (Proliferative) 및 간엽성 (Mesenchymal) 이라는 용어를 붙였다. T-세포 케모카인 리간드, CXCL11CXCL10, 및 수용체, CXCR3 은 면역반응성 (Immunoreactive) 아류형을 특징으로 하였다. 높은 발현의 전사 인자, 예컨대 HMGA2SOX11, 낮은 발현의 난소 종양 마커 (MUC1, MUC16) 및 높은 발현의 증식 마커, 예컨대 MCM2PCNA 는 증식성 (Proliferative) 아류형으로 정의되었다. 분화성 (Differentiated) 아류형은 높은 발현의 MUC16MUC1 과, 그리고 분비 나팔관 마커 SLPI 와 연관되어 있어, 더욱 성숙한 단계의 발달을 암시한다. 높은 발현의 HOX 유전자 및 마커는 간엽성 (Mesenchymal) 아류형을 특징으로 하는 예컨대 근섬유아세포 (FAP) 및 미세혈관 혈관주위세포 (ANGPTL2, ANGPTL1) 에 대한 증가된 기질 성분을 암시한다.
평가된 DNA 메틸화 및 감소된 종양 발현은 나팔관 대조군26과 비교하여 HGS-OvCa 에서 후생적으로 침묵된 168 개 유전자에 연루되었다. DNA 메틸화는 모든 샘플에 대해 감소된 유전자 발현과 연관되었다. AMT, CCL21SPARCL1 이 대부분의 종양에서 프로모터 과메틸화를 나타내기 때문에 이들이 두드러졌다. 이상하게도 난소암에서 증폭되고 과발현되는 것으로 이전에 보고된 RAB25 는 또한 종양의 부분집합에서 후생적으로 침묵된 것으로 나타났다. BRCA1 프로모터는 이전에 보고된 바와 같은 489 개 중 56 개 (11.5%) 종양에서 과메틸화되고 침묵되었다. 종양 간의 가변 DNA 메틸화의 공통 군집화는 연령, BRCA 비활성화 사건, 및 생존에서 차이와 크게 연관되었던 4 개의 아류형을 확인하였다. 그러나, 군집은 오직 적당한 안정성만을 입증하였다.
생존 지속기간은 TCGA 데이터세트에서 전사 아류형에 대해 유의하게 상이하지 않았다. 증식성 (Proliferative) 군은 MYC 증폭 및 RB1 결실의 속도 감소를 보인 반면, 면역반응성 (Immunoreactive) 아류형은 증가된 빈도의 3q26.2 (MECOM) 증폭을 보였다. DNA 메틸화 군집과 유전자 발현 아류형 사이의 적당한, 그러나 유의한 중복이 주지되었다 (p<2.2* 10-16, 카이 (Chi)-제곱 검정, 조정 란드 지수 (Adjusted Rand Index) = 0.07).
전반적인 생존의 193 개의 유전자 전사 시그니처 예측은 215 개의 샘플로부터 통합된 발현 데이터 세트를 사용하여 정의되었다. 단변량 Cox 회귀 분석 후, 108 개의 유전자가 열악한 생존과 관련되었고, 85 개가 양호한 생존에 관련되었다 (0.01 의 p-값 절사). 예측력을 255 개의 TCGA 샘플의 독립적인 세트25,29,30 뿐 아니라 3 개의 독립적 발현 데이터 세트에 대해 검증하였다. 각각의 확인 샘플에 발현 프로파일과 예후 유전자 시그니처31 사이의 유사성을 반영하는 예후 유전자 점수를 지정하였다 (도 38c). 상기 시그니처의 카플란-마이어 생존 분석은 모든 입증 데이터 세트에서 생존과 통계적으로 유의한 관련성을 보였다 (도 38d).
miRNA 발현 데이터의 NMF 공통 군집화로 3 개의 아류형을 확인하였다. 흥미롭게도, miRNA 아류형 1 은 mRNA 증식성 (Proliferative) 아류형과 중복되고 miRNA 아류형 2 는 mKNA 간엽성 (Mesenchymal) 아류형과 중복되었다 (도 38d). 생존 기간은 상당히 오래 살아남는 miRNA 아류형 1 종양 중 환자와 iRNA 아류형 사이에서 상당히 차이가 있었다 (도 38e).
실시예 XVII: 질환에 영향을 미치는 경로.
여러 분석은 HGS-OvCa 에 기여하는 생물학을 확인하기 위한 316 개의 완전히 분석된 경우로부터의 데이터를 통합하였다. 하나 이상의 돌연변이를 숨겨주는 공지된 암-관련 경로가 있는 빈도 분석, 카피 수 변화, 또는 유전자 발현에서의 변화는 RB1 및 PI3K/RAS 경로가 67% 및 45% 의 경우에서 각각 탈조절된 것을 보여준다 (도 39A). HotNet33 을 사용하는 큰 단백질-단백질 상호작용 네트워크32 에서 변경된 서브네트워크에 대한 조사는 HGS-OvCa 샘플의 23% 에서 변경되었던 Notch 신호화 경로를 포함하는 여러 공지된 경로를 확인하였다 (도 39B).
공개된 연구는 돌연변이된 또는 메틸화된 BRCA1 또는 돌연변이된 BRCA2 를 갖는 세포가 결함 상동 재조합 (HR) 을 갖고 PARP 저해자35-37에 대해 고도로 반응성이라는 것을 보여준다. 도 39C 는 HGS-OvCa 의 20% 가 BRCA1/2 에서 생식계열 또는 체세포 돌연변이를 갖고, 11% 가 DNA 과메틸화를 통한 상실된 BRCA1 발현을 갖고, BRCA1 의 후생적 침묵이 BRCA1/2 돌연변이의 상호적으로 독점적 (P = 4.4x10-4, 피셔 (Fisher) 의 정밀 검정) 이라는 것을 보여준다. BRCA 상태의 단변량 생존 분석 (도 39C) 은 BRCA 야생형 경우보다 BRCA 돌연변이된 경우에 대해 더 나은 전반적인 생존 (OS) 을 보여주었다. 흥미롭게도, 후생적으로 침묵된 BRCA1 경우는 BRCA1/2 WT HGS-OvCa 와 유사한 생존을 나타냈다 (중앙값 OS 41.5 v. 41.9 개월, P = 0.69, log-등급 검정). 이것은 BRCA1 이 상호 배타적인 게놈 및 에피게놈 메커니즘에 의해 비활성화되고 환자 생존이 비활성화의 메커니즘에 따라 다르다는 것을 제시한다. 본 연구에서 발견된 세포가 PARP 저해자에 대해 감수성이 되도록 할 HR 유전자 중의 게놈 변형은 EMSY (8%) 의 증폭 또는 돌연변이, PTEN 의 초점 결실 또는 돌연변이 (7%); RAD51C 의 과메틸화 (3%), ATM/ATR 의 돌연변이 (2%), 및 Fanconi 빈혈 유전자의 돌연변이 (5%) 를 포함한다. 전체적으로, HR 결핍은 대략 HGS-OvCa 의 절반에 존재할 수 있으며, 종양 상기 HR-관련 이상을 표적하는 PARP 저해자의 임상시험에 대한 이유를 제공한다.
모든 재발하여 변형된 카피 수 피크에 대한 BRCA 비활성화 이벤트의 완전한 세트의 비교는 BRCA 비활성화가 있는 경우에서 CCNE1 증폭의 예상치 않게 낮은 빈도를 밝혔다 (BRCA 변형된 경우의 8% 가 CCNE1 증폭을 갖는 대비, BRCA 야생형 경우의 26%, FDR 은 조절됨 P = 0.0048). 이전에 보고된 바와 같이39, 전반적인 생존은 모든 다른 경우에 비해 CCNE1 증폭이 있는 환자의 경우 짧아지는 경향이 있었다 (P = 0.072, log-등급 시험). 그러나, 오직 BRCA 야생형 경우에만 보이는 경우 CCNE1-증폭된 경우에 대해 생존 불이익이 명백하지 않아 (P = 0.24, log-등급 시험), 이전에 보고된 CCNE1 생존 차이가 BRCA-돌연변이된 경우의 더 나은 생존에 의해 설명될 수 있다고 제시된다.
마지막으로, 확률적 그래프 모델 (PARADIGM40) 은 87% 의 경우에서 유의하게 변형된 것으로 FOXM1 전사 인자 네트워크 (도 39D) 를 확인하는 NCI 경로 상호작용 데이터베이스에서 변형된 경로에 대해 조사하였다. FOXM1 및 이의 증식-관련 표적 유전자; AURB, CCNB1, BIRC5, CDC25, 및 PLK1 은 일관적으로 과발현되었으나, 전사 조절의 지표인 DNA 카피 수 변화에 의해 변경되지 않았다. TP53FOXM1 후 DNA 손상42을 억제하여, HGS-OvCa 중 높은 비율의 TP53 돌연변이가 FOXM1 과다발현에 기여한다는 것을 암시한다. 다른 데이터세트에서, FOXM1 경로는 인접 상피 조직에 비해 종양에서 상당히 활성화되고, HGS-OvCa 와 연관된다.
실시예 XVIII: 난소 장액성 암종 중의 자주 변형된 경로
카피 수 및 유전자 발현 모두의 통합 분석을 통해 상당히 변형된 경로를 확인하기 위해, PARADIGM 을 적용하였다. 컴퓨터 모델은 경로 데이터베이스에 존재하는 여러 유전자, 복합체 및 유전적 과장에 대한 통합 경로 활성 (IPA) 을 산출하기 위한 카피 수 변화, 유전자 발현 데이터, 및 경로 구조를 포함한다. 이것이 유전자, 복합체, 또는 소형 분자인 경로 중의 임의의 분자를 말하기 위해 "독립체" 라는 용어를 사용한다. 독립체의 IPA 는 오직 최종 활성 만을 말한다. 유전자의 경우, IPA 는 오직 카피 수, 유전자 발현, 및 경로 내 다른 유전자의 신호화로부터 추론된 단백질의 활성 상태의 추론된 활성을 말한다. PARADIGM 을 난소 샘플에 적용하고 National Cancer Institutes' Pathway Interaction Database (NCI-PID) 에 포함된 경로에 존재하는 과정 및 많은 상이한 유전자에서 변형을 찾았다. 동일한 구조가 있는 경로를 사용하였으나 임의의 유전자가 경로 내 상이한 지점에 지정된 1000 개의 무작위 시뮬레이션을 사용하는 추론된 변형의 유의성을 평가하였다. 즉, 제시된 경로에 대한 하나의 무작위 시뮬레이션은 상호작용 세트를 고정시켜 임의 세트의 유전자가 경로 상호작용과 함께 연결되도록 한다. 모든 샘플의 IPA 의 유의성을 각각의 샘플 내에서 각각의 독립체에 대한 유의수준을 수득하기 위해 동일한 영 분포에 대항하여 평가하였다. IPA 및 유의한 샘플의 백분율 및 적어도 0.1 의 표준 편차를 가진 IPA 는 도 28 에 열지도로서 나타내진다.
3 은 PARADIGM 에 의해 발견된 순열배치된 샘플과 관련하여 적어도 3 개의 표준 편차에 의해 변경된 경로를 보여준다. FOXM1 전사 인자 네트워크는 시험된 모든 경로 중의 최대 수의 샘플 - 샘플에 걸쳐 평균을 내었을 때 변경된 활성을 갖는 독립체의 67% 에서 변경되었다. 비교하면, 난소 코호트에서 다음으로 가장 높은 레벨의 변경된 활성을 갖는 경로는 PLK1 신호화 이벤트 (27%), 오로라 B 신호화 (24%), 및 트롬복산 A2 수용체 신호화 (20%) 가 포함된다. 그러므로, NCI-PID 내의 경로 중에서, FOXM1 네트워크는 난소 샘플과 관련하여 다른 경로보다 유의하게 더욱 변경된 활성을 갖는다.
FOXM1 전사 인자 네트워크가 가장 높은 비율의 환자 샘플에서 정상 대조군에 비해 종양 샘플에서 크게 변형된 것으로 발견되었다 (도 29). FOXM1 은 3 가지 공지된 우세한 스플라이싱 형태를 가진 다기능적인 전사 인자이고, 각각 세포 증식 및 DNA 수선에서 다양한 역할을 갖는 유전자의 별개의 서브세트를 조절한다. FOXM1c 이소형은 AUKB, PLK1, CDC25, 및 BIRC5 를 포함하는 세포 증식에서 공지된 역할을 가진 여러 표적을 직접 조절한다. 한편, FOXM1b 이소형은 DNA 수선 유전자 BRCA2 및 XRCC1 이 포함된 유전자의 완전히 상이한 서브세트를 조절한다. ATM 의 간접 조절 하에 있는 CHEK2 는 FOXM1 발현 수준을 직접 조절한다.
FOXM1 전사 인자 그 자체의 IPA 가 다른 전사 인자의 IPA 보다 더욱 고도로 변형되었는지가 궁금했다. 활성의 FOXM1 레벨을 NCI-PID 내의 다른 203 개의 전사 인자 모두와 비교하였다. NCI 세트 중의 다른 전사 인자와 비교하여, FOXM1 전사 인자는 유의하게 높은 활성 레벨을 가져 (p<0.0001; K-S 검정), 이것이 중요한 시그니처일 것이라는 것을 추가로 암시한다 (도 30).
FOXM1 이 또한 상피 기원의 많은 상이한 정상 조직에서 발현되기 때문에, 본 발명자는 PARADIGM 에 의해 확인된 시그니처가 다른 조직에서 정상인 것으로 여겨진 상피 시그니처로 인한 것인지가 궁금했다. 이를 답하기 위해서, 본 발명자는 나팔관 상피 및 난소 종양 조직을 현미해부하고 유전자 발현을 어세이한 GEO (GSE10971) 의 독립적 데이터세트를 다운로드하였다. 본 발명자는 FOXM1 의 레벨이 정상과 비교했을 때 종양 샘플에서 유의하게 더 높다는 것을 밝혀내었으면서 정상 상피 조직에서 보여지는 것 이상의 암 조직에서 확실히 상승된다는 것을 제기하였다 (도 31).
TCGA 난소에 대한 전체 코호트가 높은-등급 장액성 종양 유래의 샘플에 함유되어 있기 때문에, FOXM1 시그니처가 높은-등급 장액성에 특이적이었는지가 궁금했다. 낮은- 및 높은-등급 장액성 종양 모두가 전사적으로 프로파일링된 Etemadmoghadam et al. (2009) 의 데이터세트로부터 FOXM1 및 여러 이의 표적의 log 표현을 수득하였다. 상기 독립적인 데이터는 FOXM1 및 여러 이의 표적이 낮은-등급 난소암과 관련하여 장액성 난소에서 유의하게 상향조절되었다는 것을 확인하였다 (도 32). FOXM1 전사 인자 네트워크 중의 25 개의 유전자가 높은-등급 질환에서 높은 발현을 갖는 유전자를 상당한 비율로 함유하고 있는지를 측정하기 위해, Etemadmoghadam 로부터의 데이터를 사용하는 스튜던트 t-검정을 수행하였다. 게놈 중 723 개의 유전자 (5.4%) 가 0.05 유의수준에서 (Benjamini-Hochberg 방법을 사용하는 다중 검정에 대해 보정됨) 높은- 대 낮은-등급 암에서 유의하게 상향조절된 것으로 밝혀졌다. FOXM1 네트워크는 상이하게 조절되는 이의 유전자 중 13 개를 갖는 (52%) 것으로 밝혀졌고, 이것은 초기하 시험에 근거하여 상당한 비율이다 (P < 3.8* 10-12). 그러므로, FOXM1 네트워크 유전자의 높은 발현은 게놈 내의 전형적인 유전자의 발현과 비교하였을 때 높은-등급 질환에 특이적으로 관련되는 것으로 보인다.
유방 및 폐를 포함하는 많은 상이한 암에서 FOXM1 의 역할은 문헌에 잘 나타나 있으나, 난소암에서의 이의 역할은 조사되지 않았다. FOXM1 은 3 개의 공지된 스플라이스 변이체를 갖는 다기능적인 전사 인자이고, 각각은 세포 증식 및 DNA 수선에 다양한 역할을 갖는 유전자의 별개의 서브세트를 조절한다. 상기 분석과 관련하여 FOXM1 의 상호작용 네트워크의 발췌는 도 27 로서 제시된다. FOXM1a 이소형은 AUKB, PLK1, CDC25, 및 BIRC5 를 포함하는 세포 증식에서 공지된 역할을 갖는 여러 표적을 직접 조절한다. 대조적으로, FOXM1b 이소형은 DNA 수선 유전자 BRCA2 및 XRCC1 을 포함하는 유전자의 완전히 상이한 서브세트를 조절한다. ATM 의 간접 조절 하에 있는 CHEK2 는 FOXM1 의 발현 레벨을 직접 조절한다. 대부분의 난소 환자에서 FOXM1 의 증가된 발현 외에, 작은 서브세트는 또한 CBS 에 의해 검출되는 증가된 카피 수 증폭을 갖는다 (카피 수를 갖는 19% 는 측정된 게놈 내의 모든 유전자의 상위 5% 변위치에서 증가함). 그러므로 FOXM1 의 선택적 스플라이스 조절은 DNA 수선 및 세포 증식 사이의 조절 스위치에 관련될 수 있다. 그러나, 이소형과 엑손 어레이 프로브의 위치 사이를 구별하는 엑손 구조가 개개의 이소형 활성을 구별하게 하는 것은 어렵기 때문에 상기 주장을 뒷받침하기에는 이 시점에는 데이터가 불충분하다. 상기 샘플의 mRNA 의 추가 고 처리량 서열분석은 FOXM1 이소형의 차등 레벨의 결정을 도울 수 있다. PARADIGM 이 상기 전사 인자에 중심이 된 높은 레벨의 변경된 활성을 검출한다는 관찰은 FOXM1 이 세포 내 중요한 조절 지점에서 위치한다는 것을 암시한다.
실시예 XIX: 데이터 세트 및 경로 상호작용
카피 수 및 발현 데이터 둘다를 PARADIGM 추론에 통합시켰다. 8 개의 정상 조직 대조군 한 세트가 발현 테이터에서의 분석에 이용가능했으므로, 정상 나팔관 대조군에서 관찰된 유전자의 중간 레벨을 뺄샘하여 각 환자의 유전자-값을 정규화했다. 종양 대 정상 혈액에서 검출된 유전자 레벨 간의 카피 수 차이를 반영하도록 카피 수 데이터를 정규화했다. PARADIGM 에 입력하기 위해, 아류형 분석에 사용된 것과 동일한 통합 데이터세트로부터 발현 데이터를 취하고, MSKCC Agilent 1M 카피 수 데이터의 세그먼트화된 콜 (call) 로부터 카피 수를 취했다.
131 개의 경로, 11,563 개의 상호작용, 및 7,204 개의 독립체를 함유하는 NCI-PID 로부터 경로의 수집물을 수득했다. 독립체는 PARADIGM 의 그래프 모델에서 "노드" 로 표시되는, 분자, 복합체, 소형 분자, 또는 추상적 개념이다. 추상적 개념은 일반적 세포 과정 (예컨대 "세포자멸사" 또는 "빛의 흡수"), 및 기능적 활성을 공유하는 유전자의 패밀리 예컨대 신호 전달자의 RAS 패밀리에 해당한다. 본 발명자들은 단백질-단백질 상호작용, 전사 조절 상호작용, 단백질 변형 예컨대 인산화 및 유비퀴틴화 상호작용을 포함하는 상호작용을 수집했다.
실시예 XX: 경로 컨텍스트에서 통합된 분자 활성의 추론
본 발명자들은 PARADIGM 을 사용하여, 카피 수, 유전자 발현, 및 각 독립체의 경로 컨텍스트를 반영하는 통합 경로 활성 (IPA) 을 지정했다.
데이터의 유전자- 및 환자-특이적 단면의 순열을 사용하여 IPA 의 유의성을 평가했다. 게놈에서 각 유전자에 대한 유전자-발현 및 카피 수 값의 쌍을 무작위로 선별함으로써 1000 명의 "영 (null)" 환자에 대한 데이터를 생성시켰다. PARADIGM IPA 의 유의성을 평가하기 위해, 본 발명자들은 경로 구조를 보존하면서 유전자를 경로에 무작위로 지정함으로써 영 분포를 구축했다.
실시예 XXI: FOXM1 경로의 확인
FOXM1 경로의 시각화를 허용하기 위해 무작위 시뮬레이션 동안 FOXM1 네트워크 이내에서의 유전자를 모두 사용하여 통계적 유의성을 평가하는 한편, 도 29 에 따라 유의하게 변경된 IPA 를 갖는 FOXM1 에 직접 연결된 독립체를 선택하여 도 27 에서 포함시켰다. 이들 중에서, FOXM1 과의 상호작용에 대해 문헌 지지를 받는 것으로 밝혀진 DNA 수선 및 세포 주기 통제에서 역할을 하는 유전자가 표시되었다. 원래의 NCI-PID 경로에서 발견되지 않은 BRCC 복합체 멤버가, NCI-PID 에 따라 FOXM1 의 표적인 BRCA2 와 함께 플롯에 포함되었다. 다른 NCI 경로에서 CHEK2 의 업스트림 조절인자를 발견함으로써 업스트림 DNA 수선 표적이 확인되었다 (예를 들어, PLK3 신호화 경로에서 ATM 으로부터의 간접적 연결이 발견되었다).
실시예 XXII: 군집화
활성을 직접 나타내지 않고 활성 확률의 변화를 나타내는, 추론된 활성을 사용함으로써, 하나의 열지도 내에 다양한 유형의 독립체를 함께 군집화시킬 수 있다. PARADIGM 추론의 결과를 전체적으로 시각화하기 위해, Eisen Cluster 3.0 을 사용하여 특징 필터링 (filtering) 및 군집화를 수행했다. 0.1 의 표준 편차 필터링 결과 7204 개의 경로 독립체 중 1598 개를 남겼고, 평균 연결법 (average linkage), 비중심 상관관계 계층적 군집을 독립체 및 샘플 둘다에 대해 수행되었다.
실시예 XXIII: 세포주는 다수의 중요한 종양 아류형 및 특징을 모형화한다.
임상적으로 관련한 반응의 분자 예측변수를 확인함에 있어서 세포주의 유용성은, 종양에서의 반응을 결정하는 다양한 분자 메커니즘이 세포주에서 작동하는 정도에 의존한다. 본 발명자들은 이전에 전사물 및 게놈 카피 수 레벨9 둘다에서 세포주 모델 및 원발성 종양 간의 유사성에 대해 보고했고, 본원에서 고해상도 플랫폼 및 분석 기술을 사용하여 그 비교를 세분화한다. 구체적으로, 본 발명자들은 유전자 발현 프로파일의 계층적 공통 군집화 (HCC) 를 사용하여 50 개의 유방암 세포주 및 5 개의 비악성 유방 세포주를 다음과 같은 3 개의 전사 아류형으로 분류했다: 루미날, 기저 및 새롭게 기재된 클라우딘-낮음 (도 14A). 이들 아류형은 이전에 기재된 것들의 세분화된 버전이고, 이 경우 기저 및 클라우딘-낮음은 이전에 지정된 기저 A 및 기저 B 아류형, 각각에 연결된다, 표 7. 세분화된 고해상도 SNP 카피 수 분석 (도 14B) 은, 세포주 패널이 원발성 종양에서 발견되는 9p21 (CDKN2A) 에서의 동질접합적 결실, 및 8q24 (MYC), 11q13 (CCND1), 17q12 (ERBB2), 20q13 (STK15/AURKA) 에서의 재발성 증폭 영역을 모형화함을 확인시켜 준다. 트라스투주맙 및 라파티닙 요법에 의해 결정되는 ERBB2 종양 아류형의 임상적 적절성을 고려하여, 본 발명자들은 특별한 아류형 지정된 ERBB2AMP 로서 ERBB2 의 DNA 증폭으로 세포주를 조사했다. 종합적으로, 본 발명자들의 루미날, 기저, 클라우딘-낮음 및 ERBB2AMP 세포주의 확인은 임상 생물학과 일치한다.
실시예 XIV: 세포주는 대부분의 치료 화합물에 대해 차별적 감수성을 나타낸다.
본 발명자들은 77 가지 치료 화합물에 대한 본 발명자의 세포주 패널의 감수성을 조사했다. 본 발명자들은 9 가지 농도에서 각 작용제에 3 일간 연속 노출시킨 후 측정된 정량적 종점을 갖는 세포 성장 어세이를 사용했다. 시험된 항암 화합물은 통상적인 세포독성제 (예를 들어, 탁산, 플라티놀, 안트라사일린) 및 표적 작용제 (예를 들어, SERM 및 키나아제 저해자) 의 혼합을 포함했다. 많은 경우에, 여러 작용제가 동일한 단백질 또는 작용의 분자 메커니즘을 표적화했다. 본 발명자들은 성장을 50% 저해하는데 요구되는 농도 (GI50 로 지정함) 로서 각 화합물에 대한 반응의 정량적 측정치를 결정했다. 기초 성장 데이터가 고품질이지만, 50% 저해가 달성되지 않은 경우에, 본 발명자들은 GI50 를 시험되는 최고 농도로 설정했다. 표 8 에 모든 화합물에 대한 GI50 값이 제공되어 있다. 본 발명자들은 추가 분석에서 3 가지 화합물 (PS1145, 세툭시맙 및 바이칼레인) 을 배제했으며, 그 이유는 세포주 반응의 변이성이 최소였기 때문이다.
Sigma AKT1-2 저해자에 대한 반응의 변이와 함께 연관되는 전사 아류형을 도시하는 대표적 폭포 플롯 (Waterfall plot) 이 도 10A 에 제시되어 있다. 이러한 화합물에 대한 감수성은 루미날 및 ERBB2AMP 에서 최고이고, 기저 및 클라우딘-낮음 유방암 세포주에서 더 낮다. 모든 화합물에 대한 세포주 간의 GI50 값의 분포를 보여주는 폭포 플롯이 부록에 있다. 3 또는 4 회 반복검증한 229 가지 화합물/세포주 조합에 대해 GI50 값의 중앙 절대 편차를 계산함으로써 전체적 데이터 세트의 재현성을 확립했다. 이들 반복검증에 대한 중앙 평균 편차는 0.15 였다 (도 15). 본 발명자들은 GI50 값의 세트들 간의 쌍별 피어슨 상관계수를 계산함으로써 8 가지 화합물에 대한 반응의 일치를 평가했다 (도 15B). 작용 메커니즘이 유사한 약물의 쌍들에 대한 감수성은 상관관계가 높았고, 이는 유사한 작용 방식을 시사한다.
실시예 XV: 다수의 화합물이 세포주의 하위세트에서 우선적으로 효과적이었다.
세포주에서의 예측적 분자 특징이 인간 종양에서 반영되는 경우, 임상전 세포주 분석시 관찰되는 분자 아류형과 반응 간의 연관성이 임상시 재연될 것이라는 점이 이 연구의 중심 전제이다. 본 발명자들은 비모수 ANOVA 를 사용하여 전사 및 게놈 아류형 전체의 GI50 값을 비교함으로써 반응-아류형 연관성을 확립했다.
종합적으로, 시험된 74 개 화합물 중 33 개가 전사 아류형-특이적 반응을 보였다 (FDR p < 0.2, 표 7 및 표 9). 도 10C 는 루미날, 기저, 클라우딘-낮음 및 ERBB2AMP 아류형 중 한 가지 이상과 유의한 연관성이 있는 34 가지 작용제의 계층적 군집화를 보여준다. 아류형과 가장 강하게 연관된 11 가지 작용제는 수용체 티로신 키나아제 신호화 및 히스톤 디아세틸라아제의 저해자였고, 루미날 및/또는 ERBB2AMP 세포주에서 최고 효능을 가졌다. 차상위 3 가지 아류형-특이적 작용제 - 에토포시드, 시스플라틴, 및 도세탁셀 - 는 기저 및/또는 클라우딘-낮음 세포주에서 우선적 활성을 보였으며 이는 임상적으로 관찰된다. 익사베필론, GSK461364 (폴로 키나아제 저해자) 및 GSK1070916 (오로라 키나아제 저해자) 를 포함하는, 분열 장치를 표적화하는 작용제도 기저 및 클라우딘-낮음 세포주에 대해 더욱 활성이었다. AG1478, BIBW2992 및 게피티닙 (이들은 모두 EGFR 및/또는 ERBB2 를 표적화한다) 은 ERBB2 증폭과 양으로 연관되었다. HSP90 의 저해자인, 겔다나마이신도 ERBB2 증폭과 양으로 연관되었다. 흥미롭게도, VX-680 (오로라 키나아제 저해자) 및 CGC-11144 (폴리아민 유사체) 는 둘다 ERBB2 증폭과 음으로 연관되었으며 이는 이들이 ERBB2AMP 종양에 대한 비교적 불량한 요법임을 시사한다.
본 발명자들은 반응과 재발성 초점 높은-레벨 카피 수 이상 간의 7 가지 연관성 (6 가지 독특한 화합물) 을 확인했다 (CNA; 샘플 t-시험, FDR p < 0.2, 표 10). 도 10D 는 다음을 보여준다 (a) 9p21 (CDKN2ACDKN2B) 에서의 동질접합적 결실이 비노렐빈, 익사베필론 및 파스칼립신에 대한 반응과 연관되었다. 파스칼립신은 CDK4 를 저해했고, 이러한 특이성은 CDK420 저해에 있어서 CDKN2A 의 p16INK4A 생성물의 역할과 일치한다. (b) 20q13 (이것은 AURKA 를 인코딩한다) 에서의 증폭은 AURKBAURKC 23 을 표적화하는 GSK1070916 및 VX-680 에 대한 감수성보다는 저항성과 연관되었다. 이는 AURKA 의 증폭이 AURKBAURKC 저해자에 대한 우회 메커니즘을 제공함을 시사한다. (c) 11q13 (CCND1) 에서의 증폭은 카보플라틴 및 AURKB/C 저해자 GSK1070916 에 대한 감수성과 연관되었다.
실시예 XVI: 아류형 특이성이 성장률 효과를 지배한다.
일반적으로, 본 발명자들은 루미날 아류형 세포주가 기저 또는 클라우딘-낮음 세포보다 서서히 성장했고 (Kruskal-Wallis 시험 p = 0.006, 도 16A 및 표 7), 배가 시간의 범위가 넓었음 (18 내지 300 시간) 을 발견?다. 이는 가장 감수성인 세포주가 가장 빠르게 성장한 세포주일 가능성을 높였다. 만약에 그렇다면, 관찰된 아류형에 대한 연관성은 공변인에 대한 연관성을 나타낼 수 있다. 본 발명자들은 공분산 분석 (Analysis of Covariance: ANCOVA) 을 동시에 사용하여 아류형 및 배가 시간의 효과를 평가함으로써 이러한 가설을 시험했고, 33 가지 아류형-특이적 화합물 중 22 가지가 배가 시간보다 아류형과 더 양호한 연관성을 가졌음을 발견했다 (p-값의 평균 로그 비율 = 0.92, 표준 편차 1.11). 이는 아류형 구성원이 성장률보다 더 양호한 반응 예측변수라는 생각을 지지한다. 더욱이, 33 가지 아류형-특이적 화합물 중 15 가지가 더 서서히 성장하는 루미날 세포주에서 더 효과적이었다 (표 7). 1 가지 작용제, 5-플로로우라실은 아류형 시험에서 단독으로 유의하지 않았으나 ANCOVA 모델에서는 클래스 및 배가 시간 둘다에 대해 강한 유의성을 보였다. 루미날 및 기저 세포주 둘다에서 배가 시간이 증가함에 따라 5-플로로우라실에 대한 반응은 감소했다 (도 16B). 본 발명자들은 대부분의 경우에, 3-일 성장 저해 검정이 성장률에 의해 큰 영향을 받지 않는 분자 시그니처-특이적 반응을 탐지한다는 결론을 내린다.
실시예 XVII: 카피 수 및 전사 측정의 통합은 아류형 특이적 반응의 경로를 확인한다.
본 발명자들은 네트워크 분석 도구 PARADIGM24 를 사용하여 세포주 패널에서 아류형 간의 경로 활성의 차이를 확인했다. 분석은 큐레이트된 경로들이 부분적으로 중첩되는 사실에 의해 복잡해진다. 예를 들어 EGFR, PI3 키나아제 및 MEK 는 종종 별도의 경로로서 큐레이트되지만, 실제로 그들은 더 큰 단일 경로의 구성요소들이다. 이러한 문제를 해결하기 위해, PARADIGM 은 약 1400 개의 큐레이트된 신호 전달, 전사 및 대사 경로를 단일 중첩 경로 (슈퍼경로 (SuperPathway)) 로 병합하여 그러한 중복을 제거한다. 특정 세포주에 대한 카피 수 및 유전자 발현 데이터를 둘다 사용하여, PARADIGM 은 경로 상호작용을 사용하여 모든 유전자, 복합체, 및 세포 과정에 대한 통합 경로 레벨 (Integrated Pathway Level: IPL) 을 추론한다.
본 발명자들은 PARADIGM IPL 을 사용하는 경로 활성화에 의해 세포주를 원발성 유방 종양과 비교했다. 세포주-종양에 대한 데이터 비교는 The Cancer Genome Atlas (TCGA) 프로젝트 (http://cancergenome.nih.gov) 에 의해 생성된 데이터를 사용하여 수행했다. 도 11 은 계층적 군집화 후 각 종양 및 세포주에 대한 경로 활성을 보여준다. 각 아류형에 대한 상위 5 개의 경로 특색이 표 11 에 열거되어 있다. 종합적으로, 종양 및 세포주 아류형은 유사한 경로 활성을 보였고 탈조절된 경로는 기원보다 전사 아류형과 더 양호하게 연관되었다 (도 13). 그러나, 클라우딘 낮음 세포주 아류형과 연관된 경로는 종양에서 잘 표시되지 않는다 - 아마도 그 이유는 클라우딘-낮음 아류형이 세포주 수집물에서 과-표현되고 루미날 A 아류형이 결측되기 때문이다 (도 12).
실시예 XVIII: 아류형-특이적 경로 마커의 확인.
본 발명자들은 고유의 경로 활성이 아류형 간의 차이의 근원이 되는지 여부를 질문했다. 이를 위하여, 본 발명자들은 하나의 아류형의 세포주에서 나머지에 비해 차별적으로 상향- 또는 하향-조절되는 유전자 활성을 함유하는 슈퍼경로의 서브네트워크를 확인했다. 수집물에서 기저 세포주와 모든 다른 것들 간의 경로 활성의 비교로 941 개의 엣지에 의해 연결된 965 개의 노드로 구성된 네트워크를 확인했고, 이 경우 노드는 단백질, 단백질 복합체, 또는 세포 과정을 나타내고, 엣지는 이들 요소들 간의 단백질 인산화와 같은 상호작용을 나타낸다 (도 18-22 참조). 도 35 A 는 증식, 혈관신생, 및 종양발생과 연관되는 MYC/MAX 서브네트워크의 상향조절; 및 세포 주기, 부착, 침입, 및 대식세포 활성화를 통제하는 ERK1/2 서브네트워크의 상향조절을 보여준다. 기저 세포주에서 FOXM1 및 DNA 손상 서브네트워크가 또한 현저히 상향조절되었다. 클라우딘-낮음 아류형과 모든 다른 것들과의 비교는, 기저 세포에 비해 클라우딘 낮음 세포주에서 베타-카테닌 (CTNNB1) 네트워크의 상향조절을 포함하여, 기저 세포주에서와 동일한 서브네트워크 중 다수의 상향조절을 일부 예외와 함께 보여줬다 (도 35B). 베타-카테닌은 종양형성에 연루되고, 불량한 예후와 연관된다. 루미날 세포주와 모든 다른 것들과의 비교는, 흑색종에서 종향형성성을 저해하는 ATF2 네트워크의 하향조절, 및 ER-조절되는 유전자의 전사를 통제하고 양호한 예후 루미날 유방암에 연루되는 FOXA1/FOXA2 네트워크의 상향조절을 보여줬다 (도 35C). ERBB2AMP 세포주와 모든 다른 것들의 비교는 루미날 세포에게 흔한 다수의 네트워크 특징을 보여줬으며 - 이는 대부분의 ERBB2AMP 세포가 루미날 세포로서도 분류되기 때문에 놀랍지 않다. 그러나, 도 35D 는 ERBB2AMP 세포주에서 RPS6KBP1 에 중심이 있는 하향 조절을 보여준다.
IPL 을 사용하는 세포주 간의 차별적 약물 반응의 비교 분석은 반응 메커니즘에 대한 정보를 제공하는 경로 활성을 밝혔다. 예를 들어, 기저 세포주는 시스플라틴, DNA 손상제에 우선적으로 감수성이고, 시스플라틴34 에 대한 반응과 연관되는 핵심 역할자인 ATM, CHEK1 및 BRCA1 을 포함하는 DNA-손상 반응 서브네트워크의 상향조절을 또한 보여줬다 (도 36A). 마찬가지로, ERBB2AMP 세포주는 HSP90 의 저해자인, 겔다나마이신에 감수성이고, ERBB2-HSP90 서브네트워크에서의 상향조절을 또한 보여줬다 (도 36B). 이러한 관찰은 겔다나마이신 (이는 ERBB2 에 결합하여 그의 분해를 초래한다) 에 대한 작용 메커니즘과 일치한다. 본 발명자들은 ERBB2AMP 세포주가 오로라 키나아제 저해자 VX-680 에 저항성이고 (도 36C, 상부), 또한 이러한 화합물에 대한 감수성이 20q13 (AURKA) 에서의 증폭과 연관되지 않음을 발견했다. 이는 이러한 저항성이 FOXM1 에 의해 AURKB 와 함께 동시-조절되는, CCNB1 을 통해 매개될 수 있다는 가능성을 높인다. 4 가지 아류형 중에서, ERBB2AMP 가 유일하게 CCNB1 의 실질적 하향조절을 보여준다 (도 36C 및 도 22). 이러한 제안된 메커니즘은 원발성 종양에서, CCNB1 유전자 발현이 AURKB 유전자 발현과 유의한 상관관계에 있다는 관찰에 의해 지지된다.
실시예 XVIX: 세포 성장 저해 어세이 및 성장률
55 개의 유방암 세포주 패널에서 77 개의 화합물의 효능을 평가하였다. 이러한 어세이를 이미 기재된 바와 같이 수행하였다 (Kuo, W. L. et al. A systems analysis of the chemosensitivity of breast cancer cells to the polyamine analogue PG-11047. BMC Med 7, 77, doi: 1741-7015-7-77 [pii] 10.1186/1741-7015-7-77 (2009)). 간략히, 1:5 연속 희석에서 일련의 각각의 화합물의 9 개 투약량으로 72 시간 동안 세포를 처리하였다. Cell Titer Glo 어세이를 사용하여 세포 생존력을 측정하였다. 배가 시간 (DT) 을 비처리된 웰에 대해 72 시간 대 0 시간의 비율로부터 추정하였다.
하기 모수를 갖는 곰퍼츠 (Gompertz) 곡선과 데이터를 맞추기 위해 비선형 최소 제곱법을 사용하였다: 상부 및 하부 점근선, 기울기 및 변곡점. 맞춰진 곡선을 NCI/NIH DTP 인간 종양 세포주 스크린 방법으로 기재된 방법 및 이미 기재된 방법 (Screening Services - NCI-60 DTP Human Tumor Cell Line Screen. http://dtp.nci.nih.gov/branches/btb/ivclsp.html.; Monks, A. et al. Feasibility of a high-flux anticancer drug screen using a diverse panel of cultured human tumor cell lines. J Natl Cancer Inst 83, 757-766 (1991)) 을 사용하여, GI 곡선으로 변형하였다.
50 % 로 성장을 저해 (GI50) 하는데 필요한 화합물 농도, 성장을 완전히 저해 (총 성장 저해, TGI) 하는데 필요한 농도, 및 50 % 로 개체를 감소 (치사 농도 50 %, LC50) 시키는데 필요한 농도를 포함하는 다양한 반응 측정값을 평가하였다. 기초 성장 데이터가 고품질이나 종점 반응 (GI50, TGI, LC50) 이 도달되지 않은 경우, 그 값을 시험된 최고 농도로 설정하였다. GI50 은 도달된 제 1 한계점을 나타내므로, 가장 정확한 일련의 측정값을 포함한다.
약물 반응 데이터를 필터링하여 하기 기준을 만족시켰다: 1) 0.20 미만의 9 개의 삼중 데이터 지점에 대한 중앙 표준 편차; 2) 특정 세포주에 대한 중앙 DT 의 DT +/- 2SD; 3) 0.25 초과의 적합 곡선의 기울기; 4) 명백한 반응을 갖지 않는 데이터세트에 대한 50 % 미만의 최대 농도에서의 성장 저해. 약물 플레이트 중 약 80 % 는 모든 필터링 요건을 통과한다. GI50 의 반복 측정값의 신뢰성을 평가하기 위해 중앙 절대 편차 (MAD), 표준 편차의 로버스트 버전 (robust version) 을 사용하였다. 곡선 맞춤 및 필터링을 구입-작성된 (custom-written) R 패키지를 사용하여 수행하였다.
실시예 XX: 약물 스크리닝
통계적 분석에 포함된 각각의 약물은 데이터 품질에 대한 하기 스크리닝 기준을 만족시켰다: 1) 결측 값: 세포주의 전체 세트에 걸쳐 40 % 이하의 GI50 값이 결측될 수 있음; 2) 변산도: 3 개 이상의 세포주의 경우, GI50 > 1.5. mGI50 또는 GI50 < 0.5. mGI50 (여기서, mGI50 은 주어진 약물에 대한 중앙 GI50 임). 이러한 기준에 벗어나는 화합물은 분석으로부터 배제하였다.
실시예 XXI: SNP 어레이 및 DNA 카피 수 분석
Affymetrix Genome-Wide Human SNP Array 6.0 을 사용하여 DNA 카피 수 데이터를 측정하였다. 어레이 품질 및 데이터 처리를 aroma.affymetrix 를 기반으로 하는 R 통계 체계 (http://www.r-project.org) 를 사용하여 수행하였다. 유방암 세포주 SNP 어레이를 기재된 바와 같이 20 개의 정상 샘플 어레이를 사용하여 정규화하였다 (Bengtsson, H., Irizarry, R., Carvalho, B. & Speed, T. P. Estimation and assessment of raw copy numbers at the single locus level. Bioinformatics (Oxford, England) 24, 759-767 (2008)). 바이오전도체 패키지 DNA카피로부터의 원형 이진 세그멘테이션 (CBS: circular binary segmentation) 을 사용하여 데이터를 분할하였다 (Olshen, A. B., Venkatraman, E. S., Lucito, R. & Wigler, M. Circular binary segmentation for the analysis of array-based DNA copy numbers data. Biostatistics (Oxford, England) 5, 557-572 (2004)). 암에서의 유의한 표적의 게놈 식별 (GISTIC: Genome Identification of Significant Targets in Cancer) 을 기반으로 하는 MATLAB 을 사용하여 유의한 DNA 카피 수 변화를 분석하였다 (Beroukhim, R. et al. Assessing the significance of chromosomal aberrations in cancer: methodology and application to glioma. Proc Natl Acad Sci U S A 104, 20007-20012 (2007)). 미가공 데이터는 수납 번호, EGAS00000000059 로 유럽인 유전자형 기록 보관소 (The European Genotype Archive, EGA) 에서 이용가능하다.
카피 수의 유의한 변화를 검출할 시에 가장 좋은 기회를 확실하게 하기 위해, GISTIC 분석으로부터 비악성 세포주를 누락시켰다. 각각의 동질유전자 세포주 쌍 중 한 일원에 대한 GISTIC 점수를 사용하여 다른 것의 게놈 변화를 하기와 같이 추론하였다: AU565 는 SKBR3 으로부터 추론되고; HCC1500 는 HCC1806 으로부터 추론되고; LY2 는 MCF7 로부터 추론되고; ZR75B 는 ZR751 로부터 추론됨.
실시예 XXII: 엑손 어레이 분석
세포주에 대한 유전자 발현 데이터는 Affymetrix GeneChip Human Gene 1.0 ST 엑손 어레이로부터 도출하였다. 발현의 유전자-레벨 요약을 aroma.affymetrix R 패키지와 함께 변위치 정규화 및 "HuEx-_0-st-v2,core" 칩 유형을 기반으로 하는 로그-첨가 프로브-레벨 모델 (PLM: probe-level model) 을 사용하여 계산하였다. 전사 식별자를 BioMart R 패키지를 사용하여 Ensembl 데이터베이스에 질의함으로써 HGNC 유전자 부호로 전환하였다. 생성된 발현 프로파일을 이후 필터링하여, 모든 세포주에 걸친 log2-눈금에서 1.0 을 초과하는 표준 편차를 표현하는 유전자만을 포착하였다. 미가공 데이터는 ArrayExpress (E-MTAB-181) 에서 이용가능하다.
실시예 XXIII: 공통 군집화
세포주 아류형을 계층 공통 군집화를 사용하여 식별하였다 (Monti, S., Tamayo, P., Mesirov, J. P. & Golub, T. A. Consensus Clustering: A Resampling-Based Method for Class Discovery and Visualization of Gene Expression Microarray Data. Machine Learning 52, 91-118 (2003)). 세포주 500 개 샘플링, 샘플 당 세포주 80 %, 응집성 계층 군집화, 유클리디언 거리 미터법 및 평균 연결을 사용하여 합의성을 계산하였다.
실시예 XXIV: 임상적으로 관련된 아류형 및 치료제에 대한 반응의 연계
하기 3 가지의 계획을 사용하여 GI50 을 비교하였다: 1) 루미날 대 기저 대 클라우딘-낮음; 2) 루미날 대 기저 + 클라우딘-낮음; 및 3) ERBB2-AMP 대 비-ERBB2-AMP. 군의 GI50 사이의 차이를 순위에서 적절하게 비-모수 ANOVA 또는 t-시험에 의해 비교하였다. 3 개의 시험 세트에 대한 p-값을 합치고 거짓 발견율 (FDR: false discovery rate) 을 사용하여 다중 시험에 대해 수정하였다. 3-샘플 시험의 경우, 모든 다른 것에 대하여 각각의 군을 비교함으로써 유의한 클래스 효과 (class effect) 를 갖는 화합물에 대한 사후 분석을 수행하여, 어느 군이 가장 민감한지를 결정하였다. 사후 시험에 대한 p-값을 함께 FDR-수정하였다. 모든 경우에, FDR p < 0.20 을 유의한 것으로 간주하였다. 만일 이것이 기저 + 클라우딘-낮음 군이 계획 2 에서 유의하나 이러한 군들 중 하나만이 계획 1 에서 유의한 것으로 밝혀진 경우라면, 클래스 특이성을 지정할 때 이 3 개의 샘플 경우에 대하여 우선권을 주었다. 분석은 R 에서 수행하였다.
실시예 XXV: 게놈 변화 및 치료제에 대한 반응의 관련성
t-시험을 사용하여, 반복된 카피 수 변화 (8q24 (MYC), 11q13 (CCND1), 20q13 (STK15/AURKA) 에서) 및 약물 감수성 사이의 관련성을 평가하였다. 증폭이 낮거나 증폭이 없는 단일 군 세포주로 조합하고, 이를 증폭이 높은 세포주와 비교하였다. 비교가능한 분석을 결실 영역에 대해 수행하였다. GI50 이 시험된 최대 농도와 동일한 세포주를 분석으로부터 누락시켰다. 임의의 군이 5 개 미만의 샘플을 갖는 화합물을 누락시켰다.
실시예 XXVI: 성장률 및 치료제에 대한 반응의 관련성
약물 감수성에 대한 성장률 및 세포주 클래스의 효과를 평가하기 위해, 상기 기술된 3 개의 세포주 분류화 계획들 중 하나인 일련의 2원 배치 공분산 분석 (ANCOVA) 시험을 수행하였다. 이는 6 개의 p-값 세트 (2 개의 주요 효과 x 3 개의 분류화 계획) 을 산출하였고; 단일 FDR 수정을 사용하여 유의성을 평가하고, FDR p-값 < 0.20 을 관심 대상으로 표명하였다. 자동차 패키지의 부품으로 이용가능한, 기능 lm 및 ANOVA 로 R 에서 이러한 분석을 수행하였다.
실시예 XXVII: 통합 경로 분석
카피 수, 유전자 발현 및 경로 상호작용 데이터의 통합을 PARADIGM 소프트웨어를 사용하여 수행하였다. 간략히, 이러한 과정은 단일 세포주 또는 환자 샘플로부터 경로 상호작용 및 게놈 및 기능적 게놈 데이터를 이용하여, 유전자, 복합체 및 과정에 대한 통합 경로 레벨 (IPL) 을 추론한다. 자세한 사항에 대해서는 실시예 XXXV 을 참조한다.
실시예 XXVIII: TCGA 및 세포주 군집화
세포주에 대해 추론된 활성이 TCGA 종양 샘플에서 이의 각각의 아류형과 군집화되는지를 질의하였다. 고도로 연결된 허브 유전자 및 고도로 연관된 활성에 의해 야기되는 편향을 피하기 위해, 상관관계 분석 (추보 방법 (Supplemental Method) 참조) 에 의해 측정된 일련의 2351 개의 비-이중화 활성을 사용하여 세포주 및 종양 샘플을 군집화하였다. 동일한 아류형의 종양 샘플과 세포주가 군집화되는 정도를 콜모고로프-스미르노프 (Kolmogorov-Smirnov) 시험을 사용해 계산하여, 동일한 아류형의 종양 샘플과 세포주의 쌍 사이의 상관관계로부터 계산된 t-통계량의 분포를 상이한 아류형의 세포주 쌍으로부터 계산된 분포와 비교하였다 (추보 방법 참조). 자세한 사항에 대해서는 실시예 XXXVI 를 참조한다.
실시예 XXIX: 아류형 경로 마커의 확인
특정 아류형에 대해 차별적 활성을 총괄하여 나타내는 상호 연결된 유전자에 대해 조사하였다. 하기와 같은 두 개의 군으로의 세포주의 이분화로서 각각의 아류형을 처리하였다: 한 군은 아류형에 속하는 세포주를 함유하고 제 2 군은 잔여 세포주를 함유함. 2-클래스의 마이크로어레이의 유의성 분석 (SAM: Significance Analysis of Microarrays) 알고리즘의 R 실행을 사용하여 (Tusher, V. G., Tibshirani, R. & Chu, G. Significance analysis of microarrays applied to the ionizing radiation response. Proc Natl Acad Sci USA 98, 5116-5121, doi: 10.1073/pnas.091062498 [pii] (2001)), 슈퍼경로에서의 각각의 개념에 대한 차별적 활성 (DA) 을 계산하였다. 아류형의 경우, 양성 DA 는 다른 세포주에 비해 아류형에서 더 높은 활성에 해당한다.
슈퍼경로에서 가까이 연결된 유전자의 좌표화된 상향- 및 하향-조절은 PARADIGM 에 의해 추론된 활성을 강화하였다. 이웃한 유전자의 활성이 또한 특정한 표현형과 상관되는 경우, 높은 DA 점수를 갖는 전체 서브네트워크를 발견할 것으로 기대하였다. 모든 개념이 평균 절대 DA 보다 높은 DA 점수를 갖는 2 개의 개념을 연결한 연결만을 유지함으로써 높은 절대 DA 의 개념이 상호 연결되는, 슈퍼경로에서의 영역을 확인하였다.
실시예 XXX: 통합 경로 분석
카피 수, 유전자 발현 및 경로 상호작용 데이터의 통합을 PARADIGM 소프트웨어24 를 사용하여 수행하였다. 간략히, 이러한 절차는 단일 세포주 또는 환자 샘플로부터 경로 상호작용 및 게놈 및 기능적 게놈 데이터를 이용하여, 유전자, 복합체 및 과정에 대한 통합 경로 레벨 (IPL) 을 추론한다. TCGA BRCA 데이터를 2010 년 11 월 7 일에 TCGA DCC 로부터 수득하였다. TCGA 및 세포주 유전자 발현 데이터는 별도로 설정된 각각의 데이터 내의 중심에 있는 중앙 프로브였다. 전체 데이터세트에서의 값 (세포주 또는 TCGA 종양 샘플) 모두의 순위를 바꿔놓고, -log 10 순위 비율로 전환한 후 PARADIGM 에 공급하였다. 경로는 2010 년 10 월 13 일에 http://pid.nci.nih.gov/ 로부터 BioPax Level 2 포맷으로 수득하였고 NCI-PID, Reactome 및 BioCarta 데이터베이스를 포함하였다. 상호 작용을 병합된 중첩 경로 (슈퍼경로) 로 조합하였다. 유전자, 복합체 및 추상 과정 (예를 들어, "세포 주기") 을 경로 개념으로서 유지하였다. 유전자 개념을 합치기 전에, 모든 유전자 식별자를 HUGO 명명법으로 바꾸었다. 모든 상호작용이 포함되었고, 상반되는 영향을 해결하기 위한 시도는 이루어지지 않았다. P53 (최고 수준으로 연결된 구성요소) 으로부터 출발하는 넓이-우선 무방향 순회 (breadth-first undirected trabersal) 를 수행하여 하나의 단일 구성요소를 구축하였다. 생성된 병합된 경로 구조는 3491 개의 단백질, 4757 개의 복합체 및 520 개의 과정을 나타내는 총 8768 개의 개념을 포함하였다. PARADIGM 에 대한 기대값-최대화 모수를 세포주 데이터에 대해 훈련한 후, TCGA 샘플에 적용하였다. 세포주 및 종양 샘플의 데이터를 이후 단일 데이터 매트릭스로 조합하였다. 세포주 또는 종양 샘플로부터의 데이터에서 0.5 IPL 을 초과하여 1 이상의 값을 갖지 않는 임의의 엔트리를 추가 분석으로부터 제거하였다.
실시예 XXXI: TCGA 및 세포주 군집화
PARADIGM IPL 을 사용해, 세포주를 TCGA 종양 샘플과 함께 군집화하여 세포주가 동일한 아류형의 종양 샘플과 유사한지를 측정하였다. 슈퍼경로의 익히 연구된 영역은 직접 데이터가 이용가능하지 않은 추상 과정 및 많은 중간 복합체의 거대 신호 사슬 및 많은 상호 관계 (허브) 를 갖는 유전자를 포함한다. 허브쪽으로의 편향을 피하기 위해, 세포주 및 종양 샘플 모두에 걸쳐 고도로 연관된 벡터 (피어슨 상관계수 상수 > 0.9) 를 갖는 경로 개념을 군집화에 앞서 단일 벡터로 통일하였다. 이러한 통일은 본래의 8939 개의 경로 개념으로부터 2351 개의 비-이중화 벡터를 산출하였다.
산출된 비-이중화 개념 세트를 사용하여 샘플을 군집화하였다. 아이젠 클러스터 소프트웨어 패키지 버전 3.0 (Eisen Cluster Software Package version 3.0) 에서 시행된 완전한 연결의 계층적 응집 군집화를 사용하여 47 개의 세포주 및 183 개의 TCGA 종양 샘플에 대한 추론된 경로 활성의 매트릭스를 군집화하였다. 비중심 피어슨 상관계수를 경로 개념에 대한 미터법으로 사용하였고, 유클리디언 거리를 샘플 미터법으로 사용하였다.
세포주가 동일한 아류형의 종양 샘플과 군집화되는 정도를 수량화하기 위해, 피어슨 상관계수로부터 유래된 t-통계량의 분포 2 개를 비교하였다. Cs 를 일련의 아류형 s 의 세포주로 하였다. 유사하게, Ts 를 일련의 아류형 s 의 TCGA 종양 샘플로 하였다. 예를 들어 C기저 및 T기저 는 각각 일련의 모든 기저 세포주 및 기저 종양 샘플이다. 제 1 분포는 동일한 아류형의 세포주 및 종양 샘플을 함유하는 모든 가능한 쌍 사이의 피어슨 상관계수로부터 유래된 t-통계량으로 이루어졌는데; 즉 모든 아류형 s 에 대하여, 모든 쌍으로의 상관관계 t-통계량은 a ∈ Cs 및 b ∈ Ts 인 쌍 (a, b) 사이에서 계산하였다. 제 2 분포는 상이한 아류형의 세포주들 사이의 상관관계 t-통계량으로 이루어졌는데; 즉, a ∈ Cs 및 b ∈ Cs' 및 s ≠ s' 인 쌍 (a,b) 에 걸쳐 계산하였다. 콜모고로프-스미르노프 시험을 수행하여, 분포를 비교하였다.
실시예 XXXII: 통합 경로 분석
카피 수, 유전자 발현 및 경로 상호작용 데이터의 통합을 PARADIGM 소프트웨어24 를 사용하여 수행하였다. 간략히, 이러한 절차는 단일 세포주 또는 환자 샘플로부터 경로 상호작용 및 게놈 및 기능적 게놈 데이터를 이용하여, 유전자, 복합체 및 과정에 대한 통합 경로 레벨 (IPL) 을 추론한다. TCGA BRCA 데이터를 2010 년 11 월 7 일에 TCGA DCC 로부터 수득하였다. TCGA 및 세포주 유전자 발현 데이터는 별도로 설정된 각각의 데이터 내의 중심에 있는 중앙 프로브였다. 전체 데이터세트에서의 값 (세포주 또는 TCGA 종양 샘플) 모두의 순위를 바꿔놓고, -log 10 순위 비율로 전환한 후 PARADIGM 에 공급하였다. 경로는 http://pid.nci.nih.gov/ 로부터의 BioPax Level 2 포맷에서 수득하였고 NCI-PID, Reactome 및 BioCarta 데이터베이스를 포함하였다. 상호 작용을 병합된 중첩 경로 (슈퍼경로) 로 조합하였다. 유전자, 복합체 및 추상 과정 (예를 들어, "세포 주기") 을 경로 개념으로서 유지하였다. 유전자 개념을 합치기 전에, 모든 유전자 식별자를 HUGO 명명법으로 바꾸었다. 모든 상호작용이 포함되었고, 상반되는 영향을 해결하기 위한 시도는 이루어지지 않았다. P53 (최고 수준으로 연결된 구성요소) 으로부터 출발하는 넓이-우선 무방향 순회 (breadth-first undirected trabersal) 를 수행하여 하나의 단일 구성요소를 구축하였다. 생성된 병합된 경로 구조는 3491 개의 단백질, 4757 개의 복합체 및 520 개의 과정을 나타내는 총 8768 개의 개념을 포함하였다. PARADIGM 에 대한 기대값-최대화 모수를 세포주 데이터에 대해 훈련한 후, TCGA 샘플에 적용하였다. 세포주 및 종양 샘플의 데이터를 이후 단일 데이터 매트릭스로 조합하였다. 세포주 또는 종양 샘플로부터의 데이터에서 0.5 IPL 을 초과하여 1 이상의 값을 갖지 않는 임의의 엔트리를 추가 분석으로부터 제거하였다.
실시예 XXXIII: TCGA 및 세포주 군집화
PARADIGM IPL 을 사용해, 세포주를 TCGA 종양 샘플과 함께 군집화하여 세포주가 동일한 아류형의 종양 샘플과 유사한지를 측정하였다. 슈퍼경로의 익히 연구된 영역은 직접 데이터가 이용가능하지 않은 추상 과정 및 많은 중간 복합체의 거대 신호 사슬 및 많은 상호 관계 (허브) 를 갖는 유전자를 포함한다. 허브쪽으로의 편향을 피하기 위해, 세포주 및 종양 샘플 모두에 걸쳐 고도로 연관된 벡터 (피어슨 상관계수 상수 > 0.9) 를 갖는 경로 개념을 군집화에 앞서 단일 벡터로 통일하였다. 이러한 통일은 본래의 8939 개의 경로 개념으로부터 2351 개의 비-이중화 벡터를 산출하였다.
산출된 일련의 비-이중화 개념을 사용하여 샘플을 군집화하였다. 아이젠 클러스터 소프트웨어 패키지 버전 3.045 (Eisen Cluster Software Package version 3.0) 에서 시행된 완전한 연결의 계층적 응집 군집화를 사용하여 47 개의 세포주 및 183 개의 TCGA 종양 샘플에 대한 추론된 경로 활성의 매트릭스를 군집화하였다. 비중심 피어슨 상관계수를 경로 개념에 대한 미터법으로 사용하였고, 유클리디언 거리를 샘플 미터법으로 사용하였다.
세포주가 동일한 아류형의 종양 샘플과 군집화되는 정도를 수량화하기 위해, 피어슨 상관계수로부터 유래된 t-통계량의 분포 2 개를 비교하였다. Cs 를 일련의 아류형 s 의 세포주로 하였다. 유사하게, Ts 를 일련의 아류형 s 의 TCGA 종양 샘플로 하였다. 예를 들어 C기저 및 T기저 는 각각 일련의 모든 기저 세포주 및 기저 종양 샘플이다. 제 1 분포는 동일한 아류형의 세포주 및 종양 샘플을 함유하는 모든 가능한 쌍 사이의 피어슨 상관계수로부터 유래된 t-통계량으로 이루어졌는데; 즉 모든 아류형 s 에 대하여, 모든 쌍으로의 상관관계 t-통계량은 a ∈ Cs 및 b ∈ Ts 인 쌍 (a, b) 사이에서 계산하였다. 제 2 분포는 상이한 아류형의 세포주들 사이의 상관관계 t-통계량으로 이루어졌는데; 즉, a ∈ Cs 및 b ∈ Cs' 및 s ≠ s' 인 쌍 (a,b) 에 걸쳐 계산하였다. 콜모고로프-스미르노프 시험을 수행하여, 분포를 비교하였다.
실시예 XXXIV: 다양한 유전적 분자 레벨에서 종양의 분자 아류형
유방 종양에서 수행된 전체 게놈 유전자 발현 분석의 선구적인 연구는 에스트로겐 수용체 (ER) 음성 기저-유사 및 ER 양성 루미날 하위군에 가장 명백하게 속하는 상이한 하위부류를 확인하였으며 (Perou, C. M. et al., (2000), Molecular portraits of human breast tumours, 406: 747-752), 이는 상이한 임상 결과를 갖는다 (14 Sorlie, T. et al., (2001), Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications, 98: 10869-10874). 또한, 여러 분자 아류형의 존재는 DNA 카피 수 분석 (2Russnes et al. (2007) supra), DNA 메틸화 (Ronneberg et al. (2011) supra) 및 miRNA 발현 분석 (Enerly et al. (2011) supra) 에 의해 관찰되었다. 그러나, 다양한 신규 분자 레벨에서 분자 분석에 의해 획득되는 이들 신규 특성이 mRNA 발현에 의해 초기에 밝혀진 하위부류를 어느 정도 개괄하고 있는지, 그리고 임상적으로 중요한 새로운 환자의 하위군을 확인하기 위해 이들 신규 분류의 잠재성이 어느 정도인지는 의문이다. 이러한 의문에 접근하기 위해, 편향되지 않은 자율 방법을 이용하는 각 분자 레벨 연구에 따른 MicMa 데이터세트의 유방암 환자를 군집화하였다 (도 23). 별도의 각 분자 수준에 의해 환자의 군집화의 히스토그램 및 각 환자의 하위군에 대한 생존 KM 플롯을 도 23 에 나타냈다. 흥미롭게도, 이러한 군집화 과정으로, Pam50 분류화로부터 유래되는 군집과 밀접한 상관관계가 있는 mRNA 발현의 7 개의 군집을 확인하였다. Pam50 과 일치하였으나, exp1-4 mRNA 군집과, 마지막 3 개의 (exp5-7) 군집 중에서 기저 및 ERBB2 사이의 루미날 A 군집을 분리하였다. miRNA 레벨에서, 3 개의 상이한 군집을 문헌 (Enerly et al. (2011) supra) 에서 이전에 기술된 바와 같이 수득하였고; 메틸화 레벨에서 3 개의 주요 군집을 기술된 바와 같이 나타냈고, 훨씬 작은 4번째 군집 또한 관찰되었으나 문헌 [Ronneberg et al. (2011, supra)] 에서 추가로 논의되지 않았다. CNA 레벨에서, 6 개의 상이한 군집이 나타났다. 명백하게, 모든 레벨에서, 별개의 환자 군집이 특정 생존 패턴과 연계되어 있었다 (도 23). 이후, 동일한 환자가 상이한 분자 레벨에서 상응하는 군집을 형성하였는지를 평가하였다. 실제로, 상이한 레벨에서 군집화 사이에서, 가장 명백하게는 DNA 메틸화 및 mRNA 발현 및 DNA 카피 수 사이에서, 매우 양호한 일치가 존재한다 (표 12). 그러나, 몇몇 샘플이 항상 임의의 레벨에서 함께 군집화되는 반면, 기타는 연구에서 각 특정 분자 종점에 따른 상이한 군에서 군집화된다.
[표 12]
Figure pat00008
하나의 분자 레벨로부터 도출된 하나의 하위부류의, 다른 하위부류에 따른 군집화에 의한 일관적인 분열은 중요한 생물학적 결과를 밝힐 수 있다. 예를 들어, (3) 에서 논의되는 바와 같이, 메틸화 및 mRNA 발현 사이의 양호한 상관관계에 기초한 분류화가 관찰되나 (p = 2.29·10-6), 2 개의 상이한 메틸화 군집 사이의 루미날-A 클래스 (mRNA 발현에 의함) 가 분리되었다. 기저-유사 종양에 동일하게 적용된다는 것은, mRNA 발현 군집과 매우 일치됨에도 불구하고 DNA 메틸화에 따른 군집화에 의한 추가의 정보가 제공된다는 것을 암시한다. 상이한 DNA 메틸화 프로파일을 갖는 루미날 A 샘플은 생존에서 상이하다 (3 Ronneberg, J. A. et al., (2011), Methylation profiling with a panel of cancer related genes: association with estrogen receptor, TP53 mutation status and expression subtyles in sporadic breast cancer, 5: 61-76). 본 출원인 및 타인으로부터의 신규 데이터세트 수의 증가는 장래에 이들 군집이 여러 최상이면서 많은, 덜 빈번한 조합을 포함할 것인지를 드러낼 것이다.
상이한 분자 레벨에서의 재분류화가 상이한 레벨에 영향을 미치는 새로운 관심의 생물학적 경로를 시사하기 때문에 추가로 연구해볼 가치가 있을지라도, 여러 클래스의 샘플의 수평적 개조 내의 정보량은 제한적일 수 있다. 경로 당 이들 군집 이내의 상이하게 발현되고/변경되는 유전자의 관찰은 선험 지식 및 공지된 상호작용의 선택에 의존적이고, 새로운 경로를 확인하는데 이용할 수 없다. 또한, 이들 접근법은 독립변수로서 상이한 데이터세트에서 유전자 및 측정치를 처리하고, 경로에서 유전자의 위치를 고려하지 않거나, 상호작용하는 파트너 (즉, 경로의 위상) 의 수를 고려하지 않고 유전자 세트에서 하나 또는 몇몇의 유전자 발현에서 큰 변동에 취약하다. 통상적으로는, 특정 경로가 암에서 많은 종양에서 탈조절될 수 있는 것으로 관찰되었으나, 특정 유전자 및 탈조절 방법이 상이한 종양에서 다양하다 (Cancer Genome Atlas Research Network. Comprehensive genomic charactrization defines human glioblastoma gene and core pathway. Nature 2008 Oct.;455(7216):1061-1068). 따라서, 경로의 컨텍스트에서 종양에서 각 유전자의 활성 레벨 및 연관된 임상 데이터를 특징화하기 위해서, 단일 유전자에 대한 상이한 데이터 유형 측정치 사이의 상호작용 및 유전자들 사이의 공지된 상호작용을 모형화하는 경로 기재 모델링 방법론을 적용하였다. (분자 데이터 유형에 걸쳐) 이들 탈조절된 경로를 따라 환자를 직접 확인하고 분류하기 위해 각각의 유전자의 통합 경로 수준 (IPL) 을 사용하였고 이어서 다양한 분자 수준에서 상기 기술된 클래스의 신규 군집의 관계를 조사하였다.
실시예 XXXV: 예후적 의의를 갖는 침습성 암의 분류화를 위한 PARADIGM
종양 표현형을 설명하고 종양이 표적 치료에 취약하게 할 수 있는 별개의 생물학적 기능을 게놈 변화가 어떻게 방해하는지를 이해하기 위해, 경로 레벨에서의 교란의 이해가 필요하다. PARADIGM 은 유전자가 단일 레벨에서 연구되는 경우 식별될 수 없는 환자의 부분 집합에서 일관된 활성 경로를 확인한다. 상기 방법은 확률 그래프 모델 (PGM) 에서부터 공지된 경로 구조 상의 통합된 기능적 게놈 데이터까지의 기술을 사용한다. 이는 이미 TCGA 교모세포종 및 난소 데이터세트로부터의 카피 수 및 mRNA 발현 데이터의 분석에 적용되었다. 또한, PARADIGM 분석은 DNA 메틸화 또는 카피 수, mRNA 및 miRNA 발현과 같은 다중 레벨에서 게놈 변경을 연결짓기 위해 사용될 수 있고 따라서 각 개체 샘플에서 데이터의 오믹스 층의 임의의 수를 통합할 수 있다. DNA 메틸화 및 miRNA 발현이 여기서 관찰되는 탈조절된 경로에 기여하고, MicMa 코호트에서 유방암 그 자체의 예후 및 분자 프로파일 각각에 별도의 기여를 갖는 것으로 보이나 (도 23), 이들 2 개의 분자 프로파일 유형을 더함으로써 PARADIGM 군집의 예후 값이 개선되는 것을 찾을 수 없었다. 이에 대한 하나의 설명은, miRNA 및 DNA 메틸화 분석의 예후 값이 이들의 높은 상관관계로 인해 mRNA 발현에 의해 개괄된다는 것이다. 그러나, 그러한 결론은, 예를 들어 분석 플랫폼의 선택 (메틸화에 대한 제한된 일루미나 1505 CpG 암 패널) 및 실제 miRNA 표적에 대한 제한된 지식이, miRNA 및 DNA 메틸화 정보를 효과적으로 모형화하고 광범위하게 측정할 수 있는 능력을 제한하는 요소가 될 수 있는지에 관한 추가의 분석을 요구한다.
MicMa 코호트의 mRNA 발현 및 카피 수 변동을 기초로 하는 PARADIGM 분석은 5 개의 상이한 군집의 존재를 확인하고 (도 24A), 이는 mRNA 발현과 DNA 카피 수를 결합하는 것이 별도로 연구되는 임의의 분자 레벨 보다는 예후에 대해 환자를 보다 양호하게 구별함을 나타낸다 (도 24B 및 도 23). 교란이 분류화에 가장 강하게 기여하는 경로는 안지오포이에틴 수용체 Tie2-매개 신호화, 특히 면역 반응 (TCR) 및 인터루킨 신호화의 경로이며, 이때 경로에서 거의 모든 유전자 또는 복합체는 정상 범위에서 벗어난다 (도 25 A). 가장 우세하게 보여지는 것은 IL4, IL6, IL12 및 IL23 신호화였다. 다른 우세한 경로는 엔도텔린, FOXM1 전사 (난소에서 탈조절됨), 및 교모세포종 TCGA 데이터세트 및 ERBB4 (이 또한 유방 및 난소암에서 탈조절되는 것으로 이미 밝혀짐) 이다. 이러한 분석에 기초하여, 현저하게 상이한 예후를 갖는 하기 환자군을 확인하였고, 이는 대략 하기를 특징으로 할 수 있다:
pdgm.l = 고 FOXM1, 고 면역 신호화,
pdgm.2 = 고 FOXM1, 저 면역 신호화, 대식세포 우세,
pdgm.3 = 저 FOXM1, 저 면역 신호화,
pdgm.4 = 고 ERBB4, 저 안지오포이에틴 신호화,
pdgm.5 = 고 FOXM1, 저 대식세포 시그니처.
이미 공보된 2 개의 데이터세트에서 PARADIGM 군집의 확인이 검증되었으며 (Chin et al 2007 (Chin, S. F. et al., (2007), Using array-comparative genomic hybridization to define molecular portraits of primary breast cancers, 26: 1959-1970), 이는 MicMa 데이터세트와 비교시, 더욱 흥미롭게는 비-악성 DCIS (유관 상피내 암종) 가 풍부한 또다른 세트에서 ER- 및 높은 등급 종양의 높은 빈번도를 갖는 것이다 (12 Muggerud, A. A. et al., (2010), Molecular diversity in ductal carcinoma in situ (DCIS) and early invasive breast cancer, 4: 357-368) (도 25B, 25C). 순수한 DCIS 종양에 대한 열지도를 도 25D 27 에 나타냈다.
MicMa, pdgm.2 에서 가장 안 좋은 예후를 갖는 군집에서, IL4 신호화는 STAT6 과 접합시 강하게 하향-조절되며, 이는 인간 유방암 세포에서 성장 저해를 방해하는 것으로 나타났다 (16 Gooch, J. L., Christy, B., and Yee, D., (2002), STAT6 mediates interleukin-4 growth inhibition in human breast cancer cells, 4: 324-331). 또한, IL4 신호화의 하향-조절은 더욱 큰 종양 성장을 지지할 수 있 비만 세포 활성화를 촉진한다 (17 de Visser, K. E., Eichten, A., and Coussens, L. M., (2006), Paradoxical roles of the immune system during cancer development, 6: 24-37). 역으로, pdgm.5 에서, 대식세포 활성화가 감소되고 자연살해 세포 활성은 IL23 신호화로 인해 증가된다. 면역 반응의 암 의존적 편향화는 한편으로는 Th-2 및 B 세포 보충을 향하고, 다른 한편으로는 Th-1 증식을 향한다는 것이 이미 논의되어 있다 (1 Ursini-Siegel, J. et al., (2010), Receptor tyrosine kinase signaling favors a protumorigenic state in breast cells by inhibiting the adaptive immune response, 70: 7776-7787). 특정 조건 하에서 Th1/CTL 면역 반응이 쥐에서 양성 종양으로 증식 전이를 방지할 수 있는 반면, Th2 반응은 암종으로의 전이를 촉진하기 위한 만성 염증성 상태를 부여함으로써 된다는 가설이 있다. IL4 는 암 세포에서 만성 염증 및 B 세포 분화를 자극하는 Th-2 유래된 사이토카인이다. 또한, Th-2 세포는 이들 암에서 면역억제를 중재하는 IL10 을 분비한다. 이러한 면역억제는 기저 및 ERBB2 암에서 우세하게 발생하는 것으로 나타났다. 이를 뒷받침하는데 있어서, 문헌 ["antitumor acquired immune programs can be usurped in pro-tumor microenvironments and instead promote malignancy by engaging cellular components of the innate immune system functionally involved in regulating epithelial cell behavior" (DeNardo, D. G. et al., (2009), CD4(+) T cells regulate pulmonary metastasis of mammary carcinomas by enhancing protumor properties of macrophages, 16: 91-102)] 에서 최근 나타났다.
본원에서 제안된 이러한 면역분류화 및 mRNA 발현에 의해 잘 수립된 분류화 사이의 상당한 일치가 존재한다 (루미날 A,B, 기저, ERBB2, 정상 유사) (도 24). 기저 및 ERBB2 군집에 속하는 샘플은 우세한 prgml (안 좋은 예후), 루미날 A - prgm 3 (최선의 예후) 이었다. 그러나, PARADIGM 군집화는 루미날 A (prgm3) 및 루미날 B (prgm4) 군집 사이의 다소 현저한 분리를 제공하고, 매우 안좋은 예후 (prgm2) 를 갖는 기저 종양 부분집합의 확인을 제공한다.
실시예 XXXVI: 동요가 PARADIGM 군집화에 특히 영향을 미치는 것으로 확인된 경로
FOXM1 전사
FOXM1 은 세포 주기 진행의 핵심 조절자이고 이의 내인성 FOXM1 발현은 세포 주기의 상에 따라 동요한다. 인간 원시종양유전자로서 확인된 FOXM1 은 간, 유방, 폐, 전립선, 자궁경부, 직장, 췌장, 뇌 및 기저 세포 암종, 가장 통상적인 인간의 암을 포함하는 고형 인간 암의 대다수에서 상향-조절되는 것으로 밝혀졌다. FOXM1 은 세포 주기 및 크로모좀/게놈 유지에서 다중의 역할을 통해 원시종양유전자를 촉진하는 것으로 생각된다 (Wonsey, D. R. and Follettie, M. T., (2005), Loss of the forkhead transcription factor FOXM1 causes centrosome amplification and mitotic catastrophe, 65: 5181-5189). 주요 인간 피부 케라티노사이트에서 FOXM1 의 비정상적인 상향-조절은 카피 수 이상 및 이형접합성 (LOH) 의 손실 형태로 게놈 불안정성을 직접 유도할 수 있다 (Teh M, Gemenetzidis E, Chaplin T, Young BD, Philpott MP. Upregulation of FOXM1 induces genomic instability in human epidermal keratinocytes. Mol. Cancer 2010;9:45). 성인 인간 상피 줄기 세포의 비정상적인 상향조절이 3D-기관형 조직 재생 시스템 - 인간 증식과 유사한 조건에서 전암 표현형을 유도하는 것으로 밝혀졌다 (Gemenetzidis, E. et al., (2010), Induction of human epithelial stem progenitor expansion by FOXM1, 70: 9515-952). FOXM1 의 과도한 발현이, 분화 경로를 간섭함으로써 줄기 세포의 고유의 자가-재생 증식 잠재성을 착취하여 간세포 구획을 확장한다. 따라서, FOXM1 이 줄기세포/간세포 확장을 통해 암 개시를 유도하는 것으로 가정하였다. 주로 인터루킨 신호화 활성에 따라 파괴되는 상기 경로의 고 및 저 활성을 갖는 유방암 환자의 2 개의 군을 명백히 알 수 있다. 도 26 은 군집 pdgm 3 (최선의 생존) 과는 대조적으로 좋지 못한 생존 및 이에 기여하는 분자 레벨을 갖는 나머지 군집에 대한 상기 경로의 정반대의 활성화 방식을 설명한다 (적색의 활성화 대 청색의 비활성화) (도면의 모양에 따른 mRNA, CNA, miRNA 또는 DNA 메틸화). DNA 메틸화로 인해 pdgm3 에서 MMP2 의 하향 조절을 알 수 있다 (나머지 종양에서는 DNA 결실로 인한 것). miRNA 중에서, has-let7-b 는 pgm3 에서 상향조절되었고 나머지에서 하향조절되었고, 이의 표적 (AURKB) 에 대해 상호보완적이다. DNA 증폭 및 mRNA 발현 둘 모두는 발현의 탈조절의 원인으로서 보여진다.
안지오포이에틴 수용체 tie2-매개 신호화
Ang 패밀리는 인간 암의 발달과 성장 동안 혈관형성에 있어서 중요한 역할을 한다. 혈관형성에 있어서의 Ang2 의 역할은 일반적으로 Ang1-촉진된 Tie2 신호화를 억제하는 Ang1 에 대한 길항제로서 여겨지고 혈관 성숙 및 안정화 (23) 를 위해 중요하다. Ang2 는 다른 중요한 혈관형성 인자, 혈관내피 성장 인자 A (VEGFA) 와 협력적 방식으로 혈관형성을 조절한다 (Hashizume, H. et al., (2010), Complementary actions of inhibitors of angiopoietin-2 and VEGF on tumor angiogenesis and growth, 70: 2213-2223). 신규한 데이터는 인간 암의 진행 동안 암 세포의 침습적 표현형에서 혈관형성에의 Ang2 에 대한 보다 복잡한 역할을 암시한다. 특정 안지오포이에틴 (Ang) 패밀리의 일원은 Tie1 을 활성화시킬 수 있고, 예를 들어 Ang1 이 내피 세포에서 Tie1 인산화를 유도한다 (2 Yuan, H. T. et al., (2007), Activation of the orphan endothelial receptor Tiel modifies Tie2-mediated intracellular signaling and cell survival, 21: 3171-3183). 그러나 Tie1 인산화는 Tie2 의존적인데, 그 이유는 Tie2 가 내피 세포에서 하향-조절되는 경우 Ang1 이 Tie1 인산화를 유도하지 못하고, Tie1 인산화는 Ang1 의 부재 하에 본질적 활성 형태의 Tie2 또는 Tie2 아고니스트 항체에 의해 유도되기 때문이다 (25 Yuan et al. (2007) supra). Ang1-매개 AKT 및 42/44MAPK 인산화는 우세하게 Tie2 매개되고, Tie1 은 이러한 경로를 하향-조절한다. 따라서, Tie1 에 대한 주요 역할은 Tie2-유도된 신호화 및 내피 생존을 하향 조절하는 이의 능력으로 인하여 혈관 형태발생을 조절하는 것이다. Tie2 매개 신호화뿐만 아니라 VEGFR1 및 2 매개 신호화 및 특정 신호는 이러한 데이터세트에서 관찰되었다.
ERBB4
ERBB4 는 유선 세포 운명을 촉진하는 동안 유선 형태발생에서의 증식 및 세포 이동 및 Erbb4-표현형 유선 원시 상피의 방향적 세포 이동에 기여한다. Nrg3/Erbb4 신호화의 후보 반응기가 확인되었고, 이를 초기의 유선 발달 및 암과 관련된 다른 신호화 경로와 상호작용하는 것을 나타내었다. 생체내 ErbB4 의 주요 기능 중 하나는 임신 동안의 유선의 성숙 및 젖분비 유도이다. 임신 및 연장된 젖분비 기간은 유방암의 감소된 위험과 연관되고, 종양 억제에서의 ErbB4 의 역할은 따라서 젖분비에서의 이의 역할과 관련될 수 있다. 대부분의 보고서는 사춘기 동안의 다른 ErbB 패밀리의 일원에 의해 야기되는 역 성장 자극에서의 ErbB4 의 역할과 일치하나, ERBB4 발현에 대한 생존의 유의한 연관성은 확인되지 않았다 (Sundvall, M. et al., (2008), Role of ErbB4 in breast cancer, 13: 259-268).
실시예 XXXVII: 유관 상피내 암종 (DCIS) 에서의 분류화를 위한 PARADIGM
마우스 모델에서의 전암성 증식성 분비샘에서 면역 반응의 관련성을 고려하여 (18 Ursini-Siegel, J. et al., (2010), Receptor tyrosine kinase signaling favors a protumorigenic state in breast cancer cells by inhibiting the adaptive immune response, 70: 7776-7787), DCIS 경우를 포함하는 앞서 공개된 데이터세트를 분석하여 침습성 종양에서의 관찰된 강한 면역 반응 및 인터루킨 신호화가 전암성 단계에서 또한 존재하는지 여부를 밝혀내었다. 유관 상피내 암종 (DCIS) 은 일부 병변이 급속하게 침습성 유관 암종 (IDC) 으로 전이되는 것으로 인지되나, 나머지는 변하지 않고 유지되는 비-침습성 형태의 유방암이다. 31 개의 순수한 DCIS, 36 개의 순수한 침습성 암 및 42 개의 혼합된 진단의 경우 (상피 성분을 갖는 침습성 암) (1Muggerud et al. (2010) supra) 의 유전자 발현 패턴을 앞서 연구하고 높은 조직학적 등급의 DCIS 중의 전사체에서의 이질성을 관찰하여, 진전된 종양과 더욱 유사한 유전자 발현 특징을 갖는 DCIS 의 별개의 하위그룹을 확인하였다. 도 25C 에서의 상기 전체 코호트 (IDC 및 ILC 포함) 및 도 25D 에서의 순수한 DCIS 샘플에 대한 PARADIGM 결과의 열지도. 순수한 DCIS 종양 중 어느 것도 높은 대식세포 활성에 대해 전형적인 신호화를 특징으로 하는 prgm2 유형이 아니었다 (도 25). 마찬가지로 실험적 연구는 주요 유선 선암에서의 대식세포가 이의 전혈관형성 특성으로 인한 말기 발암작용을 조절하고 (Lin, E. Y. and Pollard, J. W., (2007), Tumor-associated macrophages press the angiogenic switch in breast cancer, 67: 5064-5066; Lin, E. Y. et al., (2007), Vascular endothelial growth factor restores delayed tumor progression in tumors depleted of macrophages, 1: 288-302), 뿐만 아니라 내피 성장 인자 (EGF) 를 악성 유선 상피 세포에 제공함으로써 폐 전이에 일조한다는 것을 입증하였다. 또한 상부의 탈조절된 경로 중에서 IL2, 4, 6, 12, 23, 및 23 신호화에 관련된 것이 DCIS 에서의 PARADIGM 분석에 의해 확인되었다.
모든 데이터세트 (DCIS, MicMa) 에서 미감작 CD8+ T 세포에서의 TCR 신호화는 CD8+ T 세포를 구성하는 것으로 공지된 다수의 케모카인과 함께 리스트의 상단에 있었다. 하나는 NK 및 T 세포로부터 IFN-감마 생성을 자극하는 것으로 나타나는 항원 표출 세포에 의해 생성되는 IL-12 이다. IFN-감마 경로는 DCIS 에서의 리스트 상에서 더 상부에 있는 탈조절된 경로 중 하나이다.
IFN감마는 Th1 세포 및 NK 세포로부터 생성되고, 항암성 면역 반응을 개시하는 것을 나타내었다. 단계 I 임상시험은 트라스투주맙 (헤르셉틴) 의 임상 효과가 HER2-과발현 종양을 가진 환자에게 IL-12 의 공동-투여에 의해 상승되고, 이러한 효과는 NK 세포 (29) 에서의 IFN감마 생성의 자극에 의해 매개된다. DCIS 에서, 가장 강력한 다른 기여자 (표 8) 는 84_NOX4. NOX4, 산소-감지 NAPHD 산화효소이었고, 호중성 과립주, 주요 면역 반응에서 다량의 반응성 산소종 (ROS) 의 생성에 책임이 있는 식세포-유형 A 산화효소와 유사하다. 또한 FN1 (피브로넥틴) 및 PDGFRB, 혈소판-유도된 성장 인자 수용체가 함께 반복적으로, 특히 DCIS 에서 COL1A2, IL12/IL12R/TYK2/JAK2/SPHK2, ESR1 및 KRT14 와 함께 나타났다.
이러한 유전자/경로는 세포외 기질에서의 기능, 세포-세포 상호작용 및 섬유증 및 케라틴화에 모두 기여하는 것으로 보여진다. 예를 들어, FN1 피브로넥틴-1 은 세포외 액, 결합 조직, 및 기저막에서 세포 표면에 존재하는 고분자량 당단백질의 패밀리에 속한다. 피브로넥틴은 다른 세포외 기질 단백질 및 세포 리간드, 예컨대 콜라겐, 피브린, 및 인테그린과 상호작용한다. 피브로넥틴은 세포의 접합 및 이동 과정에 관련된다. PDGFR, 혈소판-유도된 성장 인자 수용체는 내피 성장 인자 (EGF) 와 함께 중요한 수용체 티로신 키나아제 (RTK) 인 EGF 및 PDGF 수용체를 통해 신호를 보낸다. 중요하게도, 특정 DCIS 에서 과발현되는 것으로 밝혀진 PDGFR 은 수니티닙의 표적 (30 Fratto, M. E. et al., (2010), New perspectives: role of sunitinib in breast cancer, 161: 475-482), 및 이마티닙 메실레이트 (글리벡) 의 제 2 표적이다 (Weigel, M. T. et al., (2010), In vitro effects of imatinib mesylate on radiosensitivity and chemosensitivity of breast cancer cells, 10: 412). 증가된 INF감마 생성에 의해 매개되는 상기 기술된 트라스투주맙 (헤르셉틴) 의 면역증진 역할과 반대로, 이마티닙은 TCR-활성화된 CD4(+) T 세포에 의해 인터페론-감마 생성을 저해하는 것을 나타내었다. 이러한 관측은 DCIS 의 표면에 존재하는 성장 인자 수용체 및 악성 세포 및 면역 체계 사이에서의 상호작용을 밝히는 본원의 논거에 대해 어느 정도 흥미로운 것이다. PDGFR 에 대한 자극 자가항체는 Ras, ERK1/ERK2, 및 반응성 산소종 (ROS) (이는 증가된 유형 I 콜라겐 발현을 유도함) 와 관련된 세포내 루프를 유발하는 것을 나타내었다. 이는 또한 본 연구에서의 DCIS 에서 탈조절된 것으로 관찰된 COL1A2 발현과 유사하다.
실시예 XXXVIII: 재료 및 방법
Agilent 전체 인간 게놈 4x44K 단일 유색 올리고 어레이에 의해 분석된 mRNA 발현을 갖는 약 110 개의 유방 암종으로부터 수집된 데이터에 분석을 적용하였다. 카피 수 변동 (CNA) 을 Illumina Human-1 109K BeadChip 을 사용하여 분석하였다. 이러한 SNP 어레이는 유전자 중심적이고, 30 kb 의 평균 물리적 거리를 갖는 전체 게놈을 포괄하는 마커를 함유하고, 15,969 개의 특유의 유전자를 나타내었다 (May 2004 assembly, hgl7, NCBI Build 35). 각각의 샘플을 전체 게놈 증폭시켰다. BeadStudio (v. 2.0, Illumina) 을 사용하는 대립유전자 배향에 앞서 dbSNP's (build 125) 에 대한 참조하여 유전자형 기록 및 logR 값을 추출하고, logR 값을 CNA 에 대해 조절하였다.
전체 RNA 로부터의 miRNA 프로파일링을 제조자의 계획안에 따라 Agilent Technologies "Human miRNA Microarray Kit (V2)" 를 사용하여 수행하였다. Agilent Scanner G2565A 에서의 스캐닝 및 특징 추출 (Feature Extraction, FE) v9.5 를 사용하여 신호를 추출하였다. 상이한 어레이 및 시점에서 이중 교잡 (99 개 샘플) 을 사용하여 실험을 수행하였다. 2 개의 샘플을 단 한번 프로파일링하였다. 반복검증된 프로브에 대한 miRNA 신호 강도를 플랫폼을 거쳐 평균화시켰고, log2 변환시키고, 75 퍼센타일로 정규화시켰다. miRNA 발현 상태를 FE v9.5 에서의 디폴트 세팅에 의해 각각의 샘플에서의 각각의 유전자에 대한 존부로서 기록하였다.
DNA 메틸화. 1 마이크로그램의 DNA 를 EpiTect 96 Bisulfite Kit (Qiagen GmbH, Germany) 를 사용하여 중아황산염으로 처리하였다. 500 ng 의 중아황산염 처리된 DNA 를, 807 개의 암 관련 유전자에서의 1505 개의 CpG 부위를 동시에 분석하는 GoldenGate Methylation Cancer Panel I (Illumina Inc, CA, USA) 를 사용하여 분석하였다. 2 개 이상의 CpG 부위를 유전자마다 분석하였고, 하나의 CpG 부위는 촉진 구간에 있고, 하나의 CpG 부위는 첫 번째 엑속에 있고, 제조자의 계획안에 따라 메틸화 데이터의 초기 처리를 위해 Bead studio 소프트웨어를 사용하였다. 각각의 CpG 부위에 대한 검출 p-값을 샘플 성과를 검증하기 위해 사용하였고, 데이터세트를 검출 p-값에 기초하여 여과하고, 검출 p-값 0.05 초과인 CpG 부위는 추가 분석으로부터 제외하였다.
데이터 예비-처리 및 PARADIGM 모수. 카피 수를 CBS 를 사용하여 세그먼트화한 후, hgl8 에서의 RefSeq 유전자 좌표를 포괄하는 모든 세그먼트의 중앙값을 선택함으로써 유전자-레벨 측정값을 매핑하였다. mRNA 발현에 대해, 측정값을 우선 각각의 프로브에 대한 중앙 발현값을 빼어 프로브-정규화시켰다. 각각의 프로브에 대한 제조자의 게놈 위치를 UCSCs liftOver 도구를 사용하여 hgl7 로부터 hgl8 로 전환시켰다. RefSeq 유전자를 중복시키는 모든 프로브의 중앙값을 선택함으로써 유전자 당 측정값을 얻었다. 메틸화 프로브를 제조자 설명을 사용하여 유전자와 매치시켰다. 각각의 데이터세트를 별도로 분위수 변환시킴으로써 PARADIGM 을 이전 (10) 과 같이 실행한 반면, 데이터를 5% 및 95% 분위수에서 동일한 크기의 빈 (bin) 으로 이산시켰다. 앞서 분석한 바와 같이 경로 파일은 PID (36) 으로부터였다. 도 26 은 각각의 데이터유형에서의 높고 낮은 빈에서의 관측값의 소수를 계산함으로써 IPL 값이 아닌 이산된 입력 데이터의 요약을 나타내고, 임의의 데이터유형에서 관측값의 가장 높은 소수를 갖는 빈과 함께 각각의 노드를 표시한다.
HOPACH 자율 군집화
군집은 HOPACH R 버전 2.12 에서 작동하는 R 구현 버전 2.10 (37) 를 사용하여 유도하였다. 비-표준 분산도 및 제로값의 출현율로 인하여 코사인각을 사용하는, PARADIGM IPL 을 제외하고 모든 데이터 유형에 상관관계 거리 미터법을 사용하였다. 5 개 미만의 샘플을 함유하는 샘플의 임의의 군집에 대해 각각의 샘플을 더 큰 군집에서의 가장 유사한 샘플과 동일한 군집으로 매핑하였다. MicMa 데이터세트에서의 PARADIGM 군집을 MicMa 데이터세트에서 (중앙값 함수를 사용하여) 각각의 군집의 중앙을 결정하고, 이후 코사인각 거리에 의해 군집 중앙에 가장 근접한 다른 데이터세트에 각각의 샘플을 분배함으로써 다른 데이터유형으로 나타내었다.
카플란-마이어, 군집 강화 (Cluster enrichment). 카플란-마이어 통계, 플롯 및 군집 강화를 R 버전 2.12 를 사용하여 결정하였다. 콕스 p-값은 coxph() 비례 위험 모형으로부터의 발트 검정 (Wald test) 를 사용하여 결정하였고, log-순위 p-값은 survdiff() 함수로부터의 카이제곱 검정으로부터 결정하였다. 군집화에 대한 유전자 또는 경로 구성원의 값의 전체 강화를 ANOVA 에 의해 결정하였고, 특정 군집 라벨에 대한 유전자의 강화는 모든 다른 군집에서의 유전자 값에 대한 특정 군집에서의 유전자의 값의 T-검정에 의해 결정하였다. FDR 을 p.adjust 의 Benjamini & Hochberg 방법을 사용하여 결정하였다.
실시예 XXXIX: 데이터세트 및 경로 상호작용
카피 수 및 발현 데이터를 Paradigm 추론에 통합시켰다. 일련의 8 개의 정상 조직 대조군은 발현 데이터에서의 분석에 이용될 수 있기 때문에 각각의 환자의 유전자-값을 일반 나팔관 대조군에서 관찰되는 유전자의 중앙값을 빼어 정규화시켰다. 카피 수 데이터를 정규화시켜 정상 혈액에 비해 종양에서 검출된 유전자의 레벨 사이에서의 카피 수의 차이점을 반영하였다. PARADIGM에의 입력을 위해, 발현 데이터를 아류형 분석에 사용되는 동일한 통합된 데이터세트로부터 선택하였고, 카피 수를 MSKCC Agilent 1M 카피 수 데이터의 세그먼트화된 콜 (call) 로부터 선택하였다.
경로의 집합을 131 개의 경로, 11,563 개의 상호작용, 및 7,204 개의 독립체를 함유하는 NCI-PID 로부터 얻었다. 독립체는 분자, 복합체, 소형 분자, 또는 PARADIGM 의 그래프 모델에서 "노드" 로서 나타내는 추상적 개념이다. 추상적 개념은 일반 세포 과정 (예컨대 "세포자멸사" 또는 "광흡수,") 및 기능적 활성, 예컨대 신호 변환기의 RAS 패밀리를 공유하는 유전자의 패밀리에 대응된다. 본원에서 단백질-단백질 상호작용, 전사 조절 상호작용, 단백질 변형 예컨대 인산화 및 유비퀴틴화 상호작용을 포함하는 상호작용을 수집하였다.
실시예 XL: 경로 컨텍스트에서의 통합된 분자 활성의 추론
본원에서 카피 수, 유전자 발현 및 각각의 독립체의 경로 컨텍스트를 반영하는 통합 경로 활성 (IPA) 을 지정하는 PARADIGM 을 사용하였다.
IPA 의 유의성을 데이터의 유전자- 및 환자-특유의 단면의 순열을 사용하여 평가하였다. 게놈에서의 각각의 유전자에 대한 값의 카피 수 쌍 및 유전자-발현을 무작위적으로 선택함으로써 1000 명의 "공" 환자에 대한 데이터를 생성하였다. PARADIGM IPA 의 유의성을 평가하기 위해 경로 구조를 유지하며 경로에 무작위 유전자를 지정함으로써 영 분포를 구성하였다.
실시예 XLI: FOXM1 경로의 확인
FOXM1 네트워크에서의 모든 유전자를 사용하여 무작위 자극 동안 통계적 유의성을 평가하는 동안, FOXM1 경로의 시각화를 가능하게 하기 위해, 도 29 에 따라 유의하게 변경된 IPA 를 갖는 FOXM1 에 직접 연결된 독립체를 도 27 에 포함시키기 위해 선택하였다. 이들 중에서, FOXM1 과의 상호작용에 대한 문헌 증거를 갖는 것으로 밝혀진 DNA 수선 및 세포 주기 조절의 역할을 갖는 유전자를 나타내었다. 본래의 NCI-PID 경로에서 발견되지 않은 BRCC 복합체 멤버가 NCI-PID 에 따른 FOXM1 의 표적인 BRCA2 와 함께 플롯에 포함되었다. 다른 NCI 경로에서 CHEK2 의 업스트림 조절자를 발견함으로써 업스트림 DNA 수선 타겟을 확인하였다 (예를 들어, ATM 으로부터의 비직접적 연결이 PLK3 신호화 경로에서 발견되지 않음).
실시예 XLII: 군집화
활성 및 직접적 활성이 아닌 가능성에서의 변화를 나타내는 추론된 활성의 사용은, 다양한 유형의 독립체가 하나의 열지도로 함께 군집화되게 한다. PARADIGM 추론의 결과를 전세계적으로 시각화하기 위해서 아이젠 군집 3.0 을 사용하여 특징 필터링 및 군집화를 수행하였다. 0.1 의 표준 편차 필터링은 잔여 경로 복합체 7204 개 중 1598 개를 나타내었고, 평균 연결, 비중심적 상관관계 계층적 군집이 복합체 및 샘플에 대해 수행되었다.
실시예 XLIII: 게놈 DNA 의 분리
혈액 샘플 (2-3 ml) 를 환자로부터 수집하고, 사용하기까지 -80 ℃ 에서 EDTA-함유 튜브에 저장하였다. 게놈 DNA 를 제조자의 설명 (PUREGENE, Gentra Systems, Minneapolis MN) 에 따라 DNA 분리 키트를 사용하여 혈액 샘플로부터 추출하였다. DNA 순도를 Beckman 분광 광도계를 사용하여 측정한 260 및 280 nm (1 cm 광경로; A260/A280) 에서의 흡광도의 비로서 측정하였다.
실시예 XLIV: SNP 의 확인
환자의 DNA 샘플로부터의 유전자의 영역을 상기 영역을 위해 특별하게 고안된 프라이머를 사용하여 PCR 로 증폭시켰다. PCR 생성물을 상기에서 개시된 바와 같은 당업자에게 익히 공지된 방법을 사용하여 배열하였다. 서열 추적에서 확인된 SNP 를 Phred/Phrap/Consed 소프트웨어를 사용하여 입증하였고, NCBI SNP 데이터뱅크에 맡겨진 공지된 SNP 와 비교하였다.
실시예 XLV: 통계적 분석
평균 ± SD 로서 값을 표현하였다. χ2 분석 (Web Chi Square Calculator, Georgetown Linguistics, Georgetown University, Washington DC) 을 사용하여 정상 대상 및 질환을 가진 환자 사이에서의 유전자형 빈도에서의 차이점을 평가하였다. 사후 분석과 함께 일원배치 ANOVA 를 표시된 바와 같이 수행하여 상이한 환자 그룹들 사이에서 혈유역학을 비교하였다.
당업자는 상기 기술된 구현예의 다양한 적용 및 변형이 본 발명의 범위 및 사상을 벗어나지 않고 이루어질 수 있음을 이해할 수 있을 것이다. 본 기술분야에서 공지된 다른 적합한 기술 및 방법이 당업자에 의해 기술된 본 발명의 상세한 설명을 고려하여 다양한 특정 양태에 적용될 수 있다.
따라서, 본 발명이 본원에서 특별하게 기재된 것과 다르게 수행될 수 있다는 것이 이해된다. 상기 설명은 제한하기 위한 것이 아닌 예시적인 것으로 의도된다. 많은 다른 구현예는 상기 설명을 검토하는 경우 당업자에게 명백할 것이다. 따라서 본 발명의 범위는 이러한 청구범위가 부여하는 전체 범위의 등가물과 함께 첨부된 청구범위를 참조하여 결정되어야 한다.
표 3
Figure pat00009
Figure pat00010
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
Figure pat00019

Figure pat00020
Figure pat00021
Figure pat00022

Figure pat00023
Figure pat00024

Figure pat00025
Figure pat00026
Figure pat00027
Figure pat00028
Figure pat00029

Figure pat00030
Figure pat00031

Figure pat00032
Figure pat00033
Figure pat00034
Figure pat00035
Figure pat00036
Figure pat00037
Figure pat00038
Figure pat00039
Figure pat00040
Figure pat00042
Figure pat00043
Figure pat00044
Figure pat00045
Figure pat00046
Figure pat00047
Figure pat00048
Figure pat00049
Figure pat00050
Figure pat00051
Figure pat00052

Figure pat00053
Figure pat00054
Figure pat00055
Figure pat00056
Figure pat00057
Figure pat00058
Figure pat00059
Figure pat00060
Figure pat00061
Figure pat00062
Figure pat00063

Claims (11)

  1. 생물학적 관련 정보를 분석하기 위한 컴퓨터 구현 시스템(computer implemented system)으로서,
    동적 경로 맵 (DPM) 을 저장하는 모델 데이터베이스에의 엑세스를 제공하는 단계로서, 상기 DPM 은 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 갖는 확률적 경로 모델의 변형에 의해 생성되는 단계;
    제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 수득하는 단계; 및
    제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성 및 DPM 을 사용하여, 분석 엔진을 통해, 제 2 세포 또는 환자 샘플에 대한 예측되는 경로 활성 정보를 결정하는 단계
    를 포함하고, 예측되는 경로 활성 정보에 적어도 부분적으로 기초한 치료 권고를 생성하는 단계를 추가로 포함하는 컴퓨터 구현 시스템.
  2. 제 1 항에 있어서, 제 1 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 측정된 속성이 건강한 세포 또는 조직, 세포 또는 조직의 특정 연령, 세포 또는 조직의 특이 질환, 이환된 세포 또는 조직의 특정 질환 단계, 특정 성별, 특정 민족군, 특정 직업군, 및 특정 종에 대해 특유한 컴퓨터 구현 시스템.
  3. 제 1 항에 있어서, 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 측정된 속성이 돌연변이, 차등 유전자 서열 대상, 유전자 카피 수, 전사 레벨, 번역 레벨, 단백질 활성, 및 단백질 상호작용으로 이루어진 군으로부터 선택되는 컴퓨터 구현 시스템.
  4. 제 1 항에 있어서, 제 1 및 제 2 샘플이 동일한 세포 또는 환자로부터 수득되고, 제 2 세포 또는 환자 샘플의 복수의 엘리먼트에 대한 복수의 측정된 속성을 수득하기 전에 세포 또는 환자에 치료를 제공하는 단계를 추가로 포함하는 컴퓨터 구현 시스템.
  5. 제 4 항에 있어서, 치료가 방사선, 환자에 제약 투여, 및 상기 세포에 후보 분자 투여로 이루어진 군으로부터 선택되는 컴퓨터 구현 시스템.
  6. 제 5 항에 있어서, 후보 분자가 후보 분자의 라이브러리의 일원인 컴퓨터 구현 시스템.
  7. 제 1 항에 있어서, 예측되는 경로 활성 정보가 질환에 관한 하나 이상의 경로에서 질환-결정적 엘리먼트로서 엘리먼트를 확인하는 컴퓨터 구현 시스템.
  8. 제 1 항에 있어서, 예측되는 경로 활성 정보를 사용하여 진단, 질환의 예후, 또는 치료 옵션의 선택, 및 식사 지침으로 이루어진 군으로부터 선택되는 권고를 공식화하는 단계를 추가로 포함하는 컴퓨터 구현 시스템.
  9. 제 1 항에 있어서, 예측되는 경로 활성 정보를 사용하여 유전자 외적 인자, 스트레스 적응, 유기체의 상태, 및 회복 또는 치유 상태를 확인하는 단계를 추가로 포함하는 컴퓨터 구현 시스템.
  10. 제 1 항에 있어서, 예측되는 경로 활성 정보가 하나 이상의 경로에서 계층적-우성 엘리먼트로서 엘리먼트를 확인하는 컴퓨터 구현 시스템.
  11. 제 1 항에 있어서, 예측되는 경로 활성 정보의 그래픽 표현을 생성하는 단계를 추가로 포함하는 컴퓨터 구현 시스템.
KR1020157010056A 2011-10-26 2011-10-31 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm) KR20150048909A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/317,769 2011-10-26
US13/317,769 US10192641B2 (en) 2010-04-29 2011-10-26 Method of generating a dynamic pathway map
PCT/US2011/001844 WO2013062505A1 (en) 2011-10-26 2011-10-31 Pathway recognition algorithm using data integration on genomic models (paradigm)

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020147013980A Division KR101554530B1 (ko) 2011-10-26 2011-10-31 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)

Publications (1)

Publication Number Publication Date
KR20150048909A true KR20150048909A (ko) 2015-05-07

Family

ID=48168183

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147013980A KR101554530B1 (ko) 2011-10-26 2011-10-31 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
KR1020157010056A KR20150048909A (ko) 2011-10-26 2011-10-31 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020147013980A KR101554530B1 (ko) 2011-10-26 2011-10-31 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)

Country Status (9)

Country Link
US (2) US10192641B2 (ko)
EP (1) EP2771830A4 (ko)
JP (4) JP6061941B2 (ko)
KR (2) KR101554530B1 (ko)
CN (2) CN104011726A (ko)
AU (1) AU2011380013B2 (ko)
CA (2) CA3021833A1 (ko)
IL (2) IL232243A (ko)
WO (1) WO2013062505A1 (ko)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3007713C (en) 2010-04-29 2020-05-26 The Regents Of The University Of California Pathway recognition algorithm using data integration on genomic models (paradigm)
DE102011079034A1 (de) 2011-07-12 2013-01-17 Siemens Aktiengesellschaft Ansteuerung eines technischen Systems
AU2013286622B2 (en) 2012-07-06 2018-10-04 Nant Holdings Ip, Llc Healthcare analysis stream management
US11361867B2 (en) * 2012-10-05 2022-06-14 H. Lee Moffitt Cancer Center And Research Institute, Inc. Pathways for treating patients
CA2888125A1 (en) * 2012-10-09 2014-04-17 Five3 Genomics, Llc Systems and methods for learning and identification of regulatory interactions in biological pathways
KR102279844B1 (ko) * 2012-12-26 2021-07-21 코닌클리케 필립스 엔.브이. 타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가
CA2920608C (en) 2013-05-28 2018-07-24 Five3 Genomics, Llc Paradigm drug response networks
EP3014505A4 (en) 2013-06-28 2017-03-08 Nantomics, LLC Pathway analysis for identification of diagnostic tests
US10114925B2 (en) 2013-07-26 2018-10-30 Nant Holdings Ip, Llc Discovery routing systems and engines
KR102004335B1 (ko) 2013-09-26 2019-07-26 파이브3 제노믹스, 엘엘씨 바이러스-연관 종양을 위한 시스템, 방법, 및 조성물
CN109979526B (zh) 2014-03-25 2023-11-24 凡弗3基因组有限公司 用于功能证实癌症突变的rna分析的系统和方法
WO2015184439A1 (en) * 2014-05-30 2015-12-03 Five3 Genomics, Llc Systems and methods for comprehensive analysis of molecular profiles across multiple tumor and germline exomes
CN107548498A (zh) 2015-01-20 2018-01-05 南托米克斯有限责任公司 用于反应预测高级别膀胱癌中的化疗的系统和方法
AU2016280074B2 (en) * 2015-06-15 2020-03-19 Nantomics, Llc Systems and methods for patient-specific prediction of drug responses from cell line genomics
CA3003305A1 (en) 2015-10-12 2017-04-20 Nantomics, Llc Iterative discovery of neoepitopes and adaptive immunotherapy and methods therefor
KR102375973B1 (ko) * 2015-11-05 2022-03-17 김훈 사례기반 추론엔진을 이용한 보안 서버 및 보안 기능의 설치를 위한 저장 매체
CN105447337B (zh) * 2015-11-13 2018-01-26 大连理工大学 一种基于动态网络图分析的时间序列数据处理方法
KR20180107257A (ko) 2016-02-19 2018-10-01 난트 홀딩스 아이피, 엘엘씨 면역원 조절 방법 (methods of immunogenic modulation)
US11154597B2 (en) 2016-03-24 2021-10-26 Nantcell, Inc. Sequence arrangements and sequences for neoepitope presentation
WO2017193080A1 (en) * 2016-05-05 2017-11-09 Nantomics, Llc Checkpoint failure and methods therefor
US20170329914A1 (en) * 2016-05-11 2017-11-16 International Business Machines Corporation Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies
WO2018006057A1 (en) 2016-06-30 2018-01-04 Nantomics, Llc Synthetic wgs bioinformatics validation
TW201803598A (zh) 2016-06-30 2018-02-01 南特細胞公司 Nant癌症疫苗
JP2019527894A (ja) * 2016-08-03 2019-10-03 ナントミクス,エルエルシー ダサチニブ反応予測モデルおよびその方法
WO2018039567A1 (en) 2016-08-25 2018-03-01 Nantomics, Llc Immunotherapy markers and uses therefor
EP3535422A2 (en) * 2016-11-07 2019-09-11 Grail, Inc. Methods of identifying somatic mutational signatures for early cancer detection
CN110168646B (zh) * 2016-11-17 2023-12-19 南特生物科学公司 预测抗癌途径的验证
WO2018094204A1 (en) * 2016-11-17 2018-05-24 Arivale, Inc. Determining relationships between risks for biological conditions and dynamic analytes
AU2017362730B2 (en) 2016-11-21 2021-04-08 Nant Holdings Ip, Llc Fractal combination therapy
US10629292B2 (en) 2016-12-19 2020-04-21 Seven Bridges Genomics, Inc. Generation and use of simulated genomic data
CA3052803A1 (en) 2017-02-07 2018-08-16 Nantcell, Inc. Maximizing t-cell memory and compositions and methods therefor
US20180251849A1 (en) * 2017-03-03 2018-09-06 General Electric Company Method for identifying expression distinguishers in biological samples
US20200051660A1 (en) * 2017-03-28 2020-02-13 Mantomics, Llc MODELING miRNA INDUCED SILENCING IN BREAST CANCER WITH PARADIGM
CA3061240C (en) 2017-04-24 2024-01-16 Nantcell, Inc. Targeted neoepitope vectors and methods therefor
US10686669B2 (en) * 2017-06-16 2020-06-16 Cisco Technology, Inc. Collecting network models and node information from a network
CN111868077A (zh) 2018-01-17 2020-10-30 南特生物公司 Gpi锚定抗原的增强的免疫原性
WO2019168426A1 (ru) * 2018-03-01 2019-09-06 Общество С Ограниченной Ответственностью "Онкобокс" Способ и система для оценки клинической эффективности таргетных лекарственных средств
JP2021518432A (ja) 2018-03-16 2021-08-02 サイファー メディシン コーポレイション 抗tnf療法に対する応答性を予測するための方法及びシステム
US11823773B2 (en) 2018-04-13 2023-11-21 Nant Holdings Ip, Llc Nant cancer vaccine strategies
US11564980B2 (en) 2018-04-23 2023-01-31 Nantcell, Inc. Tumor treatment method with an individualized peptide vaccine
TWI787500B (zh) 2018-04-23 2022-12-21 美商南特細胞公司 新抗原表位疫苗及免疫刺激組合物及方法
CN108795934B (zh) * 2018-05-23 2022-06-21 中国农业科学院上海兽医研究所(中国动物卫生与流行病学中心上海分中心) 日本血吸虫SjELAV-like 2基因的siRNA及其应用
US11189361B2 (en) * 2018-06-28 2021-11-30 International Business Machines Corporation Functional analysis of time-series phylogenetic tumor evolution tree
US11211148B2 (en) 2018-06-28 2021-12-28 International Business Machines Corporation Time-series phylogenetic tumor evolution trees
JP7404648B2 (ja) 2019-04-25 2023-12-26 富士通株式会社 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム
WO2020264426A1 (en) 2019-06-27 2020-12-30 Scipher Medicine Corporation Developing classifiers for stratifying patients
CN112816275B (zh) * 2019-11-18 2022-04-05 中国科学院深圳先进技术研究院 脑部修块装置
CN111161796B (zh) * 2019-12-30 2024-04-16 中南大学 一种预测PD潜在gene和miRNA的方法及系统
RU2756883C1 (ru) * 2020-06-09 2021-10-06 ФГАУ "Военный инновационный технополис "ЭРА" Устройство для вероятностного моделирования процесса функционирования телекоммуникационной сети
CN111883203B (zh) * 2020-07-03 2023-12-29 上海厦维医学检验实验室有限公司 用于预测pd-1疗效的模型的构建方法
US11481235B2 (en) * 2021-01-11 2022-10-25 Evicore Healthcare MSI, LLC Database framework model transformation for pathway identification
US11439159B2 (en) 2021-03-22 2022-09-13 Shiru, Inc. System for identifying and developing individual naturally-occurring proteins as food ingredients by machine learning and database mining combined with empirical testing for a target food function
CN113434693B (zh) * 2021-06-23 2023-02-21 重庆邮电大学工业互联网研究院 一种基于智慧数据平台的数据集成方法
CN113436729A (zh) * 2021-07-08 2021-09-24 湖南大学 一种基于异构图卷积神经网络的合成致死相互作用预测方法
CN115203172B (zh) * 2022-06-30 2023-11-07 北京亚控科技发展有限公司 模型构建及模型数据订阅方法、装置、电子设备和介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5968770A (en) 1995-02-10 1999-10-19 Millennium Pharmaceuticals, Inc. Compositions and methods for the treatment and diagnosis of cardiovascular disease using rchd523 as a target
US7709454B2 (en) 1997-06-20 2010-05-04 New York University Methods and compositions for inhibiting tumorigenesis
US6980958B1 (en) * 2000-01-11 2005-12-27 Zycare, Inc. Apparatus and methods for monitoring and modifying anticoagulation therapy of remotely located patients
CA2396495A1 (en) 2000-01-25 2001-08-02 Cellomics, Inc. Method and system for automated inference creation of physico-chemical interaction knowledge from databases of co-occurrence data
EP1419472A2 (en) 2001-08-16 2004-05-19 Biotech Research Ventures Pte Ltd Method for modelling biochemical pathways
US20040167763A1 (en) 2002-05-31 2004-08-26 Liebman Michael N Information processing method for evaluating biochemical pathway models using clinical data
US8005620B2 (en) 2003-08-01 2011-08-23 Dna Twopointo Inc. Systems and methods for biopolymer engineering
WO2005096207A1 (ja) 2004-03-30 2005-10-13 Shigeo Ihara 文献情報処理システム
JP2006185412A (ja) 2004-12-03 2006-07-13 Kazusa Dna Kenkyusho 情報処理装置、情報処理方法及びそのプログラム
US7848890B2 (en) 2004-12-08 2010-12-07 Electronics And Telecommunications Research Institute Method and system for predicting gene pathway using gene expression pattern data and protein interaction data
US20060293859A1 (en) 2005-04-13 2006-12-28 Venture Gain L.L.C. Analysis of transcriptomic data using similarity based modeling
WO2006124836A1 (en) 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
US8642512B2 (en) * 2005-05-17 2014-02-04 Cellact Pharma Gmbh Method of detecting early immune activation
JP2007011996A (ja) 2005-07-04 2007-01-18 Fujitsu Ltd 発現情報の解析方法及びそのシステム
JP2007052766A (ja) * 2005-07-22 2007-03-01 Mathematical Systems Inc パスウェイ表示方法、情報処理装置及びパスウェイ表示プログラム
CN101790731B (zh) * 2007-03-16 2013-11-06 纳特拉公司 用于清除遗传数据干扰并确定染色体拷贝数的系统和方法
EP2366162A1 (en) 2008-11-18 2011-09-21 Collabrx, Inc. Individualized cancer treatment
JP5429567B2 (ja) 2009-06-29 2014-02-26 株式会社ジェイテクト アンギュラ玉軸受用樹脂保持器
GB2474694B (en) * 2009-10-23 2011-11-02 Innovia Films Ltd Biodegradable composites
WO2011055820A1 (ja) * 2009-11-09 2011-05-12 大日本住友製薬株式会社 支援装置、支援方法、及びコンピュータプログラム
CA3007713C (en) 2010-04-29 2020-05-26 The Regents Of The University Of California Pathway recognition algorithm using data integration on genomic models (paradigm)

Also Published As

Publication number Publication date
US20150142465A1 (en) 2015-05-21
IL232243A (en) 2016-11-30
KR101554530B1 (ko) 2015-09-21
CN108664762A (zh) 2018-10-16
IL232243A0 (en) 2014-06-30
JP6129998B2 (ja) 2017-05-17
WO2013062505A1 (en) 2013-05-02
JP6061941B2 (ja) 2017-01-18
US20120158391A1 (en) 2012-06-21
CN104011726A (zh) 2014-08-27
AU2011380013A1 (en) 2014-05-08
JP2019008812A (ja) 2019-01-17
JP2014532859A (ja) 2014-12-08
JP2017182813A (ja) 2017-10-05
US10192641B2 (en) 2019-01-29
KR20140078766A (ko) 2014-06-25
AU2011380013B2 (en) 2014-06-05
EP2771830A1 (en) 2014-09-03
CA2853702A1 (en) 2013-05-02
EP2771830A4 (en) 2015-03-25
JP2016122451A (ja) 2016-07-07
IL248380B (en) 2019-07-31
JP6396532B2 (ja) 2018-09-26
CA3021833A1 (en) 2013-05-02
JP6854792B2 (ja) 2021-04-07
IL248380A0 (en) 2016-11-30

Similar Documents

Publication Publication Date Title
KR101554530B1 (ko) 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
JP6717898B2 (ja) ゲノムモデルに関するデータ統合を用いたパスウェイ認識アルゴリズム(paradigm)
AU2014221248B2 (en) Pathway recognition algorithm using data integration on genomic models (paradigm)

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application