KR20150100896A - 타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가 - Google Patents

타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가 Download PDF

Info

Publication number
KR20150100896A
KR20150100896A KR1020157020316A KR20157020316A KR20150100896A KR 20150100896 A KR20150100896 A KR 20150100896A KR 1020157020316 A KR1020157020316 A KR 1020157020316A KR 20157020316 A KR20157020316 A KR 20157020316A KR 20150100896 A KR20150100896 A KR 20150100896A
Authority
KR
South Korea
Prior art keywords
pathway
target gene
tissue
cells
activity
Prior art date
Application number
KR1020157020316A
Other languages
English (en)
Other versions
KR102279844B1 (ko
Inventor
오이젠 헨드릭 잔 반
빌헬무스 프란시스코 요한네스 베르하흐
데 비엘 팔 아놀드 반
Original Assignee
코닌클리케 필립스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 엔.브이. filed Critical 코닌클리케 필립스 엔.브이.
Publication of KR20150100896A publication Critical patent/KR20150100896A/ko
Application granted granted Critical
Publication of KR102279844B1 publication Critical patent/KR102279844B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • G06F19/12
    • G06F19/24
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/048Fuzzy inferencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 출원은 주로 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하기 위한 특정 방법, 이러한 방법을 수행하도록 구성된 디지털 압축기를 포함하는 장치, 및 이러한 방법을 수행하기 위해 디지털 처리 디바이스에 의해 실행 가능한 명령들을 저장하는 비일시적 저장 매체에 관한 것이다.

Description

타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가 {ASSESSMENT OF CELLULAR SIGNALING PATHWAY ACTIVITY USING LINEAR COMBINATION(S) OF TARGET GENE EXPRESSIONS}
본원에 기술된 주제는 주로 생물 정보학, 유전체 처리 기술, 단백체(proteome) 처리 기술 및 관련 기술에 관한 것이다.
유전체(genome) 및 단백체 분석은 종양학과 같은 의료 분야에서의 임상적 응용을 위한 상당히 현실적이고 잠재적인 가능성을 가지며, 여기서, 다양한 암들은 유전체 돌연변이/변형 및/또는 암의 성장 및 진화, 예를 들면, 세포 증식 및 전이에서 역할을 하는 특정 유전자들에 대한 높거나 낮은 발현 수준의 특정한 조합과 연관되는 것으로 알려져 있다. 예를 들면, Wnt 시그널링 경로는 세포 증식의 조절에 영향을 미치고, 매우 조절된다. 조절 실패(loss of regulation)로 인한 높은 Wnt 경로 활성은 암, 그 중에서도 악성 결장 종양과 연관된다. 임의의 특정 작동 이론에 제한되지는 않지만, 악성 결장 세포에서의 Wnt 경로의 조절 완화(deregulation)는 높은 Wnt 경로 활성을 초래하고, 이것이 결국 악성 결장 세포의 세포 증식, 즉, 결장암의 확산을 유발하는 것으로 여겨진다. 다른 한편으로, 예를 들면, 골다공증의 경우에는 비정상적으로 낮은 경로 활성이 또한 관심을 끌 수 있다.
유전체 및 단백체 데이터를 획득하기 위한 기술들은 임상 현장에서 쉽게 이용 가능하게 되었다. 예를 들면, 마이크로어레이(microarray)에 의한 측정이 유전자 발현 수준, 단백질 수준, 메틸화 등을 평가하기 위해 일상적으로 사용된다. 자동 유전자 서열화는 DNA 및 mRNA에서 유전 변이의 비용-효과적인 식별을 가능하게 한다. 유전자 서열화 동안 mRNA 수준의 정량적 평가는 유전자 발현 수준을 평가하기 위한 또 다른 임상 도구로서의 가능성을 지닌다.
이러한 발전에도 불구하고(또는 아마도, 이것 때문에), 유전체 및 단백체 분석의 임상적 응용은 상당한 난관―데이터 과부하―에 직면한다. 예를 들면, 단일 임상 샘플에서의 식별 가능한 돌연변이의 수는 수십만 개 이상일 수 있다. 이러한 돌연변이 대부분은 암 성장에 특별히 기여하지 않는 소위 방관자 돌연변이(bystander mutations)이고, 단지 몇몇이 암 성장 및 기능적 진화에 기여하며, 이것이 효과적인 치료를 위한 타깃을 제공한다. 단일 마이크로어레이는 수만 개의 유전자에 대한 유전자 발현 수준을 생성할 수 있다. 예를 들면, 정확한 치료법을 선택하는 경우에서와 같이, 임상적으로 유용한 정보를 식별하기 위해 이러한 대량의 데이터를 처리하는 것은 어렵다.
한 가지 방식은 분석을 미국 식약청(FDA)에 의해 입증된 검사들과 같은 몇 가지 기본적이고 또는 표준이 되는 검사들로 제한하는 것이다. 이러한 방식에서는, 제시된 질병 상태(예를 들면, 특정 유형의 암)에 대해 "양성"인지를 검사하기 위해 특정 지표 또는 지표들의 조합(예를 들면, 돌연변이 및/또는 명시된 높은 또는 낮은 유전자 발현 수준)을 검출한다. 기본 검사는 질병 상태 또는 치료 효과와 강한 상관성을 나타내는 임상 연구들에 의해 뒷받침된다. 이러한 방식은 기본 검사가 개발된 임상 상태들, 예를 들면, 질병의 특정 진단 또는 특정 단계의 특정 암 유형에서의 약물에 대한 반응 예측에 대해서만 유용하고, 또한 기본 조건들에 대해서만 적용 가능하기 때문에 엄격하다.
또 다른 방식은 유전체 또는 단백체 지표의 기능적으로 관련된 그룹의 식별에 기초한다. 예를 들면, Wnt 경로는 단백체 반응의 캐스케이드(cascade)를 포함한다. 이러한 연쇄반응의 주요 구성요소는 결국 세포 핵에서의 β-카테닌/TCF4계 단백질 복합체와 같은 전사제(transcription agent)의 수준에 영향을 미치는 흩어진 단백질군의 단백질의 활성화를 유발하는 세포의 프리즐드 표면 수용체(frizzled surface receptor)에 Wnt 시그널링 단백질을 결합시키는 것을 포함한다(그러나 이것으로 제한되지는 않는다). 이러한 전사제는 결국 Wnt 경로의 타깃 단백질로 해독되는 타깃 mRNA 분자의 전사를 제어한다. 임상 연구들은 Wnt 경로의 조절 단백질 및 Wnt 경로의 활성 간에 어느 정도의 상관성을 보여 주었다.
그러나, 이러한 임상 연구 결과를 특정 환자의 진단 및 임상 평가에 적용하는 것은 시그널링 경로, 예를 들면, Wnt 경로의 복잡성으로 인해 어렵다. 간단한 예로서, Wnt 경로에서 "업스트림"에 있는 단백질의 발현 수준의 측정은 Wnt 경로에서 "다운스트림"에 있는 단백질의 비정상적인 거동을 검출하는데 실패할 수 있다. Wnt 경로는 많은 피드백 메커니즘들을 포함하고, "업스트림" 및 "다운스트림"의 간략한 개념은 Wnt 경로의 상당한 부분에 대해서는 적용할 수 없을 수 있는 것으로 여겨지며; 보다 일반적으로, Wnt 경로를 포함하는 단백질 캐스케이드의 한 부분에서의 비정상적인 거동은 단백질 캐스케이드의 다른 부분들에 대해 및 Wnt 경로 전체의 활성에 대해 다소 영향을 미칠 수 있다. 여전히 추가로, 일부 임상 연구들에 있어서, 시그널링 캐스케이드의 조절 단백질에 대한 단백질 발현 수준은 조절 단백질을 암호화하는 유전자들의 mRNA 발현 수준을 측정함으로써 평가된다. 이것은 조절 단백질 발현 수준을 정확히 평가할 수 없는 간접 측정이고, (인산화와 같은 특정 해독 후 변형(post-translational modification) 이후의) 활성 단백질의 양을 거의 반영하지 않는다.
따라서, 본 발명의 근본적인 주요 문제점은 각각 유전체 및 단백체 분석을 수행하기 위한 적합한 방법 및 수단을 제공하는 것이었다. 근본적인 문제점의 특정 국면들 뿐만 아니라 본 발명과 관련된 추가의 이의들은 본원에 제공되는 상세한 설명 및 예시들을 살펴볼 때 및 특히 첨부된 청구항들을 살펴볼 때 자명해진다.
본 발명은 본원에 개시된 바와 같은 신규하고 개선된 방법 및 장치를 제공한다.
본 발명의 주요 국면에 따르면, 상기 문제점은 타깃 유전자 발현의 선형 조합(들)(linear combination)을 사용하여 세포 시그널링 경로 활성을 평가하기 위한 특정 방법에 의해 해결되고, 즉 상기 방법은:
- 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준(특히 mRNA 및/또는 단백질 (활성) 수준)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하는 단계[여기서, 상기 추론 단계는
상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 전사 인자(TF) 요소의 수준을 측정하는 단계(여기서, 상기 TF 요소는 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 전사를 제어하고, 상기 결정 단계는 TF 요소의 수준에 대한 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준에 관한 수학적 모델을 평가하는 것에 적어도 부분적으로 기초하고, 상기 모델은 하나 이상의 타깃 유전자(들)의 발현 수준의 하나 이상의 선형 조합(들)에 적어도 부분적으로 기초한다); 및
상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 TF 요소의 상기 결정된 수준에 기초하여 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하는 단계를 포함한다]; 및
- 상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 상기 추론된 활성에 기초하여 세포 시그널링 경로가 의료 피험자의 조직 및/또는 세포에서 비정상적으로 작동하고 있는지를 결정하는 단계를 포함하고,
여기서, 상기 추론 단계는 세포 시그널링 경로의 모델을 사용하여 디지털 처리 디바이스에 의해 수행된다.
의료 피험자는 인간 또는 동물일 수 있다. 더욱이, "타깃 유전자(들)"는 (본원에 기술된 바와 같은) "직접 타깃 유전자" 및/또는 "간접 타깃 유전자"일 수 있다.
하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 하나 이상의 타깃 유전자(들)에 대해 제공된 하나 이상의 발현 수준(들)의 모든 발현 수준들의 선형 조합을 포함하는 방법이 바람직하다.
하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 하나 이상의 타깃 유전자(들)의 각각에 대해 가중치 항(weighted term)을 포함하는 선형 조합을 포함하고, 각각의 가중치 항이 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들) 중 단 하나의 발현 수준에 기초하는 방법이 또한 바람직하다.
하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 하나 이상의 타깃 유전자(들)의 각각에 대해 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들)의 모든 발현 수준들의 제1 선형 조합을 포함하고, 상기 모델이 추가로 하나 이상의 타깃 유전자(들)의 각각에 대하여 가중치 항을 포함하는 추가의 선형 조합에 적어도 부분적으로 기초하고, 각각의 가중치 항이 각각의 타깃 유전자에 대한 제1 선형 조합에 기초하는 방법이 또한 바람직하다.
세포 시그널링 경로는 Wnt 경로, ER(에스트로겐 수용체) 경로, AR(안드로겐 수용체) 경로 또는 HH(헤지호그) 경로일 수 있다.
따라서, 바람직한 양태에 따르면, 세포 시그널링 경로는 Wnt 경로, ER 경로, AR 경로 또는 HH 경로를 포함한다.
특히 적합한 타깃 유전자는 아래의 예들 뿐만 아니라 다음의 텍스트 구절에 기술된다(표 1 내지 표 9 참조).
따라서, 바람직한 양태에 따르면, 타깃 유전자(들)는 표 1 또는 표 6에 나열된 타깃 유전자(Wnt 경로의 경우), 표 2, 표 5 또는 표 7에 나열된 타깃 유전자(ER 경로의 경우), 표 3 또는 표 8에 나열된 타깃 유전자(HH 경로의 경우) 및 표 4 또는 표 9에 나열된 타깃 유전자(AR 경로의 경우)를 포함하거나 또는 이로 구성된 그룹으로부터 선택된다.
추론 단계가:
KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 및 FZD7을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 Wnt 경로의 활성을 추론함을 포함하는 방법이 특히 바람직하다.
추론 단계가 NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A 및 LECT2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 적어도 하나의 타깃 유전자의 발현 수준에 추가로 기초하는 방법이 추가로 바람직하다.
추론 단계가:
CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 및 NRIP1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 ER 경로의 활성을 추론함을 포함하는 방법이 특히 바람직하다.
추론 단계가 AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 및 TRIM25를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 적어도 하나의 타깃 유전자의 발현 수준에 추가로 기초하는 방법이 추가로 바람직하다.
추론 단계가,
GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN 및 CTSL1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 HH 경로의 활성을 추론함을 포함하는 방법이 또한 바람직하다.
추론 단계가 BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 및 TOM1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 적어도 하나의 타깃 유전자의 발현 수준에 추가로 기초하는 방법이 추가로 바람직하다.
추론 단계가,
KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR 및 EAF2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 AR 경로의 활성을 추론함을 포함하는 방법이 또한 바람직하다.
추론 단계가 APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 및 TACC2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 적어도 하나의 타깃 유전자의 발현 수준에 추가로 기초하는 방법이 추가로 바람직하다.
본 발명의 또 다른 국면은 (본원에 기술된 바와 같은) 방법에 관한 것이고, 상기 방법은:
세포 시그널링 경로의 비정상적인 작동을 치료하는 약물 처방을 의료 피험자에게 권고하는 단계를 추가로 포함하고,
상기 권고 단계는, 세포 시그널링 경로가 세포 시그널링 경로의 추론된 활성에 기초하여 의료 피험자의 조직 및/또는 세포에서 비정상적으로 작동하고 있다고 결정되는 경우에만 수행된다.
본 발명은 또한 (본원에 기술된 바와 같은) 방법에 관한 것이고, 상기 방법은:
의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 Wnt 경로의 활성을 추론하는 단계; 및/또는
의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 ER 경로의 활성을 추론하는 단계; 및/또는
의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 HH 경로의 활성을 추론하는 단계; 및/또는
의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 AR 경로의 활성을 추론하는 단계를 포함한다.
바람직하게는, Wnt 경로의 타깃 유전자의 세트는 KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 및 FZD7을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
ER 경로의 타깃 유전자의 세트는 CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 및 NRIP1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
HH 경로의 타깃 유전자의 세트는 GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN 및 CTSL1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
AR 경로의 타깃 유전자의 세트는 KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR 및 EAF2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함한다.
Wnt 경로의 타깃 유전자의 세트가 NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A, 및 LECT2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
ER 경로의 타깃 유전자의 세트가 AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 및 TRIM25를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
HH 경로의 타깃 유전자의 세트가 BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 및 TOM1을 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
AR 경로의 타깃 유전자의 세트가 APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 및 TACC2를 포함하거나 또는 이로 구성된 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하는 방법이 특히 바람직하다.
본 발명에 따라 사용될 샘플(들)은, 예를 들면, 바람직하게는 생검 절차 또는 기타의 샘플 추출 절차를 통해, 유방 병변으로부터, 또는 결장암을 갖고 있는 것을 알고 있거나 결장암을 갖는 것으로 의심되는 의료 피험자의 결장으로부터, 또는 간암을 갖고 있는 것을 알고 있거나 간암을 갖는 것으로 의심되는 의료 피험자의 간 등으로부터 입수된 샘플일 수 있다. 샘플이 추출되는 조직은 또한 전이 조직, 예를 들면, 결장, 유방, 간, 또는 결장, 유방, 간 또는 다른 장기 외부로 연장된 기타의 장기로부터 기원하는 (의심되는) 악성 조직 일 수 있다. 샘플이 추출되는 세포는 또한 혈액 악성 종양(예를 들면, 백혈병)으로부터의 종양 세포일 수 있다. 몇몇 경우에서, 세포 샘플은 또한 순환 종양 세포, 즉, 혈류로 들어간 종양 세포일 수 있고, 적절한 분리 기술을 사용하여 추출된 조직 샘플로서 추출될 수 있다. 본원에서 사용된 용어 "추출된 샘플"은 또한 의료 피험자의 조직 및/또는 세포가 의료 피험자로부터 채취되고, 예를 들면, 현미경 슬라이드 위에 두는 경우 및 청구된 방법을 수행하기 위해 본 샘플의 일부가, 예를 들면, 레이저 캡처 현미 해부(LCM)에 의해 또는 슬라이드로부터 관심 세포들을 스크랩함으로써 추출되는 경우를 포함한다.
어구 "세포 시그널링 경로가 비정상적으로 작동되고 있다"는 경로의 "활성"이 예상되는 바가 아닌 경우를 말하며, 여기서, 용어 "활성"은 타깃 유전자가 발현되도록 구동하는데 있어서의 전사 인자 복합체의 활성, 즉, 타깃 유전자가 전사되는 속도를 말할 수 있다. 정상은 비활성으로 예상되는 조직에서는 비활성이고 활성으로 예상되는 조직에서는 활성일 때일 수 있다. 또한, 정상으로 간주되는 활성의 특정 수준이 있을 수 있으며, 더 크거나 더 낮은 수준은 비정상으로 간주될 존재할 수 있다.
또 다른 개시된 국면에 따르면, 장치는 본원에 기술된 바와 같은 본 발명에 따르는 방법을 수행하도록 구성된 디지털 프로세서를 포함한다.
또 다른 개시된 국면에 따르면, 비일시적 저장 매체는 본원에 기술된 바와 같은 본 발명에 따르는 방법을 수행하기 위해 디지털 처리 디바이스에 의해 실행 가능한 명령들을 저장한다. 비일시적 저장 매체는 하드 드라이브 또는 기타의 자기 저장 매체, 광학 디스크 또는 기타의 광학 저장 매체, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 플래시 메모리, 또는 다른 전자 저장 매체와 같은 컴퓨터 판독가능 저장 매체, 네트워크 서버 등일 수 있다. 디지털 처리 디바이스는 휴대용 디바이스(예를 들면, 개인 휴대용 정보 단말기 또는 스마트폰), 노트북 컴퓨터, 데스크톱 컴퓨터, 태블릿 컴퓨터 또는 디바이스, 원격 네트워크 서버 등일 수 있다.
또 다른 개시된 국면에 따르면, 컴퓨터 프로그램은 디지털 처리 디바이스가 본원에 기술된 바와 같은 본 발명에 따르는 방법을 수행하도록 하기 위한 프로그램 코드 수단을 포함한다. 디지털 처리 디바이스는 휴대용 디바이스(예를 들면, 개인 휴대용 정보 단말기 또는 스마트폰), 노트북 컴퓨터, 데스크톱 컴퓨터, 태블릿 컴퓨터 또는 디바이스, 원격 네트워크 서버 등일 수 있다.
하나의 이점은, 예를 들면, Wnt 경로, ER 경로, AR 경로 및/또는 HH 경로의 수학적 모델을 사용하여, 하나 이상의 세포 시그널링 경로(들)의 수학적 분석에 기초한 임상 권고들을 제공하는 임상 의사결정 지원(CDS) 시스템에 있다.
또 다른 이점은 하나 이상의 선형 조합(들)에 적어도 부분적으로 기초하는 수학적 모델의 개선된 명료성에 있다.
또 다른 이점은 세포 시그널링 경로의 조절 실패를 위한 타깃 치료를 권고하는 CDS 시스템을 제공하는 것에 있다.
또 다른 이점은 Wnt 경로, ER 경로, AR 경로 또는 HH 경로와 같은 특정 세포 시그널링 경로에 대한 조절 실패를 검출하도록 설계되고, 이러한 특정 세포 시그널링 경로에 의해 소싱된 상이한 유형의 암에 대한 권고를 제공하도록 쉽게 적응되는 CDS 시스템을 제공하는데 있다.
본원에 기술된 바와 같은 본 발명은, 예를 들면, 다음과 관련하여 유리하게 사용될 수 있다:
- 예측된 (추론된) 활성에 기초한 진단;
- 예측된 (추론된) 활성에 기초한 예후;
- 예측된 (추론된) 활성에 기초한 약물 처방;
- 예측된 (추론된) 활성에 기초한 약효의 예측;
- 예측된 (추론된) 활성에 기초한 부작용의 예측;
- 약효의 모니터링;
- 약물 개발;
- 검정법 개발;
- 경로 연구;
- 암 병기결정(cancer staging);
- 예측된 (추론된) 활성에 기초한 임상 실험에서의 환자의 등록;
- 수행될 후속 검사의 선택; 및/또는
- 동반 진단 검사의 선택.
추가의 이점들은 첨부된 도면들, 다음의 상세한 설명을 판독하고 이해할 때, 및 특히 이하에 본원에 제공된 상세한 예들을 판독할 때, 당업계의 통상의 숙련가들에게 자명할 것이다.
도 1은 세포 시그널링 경로의 일부를 나타내는 예시적인 모델을 보여준다. 세포 시그널링 경로는 전사 인자(TF) 복합체 및 전사 복합체가 세포 핵에 존재하는 결과로서 생기는 타깃 유전자에 의해 기호화된다. w1, w2, 및 w3으로 여기에 도시된, 타깃 유전자의 발현의 노드와 TF 노드를 연결하는 가중치는 존재하는 전사 인자와 예를 들면, 트레이닝 데이터 또는 전문 지식에 기초한 타깃 유전자의 발현 사이의 상관의 강도를 나타낸다.
도 2는 도 1에서와 같은 세포 시그널링 경로의 일부를 나타내는 간단한 모델을 보여준다. 여기서 전사 인자 복합체의 타깃 유전자 발현 노드(node)는 타깃 유전자의 발현 강도 수준의 직접 측정치로, 이 경우, 예를 들면, 마이크로어레이 또는 (q)PCR 실험에서, 특정 타깃 유전자와 특히 매우 상관성이 있는 하나의 프로브셋으로 대체된다. 가중치는 트레이닝 데이터 세트로부터의 계산에 기초하거나 또는 전문 지식에 기초한다.
도 3은 경로의 활성 시그널링의 실험적 결정을 보다 상세히 나타내는 예시적인 2층 모델을 보여준다. 모든 타깃 유전자에 대하여, 요약 수준(summary level)은 이의 연관된 프로브셋의 측정 강도에 기초하여 선형 조합을 사용하여 계산된다. 계산된 요약 값은 이후 선형 조합을 사용하여 경로의 다른 타깃 유전자의 요약 값과 조합된다. 가중치는 트레이닝 데이터 세트로부터 학습되거나 또는 전문 지식에 기초하거나 또는 이의 조합일 수 있다.
도 4는 본원에 개시된 바와 같은 하나 이상의 세포 시그널링 경로(들)을 평가하도록 구성된 임상 의사결정 지원(CDS) 시스템을 다이어그램으로 보여준다(Wnt 경로에 대해 예시적으로 도시됨).
도 5는 GSE8671의 연속 발현 데이터, 표 1에 언급된 "모든 프로브셋" 및 "블랙 앤 화이트(black and white)" 가중치를 사용한 Wnt 트레이닝 결과를 도시한다. 좌측 그룹은 Wnt가 수동형인(passive) 정상 샘플의 계산된 선형 조합을 나타내고, 우측 그룹은 능동형 Wnt 경로를 갖는 것으로 알려진 선종 샘플의 계산된 활성 스코어를 보여준다.
도 6은 GSE20916(연속 데이터)의 결장암 샘플의 Wnt 검증 결과를 도시한다. 모델은 GSE8671의 연속 발현 데이터, 표 1에 언급된 "모든 프로브셋" 및 "블랙 앤 화이트" 가중치를 사용하여 트레이닝하였다(도 5에서의 트레이닝 결과 참조). 모델은 약간 수동형인 Wnt 경로를 갖는 것으로 예측된 하나의 암종 샘플을 제외하고는 모든 샘플들이 활성 또는 비활성 Wnt 경로를 갖는 것으로 정확히 예측한다.
도 7은 수모세포종 샘플(GSE10327, 연속 데이터)에서의 Wnt 검사 결과를 도시한다. 모델은 GSE8671의 연속 발현 데이터, 표 1에 언급된 "모든 프로브셋" 및 "블랙 앤 화이트" 가중치를 사용하여 트레이닝하였다(도 5에서의 트레이닝 결과 참조). 모델은 모든 Wnt 양성 수모세포종 샘플(마지막 그룹)이 약간 능동형인 Wnt 경로를 갖는 것을 예측할 수 있다. 모든 Wnt 양성 샘플들은 모든 Wnt 음성 샘플들과 비교하여 비교적 낮은 양성 Wnt 활성 스코어를 갖는다. 이것은 수모세포종 샘플에서 역치는 가능하게는 유전자 발현에서의 조직-특이적 차이로 인해 결장 샘플에서보다 낮아야 한다는 표시일 수 있다.
도 8은 GSE7553의 연속 발현 데이터, 표 3에서 언급된 모든 프로브셋을 사용한 유전자 요약을 갖는 "2층" 모델 및 "대수 승산(log odd)" 가중치를 사용하는 HH 트레이닝 결과를 도시한다. (왼쪽으로부터) 1번째 및 5번째 그룹의 샘플을 각각 양성 및 음성 트레이닝 샘플로서 사용하였다.
도 9는 수모세포종 샘플(GSE10327)의 연속 발현 데이터를 사용하는 HH 검사 결과를 도시한다. 모델은 GSE7553의 연속 발현 데이터, "2층" 모델, 표 3에 언급된 모든 프로브셋, 및 "대수 승산" 가중치를 사용하여 트레이닝하였다(도 8의 트레이닝 결과 참조). (shh로 나타낸) HH 양성 그룹의 샘플들의 대략 절반은 능동형 경로를 갖는 것으로 모델에 의해 예측된다.
도 10은 GSE8597의 연속 발현 데이터, "최대 판별 프로브셋(most discriminant probeset)"(표 2의 밑줄 친 프로브셋) 및 "대수 승산" 가중치를 사용하는 ER 트레이닝 결과를 도시한다. (왼쪽으로부터) 3번째 및 4번째 샘플을 각각 양성 및 음성 트레이닝 샘플로서 사용하였다.
도 11은 유방암 샘플(GSE12276)의 연속 데이터를 사용하는 ER 검사 결과를 도시한다. 모델은 GSE8597의 연속 발현 데이터, "최대 판별 프로브셋"(표 2의 밑줄친 프로브셋) 및 "대수 승산" 가중치를 사용하여 트레이닝하였다(도 10의 트레이닝 결과 참조). ER+ 샘플의 대략 25%는 이러한 유형의 유방암의 50% 내지 60%에서 비교적 높은 비효과적인 호르몬 치료에 의해 부분적으로 설명될 수 있는 능동형 ER 경로를 갖는 것으로 예측된다. ER 경로는 ER- 샘플에서 수동형 ER 경로를 갖는 것으로 정확하게 예측된다.
도 12는 몇가지 치료 간격(GSE11352, 연속 데이터)에 대한 ER 자극제(E2)로 처리된 MCF7 세포 또는 대조군의 자극 응답 데이터에서의 ER 경로 예측을 도시한다. 모델은 GSE8597의 연속 발현 데이터, "최대 판별 프로브셋"(도 2의 밑줄친 프로브셋) 및 "대수 승산" 가중치를 사용하여 트레이닝한다(도 10에서의 트레이닝 결과 참조). ER 경로 활성은 ER 자극제에 대한 더 긴 노출 시간의 경우 증가하고 대조군에서 연장된 결핍의 경우에 감소되는 것으로 제대로 예측된다.
도 13은 GSE7868의 퍼지 변환된 발현 데이터, 표 4에서 언급된 "모든 프로브셋" 및 "블랙 앤 화이트" 가중치를 사용하는 AR 트레이닝 결과를 도시한다. (왼쪽으로부터) 1번째 및 2번째 샘플을 각각 음성 및 양성 트레이닝 샘플로서 사용하였다.
도 14는 AR 자극이 있거나 없는 상이한 방법으로 처리된 세포주의 AT 검사 결과를 도시한다(GSE7708, 퍼지 변환됨). 모델은 GSE7869의 퍼지 변환된 발현 데이터, 표 4에 언급된 "모든 프로브셋" 및 "블랙 앤 화이트" 가중치를 사용하여 트레이닝하였다(도 13에 보여진 트레이닝 결과 참조). 모델은, AR 자극제로 처리된 세포주는 능동형 AR 경로를 갖고, AR 자극제로 처리되지 않거나(4번째 그룹의 샘플) 자극제와 항안드로겐 약으로 처리된(1번째 그룹의 샘플) 기타의 세포주는 수동형 AR 경로를 갖는 것을 정확하게 예측한다.
도 15는 전립선 샘플(GSE17951, 퍼지 변환됨)의 AR 검사 결과를 도시한다. 모델은 GSE7868의 퍼지 변환된 발현 데이터, 표 4에 언급되는 "모든 프로브셋" 및 "블랙 앤 화이트" 가중치를 사용하여 트레이닝하였다(도 13에 보여진 트레이닝 결과 참조). 모델은 외과적으로 제거된 종양 뿐만 아니라 생검 둘 다에서의 능동형 AR 경로의 비교적 높은 빈도 및 대조군 샘플에서의 비교적 적은 수의 AR 활성을 예측한다.
도 16은 경로 활성에 따라 그룹화된 GSE12276 데이터 세트로부터의 환자들의 카플란-마이어 생존율 곡선을 도시한다. 생존율 곡선은 능동형 ER 경로를 갖는 환자들은 수동형 ER 경로를 갖는 환자들과 비교하여 더 양호한 예후를 가짐을 나타내며, 이는 임상 시험과 일치한다. 또한, 능동형 HH 또는 Wnt 경로를 갖는 것으로 예측된 환자들은 더 악화된 예후를 갖는 것으로 보여지며, 이것 또한 과학 논문에 의해 뒷받침된다.
도 17은 MCF7 세포(GSE9253, 연속 데이터)에 의한 자극 실험의 ER 검증 결과를 도시한다. (슈도-)선형 모델은 GSE8597의 연속 발현 데이터, "최대 판별 프로브셋"(표 2에서 밑줄친 프로브셋) 및 "대수 승산" 가중치를 사용하여 트레이닝하였다(도 10에서의 트레이닝 결과 참조). E2, ER 자극제로 자극된 MCF7 세포들로부터, 규정된 역치가 너무 높게 설정된 것이 명백하다. 이러한 불일치에 대한 이유는 상이한 자극 처리(즉, 높은 E2 농도, 짧은 자극 시간 등)일 수 있다. 그럼에도 불구하고, 자극된 및 자극되지 않은 세포의 계산된 ER 활성 스코어의 차이가 분명하다. 음성 대조군은 ER 경로가 비활성인 것을 정확하게 예측한다.
도 18은 GSE12276의 관강내(luminal) A 샘플에서의 Wnt, ER, AR 및 HH 경로 활성을 보여준다.
도 19는 GSE12276의 기저 샘플에서의 Wnt, ER, AR 및 HH 경로 활성을 보여준다.
도 20은 GSE21618로부터의 MCF7 및 타목시펜 내성 MCF7 세포주에서의 예측된 ER 경로 활성을 보여준다. ER (슈도-)선형 모델은 GSE8597의 연속 발현 데이터, "최대 판별 프로브셋"(표 2에서 밑줄친 프로브셋) 및 "대수 승산" 가중치를 사용하여 트레이닝하였다(도 10에서의 트레이닝 결과 참조). 상이한 자극 처리가 적용되었고, 샘플의 상이한 그룹으로 표시되었으며, mRNA의 발현은 그룹에서 연속 샘플로 나타내어진, 0, 1, 2, 3, 6, 12, 24, 48시간째에 마이크로어레이에 의해 측정되었다.
도 21은 결장 샘플(GSE20916)의 데이터 세트에서 본원에 기술된 바와 같은 "블랙 앤 웨이트(black and weight)"-방법을 사용하여 계산된 가중치 및 광범위한 문헌 목록의 표적 유전자(표 11)와 비교된 증거 엄선된 목록의 타깃 유전자(표 1)를 사용하는 (슈도-)선형 모델을 사용하여 계산된 예측된 Wnt 경로 활성 스코어를 보여준다.
도 22는 결장 샘플(GSE4183)의 데이터 세트에서 본원에 기술된 바와 같은 "블랙 앤 웨이트"-방법을 사용하여 계산된 가중치 및 광범위한 문헌 목록의 표적 유전자(표 11)와 비교된 증거 엄선된 목록의 타깃 유전자(표 1)를 사용하는 (슈도-)선형 모델을 사용하여 계산된 예측된 Wnt 경로 활성 스코어를 보여준다.
도 23은 결장 샘플(GSE15960)의 데이터 세트에서 본원에 기술된 바와 같은 "블랙 앤 웨이트"-방법을 사용하여 계산된 가중치 및 광범위한 문헌 목록의 표적 유전자(표 11)와 비교된 증거 엄선된 목록의 타깃 유전자(표 1)를 사용하는 (슈도-)선형 모델을 사용하여 계산된 예측된 Wnt 경로 활성 스코어를 보여준다.
도 24는 유방암 샘플(GSE12777)의 데이터 세트에서 본원에 기술된 바와 같은 "블랙 앤 웨이트"-방법을 사용하여 계산된 가중치 및 광범위한 문헌 목록의 표적 유전자(표 11)와 비교된 증거 엄선된 목록의 타깃 유전자(표 1)를 사용하는 (슈도-)선형 모델을 사용하여 계산된 예측된 Wnt 경로 활성 스코어를 보여준다.
도 25는 수모세포종 샘플(GSE10327)의 데이터 세트에서 본원에 기술된 바와 같은 "블랙 앤 웨이트"-방법을 사용하여 계산된 가중치 및 광범위한 문헌 목록의 표적 유전자(표 11)와 비교된 증거 엄선된 목록의 타깃 유전자(표 1)를 사용하는 (슈도-)선형 모델을 사용하여 계산된 예측된 Wnt 경로 활성 스코어를 보여준다.
다음의 실시예들은 단지 특히 바람직한 방법들 및 이와 관련된 선택된 국면들을 예시한다. 본원에 제공되는 교시는, 예를 들면, 하나 이상의 세포 시그널링 경로의 비정상적인 활성을 검출, 예측 및/또는 진단하기 위해 몇몇 검사 및/또는 키트를 구성하는데 사용될 수 있다. 또한, 본원에 기술된 바와 같은 방법 사용시, 약물 처방이 유리하게 안내될 수 있고, 약물 예측 및 약효(및/또는 부작용)의 모니터링이 이루어질 수 있고, 예를 들면, (동반 진단 검사와 같이) 수행될 후속 검사(들)를(을) 선택하기 위해 약물 내성이 예측되고 모니터링될 수 있다. 다음의 실시예들은 본 발명의 범위를 제한하는 것으로서 해석되어서는 안된다.
실시예 1: 수학적 모델 구성
본원에 기술된 바와 같이, 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준과 전사 인자(TF) 요소의 수준 간의 관계를 도입하여 수학적 모델(예를 들면, 도 3에 도시된 예시적인 "2층" 모델)을 구성함으로써(상기 TF 요소는 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 전사를 제어하고, 상기 모델은 하나 이상의 타깃 유전자(들)의 발현 수준의 하나 이상의 선형 조합(들)에 적어도 부분적으로 기초한다), 이러한 모델이 이해 및 해석을 용이하게 하는 방식으로 세포 시그널링 경로의 활성을 결정하는데 사용될 수 있다.
타깃 유전자의 발현 수준은 바람직하게는 mRNA의 수준의 측정치이며, 이것은, 예를 들면, 타깃 유전자의 mRNA 서열과 관련된 프로브를 사용하는 (RT)-PCR 및 마이크로어레이 기술들 및 RNA-서열화의 결과일 수 있다. 또 다른 양태에서, 타깃 유전자의 발현 수준은 단백질 수준, 예를 들면, 타깃 유전자에 의해 암호화된 단백질의 농도에 의해 측정될 수 있다.
상기한 발현 수준은 적용을 보다 양호하게 할 수 있거나 그렇지 않을 수 있는 다수의 방식으로 임의로 변환될 수 있다. 여기서, 본 출원인은 발현 수준, 이 경우에는 마이크로어레이-기반 mRNA 수준의 4가지 상이한 변환을 사용하였다:
- "연속 데이터", 즉, MAS5.0 및 fRMA와 같은 널리 공지된 알고리즘을 사용한 마이크로어레이의 전처리(preprocessing) 후 수득된 바와 같은 발현 수준,
- "z-스코어", 즉, 모든 샘플에 걸친 평균이 0이고 표준 편차가 1로 되도록 환산된 연속 발현 수준,
- "이산(discrete)", 즉, 특정 역치보다 높은 모든 발현은 1로 설정하고 그 아래는 0으로 설정한다(예를 들면, 프로브셋에 대한 역치는 다수의 양성 및 동일한 수의 음성 임상 샘플의 세트에서의 이의 값의 중간값으로서 선택될 수 있다),
- "퍼지(fuzzy)", 즉, 연속 발현 수준은 다음의 포맷의 시그모이드 함수를 사용하여 0과 1 사이의 값으로 변환된다: 1 / (1 + exp((thr - expr)/se)), 여기서, expr은 연속 발현 수준이고, thr은 이전에 언급된 바와 같은 역치이고, se는 0과 1 사이의 차이에 영향을 미치는 연화 파라미터(softening parameter)이다.
도 1은 세포 시그널링 경로(의 일부)를 나타내는 예시적인 수학적 모델을 보여준다. 세포 시그널링 경로는 전사 인자(TF) 요소 및 전사 요소가 세포 핵에 존재하는 결과로서 생기는 타깃 유전자에 의해 기호화된다. w1, w2, 및 w3으로 여기에 나타낸, 타깃 유전자의 발현의 노드와 TF 노드를 연결하는 가중치는 존재하는 전사 인자와 예를 들면, 트레이닝 데이터 또는 전문 지식에 기초한 타깃 유전자의 발현 사이의 상관의 강도를 나타낸다.
구성될 수 있는 가장 간단한 모델 중의 하나가 도 2에 나타내어져 있다. 여기서 전사 인자 요소의 타깃 유전자 발현 노드는 타깃 유전자의 발현 강도 수준의 직접 측정치로, 이 경우, 예를 들면, 마이크로어레이 또는 (q)PCR 실험에서, 특정 타깃 유전자와 특히 매우 상관성이 있는 하나의 프로브셋으로 대체된다. 가중치는 트레이닝 데이터 세트로부터의 계산에 기초하거나 또는 전문 지식에 기초한다. 타깃 유전자 당 가능한 다수의 발현 수준이 측정되는 경우에(예를 들면, 하나의 타깃 유전자가 다수의 프로브셋으로 측정될 수 있는 마이크로어레이 실험의 경우에) 사용하는 이러한 방식에서는, 타깃 유전자 당 단지 하나의 발현 수준이 바람직한데, 그 이유는 이것이 특히 간단하기 때문이다. 특정 타깃 유전자에 사용되는 하나의 발현 수준을 선택하는 하나의 바람직한 방법은 트레이닝 데이터 세트의 능동형 및 수동형 샘플을 최선으로 분리할 수 있는 프로브셋으로부터의 발현 수준을 사용하는 것이다. 이러한 프로브셋을 결정하는 하나의 방법은 통계 검정, 예를 들면, t-검정을 수행하고, 최저 p-값을 갖는 프로브셋을 선택하는 것이다. 최저 p-값을 갖는 프로브의 트레이닝 데이터 세트의 발현 수준은 정의상 (알려진) 능동형 및 수동형 샘플의 발현 수준이 겹칠 확률이 가장 낮은 프로브이다. 또 다른 선택 방법은 승산-비(odds-ratio)에 기초한다(또한 아래 섹션 4 참조). 이러한 모델에서, 하나 이상의 발현 수준(들)이 하나 이상의 타깃 유전자(들)의 각각에 대해 제공되고, 하나 이상의 선형 조합(들)은 하나 이상의 타깃 유전자(들)의 각각에 대해 가중치 항을 포함하는 선형 조합을 포함하며, 각각의 가중치 항은 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들) 중 단지 하나의 발현 수준에 기초한다. 상기한 바와 같이 타깃 유전자 당 단지 하나의 발현 수준이 선택되는 경우, 모델을 하기에서 "최대 판별 프로브셋" 모델이라고 부른다.
"최대 판별 프로브셋" 모델의 대안으로서, 타깃 유전자 당 가능한 다수의 발현 수준이 측정되는 경우에, 타깃 유전자 당 제공되는 모든 발현 수준을 사용하는 것이 가능하다. 이러한 모델에서, 하나 이상의 발현 수준(들)이 하나 이상의 타깃 유전자(들)의 각각에 대해 제공되고, 하나 이상의 선형 조합(들)은 하나 이상의 타깃 유전자(들)에 대해 제공된 하나 이상의 발현 수준(들)의 모든 발현 수준의 선형 조합을 포함한다. 즉, 하나 이상의 타깃 유전자(들)의 각각에 대해, 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들)의 각각은 이들 자체(개별) 가중치 만큼 선형 조합에서 가중될 수 있다. 이러한 변이(variant)를 하기에서는 "모든 프로브셋" 모델이라고 부른다. 이것은 제공된 모든 발현 수준을 사용하면서도 비교적 간단하다는 이점을 갖는다.
상기한 바와 같은 두 가지 모델 모두, 이들은 TF 요소의 수준이 발현 수준의 선형 조합에 기초하여 계산되는 "단층" 모델로서 간주될 수 있다는 공통점을 갖는다.
각각의 모델을 평가함으로써 TF 요소의 수준을 결정한 후, 결정된 TF 요소 수준을 세포 시그널링 경로의 활성을 추론하기 위해 역치로 되도록 할 수 있다. 이러한 적절한 역치를 계산하는 방법은 수동 경로를 갖는 것으로 알려진 트레이닝 샘플과 능동 경로를 갖는 트레이닝 샘플의 결정된 TF 요소 수준 wlc를 비교하는 것이다. 이렇게 하고 또한 이들 그룹에서의 분산을 고려하는 방법은 역치를 사용함으로써 제공된다.
Figure pct00001
여기서, σ 및 μ는 트레이닝 샘플의 표준 편차 및 평균이다. 단지 소수의 샘플이 능동 및/또는 수동 트레이닝 샘플로 이용 가능한 경우, 슈도카운트(pseudocount)를 두 개의 그룹의 분산의 평균에 기초하여 계산된 분산에 더할 수 있다:
Figure pct00002
여기서, v는 그룹의 분산이고, x는 양의 슈도카운트이다. 표준 편차 σ는 다음에 분산 v의 제곱근을 취함으로써 수득될 수 있다.
음의 값은 수동 경로에 상응하고 양의 값은 능동 경로에 상응하도록, 해석을 용이하게 하기 위해 TF 요소의 결정된 수준 wlc로부터 역치를 공제하여, 경로의 활성 스코어를 야기할 수 있다.
도 3은, 기술된 "단층" 모델에 대한 대안으로서, 경로의 활성 시그널링의 실험적 결정을 보다 상세히 나타내는 예시적인 "2층" 모델을 보여준다. 모든 타깃 유전자에 대하여, 요약 수준은 이의 연관된 프로브셋의 측정 강도에 기초하여 선형 조합을 사용하여 계산된다("제1 (아래) 층"). 계산된 요약 값은 이후 추가의 선형 조합을 사용하여 경로의 다른 타깃 유전자의 요약 값들과 조합된다("제2 (위) 층"). 가중치는 트레이닝 데이터 세트로부터 학습되거나 또는 전문 지식에 기초하거나 또는 이의 조합일 수 있다. 달리 표현하여, "2층" 모델에서는, 하나 이상의 발현 수준(들)이 하나 이상의 타깃 유전자(들)의 각각에 대해 제공되고, 하나 이상의 선형 조합(들)은, 하나 이상의 타깃 유전자(들)의 각각에 대해, 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들)의 모든 발현 수준의 제1 선형 조합을 포함한다("제1 (아래) 층"). 상기 모델은 추가로, 하나 이상의 타깃 유전자(들)의 각각에 대해 가중치 항을 포함하는 추가의 선형 조합에 적어도 부분적으로 기초하며, 각각의 가중치 항은 각각의 타깃 유전자의 제1 선형 조합에 기초한다("제2 (위) 층").
요약 값의 계산은, "2층" 모델의 바람직한 버전에서, 트레이닝 데이터를 사용하여 각각의 타깃 유전자에 대한 역치를 정의하고, 계산된 선형 조합으로부터 역치를 공제하여 유전자 요약을 산출함을 포함한다. 여기서, 음의 유전자 요약 수준이 하향조절된 타깃 유전자와 부합하고, 양의 유전자 요약 수준이 상향조절된 타깃 유전자와 부합하도록 역치가 선택될 수 있다. 또한, 유전자 요약 값을 "제2 (위) 층"에서 조합하기 전에, 예를 들면, 상기한 변환(퍼지, 이산 등) 중의 하나를 사용하여 변환시키는 것이 가능하다.
"2층" 모델을 평가함으로써 TF 요소의 수준을 결정한 후, 결정된 TF 요소 수준을 상기한 바와 같이 세포 시그널링 경로의 활성을 추론하기 위해 역치로 되도록 할 수 있다.
하기에서는, 상기한 모델들을 총괄하여 "(슈도-)선형 모델"로 표시한다.
실시예 2: 타깃 유전자의 선택
전사 인자(TF)는, 특정 DNA 서열에 결합하여 DNA에서 mRNA로의 유전체 정보의 전사를 제어함으로써 타깃 유전자로부터의 전사를 제어할 수 있는 단백질 복합체(즉, 특정 구조로 함께 결합된 단백질들의 조합) 또는 단백질이다. 전사 복합체의 이러한 작용으로 인해 직접 생성되는 mRNA를 본원에서는 "직접 타깃 유전자"라고 한다. 경로 활성화는 또한 "간접 타깃 유전자"라고 하는 더욱 부차적인 유전자 전사를 야기할 수 있다. 하기에서는, 경로 활성과 mRNA 수준 간의 직접적인 링크로서, 직접 타깃 유전자를 포함하거나 이들로 이루어진 (슈도-)선형 모델이 바람직하지만, 직접 및 간접 타깃 유전자의 구별이 항상 분명한 것은 아니다. 여기서는 이용가능한 문헌 데이터에 기초한 스코어링 함수(scoring function)를 사용하여 직접 타깃 유전자를 선택하는 방법이 제시된다. 그렇기는 하지만, 제한된 정보 및 생물학적 변이 및 불확실성으로 인해 간접 타깃 유전자의 우연한 선택이 배제될 수는 없다.
증거가 축적된 과학 실험들의 유형에 따라, 특정 타깃 유전자에 대한 과학적 증거에 순위를 매기는 랭킹 시스템을 사용함으로써, 특정 경로 mRNA 타깃 유전자를 과학 문헌으로부터 선택하였다. 예를 들면, HH 경로가 능동형인 것으로 공지되어 있는 배아의 마이크로어레이에서의 mRNA 증가와 같이, 일부 실험적 증거는 단지 유전자가 타깃 유전자인 것을 시사하지만, 식별된 경로 전사 인자 결합 부위 및 세포에서의 특정 경로의 자극 이후의 염색질 면역침강(ChIP, chromatin immunoprecipitation) 분석에서의 이 부위의 복원 및 세포주에서의 경로의 특정 자극 이후의 mRNA의 증가의 조합과 같이, 다른 증거가 매우 강할 수 있다.
다음과 같은(그러나 이에 제한되지 않는) 특정 경로 타깃 유전자를 찾아내기 위한 몇가지 유형의 실험들이 과학 문헌에서 확인될 수 있다:
1. 유전체에 대한 결합 부위에의 경로-전사 인자의 직접 결합이 보여지는 ChIP 실험. 예: 염색질 면역침강(ChIP) 기술을 사용함으로써, 후속적으로 오직 뉴클레오티드 서열에 기초하여 인식되는 결합 부위의 서브세트로서, 능동형 Wnt 경로를 갖는 및 갖지 않는 결장 세포주의 DNA에서의 추정상의 기능적 TCF4 전사 인자 결합 부위를 식별하였다. 추정상의 기능은 전사 인자가 DNA 결합 부위에 결합함을 밝히는 ChIP-유도된 증거로서 식별되었다.
2. 결합 서열을 함유하는 DNA의 단편에 대한 전사 인자의 시험관내 결합(in vitro binding)을 나타나는 전기영동 이동성 변화(Electrophoretic Mobility Shift; EMSA) 검정. ChIP-기반 증거와 비교하여, EMSA-기반 증거는 이것이 생체내 상황(in vivo situation)으로 해독될 수 없기 때문에 덜 강하다.
3. 경로의 자극 및 마이크로어레이에서의 mRNA 프로파일들의 측정 또는 RNA 서열화의 사용, 경로-유도 가능 세포주의 사용 및 - 단백질로의 해독을 억제하는 사이클로헥시미드의 존재하에서- 유도 후의 몇몇 시점에서 측정된 mRNA 프로파일의 측정(따라서 유도된 mRNA들이 직접 타깃 유전자인 것으로 가정된다).
4. 3과 유사하지만, mRNA의 양을 측정하기 위해 정량적 PCR 사용.
5. 생물 정보학 방식을 사용한 유전체에서의 전사 인자 결합 부위의 식별. Wnt 경로에 대한 예: 공지되어 있는 TCF4-베타 카테닌 전사 인자 DNA 결합 서열을 사용하고, 소프트웨어 프로그램은 인간 게놈 서열에 대해 구동되며, 유전자 프로모터(gene promoter) 영역 및 다른 유전체 영역 모두에서 잠재적 결합 부위가 식별되었다.
6. 사이클로헥시미드의 부재시에만 3과 유사하다.
7. 사이클로헥시미드의 부재시에만 4와 유사하다.
8. 적절한 음성 대조군 조건의 부재하에서는 경로가 능동형인 것으로 공지되어 있는 특정 조직 또는 세포 샘플의 mRNA 발현 프로파일링.
가장 간단한 형태에서, 타깃 mRNA가 확인된 이들 실험적 방식들 각각에 대해 모든 잠재적 타깃 mRNA에 1 포인트를 제공할 수 있다.
대안적으로, 포인트들은 증분으로 제공될 수 있으며, 이것은 하나의 기술은 1 포인트, 두 번째 기술은 제2 포인트를 더하는 식으로 계속된다는 것을 의미한다. 이러한 상대 랭킹 방법을 사용함으로써, 가장 신뢰할 수 있는 타깃 유전자의 목록을 만들 수 있다.
대안적으로, 생체내 직접 타깃 유전자에 대한 대부분의 증거를 제공하는 기술에 더 높은 숫자의 포인트들을 제공함으로써, 가장 직접 타깃 유전자일 것 같은 타깃 유전자를 식별하기 위해 또 다른 방식의 랭킹이 사용될 수 있으며, 상기 목록에서 이것은 실험적 방식 1)에 대해 8 포인트를, 실험적 방식 2)에 대해 7 포인트를 의미하고, 실험적 방식 8에 대해 하나의 포인트로 내려감을 의미한다. 이러한 목록을 "일반적 타깃 유전자 목록"이라고 할 수 있다.
생물학적 변화 및 불확실성에도 불구하고, 본 발명자들은 직접 타깃 유전자가 조직-독립적 방식으로 가장 잘 유도될 것이라고 가정하였다. 이들 타깃 유전자의 목록을 "증거 엄선된 타깃 유전자 목록(evidence curated target gene list)"이라고 할 수 있다. 이들 엄선된 타깃 목록은 상이한 조직 및/또는 세포 공급원으로부터의 샘플에 적용될 수 있는 계산 모델을 구성하는데 사용된다.
"일반적 타깃 유전자 목록"은 아마도 보다 조직 특이적인 유전자를 함유하며, 잠재적으로는 유방암 샘플처럼 특정 조직으로부터의 샘플에 적용하기 위한 모델의 민감도 및 특이성을 최적화하고 증가시키기 위해 사용될 수 있다.
다음은 증거 엄선된 타깃 유전자 목록의 선택이 ER 경로에 대해 구체적으로 어떻게 구성되었는지를 예시적으로 설명할 것이다.
본원에 기술된 (슈도-)선형 모델에 대한 입력(input)으로서 사용되는 ER 타깃 유전자를 선택하기 위한 목적으로, 다음의 세 가지 기준들이 사용되었다:
1. 유전자 프로모터/인핸서(enhancer) 영역은 에스트로겐 반응 요소(estrogen response element; ERE) 모티프를 함유한다:
a. ERE 모티프는, 예를 들면, 특정 ERE 모티프가 리포터 유전자(reporter gene)에 연결되는 일시적 형질감염(transient transfection) 검정에 의해 에스트로겐에 응답하는 것으로 증명되고,
b. ERE 모티프의 존재는, 예를 들면, 유전자 프로모터/인핸서 영역의 강화된 모티프 분석에 의해 확인된다.
2. ER은 (달리) 해당 유전자의 프로모터/인핸서 영역에 생체내 결합하며, 이것은, 예를 들면, ChIP/CHIP 실험 또는 염색질 면역침강 분석에 의해 입증된다:
a. ER은 ER 경로가 능동형일 때 유전자의 프로모터/인핸서 영역에 결합하는 것으로 증명되고,
b. (바람직하게는) ER 경로가 능동형이 아니면 유전자의 유전자 프로모터/인핸서 영역에 결합하지 않는다(또는 약하게 결합한다).
3. 유전자는 ER 경로가 능동형일 때 달리 전사되고, 이것은, 예를 들면, 다음에 의해 입증된다:
a. 실시간 PCR 또는 마이크로어레이 실험을 통한 해당 유전자의 mRNA의 폴드 풍부(fold enrichment), 또는
b. RNA Pol II가 면역침강 검정을 통해 유전자의 프로모터 영역에 결합한다는 입증.
상기 언급된 모든 세 가지 기준들이 만족되었다는 것을 입증하는 충분하고 잘 문서화된 실험적 증거가 수집된 유전자를 ER 타깃 유전자로서 정의함으로써 선택이 이루어졌다. ER 차등 결합의 증거를 수집하는데 적합한 실험은, 예를 들면, 에스트로겐에 노출되거나 노출되지 않을 때, 에스트로겐에 응답하는 암 세포주(예를 들면, MCF-7 세포주)에서의 ChIP/CHIP 실험의 결과들을 비교하는 것이다. 이것은 mRNA 전사의 증거를 수집하는 경우에도 마찬가지이다.
상기에는 위에 언급된 방식을 사용하여 발견된 증거에 기초하여 다수의 타깃 유전자를 선택하는데 사용된 타깃 유전자 선택 절차의 포괄적인 방식 및 보다 구체적인 예를 논의하고 있다. 예시적인 경로, 즉, Wnt, ER, HH 및 AR 경로에 대한 (슈도-)선형 모델에서 사용되는 타깃 유전자의 목록이 각각 표 1, 표 2, 표 3 및 표 4에 나타내어져 있다.
(표 2에 나타낸) 본원에 기술된 ER 경로의 (슈도-)선형 모델에 사용되는 ER 경로의 타깃 유전자는 이들의 문헌 증거 스코어에 기초한 타깃 유전자의 선택을 포함하고; 가장 높은 증거 스코어를 갖는 타깃 유전자(본 발명에 따르는 바람직한 타깃 유전자)만이 이러한 최종 목록에 추가되었다. 낮은 증거 스코어를 갖는 유전자를 또한 포함하는 ER 타깃 유전자의 전체 목록은 표 5에 나타내어져 있다.
표 1, 표 2, 표 3 및 표 4에 나타낸 Wnt, ER, HH 및 AR 경로의 타깃 유전자의 추가적인 세부선택 또는 랭킹은 문헌 증거 스코어 및 프로브셋 노드를 상응하는 타깃 유전자 노드에 연결하는 트레이닝 데이터 세트를 사용하여 계산된 승산 비의 조합에 기초하여 수행하였다. 승산 비는 컷오프 값(cutoff value), 예를 들면, 동일한 수의 능동 및 수동 트레이닝 샘플이 사용되는 경우 모든 트레이닝 샘플의 중간값을 사용하여 계산된다; 컷오프보다 높은 모든 값은 높음을 표명하고, 컷오프보다 낮은 값은 낮음을 표명한다. 이것은 경로가 능동인지 수동인지 공지되어 있는 트레이닝 샘플에 대해 수행된다. 후속적으로, 특정 타깃 유전자 또는 프로브셋에 대한 승산 비는 다음과 같이 계산할 수 있다:
Figure pct00003
여기서, n(능동(active), 낮음(low))은 컷오프보다 낮은 발현 수준을 갖는 것으로 밝혀진 능동형 경로를 갖는 것으로 공지된 트레이닝 샘플의 수이고, n(수동(passive), 낮음)은 컷오프보다 낮은 발현 수준을 갖는 것으로 밝혀진 수동형 경로를 갖는 것으로 공지된 트레이닝 샘플의 수 등이다. f(능동, 낮음) 및 f(수동, 낮음)는 각각 능동형(active) 또는 수동형(passive) 경로를 갖는 것으로 공지되고 컷오프보다 낮은 발현 수준을 갖는 것으로 밝혀진 샘플의 분율(fraction)이다.
대안적으로, 확실하지 않은 승산 비(0으로 나눔)를 피하기 위해, 예를 들면, 다음과 같이 슈도카운트를 분율 계산에 더할 수 있다:
Figure pct00004
대안적으로, 측정 세팅에서 몇몇 불확실성(노이즈)을 가정함으로써 증명력이 있는 활성을 나타내는 샘플의 절대 수를 또한 대체하고, 각각의 트레이닝 샘플에 대해, 예를 들면, 정상 분포("부드러운 증거"라고 함)를 가정하여 "낮을" 또는 "높을" 확률을 계산할 수 있다. 후속적으로, 분율 계산은 상기한 계산법에 따라 계산할 수 있다.
Figure pct00005
여기서, p(능동, 낮음) 및 p(수동, 낮음)는, 각각의 트레이닝 샘플의 측정된 발현 수준과 동일한 평균을 갖는 표준 분포 및 발현 수준 측정과 관련된 불확실성의 추정치와 동일한 표준 편차를 가정하여, 관찰치가 컷오프보다 낮을 각각의 샘플에 대한 확률이며, 예를 들면, log2 스케일에 대해 0.25이다. 이러한 확률을 모든 트레이닝 샘플들에 걸쳐 누적하고, 그후 슈도카운트(pseudocount)를 더한다.
승산 비는 경로의 활성을 추론하는데 있어서의 타깃 유전자의 중요도의 평가이다. 일반적으로, 더 높은 승산 비를 갖는 타깃 유전자의 발현 수준은 더 낮은 승산 비를 갖는 타깃 유전자와 비교하여 경로의 전체 활성에 관해 더 유용한 정보를 줄 것으로 예상된다. 그러나, 세포 시그널링 경로의 복잡성으로 인해 더욱 복잡한 연관성들이 타깃 유전자와 경로 활성 간에 존재할 수 있는 것으로 이해되어야 한다 - 예를 들면, 낮은 승산 비를 갖는 타깃 유전자의 다양한 조합들의 발현 수준을 고려하는 것이 더 높은 승산 비를 갖는 타깃 유전자를 별개로 고려하는 것보다 더 증명력이 있을 수 있다. 본원에 보고된 Wnt, ER, HH 및 AR 모델링에서, 표 6, 표 7, 표 8 및 표 9에 나타낸 타깃 유전자는 더 낮게-랭크된 타깃 유전자와 비교하여 Wnt, ER, HH 및 AR 경로 활성을 예측하기 위한 더 높은 증거적 특성을 갖는 것으로 밝혀졌다(따라서, 표 6 내지 표 9에 나타낸 타깃 유전자는 본 발명에 따라 특히 바람직하다). 그렇기는 하지만, 마이크로어레이와 같은 획득 기술이 유전자의 큰 세트에 대한 발현 수준을 획득할 수 있는 상대적 용이성을 고려한다면, 도 1 내지 3에 도시된 바와 같은 (슈도-)선형 모델에서 표 6, 표 7, 표 8 및 표 9의 타깃 유전자 중 일부 또는 모두를 사용하고, 표 1, 표 2, 표 3 및 표 4에서 나타낸 랭크의 추가의 타깃 유전자 중 하나, 둘, 일부 또는 모두를 임의로 추가로 사용하는 것이 고려된다.
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
실시예 3: 증거 엄선된 목록 및 광범위한 문헌 목록의 비교
본원에 기술된 절차에 따라 문헌 증거에 기초하여 구성된 Wnt 타깃 유전자의 목록(표 1)을 상술된 절차에 따르지 않는 타깃 유전자의 또 다른 목록과 비교한다. 대체 목록(alternative list)은 분자 생물학 및 Wnt 경로의 분야에서의 전문 지식에 대해 공지되어 있는, 유명 연구소들에 의한 세 가지 공개 소스(public source)에 공개된 Wnt 타깃 유전자인 것으로 다양한 실험 방식들로부터의 다양한 데이터에 의해 표시된 유전자들의 모음이다. 대체 목록은 하치스 등(Hatzis et al.)으로부터의 표 S3(Hatzis P, 2008년), 드 소사 이 멜로(de Sousa e Melo)로부터의 텍스트 및 표 S1A(de Sousa E Melo F, 2011년) 및 Wnt 시그널링 분야의 선구자인 로엘 누세(Roel Nusse)에 의해 수집되고 보존된 타깃 유전자의 목록(Nusse, 2012년)에 언급된 유전자들의 조합이다. 이들 세 가지 소스의 조합은 124개의 유전자의 목록(=광범위한 문헌 목록, 표 10 참조)을 생성하였다. 여기서는, 이러한 대체 목록으로부터 유도된 알고리즘에 의해 임상 샘플들에서 Wnt 활성을 예측하는데 있어서의 성능이 기존의 유전자의 목록(=증거 엄선된 목록, 표 1)에 기초하여 구성된 모델과 비교하여 유사하거나 더 양호하게 수행되는지에 관한 문제가 논의된다.
Figure pct00018
Figure pct00019
Figure pct00020
다음 단계는 유전자들과 부합하는 Affymetrix® GeneChip 인간 게놈 U133 플러스 2.0 어레이의 프로브셋을 찾아내는 것으로 구성되었다. 이 공정을 본원에 기술된 (슈도-)선형 모델과 유사한, UCSC 게놈 브라우저에 기초한 프로브셋 관련성에 대한 매뉴얼 선정(manual curation) 및 R에서의 바이오컨덕터(Bioconductor) 플러그인을 이용하여 수행하여, 예를 들면, 대향 스트랜드들(opposite strands) 또는 외부 유전자 엑손 영역에서의 프로브셋을 제거하였다. 124개의 유전자들 중 2개의 유전자에 대해서, 이러한 마이크로어레이-칩에서 이용 가능한 프로브셋이 없고, 따라서 (슈도-)선형 모델에 삽입될 수 없으며, 이들은 LOC283859 및 WNT3A이다. 총 287개의 프로브셋이 나머지 122개의 유전자에 상응하는 것으로 밝혀졌다(표 11).
Figure pct00021
Figure pct00022
Figure pct00023
이어서, (슈도-)선형 모델을 본원에 설명된 바와 같이 가중치 파라미터를 계산하기 위해 "블랙 앤 화이트" 방법을 사용하여 도 2와 유사하게 구성하였다. 증거 엄선된 목록에 기초한 Wnt (슈도-)선형 모델의 설명과 유사하게, 프로브셋과 이들 각각의 유전자들 간의 에지와 연관된 가중치, 증거 엄선된 목록과 광범위한 문헌 목록 둘 다는 (2011년 7월 13일자로 마지막으로 액세스된 http://www.ncbi.nlm.nih.gov/geo/에서 액세스 가능한) 유전자 발현 옴니버스(Gene Expression Omnibus)로부터의 데이터 세트 GSE8671로부터의 32개의 정상 결장 샘플 및 32개의 선종 샘플의 fRMA 처리된 연속 데이터를 사용하여 트레이닝하였다.
그후, 트레이닝된 (슈도-)선형 모델을 Wnt 경로의 활성 스코어를 추론하기 위해 각종 데이터 세트에 대해 검사하였다. 활성 수준이 양성인 경우, Wnt 경로를 "on(온)", 즉, 능동형인 것으로 한다. 트레이닝된 광범위한 문헌 모델 및 증거 엄선된 모델의 요약된 결과들이 도 21 내지 도 25에 나타내어져 있다.
분명히, 광범위한 문헌 모델은 일반적으로 Wnt 시그널링이 "on"인지 또는 "off(오프)"인지에 대해 더욱 극단적인 활성 스코어를 예측하는 것으로 추정될 수 있다. 또한, 대체 모델은 유방암(GSE12777) 및 수모세포종 샘플(GSE10327) 데이터 세트에서의 예측된 활성 Wnt 시그널링을 갖는 예상 샘플보다 결장암 데이터 세트(GSE20916, GSE4183, GSE15960)에 대해 유사한 결과들을 예측한다.
마지막으로, 광범위한 문헌 타깃 유전자 목록은 한편으로 결장암에서는 Wnt 활성의 거의 동등하게 양호한 예측을 초래하지만, 다른 한편으로 기타의 암 유형들에서는 불량한 예측(보다 많은 허위 양성(false positive))을 초래한다. 이것은 타깃 유전자의 대체 목록이 특히 결장 세포 쪽으로 과도하게 편향되어 지나치게 조직 특이적인 결과일 수 있다; 드 소사 이 멜로 등과 하치스 등의 주요 관심사는 결장직장암이었지만, 비-결장-특이적 Wnt 타깃 유전자가 포함될 수 있다. 또한, 이들 목록에 가능하게 포함된 비-Wnt-특이적 타깃 유전자는 다른 암 유형들에서 Wnt 활성의 악화된 예측들의 근원일 수 있다. 대체 목록은 보다 간접적으로 조절된 타깃 유전자를 함유하는 것 같으며, 이것이 아마도 이를 더욱 조직 특이적이 되도록 한다. 원래의 목록은, 모든 조직에서 Wnt 민감한 유전자를 가장 잘 나타낼 것 같은 직접 타깃 유전자를 함유하는 쪽으로 맞추어짐으로써, 조직 특이성이 감소된다.
실시예 4: 수학적 모델의 트레이닝 및 사용
본원에 예시적으로 기술된 바와 같은 (슈도-)선형 모델을 사용하여 시험 샘플에서 경로 활성을 추론하기 전에, 노드가 "부재"인지 "존재"인지를 나타낼 수 있는 역치와 노드들 간의 상관성의 부호 및 크기를 나타내는 가중치를 결정할 필요가 있다. 전문 지식을 사용하여 가중치와 역치를 선험적으로 채울 수 있지만, 전형적으로는 모델을 바람직하게는 지상 검증자료(ground truth), 예를 들면, 공지된 존재 전사 인사 복합체(=능동형 경로) 또는 부재 전사 인사 복합체(=수동형 경로)를 갖는 샘플에서의 프로브셋의 발현 데이터가 공지되어 있는 트레이닝 샘플의 대표적인 세트를 사용하여 트레이닝한다. 그러나, 활성화 상태가 경로를 어떻게 모델링시킬지가 공지되어 있는 많은 상이한 종류의 암들로부터 트레이닝 샘플을 수득하는 것은 비현실적이다. 결과적으로, 이용 가능한 트레이닝 세트는 전형적으로 단 한 가지 유형의 암으로부터의 제한된 수의 샘플로 이루어진다. 본원에는 능동 또는 수동 경로를 갖는 것으로서 검사 샘플을 분류하는데 필요한 파라미터들을 결정하는 방법이 기술되어 있다.
모델 토폴로지(topology)를 고려하고, 모델 출력, 여기서는 가중치 선형 스코어가 최적화되도록 모델 파라미터, 여기서는 가중치 및 역치를 변화시키는 다수의 트레이닝 알고리즘(예를 들면, 회귀법)이 당해 분야에 공지되어 있다. 본원에서 본 출원인은 최적화 알고리즘을 필요로 하지 않으면서 발현 수준으로부터 직접적으로 가중치를 계산하는데 사용될 수 있는 두 가지 예시적인 방법을 입증한다.
바람직하게는, Wnt, ER, HH 및 AR 경로의 (슈도-)선형 모델의 트레이닝은 (상기 http://www.ncbi.nlm.nih.gov/geo/에서 액세스 가능한) 유존자 발현 옴니버스에서 이용 가능한 공개 데이터를 사용하여 수행한다.
"블랙 앤 화이트" 방법으로 본원에 정의된 첫번째 방법은 {-1, 0, 1}의 요소인 가중 인자를 갖는 삼진 시스템으로 요약된다. 이것을 생물학적 상황에 집어넣는 경우, -1 및 1은 각각 경로 활성의 경우에 하향- 및 상향조절되는 유전자 또는 프로브에 상응한다. 프로브 또는 유전자가 상향- 또는 하향조절된 것으로 통계적으로 증명될 수 없는 경우에, 이것은 0의 가중치를 받는다. 여기서 프로브 또는 유전자가 사용된 트레이닝 데이터를 고려하여 상향조절되는지 또는 하향조절되는지를 결정하기 위해 능동형 경로 샘플의 발현 수준 대 수동형 경로를 갖는 샘플의 발현 수준의 좌측 및 우측의, 두 개의 샘플 t-검정을 사용하였다. 능동형 샘플의 평균이 수동형 샘플보다 통계적으로 큰 경우, 즉, p-값이 특정 역치, 예를 들면, 0.3 미만인 경우, 프로브셋 또는 타깃 유전자는 상향조절되는 것으로 결정된다. 반대로, 능동형 샘플의 평균이 수동형 샘플보다 통계적으로 낮은 경우, 이러한 프로브셋 또는 타깃 유전자는 경로의 활성화시 하향조절되는 것으로 결정된다. 최저 p-값(좌측 또는 우측)이 상기한 역치를 초과할 경우, 이러한 프로브 또는 유전자의 가중치를 0으로 정의한다.
또 다른 바람직한 양태에서, 가중치 및 역치(들)에 도달하기 위한 대안적인 방법이 사용된다. 이러한 대안적인 방법은 승산비의 대수법(예를 들면, 베이스 e)에 기초하며, 따라서, "대수 승산"-가중치라고 불린다. 각각의 프로브 또는 유전자에 대한 승산비는 프로브/유전자 수준이 상응하는 역치, 예를 들면, 모든 트레이닝 샘플의 중간값 위 및 아래인 양성 및 음성 트레이닝 샘플의 수에 기초하여 계산된다(식 3). 0으로 나눠지는 것을 피하기 위해 슈도-카운트를 더할 수 있다(식 4). 추가의 개량은 프로브/유전자 수준이, 예를 들면, 명시된 특정 표준 편차(예를 들면, 2-로그 스케일에 대해 0.25)로 이의 관측치 주변에 정규 분포된다고 가정하고 역치 위 및 아래의 확률 질량을 계수함으로써, 다소 더 개연성있는 방식으로 역치 위/아래의 샘플들을 계수하는 것이다(식 5).
대안적으로, 본원에 기술된 (슈도-)선형 모델의 가중치 및 역치(들)를 결정하기 위해 회귀법과 같이 당해 분야에 공지된 최적화 알고리즘을 사용할 수 있다.
파라미터들이 (슈도-)선형 모델이 잘 일반화되었는지를 결정하는 방식에 대해 특별히 주목해야 한다. 대안적으로, 트레이닝 절차 동안 특별한 조치를 취함으로써 매우 잘 일반화할 수 있는 것으로 당해 분야에 공지되어 있는 베이지언 네트워크(Bayesian network)와 같은 또 다른 기계 학습 방법들을 사용할 수 있다.
바람직하게는, Wnt, ER, HH 및 AR 경로의 (슈도-)선형 모델의 트레이닝은 (http://www.ncbi.nlm.nih.gov/geo/에 액세스 가능한) 유전자 발현 옴니버스에서 이용 가능한 공개 데이터를 사용하여 수행된다. 모델은 이러한 공개 데이터를 사용하여 예시적으로 트레이닝되었다.
도 5는 Wnt 경로에 대한 도 2에 나타낸 바와 같은 (슈도-)선형 모델을 사용하고 표 1에 언급된 바와 같은 "모든 프로브셋"을 포함하는 트레이닝 데이터 세트 GSE8671에 대한 계산된 (슈도-)선형 조합을 보여준다. (슈도-)선형 모델에 적용된 가중치는 본원에 기술된 바와 같은 "블랙 앤 화이트" 방법을 사용하여 계산되었다. 좌측 그룹은 Wnt가 수동형인 것으로 공지된 샘플을 나타내는 반면, 우측 그룹은 능동형 Wnt 경로를 갖는 것으로 공지된 선종 샘플의 계산된 활성 스코어를 나타낸다.
도 8을 참조하면, 각각 제1 및 제2 층에 표 3에 언급된 모든 프로브셋 및 타깃 유전자를 사용하는 HH 경로의 "2층" 모델을 HH 활성을 발현하는 것으로 공지된 기저 세포 암종 샘플(제1 그룹) 및 수동형 HH 경로를 갖는 것으로 공지된 정상 피부 세포의 연속 발현 수준 데이터를 사용하여 트레이닝하였다. 트레이닝은 본원에 기술된 바와 같은 "대수-승산"법을 사용하여 여기서는 프로브셋 강도로 나타내어진 타깃 유전자 발현 수준과 타깃 유전자 노드 간의 연관성의 가중치를 계산함을 포함하며, 그후, 전사 인자 복합체의 활성 스코어는 계산된 타깃 유전자 발현 스코어를 상향조절된 또는 하향조절된 타깃 유전자에 대해 각각 1 또는 -1과 곱한 값을 합계함으로써 계산하였다.
도 10은 MCF7 세포주에서의 자극 실험으로 측정된 연속 발현 수준을 사용하는 ER 경로의 간단한 (슈도-)선형 모델의 트레이닝 결과를 보여준다. 모델은 단지 표 2에 나타낸 바와 같이 타깃 유전자 당 "최대 식별 프로브셋"을 포함하였다. "대수 승산"법을 능동형 ER 경로 샘플(좌측으로부터 3번째 그룹, 강력한 ER 활성제인 E2로 자극된 MCF7 세포) 및 수동형 ER 경로 샘플(4번째 그룹, 대조군으로 처리된 MCF7 세포)과 함께 사용하여, 수직 축에 플롯팅된 ER 활성 스코어를 계산하는데 필요한 가중치가 되도록 하였다.
도 13을 참조하면, AR 경로의 도 2에 도시된 바와 같은 (슈도-)선형 모델은 양성 AR 활성을 갖는 3개의 샘플, 강력한 AR 경로 활성제인 디하이드로테스토스테론(DHT)으로 자극된 LNCaP 세포주 및 불활성형 AR 경로의 경우를 나타내는 3개의 비-자극된 LNCaP 세포주를 사용하여 상기한 "블랙 앤 화이트" 방법으로 예시적으로 트레이닝하였다. 이러한 자극 실험의 발현 데이터는 본원에 기술된 바와 같이 퍼지 변환된 GSE7868 데이터세트에서 공개적으로 이용 가능하다. 표 4에 언급된 선택된 AR 타깃 유전자의 "모든 프로브셋"이 당해 특정 예로 사용되었다. 트레이닝의 결과가 도 13에 도시되어 있다. 좌측으로부터 1번째 및 2번째 그룹의 샘플이 각각 음성 및 양성 트레이닝 샘플로서 사용되었다. 예상대로, 실험 내의 제어, 4시간 동안 DHT로의 LNCaP의 자극은 16시간 동안 자극된 세포보다 낮은 활성 수준이지만 AR 활성을 입증한다.
도 6 및 도 17을 참조하면, Wnt 및 ER 경로의 트레이닝된 (슈도-)선형 모델을 사용하여, 본원에 기술된 바와 같은 트레이닝 절차에 사용되지 않은 유사한 샘플(각각 Wnt 및 ER 베이지안 네트워크를 위한 결장 샘플 및 MCF7 유방암 세포주)에서 경로 활성을 예측하였다(HH 및 AR (슈도-)선형 모델에 적합한 데이터 세트는 이용 가능하지 않았다). 압도적으로 대부분의 샘플의 예측된 경로 활성은 검증하고자 하는 모델에 대한 임상적으로 예상되는 경로 활성과 일치할 것이다.
도 6은 GSE20916 데이터 세트에서의, 막대의 색상으로 표시된, 분류에 의해 그룹화된 결장 샘플의, 수평 축의 막대로 표시된, 샘플에 대한, 수직 축에 계산된 활성 스코어로서 도시된, 계산된 Wnt 활성을 보여준다. 모든 정상 결장 샘플은, 이것이 건강한 조직의 샘플인 것에 기초하여, 불활성형 경로(스코어 < 0)를 갖는 것으로 정당하게 예측된다. 모두는 아니지만 하나의 샘플, 즉 능동형 경로를 갖는 것으로 주장된 마지막 그룹의 암종 샘플은 능동형 Wnt 경로를 갖는 것으로 예측된다.
도 17에서, 트레이닝된 ER (슈도-)선형 모델의 검증 결과가 GSE9253 데이터 세트로부터 기원하는 MCF7 유방암 세포주 샘플을 사용하여 측정된 두 개의 마이크로어레이(하나는 에스트라디올(E2)로 자극되고, 다른 하나는 음성 대조군(EtOH)으로 자극됨)에 대해 나타내어져 있다. ER 활성 스코어의 차이가 도 17로부터 분명하다. 그러나, E2-자극된 샘플은 약간 음의 ER 활성 스코어를 갖는 것으로 예측되었다. 이것은 능동 또는 수동 상태가 이러한 특정 실험에 대해 지나치게 높게 설정되었음을 정의하는 역치의 결과이다. 이러한 불일치의 이유는, 이 실험에서 상이한 자극 처리들이 적용되었던 것일 수 있다; 트레이닝 데이터 세트(GSE8597)에서는 샘플을 E2의 농도보다 4배 낮은 농도(100nM vs 25nM)로 8배 긴 시간(3시간 대신에 24시간) 동안 처리하였다. 일반적으로 타깃 유전자의 발현은 단지 3시간 후 보다 자극제로 처리한지 24시간 후에 더 최적인 것은 당업게로부터 공지되어 있으며, 이것이 이러한 데이터 세트에서의 자극된 MCF7 샘플의 보다 낮은 ER 활성 스코어를 설명할 수 있다. 음성 대조군은 ER 경로가 불활성형임을 제대로 예측한다.
(예를 들면, Wnt, ER, AR 및 HH 경로의) 트레이닝된 (슈도-)선형 모델을 사용하여 각각의 경로 활성을 예측하는데 대한 추가의 상세한 설명 및 예가 아래 실시예 6에서 설명된다.
상기 언급된 트레이닝 공정은 임상 용도의 기타의 (슈도-)선형 모델에 사용될 수 있다. 여기서는 이것은 세포 시그널링 경로, 보다 구체적으로 Wnt, ER, AR 및 HH 경로를 나타내는 본원에 개시된 방법을 사용하여 구성된 예시적인 (슈도-)선형 모델을 위해 작용하는 것으로 나타나고 판명된다.
실시예 5: (비정상) 경로 활성의 진단
다음에서는 세포 시그널링 경로의 활성을 진단하기 위해, 예를 들면, (슈도-)선형 모델을 어떻게 사용하는지를 본보기로 예시할 것이다.
전사 인자 복합체를 나타내는 노드, 경로 활성에 대한 예시적으로 선택된 판독치, 및 전사 인자 복합체 노드에 공급된 표 1에 언급된 "모든 프로브셋"으로 이루어지고 본원에 기술된 바와 같이 트레이닝된 Wnt의 예시적인 (슈도-)선형 모델을, 트레이닝된 (슈도-)선형 모델이 얼마나 잘 작동하는지를 추론하기 위해 이전에는 트레이닝에 사용되지 않았던 다양한 데이터 세트에서 Wnt 경로 활성 스코어 및 이의 상태(능동 또는 수동)을 예측하는데 사용하였다. 수모세포종 암 샘플(GSE10327, 도 7 참조)의 세트에 대해 계산된 예측된 경로 활성 스코어 및 관련 활성은 임상 샘플에 대해 공지된 임상 지식과 상관성이 있다. 예시적인 트레이닝된 (슈도-)선형 모델은 모든 Wnt 양성 수모세포종 샘플이 약간 능동형인 Wnt 경로를 가짐을 예측할 수 있다. 모든 Wnt 양성 샘플은 기타의 모든 Wnt 음성 샘플에 비해 상대적으로 낮은 Wnt 스코어를 가지며, 이것은 수모세포종 샘플에서는 결장 조직 샘플에서 정의된 역치가, 가능하게는 유전자 발현에 있어서의 조직-특이적 차이로 인해, 결장 샘플에서보다 더 낮을 것이라는 표시일 수 있다.
각각 1번째 층과 2번째 층에 표 3에 언급된 모든 프로브셋과 타깃 유전자를 갖는, 2층으로 이루어진 HH 경로의 예시적인 트레이닝된 (슈도-)선형 모델을, 수모세포종 암 샘플(GSE10327, 도 9 참조)의 세트에서 HH 활성을 예측하는데 사용하였다. HH 활성 스코어는 본원에 기술된 방법에 기초하는 타깃 유전자 발현 스코어에 기초하여 계산한다. 도 9에서 shh로 표시된 바와 같은 HH 양성 그룹의 샘플의 절반은 모델에 의해 능동형 HH 경로를 갖는 것으로 정확하게 예측된다. 기타의 모든 샘플은 불활성형 HH 경로를 갖는 것으로 정확하게 예측되었다.
본원에 기술된 바와 같이 표 2에 나타낸 바와 같은 "최대 식별 프로브셋" 및 "대수 승산"에 기초한 ER 경로의 예시적인 트레이닝된 (슈도-)선형 모델을, GSE12276 데이터 세트의 유방암 샘플의 세트에서 ER 경로 활성 스코어를 예측하는데 사용하였다. 이에 따른 ER 경로 활성 스코어가 도 11에 나타내어져 있다. 유방암 샘플을 발현 ER(ER+) 또는 비발현 ER(ER-)로 함께 그룹화한다. ER 상태는 마이크로어레이 실험에 의해 측정된 ER의 발현 수준에 기초하여 결정된다. 임상 샘플이 높은 수준의 ER을 발현하더라도, 이것은 반드시 ER 경로가 능동형임을 의미하는 것은 아니다. 이것은 ER+ 유방암의 50-60%에서의 비교적 높은 비효과적인 호르몬 치료에 의해 또한 뒷받침된다. 다른 한편으로, 임상 샘플이 ER을 발현하지 않는 경우 ER 경로는 능동형일리가 없음은 당업계로부터 공지되어 있다. 대략 25%의 ER+ 샘플은 (슈도-)선형 모델에 의해 능동형 ER 경로를 갖는 것으로 예측되며, 이것은 이러한 유방암 유형의 50-60%에서의 비교적 높은 비효과적인 호르몬 치료에 의해 부분적으로 설명될 수 있다. ER 경로는 ER- 샘플에서 수동형 ER 경로를 갖는 것으로 정확하게 예측된다.
표 4에 언급된 "모든 프로브셋" 및 "블랙 앤 화이트"법을 사용하여 계산된 가중치 및 본원에 기술된 바와 같은 LNCaP 세포(GSE7868)의 퍼지 변환된 발현 데이터에 기초한 예시적인 트레이닝된 AR (슈도-)선형 모델을, 전립선 샘플(GSE17951, 퍼지 변환됨)에서 AR 경로의 활성을 예측하는데 사용하였다. 세 가지 그룹의 샘플(좌측에서 우측으로: 생검, 대조군 및 종양)에 대한 계산된 AR 활성 스코어가 도 15에 도시되어 있다. 생검 및 종양 샘플의 압도적인 대부분은 높은 AR 활성을 갖는 것으로 밝혀졌으며, 이것은 알려진 임상 상태와 상관성이 있는 것으로 보인다. 다른 한편으로, 대조군 중의 비교적 낮은 갯수의 샘플은 예상대로 모델 예측에 따르는 AR 활성을 발현한다.
실시예 6: 경로 활성에 기초한 예후
Wnt 및 HH와 같은 조기 개발 경로들이, 암 줄기 세포라고 불리는, 더욱 줄기 세포 유사 표현형으로 복귀된(reverted) 암 세포에 의해 유발되는 전이에서 역할을 하는 것으로 생각된다. 실제로, Wnt 경로와 같은 조기 개발 경로가 암 전이에서 역할을 하여, 전이성 암 세포가 또 다른 장기 또는 조직에서의 시딩 위치(seeding location)에서 분할을 시작하도록 할 수 있다는 충분한 증거가 조기 개발 경로들에 대해 이용 가능하다. 전이는 나쁜 예후와 연관되며, 따라서, 암 세포에서 Wnt 및 HH 경로와 같은 조기 개발 경로의 활성은 나쁜 예후를 예측할 것으로 예상된다. 이것은 본원에 기술된 (슈도-)선형 모델을 이용하여 능동형 ER 경로는 갖지만 능동형 Wnt 또는 HH 경로는 갖지 않는 것으로 식별된, GSE12276 데이터 세트로부터의, 유방암 환자는 도 16에서 카플란-마이어 플롯(Kaplan-Meier plot)으로 예시된 바와 같이 능동형 HH 또는 Wnt 경로 중 어느 하나 또는 둘 다를 갖는 것으로 식별된 환자보다 더 양호한 예후를 갖는다는 사실에 의해 뒷받침된다.
실시예 7: 치료 계획, 약효의 예측, 부작용의 예측 및 약효의 모니터링
다음은 치료 계획, 약효의 예측, 약효의 모니터링 및 관련 활동들을 위해 세포 시그널링 경로의 (슈도-)선형 모델을 어떻게 사용하는지를 본보기로 예시한다.
전사 인자 존재에 대한 노드, 본원에 기술된 도 2와 유사한 ER 경로의 타깃 유전자와 관련된 프로브셋의 층(표 2)을 사용하여 구성되고, 본원에 기술된 바와 같이 트레이닝되는 ER 경로의 (슈도-)선형 모델을, ER 경로 활성 스코어를 계산하는데 사용하였다. 그후, 경로 활성 스코어는 약효 또는 약효 모니터링과 상관성이 있는 것으로 입증되었다. 결과 요약들이 도 20 및 도 12에 나타내어져 있다.
도 20과 관련하여, 타목시펜은 ER+(에스트로겐 수용체 양성) 유방암의 치료를 위해 현재 사용되고 있는 약물이다. 이것은 ER 시그널링에 의해 유도되는 것으로 생각되는 조절되지 않은 세포 증식을 억제하는 에스트로겐 수용체의 부분 길항제로서 작용한다. 불행하게도, 암 조직의 통상적인 조직병리학 분석에 의해 암 세포에 ER 단백질이 존재한다고 하는 입증이 이루어지더라도, 모든 유방암이 타목시펜으로의 치료에 반응하는 것은 아니다. 이러한 소위 타목시펜 내성을 조사하기 위한 다수의 연구들이 수행되어 왔다. 공개적으로 이용 가능한 GSE21618 데이터 세트가 이러한 연구 중 하나의 결과이고, 상이한 치료 섭생하에서 타목시펜 내성 및 야생형(wildtype) MCF7 세포주의 마이크로어레이 데이터를 함유한다. 본원에 기술된 바와 같이 구성되고 트레이닝된 ER (슈도-)선형 모델이 상이한 치료 섭생하에서 타목시펜 내성 및 야생형 MCF7 세포주를 분석하는데 사용되며, 그 결과가 도 20에 도시되어 있다.
TamR.Ctrl로 표시되는 대조군 타목시펜 내성 세포주는 타목시펜 첨가 이후의 매 시점 동안(1h, 2h, 3h, 6h, 12h, 24h 및 48h) 불활성형 ER 경로를 갖는 것으로 예측된다. TamR.E2_Tam(4번째 그룹)으로 표시되는, E2로 자극되고 타목시펜으로 처리된 타목시펜 내성 세포주의 처리가 효과적이지 못한 것은 놀라운 것이 아니며, 이것은 또한 동일한 시점들에 걸쳐 이 그룹에 대한 ER 경로의 예측된 불활성에 의해 예시된다. 타목시펜 내성 세포주(TamR.Ctrl)의 분석에 따르면, 조절되지 않은 세포 증식의 구동력(driving force)은 활성 ER 시그널링으로 인한 것은 아니며; 따라서, 이것을 ER 길항제로 처리하는 것이 세포 증식을 억제하지 않을 것이다. 이것은 타목시펜으로의 처리가 음성 예측된 ER 경로 활성의 경우에는 권고되지 않는다는 것을 예시한다.
다른 한편으로, 17베타-에스트라디올로 처리된, 타목시펜 민감성인 것으로 공지된 야생형 MCF7 세포주(wt1.E2, 11번째 그룹)는 증가하는 ER 양성 활성 예측에서 가시적인 호르몬 치료에 서서히 반응한다. 이러한 세포주를 타목시펜과 같은 ER 억제제로 처리하는 것은 ER 경로를 억제할 것이며, 이것은 E2로 자극되고 타목시펜으로 처리된 MCF7 샘플(wt2.E2_Tam, 12번째 그룹)의 경우에 감소하는 ER 경로 활성 스코어에 의해 예시된다.
또 다른 예에서, 자극 개시 또는 결핍(GSE11352) 후 12시간, 24시간 및 48시간 째에 측정한 발현 수준을 갖는 ER 자극제(E2)로 자극되거나 이것이 결핍된 MCF7 세포주의 공개적으로 이용 가능한 데이터 세트를, 본원에 기술된 바와 같은 트레이닝된 ER (슈도-)선형 모델을 사용하여 ER 활성 스코어를 계산하는데 사용하였다. ER 경로 활성 스코어는 ER 자극제(처음 3개의 그룹)로의 보다 긴 노출 시간 동안 증가하고 대조군(마지막 3개의 그룹)에서의 장기간 결핍의 경우에 감소하지만, 장기간 결핍은 48시간 후 다시 약간 증가한다. 48시간의 결핍을 제외하고는, 예측된 ER 활성 스코어는, 장기간 자극이 보다 높은 ER 활성을 초래하고 그 역도 가능하다는 지식과 좋은 상관성을 갖는다. 반대로, 당해 실시예는 ER 활성 스코어가 ER 활성 처리의 자극 또는 억제의 효능 또는 무효능을 모니터링하는데 사용될 수 있음을 암시한다.
실시예 8: 약물 개발
치료 반응 모니터링과 유사하게, 경로 모델은 다양한 추정 화합물들의 유효성을 평가하기 위해 약물 개발에 사용될 수 있다. 예를 들면, 암 세포주에서 특정 경로에 대한 가능한 효과를 위해 다수의 화합물들을 스크리닝(screening)하는 경우, 각각의 경로 모델이 경로의 활성이 화합물의 적용 이후에 높아졌는지 낮아졌는지 또는 그렇지 않은지의 여부를 결정하는데 사용될 수 있다. 종종, 이러한 확인은 경로 활성의 단 하나의 또는 몇몇의 추정 마커를 사용하여 수행되며, 이것은 치료 효과의 비효과적인 모니터링의 기회를 증가시킨다. 또한, 동물이나 환자 대상체에 대한 추적 연구에서, 경로 모델은 후보 약물의 유효성을 평가하고 경로 활성에 최대로 영향을 미치는 최적 투여량을 결정하기 위해 유사하게 사용될 수 있다.
신약 화합물의 비효과적인 모니터링의 예가 도 14에 도시된 바와 같은 GSE7708 샘플에서의 예측된 AR 경로 활성에 의해 예시된다. 이 연구에서, 폴리아미드 1 및 폴리아미드 2라고 표기된, AR 경로 활성을 억제하기 위한 2개의 가능한 약물 화합물이 개발되었다. 이들 2개의 폴리아미드가, AR 경로의 널리 공지된 타깃 유전자/마커인 KLK3(=PSA)의 발현 뿐만 아니라 DHT 자극(AR 경로의 공지된 활성인자)시 유도되는 전사체의 ~35%의 발현을 억제할 수 있는 것으로 입증되었다. 이와 달리, AR 경로의 (슈도-)선형 모델은 자극제 DHT로 먼저 처리된 다음 폴리아미드 1(도 14의 2번째 그룹) 및 폴리아미드 2(도 14의 3번째 그룹)로 처리된 샘플은 여전히 능동형 AR 경로를 갖는다고 예측하였다. 타깃 유전자의 추론된 AR 활성 스코어 및 측정된 발현 수준을 조사하는 것은, 다른 타깃 유전자와 달리 KLK3은 조사 결과에 따라 하향조절되는 반면 (폴리아미드 1의 경우에 AR, GUCY1A3 및 TMPRSS2를 제외한) 기타의 모든 타깃 유전자들은 폴리아미드 1 및 폴리아미드 2 처리된 샘플에서 명백히 상이하게 발현됨을 나타내었다. 즉, AR 활성에 대한 단지 제한된 수의 타깃 유전자, 특히 이들의 효능 마커인 KLK3은 하향조절된 반면 대다수의 식별된 타깃 유전자들은 여전히 상향조절되었으며, 이것은 AR 경로가 여전히 대체로 온전하고, 따라서, 능동형임을 나타낸다. 문헌 증거에 기초하여 다수의 타깃 유전자를 고려함으로써, 본 발명자들은 폴리아미드의 AR 활성의 억제가 제한되고 KLK3 발현만이 이들 폴리아미드를 사용하여 명백히 하향조절된다는 것을 보여줄 수 있었다. 또한, 이것은 약물 개발시 축소적 방식(reductionist approach)과 비교하여 다중-타깃 유전자 (슈도-)선형 모델을 사용하는 계통적 방식(systematic approach)의 가치를 예시한다.
실시예 9: 검정법 개발
언급된 (슈도-)선형 모델을 마이크로어레이 또는 RNA 서열화로부터의 mRNA 입력 데이터에 적용하는 대신, 임상 용도에서는, 예를 들면, 타깃 유전자의 mRNA 수준을 결정하기 위해 qPCR을 사용하는 통합 플랫폼에 대해, 샘플 측정을 수행하기 위한 전용 검정법들을 개발하는 것이 유리할 수 있다. 그후, 기술된 타깃 유전자의 RNA/DNA 서열을 사용하여 이러한 플랫폼에 대해 어떤 프라이머 및 프로브를 선택할지의 여부를 결정할 수 있다.
이러한 전용 검정법의 검증은, 기준 모델로서 마이크로어레이-기반 (슈도-)선형 모델을 사용하고, 개발된 검정이 검증 샘플의 세트에 대해 유사한 결과를 제공하는지의 여부를 입증함으로써 수행될 수 있다. 전용 분석 다음에, 이것은 또한 입력 측정치로서 mRNA-서열화 데이터를 사용하여 유사한 (슈도-)선형 모델을 만들고 검량하기 위해 수행될 수 있다.
실시예 10: 경로 조사 및 암 병리생리학 조사
다음은 특정 질병에 어떤 경로가 관련되는지를 찾아내는데 관심이 있는 조사인 (임상) 경로 조사에서 (슈도-)선형 모델이 어떻게 이용될 수 있는지를 예시할 것이며, 이후에는, 예를 들면, 시그널링 단백질의 돌연변이를 (모델에 의해 측정된) 경로 활성화에 있어서의 변화들에 연결하기 위한 보다 상세한 조사가 뒤따를 수 있다. 이것은 특정 암의 개시, 성장 및 진화와 전이(병리생리학)를 조사하는 것과 관련된다.
전사 인자 존재에 대한 노드 및 본원에 기술된 도 2 및 3과 유사한 이들과 관련된 프로브셋(표 1, 표 2, 표 3 및 표 4)에 의해 측정된 바와 같은 타깃 유전자의 mRNA 발현 수준을 나타내는 노드들의 층을 적어도 사용하여 구성되고, 본원에 기술된 바와 같이 트레이닝된, Wnt, ER, HH 및 AR 경로의 (슈도-)선형 모델을, 유방암 샘플로 이루어지는 데이터 세트(GSE12276)의 경로 활성을 예측하는데 사용하였다.
연구원이 조절되지 않은 세포 증식을 일으키는 세포 시그널링 경로 또는 경로들 및 특정 조절 완화(deregulation)(들)를 조사하는데 관심이 있는 것으로 가정한다. 연구원은 어떤 경로가 조절되지 않은 세포 증식의 원인일지를 알아내기 위해 상기 언급된 (슈도-)선형 모델을 사용하여 마이크로어레이 데이터를 분석할 수 있다. 도 18 및 도 19에 도시된 바와 같이, Wnt, ER 및 HH 활성 스코어의 경우(GSE12276 데이터 세트의 기저 및 관강내 A 샘플)에 대한 이러한 분석의 예시를 볼 수 있다. 이어서, 연구원은 경로 조절 완화의 정확한 원인을 알아내기 위해 더 상세히 조사할 수 있다.
도 19를 참조하면, 기저 샘플은 삼중 음성 수용체 상태(triple negative receptor status)(ER, PR 및 HER2)를 갖는 것으로 공지되어 있으며, 따라서, 모든 샘플들이 불활성형 ER 경로를 갖는 것으로 예측된다는 것을 이해하는 것은 놀라운 일이 아니다(또한 도 11 참조). 다른 한편으로, 샘플들 중 일부는 도 19에 도시된 바와 같이 Wnt 경로 활성을 갖는 것으로 예측된다. 이러한 예측된 Wnt 경로 활성은 연구자로 하여금, 예를 들면, Wnt 경로에서 공지된 돌연변이 또는 기타의 공지된 조절 완화에 대해 보다 상세히 이들 샘플들을 조사하도록 한다. 이러한 방법은 또한 HH 및 AR 경로와 같은 기타의 세포 시그널링 경로에도 적용될 수 있다.
GSE12276 데이터 세트의 관강내 A 샘플에서의 Wnt, ER 및 HH 활성 스코어가 예시되어 있는 또 다른 예가 도 18에 제공되어 있다. 관강내 A 샘플은 ER을 발현하는 것으로 공지되어 있지만, 이것이 반드시 암의 특성들이 활성형 ER 시그널링으로 인한 것임을 의미하는 것은 아니다. 예측된 경로 활성으로부터, 모든 ER+ 샘플이 활성형 ER 시그널링을 갖는 것은 아님을 추론할 수 있다. 그러나, 활성형 ER 시그널링을 갖지 않는 샘플들 중 일부는 활성형 Wnt, AR 및/또는 HH 경로를 갖는 것으로 밝혀졌다. 이것은 연구원으로 하여금 각각 Wnt, AR 및/또는 HH 시그널링 경로에 있어서의 결함들에 대해 보다 상세히 이들 샘플들을 조사하도록 할 수 있다. 샘플들 중 일부는 포함된 4개의 경로들 중 임의의 것이 활성형이라는 예측을 하지 않으며; 아마도 다른 경로들은 조절되지 않은 세포 증식을 유발한다. 또한, 이것은 연구원에게 다른 경로에서의 결함들에 대해 조사하기 위한 부가적인 정보를 제공한다.
요약하면, 본원에 기술된 예시들은 더욱 직접적인 방법으로 조절되지 않은 세포 증식의 원인을 알아내는 방법을 지원하는 (상술된 바와 같은) 트레이닝된 (슈도-)선형 모델의 능력을 나타낸다. 경로 활성에 대해 샘플들을 스크리닝하는데 (슈도-)선형 모델을 이용함으로써, 예측된 경로 활성은 조절되지 않을 수 있는 세포 증식에 대한 가능한 경로를 정확히 찾아낼 수 있고, 이후에는, 예를 들면, 시그널링 단백질의 돌연변이 또는 기타의 공지된 조절 완화를 (모델에 의해 측정된 바와 같이) 활성화시의 변화들에 연결하기 위한 보다 상세한 조사가 뒤따를 수 있다.
본원에 기술된 바와 같이, 세포 시그널링 경로의 (슈도-)선형 모델을 개발하고 트레이닝하기 위한 방법은 본 발명과 함께 사용될 수도 있는 기타의 경로에 대한 (슈도-)선형 모델을 구성하는데 이용될 수 있다.
실시예 11: 예측된 활성에 기초한 임상 실험에서의 환자의 등록
후보 약물이, 예를 들면, 종양 성장을 유발하는 특정 경로의 활성을 차단하기 위해 개발되고, 이 약물이 임상 실험에 들어간다면, 이러한 실험에 등록할 환자들의 적절한 선택이 약물의 잠재적인 효과를 증명하기 위해 필수적이다. 이러한 경우에, 이들의 종양에서 활성화된 각각의 경로를 갖지 않는 환자들은 실험으로부터 배제되어야 하며, 이것은 경로가 첫 번째 부위에서 활성화되지 않는다면 약물은 효과가 없을 수 있다는 것이 명백하기 때문이다. 따라서, 경로 활성을 예측할 수 있는 경로 모델, 예를 들면, 본원에 기술된 (슈도-)선형 모델이, 활성화된 각각의 경로를 갖는 것으로 예측되는 환자들만을 선택하기 위한 선택 도구로서 사용될 수 있다.
실시예 12: 수행될 후속 검사(들)의 선택
상이한 경로 모델을 사용하여 종양을 분석하고, 모델이 특정 경로의 조절 완화를 예측한다면, 이것은 수행될 후속 검사의 선택을 안내할 수 있다. 예를 들면, 각각의 전사 복합체의 존재를 확인하기 위해 근접성 라이게이션 검정(proximity ligation assay; PLA)을 구동할 수 있다(Soderberg O, 2006년). 이러한 PLA는, TF 복합체에서의 2개의 주요 단백질, 예를 들면, Wnt 경로의 TF 복합체에서의 베타-카테닌 및 TCF4가 실제로 함께 결합된다면, 양성 결과를 제공하도록 설계될 수 있다.
또 다른 예는 조절 완화되는 것으로 예측된 경로를 시그널링 캐스케이드에 대해 보다 상세히 분석하는 것이다. 예를 들면, 각각의 유전자를 암호화하는 DNA 영역에 돌연변이가 존재하는지의 여부를 결정하기 위해 이 경로에서의 주요 단백질을 분석할 수 있거나, 이들 단백질이 정상보다 높은지 낮은지의 여부를 알아보기 위해 이들 단백질의 과다에 대해 검사할 수 있다. 이러한 검사는 경로의 조절 완화 이면의 근본 원인이 무엇인지를 나타낼 수 있고, 어떠한 이용 가능한 약물들이 경로의 활성을 감소시키는데 사용될 수 있는지의 통찰을 제공할 수 있다.
이러한 검사는 (슈도-)선형 모델을 사용하여 식별되는 바와 같이 경로의 활성을 확인하도록 선택된다. 그러나, 동반 진단용 검사의 선택 또한 가능하다. 모델을 사용하여 경로를 식별한 후, 표적 치료법 선택을 위해, 식별된 경로에 적용할 수 있는 이러한 동반 진단 검사들만이 수행될 필요가 있다(선택).
실시예 13: 동반 진단 검사의 선택
상기 예와 유사하게, 종양이 분석되고 경로 모델이 특정 경로의 조절 완화를 예측하고, 임의로 다수의 부가적인 검사들이 조절 완화의 원인을 조사하기 위해 수행되었다면, 종양학자는 환자를 치료하기 위한 다수의 후보 약물을 선택할 수 있다. 그러나, 이러한 약물로의 치료는, 예를 들면, 임상 지침들을 따르거나 치료 비용 상환을 보장하기 위해, 또는 약물을 제공하기 전에 동반 진단 검사를 수행하는 것이 필요한 규제(FDA)로 인해 동반 진단 검사를 먼저 실행하는 것을 필요로 할 수 있다. 이러한 동반 진단 검사의 예로는 약물 허셉틴(Herceptin)(트라스투주맙(Trastuzumab))으로의 유방암 환자의 치료를 위한 Her2 검사가 있다. 따라서, 경로 모델의 결과를 사용하여, 후보 약물 및 수행될 각각의 동반 진단 검사를 선택할 수 있다.
실시예 15: CDS 애플리케이션
((Wnt 경로에 대해 예시적으로 도시되어 있는) 본원에 기술된 바와 같은 하나 이상의 세포 시그널링 경로를 평가하도록 구성된 임상 의사결정 지원(CDS) 시스템을 다이어그램으로 도시하는) 도 4를 참조하면, 임상 의사결정 지원(CDS) 시스템(10)은 적절하게 구성된 컴퓨터(12)로서 구현된다. 컴퓨터(12)는 적절한 소프트웨어, 펌웨어, 또는 하드 드라이브 또는 기타의 자기 저장 매체, 광학 디스크 또는 기타의 광학 저장 매체, 랜덤 액세스 메모리(RAM), 판독-전용 메모리(ROM), 플레시 메모리, 또는 기타의 전자 저장 매체와 같은 비-일시적 저장 매체(도시되지 않음), 네트워크 서버 등에 저장된 기타의 명령들을 실행함으로써 CDS 시스템(10)으로서 작동하도록 구성될 수 있다. 예시적인 CDS 시스템(10)이 예시적인 컴퓨터(12)로 구체화되어 있지만, 보다 일반적으로, CDS 시스템은 본원에 기재된 바와 같은 임상 의사결정 지원 방법을 수행하도록 구성된 디지털 프로세서를 포함하는 장치 또는 디지털 처리 디바이스로 구체화될 수 있다. 예를 들면, 디지털 처리 디바이스는 소형 디바이스(예를 들면, CDS 애플리케이션을 동작시키는 개인 휴대용 정보 단말기 또는 스마트폰), 노트북 컴퓨터, 데스크탑 컴퓨터, 태블릿 컴퓨터 또는 디바이스, 원격 네트워크 서버 등 일 수 있다. 컴퓨터(12) 또는 기타의 디지털 처리 디바이스는 전형적으로 임상 의사결정 지원 권고들을 포함하는 정보가 의료인에게 디스플레이되는 디스플레이 디바이스(14)를 포함하거나 이와 작동 가능하게 접속된다. 컴퓨터(12) 또는 기타의 디지털 처리 디바이스는 전형적으로 또한, 예시적인 키보드(16), 또는 마우스, 트랙볼, 트랙패드, (가능하게는 디스플레이 디바이스(14)와 통합되는) 터치-감지 스크린, 또는 기타의 포인터-기반 이용자 입력 디바이스와 같은, 하나 이상의 이용자 입력 디바이스를 포함하거나 이와 작동 가능하게 접속되며, 이를 통해 의료인이 CDS 시스템(10)을 제어하기 위한 작동 명령들과 같은 정보, CDS 시스템(10)에 의한 사용을 위한 데이터 등을 입력할 수 있다.
CDS 시스템(10)은 의료 피험자(예를 들면, 병원의 환자, 또는 종양학자, 의사 또는 다른 의료인이 치료하는 외래 환자, 또는 암 검진을 받고 있거나 결장암, 유방암, 또는 간암 등과 같은 특정 유형의 암을 갖고 있는 것을 알고 있거나 갖고 있는 것으로 의심되는 어떤 다른 의학 진단을 받고 있는 사람 등)에 관해 입력 정보로서 수신한다. CDS 시스템(10)은 디스플레이 디바이스(14)를 통해(또는 음성 합성기 또는 인간-인지 가능 출력을 제공하는 기타의 디바이스를 통해) 의료인에게 제시되어지는 임상 의사결정 지원 권고들을 생성하기 위해 다양한 데이터 분석 알고리즘을 이 입력 정보에 적용한다. 몇몇 양태에서, 이러한 알고리즘은 임상 지침을 환자에게 적용함을 포함할 수 있다. 임상 지침은 전형적으로 의학 전문가 패널의 권고들에 기초하여 구성되고 임의로 임상 지침을 다루는 것을 용이하게 하기 위해 임상 "흐름도"의 형태로 포맷되는 표준의 또는 "기준이 되는" 치료 권고들의 저장된 세트이다. 다양한 양태에서, CDS(10)의 데이터 처리 알고리즘은 부가적으로 또는 대안적으로 본원에 기술된 기계 학습 방법과 같은 임상 의사결정 권고들을 발췌하기 위해 입력 정보에 대해 수행되는 다양한 진단 또는 임상 검사 알고리즘을 포함할 수 있다.
본원에 기술된 예시적인 CDS 시스템(예를 들면, CDS 시스템(10))에서, CDS 데이터 분석 알고리즘은 하나 이상의 의학 실험실(18)에 의해 획득된 입력 유전체 및/또는 단백체 정보에 대해 수행되는 하나 이상의 진단 또는 임상 검사 알고리즘을 포함한다. 이들 실험실은 "내부(on-site)"에, 즉, 병원 또는 의료 피험자가 진찰을 받는 다른 위치에, 또는 "외부(off-site)"에, 예를 들면, 의료 피험자로부터 추출된 의료 피험자의 조직 및/또는 세포의 샘플(예를 들면, 생검 절차 또는 기타의 샘플 추출 절차를 통해, 유방 병변으로부터, 또는 결장암이 있는 것을 알고 있거나 의심되는 의료 피험자의 결장으로부터, 또는 간암이 있는 것을 알고 있거나 의심되는 의료 피험자의 간으로부터 수득되는 샘플)을 (우편 또는 다른 배달 서비스를 통해) 수령하는 전문화되고 집중된 실험실에 다양하게 위치할 수 있다. 샘플이 추출되는 조직은 또한 전이 조직, 예를 들면, 결장, 유방, 간, 또는 결장, 유방, 간이나 다른 장기 밖으로 퍼진 다른 장기로부터 기원하는 (의심되는) 악성 조직일 수 있다. 샘플이 추출되는 세포는 또한 혈액 악성 종양(예를 들면, 백혈병)으로부터의 종양 세포일 수 있다. 몇몇 경우에 있어서, 세포 샘플은 또한 순환 종양 세포, 즉, 혈류로 들어간 종양 세포일 수 있고, 적절한 분리 기술을 사용하여 추출된 조직 샘플로서 추출될 수 있다. 추출된 샘플은 유전체 또는 단백체 정보를 생성하기 위해 실험실에서 처리된다. 예를 들면, 추출된 샘플은, 예를 들면, 유전자로부터 전사된 메신저 리보핵산(messenger ribonucleic acid; mRNA)의 수준 또는 유전자로부터 전사된 mRNA로부터 해독되는 단백질의 수준의 형태로, 관심있는 유전자의 발현 수준과 같은 유전체 또는 단백체 증명 정보를 측정하기 위해 (이 분야에서 유전자 칩, DNA 칩, 바이오칩 등으로 다양하게 일컬어지는) 마이크로어레이를 사용하여 또는 정량적 폴리머라제 연쇄 반응(qPCR) 처리에 의해 처리될 수 있다. 또 다른 예로서, 추출된 샘플은 데옥시리보핵산(deoxyribonucleic acid; DNA)에 대한 서열을 생성하기 위해 또는 RNA 서열, 복제수 변이 등을 생성하기 위해 유전자 서열화 실험실에 의해 처리될 수 있다. 기타의 고려되는 측정 방식들은 병리학 슬라이드에서 수행되는 면역 조직 화학(immunohistochemistry; IHC), 세포학, 형광 동소 혼성화(fluorescence in situ hybridization; FISH), 근접성 라이게이션 검정 등을 포함한다. 마이크로어레이 처리, 질량 분광분석, 유전자 서열화 또는 기타의 실험실 기술들에 의해 생성될 수 있는 또 다른 정보는 메틸화 정보를 포함한다. 이러한 유전체 및/또는 단백체 측정들의 다양한 조합이 또한 수행될 수 있다.
몇몇 양태에서, 의학 실험실(18)에서는 대량의 유전체 및/또는 단백체 데이터를 생성하도록, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에 대해 다수의 표준화된 데이터 획득을 수행한다. 예를 들면, 표준화된 데이터 획득 기술은 하나 이상의 염색체 또는 염색체 부분들에 대한 또는 조직 및/또는 세포의 전체 유전체에 대한 (임의로 정렬된) DNA 서열을 생성할 수 있다. 표준 마이크로어레이를 적용하면 다수의 유전자에 대한 발현 수준, 각종 메틸화 데이터 등과 같은 수천 또는 수만의 데이터 항목들을 생성할 수 있다. 이러한 과다한 유전체 및/또는 단백체 데이터 또는 이의 선택된 일부가 CDS 시스템(10)에 입력되어, 임상 의사결정 지원 권고들을 조직화하기 위한 임상적으로 유용한 정보를 개발하도록 처리된다.
기재된 CDS 시스템 및 관련 방법들은 다양한 세포 시그널링 경로의 활성을 평가하기 위한 유전체 및/또는 단백체 데이터의 처리와 관련된다. 그러나, 기재된 CDS 시스템(예를 들면, CDS 시스템(10))은 임의로 바이탈 사인 모니터링 데이터, 환자 이력 데이터, 환자 인구통계학적 데이터(예를 들면, 성별, 나이 등), 환자 의료 영상 데이터 등과 같은 다양한 환자 데이터에 기초하여 저장되어 있는 임상 지침들에 따라 임상 의사결정 지원 권고들을 생성하는 것과 같은 다양한 부가적인 능력들을 추가로 포함할 수 있는 것으로 이해되어야 한다. 대안적으로, 몇몇 양태에서, CDS 시스템(10)의 능력은 본원에 기술된 것과 같은 세포 시그널링 경로를 평가하기 위한 유전체 및/또는 단백체 데이터 분석을 수행하는 것으로만 제한될 수 있다.
예시적인 도 4를 계속 참조하면, CDS 시스템(10)은 추출된 샘플에서 측정된 세포 시그널링 경로의 타깃 유전자의 발현 수준에 제한되지 않으면서 적어도 이에 기초하여, 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하고, 세포 시그널링 경로가 이러한 추론된 활성에 기초하여 의료 피험자의 조직 및/또는 세포에서 비정상적으로 작동하고 있는지의 여부를 결정한다. 본원에 기재된 예들은 예시적인 세포 시그널링 경로로서 Wnt, ER, AR 및 HH 경로와 관련된다. 이러한 경로들은 다양한 종양학 분야에서 관심 대상이고, 이것은 경로의 조절 실패가 암 증식의 원인일 수 있기 때문이다. 약 10개 내지 15개의 관련 시그널링 경로가 있으며, 각각의 암은 원칙적으로 조절 완화되는 하나의 지배적 경로에 의해 구동된다. 특정 작동 이론으로 제한하는 것은 아니지만, 이러한 경로가 세포 증식을 조절하고, 결과적으로, 암 세포에서의 이들 경로들의 조절 실패는 경로가 "항상 on"이 되도록 하여, 암 세포의 증식을 가속화시킬 수 있으며, 이것이 암의 성장, 침입 또는 전이(확산)를(을) 나타낸다.
세포 시그널링 경로를 형성하는 단백질 캐스케이드의 일부인 중간 단백질과 같은, 세포 시그널링 경로의 조절 단백질을 암호화하는 유전자의 mRNA 발현 수준의 측정은 조절 단백질 발현 수준의 간접 측정이고, 이것은 실제 조절 단백질 발현 수준과 강하게 상관될 수 있거나 그렇지 않을 수 있다(하물며 세포 시그널링 경로의 전체 활성은 말할 것도 없다). 세포 시그널링 경로는 타깃 유전자의 전사를 직접 조절하고 - 따라서, 타깃 유전자로부터 전사된 mRNA의 발현 수준이 이러한 조절 활동의 직접적인 결과이다. 따라서, CDS 시스템(10)은 세포 시그널링 경로의 타깃 유전자의 발현 수준(대리 측정으로서 mRNA 또는 단백질 수준)에 적어도 기초하여 세포 시그널링 경로(예를 들면, Wnt, ER, AR 및 HH 경로)의 활성을 추론한다. 이것은 CDS 시스템(10)이 타깃 유전자들의 측정된 발현 수준에 의해 제공되는 직접적인 정보에 기초하여 경로의 활성을 추론하는 것을 보장한다.
그러나, 본원에 기술된 것과 같이, 전체 경로의 활성을 평가하기에는 효과적이라고 하더라도, 경로의 타깃 유전자의 측정된 발현 수준(20)은 (실제로 그런 경우라면) 경로가 왜 비정상적으로 작동하는지에 대해 특별히 유용한 정보를 제공하지는 못한다. 즉, 경로의 타깃 유전자의 측정된 발현 수준(20)은 경로가 비정상적으로 작동한다는 것은 나타낼 수 있지만, 전체 경로가 비정상적으로 작동하도록 하기 위해 경로의 어떤 부분이 오작동하는지(예를 들면, 충분한 조절의 결여)를 나타내지는 않는다.
따라서, CDS 시스템(10)이 특정 경로의 비정상적인 활성을 검출한다면, CDS 시스템(10)은 임의로, 정렬된 유전 서열(22) 및/또는 경로의 하나 이상의 조절 유전자에 대한 측정된 발현 수준(들)(24)과 같은 추출된 샘플에 대한 의학 실험실(18)에 의해 제공된 다른 정보를 이용하게 되거나, 경로의 어떤 부분이 오작동하는지를 평가하기 위해 다음에 수행될 진단 검사를 선택하게 된다. 효율성을 최대화하기 위해, 몇몇 양태에서, 경로가 왜 오작동하는지에 대한 이러한 임의의 평가는, 경로의 타깃 유전자의 측정된 발현 수준(20)의 분석이 경로가 비정상적으로 작동하고 있다는 것을 나타내는 경우에만 수행된다. 또 다른 양태에서, 이 평가는 본원에 기술된 세포 시그널링 경로의 분석에 통합된다.
CDS 시스템(10)이 경로의 어떤 부분이 오작동하는지를 평가하고 이렇게 하는데 있어서 성공한 양태에서, 부가적인 정보는 CDS 시스템(10)이 특정 오작동을 표적으로 하는 약물의 처방을 권고하도록 한다(도 4에 도시된 권고(26)). (임의의 부가적인 평가가 수행되지 않거나 아니면 그 평가가 오작동중인 경로의 임의의 특정 부분을 확인하는데 실패하는 것으로 인해) 어떠한 특정 경로 오작동도 확인되지 않으면, (비정상적인 경로 활성이 너무 높은 활성인 것으로 가정하여) CDS 시스템(10)은 이 특정 경로에 대한 일반적인 억제 약물의 처방을 권고하는 디폴트 권고(28)를 제공할 수 있다.
실시예 16: 경로 활성을 측정하기 위한 키트 및 분석 도구
(슈도-)선형 모델을 사용하는 마이크로어레이/RNA 서열화 기반 조사에 기초하여 특정 경로 활성을 가장 잘 나타내는 것으로 밝혀진 타깃 유전자의 세트를, 조직 또는 세포 샘플에 대해 수행될 다중 정량적 PCR 검정으로 해독할 수 있다. 경로 활성에 대한 이러한 FDA-승인된 검사를 개발하기 위해, 표준화된 검사 키트의 개발이 요구되며, 이것은 조절 승인을 획득하기 위해 임상 실험에서 임상적으로 검증되어야 한다.
일반적으로, Wnt, ER, AR 및/또는 HH 경로(들)와 관련된 예들이 예시적인 예로서 제공되어 있지만, 본원에 기술된 세포 시그널링 경로 분석을 위한 방식들은 이들 경로 이외의 다른 세포 시그널링 경로에, 예를 들면, (상기와 비교하여) 세포 막에 수용체를 갖는 세포간 시그널링 경로 및 (상기와 비교하여) 세포 내부에 수용체를 갖는 세포내 시그널링 경로에 쉽게 적용되는 것으로 이해되어야 한다. 또한, 이러한 응용은 여러 바람직한 양태들을 기술한다. 상기한 상세한 설명을 읽고 이해할 때 수정들 및 대안들이 발생할 수 있다. 본 출원은 첨부된 청구항 또는 이의 등가물의 범위 내에 있는 한 이러한 모든 수정들 및 대안들을 포함하는 것으로 해석되도록 의도된다.
참조문헌
de Sousa E Melo F, C. S. (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell, 476-485
Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol, 2732-2744
Nusse, R. (2012, May 1). Wnt target genes. Retrieved from The Wnt homepage: http://www.stanford.edu/group/nusselab/cgi-bin/wnt/target_genes
Soderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000
van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250

Claims (21)

  1. - 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준(20)에 적어도 기초하여 상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하는 단계; 및
    - 상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초하여, 세포 시그널링 경로가 상기 의료 피험자의 조직 및/또는 세포에서 비정상적으로 작동하고 있는지를 결정하는 단계를 포함하고,
    여기서, 상기 추론 단계는,
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 전사 인자(TF) 요소의 수준(46)을 측정하고, 이때, 상기 TF 요소는 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 전사를 제어하고, 상기 결정 단계는 TF 요소의 수준에 대한 세포 시그널링 경로의 하나 이상의 타깃 유전자(들)의 발현 수준에 관한 수학적 모델(40-l,...,40-3)을 평가하는 것에 적어도 부분적으로 기초하며, 상기 모델은 하나 이상의 타깃 유전자(들)의 발현 수준의 하나 이상의 선형 조합(들)(linear combination)에 적어도 부분적으로 기초로 하는 단계; 및
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 TF 요소의 상기 결정된 수준에 기초하여 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 활성을 추론하는 단계를 포함하며,
    상기 추론 단계가 세포 시그널링 경로의 모델을 사용하여 디지털 처리 디바이스(12)에 의해 수행되는, 방법.
  2. 제1항에 있어서, 상기 하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 상기 하나 이상의 타깃 유전자(들)에 대해 제공된 상기 하나 이상의 발현 수준(들)의 모든 발현 수준의 선형 조합을 포함하는, 방법.
  3. 제1항에 있어서, 상기 하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 하나 이상의 타깃 유전자(들)의 각각에 대하여 가중치 항(weighted term)을 포함하는 선형 조합을 포함하고, 각각의 가중치 항이 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들) 중 단지 하나의 발현 수준에 기초하는, 방법.
  4. 제1항에 있어서, 상기 하나 이상의 타깃 유전자(들)의 각각에 대하여, 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 하나 이상의 발현 수준(들)이 제공되고, 하나 이상의 선형 조합(들)이 하나 이상의 타깃 유전자(들)의 각각에 대하여 각각의 타깃 유전자에 대해 제공된 하나 이상의 발현 수준(들)의 모든 발현 수준의 제1 선형 조합을 포함하고, 상기 모델이 추가로 하나 이상의 타깃 유전자(들)의 각각에 대해 가중치 항을 포함하는 추가의 선형 조합에 적어도 부분적으로 기초하고, 각각의 가중치 항이 각각의 타깃 유전자에 대한 제1 선형 조합에 기초하는, 방법.
  5. 제1항 내지 제4항 중의 어느 한 항에 있어서, 상기 세포 시그널링 경로가 Wnt 경로, ER 경로, AR 경로 또는 HH 경로를 포함하는, 방법.
  6. 제5항에 있어서, 상기 추론 단계가 KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 및 FZD7을 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 Wnt 경로의 활성을 추론함을 포함하는, 방법.
  7. 제5항에 있어서, 상기 추론 단계가 CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 및 NRIP1을 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 ER 경로의 활성을 추론함을 포함하는, 방법.
  8. 제5항에 있어서, 상기 추론 단계가 GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN 및 CTSL1을 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 HH 경로의 활성을 추론함을 포함하는, 방법.
  9. 제5항에 있어서, 상기 추론 단계가 KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR 및 EAF2를 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 하나 이상의, 바람직하게는 적어도 세 개의 타깃 유전자(들)의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 AR 경로의 활성을 추론함을 포함하는, 방법.
  10. 제6항에 있어서, 상기 추론 단계가 NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A 및 LECT2를 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 적어도 하나의 타깃 유전자의 발현 수준(20)에 추가로 기초하는, 방법.
  11. 제7항에 있어서, 상기 추론 단계가 AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 및 TRIM25를 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 적어도 하나의 타깃 유전자의 발현 수준(20)에 추가로 기초하는, 방법.
  12. 제8항에 있어서, 상기 추론 단계가 BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 및 TOM1을 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 적어도 하나의 타깃 유전자의 발현 수준(20)에 추가로 기초하는, 방법.
  13. 제9항에 있어서, 상기 추론 단계가 APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 및 TACC2를 포함하는 그룹으로부터 선택된 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 적어도 하나의 타깃 유전자의 발현 수준(20)에 추가로 기초하는, 방법.
  14. 제1항 내지 제13항 중의 어느 한 항에 있어서,
    상기 세포 시그널링 경로의 비정상적인 작동을 치료하는 약물 처방을 의료 피험자에게 권고하는 단계를 추가로 포함하고,
    상기 권고 단계는, 세포 시그널링 경로가 세포 시그널링 경로의 추론된 활성에 기초하여 의료 피험자의 조직 및/또는 세포에서 비정상적으로 작동하고 있다고 결정되는 경우에만 수행되는, 방법.
  15. 제1항 내지 제13항 중의 어느 한 항에 있어서,
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 진단;
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 예후;
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 약물 처방;
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 약효의 예측;
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 부작용의 예측;
    약효의 모니터링;
    약물 개발;
    검정법 개발;
    경로 연구;
    암 병기결정;
    상기 의료 피험자의 조직 및/또는 세포에서 세포 시그널링 경로의 추론된 활성에 기초한 임상 실험에서의 의료 피험자의 등록;
    수행할 후속 검사의 선택; 및
    동반 진단 검사의 선택 중의 적어도 하나에서 사용되는, 방법.
  16. 제1항 내지 제15항 중의 어느 한 항에 있어서,
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 Wnt 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 Wnt 경로의 활성을 추론하는 단계; 및/또는
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 ER 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 ER 경로의 활성을 추론하는 단계; 및/또는
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 HH 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 HH 경로의 활성을 추론하는 단계; 및/또는
    상기 의료 피험자의 조직 및/또는 세포의 추출된 샘플에서 측정된 AR 경로의 타깃 유전자의 세트 중의 두 개, 세 개 또는 그 이상의 타깃 유전자의 발현 수준(20)에 적어도 기초하여 의료 피험자의 조직 및/또는 세포에서 AR 경로의 활성을 추론하는 단계를 포함하는, 방법.
  17. 제16항에 있어서,
    상기 Wnt 경로의 타깃 유전자의 세트가 KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 및 FZD7을 포함하는 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
    상기 ER 경로의 타깃 유전자의 세트가 CDH26, SGK3, PGR, GREB1, CA12, XBP1, CELSR2, WISP2, DSCAM, ERBB2, CTSD, TFF1 및 NRIP1을 포함하는 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
    상기 HH 경로의 타깃 유전자의 세트가 GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN 및 CTSL1을 포함하는 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하고/하거나,
    상기 AR 경로의 타깃 유전자의 세트가 KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR 및 EAF2를 포함하는 그룹으로부터 선택된 적어도 아홉 개, 바람직하게는 모든 타깃 유전자를 포함하는, 방법.
  18. 제17항에 있어서,
    상기 Wnt 경로의 타깃 유전자의 세트가 NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A 및 LECT2를 포함하는 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
    상기 ER 경로의 타깃 유전자의 세트가 AP1B1, ATP5J, COL18A1, COX7A2L, EBAG9, ESR1, HSPB1, IGFBP4, KRT19, MYC, NDUFV3, PISD, PRDM15, PTMA, RARA, SOD1 및 TRIM25를 포함하는 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
    상기 HH 경로의 타깃 유전자의 세트가 BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 및 TOM1을 포함하는 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하고/하거나,
    상기 AR 경로의 타깃 유전자의 세트가 APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 및 TACC2를 포함하는 그룹으로부터 선택된 적어도 하나의 타깃 유전자를 추가로 포함하는, 방법.
  19. 제1항 내지 제18항 중의 어느 한 항에 기재된 바와 같은 방법을 수행하도록 구성된 디지털 프로세서(12)를 포함하는, 장치.
  20. 제1항 내지 제18항 중의 어느 한 항에 기재된 바와 같은 방법을 수행하기 위해 디지털 처리 디바이스(12)에 의해 실행 가능한 명령들을 저장하는, 비일시적 저장 매체.
  21. 디지털 처리 디바이스(12)가 제1항 내지 제18항 중의 어느 한 항에 기재된 바와 같은 방법을 수행하도록 하기 위한 프로그램 코드 수단을 포함하는, 컴퓨터 프로그램.
KR1020157020316A 2012-12-26 2013-12-18 타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가 KR102279844B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261745839P 2012-12-26 2012-12-26
US61/745,839 2012-12-26
PCT/IB2013/061066 WO2014102668A2 (en) 2012-12-26 2013-12-18 Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions;

Publications (2)

Publication Number Publication Date
KR20150100896A true KR20150100896A (ko) 2015-09-02
KR102279844B1 KR102279844B1 (ko) 2021-07-21

Family

ID=50156797

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157020316A KR102279844B1 (ko) 2012-12-26 2013-12-18 타깃 유전자 발현의 선형 조합(들)을 사용한 세포 시그널링 경로 활성의 평가

Country Status (13)

Country Link
US (2) US11306360B2 (ko)
EP (1) EP2938745B1 (ko)
JP (2) JP6449779B2 (ko)
KR (1) KR102279844B1 (ko)
CN (2) CN111961726A (ko)
AU (2) AU2013368945B2 (ko)
BR (1) BR112015015131A2 (ko)
CA (1) CA2896414C (ko)
DK (1) DK2938745T3 (ko)
ES (1) ES2878196T3 (ko)
MX (1) MX2015008177A (ko)
RU (1) RU2721130C2 (ko)
WO (1) WO2014102668A2 (ko)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI637951B (zh) 2013-02-15 2018-10-11 英商葛蘭素史克智慧財產發展有限公司 作為激酶抑制劑之雜環醯胺類
WO2014174003A1 (en) 2013-04-26 2014-10-30 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CA2923092C (en) 2014-01-03 2019-12-17 Koninklijke Philips N.V. Assessment of the pi3k cellular signaling pathway activity using mathematical modelling of target gene expression
CA2965442A1 (en) 2014-10-24 2016-04-28 Koninklijke Philips N.V. Assessment of tgf-b cellular signaling pathway activity using mathematical modelling of target gene expression
ES2838923T3 (es) 2014-10-24 2021-07-02 Koninklijke Philips Nv Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
JP7065609B6 (ja) 2014-10-24 2022-06-06 コーニンクレッカ フィリップス エヌ ヴェ 複数の細胞シグナル伝達経路活性を用いる治療応答の医学的予後及び予測
ES2861400T3 (es) * 2015-08-14 2021-10-06 Koninklijke Philips Nv Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
US20190128899A1 (en) * 2016-06-13 2019-05-02 Koninklijke Philips N.V. Method for inferring activity of a transcription factor of a signal transduction pathway in a subject
CA3044030A1 (en) * 2016-11-17 2018-05-24 Nantbio, Inc. Validation of inferred anticancer pathways
EP3544993A1 (en) 2016-11-25 2019-10-02 Koninklijke Philips N.V. Method to distinguish tumor suppressive foxo activity from oxidative stress
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3461915A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3461916A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat3 cellular signaling pathway activity using mathematical modelling of target gene expression
EP3692170A1 (en) 2017-10-02 2020-08-12 Koninklijke Philips N.V. Determining functional status of immune cells types and immune response
EP3462349A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
CN108187050A (zh) * 2018-01-18 2018-06-22 石河子大学 抑制食管癌细胞增殖的药物
EP3837548A2 (en) * 2018-08-17 2021-06-23 F. Hoffmann-La Roche AG Diagnostic and therapeutic methods for the treatment of breast cancer
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3963108A1 (en) 2019-05-03 2022-03-09 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP3822368A1 (en) 2019-11-14 2021-05-19 Koninklijke Philips N.V. Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
EP3835433A1 (en) 2019-12-12 2021-06-16 Koninklijke Philips N.V. Notch signaling pathway activity as prognostic marker in bladder cancer
CN111166884B (zh) * 2020-01-15 2021-12-03 广州中医药大学第一附属医院 Foxf1基因在制备用于骨质疏松症药物中的应用
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
US20230223108A1 (en) 2020-04-16 2023-07-13 Innosign B.V. Prognostic pathways for viral infections
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
CN112466403B (zh) * 2020-12-31 2022-06-14 广州基迪奥生物科技有限公司 一种细胞通讯分析方法及系统
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
WO2022189530A1 (en) 2021-03-11 2022-09-15 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
CN114015709B (zh) * 2021-11-04 2023-04-25 塔里木大学 绵羊ctsd基因在调控初情期启动中的应用
WO2023084039A1 (en) 2021-11-15 2023-05-19 Innosign B.V. Assessment of gr cellular signaling pathway activity using mathematical modelling of target gene expression
CN114703227B (zh) * 2022-01-27 2023-11-10 中国科学院生态环境研究中心 基于MCF-7细胞系构建的RARα效应物体外筛选方法
WO2024033063A1 (en) 2022-08-12 2024-02-15 Innosign B.V. Prediction and monitoring of immunotherapy in cancer

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003260973A1 (en) * 2002-09-05 2004-03-29 Toolgen, Inc. Bioinformatics analysis of cellular effects of artificial transcription factors
TW200512298A (en) * 2003-09-24 2005-04-01 Oncotherapy Science Inc Method of diagnosing breast cancer
EP1690212A2 (en) 2003-11-26 2006-08-16 Genstruct, Inc. System, method and apparatus for causal implication analysis in biological networks
AU2006206159A1 (en) * 2005-01-24 2006-07-27 Massachusetts Institute Of Technology Method for modeling cell signaling systems by means of bayesian networks
EP2027549A2 (en) * 2006-05-17 2009-02-25 The Trustees Of Boston University Method to determine transcriptional regulation pathways in organisms
US20080317745A1 (en) * 2006-09-15 2008-12-25 Boruchov Adam M Methods of diagnosing, treating, or preventing plasma cell disorders
US7629125B2 (en) 2006-11-16 2009-12-08 General Electric Company Sequential analysis of biological samples
EP2120913B1 (en) * 2006-12-22 2015-01-21 NanoPharmaceuticals LLC Nanoparticle and polymer formulations for thyroid hormone analogs, antagonists, and formulations and uses thereof
US20100267626A1 (en) 2007-11-05 2010-10-21 Novartis Ag Methods and compositions for measuring wnt activation and for treating wnt-related cancers
US8483970B2 (en) * 2008-09-29 2013-07-09 The Trustees Of Columbia University In The City Of New York Method for identifying aQTL regions whose genotype modulates transcription factor activity
KR101903547B1 (ko) * 2010-04-29 2018-10-04 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
US10192641B2 (en) 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
US9045749B2 (en) * 2011-01-14 2015-06-02 The General Hospital Corporation Methods targeting miR-128 for regulating cholesterol/lipid metabolism
JP6078531B2 (ja) * 2011-04-26 2017-02-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. デジタル処理装置により実行される方法、装置及び記憶媒体
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Bioinformatics. 2005 Mar, 21(6): 741-753 *
Nucleic Acids Res. 2015 Apr 30, 43(8): 3873-3885. *
PLoS One. 2011, 6(5): e20059 *

Also Published As

Publication number Publication date
RU2015131009A (ru) 2017-01-30
DK2938745T3 (da) 2020-11-30
EP2938745B1 (en) 2020-10-07
CA2896414C (en) 2023-06-20
MX2015008177A (es) 2015-09-16
AU2020202706A1 (en) 2020-05-14
CN105074005A (zh) 2015-11-18
AU2020202706B2 (en) 2022-06-16
JP6449779B2 (ja) 2019-01-09
BR112015015131A2 (pt) 2017-07-11
RU2721130C2 (ru) 2020-05-18
US20150347672A1 (en) 2015-12-03
WO2014102668A3 (en) 2014-08-21
WO2014102668A2 (en) 2014-07-03
ES2878196T3 (es) 2021-11-18
JP6721665B2 (ja) 2020-07-15
JP2016509472A (ja) 2016-03-31
JP2019076096A (ja) 2019-05-23
EP2938745A2 (en) 2015-11-04
US20230030858A1 (en) 2023-02-02
CN111961726A (zh) 2020-11-20
CA2896414A1 (en) 2014-07-03
AU2013368945B2 (en) 2020-01-23
US11306360B2 (en) 2022-04-19
AU2013368945A1 (en) 2015-08-13
KR102279844B1 (ko) 2021-07-21

Similar Documents

Publication Publication Date Title
AU2020202706B2 (en) Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions
US20230105263A1 (en) Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression
AU2014259459B2 (en) Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant