KR20060006782A - 차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적분석 - Google Patents

차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적분석 Download PDF

Info

Publication number
KR20060006782A
KR20060006782A KR1020057018167A KR20057018167A KR20060006782A KR 20060006782 A KR20060006782 A KR 20060006782A KR 1020057018167 A KR1020057018167 A KR 1020057018167A KR 20057018167 A KR20057018167 A KR 20057018167A KR 20060006782 A KR20060006782 A KR 20060006782A
Authority
KR
South Korea
Prior art keywords
cancer
differentially expressed
binding site
regulatory
factor binding
Prior art date
Application number
KR1020057018167A
Other languages
English (en)
Inventor
지에 장
쉬우-잉 웨이
레슬리 마가렛 맥에보이
Original Assignee
코르젠테크, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코르젠테크, 인크. filed Critical 코르젠테크, 인크.
Publication of KR20060006782A publication Critical patent/KR20060006782A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적 분석에 관한 것이다. 보다 구체적으로, 본 발명은 차별적인 유전자 발현이 수반되는 질병의 치료를 위한 치료 전략을 개발하거나 또는 생물학적 프로세스를 연구하기 위해 차별적으로 발현된 유전자 내의 조절 인자, 예를 들어 전사 인자 결합 부위를 확인 및 특성화하는 방법에 관한 것이다.
차별적으로 발현된 유전자, 통계적 분석, 풍부화도(enrichment), 단백질유전정보학.

Description

차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적 분석 {STATISTICAL ANALYSIS OF REGULATORY FACTOR BINDING SITES OF DIFFERENTIALLY EXPRESSED GENES}
본 발명은 차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적 분석에 관한 것이다. 보다 구체적으로, 본 발명은 차별적인 유전자 발현이 수반되는 질병의 치료를 위한 치료 전략을 개발하기 위해 차별적으로 발현된 유전자 내의 조절 인자, 예를 들어 전사 인자 결합 부위를 확인 및 특성화하는 방법에 관한 것이다.
신규 치료 표적을 확인하는 주요 방법들 중 하나는 전형적으로 정상 생물학적 샘플과 질병에 걸린 생물학적 샘플 또는 특정 질병 또는 병리학적 증상의 상이한 단계들을 나타내는 생물학적 샘플을 비교하는, 차별적인 유전자 발현의 연구이다. 일반적으로, 차별적인 유전자 발현의 연구에 이용되는 방법은 폴리뉴클레오티드의 혼성화 분석 및(또는) 서열분석을 기초로 할 수 있다. 샘플 중 차별적인 유전자 발현을 정량하기 위해 가장 통상적으로 사용되는 당업계에 공지된 방법은 노던 블롯팅 및 계내 혼성화 [Parker & Barnes, Methods in Molecular Biology 106: 247-283 (1999)]; 폴리머라제 연쇄 반응(PCR) [Weis et al., Trends in Genetics 8: 263-264, (1992)], 예를 들어 정량적 실시간 PCR 및 마이크로어레이 분석을 포함한다. 별법으로, DNA 이중나선, RNA 이중나선, 및 DNA-RNA 하이브리드 이중나선 또는 DNA-단백질 이중나선을 비롯한 특정 이중나선을 인식할 수 있는 항체를 사용할 수 있다. 서열분석-기초의 유전자 발현 분석을 위한 대표적인 방법은 유전자 발현의 직렬 분석(SAGE), 및 대규모 패러렐 시그너처(parallel signature) 서열분석(MPSS)을 포함한다.
차별적인 유전자 발현 연구는 올바른 생물학적 프로세스를 나타내는 다양한 인간 조직 및 생물학적 샘플, 예를 들어 각종 암, 신경성 질병, 발달 장애, 노화 과정 및 감염성 질병 등에서 수행되어 왔다.
<발명의 개요>
본 발명은, 각종 질병, 질병 상태 및 기타 이상증을 나타낼 수 있지만 반드시 그렇지만은 않은 생물학적 샘플에서 확인된 다수의 차별적으로 발현된 유전자가 몇몇 조절 인자, 예를 들어 전사 인자(TF)의 전사 기능이 변화된 결과라는 인식을 기초로 한다.
한 측면에서, 본 발명은
(a) 차별적으로 발현된 유전자 세트를 얻는 단계;
(b) 조절 인자 결합 부위의 존재에 대하여 상기 차별적으로 발현된 유전자의 조절 영역을 포함하는 게놈 서열을 스크리닝하는 단계; 및
(c) 게놈-전체 또는 조직-전체 배경에 비해 상기 차별적으로 발현된 유전자 세트 내에 풍부한 하나 이상의 조절 인자 결합 부위를 확인하는 단계
를 포함하는, 차별적으로 발현된 유전자의 통계적 분석 방법에 관한 것이다.
차별적으로 발현된 유전자 세트는 차별적인 유전자 또는 단백질 발현 연구의 결과로부터 얻을 수 있으며, 따라서, 예를 들어 마이크로어레이, RT-PCR 또는 단백질유전정보학 방법에 의해 생성시킬 수 있다.
단계 (c)에서, 풍부화도(enrichment)는, 예를 들어 단계 (c)에서 확인된 조절 결합 부위 또는 결합 부위가 유전자 세트 내에 존재하는 빈도 또는 확률을 비교함으로써 결정할 수 있다.
특정 실시양태에서, 차별적으로 발현된 유전자 세트는 질병, 장애 또는 생물학적 프로세스의 특징적인 유전자 발현 프로필의 일부일 수 있다. 유전자 전사와 관련된 모든 질병, 장애 및 생물학적 프로세스로는 예를 들어 종양, 종양성 질병, 신경성 질병, 심혈관성 질병, 신장 질병, 감염성 질병, 소화기 질병, 대사성 질병, 염증성 질병, 자가면역 질병, 피부과 질병, 및 외상 또는 비정상적 골격 발달과 관련된 질병을 들 수 있지만, 이에 한정되지 않는다. 대사성 질병은 특히 당뇨병, 및 지질, 탄수화물 및 칼슘 대사에 관한 질병을 포함하지만, 이에 한정되지 않는다. 피부과 질병은 특히 상처 치유를 요하는 질병을 포함하지만, 이에 한정되지 않는다.
다른 특정 실시양태에서, 질병은 암이며, 암은 예를 들어 유방암, 신장암, 백혈병, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요로암, 갑상선암, 신장암, 암종, 흑색종 및 뇌암일 수 있다.
다른 실시양태에서, 장애는 발달 장애이다.
또 다른 실시양태에서, 차별적으로 발현된 유전자 세트가 나타나는 생물학적 프로세스는 노화와 관련된다.
추가의 실시양태에서, 유전자 세트는 대조군에 비해 약 2배 이상 또는 약 4배 이상 또는 약 10배 이상의 차별적인 발현을 나타내는 유전자들로 구성된다.
또 다른 실시양태에서, 조절 인자 결합 부위는 5' 상류 코어 프로모터 영역, 5' 상류 인핸서 영역, 인트론 영역, 및(또는) 3' 조절 영역 내에서 확인된다.
다른 실시양태에서, 조절 인자 결합 부위는 전사 인자 결합 부위이다. 한정을 위한 것이 아니라 다만 예시하기 위한 것으로, 전사 인자는 c-Fos, c-Jun, AP-1, Elk, ATF, c-Ets-1, c-Rel, CRF, CTF, GATA-1, POU1F1, NF-κB, POU2F1, POU2F2, p53, Pax-3, Sp1, TCF, TAR, TFEB, TCF-1, TFIIF, E2F-1, E2F-2, E2F-3, E2F-4, HIF-1, HIF-1α, HOXA1, HOXA5, Sp3, Sp4, TCF-4, APC, 및 STAT5A로 이루어진 군으로부터 선택될 수 있다.
특정 실시양태에서, 전사 인자는 E2F-1, E2F-2, E2F-3, NF-κB, Elk, AP-1, c-Fos 또는 c-Jun이다.
전형적으로, 차별적으로 발현된 다수의 유전자를 분석한다. 따라서, 분석을 약 100개 이상의 차별적으로 발현된 유전자 또는 약 500개 이상의 차별적으로 발현된 유전자로 확장할 수 있다.
다른 측면에서, 본 발명은 상기 방법에 의한 풍부한 조절 인자 결합 부위의 확인을 기초로 하는 치료 전략을 설계하는 방법에 관한 것이다.
특정 실시양태에서, 풍부한 조절 인자 결합 부위는 하나 이상의 전사 인자에 결합하는 전사 인자 결합 부위이다.
다른 실시양태에서, 풍부한 전사 인자 결합 부위를 기초로 하여 컨센서스 결합 부위를 확인한다.
치료 전략은, 예를 들어, 상응하는 전사 인자와 결합하는데 있어서 상기 풍부한 결합 부위와 경쟁하는 이중-가닥 올리고뉴클레오티드 데코이(decoy)의 설계에 의존할 수 있거나 또는 풍부한 전사 인자의 mRNA와 결합하도록 설계된 안티-센스 올리고뉴클레오티드에 의존할 수 있다.
다른 측면에서, 본 발명은
게놈-전체 또는 조직-전체 대조군에 비해 차별적으로 발현된 유전자 세트 내에 풍부한 조절 인자 결합 부위를 확인하는 단계, 및
상기 차별적으로 발현된 유전자 세트 내에 풍부한 조절 인자 결합 부위에 의해 공유되는 뉴클레오티드로 본질적으로 이루어진 컨센서스 조절 인자 결합 부위를 설계하는 단계
를 포함하는, 컨센서스 조절 인자 결합 부위의 설계 방법에 관한 것이다.
또 다른 측면에서, 본 발명은 조절 인자 결합 부위가 차별적으로 발현된 유전자 세트 내에 존재하는 빈도 또는 확률과 상기 조절 인자 결합 부위가 기준 샘플 내에 존재하는 빈도 또는 확률을 비교하는 것을 포함하는, 상기 유전자 세트를 포함하는 생물학적 샘플 내에서 상기 조절 인자 결합 부위의 풍부화도를 분석하는 방법에 관한 것이다. 통계적 분석은 바람직하게는 초기하학적 분포 모델을 이용하여 수행한다.
도 1은 G1 단계 및 S 단계의 차별적으로 발현된 유전자와 전체 게놈 배경 사이의 TF 결합 부위의 빈도를 나타낸다.
도 2는 1995년에서 2002년까지의 마이크로어레이-관련 간행물의 수를 나타내는 그래프이다.
<바람직한 실시양태의 상세한 설명>
A. 정의
달리 정의하지 않는다면, 본원에 사용된 기술 용어 및 과학 용어는 본 발명이 속하는 당업계에서 통상의 기술을 가진 자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 문헌 [Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, NY 1994), and March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, NY 1992)]은 당업자에게 본 출원에 사용된 많은 용어들에 대한 일반적인 가이드를 제공한다.
본 발명에 있어서, 이하의 용어들은 다음과 같이 정의된다.
용어 "조절 인자"는 가장 넓은 의미로 사용되며, 유전자의 mRNA 전사 프로세스에 영향을 줄 수 있는 임의의 인자를 포함한다. 특히, 이 용어에는 전사 인자가 포함된다.
용어 "유전자 조절 서열," "시스-조절 요소," "시스-작용성 조절 요소," "시스-조절 서열" 및 "시스-작용성 조절 서열"은 서로 바꾸어 쓸 수 있고, 유전자 발 현을 조절하는 임의의 조절 서열을 의미하며, 예로서 5' 조절 영역 및 3' 조절 영역, 예를 들어 프로모터, 인핸서, 사일렌서(silencer), 전사 종결 신호 및 스플라이싱 신호, 인트론 영역, 및 유전자사이 영역, 및 번역 조절 서열을 들 수 있지만, 이에 한정되지 않는다. 특히, 전사 인자가 관련되는 DNA 인식 서열(또한, 전사 인자 결합 부위라고도 함)이 포함된다.
용어 "전사 인자 결합 부위"는 유전자의 전사 개시 부위(TSS)의 직전에 위치하는 짧은 컨센서스 게놈 서열을 의미한다. 전사 조절 영역은 여러 결합 부위를 함유할 수 있으며, 따라서 여러 전사 인자가 결합할 수 있다.
"트랜스-인자"는 시스-조절 서열과 결합하는 단백질이다.
"전사 인자"는 유전자의 전사 개시 부위 근처의 DNA와 결합하며 전사의 개시 및 유지에서 RNA 폴리머라제를 보조 또는 억제하는 단백질이다.
"DNA 결합 도메인"은 표적 유전자에서 전사 개시 부위 근처의 특정 염기를 인식하는 전사 인자 내의 영역이다.
"전사 개시 부위(TSS)"는 유전자의 mRNA가 RNA 폴리머라제 II에 의해 DNA로부터 전사되기 시작하는 위치이다.
본원에 사용된 용어 "전사 인자 데코이" 또는 "데코이"는 표적 전사 인자와 특이적으로 결합함으로써 전사 인자가 표적 유전자의 전사를 개시하는 것을 방지하는 짧은 이중-가닥 올리고뉴클레오티드를 의미한다.
용어 "마이크로어레이"는 기질 상에서 혼성화가능한 어레이 요소의 정렬된 배열, 바람직하게는 폴리뉴클레오티드 프로브를 의미한다.
용어 "폴리뉴클레오티드"는 단수 또는 복수로 사용되며, 일반적으로 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 의미한다. 따라서, 예를 들어, 본원에 정의된 폴리뉴클레오티드는 단일-가닥 및 이중-가닥 DNA, 단일-가닥 및 이중-가닥 영역을 포함하는 DNA, 단일-가닥 및 이중-가닥 RNA, 및 단일-가닥 및 이중-가닥 영역을 포함하는 RNA, 단일-가닥일 수 있거나 또는 보다 전형적으로는 이중-가닥일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함하지만 이에 한정되지 않거나, 또는 단일-가닥 및 이중-가닥 영역을 포함한다. 또한, 용어 "폴리뉴클레오티드"는 본원에 사용된 바와 같이 RNA 또는 DNA를 포함하거나 또는 RNA와 DNA를 둘 다 포함하는 삼중-가닥 영역을 의미한다. 이러한 영역 내의 가닥은 동일 분자에서 유래하거나 또는 다른 분자에서 유래할 수 있다. 이 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 전형적으로는 몇몇 분자의 영역만을 포함한다. 흔히, 삼중-나선 영역의 분자들 중 하나는 올리고뉴클레오티드이다. 용어 "폴리뉴클레오티드"는 특히 cDNA를 포함한다. 이 용어는 하나 이상의 변형된 염기를 함유하는 DNA (cDNA 포함) 및 RNA를 포함한다. 따라서, 안정성 또는 다른 이유로 인해 변형된 주쇄를 갖는 DNA 또는 RNA는 본원에서 의도된 용어 "폴리뉴클레오티드"이다. 게다가, 본원에 정의된 용어 "폴리뉴클레오티드"에는 독특한 염기, 예를 들어 이노신, 또는 변형된 염기, 예를 들어 삼중수소화 염기를 포함하는 DNA 또는 RNA가 포함된다. 일반적으로, 용어 "폴리뉴클레오티드"는 변형된 폴리뉴클레오티드의 화학적으로, 효소적으로 및(또는) 대사적으로 변형된 모든 형태, 및 바이러스 및 단 순한 세포와 복잡한 세포를 비롯한 세포의 특징적인 DNA 및 RNA의 화학적 형태를 포함한다.
용어 "올리고뉴클레오티드"는 단일-가닥 데옥시리보뉴클레오티드, 단일- 또는 이중-가닥 리보뉴클레오티드, RNA:DNA 하이브리드 및 이중-가닥 DNA를 포함하지만 이에 한정되지 않는 비교적 짧은 폴리뉴클레오티드를 의미한다. 올리고뉴클레오티드, 예를 들어 단일-가닥 DNA 프로브 올리고뉴클레오티드는 흔히 화학적 방법, 예를 들어 상업적으로 이용가능한 자동화 올리고뉴클레오티드 합성기를 사용하여 합성된다. 그러나, 올리고뉴클레오티드는 시험관내 재조합 DNA-매개 기술을 비롯한 다양한 다른 방법 및 세포 및 유기체에서 DNA를 발현시키는 방법에 의해 제조할 수 있다.
용어 "차별적으로 발현된 유전자," "차별적인 유전자 발현" 및 이들이 동의어는 서로 바꾸어쓸 수 있으며, 정상 또는 대조군(기준) 샘플에서의 발현에 비해 질병으로 고통받는 대상체로부터 얻은 샘플에서 더 높거나 더 낮은 수준으로 발현이 활성화되는 유전자를 의미한다. 또한, 이 용어는 동일한 질병의 상이한 단계들에서 더 높거나 더 낮은 수준으로 발현이 활성화되는 유전자를 포함한다. 차별적으로 발현된 유전자는 핵산 수준 또는 단백질 수준에서 활성화 또는 억제될 수 있거나, 또는 다른 스플라이싱으로 처리되어 상이한 폴리펩티드 생성물을 형성시킬 수 있다. 이러한 차이는, 예를 들어 mRNA 수준, 폴리펩티드의 표면 발현, 분비 또는 기타 분배에서의 변화에 의해 입증될 수 있다. 차별적인 유전자 발현은 둘 이상의 유전자 사이의 발현 또는 이들 유전자 생성물의 비교, 둘 이상의 유전자 사이 의 발현 또는 이들 유전자 생성물의 비율 비교, 또는 정상 대상체와 질병으로 고통받는 대상체 사이 또는 동일한 질병의 다양한 단계들 사이에서 차이가 있는, 동일 유전자의 두 가지로 다르게 프로세스된 생성물의 비교를 포함할 수 있다. 차별적인 발현은, 예를 들어 정상 세포 및 질병에 걸린 세포 중에서 또는 상이한 질병 발병 또는 질병 단계를 수행한 세포 중에서 유전자의 일시적 또는 세포성 발현 패턴 또는 유전자의 발현 생성물에서의 정량적 차이와 정성적 차이를 둘 다 포함한다. 본 발명에 있어서, "차별적인 유전자 발현"은 정상 대상체 및 질병에 걸린 대상체에서 또는 질병에 걸린 대상체의 질병 발병의 다양한 단계들에서 주어진 유전자의 발현 사이에 약 2배 이상, 바람직하게는 약 4배 이상, 보다 바람직하게는 약 6배 이상, 가장 바람직하게는 약 10배 이상의 차이가 있는 경우에 "유의한" 것으로 고려된다.
차별적으로 발현된 유전자 "세트"는 통계적 분석을 위한 충분한 수의 유전자를 포함한다. 일반적으로, 상기 세트는 약 20개 이상, 또는 약 50개 이상, 또는 약 100개 이상, 또는 약 200개 이상, 또는 약 500개 이상, 또는 약 1000개 이상의 유전자를 포함할 것이다.
용어 "치료"는 대상 병리학적 증상 또는 장애를 예방하거나 또는 늦추는(완화시키는)데 목적이 있는 치료 처치와 예방 또는 방지 조치 둘 다를 의미한다. 치료를 요하는 것들에는 이미 장애가 있는 것들 뿐만 아니라 장애에 걸리기 쉬운 것들 또는 장애를 예방하고자 하는 것들이 포함된다. 종양(예, 암) 치료에서, 치료제는 종양 세포의 병리 상태를 직접 감소시킬 수 있거나 또는 종양 세포가 다른 치 료제에 의한 치료, 예를 들어 방사선 및(또는) 화학요법에 보다 민감해지도록 만들 수 있다.
용어 "종양"은, 본원에 사용된 바와 같이, 악성이든 양성이든지 간에 모든 종양 세포 성장 및 증식, 및 모든 암유발성 및 암성 세포 및 조직을 의미한다.
용어 "암" 및 "암성"은 전형적으로 조절되지 않은 세포 성장을 특징으로 하는, 포유동물의 생리학적 상태를 의미하거나 기술한다. 암의 예로는 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요로암, 갑상선암, 신장암, 암종, 흑색종, 두부 및 경부 암, 및 뇌암을 들 수 있지만, 이에 한정되지 않는다.
암의 "병리 상태"는 환자의 안녕을 위해하는 모든 현상을 포함한다. 이는 비정상적 또는 조절할 수 없는 세포 성장, 전이, 인접 세포의 정상 기능의 방해, 사이토카인 또는 기타 분비 생성물의 비정상적 수준의 방출, 염증 또는 면역학적 반응의 억제 또는 악화, 신생물형성, 악성유발성종양, 악성종양, 주변 또는 원위 조직 또는 기관, 예를 들어 림프절로의 침입 등을 포함하지만, 이에 한정되지 않는다.
B. 상세한 설명
달리 나타내지 않는다면 본 발명의 실시에서는 당업계의 기술 범위 내의 통상의 분자 생물학 기술 (재조합 기술 포함), 미생물학 기술, 세포 생물학 기술 및 생화학 기술이 이용될 것이다. 이들 기술은 예를 들어 문헌 ["Molecular Cloning: A Laboratory Manual", 2nd edition (Sambrook et al., 1989); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984); "Animal Cell Culture" (R. I. Freshney, ed., 1987); "Methods in Enzymology" (Academic Press, Inc.); "Handbook of Experimental Immunology", 4th edition (D. M. Weir & C. C. Blackwell, eds., Blackwell Science Inc.,1987); "Gene Transfer Vectors for Mammalian Cells" (J. M. Miller & M. P. Calos, eds., 1987); "Current Protocols in Molecular Biology" (F. M. Ausubel et al., eds., 1987); and "PCR: The Polymerase Chain Reaction", (Mullis et al., eds., 1994)]에 상세히 설명되어 있다.
본 발명은 특정 질병, 질병 상태 또는 이상증에서 차별적으로 발현되는 것으로 확인된 유전자의 조절 영역의 체계적인 비교를 기초로 한다. 특히, 본 발명은, 차별적으로 발현된 다수의 유전자들 중의 공통적인 연관관계가 몇몇 조절 인자, 예를 들어 전사 인자의 전사 프로세스에서의 변화라는 인식을 기초로 한다.
상기 언급된 바와 같이, 연구자들은 다양한 기술을 이용하여 차별적인 유전자 발현을 연구한다. 가장 빈번하게 사용되는 방법은 마이크로어레이 및 RT-PCR이지만, 다른 기술, 예를 들어 노던 블롯팅, RNase 보호 분석, 차별적인 플레이크 혼성화, 감소(subtractive) 혼성화, 유전자 발현의 직렬 분석 (SAGE, Velculescu et al., Science 270: 484-487 (1995); and Velculescu et al., Cell 88: 243-51 (1997)), 유전자 발현의 신속 분석 (RAGE; Wang et al., Nucleic Acids Research, 27: 4609-18, (1999)), 및 대규모 패러렐 시그너처 서열분석 (MPSS; Brenner et al., Nature Biotechnology 18: 630-634 (2000))도 차별적인 유전자 발현의 연구에 마찬가지로 적합하다. 차별적인 유전자 발현에 대하여 점점 더 많은 연구가 수행 되어 왔다. 도 2는 마이크로어레이 기술 기초의 모든 생의학 연구 또는 암 특이적 연구의 간행물들에 대한 개요를 제공한다.
마이크로어레이 방법에서, 대상 폴리뉴클레오티드 서열 (cDNA 및 올리고뉴클레오티드 포함)을 마이크로칩 기재상에 플레이팅하거나 또는 배열한다. 이어서, 배열된 서열은 대상 세포 또는 조직으로부터의 특이적 DNA 프로브와 혼성화된다. 마이크로어레이 기술의 특정 실시양태에서, cDNA 클론의 PCR 증폭된 삽입물을, 전형적으로 약 10,000개 이상의 뉴클레오티드 서열을 포함하는 조밀한 배열로 기재상에 적용한다. 고정된 마이크로어레이된 유전자는 엄격 조건하의 혼성화에 적합하다. 칩에 적용된 형광 표지된 cDNA 프로브는 배열 상의 DNA의 각 스팟에 대해 특이적으로 혼성화된다. 비-특이적으로 결합된 프로브를 제거하기 위한 엄격 세척 후, 공초점 레이저 현미경 또는 다른 검출 방법, 예를 들어 CCD 카메라로 칩을 스캐닝한다. 배열된 각 요소의 혼성화를 정량하여 상응하는 mRNA 풍부도(abundance)를 평가한다. 듀얼 컬러 형광을 사용함으로써, 두 가지 RNA 공급원들로부터 생성된 별도로 표지된 cDNA 프로브가 상기 배열에 쌍으로(pairwise) 혼성화된다. 따라서, 지정된 각 유전자에 상응하는 두 가지 공급원으로부터의 전사체의 상대적 풍부도를 동시에 결정함으로써 차별적인 유전자 발현 데이타를 제공한다. 제조자의 프로토콜에 따라 상업적으로 이용가능한 장치, 예를 들어 어피메트릭스 젠칩(Affymetrix GenChip) 기술, 또는 아질렌트(Agilent's) 마이크로어레이 기술을 이용함으로써 마이크로어레이 분석을 수행할 수 있다.
또한, RT-PCR을 이용하여 상이한 샘플 집단, 예를 들어 정상 조직 및 질병( 예, 종양) 조직에서 mRNA 수준을 비교함으로써 유전자 발현의 패턴을 특성화하고, 밀접하게 관련된 mRNA들을 구별하며, RNA 구조를 분석할 수 있다.
제1 단계는 표적 샘플로부터 mRNA를 단리하는 것이다. RNA는 PCR에서 템플레이트로 작용할 수 없기 때문에, RT-PCR에 의한 유전자 발현 프로필링에서의 제1 단계는 RNA 템플레이트를 cDNA로 역 전사한 다음, 역 전사된 cDNA를 PCR 반응에 의해 지수적으로 증폭시키는 것이다. 가장 통상적으로 사용되는 두 가지 역전사효소는 조류 골수아세포증바이러스 역전사효소(AMV-RT) 및 몰로니(Moloney) 쥐 백혈병 바이러스 역전사효소(MMLV-RT)이다. 역 전사 단계는 전형적으로 발현 프로필링의 상황 및 목표에 따라 특정 프라이머, 랜덤 헥사머 또는 올리고-dT 프라이머를 사용하여 개시된다. 예를 들어, 추출된 RNA는 제조자의 지침에 따라 진앰프(GeneAmp) RNA PCR 키트(Perkin Elmer, CA, USA)를 사용하여 역 전사될 수 있다. 이어서, 유도된 cDNA를 이후의 PCR 반응에서 템플레이트로서 사용할 수 있다.
RT-PCR 기술의 보다 최근의 변형법은 이중-표지된 형광생성(fluorigenic) 프로브(즉, 태크맨(TaqMan; 등록상표) 프로브)를 통해 PCR 생성물 축적량을 측정하는 실시간 정량적 PCR이다. 실시간 PCR은 정량적 경쟁 PCR (각 표적 서열에 대한 내부 경쟁자는 표준화를 위해 사용됨) 및 정량적 비교 PCR (샘플 내에 함유된 표준화 유전자 또는 RT-PCR의 경우 하우스키핑(housekeeping) 유전자를 사용함) 둘 다와 상용성이다. 추가의 세부사항에 대해서는 예를 들어 문헌 [Held et al., Genome Research 6: 986-994 (1996)]을 참조한다.
또한, 차별적인 유전자 발현은 단백질유전정보학 기술을 이용하여 단백질 수 준에서 연구할 수 있다. 프로테오메(proteome)는 특정 시점에서 샘플 (예, 조직, 유기체, 또는 세포 배양물) 중에 존재하는 총 단백질이다. 단백질유전정보학은 특히 샘플 중 단백질 발현의 전체 변화 연구(또한, "발현 단백질유전정보학"이라고도 함)를 포함한다. 단백질유전정보학은 전형적으로 다음과 같은 단계들을 포함한다: (1) 2-D 겔 전기영동 (2-DPAGE)에 의해 샘플 중의 각 단백질을 분리하는 단계; (2) 겔로부터 회수한 각 단백질을 확인하는 단계, 예를 들어 질량 분광법 및(또는) N-말단 서열분석, 및 (3) 생물정보학을 이용하여 데이타를 분석하는 단계. 단백질유전정보학 방법은 다른 유전자 발현 프로필링 방법에 대한 유용한 보충수단이며, 단독으로 또는 다른 방법과 병행하여 사용함으로써 차별적인 유전자 발현을 연구할 수 있다. 추가의 세부사항에 대해서는, 예를 들어 문헌 [Proteomics in Practice: A Laboratory Manual of Proteome Analysis, R. Westermeier et al., eds., John Wiley & Sons, 2002]을 참조한다.
전형적으로, 유전자 발현 연구에 의해 시험 샘플 내에서 정상 샘플에 비해 차별적으로 발현된 수백 내지 수천의 유전자를 확인한다. 예를 들어, 정상 생물학적 프로세스, 예를 들어 HeLa 세포 주기, 및 비정상적 생물학적 표현형, 예를 들어 로타바이러스에 감염된 조직의 연구 결과, 약 500개 이상의 유전자가 이들의 정상 대응물에 비해 유의한 변화를 나타내는 것으로 밝혀졌다. 대부분의 유전자 발현 데이타는 공개 및 상업 데이타베이스, 예를 들어 스탠포드(Stanford) 마이크로어레이 데이타베이스 (SMD), 예일(Yale) 마이크로어레이 데이타베이스, 유러피안 바이오인포매틱스 인스티튜트(European Bioinformatics Institute) IEBI의 어레이익스 프레스(ArrayExpress)에 기탁되었다. 이들 및 기타 공개적으로 이용가능한 유전자 발현 데이타베이스는 하기 표 1에 기재되어 있다.
데이타베이스 명칭 설명
어레이익스프레스 (ArrayExpress) 유러피안 바이오인포매틱스 인스티튜트에 의해 유지되는 마이크로어레이 기초의 유전자 발현 데이타 저장소
칩(Chip)DB 유전자 발현의 검색가능한 데이타베이스
익스프레스DB 효모 및 이.콜라이(E.Coli) RNA 발현 데이타를 함유하는 상관 데이타베이스
진 익스프레션 아틀라스 (Gene Expression Atlas) 조직, 기관 및 세포주의 다양한 배열에 걸친 91개의 정상 인간 및 마우스 샘플로부터의 유전자 발현 프로필에 대한 데이타베이스
진 익스프레션 데이타베이스 (GDX) 잭슨 래버러토리(Jackson laboratory)의 마우스 게놈 인포매틱스의 데이타베이스
진 익스프레션 옴니버스 (Omnibus) 유전자 발현 데이타의 공개 사용 및 보급을 지지하는 NCBI의 데이타베이스
진(Gene)X 인터넷으로 이용할 수 있는 유전자 발현 데이타 저장소를 제공하기 위해 내셔널 센터 포 게놈 리소스(National Center for Genome Resource)에서 모방한 것
휴먼 진 익스프레션 인덱스 (HuGE Index) 정상 인간 조직에서의 인간 유전자 발현을 이해하기 위해 포괄적인 데이타베이스를 제공하는 것을 목적으로 함
M-CHiPS(Multi-Conditional Hybridization Intensity Processing System) 데이타 창고 개념. 실험 주해를 포함하여 마이크로어레이 데이타베이스의 전체 성분들의 통계적 분석에 적합한 구조를 제공하는데 중점을 둠
READ(RIKEN cDNA Expression Array Database) 일본 소재의 RIKEN(The institute of Physical and Chemical Research)에 의해 유지되는 데이타베이스
RNA 어번던스(Abundance) 데이타베이스(RAD) RNA 어번던스 데이타베이스(RAD)는 배열-기초 및 비-배열-기초(SAGE) 실험으로부터의 데이타를 유지하기 위해 설계된 공개 유전자 발현 데이타베이스임. 궁극적인 목표는 상이한 플랫폼을 사용하며 상이한 생물계를 조사하는 여러 실험실에 의해 수행된 실험을 비교 분석하는 것임
사카로마이세스(Saccharomyces) 게놈 데이타베이스(SGD): 익스프레션 커넥션 스탠포드 대학교에 있는 사카로마이세스 게놈의 유전자 발현 데이타베이스; 주어진 유전자 또는 ORF의 유전자 발현 데이타에 대한 여러 마이크로어레이 연구의 결과에 대한 동시적인 연구를 제공함
데이타베이스 명칭 설명
스탠포드 마이크로어레이 데이타베이스(SMD) 마이크로어레이 실험으로부터의 원료 데이타 및 표준화된 데이타, 및 이들의 상응하는 이미지 파일을 저장함. 또한, SMD는 데이타 검색, 분석 및 시각화를 위한 인터페이스를 제공함. 데이타는 연구자의 재량하에 또는 간행시 공개 유포됨
예일(Yale) 마이크로어레이 데이타베이스
이스트(Yeast) 마이크로어레이 글로벌 뷰어(Global Viewer) 효모 유전자 발현 데이타에 대한 데이타베이스((Laboratoire de genetique moleculaire, Ecole Normale Superieure)에 의해 유지됨)
3D-진 익스프레션 데이타베이스 발생의 유전자 발현의 3D-시각화 데이타베이스에 대한 예비 구조
BODYMAP 3'-방향 cDNA 라이브러리 내의 클론의 랜덤 서열분석에 의해 생성된, 인간 및 마우스 유전자의 유전자 발현 정보의 데이타뱅크
진 리소스 로케이터 (Resource Locator) 목표는 유전자의 엑손-인트론 구조, 예비-mRNA의 다른 스플라이싱, 전장의 풍부한 cDNA 서열의 프로모터 영역, 및 EST와 관련된 유전자 발현 패턴의 연구를 위해 수백만의 EST를 인간 게놈에 맵핑함
RNA 어번던스 데이타베이스 (RAD) 배열-기초 및 비-배열-기초(SAGE) 실험으로부터의 데이타를 보유하도록 설계된 공개 유전자 발현 데이타베이스. 궁극적인 목표는 상이한 플랫폼을 사용하며 상이한 생물계를 조사하는 여러 실험실에 의해 수행된 실험을 비교 분석하는 것임
티슈인포(TissueInfo) 주어진 서열을 EST 데이타베이스에 대해 비교함으로써 서열의 조직 발현 프로필을 결정하는 온라인 데이타베이스. 각각의 EST는 특정 조직 유형으로부터 유도된 라이브러리에서 유래함
이 분야의 폭넓은 연구 및 축적된 큰 분량의 데이타에도 불구하고, 유전자 발현의 복잡성 측면에서, 차별적인 유전자 발현 데이타를 해석하는 것은 어려운 일이다.
차별적으로 발현된 수많은 유전자들의 각각이 돌연변이 또는 몇가지 다른 결함을 가질 가능성은 거의 없는 것으로 받아들여져 왔다. 이와는 달리, 차별적으로 발현된 다수의 유전자는 많은 유전자의 발현 수준에 동시에 영향을 줄 수 있는 몇가지 중요한 현상 또는 메카니즘이 변화된 결과일 수 있다. 본 발명은, 각종 질병, 질병 상태 또는 기타 이상증에서 차별적으로 발현된 다수의 유전자가 몇몇 조절 인자, 예를 들어 전사 인자(TF)의 변화로부터 발생한다는 인식을 기초로 한다.
전사 인자(TF)는 DNA에 의해 코딩되는 유전 정보를 mRNA로 전사하는 과정을 조절 및 개시하는 단백질 부류이다. 현재 알려져 있는 모든 TF는 이들의 기능적 도메인의 이름에 따라 명명된 다섯 가지 상이한 하위군, 즉 베이직(Basic) 도메인, 아연-배위결합 DNA 결합 도메인, 헬릭스-턴-헬릭스 도메인, 마이너 그루브 콘택츠( Minor Groove Contacts)를 갖는 베타-스캐폴드(Scaffold) 인자, 및 기타 전사 인자들로 분류된다. 일반적으로, 유전자의 조절 영역과 결합하여, 그 결과로 mRNA 전사 기구를 조절 및 초기화하는 전사 복합체를 형성하기 위해서는 적어도 몇가지 전사 인자들이 필요하다. 이러한 결합 과정은 TF 단백질의 DNA 결합 도메인에 의해 매개된다. 몇몇 전사 인자들만이 DNA와 직접 결합 할 수 있으며 다른 전사 인자들은 표적 유전자의 조절 영역에 직접 결합할 필요 없는 기능성 전사 기구를 형성하는데 필요한 것으로 알려져 있다.
현재, 4000개가 넘는 공지된 TF가 존재하며, 이들 중 약 2000개는 포유동물 종으로부터 유래한다. 예시적인 TF로는 c-Fos, c-Jun, AP-1, ATF, c-Ets-1, c-Rel, CRF, CTF, GATA-1, POU1F1, NF-κB, POU2F1, POU2F2, p53, Pax-3, Sp1, TCF, TAR, TFEB, TCF-1, TFIIF, E2F-1, E2F-2, E2F-3, E2F-4, HIF-1, HIF-1α, HOXA1, HOXA5, Sp3, Sp4, TCF-4, APC 및 STATSA를 들 수 있지만, 이에 한정되지 않는다.
포유동물 TF 중에서, 수백 가지만이 표적 유전자의 조절 영역(시스-조절 결합 부위)에 직접 결합하는 능력을 갖는 것으로 밝혀졌으며, 최근까지 몇백 가지 TF 결합 부위만이 특성화되었다. 유전자의 TF 결합 부위는 유전자의 조절 영역내에 위치하는 DNA 서열의 짧은 스트레치이다. 이들 부위는 상이한 DNA 결합 TF에 대해 특이적이며, 일반적으로 염기 약 6개 내지 약 16개의 길이이다. 주어진 결합 부위 내에는 상응하는 TF에 의한 결합에 절대적으로 필요한 특정 위치에 염기가 존재하지만 다른 염기들은 어떤 염기-변경 변화를 허용할 수 있는 것으로 알려져 있다. 추가의 세부사항에 대하여는, 예를 들어 문헌 [Davidson, E. H., Genome Regulator Systems: development and evolution, ISBN 0-12-205351-6, Academic Press, 2001] 및 예를 들어 문헌 [Michael Carey, Stephen T. Smale, Transcriptional Regulation in Eukaryotes, ISBN 0-87969-537-4, Cold Spring Harbor Laboratory Press, 2000]을 참조한다.
하기 표 2에는 여러 전사 인자 관련 데이타베이스가 기재되어 있다.
데이타베이스 TF 부위 주소
TRANSFAC 인자 부위 http://transfac.gbf.de/TRANSFAC/index.html
TRRD 인자 부위 http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd
TFD 인자 부위 http://kisec.cmb.ki.se/kisac/databases/tfd.html
COMPEL 컴퍼지터리 부위 http://compel.bbionet.nsc.ru/
EPD N/A 프로모터 http://www.epd.isb-sib.ch/
IMD 인자 부위 http://bimas.dcrt.nih.giv/molbio/matrixs/
상기 기재된 데이타베이스 중에서, TRANSFAC는 TF 결합 부위의 수 측면에서 가장 많이 수집하며, 자주 업데이트 및 인용된다 [Heinemeyer et al., 1998, Heinemeyer et al., 1999, Karas et al., 1997, Knuppel et al., 1994, Matys et al., 2003, Wingender et al., 1996, Wingender et al., 1997, Wingender et al., 1997, Wingender et al., 2000., Wingender et al., 2001]. 단백질-경로 평가에 있어서 TF 결합 부위의 사용은 최근에 보고되었다 [Krull et al, 2003].
가장 넓은 의미에서, 본 발명은 공통의 조절 메카니즘을 확인하기 위해 다수의 유전자의 조절 영역 및(또는) 이러한 유전자에 의해 공유되는 컨센서스 조절 인자 결합 부위를 비교 분석하는 방법을 최초로 제공한다. 따라서, 본 발명은 이러한 유전자들 사이에서 지금까지 발견되지 않은 관계에 대한 새로운 통찰력을 제공하며, 현재 이용가능하거나 또는 향후 생성될 다량의 유전자 발현 데이타로부터 중요한 조절 인자를 확인할 수 있다.
본 발명의 기초를 이루는 사상은, 각종 질병, 질병 상태 또는 이상증에서 확인된 차별적으로 발현된 유전자의 대부분에 의해 공유되는 특정 컨센서스 조절 인자 결합 부위, 예를 들어 TF 결합 부위를 확인할 수 있다는 것이다. 특정 조절 인자, 예를 들어 TF 결합 부위가 조직-전체 또는 게놈-전체에 비해 상기 차별적으로 발현된 유전자들 중에서 풍부한 것으로 밝혀진 경우, 확인된 결합 부위는 차별적인 발현을 나타내는데 중요한 역할을 할 가능성이 매우 높으며, 즉 질병 또는 이상증, 예를 들어 암 또는 종양에서 나타나는 최종 세포-사멸 변화의 원인이 될 수 있다.
한가지 특정 측면에서, 본 발명은 차별적으로 발현된 유전자 내에 풍부한 컨센서스 조절 영역을 확인하기 위해 상기 유전자의 조절 영역을 비교 분석하는 새로운 방법을 제공하며, 이 방법을 이용하여 유전자 발현을 조절하는 역할을 하는 하나 이상의 조절 인자를 확인할 수 있다.
다른 측면에서, 본 발명은 유전자 조절 영역의 체계적인 비교에 의해 질병, 질병 상태 또는 이상증에서 차별적으로 발현되는 다수의 유전자들 사이의 연관관계를 제공하는, 조절 인자, 예를 들어 전사 인자(TF)를 확인하는 방법을 제공한다.
질병 프로세스와 관련된 필수적인 조절 메카니즘에 관여한 결과로서, 공유된 조절 인자 결합 부위 및 상응하는 조절 인자가 치료제-개발 표적으로 유용하다. 예를 들어, 확인된 TF를 변화시켜, 예컨대 안티센스 올리고뉴클레오티드 방법 (TF의 mRNA와 결합하여 상응하는 단백질 발현을 변화시킴)에 의해 또는 이러한 TF의 전사 효과를 변화시켜, 예를 들어 전사 데코이 방법 (상응하는 TF와 경쟁적으로 결합함)을 이용하여, 다양한 질병, 장애 및 이상증을 치료(예방 포함)하거나 또는 해롭거나 바람직하지 않은 특정 생물학적 프로세스, 예를 들어 노화를 방해하기 위해 새로운 방법을 개발할 수 있다. 보다 일반적인 의미에서, 본 발명은 일반적으로 생의학 학문 및 연구 노력을 위한 유용한 수단을 제공하며, 상기 프로세스를 이해하는데 있어서 독특한 수단을 제공한다. 일반적으로, 본 발명에 의해 제공된 정보는 생의학 연구, 임상전 개발, 약물 스크리닝 어플리케이션, 표적 발견 및 표적 확인, 상이한 유전자의 조절 프로필들 사이의 게놈-전체 또는 조직-전체의 관계 수립, 공지된 다양한 조절 인자의 게놈 배경 또는 조직 배경의 이해, 및 공지된 다양한 전사 인자의 게놈 배경 또는 조직 배경의 이해 등을 포함하지만 이에 한정되지 않는 다양한 여러 목적 및 용도에 이용될 수 있다.
따라서, 본 발명은 차별적으로 발현된 유전자의 조절 인자(예, TF) 결합 부위의 통계적 분석 방법에 관한 것이다. 특정 측면에서, 본 발명은 질병, 장애 또는 특정 생물학적 프로세스를 나타내는 생물학적 샘플에서 발견된 다수의 유전자의 차별적인 발현의 원인이 되는 조절, 예를 들어 전사 인자를 확인함으로써 새로운 치료 표적을 제공한다.
특정 실시양태에서, 본 발명의 방법은 다음과 같은 단계들을 포함한다: (1) 유의한 차별적 발현을 나타내는 유전자의 목록을 생성하는 단계; (2) 차별적으로 발현된 유전자 내의 시스-조절 영역의 확인 단계; (3) 전사 인자 결합 부위를 확인된 시스-조절 영역 상에 맵핑하는 단계; 및 (4) 확인된 TF 결합 프로필을 통계적으로 분석하는 단계.
(1) 유의한 차별적 발현을 나타내는 유전자 목록의 생성:
유전자 발현 데이타는 다양한 유전자 발현 관련 데이타베이스로부터 검색할 수 있다. 이들 데이타베이스는 마이크로어레이 기술에 의해 생성된 것들로 한정되지 않는다. 또한, 상기 데이타베이스는 실시간 정량적 PCR, 노던 블롯 혼성화, 및 단백질유전정보학을 비롯한 기타 유전자 발현 관련 방법에 의해 얻어진 유전자 발현 데이타를 포함할 수 있다. 유전자 발현 데이타의 데이타베이스의 예는 상기 표 1에 기재되어 있다. 이미 이용가능한 이러한 데이타 세트 이외에, 차별적으로 발현된 유전자 목록은 상기 논의되거나 또는 당업계에 공지된 임의의 기술을 이용하는 임의의 과제-지향의 특이적 실험에 의해 생성시킬 수 있다. 본 발명에 따라, 상기 데이타베이스 또는 임의의 다른 공급원으로부터 검색된 데이타가 다수의 유전자 또는 유전자 세트를 포함하는 경우, 상기 데이타를 철저히 분석한다 (예, SAM 분석). 유의한 차별적 발현을 나타내는 유전자 목록을 생성시키고, 자체 생성된 스크립트를 사용하는 국제 명명법 위원회(The international nomenclature committee) 및 다른 게놈 데이타베이스를 기초로 하여 각각의 유전자 식별자를 정한다. 상기 언급된 바와 같이, 차별적인 유전자 발현은 시험 및 기준 샘플, 예를 들어 정상 대상체 및 질병에 걸린 대상체 또는 질병에 걸린 대상체의 질병 발병의 다양한 단계에서 주어진 유전자의 발현 사이에 약 2배 이상, 바람직하게는 약 4배 이상, 보다 바람직하게는 약 6배 이상, 가장 바람직하게는 약 10배 이상의 차이가 존재하는 경우에 "유의한" 것으로 고려된다.
(2) 차별적으로 발현된 유전자의 시스-조절 영역의 확인.
상기 (1)에서 생성된 유전자 목록을 기초로, 상기 유전자의 전장 서열을 다양한 전장 유전자 데이타베이스 (예, NCBI 기초의 refSeq, NIH 기초의 MGC 컨소시엄, Japan DBTSS 등)로부터 검색하였다 [Pruitt et al., 2001, Strausberg et al., 1999, Strausberg RL et al., 2002, Yamashita et al., 2001]. 이어서, 상기 전장 서열을 가장 최근 업데이트된 인간 게놈 서열 데이타베이스 [Lander et al., 2001, McPherson et al., 2001](예, 2002년 11월 31일 수립된 인간 게놈 워킹 드래프트(Human Genome Working Draft))와 비교하고, 예를 들어 BLAT 소프트웨어 (Kent, 2002)를 사용하여 상기 서열의 염색체 위치를 맵핑하였다. 구체적인 목적에 따라, 시스-조절 영역, 예를 들어 5' 상류 코어 프로모터 영역, 5' 상류 인핸서 영역, 인트론 영역, 및(또는) 3' 조절 영역을 정의하고, 상응하는 게놈 서열을 가장 최근 업데이트된 게놈 서열 데이타베이스 (UCSC 게놈 브라우저)로부터 검색하였다 [Kent et al., 2002, Karolchik et al., 2003]. 필요하다면, 자체-개발된 스크립트를 사용함으로써 서열 검색 프로세스를 용이하게 할 수 있다.
(3) 조절 인자 결합-프로필을 확인된 시스-조절 영역 상에 맵핑함.
확인된 조절 영역에 대한 게놈 서열을 임의의 추정의 조절 인자 결합 부위, 예를 들어 TF 결합 부위에 대하여 스크리닝한다. 예를 들어, 공지된 전사 인자 결합 부위를 이용하여 차별적으로 발현된 유전자의 코어 프로모터 영역을 분석할 수 있다. 이러한 종류의 분석에 이용가능한 소프트웨어는 예를 들어 다음과 같은 간행물들에 개시되어 있다 [Grabe, 2002, Kel-Margoulis et al., 2000, Kel et al., 1995, Liebich et al., 2002, Perier et al., 2000, Praz et al., 2002, Prestridge, 1996, Quandt et al., 1995, Tsunoda et al., 1999, and Wingender, 1994]. 다양한 모티프-발견 소프트웨어를 사용하여 상기 조절 영역의 게놈 서열을 추정의 시스-조절 결합 부위에 대하여 추가로 스크리닝할 수 있다. 이는 공지되지 않은 전사 인자 결합 부위 및 공지되지 않은 조절 인자 컨센서스 모티프를 맵핑하는데 도움이 될 수 있다.
(4) 조절 인자 결합 프로필의 통계적 분석.
차별적으로 발현된 유전자에서 확인된 추정의 조절 인자 결합 부위를 게놈-전체 또는 조직-전체에서의 상기 부위의 존재와 비교한다. 통계적 분석을 이용하여, 상기 결합 부위의 수, 상기 결합 프로필의 빈도, 및 상기 결합 부위의 존재 분포 및 빈도를 계산한다. 예를 들어, 초기하학적 분포 모델을 이용하여 통계적 분석을 수행할 수 있으며, 이로써 대체 없이 한정된 집단으로부터 얻은 고정된 크기의 샘플에서 총 성공(success) 수를 결정한다. 특히, 초기하학적 분포 분석 (자체-개발된 스크립트와 함께 마이크로소프트 엑셀(by using Microsoft Excel) 빌딩 함수를 사용함)을 이용하여, 특정 조절 인자(예, TF) 결합 부위가 차별적인 발현 유전자 목록에 상당히 풍부하게 존재하는지를 시험할 수 있다. 이러한 풍부화도는 게놈 또는 조직 배경과 비교하는 경우에 이상증, 예를 들어 종양, 예컨대 암을 일으킬 수 있다. 필요하다면, 상기 통계적 분석을 기초로 하여 조절 인자, 예를 들어 TF를 확인할 수 있으며 그의 서열을 제공할 수 있다. 이러한 조절 인자, 예를 들어 TF는 질병, 장애 또는 원치않는 생물학적 프로세스의 예방 또는 치료에 관한 치료적 개입을 위한 표적으로 유용하다.
조절 영역이 임의의 두 유전자 세트에서 확인된 유전자 내에 존재하는 빈도 또는 확률의 비교에 적합하다면 다른 통계적 방법을 이용할 수도 있다는 것은 당업자에게 자명할 것이다.
특정 실시양태에서, 차별적으로 발현된 유전자의 시스-조절 영역, 예를 들어 조절 인자 결합 부위는 2003년 3월 28일 출원되어 동시 계류중인 미국 특허 출원 제10/402,689호에 개시된 방법에 의해 확인된다. 요컨대, 이 방법에 따라, 유전자 조절 영역의 게놈 서열을 공개 및(또는) 독점 데이타베이스로부터 검색하고, 검색된 각 유전자 조절 영역에 대한 DNA 서열 정보를 스크리닝하여 추정의 조절 인자 결합 부위를 확인하고, 추정의 조절 인자 결합 부위를 프로필링하고, 확률 맵핑을 상기 프로필링된 결합 부위에 적용한다. 확률 맵핑은 유전자 세트, 예를 들어 특정 질병, 질병 상태 및 이상증 등에서의 차별적으로 발현된 유전자 세트의 모든 유전자의 조절 영역에서 특정한 조절 인자 결합 부위, 예를 들어 추정의 모든 E2F-1 전사 인자 결합 부위를 확인하는 것을 포함한다. 확률 맵핑은 차별적으로 발현된 다수의 유전자가 특정한 조절 인자에 의해 어떻게 전사-조절될 수 있는지를 보여준다. 또한, 확률 맵핑은 특정한 조절 인자가 얼마나 많은 게놈-전체, 세포-전체 또는 조직-전체 효과를 가질 것으로 예상되는지를 나타낸다.
확인된 각 결합 부위에 대해, 보존 스코어를 생성시킬 수 있다. 보존 스코어는 조절 인자 (예, TF) 결합 부위가 확인되는 영역 뿐만 아니라 마우스 및 인간을 포함하지만 이에 한정되지 않는 두 종 사이의 보존 수준을 나타내는 임의의 다른 측정치를 포함하기 위해 선택된다. 더 높은 보존 스코어를 갖는 결합 부위 또는 더 높은 발현 수준을 갖는 상응하는 유전자는 낮은 점수를 갖는 것들보다 더 중요한 역할을 수행할 수 있다.
생성된 데이타를 데이타 뱅크로 수집 및 조직화할 수 있으며, 이로써 연구 및 약물 개발 노력에서 정보를 용이하게 사용할 수 있다.
그러나, 반드시 이러한 비공개 방법을 이용하여 본 발명을 실시할 필요는 없음을 강조하고자 한다. 유전자 조절 영역의 맵핑 정보를 포함하는 데이타베이스는 다수의 상이한 방법으로 개발할 수 있다. 따라서, 본 발명은 차별적으로 발현된 유전자의 조절 인자 결합 부위를 맵핑 및 분석하는 방법으로 제한되지 않는다.
본 발명에 따라 확인될 수 있는 조절 인자 결합 부위의 예로는 전사 인자 NF-κB에 대한 결합 부위 (AGGGGACTTTCCCA; 서열 1) 및 E2F-1에 대한 결합 부위 (TTTGGCGG; 서열 2)를 들 수 있지만, 이에 한정되지 않는다.
초기 정보가 차별적인 단백질 발현 수준을 나타내는 단백질유전정보 프로필 (예, 질량 스펙트럼)이라면, 상응하는 유전자를 위치결정 및 확인하고, 유전자 목록 및 이들 유전자의 상응하는 단백질 발현 수준을 이후의 분석에서 사용한다.
C. 치료제 확인 및 전사 인자 데코이 설계
한가지 구체적인 적용에서, 본 발명에 따라 수행된 조절 결합 부위의 통계적 분석은 치료 약물 설계를 위해 표적을 확인하고, 올리고뉴클레오티드 데코이의 설계를 포함하지만 이에 한정되지 않는, 확인된 표적에 대한 다양한 치료 방법을 개발하기 위한 용이한 방법을 제공한다.
인간 질병을 비롯한 모든 질병이 어떤 식으로든지 유전자 전사 프로세스와 관련될 가능성은 충분하다. 전사 인자를 코딩하는 유전자에서의 배선(germline) 돌연변이가 여러 신체 구조의 발달에 영향을 주는 기형 증후군을 일으킨다는 것은 잘 알려져 있다. 전사 인자를 코딩하는 유전자에서의 체세포 돌연변이는 종양발생에 기여하는 것으로 밝혀졌다. 또한, 출생전 발달 및 출생후 생리학은 단일 전사 인자가 발달 동안 기원(progenitor) 세포의 증식, 및 특정 생리학적 반응에 관여하는 유전자 생성물의 분화된 세포내 발현을 조절할 수 있음을 입증한다. 예로서, 충분히 연구된 전사 인자, 예를 들어 p53, 및 Smad 및 STAT 단백질은 다수의 암에서 중요한 역할을 수행하는 것으로 알려져 있다. 또한, 전사 인자는 다양한 신경, 심혈관, 신장 및 감염성 질병, 골 발생의 질병, 소화기 질병, 및 비정상적 골격 발달과 관련된 질병 등에 관여하는 것으로 확인되었다. 추가의 세부사항에 대하여는, 예를 들어 문헌 [Gregg L. Semenza, Transcription Factors and Human Disease, Oxford Press 1998]을 참조한다.
전사 인자 단백질-DNA 상호작용은 서열-특이적이지만, 주어진 하나의 전사 인자에 대한 결합 부위는 상이한 표적 유전자 내에서 여러 염기쌍이 다를 수 있다. 특정 전사 인자에 대한 결합 서열의 공통 부분 또는 비-변화 부분을 전사 인자 컨센서스 서열이라 지칭한다. 예를 들어, 전사 인자 NF-κB에 대한 컨센서스 서열은 AGGGGACTTTCCCA (서열 1)이며, E2F-1에 대한 컨센서스 서열은 TTTGGCGG (서열 2)이다. AP-1 전사 인자는 TGACTCA (서열 3) 컨센서스 서열과 결합한다. 유전자 발현에서 TGF-β, 액티빈 및 BMP-유도된 변화를 매개하는 Smad-3 전사 인자에 대한 컨센서스 서열은 TGTCTGTCT (서열 4)이다.
이러한 컨센서스 서열들 중 어떤 것이 질병, 장애 또는 병리학적 증상을 나타내는 생물학적 샘플 내에 풍부하다면, 상응하는 전사 인자는 이러한 질병, 장애 또는 증상에 대한 새로운 치료 방법의 유망한 표적이 된다.
전사 인자 데코이 방법에 따라, 표적 전사 인자와 특이적으로 결합하는 세포 내에 작은 이중-가닥 올리고뉴클레오티드를 도입함으로써 상기 인자가 그의 표적 유전자를 트랜스활성화하는(즉, "켜는(turning on)") 것을 방지한다.
임상전 연구에서, E2F 데코이의 압력 매개 생체외 전달은 정맥 이식편 이식의 동물 모델의 정맥 이식편에서 신생혈관내막 과다형성증 및 아테롬성경화증 둘 다를 방지하는 것으로 나타났다. 추가의 정보에 대하여는, 예를 들어 문헌 [Ehsan, A. , M. J. Mann 2001; Mann and Dzau 2000; Mann et al. 1999] 및 미국 특허 제5,766,901호 및 동 제5,992,687호를 참조한다.
본 발명의 추가의 세부사항은 하기 비-제한적 실시예에 의해 예시된다.
실시예 1
본 발명의 방법을 세포 주기 관련 유전자 발현 데이타 세트 [Whitfield et al., 2002]에 적용하였다. 세포 분열 주기의 적절한 조절은 모든 유기체의 성장 및 발달에 결정적이며; 이러한 조절을 이해하는 것은 많은 질병, 가장 주목할만한 것으로는 암의 연구에서 중심이 된다.
인간 암 세포주 (HeLa)에서 세포 분열 주기 동안 유전자 발현의 게놈-전체 프로그램은 cDNA 마이크로어레이를 이용하는 것을 특징으로 하였다. 850개 초과의 유전자의 전사체들이 세포 주기 동안 주기적인 변화를 나타냈다. 발현 패턴의 계급 클러스터링(Hierarchical clustering)에 의해, 특성화되지 않은 기능의 유전자와 함께 DNA 복제, 염색체 분리 및 세포 부착과 같은 필수적인 세포 주기 프로세스에 관여하는 기존의 잘 특성화된 유전자들의 동시발현된 군들을 밝혀냈다. 발현이 종양의 증식성 상태와 상관관계가 있는 것으로 기존에 보고된 유전자의 대부분은 HeLa 세포 주기 동안 주기적으로 발현되는 것으로 밝혀졌다. 이 보고서의 데이타는 본 발명의 방법의 기점 역할을 할 수 있는 세포 주기 조절 유전자의 포괄적인 카탈로그를 제공한다. 추가의 분석을 위해 완전한 데이타 세트를 인터넷 사이트(http://genome-www.stanford.edu/Human-CellCycle/HeLa)에서 검색하였다.
세포 주기에서 상기 차별적으로 발현된 유전자에 관여하는 주요 요소들을 확인하기 위해, UCSC 게놈 브라우저 [Karolchik et al., 2003, Kent et al., 2002], MGC 유전자 수집 데이타베이스 및 DBTSS 데이타베이스의 조합을 이용하여 상기 유전자들의 전장 서열을 검색하였다. BLAT 프로그램을 사용하여 전사 개시 부위 위치들을 가장 최근의 인간 게놈 워킹 드래프트 [McPherson et al, 2001, Lander et al.,2001]에 맵핑하였다. 모든 유전자에 대한 자체-생성된 펄 스크립트를 사용하여 코어 프로모터 영역 (각각 전사 개시 부위에 대해 약 250 bp 상류 및 50 bp 하류)에 대한 서열을 검색하였다. 자체-생성된 펄 스크립트와 함께, 라이센스체결된 TRANSFAC 데이타베이스 내부에 삽입된 매치(Match) 프로그램 [Matys et al., 2003]을 사용하여 추정의 TF 결합 프로필 분석을 수행하였다.
포유동물 종들로부터만 확인된 잘 연구된 공지의 전사 인자를 사용하여 초기 스크리닝을 수행하였다. 전형적인 세포 주기는 G1, G2, M 및 S 단계로 구성된다. 이들 중에서, G2 및 M 단계는 G1 단계 및 S 단계에 비해 매우 짧으며, 이는 G1 및 S의 세포 단계를 정의하기가 보다 용이하다는 것을 시사한다. 따라서, 이 분석은 G1 및 S 단계에서 발견된 차별적으로 발현된 유전자 (총 198개)에 초점을 둔다. 상기 분석으로부터 확인된 공지된 TF 결합 부위의 빈도를 게놈 배경에서 상기 부위의 상응하는 빈도에 대해 스캐터-플롯화(scatter-plotted)하였다. 결과는 도 1에 나타나 있다. 플롯팅은, 확인된 TF 결합 부위가 표적 유전자 목록 내에 정상적으로 분포하는 경우, 상응하는 스팟이 레드 라인(red line)(이는 확인된 TF 결합 빈도가 상응하는 게놈 빈도와 동일한 경우의 이론값임) 주변에 위치해야함을 시사한다. 그러나, 특정 TF-결합이 또한 차별적으로 발현된 유전자에 풍부하게 존재한다면, 상응하는 스팟은 이론적인 레드 라인으로부터 벗어나 표적화된 유전자 목록 내 TF-결합의 빈도를 나타내는 x-축을 향해 이동할 것이다. 도 1에 나타낸 바와 같이, 표적 유전자 목록에서 가장 많이 이동된 3개의 스팟은 더 많이 발생하며(더 높은 빈도, 0.4 초과), 전사 인자 E2F-1, E2F-1/DP-1 및 E2F에 속한다.
상기 결과를 추가의 통계 분석으로 처리하였다. 표적 유전자 목록에서 확인된 가장 높은 빈도를 갖는 14개의 TF는 초기하학적 분포 시험에서의 이들의 P 값 (우측 미부 누적)과 함께 하기 표 3에 기재되어 있다 (표 참조). 표 3에 기재된 데이타 세트는 E2F-1, Elk-1, E2F 및 E2F-1/DP-1이 최소의 P 값을 갖는 가장 유의한 것임을 시사한다. E2F-1과 유사하게, 전사 인자 Elk-1은 또한 널리 연구되었으며, 세포 주기 및 증식에서 중요한 역할을 나타내었다.
Figure 112005054062310-PCT00001
결론적으로, 주요 전사 인자 E2F-1 및 Elk-1은 특정 세포 주기 프로세스 동안 발견된 차별적인 발현을 나타내는 850개의 유전자들에 영향을 주는 필수적인 역할을 할 수 있는 인자로서 확인되었다. 세포 주기는 많은 상이한 종류의 종양 또는 암 발생에서 결정적인 것으로 나타났다. 이들로부터의 즉시적인 이점은 상기 주요 요소들을 기초로 치료 전략을 개발할 수 있다는 점이다. 전사 인자 데코이 (예, E2F-1 데코이의 경우, 코르젠테크, 인크.(Corgentech Inc.)) 또는 안티-센스 올리고뉴클레오티드는 이러한 새로운 치료 선택에 대한 예이다. 세포 증식에서 E2F-1 및 Elk-1의 역할은 수많은 실험과 수년에 걸친 연구 후에 점차적으로 개발되었다. 그러나, 본 발명은 이러한 시간-소모적인 과정을 쉽고 빠르게 만들었다.
개시에 의해 인용된 모든 문헌들 및 이들 문헌에 인용된 모든 문헌들은 그 전체내용이 명시적으로 본원에 참고로 포함된다.
당업자라면 본원에 기재된 것들과 유사하거나 등가인 다수의 방법 및 재료들이 본 발명의 실시에 사용될 수 있음을 알 것이다. 또한, 본 발명은 어떠한 식으로든지 상기 기재된 방법 및 재료들로 한정되지 않는다.
<참고문헌>
Figure 112005054062310-PCT00002
Figure 112005054062310-PCT00003
Figure 112005054062310-PCT00004
Figure 112005054062310-PCT00005
SEQUENCE LISTING <110> CORGENTECH, INC. Zhang, Jie Wei, Hsiu-Ying McEvoy, Leslie M. <120> Statistical Analysis Of Regulatory Factor Binding Sites Of Differentially Expressed Genes <130> 39753-0002 PCT <140> Unassigned <141> Herewith <150> US 10/401,830 <151> 2003-03-28 <160> 4 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 14 <212> DNA <213> Homo Sapiens <400> 1 aggggacttt ccca 14 <210> 2 <211> 8 <212> DNA <213> Homo Sapiens <400> 2 tttggcgg 8 <210> 3 <211> 7 <212> DNA <213> Homo Sapiens <400> 3 tgactca 7 <210> 4 <211> 9 <212> DNA <213> Homo Sapiens <400> 4 tgtctgtct 9

Claims (34)

  1. (a) 차별적으로 발현된 유전자 세트를 얻는 단계;
    (b) 조절 인자 결합 부위의 존재에 대하여 상기 차별적으로 발현된 유전자의 조절 영역을 포함하는 게놈 서열을 스크리닝하는 단계; 및
    (c) 게놈-전체 또는 조직-전체 배경에 비해 상기 차별적으로 발현된 유전자 세트 내에 풍부한 하나 이상의 조절 인자 결합 부위를 확인하는 단계
    를 포함하는, 차별적으로 발현된 유전자의 통계적 분석 방법.
  2. 제1항에 있어서, 단계 (c)에서 확인된 조절 결합 부위 또는 결합 부위가 상기 유전자 세트 내에 존재하는 빈도 또는 확률과 상기 조절 결합 부위 또는 결합 부위가 게놈-전체 또는 조직-전체 배경에 존재하는 빈도 또는 확률을 비교함으로써 단계 (c)에서 풍부화도(enrichment)를 결정하는 방법.
  3. 제1항에 있어서, 상기 차별적으로 발현된 유전자 세트를 얻기 전에 차별적으로 발현된 단백질 세트의 단백질유전정보 프로필을 얻는 방법.
  4. 제1항에 있어서, 상기 차별적으로 발현된 유전자 세트가 질병, 장애, 또는 생물학적 프로세스의 특징적인 유전자 발현 프로필의 일부인 방법.
  5. 제4항에 있어서, 상기 질병이 종양, 종양성 질병, 신경성 질병, 심혈관성 질병, 신장 질병, 감염성 질병, 소화기 질병, 대사성 질병, 염증성 질병, 자가면역 질병, 피부과 질병, 및 외상 또는 비정상적 골격 발달과 관련된 질병으로 이루어진 군으로부터 선택되는 것인 방법.
  6. 제5항에 있어서, 상기 종양이 암인 방법.
  7. 제6항에 있어서, 상기 암이 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요로암, 갑상선암, 신장암, 암종, 흑색종 및 뇌암으로 이루어진 군으로부터 선택되는 것인 방법.
  8. 제4항에 있어서, 상기 장애가 발달 장애인 방법.
  9. 제4항에 있어서, 상기 생물학적 프로세스가 노화와 관련된 것인 방법.
  10. 제1항에 있어서, 상기 세트가 대조군에 비해 약 2배 이상의 차별적인 발현을 나타내는 유전자들로 이루어진 것인 방법.
  11. 제1항에 있어서, 상기 세트가 대조군에 비해 약 4배 이상의 차별적인 발현을 나타내는 유전자들로 이루어진 것인 방법.
  12. 제1항에 있어서, 상기 세트가 대조군에 비해 약 10배 이상의 차별적인 발현을 나타내는 유전자들로 이루어진 것인 방법.
  13. 제1항에 있어서, 상기 조절 인자 결합 부위가 5' 상류 코어 프로모터 영역, 5' 상류 인핸서 영역, 인트론 영역 및 3' 조절 영역으로 이루어진 군으로부터 선택된 영역 내에서 확인되는 것인 방법.
  14. 제13항에 있어서, 상기 조절 인자 결합 부위가 전사 인자 결합 부위인 방법.
  15. 제14항에 있어서, 상기 전사 인자가 c-Fos, c-Jun, AP-1, Elk, ATF, c-Ets-1, c-Rel, CRF, CTF, GATA-1, POU1F1, NF-κB, POU2F1, POU2F2, p53, Pax-3, Sp1, TCF, TAR, TFEB, TCF-1, TFIIF, E2F-1, E2F-2, E2F-3, E2F-4, HIF-1, HIF-1α, HOXA1, HOXA5, Sp3, Sp4, TCF-4, APC 및 STAT5A로 이루어진 군으로부터 선택되는 것인 방법.
  16. 제15항에 있어서, 상기 전사 인자가 E2F-1, E2F-2, E2F-3, NF-κB, Elk, AP-1, c-Fos 및 c-Jun으로 이루어진 군으로부터 선택되는 것인 방법.
  17. 제1항에 있어서, 50개 이상의 차별적으로 발현된 유전자를 분석하는 방법.
  18. 제1항에 있어서, 100개 이상의 차별적으로 발현된 유전자를 분석하는 방법.
  19. 제1항에 있어서, 500개 이상의 차별적으로 발현된 유전자를 분석하는 방법.
  20. 제1항에 있어서, 상기 풍부한 조절 인자 결합 부위의 확인을 기초로 하여 치료 전략을 설계하는 단계를 추가로 포함하는 방법.
  21. 제20항에 있어서, 상기 풍부한 조절 인자 결합 부위가 하나 이상의 전사 인자와 결합하는 전사 인자 결합 부위인 방법.
  22. 제21항에 있어서, 상기 풍부한 전사 인자 결합 부위를 기초로 하여 컨센서스 결합 부위를 확인하는 방법.
  23. 제20항에 있어서, 상기 치료 전략이, 상응하는 전사 인자와 결합하는데 있어서 상기 풍부한 결합 부위와 경쟁하는 이중-가닥 올리고뉴클레오티드 데코이(decoy)의 설계에 의존하는 것인 방법.
  24. 제20항에 있어서, 상기 치료 전략이, 상기 풍부한 결합 부위와 결합하도록 설계된 안티-센스 올리고뉴클레오티드에 의존하는 것인 방법.
  25. 게놈-전체 또는 조직-전체 대조군에 비해 차별적으로 발현된 유전자 세트 내에 풍부한 조절 인자 결합 부위를 확인하는 단계, 및
    상기 차별적으로 발현된 유전자 세트 내에 풍부한 조절 인자 결합 부위에 의해 공유되는 뉴클레오티드로 본질적으로 이루어진 컨센서스 조절 인자 결합 부위를 설계하는 단계
    를 포함하는, 컨센서스 조절 인자 결합 부위의 설계 방법.
  26. 조절 인자 결합 부위가 차별적으로 발현된 유전자 세트 내에 존재하는 빈도 또는 확률과 상기 조절 인자 결합 부위가 기준 샘플 내에 존재하는 빈도 또는 확률을 비교하는 것을 포함하는, 상기 차별적으로 발현된 유전자 세트를 포함하는 생물학적 샘플 내에서 상기 조절 인자 결합 부위의 풍부화도를 분석하는 방법.
  27. 제26항에 있어서, 생물학적 샘플이 조직 샘플인 방법.
  28. 제27항에 있어서, 조직 종양 세포를 포함하는 것인 방법.
  29. 제28항에 있어서, 조직이 암 세포를 포함하는 것인 방법.
  30. 제28항에 있어서, 암이 유방암, 결장암, 폐암, 전립선암, 간세포암, 위암, 췌장암, 자궁경부암, 난소암, 간암, 방광암, 요로암, 갑상선암, 신장암, 암종, 흑색종 및 뇌암으로 이루어진 군으로부터 선택되는 것인 방법.
  31. 제28항에 있어서, 기준 샘플이 동일 조직 유형의 정상 조직인 방법.
  32. 제28항에 있어서, 기준 샘플이 인간 게놈인 방법.
  33. 제26항에 있어서, 생물학적 샘플이 생물학적 체액인 방법.
  34. 제26항에 있어서, 초기하학적 분포 분석을 이용하여 풍부화도를 결정하는 방법.
KR1020057018167A 2003-03-28 2004-03-24 차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적분석 KR20060006782A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/401,830 2003-03-28
US10/401,830 US20040191779A1 (en) 2003-03-28 2003-03-28 Statistical analysis of regulatory factor binding sites of differentially expressed genes

Publications (1)

Publication Number Publication Date
KR20060006782A true KR20060006782A (ko) 2006-01-19

Family

ID=32989536

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057018167A KR20060006782A (ko) 2003-03-28 2004-03-24 차별적으로 발현된 유전자의 조절 인자 결합 부위의 통계적분석

Country Status (10)

Country Link
US (1) US20040191779A1 (ko)
EP (1) EP1608785A2 (ko)
JP (2) JP2004298178A (ko)
KR (1) KR20060006782A (ko)
CN (1) CN1777686A (ko)
AU (1) AU2004225536A1 (ko)
CA (1) CA2519368A1 (ko)
MX (1) MXPA05010362A (ko)
RU (1) RU2005133211A (ko)
WO (1) WO2004087965A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT732929E (pt) * 1993-10-29 2008-08-26 Brigham & Womens Hospital Utilização terapêutica de ''engodos'' de elementos cis in vivo
US7470507B2 (en) 1999-09-01 2008-12-30 Whitehead Institute For Biomedical Research Genome-wide location and function of DNA binding proteins
EP1691817A2 (en) * 2003-12-02 2006-08-23 Corgentech, Inc. NF-kB OLIGONUCLEOTIDE DECOY MOLECULES
US7611838B2 (en) 2004-03-04 2009-11-03 Whitehead Institute For Biomedical Research Biologically-active DNA-binding sites and related methods
US7482158B2 (en) * 2004-07-01 2009-01-27 Mathison Brian H Composite polynucleic acid therapeutics
WO2006034433A2 (en) * 2004-09-21 2006-03-30 Anesiva, Inc. Delivery of polynucleotides
CA2614295A1 (en) * 2005-06-06 2006-12-14 Anges Mg, Inc. Transcription factor decoy
US7556921B2 (en) 2005-12-02 2009-07-07 Whitehead Institute For Biomedical Research Methods for mapping signal transduction pathways to gene expression programs
JP4714869B2 (ja) 2005-12-02 2011-06-29 国立大学法人山口大学 有効因子抽出システム
US7917525B2 (en) * 2005-12-06 2011-03-29 Ingenix, Inc. Analyzing administrative healthcare claims data and other data sources
US20080163824A1 (en) * 2006-09-01 2008-07-10 Innovative Dairy Products Pty Ltd, An Australian Company, Acn 098 382 784 Whole genome based genetic evaluation and selection process
US20090049856A1 (en) * 2007-08-20 2009-02-26 Honeywell International Inc. Working fluid of a blend of 1,1,1,3,3-pentafluoropane, 1,1,1,2,3,3-hexafluoropropane, and 1,1,1,2-tetrafluoroethane and method and apparatus for using
TWI373338B (en) * 2009-08-27 2012-10-01 Nat Univ Chung Cheng Pharmaceutical composition containing transcription factor decoys and their preparation method and applications
JP2014511391A (ja) * 2011-03-07 2014-05-15 フォンダッツィオーネ・テレソン Tfebリン酸化阻害剤およびその使用
CN103223175B (zh) * 2013-05-23 2015-07-22 中国人民解放军第三军医大学第三附属医院 抗瘢痕和组织纤维化寡聚双链核苷酸药物及其应用
CN103290016B (zh) * 2013-06-21 2015-04-22 厦门大学 白氏文昌鱼Pax2/5/8基因非编码保守元件增强子及其应用
CN103390119B (zh) * 2013-07-03 2016-01-27 哈尔滨工程大学 一种转录因子结合位点识别方法
US20170003302A1 (en) * 2014-01-22 2017-01-05 University Of Brescia In Vitro Method of Diagnosing Parkinson's Disease
CN107391962B (zh) * 2017-09-05 2020-12-29 武汉古奥基因科技有限公司 基于多组学分析基因或位点对疾病调控关系的方法
CN110211634B (zh) * 2018-02-05 2022-04-05 深圳华大基因科技服务有限公司 一种多组学数据联合分析的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2441060A1 (en) * 2001-03-13 2002-09-19 Ashni Naturaceuticals, Inc. Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes
WO2004053106A2 (en) * 2002-12-05 2004-06-24 Regulome Corporation Profiled regulatory sites useful for gene control

Also Published As

Publication number Publication date
JP2004298178A (ja) 2004-10-28
MXPA05010362A (es) 2006-03-08
RU2005133211A (ru) 2006-04-20
WO2004087965A2 (en) 2004-10-14
EP1608785A2 (en) 2005-12-28
JP2007185192A (ja) 2007-07-26
CN1777686A (zh) 2006-05-24
WO2004087965A3 (en) 2004-11-25
AU2004225536A1 (en) 2004-10-14
CA2519368A1 (en) 2004-10-14
US20040191779A1 (en) 2004-09-30

Similar Documents

Publication Publication Date Title
JP2007185192A (ja) 差示的に発現される遺伝子の調節因子結合部位の統計的分析
Tahira et al. Long noncoding intronic RNAs are differentially expressed in primary and metastatic pancreatic cancer
Son et al. Database of mRNA gene expression profiles of multiple human organs
JP4938672B2 (ja) p53の状態と遺伝子発現プロファイルとの関連性に基づき、癌を分類し、予後を予測し、そして診断する方法、システム、およびアレイ
Maltseva et al. High-throughput identification of reference genes for research and clinical RT-qPCR analysis of breast cancer samples
Patil et al. An integrated data analysis approach to characterize genes highly expressed in hepatocellular carcinoma
US20220267855A1 (en) A Method for Predicting Prognosis of Cancer and the Composition Thereof
Cullum et al. The next generation: using new sequencing technologies to analyse gene regulation
Hu et al. Obtaining reliable information from minute amounts of RNA using cDNA microarrays
US20050282227A1 (en) Treatment discovery based on CGH analysis
CN111961726A (zh) 使用靶基因表达的线性组合评价细胞信号传导途径活性
WO2015017537A2 (en) Colorectal cancer recurrence gene expression signature
Zimmerman et al. Spatially resolved whole transcriptome profiling in human and mouse tissue using Digital Spatial Profiling
Wong et al. Identification of novel microRNAs in the sheep heart and their regulation in heart failure
Zeng et al. Identification and analysis of house-keeping and tissue-specific genes based on RNA-seq data sets across 15 mouse tissues
Tan et al. Integrated approaches to uncovering transcription regulatory networks in mammalian cells
Chen et al. SELMAP-SELEX affinity landscape MAPping of transcription factor binding sites using integrated microfluidics
Coppola Designing, performing, and interpreting a microarray-based gene expression study
Khozyainova et al. Complex analysis of single-cell RNA sequencing data
König et al. Reliability of gene expression ratios for cDNA microarrays in multiconditional experiments with a reference design
Sasaki et al. Identification and characterization of human non-coding RNAs with tissue-specific expression
Oeder et al. Uncovering information on expression of natural antisense transcripts in Affymetrix MOE430 datasets
van Haaften et al. Biologically relevant effects of mRNA amplification on gene expression profiles
Lee et al. Systems biology approaches to decoding the genome of liver cancer
Chang et al. Microarray analysis of stem cells and differentiation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application