KR100772435B1 - 유전자 발현 수준을 결정하기 위한 방법 및 장치 - Google Patents

유전자 발현 수준을 결정하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR100772435B1
KR100772435B1 KR1020057009772A KR20057009772A KR100772435B1 KR 100772435 B1 KR100772435 B1 KR 100772435B1 KR 1020057009772 A KR1020057009772 A KR 1020057009772A KR 20057009772 A KR20057009772 A KR 20057009772A KR 100772435 B1 KR100772435 B1 KR 100772435B1
Authority
KR
South Korea
Prior art keywords
probe
oligonucleotide
target
nucleic acid
hybridization
Prior art date
Application number
KR1020057009772A
Other languages
English (en)
Other versions
KR20050084054A (ko
Inventor
지오프레이 그린스테인
글렌 알렌 헬드
유하이 투
Original Assignee
인터내셔널 비지니스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지니스 머신즈 코포레이션 filed Critical 인터내셔널 비지니스 머신즈 코포레이션
Publication of KR20050084054A publication Critical patent/KR20050084054A/ko
Application granted granted Critical
Publication of KR100772435B1 publication Critical patent/KR100772435B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N31/00Investigating or analysing non-biological materials by the use of the chemical methods specified in the subgroup; Apparatus specially adapted for such methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 유전자 발현 수준을 분석하는 기술을 제공한다. 본 발명의 한 양태에서, 상기 기술은 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 측정하는 방법을 제공한다. 상기 방법은, 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 친화도 값의 척도를 측정하고, 프로브 스팟에서 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화 세기 값을 측정한다. 표적 핵산의 농도 수준을 측정하기 위해 친화도 값의 척도 및 하이브리드화 세기 값이 사용된다.

Description

유전자 발현 수준을 결정하기 위한 방법 및 장치{METHOD AND APPARATUS FOR DETERMINING GENE EXPRESSION LEVELS}
본 발명은 유전자 발현 수준, 더욱 특히는 핵산 마이크로어레이(microarray)를 사용하는 유전자 발현 수준의 결정 방법에 관한 것이다.
유전자 발현 수준에 대한 연구가 최근 연구의 초점이다. 유전자 발현 분석은 마이크로어레이를 사용하여 실시될 수 있다. 마이크로어레이는 다량의 유전자 물질의 신속한 분석을 가능하게 만든다. 마이크로어레이에 대한 상세한 논의에 있어서, 브라운(P. O. Brown) 등의 문헌 ["Exploring the New World of the Genome With DNA Microarrays," Nature Genetics v. 21, p. 33 (1999)]; 립슈츠(R. J. Lipshutz) 등의 문헌 ["High Density Synthetic Oligonucleotide Arrays," Nature Genetics v. 21, p. 20 (1999)]을 참고하며, 그 개시내용은 본원에서 참고로 인용한다. 마이크로어레이는, 연구자들에게 세포(예: 유전자) 내의 유전자 정보를 분석하여 각각의 유전자가 세포 내에서 발현되는지 여부를 결정하며 그러한 경우 발현 수준의 양을 정량화할 수 있게 한다. 유전자 발현 수준이 표현형(세포의 관찰 가능한 특징)을 결정하는데 중심 역할을 담당하기 때문에, 유전자 발현 수준은 세포의 질환 상태를 진단하고(예컨대, 암 세포를 확인하거나, 또는 암 세포가 되기 쉬운 세포를 확인하고) 세포 주기 및 분화를 이해하고 세포의 복잡한 범위의 거동 및 변화를 밝히는데 있어서 중요한 부분을 담당한다.
마이크로어레이 기술은 여러 다른 형태를 취한다. 일부 마이크로어레이는 수십억의 비교적 짧은 올리고뉴클레오타이드, 즉 단일 데옥시리보핵산(DNA) 스트랜드("프로브 올리고뉴클레오타이드"로 지칭됨)의 100개 미만의 염기 쌍을 함유한다. 각각의 프로브 올리고뉴클레오타이드는 상기 프로브 올리고뉴클레오타이드가 "지핑(zip)"될 수 있는 상보적 스트랜드와 결합하는데 허용 가능한 유전자의 "미지핑된(unzipped)" 조각을 나타낸다. 이상적으로, 다수의 동일한 복제물의 각각의 프로브 올리고뉴클레오타이드는 기재 상에 "프로브 스팟(spot)"으로 지칭되는 약 20마이크론 평방의 영역 상에 침착된다. 마이크로어레이 상의 일군의 프로브 스팟은 수천개의 유전자일 수 있다.
세포 내의 해당 유전자를 대표하는 올리고뉴클레오타이드 서열은 표적 올리고뉴클레오타이드로 지칭된다. 표적 올리고뉴클레오타이드의 농도는 유전자 발현 수준의 척도(measure)이다. 다수의 표적 올리고뉴클레오타이드는 프로브 올리고뉴클레오타이드에 상보적일 수 있다. 각각의 표적 올리고뉴클레오타이드는 상보적인 프로브 올리고뉴클레오타이드와 결합(즉, 하이브리드화)하기 위한 강한 친화력을 갖는다. 따라서, 표적 올리고뉴클레오타이드를 함유하는 용액이 일단 마이크로어레이 내에 도입되면, 용액 중의 표적 올리고뉴클레오타이드에 상보 또는 일부 상보적인 마이크로어레이의 프로브 올리고뉴클레오타이드가 표적 올리고뉴클레오타이드와 하이브리드화할 것이며, 이로 인해 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드 이중 스트랜드를 함유하는 마이크로어레이의 프로브 스팟이 생성된다. 프로브 올리고뉴클레오타이드가 용액 중의 임의의 표적 올리고뉴클레오타이드에 상보적이지 않은 다른 스팟은, 단지 비하이브리드화되고 단일-스트랜드 프로브 올리고뉴클레오타이드만을 함유할 것이다. 표적 올리고뉴클레오타이드 상의 형광성 tag는 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드를 함유하는 프로브 스팟을 검출할 수 있게 한다. 따라서, 용액 중에 존재하는 표적 올리고뉴클레오타이드가 결정될 수 있다. 더욱이, 형광(fluorescence)의 강도는 각각의 표적 올리고뉴클레오타이드가 표적 용액 중에 그리고 이후에 원래의 세포 내에 얼마나 존재하는지의 척도를 제공한다.
통상의 방법, 예컨대 아피메트릭스(Affymetrix)(등록상표) 진칩스(Genechips)(등록상표) 및 알고리즘을 사용하는 유전자 발현 분석은 몇몇 단점을 갖고 있다. 예를 들면, 아피메트릭스(등록상표) 기술에서, 각각의 유전자는 전형적으로 다수의 여러 짧은 길이의 프로브, 즉 약 25개 뉴클레오타이드 염기 쌍의 프로브에 의해 묘사된다. 소정의 유전자를 제공하는 모든 표적 올리고뉴클레오타이드는 거의 동일한 농도로 존재하기 때문에, 상기 유전자에 상응하는 모든 프로브 스팟의 측정된 강도 값은 실제적으로 동일할 것으로 예측된다. 그러나 사실상, 전형적으로는 특정 유전자를 제공하는 프로브 스팟들 중 측정된 하이브리드화 강도 값에서 사이징가능한(sizable) 변형이 존재한다. 이들 변형은 예컨대 교차-하이브리드화, 2차 구조(단일 표적 올리고뉴클레오타이드 또는 프로브 올리고뉴클레오타이드의 세그먼트의 다른 하나와의 하이브리드화), 또는 특정 상보적 쌍에 대한 더욱 강한 하이브리드화 경향 때문일 수 있으며, 이는 다른 것에서는 없는 것이다. 변형은 표적 용액에서 각각의 유전자에 대해 독특하고 정확한 발현 수준을 결정하는 작업을 매우 복잡하게 만든다.
따라서, 유전자 발현 수준을 결정하기 위한 정확하고 효과적인 기술에 대한 요구가 존재한다.
발명의 요약
본 발명은 유전자 발현을 분석하는 기술을 제공한다. 본 발명의 한 양태에서, 상기 기술은 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하는 방법을 제공한다. 상기 방법은, (i) 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 친화도 값의 척도를 결정하고, (ii) 프로브 스팟에서 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화 강도 값을 결정한다. 표적 핵산의 농도 수준을 결정하기 위해 친화도 값의 척도 및 하이브리드화 강도 값이 사용된다.
친화도 값의 척도는 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화의 자유 에너지를 포함할 수 있다. 또한, 친화도 값의 척도는 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화의 순수 속도(net rate)를 포함할 수 있다.
본 발명의 추가 특징 및 이점뿐만 아니라 본 발명의 더욱 완벽한 이해는 하기 상세한 설명 및 도면을 참고하여 얻을 수 있다.
도 1은 본 발명의 실시양태에 따른 유전자 발현 수준을 결정하기 위한 예시적인 방법을 도시하는 순서도이다.
도 2는 본 발명의 실시양태에 따른 마이크로어레이 상의 하이브리드화를 도시하는 개략적 도식이다.
도 3은 본 발명의 실시양태에 따른 유전자 발현 수준을 결정하기 위한 방법의 예시적 하드웨어 도구의 블록 도식이다.
도 4는 본 발명의 실시양태에 따른 다중 표적 올리고뉴클레오타이드 농도의 하이브리드화 자유 에너지에 대한 하이브리드화 강도 의존도를 도시하는 플롯이다.
도 5는 본 발명의 실시양태에 따른 일부 하이브리드화 자유 에너지 빈(bin)에 대한 표적 올리고뉴클레오타이드 농도의 함수로서 하이브리드화 강도를 도시하는 플롯이다.
도 6은 본 발명의 실시양태에 따른 하이브리드화 자유 에너지의 함수로서 변수(n e )를 도시하는 플롯이다.
도 7은 본 발명의 실시양태에 따른 하이브리드화 자유 에너지의 함수로서 변수(b g )를 도시하는 플롯이다.
도 8은 본 발명의 실시양태에 따른 하이브리드화 자유 에너지 및 하이브리드화 강도로부터 결정된 표적 올리고뉴클레오타이드 농도를 도시하는 플롯이다.
도 9는, 본 발명의 실시양태에 따라, 공지된 표적 올리고뉴클레오타이드 농도와 비교하는 경우, 본 발명의 교시내용 및 아피메트릭스(등록상표) 방법에 의해 결정된 표적 올리고뉴클레오타이드 농도를 도시하는 플롯이다.
본 발명은 표적 핵산의 농도 수준을 사용하는 예시적 유전자 발현 분석에 대해 아래에 기술할 것이다. 그러나, 본 발명의 교시내용은 일반적으로 유전자 발현 분석에 적용 가능하지만 유전자 발현 수준 분석에 대한 임의의 특정 방법에 국한되는 것으로 생각되어서는 안됨을 이해해야 한다.
하기 정의가 제공된다.
표적 핵산: 서열이, 발현된 유전자 또는 발현된 서열 tag(EST) 모두 또는 그 일부에 상응하는 올리고뉴클레오타이드. 표적 핵산은 mRNA, cRNA 또는 cDNA를 포함할 수 있다.
표적 올리고뉴클레오타이드: 전형적으로 25 내지 100 염기 쌍 길이를 갖는 표적 핵산의 단편. 표적 올리고뉴클레오타이드는 아래 상세하게 정의되는 DNA 마이크로어레이 상에서 순환되고(circulate), 아래 상세하게 정의되는 프로브 올리고뉴클레오타이드와 하이브리드화된다. 표적 올리고뉴클레오타이드는 전형적으로 형광성 또는 방사성 taggant로 표지화되며, 표적 올리고뉴클레오타이드가 프로브 올리고뉴클레오타이드와 하이브리드화되는 경우 검출될 수 있다.
프로브 올리고뉴클레오타이드: 기재에 결합된 올리고뉴클레오타이드. 프로브 올리고뉴클레오타이드의 서열은 특정 표적 핵산의 특정 서열과 하이브리드화하도록 선택되며, 이로 인해 상기 특정 서열을 함유하는 표적 올리고뉴클레오타이드와 하이브리드화하게 될 것이다.
프로브 스팟: 다수의 프로브 올리고뉴클레오타이드가 결합되는 전형적으로 25 내지 200마이크론 평방의 기재 영역. 수십억개 이상의 프로브 올리고뉴클레오타이드가 단일 프로브 스팟에서 결합될 수 있다. 바람직하게는, 이들 프로브 올리고뉴클레오타이드 모두는 동일하다.
DNA 마이크로어레이: 전형적으로 다수의 프로브 스팟을 포함하는 기재. 단일 마이크로어레이는 전형적으로 약 1,000 내지 약 100,000개의 프로브 스팟을 포함한다. 각각의 프로브 스팟은 특정 표적 핵산의 일부인 특정 서열과 하이브리드화하는 프로브 올리고뉴클레오타이드를 포함한다. 마이크로어레이 상의 다수의 프로브 스팟은 통상의 표적 핵산의 여러 영역과 하이브리드화하도록 디자인될 수 있다. DNA 마이크로어레이 상의 조합된 프로브 스팟은 전형적으로 다수의 명백한 포텐셜 표적 핵산, 예컨대 전형적으로 1,000개 초과의 별개의 포텐셜 표적 핵산과 하이브리드화한다.
도 1은 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하기 위한 예시적인 방법을 도시하는 순서도이다. 단계(110)에 도시된 바와 같이, 친화도 값의 척도는 표적 올리고뉴클레오타이드, 및 프로브 올리고뉴클레오타이드, 예컨대 DNA 마이크로어레이에 부착된 것에 대해 결정된다. 다수의 친화도 값의 척도가 결정될 수 있다. 마이크로어레이에 부착된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드의 하이브리드화는 도 2의 설명과 함께 아래 상세하게 기술되고 있다. 친화도 값의 척도는, 표적 올리고뉴클레오타이드과 프로브 올리고뉴클레오타이드의 하이브리드화 반응의 속도 상수로부터, 또는 표적 올리고뉴클레오타이드과 프로브 올리고뉴클레오타이드의 하이브리드화에 대한 자유 에너지에서의 변화로부터 결정될 수 있다. 표적 올리고뉴클레오타이드과 프로브 올리고뉴클레오타이드에 대한 친화도의 척도는 아래에 더욱 상세하게 기술되고 있다. 단계(120)에 도시된 바와 같이, 하이브리드화 강도 값은 표적 올리고뉴클레오타이드 및 프로브 올리고뉴클레오타이드에 대해 결정된다. 다수의 하이브리드화 강도 값이 결정될 수 있다. 하이브리드화 강도의 결정은 아래 더욱 상세하게 기술되고 있다. 그 다음, 단계(130)에 도시된 바와 같이, 핵산의 농도 수준이 결정된다. 핵산의 농도 수준은 유전자 발현 수준과 관련된다. 표적 핵산의 다수의 농도 수준이 결정될 수 있다. 표적 핵산의 농도 수준의 결정, 및 표적 핵산의 농도 수준과 유전자 발현 수준 사이의 관계는 아래 더욱 상세하게 기술되고 있다.
도 2는 DNA 마이크로어레이(220) 상의 표적 올리고뉴클레오타이드(210)와 프로브 올리고뉴클레오타이드(230)의 예시적 하이브리드화를 도시하는 개략적 도식이다. 표적 올리고뉴클레오타이드(210) 및 프로브 올리고뉴클레오타이드(230) 모두는 뉴클레오타이드 염기를 포함한다. 뉴클레오타이드 염기는 아데닌, 구아닌, 사이토신, 티민 및 유라실을 포함한다.
본 발명의 교시내용은 물리적 원리에 기초한 하이브리드화를 사용하여 하이브리드화 과정의 단일 모델을 생성시킨다. 상기 모델은 마이크로어레이의 각각의 프로브 스팟 상에 하이브리드화된 프로브 올리고뉴클레오타이드의 개수의 화학적 동력학적인 대표물(representation)로 이루어지며, 상기 하이브리드화된 프로브 올리고뉴클레오타이드의 개수는 프로브 스팟에 대한 측정된 하이브리드화 강도 값에 정비례한다.
개별 표적 올리고뉴클레오타이드는 개별 프로브 올리고뉴클레오타이드보다 많은 수의 뉴클레오타이드 염기를 포함할 수 있다. 따라서, 예시적인 실시양태에서, 개별 표적 올리고뉴클레오타이드는 약 25개 이상의 뉴클레오타이드 염기를 포함하고, 개별 프로브 올리고뉴클레오타이드는 약 25개의 뉴클레오타이드 염기를 포함한다.
하기 논의에서는, 프로브 올리고뉴클레오타이드가 단일-스트랜드 DNA 서열이고, 표적 올리고뉴클레오타이드가 mRNA인 것에 집중할 것이다. 세포 내에 존재하는 mRNA는 아래 더욱 상세하게 기술되는 바와 같이 mRNA를 코딩하는 유전자의 발현 수준과 관련된다. 그러나, 본 발명의 교시내용에 따르면, 표적 올리고뉴클레오타이드는 mRNA, cDNA 또는 cRNA일 수 있다.
하이브리드화된 마이크로어레이를 형성하기 위해, 표적 올리고뉴클레오타이드(210)를 포함하는 용액은 DNA 마이크로어레이(220)와 접촉하게 위치한다. 표적 올리고뉴클레오타이드(210)의 개별 표적 올리고뉴클레오타이드 서열은 프로브 올리고뉴클레오타이드(230)의 상보적 개별 프로브 올리고뉴클레오타이드와 하이브리드화한다. 그 다음, 마이크로어레이(220)는 세척되고, 모든 비하이브리드화된 표적 올리고뉴클레오타이드(210)는 마이크로어레이(220)로부터 제거된다. 따라서, 프로브 올리고뉴클레오타이드(230)와 하이브리드화되지 않은 모든 표적 올리고뉴클레오타이드(210)는 제거되고, 분석을 위해 단지 표적 올리고뉴클레오타이드(210)의 하이브리드화된 개별 표적 올리고뉴클레오타이드만이 남는다.
도 3은, 본 발명의 실시양태에 따라, 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하기 위한 시스템(300)의 블록 도식이다. 장치(300)는 매체(350)와 상호 작용하는 컴퓨터 시스템(310)을 포함한다. 컴퓨터 시스템(310)은 프로세서(320), 네트워크 인터페이스(325), 메모리(330), 매체 인터페이스(335) 및 선택적 디스플레이(340)를 포함한다. 네트워크 인터페이스(325)는 컴퓨터 시스템(310)이 네트워크에 연결되게 허용하며, 매체 인터페이스(335)는 컴퓨터 시스템(310)이 디지털 다목적 디스크(DVD) 또는 하드 드라이브와 같은 매체(350)와 상호 작용되게 허용한다.
당해 분야에 공지되어 있는 바와 같이, 본원에 논의된 방법 및 장치는, 본 발명의 실시양태를 시행하는 경우 작동하는 하나 이상의 프로그램을 함유하는 기계-판독 가능한 매체를 자체적으로 포함하는 제품으로서 분배될 수 있다. 예를 들면, 기계-판독 가능한 매체는, 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 친화도 값의 척도를 결정하고; 프로브 스팟에서 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화 강도 값을 결정하고, 상기 친화도 값의 척도 및 상기 하이브리드화 강도 값을 사용하여 표적 핵산의 농도 수준을 결정하도록 배치된 프로그램을 포함할 수 있다. 기계-판독 가능한 매체는 기록 가능한 매체(예: 플로피 디스크, 하드 드라이브, 광 디스크(예컨대, DVD) 또는 메모리 카드) 또는 전송 매체(예컨대, 섬유-광학 물질을 포함하는 네트워크, 월드-와이드 웹(world-wide web), 케이블, 또는 시간-분할 다중 억세스, 코드-분할 다중 억세스 또는 다른 라이오-주파수 채널을 사용하는 무선 채널)일 수 있다. 컴퓨터 시스템에 사용하기 적합한 정보를 저장할 수 있는 공지 또는 개발된 임의의 매체가 사용될 수 있다.
프로세서(320)는 본원에 개시된 방법, 단계 및 기능을 작동시키도록 배치될 수 있다. 메모리(330)는 분포 또는 국지화될 수 있고, 프로세서(320)는 분포 또는 단독으로 존재할 수 있다. 메모리(330)는 전기, 자기 또는 광학 메모리, 또는 이들의 임의의 조합 또는 다른 유형의 저장 디바이스로서 작동될 수 있다. 더욱이, 용어 "메모리"는 프로세서(320)에 의해 접근되는 어드레스 가능한 공간에서 주소로부터 판독되거나 또는 상기 주소에 기록할 수 있는 임의의 정보를 포함하기에 크게 충분한 것으로 고려된다. 이 정의에서, 네트워크 인터페이스(325)를 통해 접근 가능한 네트워크 상의 정보는 여전히 메모리(330) 내에 존재하는데, 이는 프로세서(320)가 네트워크로부터 정보를 검색할 수 있기 때문이다. 프로세서(320)를 구성하는 각각의 분포된 프로세서가 일반적으로 그 자체의 어드레스 가능한 메모리 공간을 점유하는 것을 주지해야 한다. 또한, 컴퓨터 시스템(310) 모두 또는 그 일부가 분야-특이적 또는 범용 집적 회로 내로 혼용될 수 있다.
선택적 비디오 디스플레이(340)는 장치(300)의 인간 사용자와 상호 작용하기에 적합한 임의의 유형의 비디오 디스플레이이다. 일반적으로, 비디오 디스플레이(340)는 컴퓨터 모니터 또는 다른 유사 비디오 디스플레이이다.
친화도 값의 척도는 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 하이브리드화의 자유 에너지를 포함할 수 있다. 하이브리드화의 자유 에너지가 더욱 네거티브화되어 감에 따라, 하이브리드화의 친화도는 증가한다. 하이브리드화의 자유 에너지가 정량화될 수 있는 예시적인 방법은 최근접(nearest-neighbor)(NN) 모델의 사용을 포함한다. NN 모델은 소정의 뉴클레오타이드 염기 쌍의 안정성이 근접 염기 쌍의 정체성 및 배향에 의해 영향을 받는다는 가정에 기초한다. 예를 들면, 하기 표 1에 제시된 바와 같이, 단일 스트랜드 올리고뉴클레오타이드 상의 근접 염기에서의 차이는, 하이브리드화 자유 에너지의 성분들에서의 차이, 즉 엔탈피(ΔH) 및 엔트로피(ΔS)에서의 차이에 의해 대표되는 바와 같이, 상기 올리고뉴클레오타이드와 그에 상보적인 단일 스트랜드 올리고뉴클레오타이드 사이의 쌍의 안정성에 충격을 가한다.
Figure 112005028651506-pct00001
터미널 G·C를 갖는 쌍과 비교함으로써, 터미널 A·T를 갖는 올리고뉴클레오타이드들 사이의 쌍에 대한 하이브리드화 엔탈피 및 엔트로피에서의 차이를 설명하기 위해, 파라미터들("터미널 G·C를 갖는 개시자" 및 "터미널 A·T를 갖는 개시자")이 또한 표 1에 제시된다. NN 모델의 더욱 상세한 설명을 위해, 산타루시아(J. SantaLucia, Jr.)의 문헌 ["A Unified View of Polymer, Dumbbell, and Oligonucleotide DNA Nearest-Neighbor Thermodynamics," Prod. Natl. Acad. Sci., 1998, 95, 1460-65]을 참고하며, 그 개시내용은 본원에 참고로 인용한다.
하이브리드화에 따른 시스템의 자유 에너지에서의 변화는 하기 수학식 1과 같이 자유 에너지 함수에 따라 결정될 수 있다.
Figure 112005028651506-pct00002
상기 식에서,
ΔG 0는 자유 에너지에서의 변화이고,
ΔH 0는 엔탈피에서의 변화이고,
T는 절대 온도이고,
ΔS 0는 엔트로피에서의 변화이다.
ΔG 0의 감소는 하이브리드화에 대한 친화도의 증가를 의미한다.
표적 올리고뉴클레오타이드가 하이브리드화되는 DNA 마이크로어레이로부터 하이브리드화 강도 값을 수득하기 위한 방법의 예가 아래에 제시된다. 다수의 하이브리드화 강도 값이 결정될 수 있다. 다수의 하이브리드화 강도 값이 비교되어서 전체 하이브리드화 강도 값, 즉 평균 값을 결정할 수 있다.
마이크로어레이의 프로브 스팟 상에서 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드에 대한 하이브리드화 강도 값은 실험적으로 결정될 수 있다. 예를 들면, 표적 올리고뉴클레오타이드는 형광성 taggant로 표지화될 수 있다. 표적 올리고뉴클레오타이드가 마이크로어레이와 접촉하는 경우, 마이크로어레이 상의 프로브 올리고뉴클레오타이드에 상보적인 표적 올리고뉴클레오타이드는 하이브리드화될 것이다. 그 다음, 이론상으로 모든 비상보적인 표적 올리고뉴클레오타이드는 제거될 수 있다. 그러나, 교차-하이브리드화가 발생하며, 이로 인해 교차-하이브리드화된 표적 올리고뉴클레오타이드가 또한 남을 것이다. 이와 관련하여, 교차-하이브리드화는, 단지 여러 표적 핵산의 존재로부터 생성되는 표적 올리고뉴클레오타이드로만 하이브리드화하려고 하는 프로브 올리고뉴클레오타이드와 하이브리드화되는 표적 올리고뉴클레오타이드와 관련된다.
하이브리드화된 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드는 형광성 마커로 표지화될 것이다. 형광성 마커는 여러 파장의 광을 수용하는 경우 특정 파장의 광을 방출할 것이며, 이는 현미경 하에서 관찰될 수 있다. 예를 들면, DNA 마이크로어레이 상의 다양한 프로브 스팟의 형광을 측정하기 위해 공초점 현미경(confocal microscopy) 스캐너가 사용될 수 있다. 형광의 관찰된 강도는 하이브리드화 강도 값의 척도로서 취급될 수 있다.
그 다음, 표적 핵산의 농도 수준을 결정하기 위해 친화도 값의 척도 및 하이브리드화 강도 값이 사용될 수 있다. 친화도 값의 척도 및 하이브리드화 강도 값으로부터 표적 핵산의 농도 수준을 결정하는 것은, 친화도 값의 척도, 하이브리드화 강도 값 및 표적 핵산의 농도 수준 사이의 정량적 관계를 결정하는 것이 포함된다.
친화도 값의 척도, 하이브리드화 강도 값 및 표적 핵산의 농도 수준 사이의 정량적 관계는, 다수의 공지된 표적 올리고뉴클레오타이드 농도에서 다수의 예시적인 공지의 표적 올리고뉴클레오타이드와 하이브리드화된 다수의 DNA 마이크로어레이에 대해 측정된 하이브리드화 강도 값으로부터 결정될 수 있다. 이러한 다수의 강도 값 측정치는 아피메트릭스(등록상표)에 의해 공개적으로 허용 가능하다(또한, www.affymetrix.com에서 접근할 수 있다). 따라서, 공지된 표적 핵산 농도에서 관찰된 하이브리드화 강도 값은 특정의 프로브 올리고뉴클레오타이드 서열과 관련될 수 있다.
도 4에 도시된 바와 같이, 이들 데이터는 표적 핵산 농도의 범위에 걸쳐 하이브리드화 자유 에너지에 대한 하이브리드화 강도의 의존도를 나타내는데 사용될 수 있다. 도 4에서, 하이브리드화 자유 에너지의 네거티브 값은 즉 포지티브 값으로서 제시된다. 분명하게, 하이브리드화 강도는 표적 핵산 농도의 소정 범위에 걸쳐 하이브리드화 자유 에너지에 의존적이고, 하이브리드화 강도는 표적 핵산 농도의 소정 범위에 걸쳐 증가하는 네거티브 하이브리드화 자유 에너지와 함께 증가한다.
하이브리드화 반응은 하기 수학식 2로 나타낸다.
Figure 112005028651506-pct00003
상기 식에서,
DNA 마이크로어레이 상의 특정 프로브 스팟에 대한 자유 비하이브리드화된 프로브 올리고뉴클레오타이드의 농도{자유 프로브}는
Figure 112005028651506-pct00004
이고,
샘플 용액에서, 특정 프로브 스팟에 대한 프로브 올리고뉴클레오타이드에 상보적인 자유 비하이브리드화된 표적 올리고뉴클레오타이드의 농도{자유 표적}는
Figure 112005028651506-pct00005
이고,
하이브리드화된 DNA 마이크로어레이 상의 특정 프로브 스팟에 대한 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드의 농도{자유 프로브/표적}는
Figure 112005028651506-pct00006
이고,
k f 는 프로브 스팟에 대한 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드의 형성을 위한 속도 상수이고,
상수 k b 는, DNA 마이크로어레이 상의 프로브 스팟에 대한 자유 비하이브리드화된 프로브 올리고뉴클레오타이드 및 샘플 용액에서 자유 비하이브리드화된 표적 올리고뉴클레오타이드 내로의, 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드의 비커플링화를 위한 속도 상수이고,
상수 kf kb 는 하이브리드화의 순수 속도, 즉 프로브 스팟에 대한 하이브리드화된 프로브 올리고뉴클레오타이드와 표적 올리고뉴클레오타이드의 형성에 대한 순수 속도를 결정하는데 사용될 수 있되, 여기서
변수(nP )는 DNA 마이크로어레이 상의 특정 프로브 스팟에 대한 프로브 올리고뉴클레오타이드의 개수이고,
변수(nB )는 아래 상세하게 정의되는 바와 같이 프로브 스팟에 대한 결합된 프로브 올리고뉴클레오타이드의 전체 개수이고,
변수(n0 )는 특정 프로브 스팟에 상보적인 샘플 용액에서의 표적 올리고뉴클레오타이드의 전체 개수이고,
변수(V프로브 )는 프로브 스팟에 대한 프로브 올리고뉴클레오타이드의 전체 부피이고,
변수(V용액 )는 표적 올리고뉴클레오타이드를 함유하는 샘플 용액의 전체 부피이다.
하이브리드화 자유 에너지와 같이, 속도 상수 k f k b 는 프로브의 뉴클레오타이드 염기 서열에 의존적이다. 따라서, 속도 상수 k f k b 는, 각각의 상보적인 표적 올리고뉴클레오타이드로의 각각의 프로브 스팟에 대한 프로브 올리고뉴클레오타이드의 하이브리드화의 자유 에너지에서의 변화의 결과로서, 올리고뉴클레오타이드 프로브 스팟으로부터 다른 것으로 변할 것이다. k f k b 의 비율은 하이브리드화 반응의 평형 상수이다. k f k b 의 비율이 커지면, 발생되는 하이브리드화의 경향도 강해진다. 예시적인 실시예에서, 프로브 올리고뉴클레오타이드가 아데닌을 우세적으로 함유하는 뉴클레오타이드 염기 서열을 포함하고, 상보적인 표적 올리고뉴클레오타이드가 티민을 우세적으로 포함하면, 속도 상수(k f /k b )는 프로브 올리고뉴클레오타이드가 구아닌을 우세적으로 함유하는 뉴클레오타이드 염기 서열을 포함하고, 상보적인 표적 올리고뉴클레오타이드가 사이토신을 우세적으로 포함하는 경우보다 작게 된다.
본 발명의 교시내용은 상보적인 표적 올리고뉴클레오타이드의 농도를 예측하 는데 사용될 수 있다. 상기 수학식 2로부터, 속도에 관한 하기 수학식 3이 추론되었다.
Figure 112005028651506-pct00007
상기 식에서,
평형 상태, 즉
Figure 112005028651506-pct00008
가 0이고, n B n 0 이면, 하기 수학식 4가 충족된다.
Figure 112005028651506-pct00009
[상기 식에서,
n e
Figure 112005028651506-pct00010
이고,
Figure 112005028651506-pct00011
은 표적 올리고뉴클레오타이드 농도이다.]
n e 이 하이브리드화의 자유 에너지에 의존적인 것으로 가정하고(이로 인해, 특정 프로브 올리고뉴클레오타이드의 하이브리드화 자유 에너지에 따라 변할 것이고), n p 이 하이브리드화의 자유 에너지에 의존적인 것으로 가정되는 모델이 고려될 수 있다.
측정된 하이브리드화 강도 값은 nB 와 직접 관련되어 있다. 선형 비례를 가정하면, 강도는 fnB 이되, 여기서 f는 상수이다. 그 다음, 하기 수학식 5는 하이브리드화 자유 에너지, 하이브리드화 강도 및 표적 올리고뉴클레오타이드 농도의 관계를 정립시키는데 사용될 수 있다.
Figure 112005028651506-pct00012
상기 식에서,
변수(c)는 표적 올리고뉴클레오타이드 농도(mol)이고,
n'p =fnp 는 형광의 포화 강도이고,
변수(bg)는 표적 올리고뉴클레오타이드 농도(c)를 0의 값으로 설정함으로써 결정될 수 있는 에너지 의존성 백그라운드(background)이다.
그러나, 낮은 농도로부터의 데이터를 높은 농도로부터의 데이터에 제공하기 위해, 강도 값의 log를 취할 수 있다. 따라서, 예시적인 실시양태에서, 화학식 5의 log는 하기 화학식 6에 사용된다.
Figure 112005028651506-pct00013
프로브 스팟의 하이브리드화 강도 값 및 표적 핵산의 실제 농도 모두가 공지된 다수의 실험 측정치에 상기 수학식 6을 적용하면, 가정 상수 값(n'p ) 뿐만 아니라 하이브리드화의 자유 에너지의 함수로서의 표현(ne ) 및 (bg)의 측정이 가능하게 된다.
따라서, 상수(np ) 뿐만 아니라 하이브리드화의 자유 에너지의 함수로서의 (ne ) 및 (bg)의 값을 포함하는 상기 수학식 6의 파라미터를 정의하기 위해, 도 5에서 플로팅되어 제시된 데이터와 같이, 다중 표적 핵산을 위해 다양한 공지의 표적 핵산 농도에서 측정된 공지의 및 빈드(binned) 하이브리드화 자유 에너지 값의 함수로서 공지된 하이브리드화 강도 값이 사용될 수 있다. 일단 하이브리드화의 자유 에너지에 대해 (ne ) 및 (bg)의 함수 의존도를 위한 파라미터가 소정의 표적 핵산 세트를 위해 정의되면, 상응하는 (ne ) 및 (bg) 값을 결정하기 위해 임의의 하이브리드화 강도 값 및 하이브리드화 자유 에너지 값이 사용될 수 있다. 그 결과로서, 수학식 6이 표적 올리고뉴클레오타이드 농도를 결정하는데 사용될 수 있다.
특히, 도 5에 플로팅되어 제시된 바와 같은 데이터는 수학식 6에 정합되며, 아래 상세하게 기술되는 바와 같이 하이브리드화의 자유 에너지의 함수로서의 (ne ) 및 (bg)의 의존도를 기술하는 실험적 작용을 결정하는데 사용될 수 있다. (n'p )에 대한 상수 값도 또한 이 정합 절차를 통해 얻어진다. 도 5에서, 실선은 앞서 기술된 방식으로 수학식 6에 정합된 데이터의 가장 적합하게 정합된 값들을 나타낸다. 제시된 각각의 곡선은 하이브리드화 자유 에너지 값의 특정의 협소한 범위에 상응하는 빈드 데이터(도 5의 1.333 kcal.mol)를 나타낸다. 이와 같이, 각각의 별도의 하이브리드화 자유 에너지 범위 또는 빈은 특정의 (ne ) 및 (bg) 값을 갖는다.
일단 (ne ) 및 (bg)의 값이 각각의 하이브리드화 자유 에너지 빈에 대해 결정되면, (ne ) 및 (bg)의 값은 각각 도 6 및 7에 도시된 바와 같이 하이브리드화 자유 에너지와 상호 관련되어 있다. 도 6은 하이브리드화 자유 에너지의 네거티브 함수로서 변수(ne )를 도시하는 플롯이다. (ne )의 값은 각각의 하이브리드화 자유 에너지 빈의 값들이 감소함에 따라 감소한다. 도 7은 하이브리드화 자유 에너지의 네거티브 함수로서 변수(bg )를 도시하는 플롯이다. (bg )의 값은 각각의 하이브리드화 자유 에너지 빈의 값들이 감소함에 따라 증가한다. 각각의 하이브리드화 자유 에너지 빈에 대한 (ne ) 및 (bg)과 하이브리드화 자유 에너지의 상호 관계로부터, 함수 방정식이 결정될 수 있다. 예를 들면, 도 6 및 7에 제시된 데이터로부터, (ne )에 대한 함수 방정식은 3.1×105exp(-0.235ΔG)이고, (bg)에 대한 함수 방정식은 127+6×105exp(-0.423ΔG)이며, 여기서 ΔG는 하이브리드화 자유 에너지의 네거티브 값을 나타낸다. 상기 정합 절차로부터 수득된 (n'p )의 값은 9494이다.
하이브리드화의 자유 에너지의 함수로서 (ne ) 및 (bg) 표현을 사용하면, 수학식 6이 특정 표적 올리고뉴클레오타이드를 위한 프로브 스팟으로부터의 실험적으로 결정된 하이브리드화 강도 값, 및 상기 프로브 스팟의 하이브리드화 자유 에너지 값과 함께 사용되어 표적 올리고뉴클레오타이드 농도를 결정할 수 있다. 데이터가 단일 표적 핵산에 상응하는 다중 프로브 올리고뉴클레오타이드로부터 수거되는 경우, 상기 핵산의 농도에 대한 값이 결정된다. 본 발명의 한 실시양태에서, 다중 프로브 올리고뉴클레오타이드로부터 표적 핵산의 농도 수준을 결정하는 것은, 고려되는 표적 핵산의 영역에서 하이브리드화하는 각각의 프로브 스팟에 대해 수학식 6으로부터 수득된 값들을 평균화함으로써 달성될 수 있다.
본 발명의 다른 예시적인 실시양태에서, 특정 표적 핵산의 영역과 하이브리드화하는 모든 프로브 스팟의 하이브리드화 강도 값은 동시에 수학식 6에 정합될 수 있다. 소정의 샘플에 대한 표적 올리고뉴클레오타이드 농도를 결정하기 위해 수학식 6의 예시적인 사용이 도 8에 제시된다. 도 8은 단백질 포스포다이에스터라제 1A를 코딩하는 표적 핵산의 영역과 하이브리드화하는 프로브 스팟의 하이브리드화 강도 값을 제시한다. 상기 값들은 개별 프로브 스팟의 하이브리드화의 자유에너지의 함수로서 플로팅된다. 도 8에서 데이터를 수학식 6으로 정합시키면, 표적 올리고뉴클레오타이드 농도가 계산될 수 있다. 16개의 프로브 스팟이 이 특정 경우에 사용되었다. 모든 프로브 스팟의 하이브리드화 강도 값을 위한 최고 적합한 정합 선이 도 8에서 실선으로 제시된다.
예시적인 실시양태에서, 표적 핵산 농도를 예측하는 방법이 제공된다. 예시적인 방법에서, 표적 올리고뉴클레오타이드와 프로브 올리고뉴클레오타이드의 친화도 값의 척도가 결정된다. 핵산의 독특한 기대된 농도를 결정하기 위해 표적 핵산에 상응하는 다수의 프로브 스팟에 대해, 관찰된 하이브리드화 강도 값, 기대된 하이브리드화 강도 값 및 친화도 값의 척도가 비교된다.
다른 예시적인 실시양태에서, 본 발명의 방법은 다수의 프로브 올리고뉴클레오타이드를 포함한다. 또한, 프로브 올리고뉴클레오타이드에 대한 관찰된 하이브리드화 강도 값이 수득되며, 다수의 프로브 올리고뉴클레오타이드를 위한 표적 핵산 값의 농도 수준을 결정하고 표적 핵산의 다수의 농도 수준을 수득하기 위해, 관찰된 하이브리드화 강도 값이 사용된다. 표적 핵산의 전체 농도 수준을 결정하기 위해 표적 핵산의 다수의 농도 수준이 비교된다.
도 8에서 도시된 바와 같이, 분석에 영향을 미치게 되는 외부 데이터 지점이 생성될 수 있다. 따라서, 앞서 기술된 바와 같이, 교차-하이브리드화가 발생할 수 있다. 또한, 분석에 영향을 미치게 되는 배제(outlying) 데이터 지점을 통계학적으로 생성시키는 통계학적 변동이 발생할 수 있다. 상기 변화에 대해 순응시키기 위해, 상기 데이터에 대해 수학식 6을 가장 적합하게 정합시킴으로써 기대된 하이브리드화 강도 값으로부터의 예비 결정된 편차를 나타내는 모든 데이터 지점이 폐기되며, 나머지 하이브리드화 강도 값은 수학식 6으로 재정합된다. 따라서, 통계학적으로 배제되는 하이브리드화 강도 값들이 제거되고, 표적 핵산 농도는 다시 나머지 하이브리드화 강도 값을 사용하여 결정된다. 예시적 실시양태에서, 가장 적합한 정합 값으로부터의 데이터 지점의 평균 편차 이외의 표준 편차 이상의 모든 지점은 제거될 수 있다. 따라서, 표적 핵산 농도의 가장 적합한 정합 값을 사용하여 기대기고뉴클레오타이드 농도를 결정하기 위해, 표적 핵산과 하이브리드화하는 프로브 스팟의 16개의 하이브리드화 강도 값이 사용될 수 있다.
표적 올리고뉴클레오타이드 농도는 유전자 발현 수준에 근접하는 효과적이고 정확한 방법이다. 세포에서, 유전자는 전형적으로 유전자 물질의 전사, 즉 mRNA로의 DNA의 전사에 의해 발현된 후, 단백질로 해독된다. 세포 내용물을 샘플링하고 존재하는 mRNA 수준을 규정 및 정량화함으로써, 연구자들은 어느 유전자, 즉 어느 DNA가 세포에 의해 발현되는지에 대해 결정할 수 있다. 마이크로어레이의 사용으로 인해, 연구자들은 비교 유전자 발현 연구와 동시에 다양한 유전자를 연구할 수 있게 허용된다.
또한, 단일 프로브 스팟에서 변동이 발생할 수 있다. 특히, 프로브 스팟 상의 프로브 올리고뉴클레오타이드는 동일한 수의 뉴클레오타이드 염기를 포함하는 것을 목적으로 하지만, 다수가 그렇지는 않다. 각각의 프로브 스팟이 이상적으로는 25 뉴클레오타이드 염기 길이를 갖는 프로브 올리고뉴클레오타이드로 구성되는 아피메트릭스(등록상표) DNA 마이크로어레이 상에서, 사실상 프로브 올리고뉴클레오타이드의 단지 약 8%만이 실제적으로 25 뉴클레오타이드 염기 길이를 갖는다. 마이크로어레이에 대한 상세한 설명에서, 포만(J. E. Forman) 등의 문헌 ["Thermodynamics of Duplex Formation and Mismatch Discrimination on Photolithographically Synthesized Oligonucleotide Arrays," Molecular Modeling of Nucleic Acids, ACS Symposium Series, v. 692, p. 206 (1998)]을 참고하며, 이 개시내용은 본원에 참고로 인용한다. 따라서, DNA 마이크로어레이 상의 소정의 프로브 스팟 내의 프로브 올리고뉴클레오타이드 길이의 일정한 분포가 존재할 수 있다. 여러 길이의 프로브 올리고뉴클레오타이드의 분포가 존재하는 경우, 표적 올리고뉴클레오타이드 농도는 하기 수학식 7에 따라 결정될 수 있다.
Figure 112005028651506-pct00014
상기 식에서,
각각의 여러 프로브 올리고뉴클레오타이드 길이(i)에 있어서,
용어 ne (i)는 하이브리드화 강도 및 실제 표적 핵산 농도가 공지된 프로브 스팟으로부터의 데이터로부터 결정될 수 있다.
다른 실시양태에서, ne 의 값은 하기 수학식 8에서와 같이 평형 통계학적 역학으로부터 기대된 값으로 획득될 수 있다.
Figure 112005028651506-pct00015
상기 식에서,
변수(i)는 프로브 올리고뉴클레오타이드 내의 뉴클레오타이드 염기의 개수이다.
따라서, 값 prob(i)는 소정의 프로브 스팟 내의 프로브 올리고뉴클레오타이드가 특정 수의 뉴클레오타이드 염기를 갖는 확률, 즉 1 내지 25 뉴클레오타이드 염기의 길이이다.
본 발명의 예시적인 실시양태가 본원에 기술되어 있을지라도, 본 발명은 정확한 실시양태에 국한되지 않으며 다양한 다른 변화 및 변경이 당해 분야의 숙련자에 의해 발명의 범위 또는 취지로부터 벗어나지 않고서 실시될 수 있음을 이해할 것이다. 하기 실시예는 본 발명의 범위 및 취지를 예시하고자 제공된다. 이 실시예는 단지 예시적인 목적으로 제공되기 때문에, 그에 구체화된 본 발명은 이에 국한되지 않아야 한다.
아피메트릭스(등록상표)(www.affymetrix.com)로부터 공개적으로 입수 가능한 데이터를 사용하여 본 발명의 방법을 시험하였다. 상기 데이터는 농도가 공지된 표적 핵산의 약 840개의 측정치를 포함하였다. 특히, 각각의 공지된 농도에서, 각각이 특정 유전자를 코딩하는 각 14개의 표적 핵산의 2 내지 12 복제물을 나타내는 약 60개의 데이터가 존재하였다. 그 결과는 도 9에 제시한다. 도 9는, 공지된 표적 올리고뉴클레오타이드 농도와 비교하는 경우, 본 발명 및 아피메트릭스(등록상표) 방법에 의해 결정된 표적 올리고뉴클레오타이드 농도를 도시하는 플롯이다. 특히, 도 9는 본 발명 및 또는 아피메트릭스(등록상표) 마이크로어레이 수트(Microarray Suite) V. 5 분석에 따른 공개적으로 입수 가능한 데이터를 사용하여, 공지된 표적 올리고뉴클레오타이드 농도에서 결정된 평균의 표적 올리고뉴클레오타이드 농도 값을 도시한다. 결정된 표적 핵산 농도와 공지된 표적 핵산 농도 사이의 완벽한 선형은, 공지된 표적 핵산 농도 및 결정된 표적 핵산 농도가 모두 대수 계산자(logarithmic scale) 상에서 플로팅한 플로트에서 단일한 경사도를 생성시킨다.
아피메트릭스(등록상표) 방법에 따라, 개별 프로브 스팟을 쌍으로 군집시켜 유전자 발현 수준을 결정하였다. 각 쌍의 프로브 스팟은 소정의 개별 표적 올리고뉴클레오타이드 서열에 정확하게 상보적인 개별 올리고뉴클레오타이드 프로브 서열을 포함하며, 이는 완벽한 매치 올리고뉴클레오타이드 서열(이하 본원에서 "완벽 매치 서열"로 지칭함)로 지칭한다. 각 쌍의 올리고뉴클레오타이드 프로브 서열은 또한 소정의 개별 표적 올리고뉴클레오타이드 서열 내의 상응하는 뉴클레오타이드 염기에 상보적이지 않은 정확하게 하나의 뉴클레오타이드 염기를 갖는 하나의 개별 프로브 올리고뉴클레오타이드 서열을 포함하며, 이는 미스매치 올리고뉴클레오타이드 서열(이하 본원에서 "미스매치 서열"로 지칭함)로 지칭한다. 따라서, 미스매치 서열은 완벽 매치 서열과 동일한 뉴클레오타이드 염기 서열을 갖지만, 하나의 미스매치 뉴클레오타이드 염기는 제외된다. 완벽 매치 서열로의 표적 올리고뉴클레오타이드 서열의 하이브리드화의 정도와 미스매치 서열로의 표적 올리고뉴클레오타이드 서열의 하이브리드화의 정도 사이의 차이를 사용하여 상응하는 유전자의 발현 수준을 결정할 수 있다. 본원에 기술된 본 발명이 분석을 위한 미스매치 서열 프로브 스팟 하이브리드화 강도를 이용하지 않지만, 당해 분야의 숙련자에게는, 각각의 프로브 올리고뉴클레오타이드 서열에 대한 관찰된 하이브리드화 강도 측정치에서와 같이, 완벽 매치 서열 프로브 스팟 하이브리드화 강도와 상응하는 미스매치 서열 프로브 스팟 하이브리드화 강도 사이의 차이가 본 발명 내에 혼입될 수 있음을 이해한다.
도 9에 도시된 바와 같이, 본 발명을 사용하여 결정된 대수 계산자 상의 공지된 표적 핵산 농도에 대해 플로팅된 계산된 표적 핵산 농도를 위한 경사도는 1.08이다. 대수 계산자 상의 공지된 표적 핵산 농도에 대해 플로팅된 계산된 표적 핵사 농도를 위한 경사도는 아피메트릭스(등록상표) 분석을 사용하면 0.71이다. 따라서, 공지된 핵산 농도의 함수로서 계산된 표적 핵산 농도의 선형 반응과 관련하여, 본 발명을 사용하면 더욱 정확한 계산된 값을 수득한다.

Claims (17)

  1. 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하는 방법으로서,
    상기 표적 올리고뉴클레오타이드의 프로브 올리고뉴클레오타이드에 대한 친화도 값의 척도(measure)를 결정하는 단계,
    프로브 스팟(spot)에서 상기 표적 올리고뉴클레오타이드 및 상기 프로브 올리고뉴클레오타이드의 하이브리드화 강도 값을 결정하는 단계, 및
    상기 친화도 값의 척도 및 상기 하이브리드화 강도 값을 사용하여 상기 표적 핵산의 농도 수준을 결정하는 단계를 포함하는 표적 핵산의 농도 수준 결정 방법.
  2. 제 1 항에 있어서,
    상기 친화도 값의 척도가 상기 표적 올리고뉴클레오타이드와 상기 프로브 올리고뉴클레오타이드의 하이브리드화의 자유 에너지를 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  3. 제 1 항에 있어서,
    상기 친화도 값의 척도가 상기 표적 올리고뉴클레오타이드와 상기 프로브 올리고뉴클레오타이드의 하이브리드화의 순수 속도(net rate)를 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  4. 제 1 항에 있어서,
    상기 방법이 다수의 프로브 스팟에 대해 실시되는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  5. 제 4 항에 있어서,
    상기 다수의 프로브 스팟이 마이크로어레이(microarray)에 부착되는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  6. 제 1 항에 있어서,
    상기 하이브리드화 강도 값이 형광(fluorescence)을 사용하여 결정되는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  7. 제 1 항에 있어서,
    다수의 친화도 값의 척도, 하이브리드화 강도 값 및 표적 핵산의 농도 수준을 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  8. 제 7 항에 있어서,
    상기 다수의 하이브리드화 강도 값들을 비교하여 전체 하이브리드화 강도 값을 결정하는 단계를 추가로 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  9. 제 1 항에 있어서,
    다수의 프로브 올리고뉴클레오타이드를 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  10. 제 1 항에 있어서,
    상기 표적 올리고뉴클레오타이드의 프로브 올리고뉴클레오타이드에 대한 친화도 값의 척도를 결정하는 단계가, 공지된 표적 핵산 농도에서 관찰된 하이브리드화 강도 값과 프로브 올리고뉴클레오타이드 서열을 상호관련시키는 단계를 추가로 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  11. 제 1 항에 있어서,
    상기 친화도 값의 척도가 하이브리드화의 물리적 원리에 기초하여 계산되는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  12. 제 9 항에 있어서,
    (i) 상기 프로브 스팟에서 상기 프로브 올리고뉴클레오타이드에 대해 관찰된 하이브리드화 강도 값을 수득하는 단계,
    (ii) 상기 관찰된 하이브리드화 강도 값을 사용하여 상기 표적 핵산의 농도 수준을 결정하는 단계,
    (iii) 상기 단계 (i) 및 (ii)를 상기 다수의 프로브 올리고뉴클레오타이드에 대해 수행하여 상기 표적 핵산의 다수의 농도 수준을 수득하는 단계, 및
    (iv) 상기 표적 핵산의 다수의 농도 수준들을 비교하여 상기 표적 핵산의 전체 농도 수준을 결정하는 단계를 추가로 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  13. 제 12 항에 있어서,
    상기 단계(ii)가, 통계학적으로 배제되는 관찰된 하이브리드화 강도 값을 갖는 프로브 스팟을 제거하는 단계를 추가로 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 결정 방법.
  14. 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 예측하는 방법으로서,
    (i) 프로브 스팟에서 상기 표적 올리고뉴클레오타이드의 프로브 올리고뉴클레오타이드에 대한 친화도 값의 척도를 결정하는 단계,
    (ii) 관찰된 하이브리드화 강도 값을 수득하는 단계,
    (iii) 기대된 하이브리드화 강도 값을 결정하는 단계, 및
    (iv) 다수의 프로브 스팟에 대해 상기 친화도 값의 척도, 상기 관찰된 하이브리드화 강도 값 및 상기 기대된 하이브리드화 강도 값을 비교하여 유일한 예측 표적 핵산 농도를 결정하는 단계를 포함하는 표적 핵산의 농도 수준 예측 방법.
  15. 제 14 항에 있어서,
    상기 단계(ii)가, 다수의 프로브 스팟으로부터, 통계학적으로 배제되는 관찰된 하이브리드화 강도 값을 갖는 프로브 스팟을 제거하는 단계를 추가로 포함하는 것을 특징으로 하는 표적 핵산의 농도 수준 예측 방법.
  16. 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하는 장치로서,
    메모리, 및 상기 메모리에 연결된 하나 이상의 프로세서를 포함하되,
    상기 하나 이상의 프로세서가 작동하여, 상기 표적 올리고뉴클레오타이드의 프로브 올리고뉴클레오타이드에 대한 친화도 값의 척도를 결정하고, 프로브 스팟에서 상기 표적 올리고뉴클레오타이드 및 상기 프로브 올리고뉴클레오타이드의 하이브리드화 강도 값을 결정하고, 상기 친화도 값의 척도 및 상기 하이브리드화 강도 값을 사용하여 상기 표적 핵산의 농도 수준을 결정하는 것을 특징으로 하는 표적 핵산의 농도 수준 측정 장치.
  17. 하나 이상의 표적 올리고뉴클레오타이드를 포함하는 표적 핵산의 농도 수준을 결정하기 위한 하나 이상의 프로그램이 포함된 기계-판독 가능한 매체로서,
    상기 하나 이상의 프로그램이 실행되는 경우
    상기 표적 올리고뉴클레오타이드의 프로브 올리고뉴클레오타이드에 대한 친화도 값의 척도를 결정하는 단계,
    프로브 스팟에서 상기 표적 올리고뉴클레오타이드 및 상기 프로브 올리고뉴클레오타이드의 하이브리드화 강도 값을 결정하는 단계, 및
    상기 친화도 값의 척도 및 상기 하이브리드화 강도 값을 사용하여 상기 표적 핵산의 농도 수준을 결정하는 단계를 실행시키는 기계-판독 가능한 매체.
KR1020057009772A 2002-12-31 2003-12-05 유전자 발현 수준을 결정하기 위한 방법 및 장치 KR100772435B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US43723202P 2002-12-31 2002-12-31
US60/437,232 2002-12-31
US10/365,891 US6816790B2 (en) 2002-12-31 2003-02-13 Method and apparatus for determining gene expression levels
US10/365,891 2003-02-13

Publications (2)

Publication Number Publication Date
KR20050084054A KR20050084054A (ko) 2005-08-26
KR100772435B1 true KR100772435B1 (ko) 2007-11-01

Family

ID=32658869

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057009772A KR100772435B1 (ko) 2002-12-31 2003-12-05 유전자 발현 수준을 결정하기 위한 방법 및 장치

Country Status (5)

Country Link
US (1) US6816790B2 (ko)
KR (1) KR100772435B1 (ko)
AU (1) AU2003298934A1 (ko)
TW (1) TWI282859B (ko)
WO (1) WO2004061076A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050221281A1 (en) * 2003-01-08 2005-10-06 Ho Winston Z Self-contained microfluidic biochip and apparatus
US7122153B2 (en) * 2003-01-08 2006-10-17 Ho Winston Z Self-contained microfluidic biochip and apparatus
US20090105092A1 (en) * 2006-11-28 2009-04-23 The Trustees Of Columbia University In The City Of New York Viral database methods
JP2010514804A (ja) * 2006-12-29 2010-05-06 ザ・ソーク・インスティチュート・フォー・バイオロジカル・スタディーズ 運動能力を高めるための方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6251601B1 (en) 1999-02-02 2001-06-26 Vysis, Inc. Simultaneous measurement of gene expression and genomic abnormalities using nucleic acid microarrays
US6516276B1 (en) 1999-06-18 2003-02-04 Eos Biotechnology, Inc. Method and apparatus for analysis of data from biomolecular arrays
US20030186234A1 (en) * 2000-12-13 2003-10-02 Nurith Kurn Methods and compositions for generation of multiple copies of nucleic acid sequences and methods of detection thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
US6510391B2 (en) * 2000-11-22 2003-01-21 Affymetrix, Inc. Computer software products for nucleic acid hybridization analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6251601B1 (en) 1999-02-02 2001-06-26 Vysis, Inc. Simultaneous measurement of gene expression and genomic abnormalities using nucleic acid microarrays
US6516276B1 (en) 1999-06-18 2003-02-04 Eos Biotechnology, Inc. Method and apparatus for analysis of data from biomolecular arrays
US20030186234A1 (en) * 2000-12-13 2003-10-02 Nurith Kurn Methods and compositions for generation of multiple copies of nucleic acid sequences and methods of detection thereof

Also Published As

Publication number Publication date
US6816790B2 (en) 2004-11-09
AU2003298934A1 (en) 2004-07-29
TWI282859B (en) 2007-06-21
AU2003298934A8 (en) 2004-07-29
WO2004061076A3 (en) 2005-01-06
US20040128082A1 (en) 2004-07-01
WO2004061076A2 (en) 2004-07-22
TW200502825A (en) 2005-01-16
KR20050084054A (ko) 2005-08-26

Similar Documents

Publication Publication Date Title
US6988040B2 (en) System, method, and computer software for genotyping analysis and identification of allelic imbalance
Causton et al. Microarray gene expression data analysis: a beginner's guide
US7013221B1 (en) Iterative probe design and detailed expression profiling with flexible in-situ synthesis arrays
Gibson Microarrays in ecology and evolution: a preview
AU2011207561B2 (en) Partition defined detection methods
US20050159896A1 (en) Apparatus and method for analyzing data
Shaw et al. Comparative genomic hybridisation using a proximal 17p BAC/PAC array detects rearrangements responsible for four genomic disorders
CA2795554A1 (en) Gene-expression profiling with reduced numbers of transcript measurements
US6850846B2 (en) Computer software for genotyping analysis using pattern recognition
KR100772435B1 (ko) 유전자 발현 수준을 결정하기 위한 방법 및 장치
US20070203653A1 (en) Method and system for computational detection of common aberrations from multi-sample comparative genomic hybridization data sets
CA2379212A1 (en) Methods for determining the specificity and sensitivity of oligonucleotides for hybridization
Peiffer et al. Design of tag SNP whole genome genotyping arrays
US20080269063A1 (en) Method and system for preparing a microarray for a disease association gene transcript test
Lockhart et al. DNA arrays and gene expression analysis in the brain
Kelley et al. Correcting for gene-specific dye bias in DNA microarrays using the method of maximum likelihood
Dannemann et al. The effects of probe binding affinity differences on gene expression measurements and how to deal with them
US20060259251A1 (en) Computer software products for associating gene expression with genetic variations
DeSantis et al. A latent class model with hidden Markov dependence for array CGH data
Katagiri et al. Overview of m RNA Expression Profiling Using Microarrays
US20030144799A1 (en) Regulatory single nucleotide polymorphisms and methods therefor
US20070128611A1 (en) Negative control probes
Pan et al. Clustering gene expression data based on predicted differential effects of GV interaction
Agapito et al. Parallel and Distributed Analysis of Microarray Data
JP2001346599A (ja) 遺伝子発現分析のためのシステムおよびコンピュータソフトウェアプロダクト

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee