KR20060120063A - 생물학적 특징의 탐지 시스템 및 생물학적 특징 탐지 방법 - Google Patents

생물학적 특징의 탐지 시스템 및 생물학적 특징 탐지 방법 Download PDF

Info

Publication number
KR20060120063A
KR20060120063A KR1020067008396A KR20067008396A KR20060120063A KR 20060120063 A KR20060120063 A KR 20060120063A KR 1020067008396 A KR1020067008396 A KR 1020067008396A KR 20067008396 A KR20067008396 A KR 20067008396A KR 20060120063 A KR20060120063 A KR 20060120063A
Authority
KR
South Korea
Prior art keywords
model
biological
organism
species
cellular
Prior art date
Application number
KR1020067008396A
Other languages
English (en)
Inventor
글렌다 쥐 안데르센
Original Assignee
패스워크 인포메틱스 아이엔씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/861,177 external-priority patent/US8321137B2/en
Priority claimed from US10/861,216 external-priority patent/US20050069863A1/en
Application filed by 패스워크 인포메틱스 아이엔씨 filed Critical 패스워크 인포메틱스 아이엔씨
Publication of KR20060120063A publication Critical patent/KR20060120063A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design

Abstract

메모리를 구비하는 컴퓨터는 데이터를 받는 것을 위한 명령들을 저장한다. 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소 중에서 각각의 세포 요소의 하나 또는 그 이상의 특징들을 포함한다. 상기 메모리는 복수 개의 모델들 중에서 하나의 모델을 평가하는 것을 위한 명령들을 포함한다. 상기 모델에 대한 평가에서, 모델은 테스트 유기체 또는 생물학적 테스트 표본에서의 생물학적 특징의 존재 가능성을 나타내는 모델 스코어에 의해서 특성화된다. 모델에 대한 평가는 복수 개의 세포 요소 중에서 하나 또는 그 이상의 세포 요소의 하나 또는 그 이상의 특징들을 사용하여 모델 스코어를 결정하는 것을 포함한다. 또한 상기 메모리는 한 번 또는 그 이상 평가하기 위한 명령들을 반복하기 위한 명령들을 저장하고 그것에 의해서 복수 개의 모델들을 평가한다. 또 메모리는 평가된 모델 스코어를 커뮤니케이트하기 위한 명령들을 저장한다.

Description

생물학적 특징의 탐지 시스템 및 생물학적 특징 탐지 방법{SYSTEMS AND METHODS FOR DETECTING BIOLOGICAL FEATURES}
본 발명은 생물학적 표본에서의 질병과 같은 생물학적 특징을 확인하는 컴퓨터 시스템 및 방법에 관한 것이다.
질병을 효율적으로 치료하는 첫 번째 단계는 환자가 어떤 질병을 갖고 있는지 결정하고 다양한 치료법에 대한 환자의 반응을 예측하기 위해 환자의 질병을 분류하는 것이다. 그러한 단계의 효율성은 분류의 질에 의존한다. 적어도 암의 경우는, 종양(tumor) 세포로부터 DNA, RNA 또는 단백질을 분석하는 마이크로어레이법(microarray method)의 출현으로, 암세포의 분류는 개선되기 시작했다. (예를 들어, Gloub et al., 1999, Science 286, P. 531. 참조.)
게다가, van't Veer et al., 2002, Nature 415, p. 530에서는 "분자 프로파일링(molecular profiling)"이 암 분류를 어떻게 개선시키는지를 설명한다. Van't Veer et al.에서는 유방 종양이 외과적으로 제거된 후 수행되는 유방 종양에 대한 유전자-발현 프로파일링(gene-expression profiling)의 결과가 어떤 환자가 임상적인 전이(clinical metastasis)(종양의 다른 곳으로의 전염)를 일으키게 되는지를 예측하는데 사용될 수 있다는 것을 설명한다. 각각의 유방암 환자에 대한 치료는 종양의 양, 암 세포가 예비의 림프 노드(auxiliary lymph node)로 번지는지, 얼마나 많은 노드가 포함되는지, 멀리까지 임상적인 전이가 일어났는지와 같은 다양한 표준에 따라 선택된다. 아무런 전이의 증거를 갖지 않은 여성에게 있어서, 질병의 치료에 목적을 둔 치료법의 가장 주된 것은 종양을 제거하고 방사선치료를 하는 것이다. 불행하게도, 이런 환자들 중 일부는 나중에 임상적인 전이가 발생하게 된다. 그래서, 수술 후에 최초 종양(the primary tumor)으로부터 이미 번졌을지도 모르는 암 세포에 대한 보조적인 치료를 요구하는 여성을 확인할 필요가 있다. 예를 들어, Caldas and Aparicio, 2002, Nature 415, p. 484 및 Goldhirschet al. 1998, J. Natl. Cancer Inst. 90, p. 1601. 참조.
보조적인 치료는 혈액을 통해 암 세포로 도달하는 에스트로겐 모듈레이터(oestrogen modulator) 또는 시토톡식 약제(cytotoxic drug)와 같은 약제를 사용한다. 그런 치료법들은 종종 독성의 부작용을 가진다. 그러한 치료를 필요로하는 여성을 확인하는 것은 다양한 임상적이고 조직병리학적인 지표(예를 들어, 환자의 나이, 암 세포가 그들의 보통의 세포와 닮은 정도, '종양의 등급(tumor grade) 및 암세포가 에스트로겐 수용체를 표현하는지 여부)에 의존한다. 그러나, 이들 지표들은 함께 사용될지라도 매우 열악한 예측력을 나타낸다. 그래서, 수술 및 방사선치료에 의해 치료된 많은 환자들이 필수적이지 않은 독성의 보조 치료를 받는다. 다른 연구들 뿐만 아니라 "van't Veer et al., 2002, Nature 415, p. 530"의 결과 또한 한 명의 환자로부터의 채취된 생물학적인 표본(예를 들어 종양)을 복수의 생물학적인 샘플 군(예를 들어 보조적인 치료를 요하는 유방암과 그렇지 않은 유방암) 으로 특징지으려고 시도하는 분류안(classification scheme)에 사용되고 있다. 아본 재단(Avon Foundation), 밀레늄 파마슈티컬스, 암 연구 및 치료를 위한 유럽 조직(the European Organization for Research and Treatment of Cancer) 및 미국 국립 암센터(the National Cancer Institute)와 같은 회사나 조직에 의해 투자된 임상적인 수많은 시도가 그런 분류안을 발견하고 실증하기 위해 현재 진행 중에 있다.
수많은 생물학적인 분류안이 유방암에 대해 적용 가능하다. 예를 들어, "Ramaswamy et al., 2003, Nature Genetics 33, p. 49"는 전이선암(metastatic adenocarcinomas)으로부터 최초선암을 구별하는 유전자-발현 서명(gene-expression signature)을 제공한다. "Su etal., 2001, Cancer Research 61, p. 7388"은 전립선(prostate), 유방(breast), 폐(lung), 난소(ovary), 결장(colorectum), 신장(kidney), 췌장(pancreas), 방광(bladder), 수뇨관(ureter) 및 가스트로소페거스(astroesophagus)의 암(carcinomas)을 확인하기 위한 1세대 분자 분류안을 확립하기 위해 대규모 RNA 프로파일링(large-scale RNA profiling)과 관리된 알고리즘(machine-learning algorithm)의 사용을 설명한다. 상기 분자 분류안은 최초 종양의 기원이 밝혀지지 않는 전이암을 분석하는데 유용하다. "Wilson etal., 2002, American Journal of Pathology 161"은 결절-양성(node-positive) 유방암 환자의 감소된 생존율과 관련된 HER2/neu 양성 조직의 발현 서명 특징(expression signature characteristic)을 제공한다. "Richer etal., 2002, The Journal of Biological Chemistry 277, p. 5209"은 프로게스테론 수용체-A(PR-A) 및 프로게스 테론 수용체-B(PR-B)를 과도하게 발현하는(over-expressing) 인간 유방암 세포에 대한 유전적 서명을 제공한다. 하나 또는 다른 PR 이소폼(isoform)의 과도한 양은 차이하는 예후(prognostic)를 갖는 종양과 두 개의 PR 이소폼의 동등한 몰수를 갖는 종양으로부터 호르몬 민감성 프로파일(hormone-responsiveness profile)을 야기하게 된다. "Gruvberger etal., 2001, Cancer Research 61, p.5979"은 에스트로겐 수용체 상태에 근거한 종양을 식별하는 DNA 미세배열 데이터(DNA microarray data)에 근거한 분자 분류(molecular classification)를 제공한다. 위에서 설명한 생물학적 분류안은 유방암에 유용한 많은 생물학적 분류안을 단지 표본화한 것이다. 게다가, 유방암은 흥미로운 많은 생물학적 분류들을 대표한다. 다른 대표적인 생물학적 분류는 일반적으로 암의 분류와 더 일반적으로는 질병의 분류를 포함한다. 전술한 이와 같은 생물학적인 분류안에 있어서의 하나의 문제는 그들이 특수한 정보(예를 들어, 미세배열 데이터)를 필요로 한다는 것이다. 그래서, 생물학적 표본의 특징을 설명하려는 노력하에서, 각각의 생물학적인 분류안에 대한 특수화된 입력과 출력 정보는 해독되어야 한다. 그러한 장벽 때문에, 의료 관계자들은 통상적으로 그런 생물학적인 분류안의 제한된 일부만 사용한다.
그래서, 이러한 배경하에서 당업계에서 요구되는 것은 표본들을 생물학적 군들로 분류하는 데에 유용한 생물학적인 분류안을 만드는 개선된 방법이다.
여기서, 참고 문헌에 대한 논의 및 인용은 그 참고 문헌이 본 발명에 대한 선행 기술임을 인정하는 것으로 해석되어져서는 안된다.
본 출원은 여기에서 참조에 의해 전체로서 통합된 2004년 6월 5일 출원된 미국 가출원 번호 "60/577,416"의 이익을 35 U. S. C. 119 (e) 아래에서 청구한다. 본 출원은 여기에서 참조에 의해 전체로서 통합된 2003년 9월 29일에 출원된 미국 가출원 번호 "60/507,381"의 이익을 35 U. S. C. 119 (e) 아래에서 청구한다. 본 출원은 역시 여기에서 참조에 의해 전체로서 통합된 2003년 9월 29일에 출원된 미국 가출원 번호 "60/507,445"의 이익을 35 U. S. C. 119 (e) 아래에서 청구한다. 본 출원은 여기에서 참조에 의해 전체로서 통합된 2004년 6월 4일 출원된 미국 특허 제 "10/861,216"의 CIP이다. 본 출원은 여기에서 참조에 의해 전체로서 통합된 2004년 6월 4일 출원된 미국 특허 제 "10/861,177"의 CIP이다.
본 발명의 첫번째 실시예는 중앙 프로세싱 유닛 및 상기 중앙 프로세싱 유닛(central processing unit)에 연결된 메모리(memory)를 포함하는 컴퓨터를 제공한다. 상기 메모리는 데이터를 받는 것을 위한 명령들을 저장한다. 그러한 명령들에서 데이터는 하나의 종의 테스트 유기체(test organism of a species) 또는 그 종의 유기체로부터의 생물학적인 테스트 표본(test biological specimen)에서 측정되는 복수 개의 세포 요소(cellular constituent)들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징들을 포함한다. 상기 메모리는 또한 복수개의 모델에서 하나의 모델을 평가하는 것을 위한 명령들들을 저장한다. 그 명령들들에서 상기 모델은 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어(model score)에 의해 특징지워진다. 모델에 대한 평가는 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함한다. 메모리는 또한 한번 또는 수차례 평가하는 것을 위한 명령들을 반복하는 것을 위한 명령들을 포함하며, 그것에 의해 복수개의 모델을 평가한다. 역시 평가된 모델 스코어의 각각을 커뮤니케이트시키기 위한 명령들이 메모리에 저장된다.
몇몇 실시예에서, 두 개 또는 그 이상의 모델 스코어는 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트된다. 그리고, 이들 둘 또는 그 이상의 모델 스코어에서 모델 스코어의 각각은 다양한 모델들 중에서 차이나는 모델에 대응한다. 몇몇 실시예에서 다섯 또는 그 이상의 모델 스코어는 평가를 위한 명령들에 의해 평가된다. 그리고, 다섯 또는 그 이상의 모델 스코어 중에서 각각의 모델 스코어는 복수 개의 모델들 중에서 차이나는 모델에 대응한다.
몇몇 실시예에서, 데이터를 받는 것을 위한 명령들은 인터넷과 같은 광범위 네트워크를 통해 리모트 컴퓨터(remote computer)로부터 데이터를 받는 것을 위한 명령들을 포함한다. 몇몇 실시예에서, 평가를 위한 명령들은 인터넷과 같은 광범위 네트워크를 통해 리모트 컴퓨터에 각각의 모델스코어를 전달하는 것을 위한 명령들을 포함한다.
몇몇 실시예에서, 테스트 유기체와 생물학적인 테스트 표본은 모델 스코어가 첫번째 범위의 값에 있는 경우 복수개의 모델 중 그 모델에 의해 표현되는 생물학적인 특징을 갖는 것으로 간주되고, 모델 스코어가 두 번째 범위의 값에 있는 경우는 그 모델에 의해서 표현되는 생물학적인 특징을 갖지 않는 것으로 간주된다. 몇몇 실시예에서, 그러한 생물학적인 특징은 암(예를 들어, 유방암, 폐암, 전립선암, 결장(colorectal)암, 난소암, 방광암, 위암, 직장암 등)과 같은 질병이다.
몇몇 실시예에서, 복수개의 모델은 첫번째 모델 스코어에 의해 특징지워지는 첫번째 모델과 두번째 모델 스코어에 의해서 특징지워지는 두번째 모델을 포함한다. 그리고, 하나 또는 그 이상의 특징이 첫번째 모델 스코어를 평가하기 위해 사용되어지는 세포 요소의 특성(identity)은 하나 또는 그 이상의 특징이 두번째 모델 스코어를 평가하기 위해 사용되어지는 세포 요소의 독자성과 차이가 있다.
몇몇 실시예에서, 복수개의 모델에서 하나의 모델의 모델 스코어를 결정하기 위해 사용되는 하나 또는 그 이상의 세포 요소들의 하나 또는 그 이상의 특징들 중에서 하나의 특징은 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 하나 또는 그 이상의 세포 요소의 어번던스(abundance)를 포함한다. 몇몇 예에서, 그 종은 인간이다. 몇몇 예에서, 생물학적인 테스트 표본은 바이옵시(biopsy) 또는 종양, 혈액, 뼈, 유방, 폐, 전립선, 콜로렉텀, 난소, 방광, 위 또는 직장으로부터의 샘플의 다른 형태이다.
몇몇 실시예에서, 하나 또는 그 이상의 특징들은 다량의 세포 요소(cellular constituent abundance)를 포함한다. 그리고, 데이터는 그 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적인 표본에서 적어도 백 개의, 적어도 오백개의, 적어도 오천 개의 또는 천 또는 이천 개 사이의 세포 요소의 어번던스(abundance)를 포함한다. 몇몇 실시예에서, 복수개의 세포 요소에서 하나의 세포요소는 mRNA,cRNA 또는 cDNA이다.
본 발명의 몇몇 실시에에서, 하나 또는 그 이상의 세포 요소들 중의 하나의 세포 요소는 핵산(nucleic acid) 또는 리보핵산(ribonucleic acid)이다. 그리고, 그 세포 요소의 하나 또는 그 이상의 특징들 중 하나의 특징은 테스트 유기체 또는 생물학적인 테스트 표본에서의 전부 또는 일부의 세포 요소의 전사 상태(transcriptional state)를 측정함에 의해서 얻어질 수 있다. 몇몇 실시에에서, 하나 또는 그 이상의 세포 요소들 중의 하나의 세포 요소는 단백질이다. 그리고, 세포 요소의 하나 또는 그 이상의 특징들 중의 하나의 특징은 테스트 유기체 또는 생물학적인 테스트 표본에서의 세포 요소의 전사 상태를 측정함에 의해 얻어진다. 몇몇 실시에에서, 복수개의 세포 요소들 중에서 하나의 세포 요소의 하나 또는 그 이상의 특징들 중에서 하나의 특징은 ICAT(isotope-coded affinity tagging)을 사용하여 결정될 수 있다. 테스트 유기체 또는 생물학적인 테스트 표본으로부터 얻어지는 샘플을 사용하는 세포 요소의 텐덤 매스 스펙트로메트리 분석(andem mass spectrometry analysis)은 상기 ICAT(isotope-coded affinity tagging) 후에 이루어진다. 몇몇 실시예에서, 복수개의 세포 요소들 중 하나의 세포 요소의 하나 또는 그 이상의 특징들 중 하나의 특징은 테스트 유기체 또는 생물학적인 테스트 표본으로부터 얻어지는 샘플에서 세포 요소의 활동(activity) 또는 후-번역 모디피케이션(post-translational modification)에 의해서 결정된다.
몇몇 실시예에서, 생물학적인 특징은 약물에 대한 민감성이다. 몇몇 실시예에서, 모델 스코어가 평가를 위한 명령들들의 예들에 의해서 평가되는 복수 개의 모델들은 공동으로 둘 또는 그 이상의 생물학적인 특징의 존재 또는 부존재를 나타낸다. 몇몇 실시예에서, 상기 둘 또는 그 이상의 생물학적인 특징들에서 각각의 특징은 암의 기원(cancer origin)이다. 몇몇 실시에에서 상기 둘 또는 그 이상의 생물학적인 특징은 첫 번째 질병과 두 번째 질병을 포함한다.
몇몇 실시예에서, 평가를 위한 명령들의 예에 의해서 모델 스코어가 평가되는 복수개의 모델은 공동으로 다섯 또는 그 이상의 생물학적인 특징의 존재 또는 부존재를 나타낸다. 몇몇 실시에에서, 상기 다섯 또는 그 이상의 생물학적인 특징의 각각은 차이나는 암의 원인을 나타낸다. 몇몇의 예에서, 상기 다섯 또는 그 이상의 생물학적인 특징은 첫 번째 질병과 두 번째 질병을 포함한다.
몇몇 실시예에서, 평가를 위한 명령들의 예에 의해서 모델 스코어가 평가되는 복수개의 모델은 공동으로 2 내지 20개의 생물학적인 특징의 존재 또는 부존재를 나타낸다. 몇몇 실시예에서, 2 내지 20개의 생물학적인 특징들에서 각각의 생물학적인 특징은 암의 원인이다. 몇몇 실시예에서,2 내지 20개의 생물학적인 특징은 첫 번째 질병과 두 번째 질병을 포함한다.
본 발명의 또 다른 양상은 중앙 처리 유닛(central processing unit)과 상기 중앙 처리 유닛에 연결된 메모리를 포함하는 컴퓨터를 포함한다. 메모리는 데이터를 받는 것을 위한 명령들들을 저장한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징들을 포함한다. 상기 메모리는 복수 개의 모델들을 평가하는 것을 위한 명령들을 저장한다. 복수 개의 모델들 중에서 각각의 모델은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해서 특징지워진다. 복수개의 모델에서 각각의 모델에 대한 평가는 복수개의 세포 요소들 중의 하나 또는 그 이상의 세포 요소들에 대한 하나 또는 그 이상의 특징을 사용하여 각각의 모델과 관련된 모델 스코어를 결정하는 것을 포함한다. 상기 메모리는 평가를 위한 명령들의 예에서 평가된 각각의 모델 스코어를 평가하는 것을 위한 명령들을 저장한다.
본 발명의 또 다른 양상은 컴퓨터 시스템과 연결하여 사용하는 것을 위한 컴퓨터 프로그램 프로덕트(computer program product)를 포함한다. 상기 컴퓨터 프로그램 프로덕트는 컴퓨터 가독성 저장 매체(computer readable storage medium)와 거기에 저장되는(embedded) 컴퓨터 프로그램 메커니즘(computer program mechanism)을 포함한다. 컴퓨터 프로그램 메커니즘은 데이터를 받는 것을 위한 명령들을 포함한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 복수개의 모델에서 하나의 모델을 평가하기 위한 명령들들을 포함한다. 모델은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해 특징지워진다. 그리고, 그 모델에 대한 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소들에 대한 하나 또는 그 이상의 특징들을 사용하여 모델 스코어를 결정하는 것을 포함한다. 컴퓨터 프로그램 프로덕트는 또한 한 번 이상 평가하는 것을 위한 명령들을 반복하는 것을 위한 명령들을 포함한다. 그를 통해 복수 개의 모델들에 대해 평가한다. 컴퓨터 프로그램 프로덕트는 또한 평가를 위한 명령들에 의해서 평가된 각각의 모델 스코어를 결합하는 것을 위한 명령들을 포함한다.
본 발명의 또 다른 양상은 컴퓨터 시스템과 결합하여 사용하는 것을 위한 컴퓨터 프로그램 프로덕트를 제공한다. 상기 컴퓨터 프로그램 프로덕트는 컴퓨터 가독성 저장 매체(computer readable storage medium) 및 거기에 저장되는(embedded) 컴퓨터 프로그램 메커니즘(computer program mechanism)을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 데이터를 받는 것을 위한 명령들을 포함한다. 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징들을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 복수개의 모델을 평가하기 위한 명령들을 포함한다. 복수 개의 모델들 중에서 각각의 모델은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해서 특징지워진다.
복수개의 모델에서 각각의 모델에 대한 평가는 복수개의 세포 요소들 중의 하나 또는 그 이상의 세포 요소들에 대한 하나 또는 그 이상의 특징을 사용하여 각각의 모델과 관련된 모델 스코어를 결정하는 것을 포함한다. 컴퓨터 프로그램 메커니즘은 평가를 위한 명령들에 의해 평가된 모델 스코어를 평가하는 것을 위한 명령들을 포함한다.
본 발명의 또 다른 양상은 데이터가 얻어지는 방법을 포함한다. 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정된 복수개의 세포 요소에서 각각의 세포 요소들의 하나 또는 그 이상의 특징들을 포함한다. 상기 방법은 복수 개의 모델들 중에서 하나의 모델을 평가하는 것을 포함한다. 상기 모델은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해서 특징지워진다. 모델에 대한 평가는 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징들을 사용하여 모델 스코어를 결정하는 것을 포함한다. 상기 방법은 또한 한 번 이상 평가를 반복하는 것을 포함하며, 그에 의해 복수 개의 모델들을 평가한다. 상기 방법은 또한 하나의 평가에서 계산된 각각의 스코어를 커뮤니케이트시키는 것을 포함한다.
본 발명의 또 다른 양상은 데이터를 받는 것을 포함한다. 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정된 복수개의 세포 요소에서 각각의 세포 요소들의 하나 또는 그 이상의 특징들을 포함한다. 복수 개의 모델들의 평가되며, 복수개의 모델들 중에서 각각의 모델들은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해서 특징지워진다. 그리고, 각각의 모델들에 대한 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징들을 사용하여 각각의 모델과 관련된 모델 스코어를 결정하는 것을 포함한다. 그 후, 하나의 평가에서 평가된 각각의 모델 스코어는 서로 커뮤니케이트된다.
본 발명의 또 다른 양상은 중앙 프로세싱 유닛과 상기 중앙 프로세싱 유닛에 결합된 메모리를 포함하는 컴퓨터를 제공한다. 메모리는 데이터를 받는 것을 위한 명령들들을 저장한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징들을 포함한다. 상기 메모리는또한 복수개의 모델 스코어를 받는 것을 위한 명령들을 저장한다. 각각의 모델 스코어는 복수개의 모델들 중에서 하나의 모델에 대응한다. 복수개의 모델들 중에서 각각의 모델은 테스트 유기체 또는 생물학적인 테스트 표본에서의 생물학적인 특징의 존재 또는 부존재를 나타내는 모델 스코어에 의해서 특징지워진다. 그리고, 각각의 모델들에 대한 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징들을 사용하여 모델 스코어를 결정하는 것을 포함한다.
본 발명의 또 다른 양상은 중앙 프로세싱 유닛(central processing unit)과 상기 중앙 프로세싱 유닛에 연결된 메모리를 포함하는 컴퓨터를 포함한다. 메모리는 데이터를 받는 것을 위한 명령들들을 저장한다. 그 명령들에서 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 포함한다. 상기 메모리는 복수 개의 모델들을 평가하는 것을 위한 명령들을 저장한다. 상기 평가를 위한 명령들은 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플군에 속하는지를 지시하는 그 모델을 위한 모델 특성화(model characterization)를 제공한다. 평가를 위한 명령들은 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 그 모델에 대한 특성화를 포함한다. 메모리는 또한 한 번 이상 평가하는 것을 위한 명령들을 반복하는 것을 위한 명령들을 포함한다. 그에 의해서 복수개의 모델을 평가하게 된다. 상기 메모리는 역시 평가를 위한 하나의 명령들에서 평가된 각각의 모델 특성화를 커뮤니케이트하는 것을 위한 명령들을 포함한다. 몇몇 실시예에서, 데이터를 받는 것을 위한 명령들은 인터넷과 같은 광범위에 걸친 리모트 컴퓨터(remote computer)로부터 데이터를 받는 것을 위한 명령들을 포함한다.
본 발명의 또 다른 양상은 중앙 프로세싱 유닛과 상기 중앙 프로세싱 유닛에 결합된 메모리를 포함하는 컴퓨터를 제공한다. 상기 메모리는 데이터를 받는 것을 위한 명령들을 저장한다. 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 포함한다. 상기 명령들은 또한 복수 개의 모델들을 평가하는 것을 위한 명령들을 포함한다. 이 컴퓨터는 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플 군에 속하는지를 지시하는 그 모델을 위한 모델 특성화(model characterization)를 제공한다. 상기 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 복수 개의 모델 중에서 각각의 모델에 대한 특성화를 포함한다. 상기 메모리는 또한 평가를 위한 명령들에 의해 평가된 각각의 모델 특성화를 평가하는 것을 위한 명령들을 저장한다.
본 발명의 또 다른 양상은 컴퓨터 시스템과 연결하여 사용하는 것을 위한 컴퓨터 프로그램 프로덕트(computer program product)를 포함한다. 상기 컴퓨터 프로그램 프로덕트는 컴퓨터 가독성 저장 매체(computer readable storage medium)와 거기에 저장되는(embedded) 컴퓨터 프로그램 메커니즘(computer program mechanism)을 포함한다. 컴퓨터 프로그램 메커니즘은 데이터를 받는 것을 위한 명령들을 포함한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적인 상태의 하나 이상의 양상을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 복수개의 모델에서 하나의 모델을 평가하기 위한 명령들들을 포함한다. 그 평가는 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플군에 속하는지를 지시하는 그 모델을 위한 모델 특성화(model characterization)를 생성한다. 상기 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 그 모델에 대해 특성화를 하는 것을 포함한다. 상기 메모리는 또한 평가를 위한 명령들에 의해 평가된 각각의 모델 특성화를 평가하는 것을 위한 명령들을 저장한다. 상기 컴퓨터 프로그램 메커니즘은 또한 한 번 이상 평가하는 것을 위한 명령들을 반복하는 것을 위한 명령들을 포함한다. 그에 의해서, 복수개의 모델을 평가하게 된다. 상기 컴퓨터 프로그램 메커니즘은 또한 평가를 위한 하나의 명령들에서 평가된 각각의 모델 특성화를 커뮤니케이트하는 것을 위한 명령들을 포함한다.
본 발명의 또 다른 양상은 컴퓨터 시스템과 연결하여 사용하는 것을 위한 컴퓨터 프로그램 프로덕트(computer program product)를 포함한다. 상기 컴퓨터 프로그램 프로덕트는 컴퓨터 가독성 저장 매체(computer readable storage medium)와 거기에 저장되는(embedded) 컴퓨터 프로그램 메커니즘(computer program mechanism)을 포함한다. 컴퓨터 프로그램 메커니즘은 데이터를 받는 것을 위한 명령들을 포함한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적인 상태의 양상을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 복수 개의 모델을 평가하기 위한 명령들을 포함한다. 그 평가는 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플 군에 속하는지를 지시하는 각각의 모델을 위한 모델 특성화(model characterization)를 생성한다. 상기 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 각각의 모델에 대해 특성화를 하는 것을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 평가를 위한 명령들에 의해 평가된 각각의 모델 특성화를 평가하는 것을 위한 명령들을 저장한다.
본 발명의 또 다른 양상은 데이터를 받는 것을 포함하는 방법을 제공한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적인 상태의 양상을 포함한다. 복수 개의 모델들 중에서 하나의 모델은 평가된다. 그 평가는 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플 군에 속하는지를 지시하는 그 모델을 위한 모델 특성화(model characterization)를 생성한다. 그 모델에 대한 그 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 그 모델에 대해 특성화를 하는 것을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 평가를 위한 명령들에 의해 평가된 각각의 모델 특성화를 평가하는 것을 위한 명령들을 저장한다. 그와 같은 평가는 수차례 반복되며, 그에 의해 복수 개의 모델들에 대해 평가하게 된다.
본 발명의 또 다른 양상은 데이터를 받는 것을 포함한다. 그 데이터는 하나의 종의 테스트 유기체 또는 그 종의 하나의 유기체로부터의 생물학적인 테스트 표본에서 측정되는 복수개의 세포 요소들 중에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적인 상태의 양상을 포함한다. 복수 개의 모델들은 평가되고, 그 평가는 그 종의 테스트 유기체 또는 그 종의 그 유기체로부터의 생물학적인 테스트 표본이 하나의 생물학적인 샘플 군에 속하는지를 지시하는 각각의 모델을 위한 모델 특성화(model characterization)를 생성한다.
그와 같은 평가는 복수개의 세포 요소들 중에서 하나 또는 그 이상의 세포 요소에 대한 생물학적인 상태의 하나 또는 그 이상의 양상을 사용하여 각각의 모델에 대해 특성화를 하는 것을 포함한다. 상기 컴퓨터 프로그램 메커니즘은 또한 평가를 위한 명령들에 의해 평가된 각각의 모델 특성화를 평가하는 것을 위한 명령들을 저장한다. 그와 같은 평가는 수차례 반복되며, 그에 의해 복수 개의 모델들에 대해 평가하게 된다. 각각의 평가된 모델 특성화는 커뮤니케이트된다.
이하, 도면 및 실시예를 참조하여 본 발명을 보다 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따라 작동하는 시스템 10을 설명한다. 도 3은 본 발명에서 사용되는 데이타의 저장을 위해 유용한 데이터 구조를 설명한다. 도 2는 본 발명의 일 실시예에 따라 복수 개의 모델들을 테스트하기 위해 사용되는 처리 단계를 설명한다. 도 2에 개설된 처리 단계를 사용하여, 그러한 모델들은 하나의 표본이 하나 또는 그 이상의 생물학적인 특성을 가지는지를 결정할 수 있다. 이 도면들은 본 발명의 이점 및 특성을 개시하기 위해 언급될 것이다. 대표적인 생물학적인 특징들은 아래의 색션 5.4에 개시될 것이다.
시스템(10)은 적어도 하나의 컴퓨터(20)를 포함한다(도 1). 컴퓨터(20)는 중앙 프로세싱 유닛(22), 프로그램 모듈(program module)과 데이터 그조를 저장하기 위한 메모리(24), 유저 입력/출력(input/output) 장치(26), 컴퓨터(20)를 시스템에 있는 다른 컴퓨터들 또는 연결 네트워크를 통해 다른 컴퓨터들과 커뮤니케이트시키는 것을 위한 네트워크 인터페이스 카드(network interface card)(28), 그리고, 이 구성 요소들을 상호 커뮤니케이트시키기 위한 하나 이상의 버스(bus)(33)를 포함한다. 유저 입력/출력(input/output) 장치(26)는 하나 이상의 마우스(36), 디스플레이(38) 및 키보드(34)와 같은 입력/출력 요소를 포함한다. 컴퓨터(20)는 또한 디스크 컨트롤러(30)에 의해 컨트롤되는 디스크(32)를 포함한다. 또한, 메모리(24)와 디스크(32)는 본 발명에서 사용되는 프로그램 모율과 데이터 구조를 저장한다.
메모리(24)는 본 발명에 따라 사용되는 수 많은 모듈 및 데이터 구조를 포함한다. 시스템의 작동 중 어떤 한 시점에, 메모리(24)에 저장된 모듈 및/또는 데이터 구조의 일부는, 또 다른 모듈 및/또는 데이터 구조의 일부가 비휘발성 기억장치(non-volatile storage)(32)에 저장되는 동안, 임의의 액세스 메모리(access memory)에 저장된다고 평가될 것이다. 전형적인 하나의 실시예에서, 메모리(24)는 하나의 작동 시스템(50)을 포함한다. 작동 시스템은 다양한 기본적인 시스템 서비스(system service)를 다루고 하드웨어 의존적인 임무를 수행하는 것을 위한 절차를 포함한다. 메모리(24)는 또한 파일 처리를 위한 파일 시스템(미도시)을 포함한다. 몇몇 실시예에서, 디 파일 시스템은 작동 시스템의 요소이다.
본 발명에 따른 전형적인 컴퓨터 시스템의 개관이 상세화되었으므로, 본 발명의 일 실시예에 사용되는 전형적인 데이터 구조의 개관이 아래 색션 5.1에서 설명될 것이다. 그리고, 색션 5.2에서 그와 같은 전형적인 데이터 구조를 사용하여 복수개의 모델을 테스트하는 상세화된 작동 단계들이 설명될 것이다. 색션 5.3에서는, 본 발명에 의해서 제공되는 결과들의 예들이 제공될 것이다.
1. 전형적인 데이터 구조
본 발명의 일 실시예에서 사용되는 전형적인 데이터 구조들은 도 1에서 설명된다. 모델 테스팅 어플리케이션(model testing application)(52)은 런타임 데이터베이스(120)을 사용한다. 런타임 데이터베이스(120)는 그것이 런타임 분석 스키마(300)와 런타임 모델 스키마(200)을 포함하도록 모델되었다. 이 스키마들은 런타임 데이터베이스(120)에서 수많은 다양한 타입의 테이블들의 조직(organization)을 설명한다. 바람직한 실시예에서, 데이터베이스(120)는 플랫 파일, 관련 데이터베이스(relational database)(SQL) 및 OLAP 데이터베이스(MDX 및/또는 그것의 변형물(variant))을 포함하나 그것들에 한정되지 않는 데이터 저장 기구(data storage apparatus)의 어떤 형태이다. 몇몇 특수한 실시예에서, 데이터베이스(120)는 계층적(hierarchical) OLAP 큐브이다. 몇몇 특수한 실시예에서, 데이터베이스(120)는 큐브로서 저장되지 않으나 계층(hierarchy)을 정의하는 디멘션 테이블(dimension table)을 갖는 스타스키마(star schema)를 포함한다. 또한, 어떤 실시예에서는, 데이터베이스(120)는 근원적인 데이터베이스(underlying database) 또는 데이터베이스 스키마에서 명백하게 변하지 않는 계층을 포함한다(예를 들어, 디멘션 테이블은 계층적으로 정렬되지 않는다). 몇몇 실시예에서, 데이터베이스(120)는 Oracle, MS Access 95/97/2000 or better, Informix, Sybase, Interbase, IBM DB2, Paradox, dBase, SQL Anywhere, Ingres,MsSQL, MS SQL server, ANSI Level 2 또는 PostgreSQL과 같은 포맷(format)에 있는 데이터베이스이다. 몇몇 실시예에서, 런타임 데이터베이스(120)는 런타임 분석 스키마(300)와 런타임 모델 스키마(200)를 포함한다.
런타임 모델 스키마(200)에 의해서 상술되는(specified) 필수적인 테이블 타입은 모델(202)이다. 모델(202)의 목적은 생물학적인 표본(예를 들어 종양)이 생물학적인 특징(예를 들어 유방암, 폐암 등)을 갖는 가능성을 결정하는 것을 시도하는 것이다. 그와 같이 각각의 모델(202)은 생물학적인 특징과 관련된다. 여기에서 사용되는 것과 같이, 생물학적인 특징들은 하나 또는 그 이상의 생물학적인 표본에 의해서 드러나는 어떤 특징적인 표현형들이다. 예를 들어, 본 발명의 하나의 적용에서, 각각의 생물학적인 특징들은 근원적인 또는 최초의(primary) 종양 타입을 언급한다. 암으로 진단된 환자들의 약 4 %가 전이 종양을 가지나. 최초의(primary) 종양의 근원은 관찰되지 않는다. 예를 들어, Hillen, 200, Postgrad. Med. J. 76, p. 690. 참조.
때때로, 전이종양의 최초의 위치(primary site)는 병리분석(pathological analysis) 후에마저도 분명하게 명백하지 않다. 그래서, 이 암들의 몇몇에 대한 기원의 최초의 종양 위치를 예측하는 것은 하나의 중요한 임상의 목적을 나타낸다. 최초의 기원이 알려지지 않은 종양의 경우에, 대표적인 생물학적인 샘플군은 전립선, 유방, 결장(colorectum), 폐, 간, 가스트로호페이거스(gastroesophagus), 췌장, 난소, 신장, 방광/뇨관과 같은 암종을 포함한다. 이들 암종은 미국 암관련 사망자의 거의 70%의 원인이 된다. 예를 들어, Greenlee et al.,2001, CA Cancer J. Clin.51, p. 15. 참조.아래의 색션 5.4는 본 발명에 다른 생물학적인 샘플군의 추가적인 예를 설명한다. 모델(202)이 생물학적 표본이 생물학적 샘플군에 속하즌지의 가능성을 결정하기 위해 어떻게 사용될 수 있는지를 설명하기 위하여, 특수한 모델(202)이 생물학적 샘플이 폐암을 갖는 가능성을 나타내는 케이스를 생각해 보라. 이 폐암 모델이 하나의 생물학적 표본에 적용된다고 가정하면, 그러한 결과는 그 생물학적 표본이 폐암을 가질 가능성이 높다는 것을 지적한다. 몇몇 실시예에서, 런타임 데이터베이스(120)에 있는 각각의 모델(202)은 독창적으로 각각의 모델을 확인하는 모델 아이덴티파이어(110)을 포함한다. 더하여, 각각의 모델(202)은 하나 이상의 계산(또는 테스트)(204)을 상술한다(specify). 몇몇 실시예에서, 모델(202)은 2 내지 1000 개의 계산을 상술한다. 더욱 바람직한 실시에에서, 각각의 모델(202)은 3 내지 500 개의, 3 내지 100개의 또는 3 내지 50개의 계산을 상술한다.
모델(202)에 있는 각각의 계산(204)은 어떤 세포 요소들의 개성(identity)을 상술한다. 예를 들어 각각의 계산(204)은 첫 번째 세포 요소 그리고 두 번째 세포 요소를 상술한다. 설명을 위해, 표 1에 설명된 것과 같이 모델(202)에 4개의 계산(204)이 있는 경우를 생각해 보라.
Figure 112006030389845-PCT00001
앞서 말한 바와 같이, 계산 1은 첫번째 세포 요소 AAA 및 두번째 세포 요소 DDD 등을 상술한다.
계산(204)을 상술하는 것에 더하여, 각각의 모델(202)은 그 모델에 각각의 계산을 적용하기 위해 사용되는 계산 알고리즘(calculation algorithm)(212)를 상술한다. 계산 알고리즘(212)은 모델에 있는 계산이 평가될 때 세포 요소 어번던스값(cellular constituent abundance value)들 사이의 조직적인 관계(operational relationship )를 상술한다. 세포 요소 어번던스값(cellular constituent abundance value)은 모델(202)에 의해 분류되는 생물학적인 표본으로부터 얻어진다.
계산 알고리즘(212)의 하나의 예는 비율(ratio)이며, 그 비율 분자(ratio numerator)는 하나의 생물학적 표본에서 첫 번째 세포 요소의 어번던스(abundance)에 의해서 결정되고, 그 비율 분자(ratio numerator)는 그 생물학적 표본에서 두번째 세포 요소의 어번던스(abundance)에 의해서 결정된다. 이 예에서, 계산 알고리즘(212)은, 그 계산 알고리즘(212)에 따라서 계산(204)을 평가할 때 사용되는 생물학적인 테스트 표본에서 세포 요소의 실질적인 개성(identity)을 계산(204)이 상술하는 반면, 두 개의 세포 요소 어번던스 사이의 비율이 얻어진다는 것을 상술한다. 예를 들어, 하나의 계산 알고리즘(212)은 분자로서 첫번째 세포 요소의 어번던스의 분모로서 두번째 세포요소의 어번던스로의 비율을 얻기 위해 상술한다. 이 계산 알고리즘(212)은 전형적인 모델(202)에 있는 각각의 계산(204)에서 사용된다. 표 1의 계산 번호 1의 경우, 전형적인 계산 알고리즘(212)은 유전자 AAA 및 유전자 DDD 사이의 비율을 얻기 위해 상술하고, 계산 번호 2의 경우는 계산 알고리즘(212)은 유전자 CCC 및 유전자 DDD 사이의 비율을 얻기 위해 상술한다.
본 발명은 첫번째 세포 요소와 두번째 세포 요소 사이의 비율에 더하여 계산 알고리즘(212)의 넓은 범위를 포함한다(encompass). 예를 들어, 몇몇 실시예에서, 계산 알고리즘(212)은 첫번째 세포 요소의 어번던스 값이 두 번째 세포 요소의 어번던스 값에 의해 곱해진다는 것을 상술한다(A x B). 사실, 계산 알고리즘(212)은 최초의 두개의 세포 요소의 어번던스 값의 산물이 세번째 세포 요소의 어번던스 값에 의해 곱해지는 것을 상술할 수 있다(A x B x C). 다르게는, 계산 알고리즘(212)은 최초의 두개의 세포 요소의 어번던스 값의 산물이 세번째 세포 요소의 어번던스 값에 의해 나눠지는 것을 상술할 수 있다[ (A xB)/C)]. 이 예가 설명하듯이, 계산 알고리즘(212)은 세포 요소의 어떤 조합의 어떤 수학적 연산, 또는 수학적 연산들의 세트(예를 들어 곱하기, 나누기, 로그 등)이다. 계산 알고리즘(212)은 어떤 주어진 계산(204)을 평가하기 위해 사용되는 세포 요소의 실질적인 개성을 지적하지 않는다. 한편, 계산(204)은 세포 요소의 세트를 상술하지만 그 계산을 평가하기 위해 사용되는 세포 요소들 사이의 조직적인 관계를 지적하지는 않는다. 계산으로 계산 알고리즘을 적용함에 의해서, 계산은 본 발명의 방법에 따라서 평가될 수 있다.
몇몇 실시예에서, 각각의 계산은 그 계산이 속하는 모델을 상술하는 모델 아이덴티파이어(110)를 포함한다. 게다가, 각각의 계산은 문턱값(threshold)(114)을 포함한다. 예를 들어 몇몇 실시예에서 각각의 계산은 낮은 문턱값과 높은 문턱값을 포함한다. 그런 실시예에서, 모델에서의 각각의 계산은 위에서 설명된 계산으로 모델을 위한 계산 알고리즘을 적용함에 의해 평가된다. 평가된 계산이 낮은 문턱값 아래에 있을때 계산은 네가티브(negative)로 특징지워지고, 평가된 계산이 높은 문턱값 위에 있을때 계산은 포지티브(positive)로서 특징지워진다. 평가된 계산이 낮은 문턱값과 높은 문턱값의 사잉에 있을때는, 계산은 인터미네이트(indeterminate)로 특징지워진다. 본 발명에 따른 더 상세화된 모델들과 그들의 사용뿐만 아니라, 그런 문턱값이 어떻게 평가되는지에 대한 더 많은 정보를 위하여, 2004년 6월 4일 출원된 Anderson의 "Systems and Methods for Analyzing Gene Expression Data For Clinical Diagnostics" 표제의 미국 특허 연속 번호 60/507,381과 United States Patent Application Serial No.60/507,381, entitled"Systems and Methods for Analyzing Gene Expression Data for Clinical Diagnostics, " Moraleda과 Anderson의 "Systems and Methods for Analyzing Gene Expression Data for Clinical Diagnostics," 표제의 결정된 미국 특허 연속 번호를 참조하라.
높은 문턱값과 낮은 문턱값이 사용되는 계산(테스트)를 설명하기 위하여, 표 1로부터의 계산 1의 경우를 생각하라. 생물학적 표본에서 유전자 AAA 의 어번던스는 1000이고 DDD의 어번던스는 100이다. 더하여, 계산 1은 0.8의 낮은 문턱값과 5의 높은 문턱값을 상술한다. 계산 1을 포함하는 모델을 위한 계산 알고리즘은 첫번째 유전자와 두번째 유전자 사이의 비율이 얻어진다는 것을 지적한다. 이 계산 알고리즘이 예산에 적용될 때, 평가된 계산, 즉 비율 [AAA]/[DDD] 10의 값을 갖는다. 그 값은 높은 문턱값보다 더 크기 때문에, 계산은 포지티브로서 특징지어진다.
또 다른 예에서, [AAA]은 생물학적 표본에서 70의 값을 갖고 [DDD]는 생물학적 표본에서 100의 값을 갖는다. 나아가, 계산 1은 0.8의 낮은 문턱값과 5의 높은 문턱값을 상술한다. 그와 같은 경우에, [AAA]/[DDD]은 1.2의 값을 갖는다. 그 비율은 낮은 문턱값보다 크고 높은 문턱값보다 작지 때문에 계산은 인터미네이트로 특징지워진다.
계산 알고리즘에 더하여, 각각의 모델은 주어진 모델에 대한 계산이 모델을 특징짓기 위해(평가하기 위해) 어떻게 결합되는지를 상술하는 집합 알고리즘(aggregation algorithm)(214)를 포함한다. 집합 알고리즘은 하나의 예는 보팅 스킴(voting scheme)이다. 상기 보팅 스킴에서 계산들의 더 많은 것들이 포지티브라면 높은 가능성을 갖는 것으로 평가된다. 예를 들어, 계산 알고리즘이 위의 표 1의 계산들에 적용되는 경우와 계산 1, 2는 포지티브이고, 계산 3은 인터미네이트이고, 계산 4는 네가티브라는 것을 생각해 보라. 이 결과에서, 표 1에서 계산을 구성하는 모델을 사용하여 테스트되는 유기체는 모델과 관련된 생물학적 특성을 가질 가능성을 갖는 것으로 특징지워질 것이다.
각각의 모델은 선택적으로 모델 프리컨디션(116)을 포함한다. 모델 프리컨디션은 계산 알고리즘이 모델의 계산에 적용되기 전에 만족되어야하는 요구를 상술한다. 모델 프리컨디션의 하나의 예는 모델 프리컨디션과 관련된 모델에 대한 계산들이 평가되기 전에 다른 선결정 모델의 계산이 평가되어야 한다는 요구이다. 예를 들어, 폐암에 대한 모델이 있고 폐 아데노카르시노마(lung adenocarcinoma)에 대한 다른 모델이 있는 경우를 생각해 보라. 폐암에 대한 모델은 특별한 종양이 폐암에 대하여 포지티브인지를 결정하기 위해 사용된다. 이 경우에 폐 아데노카르시노마(lung adenocarcinoma)에 대한 모델은 폐 아데노카르시노마(lung adenocarcinoma)에 대한 모델이 수행되기 전에 폐암에 대한 모델이 수행되어야 한다고 요구하는 모델 프리컨디션을 가질 수 있다. 상기 프리 컨디션(116)은 또한 폐 아데노카르시노마(lung adenocarcinoma)에 대한 모델이 수행되기 전에 폐암에 대한 모델이 포지티브를 테스트할 것을 요구할 수 있다. 모델 표 타입(model table type)에 더하여, 런타임 모델 스키마는 계통 방식(hierarchical manner)에 있는 다른 표를 상술한다. 프로시져 타입(220)은 이 계통의 탑(top)에 있다. 각각의 프로시져 타입은 계산 알고리즘과 집합 알고리즘을 상술한다. 게다가, 각각의 타입은 선택적으로 프로시져 아이덴티파이어(221)을 포함한다.
하나 이상의 모델들(202)은 하나의 프로시져 타입과 연관될 수 있다. 모델이 프로시져 타입과 연관될 때, 모델은 계산 알고리즘과 프로시져 타입에 의해 상술도니 집합 알고리즘을 사용한다. 하나의 예에서 모델은 모델에 의해 사용되는 프로시져(220)의 프로시져 아이덴티파이어(221)를 포함한다. 그런 예에서, 모델은 그 모델에 의해서 사용되는 계산 알고리즘 및 집합 알고리즘에 대한 명백한 정보를 포함할 필요가 없다. 왜냐하면, 그 정보는 모델에 있는 프로시져 아이덴티파이어(221)에 의해 지정되어진 프로시져로부터 얻어질 수 있기 때문이다.
도 1에서 설명되고 위에서 설명된 것처럼, 각각의 모델은 하나 이상의 계산을 포함한다. 사실 몇몇 예에서, 각각의 계산은 런타임 보델 스키마(200)에서 발견되는 다른 형태의 표로 저장된다. 각각의 계산은 하나 이상의 세포 요소 어번던스 값을 상술한다. 더하여, 각각의 계산은 선택적으로 그 계산과 관련되는 모델을 확인하기 위한 모델 아이덴티파이어(110)을 포함한다. 예를 들어, 모델 아이덴티파이어(110)는 계산(204-1)이 모델(202-1)과 관련된다는 것을 지적할 수 있다. 더하여, 각각의 계산은 계산 아이덴티파이어(112)와 문턱값(114)를 포함할 수 있다. 각각의 계산이 모델 아이덴티파이어(110)를 포함하는 경우에 런타임 데이터베이스(120)의 모델은 그 모델의 부분인 계산을 명확하게 설명할 필요는 없다. 만일 주어진 모델에 대한 계산이 요구되어진다면, 그들은 주어진 모델과 매치(match)되는 모델 아이덴티파이어(110)를 포함하는 계산을 위한 런타임 데이터베이스(120)에 있는 계산을 통해 서치하는 것에 의해 확인될 수 있다.
도 1과 위에서 설명된 것과 같이 각각의 모델은 하나 이상의 모델 프리컨디션(224)을 포함한다. 사실, 각각의 모델 프리컨디션(224)은 런타임 모델 스키마(200)에서 발견되는 다른 형태의 데이터 구조이다. 각각의 프리컨디션(224)은 프리컨디션과 관련된 모델이 수행되기 전에 만족되어지는 프리컨디션을 상술한다. 더하여, 각각의 모델 프리컨디션은 그 프리컨디션과 관련되는 모델을 확인하기 위한 모델 아이덴티파이어(110)를 선택적으로 포함한다. 예를 들어, 모델 아이덴티파이어(110)은 프리컨디션(224-1)이 모델(202-1)과 관련된다는 것을 지적할 수 있다. 각각의 프리컨디션(224)이 모델 아이덴티파이어를 포함하는 경우에 런타임 데이터베이스의 모델은 그 모델들의 부분인 프리컨디션을 명확하게 묘사할 필요는 없다. 그런 경우에, 어떤 프리컨디션이 주어진 모델로 적용되는지를 결정하기 위하여, 주어진 모델과 매치(match)되는 모델 아이덴티파이어를 갖는 프리컨디션을 위한 런타임 데이터베이스에 있는 프리컨디션을 통한 서치(search)가 만들어진다.
2. 전형적인 프로세싱 단계(EXEMPLARY PROCESSING)
본 발명의 일 실싱예에 따른 전형적인 데이터 구조가 색션 5.1에서 소개되었다. 이 색션은 그러한 새로운 데이터 구조가 복수개의 모델들을 테스트하기 위해 어떻게 사용되는지를 표사한다. 색션 5.3에서는 그런 계산들의 결과가 설명된다.
단계 402.
스텝 402에서 세포 요소 특징 데이터(cellular constituent characteristic data)가 얻어진다. 전형적으로 세포 요소 특징 데이터는 먼 지점에서 임상(clinician)에 의해 제공되어지는 세포 요소 어번던스 데이터 파일의 형태에 있다. 어떤 경우에, 데이터 파일이 제공되어질 때, 컴퓨터(20)는 네트워크 인터페이스 카드(28)를 통해 파일을 받는다. 전형적인 실시예에서 원격 컴퓨터는 인터넷과 같은 광범위 네트워크(WAN)를 통해 컴퓨터(20)로 데이터를 전송한다. 세포 요소 특징 데이터 파일은 전형적으로 다양한 세포 요소들 중에서 각각의 세포 요소들의 생물학적 상태의 양상을 포함한다. 예를 들어, 세포 요소 특징 파일은 주어진 생물학적 표본 또는 유기체에 있는 몇몇의 세포 요소에 대한 어번던스 데이터를 포함한다. 세포 요소 어번던스 데이터 파일은 주어진 생물학적 표본에서 백 개 이상의 세포 요소에 대한 데이터를 포함할 수 있다. 사실, 세포 요소 어번던스 데이터 파일은 주어진 생물학적 표본에서 500개 이상, 1000개 이상, 10000개 이상 또는 15000개 이상의 세포 요소에 대한 데이터를 포함할 수 있다. 몇몇 실시예에서, 세포요소 어번던스 데이터 파일은 복합 생물학적 표본(multiple biological specimen)에 대한 데이터를 포함한다. 그런 실시예에서 데이터 파일은 어떤 생물학적 표본이 파일에 있는 각각의 세포 요소 어번던스 레벨과 관련되는지를 명백하게 지적한다.
몇몇 실시예에서, 세포 요소 특징 데이터 파일은 Affymetrix (Santa Clara, California) GeneChip 탐침 배열(probe array)을 위해 고안된 포맷(예를 들어, Affymetrix MAS4.0 소프트웨어와 U95A 또는 U133 유전자 칩(gene chip)을 사용하여 생성되는 CHP 익스텐션(extension)을 갖는 Affymetrix 칩 파일(chip file)), Agilent (Palo Alto, California) DNA 마이크로어레이(microarray)를 위해 고안된 포맷, Amersham (Little Chalfont, England) CodeLink를 위해 고안된 포맷, Imaging Research (St. Catharines, Canada)에 의한 ArrayVision 파일 포맷, Axon (Union City, California) GenePix 파일 포맷, BioDiscovery (Marina del Rey, California) ImaGene 파일 포맷, the Rosetta (Kirkland, Washington) gene expression markup language (GEML) 파일 포맷, Incyte (Palo Alto, California) GEM 마이크로어레이(microarray)를 위해 고안된 포맷 또는 Molecular Dynamics (Sunnyvale, California)cDNA 마이크로어레이를 위해 발전된 포맷에 있다.
몇몇 실시예에서, 세포 요소 특징 파일은 생물학적 표본을 위한 가공 처리된 마이크로어레이 이미지(image)를 포함한다. 예를 들어, 하나의 그런 실시예에서, 파일은 각각의 세포요소를 위해 사용되는 탐침(probe)을 묘사하면서, 그러한 어레이, 선택적 배경 신호 정보(optional background signal information) 및 선택적 관련 주석 정보(optional associated annotation information)에서 나타내어지는 각각의 세포 요소를 위한 세포 요소 어번던스 정보를 포함한다. 어떤 실시예에서, 세포 요소 어번던스 측정은 아래 색션 5.5에서 묘사된 것처럼 전사 상태 측정(transcriptional state measurement)이다.
본 발명의 어떤 실시예에서, 번역 상태(translational state), 활동 상태(activity state) 또는 생물학적 상태의 혼합된 양상과 같은 전사 상태(transcriptional state)가 아닌 생물학적 상태의 양상이 세포 요소 특징 파일에서 나타내어진다. 예를 들어, 아래 색션 5.6을 참조하라. 예를 들어 어떤 실시예에서, 세포 요소 특징 파일은 연구하에 있는 생물학적 표본에 있는 다양한 단백질에 대한 단백질 레벨을 포함한다. 그런 명백한 실시예에서, 세포 요소 특징 파일은 연구하의 생물학적 표본의 조직에 있는 세포 요소의 양 또는 농도, 생물학적 표본의 하나 이상의 조직에 있는 세포 요소 활동 레벨 또는 생물학적 표본의 하나 이상의 세포 요소의 변화 상태(예를 들어 인산화)를 포함한다.
본 발명의 하나의 양상에서, 생물학적 표본에서 유전자의 발현 레벨(expression level)은 연구하에 있는 생물학적 표본의 하나 이상의 세포에 있는 유전자에 상응하는 적어도 하나의 세포 요소의 양을 측정함에 의해서 결정될 수 있다. 하나의 실시예에서, 측정되는 적어도 하나의 세포 요소의 양은 생물학적 표본의 하나 이상의 세포에 존재하는 적어도 하나의 RNA 종(RNA species)의 어번던스를 포함한다. 그런 어번던스는 하나 이상의 유기체의 세포로부터의 RNA 또는 그들로부터 유도된 cDNA와 유전자 전사 배열(gene transcript array)을 접촉시키는 것을 포함하는 방법에 의해서 측정될 수 있다. 유전자 전사 배열은 핵산 또는 핵산 전사물(gene transcript array)을 갖는 표면을 포함한다. 핵산 또는 핵산 전사물(gene transcript array)은 RNA 종 또는 RNA 종으로부터 유도된 cDNA와 하이브리다이징(hybridizing)할 수 있다. 하나의 특별한 실시예에서, RNA의 어번던스는 연구하에 있는 하나 이상의 세포로부터의 RNA 또는 그 RNA로부터 유도된 핵산과 유전자 전사 배열을 접촉시킴에 의해 측정될 수 있다. 유전자 전사 배열은 핵산 또는 핵산 전사물을 갖는 표면을 포함하며, 거기서 핵산 또는 전사물이 RNA 또는 그들로부터 유도된 핵산과 하이브리다이징(hybridizing)할 수 있다.
몇몇 실시예에서, 세포 요소 특징 파일은 복수개의 유전자(또는 복수개의 유전자에 상응하는 세포 요소들)를 위한 유전자 발현 데이터(gene expression data)를 포함한다. 몇몇 실시예에서, 복수개의 유전자들은 적어도 다섯개의 유전자를 포함한다. 또 다른 실시예에서, 복수개의 유전자는 적어도 100, 적어도 1000, 적어도 2000 또는 3000 이상의 유전자를 포함한다. 몇몇 실실예에서, 복수개의 유전자는 5천 내지 2만 사이의 유전자를 포함한다. 단계 402의 몇몇의 실행에서, 어번던스 데이터는 전처리(preprocess)된다. 몇몇 실시예에서, 이 전처리는 표준화를 포함한다. 상기 표준화에서 주어진 생물학적 표본에 대한 모든 세포 요소 특징값은 생물학적 표본에 대해 측정된 중간 세포 요소 어번던스값(median cellular constituent abundance value)에 의하여 나누어진다. 몇몇 실시예에서, 주어진 생물학적 표본 및 유기체에 대한 모든 세포 요소 어번던스값은 생물학적 표본에 대해 측정된 세포 요소 어번던스 값의 평균 25% 및 75%에 의해 나누어진다. 세포 요소 어번던스 측정의 근원(source)이 마이크로어레이(microarray)인 경우, 미스매치된 탐침 측정이 완전한 매치 탐침보다 더 클 때 네가티브 세포 요소 어번던스 값은 얻어질 수 있다. 이것은 첫번째 유전자(primary gene)가 낮은 레벨에서 표현될 때 전형적으로 일어난다. 몇몇 대표적 실시예에서, 주어진 세포 요소 어번던스 파일이 30%는 네가티브이다. 본 발명의 전처리의 몇몇 경우에, 0 이하의 값을 갖는 모든 세포 요소 어번던스 값은 고정된 값으로 치환된다. 세포 요소 어번던스 측정치의 근원(source)이 Affymetrix GeneChip MAS 5.0인 경우에, 네가티브 세포 요소 어번던스 값은, 몇몇 실시예에서, 20, 100과 같은 고정된 값으로 치환될 수 있다. 더 일반적으로, 몇몇 실시예에서, 0 이하의 값을 갖는 모든 세포 요소 어번던스 값은 주어진 생물학적 표본에 대한 중간 세포 요소 어번던스 값(median cellular constituent abundance value)의 0.001 내지 0.5의 고정 값에 의해 치환될 수 있다. 몇몇 실시예에서, 모든 세포 요소 어번던스 값은, 치환되는 세포 요소 어번던스 값의 절대값에 비례하여 중앙값(median)과 영 사이에서 역으로 변화하는 값의 변환과 치환된다. 몇몇 실시예에서, 영보다 작은 값을 갖는 모든 세포 요소 어번던스 값은 그들의 초기 네가티브 값의 크기(magnitude)의 함수에 근거하여 결정되는 값으로 치환된다. 몇몇 경우에, 이 함수는 시그모이달 함수(sigmoidal function)이다.
몇몇 실시예에서, 단계 402는 컴퓨터(20)에 있거나 컴퓨터에 의해 어드레스로 끄집어낼 수 있는(addressable) 웹 페이지(web page)에 의해 촉진된다. 상기 웹 페이지는 리모트 유저(remote user)가 어떤 모델이 수행되어져야하는지를 선잭하는 것을 허락하고, 원격지(remote site)로부터 컴퓨터로 세포 요소 데이터 파일의 전송을 촉진시킨다. 몇몇 실시예에서, 웹 페이지는 하나 또는 그 이상의 모델들에 대한 랩 리퀘스팅 평가(lab requesting computation)의 어드레스(address), 세포 요소데이터 파일을 사용하여 수행되어야하는 하나 이상의 모델들의 개성, 제출된 표본을 확인하는 독특한 표본 아이덴티파이어, 세포 요소 특징 데이터를 측정하기 위해 사용되는 마이크로어레이 포맷을 확인하는 아이덴티파이어, 세포 요소 특징 데이터 파일에 의해서 대표되는 환자를 확인하는 아이덴티파이어, 세포 요소 특징 파일을 위해 세포 요소 특징 데이터가 그것으로부터 얻어지는 생물학적 표본의 묘사, 및/또는 생물학적 표본에 대하여 수행되는 모델을 명령들하는 의사 또는 다른 치료 전문가의 신원(identity)과 같은 정보의 전달을 허락한다.
몇몇 실시예에서, 웹페이지 베이스드 인터페이스(web-page based interface)를 사용하는 것보다 소프트웨어 모듈이 원격 작동 컴퓨터(remote originating computer)에서 수행된다. 또는 웹페이지 베이스드 인터페이스(web-page based interface)를 사용하는 것에 더하여, 소프트웨어 모듈이 원격 작동 컴퓨터(remote originating computer)에서 수행된다. 소프트웨어 모듈은 원격 임상의(emote clinician)가 파일 전달 프로토콜(file transfer protocol), 인터넷 프로토콜( internet protocol), 또는 다른 타입의 파일 공유 기술(file sharing techniques)를 사용하여 필요한 데이터를 컴퓨터에 업로드하는 것을 허락한다. 몇몇 실시예에서, 스텝 402에 있는(그리고 스텝 424에 있는) 컴퓨터 사이의 모든 통신(communication)은 비밀 키 크립토그래피(secret key cryptography), 헤이시(hashes),메시지 디제트(message digest) 및/또는 공중 키 알고리즘(public key algorithm)과 같은 기술분야에서 알려진 인크립션 알고리즘(encryption algorithm)을 사용하여 인크립트(encrypt)된다.
단계 404 및 406.
스텝 404에서 결정(determination)은 어떤 모델이 수행되는지에 따라 만들어진다. 예를 들어, 어떤 경우에는, 런타임데이터베이스에 있는 모델은 모델들의 슈트(suite)들로 나뉘어진다. 예를 들어, 알려지지 않은 최초의 (primary) 암을 테스트 하기 위한 모델의 슈트, 폐암을 테스트 하기 위해 고안된 모델 슈트 등이 있다. 각각의 모델 슈트는 하나 이상의 모델들을 포함한다. 그래서, 어떤 경우에는 스텝 404는 어떤 모델 슈트가 유저에 의해 요구되는지를 결정하는 것을 포함한다. 스텝 406에서, 스텝 404에서 선택된 모델의 세트로부터 하나의 모델이 선택된다.
단계 408.
스텝 408은 선택적이다. 몇몇 실시예에서, 스텝 408은 수행되지 않고, 스텝 402에서 원격 유저에 의해 지정된 모든 모델들은 수행도니다. 선택적 스탭 408에서, 결정은 모델 프리컨디션(116)이 스텝 406에서 선택된 모델을 위해 만족스러운지에 관하여 만들어진다. 예를 들어, 어떤 실시예에서, 모델 프리컨디션은 스텝 406의 마지막 경우에 선택된 모델보다 더 넓은 생물학적 샘플군의 인디케이티브(indicative)인 모델이 더 좁은 생물학적 샘플군의 인디케이티브인 어떤 모델전에 수행되어야 한다는 것을 상술한다. 설명을 위하여, 폐암의 특별한 형태의 인디케이티브인 첫번째 모델의 모델 프리컨디션은 일반적으로 폐암의 인디케이티브인 두번째 모델이 첫번째 모델을 수행하기에 앞서 포지티브를 테스트할 것을 요구할 수 있다. 게다가, 두번째 모델은 암의 인디케이티브인 세번째 모델이 두번째 모델을 수행하기에 앞서 포지티브를 테스트하기를 요구하는 모델 프리컨디션을 가질 수 있다. 몇몇 실시예에서, 모델 프리컨디션은 선택된 모델을 테스트하기에 앞서 또 다른 모델이 네가티브, 포지티브, 인터미네이트로서 확인되어야한다는 요구를 포함한다. 프리컨디션이 어떻게 모델을 분류체계(hierarchies)로 정렬하기 위해 사용되는지에 대한 몇몇 추가적인 예는 다음과 같다.
첫번째 예에서, 모델 B의 프리컨디션은 모델 B가 수행되기 전에 모델A가 명백한 결과를 가지기를 요구한다. 모델A가 수행되나 모델B에 의해 요구되는 명백한 결과를 산출하는 것에 실패할 경우가 있다. 이런 경우에는 모델 B는 결고 수행되지 않는다. 그러나, 만일 모델 ARK 수행되고 모델 B에 의해 요구되는 명백한 결과를 산출하면, 모델 B는 수행된다. 이 예는 다음과 같이 표시될 수 있다.
if (A = result), then B can be run.
두번째 예에서, 모델 C의 프리컨디션은 모델 C를 수행하기 전에 모델 A가 명백한 결과를 갖거나, 모델 B가 명백한 결과를 갖기를 요구한다. 이 예는 다음과 같이 표시될 수 있다.
if( (A= first result) or (B = second result) ), then C can be run.
설명을 위하여, 모델 C는 모델 C가 수행되기 전에 모델 A가 수행되고 암에 대한 포지티브를 테스트하고, 모델 B가 수행되고 폐암에 대한 포지티브를 테스트하는 것을 요구할 수 있다. 다르게는 모델 C의 프리컨디션은 모델A 및 모델 B가 명백한 결과를 획득하기를 요구할 수 있다.
if( (A= first result) and (B = second result) ), then C can be run.
또 다른 예에서, 모델 D의 프리컨디션은 모델 D가 수행되기 전에 모델 C가 명백한 결과를 가질 것을 요구한다. 모델 C의 프리컨디션은 모델 C가 수행되기 전에 순차적으로 모델A가 첫번째 결과를 갖고, 모델B가 두번째 결과를 갖기를 요구한다. 이 예는 다음과 같이 표시된다.
If( (A= first result) and (B = second result) ), then C can be run
If (C=third result), then D can be run.
이 예들은 모델 프리컨디션이 제공하는 이점을 설명한다. 본 발명의 독창적인 프리컨디션때문에, 모델들은 분류체계(hierarchies)로 정렬될 수 있고, 그 분류체계에서 특정한 모델은 다른 모델이 수행되기 전에 수행된다. 종종, 첫번째로 수행되는 모델은 생물학적 표본을 넓은 생물학적 샘플군으로 분류하도록 디자인된다. (예를 들어, 넓은 표현형(phenotype)). 일단 생물학적 샘플이 폭넓게 분류되면, 그 다음의 모델들은 예비의 분류를 더 좁은 생물학적 샘플군으로 바꾸기 위해 수행된다.
단계 406에서 선택된 모델의 모델 프리컨디션들이 만족되면(408-Yes), 프로세스 컨트롤은 단계 410으로 진행된다. 모델의 프리컨디션이 만족되지 않으면 프로세스 컨트롤은 다시 단계 406으로 진행된다. 거기서, 단계 404에서 확인된 세트 모델들로부터 다른 모델이 선택된다.
단계 410.
모델에서의 계산은 단계 410에서 선택된다. 계산은 두 개 이상의 세포 요소를 확인하고, 그 세포 요소들의 특징들은 연구하에 있는 생물학적 표본에서 테스트된다. 예를 들어, 계산은 유전자 AAA 및 BBB에 대한 세포 요소 어번던스 값을 상술할 수 있다. 몇몇 실시예에서, 계산은 모델에 의해 대표되는 생물학적 특징을 갖지 않는 및/또는 차이나는 생물학적 특징을 갖는 생물학적 표본과 관련된 단계 406의 마지막 예에서 선택된 모델에 의해서 대표되는 생물학적 특징을 갖는 표본에서 높게 조절되거나(up- regulated) 낮게 조절되는(down-regulated) 적어도 하나의 세포 요소를 상술한다.
다른 생물학적 특징을 갖는 표본과 관련된 어떤 생물학적 특징을 갖는 표본에서 높게 조절되거나 낮게 조절되는 세포 요소들은 통상적인 실험(routine experimentation) 또는 공개된 문헌들을 통해 얻어질 수 있다. 예를 들어, Su et al. 2001, Cancer Research 61, p. 7388는 최초의 종양 타입(primary tumor type)에서 높게 조절된 그리고 그런 종양 타입에 대해 전조가 되는 유전자의 명칭을 제공한다. Su et al.은 전립선 암에 대하여 표 2에 기재된 세포 요소의 표현을 확인하였다.
Figure 112006030389845-PCT00002
어떤 실시예에서, 어떤 생물학적 특징을 갖는 생물학적 표본에서 세포 요소의 어번던스가 그런 생물학적 특징을 갖는 생물학적 표본에서 세포 요소들의 적어도 60%, 70%, 80% 또는 90%의 어번던스보다 더 클 때에 세포 요소는 그런 생물학적 특징을 갖는 표본에서 낮게 조절된 것으로 간주된다. 어떤 실시예에서, 어떤 생물학적 특징을 갖는 생물학적 표본에서의 세포 요소의 어번던스가 평균적으로 그 생물학적 특징을 갖지 않는 생물학적 표본에서의 세포 요소의 어번던스보다 높을 때, 그 세포 요소는 그 생물학적 특징을 갖지 않는 생물학적 표본과 관련한 생물학적 특징을 갖는 표본에서 높게 조절된 것으로 간주된다. 어떤 실시예에서, 어떤 생물학적 특징을 갖는 생물학적 표본에서의 세포 요소의 어번던스가 그 생물학적 특징을 갖는 생물학적 표본에서의 세포 요소의 40, 30, 20, 10%의 어번던스보다 작을 때, 그 세포 요소는 그 생물학적 특징을 갖는 표본에서 낮게 조절된 것으로 간주된다. 어떤 실시예에서, 어떤 생물학적 특징을 갖는 생물학적 표본에서의 세포 요소의 어번던스가 평균적으로 그 생물학적 특징을 갖지 않는 생물학적 표본에서의 세포 요소의 어번던스보다 작은 때, 그 세포 요소는 그 생물학적 특징을 갖지 않는 생물학적 샘플 또는 유기체들과 관련한 생물학적 샘플 또는 유기체에서 낮게 조절된 것으로 간주된다.
몇몇 실시예에서, 계산에서 명시된 세포 요소들은 각각 핵산 또는 리보핵산이고, 생물학적 표본에서의 이 세포 요소들의 어번던스는 생물학적 표본에서의 첫 번째 세포요소와 두 번째 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해 얻어질 수 있다. 몇몇 실시예에서, 계산에서 명시된 세포 요소들은 각각 독립적으로 mRNA, cRNA 또는 cDNA이거나 이들의 프래그먼트(fragment)이다. 몇몇 실시예에서, 계산에서 명시된 세포 요소들은 각각 단백질이고, 이들 세포 요소들의 어번던스는 그 세포 요소의 전부 또는 일부의 전사 상태를 측정함에 의해서 얻어질 수 있다. 어떤 실시예에서, 계산에서 명시된 세포 요소의 어번던스는 그 세포 요소의 활동(activity) 또는 후번역 변형(posttranslational modification)를 측정함에 의해 결정된다.
단계 412.
단계 412에서, 단계 410의 마지막 경우에서 선택된 계산에서 명시된 세포 요소 특징값은 단계 402에서 제출된 세포 요소 특징으로부터 얻어질 수 있다. 그래서, 계산이 유전자 AAA 및 유전자 BBB를 명시하는 예에서, 유전자 AAA 및 유전자 BBB에 대한 세포 요소 어번던스 값(또는 계산에 의해 명시된 어떤 다른 특징)은 세포 요소 어번던스 파일로부터 얻어진다.
단계 414.
단계 414에서, 단계 410의 마지막 예에서 선택된 계산은 모델에서 명시된 계산 알고리즘에 따라서 평가된다. 예를 들어, 계산 알고리즘은 전형적인 계산에서 명시된 첫번째 세포 요소의 어번던스 값과 전형적인 계산에서 명시된 두번째 세포 요소의 어번던스 값 사이의 비율을 얻기 위해 명시할 수 있다. 계산 알고리즘에 따라서 계산을 평가하는 추가적인 예는 상기 색션 5.1에서 묘사되었다. 이 예들은 계산이 그 계산을 위한 문턱값과 관련한 평가된 계산값에 근거하여 계산된 후에, 어떻게 특징지워지는지를 묘사한다. 예를 들어, 만일 평가된 계산이 그 계산을 위한 진정 최소값(true minimum)보다 더 큰 값을 가진다면, 그 평가된 계산은 포지티브로서 특징지워진다.
단계 416.
단계 416에서, 마지막 계산에 대한 평가의 결과는 저장된다. 어떤 실시예에서, 저장은 계산이 그것을 위해 수행되는 모델을 확인하는 모델 아이덴티파이어, 모델의 어떤 버전(version)이 수행되는지를 확인하는 모델 버전 아이덴티파이어, 계산을 평가하기 위해 사용되는 세포 요소 특징 값을 공급하는 세포 요소 특징 데이터 파일을 확인하는 발현 데이터 파일 아이덴티파이어, 계산 및 계산 결과 코드와 관련한 계산 아이덴티파이어(도 1)의 저장을 포함한다.
단계 418.
단계 418에서, 결정(determination)은 모델에서의 모든 계산들이 그 모델에서의 계산 알고리즘에 따라서 평가되는지에 따라서 만들어진다. 만일 아니라면(418-No), 프로세스 컨트롤(process control)은 단계 410으로 되돌아가고, 거기서 또 다른 계산이 평가를 위한 모델로부터 선택된다. 만일 그렇다면(418-Yes), 네트워크 컨트롤(network control)은 단계 420으로 진행된다.
단계 420.
단계 420에서, 단계 406의 마지막 예에서 선택된 모델을 위해 만들어진 모든 계산들은 모델에 의해서 명시된 집합 알고리즘에 따라서 집계된다. 그런 집계는 그 모델을 위한 모델 특성화(model characterization)로 귀결된다. 이 모델 특성화는 그 종의 유기체 또는 그 종의 그 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플군에 속하는지를 지적한다.
하나의 실시예에서, 단계 406의 마지막 경우에서 선택된 모델을 위한 모델 아이덴티파이어와 매칭(matching)되는 모델 아이덴티파이어를 갖는 표에서의 각각의 열의 결과 코드는 모아진다. 예를 들어 모델이 다섯개의 계산을 갖는 경우를 생각해보라. 각각의 계산은 단계 414의 예에서 평가되고 그 결과는 저장된다. 문턱값이 각각의 계산과 관련되는 경우에, 계산에 대한 결과는 계산이 포지티브, 네가티브 또는 인터미네이트인지에 따른 지적일 수 있다.
모델이 다섯개의 계산(테스트)를 포함하는 경우를 생각해보라. 계산 결과 표에는 각각의 계산마다 하나씩, 즉 다섯개의 열이 있다. 이 다섯개의 열은 결과 코드를 포함할 것이다. 이 유저 케이스 시나리오(user case scenario)에서, 각각의 결과 코드는 포지티브, 네가티브 또는 인터미네이트이다. 다음으로, 모델을 관련한 집합 알고리즘은 이 다섯 개의 결과 코드가 모델을 특성화하기 위해 어떻게 결합되는지를 명시할 것이다. 예를 들어, 집합 알고리즘은 만일 평가된 계산의 더 많은 것이 포지티브라면 모델이 포지티브로 생각되어지는 보팅 스킴에서 다섯개의 결과 코드가 결합되도록 명시할 수 있다.
집합 알고리즘의 하나의 예는 만일 모델에 대한 계산의 더 많은 것이 포지티브라면 포지티브로서 특징지워지는 보팅 스킴이다. 예를 들어, 계산 알고리즘이 위의 표 1의 계산에 적용되는 경우, 그리고 계산 1, 2가 포지티브이고 계산 3이 인터미네이트이고 계산 4가 네가티브인 것을 생각해보라. 이러한 결과에서, 표 1에서의 계산들로 구성되는 모델은 포지티브로서 특징지워질 것이다. 그러나, 본 발명의 어떤 실시예에서는, 모델에서의 각각의 포지티브 계산이 모델에서의 각각의 네가티브 계산과 차이가 나는 웨이트를 갖는 경우에는, 웨이팅 스킴(weighting scheme)이 사용될 수 있다. 예를 들어, 모델에서의 각각의 포지티브 계산은 3의 웨이트를 가지고, 각각의 네가티브 계산은 1의 웨이트를 가질 수 있다. 이 웨이팅 스킴에서, 모델은 모델이 하나의 포지티브 계산과 두 개의 네가티브 계산을 가지는 경우마저도 포지티브로서 특징지워질 것이다.
바람직한 실시예에서, 각각의 특성화된(characterized) 모델은 하나의 생물학적 표본 또는 유기체가 모델에 의해서 대표되는 생물학적 특징을 갖는 가능성을 산출한다. 이 가능성은 평가된 모델을 위한 모델 스코어를 나타낸다. 다른 말로, 각각의 특성화된(characterized) 모델 하나의 종의 테스트 유기체 또는 하나의 종의 유기체로부터의 생물학적 테스트 표본이 어떤 샘플군에 속하는지를 지적하는 모델 특성화(예를 들어 모델 스코어)를 제공한다. 어떤 실시예에서, 모델 스코어가 더 높으면 높을수록, 그것의 세포 요소 값이 모델을 평가하기 위해 사용되는 생물학적 표본 또는 유기체는 모델에 의해서 나타내어지는 생물학적 특성을 갖거나, 모델에 의해서 나타내어지는 생물학적 샘플군에 속할 가능성이 더 높다. 몇몇 실시예에서, 모델은 생물학적 표본 또는 유기체가 모델과 관련한 생물학적 특징을 갖거나, 테스트에 의해 나타내어지는 생물학적 샘플군에 속할 가능성이 극도로 높거나, 높거나, 중간 정도거나, 낮거나, 극도로 낮은지를 결정한다. 몇몇 실시예에서, 모델에 의해서 나타내어지는 생물학적 특징은 치료 컴비네이션(therapy combination)에 대한 민감성(sensitivity) 및/또는 저항성(resistance)이다. 어떤 실시예에서, 모델에 의해 나타내어지는 생물학적 특징은 생물학적 유기체에서 특별한 질병의 전이 가능성 및/또는 그 질병의 재발 가능성이다. 어떤 실시예에서, 모델에 의해 나타내어지는 생물학적 샘플군은 암 및/또는 색션 5.4에서 나타내어지는 전형적인 생물학적 특징의 어떤 것이다. 질병의 재발 가능성을 탐지하는 실시예에서, 모델은 "sensitive", "low risk" 또는 "high risk" 등으로 점수를 부여할지도 모른다. 질병의 전이 가능성을 탐지하는 실시예에서, 모델은 "malignant", "inconclusive" ㄸ또는 "on malignant" 등으로 점수를 부여할지도 모른다. 질병의 공격성(aggressiveness)을 평가하는 실시예에서는, 모델은 "aggressive", "inconclusive" 또는 "indolent" 등으로 점수를 부여할수도 있다.
단계 422 및 424.
단계 422에서, 결정(determination)은 주어진 세포 요소 어번던스 파일에 대해 수행되는(평가되는) 모델들의 세트에서 모든 모델들이 수행되었는지에 관하여 만들어진다. 만일 아니라면(422-No), 프로세스 컨트롤은 단계 406으로 되돌아가고, 거기서 또 다른 모델이 선택된다. 만일 모든 모델들이 평가되었다면, 결과는 보고된다(단계 424). 어떤 실시예에서, 보고된 결과들은 복수 개의 모델들 중에서 각각의 모델들에 대한 특성화(characterization)이다.
전형적인 실시예에서, 보고된 결과는 수행되어진 모델 세트에서의 각각의 모델에 대한 특성화이다. 평가된 각각의 모델은 모델을 위한 각각의 집합 알고리즘에 따라서 특성화되어진다. 전형적인 실시예에서, 결과들은 최초의 세포 요소 어번던스 파일(original cellular constituent abundance file)을 제출한 먼 거리의 고객 컴퓨터로 보고된다. 단계 424에서 만들어진 전형적인 보고(report)는 색션 5.3에서 묘사된다.
3. 실험적 결과(EXEMPLARY RESULTS)
어떤 실시예에서, 단계 424에서 제공되어진 보고는 컴퓨터(20)으로부터 도 4의 단계 402에서 세포 요소 특성 데이터 파일을 생성했던 원격 컴퓨터로 보내진다. 어떤 실시예에서, 그 보고는 하나 이상의 모델에 대한 랩 리퀘스팅 평가(lab requesting computation)에 대한 어드레스(address), 그 리퀘스트에 대한 독특한 오더 아이덴티파이어(unique order identifier), 제출된 표본을 확인하는 독특한 표본 아이덴티파이어(unique specimen identifier), 세포 요소 특징 데이터를 측정하기 위해 사용되는 마이크로어레이 포맷을 확인하는 아이덴티파이어, 단계 402에서 세포 요소 데이터 파일이 컴퓨터로 제출된 날짜, 단계 424의 보고가 생성된 날짜, 세포 요소 특징 데이터 파일에 의해서 나타내어지는 환자를 확인하는 아이덴티파이어, 파일을 위해 세포 요소 특징 데이터가 얻어지는 생물학적 표본에 대한 묘사, 및/또는 생물학적 표본에 대해 수행되어지는 모델들을 명령들하는 의사 또는 치료 전문가들에 대한 신원확인(identity)과 같은 정보를 제공하는 헤더(header)를 갖는다.
아래의 표 3, 4는 모델의 전립선 슈트(prostate suite)에 대해 제공되는 보고의 예를 집합적으로(collectively) 나타낸다. 표 3에 있는 각각의 열은 차이나는 모델을 나타낸다. 테이블 3에서, 각각의 보고된 모델은 모델이 무엇을 테스트하는지, 모델을 테스트하기 위한 세포 요소의 선택을 위한 과학적 근거를 제공하는 하나 또는 그 이상의 참조 논문, 모델 결과(model result) 및 모델 결과에 대한 임상적인 묘사에 대한 지적을 제공하는 임상의 테스트 명칭(clinical test name)을 갖는다. 표 3은 환자가 전립선암의 재발로부터 고통을 겪을 가능성의 정도와 치료의 특별한 형태로의 환자의 민감성을 지적하는 모델을 제공한다. 표 4는 각각의 열이 환자가 전립선암을 가지는지를 확실히 하는 확정 테스트(confirmation test)를 나타낸다는 점에서 표 3과 차이가 있다.
Figure 112006030389845-PCT00003
Figure 112006030389845-PCT00004
표 5 및 표 6은 본 발명의 또 다른 경우에 단계 424에서 보내지는 또 다른 타입의 리포트에서 발견되는 항암제 감수성(chemosensitivity) 모델을 묘사한다.
Figure 112006030389845-PCT00005
Figure 112006030389845-PCT00006
표 7 및 표 8은 본 발명의 또 다른 경우에, 단계 424에서 보내지는 또 다른 타입의 보고에서 발견되는 결장(colorectal) 모델을 묘사한다.
Figure 112006030389845-PCT00007
Figure 112006030389845-PCT00008
표 9는 본 발명의 또 다른 실시예에서의 단계 424에서 보내지는 또 다른 타입의 보고에서 발견되는 모델의 오리진 슈트(origin suite)의 위치(site)를 묘사한다.
Figure 112006030389845-PCT00009
4. 전형적인 생물학적 표본(EXEMPLARY BIOLOGICAL FEATURES)
본 발명은 생물학적 표본이 복수개의 생물학적 특징 중에서 어떤 특징을 갖는지를 결정하는 모델을 발전시키기 위해 사용될 수 있다. 다시 말해, 본 발명은 하나의 종의 테스트 유기체 또는 하나의 종의 유기체로부터의 생물학적 테스트 표본이 하나의 생물학적 샘플군에 속하즌지를 지적하는 모델을 발전시키기 위해 사용될 수 있다. 생물학적 특징들의 폭넓은 배열(broad array)(예를 들어, 생물학적 샘플군)은 관찰된다. 하나의 예에서, 두 개의 생물학적 특징은 와일드 타입 상태(wild type state)와 질병 상태(diseased state)이다. 또 다른 예에서 두 개의 생물학적 특징은 첫번째 질병 상태(first diseased state)와 두번째 질병 상태(second diseased state)이다. 또 다른 실시예에서, 두 개의 다른 생물학적 특징은 약물 감응 상태(drug respondent state) 및 약물 비감응 상태(drug nonrespondent state)이다. 그런 경우에, 첫번재 모델은 첫번째 생물학적 샘플 특징의 존재 또는 부존재에 대하여 테스트하고, 두번재 모델은 두번째 생물학적 샘플 특징의 존재 또는 부존재에 대하여 테스트한다. 본 발명은 샘플이 단지 두개의 생물학적 특징의 존재 또는 부존재에 대해 테스트되는 경우에 한정되지 않는다. 실제로 어떤 수의 생물학적 특징들(예를 들어, 하나, 둘 이상, 3 내지 10 사이, 5 내지 20 사이, 25개 이상의 생물학적 특징 등)도 본 발명의 방법, 컴퓨터 및 컴퓨터 프로그램 프로덕트를 사용하여 테스트될 수 있다. 그와 같은 경우에, 차이나는 모델들은 각각의 그런 생물학적 특징들의 존재 또는 부존재를 테스트하기 위해 전형적으로 사용된다(예를 들어, 표본이 그 특징의 존재에 의해 특징지워지는 생물학적 샘플군에 속하는지, 그 특징의 부존재에 의해 특징지워지는 생물학적 샘플군에 속하는지를 결정하기 위해 사용된다.). 어떤 실시예에서, 복수의 모델이 같은 생물학적 특징의 존재 또는 부존재에 대하여 테스트한다. 다시 말해, 복수의 모델이 생물학적 샘플이 특별한 생물학적 샘플군에 속하는지를 결정하기 위해 테스트한다. 이 색션은 전형적인 생물학적 특징들을 묘사한다. 어떤 생물학적 특징을 갖는 유기체는 상응하는 생물학적 샘플군에 속하는 것으로 간주되어질 수 있다.
4. 1 유방암(BREAST CANCER)
Pusztai et al.
몇 가지의 상이한 보조적 화학요법 레지멘(chemotherapy regimen)이 유방암 치료에 사용된다. 모든 레지멘이 모든 환자에게 동일하게 효과적인 것은 아니다. 현재, 각각의 환자에 대해 가장 효과적인 레지멘을 선택하는 것은 가능하지 않다. 유방암에서의 화학요법(chemotherapy) 후에 연장된 비재발 생존자(prolonged recurrence-free survival)의 하나의 인정된 대리(surrogate)는 신보강 요법(neoadjuvant therapy)으로의 완전한 병리적인(pathologic) 대응(pCR)이다. Pusztai etal., ASCO 2003 abstract 1은 FAC 연속 화학요법(FAC sequential chemotherapy (T/FAC))이 그 뒤를 잇게 되는 신보강의 주간의 파크리탁셀(neoadjuvant weekly paclitaxel) 후에 pCR을 예보하는 유전자 발현 프로파일(ene expression profile)의 발견을 보고한다. Pusztai etal. 예언적인 마커(predictive marker)는 24명의 초기 단계 유방암 환자의 파인 니들 아스피레이트(fine needle aspirates)로부터 생성되었다. 24명의 환자 중 6명이 pCR을 획득했다(25%). Pusztai etal.에서, 각각의 샘플로부터의 RNA는 30,000개의 인간 트랜스크립트(transcript)의 cDNA 마이크로어레이(cDNA microarray) 위에 프로파일된다. pCR과 나머지 질병(RD) 사이의 차별적으로 표현된 유전자는 시그널-투-노이즈-레이시오(signal-to-noise-ratio)에 의해 선택된다. 몇몇의 감독된 교육 방법(Several supervised learning method)은 리브-원 아웃 크로스 밸리데이션(leave-one out cross validation)을 사용하여 가장 좋은 예보 알고리즘(prediction algorithm)과 결과 예보(utcome prediction)를 필요로하는 최선의 유전자 수를 정의하기 위해 평가되었다. 다섯개의 유전자(3 ESTs, 핵 팩터 1/A(nuclear factor 1/A) 및 히스톤 아세틸트랜스패라제( histone acetyltransferase))를 사용하는 지지 백터 머신(support vector machine)은 가장 대단하게 평가된 정확성을 산출했다. 이 예언적인 마커 세트(predictive marker set)은 T/FAC 신보강 요법(T/FAC neoadjuvant therapy)을 받는 독립적 케이스에 대해 테스트된다. Pusztai etal.는 확인(validation)에서 포함되는 21명의 환자를 위한 결과를 보고했다. 유전자 발현 프로파일에 근거한 Pusztai et al. 대응 예보(response prediction)의 전체 정확성(overall accuracy)은 81%이다. 전체 특이성(overall specificity)은 93%이다. (여섯 개의 pCR 중 세 개는 RD로서 잘못 분류되었다). Pusztai et al.은 T/FAC 수술전 화학요법(T/FAC preoperative chemotherapy)으로 pCR을 갖는 것으로 예보되는 환자들이 선택되지 않는 환자들에서 기대되는 25-30%에 비하여 pCR을 경험하는 75%의 가능성을 갖는다는 것을 발견했다. Pusztai etal.의 발견들은 의사들이 T/FAC 보조 화학요법(T/FAC adjuvant chemotherapy)으로부터 가장 이익을 받을 것 같은 개개의 환자들을 선택하는 것을 돕기 위해 사용될 수 있는 모델(202)을 구축하기 위해 사용될 수 있다.
Cobleigh et al.
열 개 이상의 포지티브 노드(positive node)를 갖는 유방암 환자들은 부족한 예후(prognosis)를 갖는다. Cobleigh etal., ASCO 2003 abstract 3415은 이 고 위험의 환자 그룹에서 디스턴트 디지즈-프리 서바이벌(distant disease-free survival (DDFS))에 대한 예언자(predictor)를 확인하고자 한다. 1979년부터 1999년까지 진단된 침습성의(invasive) 암세포 및 열 개 이상의 포지티브 노드(positive node)를 갖는 환자들은 확인되었다. RNA는 세 개의 10 미크론 색션(10 micron section)으로 부터 추출되고, 발현(expression)은 일곱 개의 레퍼런스 유전자(reference gene) 및 RT- PCR를 사용하는 185개의 암 관련 유전자에 대해 양이 표시된다(quantified). 유전자는 공개된 문헌 및 마이크로어레이 실험의 결과에 근거하여 선택된다. 총 79명의 환자가 연구되었다. 환자들의 54%가 혼르몬 치료(hormonal therapy)를 받았고, 80%가 화합요법치료(chemotherapy)를 받았다. 미디언 팔로우-업은 15.1 yrs이었다. 2002년 8월, 환자들의 77%는 디스턴트 재발(distant recurrence) 또는 유방암 사망을 가졌다. 임상적 변수(clinical variable)에 대한 유니베이에이트 콕스 생존 분석(Univariate Cox survival analysis)은 관련된 노드의 수가 두드러지게 DDFS (p=0.02)와 연관된다. Cobleigh etal.는 DDFS 시간(DDFS time)에서 변수의 13%를 차지하는 나이, 종양 크기, 관련된 노드, 종양 등급, 보조의 호르몬 요법, 화학 요법을 포함하는 멀티베리에이트 모델을 적용했다. 상기 185개의 암 관련 유전자의 유니베이에이트 콕스 생존 분석(Univariate Cox survival analysis)은 수많은 유전자가 DDFS(5 with p < 0.01 ; 16 with p < 0.05)와 관련된다는 것을 지적한다. 더 높은 발현(Higher expression)은 HER2 어뎁터 Grb7(HER2 adaptor Grb7)와 마크로페이지 마커 CD68(macrophage marker CD68)를 위한 짧은 DDFS (p < 0.01)와 관련된다. 더 높은 발현(Higher expression)은 TP53BP2 (tumor protein p53-binding protein 2), PR, 및 Bcl2를 위한 더 긴 DDFS(p < 0. 01)와 관련된다. 다섯개의 유전자를 포함하는 멀티베리에이트 모델은 DDFS 시간(DDFS time)에 있는 베리언스(variance)의 45%를 책임진다. 멀티베리에이트 분석 역시 유전자 발현이 임상적 변수(clinical variable)를 위한 컨트롤링(controlling) 후에 중요한 예언자라는 것을 지적한다. The Cobleigh et al.의 발견들은 어떤 환자들이 DDFS와 관련될 것 같은지와 어떤 환자들이 DDFS와 관련되지 않을 것 같은지를 결정하는 것을 돕기 위해 사용되어질 수 있는 모델을 구축하기 위해 사용될 수 있다.
van't Veer.
질병의 같은 단계를 갖는 유방암 환자들은 현저하게 차이나는 치료에 대한 반응 및 전체적인 결과를 가질 수 있다. 예를 들어, 전이, 림프 노드 스테이터스 및 조직학적 등급에 대한 예보자(Predictor)는 그들의 임상적 습성에 따라 정확하게 유방 종양을 분류하는데 실패한다. 이 결점을 전하기 위해 Veer 2002, Nature 415,530-535는 117 명의 환자들의 최초의 유방 종양들에 대한 DNA 마이크로어넬리시스(DNA microanalysis)를 사용했다. 더하여, van't Veer는 BRCA1 케리어(BRCA1 carrier)의 종양을 확인하는 서명을 확립했다. van't Veer의 발견들은 환자의 예후를 결정하는 것을 돕기 위해 사용될 수 있는 모델을 구축하기 위해 사용될 수 있다.
다른 문헌들.
유방암을 관찰하는 것을 위한 모델을 구축하기 위해 사용될 수 있는 추가적인 유방암 연구의 대표적인 표본은 ASCO 2003 abstract 3466; Ikeda etal., ASCO 2003 abstract 34; Schneider etal., 2003, British Journal of Cancer 88, p. 96; Long et al. ASCO 2003 abstract 3410;와 Chang et al., 2002, PeerView Press, Abstract 1700, "Gene Expression Profiles for Docetaxel Chemosensitivity."를 포함하며, 이들에 한정되는 것은 아니다.
4. 2 폐암(LUNG CANCER)
Rosell-Costa et al.
ERCC1 mRNA 레벨(ERCC1 mRNA level)은 DNA 리페어 커패서티(DNA repair capacity (DRC)) 및 시스플라틴(cisplatin)으로의 임상적 저항과 관련된다. 효소 활동(enzyme activity)에서의 변화와 리보뉴클레오티드 리덕테이즈(ribonucleotide reductase (RR))의 M1 또는 M2 서브유닛(M1 or M2 subunits)의 유전자 발현은 젬시타빈 손상(gemcitabine damage) 후에 DNA 회복(DNA repair) 동안 관찰된다. Rosell-Costa etal., ASCO 2003 abstract 2590은 vrb/ifos(Alberola et al. ASCO 2001 abstract 1229)에 의해 뒤따라지는 gem/cis versus gem/cis/vrb vs gem/vrb으로 무작위 추출된 570명의 환자들의 시험에 포함되는 100명의 IV 단계(stage IV (NSCLC))의 환자들의 종양 비옵시(tumor biopsy)로부터 분리된 RNA에서 퀀터티브 PCR(quantitative PCR)에 의해 RCC 1 andRRM1 mRNA 레벨을 평가했다. ERCC1와 RRM1 데이터는 81명의 환자에 대하여 적용되었다. 이 81명의 환자들의 총 반응 속도(Overall response rate), 진행으로의 시간(time to progression (TTP)) 및 미디언 서바이벌(median survival)은 모든 570명의 환자에 대한 결과와 유사했다. ERCC1와 RRM1 사이의 강한 상관 관계가 발견되었다(P=0.00001). ERCC1와 RRM1 레벨에 따른 결과에 있어서의 두드러진 차이는 gem/cis arm에서 발견되었으나, 다른 arm에서는 발견되지 않았다. gem/cis arm에서, TTP는 low ERCC 1을 가진 환자들에게는 8.3달, highERCC1 (P=0.07)를 가진 환자에게는 5.1달, low RRM1를 가진 환자에게는 8.3달, 그리고 highRRM1 (P=0. 01)를 가진 환자에게는 2.7달, low ERCC 1 &RRM1를 가진 환자에게는 10달, highERCC1 &RRM1 (P=0.009)를 가진 환자에게는 4.1달이었다. MS는 low ERCC1를 가진 환자에게는 13.7달, highERCC1 (P=0. 19)를 가진 환자에게는 9.5달, lowRRM1를 가진 환자에게는 13.7달, highRRM1 (P=0.009)를 가진 환자에게는 3.6달, low ERCC1 &RRM1를 가진 환자에게는 도달되지 않았고, high ERCC1 &RRM1를 가진 환자에게는 (P=0.004) 6.8달이었다. low ERCC1 및 RRM1 레벨을 가진 환자들은 low DRC를 지시하면서 gem/cis에 대해 이상적인 지원자(candidate)였다. 반면에, 높은 레벨을 갖는 환자들은 더 열악한 결과를 가졌다. 따라서, ERCC1 & RRM1를 포함하는 비율들은 어떤 종류의 치료요법이 폐암 환자들에게 주어져야만하는지를 결정하는 모델을 구축하기 위해 사용될 수 있다.
Hayes et al.
폐암의 높은 유행에도 불구하고, 예후 및 치료 감응(treatment response)에 의한 환자에 대한 건전한 층화(robust stratification)는 파악하기 어렵다. 폐암 유전자 발현 정렬(lung cancer gene expression array)의 최초의 연구들은 아데노카르시노마(adenocarcinoma)의 이전에 인정되지 않은 서브클레스(subclasse)가 존재할지도 모른다는 것을 제안했다. 이 연구들은 되풀이되지 않고 있고 임상적 결과를 가진 서브클레스의 결합은 완벽하지 않은 상태로 남아 있다. 세 개의 가장 큰 케이스 시리즈에 의해 제안된 서브클레스를 비교하기 위해, 366 종양과 노말 조직 샘플을 포함하는 그들의 유전자 발현 정렬은 Hayes etal., ASCO 2003 abstract 2526에 의해 의한 데이터 세트에서 분석된다. 발현 데이터의 보통 세트는 리-스케일된다(re-scaled). 그리고 필터링(filtering)은 일치하는 발현을 가진 유전자의 서브세트을 선택하도록 고용된다. 계층적 클러스터링(Hierarchical clustering)은 공통의 데이터 세트에서 수행되었고, 결과로서 생기는 클러스터는 오리지널 원고(original manuscript)의 작가에 의해 제안된 그들에게 비교하였다. 오리지널 분류 스킴으로의 직접적인 비교를 만들기 위하여, 분류자(classifier)은 구성되고 366 종양의 풀로부터 벨리데이션 샘플도 적용된다. 분석의 각각의 단계에서, 벨리데이션과 최초로 공개된 클래스 사이의 클러스터링 일치는 통계학적으로 중요하다. 추가적인 벨리데이션 단계에서, 최초로 공개된 서브클래스를 묘사하는 유전자의 목록은 분류 스킴에 따라 비교된다. 다시, 아데노카르시노마 서브타입(adenocarcinoma subtype)을 묘사하기 위하여 사용되는 유전자의 목록들에 통계학적으로 중요한 오버랩이 있다. 마침네, 서바이벌 커브(survival curve)는 감소된 생존자(survival)를 갖는 아데노카르시노마의 하나의 서브타입을 증명했다. The Hayes etal. 분석은 재생산될 수 있는 아데노카르시노마의 서브타입이 mRNA 발현 프로파일링(mRNA expression profiling)에 근거하여 묘사될 수 있다는 것을 확립하기 위해 돕는다. 따라서, Hayes etal.의 결과는 아데노카르시노마의 서브타입을 확인하기 위해 사용될 수 있는 모델을 구축하기 위해 사용될 수 있다.
4. 3 전립선 암(PROSTATE CANCER)
Li et al.
탁소테르(Taxotere)는 전립선 암을 포함하는 솔리드 종양(solid tumor)에 대항한 반종양 활동(anti-tumor activity)을 보여준다. 그러나, 탁소테르의 활동의 분자 메카니즘음 전적으로 밝혀지지 않았다. 호르몬 비민감성(PC3) 및 호르몬 민감성(LNCaP) 전립선 암 세포에서의 탁소테르의 활동의 분자 메카니즘을 확립하기 위하여, 포괄적 유전자 발현 프로파일(comprehensive gene expression profile)은 Affymetrix Human Genome U133A array를 사용하여 얻어질 수 있다. Li et al. ASCO 2003 abstract 1677을 보라. 6, 36, 및 72 시간 동안 2 nM Taxotere 처리된 세포와 처리되지 않은 세포로부터의 전체 RNA는 마이크로어레이 분석되었고, 데이터는 Microarray Suite, Data Mining, Cluster and TreeView 및 Onto-express software를 사용하여 분석되었다. 유전자의 발현에서의 교호(alternation)는 여섯 시간 일찍 관찰된다. 그리고 더 많은 유전자들이 더 긴 처리와 함께 교호되었다. 추가적으로 탁소테르는 LNCaP 및 PC3 세포 사이의 유전자 발현 프로파일에 대한 차별적인 효과를 나타내었다. inLNCaP 세포에 있는 57,823 및 964 유전자에 비교될 때, 166,365 및 1785 유전자가 PC3 세포에서 2 폴드 변화를 보여주었다. steroid- independent AR activation(IGFBP2,FGF13, EGF8, etc)에 포함되는 몇몇 유전자의 업 레귤레이션(up-regulation)이 LNCaP 세포에서 관찰됨에도 불구하고, Li etal.는 안드로겐 리셉터(androgen receptor)에 대한 아무런 효과를 발견하지 못했다. 클러스터링 분석은 세포 프로리퍼레이션(cell proliferation)과 세포 사이클(cell cycle)(cyclins andCDKs, Ki-67, 등)에 대한 유전자의 다운 레귤레이션, 시그널 트랜스덕션(signal transduction)(IMPA2,ERBB2IP, etc), 전사 팩터(HMG-2, NFYB, TRIP13, PIR, etc) 및 종양형성(oncogenesis)(STK15,CHK1, Survivin, etc. )을 보여준다. 반대로, 탁소테르 업-레귤레이티드 유전자(Taxotere up-regulated gene)는 아포토시스의 유도(GADD45A, FasApo-1, etc), 세포 사이클 억제(p21 CIP 1, p27KIP 1, etc) 및 종양 억제(tumor suppression)와 관련된다. 이 결과들로부터, Li etal.는 탁스테르가 수많은 유전자의 변성(alteration)을 야기시키고, 그러한 많은 유전자의 변성이 분자 메카니즘에 기여하고, 그러한 분자 메카니즘에 의해서 탁소테르가 전립선암 세포에 영향을 준다는 결론을 내렸다. 이 정보는 전이 전립선암의 치료를 위한 탁소테르의 치료적 효과(therapeutic effect)를 최적화하기 위해 전략들을 고안하기 위해 활용될 수 있다. 이 색션에서 묘사된 결과를 사용하여, 탁소테르 및 관련 치료 레지멘(예를 들어, 탁소테르에 높게 반응하는 첫번째 생물학적 특징, 탁소테르에 반응하지 않는 두번째 생물학적 특징)으로의 반응의 다양한 정도를 갖는 그룹들로 환자를 분류하는 모델들은 발전될 수 있다. 또 다른 접근에서, 생물학적 특징들은, 부분적으로, D2 단계 전립선 암에서 생존자 예보자(survival predictor)로서 기여하기 위하여 Cox-2 발현에 근거해서 발전될 수 있다.
4. 4 결장암(COLORECTAL CANCER)
Kwon et al.
콜로렉탈 발암현상(colorectal carcinogenesis)의 발전에 포함된 유전자의 세트을 확인하기 위하여, Kwon et al. ASCO 2003 abstract 1104는, acDNA microarray representing 4,608 유전자에 의해서 상응하는 넌칸세로스 콜로닉 에피델리아(noncancerous colonic epithelia)를 갖는 12개의 종양으로부터 결장암 세포의 유전자 발현 프로파일을 분석했다. Kwon et al.은 투-웨이 클러스터링 분석(two-way clustering analysis)과 암과 넌카세로스 조직(noncancerous tissue) 사이에서 차이나게 표현되는 확인된 유전자에 의해서 샘플과 유전자를 분류했다. 유전자 발현 레벨에서 변성(Alteration)은 선택된 유전자에서 리버스-트랜스크립타제 PCR (RT-PCR)에 의해서 확실히될 수 있다. 림프 노드 전이(lymph node metastasis)에 따른 유전자 발현 프로파일은 감독된 학습 기술(supervised learning technique)을 가지고 평가된다. 종양의 75% 이상에서의 발현 변화는 122개의 유전자, 즉 77개의 업-레귤레이티드 및 45개의 다운-레귤레이티드 유전자에 대하여 관찰된다. 가장 자주 변성되는 유전자는 시그널 트랜스덕션(19%), 메타볼리즘(17%), 세포 구조/모틸리티(cell structure/motility)(14%), 세포 사이클(13%) 그리고 유전자 단백질 발현(gene protein expression)(13%)의 기능적 카테고리에 속한다. 무작위적으로 선택된 유전자의 RT-PCR 분석은 cDNA 마이크로어레이에 있는 그것들과 일치하는 발견을 보여준다. Kwon etal.은 크로스-벨리데이션 루프를 갖는 12명의 환자들 중의 10명에 대한 림프 노드 전이(lymph node metastasis)를 예보한다. Kwon et al.의 결과는 환자가 결장암을 가지는지를 결정하기 위한 모델을 발전시키기 위해 사용될 수 있다. 게다가, Kwon et al.의 결과는 결장암의 서브클레스를 확인하기 위해 연장될 수 있다. 결장암을 위한 모델을 발전시키기 위해 사용되는 추가적인 연구들은 Longleyet al., 2003 Clin. Colorectal Cancer. 2, p. 223; McDermott et al., 2002, Ann Oncol. 13, p. 235; 및 Longley et al., 2002, Pharmacogenomics J. 2, p. 209.뿐만 아니라 Nasir etal., 2002, In Vivo. 16, p. 501를 포함한다. 다만 이에 한정되는 것은 아니다.
4. 5 난소암(OVARIAN CANCER)
Spenlzo. s et al.
상피 난소암(EOC)에서의 임상적 결과와 관련한 발현 프로파일을 확인하기 위하여, Spentzos eta/. ASCO 2003 abstract 1800은 first-line platinum/taxane-based chemotherapy을 받는 EOC를 가진 환자들로부터의 38개의 종양 샘플을 평가했다. RNA 프로브(RNA probe)는 12675개의 인간 유전자와 발현된 연속 태그(expressed sequence tag)를 포함하는 올리고핵산염 배열로 역전사되고(reverse-transcribed), 플루오레선트-라벨드되고(fluorescent-labeled), 하이브라이즈드(hybridized)되었다. 발현 데이터는 약제 민감성(), 디지즈-프리 서바이벌(disease-free survival(DFS)) 및 오버롤 서바이벌(overall survival (OS))에 대해 예보하는 시그너쳐(signature)를 위해 분석되었다. 베이에시언 모델(Bayesian model)은 차이나는 항암제 감수성 및 서바이벌의 종양들 사이의 차이나는 발현에 대한 그들이 가능성에 따라 유전자를 분류하기 위해 사용된다. 차이나는 결과를 갖는 종양 서브그룹들 사이에서 차이나게 발현되는 것의 가장 높은 가능성을 가진 유전자들은 각각의 시그너쳐에 포함된다. Spealtzos et al.는 과발현된 인케모리시스턴트 종양(overexpressed inchemoresistant tumor)인 유전자의 한 세트과 과발현된 인케모센서티브 종양(verexpressed inchemosensitive tumor)인 유전자의 다른 세트을 발견했다. Spentzos et cal.는 짧은 DFS과 관련된 종양에서 과발현된 45 개의 유전자와 긴 DFS와 관련된 종양에서 과발현되는 18 개의 유전자를 발견했다. 이 유전자들은 환자 모집단(patient population)을 7.5달 및 30.5달의 미디언 DFS를 갖는 두 개의 그룹으로 분리했다(p <0.00001). Spentzos et al.는 짧은 OS를 갖는 종양에서 과발현된 20개의 유전자와 긴 OS를 갖는 종양에서 과발현된 29개의 유전자를 발견했다(22달 및 40달의 미디언 OS ,p=0. 00008). Spenizos et al.에 의해서 확인되는 과발현된 유전자들은 케모리시스턴트 난소암(chemoresistant ovarian cancer), 케모센서티브 난소암(chemosensitive ovarian cancer), 짧은 DFS 난소암(short DFS ovarian cancer), 긴 DFS 난소암(long DFS ovarian cancer), 짧은 OS 난소암(short OS ovarian cancer) 및 긴 OS 난소암(long OS ovarian cancer)과 같은 생물학적 군으로 생물학적 표본을 분류하는 모델을 구축하기위해 사용될 수 있다. 난소암을 위한 모델을 발전시키기 위해 사용될 수 있는 추가적인 연구들은 Presneau etal., 2003, Oncogene 13, p. 1568 및 Takano et al. ASCO 2003 abstract 1856.가 있으나, 이에 한정되는 것은 아니다.
4. 6 방광암(BLADDER CANCER)
Wulfing et al.
아라키도네이트 메타볼리즘(arachidonate metabolism)에 포함되는 유도효소(inducible enzyme)인 Cox-2는 다양한 인간 암에서 공통적으로 과발현되는 것으로 보여졌다. 최근의 연구는 Cox-2 발현이 어떤 종양 실재물(tumor entity)에 대한 라디에이션 또는 화학요법을 경험하는 환자들에서 예후의 값을 갖는다는 것을 밝혔다. 방광암에서, Cox-2 발현은 서바이벌 데이터와 잘 관련되지 않는다. 이것을 알리기 위해, Wulfing et al. ASCO 2003 abstract 1621는 침습성의 방광암(invasive bladder cancer)을 위한 라디칼 시스텍토미(radical cystectomy)를 경험한 157명의 컨세큐티브 환자(consecutive patient)를 연구했다. 이들 중에서 61명의 환자는, 보조적 세팅에서 또는 전이 질병을 위하여 시스플라틴 함유 화학요법(cisplatin-containing chemotherapy)을 받았다. 표준 면역조직화학(Standard immunohistochemistry)은 모노클로널 Cox-2 항체(monoclonal Cox-2 antibody)를 적용하면서 파라핀-임배디드 조직 블록(paraffin-embedded tissue block)에서 수행된다. 세미퀀터티브 결과(Semiquantitative result)는 임상의(clinical) 그리고 병리적인(pathological) 데이터, 롱-텀 서바이벌 레이트(long-term survival rates)(3-177 months) 및 화학요법에서의 세부적인 사항(details on chemotherapy)들에 관련된다. 26개의 케이스(16.6%)가 Cox-2-네가티브였다. 모든 포지티브 케이스(n=131,83. 4%)로부터, 59(37.6%)는 낮은 Cox-2 발현(low Cox-2 expression)을, 53(33.8%)은 중간의 Cox-2 발현을, 19(12.1%)는 강한 Cox-2 발현을 보여주었다. 발현은 TNM-스테이징(TNM-Staging)과 조직학적 등급(histological grading)에 독립적이다. Cox-2 발현은 종양의 조직학적 타입과 중요하게 관련된다(urothelial vs. squamous cell carcinoma; P=0.01). 모든 조사된 경우에 있어서, Kaplan-Meier 분석은 오버롤 및 디지즈 프리 서바이벌로 어떤 통계적인 관련도 보여주지 않는다. 그러나, 시스플라틴-함유 화학요법을 갖는 환자들의 서브그룹 분석에 의해서, Cox-2-발현은 열악한 총 서바이벌 시간(overall survival time)(P=0.03)과 중요하게 관련된다. Wulfing etal.에 따르면, Cox-2의 이뮤노히스토케미칼 과발현(immunohistochemical overexpression)은 방광암에서 매우 일반적인 일이다. 화학요법을 받은 환자들은 그들의 종양에서 Cox-2를 과발현할 때 더 나쁜 서바이법 레이트를 갖는 것처럼 보인다. 그러므로, Wulfing etal.는 Cox-2 발현이 시스테인-베이스드 화학요법 레지멘(cisplatin-based chemotherapy regimen)으로 처리된 방광암을 갖는 환자들을 위한 추가적인 예후의 정보를 제공할 수 있고, 이것이 개개의 호나자들에 대한 더욱 공격적인 치료 또는 선택적 Cox-2-저해제를 사용하는 리스크-어뎁트 타게티드 치료(risk-adapted targeted therapy)를 위한 기초가 될 수 있다고 추론했다. Wulfing etal.의 결과는 방광암 모집단(bladder cancer population)을 치료 그룹(treatment group)으로 계층화하는 모델을 발전시키기 위해 사용될 수 있다.
4. 7 위암(GASTRIC CANCER)
Terashima et al.
인간 위암에서 케모리시스턴스-관련 유전자(chemoresistance-related gene)를 검출하기 위하여, Terashima etal., ASCO 2003 abstract 1161는 DNA 마이크로어레이를 사용하여 유전자 발현 프로파일을 조사하고 인 비트로 약물 민감성(in vitro drug sensitivity)과 그 결과를 비교하였다. 신선한 종양 조직(Fresh tumor tissue)은 위암을 갖는 총 16명의 환자로 부터 얻어졌고, 12,000 개의 인간 유전자와 EST 서열(EST sequence)를 포함하는 GeneChip Human U95Av2 array (Affymetrix, Santa Clara, California)를 사용하여 유전자 발현 프로파일을 위해 시험되었다. 그 발견들은 ATP 분석(ATP assay)에 의해 결정되는 인 비트로 약물 민감성의 결과오 비교되었다. 관찰된 약물과 약물 농도는 시스플라틴(cisplatin (CDDP)), 독소루비신(doxorubicin (DOX)), 미토미신 C(mitomycin C (MMC)), 에토포시드(etoposide (ETP)), 이피노테칸(irinotecan (CPT; as SN-38)), 5-플루오루라실(5-fluoruuracil (5-FU)), 독시플루리딘(doxifluridine (5'-DFUR)), 파클리탁셀(paclitaxel (TXL)) 및 도세탁셀(docetaxel (TXT))이었다. 약물 민감성은 그룹을 컨트롤하기 위해 약물 처리 그룹에서의 ATP 함유량(ATP content)의 비로서 표현된다(T/C percent). 상대적인 유전자 발현의 양과 T/C percent 사이의 피어슨 상호관계(Pearson correlation)는 평가되었고, 클러스터링 분석은 역시 그 상호관계에 의해 선택된 유전자들을 사용하여 수행되었다. 이 분석들로부터, CDDP에 있는 51개의 유전자, DOX에 있는 34개의 유전자, MMC에 있는 26개의 유전자, ETP에 있는 52개의 유전자, CPT에 있는 51개의 유전자, 5-FU에 있는 85개의 유전자, 5'-DFUR에 잇는 42개의 유전자, TXL에 있는 11개의 유전자 및 TXT에 있는 32개의 유전자가 약물 저항 종양(drug resistant tumor)에서 업-레귤레이티드(up-regulated)였다. 이들 유전자의 대부분은 세포 성장(cell growth), 세포 사이클 레귤레이션(cell cycle regulation), 아포토시스(apoptosis), 히트 쇼프 프로테인(heat shock protein) 또는 유비퀴틴-프로티즘 패스웨이(ubiquitin-proteasome pathway)과 관현이 있다. 그러나, 리보조멀 단백질(ribosomal protein), CD44 및 이롱게이션 팩터 알파(elongation factor alpha)와 같은 몇몇 유전자들은 각각의 약물-저항 종양에서 명백하게 업-레귤레이티드였다. Terashima et al.에 의해 확인된 업-레귤레이티드 유전자들은 위암을 가진 환자들을 진단하는 것뿐만 아니라 환자가 약물-저항 위 종양을 갖는지와 만약 그렇다면 약물-저항 종양의 종류가 무엇인지에 대한 지적을 제공하는 모델을 발전시키기 위해 사용될 수 있다. 위암을 위한 모델을 발전시키기 우해 사용될 수 있는 추가적인 참고문헌은 Kim et al.ASCO 2003 abstract 560; Arch-Ferrer et al. ASCO 2003 abstract 1101; Hobday ASCO 2003 abstract 1078; Song et al. ASCO 2003 abstract 1056 (overexpression of the Rb gene is an independent prognostic factor for predicting relapse free survival); Leichman et al., ASCO 2003 abstract 1054 (thymidylate synthase expression as a predictor of chemobenefit in esophageal/gastric cancer)들을 포함한다.다만, ㅇ이에 한정되는 것은 아니다.
4. 8 직장암(RECTAL CANCER)
Lenz et al.
국부 재발(Local recurrence)은 직장암을 갖는 환자에 있어서의 중요한 임상적 문제이다. 따라서, Lenz et al. ASCO 2003 abstract l185은 보조적 화학방사선 요법(adjuvant chemoradiation)으로 처리된 직장암을 갖는 환자들에서 팰빅 재발(pelvic recurrence)을 예보하는 유전적 프로파일을 확립하고자 한다. 국부적으로 진전된 직장암(U1CC stage 11 andIII)을 갖는 73명의 환자들(25 female, 48 male, median age 52.1 years)은 1991-2000에 처리되었다. 조직학적 스테이징(Histological staging)은 stageT2로서 22명의 환자를, stageT3으로서 51명의 환자를 분류했다. 35명의 환자는 림프 노드 네가티브이었고, 38명의 환자는 하나 또는 그 이상의 림프 노드 전이를 가졌다. 모든 환자들은 암 절제를 경험했고, 다음으로 5-FU과 팰빅 라디에이션이 이어졌다. RNA는 포르말린-픽스ㄷ, 파라핀-임배디드, 레이저-카팔레-마이크로디젝티드 조직으로 부터 추출된다. Lenz et al.은 퀀터테이티브 RT-PCR(quantitative RT-PCR (Taqman))에 의해 종양 및 인접 조직에서의 SFL1 pathway (TS, DPD), 혈관형성(angiogenesis (VEGF)) DNA 리페어(ERCC1, RAD51)에서 포함되는 유전자의 mRNA 레벨을 결정했다. Lenz et al.은 국부 종양 재발과 ERCCI의 인접 노말 조직에서이 더 높은 m-RNA 발현 레벨 사이의 중요한 관계를 발견했다. 그리고, TS는 DNA 리페어 및 혈관형성(angiogenesis)뿐만 아니라 5-FU 패스웨이의 타겟 유전자의 유전자 발현 레벨은 팰빅 재발에 대한 위험에 에 있는 환자들을 확인하는데 유용하다고 제안한다. Lenz et al.의 결과는 팰빅 재발에 대한 위험에 있는 환자를 확인하는 모델을 발전시키기 위해 사용될 수 있다.
4. 9 추가적인 전형적 생물학적 특징(ADDITIONAL EXEMPLARY BIOLOGICAL FEATURES)
추가적인 대표적 생물학적 특징들은 좌창(acne), 선단 비대증(acromegaly), 쓸개염(acute cholecystitis), 에디슨병(Addison's disease), 샘근육증(adenomyosis), 성장 호르몬 결핍(adult growth hormone deficiency), 육종증(adult soft tissue sarcoma), 알콜중독(alcohol dependence), 알레르기성 비염(allergic rhinitis), 알레그기(allergies), 탈모증(alopecia), 알츠하이머병(alzheimer disease), 양수천자(amniocentesis), 심장 기능부전 빈혈증(anemia in heart failure), 빈혈증(anemias), 협심증(angina pectoris), 강직척추염(ankylosing spondylitis), 신경불안(anxiety disorders), 난소의 남성배세포종(arrhenoblastoma of ovary), 부정맥(arrhythmia), 관절염(arthritis), 관절염-관련 시력 문제(arthritis-related eye problems), 천식(asthma), 동맥 경화증(atherosclerosis), 아토피 습진 위측증 질염(atopic eczema atrophic vaginitis), 주의력 부족(attention deficit disorder), 주의력 장애(attention disorder), 자기 면역 질병(autoimmune diseases), 귀두포피염(balanoposthitis), 대머리(baldness), 큰어귀샘 농양(bartholins abscess), 출산결함(birth defects), 출혈장애(bleeding disorders), 골격암(bone cancer), 뇌 및 척수 종양(brain and spinal cord tumors), 신경교종(brain stem glioma), 죄종양(brain tumor), 유방암(breast cancer), 유방암 위험(breast cancer risk), 심장 장애(breast disorders), 암(cancer), 신장암(cancer of the kidney), 심근종(cardiomyopathy), 경동맥 질병(carotid artery disease), 경동맥 앤다르테렉토미(carotid endarterectomy), 카팔 터널 신드롬(carpal tunnel syndrome), 중풍cerebral palsy), 세비컬 암(cervical cancer), 연성 하감(chancroid), 설사(chickenpox), 유아 콩팥증후군(childhood nephrotic syndrome), 클라미디아(chlamydia), 만성 설사(chronic diarrhea), 만성 심장 기능부전(chronic heart failure), 절름발이(claudication), 복통(colic),결장 또는 직장암 (colon or rectum cancer), 결장암(colorectal cancer), 감기(common cold), 콘딜로마(condyloma (genital warts)), 선천성 갑상선종(congenital goiters), 출혈성 심장 기능부전(congestive heart failure), 결막염(conjunctivitis), 각막 질병(corneal disease), 각막 종기(corneal ulcer), 동맥 심장 질병(coronary heart disease), 와포자충증(cryptosporidiosis), 큐싱즈 신드롬(Cushings syndrome), 방광 섬유증(cystic fibrosis), 방광염(cystitis), 시스토코피 또는 우레제로스코피(cystoscopy or ureteroscopy), 드 쿠에르비안 질병(De Quervains disease), 치매(dementia), 우울증(depression), 조병(mania), 당뇨병(diabetes), 요붕증(diabetes insipidus), 당뇨병(diabetes mellitus), 당뇨망막병증(diabeticretinopathy), 다운증후군(Down syndrome), 월경통(dysmenorrhea in the adolescent), 성교통증(dyspareunia), 귀 알레르기(ear allergy), 귀 감염(ear infection), 식사 장애(eating disorder), 습진(eczema), 기종(emphysema), 심장 내막염(endocarditis), 앤도매트리얼 암(endometrial cancer), 앤도매트리오시스(endometriosis), 이누레시스(eneuresis in children), 부고환염(epididymitis), 간질(epilepsy), 외음절개술(episiotomy), 발기부전(erectile dysfunction), 아이 암(eye cancer), 패이탈 업스트랙션(fatal abstraction), 대변실금(fecal incontinence), 여성 성기능 장애(female sexual dysfunction), 태아 기형(fetal abnormalities), 태아 알콜증후군(fetal alcohol syndrome), 피브로미알지아(fibromyalgia), 플루(flu), 폴리쿨리티스(folliculitis), 펑갈 감염(fungal infection), 가드네렐라 배지날리스(gardnerella vaginalis), 성기 칸디다증(genital candidiasis), 성기 포진(genital herpes), 제스테이셔널 당뇨병(gestational diabetes), 글라우코마(glaucoma), 사구체 질병(glomerular diseases), 임질(gonorrhea), 통풍과 가성 통풍(gout and pseudogout), 성장장애(growth disorders), 검 질병(gum disease), 헤어 장애(hair disorders), 구취(halitosis), 햄버거 질병(Hamburger disease), 형우병(hemophilia), 간염(hepatitis), B형 간염(hepatitis b), 유전성 결장암(hereditary colon cancer), 헤르페스 감염(herpes infection), 인간 플라센탈 락토겐(human placental lactogen), 부갑상샘항진증(hyperparathyroidism), 고혈압(hypertension), 갑상샘과다증(hyperthyroidism), 저혈당증(hypoglycemia), 히포고나디즘(hypogonadism), 히포스파디아스(hypospadias), 히포티로이디즘(hypothyroidism), 히스터렉토미(hysterectomy), 발기불능(impotence), 불임증(infertility), 염증 결장 질병 (inflammatory bowel disease), 서혜 헤르니아(inguinal hernia), 유전성 심장 불규칙(inherited heart irregularity), 인트라오큘라 멜라노마(intraocular melanoma), 민감성 결장 신드롬(irritable bowel syndrome), 카포시스 사르코마(Kaposis sarcoma), 백혈병(leukemia), 간암(liver cancer), 폐암(lung cancer), 말라리아(malaria), 조울증(manic depressive illness), 홍역(measles), 기억상실 (memory loss), 수막염(meningitis in children), 월경과다(menorrhagia), 메조테리오마(mesothelioma), 미크로알부민(microalbumin), 편두통(migraine headache), 미텔슈메르쯔(mittelschmerz), 구강암(mouth cancer), 운동 장애(movement disorders), 이하선염(mumps), 나보티안 시스트(Nabothian cyst), 기면 발작(narcolepsy), 코 알레르기(nasal allergies), 나잘 케버티 및 파라나잘 시너스암 (nasal cavity and paranasal sinus cancer), 신경아종(neuroblastoma), 뉴로피브로마토시스(neurofibromatosis), 뉴롤라지컬 장애(neurological disorders), 신생아 황달(newborn jaundice), 비만(obesity), 오베시브-컴펄시브 장애(obsessive-compulsive disorder), 고환염 또는 부고환염(orchitis or epididymitis), 오로파시알 미오펑셔널 장애(orofacial myofunctional disorders), 골관절염(osteoarthritis), 골다공증(osteoporosis), 오스테오포로시스(osteoporosis), 골육종(osteosarcoma), 난소암(ovarian cancer), 난소 시스트(ovarian cysts), 판크리아틱 암(pancreatic cancer), 감돈포경(paraphimosis), 파킨슨병(Parkinson disease), 부분적 에필렙시(partial epilepsy), 팰빅 염증 질병(pelvic inflammatory disease), 펩틱 궤양(peptic ulcer), 페리스파텀 카르디오미오퍼시(periSpartum cardiomyopathy), 페이로니 질병(peyronie disease), 폴리시스틱 난소 신드롬(polycystic ovary syndrome), 자간전증(preeclampsia,), 프레그난디올(pregnanediol), 프레멘스트루얼 신드롬(premenstrual syndrome), 프리아피즘(priapism), 프롤락티노마(prolactinoma), 전립선암(prostate cancer), 건선(psoriasis), 류마틱 패버(rheumatic fever), 샐리버리 그랜드 암(salivary gland cancer), 사스(SARS), 성적 전달 질병(sexually transmitted diseases), 성적 전달 앤터릭션(sexually transmitted enterictions), 성적 전달 감염(sexually transmitted infections), 쉬한스 신드롬(Sheehans syndrome), 정맥두염(sinusitis), 피부암(skin cancer), 수면 장애(sleep disorders), 천연두(smallpox), 후각 장애(smell disorders), 코골이(snoring), 사회 공포증(social phobia), 스피나 비피다(spina bifida), 위암(stomach cancer), 매독(syphilis), 테스티큘러 암(testicular cancer), 갑상선암(thyroid cancer), 갑상선 질병(thyroid disease), 톤실리티스(tonsillitis), 치아 장애(tooth disorders), 트리코모니아시스(trichomoniasis), 튜브큘로시스(tuberculosis), 종양(tumors), 타입II 당노병(Type II diabetes), 얼세라티브 콜로이티스(ulcerative colitis), (urinary tract infections), (urological cancers), (uterine fibroids), 요도과 감염(vaginal cancer), 버지널 시스트(vaginal cysts), 벌보디니아(vulvodynia) 및 외음부질염(vulvovaginitis)를 포함한다. 다만, 이에 한정되는 것은 아니다.
5. 전사 상태 측정(TRANSCRIPTIONAL STATE MEASUREMENTS)
이 색션은 세포 요소의 하나의 타입인 유전자 발현 레벨을 측정하는 것을 위한 몇몇 전형적인 방법을 제공한다. 관련분야의 숙련자는 복수개의 유기체 중에서 각각의 유기체의 유전자의 발현 레벨을 측정하는 다음의 특정 방법으로 본 발명이 한정되지 않음을 예상할 수 있을 것이다.
5.1 마이크로 어레이를 사용한 전사 분석(TRANSCRIPT ASSAY USING MICROARRAYS )
이 색션에 묘사된 기술들은 복수개의 유전자의 발현 레벨에 대한 동시적인 결정을 제공하기 위해 사용될 수 있는 폴리뉴클레오티드 프로브 어레이(polynucleotide probe array)의 제공을 포함한다. 이 기술들은 그런 폴리뉴클레오티드 프로브 어레이를 디자인하고 만드는 것을 위한 방법을 제공한다.
유전자에서의 뉴클레오티드 서열(nucleotide sequence)의 발현 레벨은 어떤 높은 처리량 기술(high throughput technique)에 의해서도 측정될 수 있다. 그 결과는 전사의 절대량 또는 상대(absolute or relative amounts of transcript)량, 또는 응답 데이터(response data)이다. 바람직하게는 발현 프로파일의 측정은 이 서브색션에서 묘사되는 전사 어레이로 하이브리디제이션에 의해서 만들어진다. 하나의 실시예에서, "전사 어레이(transcript array)" 또는 "프로파일링 어레이(profiling array)" 가 사용되어진다. 전사 어레이는 세포 샘플에서의 발현 프로파일을 분석하는 것을 위해, 특히, 특별한 세포 타입의 또는 발달 상태의 또는 관심 있는 약물로 노출된 세포 샘플의 발현 프로파일을 측정하는 것을 위해 채용될 수 있다.
하나의 실시예에서, 발현 프로파일은 마이크로어레이로 세포(예, 전체 세포 mRNA로부터 합성된 형광 표지된 cDNA)에 있는 mRNA 전사에 있는 뉴클레오타이드 서열을 나타내는 디텍터블리 라벨드(detectably labeled)된 폴리뉴클레오타이드를 하이브리다이징함에 의해 얻어질 수 있다. 마이크로어레이는 세포 또는 유기체의 게놈에 있는 많은 뉴클레오티드 서열을 나타내는 것을 위한 서포트(support) 위에 포지셔널리-어드레서블한(positionally-addressable) 바인딩(예, 교잡화) 사이트의 어레이이다.
각각의 그런 바인딩 사이트는 서포트 위에 있는 프리디터민드 영역으로 결합된 폴리뉴클레오티드 프로브로 구성된다. 마이크로어레이는 수많은 방식으로 만들어질 수 있다. 그 방식의 몇몇은 아래에서 묘사된다. 어떻게 생산되더라도, 마이크로어레이는 어떤 특징들을 공유한다. 그 어레이는, 주어진 어레이의 복수개의 카피가 생산되고 쉽게 서로서로 비교되는 것을 허락하면서, 재생샨될 수 있다. 바람직하게는 마이크로어레이는 바인딩(예를 들어 핵산 교잡화) 상태 아래에서 안정한 물질들로부터 만들어진다. 마이크로어레이는 바람직하게는 작다. 예를 들어 1내지 25제곱 센티미터 사이, 바람직하게는 1 내지 3 제곱 센티미터 사이이다. 그러나, 더 큰 어레이 및 더 작은 어레이도, 예를 들어 동시에 매우 많은 수의 프로브와 매우 적은 수의 프로브를 평가하는 것을 위해, 역시 기대되고 바람직할 수 있다.
바람직하게는 주어진 바인딩 사이트 또는 마이크로어레이에서의 바인딩 사이트의 독특한 세트는 하나의 세포 또는 유기체로부터의 하나의 유전자에서 뉴클레오티드 서열로 명확하게 바인드할 것이다.
사용된 마이크로어레이는 하나 이상의 테스트 프로브를 포함할 수 있다. 그들의 각각은 관찰되는 RNA 또는 DNA의 서열에 상보적인 폴리뉴클레오티드 서열을 갖는다. 각각의 프로브는 전형적으로 차이나는 핵산 서열을 갖는다. 그리고, 그 어레이의 솔리드 표면( solid surface)에 있는 각각의 프로브의 위치는 대게는 알려진다. 정말로, 마이크로어레이는 바람직하게 어드레서블한 어레이이다. 더 바람직하게는 포지셔널리 어드레서블한 어레이이다. 어레이으 각각의 프로브는, 어레이 위의 그것의 위치로부터 각각의 프로브의 아이덴터티(예, 그 서열)가 결정될 수 있기 위하여, 솔리드 서포트 위에 알려진, 미리정해진 위치에 위치한다. 몇몇 실시예에서 어레이는 정렬된 어레이이다.
바람직하게는, 마이크로어레이 또는 마이크로어레이의 세트 위에 있는 프로브의 밀도는 1 cm2 당 100개의 상이한 프로브 또는 그 이상이다. 더 바람직하게는, 본 발명의 방법에 사용되는 마이크로어레이는 1cm2 당 적어도 550, 적어도 1000, 적어도 1500, 적어도 2000, 적어도 8000, 적어도 15000개의 프로브를 갖거나, 그 이상이다. 그러므로, 본 발명에 사용되는 마이크로어레이는 바람직하게는 적어도 25000개, 적어도 50000, 적어도 100000, 적어도 150000,적어도 200000, 적어도 250000, 적어도 500000 또는 적어도 550000 개의 상이한 프로브를 포함한다.
하나의 실시예에서, 마이크로어레이는, 그 마이크로어레이에서 각각의 위치(position)가 유전자(예, 그것으로부터 유래한 mRNA 또는 cDNA 액손)에 의해 인코드되는 전사의 뉴클레오티드 서열을 위한 분리된 바인딩 사이트를 나타내는 어레이이다.마이크로어레이 위에 있는 바인딩 사이트의 컬렉션(collection)은 복수개의 유전자를 위한 바인딩 사이트의 세트을 포함한다. 예를 들어, 다양한 실시예에서, 본 발명의 마이크로어레이는, 유기체의 게놈에서의 50% 이하의유전자에 의해서 인코드되는 프로덕트를 위한 바인딩 사이트를 포함할 수 있다. 다르게는, 본 발명의 마이크로어레이는, 유기체의 게놈에 있는 유전자의 적어도 50%, 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 적어도 100%에 의해 인코드되는 프로덕트를 위한 바인딩 사이트를 가질 수 있다. 다른 실시예에서, 본 발명의 마이크로어레이는, 유기체의 세포에 의해 표현되는 유전자의 50% 이하, 적어도 50%, 적어도 75%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100%에 의해 인코드(encode)되는 프로덕트를 위한 바인딩 사이트를 포함할 수 있다. 그 바인딩 사이트는, 그 사이트로 특별한 RNA가 특별하게 하이브리다이즈할 수 있는 DNA 또는 DNA 아날로그일 수 있다. 그 DNA 또는 DNA 아날로그는 예를 들어 합성 올리고머(synthetic oligomer) 또는 유전자 단편(gene fragment) 또는 엑손에 상응하는 것일 수 있다.
몇몇 실시예에서, 유전자 또는 유전자에 있는 엑손은, 그 유전자 또는 엑손의 상이한 서열 세그먼트들에 상보적인 상이한 폴리뉴클레오티드들을 가지는 프로브를 포함하는 바인딩 사이트의 세트에 의해서 프로파일링 어레이에서 나타내어진다. 그런 폴리뉴클레오티드들은 바람직하게는 15 내지 200 베이스의 길이, 더 바람직하게는 20 내지 100 베이스의 길이, 가장 바람직하게는 40 내지 60 베이스의 길이를 갖는다. 각각의 프로브 서열은 역시 그것의 타겟 서열에 상보적인 서열에 더하여 링커 서열을 포함한다. 여기서 사용되는 것과 같이, 링커 서열은 그것의 타겟 서열에 상보적인 서열와 서포트 표면과의 사이에 있는 서열이다. 예를 들어, 바람직한 실시예에서, 본 발명의 프로파일링 어레이는 각각의 타겟 유전자 또는 엑손으로의 특정한 하나의 프로브를 포함한다. 프로파일링 어레이는 타겟 유전자 또는 엑손으로 특정한 적어도 2. 5, 10, 100 또는 1000 또는 더 많은 프로브를 포함할 수 있다. 예를 들어, 어레이는 싱글 베이스 스텝에 있는 유전자의 가장 큰 mRNA 이소폼(isoform)의 서열을 따라 타이틀되는 프로브를 포함한다.
본 발명의 특별한 실시예에서, 엑손이 대안의 스플라이스드 배리언트(alternative spliced variant)를 가질 때, 연속적인 오버랩핑 서열의 폴리뉴클레오티드 프로브의 세트, 즉 타일드 서열은 엑손 프로파일링 어레이에 포함될 수 있다. 폴리뉴클레오티드 프로브의 세트은 프리디터민드 베이스 인터벌의 스탭, 예를 들어 1.5 또는 10 베이스 인터벌의 단계에서 연속적인 오버래핑 서열을 포함할 수 있다. 그러므로, 프로브의 그런 세트은 발현된 버라이언트 또는 엑손의 버라이언트를 결정하기 위해 발현된 버라이언트 또는 엑손의 버라이언트를 결정하기 위해 엑손의 모든 버라이언트를 포함하는 제노믹 리젼(genomic region)을 조사하는데 사용돌 수 있다. 대안으로 또는 추가적으로, 엑손 스패시픽 프로브(exon specific probe) 및/또는 버라이언트 정션 프로브(variant junction probe)를 포함하는 폴리뉴클레오티드 프로브의 세트은 엑손 프로파일링 어레이에서 포함될 수 있다. 여기에서 사용되듯이, 버라이언트 정션 프로브는 특별한 엑손 버라이언트 및 이웃하는 엑손의 정션 리젼으로 특별한 프로브를 회부한다. 몇몇 경우에, 프로브 세트은 엑손의 모든 상이한 스플라이스 정션 서열로 특별하게 하이브리다이즈할 수 있는(hybridizable) 버라이언트 정션 프로브를 포함한다. 다른 경우에, 프로브 세트은 엑손의 모든 상이한 버라이언트에서 공통적인 서열로 특별하게 하이브리다이즈할 수 있는(hybridizable) 엑손 스패시픽 프로브(exon specific probe)를 포함한다. 그리고/또는 프로브 세트은 엑손의 상이한 스플라이스 정션 서열로 특별하게 하이브리다이즈할 수 있는(hybridizable) 버라이언트 정션 프로브를 포함한다. 어떤 경우에는, 엑손은 풀 랭쓰 엑손(full length exon)에 상보적인 폴리뉴클레오티드를 포함하는 프로브에 의해서 엑손 프로파일링 어레이에서 나타내어진다. 그런 경우에, 엑손은 프로파일링 어레이에 있는 단일 바인딩 사이트(single binding site)에 의해 나타내어진다. 바람직한 경우에, 엑손은 그 프로파일링 어레이에 있는 하나 이상의 바인딩 사이트에 의해 나타내어진다. 그 바인딩 사이트의 각각은 타겟 엑손의 실질적인 비율인 RNA 단편(fragment)에 상보적인 폴리뉴클레오티드 서열을 갖는 프로브를 포함한다. 그런 프로브의 길이는 보통 15-600 베이스, 바람직하는 20-200 베이스, 더욱 바람직하게는 30-100 베이스 그리고 가장 바람직하게는 40-80 베이스이다. 엑손의 평균 긱이는 약 200 베이스이다(예를 들어, Lewin, Genes V, Oxford University Press, Oxford, 1994 참조). 40-80의 길이의 프로브는 더 짧은 길이의 프로브보다, 타겟 엑손으로 프로브의 특이성(specificity)을 증가시키면서, 엑손의 더 특별한 바인딩을 허락한다. 어떤 유전자들에 대하여, 하나 이상의 타겟 엑손은 40-80 베이스보다 작은 서열 길이를 가질 수 있다. 그런 경우에, 만일 타겟 엑손보다 더 긴 서열을 가진 프로브가 사용된다면, 프로브 서열이 mRNA에 있는 상응하는 서열 세그먼트를 보충하기 위하여 인접하는 스플라이스드 엑손 또는 엑손들(adjacent constitutively spliced exon or exons)로부터 서열에 의해 접해지는(flanked) 전체 타겟 엑손을 포함하는 서열을 포함하는 프로브를 디자인하는 것이 바람직하다. 게노믹 플랭킹 서열, 즉 인트론 서열 보다 오히려 인접하는 스플라이스드 엑손 또는 엑손들(adjacent constitutively spliced exon or exons)로부터 플랭킹 서열을 사용하는 것은 같은 길이의 다른 프로브를 갖는 비교되는 하이브리디제이션 스트린전시(comparable hybridization stringency)를 허락한다. 바람직하게는, 사용되는 플랭킹 서열은 어떤 다른 경로에서도 포함되지 않는 인접하는 스플라이스드 엑손 또는 엑손들(adjacent constitutively spliced exon or exons)으로부터 온다. 더 바람직하게는 사용되는 플랭킹 서열은 크로스-하이브리디제이션을 최소화하기 위하여 인접하는 엑손 또는 엑손들이 서열의 중요한 몫을 포함하지 않는다. 몇몇 실시예에서, 요구되는 프로브 길이보다 더 짧은 타겟 엑손이 대안의 스플라이싱(alternative splicing)에 포함될 때, 대신으로 스플라이스되는 상이한 mRNA들에서 플랭킹 서열을 포함하는 프로브는 대신으로 스플라이스되는 상이한 mRNA들에서의 발현되는 엑손의 발현 레벨이 측정될 수 있게 하도록 디자인될 수 있다. 몇몇 실시예에서, 대신으로 스플라이싱하는 경로 및/또는 분리된 유전자들에서의 엑손 복사(exon duplication)가 구별될 때, DNA 어레이와 어레이의 세트은 역시 두 개의 인접한 엑손의 결합 영역(junction region)을 스팬닝(spanning)하면서 서열에 상보적인 프로브를 포함할 수 있다. 바람직하게는, 그런 프로브들은 크로스 하이브리디제이션(cross hybridization)을 최소화하기 위하여 각각의 엑손을 위한 프로브들과 실질적으로 오버랩되지 않는 두 개의 엑손으로부터의 서열을 포함한다. 만일, 엑손이 복사된 엑손을 포함하는, 그러나 다른 대신으로 스플라이스된 mRNA들 및 복사된 엑손을 포함하는 다른 유전자들에서는 그렇지 않은 하나 이상의 분리도니 유전자 및 하나 이상의 대신으로 스플라이스된 mRNA들에서 일어난다면, 하나 이상의 엑손으로부터 서열을 포함하는 프로브는 대신으로 스플라이싱하는 경로(alternative splicing pathway) 및/또는 분리된 유전자들에서의 복사된 엑손의 발현을 구별하는데 유용하다. 대신으로, 분리된 유전자들에서의 복사된 엑손을 위하여, 만일 상이한 유전자들로부터의 엑손들이 서열 호몰로지(sequence homology)에서 실질적인 차이를 보여준다면, 상이한 유전자들로부터의 엑손들이 구별될 수 있기 위하여 상이한 프로브를 포함하는 것이 바람직하다. 다양한 유전자들의 발현 프로파일의 더 정확한 결정이 수행되도록 하기 위하여,같은 프로파일링 어레이에서 및/또는 프로파일링 어레이의 같은 세트 안에 있는 차이 나는 어레이에서 어떤 프로브 스킴도 결합될 수 있다는 것은 관련 업계의 숙련자에게는 명백하다. 상이한 프로브 스킴이 역시 프로파일링에서이 정확성의 상이한 레벨을 위해 사용될 수 있다. 예를 들어, 각각이 엑손을 위한 프로브의 작은 세트을 포함하는 프로바일링 어레이 또는 어레이 세트은 어떤 특정한 상태아래에서 관련 유전자들 및/또는 RNA 스플라이싱 경로를 결정하기 위해 사용될 수 잇다. 흥미의 대상이 되는 엑손을 위한 프로브의 더 큰 세트을 포함하는 어레이 또는 어레이 세트은 그런 특정 상태아래에서 엑손 발현 프로파일을 보다 더 정확하게 결정하기 위하여 사용된다. 상이한 프로브 스킴의 더 유리한 사용을 허락하는 다른 DNA 어레이 전략은 역시 완수된다.
바람직하게는,본 발명에서 사용되는 마이크로어레이는, 흥미의 대상이 되는 약물의 활동과 관련한 또는 흥미의 대상이 되는 생물학적 경로에서의 하나 이상의 유전자를 위한 엑손들의 세트들을 위해 바인딩 사이트를 가진다. 위에서 묘사된 것처럼, "유전자(gene)"은 RNA 폴리머라제(RNA polymerase)에 의해 전사되는 DNA의 일부로서 인지된다. 그것은 5 개의 번역되지 않은 영역(region)(UTR), 즉 인트론, 엑손 그리고 3개의 UTR을 포함한다. 게놈에서의 유전자의 수는 세포 또는 유기체에 의해서 또는 게놈의 잘 특징화된 일부의 추정(extrapolation)에 의해서 발현된 mRNA의 수로부터 평가될 수 있다. 흥미의 대상이 되는 유기체의 게놈이 배열되었을 때, ORF이 수는 결정되고, mRNA 코딩 리젼은 DNA 서열의 분석에 의해 확인된다. 예를 들어, Saccharomyces cerevisiae의 게놈은 완전하게 배열되고, 길이에서 99 아미노산 잔류물(residue)보다 더 긴 거의 6275 ORFs 인코딩 서열(encoding sequence)를 갖는 것으로 보고된다. 이 ORF들의 분석은 단백질 프로덕트를 인코드할 것 같은 5885개의 ORF이 있다는 것을 지적한다(Goffeau etal., 1996, Science 274: 546-567). 반대로, 인간 게놈은 거의 30000 내지 130000 개의 유전자를 포함하는 것으로 평가된다. (예를 들어 Crollius et al. , 2000, Nature Genetics 25: 235- 238; Ewing et al. , 2000, Nature Genetics 25: 232-234 참조). 초파리(Drosophila), C. 엘레간스(C. elegans), 쌀 및 아라비돕시스(Arabidopsis)와 같은 식물, 쥐 및 인간과 같은 포유 동물들을 포함하는, 그러나 이에 한정되지 않는, 다른 유기체들의 게놈 서열은 역시 완성되었거나 거의 완성되었다. 그래서, 본 발명의 바람직한 실시예에서, 유기체의 게놈에서 모두 알려진 또는 예상되는 엑손을 위한 전체 프로브을 포함하는 어레이 세트은 제공된다. 제한되지 않는 예로서, 본 발명은 인간 게놈에서 각각 알려진 또는 예상되는 엑손을 위한 하나 또는 두 개의 프로브를 포함하는 어레이 세트을 제공한다.
세포의 RNA에 상보적인 cDNA가 만들어지고 적절한 하이브리디제이션 상태 아래에서 마이크로어레이로 하이브리다이즈될 때, 어떤 특별한 유전자의 엑손에 상응하는 어레이에 있는 사이트로의 하이브리디제이션의 레벨은 그 유전자로부터 전사된 엑손을 포함하는 mRNA 또는 mRNA들의 세포에서의 우세(prevalence)를 반영할 것이다. 예를 들어, 전체 mRNA에 상보적인 탐지될 수 있도록 분류된(detectably labeled)(예를 들어 플루오로포어로) cDNA가 마이크로어레이로 하이브리다이즈될 때, 전사되지 않거나 RNA 스플라이싱 동안 제거되는 유전자의 엑손에 상응하는 에레이에서의 사이트는 거의 또는 아무런 시그널(예를 들어 형광 시그널)을 가지지 않을 것이고, 엑손을 발현하는 인코딩 된 mRNA 가 우세한(prevalent) 유전자의 엑손은 상대적으로 강한 시그널을 가질 것이다. 대신의 스플라이싱에 의해 같은 유전자로부터 생성된 상이한 mRNA의 상대적인 어번던스(abundance)은 유전자를 위해 모니터되는 엑손의 전체 세트을 따라 시그널 강도 패턴(signal strength pattern)에 의해 결정된다.
하나의 실시예에서, 두 개의 상이한 상태로붙의 세포 샘플로부터의 cDNA들은 두 개의 프로토콜을 사용하여 마이크로어레이의 바인딩 사이트로 하이브리다이즈된다. 약물 반응의 경우에 하나의 세포 샘플은 약물로 노출되고 같은 타입의 다른 세포 샘플은 약물로 노출되지 않는다. 경로 반응(pathway response)의 경우에 하나의 세포는 경로 혼란(pathway perturbation)으로 노출되고, 같은 타입의 다른 세포는 경로 혼란으로 노출되지 않는다. 두 개의 세포 타입의 각각으로부터 유도된 cDNA는 그들이 구별되게 하기 위하여 상이하게 분류된다(예를 들어 Cy와 Cy5를 가지고). 예를 들어 하나의 실시예에서, 약물로 처리된 세포로부터의 cDNA는 형광 물질로 라벨된(fluorescein-labeledd) dNTP를 사용하여 합성되고, 약물처리되지 않은 두 번째 세포로부터의 cDNA는 로다민으로 라벨된(rhodamine-labeled) dNTP를 사용하여 합성된다. 두 개의 cDNA가 마이크로어레이로 혼합되고 하이브리다이즈될 때, 각각의 cDNA로부터의 시그널의 상대적인 강도는 어레이에서의 각각의 사이트와 탐지된 특별한 엑손의 어번던스(abundance)에서의 상대적인 차이를 위해 결정된다.
위에서 묘사된 예에서, 약물 처리된(또는 경로 교란된) 세포로부터의 cDNA는 플루오로포어(fluorophore)이 자극받을 때 녹색의 형광을 발하고, 약물 처리되지 않은 세포로부터의 cDNA는 붉은 색의 형광을 발할 것이다. 결과적으로, 약물처리가, 직접적으로 또는 간접적으로, 전사 및 /또는 세포에서의 특별한 유전자의 후-전사 스플라이싱(post-transcriptional splicing) 아무런 효과를 갖지 않을 때, 엑손 발현 패턴은 두 개의 세포에서 구별되지 않을 것이고, 역전사에서 적색-라벨된 cDNA와 녹색-라벨된 cDNA는 동일하게 우세하게(prevalent) 될 것이다. 마이크로어레이로 하이브리다이즈될 때, RNA의 그 종을 위한 바인딩 사이트는 양쪽의 형광투시경의 파장 특성을 방출할 것이다. 반대로, 약물-노출 세포가 직간접적으로 전사 및/또는 세포에서의 특별한 유전자의 후전사 스플라이싱을 변화시키는 약물로 처리될 때에, 엑손 발현 패턴은 각각의 엑손 바인딩 사이트를 위해 붉은 색 형광에 대한 녹색 형광의 비에 의해서 나타내어지는 것처럼 변화할 것이다. 약물이 mRNA의 우세를 증가시킬 때, 그 mRNA에서 발현된 각각의 엑손의 비는 증가할 것이다. 반면, 약물이 mRNA의 우세를 감소시킬 때, 그 mRNA에서 발현된 각각의 엑손의 비는 감소할 것이다. 유전자 발현에서의 변성(alteration)을 정위하기 위한 이-색 형광 라벨링(two-color fluorescence labeling) 및 탐지 스킴(detection scheme)의 사용은 mRNA의 탐지와 관련하여 묘사된다. 예를 들어 "Schena et al., 1995, Quantitative monitoring of gene expression patterns with a complementary DNA microarray"에 그러한 내용이 묘사되어 있다. 그 스킴은 라벨링과 엑손의 탐지에 동일하게 적용될 수 있다. 두 개의 상이한 플루오로포어를 가지고 라벨된 cDNA를 사용하는 것의 이점은, 두 개의 세포 상태에서의 mRNA 또는 각각의 배열된 유전자에 상응하는 엑손 발현 레벨의 직접적인 내부적으로 조절된 비교가 만들어질 수 있다는 것과 실험 상태에서의 작은 차이에 기인하는 변화(variation)이 분석에 영향을 주지 않는다는 것이다. 그러나, 하나의 세포로부터의 cDNA를 사용하고 예를 들어 약물처리된 또는 경로 교란된 그리고 처리되지 않은 세포에서의 특별한 엑손의 절대적인 양을 비교하는 것도 가능하다. 더욱이, 두 개 이상의 색으로 라벨링하는 것도 역시 가능하다. 본 발명의 몇몇 실시예에서, 상이한 색의 적어도 5, 10, 20 또는 100 개의 염료가 라벨링을 위해 사용될 수 있다. 그런 라벨링은 차이나게 라벨된 cDNA 집단의 같은 어레이로의 동시의 하이브리다이징 및 측정 및 두 개 이상의 샘플로부터 유도된 mRNA의 발현 레벨을 선택적으로 비교하는 것을 허락한다. 사용될 수 있는 염료는 플루오레세인(fluorescein) 및 그 유도체, 로다민(rhodamine) 및 그 유도체, 텍사스 레드, 5 카르복시-플루오레세인, 2,7-디메톡시-4,5 -디클로로-6-카르복시-플루오레세인, N, N, N', N'-테트라메틸-6-카르복시-로다민, 6카르복시-X-로다민, HEX, TET, IRD40, IRD41, Cy3, Cy3.5 및 Cy5와 같은 시아민 염료, BODIPY-FL, BODIPY-TR, BODIPY-TMR, BODIPY-630/650 및 BODIPY-650/670와 같은 BODIPY 염료, ALEXA-488, ALEXA-532, ALEXA- 546, ALEXA-568 및 ALEXA-594 ALEXA 염료와 당업계에 알려질 다른 형광 염료를 포함한다.
몇몇 실시예에서, 평형상태(equilibrium)로의 하이브리디제이션 레벨의 전개(evolution)가 결정될 수 있기 위하여, 하이브리디제이션 데이터는 복수개의 상이한 하이브리디제이션 시간에서 측정된다. 그런 실시예에서, 그 혼합물(mixture)이 평형상태의 가까이로 가고, 듀플렉스(duplexe)들이 디퓨젼(diffusion)보다는 친화력(affinity)과 어번던스(abundance)에 근거한 농도에 있게 하기 위하여,하이브리디제이션 레벨은 가장 바람직하게는 0부터 라벨된 폴리뉴클레오티드에 의한 바운드 폴리뉴클레오티드(즉, 그 프로브 또는 프로브들)의 샘플링을 위해 요구되는 것의 과량까지의 범위의 하이브리디제이션 시간에서 측정된다. 그러나, 하이브리디제이션 시간은 라벨된 폴리뉴클레오티드와 프로브 및/또는 표면 사이의 비가역적인 바인딩 상호작용(interaction)이 일어나지 않거나 또는 적어도 제한되기에 충분할 정도로 짧은 것이 바람직하다. 예를 들어, 폴리뉴클레오티드 어레이가 단편 폴리뉴클레오티드의 복합 혼합물을 프로브하기 위해 사용되는 실시예에서, 전형적인 하이브리디제이션 시간은 대략 0-72 시간일 수 있다. 다른 실시예를 위한 적절한 하이브리디제이션 시간은 특별한 폴리뉴클레오티드 서열 및 사용되는 프로브에 의존할 것이며, 당업계에서의 숙련자들에 의해 결정될 수 있을 것이다(예를 들어, Sambrooket al., Eds. , 1989, Molecular Cloning. A Laboratory Manual, 2nded., Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York 참조)
하나의 실시에에서, 상이한 하이브리디제이션 시간에 있는 하이브리디제이션 레벨은 상이한 그리고 동일한 마이크로어레(different, identical microarray)이에서 분리되어 측정된다. 각각의 그런 측정을 위하여, 하이브리디제이션 레벨이 측정되는 하이브리디제이션 시간에, 모든 언바운드 폴리뉴클레오티드(unbound polynucleotide)를 제거하는 동안 모든 바운드 또는 하이브리다이즈된 폴리뉴클레오티드를 보유하는 상태 아래에서 염 농(예를 들어, 0.5 내지 3 M의 염 농도)도를 중화시키기 위해 수용액에서 바람직하게는 상온에서, 마이크로어레이는 짧게 세척된다. 각각의 프로브에 잔류하는 하이브리다이즈된 폴리뉴클레오티드 분자 위의 탐지될 수 있는 라벨은 사용되는 특별한 라벨링 방법에 적합한 방법에 의해서 측정될 수 있다. 결과적인 하이브리디제이션 레벨은 하이브리디제이션 커브(hybridization curve)를 형성하기 위해 결합된다. 이 실시예에서, 마이크로어레이는 방해 없이 하이브리다이즈하도록 허락되고, 그 마이크로어레이는 비침습성의 방법(non-invasive manner)에서 각각의 하이브리디제이션 시간에 인테로게이트된다. 또 다른 실시예에서, 우리는 하이브리디제이션 시간 커브를 얻기 위하여, 하나의 어레이를 사용하고, 짧은 시간 동안 하이브리다이즈하고, 세척하고 하이브리디제이션 레벨을 측정하고, 다시 같은 샘플로 돌아와서 다른 시간 동안 하이브리다이즈하고 세척하고 다시 측정할 수 있다.
바람직하게는, 적어도 두 개의 상이한 하이브리디제이션 시간에 있는 적어도 두 개의 하이브리디제이션 레벨이 측정된다. 즉, 하나는 크로스-하이브리디제이션 평형상태(cross-hybridization equilibrium)의 시간 스케일에 가까운 하이브리디제이션 시간에서 측정되고, 다른 하나는 그것보다 더 긴 하이브리디제이션 시간에서 측정된다. 크로스-하이브리디제이션 평형상태(cross-hybridization equilibrium)의 시간 스케일은 샘플 구성과 프로브 서열에 의존한다. 그리고, 당업계의 숙련자드에 의해 결정될 수 있을 것이다. 바람직한 실시예에서, 첫번째 하이브리디제이션 레벨은 1 내지 10 시간에서 측정된다. 반면 두번째 하이브리디제이션 시간은 첫번째 하이브리디제이션 시간의 2, 4, 6, 10, 12, 16, 18, 48 또는 72배 정도에서 측정된다.
5.1.1 마이크로어레이를 위한 프로브의 제조
위에서 언급된 것처럼, 본 발명에 따라 엑손과 같은 특정 폴리뉴클레오티드 분자가 특이하게 하이브리다이즈하는 "프로브"는 상보적인 폴리뉴클레오티드 서열이다. 바람직하게 각 타겟 엑손에 대하여 하나 이상의 프로브가 선택된다. 예를 들어, 엑손의 검출을 위해 최소한의 프로브가 사용되는 경우 프로브들은 일반적으로 그 길이가 40 염기보다 큰 뉴클레오타이드 서열을 포함한다. 대안적으로, 많은 세트의 풍부한 프로브가 엑손을 위해 사용되는 경우 프로브들은 일반적으로 40-60 염기의 뉴틀레오티드 서열을 포함한다. 프로브들은 또한 총 길이 엑손에 상보적인 서열을 포함할 수 있다. 엑손의 길이는 50 염기보다 작거나 200 염기 이상일 수 있다. 그러므로, 엑손보다 긴 길이의 프로브가 사용될 때, 프로브가 타겟 엑손을 포함하는 연속적 RNA 절편에 상보적이도록 엑손을 인접 구성 슬라이스된 엑손 서열로 보강하는 것이 바람직하다. 이것은 엑손 프로파일링 어레이의 프로브들 사이에서 대응하는 하이브리디제이션이 정확하도록 할 것이다. 각 프로브 서열은 또한 그것의 타겟 서열에 상보적인 서열에 더하여 링커 서열을 포함할 수도 있다는 것이 인지되어야 한다.
프로브들은 유기체의 게놈에서 각 유전자의 각 엑손의 일 부분에 대응하는 DNA 또는 DNA "유사체(mimics)"(예를 들어, 유도체 및 아날로그)를 포함할 수 있다. 일 실시예에서, 마이크로어레이의 프로브들은 RNA 또는 RNA 유사체에 상보적이다. DNA 유사체는 DNA와 특정, Watson-Crick-유사 하이브리디제이션, 또는 RNA와 특정 하이브리디제이션을 할 수 있는 서브유닛으로 구성된 폴리머이다. 핵산은 염기 부분, 당 부분, 또는 포스페이트 백본이 조정될 수 있다. 예시적인 DNA 유사체는 예를 들어 포스포로티오에이트(phosphorothioate)를 포함한다. DNA는 예를 들어, 게놈 DNA, cDNA (예를 들어, RT-PCR에 의해), 또는 클론된 서열로부터 엑손 단편의 폴리머라제 체인 반응(PCR) 증폭에 의해 얻어질 수 있다. PCR 프라이머는 바람직하게 특정 절편의 증폭을 초래하는 엑손 또는 cDNA의 알려진 서열에 기초하여 선택된다 (예를 들어, 마이크로어레이 상의 어떠한 다른 절편과 연속하여 동일한 서열이 10 염기보다 많지 않은 절편). Oligo version 5.0 (National Biosciences)과 같은 본 발명이 속한 분야에서 잘 알려진 컴퓨터 프로그램이 요구되는 특이성 및 최적의 증폭 성질을 가진 프라이머를 설계하는데 유용하다. 전형적으로 마이크로어레이 상의 각 프로브는 20 염기 내지 600 염기이고, 일반적으로 30 내지 200 염기 길이이다. PCR 방법은 본 발명이 속한 분야에서 잘 알려져 있으며, 예를 들어, Innis et al., eds., 1990, PCR Protocols. A Guide to Methods and Applications, Academic Press Inc., San Diego, CA에 설명되어 있다. 조절된 로보틱 시스템이 핵산을 분리하고 증폭하는데 유용하다는 것은 본 발명이 속한 분야에서 통상의 지식을 가진 자에게 분명할 것이다.
마이크로어레이의 폴리뉴클레오티드 프로브를 생성하는 대안적인 바람직한 수단은 예를 들어, N-포스포네이트(phosphonate) 또는 포스포라미다이트(phosphoramidite) 화학(Froehler et al., 1986, Nucleic Acid Res. 14: 5399-5407; McBride et al., 1983, Tetrahedron Lett. 24: 246-248)과 같은 합성 폴리뉴클레오티드 또는 올리고뉴클레오티드의 합성에 의해서이다. 합성 서열은 그 길이가 일반적으로 15 내지 600 염기이고, 더 전형적으로는 20 내지 100 염기, 가장 바람직하게는 40 내지 70 염기이다. 일정 실시예에서, 합성 핵산은 예를 들어, 하지만 이에 한정되지 않는, 이노신과 같은 비-천연(non-natural) 염기를 포함한다. 위에서 언급된 것처럼, 핵산 아날로그는 하이브리디제이션을 위한 결합 부위로 사용될 수 있다. 적당한 핵산 아날로그의 예는 펩타이드 핵산(예를 들어, Egholm et al., 1993, Nature 363: 566-568; 및 미국특허 제5,539,083호 참조)이다.
대안적 실시예에서, 하이브리디제이션 부위(즉, 프로브)는 유전자, cDNA(예를 들어, 발현된 서열 태그(tag))의 플라스미드 또는 파지 클론, 또는 그것으로부터의 삽입물로부터 만들어진다(Nguyen et al., 1995, Genomics 29: 207-209).
5.1.2. 핵산의 고체 표면에의 부착
제조된 폴리뉴클레오티드 프로브는 어레이를 형성하기 위하여 지지체 위에 위치될 수 있다. 대안적으로, 폴르뉴클레오티드 프로브는 고체 지지체 또는 표면 위에 부착되고, 그것들은 예를 들어, 유리, 플라스틱(예를 들어, 폴리프로필렌, 나일론), 폴리아크릴아마이드, 니트로셀룰로스, 겔, 또는 다른 다공성 또는 비당공성 물질로부터 만들어질 수 있다.
핵산을 표면에 부착하는 바람직한 방법은 Schena et al., 1995, Science 270: 467-470에 일반적으로 설명된 것과 같이 유리 플레이트 상에 프린팅(printing)함에 의해서이다. 이러한 방법은 특이하게 cDNA의 마이크로어레이를 제조하는데 유용하다(또한, DeRisi et al, 1996, Nature Genetics 14: 457-460; Shalon et al., 1996, Genome Res. 6: 639-645; 및 Schena et al., 1995, Proc . Natl . Acad . Sci . U.S.A. 93: 10539-11286 참조).
마이크로어레이를 제조하는 두 번째 바람직한 방법은 고-밀도 폴리뉴클레오티드 어레이를 제조함에 의해서이다. In situ 합성을 위해 포토리쏘오그래픽 기술(photolithographic technique)(Fodor et al., 1991, Science 251: 767-773; Lockhart et al., 1996, Nature Biotechnology 14: 1675; 미국특허 제5,578,832호; 제5,556,752호; 및 제5,510,270호 참조) 또는 정의된 올리고뉴클레오티드의 빠른 합성 및 침착(deposition)을 위한 다른 방법(Blanchard et al., Biosensors & Bioelectronics 11: 687-690)을 사용하여 표면 위 한정된 영역에 정의된 서열에 상보적인 수천 개의 올리고뉴클레오티드을 포함하는 어레이를 제조하는 방법은 잘 알려져 있다. 이러한 방법들이 사용될 때, 알려진 서열의 올리고뉴클레오티드(예를 들어, 60머)는 변형된 유리 슬라이드와 같은 표면 위에서 직접적으로 합성된다. 제조된 어레이는 엑손 당 수개의 폴리뉴클레오티드 분자가 풍부할 수 있다.
예를 들어, 마스킹(Maskos and Southern, 1992, Nucl . Acids. Res. 20: 1679-1684)과 같은 마이크로어레이를 제조하는 다른 방법 또한 사용될 수 있다. 특히, 위에서 언급된 바와 같이, 예를 들어 나일론 하이브리디제이션 막 위의 점 블럿(blot)(Sambrook et al., 상동 참조)과 같은 어떠한 타입의 어레이도 사용될 수 있다. 그러나, 본 발명이 속한 분야에서 통상의 지식을 가진 자에게 잘 인식되어 있는 것처럼, 하이브리디제이션 부피가 상대적으로 작기 때문에 매우 작은 어레이가 주로 바람직할 것이다.
특정 바람직한 실시예에서, 본 발명의 마이크로어레이는 예를 들어, 1998년 9월 24일 공개된 Blanchard 국제특허 공개번호 WO98/41531; Blanchard et al., 1996, Biosensors and Bioelectronics 11: 687-690; Blanchard, 1998, in Synthetic DNA Arrays in Genetic Engineering, Vol. 20, J.K. Setlow, Ed., Plenum Press, New York at pages 111-123; 및 미국특허 제6,028,189호 Blanchard에 의해 개시된 방법 및 시스템을 사용하여 올리고뉴클레오티드 합성을 위한 잉크 젯 프린팅 장치를 통해 제조된다. 특히, 그러한 마이크로어레이의 폴리뉴클레오티드 프로브는 바람직하게는 어레이, 예를 들어 유리 슬라이드 위에서 프로필렌 카보네이트과 같은 고 표면장력 용매의 "마이크로방울(microdroplet)" 내 개개의 뉴클레오티드 염기를 연속적으로 위치시킴으로써 합성된다. 마이크로방울은 작은 부피(예를 들어, 100 pL 이하, 바람직하게는 50 pL 이하)를 가지며 어레이 엘리먼트(예를 들어, 다른 프로브)의 위치를 한정하는 원형의 표면장력 웰(well)을 형성하기 위하여 마이크로어레이 상에서 각각 분리된다. 폴리뉴클레오티드 프로브는 일반적으로 폴리뉴클레오티드 3 말단이 공유적으로 표면과 부착한다. 대안적으로, 폴리뉴클레오티드 프로브는 폴리뉴클레오티드의 5' 말단이 공유적으로 표면에 부착할 수 있다(예를 들어, Blanchard, 1998, in Synthetic DNA Arrays in Genetic Engineering 20, Setlow, Ed., Plenum Press, New York at pages 111-123 참조).
5.1.3. 타겟 폴리뉴클레오티드 분자
본 발명의 방법 및 조성물에 의해 분석될 수 있는 타겟 폴리뉴틀레오티드는 예를 들어, 하지만 이에 한정되지 않는, 메신저 RNA(mRNA) 분자, 리보솜 RNA(rRNA) 분자, cRNA 분자(예를 들어, in vivo 전사된 cDNA 분자로부터 제조된 RNA 분자) 및 이들의 절편과 같은 RNA 분자를 포함한다. 본 발명의 방법 및 조성물에 의해 분석될 수 있는 타겟 폴리뉴틀레오티드는 또한 예를 들어, 하지만 이에 한정되지 않는, 게놈 DNA 분자, cDNA 분자, 및 올리고뉴클레오티드, EST, STS 등을 포함하는 이들의 절편과 같은 DNA 분자를 포함한다.
타겟 폴리뉴클레오티드는 어떠한 소스로부터일 수도 있다. 예를 들어, 타겟 폴리뉴클레오티드 분자는 유기체로부터 분리된 게놈 또는 게놈외 DNA 분자, 또는 유기체로부터 분리된 mRNA 분자와 같은 RNA 분자와 같은 자연적으로 발생하는 핵산 분자일 수 있다. 대안적으로, 폴리뉴클레오티드 분자는 합성될 수 있으며, 이러한 방법은 예를 들어, PCR에 의해 합성된 cDNA 분자 또는 폴리뉴클레오티드 분자와 같은 in vivo 또는 in vitro 효소적으로 합성된 핵산 분자, in vitro 전사에 의해 합성된 RNA 분자 등을 포함한다. 타겟 폴리뉴클레오티드의 샘플은 예를 들어, DNA, RNA, 또는 DNA와 RNA의 공중합체의 분자를 포함한다. 바람직한 실시예에서, 본 발명의 타겟 폴리뉴클레오티드는 특정 유전자 또는 특정 유전자 전사체(예를 들어, mRNA 서열로부터 유래한 특정 cDNA 서열 또는 세포 내 발현된 특정 mRNA 서열)에 대응할 수 있다. 그러나, 많은 실시예에서, 해당 폴리뉴클레오티드 분자는 포유류 세포로부터 유래하고, 타겟 폴리뉴클레오티드는 유전자 전사체의 특정 절편에 대응할 수 있다. 예를 들어, 타겟 폴리뉴클레오티드는 동일한 유전자의 다른 엑손에 대응할 수 있고, 예를 들어, 그래서 그 유전자의 다른 슬라이스 변이체가 검출 및/또는 분석될 수 있다.
바람직한 실시예에서, 분석될 타겟 폴리뉴클레오티드는 세포로부터 추출된 핵산으로부터 in vitro 제조된다. 예를 들어, 일 실시예에서, RNA는 세포(예를 들어, 총 세포성 RNA, 폴리(A)+ 메신저 RNA, 또는 그들의 분획)로부터 추출되고, 메신저 RNA는 총 추출 RNA로부터 정제된다. 총 및 폴리(A)+ RNA를 제조하는 방법은 본 발명이 속한 분야에서 잘 알려져 있으며, 예를 들어, Sambrook et al., 상동에 잘 기재되어 있다. 일 실시예에서, RNA는 구아니디움 티오시아네이트(guanidinium thiocyanate) 세포용해하고, CsCl 원심분리 및 올리고 dT 정제(Chirgwin et al., 1979, Biochemistry 18: 5294- 5299)하여 본 발명에서 관심 있는 다양한 타입의 세포로부터 추출된다. 다른 실시예에서, RNA는 구아니디움 티오시아네이트(guanidinium thiocyanate) 세포용해하고, RNeasy column(Qiagen)으로 정제하여 세로로부터 추출된다. 그 후 cDNA는 예를 들어, oligo-dT 또는 무작위 프라이머를 사용하여 정제된 mRNA로부터 합성된다. 바람직한 실시예에서, 타겟 폴리뉴클레오티드는 세포로부터 추출된 정제 메신저 RNA로부터 제조된 cRNA이다. 본 명세서에서 사용되는 경우, cRNA는 여기에서 소스 RNA에 상보적인 RNA로 정의된다. 추출된 RNA는 안티-센스 RNA의 직접적 전사가 가능한 방향으로 RNA 폴리머라제 프로모토에 결합된 프라이머를 사용하여 RNA로부터 이중 가닥 cDNA가 합성되는 프로세스를 사용하여 증폭된다. 안티-센스 RNA 또는 cRNA는 그 후 RNA 폴리머라제를 사용하여 이중-가닥 cDNA의 두 번째 가닥으로부터 전사된다(예를 들어, 미국특허 제5,891, 636호, 제5,716,785호; 제5,545,522호 및 제6,132,997호 참조; 또한 미국특허 제6,271,002호, 및 Ziman et al.에 의해 2000년 11월 28일 출원된 미국 가출원 출원번호 제60/253,641호 참조). RNA 폴리머라제 프로모터 또는 그것의 보체를 포함하는 oligo-dT 프라이머(미국특허 제5,545,522호 및 제6,132,997호) 또는 무작위 프라이머(Ziman et al.에 의해 2000년 11월 28일 출원된 미국 가출원 출원번호 제60/253,641호)가 사용될 수 있다. 바람직하게, 타겟 폴리뉴클레오티드는 세포의 오리지날 핵산군(nuleic acid popuplation)을 대표하는 짧고 및/또는 절단된 폴리뉴클레오티드 분자이다.
본 발명의 방법 및 조성물에 의해 분석될 타겟 폴리뉴클레오티드는 바람직하게는 검출가능하도록 표지 된다. 예를 들어, cDNA는 예를 들어, 뉴클레오티드 아날로그로 직접적으로 표지되거나, 예를 들어, 템플레이트로 첫 번째 가닥을 사용한 두 번째 표지된 cDNA 가닥을 제조함으로써 간접적으로 표지될 수 있다. 대안적으로, 이중 가닥 cDNA는 cRNA로 전사되고 표지될 수 있다.
바람직하게, 검출가능한 표지는 예를 들어, 뉴클레오티드 아날로그의 봉입(incorporation)에 의한 형광 표지이다. 본 발명에서 사용하기 위해 적당한 다른 표지는 바이오틴, 이미노바이오틴, 항원, 코팩터, 디니트로페놀, 리포익산(lipoic acid), 올리피닉 화합물(olefinic compound), 검출가능한 폴리펩타이드, 전자 풍부 분자(electron rich molecule), 기질에 대한 작용으로 검출가능한 시그널을 생성할 수 있는 효소, 및 방사활성 동위원소를 포함하나 이에 한정되는 것은 아니다. 바람직한 방사활성 동위원소는 32P, 35S, 14C, 15N 및 125I를 포함한다. 본 발명에서 사용하기에 적당한 형광 분자는 플루오레세인(fluorescein) 및 그것의 유도체, 로다민 및 그것의 유도체, 텍사스 레드(texas red), 5 카복시-플루오레세인("FMA"), 2,7-디메톡시-4,5-디클로로-6-카복시-플루오레세인("JOE"), N,N,N',N'-테트라메틸-6-카복시-로다민("TAMRA"), 6 카복시-X-로다민("ROX"), HEX, TET, IRD40, 및 IRD41을 포함하나 이에 한정되는 것은 아니다. 본 발명에 사용하기에 적당한 형광 분자는: 본 발명이 속한 분야에서 통상의 지식을 가진 자에게 알려진 다른 형광 염료뿐만 아니라 Cy3, Cy3.5 및 Cy5를 포함하는 하지만 이에 한정되지 않는 시아민 염료; BODIPY-FL, BODIPY-TR, BODIPY-TMR, BODIPY-630/650, 및 BODIPY-650/670를 포함하는 하지만 이에 한정되지 않는 BODIPY 염료; 및 ALEXA-488, ALEXA- 532, ALEXA-546, ALEXA-568, 및 ALEXA-594를 포함하는 하지만 이에 한정되지 않는 ALEXA 염료를 포함한다. 본 발명에 사용하기에 적당한 전자 풍부 표시자(indicator) 분자는 페리틴(ferritin), 헤모시아닌, 및 콜로이달 골드를 포함하나 이에 한정되는 것은 아니다. 대안적으로, 덜 바람직한 실시예에서 타겟 폴리뉴클레오티드는 해당 폴리뉴클레오티드에 첫 번째 그룹을 특이적으로 복합체화함으로써 표지될 수 있다. 표시자 분자에 공유결합되고 첫 번째 그룹에 대한 친화력이 있는 두 번째 그룹은 타겟 폴리뉴클레오티드를 간접적으로 검출하기 위해 사용될 수 있다. 그러한 실시예에서, 첫 번째 그룹으로 사용하기에 적당한 화합물은 바이오틴 및 이미노바이오틴을 포함하나 이에 한정되는 것은 아니다. 두 번째 그룹으로 사용되기에 적당한 화합물을 아비틴 및 스트렙토아비딘을 포함하나 이에 한정되는 것은 아니다.
5.1.4. 마이크로어레이와의 하이브리디제이션
위에서 설명된 것과 같이, 핵산 하이브리디제이션 및 세척 조건은 본 발명에 의해 분석될 폴리뉴클레오티드 분자(본 명세서에서는 "타겟 폴리뉴클레오티드 분자"로 명명됨)가 어레이의 상보적인 폴리뉴틀레오티드 서열, 바람직하게는 그것의 상보적 DNA가 위치한 특정 어레이 부위에 특이적으로 결합 또는 특이적으로 하이브리다이즈하도록 선택된다.
어레이 상에 위치한 이중-가닥 프로브 DNA를 가진 어레이들은 바람직하게는 타겟 폴리뉴클레오티드 분자와 접촉하기 전에 해당 DNA를 단일 가닥으로 만들기 위하여 변성 조건에 종속된다. 단일 가닥 프로브 DNA(예를 들어, 합성 올리고데옥시리보핵산)를 포함한 어레이는 예를 들어, 자가 상보적 서열(self complementary sequence)때문에 형성되는 다이머 또는 헤어핀(hairpin)을 제거하기 위하여 타겟 폴리뉴클레오티드 분자와 접촉하기 전에 변성될 필요가 있다.
최적 하이브리디제이션 조건은 프로브와 타겟 핵산의 길이(예를 들어, 폴리뉴클레오티드 대 올리고머가 200 염기보다 큼) 및 종류(예를 들어, RNA 또는 DNA)에 달려있다. 핵산의 특정 (즉, 엄격한(stringent)) 하이브리디제이션 조건에 대한 일반적 파라미터들은 Sambrook et al., (상동), 및 Ausubel et al., 1987, Current Protocols in Molecular Biology, Greene Publishing and Wiley - Interscience, New York에 설명되어 있다. Schena et al.의 cDNA 마이크로어레이가 사용되는 경우, 전형적인 하이브리디제이션 조건은 4시간 동안, 65℃에서 0.2% SDS가 보충된 5 X SSC 내에서 하이브리디제이션, 그 후 낮은 스트린젠시(stringency) 세척 완충액(0.2% SDS가 보충된 1 X SSC) 내 25℃에서의 세척, 그 후 높은 스트린젠시(stringency) 세척 완충액(0.2% SDS가 보충된 1 X SSC) 내 25℃에서 10분 동안의 세척이다(Schena et al., 1996, Proc . Natl. Acad . Sci. U.S.A. 93: 10614). 유용한 하이브리디제이션 조건은 또한 예를 들어, Tijessen, 1993, Hybridization With Nucleic Acid Probes, Elsevier Science Publishers B. V. and Kricka, 1992, Nonisotopic DNA Probe Techniques, Academic Press, San Diego, CA에 제공되어 있다.
본 발명의 스크리닝 및/또는 시그널링 칩에 사용하기 위한 특히 바람직한 하이브리디제이션 조건은 1 M NaCl, 50 mM MES 완충액 (pH 6.5), 0.5% 소디움 사르코신(Sarcosine) 및 30 퍼센트 포름아마이드 내에서 프로브의 평균 용융 온도 또는 거의 평균 용융 온도로 하이브리디제이션하는 것을 포함한다.
5.1.5. 시그널 탐지와 데이터 분석(SIGNAL DETECTION AND DATA ANALYSIS)
세포의 RNA에 상보적인 타겟 서열, 예를 들어 cDNA 또는 cRNA가 적절한 하이브리디제이션 상태에서 만들어지고 마이크로어레이로 하이브리다이즈될 때, 어떤 특별한 유전자의 엑손에 상응하는 어레이에 있는 사이트로의 하이브리디제이션의 레벨은 그 유전자로부터 전사된 엑손을 포함하는 mRNA 또는 mRNA들의 세포에서의 우세(prevalence)를 반영할 것이다. 예를 들어, 탐지될 수 있게 라벨된(detectably labeled) 전체 세포의 mRNA에 상보적인 cDNA가 마이크로어레이로 하이브리다이즈될 때, 세포에서 RNA 스플라이싱 또안 전사되지 않거나 제거되는 유전자의 엑손에 상응하는 어레이에 있는 사이트는 시그널을 거의 또는 완전히 갖지 않을 것이고, 엑손을 발현하는 인코딩된 mRNA가 우세한 유전자의 엑손은 상대적으로 강한 시그널을 가질 것이다. 대신의 스플라이싱에 의해 같은 유전자로부터 생성된 상이한 mRNA의 상대적인 어번던스(abundance)은 유전자를 위해 모니터되는 전체 엑손의 세트에 따라 시그널 강도 패턴에 의해 결정된다.
바람직한 실시예에서, 두 개의 상이한 세포로부터이 타겟 서열, 예를 들어 cDNA들 또는 cRNA들은 마이크로어레이의 바인딩 사이트로 하이브리다이즈된다. 약물 반응(cDNAs or cRNA)의 경우에 하나의 세포 샘플은 약물로 노출되고 같은 타입의 다른 세포 샘플은 약물로 노출되지 않는다. 경로 교란(pathway response)의 경우에 하나의 세포는 경로 교란으로 노출되고, 같은 타입의 다른 세포 샘플은 노출되지 않는다. 두 개의 세포 타입의 각각으로부터 유도된 cDNA 또는 cRNA는 그들이 구별되기 위하여 상이하게 라벨된다. 하나의 실시예에서, 예를 들어, 약물로 처리된(또는 경로 교란으로 노출된) 세포로 부터의 cDNA는 플루오레세인(fluorescein)-라벨된 dNTP를 사용하여 합성되고, 약물처리되지 않은 두번째 세포로부터의 cDNA는 로다민-라벨된 dNTP를 사용하여 합성된다. 그 두개의 cDNA가 혼합되고 마이크로어레이로 하이브리다이즈될 때, 각각의 cDNA 세트으로부터의 시그널의 상대적인 강도는 어레이의 각각의 사이트를 위해 결정되고, 특별한 엑손의 어번던스(abundance)에서의 상대적인 차이는 탐지된다.
위에서 묘사된 예에서, 약물처리된 것(또는 경로 교란된 것)으로부터의 cDNA는 플루오로포어가 자극 받았을 때에 녹색을 발할 것이고 처리되지 않은 세포로부터의 cDNA는 적색을 발할 것이다. 결과적으로, 약물처리가 직간접적으로 전사 및/또는 세포에서의 특별한 유전자의 후전사 스플라이싱(post-transcriptional splicing)에 대해 아무런 효과를 가지지 않을 경우, 엑손 발현 패턴은 양쪽의 세포에서 구별되지 않을 것이고, 역전사에서 적색 라벨 및 녹색 라벨된 cDNA는 동일하게 우세할 것이다. 마이크로어레이로 하이브리다이즈될 때, RNA의 그 종을 위한 바인딩 사이트는 양쪽의 플루오로포어의 파장 특성을 방출할 것이다. 반대로, 세포가 직간접적으로 전사 및/또는 세포에서의 특별한 유전자의 후전사 스플라이싱을 변화시키는 약물로 처리될 경우, 각각의 엑손 바인딩 사이트을 위한 적색 형광에 대한 녹색 형광의 비에 의해서 나타내어지는 것과 같은 엑손 발현 패턴은 변화할 것이다. 약물이 mRNA의 우세를 증가시킬 때, mRNA에서 발현된 각각의 엑손에 대한 비율은 증가한다. 반면, 약물이 mRNA의 우세를 감소시킬 때, mRNA에 발현된 각각의 엑손에 대한 비율은 감소할 것이다.
유전자 발현에서의 개변(alteration)을 정의하기 위한 이색 형광 라벨링(two-color fluorecsence labeling)과 탐지 스킴(detection scheme)의 사용은, 예를 들어 Schenaet al., 1995, Science 270: 467-470에서, mRNA의 탐지와 관련하여 묘사된다. 그 스킴은 라벨링과 엑손의 탐지에 동일하게 적용된다. 두 개의 상이한 플루오로포어로 라벨된 타겟 서열(예를 들어 cDNAs 또는 cRNA)를 사용하는 것의 이점은 두 개의 세포 상태에서의 각각의 배열된 유전자에 상응하는 mRNA 또는 엑손 발현 레벨의 직접적이고 내부적으로 조절된 비교가 만들어질 수 있다는 것과, 실험적인 환경에서의 작은 차이에 기인한 변화가 분석에 영향을 주지 않는다는 것이다. 그러나, 하나의 세포로부터의 cDNA를 사용하고, 예를 들러, 약물 처리 또는 경로 교란된 그리고 처리되지 않은 세포에서의 특별한 엑손의 절대적인 양을 비교하는 것도 가능하다.
형광물질로 라벨된 프로브(fluorescently labeled probe)가 사용될 때, 전사 어레이의 각각의 사이트에서의 형광 방출은 바람직하게는 컨포칼 레이저 마이크로스카피(confocal laser microscopy)를 스캔닝함에 의해 탐지될 수 있다. 하나의 실시예에서, 적절한 자극 라인(excitation line)을 사용하여, 분리된 스캔은 사용된 두 개의 플루오로포어의 각각에 대해 수행된다. 대신으로, 레이저는 두 개의 플루오로포어에 특유한 파장에서 자극적인 표본 조명을 허락하기 위해 사용될 수 있고, 두 개의 플루오로포어로부터의 발광(emission)은 동시에 분석될 수 있다(예를 들어, Shalon etal., 1996, Genome Res. 6: 639-645 참조). 바람직한 실시예에서, 어레이는 컴퓨터로 컨트롤되는 X-Y 스테이지(computer controlled X-Y stage)와 현미경 렌즈(microscope objective)를 갖는 레이저 발광 스캔너를 가지고 스캔될 수 있다. 두 개의 플루오로포어의 연속되는 자극은 멀티-라인(multi-line), 혼합 가스 레이저(mixed gas laser)를 가지고 수행되며, 방출된 빛은 파장에 의해서 분리되고 두 개의 포토멀티플라이어 튜브(photomultiplier tube)를 가지고 탐지된다. 그런 발광 레이저 스캔닝 장치는, 예를 들어 Schena et al., 1996, Genome Res. 6: 639-645에서 묘사된다. 대신에, Ferguson etal., 1996, Nature Biotech. 14에 의해서 묘사된 피버-옵틱 번들(fiber-optic bundle)이 수많은 사이트에서의 mRNA 어번던스 레벨을 동시에 모니터하기 위해 사용될 수 있다.
시그널은 기록되고, 바람직한 실시예에서, 컴퓨터(예를 들어 디지털 보드로 12 비트 아날로그를 사용하는 컴퓨터)에 의해 분석된다. 하나의 실시예에서, 스캔된 이미지는 그래픽 프로그램(예를 들어 Hijaak Graphics Suite)을 사용하여 데스페클(despeckle)된고 각각의 사이트에 있는 각각의 파장의 평균 하이브리디제이션의 스프레드시트를 만드는 이미지 그리딩 프로그램을 사용하여 분석된다. 필수적이라면, 두 개의 플루오(fluor)를 위한 채널 사이의 "크로스 토크"을 위한 실험적으로 결정된 교정(correction)이 만들어질 수 있다. 전사 어레이에 있는 어떤 특별한 하이브리디제이션 사이트를 위하여, 두 개의 플루오로포어의 방출량의 비는 계산될 수 있다. 그 비는 동종(cognate)의 절대적인 발현 레벨에 독립적이다. 그러나, 그 비는 발현이 약물 관리(), 유전자 삭제() 또는 어떤 다른 테스트되는 것들에 의해 두드러지게 조절되는 유전자에 대하여 유용하다.
본 발명의 방법에 따르면, 두 개의 세포 또는 세포 라인들에서 발현되는 mRNA 및/또는 엑손의 상대적인 어번던스(abundance)은 "perturbed(어번던스가 테스트된 mRNA의 두 개의 소스에서 차이가 있을 때)" 및 "not perturbed(차이가 없을 때)"로서 스코어된다. 여기서 사용되듯이, 적어도 25%(RNA가 하나의 소스에서 다른 소스에 비해 25% 더 풍부)의 인자의, 더 자주는 50%의 인자의, 한층 더 자주는 2(두 배), 3(세 배), 5(다섯 배)의 인자에 의한 RNA의 두 개의 소스 사이에서의 차이는 "perturbation"으로서 평가된다. 본 탐지 방법은 1.5배 내지 3배의 오더의 차이의 믿을만한 탐지를 허락한다.
그러나, 그것은 두 개의 세포 또는 두 개의 세포 라인에서의 mRNA 및/또는 mRNA에서 발현되는 엑손의 어번던스(abundance)에서의 상대적인 차이의 크기를 결정하는데 유리하다. 위에도 언급된 바와 같이, 이것은 차이나는 라벨링을 위해 사용된 두 개의 플루오로포어의 방출량의 비를 계산하는 것에 의해 또는 당업계의 숙련자에게 명백한 유사한 방법들에 의해 수행될 수 있다.
5. 2. 전사 상태 측정의 다른 방법들(OTHER METHODS OF TRANSCRIPTIONAL STATE MEASUREMENT)
세포의 전사 상태는 당업계에서 알려진 다른 유전자 발현 기술들에 의해 측정될 수 있다. 몇몇 그런 기술들은, 페이징 프라이머(phasing primer)를 갖는 더블 리스트릭션 효소 디제스쳔(double restriction enzyme digestion)를 결함하는 방법(예를 들어, European Patent534858 Al, filed September 24,1992, by Zabeauet al. 참조) 또는 한정된 RNA 말단(end)으로 가장 가까운 사이트를 갖는 제한 단편(restriction fragment)을 선택하는 방법(예를 들어, Prashar et al., 1996, Proc. Natl. Acad. Sci. USA 93: 659-663)과 같은 일레트로포레틱 분석(electrophoretic analysis)을 위한 제한된 복잡성의 제한 단편의 풀(pools of restriction fragments of limited complexity)을 제공한다. 다른 방법들은, 각각의 cDNA를확인하기 위해 복수개의 cDNA의 각각에서 충분한 베이스(예를 들어 20-50 베이스)를 스켄칭(sequencing)함에 의해 또는 한정된 mRNA 말단에 적절한 알려진 위치에서 생성되는 짧은 테그(예를 들어 9-10 베이스)를 스켄칭함에 의해서, 전략적으로 cDNA 풀을 표본으로 한다(sampling)(예를 들어 Velculescu, 1995, Science 270: 484- 487 참조).
세포의 전사 상태는 역시 역 전사 폴리머라제 연쇄 반응(RT-PCR)에 의해서 측정될 수 있다. RT-PCR는 mRNA 탐지와 퀀티테이션(quantitation)을 위한 기술이다. RT-PCR는 하나의 세포로부터의 RNA의 퀀티테이션(quantitation)을 가능하기에 충분한 정도로 민감하다. (예를 들어 Pfaffl and Hageleit, 2001, Biotechnology Letters 23,275-282 ; Tadesse etal., 2003, Mol Genet Genomics 269, p. 789-796; and Kabir and Shimizu, 2003, J. Biotech. 9, p. 105. 참조)
6. 생물학적 상태의 다른 양상의 측정(MEASUREMENT OF OTHER ASPECTS OF THE BIOLOGICAL STATE)
본 발명의 다양한 실시예에서, 번역 상태(), 활동 상태() 또는 혼합된 양상과 같은 전사 상태가 아닌 다른 생물학적 상태의 양상들이 측정될 수 있다. 그래서, 그런 실시예에서, 세포 요소 어번던스 데이터는 번역 상태 측정 또는 단백질 발현 측정마저도 포함할 수 있다. 전사 상태와 다른 생물학적 상태의 양상의 세부적인 내용이 이 색션에서 묘사된다.
6.1 번역 상태 측정(TRANSLATIONAL STATE MEASUREMENTS)
번역 상태의 측정은 몇 가지 방법에 따라서 수행될 수 있다. 예를 들어, 단백질의 전체 게놈 모니터링(whole genome monitoring of protein) (예를 들어 "proteome")은, 바인딩 사이트가 세포 게놈에 의해서 인코딩되는 복수개의 단백질 종(protein species)에 특유한 고정된(immobilized), 바람직하게는 모노클로날(monoclonal)한 항체(antibody)를 포함하는 마이크로어레이를 구성함에 의해 수행될 수 있다. 바람직하게는 항체들은 인코딩된 단백질의 실질적인 단편(fraction)을 위해 또는 적어도 흥미의 대상이 되는 약물의 활동과 관련된 그 단백질들을 위해 존재한다. 모노클로날 항체를 만드는 방법은 잘 알려져 있다(예를 들어, Harlow and Lane, 1988, Antibodies. A Laboratory Manual, Cold Spring Harbor, New York). 하나의 실시예에서, 모노클로날 항체는 세포의 유전자 서열(genomic sequence)에 근거하여 디자인된 합성 펩타이드 단편(ynthetic peptide fragment)에 대항하여 올려진다. 그런 항체 배열(array)을 가지고, 세포로부터의 단백질은 그 배열에 접촉하게 되고 그들의 바인딩은 당업계에서 알려진 분석자료들과 함께 분석된다.
대신에, 단백질은 이차원 겔 전기 이동 시스템(two-dimensional gel electrophoresis system)에 의해서 분리될 수 있다. 이차원 겔 전기 이동 시스템은 당업계에서 잘 알려진 것이며, 전형적으로 두번째 차원을 따르는 SDS-PAGE 전기 이동(SDS-PAGE electrophoresis)에 의해서 뒷따라지는 첫번째 차원을 따르는 아이소-일렉트릭 포커싱(iso-electric focusing)을 포함한다.(예를 들어, Hames etal., 1990, GelElectrophoresis of Proteins : A Practical Approach, IRL Press, New York; Shevchenko etal., 1996, Proc. Natl. Acad. Sci. USA 93:1440-1445 ; Saglioccoet al., 1996, Yeast 12: 1519- 1533 ; Lander, 1996, Science 274: 536-539. 참조). 결과적인 일렉트로페로그램은, 폴리클로날(polyclonal) 및 모노클로날(monoclonal) 항체와 인터널 및 N-터미널-스켄칭(internal and N-terminal micro-sequencing)을 사용하는 면역탁본법(immunoblot), 질량 분광 기술(mass spectrometric technique) 및 웨스턴 블로팅(Western blotting)을 포함하는 수많은 기술들에 의해 분석될 수 있다. 이 기술들을 사용하여, 주어진 생리학적 상태에서 생성되는 모든 단백질의 실질적인 비율을 확인하는 것이 가능하다.
6. 2 다른 타입의 세포 요소 어번던스의 측정(OTHER TYPES OF CELLULAR CONSTITUENT ABUNDANCE MEASUREMENTS)
본 발명의 방법은 모니터되는 어떤 세포 요소에도 적용될 수 있다. 예를 들어, 단백질의 활동이 측정될 수 있는 곳에서, 본 발명의 실시예들은 그런 측정치를 사용할 수 있다. 활동 측정(Activity measurement)은, 특징적인 특별한 활동에 적합한 어떠한 기능적, 생화학적, 물리적 수단에 의해서도 수행될 수 있다. 활동이 화학적 변형을 포함하는 곳에서 세포 단백질은 천연 기질과 접촉될 수 있고, 변형 속도가 측정될 수 있다. 활동이 다중결합의 유닛(multimeric unit)에서의 결합(association), 예를 들어 DNA와의 활성화된 DNA 바인딩 복합체(activated DNA binding complex)의 결합을 포함하는 곳에서, 결합된 단백질의 양 또는 전사된 mRNA의 양과 같은 결합의 2차적 결과(secondary consequences of the association)가 측정될 수 있다. 역시, 세포 사이클 조절(cell cycle control)에서와 같이 단지 기능적인 활동이 알려진 곳에서, 그 기능의 수행이 관찰될 수 있다. 어떻게 알려지고 측정되더라도, 단백질 활성에서의 변화는 본 발명의 전술한 방법에 의해서 분석된 응답 데이터(response data)를 형성한다. 본 발명의 몇몇 실시예에서, 세포 요소 측정은 세포 페노티픽 기술(cellular phenotypic technique)로부터 유도될 수 있다. 하나의 그런 세포 페노티픽 기술은 보편적 리포터(universal reporter)로서 호흡을 사용한다. 하나의 실시예에서, 각각 독특한 화학적 성질을 갖는 96-웰 마이크로타이터 플레이트(96-well microtiter plate)들이 제공된다. 각각의 독특한 화학적 성질은 특별한 페노타입을 테스트하기 위하여 디자인된다. 흥미의 대상이되는 유기체로부터의 세포는 각각의 웰로 피펫팅(pipetting)된다. 만일, 세포가 적절한 페노타입을 드러낸다면, 그들은, 강한 자주색 칼라를 형성하면서, 호흡할 것이고 활동적으로 테트라졸리움 염료를 감소시킬 것이다. 약한 페노타입은 더 가벼운 색깔을 나타낸다. 무색은 세포가 특유의 페노타입을 가지지 않는다는 것을 의미한다. 색깔 변화는 매 시간 몇 차례 정도로 자주 기록될 것이다. 하나의 인큐베이션(incubation)동안, 5000 이상의 페노타입은 테스트될 수 있다. (예를 들어, Bochner etal., 2001, Genome Research 11, p. 1246. 참조).
본 발명의 어떤 실시예에서, 세포 요소 측정은 세포 페노티픽 기술(cellular phenotypic technique)로부터 유도된다.
하나의 그런 세포 페노티픽 기술은 보편적 리포터(universal reporter)로서 호흡을 사용한다.
하나의 실시예에서, 각각 독특한 화학적 성질을 갖는 96-웰 마이크로타이터 플레이트(96-well microtiter plate)들이 제공된다. 각각의 독특한 화학적 성질은 특별한 페노타입을 테스트하기 위하여 디자인된다. 흥미의 대상이되는 생물학적 표표본으로부터의 세포는 각각의 웰로 피펫팅(pipetting)된다. 만일, 세포가 적절한 페노타입을 드러낸다면, 그들은, 강한 자주색 칼라를 형성하면서, 호흡할 것이고 활동적으로 테트라졸리움 염료를 감소시킬 것이다. 약한 페노타입은 더 가벼운 색깔을 나타낸다. 무색은 세포가 특유의 페노타입을 가지지 않는다는 것을 의미한다. 색깔 변화는 매 시간 몇 차례 정도로 자주 기록될 것이다. 하나의 인큐베이션(incubation)동안, 5000 이상의 페노타입은 테스트될 수 있다. (예를 들어, Bochner etal., 2001, Genome Research 11,1246-55 참조).
몇몇 실시예에서, 측정되는 세포 요소는 대사산물(metabolite)이다. 대사 산물에는 아미노산, 금속, 용해성 당(soluble sugar), 당 포스페이트(sugar phosphate) 그리고 복합 탄수화물(complex carbohydrate)이 포함되며 이에 한정되는 것은 아니다. 그런 대사 산물은, 예를 들어, 열분해 질량 분광법(pyrolysis mass spectrometry)(Irwin, 1982, Analytical Pyrolysis : A Comprehensive Guide, Marcel Dekker, New York; Meuzelaar etal., 1982, Pyrolysis MassSpectrometry of Recent and Fossil Biomaterials, Elsevier, Amsterdam), 후리에-변형 적외선 분광법(fourier-transform infrared spectrometry) (Griffiths and de Haseth, 1986, Fourier transform infrared spectrometry, John Wiley, New York; Helm etal., 1991, J. Gen.Microbiol. 137,69-79 ; Naumannet al., 1991, Nature 351,81-82 ; Naumann etal., 1991, In: Modern techniques for rapid microbiological analysis, 43-96, Nelson, W. H.,ed., VCH Publishers, New York), 라만 분광법(Raman spectrometry), 가스 크로마토그래비-질량 분광법(gas chromatography- mass spectroscopy (GC-MS))(Fiehn et al., 2000, Nature Biotechnology 18,1157-1161), 모세관 전기이동(capillary electrophoresis (CE) /MS), 고압 액체 크로마토그래피/질량 분광법(high pressure liquid chromatography/mass spectroscopy(HPLC/MS)), 액체 크로마토그래피-일렉트로스프레이(liquid chromatography (LC) -Electrospray) 및 캡-LC-탠덤-일렉트로스프레이 질양 분광법(cap-LC-tandem-electrospray mass spectrometry)과 같은 방법을 사용하여 전체-세포 레벨(whole-cell level)에서 측정될 수 있다. 그런 방법들은, 밀접하게 관련된 샘플들 사이을 구별하기 위하여 인공의 신경 네트워크(artificial neural network)와 유전적 프로그래밍(genetic programming)을 이용하는 확립된 케모메트릭 방법(chemometric method)과 결합될 수 있다.
7. 분석 키트 임플리멘테이션 (ANALYTIC KIT IMPLEMENTATION)
하나의 실시예에서, 이 발명의 방법은 생물학적 분류자(biological classifier)를 발전시키고 사용하기 위하여 키트의 사용에 의해 수행될 수 있다. 그런 키트는 위의 서브색션에 묘사된 것들과 같은 마이크로어레이를 포함한다. 그런 키트에 포함되는 마이크로어레이는 솔리드 면(solid phase), 예를 들어 표면(surface)을 포함한다. 프로브는 그 솔리드 면으로 하이브리다이즈되고, 그 솔리드 면의 알려진 위치에 결합된다. 바람직하게는, 이 프로브는 RNA 종(RNA species) 또는 그로부터 유도된 cDNA 종(cDNA species)으로 하이브리다이즈할 수 있는 각각의 뉴클레익 산을 갖는, 알려진, 상이한 서열의 핵산으로 구성된다. 특별한 실시예에서, 본 발명의 키트에 포함되는 프로브는 , 흥미의 대상이 되는 유기체로부터 모아진 세포에서의 RNA 종으로부터 유도된 뉴클레익 산 서열로 특유하게 하이브리다이즈할 수 있는 핵산이다.
본 발명의 바람직한 실시예에서, 본 발명의 키트는 역시 하나 또는 그 이상의 본 명세서에서 설명된 데이터 구조 및/또는 소프트웨어 모듈을 포함한다. 이들 데이터 구조 및 소프트웨어 모듈은 원격 네트워크 컴퓨터로부터 상기에서 묘사된 데이터베이스를 사용하기 위해 컴퓨터 가독성 매체 및/또는 접근 인증(access author)에서 인코딩된다.
또 다른 바람직한 실시예에서, 본 발명의 키트는 앞에서 묘사된 것과 같은 그리고 도 1에서 설명된 것과 같은 컴퓨터 시스템의 메모리로 저장될 수 있는 소프트웨어를 포함한다. 본 발명의 키트에 포함되는 소프트웨어는 도 1과 관련하여 위에서 묘사된 소프트웨어와 필수적으로 동일하다.
본 발명의 분석적 방법을 이행하는 다른 키트는 당업계에서의 숙련자에게 명백할 것이며 본 발명의 범위에 포함된다.
8. 인용된 문헌(REFERENCES CITED)
여기에 인용된 문헌들은, 각각의 개인적 공개 또는 특허 또는 특허 출원이 명백하게 개별적으로 모든 목적을 위해 전체로서 문헌들에 의해 통합되는 것으로 지적되는 것과 같은 정도로, 전체로서 그리고 모든 목적을 위하여 문헌들에 의해 여기에서 통합되어 진다.
본 발명은 컴퓨터 가독성 저장 매체에서 임배드(embed)된 컴퓨터 프로그램 메커니즘을 포함하는 컴퓨터 프로그램 프로덕트로서 이행될 수 있다. 예를 들어, 컴퓨터 프로그램 프로덕트는 도 1에 도시된 프로그램 모듈 및/또는 도 2 및 도3에서 도시된 데이터베이스를 포함할 수 있다.이 프로그램 모듈은 CD-ROM, 자기 디스크 저장 프로덕트( magnetic disk storage product) 또는 어떤 다른 가독성 데이터 또는 프로그램 저장 프로덕트에 저장될 수 있다. 컴퓨터 프로그램 프로덕트에 있는 소프트웨어 모듈은 역시, 인터넷을 통해 또는 다른 방식으로, 캐리어 파(carrier wave)에 있는 컴퓨터 데이터 시그널의 전달에 의해서 전자적으로 분배될 수 있다.
본 발명의 많은 수정 및 변경은, 당업계에서의 숙련자들에게 명백한 것으로, 본 발명의 정신과 범위로 부터 벗어남 없이 만들어질 수 있다. 여기서 묘사된 특유의 실시예들은 단지 예시적인 것으로서 제공되어지며, 본 발명은 청구항의 균등물의 범위에 따라서 단지 청구항의 용어에 의해서 한정된다.
도 1은 본 발명의 일 실시예에 따라 생물학적 표본을 분류하는 것을 위한 컴퓨터 시스템을 설명한다.
도 2는 본 발명의 일 실시예에 따라 표본을 분류하는 것을 위한 복수개의 분류자(classifier)를 사용하는 것을 위한 처리 단계를 설명한다.
도 3은 본 발명의 일 실시예에 따라 복수개의 모델들(분류자들)을 저장하는 데이터 구조를 설명한다.

Claims (139)

  1. 중앙 처리 유닛; 및
    상기 중앙 처리 유닛에 연결되는
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델 중에서 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 모델을 평가하기 위한 명령들, 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하며;
    (iii) 복수 개의 모델을 평가하기 위하여 한번 이상 평가를 하기 위한 상기 명령들을 반복하는 것을 위한 명령들; 및
    (iv) 상기 평가를 위한 상기 명령들을 통해 평가된 각각의 상기 모델 스코어를 커뮤니케이트시키는 것을 위한 명령들을 저장하는 메모리를 포함하는 컴퓨터.
  2. 제1항에 있어서,
    두 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트되고,
    상기 두 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 컴퓨터.
  3. 제1항에 있어서,
    다섯 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트되고,
    상기 다섯 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 컴퓨터.
  4. 제1항에 있어서,
    상기 데이터를 받는 것을 위한 명령들은 광범위 네트워크를 통해 리모트 컴퓨터로부터 상기 데이터를 받는 것을 위한 명령들을 포함하는 것을 특징으로 하는 컴퓨터.
  5. 제1항에 있어서,
    상기 광범위 네트워크는 인터넷인 것을 특징으로 하는 컴퓨터.
  6. 제1항에 있어서,
    커뮤니케이트을 위한 상기 명령들은 상기 각각의 모델 스코어를 광범위 네트워크를 통해 리모트 컴퓨터로 전달하는 것을 위한 명령들을 포함하는 것을 특징으 로 하는 컴퓨터.
  7. 제6항에 있어서,
    상기 광범위 네트워크는 인터넷인 것을 특징으로 하는 컴퓨터.
  8. 제1항에 있어서,
    상기 모델 스코어가 첫 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지는 것으로 간주되어지고,
    상기 모델 스코어가 두 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지지 않는 것으로 간주되어지는 것을 특징으로 하는 컴퓨터.
  9. 제1항에 있어서,
    상기 생물학적 특징은 질병인 것을 특징으로 하는 컴퓨터.
  10. 제9항에 있어서,
    상기 질병은 암인 것을 특징으로 하는 컴퓨터.
  11. 제9항에 있어서,
    상기 질병은 유방암, 폐암, 전립선 암, 결장암, 난소암, 방광암. 위암 또는 직장암인 것을 특징으로 하는 컴퓨터.
  12. 제1항에 있어서,
    상기 복수개의 모델들은 첫 번째 모델 스코어에 의해서 특징지워지는 첫번째 모델 및 두번째 모델 스코어에 의해서 특징지워지는 두번째 모델을 포함하고,
    하나 또는 그 이상의 특징들이 상기 첫번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티는 하나 또는 그 이상의 특징이 상기 두번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티와 다른 것을 특징으로 하는 컴퓨터.
  13. 제1항에 있어서,
    상기 복수 개의 모델 중에서 하나의 모델에 대한 모델 스코어를 결정하기 위하여 사용되는 하나 또는 그 이상의 세포 요소에 대한 상기 하나 또는 그 이상의 특징들 중에서 하나의 특징은, 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서의 다량의 상기 하나 또는 그 이상의 세포 요소를 포함하는 것을 특징으로 하는 컴퓨터.
  14. 제1항에 있어서,
    상기 종은 인간인 것을 특징으로 하는 컴퓨터.
  15. 제1항에 있어서,
    상기 생물학적 테스트 표본은 비옵시 또는 종양, 혈액, 뼈, 유방, 폐, 전립선, 결장, 난소, 방광, 위 또는 직장인 것을 특징으로 하는 컴퓨터.
  16. 제1항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  17. 제1항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  18. 제1항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상 기 생물학적 테스트 표본에서 적어도 오 천 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  19. 제1항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 천 내지 이천 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  20. 제1항에 있어서,
    상기 복수개의 세포 요소 중에서 하나의 세포 요소는 mRNA, cRNA 또는 cDNA인 것을 특징으로 하는 컴퓨터.
  21. 제1항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 핵산 또는 리보핵산이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터.
  22. 제1항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 단백질이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터.
  23. 제1항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체 또는 상기 생물학적 테스트 표본으로부터 얻어진 샘플을 사용하는 세포 요소에 대한 텐덤 매스 분광 분석에 의해서 수반되는 동위원소-코디드된 친화 태깅을 사용하여 결정되는 것을 특징으로 하는 컴퓨터.
  24. 제1항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체로부터 얻어진 샘플 또는 상기 생물학적 테스트 표본에서의 세포 요소의 활동 또는 후-번역 변형을 측정함에 의해서 결정되는 것을 특징으로 하는 컴퓨터.
  25. 제1항에 있어서,
    상기 생물학적 특징은 약물에 대한 민감성인 것을 특징으로 하는 컴퓨터.
  26. 제1항에 있어서,
    평가를 위한 상기 명령들의 예들에 의해서 모델 스코어가 평가되는 복수개의 모델들은 두 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  27. 제26항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  28. 제26항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 컴퓨터.
  29. 제1항에 있어서,
    평가를 위한 상기 명령들의 예들에 의해서 모델 스코어가 평가되는 복수개의 모델들은 다섯 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  30. 제29항에 있어서,
    상기 다섯 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  31. 제29항에 있어서,
    상기 다섯 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 컴퓨터.
  32. 제1항에 있어서,
    평가를 위한 상기 명령들의 예들에 의해서 모델 스코어가 평가되는 복수개의 모델들은 2 내지 20 개의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  33. 제32항에 있어서,
    상기 2 내지 20 개의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  34. 제32항에 있어서,
    상기 2 내지 20 개의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 컴퓨터.
  35. 중앙 처리 유닛; 및
    상기 중앙 처리 유닛에 연결되는
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델 중에서 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 모델을 평가하기 위한 명령들, 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하고;
    (iii) 상기 평가를 위한 상기 명령들에 의하여 평가된 각각의 상기 모델 스코어를 커뮤니케이트시키는 것을 위한 명령들을 저장하는 메모리를 포함하는 것을 특징으로 하는 컴퓨터.
  36. 컴퓨터 가독성 저장 매체 및 상기 컴퓨터 가독성 저장 매체에 임배드된
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델 중에서 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지 는 모델을 평가하기 위한 명령들, 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하고;
    (iii) 복수 개의 모델을 평가하기 위하여 한번 이상 평가를 하기 위한 상기 명령들을 반복하는 것을 위한 명령들; 및
    (iv) 상기 평가를 위한 상기 명령들을 통해 평가된 각각의 상기 모델 스코어를 커뮤니케이트시키는 것을 위한 명령들을 포함하는 컴퓨터 프로그램 메카니즘을 포함하는 컴퓨터 시스템과 연결하여 사용하기 위한 컴퓨터 프로그램 프로덕트.
  37. 제36항에 있어서,
    두 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트되고,
    상기 두 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  38. 제36항에 있어서,
    다섯 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트되고,
    상기 다섯 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  39. 제36항에 있어서,
    상기 모델 스코어가 첫 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지는 것으로 간주되어지고,
    상기 모델 스코어가 두 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지지 않는 것으로 간주되어지는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  40. 제36항에 있어서,
    상기 생물학적 특징은 질병인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  41. 제40항에 있어서,
    상기 질병은 암인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  42. 제40항에 있어서,
    상기 질병은 유방암, 폐암, 전립선 암, 결장암, 난소암, 방광암. 위암 또는 직장암인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  43. 제36항에 있어서,
    상기 복수개의 모델들은 첫 번째 모델 스코어에 의해서 특징지워지는 첫 번째 모델 및 두 번째 모델 스코어에 의해서 특징지워지는 두번째 모델을 포함하고,
    하나 또는 그 이상의 특징들이 상기 첫 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티는 하나 또는 그 이상의 특징이 상기 두 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티와 다른 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  44. 제36항에 있어서,
    상기 복수 개의 모델 중에서 하나의 모델에 대한 모델 스코어를 결정하기 위하여 사용되는 하나 또는 그 이상의 세포 요소에 대한 상기 하나 또는 그 이상의 특징들 중에서 하나의 특징은, 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 다량의 상기 하나 또는 그 이상의 세포 요소를 포함하는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  45. 제36항에 있어서,
    상기 종은 인간인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  46. 제36항에 있어서,
    상기 생물학적 테스트 표본은 비옵시 또는 종양, 혈액, 뼈, 유방, 폐, 전립선, 콜로렉텀, 난소, 방광, 위 또는 직장인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  47. 제36항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터 프로그램 프로덕트.
  48. 제36항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터 프로그램 프로덕트.
  49. 제36항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 천 개의 세포 요소의 세포요소 어번던스를 포함하는 컴퓨터 프로그램 프로덕트.
  50. 제36항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 천 내지 이천 개의 세포 요소의 세포요소 어번던스를 포함하는 컴퓨터 프로그램 프로덕트.
  51. 제36항에 있어서,
    상기 복수개의 세포 요소 중에서 하나의 세포 요소는 mRNA, cRNA 또는 cDNA인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  52. 제36항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 핵산 또는 리보핵산이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터 프로그 램 프로덕트.
  53. 제36항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 단백질이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  54. 제36항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체 또는 상기 생물학적 테스트 표본으로부터 얻어진 샘플을 사용하는 세포 요소에 대한 텐덤 매스 분광 분석에 의해 수반되는 동위원소-코디드된 친화 태깅을 사용하여 결정되는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  55. 제36항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체로부터 얻어진 샘플 또는 상기 생물학적 테스트 표본에서의 세포 요소의 활동 또는 후-번역 변형을 측정함에 의해서 결정되 는 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  56. 제36항에 있어서,
    상기 생물학적 특징은 약물에 대한 민감성인 것을 특징으로 하는 컴퓨터 프로그램 프로덕트.
  57. 컴퓨터 가독성 저장 매체 및 상기 컴퓨터 가독성 저장 매체에 임배드된
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델 중에서 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 모델을 평가하기 위한 명령들, 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하고;
    (iii) 상기 평가를 위한 상기 명령들을에서 평가된 각각의 상기 모델 스코어를 커뮤니케이트시키는 것을 위한 명령들을 포함하는 컴퓨터 프로그램 메카니즘을 포함하는 컴퓨터 시스템과 연결하여 사용하기 위한 컴퓨터 프로그램 프로덕트.
  58. 데이터를 수신하는 단계;
    복수개의 모델 중에서 하나의 모델을 평가하는 단계;
    상기 복수개의 모델들을 평가하기 위하여 상기 평가 단계를 반복하는 단계; 및
    상기 평가 단계의 하나의 예에서 평가된 각각의 모델 스코어를 커뮤니케이트시키는 단계를 포함하며,
    여기서 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하고,
    상기 모델은 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 것이고, 상기 모델에 대한 상기 평가는 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 상기 모델 스코어를 결정하는 것을 포함하는 것을 특징으로 하는 방법.
  59. 제58항에 있어서,
    두 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트 단계에 의해 커뮤니케이트되고,
    상기 두 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 방법.
  60. 제58항에 있어서,
    다섯 개 또는 그 이상의 모델 스코어가 상기 커뮤니케이트 단계에 의해 커뮤니케이트되고,
    상기 다섯 개 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 상이한 모델들 각각에 상응하는 것을 특징으로 하는 방법.
  61. 제58항에 있어서,
    상기 모델 스코어가 첫 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지는 것으로 간주되어지고,
    상기 모델 스코어가 두 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지지 않는 것으로 간주되어지는 것을 특징으로 하는 방법.
  62. 제58항에 있어서,
    상기 생물학적 특징은 질병인 것을 특징으로 하는 방법.
  63. 제62항에 있어서,
    상기 질병은 암인 것을 특징으로 하는 방법.
  64. 제62항에 있어서,
    상기 질병은 유방암, 폐암, 전립선 암, 결장암, 난소암, 방광암. 위암 또는 직장암인 것을 특징으로 하는 방법.
  65. 제58항에 있어서,
    상기 복수개의 모델들은 첫 번째 모델 스코어에 의해서 특징지워지는 첫 번째 모델 및 두 번째 모델 스코어에 의해서 특징지워지는 두 번째 모델을 포함하고,
    하나 또는 그 이상의 특징이 상기 첫 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티는 하나 또는 그 이상의 특징이 상기 두 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티와 다른 것을 특징으로 하는 방법.
  66. 제58항에 있어서,
    상기 복수개의 모델 중에서 하나의 모델에 대한 모델 스코어를 결정하기 위하여 사용되는 하나 또는 그 이상의 세포 요소에 대한 상기 하나 또는 그 이상의 특징들 중에서 하나의 특징은, 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 다량의 상기 하나 또는 그 이상의 세포 요소를 포함하는 것을 특징으로 하는 방법.
  67. 제58항에 있어서,
    상기 종은 인간인 것을 특징으로 하는 방법.
  68. 제58항에 있어서,
    상기 생물학적 테스트 표본은 비옵시 또는 종양, 혈액, 뼈, 유방, 폐, 전립선, 콜로렉텀, 난소, 방광, 위 또는 직장인 것을 특징으로 하는 방법.
  69. 제58항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 방법.
  70. 제58항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 백 개의 세포 요소의 세포요소 어번던스를 포함하는 방법.
  71. 제58항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 천 개의 세포 요소의 세포 요소 어번던스를 포함하는 방법.
  72. 제58항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 천 내지 이천 개의 세포 요소의 세포 요소 어번던스를 포함하는 방법.
  73. 제58항에 있어서,
    상기 복수개의 세포 요소 중에서 하나의 세포 요소는 mRNA, cRNA 또는 cDNA인 것을 특징으로 하는 방법.
  74. 제58항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 핵산 또는 리보핵산이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 방법.
  75. 제58항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 단백질이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 방법.
  76. 제58항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체 또는 상기 생물학적 테스트 표본으로부터 얻어진 샘플을 사용하는 세포 요소에 대한 텐덤 매스 분광 분석에 의해 수반되는 동위원소-코디드된 친화 태깅을 사용하여 결정되는 것을 특징으로 하는 방법.
  77. 제58항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체로부터 얻어진 샘플 또는 상기 생물학적 테스트 표본에서의 세포 요소의 활동 또는 후-번역 변형을 측정함에 의해서 결정되는 것을 특징으로 하는 방법.
  78. 제58항에 있어서,
    상기 생물학적 특징은 약물에 대한 민감성인 것을 특징으로 하는 방법.
  79. 제58항에 있어서,
    상기 평가 단계의 예들에 의해서 모델 스코어가 평가되는 복수 개의 모델들은 두 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 방법.
  80. 제79항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 방법.
  81. 제79항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 방법.
  82. 제58항에 있어서,
    상기 평가 단계의 예들에 의해서 모델 스코어가 평가되는 복수 개의 모델들은 다섯 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 방법.
  83. 제82항에 있어서,
    상기 다섯 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 방법.
  84. 제82항에 있어서,
    상기 다섯 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 방법.
  85. 제58항에 있어서,
    평가 단계의 예들에 의해서 모델 스코어가 평가되는 복수 개의 모델들은 2 내지 20 개의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 방법.
  86. 제85항에 있어서,
    상기 2 내지 20 개의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 방법.
  87. 제85항에 있어서,
    상기 2 내지 20 개의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 방법.
  88. 데이터를 받는 단계;
    복수개의 모델을 평가하는 단계;및
    상기 평가 단계의 하나의 예에서 평가된 각각의 모델 스코어를 커뮤니케이트시키는 단계;를 포함하며,
    여기서 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하고,
    상기 모델은 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 것이고, 상기 모델에 대한 상기 평가는 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 상기 모델 스코어를 결정하는 것을 포함하는 것을 특징으로 하는 방법.
  89. 중앙 처리 유닛; 및
    상기 중앙 처리 유닛에 연결되는
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 전송하기 위한 명령들; 및
    (ii) 각 모델 스코어는 복수 개의 모델 중에서 각 모델이 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 모델에 해당되는 복수 개의 모델 스코어들을 수신하기 위한 명령들이며 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하는 명령들을 저장하는 메모리를 포함하는 컴퓨터.
  90. 제89항에 있어서,
    상기 복수개의 모델 스코어는 둘 또는 그 이상의 모델 스코어로 구성되고,
    상기 둘 또는 그 이상의 모델 스코어에서 각각의 모델 스코어는 상기 복수개의 모델에서 하나의 모델에 상이한 모델에 상응하는 것을 특징으로 하는 컴퓨터.
  91. 제89항에 있어서,
    상기 복수개의 모델 스코어는 상기 커뮤니케이트을 위한 명령들에 의해 커뮤니케이트되는 다섯 또는 그 이상의 모델 스코어로 구성되고,
    상기 다섯 또는 그 이상의 모델 스코어 중 각각의 모델 스코어는 상기 복수개의 모델 중에서 하나의 상이한 모델에 상응하는 것을 특징으로 하는 컴퓨터.
  92. 제89항에 있어서,
    데이터를 보내는 것을 위한 상기 명령들은 상기 리모트 컴퓨터로부터 광범위 네트워크를 통해 리무브 컴퓨터로 상기 데이터를 보내는 것을 위한 명령들을 포함하는 것을 특징으로 하는 컴퓨터.
  93. 제92항에 있어서,
    상기 광범위 네트워크는 인터넷인 것을 특징으로 하는 컴퓨터.
  94. 제89항에 있어서,
    상기 모델 스코어를 받는 것을 위한 명령들은 광범위 네트워크를 통해 리모트 컴퓨터로부터 상기 복수개의 모델 스코어를 받는 것을 위한 명령들을 포함하는 것을 특징으로 하는 컴퓨터.
  95. 제94항에 있어서,
    상기 광범위 네트워크는 인터넷인 것을 특징으로 하는 컴퓨터.
  96. 제89항에 있어서,
    상기 모델 스코어가 첫 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학적 특징을 가지는 것으로 간주되어지고,
    상기 모델 스코어가 두 번째 범위의 값일 때는, 테스트 유기체 또는 생물학적 테스트 표본이 복수개의 모델 중의 하나의 모델에 의하여 나타내어지는 생물학 적 특징을 가지지 않는 것으로 간주되어지는 것을 특징으로 하는 컴퓨터.
  97. 제89항에 있어서,
    상기 생물학적 특징은 질병인 것을 특징으로 하는 컴퓨터.
  98. 제97항에 있어서,
    상기 질병은 암인 것을 특징으로 하는 컴퓨터.
  99. 제97항에 있어서,
    상기 질병은 유방암, 폐암, 전립선암, 결장암, 난소암, 방광암. 위암 또는 직장암인 것을 특징으로 하는 컴퓨터.
  100. 제89항에 있어서,
    상기 복수 개의 모델들은 첫 번째 모델 스코어에 의해서 특징지워지는 첫 번째 모델 및 두 번째 모델 스코어에 의해서 특징지워지는 두 번째 모델을 포함하고,
    하나 또는 그 이상의 특징들이 상기 첫 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티는 하나 또는 그 이상의 특징이 상기 두 번째 모델 스코어를 평가하기 위하여 사용되는 세포 요소의 아이덴터티와 다른 것을 특징으로 하는 컴퓨터.
  101. 제89항에 있어서,
    상기 복수 개의 모델 중에서 하나의 모델에 대한 모델 스코어를 결정하기 위하여 사용되는 하나 또는 그 이상의 세포 요소에 대한 상기 하나 또는 그 이상의 특징들 중에서 하나의 특징은, 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 다량의 상기 하나 또는 그 이상의 세포 요소를 포함하는 것을 특징으로 하는 컴퓨터.
  102. 제89항에 있어서,
    상기 종은 인간인 것을 특징으로 하는 컴퓨터.
  103. 제89항에 있어서,
    상기 생물학적 테스트 표본은 비옵시 또는 종양, 혈액, 뼈, 유방, 폐, 전립선, 결장, 난소, 방광, 위 또는 직장인 것을 특징으로 하는 컴퓨터.
  104. 제89항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 백 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  105. 제89항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 백 개의 세포 요소의 세포요소 어번던스를 포함하는 컴퓨터.
  106. 제89항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 적어도 오 천 개의 세포 요소의 세포 요소 어번던스를 포함하는 컴퓨터.
  107. 제89항에 있어서,
    상기 하나 또는 그 이상의 특징은 세포 요소 어번던스를 포함하고,
    상기 데이터는 상기 종의 테스트 유기체 또는 상기 종의 유기체로부터의 상기 생물학적 테스트 표본에서 천 내지 이천 개의 세포 요소의 세포요소 어번던스를 포함하는 컴퓨터.
  108. 제89항에 있어서,
    상기 복수개의 세포 요소 중에서 하나의 세포 요소는 mRNA, cRNA 또는 cDNA 인 것을 특징으로 하는 컴퓨터.
  109. 제89항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 핵산 또는 리보핵산이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터.
  110. 제89항에 있어서,
    상기 하나 또는 그 이상의 세포 요소에서 하나의 세포 요소는 단백질이고,
    상기 세포 요소의 상기 하나 또는 그 이상의 특징에서 하나의 특징은 상기 테스트 유기체 또는 상기 생물학적 테스트 표본에서 상기 세포 요소의 모두 또는 일부의 전사 상태를 측정함에 의해서 얻어지는 것을 특징으로 하는 컴퓨터.
  111. 제89항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체 또는 상기 생물학적 테스트 표본으로부터 얻어진 샘플을 사용하는 세포 요소에 대한 텐덤 매스 분광 분석에 의해 수반되는 동위원소 코디드된 친화 태깅을 사용하여 결정되는 것을 특징으로 하는 컴퓨터.
  112. 제89항에 있어서,
    복수개의 세포 요소에서 하나의 세포 요소의 하나 또는 그 이상의 특징 중에서 하나의 특징은, 상기 테스트 유기체로부터 얻어진 샘플 또는 상기 생물학적 테스트 표본에서의 세포 요소의 활동 또는 후-번역 변형을 측정함에 의해서 결정되는 것을 특징으로 하는 컴퓨터.
  113. 제89항에 있어서,
    상기 생물학적 특징은 약물에 대한 민감성인 것을 특징으로 하는 컴퓨터.
  114. 제89항에 있어서,
    상기 복수 개의 모델들은 두 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  115. 제114항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  116. 제114항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포 함하는 것을 특징으로 하는 컴퓨터.
  117. 제89항에 있어서,
    상기 복수 개의 모델들은 다섯 개 또는 그 이상의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  118. 제117항에 있어서,
    상기 둘 또는 그 이상의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  119. 제117항에 있어서,
    상기 다섯 또는 그 이상의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 컴퓨터.
  120. 제89항에 있어서,
    평가를 위한 상기 명령들의 예들에 의해서 모델 스코어가 평가되는 복수개의 모델들은 2 내지 20 개의 생물학적 특징의 각각의 존재 가능성을 집합적으로 나타내는 것을 특징으로 하는 컴퓨터.
  121. 제120항에 있어서,
    상기 2 내지 20 개의 생물학적 특징에서 각각의 생물학적 특징은 암의 기원인 것을 특징으로 하는 컴퓨터.
  122. 제120항에 있어서,
    상기 2 내지 20 개의 생물학적 특징은 첫 번째 질병과 두 번째 질병을 포함하는 것을 특징으로 하는 컴퓨터.
  123. 컴퓨터 가독성 저장 매체 및
    상기 컴퓨터 가독성 저장 매체에 임배드된
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하는 데이터를 전송하기 위한 명령들; 및
    (ii) 각 모델 스코어는 복수 개의 모델 중에서 각 모델이 테스트 유기체 및 생물학적인 테스트 표본에서 어떠한 생물학적인 특징의 존재 가능성을 나타내는 모델 스코어에 의해 특징지워지는 모델에 해당되는 복수 개의 모델 스코어들을 수신하기 위한 명령들이며 여기서 상기 모델에 대한 상기 평가는 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 모델 스코어를 결정하는 것을 포함하는 복수 개의 모델 스코어들을 수신하기 위한 명령들을 포함하는 컴퓨터 프로그램 메카니즘을 포함하는 컴퓨터 시스템과 연결하여 사용하기 위한 컴퓨터 프로그램 프로덕트.
  124. 데이터를 전송하는 단계; 및
    복수개의 모델 스코어를 받는 단계를 포함하고,
    여기서 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 특징을 포함하고,
    상기 각각의 모델 스코어는 복수개의 모델중 하나의 모델에 상응하고, 상기 복수개의 모델에서의 각각의 모델은 테스트 유기체 또는 생물학적 테스트 표본에서의 생물학적 특징의 존재 가능성을 나타내는 모델 스코어에 의해서 특징지워지고, 상기 모델에 대한 평가는 상기 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소에 대한 하나 또는 그 이상의 특징을 사용하여 상기 모델 스코어를 결정하는 것을 특징으로 하는 방법.
  125. 제58항에 있어서,
    상기 생물학적 특징은 치료요법에 대한 민감성 또는 저항성인 것을 특징으로 하는 방법.
  126. 제125항에 있어서, 상기 치료요법은 약물 투여인 것을 특징으로 하는 방법.
  127. 제58항에 있어서,
    상기 생물학적 특징은 조합된 치료요법(therapy combination)에 대한 민감성 또는 저항성을 포함하는 것을 특징으로 하는 방법.
  128. 제127항에 있어서,
    상기 조합된 치료요법은 조합된 약물들의 투여인 것을 특징으로 하는 방법.
  129. 제58항에 있어서,
    상기 생물학적 특징은 질병의 전이 가능성 및 재발 가능성을 포함하는 것을 특징으로 하는 방법.
  130. 중앙 처리 유닛; 및
    상기 중앙 처리 유닛에 연결되는 메모리를 포함하며,
    여기서 상기 메모리는
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되어진 복수 개의 세포 요소들에서 각각의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델에서 하나의 모델을 평가하는 것을 위한 명령들, 여기서 상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 모델에 대한 모델 특성화를 생성하는 것이고, 상기 모델에 대한 상기 평가는 상기 복수개의 세 포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 명령들;
    (iii) 복수 개의 모델을 평가하기 위하여 일 회 이상 평가하기 위하여 상기 명령들을 반복하는 것을 위한 명령들 및
    (iv) 상기 평가를 위한 상기 명령들의 예에서 평가된 각각의 상기 모델 특성화를 커뮤니케이트시키는 것을 위한 명령들을 저장하는 것을 특징으로 하는 컴퓨터.
  131. 제130항에 있어서,
    데이터를 수신하기 위한 상기 명령들은 광범위 네트워크를 통해 리모트 컴퓨터로부터 상기 데이터를 받는 것을 위한 명령들을 포함하는 것을 특징으로 하는 컴퓨터.
  132. 제131항에 있어서,
    상기 광범위 네트워크는 인터넷인 것을 특징으로 하는 컴퓨터.
  133. 제130항에 있어서,
    상기 생물학적 샘플 군은 질병인 것을 특징으로 하는 컴퓨터.
  134. 제133항에 있어서,
    상기 질병은 암인 것을 특징으로 하는 컴퓨터.
  135. 중앙 처리 유닛; 및
    상기 중앙 처리 유닛에 연결되는 메모리를 포함하며,
    여기서 상기 메모리는
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되어진 복수 개의 세포 요소들에서 각각의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델에서 하나의 모델을 평가하는 것을 위한 명령들 여기서 상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 모델에 대한 모델 특성화를 생성하는 것이고, 상기 모델에 대한 상기 평가는 상기 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 명령들; 및
    (iii) 상기 평가를 위한 상기 명령들에 의해서 평가된 각각의 상기 모델 특성화를 커뮤니케이트시키는 것을 위한 명령들을 저장하는 것을 특징으로 하는 컴퓨터.
  136. 컴퓨터 가독성 저장 매체 및 상기 컴퓨터 가독성 저장 매체에 임배드된 컴퓨터 프로그램 메카니즘을 포함하며,
    여기서 컴퓨터 프로그램 메카니즘은
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되어진 복수 개의 세포 요소들에서 각각의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델에서 하나의 모델을 평가하는 것을 위한 명령들 여기서 상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 모델에 대한 모델 특성화를 생성하는 것이고, 여기서 상기 모델에 대한 상기 평가는 상기 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 명령들;
    (iii) 복수 개의 모델을 평가하기 위하여 일 회 이상 평가하기 위하여 상기 명령들을 반복하는 것을 위한 명령들 및
    (iv) 상기 평가를 위한 상기 명령들의 예에서 평가된 각각의 상기 모델 특성화를 커뮤니케이트시키는 것을 위한 명령들을 포함하는 컴퓨터 시스템과 연결하여 사용하기 위한 컴퓨터 프로그램 프로덕트.
  137. 컴퓨터 가독성 저장 매체 및 상기 컴퓨터 가독성 저장 매체에 임배드된 컴퓨 터 프로그램 메카니즘을 포함하며,
    여기서 컴퓨터 프로그램 메카니즘은
    (i) 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되어진 복수 개의 세포 요소들에서 각각의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 포함하는 데이터를 수신하기 위한 명령들;
    (ii) 복수 개의 모델에서 하나의 모델을 평가하는 것을 위한 명령들 여기서 상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 모델에 대한 모델 특성화를 생성하는 것이고, 여기서 상기 모델에 대한 상기 평가는 상기 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 명령들; 및
    (iii) 상기 평가를 위한 상기 명령들에 의해서 평가된 각각의 상기 모델 특성화를 커뮤니케이트시키는 것을 위한 명령들을 포함하는 컴퓨터 시스템과 연결하여 사용하기 위한 컴퓨터 프로그램 프로덕트.
  138. 데이터를 수신하는 단계;
    복수 개의 모델 중에서 하나의 모델을 평가하는 단계;
    상기 복수 개의 모델들을 평가하기 위하여 상기 평가 단계를 반복하는 단계; 및
    상기 평가 단계의 하나의 예에서 평가된 각각의 모델 특성화를 커뮤니케이트시키는 단계를 포함하며,
    여기서 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적 상태의 양상을 포함하고,
    상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 모델에 대한 모델 특성화를 생성하는 것이고, 여기서 상기 모델에 대한 상기 평가는 상기 복수개의 세포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 방법.
  139. 데이터를 수신하는 단계;
    복수 개의 모델을 평가하는 단계; 및
    평가된 상기 각각의 모델 특성화를 커뮤니케이트시키는 단계를 포함하며
    여기서 상기 데이터는 하나의 종의 테스트 유기체 또는 그 종의 유기체로부터의 생물학적 테스트 표본에서 측정되는 복수 개의 세포 요소들에서 각각의 세포 요소에 대한 하나 또는 그 이상의 생물학적 상태의 양상을 포함하고,
    상기 평가는 상기 종의 상기 테스트 유기체 또는 상기 종의 상기 유기체로부터의 생물학적 테스트 표본이 생물학적 샘플 군에 속하는지를 나타내는 복수 개 의 모델 중에서 각각의 모델에 대한 모델 특성화를 생성하는 것이고, 상기 평가는 상기 복수 개의 세포 요소에서 하나 또는 그 이상의 세포 요소의 생물학적 상태의 하나 또는 그 이상의 양상을 사용하여 상기 복수 개의 모델 중에서 각각의 모델을 특성화하는 것을 포함하는 것을 특징으로 하는 방법.
KR1020067008396A 2003-09-29 2004-09-29 생물학적 특징의 탐지 시스템 및 생물학적 특징 탐지 방법 KR20060120063A (ko)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US50738103P 2003-09-29 2003-09-29
US50744503P 2003-09-29 2003-09-29
US60/507,381 2003-09-29
US60/507,445 2003-09-29
US10/861,177 2004-06-04
US10/861,177 US8321137B2 (en) 2003-09-29 2004-06-04 Knowledge-based storage of diagnostic models
US10/861,216 2004-06-04
US10/861,216 US20050069863A1 (en) 2003-09-29 2004-06-04 Systems and methods for analyzing gene expression data for clinical diagnostics
US57741604P 2004-06-05 2004-06-05
US60/577,416 2004-06-05

Publications (1)

Publication Number Publication Date
KR20060120063A true KR20060120063A (ko) 2006-11-24

Family

ID=34382268

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067008396A KR20060120063A (ko) 2003-09-29 2004-09-29 생물학적 특징의 탐지 시스템 및 생물학적 특징 탐지 방법

Country Status (8)

Country Link
US (3) US20050071087A1 (ko)
EP (2) EP1671121A4 (ko)
JP (2) JP2007507770A (ko)
KR (1) KR20060120063A (ko)
AU (1) AU2004285103A1 (ko)
CA (1) CA2540167A1 (ko)
IL (1) IL174599A0 (ko)
WO (1) WO2005042760A2 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7755757B2 (en) * 2007-02-14 2010-07-13 Chemimage Corporation Distinguishing between renal oncocytoma and chromophobe renal cell carcinoma using raman molecular imaging
US7956996B2 (en) * 2007-02-14 2011-06-07 Chemimage Corporation Distinguishing between invasive ductal carcinoma and invasive lobular carcinoma using raman molecular imaging
US20050069863A1 (en) * 2003-09-29 2005-03-31 Jorge Moraleda Systems and methods for analyzing gene expression data for clinical diagnostics
US8321137B2 (en) 2003-09-29 2012-11-27 Pathwork Diagnostics, Inc. Knowledge-based storage of diagnostic models
WO2005042760A2 (en) 2003-09-29 2005-05-12 Pathwork Informatics, Inc. Systems and methods for detecting biological features
US8135595B2 (en) * 2004-05-14 2012-03-13 H. Lee Moffitt Cancer Center And Research Institute, Inc. Computer systems and methods for providing health care
JP2008541701A (ja) * 2005-05-04 2008-11-27 ユニヴァーシティ オブ サウス フロリダ がんの対象における処置応答の予測
CA2653513C (en) 2006-05-25 2015-03-31 Elminda Ltd. Neuropsychological spatiotemporal pattern recognition
US20140214730A9 (en) * 2007-02-05 2014-07-31 Goded Shahaf System and method for neural modeling of neurophysiological data
RU2010101093A (ru) * 2007-06-15 2011-07-20 Юниверсити Оф Саут Флорида (Us) Способы диагностики и лечения рака
CN101329348A (zh) * 2007-06-18 2008-12-24 许洋 检测胃癌特征蛋白的优化质谱模型及其制备方法和应用
EP2227725A4 (en) * 2007-11-29 2013-12-18 Elminda Ltd CLINICAL APPLICATIONS OF MODELING AND ANALYSIS OF NEUROPSYCHOLOGICAL DATA MODELS
US9168173B2 (en) 2008-04-04 2015-10-27 Truevision Systems, Inc. Apparatus and methods for performing enhanced visually directed procedures under low ambient light conditions
US10117721B2 (en) 2008-10-10 2018-11-06 Truevision Systems, Inc. Real-time surgical reference guides and methods for surgical applications
US9226798B2 (en) 2008-10-10 2016-01-05 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for surgical applications
US9173717B2 (en) 2009-02-20 2015-11-03 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for intraocular lens implantation
EP2430579A2 (en) * 2009-05-11 2012-03-21 Koninklijke Philips Electronics N.V. Device and method for comparing molecular signatures
US8784443B2 (en) 2009-10-20 2014-07-22 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for astigmatism correction
WO2011119868A2 (en) * 2010-03-24 2011-09-29 Nodality, Inc. Hyper-spatial methods for modeling biological events
JP5631682B2 (ja) * 2010-09-30 2014-11-26 オリンパス株式会社 顕微鏡システムおよび配信システム
AU2013266419B2 (en) * 2012-05-22 2018-09-27 British Columbia Cancer Agency Branch NANO46 genes and methods to predict breast cancer outcome
CA2883498C (en) * 2012-08-30 2022-05-31 Truevision Systems, Inc. Imaging system and methods displaying a fused multidimensional reconstructed image
JP6164135B2 (ja) * 2014-03-27 2017-07-19 株式会社豊田自動織機 圧縮機
FR3024546B1 (fr) * 2014-07-29 2018-08-24 Universite De Reims Champagne-Ardenne Procede de detection et de quantification de la fibrose
US10917543B2 (en) 2017-04-24 2021-02-09 Alcon Inc. Stereoscopic visualization camera and integrated robotics platform
US11083537B2 (en) 2017-04-24 2021-08-10 Alcon Inc. Stereoscopic camera with fluorescence visualization
US10299880B2 (en) 2017-04-24 2019-05-28 Truevision Systems, Inc. Stereoscopic visualization camera and platform
EP3970152A4 (en) 2019-05-14 2023-07-26 Tempus Labs, Inc. MULTI-LABEL CANCER CLASSIFICATION SYSTEMS AND METHODS
CN111639203B (zh) * 2020-05-28 2023-07-07 神华包神铁路集团有限责任公司 隧道病害定位方法、装置、计算机设备和存储介质
WO2022260740A1 (en) 2021-06-10 2022-12-15 Alife Health Inc. Machine learning for optimizing ovarian stimulation

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5545522A (en) 1989-09-22 1996-08-13 Van Gelder; Russell N. Process for amplifying a target polynucleotide sequence using a single primer-promoter complex
PT969102E (pt) 1991-09-24 2008-03-25 Keygene Nv Iniciadores, grupos e conjuntos de fragmentos de restrição usados na amplificação selectiva de fragmentos de restrição
US6389305B1 (en) * 1993-12-15 2002-05-14 Lifeline Biotechnologies, Inc. Method and apparatus for detection of cancerous and precancerous conditions in a breast
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
US5539083A (en) 1994-02-23 1996-07-23 Isis Pharmaceuticals, Inc. Peptide nucleic acid combinatorial libraries and improved methods of synthesis
US5989811A (en) 1994-09-29 1999-11-23 Urocor, Inc. Sextant core biopsy predictive mechanism for non-organ confined disease status
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
EP0880598A4 (en) * 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
US6303301B1 (en) 1997-01-13 2001-10-16 Affymetrix, Inc. Expression monitoring for gene function identification
WO1998041531A2 (en) 1997-03-20 1998-09-24 University Of Washington Solvent for biopolymer synthesis, solvent microdroplets and methods of use
US6028189A (en) 1997-03-20 2000-02-22 University Of Washington Solvent for oligonucleotide synthesis and methods of use
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
US6912524B2 (en) 1998-05-20 2005-06-28 Lucent Technologies, Inc. Join synopsis-based approximate query answering
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6263287B1 (en) 1998-11-12 2001-07-17 Scios Inc. Systems for the analysis of gene expression data
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
US6351712B1 (en) 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
US20020115070A1 (en) 1999-03-15 2002-08-22 Pablo Tamayo Methods and apparatus for analyzing gene expression data
US7324926B2 (en) 1999-04-09 2008-01-29 Whitehead Institute For Biomedical Research Methods for predicting chemosensitivity or chemoresistance
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
US6502039B1 (en) 2000-05-24 2002-12-31 Aventis Pharmaceuticals Mathematical analysis for the estimation of changes in the level of gene expression
US6132997A (en) 1999-05-28 2000-10-17 Agilent Technologies Method for linear mRNA amplification
US6505125B1 (en) 1999-09-28 2003-01-07 Affymetrix, Inc. Methods and computer software products for multiple probe gene expression analysis
US6271002B1 (en) 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method
US20010049393A1 (en) 1999-12-07 2001-12-06 Whitehead Institute For Biomedical Research Methods for defining MYC target genes and uses thereof
US20010044414A1 (en) 1999-12-10 2001-11-22 Whitehead Institute For Biomedical Research Metastasis genes and uses thereof
JP2002063278A (ja) * 2000-08-22 2002-02-28 Shotaro Katsuki 健康度評価システム及びその記録媒体並びに健康度評価方法
US7105293B2 (en) 2000-09-19 2006-09-12 Whitehead Institute For Biomedical Research Genetic markers for tumors
US20030194701A1 (en) 2000-11-20 2003-10-16 Golub Todd R. Diffuse large cell lymphoma diagnosis and outcome prediction by expression analysis
EP1425413A2 (en) 2001-01-23 2004-06-09 Irm, Llc Genes overexpressed in prostate disorders as diagnostic and therapeutic targets
WO2002061144A2 (en) 2001-01-31 2002-08-08 Whitehead Institute For Biomedical Research Brain tumor diagnosis and outcome prediction
US6832069B2 (en) * 2001-04-20 2004-12-14 Educational Testing Service Latent property diagnosing procedure
CA2450379A1 (en) 2001-06-10 2002-12-19 Irm Llc Molecular signatures of commonly fatal carcinomas
US7171311B2 (en) 2001-06-18 2007-01-30 Rosetta Inpharmatics Llc Methods of assigning treatment to breast cancer patients
EP1417297A4 (en) 2001-07-13 2007-08-22 Whitehead Biomedical Inst LEUCEMIGENES TRANSCRIPTION FACTORS
US7011947B2 (en) 2001-07-17 2006-03-14 Whitehead Institute For Biomedical Research MLL translocations specify a distinct gene expression profile, distinguishing a unique leukemia
US20040110193A1 (en) 2001-07-31 2004-06-10 Gene Logic, Inc. Methods for classification of biological data
AU2002324881A1 (en) 2001-09-05 2003-03-18 Wesleyan University Diagnostic and prognostic tests
US7622260B2 (en) 2001-09-05 2009-11-24 The Brigham And Women's Hospital, Inc. Diagnostic and prognostic tests
WO2003029273A2 (en) 2001-09-28 2003-04-10 Whitehead Institute For Biomedical Research Classification of lung carcinomas using gene expression analysis
WO2003041562A2 (en) 2001-11-14 2003-05-22 Whitehead Institute For Biomedical Research Molecular cancer diagnosis using tumor gene expression signature
US20040010481A1 (en) 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Time-dependent outcome prediction using neural networks
US20040009495A1 (en) 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Methods and products related to drug screening using gene expression patterns
US6949342B2 (en) 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
US20030215835A1 (en) 2002-01-15 2003-11-20 Zairen Sun Differentially-regulated prostate cancer genes
US7774143B2 (en) * 2002-04-25 2010-08-10 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
WO2003093794A2 (en) 2002-05-01 2003-11-13 Irm Llc Methods for discovering tumor biomarkers and diagnosing tumors
US20040098367A1 (en) 2002-08-06 2004-05-20 Whitehead Institute For Biomedical Research Across platform and multiple dataset molecular classification
US20050069863A1 (en) 2003-09-29 2005-03-31 Jorge Moraleda Systems and methods for analyzing gene expression data for clinical diagnostics
US8321137B2 (en) 2003-09-29 2012-11-27 Pathwork Diagnostics, Inc. Knowledge-based storage of diagnostic models
WO2005042760A2 (en) 2003-09-29 2005-05-12 Pathwork Informatics, Inc. Systems and methods for detecting biological features

Also Published As

Publication number Publication date
WO2005042760A2 (en) 2005-05-12
JP2007507770A (ja) 2007-03-29
US8977506B2 (en) 2015-03-10
EP1671121A2 (en) 2006-06-21
EP1671121A4 (en) 2007-12-19
EP2469439A2 (en) 2012-06-27
IL174599A0 (en) 2006-08-20
US20150161327A1 (en) 2015-06-11
US20050071087A1 (en) 2005-03-31
WO2005042760A3 (en) 2005-09-09
JP2012065674A (ja) 2012-04-05
AU2004285103A1 (en) 2005-05-12
CA2540167A1 (en) 2005-05-12
US20120215514A1 (en) 2012-08-23

Similar Documents

Publication Publication Date Title
US8977506B2 (en) Systems and methods for detecting biological features
US8321137B2 (en) Knowledge-based storage of diagnostic models
Shen et al. Prognostic meta-signature of breast cancer developed by two-stage mixture modeling of microarray data
Abdullah-Sayani et al. Technology Insight: tuning into the genetic orchestra using microarrays—limitations of DNA microarrays in clinical practice
US8600718B1 (en) Computer systems and methods for identifying conserved cellular constituent clusters across datasets
JP2008536094A (ja) 乳癌患者における化学療法反応性を予測する方法
EP2419540B1 (en) Methods and gene expression signature for assessing ras pathway activity
Knudsen Cancer diagnostics with DNA microarrays
EP2406729B1 (en) A method, system and computer program product for the systematic evaluation of the prognostic properties of gene pairs for medical conditions.
US20050069863A1 (en) Systems and methods for analyzing gene expression data for clinical diagnostics
Elvidge Microarray expression technology: from start to finish
Lee et al. A novel immune prognostic index for stratification of high-risk patients with early breast cancer
Futschik et al. The human transcriptome: implications for understanding, diagnosing, and treating human disease
Gormley et al. Prediction potential of candidate biomarker sets identified and validated on gene expression data from multiple datasets
Nagarajan et al. An approach for deciphering patient-specific variations with application to breast cancer molecular expression profiles
Sontrop et al. A comprehensive sensitivity analysis of microarray breast cancer classification under feature variability
CN1886658A (zh) 用于检测生物学特征的系统和方法
Vinaya et al. Comparison of feature selection and classification combinations for cancer classification using microarray data
Ahdesmaeki et al. Model selection for prognostic time-to-event gene signature discovery with applications in early breast cancer data
Rueda Introduction to Microarrays
Goldstein et al. Calling Rare Variants from Genotype Data
Kim et al. Standardized genetic alteration score and predicted score for predicting recurrence status of gastric cancer
Starmans et al. Microarray-Based Investigations in Cancer
Kaindl et al. Molecular Tools, Expression Profiling
Aris Non-parametric algorithms for evaluating gene expression in cancer using DNA microarray technology

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid