KR101720555B1 - 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침 - Google Patents
이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침 Download PDFInfo
- Publication number
- KR101720555B1 KR101720555B1 KR1020117025261A KR20117025261A KR101720555B1 KR 101720555 B1 KR101720555 B1 KR 101720555B1 KR 1020117025261 A KR1020117025261 A KR 1020117025261A KR 20117025261 A KR20117025261 A KR 20117025261A KR 101720555 B1 KR101720555 B1 KR 101720555B1
- Authority
- KR
- South Korea
- Prior art keywords
- cancer
- mitochondrial
- transcript
- fusion
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4748—Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57484—Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Biophysics (AREA)
- Hospice & Palliative Care (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Engineering & Computer Science (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 암을 예견, 진단 및/또는 모니터하기 위한 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자, 및 생성되는 번역 산물(단백질)을 제공한다. 본 발명의 방법에 사용하기 위한 상기에 상보성인 하이브리드화 탐침을 또한 제공한다.
Description
선행 출원에 대한 상호 참조
본 출원은 2009년 3월 27일자로 출원된 PCT 출원 제 PCT/CA2009/000351 호의 일부 계속 출원이며, 이는 2008년 3월 28일자로 출원된 미국 가 출원 제 61/040,616 호로부터 우선권을 청구한다. 상기와 같은 선행 출원들의 전체 내용은 본 발명에 참고로 인용된다.
발명의 분야
본 발명은 미토콘드리아 유전체학 및 단백질체학의 분야에 관한 것이다. 하나의 태양에서, 본 발명은 미토콘드리아 게놈 융합 전사물 및 번역 산물뿐만 아니라 이에 하이브리드화하는 탐침의 확인 및 용도에 관한 것이다.
미토콘드리아 게놈
미토콘드리아 게놈은 핵산의 작지만 중요한 서열이다. 미토콘드리아 DNA, 또는 "mtDNA"는 33억 bp(반수체)의 광대한 핵 게놈과 대조적으로 16,569 핵산 염기쌍(bp)의 작은 게놈(Anderson et al., 1981; Andrews et al., 1999)을 포함한다. 그의 유전자 보체는 그의 핵 세포 짝의 경우보다 실질적으로 더 적다(0.0005%). 그러나, 개별적인 세포들은 어디에서나 특정한 세포 작용에 따라 103 내지 104 개의 미토콘드리아를 가지고 있다(Singh and Modica-Napolitano 2002). 상기 핵과 미토콘드리아 게놈 간에는 연통 또는 화학적 신호전달이 통상적으로 일어난다(Sherratt et al., 1997). 더욱이, 특정 핵 성분들이 미토콘드리아 서열의 유지 및 보전에 기여한다(Croteau et al., 1999). 주어진 개체 중의 모든 mtDNA 게놈들은 일단 수정이 일어나면 난자 내에서 미토콘드리아의 클론 확장으로 인해 동일하다. 그러나, 돌연변이 유발 사건들은 체세포 돌연변이로서 반영되는 서열 다양성을 유도할 수 있다. 이러한 돌연변이는 이종조직성으로서 공지된 조건에서 몸 전체를 통해 상이한 조직에 축적될 수도 있다.
미토콘드리아 프로테옴
약 3,000 개의 핵 유전자가 미토콘드리아를 구성하고, 작동시키고 유지시키는데 필요하며, 이들 중 단지 37 개만이 미토콘드리아 게놈에 의해 암호화되는데, 이는 핵 유전자 좌에 대한 강한 미토콘드리아 의존성을 가리킨다. 상기 미토콘드리아 게놈은 24 개 유전자의 보체를 암호화하며, 전자 전달에 지극히 중요한 나머지 13 개 유전자의 정확한 번역을 보장하는 2rRNA 및 22tRNA를 포함한다(도 1 참조). 상기 미토콘드리아 게놈은 상기 미토콘드리아 게놈에 의해 공급된 13 개 폴리펩타이드 이외에, 상기 지극히 중요한 작용에 필요한 산화 및 환원 반응을 수행하기 위해 70 개의 핵 암호화된 단백질에 의존한다. 핵 및 미토콘드리아 단백질은 모두 내부 미토콘드리아 막에 걸쳐 있는 복합체들을 형성하며 집합적으로, 세포 대사에 필요한 화학 연료 아데노신 트라이포스페이트 또는 ATP의 80 내지 90%를 생성시킨다. 에너지 생산 이외에, 미토콘드리아는 다른 대사 경로에도 또한 중추적인 역할을 한다. 상기 미토콘드리아의 중요한 기능은 세포 사 또는 세포사멸의 중재이다(Green and Kroemer, 2005 참조). 본질적으로, 외부 미토콘드리아 막, 또는 또한 내부 미토콘드리아 막을 또한 투과성으로 만드는 신호 경로들이 존재한다. 특정한 미토콘드리아 단백질이 시토졸 내로 방출되면, 비가역적인 세포 사에 시동이 걸린다. 이러한 과정은 일부 미토콘드리아 단백질들이 갖는 다기능 역할을 강조한다. 이들 다중작업 단백질들은 교체 기능을 가질 수도 있는 다른 미토콘드리아 단백질들이 또한 존재함을 암시한다.
미토콘드리아 융합
전사체
/프로테옴
미토콘드리아 게놈은 원형의, 인트론이 없는 DNA 분자라는 점에서 특이하다. 상기 게놈에는 특정한 길이의 서열들과 접하고 있는 반복 동기들이 산재하여 있다. 이들 반복부 사이의 서열은 잘 이해되지 않은 상황 하에서 결실되기 쉽다. 상기 미토콘드리아 게놈 중의 반복부의 번호가 제공되는 경우, 다수의 가능한 결실들이 존재한다. 가장 잘 알려진 예가 4977 "공통 결실"이다. 상기 결실은 여러 가지 소문난 병 및 질병들과 관련되었으며 노화에 따라 빈도가 증가하는 것으로 여겨진다(Dai et al., 2004; Ro et al., 2003; Barron et al., 2001; Lewis et al., 2000; Muller-Hocker, 1998; Porteous et al., 1988)(도 4). 미토콘드리아 게놈학 분야의 현재의 생각은 미토콘드리아 결실은 단지 반응성 산소 종 및 UVR과 같은 작용제들에 의한 상기 미토콘드리아 게놈에 대한 손상의 유해 부산물이라는 것이다(Krishnan et al 2008, Nature Genetics). 더욱이, 높은 수준의 mtDNA 결실은 세포 호흡에 필요한 유전자 서열의 누락의 결과로서 ATP 형태의 에너지를 생산하는 세포의 능력에 심한 영향을 미칠 수 있음이 인식되고 있지만, 이들 결실된 미토콘드리아 분자가, 하부 경로의 요소일 수도 있고 의도하는 기능 역할을 가지며 가능하게는 상기 미토콘드리아의 인지된 유전자의 또 다른 천연 형태로서 보다 적합하게 간주될 수 있을 것으로는 예상되지 않는다.
mtDNA의 서열 역학은 중요한 진단 도구이다. mtDNA의 돌연변이는 종종 발병의 예비 지표이다. 예를 들어, 미토콘드리아 게놈 중의 점 돌연변이는 전립선 중의 종양 유전자 좌의 특징인 것으로 입증되었다. 이러한 성향은 종양 조직에 인접한 및 상기 조직에서 떨어져 있는 정상으로 보이는 조직까지 확장된다(Parr et al. 2006). 이는 미토콘드리아 돌연변이가 악성 형질전환 경로의 초기에 존재함을 암시한다.
예를 들어, 3.4 kb 미토콘드리아 결실의 빈도는 양성과 악성 전립선 조직을 식별하는데 탁월한 유용성을 갖는다(Maki et al., 2008). 더욱 또한, 상기 질병 관련된 결실, 및 상기 분자의 재-폐쇄를 통해 생성된 신규 서열에 대한 연구는 다수의 개방 판독 프레임들을 확인하며, 이는 독특한 미토콘드리아 융합 단백질들의 가능성을 암시한다.
미토콘드리아 융합 전사물은 앞서 문헌에서, 먼저 대두 중에서(Morgens et al. 1984) 및 이어서 나중에 희귀 신경근 장애인 컨즈-세이레 증후군에 관한 2 개의 특허(Nakase et al 1990)에서 보고되었다. 중요하게는, 이들 전사물은 어떠한 인간 암과도 관련이 있지 않은(또는 상기에 관해 조사되지 않은) 것으로 밝혀졌다.
핵 융합 프로테옴
융합 단백질 및 암에 대한 이의 생성 효과에 대한 중요한 핵 선행이 존재한다. 핵 MLL 유전자 짝 전좌는 국소이성화효소 II를 표적화하는 작용제에 의한 치료에 따른 고 위험 급성 백혈병 및 치료 관련된 급성 골수성 백혈병과 관련하여 잘 확립되어 있다(Libura et al., 2005). 현재 인간 MLL 유전자의 대략 50 개의 전좌가 이들 암과 관련되는 것으로 알려져 있다(Meyer et al., 2005). 이들 돌연변이에 대한 중지점은, 부분적인 직렬 중복이든 전좌든 간에, 이들 사건의 대부분의 경우, Alu I와 같은 핵 특이적인 반복성 동기 내에 존재한다. 이들 돌연변이의 대부분은 상호 전좌이며(84%) 약 40 개의 상이한 유전자를 포함한다(Libura et al. 2005).
악성 질병의 과정에 영향을 미치는 상기 재배열 중 일부로부터 생성되는 공지된 작용성 키메릭 단백질들이 존재한다. 예를 들어, MLL-ENL로부터의 단백질을 발현하는 쥐 세포는 에토포시드에의 노출에 생존하는 세포에서 염색체 이상의 보급을 가속화한다(Eguchi et al., 2006). 특히 흥미로운 것은 MLL-SMAP1 및 상호 SMAP1-MLL이다. SMAP1은 칼슘과 결합하며 그 자체로서 세포 신호전달 및 수송에 참여한다.
미토콘드리아 융합 단백질들은, 특히 미토콘드리아 및 미토콘드리아 단백질이 신호전달 및 세포사멸에서 유사한 역할을 수행하기 때문에, 핵 융합 단백질들과 유사한 특성을 갖는 것으로 추정될 수 있다.
본 발명의 목적은 이상 미토콘드리아 DNA, 관련된 융합 전사물 및 번역 산물, 및 이에 대한 하이브리드화 탐침을 제공하는 것이다.
본 발명의 하나의 태양에 따라, 암과 관련된 단리된 미토콘드리아 융합 전사물을 제공한다.
본 발명의 또 다른 태양에 따라, 본 발명의 융합 전사물을 암호화하는 단리된 mtDNA를 제공한다.
본 발명의 또 다른 태양에 따라, 본 발명의 미토콘드리아 융합 전사물 또는 mtDNA의 적어도 일부에 상보성인 핵산 서열을 갖는 하이브리드화 탐침을 제공한다.
본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 본 발명에 따른 미토콘드리아 융합 전사물의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 암과 관련된 하나 이상의 미토콘드리아 융합 전사물의 존재를 분석함을 포함한다.
본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 본 발명에 따른 mtDNA의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 암과 관련된 하나 이상의 이상 mtDNA의 존재를 분석함을 포함한다.
본 발명의 또 다른 태양에 따라, 포유동물의 암의 존재를 검출하기 위한 분석을 수행하기 위한 키트를 제공하며, 상기 키트는 본 발명의 융합 전사물 또는 mtDNA의 적어도 일부에 상보성인 하나 이상의 하이브리드화 탐침을 포함한다.
본 발명의 또 다른 태양에 따라, 미토콘드리아 융합 단백질을 제공하며, 상기 단백질은 본 발명의 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는다.
본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함하고, 상기 단백질은 본 발명에 따른 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는다.
본 발명은 미토콘드리아 DNA 중 돌연변이에 상응하는 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는, 단리된 미토콘드리아 융합 단백질을 제공한다.
또한 본 발명은 포유동물에게서 암을 검출하는 방법으로서, 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함하고, 상기 단백질이 DNA 중 돌연변이에 상응하는 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는 방법을 제공한다.
본 발명은 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자 및 생성되는 번역 산물을 이용하여 암를 예견하거나 암의 진단 또는 모니터가 가능한 효과가 있다.
또한 본 발명은 하이브리드화 탐침을 이용하여 융합 전사물 및 관련된 mtDNA 분자를 검출할 수 있는 효과가 있다.
이제 본 발명의 실시태양들을 첨부된 도면을 단지 참고로 하여 예로서 개시할 것이며, 도면에서:
도 1은 미토콘드리아 단백질 암호화 유전자들을 나타내는 도해이다.
도 2는 3.4 kb 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 3은 4977 kb 공통 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 4는 상기 mt게놈으로부터의 3.4 kb 분절의 상실에 의해 촉발된 유방 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 5a 및 5b는 유전자들의 연접(splicing) 전후의 미토콘드리아 DNA 영역의 예를 나타낸다.
도 6a 내지 6g는 결장직장 암 종양의 확인에서 본 발명의 전사물 2, 3, 8, 9, 10, 11 및 12의 결과를 예시한다.
도 7a 내지 7d는 폐암 종양의 확인에서 본 발명의 전사물 6, 8, 10 및 20의 결과를 예시한다.
도 8a 내지 8g는 흑색종의 확인에서 본 발명의 전사물 6, 10, 11, 14, 15, 16 및 20의 결과를 예시한다.
도 9a 내지 9h는 난소암의 확인에서 본 발명의 전사물 1, 2, 3, 6, 11, 12, 15 및 20의 결과를 예시한다.
도 10 내지 18은 고환 암의 확인에서 본 발명의 전사물 2, 3, 4, 11, 12, 13, 15, 16 및 20의 결과를 예시한다.
도 19는 융합 단백질 발견 단계 중에 수행된 RWPE1 및 WPE1-NA22 세포 주의 시토졸 및 미토콘드리아 분획의 SDS PAGE 젤을 예시한다.
도 20a는 펩타이드 ILYMTDEVNDPSLTIK 및 STPYECGFDPMSP를 기본으로 하는 융합 전사물 P0026의 확인된 단백질을 예시한다.
도 20b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 5에서 확인된 야생형 CO2 단백질을 예시한다.
도 21a는 펩타이드 KGPNVVGPYGLLQPFADAMK, YDQLMHLLWK 및 LITTQQWLIK를 기본으로 하는 융합 전사물 P0062의 확인된 단백질을 예시한다.
도 21b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 젤 조각 5에서 확인된 ND1의 확인된 펩타이드를 예시한다.
도 22는 펩타이드 KGPNVVGPYGLLQPFADAMK 및 WAIIEEFTK를 기본으로 하는 융합 전사물 P0064의 확인된 단백질을 예시한다.
도 23a는 펩타이드 KGPNVVGPYGLLQPFADAMK, VFSWLATLHGSNMK 및 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK를 기본으로 하는 융합 전사물 P0176의 확인된 단백질을 예시한다.
도 23b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 4에서 확인된 야생형 CO1 단백질을 예시한다.
도 24a 내지 24d는 각각 융합 전사물 P0026, P0062, P0064 및 P0176의 정량적인 측정의 결과를 예시한다.
도 1은 미토콘드리아 단백질 암호화 유전자들을 나타내는 도해이다.
도 2는 3.4 kb 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 3은 4977 kb 공통 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 4는 상기 mt게놈으로부터의 3.4 kb 분절의 상실에 의해 촉발된 유방 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 5a 및 5b는 유전자들의 연접(splicing) 전후의 미토콘드리아 DNA 영역의 예를 나타낸다.
도 6a 내지 6g는 결장직장 암 종양의 확인에서 본 발명의 전사물 2, 3, 8, 9, 10, 11 및 12의 결과를 예시한다.
도 7a 내지 7d는 폐암 종양의 확인에서 본 발명의 전사물 6, 8, 10 및 20의 결과를 예시한다.
도 8a 내지 8g는 흑색종의 확인에서 본 발명의 전사물 6, 10, 11, 14, 15, 16 및 20의 결과를 예시한다.
도 9a 내지 9h는 난소암의 확인에서 본 발명의 전사물 1, 2, 3, 6, 11, 12, 15 및 20의 결과를 예시한다.
도 10 내지 18은 고환 암의 확인에서 본 발명의 전사물 2, 3, 4, 11, 12, 13, 15, 16 및 20의 결과를 예시한다.
도 19는 융합 단백질 발견 단계 중에 수행된 RWPE1 및 WPE1-NA22 세포 주의 시토졸 및 미토콘드리아 분획의 SDS PAGE 젤을 예시한다.
도 20a는 펩타이드 ILYMTDEVNDPSLTIK 및 STPYECGFDPMSP를 기본으로 하는 융합 전사물 P0026의 확인된 단백질을 예시한다.
도 20b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 5에서 확인된 야생형 CO2 단백질을 예시한다.
도 21a는 펩타이드 KGPNVVGPYGLLQPFADAMK, YDQLMHLLWK 및 LITTQQWLIK를 기본으로 하는 융합 전사물 P0062의 확인된 단백질을 예시한다.
도 21b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 젤 조각 5에서 확인된 ND1의 확인된 펩타이드를 예시한다.
도 22는 펩타이드 KGPNVVGPYGLLQPFADAMK 및 WAIIEEFTK를 기본으로 하는 융합 전사물 P0064의 확인된 단백질을 예시한다.
도 23a는 펩타이드 KGPNVVGPYGLLQPFADAMK, VFSWLATLHGSNMK 및 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK를 기본으로 하는 융합 전사물 P0176의 확인된 단백질을 예시한다.
도 23b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 4에서 확인된 야생형 CO1 단백질을 예시한다.
도 24a 내지 24d는 각각 융합 전사물 P0026, P0062, P0064 및 P0176의 정량적인 측정의 결과를 예시한다.
본 발명은 암의 예견, 진단 및/또는 모니터에 유용한 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자, 및 생성되는 번역 산물을 제공한다. 본 발명은 또한 융합 전사물 및 관련된 mtDNA 분자의 검출을 위한 하이브리드화 탐침 및 상기와 같은 탐침의 용도를 제공한다.
정의
달리 나타내지 않는 한, 본 발명에 사용된 모든 기술 및 과학 용어들은 본 발명이 속하는 분야의 통상적인 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다.
"포함하다", "포함된" 또는 "포함하는"이란 용어를 본 설명에 사용할 수 있다. 본 발명(명세서 및/또는 청구의 범위 포함)에 사용된 바와 같이, 이들 용어는 진술된 특징, 정수, 단계 또는 성분들의 존재를 명시하는 바와 같이 해석해야 하며, 관련 분야의 통상적인 숙련가에게 자명한 바와 같은 하나 이상의 다른 특징, 정수, 단계, 성분 또는 그의 그룹을 제외하는 것으로서 해석해서는 안 된다.
본 발명에 사용된 바와 같이, "이상" 또는 "돌연변이"는 융합 전사물을 생성시키는 야생형 미토콘드리아 DNA 서열의 임의의 변경을 포함하며, 비 제한적으로 삽입, 전좌, 결실, 중복, 재조합, 재배열 또는 이들의 조합을 포함한다.
본 발명에 정의된 바와 같이, "생물학적 샘플"은 관심 분자를 수득할 수 있는 세포를 함유하는 조직 또는 체액을 지칭한다. 예를 들어, 상기 생물학적 샘플은 전립선, 유방, 결장직장, 폐 및 피부와 같은 조직으로부터, 또는 혈액, 타액, 뇌척수액, 객담, 뇨, 점액, 활액, 복막 액, 양수 등으로부터 유래할 수 있다. 상기 생물학적 샘플은 외과적 시편 또는 생검 시편일 수 있다. 상기 생물학적 샘플을 공급원으로부터 수득된 대로 바로 또는 상기 샘플의 특징을 변경시키기 위한 전-처리에 이어서 사용할 수 있다. 따라서, 상기 생물학적 샘플을 사용 전에, 예를 들어 혈액으로부터 혈장 또는 혈청을 제조하고, 세포를 파괴하고, 고형 물질로부터 액체를 제조하고, 점성 유체를 희석하고, 액체를 여과하고, 액체를 증류시키고, 액체를 농축시키고, 방해 성분들을 불활성화시키고, 시약을 첨가함 등에 의해 전-처리할 수 있다.
"연속적인" 전사물은 판독 프레임을 양쪽 연접된 유전자들의 시작에서부터 단부까지 유지하는 융합 전사물이다. "단부" 전사물은 두 번째 연접된 유전자의 원래 종결 코돈 앞에 조기 종결 코돈을 생성시키는 융합 전사물이다.
본 발명에 사용된 바와 같이, "미토콘드리아 DNA" 또는 "mtDNA"는 미토콘드리아 중에 존재하는 DNA이다.
본 발명에 사용된 바와 같이, "미토콘드리아 융합 단백질" 또는 "융합 단백질"이란 표현은 돌연변이된 미토콘드리아 DNA의 전사 및 번역에 의해 생성된 펩타이드 산물을 지칭하며, 여기에서 상기와 같은 돌연변이는 결실 또는 다른 "대규모" 미토콘드리아 DNA 재배열을 포함한다. 또한, 또는 한편으로, 인-프레임 단백질은 상기 서열 내에 또 다른 초기 및 종결 코돈으로부터 번역될 수도 있다.
본 발명에 사용된 바와 같이, "미토콘드리아 융합 전사물" 또는 "융합 전사물"이란 표현은 돌연변이된 미토콘드리아 DNA 서열의 전사의 결과로서 생성된 RNA 전사 산물을 지칭하며, 여기에서 상기와 같은 돌연변이는 결실 및 다른 대규모 미토콘드리아 DNA 재배열을 포함할 수 있다.
본 발명에 사용된 바와 같이, "미토콘드리아 번역 산물" 또는 "번역 산물"이란 표현은 펩타이드, 폴리펩타이드 및 단백질을 포함하여 미토콘드리아 융합 전사물로부터 유도된 임의의 아미노산 쇄를 지칭한다. "미토콘드리아 번역 산물"이 상기 정의한 바와 같이, "융합 단백질"을 포함함을 알 것이다.
컴퓨터 분석 및 서열
표적화
상기 논의된 바와 같이, 미토콘드리아 융합 전사물은 대두(Morgens et al. 1984) 및 희귀 신경근 질환을 앓고 있는 인간(Nakase et al 1990)에서 보고되었다. 그러나 인간 암과 관련된 융합 전사물들은 개시되지 않았다.
암과 관련된 인간 미토콘드리아 게놈의 대규모 결실을 지도화함으로써 얻은 지식, 상기 결실의 높은 빈도의 관찰, 및 또 다른 유기체 및 또 다른 질병 유형에서 전사적으로 활성인 돌연변이된 mtDNA 분자의 증거를 사용하여, 본 발명자들은 상기와 같은 결실이 암과 관련이 있으므로 상기 DNA 분자 및 손상 및 복원 과정 외에 중요성을 가질 수도 있다는 가설을 세웠다. 이러한 가설을 시험하기 위해서, 다수의 잠재적인 결실 부위들을 암시하는 반복 요소들에 특이적인 상기 미토콘드리아 게놈의 컴퓨터 분석을 수행하였다. 비-인접 또는 비-직렬 배치를 갖는 미토콘드리아 서열 중의 독특한 반복부를 확인하는 상기 초기 단계에 이어서, 필터를 적용하여, 상기 DNA 분자의 결실 사건이 개시될 때 개방 판독 프레임(ORF)을 갖는 융합된 DNA 서열을 생성하도록 재폐쇄 또는 재연결하는 듯하고 따라서 상기 미토콘드리아 전사 기구에 의해 전사될 수 있는 반복부들을 확인하였다. 이어서 이들 분자 중 18 개의 부분집합을, 이들이 인간의 타고난 생물학적 상태로 존재하는지; 이들이 폴리아데닐화되고 따라서 단백질 합성으로 진행할 것이 예상되는지; 이들이 암과 관련성을 갖는지를 조사하기 위한 표적화를 위해 선택하였다. 이들 조사로부터의 결과는 3 개의 질문 모두에 대한 긍정을 입증하였으며 이를 이후에 개시한다.
게놈 돌연변이
미토콘드리아 DNA(mtDNA) 역학은 중요한 진단 도구이다. mtDNA의 돌연변이는 종종 발병의 예비 지표이며 질병 개시와 관련된 위험 인자들을 가리키는 생물마커로서 작용할 수도 있다. 본 발명에 따라, 상기 미토콘드리아 게놈의 돌연변이는 암과 관련된 융합 전사물을 생성시킨다. 따라서, 암의 검출, 진단 및 모니터를 위한 상기와 같은 전사물을 암호화하는 mtDNA 및 그에 대한 탐침의 용도를 제공한다.
당해 분야의 숙련가는 본 발명의 방법에 사용하기 위한 mtDNA 분자가 천연 돌연변이체의 단리를 통해 유도되거나 또는 본 발명에 개시된 융합 전사물들 중 어느 하나의 상보적인 서열을 기본으로 할 수 있음을 알 것이다. 예시적인 mtDNA 서열 및 융합 전사물들은 출원인의 동시 계류중인 미국 출원 제 61/040,616 호 및 공개된 PCT 출원 제 PCT/CA2009/000351 호(WO 2009/117811로서 공개됨)에 개시되어 있다.
돌연변이 게놈 서열의 검출
본 발명에 따른 돌연변이 mtDNA 서열은 융합 전사물을 생성시키는 임의의 변경을 포함할 수 있다. 상기와 같은 변경의 비 제한적인 예로는 삽입, 전좌, 결실, 재조합, 재배열 또는 이들의 조합이 있다. 상기 변경 또는 변화가 크기에 있어서 단지 수 개의 염기에서부터 수 킬로 염기까지 매우 다양할 수 있지만, 바람직하게는 상기 변경은 상당한 결실 또는 다른 대규모 게놈 이상을 생성시킨다.
상기와 같은 돌연변이의 존재를 검출하기 위한 DNA의 추출은 당해 분야에서 인정된 방법들의 사용, 이어서 상기 미토콘드리아 게놈의 전부 또는 부분의 증폭에 의해 일어날 수 있으며, 문헌[Current Protocols in Molecular Biology]에 개시된 바와 같이, 상기 미토콘드리아 게놈의 서열화를 포함할 수도 있다.
상기 돌연변이의 검출 단계를 당해 분야에 공지된 임의의 기법으로부터 선택할 수 있다. 예를 들어 mtDNA 분석은 상기 mtDNA 서열화, PCR에 의한 mtDNA 증폭, 서던, 노던, 웨스턴 사우스-웨스턴 블럿 하이브리드화, 변성 HPLC, 미세배열, 바이오칩 또는 유전자 칩에의 하이브리드화, 분자 마커 분석, 바이오센서, 용융 온도 프로파일링 또는 이들 중 임의의 것들의 조합을 포함할 수 있다.
미토콘드리아 DNA의 서열화에 적합한 임의의 수단을 사용할 수도 있다. 바람직하게는, mtDNA를 서열화에 앞서 PCR에 의해 증폭시킨다. PCR 방법은 당해 분야에 널리 공지되어 있으며 문헌[Mullis and Faloona, 1987, Methods Enzymol., 155:335]에 개시된 바와 같이 수행될 수 있다. PCR 산물을 직접 서열화하거나 또는 벡터 내로 클로닝하고 이어서 세균 숙주 내에 넣을 수 있다. DNA 서열화 방법의 예가 문헌[Brumley, R.L. Jr. and Smith, L.M., 1991, 수평 초박 젤 전기영동에 의한 신속한 DNA 서열화, Nucleic Acids Res. 19:4121-4126] 및 [Luckey, J.A., et al., 1993, 모세관 젤 전기영동에 의한 고속 DNA 서열화, Methods Enzymol. 218:154-172]에서 발견된다. PCR의 병용 및 mtDNA의 서열화는 문헌[Hopgood, R., et al., 1992, 직접 PCT 산물로부터 인간 mtDNA의 자동화된 서열화 전략, Biotechniques 13:82-92] 및 [Tanaka, M. et al., 1996, mtDNA의 자동화된 서열화, Methods Enzymol. 264:407-421]에 개시되어 있다.
다양한 프라이머들의 제조를 위한 적합한 서열의 선택 방법이 또한 당해 분야에 공지되어 있다. 예를 들어, 상기 프라이머를 상업적으로 입수할 수 있는 장비, 예를 들어 어플라이드 바이오시스템스 유에스에이 인코포레이티드(Applied Biosystems USA Inc.)(Foster City, CA), 듀퐁(Wilmington, Del.) 또는 밀리젠(Milligen)(Bedford, Mass.)으로부터 입수할 수 있는 것을 사용하여 통상적인 고상 합성으로 제조할 수 있다.
본 발명의 하나의 태양에 따라, 후보 게놈 서열들을 결정하기 위해서, 먼저 서열 결실의 연결 점(junction point)을 확인한다. 서열 결실은 주로 5' 및 3' 단부에서 결실되는 서열에 인접한 직접 및 간접 반복 요소들에 의해 확인된다. 상기 게놈으로부터 뉴클레오타이드의 구획을 제거한 다음 상기 게놈을 연결시켜 새로운 연결 점을 생성시킨다.
상기 연결 점의 확인 시, 상기 연결 점에 인접하고 있는 유전자들의 뉴클레오타이드들을, 연접된 유전자의 확인을 위해 측정한다. 전형적으로 상기 연접된 유전자는 상기 첫 번째 유전자로부터의 개시 코돈 및 두 번째 유전자의 종결 코돈을 포함하며, 연속적인 전사물, 즉 상기 2 개의 연접된 유전자 모두의 시작에서부터 단부까지 판독 프레임을 유지하는 것으로서 발현될 수 있다. 재배열된 서열들이 상기 연접 부위에서 재결합될 때 개방 판독 프레임(ORF)을 갖는 것으로 발견된 일부 공지된 미토콘드리아 결실들을 표 1에 제공한다.
본 발명의 방법에 사용하기 위한 예시적인 mtDNA 분자들을 하기에 제공한다. 이들 mtDNA는 공지된 미토콘드리아 게놈(서열식별번호: 1)의 변경을 기본으로 하며 융합물 또는 "FUS"라는 명칭이 지정되었고, 여기에서 A:B는 첫 번째 연접된 유전자의 최종 미토콘드리아 뉴클레오타이드와 두 번째 연접된 유전자의 첫 번째 미토콘드리아 뉴클레오타이드 간의 연결 점을 나타낸다. 상기 연접된 유전자의 확인을 괄호 안에 제공하며, 이어서 상응하는 서열 식별자를 제공한다. 하기에 제공되는 경우, (AltMet) 및 (OrigMet)는 각각 교체 및 원래의 번역 출발 부위들을 지칭한다.
FUS 8469:13447(AltMet)(ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛)(서열식별번호: 2)
FUS 10744:14124(NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 3)
FUS 7974:15496(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 4)
FUS 7992:15730(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 5)
FUS 8210:15339(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 6)
FUS 8828:14896(ATP 신타제 F0 서브유닛 6(ATPase6) 대 시토크롬 b(Cytb))(서열식별번호: 7)
FUS 10665:14856(NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 시토크롬 b(Cytb))(서열식별번호: 8)
FUS 6075:13799(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 9)
FUS 6325:13989(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 10)
FUS 7438:13476(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 11)
FUS 7775:13532(시토크롬 c 옥시다제 서브유닛 II(COII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 12)
FUS 8213:13991(시토크롬 c 옥시다제 서브유닛 II(COII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 13)
FUS 9191:12909(ATP 신타제 F0 서브유닛 6(ATPase6) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 14)
FUS 9574:12972(시토크롬 c 옥시다제 서브유닛 III(COIII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 15)
FUS 10367:12829(NADH 데하이드로게나제 서브유닛 3(ND3) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 16)
FUS 11232:13980(NADH 데하이드로게나제 서브유닛 4(ND4) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 17)
FUS 8469:13447(OrigMet)(ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛)(서열식별번호: 18)
FUS 9144:13816(ATP 신타제 F0 서브유닛 6(ATPase6) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 54)
본 발명은 또한 암의 예견, 진단 및/또는 모니터를 위한 상기 서열들의 변체 또는 단편들의 용도를 제공한다.
본 발명에 사용된 바와 같이, "변체"는 본 발명의 mtDNA 서열과 상이하지만 그의 필수 성질은 유지하는 핵산을 지칭한다. 일반적으로, 변체는 전체적으로 밀접하게 유사하며, 다수의 영역들에서 선택 mtDNA 서열과 동일하다. 구체적으로, 본 발명의 변체는 상기 연접된 유전자들의 연결 점의 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 본 발명의 하나의 실시태양에서, 상기 변체 서열은 본 발명의 mtDNA 서열들 중 어느 하나 또는 그의 상보성 가닥과 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일하다.
본 발명에서, "단편"은 개시된 게놈 서열들 또는 그의 상보성 가닥 중에 함유된 것의 일부인 짧은 핵산 서열을 지칭한다. 이 부분은 상기 연접된 유전자들의 연결 점의 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 본 발명의 단편은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 단편은 예를 들어 상기 나열된 mtDNA 서열들 중 어느 하나의 20 개 이상의 연속된 염기들을 포함함을 의미한다. 이와 관련하여 "약"은 어느 한 말단 또는 양쪽 말단에서 특별히 인용된 값, 여러 개(5, 4, 3, 2 또는 1) 뉴클레오타이드까지 더 크거나 더 작은 값을 포함한다. 이들 단편은 비 제한적으로 본 발명에 논의된 바와 같은 진단 탐침 및 프라이머로서의 용도를 포함한 용도를 갖는다. 물론, 더 큰 단편들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 또한 고려된다.
따라서, 본 발명의 특정한 실시태양에서, 상기 mtDNA 서열은 하기로 이루어진 그룹 중에서 선택된다:
서열식별번호: 2(FUS 8469:13477; AltMet)
서열식별번호: 3(FUS 10774:14124)
서열식별번호: 4(FUS 7974:15496)
서열식별번호: 5(FUS 7992:15730)
서열식별번호: 6(FUS 8210:15339)
서열식별번호: 7(FUS 8828:14896)
서열식별번호: 8(FUS 10665:14856)
서열식별번호: 9(FUS 6075:13799)
서열식별번호: 10(FUS 6325:13989)
서열식별번호: 11(FUS 7438:13476)
서열식별번호: 12(FUS 7775:13532)
서열식별번호: 13(FUS 8213:13991)
서열식별번호: 14(FUS 9191:12909)
서열식별번호: 15(FUS 9574:12972)
서열식별번호: 16(FUS 10367:12829)
서열식별번호: 17(FUS 11232:13980)
서열식별번호: 18(FUS 8469:13447; OrigMet)
서열식별번호: 54(FUS 9144:13816)
및 이들의 단편 또는 변체.
탐침
본 발명의 또 다른 태양은 본 발명의 이상 mtDNA 서열을 인식할 수 있는 하이브리드화 탐침을 제공하는 것이다. 본 발명에 사용된 바와 같이, "탐침"이란 용어는 표적 영역 중의 서열을 갖는 탐침 중의 하나 이상의 서열의 상보성으로 인해, 표적 핵산 중의 서열을 갖는 이중 구조를 형성하는 올리고뉴클레오타이드를 지칭한다. 상기 탐침을 당해 분야에 공지된 방법들에 따라 표지할 수도 있다.
일단 특정 질병과 관련된 이상 mtDNA가 확인되면, 예를 들어 올리고뉴클레오타이드들의 배열에 대한 mtDNA의 하이브리드화를 사용하여 특정 돌연변이를 확인할 수 있으나, 임의의 공지된 하이브리드화 방법을 사용할 수도 있다.
본 발명의 프라이머와 마찬가지로, 탐침을 본 발명의 예시적인 mtDNA 융합 분자 또는 그의 단편 또는 변체에 대해 직접 생성시킬 수도 있다. 예를 들어 서열식별번호: 2 내지 18 및 54에 나열된 서열 및 표 1에 개시된 서열들을 사용하여 관심 융합 서열을 포함하는 핵산 서열을 검출하는 프라이머 또는 탐침을 디자인할 수 있다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 이들 핵산 분자에 하이브리드화하는 프라이머 또는 탐침은 매우 엄격한 하이브리드화 조건 또는 보다 덜 엄격한 조건 하에서 그렇게 할 수 있으며, 상기와 같은 조건은 당해 분야에 공지되어 있고 예를 들어 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, New York(1989)), 6.3.1-6.3.6]에서 발견된다.
본 발명의 특정 실시태양에서, 본 발명의 탐침은 상기 연접된 유전자들의 연결 점을 포함하는 이상 mtDNA의 적어도 일부에 상보적인 서열을 함유한다. 이 부분은 상기 연결 점 A:B에 포함된 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 이에 관하여, 본 발명은 상기 연결 점 A:B에 포함되고/되거나 이에 인접한 뉴클레오타이드를 사용하여 mtDNA 분자를 선택하는 임의의 적합한 표적화 기전을 포함한다.
당해 분야에 공지된 다양한 유형의 탐침들이 본 발명에 고려된다. 예를 들어, 상기 탐침은 표적 뉴클레오타이드 서열에의 결합을 일반적인 DNA 결합 염료, 예를 들어 에티디움 브로마이드, SYBR(등록상표) 그린, SYBR(등록상표) 골드 등을 사용하여 검출할 수 있는 하이브리드화 탐침일 수 있다. 한편으로, 상기 탐침은 하나 이상의 검출 가능한 표지들을 포함할 수 있다. 검출 가능한 표지는, 성질 또는 특징이 직접 또는 간접적으로 검출될 수 있고 표적 서열과 하이브리드화하는 탐침의 능력에 영향을 미치지 않도록 선택되는 분자 또는 부분이다. 핵산 서열의 표지화 방법은 당해 분야에 널리 공지되어 있다(예를 들어 문헌[Ausubel et al., (1997 & updates) Current Protocols in Molecular Biology, Wiley & Sons, New York]을 참조하시오).
본 발명의 탐침에 사용하기에 적합한 표지는 직접 검출될 수 있는 것들, 예를 들어 방사성 동위원소, 형광단, 화학발광단, 효소, 콜로이드 입자, 형광 미세입자 등을 포함한다. 당해 분야의 숙련가는, 직접 검출할 수 있는 표지는 상기 표지의 검출을 가능하게 하기 위해서 추가적인 성분들, 예를 들어 기질, 촉발 시약, 빛 등을 필요로 할 수도 있음을 알 것이다. 본 발명은 또한 간접적으로 검출되는 표지들의 사용을 고려한다.
본 발명의 탐침은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 탐침은 예를 들어 본 발명의 mtDNA 서열에 상보성인 20 개 이상의 연속된 염기들을 포함함을 의미한다. 물론, 더 큰 탐침들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 바람직할 수도 있다.
본 발명의 탐침들은 또한 생물학적 샘플 중의 핵산 분자에 하이브리드화하여, 본 발명의 방법을 가능하게 할 것이다. 따라서, 본 발명의 하나의 태양에서, 하이브리드화 탐침을 암의 검출에 사용하며, 여기에서 상기 탐침은 이상 mtDNA 분자의 적어도 일부에 상보성이다. 본 발명의 또 다른 태양은 탐침 및 직장결장암, 폐암, 유방암, 난소암, 고환암, 전립선암 및/또는 흑색종 피부암의 검출을 위한 상기 탐침의 용도(또는 사용 방법)를 제공한다.
분석
생물학적 샘플 중의 이상 mtDNA 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 mtDNA를 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 이상 mtDNA 서열의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 이상 mtDNA에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 mtDNA 데이터와 관련이 있을 수 있다.
하나의 태양에서, 본 발명은 포유동물의 암의 검출 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 상술한 이상 미토콘드리아 DNA의 존재에 대해 분석함을 포함한다. 본 발명은 또한 상기 포유동물로부터의 조직 샘플을 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 상기 샘플을 분석함을 포함하는 방법을 제공한다. 상기 탐침을 본 발명에 개시된 바와 같은 본 발명의 돌연변이 미토콘드리아 DNA 서열에 대해 생성될 수 있다.
또 다른 태양에서, 본 발명은 상기와 같은 방법을 제공하며, 여기에서 상기 분석은
a) 상기 탐침 중 하나 이상을 사용하여 하이브리드화 반응을 수행하여 상기 하나 이상의 탐침을 상보적인 이상 미토콘드리아 DNA 서열에 하이브리드화할 수 있게 하고;
b) 상기 하나 이상의 탐침에 하이브리드화된 미토콘드리아 DNA의 양을 정량분석함으로써 상기 샘플 중의 상기 하나 이상의 이상 미토콘드리아 DNA 서열의 양을 정량화하고;
c) 상기 샘플 중의 미토콘드리아 DNA의 양을 하나 이상의 공지된 기준 값과 비교함
을 포함한다.
또한 본 발명은 하기 개시하는 바와 같은 진단 영상 분석을 포함하는 암의 예견, 진단 또는 모니터 방법을 포함한다. 본 발명의 진단 분석을 고도의 자료처리 분석에 쉽게 적응시킬 수 있다. 고도의 자료처리 분석은 다수의 샘플들을 동시에 처리하는 이점을 제공하며 다수의 샘플을 선별하는데 필요한 시간을 현저하게 감소시킨다. 따라서 본 발명은 다수의 시험 샘플들 중의 표적 뉴클레오타이드 서열을 검출하고/하거나 정량화하기 위한 고도의 자료 처리 선별 또는 분석에 있어서 본 발명 뉴클레오타이드의 용도를 고려한다.
융합
전사물
본 발명은 암의 예견, 진단 및/또는 모니터 방법에 유용한 융합 전사물 및 관련된 하이브리드화 탐침의 확인을 추가로 제공한다. 당해 분야의 숙련가는 상기와 같은 분자가 천연 전사물의 단리를 통해 또는 한편으로, 본 발명의 방법에 따라 단리된 mtDNA의 재조합 발현에 의해 유도될 수 있음을 알 것이다. 논의된 바와 같이, 상기와 같은 mtDNA는 전형적으로는 첫 번째 유전자로부터의 개시 코돈 및 두 번째 유전자의 종결 코돈을 갖는 연접된 유전자를 포함한다. 따라서, 상기로부터 유도된 융합 전사물은 상기 연접된 유전자들과 결합된 연결 점을 포함한다.
융합
전사물의
검출
천연 융합 전사물을 생물학적 샘플로부터 추출하고 당해 분야에 공지된 임의의 적합한 방법에 따라 확인하거나, 또는 실시예에 개시된 방법에 따라 수행할 수도 있다. 본 발명의 하나의 실시태양에서, 안정한 폴리아데닐화된 융합 전사물을 폴리-A 꼬리로 전사물을 표적화하는 올리고(dT) 프라이머를 사용하여 확인한 다음 상기 표적 전사물에 대해 디자인된 프라이머 쌍을 사용하여 RT-PCR을 수행한다.
하기의 예시적인 융합 전사물을 상기와 같은 방법을 사용하여 검출하였으며 이는 실시예에서 가리킨 바와 같이 암의 예견, 진단 및/또는 모니터에 유용한 것으로 밝혀졌다. 마찬가지로, 표 1에 나타낸 ORF 서열들로부터 유도된 융합 전사물이 암의 예견, 진단 및/또는 모니터에 유용할 수 있다.
서열식별번호: 19(전사물 1; 8469:13477; AltMet)
서열식별번호: 20(전사물 2; 10774:14124)
서열식별번호: 21(전사물 3; 7974:15496)
서열식별번호: 22(전사물 4; 7992:15730)
서열식별번호: 23(전사물 5; 8210:15339)
서열식별번호: 24(전사물 6; 8828:14896)
서열식별번호: 25(전사물 7; 10665:14856)
서열식별번호: 26(전사물 8; 6075:13799)
서열식별번호: 27(전사물 9; 6325:13989)
서열식별번호: 28(전사물 10; 7438:13476)
서열식별번호: 29(전사물 11; 7775:13532)
서열식별번호: 30(전사물 12; 8213:13991)
서열식별번호: 31(전사물 14; 9191:12909)
서열식별번호: 32(전사물 15; 9574:12972)
서열식별번호: 33(전사물 16; 10367:12829)
서열식별번호: 34(전사물 17; 11232:13980)
서열식별번호: 35(전사물 20; 8469:13447; OrigMet)
서열식별번호: 53(전사물 13; 9144:13816)
융합 전사물들을 또한 당해 분야에 공지된 재조합 기법에 의해 생성시킬 수 있다. 전형적으로 이는 관심 mtDNA 서열을 포함하는 발현 벡터로 적합한 숙주 세포를 형질전환(형질감염, 형질도입 또는 감염 포함)시킴을 포함한다.
본 발명에서 확인된 융합 전사물들의 변체 또는 단편들을 또한 제공한다. 상기와 같은 서열들은 게놈 변체 및 단편에 관하여 상술한, 또는 숙련가에 의해 적합한 것으로 결정된 바와 같은 크기 제한 및 일치율을 고수할 수 있다.
탐침
일단 융합 전사물이 특성화되었으면, 프라이머 또는 탐침을 생물학적 샘플 중의 전사물을 표적화하기 위해서 개발할 수 있다. 상기와 같은 프라이머 및 탐침을 임의의 공지된 방법(상술한 바와 같은)을 사용하거나 또는 하기 제공된 실시예에 나타낸 바와 같이 제조할 수 있다. 탐침은 예를 들어 상기 융합 전사물에 대해 생성될 수 있으며, 검출 기술, 예를 들어 QuantiGene 2.0TM by PanomicsTM를 샘플 중의 전사물의 존재를 검출하기 위해 사용할 수 있다. 프라이머 및 탐침을 본 발명의 예시적인 융합 전사물, 또는 그의 단편 또는 변체에 대해 직접 생성시킬 수 있다. 예를 들어 서열식별번호: 19 내지 35에 나타낸 서열들뿐만 아니라 표 1에 개시된 것들을 사용하여 관심 융합 서열을 포함하는 핵산 서열을 검출하는 탐침을 디자인할 수 있다.
당해 분야의 숙련가들에 의해 이해되는 바와 같이, 본 발명의 융합 전사물에 하이브리드화하도록 디자인된 탐침은 상기 연접된 유전자의 연결 점을 발현하는 전사물의 적어도 일부에 상보적인 서열을 함유한다. 이 부분은 상기 발현된 연결 점에 상보적인 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 상보성 뉴클레오타이드를 추가로 포함할 수도 있다. 이에 관하여, 본 발명은 상기 연접된 유전자의 연결 점을 포함하고 이에 인접한 뉴클레오타이드를 사용하는 융합 전사물을 선택하는 임의의 적합한 표적화 기전을 포함한다.
당해 분야에 공지된 다양한 유형의 탐침 및 표적화 방법들을 전사물 탐침의 제조에 고려한다. 상기와 같은 유형 및 방법들은 게놈 서열의 검출에 관하여 상기 개시되어 있다. 본 발명의 전사물 탐침은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 탐침은 예를 들어 본 발명의 mtDNA 서열에 상보성인 20 개 이상의 연속된 염기들을 포함함을 의미한다. 물론, 더 큰 탐침들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 바람직할 수도 있다.
하나의 태양에서, 본 발명은 암 검출에 사용하기 위한 하이브리드화 탐침을 제공하며, 여기에서 상기 탐침은 상기 제공된 미토콘드리아 융합 전사물의 적어도 일부에 상보성이다.
또 다른 태양에서, 본 발명은 탐침 및 결장직장암, 폐암, 유방암, 난소암, 고환암, 전립선암 또는 흑색종 피부암의 검출을 위한 상기와 같은 탐침의 용도(또는 사용 방법)를 제공한다.
분석
생물학적 샘플 중의 미토콘드리아 융합 전사물 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 미토콘드리아 RNA를 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 융합 전사물의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 융합 전사물에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 전사물 데이터와 관련이 있을 수 있다.
하나의 태양에서, 본 발명은 포유동물의 암의 검출 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 상기 미토콘드리아 융합 전사물의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 본 발명의 하나 이상의 융합 전사물의 존재에 대해 분석함을 포함한다.
또 다른 태양에서, 본 발명은 상기와 같은 방법을 제공하며, 여기에서 상기 분석은
a) 상기 탐침 중 하나 이상을 사용하여 하이브리드화 반응을 수행하여 상기 하나 이상의 탐침을 상보적인 미토콘드리아 융합 전사물에 하이브리드화할 수 있게 하고;
b) 상기 하나 이상의 탐침에 하이브리드화된 전사물의 양을 정량분석함으로써 상기 샘플 중의 상기 하나 이상의 미토콘드리아 융합 전사물의 양을 정량화하고;
c) 상기 샘플 중의 미토콘드리아 융합 전사물의 양을 하나 이상의 공지된 기준 값과 비교함
을 포함한다.
상기 논의된 바와 같이, 본 발명의 진단 분석은 본 발명에 개시된 바와 같은 진단 영상 방법을 또한 포함하며 이를 고도의 자료처리 분석에 쉽게 적응시킬 수 있다. 따라서, 본 발명은 다수의 시험 샘플들 중의 표적 뉴클레오타이드 서열을 검출하고/하거나 정량화하기 위한 고도의 자료 처리 선별 또는 분석에 있어서 본 발명의 융합 전사물 및 관련된 탐침의 용도를 고려한다.
번역 산물
지금까지, 미토콘드리아 융합 단백질은 검출되거나 단리되지 않았다. 그러나, 미토콘드리아 융합 전사물의 수준이 하기에 제공된 실시예들로부터 관찰되었으며 상기 전사물이 폴리아데닐화된다는 표시는 상기와 같은 미토콘드리아 융합 단백질의 존재를 지지하는 추가의 증거를 제공한다. 따라서, 본 발명은 암의 예견, 진단 및/또는 모니터를 위한 융합 단백질의 확인을 제공한다.
상기 개시된 방법에 사용하기 위해 고려되는 융합 단백질은 천연 폴리펩타이드의 단리를 통해 또는 유전자 발현을 통해 유도될 수 있다. 상기와 같은 폴리펩타이드를 당해 분야에 공지된 방법, 예를 들어 세포 추출물로부터의 정제 또는 재조합 기법의 사용에 의해 제조할 수 있다.
전사물 1 내지 17 및 20에 상응하는 추정적인 단백질 서열들을 하기에 각각의 서열 식별자와 함께 제공한다. 이들뿐만 아니라 표 1에 개시된 결실 서열들에 상응하는 추정적인 단백질 서열들을 본 발명의 방법에 사용하기 위해 본 발명에서 고려한다.
서열식별번호: 36(전사물 1)
서열식별번호: 37(전사물 2)
서열식별번호: 38(전사물 3)
서열식별번호: 39(전사물 4)
서열식별번호: 40(전사물 5)
서열식별번호: 41(전사물 6)
서열식별번호: 42(전사물 7)
서열식별번호: 43(전사물 8)
서열식별번호: 44(전사물 9)
서열식별번호: 45(전사물 10)
서열식별번호: 46(전사물 11)
서열식별번호: 47(전사물 12)
서열식별번호: 48(전사물 14)
서열식별번호: 49(전사물 15)
서열식별번호: 50(전사물 16)
서열식별번호: 51(전사물 17)
서열식별번호: 52(전사물 20)
서열식별번호: 55(전사물 13)
융합 단백질의 검출
본 발명의 융합 단백질을 황산 암모늄 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록실아파타이트 크로마토그래피, 소수성 전하 상호작용 크로마토그래피 및 렉틴 크로마토그래피를 포함한 널리 공지된 방법들에 의해 생물학적 샘플로부터 회수하고 정제할 수 있다. 가장 바람직하게는, 고성능 액체 크로마토그래피("HPLC")가 정제에 사용된다.
생물학적 샘플 중의 융합 단백질 수준의 분석을 다양한 기법을 사용하여 수행할 수 있다. 예를 들어, 조직 중 단백질 발현을 전통적인 면역조직학적 방법(Jalkanen et al., J. Cell. Biol. 101:976-985(1985); Jalkanen, M. et al., J. Cell. Biol. 105:3087-3096(1987))으로 연구할 수 있다. 단백질 발현의 검출에 유용한 다른 방법은 면역분석, 예를 들어 효소 결합된 면역흡수 분석(ELISA) 및 방사성면역분석(RIA)을 포함한다. 적합한 항체 분석 표지가 당해 분야에 공지되어 있으며 효소 표지, 예를 들어 글루코스 옥시다제, 및 방사성 동위원소, 예를 들어 요오드(<125>I, <121>I), 탄소(<14>C), 황(<35>S), 삼중수소(<3>H), 인듐(<112>In), 및 테크네슘(<99m>Tc) 및 형광 표지, 예를 들어 플루오레세인 및 로다민, 및 비오틴을 포함한다.
본 발명의 폴리펩타이드를 또한 당해 분야에 공지된 재조합 기법에 의해 제조할 수 있다. 전형적으로 이는 관심 단백질 또는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 발현 벡터로 적합한 숙주 세포를 형질전환(형질감염, 형질도입 또는 감염 포함)시킴을 포함한다.
항체
본 발명의 분석에 사용하기 위한 단백질 특이 항체를 본 발명의 야생형 또는 발현된 미토콘드리아 융합 단백질 또는 그의 항원성 폴리펩타이드 단편에 대해 생성시킬 수 있으며, 이들은 담체 단백질, 예를 들어 알부민과 함께 동물계(예를 들어 토끼 또는 마우스)로 제공되거나, 충분히 긴 경우(약 25 아미노산 이상), 담체 없이 제공될 수 있다.
본 발명에 사용된 바와 같이, "항체"(Ab) 또는 "단클론 항체"(Mab)란 용어는 미토콘드리아 융합 단백질에 특이적으로 결합하거나 상기 단백질에 대한 "특이성"을 가질 수 있는 완전한 분자뿐만 아니라 항체 단편, 또는 그의 항원-결합 단편(예를 들어 Fab 및 F(ab')2 단편)을 포함함을 의미한다. Fab 및 F(ab')2 단편은 완전 항체의 Fc 단편이 결여되며, 순환으로부터 보다 빠르게 제거되고, 완전 항체의 덜 비-특이적인 조직 결합을 가질 수도 있다(Wahl et al., J. Nucl. Med. 24:316-325(1983)). 따라서, 이들 단편이 바람직하다.
본 발명의 항체를 임의의 다양한 방법들에 의해 제조할 수 있다. 예를 들어 상기 미토콘드리아 융합 단백질 또는 그의 항원 단편을 발현하는 세포를 다클론 항체를 함유하는 혈청의 생산을 유도하기 위해서 동물에게 투여할 수 있다. 하나의 방법에서, 미토콘드리아 융합 단백질의 제제를 제조하고 천연 오염물질이 실질적으로 없도록 정제한다. 이어서 상기와 같은 제제를 보다 큰 특이 활성의 다클론 항혈청을 생성시키기 위해서 동물에게 도입시킨다.
관련된 방법에서, 본 발명의 항체는 단클론 항체이다. 상기와 같은 단클론 항체를 하이브리도마 기술을 사용하여 제조할 수 있다(Kohler et al., Nature 256:495(1975); Kohler et al., Eur. J. Immunol. 6:511(1976); Kohler et al., Eur. J. Immunol. 6:292(1976); Hammerling et al., in: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., (1981) pp. 563-681). 일반적으로, 상기와 같은 과정은 동물(바람직하게는 마우스)을 미토콘드리아 융합 단백질 항원 또는 미토콘드리아 융합 단백질-발현 세포로 면역함을 포함한다.
본 발명은 본 발명에 개시된 융합 단백질에 대해 특이성을 갖는 항체 또는 항원-결합 단편을 사용하는 면역학적 분석을 포함한다. 상기와 같은 면역학적 분석은 임의의 다른 필요 시약, 시험 스트립, 물질, 설명서 등과 함께 항체 또는 항원-결합 단편을 함유하는 키트에 의해 용이해 질 수 있다.
분석
생물학적 샘플 중의 융합 단백질과 같은 번역 산물의 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 미토콘드리아 융합 단백질을 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 상기와 같은 분자의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 상기 분자에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 전사물 데이터와 관련이 있을 수 있다.
샘플 중의 단백질을 정량화하는 기법은 당해 분야에 널리 공지되어 있으며 예를 들어, 전통적인 면역조직학적 방법(Jalkanen et al., J. Cell. Biol. 101:976-985(1985); Jalkanen, M. et al., J. Cell. Biol. 105:3087-3096(1987))을 포함한다. 단백질 발현의 검출에 유용한 추가적인 방법은 면역분석, 예를 들어 효소 결합된 면역흡수 분석(ELISA) 및 방사성면역분석(RIA)을 포함한다.
하나의 태양에서, 본 발명은 포유동물에게서 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함한다. 또 다른 태양에서, 본 발명은 결장직장암, 폐암, 유방암, 난소암, 고환 암, 전립선암 및/또는 흑색종 피부암의 진단에서 미토콘드리아 융합 단백질의 검출을 제공한다.
진단 영상화
진단 장치
본 발명은 특정 질병을 진단하거나 특정 돌연변이를 확인하는데 사용되는 바이오칩, 유전자 칩 또는 미세배열 등의 진단 장치를 포함한다. 모든 서열화된 미토콘드리아 게놈들은 염기쌍 배열의 일치 구조를 생성시키는 것으로 평가되며 특정 질병 또는 질환과 관련된 염기쌍 결실 및 돌연변이의 비율에 대한 금지율을 지정한다. 상기 진단 설비를 사용하여 바이오칩, 유전자 칩 또는 미세배열을 생성시킨다.
일단 특정 질병, 질병 상태 또는 질환과 관련된 서열이 확인되면, 올리고뉴클레오타이드의 배열에 대한 미토콘드리아 뉴클레오타이드 샘플의 하이브리드화를 사용하여 특정 돌연변이를 확인할 수 있다. 임의의 공지된 하이브리드화 방법을 사용할 수 있다. 바람직하게는, 야생형 또는 돌연변이된 영역과 합치하는 올리고뉴클레오타이드 탐침, 및 대조용 탐침을 갖는 배열을 사용한다. 상업적으로 입수할 수 있는 배열, 예를 들어 미세배열 또는 유전자 칩이 적합하다. 이들 배열은 슬라이드 또는 미세 칩 상에 수천의 합치된 및 대조용 탐침 쌍을 함유하며, 전체 게놈을 매우 신속하게 서열화할 수 있다. 게놈 및 DNA 서열 분석에서 미세배열들의 용도를 개시하는 고찰 논문들을 온-라인 상에서 입수할 수 있다.
미세배열
폴리뉴클레오타이드 배열은 하나 이상의 표적 핵산 서열을 포함하는 샘플 중의 다수의 폴리뉴클레오타이드를 분석할 수 있는 고도의 자료처리 기법을 제공한다. 본 발명의 배열은 유전자 발현 분석, 질병의 진단 및 질병의 예후(예를 들어 치료에 대한 환자의 반응 모니터 등)에 유용하다.
질병, 또는 질병의 진행을 가리키는 mtDNA의 폴리뉴클레오타이드 서열의 임의의 조합을 미세배열의 제작을 위해 사용한다.
미세배열을 사용하여 분석하려는 표적 핵산 샘플은 앞서 개시한 바와 같이 적합한 양의 mtDNA를 함유하는 임의의 인간 조직 또는 유체로부터 유래한다. 상기 표적 핵산 샘플을 상보적인 핵산 구성원/표적 복합체의 하이브리드화 패턴을 생성시키기에 충분한 하이브리드화 조건 하에서 폴리뉴클레오타이드 구성원들과 접촉시킨다.
미세배열의 제작
상기 미세배열은 고체 지지체의 한 표면에 결합된 다수의 독특한 폴리뉴클레오타이드들을 포함하며, 여기에서 상기 폴리뉴클레오타이드들은 각각 상기 고체 지지체의 표면에 동일하지 않은 소정의 영역에서 결합된다. 상기 배열상의 각각의 결합된 샘플은 하기에 보다 상세히 개시되는 바와 같이, 공지된 정체, 대개는 공지된 서열의 폴리뉴클레오타이드 조성물을 포함한다. 임의의 가능한 기질들을 본 발명에 사용할 수 있다.
상기 배열을 임의의 공지된 수단을 사용하여 제작한다. 상기 핵산 구성원을 확립된 기법들, 예를 들어 폴리머라제 쇄 반응(PCR) 및 역 전사(RT)를 사용하여 생성시킬 수 있다. 이들 방법은 당해 분야에 현재 공지된 것들과 유사하다(예를 들어 문헌[PCR Strategies, Michael A. Innis(Editor), et al.(1995)] 및 [PCR: Introduction to Biotechniques Series, C.R. Newton, A. Graham(1997)]을 참조하시오). 증폭된 폴리뉴클레오타이드를 당해 분야에 널리 공지된 방법(예를 들어 컬럼 정제)에 의해 정제한다. 폴리뉴클레오타이드는 목적하는 폴리뉴클레오타이드의 합성 중에 생성되는 불완전 산물 및 프라이머들이 실질적으로 없도록 단리되었을 때 순수한 것으로 간주된다. 바람직하게는, 정제된 폴리뉴클레오타이드는 또한 상기 분자의 결합 활성을 방해하거나 또는 달리 가릴 수도 있는 오염물질이 실질적으로 없을 것이다.
본 발명의 배열에서, 상기 폴리뉴클레오타이드 조성물은 고체 지지체의 표면과 안정하게 결합하며, 여기에서 상기 지지체는 가요성이거나 강성의 고체 지지체일 수 있다.
핵산 구성원이 결합될 수도 있는 임의의 고체 지지체를 본 발명에 사용할 수 있다. 적합한 고체 지지체 물질의 예로는 비 제한적으로, 실리케이트, 예를 들어 유리 및 실리카젤, 셀룰로스 및 나이트로셀룰로스 페이퍼, 나일론, 폴리스타이렌, 폴리메트아크릴레이트, 라텍스, 고무, 및 플루오로카본 수지, 예를 들어 TEFLONTM이 있다.
상기 고체 지지체 물질을 비 제한적으로 슬라이드 및 비드를 포함한 광범위하게 다양한 모양으로 사용할 수 있다. 슬라이드는 여러 가지 작용 이점들을 제공하며 따라서 고체 지지체의 바람직한 형태이다. 유리 슬라이드를 사용하는 경우 그의 평평한 표면으로 인해 탐침 및 하이브리드화 시약이 최소화된다. 슬라이드는 또한 시약들의 표적화된 적용을 가능하게 하며, 일정한 온도를 유지하기가 쉽고, 세척이 용이하며, 상기 고체 지지체 상에 고정화된 RNA 및/또는 DNA의 직접적인 가시화를 촉진한다. 상기 고체 지지체 상에 고정화된 RNA 및/또는 DNA의 제거가 또한 슬라이드를 사용하여 촉진된다.
상기 고체 지지체로서 선택된 특정 물질은 상기 물질이 상기 개시된 작용을 제공하는 한 본 발명에 필수적이지 않다. 통상적으로는, 본 발명을 만들거나 이용하는 사람들은 비용 및 유효성의 경제학, 최종 생성물의 예상된 적용 요건, 및 전체 제조 공정의 요구를 근거로 최선의 상업적으로 입수할 수 있는 물질을 선택할 것이다.
본 발명의 핵산 구성원들을 기질에 결합시키기 위한 다수의 방법들(스폿팅이라 지칭되는 공정)이 사용된다. 예를 들어, 폴리뉴클레오타이드를 예를 들어 미국 특허 제 5,807,522 호(중합체 결합 방법을 교시하기 위해 본 발명에 참고로 인용됨)의 기법을 사용하여 결합시킨다. 한편으로, 스폿팅을 접촉 인쇄 기술을 사용하여 수행한다.
각각의 조성물 중에 존재하는 폴리뉴클레오타이드의 양은 상기 배열을 사용하는 분석 중에 표적 폴리뉴클레오타이드 서열의 적합한 하이브리드화 및 검출을 제공하기에 충분할 것이다. 일반적으로, 상기 배열의 고체 지지체와 안정하게 결합하는 각 핵산 구성원의 양은 약 0.1 ng 이상, 바람직하게는 약 0.5 ng 이상 및 보다 바람직하게는 약 1 ng 이상이며, 이때 상기 량은 1000 ng 이상 정도로 높을 수 있으나, 대개는 약 20 ng을 초과하지 않을 것이다.
대조용 폴리뉴클레오타이드를, 상기 탐침이 향하는 표적 이외의 샘플 중의 폴리뉴클레오타이드에 대한 비-특이적 결합 또는 교차-하이브리드화를 모니터하기 위해서 상기 배열상에 스폿팅하고 표적 발현 대조용 폴리뉴클레오타이드 및 불일치 대조용 뉴클레오타이드로서 사용할 수 있다. 따라서 불일치 탐침은 하이브리드화가 특이적인지 아닌지를 가리킨다. 예를 들어, 상기 표적이 존재하는 경우, 완벽하게 일치된 탐침은 불일치된 탐침보다 일관되게 더 밝을 것이다. 또한, 모든 중심 불일치가 존재하는 경우, 상기 불일치 탐침들을 사용하여 돌연변이를 검출한다.
표적 제조
상기 미세배열의 표적들은 하나 이상의 생물학적 탐침들로부터 유래할 수 있다. 하이브리드화 전에 표적 핵산 샘플을 증폭시키는 것이 바람직할 수도 있다. 당해 분야의 숙련가는 사용되는 증폭 방법이 무엇이든 간에, 정량적인 결과를 원하는 경우, 상기 증폭된 폴리뉴클레오타이드의 상대 빈도를 유지하거나 조절하는 방법을 주의해서 사용해야 한다. "정량적인" 증폭의 방법들은 당해 분야의 숙련가들에게 널리 공지되어 있다. 예를 들어, 정량적인 PCR은 동일한 프라이머를 사용하여 기지 량의 대조용 서열을 동시에 함께 증폭시킴을 포함한다. 이는 PCR 반응을 눈금화하는데 사용될 수 있는 내부 기준을 제공한다. 이어서 고 밀도 배열은 상기 증폭된 폴리뉴클레오타이드의 정량화에 대한 내부 기준에 특이적인 탐침을 포함할 수 있다. 정량적인 PCR에 대한 상세한 프로토콜이 문헌[PCR Protocols, A Guide to Methods and Applications, Innis et al., Academic Press, Inc. N.Y.,(1990)]에 제공되어 있다. 다른 적합한 증폭 방법으로는 비 제한적으로 폴리머라제 쇄 반응(PCR)(Innis, et al., PCR Protocols. A guide to Methods and Application. Academic Press, Inc. San Diego, (1990)), 리가제 쇄 반응(LCR)(Wu and Wallace, Genomics, 4:560(1989), Landegren, et al., Science, 241:1077(1988) 및 Barringer et al., Gene, 89:117(1990)), 전사 증폭(Kwoh, et al, Proc. Natl. Acad. Sci. USA, 86:1173(1989)), 및 자립 서열 복제(Guatelli, et al., Proc. Nat. Acad. Sci. USA, 87:1874(1990))가 있다.
본 발명은 상술한 바와 같은 표지된 표적 또는 표지된 탐침을 제공한다. 미세배열의 경우, 분자에 결합하거나 분자 내로 통합되는 임의의 분석학적으로 검출 가능한 마커를 본 발명에 사용할 수 있다. 분석학적으로 검출 가능한 마커는 분석학적으로 검출되고 정량화되는 임의의 분자, 부분 또는 원자를 지칭한다. 본 발명에 사용하기에 적합한 검출 가능한 표지는 분광학적, 광화학적, 생화학적, 면역화학적, 전기, 광학 또는 화학적 수단에 의해 검출 가능한 임의의 조성물을 포함한다. 본 발명에 유용한 표지는 표지된 스트렙트아비딘 접합체에 의한 염색을 위한 비오틴, 자기 비드(예를 들어 DynabeadsTM), 형광 염료(예를 들어 플루오레세인, 텍사스 레드, 로다민, 녹색 형광 단백질 등), 방사성 표지(예를 들어 3H, 125I, 35S, 14C, 또는 32P), 효소(예를 들어 양고추 냉이 퍼옥시다제, 알칼리성 포스파타제, 및 ELISA에 통상적으로 사용되는 것들), 및 비색측정 표지, 예를 들어 콜로이드성 금 또는 착색된 유리 또는 플라스틱(예를 들어 폴리스타이렌, 폴리프로필렌, 라텍스 등) 비드를 포함한다. 상기와 같은 표지의 사용을 교시하는 특허들로는 미국 특허 제 3,817,837; 3,850,752; 3,939,350; 3,996,345; 4,277,437; 4,275,149; 및 4,366,241 호가 있다.
상기와 같은 표지의 검출 수단은 당해 분야의 숙련가들에게 널리 공지되어 있다. 따라서 예를 들어 방사성 표지를 사진 필름 또는 섬광 계수기를 사용하여 검출할 수 있고, 형광 마커를 방출된 빛을 검출하는 광검출기를 사용하여 검출할 수 있다. 효소 표지는 전형적으로는 상기 효소에 기질을 제공하고 상기 기질 상에서 상기 효소의 작용에 의해 생성된 반응 산물을 검출함으로써 검출하며, 비색 측정 표지는 착색된 표지를 단순히 가시화함으로써 검출한다.
상기 표지들을 당해 분야의 숙련가들에게 널리 공지된 다수의 수단들 중 임의의 수단에 의해 통합시킬 수 있다. 그러나, 바람직한 실시태양에서, 상기 표지를 상기 샘플 폴리뉴클레오타이드의 제조에서 증폭 단계 중에 동시에 통합시킨다. 따라서, 예를 들어 표지된 프라이머 또는 표지된 뉴클레오타이드와의 폴리머라제 쇄 반응(PCR)은 표지된 증폭 산물을 제공할 것이다. 바람직한 실시태양에서, 표지된 뉴클레오타이드(예를 들어 플루오레세인-표지된 UTP 및/또는 CTP)를 사용하는, 상술한 바와 같은 전사 증폭은 표지를 상기 전사된 폴리뉴클레오타이드 내로 통합시킨다. 한편으로, 상기 증폭을 완료한 후에 표지를 원래의 폴리뉴클레오타이드 샘플(예를 들어 mRNA, 폴리A mRNA, cDNA 등)에 또는 증폭 산물에 직접 가할 수도 있다. 폴리뉴클레오타이드에 표지를 결합시키는 수단은 당해 분야의 숙련가들에게 널리 공지되어 있으며, 예를 들어 틈 번역 또는 상기 폴리뉴클레오타이드의 키나제 처리 및 상기 샘플 폴리뉴클레오타이드를 표지(예를 들어 형광단)에 결합시키는 폴리뉴클레오타이드 링커의 후속적인 결합(연결)에 의한 단부-표지화(예를 들어 표지된 RNA에 의해)를 포함한다.
바람직한 실시태양에서, 상기 표적은 상기 미세배열상의 대조용 탐침에 하이브리드화하여 상기 미세배열로부터 생성되는 신호들을 표준화하는 하나 이상의 대조용 분자들을 포함할 것이다. 표지된 표준화 표적들은 상술한 바와 같이 상기 미세배열상에 스폿팅되는 대조용 올리고뉴클레오타이드에 완벽하게 상보성인 폴리뉴클레오타이드 서열이다. 하이브리드화 후 상기 표준화 대조군으로부터 획득한 신호는 하이브리드화 조건에서 변화에 대한 조절, 표지 강도, "판독" 효율, 및 배열들 간에 완벽한 하이브리드화의 신호의 변화를 야기할 수 있는 다른 인자들을 제공한다.
영상 획득 및 데이터 분석
하이브리드화 및 임의의 세척 단계(들) 및/또는 통상적인 성질의 후속 처리에 이어서, 생성된 하이브리드화 패턴이 검출된다. 상기 하이브리드화 패턴의 검출 또는 가시화에서, 상기 표지의 강도 또는 신호 값은 검출될 뿐만 아니라 정량화될 것이며, 이는 상기 하이브리드화의 각 스폿으로부터의 신호가 측정되고 기지의 수의 단부 표지된 표적 폴리뉴클레오타이드에 의해 방출되는 신호에 상응하는 단위 값과 비교되어 상기 배열상의 특정 스폿에 상기 하이브리드화 패턴으로 하이브리드화되는 각각의 단부-표지된 표적의 사본 수의 수 또는 절대 값을 획득함을 의미한다.
배열에 대한 하이브리드화로부터 수집한 데이터의 분석 방법은 당해 분야에 널리 공지되어 있다. 예를 들어, 하이브리드화의 검출이 형광 표지를 수반하는 경우, 데이터 분석은 상기 수집된 데이터로부터 기질 위치의 함수로서 형광 강도를 측정하고, 이상치들, 즉 소정의 통계 분포로부터 벗어난 데이터를 제거하고, 나머지 데이터로부터 상기 시험 폴리뉴클레오타이드의 상대 결합 친화성을 계산하는 단계를 포함할 수 있다. 상기 생성 데이터는 관련된 올리고뉴클레오타이드들 및/또는 폴리뉴클레오타이드들과 시험 폴리뉴클레오타이드들 간의 결합 친화성에 따라 변하는 각 영역 중의 강도를 갖는 영상으로서 표시된다.
진단 시험
검출 또는 가시화에 이어서, 상기 하이브리드화 패턴을 사용하여 상기 하이브리드화 패턴을 생성시키는 배열과 접촉한 표지된 표적 폴리뉴클레오타이드 샘플의 유전자 프로파일뿐만 아니라 상기 샘플이 유래된 조직, 유체, 기관, 세포 등의 상태 또는 조건에 대한 정량적인 정보를 측정한다. 이에 관하여, 본 발명은 암 검출을 위한 진단 시험을 추가로 제공한다. 본 발명은 또한 환자의 상태를 모니터함을 제공한다. 본 발명의 방법에 따라, 암의 존재를 환자로부터의 생물학적 샘플을 획득하여 검출한다. 핵산을 포함하는 시험 샘플을 상기 생물학적 샘플로부터 제조한다. 상기 샘플로부터 추출한 핵산을 고체 기질 및 다수의 핵산 구성원들을 포함하는 배열에 하이브리드화하며, 여기에서 각각의 구성원들은 질병의 존재 또는 암에 대한 소인을 가리킨다. 상기 진단 시험에 따라, 상기 배열상의 하나 이상의 핵산 구성원에 대한 핵산을 포함하는 상기 샘플의 하이브리드화는 암 또는 암에 대한 소인을 가리킨다.
진단
모니터링
본 발명의 방법은 하나 이상의 분석들의 결과를 기본으로 하는 요법의 모니터링 섭생 또는 과정을 추천하는 단계를 추가로 포함할 수 있다. 이는 임상의들이 개인화된 투약을 실행하게 한다, 예를 들어 환자의 암의 진행(예를 들어 초기 또는 후속 돌연변이가 발생하는 때를 인식함으로써) 또는 치료(예를 들어 돌연변이가 안정화된 때를 인식함으로써)를 모니터함으로써 암 치료를 실행하게 한다.
연구중인 서열 변화의 한계들에 대한 지식과 함께, 상기 정보를 사용하여 전암성 상태 또는 기존의 암 상태를 진단할 수 있다. 더욱이, 시간에 따른 연속적인 샘플 중의 이상 mtDNA의 양을 정량분석함으로써, 암 상태의 진행을 모니터할 수 있다. 예를 들어, 야생형으로부터 첫 번째 돌연변이 세트를 검출하기 위해 하나의 시점에서 환자의 조직을 분석함으로써 제공된 데이터를, 상기 이상의 변화가 발생했는지를 측정하기 위해서, 후속 분석으로부터 제공된 데이터와 비교할 수 있다.
아직 암의 증상들이 나타나지 않은 개인에게서 돌연변이가 발견되는 경우, 상기 돌연변이는 암 상태를 나타낼 유전학적 민감성을 가리킬 수 있다. 질병에 대한 민감성의 측정 또는 상기 존재의 진단을, 환자의 가족력에서 암 상태(존재하는 경우)의 이환율 및 다른 위험 인자들의 존재, 예를 들어 환경 인자들에의 노출 및 상기 환자의 세포가 또 다른 종류의 돌연변이를 또한 갖는지에 관한 정보에 근거한 정량적인 기준으로 추가로 평가할 수 있다.
생물학적 샘플
본 발명은 하나 이상의 생물학적 샘플을 수득하거나 수집함을 포함하는 진단 시험을 제공한다. 본 발명과 관련하여, "생물학적 샘플"은 mtDNA, mtRNA 및 번역 산물 또는 융합 단백질이 수득될 수 있는 세포들을 함유하는 조직 또는 체액을 지칭한다. 예를 들어, 상기 생물학적 샘플은 비 제한적으로 피부, 폐, 유방, 전립선, 신경, 근육, 심장, 위, 결장, 직장 조직 등을 포함하는 조직으로부터; 또는 혈액, 타액, 뇌척수액, 객담, 뇨, 점액, 활액, 복막액, 양수 등으로부터 유래할 수 있다. 상기 생물학적 샘플을 암성 또는 비 암성 조직으로부터 수득할 수 있으며 상기 샘플은 비 제한적으로 외과적 시편 또는 생검 시편일 수 있다.
상기 생물학적 샘플을 상기 공급원으로부터 수득한 대로 바로 사용하거나 상기 샘플의 특성을 변경시키기 위해 전-처리에 이어서 사용할 수 있다. 따라서, 상기 생물학적 샘플을 사용 전에, 예를 들어 혈액으로부터 혈장 또는 혈청을 제조하고, 세포를 파괴하고, 고체 물질로부터 액체를 제조하고, 점성 유체를 희석하고, 액체를 여과하고, 액체를 증류하고, 액체를 농축시키고, 간섭 성분들을 불활성화시키고, 시약들을 첨가하는 등에 의해 전처리할 수 있다.
당해 분야의 숙련가는 하나보다 많은 유형의 샘플(즉 하나보다 많은 암의 검출을 위해)을 한번에 분석할 수 있음을 알 것이다. 더욱 또한, 수집 과정이 필요한 경우, 예를 들어 시간에 따라 암을 모니터하는 경우, 주어진 샘플을 단독으로 또는 시험기간 전체를 통해 취한 다른 샘플들과 함께 진단할 수 있다. 이에 관하여, 생물학적 샘플을 단지 1회만, 또는 규칙적인 간격으로, 예를 들어 2주마다, 달마다, 반년마다 또는 매년 취할 수 있다.
키트
본 발명은 임상적인 환경에서 암을 검출하기 위한 진단/선별 키트를 제공한다. 상기와 같은 키트는 하나 이상의 샘플링 수단을 본 발명에 따른 하나 이상의 탐침과 함께 포함할 수도 있다. 한편으로, 또는 상기 이외에, 상기 키트는 본 발명의 번역 산물을 검출하기 위한 수단을 포함할 수도 있다.
상기 키트는 진단 분석을 수행하는데 필요한 시약들, 예를 들어 완충제, 염, 검출 시약 등을 임의로 포함할 수 있다. 다른 성분들, 예를 들어 완충제 및 생물학적 샘플의 단리 및/또는 처리를 위한 용액들을 또한 상기 키트에 포함시킬 수 있다. 상기 키트의 상기 성분들 중 하나 이상을 동결건조시킬 수도 있으며 상기 키트는 상기 동결건조된 성분들의 재조성에 적합한 시약들을 추가로 포함할 수 있다.
적합한 경우, 상기 키트는 반응 용기, 혼합 용기 및 상기 시험 샘플의 제조를 촉진하는 다른 성분들을 또한 함유할 수 있다. 상기 키트는 사용 설명서를 또한 임의로 포함할 수 있으며, 상기 설명서는 종이 형태로 또는 컴퓨터 판독 가능한 형태, 예를 들어 디스크, CD, DVD 등의 형태로 제공될 수 있다.
본 발명의 하나의 실시태양에서, 샘플링 수단 및 본 발명의 하이브리드화 탐침을 포함하는 암 진단용 키트를 제공한다.
또 다른 실시태양에서, 본 발명의 키트는 면역학적 분석을 포함할 수도 있다. 상기와 같은 경우에, 상기 키트는 본 발명에 개시된 융합 단백질에 대한 특이성을 갖는 항체 또는 항원-결합 단편을 포함할 수 있다. 상기와 같은 면역학적 분석에 필요한 다양한 다른 시약들, 시험 스트립 등이 사용자에게 필요한 상기 설명서처럼 상기 키트 중에 함유될 것이다.
실시예
본 발명의 다양한 태양들을 하기 실시예들을 사용하여 예시에 의해 개시할 것이다. 본 발명에 제공된 실시예들은 단지 본 발명의 몇몇 특정 실시태양들을 예시하는 것이며 본 발명의 범위를 어떠한 식으로도 제한하고자 하는 것은 아니다.
실시예
1: 미토콘드리아 융합
전사물의
검출
PCT 출원 제 PCT/CA2007/001711 호(WO 2009/039601번으로 공개됨, 그의 전체 내용이 참고로 인용됨)에서 본 출원인에 의해 앞서 확인된 미토콘드리아 4977 "공통 결실" 및 3.4 kb 결실은 전립선 조직에서 올리고-dT 선택에 의해 확인된 바와 같은 활성 전사물을 갖는 독특한 개방 판독 프레임을 생성시킨다(도 2 및 3). 유방 조직 샘플의 검사는 상기 3.4 kb 결실로부터 생성되는 안정한 폴리아데틸화된 융합 전사물의 존재를 또한 밝힌다(도 4).
결실 전사물 검출을 위한 역 전사효소-PCR 프로토콜
RNA 단리 cDNA 합성
전체 RNA를 제조자의 설명에 따라 AurumTM 전체 RNA 지방 및 섬유 조직 키트(Bio-Rad, Hercules, CA)를 사용하여 급속 동결된 전립선 및 유방 조직 샘플(악성 및 종양에 인접한 정상 샘플 모두)로부터 단리하였다. 본 실험에서 게놈 DNA 오염을 피해야 했기 때문에, DNase I 처리 단계를 당해 분야에 통상적으로 공지된 바와 같은 방법을 사용하여 포함시켰다. RNA 양 및 질을 ND-1000 분광광도계(NanoDrop(등록상표) technologies)로 측정하였다. 약 100 g의 출발 물질로부터, 전체 RNA 농도는 100 내지 1000 ng/ul로 변하였으며 이때 260/280 비는 1.89 내지 2.10이었다. RNA 농도를 100 ng/ul로 조절하고 각각의 주형 2 ul을 제조자의 설명에 따라 RT-PCR을 위한 슈퍼스크립트(SuperScript)TM 첫 번째 가닥 합성 시스템(Invitrogen)과 함께 첫 번째 가닥 DNA 합성에 사용하였다. 안정한 폴리아데틸화된 융합 전사물을 확인하기 위해서, 폴리-A 꼬리로 전사물을 표적화하는 올리고(dT) 프라이머를 사용하였다.
PCR
실시간 PCR을 DNA 엔진 옵티콘(Engine Opticon®) 2 연속 형광 검출 시스템(Bio-Rad, Hercules, CA) 상의 iQTM SYBR® 그린 수퍼믹스(Bio-Rad, Hercules, CA)와 함께 각각의 cDNA 주형 5 ul을 사용하여 수행하였다. 상기 4977 bp 결실을 표적화하는 프라이머 쌍은 8416F 5'-CCTTACACTATTCCTCATCAC-3', 13637R 5'-TGACCTGTTAGGGTGAGAAG-3'이고; 상기 3.4 kb 결실에 대한 것은 ND4LF 5'-TCGCTCACACCTCATATCCTC-3', ND5R 5'-TGTGATTAGGAGTAGGGTTAGG-3'이다. 상기 반응 칵테일은 2X SYBR® 그린 수퍼믹스(100 mM KCL, 40 mM 트리스-HCl, pH 8.4, 0.4 mM의 각각의 dNTP[dATP, dCTP, dGTP 및 dTTP], iTaqTM DNA 폴리머라제, 50 단위/㎖, 6 mM MgCl2, SYBR® 그린 1, 20 nM 플루오레세인, 및 안정제), 250 nM 각각의 프라이머, 및 ddH2O를 포함하였다. PCR 순환 매개변수는 하기와 같았다: (1) 95 ℃ 2 분, (2) 95 ℃ 30 초, (3) 55 ℃(상기 4977 bp 결실의 경우) 및 63 ℃(상기 3.4 kb 결실의 경우), (4) 72 ℃ 45 초, (5) 플레이트 판독, 이어서 39 주기의 단계 3 내지 5, 및 4 ℃에서 최종 배양. 순환 역치 및 용융 곡선 분석과 별개로, 샘플들을 증폭 산물의 특수 가시화를 위해 아가로스 젤 상에서 실행시켰다(도 2 내지 4 참조).
도 2는 상기 미토콘드리아 게놈으로부터 3.4 kb 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시하는 아가로스 젤이다. 도 2에 대한 범례: B-블랭크, 레인 1 내지 6, cDNA에서 검출된 전사물들; 레인 7 내지 12, 레인 1 내지 6의 샘플들에 대한 역 전사효소(RT) 대조군이 없음.
도 3은 4977 kb 공통 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다. 도 3에 대한 범례: B-블랭크, 레인 1 내지 6, cDNA에서 검출된 전사물들; 레인 7 내지 12, 레인 1 내지 6의 샘플들에 대한 RT 대조군이 없음.
도 4는 상기 mt게놈으로부터의 3.4 kb의 상실에 의해 촉발된 유방 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다. 도 4에 대한 범례: 레인 2 내지 8, 유방 cDNA로부터의 전사물들; 레인 9, 음성(물) 대조군; 레인 10 및 11, 음성, 레인 2 및 3의 샘플들에 대한 대조군인 RT 없음.
이들 결과는 안정한 미토콘드리아 융합 전사물의 존재를 입증한다.
실시예
2: 융합 산물의 확인 및
표적화
다양한 하이브리드화 탐침들을 돌연변이된 미토콘드리아 게놈으로부터 생성되는 신규의 전사물, 예를 들어 3.4 kb 결실의 존재를 검출하고 추가로 입증하도록 디자인하였다. 이를 위해서, 정량적인 유전자 발현 분석을 위한 단일 분지된 DNA 플랫폼(QuantiGene 2.0TM, PanomicsTM)을 사용하였다. 본 실시예에 나열된 특정한 결실 및 서열들은 서열식별번호: 1로 인용된 전체 mtDNA 게놈에 대한 그들의 상대적인 위치에 근거한다. 본 실시예에서 디자인된 상기 탐침들에 대한 4 개 전사물들의 핵산 서열은 본 발명에서 하기와 같이 확인된다: 전사물 1(서열식별번호: 19), 전사물 2(서열식별번호: 20), 전사물 3(서열식별번호: 21), 및 전사물 4(서열식별번호: 22).
상기 3.4 kb 미토콘드리아 게놈 결실로부터의 연속적인 전사물의 예는 유전자 ND4L(NADH 데하이드로게나제 서브유닛 4L) 및 ND5(NADH 데하이드로게나제 서브유닛 5)에 대해서 존재한다. 서열식별번호: 20에 대한 상보성 서열을 갖는 탐침을 사용하여 전사물 2를 검출하였다. 반복적인 요소들이 ND4L 중의 10745 내지 10754 위치 및 ND5 중의 14124 내지 14133 위치에 존재한다.
상기 3.4 kb 결실은 ND4L의 3' 단부, 전체 ND4 유전자, tRNA 히스티딘, tRNA 세린2, tRNA 류신2, 및 ND5의 5' 단부의 대부분을 제거시켜(도 5a 참조), 10744(ND4L):14124(ND5)의 연결 점을 갖는 ND4L과 ND5의 유전자 연접을 생성시킨다(도 5b).
상기 첫 번째 유전자, ND4L의 원래 개시 코돈에서 출발함으로써, 아미노산 서열이 종결 코돈이 나타날 때까지 번역되었다. 본 실시예에서 상기 종결 코돈은 ND5의 원래 종결 코돈이다. 따라서, 2 개의 유전자를 함께 연접시킴에도 불구하고, 상기 판독 프레임은 완전하게 유지되어 길이가 100 아미노산(또는 300 bp)인 가설적인 또는 예견된 전사물이 생성된다. 상기 융합 단백질 전사물 생성물을 본 발명에서 서열식별번호: 37로서 나타낸다. 상기와 같은 단백질을 암호화하는 뉴클레오타이드 서열(서열식별번호: 3)은 10470 내지 10744:14124 내지 14148의 미토콘드리아 게놈 위치에 상응한다. 서열식별번호: 3은 상술한 방식으로 검출된 RNA 전사물(서열식별번호: 20)에 상보적인 DNA 서열이다.
유사하게, 전사물 1은 위치 8469:13447(서열식별번호: 19)과 결합된 ATPase 8과 ND5 사이의 융합 전사물이다. 전사물 3 및 4(각각 서열식별번호: 21 및 서열식별번호: 22)는 각각 뉴클레오타이드 위치 7974:15496 및 7992:15730과 결합된 COII와 Cytb 사이의 융합 전사물이다. 표 3은 본 실시예에 사용된 다양한 서열들 간의 관계에 대한 요약을 제공한다. 표 3은 검출된 융합 전사물, 상기 검출된 융합 전사물에 상보성인 DNA 서열 및 각 전사물에 대한 가설적인 번역 산물을 포함한다.
실시예
3: 전립선암에의 적용
상기 논의된 4 개의 융합 전사물, 즉 전사물 1 내지 4를 사용하여, 한 명의 환자로부터의 2 개의 전립선 조직 샘플을 분석하여 새로운 예견된 융합 전사물의 정량적인 차이를 평가하였다. 상기 실험의 결과를 하기 표 2에 제공하며, 여기에서 "Homog 1"은 환자로부터의 동결된 전립선 종양 조직의 균질물을 지칭하고, "Homog 2"는 상기 환자의 종양에 인접한 동결된 정상 전립선 조직의 균질물을 지칭한다. 이들 샘플을 25.8 ㎎의 Homog 1 및 28.9 ㎎의 Homog 2로 시작하는 제조자의 프로토콜(신선한 또는 동결된 동물 조직용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 처리하였다(분석 구성을 표 5에 나타낸다).
정상적인 인접 전립선 조직에 비해 전립선암 조직 중의 증가된 미토콘드리아 융합 전사물의 존재가 명백히 입증된다. 상기 융합 전사물은 훨씬 더 낮은 수준이긴 하지만, 상기 정상 조직 중에도 존재한다. 표적 전사물에 대한 탐침의 하이브리드화에 의해 발생된 상대적인 발광 단위(RLU)는 각 전사물의 풍부성에 직접 비례한다. 표 2는 또한 상기 샘플들에 대해서 취한 판독의 변화 계수 CV(퍼센트로서 나타냄)를 나타낸다. 상기 CV는 상기 값들의 평균으로 나눈 표준 편차를 포함한다. 암 조직에서 상기와 같은 안정하게 전사된 미토콘드리아 유전자 산물의 의미는 질병의 발전 및 진행을 암시한다.
실시예
4: 유방암에의 적용
실시예 3과 동일한 프로토콜을 사용하여, 그러나 오직 3.4 kb 게놈 결실과 관련된 신규의 융합 전사물인 전사물 2에만 초점을 두어, 2 개의 유방 종양 조직 샘플 및 2 개의 상기 종양에 인접한 종양 비 함유 조직 샘플뿐만 아니라 3 개의 전립선 종양 조직 샘플(하나의 샘플은 인접한 종양 비 함유 조직을 포함한다)에 대해 분석을 수행하였다. 이들 실시예의 결과를 표 4에 제공한다. 상응하는 정상 조직 구획을 갖는 전립선 종양 조직 샘플은 상기 종양 조직이 정상의 인접 조직보다 대략 2 배의 융합 전사물 양을 갖는다는 점에서 실시예 3에서 분석된 전립선 샘플과 유사한 패턴을 나타내었다. 상기 유방 종양 샘플은 인접한 비 종양 조직에 비해 융합 전사물 수준이 현저하게 증가된 것으로 나타났다. 상기 균질물의 1:100 희석을, 상기 희석이 실시예 3에서 인용된 실험에서 가장 재현적으로 수행되었으므로 상기 분석에 사용하였다.
따라서, 상기 논의된 결과는 전립선과 유방 조직 모두의 종양 검출에 있어서 본 발명 전사물의 적용을 예시한다.
실시예
5: 직장결장암에의 적용
본 연구는 직장결장암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 9 개의 대조군(양성) 조직 샘플(샘플 1 내지 9) 및 10 개의 종양(악성) 조직 샘플(샘플 10 내지 19)을 포함한 총 19 개의 샘플을 제조하였다. 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼). 7 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다. 상기 전사물들의 특징을 하기와 같이 요약한다:
유방암 전사물들의 특징 | ||
전사물 ID | 연결 부위 | 유전자 연결 |
2 | 10744:14124 | ND4L:ND5 |
3 | 7974:15496 | COII:Cytb |
10 | 7438:13476 | COI:ND5 |
11 | 7775:13532 | COII:ND5 |
12 | 8213:13991 | COII:ND5 |
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼") | N/A | N/A |
전사물 2 및 3은 실시예 3 및 4에 대해 상기 논의된 바와 동일함에 주목한다.
균질물들을 OCT 블록으로부터 대략 25 ㎎의 조직을 사용하여 제조하고 전사물 2 및 4의 경우 1:1 희석하고 전사물 10 및 11의 경우 1:8 희석하였다. 상기 전사물들의 양을 글로맥스(Glomax)TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다. 상기 분석은 상기 샘플들에 대한 RLU 값들로부터 하한을 감하여 배경을 나타내었다. 입력 RNA는 식 log2 aRLU - log2 hRLU(여기에서 a는 표적 융합 전사물이고 h는 하우스키퍼 전사물이다)을 사용하여 나타내었다.
상기 데이터의 분석은 하기의 단계들을 포함하였다:
a) 3중 분석을 위해 CV(변화 계수)를 설정한다; ≤15%의 경우 허용 가능하다.
b) 표적 융합 전사물(a) 및 하우스키퍼 전사물(h)의 3중 분석을 위해 평균 RLU 값을 설정한다.
c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.
d) 하한(l)을 (a)로부터 감한다.
e) log2 aRLU - log2 hRLU를 계산한다.
결과의 요약:
상기 분석의 결과를 도 6a 내지 6g에 예시하며, 이는 샘플 번호에 대한 log2 aRLU - log2 hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.
전사물
2:
정상(p<0.10) 및 악성(p>0.09) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.6129의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.73이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
3:
정상(p<0.05) 및 악성(p=0.03) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 4.0813의 컷오프 값을 사용하여 60%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.79이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
8:
정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -6.0975의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
9:
정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -7.5555의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
10:
정상(p≤0.01) 및 악성(p=0.01) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -3.8272의 컷오프 값을 사용하여 90%의 감도 및 67%의 특이성이 생성되고 상기 곡선 아래 면적은 0.84이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
11:
정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.1753의 컷오프 값을 사용하여 70%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
12:
정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.2626의 컷오프 값을 사용하여 70%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
결론:
상기 결과들은 결장직장암의 검출 및 정상 결장직장 조직으로부터 악성의 식별에 있어서 전사물 2, 3, 8, 9, 10, 11 및 12의 유용성을 예시한다. 상기 가리킨 바와 같이, 전사물 2 및 3은 또한 전립선암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 2는 또한 유방암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 흑색종 피부암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 10은 또한 폐암 및 흑색종의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 8은 또한 폐암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 7 개의 전사물들 중 임의의 것을 임상 현장에서 결장직장암의 특징 검출을 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.
실시예
6: 폐암에의 적용
본 연구는 폐암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 실시예 5에서와 같이, 9 개의 대조군(양성) 조직 샘플(샘플 1 내지 9) 및 10 개의 종양(악성) 조직 샘플(샘플 10 내지 19)을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼). 균질물들을 1:8 희석하였고 4 개의 표적 전사물 및 1 개의 하우스키퍼 전사물의 양을 글로맥스(Glomax)TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다.
본 실시예를 위해 하기의 전사물들을 제조하였다:
폐암 전사물들의 특징 | ||
전사물 ID | 연결 부위 | 유전자 연결 |
6 | 8828:14896 | ATPase6:Cytb |
8 | 6075:13799 | COI:ND5 |
10 | 7438:13476 | COI:ND5 |
20 | 8469:13447 | ATPase8:ND5 |
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼") | N/A | N/A |
본 실시예에 사용된 조직 샘플들은 하기의 특징들을 가졌다:
폐암 샘플들의 특징 | ||
샘플 | 악성 | 설명(조직의 공급원) |
1 | 없음 | 간질성 폐질병 |
2 | 없음 | 폐기종 |
3 | 없음 | 동맥류 |
4 | 없음 | 기관지폐렴, COPD |
5 | 없음 | 간의 악성 신생물, 기원을 알 수 없음, 폐의 석회화된 육아종 |
6 | 없음 | 사후 12 시간째, 순한 폐기종 |
7 | 없음 | 사후 12 시간째, 대 B 세포 림프종, 폐 부종, 폐렴 |
8 | 없음 | 폐렴, 부종, 폐포 손상 |
9 | 없음 | 울혈 및 부종 |
10 | 있음 | 선암종, 비-소 세포 |
11 | 있음 | 소 세포 |
12 | 있음 | 편평세포 암종, NSC, 폐기종 |
13 | 있음 | 선암종, 폐암, nsc, 전이 |
14 | 있음 | 편평세포 암종, 비-소 세포 |
15 | 있음 | 혼합된 편평 및 선암종 |
16 | 있음 | 비-소 세포 암종, 편평 |
17 | 있음 | 소 세포 암종 |
18 | 있음 | 선암종, 폐암, nsc |
19 | 있음 | 선암종, 폐암, nsc, 전이 |
상기 데이터의 분석을 실시예 5에 개시된 방법에 따라 수행하였다. 상기 결과를 도 7a, 7b, 7c 및 7d에 예시한다.
결과의 요약:
전사물
6:
정상(양성, p<0.1) 및 악성(p=0.60) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -6.5691의 컷오프 값을 사용하여 80%의 감도 및 71%의 특이성이 생성되고 상기 곡선 아래 면적은 0.77이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
8:
정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p<0.05, p=0.02). 상기 ROC 곡선에 의해 입증된 바와 같은 -9.6166의 컷오프 값을 사용하여 90%의 감도 및 86%의 특이성이 생성되고 상기 곡선 아래 면적은 0.86이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
10:
정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p≤0.01, p=0.01). 상기 ROC 곡선에 의해 입증된 바와 같은 -10.6717의 컷오프 값을 사용하여 90%의 감도 및 86%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
20:
정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p≤0.1, p=0.1). 상기 ROC 곡선에 의해 입증된 바와 같은 2.5071의 컷오프 값을 사용하여 70%의 감도 및 71%의 특이성이 생성되고 상기 곡선 아래 면적은 0.74이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
결론:
상기 실시예 6으로부터의 결과들은 폐암 종양의 검출 및 악성과 정상 폐암 조직간의 식별에 있어서 전사물 6, 8, 10, 및 20의 유용성을 예시한다. 이들 3 개의 전사물들 중 임의의 것을 임상 현장에서 폐암의 검출 또는 특성화를 위해 사용할 수 있다.
실시예
7: 흑색종에의 적용
본 연구는 흑색종의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 본 연구에서, 5 개의 대조군(양성) 조직 샘플 및 9 개의 악성 조직 샘플을 포함하여 총 14 개의 샘플을 사용하였다. 모든 샘플들을 포르말린 고정시켰으며, 파라핀 매몰시켰다(FFPE). 상기 FFPE 조직 샘플들을 균질화 전에 각각의 샘플이 대략 20 마이크론이 되도록 튜브 내로 절편화하고 제조자의 권고에 따라 균질화하였다(FFPE 샘플용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼). 균질물들을 1:4 희석하였고 7 개의 표적 전사물 및 1 개의 하우스키퍼 전사물의 양을 글로맥스(Glomax)TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다.
본 실시예에 사용된 14 개의 조직 샘플들은 하기의 특징들을 가졌다:
흑색종 암 샘플들의 특징 | ||
샘플 | 악성 | 설명(조직의 공급원) |
1 | 없음 | 유방축소 조직(피부) |
2 | 없음 | 유방축소 조직(피부) |
3 | 없음 | 유방축소 조직(피부) |
4 | 없음 | 유방축소 조직(피부) |
5 | 없음 | 유방축소 조직(피부) |
6 | 있음 | 악성흑색점, (같은 장소 흑색종) 침습성 흑색종 존재하지 않음 |
7 | 있음 | 침습성 악성 흑색종 |
8 | 있음 | 결절성 흑색종, pT3b, 악성흑색점의 관련 특징 |
9 | 있음 | 잔류성의 표면에 퍼져있는 침습성 악성 흑색종, 클라크 수준 II |
10 | 있음 | 표면에 퍼져있는 악성 흑색종, 클라크 수준 II |
11 | 있음 | 결절성 악성 흑색종, 클라크 수준 IV |
12 | 있음 | 같은 장소에서 표면에 퍼져있는 악성 흑색종, 침습의 증거 없음 |
13 | 있음 | 표면에 퍼져있는 악성 흑색종, 클라크 수준 II, 집중하여 존재하는 수직 상 |
14 | 있음 | 같은 장소에서 표면에 퍼져있는 악성 흑색종, 클라크 수준 I |
본 실시예를 위해 하기의 전사물들을 제조하였다:
흑색종 암 전사물들의 특징 | ||
전사물 ID | 연결 부위 | 유전자 연결 |
6 | 8828:4896 | ATPase6:Cytb |
10 | 7438:13476 | COI:ND5 |
11 | 7775:13532 | COII:ND5 |
14 | 9191:12909 | ATPase6:ND5 |
15 | 9574:12972 | COIII:ND5 |
16 | 10367:12829 | ND3:ND5 |
20 | 8469:13447 | ATPase8:ND5 |
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼") | N/A | N/A |
나타낸 바와 같이, 전사물 10 및 11을 또한 실시예 5에 사용하였다. 상기 데이터의 분석을 실시예 5에 개시된 방법에 따라 수행하였다. 상기 결과를 도 8a 내지 8g에 예시한다.
결과의 요약:
전사물
6:
정상(p≤0.01) 및 악성(p=0.01) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -5.9531의 컷오프 값을 사용하여 89%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
10:
정상(p≤0.05) 및 악성(p=0.05) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -4.7572의 컷오프 값을 사용하여 89%의 감도 및 40%의 특이성이 생성되고 상기 곡선 아래 면적은 0.82이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
11:
정상(p<0.05) 및 악성(p=0.02) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 1.6762의 컷오프 값을 사용하여 78%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
14:
정상(p≤0.05) 및 악성(p=0.05) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -4.9118의 컷오프 값을 사용하여 89%의 감도 및 60%의 특이성이 생성되고 상기 곡선 아래 면적은 0.82이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
15:
정상(p<0.1) 및 악성(p=0.07) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -7.3107의 컷오프 값을 사용하여 100%의 감도 및 67%의 특이성이 생성되고 상기 곡선 아래 면적은 0.80이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
16:
정상(p<0.05) 및 악성(p=0.03) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -10.5963의 컷오프 값을 사용하여 89%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.878이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
20:
정상(p<0.05) 및 악성(p=0.04) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -8.3543의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
결론:
상기 실시예 7로부터의 결과들은 악성 흑색종의 검출에 있어서 전사물 6, 10, 11, 14, 15, 16 및 20의 유용성을 예시한다. 상기 나타낸 바와 같이, 전사물 10 및 11은 또한 결장직장암의 검출에서도 유용성을 갖는 반면 전사물 6은 폐암의 검출에서 유용성을 갖는 것으로 밝혀졌다. 질병에 의한 전사물 요약을 표 6에 제공한다.
실시예
8: 난소암에의 적용
본 연구는 난소암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 10 개의 대조군(양성) 조직 샘플(샘플 1 내지 10) 및 10 개의 종양(악성) 조직 샘플(샘플 11 내지 20)을 포함한 총 20 개의 샘플을 제조하였다. 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼). 8 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다.
본 실시예에 사용된 20 개의 조직 샘플들은 하기의 특징들을 가졌다:
난소암 샘플들의 특징 | ||
샘플 | 진단 | 설명 |
1 | 정상 | 난포낭종 |
2 | 정상 | 섬유종 |
3 | 정상 | 난소에 병적인 변화 없음 |
4 | 정상 | 난포낭종 |
5 | 정상 | 세포성 섬유종 |
6 | 정상 | 양성 난포 및 단순 낭종 |
7 | 정상 | 평활근종, 백체 |
8 | 정상 | 백체 및 상피 봉입낭 |
9 | 정상 | 백체 |
10 | 정상 | 백체, 표면 봉입낭, 난포낭종 |
11 | 악성 | 장막을 포함한 고 등급의 불충분하게 분화된 유두 장액 암종 |
12 | 악성 | 자궁내막성 선암종, 국소 장액 분화에 따라 잘 분화된 것에서부터 보통으로 분화된 것 |
13 | 악성 | 유두 장액 암종 |
14 | 악성 | 혼합된 상피 암종 우세한 유두 장액 암종 |
15 | 악성 | 고 등급: 장액 암종, 유두 및 고형 성장 패턴 |
16 | 악성 | 고 등급(3/3)의 유두 장액 암종 |
17 | 악성 | 유두 장액 암종, 높은 핵 등급 |
18 | 악성 | 유두 장액 낭성선암종 등급: III |
19 | 악성 | 불충분하게 분화된 유두 장액 암종 |
20 | 악성 | 잘 분화된 선암종, 자궁내막성 유형, 등급 1 |
상기 전사물들의 특징을 하기와 같이 요약한다:
난소암 전사물들의 특징 | ||
전사물 ID | 연결 부위 | 유전자 연결 |
1 | 8469:13447 | ATPase8:ND5 |
2 | 10744:14124 | ND4L:ND5 |
3 | 7974:15496 | COII:Cytb |
6 | 8828:14896 | ATPase6:Cytb |
11 | 7775:13532 | COII:ND5 |
12 | 8213:13991 | COII:ND5 |
15 | 9574:12972 | COIII:ND5 |
20 | 8469:13447 | ATPase8:ND5 |
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼") | N/A | N/A |
전사물 1, 2, 3, 6, 11, 12, 15 및 20은 실시예 3 내지 7에 대해 상기 논의된 바와 동일함에 주목한다.
균질물들을 대략 25 ㎎의 동결된 조직을 사용하여 제조하고 1:4 희석하였다. 상기 전사물들의 양을 글로맥스(Glomax)TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다. 상기 분석은 상기 샘플들에 대한 RLU 값들로부터 하한을 감하여 배경을 나타내었다. 입력 RNA는 식 log2 aRLU - log2 hRLU(여기에서 a는 표적 융합 전사물이고 h는 하우스키퍼 전사물이다)을 사용하여 나타내었다.
상기 데이터의 분석은 하기의 단계들을 포함하였다:
a) 3중 분석을 위해 CV(변화 계수)를 설정한다; ≤15%의 경우 허용 가능하다.
b) 표적 융합 전사물(a) 및 하우스키퍼 전사물(h)의 3중 분석을 위해 평균 RLU 값을 설정한다.
c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.
d) 하한(l)을 (a)로부터 감한다.
e) log2 aRLU - log2 hRLU를 계산한다.
결과의 요약:
상기 분석의 결과를 도 9a 내지 9h에 예시하며, 이는 샘플 번호에 대한 log2 aRLU - log2 hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.
전사물
1:
정상(p<0.05) 및 악성(p=0.002) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -11.1503의 컷오프 값을 사용하여 90%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.91이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
2:
정상(p<0.01) 및 악성(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6962의 컷오프 값을 사용하여 90%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
3:
정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6754의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
6:
정상(p<0.01) 및 악성(p=0.007) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.6479의 컷오프 값을 사용하여 90%의 감도 및 70%의 특이성이 생성되고 상기 곡선 아래 면적은 0.86이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
11:
정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -1.3794의 컷오프 값을 사용하여 100%의 감도 및 90%의 특이성이 생성되고 상기 곡선 아래 면적은 0.99이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
12:
정상(p<0.01) 및 악성(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -1.2379의 컷오프 값을 사용하여 90%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
15:
정상(p<0.05) 및 악성(p=0.023) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -8.6926의 컷오프 값을 사용하여 70%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.80이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
20:
정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6521의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
결론:
상기 결과들은 난소암의 검출 및 정상 난소 조직으로부터 악성의 식별에 있어서 전사물 1, 2, 3, 6, 11, 12, 15 및 20의 유용성을 예시한다. 전사물 1, 2 및 3은 또한 전립선암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 6은 또한 흑색종 및 폐암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 흑색종 피부암, 결장직장암 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 12는 또한 결장직장암 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 15는 또한 흑색종 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 20은 또한 결장직장암, 흑색종 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 8 개의 전사물들 중 임의의 것을 임상 현장에서 난소암의 특징 검출을 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.
실시예
9:
고환암에의
적용
본 연구는 고환암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 8 개의 대조군(양성) 조직 샘플(샘플 1 내지 8) 및 9 개의 종양(악성) 조직 샘플(샘플 9 내지 17)을 포함한 총 17 개의 샘플을 제조하였으며, 상기 악성 샘플 중 5 개는 비-정상피종이고(샘플 9 내지 13) 4 개는 정상피종이었다(샘플 14 내지 17). 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene® 샘플 처리 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼). 10 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다.
본 실시예에 사용된 17 개의 조직 샘플들은 하기의 특징들을 가졌다:
고환암 샘플들의 특징 | ||
샘플 | 일반적인 진단 | 계층화된 악성 진단 |
1 | 양성 | 양성 |
2 | 양성 | 양성 |
3 | 양성 | 양성 |
4 | 양성 | 양성 |
5 | 양성 | 양성 |
6 | 양성 | 양성 |
7 | 양성 | 양성 |
8 | 양성 | 양성 |
9 | 악성 | 비-정상피종 |
10 | 악성 | 비-정상피종 |
11 | 악성 | 비-정상피종 |
12 | 악성 | 비-정상피종 |
13 | 악성 | 비-정상피종 |
14 | 악성 | 정상피종 |
15 | 악성 | 정상피종 |
16 | 악성 | 정상피종 |
17 | 악성 | 정상피종 |
상기 전사물들의 특징을 하기와 같이 요약한다:
고환암 전사물들의 특징 | ||
전사물 ID | 연결 부위 | 유전자 연결 |
2 | 10744:14124 | ND4L:ND5 |
3 | 7974:15496 | COII:Cytb |
4 | 7992:15730 | COII:Cytb |
11 | 7775:13532 | COII:ND5 |
12 | 8213:13991 | COII:ND5 |
13 | 9144:13816 | ATPase6:ND5 |
15 | 9574:12972 | COIII:ND5 |
16 | 10367:12829 | ND3:ND5 |
20 | 8469:13447 | ATPase8:ND5 |
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼") | N/A | N/A |
전사물 2, 3, 4, 11, 12, 15, 16 및 20은 실시예 3 내지 8에 대해 상기 논의된 바와 동일함에 주목한다.
균질물들을 대략 25 ㎎의 동결된 조직을 사용하여 제조하고 1:4 희석하였다. 상기 전사물들의 양을 글로맥스(Glomax)TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다. 상기 분석은 상기 샘플들에 대한 RLU 값들로부터 하한을 감하여 배경을 나타내었다. 입력 RNA는 식 log2 aRLU - log2 hRLU(여기에서 a는 표적 융합 전사물이고 h는 하우스키퍼 전사물이다)을 사용하여 나타내었다.
상기 데이터의 분석은 하기의 단계들을 포함하였다:
a) 3중 분석을 위해 CV(변화 계수)를 설정한다; ≤15%의 경우 허용 가능하다.
b) 표적 융합 전사물(a) 및 하우스키퍼 전사물(h)의 3중 분석을 위해 평균 RLU 값을 설정한다.
c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.
d) 하한(l)을 (a)로부터 감한다.
e) log2 aRLU - log2 hRLU를 계산한다.
결과의 요약:
상기 분석의 결과를 도 10 내지 18에 예시하며, 이는 샘플 번호에 대한 log2 aRLU - log2 hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.
일부 전사물들은 양성과 악성 고환 조직 사이를 식별하지만, 다른 것들은 정상피종 및 비-정상피종 및/또는 양성 고환 조직의 종양 서브유형들 간의 구별을 나타낸다. 따라서 각 부류로부터의 전사물들의 병용은 고환암의 검출뿐만 아니라 정상피종 또는 비-정상피종의 서브유형들로의 분류를 용이하게 할 것이 기대된다.
전사물
2:
정상(p<0.05) 및 악성 정상피종(p=0.02) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.5621의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.024) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 2.1006의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.90이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
3:
정상(p<0.05) 및 악성 정상피종(p=0.018) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.969의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.969이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.017) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.8181의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.9이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
4:
정상(p<0.05) 및 악성 (p=0.034) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.7628의 컷오프 값을 사용하여 67%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.833이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
11:
정상(p<0.05) 및 악성 정상피종(p=0.016) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.732의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.016) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.9884의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.90이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
12:
정상(p<0.1) 및 악성 정상피종(p=0.056) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.5361의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.969이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.044) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.6039의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.9이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
13:
정상(p<0.05) 및 악성(p=0.019) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.8751의 컷오프 값을 사용하여 87.5%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.875이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 또한 악성 비-정상피종(p<0.01) 및 양성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -13.9519의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.975이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.01) 및 악성 비-정상피종(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -15.8501의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
15:
정상(p<0.1) 및 악성 (p=0.065) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -5.4916의 컷오프 값을 사용하여 75%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.833이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
16:
정상(p<0.05) 및 정상피종과 비-정상피종 모두를 포함하는 악성(p=0.037) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -6.448의 컷오프 값을 사용하여 89%의 감도 및 75%의 특이성이 생성되고 상기 곡선 아래 면적은 0.806이며 이는 시험이 양호하게 정확함을 가리킨다. 또한 정상(p<0.05) 및 악성 정상피종(p=0.037) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -7.4575의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.938이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
전사물
20:
정상(p<0.01) 및 악성 정상피종(p=0.006) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.8364의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.01) 및 악성 비-정상피종(p=0.004) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.6065의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.
결론:
상기 결과들은 고환암 및 고환암 서브유형들의 검출 및 정상 고환 조직으로부터 악성의 식별에 있어서 전사물 2, 3, 4, 11, 12, 13, 15, 16 및 20의 유용성을 예시한다. 전사물 2는 또한 전립선, 유방, 결장직장 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 3은 또한 전립선, 유방, 흑색종, 결장직장 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 4는 또한 전립선 및 결장직장암 의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 결장직장, 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 12는 또한 결장직장암 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 15는 또한 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 16은 또한 결흑색종 피부암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 20은 또한 결장직장암, 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 9 개의 전사물들 중 임의의 것을 임상 현장에서 난소암의 검출 또는 특성화를 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.
하나의 태양에서, 본 발명은 조직 샘플 중의 암의 존재를 측정하기 위한 분석을 수행하기 위한 키트를 제공한다. 상기 키트는 상술한 바와 같은 분석을 수행하는데 필요한 시약들을 포함한다. 특히, 상기 키트는 상술한 전사물 1 내지 17, 및 20에 상응하는 하나 이상의 하이브리드화 탐침을 함유하는 하나 이상의 용기를 포함한다. 이해되는 바와 같이, 상기 분석을 수행하기 위한 시약들은 임의의 필수 완충제, 염, 검출 시약 등을 포함할 수도 있다. 더욱이, 상기 키트는 예를 들어 균질화 또는 핵산 추출에 의해 상기 조직 샘플을 제조하는데 필요한 조직 샘플, 시약 또는 물질을 수득하기 위해서, 및 주 분석 또는 분석들을 수행하기 위해 임의의 필수 샘플 수집 장치, 용기 등을 포함할 수 있다. 상기 키트는 병든 또는 병들지 않은 조직에 허용 가능한 값을 설정 또는 확인하기 위해서 대조용 조직 또는 샘플을 또한 포함할 수도 있다.
실시예
10: 융합 단백질의 검출
세포주
융합 단백질의 존재를 2 개의 인간 전립선 세포주에서 조사하였다. 첫 번째로 정상 전립선 세포주 RWPE-1(ATCC Cat# CRL-11609), 상기 세포는 누드 마우스에서 비 종양발생성이며, 조직학적으로 정상인 성인 인간 전립선 세포 중 인간 유두종 바이러스 18에 의한 감염에 의해 확립되었다. 두 번째로 종양발생 세포주 WPE1-NA22를 검사하였다(ATCC Cat#CRL-2849). 상기 세포를 N-메틸-N-니트로소유레아에의 노출에 이어서 상기 RWPE-1 세포로부터 유도하였다. 상기 세포는 그의 모 세포주 RWPE-1과 달리 누드 마우스에서 종양발생성이다.
상기 두 세포주 모두 각질세포 무 혈청 배지(Invitrogen Cat#17005-042)에서 증식시켰으며, 배지는 소 뇌하수체 추출물 및 인간 재조합 표피 성장 인자가 보충된다. 세포를 90% 융합률로 증식시키고 이어서 TrypLE 셀렉트(Invitrogen Cat#12563029)를 사용하여 트립신 처리하였다. 이어서 세포를 자동화된 계수 시스템(Invitrogen Countess Cat#C10227)을 사용하여 카운트하고, 이어서 분액들을 급속 동결시키고 -80 ℃에서 보관하였다.
단백질 추출
세포 분획물을 큐프로테옴(Qproteome) 미토콘드리아 단리 키트(Qiagen Cat#37612)를 사용하여 RWPE1 및 WPE1-NA22 세포주 모두로부터 추출하였다. 미토콘드리아 및 세포질 분획물들을 모두 1 x 107 세포로부터 추출하였다. 이어서 단백질 농도를 퀴비트(Qubit) 형광계(Invitrogen Cat#Q32857) 상에서 측정되는 형광 단백질 분석(Quant-IT Protein, Invitrogen Cat#Q33211)을 사용하여 계산하였다.
SDS
-
PAGE
젤 전기영동
SDS-Page 전기영동을 큐프로테옴 미토콘드리아 단리 키트를 사용하여 제조한 미토콘드리아 및 시토졸 분획물 상에서 수행하였다. 20 ㎍의 단백질을 MES 실행 완충제(Invitrogen Cat#NP00020)를 사용하여, 4 내지 12% 미리성형된(Invitrogen Nupage Cat#NP0321) 비스-트리스 젤 환원 젤 상의 각 레인에서 실행시켰다. 상기 젤을 콜로이드성 청색 젤 색소(Invitrogen Cat#LC6025)로 밤새 염색하였다. 결과를 도 19에 예시한다. 도 19에 예시된 8 개의 젤 조각들 각각에 함유되는 것으로 예견되는 단백질들의 대략적인 크기(kD) 범위는 하기와 같다:
1 | 60-80 |
2 | 50-60 |
3 | 40-50 |
4 | 30-40 |
5 | 20-30 |
6 | 15-20 |
7 | 10-15 |
8 | 3.5-10 |
LCMS
8 개의 젤 조각을 콜로이드성의 청색 염색된 1D SDS-PAGE(도 19)의 각 레인으로부터 및 하기의 표준 과정에 따라 트립신으로 절단된 젤 중에서 절단하였다.
상기 절단 산물들은 상기 젤로부터 용출되고 증발되었다. 1 회 분취량을 LCMS 시스템(Dionex/Thermo LTQ XL orbitrap에 온라인 연결된 LC Packings Ultimate 3000) 상에 주입하고 5% MeCN에서 출발하여 110 분에 걸쳐 40% MeCN으로 가는 선형 구배 및 이온쌍 작용제로서의 포름산을 사용하여 300 ㎖/분의 유속으로 25 ㎝(75 um ID) PepMap(Dionex) 상에서 분리시켰다. MS 스펙트럼을 60000(400 Da)의 분해능으로 상기 오비트랩(orbitrap)에서 수집하고 MSMS 스펙트럼은 낮은 분해능으로 선형 이온 트랩에서 수집하였다.
데이터를 써모 프로테옴 디스커버러(Thermo Proteome Discoverer)를 사용하여 처리하여 .mgf(마스코트 유전자 포맷) 피크 목록 파일을 생성시켰으며, 이를 집에서 X!Tandem에 제출하여, 인간 프로테옴(ensembl) 및 앞서 개시된 융합 전사물들을 기본으로 하는 예견된 융합 단백질을 포함하는 맞춤 데이터베이스를 검색하였다. 오류 발견율(FDR)을 계산하기 위해서, 상기 검색된 데이터베이스는 모든 단백질들의 역 서열을 또한 포함하였다.
단백질 복합체 분석
상기 X!Tandem 맞춤 데이터베이스 검색의 종료 시, 모든 확인된 단백질 및 융합 전사물들은 반송되었다. 상기 단백질들을 그들의 log(e)+ 값에 의해 평가하고 상기 log(e)+ 가 -1 미만인 경우 유의수준으로서 분류하였으며, -3 미만의 log(e)+ 를 갖는 단백질들이 바람직하다. 융합 단백질들을 상기 샘플 젤 조각 중에 존재하는 융합 전사물의 기여 유전자들 각각으로부터의 하나 이상의 펩타이드의 존재에 의해 확인하였다. 상기 LC/MS-MS에 의한 상기 확인된 펩타이드로부터의 단백질 서열 유효범위를 적색으로 나타낸다. 실험 조건으로 인해 펩타이드를 관찰하기 어려울 수도 있는 단백질의 서열은 녹색으로 나타낸다. 최종적으로, 검은색으로 나타낸 단백질 서열은 펩타이드를 확인할 가능성이 애매함을 나타낸다.
확인된 융합 단백질의
실시예
다수의 미토콘드리아 융합 단백질들을 본 방법을 사용하여 확인하였다. 상기와 같은 융합 단백질들 중 4 개를 전형적인 예로서 하기에 개시한다.
실시예
융합 단백질 1
도 20a는 P0026으로서 확인된 융합 전사물에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 시토크롬 c 옥시다제 서브유닛 2(CO2) N-말단 펩타이드 ILYMTDEVNDPSLTIK 및 NADH-유비퀴논 옥시도리덕타제 쇄 3(ND3) C-말단 펩타이드 STPYECGFDPMSP(도 20a)의 존재로부터 상기 미토콘드리아 NA22 세포주(도 19)의 조각 7에서 확인되었다(log(e)+ = -13.2).
야생형 CO2의 가장 C-말단의 트립신 펩타이드, IFEMGPVFTL을 모든 미토콘드리아 NA22 세포 주 젤 조각.xml 데이터에 대해 검색하였다. 상기 펩타이드는 오직 젤 조각 5에서만 관찰되었다(도 19). 이는 모든 젤 조각들에 대해 인간(SwissProt) 데이터베이스(융합 전사물 없음)를 검색한 후 오직 미토콘드리아 NA22 세포 주 젤 조각 5에서 CO2 야생형 (log(e)+ = -42.9)(도 20b)을 확인함으로써 추가로 입증되었다.
시토크롬 c 옥시다제 서브유닛 2 펩타이드 ILYMTDEVNDPSLTIK가 젤 조각 5 및 7에서 관찰되었다. 이는 ∼25 kD의 분자량을 갖는 야생형 CO2가 20-30 kDa 젤 조각 5 중에 존재하고, CO2 N-말단의 단편이 젤 조각 7 중에 존재함을 가리킨다. DN3으로부터의 트립신 펩타이드 STPYECGFDPMSP는 오직 젤 조각 7(10-15 kDa)에서 확인되며, 상기 조각 7은 야생형 유전자(13 kDa) 및 P0026의 C-말단을 나타낸다.
융합 전사물 P0026의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 56, 서열식별번호: 57 및 서열식별번호: 58로서 제공된다.
실시예
융합 단백질 2
도 21a는 융합 전사물 P0062에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 NADH 데하이드로게나제 서브유닛 1(ND1) N-말단 펩타이드 KGPNVVGPYGLLQPFADAMK 및 YDQLMHLLWK 및 ATP 신타제 서브유닛 6 C-말단 펩타이드 LITTQQWLIK의 존재로부터 상기 미토콘드리아 NA22 세포주의 조각 5(20-30 kDa)(도 19에 도시됨)에서 확인되었다(log(e)+ = -41.2). 3 개의 펩타이드는 모두 미토콘드리아 NA22 세포 주 젤 조각 5(도 19)에서 확인되었지만 ND1의 가장 C-말단의 펩타이드(YDQLMHLLWK)는 오직 젤 조각 5에서만 존재하며, 상기 야생형(도 21b) 및 융합 전사물 P0062에 상응하는 융합 단백질 모두가 존재할 수 있다.
융합 전사물 P0062의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 59, 서열식별번호: 60 및 서열식별번호: 61로서 제공된다.
실시예
융합 단백질 3
도 22는 융합 전사물 P0064에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 ND1의 N-말단으로부터의 펩타이드 KGPNVVGPYGLLQPFADAMK 및 NADH 데하이드로게나제 서브유닛 2(ND2) C-말단 펩타이드 WAIIEEFTK를 갖는 상기 미토콘드리아 NA22 세포주의 조각 4(도 19에 도시됨)에서 확인되었다(log(e)+ = -22). 상기 ND1 C-말단 펩타이드 YDQLMHLLWK는 젤 조각 4에서 관찰되지 않았으며 P0064 및 ND2의 예상된 크기를 근거로 젤 조각 4가 P0064 및 ND2를 함유함을 암시한다.
융합 전사물 P0064의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 62, 서열식별번호: 63 및 서열식별번호: 64로서 제공된다.
실시예
융합 단백질 4
도 23a는 융합 전사물 P0176에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 ND1의 N-말단으로부터의 펩타이드 KGPNVVGPYGLLQPFADAMK 및 시토크롬 c 옥시다제 서브유닛 1(CO1) C-말단 펩타이드 VFSWLATLHGSNMK 및 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK를 갖는 상기 미토콘드리아 NA22 세포주(도 19)의 조각 4에서 확인되었다(log(e)+ = -33.8). 상기 CO1 펩타이드들 모두는 55 kDa의 예상 크기에도 불구하고 오직 상기 미토콘드리아 NA22 세포 주의 젤 조각 4(30-40 kDa)에서만 함께 관찰되었다. 이는 모든 젤 조각들에 대해 인간(SwissProt) 데이터베이스(융합 전사물 없음)를 검색한 후 오직 미토콘드리아 NA22 세포 주 젤 조각 4에서 CO1 야생형 (log(e)+ = -14.6)(도 23b)을 확인함으로써 추가로 입증되었다.
젤 조각 4에서 관찰된 유일한 ND1 펩타이드는 KGPNVVGPYGLLQPFADAMK이었다. 상기 ND1 C-말단 펩타이드 YDQLMHLLWK가 존재하지 않았으므로, 야생형 D1은 상기 조각에 존재하지 않으며, 이는 P0176의 존재를 지지한다.
융합 전사물 P0176의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 65, 서열식별번호: 66 및 서열식별번호: 67로서 제공된다.
상응하는 융합
전사물
상기 4 개의 융합 단백질들 각각과 관련된 융합 전사물들의 정량적인 측정을 일련의 세포주들에서 수행하였으며, 상기 세포주들 중 2개는 LC-MS/MS 실험에 사용된 것들, 구체적으로 RWPE-1 및 WPE1-NA22(침습 잠재성이 낮은 악성 세포주이다)이었다. 이들 측정의 결과를 도 24a 내지 24d에 예시하며, 이들은 상기 논의된 4 개의 단백질에 상응한다. 도 24a-d에서, 세포주 RWPE-1은 NO로서 나타내고 세포주 WPE1-NA22는 LI로서 나타낸다. 본 실험에 포함된 추가의 세포주들은 보통 침습 잠재성(MI), 높은 침습 잠재성(HI), 및 매우 높은 침습 잠재성(VH)을 갖는 암의 계속되는 진행을 나타낸다.
상기 세포를 용해시키고 본 발명에 개시된 바와 같이 또는 앞서 PCT 출원 제 PCT/CA2009/000351 호(WO2009/117811번으로서 공개됨)(이의 전체 내용은 본 발명에 참고로 인용된다)에 개시된 바와 같이 분지하는 DNA 플랫폼상의 각각의 융합 전사물에 특이적인 맞춤 탐침을 사용하여 분석하였다. 결과는 높은 발현 수준을 나타내었다(106 내지 108 범위의 RLU 값을 가짐). 각 융합 전사물의 양에 있어서, 정상 세포에서부터 악성 세포(NO-LI)로의 초기 변형이 상기 전사물의 양의 현저한 변화에 의해서, 이어서 악성의 진행이 LI에서부터 VH로 진행함에 따라 상기 양의 연속적인 증가 또는 연속적인 감소에 의해 중단된다는 일반적인 성향이 관찰되었다.
본 발명을 몇몇 특정한 실시태양들을 참고로 개시하였지만, 본 발명의 다양한 변경들이 첨부된 청구의 범위에 개략된 바와 같은 본 발명의 목적 및 범위로부터 이탈되지 않음은 당해 분야의 숙련가들에게 자명할 것이다. 본 발명에 제공된 임의의 실시예들은 단지 본 발명을 예시할 목적으로 포함되며 본 발명을 어떠한 식으로도 제한하고자 하지 않는다. 본 발명에 제공된 임의의 도면들은 오직 본 발명의 다양한 태양들을 예시하기 위한 것이며 본 발명을 어떠한 식으로도 축소하거나 제한하고자 하는 것은 아니다. 본 발명에 인용된 모든 종래 기술들의 내용은 그 전체가 본 발명에 참고로 인용된다.
인용문헌
특히 하기의 참고문헌들을 상기 설명에 인용하였다. 이들 참고문헌의 전체 내용을 본 발명에 참고로 인용한다.
RNA | Homog 1 | Homog 2 | RNA | Homog 1 | Homog 2 | RNA | Homog 1 | Homog 2 | RNA |
전사물 1 | 전사물 1 | 전사물 1 | 전사물 2 | 전사물 2 | 전사물 2 | 전사물 3 | 전사물 3 | 전사물 3 | 전사물 4 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
2957 | 353 | 233 | 144838 | 75374 | 17192 | 348424 | 333189 | 213844 | 509 |
3174 | 475 | 298 | 202793 | 100062 | 31750 | 320877 | 278137 | 210265 | 401 |
1041 | 262 | 114 | 106195 | 98403 | 36191 | 238467 | 248677 | 123497 | 181 |
1040 | 272 | 176 | 120308 | 116930 | 50323 | 239231 | 262520 | 129778 | 153 |
318 | 170 | 110 | 25155 | 64823 | 27725 | 100345 | 164606 | 85287 | 72 |
287 | 150 | 109 | 23500 | 50524 | 24629 | 100856 | 178527 | 84731 | 83 |
100 | 76 | 123 | 3002 | 12960 | 252 | 29203 | 102309 | 137 | 31 |
94 | 83 | 91 | 1263 | 5796 | 285 | 29092 | 97257 | 96 | 45 |
5.0 | 20.9 | 17.3 | 23.6 | 19.9 | 42.1 | 5.8 | 12.7 | 1.2 | 16.9 |
0.1 | 2.5 | 30.1 | 8.8 | 12.2 | 23.1 | 0.2 | 3.8 | 3.5 | 12.0 |
7.1 | 9.0 | 0.6 | 4.8 | 17.5 | 8.4 | 0.4 | 5.7 | 0.5 | 9.8 |
4.7 | 6.0 | 20.8 | 57.7 | 54.0 | 8.8 | 0.3 | 3.6 | 25.0 | 27.0 |
*표에서 결과 단위들은 RLU(상대 발광 단위)이며; 데이터를 GlorunnerTM 상에서 판독한다.
%CV = 변화 계수(%로서)
범례: Homog = 균질물
Homog 1: 환자로부터의 전립선 종양 조직 샘플;
Homog 2: 환자로부터의 종양에 인접한 조직학적으로 정상인 조직
RNA: 대조용: 전립선 조직(Ambion p/n 7988)으로부터 전체 RNA
음영: 배경 측정치)
결실/전사물/가상 번역 산물 관계 | ||||
결실 | RNA 전사물 | RNA 전사물에 상보적인 결실을 갖는 DNA 서열 | 전사물 번호 |
가상 융합 단백질 |
ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛 미토콘드리아 위치 8366-14148 (서열식별번호: 1과 관련하여) 번역서열은 8389번 위치에서 시작한다 |
서열식별번호: 19 |
서열식별번호: 2 |
1 | 서열식별번호: 36 |
NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 NADH 데하이드로게나제 서브유닛 5(ND5); 미토콘드리아 위치 10470-14148(서열식별번호: 1과 관련하여) | 서열식별번호: 20 |
서열식별번호: 3 |
2 | 서열식별번호: 37 |
시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb); 미토콘드리아 위치 7586-15887 (서열식별번호: 1과 관련하여) |
서열식별번호: 21 |
서열식별번호: 4 |
3 | 서열식별번호: 38 |
시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb); 미토콘드리아 위치 7586-15887 (서열식별번호: 1과 관련하여) |
서열식별번호: 22 |
서열식별번호: 5 |
4 | 서열식별번호: 39 |
유방종양 1 | 유방종양에 인접한 정상 1 | 유방종양 2 | 유방종양에 인접한 정상 2 | 전립선 종양 3 | 전립선 종양 4 | 전립선 종양 5 | ||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||||
1:100 희석 | E | 68920 | 2971 | 49108 | 1245 | 46723 | 56679 | 99836 | ||
1:100 희석 복제물 | F | 92409 | 3017 | 60637 | 1512 | 53940 | 56155 | 100582 | ||
G | 420 | 3 | 31 | 6 | 26 | 25 | 44 | |||
H | 518 | 3 | 4 | 5 | 5 | 3 | 4 | |||
% CV | 20.6 | 1.1 | 14.9 | 13.7 | 10.1 | 0.7 | 0.5 | |||
-표의 결과 단위는 RLU(상대 발광 단위)이다
-배경 G1, H1
-빈 웰 G2-G8, H2-H8)
균질물 1 - 26 ㎎의 조직을 사용하여 프로테이나제 K(PK)로 700 ul H 용액 중에서 균질화시킴. Qiagen TissueRuptor 사용됨. 희석을 위해 균질물 상등액 400 ul, 20, 10 및 5 ul 사용됨.
균질물 1 = 종양성 전립선으로부터의 종양 조직
균질물 2 - 29 ㎎의 조직을 사용하여 PK로 700 ul H 용액 중에서 균질화시킴. Qiagen TissueRuptor 사용됨. 희석을 위해 균질물 상등액 400 ul, 20, 10 및 5 ul 사용됨.
균질물 2 = 종양성 전립선으로부터의 정상 조직
RNA 희석을 하기와 같이 수행하였다. RNA는 Ambion 으로부터의 정상 전립선으로부터의 것이었다. 분석을 중복 수행하였다.
탐침 | 전립선암 | 유방암 | 결장직장암 | 흑색종 피부암 | 폐암 | 난소암 | 고환암 |
1 | |||||||
2 | |||||||
3 | |||||||
4 | |||||||
5 | |||||||
6 | |||||||
7 | |||||||
8 | |||||||
9 | |||||||
10 | |||||||
11 | |||||||
12 | |||||||
13 | |||||||
14 | |||||||
15 | |||||||
16 | |||||||
17 | |||||||
20 |
<110> Genesis Genomics Inc.
Parr, Ryan
Dakubo, Gabriel
Harbottle, Andrew
Reguly, Brian
Creed, Jennifer
Robinson, Kerry
Klein, Daniel
<120> Aberrant Mitochondrial DNA, Associated Fusion Transcripts and
Translation Products and Hybridization Probes Therefor
<130> 102222/00099
<140> PCT
<141> 2010-03-29
<150> PCT/CA2009/000351
<151> 2009-03-27
<150> US 61/040616
<151> 2008-03-28
<160> 67
<170> PatentIn version 3.5
<210> 1
<211> 16568
<212> DNA
<213> Human
<400> 1
gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60
cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120
gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180
acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240
acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300
aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360
acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420
ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480
ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540
ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600
gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660
ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720
tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780
aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840
acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900
ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960
tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020
tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080
taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140
cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200
agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260
ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320
acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380
aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440
agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500
aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560
cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620
aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680
gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740
agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800
aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860
ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920
acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980
ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040
ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100
caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160
acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220
ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280
accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340
ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400
aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460
aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520
atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580
aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640
acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700
ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760
cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820
cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880
ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940
gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000
ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060
gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacttca aattcctccc 3120
tgtacgaaag gacaagagaa ataaggccta cttcacaaag cgccttcccc cgtaaatgat 3180
atcatctcaa cttagtatta tacccacacc cacccaagaa cagggtttgt taagatggca 3240
gagcccggta atcgcataaa acttaaaact ttacagtcag aggttcaatt cctcttctta 3300
acaacatacc catggccaac ctcctactcc tcattgtacc cattctaatc gcaatggcat 3360
tcctaatgct taccgaacga aaaattctag gctatataca actacgcaaa ggccccaacg 3420
ttgtaggccc ctacgggcta ctacaaccct tcgctgacgc cataaaactc ttcaccaaag 3480
agcccctaaa acccgccaca tctaccatca ccctctacat caccgccccg accttagctc 3540
tcaccatcgc tcttctacta tgaacccccc tccccatacc caaccccctg gtcaacctca 3600
acctaggcct cctatttatt ctagccacct ctagcctagc cgtttactca atcctctgat 3660
cagggtgagc atcaaactca aactacgccc tgatcggcgc actgcgagca gtagcccaaa 3720
caatctcata tgaagtcacc ctagccatca ttctactatc aacattacta ataagtggct 3780
cctttaacct ctccaccctt atcacaacac aagaacacct ctgattactc ctgccatcat 3840
gacccttggc cataatatga tttatctcca cactagcaga gaccaaccga acccccttcg 3900
accttgccga aggggagtcc gaactagtct caggcttcaa catcgaatac gccgcaggcc 3960
ccttcgccct attcttcata gccgaataca caaacattat tataataaac accctcacca 4020
ctacaatctt cctaggaaca acatatgacg cactctcccc tgaactctac acaacatatt 4080
ttgtcaccaa gaccctactt ctaacctccc tgttcttatg aattcgaaca gcataccccc 4140
gattccgcta cgaccaactc atacacctcc tatgaaaaaa cttcctacca ctcaccctag 4200
cattacttat atgatatgtc tccataccca ttacaatctc cagcattccc cctcaaacct 4260
aagaaatatg tctgataaaa gagttacttt gatagagtaa ataataggag cttaaacccc 4320
cttatttcta ggactatgag aatcgaaccc atccctgaga atccaaaatt ctccgtgcca 4380
cctatcacac cccatcctaa agtaaggtca gctaaataag ctatcgggcc cataccccga 4440
aaatgttggt tatacccttc ccgtactaat taatcccctg gcccaacccg tcatctactc 4500
taccatcttt gcaggcacac tcatcacagc gctaagctcg cactgatttt ttacctgagt 4560
aggcctagaa ataaacatgc tagcttttat tccagttcta accaaaaaaa taaaccctcg 4620
ttccacagaa gctgccatca agtatttcct cacgcaagca accgcatcca taatccttct 4680
aatagctatc ctcttcaaca atatactctc cggacaatga accataacca atactaccaa 4740
tcaatactca tcattaataa tcataatagc tatagcaata aaactaggaa tagccccctt 4800
tcacttctga gtcccagagg ttacccaagg cacccctctg acatccggcc tgcttcttct 4860
cacatgacaa aaactagccc ccatctcaat catataccaa atctctccct cactaaacgt 4920
aagccttctc ctcactctct caatcttatc catcatagca ggcagttgag gtggattaaa 4980
ccaaacccag ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat 5040
agcagttcta ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct 5100
aactactacc gcattcctac tactcaactt aaactccagc accacgaccc tactactatc 5160
tcgcacctga aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct 5220
aggaggcctg cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac 5280
aaaaaacaat agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta 5340
cttctaccta cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt 5400
aaaaataaaa tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc 5460
ccttaccacg ctactcctac ctatctcccc ttttatacta ataatcttat agaaatttag 5520
gttaaataca gaccaagagc cttcaaagcc ctcagtaagt tgcaatactt aatttctgta 5580
acagctaagg actgcaaaac cccactctgc atcaactgaa cgcaaatcag ccactttaat 5640
taagctaagc ccttactaga ccaatgggac ttaaacccac aaacacttag ttaacagcta 5700
agcaccctaa tcaactggct tcaatctact tctcccgccg ccgggaaaaa aggcgggaga 5760
agccccggca ggtttgaagc tgcttcttcg aatttgcaat tcaatatgaa aatcacctcg 5820
gagctggtaa aaagaggcct aacccctgtc tttagattta cagtccaatg cttcactcag 5880
ccattttacc tcacccccac tgatgttcgc cgaccgttga ctattctcta caaaccacaa 5940
agacattgga acactatacc tattattcgg cgcatgagct ggagtcctag gcacagctct 6000
aagcctcctt attcgagccg agctgggcca gccaggcaac cttctaggta acgaccacat 6060
ctacaacgtt atcgtcacag cccatgcatt tgtaataatc ttcttcatag taatacccat 6120
cataatcgga ggctttggca actgactagt tcccctaata atcggtgccc ccgatatggc 6180
gtttccccgc ataaacaaca taagcttctg actcttacct ccctctctcc tactcctgct 6240
cgcatctgct atagtggagg ccggagcagg aacaggttga acagtctacc ctcccttagc 6300
agggaactac tcccaccctg gagcctccgt agacctaacc atcttctcct tacacctagc 6360
aggtgtctcc tctatcttag gggccatcaa tttcatcaca acaattatca atataaaacc 6420
ccctgccata acccaatacc aaacgcccct cttcgtctga tccgtcctaa tcacagcagt 6480
cctacttctc ctatctctcc cagtcctagc tgctggcatc actatactac taacagaccg 6540
caacctcaac accaccttct tcgaccccgc cggaggagga gaccccattc tataccaaca 6600
cctattctga tttttcggtc accctgaagt ttatattctt atcctaccag gcttcggaat 6660
aatctcccat attgtaactt actactccgg aaaaaaagaa ccatttggat acataggtat 6720
ggtctgagct atgatatcaa ttggcttcct agggtttatc gtgtgagcac accatatatt 6780
tacagtagga atagacgtag acacacgagc atatttcacc tccgctacca taatcatcgc 6840
tatccccacc ggcgtcaaag tatttagctg actcgccaca ctccacggaa gcaatatgaa 6900
atgatctgct gcagtgctct gagccctagg attcatcttt cttttcaccg taggtggcct 6960
gactggcatt gtattagcaa actcatcact agacatcgta ctacacgaca cgtactacgt 7020
tgtagcccac ttccactatg tcctatcaat aggagctgta tttgccatca taggaggctt 7080
cattcactga tttcccctat tctcaggcta caccctagac caaacctacg ccaaaatcca 7140
tttcactatc atattcatcg gcgtaaatct aactttcttc ccacaacact ttctcggcct 7200
atccggaatg ccccgacgtt actcggacta ccccgatgca tacaccacat gaaacatcct 7260
atcatctgta ggctcattca tttctctaac agcagtaata ttaataattt tcatgatttg 7320
agaagccttc gcttcgaagc gaaaagtcct aatagtagaa gaaccctcca taaacctgga 7380
gtgactatat ggatgccccc caccctacca cacattcgaa gaacccgtat acataaaatc 7440
tagacaaaaa aggaaggaat cgaacccccc aaagctggtt tcaagccaac cccatggcct 7500
ccatgacttt ttcaaaaagg tattagaaaa accatttcat aactttgtca aagttaaatt 7560
ataggctaaa tcctatatat cttaatggca catgcagcgc aagtaggtct acaagacgct 7620
acttccccta tcatagaaga gcttatcacc tttcatgatc acgccctcat aatcattttc 7680
cttatctgct tcctagtcct gtatgccctt ttcctaacac tcacaacaaa actaactaat 7740
actaacatct cagacgctca ggaaatagaa accgtctgaa ctatcctgcc cgccatcatc 7800
ctagtcctca tcgccctccc atccctacgc atcctttaca taacagacga ggtcaacgat 7860
ccctccctta ccatcaaatc aattggccac caatggtact gaacctacga gtacaccgac 7920
tacggcggac taatcttcaa ctcctacata cttcccccat tattcctaga accaggcgac 7980
ctgcgactcc ttgacgttga caatcgagta gtactcccga ttgaagcccc cattcgtata 8040
ataattacat cacaagacgt cttgcactca tgagctgtcc ccacattagg cttaaaaaca 8100
gatgcaattc ccggacgtct aaaccaaacc actttcaccg ctacacgacc gggggtatac 8160
tacggtcaat gctctgaaat ctgtggagca aaccacagtt tcatgcccat cgtcctagaa 8220
ttaattcccc taaaaatctt tgaaataggg cccgtattta ccctatagca ccccctctac 8280
cccctctaga gcccactgta aagctaactt agcattaacc ttttaagtta aagattaaga 8340
gaaccaacac ctctttacag tgaaatgccc caactaaata ctaccgtatg gcccaccata 8400
attaccccca tactccttac actattcctc atcacccaac taaaaatatt aaacacaaac 8460
taccacctac ctccctcacc aaagcccata aaaataaaaa attataacaa accctgagaa 8520
ccaaaatgaa cgaaaatctg ttcgcttcat tcattgcccc cacaatccta ggcctacccg 8580
ccgcagtact gatcattcta tttccccctc tattgatccc cacctccaaa tatctcatca 8640
acaaccgact aatcaccacc caacaatgac taatcaaact aacctcaaaa caaatgataa 8700
ccatacacaa cactaaagga cgaacctgat ctcttatact agtatcctta atcattttta 8760
ttgccacaac taacctcctc ggactcctgc ctcactcatt tacaccaacc acccaactat 8820
ctataaacct agccatggcc atccccttat gagcgggcac agtgattata ggctttcgct 8880
ctaagattaa aaatgcccta gcccacttct taccacaagg cacacctaca ccccttatcc 8940
ccatactagt tattatcgaa accatcagcc tactcattca accaatagcc ctggccgtac 9000
gcctaaccgc taacattact gcaggccacc tactcatgca cctaattgga agcgccaccc 9060
tagcaatatc aaccattaac cttccctcta cacttatcat cttcacaatt ctaattctac 9120
tgactatcct agaaatcgct gtcgccttaa tccaagccta cgttttcaca cttctagtaa 9180
gcctctacct gcacgacaac acataatgac ccaccaatca catgcctatc atatagtaaa 9240
acccagccca tgacccctaa caggggccct ctcagccctc ctaatgacct ccggcctagc 9300
catgtgattt cacttccact ccataacgct cctcatacta ggcctactaa ccaacacact 9360
aaccatatac caatgatggc gcgatgtaac acgagaaagc acataccaag gccaccacac 9420
accacctgtc caaaaaggcc ttcgatacgg gataatccta tttattacct cagaagtttt 9480
tttcttcgca ggatttttct gagcctttta ccactccagc ctagccccta ccccccaatt 9540
aggagggcac tggcccccaa caggcatcac cccgctaaat cccctagaag tcccactcct 9600
aaacacatcc gtattactcg catcaggagt atcaatcacc tgagctcacc atagtctaat 9660
agaaaacaac cgaaaccaaa taattcaagc actgcttatt acaattttac tgggtctcta 9720
ttttaccctc ctacaagcct cagagtactt cgagtctccc ttcaccattt ccgacggcat 9780
ctacggctca acattttttg tagccacagg cttccacgga cttcacgtca ttattggctc 9840
aactttcctc actatctgct tcatccgcca actaatattt cactttacat ccaaacatca 9900
ctttggcttc gaagccgccg cctgatactg gcattttgta gatgtggttt gactatttct 9960
gtatgtctcc atctattgat gagggtctta ctcttttagt ataaatagta ccgttaactt 10020
ccaattaact agttttgaca acattcaaaa aagagtaata aacttcgcct taattttaat 10080
aatcaacacc ctcctagcct tactactaat aattattaca ttttgactac cacaactcaa 10140
cggctacata gaaaaatcca ccccttacga gtgcggcttc gaccctatat cccccgcccg 10200
cgtccctttc tccataaaat tcttcttagt agctattacc ttcttattat ttgatctaga 10260
aattgccctc cttttacccc taccatgagc cctacaaaca actaacctgc cactaatagt 10320
tatgtcatcc ctcttattaa tcatcatcct agccctaagt ctggcctatg agtgactaca 10380
aaaaggatta gactgaaccg aattggtata tagtttaaac aaaacgaatg atttcgactc 10440
attaaattat gataatcata tttaccaaat gcccctcatt tacataaata ttatactagc 10500
atttaccatc tcacttctag gaatactagt atatcgctca cacctcatat cctccctact 10560
atgcctagaa ggaataatac tatcgctgtt cattatagct actctcataa ccctcaacac 10620
ccactccctc ttagccaata ttgtgcctat tgccatacta gtctttgccg cctgcgaagc 10680
agcggtgggc ctagccctac tagtctcaat ctccaacaca tatggcctag actacgtaca 10740
taacctaaac ctactccaat gctaaaacta atcgtcccaa caattatatt actaccactg 10800
acatgacttt ccaaaaaaca cataatttga atcaacacaa ccacccacag cctaattatt 10860
agcatcatcc ctctactatt ttttaaccaa atcaacaaca acctatttag ctgttcccca 10920
accttttcct ccgaccccct aacaaccccc ctcctaatac taactacctg actcctaccc 10980
ctcacaatca tggcaagcca acgccactta tccagtgaac cactatcacg aaaaaaactc 11040
tacctctcta tactaatctc cctacaaatc tccttaatta taacattcac agccacagaa 11100
ctaatcatat tttatatctt cttcgaaacc acacttatcc ccaccttggc tatcatcacc 11160
cgatgaggca accagccaga acgcctgaac gcaggcacat acttcctatt ctacacccta 11220
gtaggctccc ttcccctact catcgcacta atttacactc acaacaccct aggctcacta 11280
aacattctac tactcactct cactgcccaa gaactatcaa actcctgagc caacaactta 11340
atatgactag cttacacaat agcttttata gtaaagatac ctctttacgg actccactta 11400
tgactcccta aagcccatgt cgaagccccc atcgctgggt caatagtact tgccgcagta 11460
ctcttaaaac taggcggcta tggtataata cgcctcacac tcattctcaa ccccctgaca 11520
aaacacatag cctacccctt ccttgtacta tccctatgag gcataattat aacaagctcc 11580
atctgcctac gacaaacaga cctaaaatcg ctcattgcat actcttcaat cagccacata 11640
gccctcgtag taacagccat tctcatccaa accccctgaa gcttcaccgg cgcagtcatt 11700
ctcataatcg cccacgggct tacatcctca ttactattct gcctagcaaa ctcaaactac 11760
gaacgcactc acagtcgcat cataatcctc tctcaaggac ttcaaactct actcccacta 11820
atagcttttt gatgacttct agcaagcctc gctaacctcg ccttaccccc cactattaac 11880
ctactgggag aactctctgt gctagtaacc acgttctcct gatcaaatat cactctccta 11940
cttacaggac tcaacatact agtcacagcc ctatactccc tctacatatt taccacaaca 12000
caatggggct cactcaccca ccacattaac aacataaaac cctcattcac acgagaaaac 12060
accctcatgt tcatacacct atcccccatt ctcctcctat ccctcaaccc cgacatcatt 12120
accgggtttt cctcttgtaa atatagttta accaaaacat cagattgtga atctgacaac 12180
agaggcttac gaccccttat ttaccgagaa agctcacaag aactgctaac tcatgccccc 12240
atgtctaaca acatggcttt ctcaactttt aaaggataac agctatccat tggtcttagg 12300
ccccaaaaat tttggtgcaa ctccaaataa aagtaataac catgcacact actataacca 12360
ccctaaccct gacttcccta attcccccca tccttaccac cctcgttaac cctaacaaaa 12420
aaaactcata cccccattat gtaaaatcca ttgtcgcatc cacctttatt atcagtctct 12480
tccccacaac aatattcatg tgcctagacc aagaagttat tatctcgaac tgacactgag 12540
ccacaaccca aacaacccag ctctccctaa gcttcaaact agactacttc tccataatat 12600
tcatccctgt agcattgttc gttacatggt ccatcataga attctcactg tgatatataa 12660
actcagaccc aaacattaat cagttcttca aatatctact catcttccta attaccatac 12720
taatcttagt taccgctaac aacctattcc aactgttcat cggctgagag ggcgtaggaa 12780
ttatatcctt cttgctcatc agttgatgat acgcccgagc agatgccaac acagcagcca 12840
ttcaagcaat cctatacaac cgtatcggcg atatcggttt catcctcgcc ttagcatgat 12900
ttatcctaca ctccaactca tgagacccac aacaaatagc ccttctaaac gctaatccaa 12960
gcctcacccc actactaggc ctcctcctag cagcagcagg caaatcagcc caattaggtc 13020
tccacccctg actcccctca gccatagaag gccccacccc agtctcagcc ctactccact 13080
caagcactat agttgtagca ggaatcttct tactcatccg cttccacccc ctagcagaaa 13140
atagcccact aatccaaact ctaacactat gcttaggcgc tatcaccact ctgttcgcag 13200
cagtctgcgc ccttacacaa aatgacatca aaaaaatcgt agccttctcc acttcaagtc 13260
aactaggact cataatagtt acaatcggca tcaaccaacc acacctagca ttcctgcaca 13320
tctgtaccca cgccttcttc aaagccatac tatttatgtg ctccgggtcc atcatccaca 13380
accttaacaa tgaacaagat attcgaaaaa taggaggact actcaaaacc atacctctca 13440
cttcaacctc cctcaccatt ggcagcctag cattagcagg aatacctttc ctcacaggtt 13500
tctactccaa agaccacatc atcgaaaccg caaacatatc atacacaaac gcctgagccc 13560
tatctattac tctcatcgct acctccctga caagcgccta tagcactcga ataattcttc 13620
tcaccctaac aggtcaacct cgcttcccca cccttactaa cattaacgaa aataacccca 13680
ccctactaaa ccccattaaa cgcctggcag ccggaagcct attcgcagga tttctcatta 13740
ctaacaacat ttcccccgca tcccccttcc aaacaacaat ccccctctac ctaaaactca 13800
cagccctcgc tgtcactttc ctaggacttc taacagccct agacctcaac tacctaacca 13860
acaaacttaa aataaaatcc ccactatgca cattttattt ctccaacata ctcggattct 13920
accctagcat cacacaccgc acaatcccct atctaggcct tcttacgagc caaaacctgc 13980
ccctactcct cctagaccta acctgactag aaaagctatt acctaaaaca atttcacagc 14040
accaaatctc cacctccatc atcacctcaa cccaaaaagg cataattaaa ctttacttcc 14100
tctctttctt cttcccactc atcctaaccc tactcctaat cacataacct attcccccga 14160
gcaatctcaa ttacaatata tacaccaaca aacaatgttc aaccagtaac tactactaat 14220
caacgcccat aatcatacaa agcccccgca ccaataggat cctcccgaat caaccctgac 14280
ccctctcctt cataaattat tcagcttcct acactattaa agtttaccac aaccaccacc 14340
ccatcatact ctttcaccca cagcaccaat cctacctcca tcgctaaccc cactaaaaca 14400
ctcaccaaga cctcaacccc tgacccccat gcctcaggat actcctcaat agccatcgct 14460
gtagtatatc caaagacaac catcattccc cctaaataaa ttaaaaaaac tattaaaccc 14520
atataacctc ccccaaaatt cagaataata acacacccga ccacaccgct aacaatcaat 14580
actaaacccc cataaatagg agaaggctta gaagaaaacc ccacaaaccc cattactaaa 14640
cccacactca acagaaacaa agcatacatc attattctcg cacggactac aaccacgacc 14700
aatgatatga aaaaccatcg ttgtatttca actacaagaa caccaatgac cccaatacgc 14760
aaaactaacc ccctaataaa attaattaac cactcattca tcgacctccc caccccatcc 14820
aacatctccg catgatgaaa cttcggctca ctccttggcg cctgcctgat cctccaaatc 14880
accacaggac tattcctagc catgcactac tcaccagacg cctcaaccgc cttttcatca 14940
atcgcccaca tcactcgaga cgtaaattat ggctgaatca tccgctacct tcacgccaat 15000
ggcgcctcaa tattctttat ctgcctcttc ctacacatcg ggcgaggcct atattacgga 15060
tcatttctct actcagaaac ctgaaacatc ggcattatcc tcctgcttgc aactatagca 15120
acagccttca taggctatgt cctcccgtga ggccaaatat cattctgagg ggccacagta 15180
attacaaact tactatccgc catcccatac attgggacag acctagttca atgaatctga 15240
ggaggctact cagtagacag tcccaccctc acacgattct ttacctttca cttcatcttg 15300
cccttcatta ttgcagccct agcaacactc cacctcctat tcttgcacga aacgggatca 15360
aacaaccccc taggaatcac ctcccattcc gataaaatca ccttccaccc ttactacaca 15420
atcaaagacg ccctcggctt acttctcttc cttctctcct taatgacatt aacactattc 15480
tcaccagacc tcctaggcga cccagacaat tataccctag ccaacccctt aaacacccct 15540
ccccacatca agcccgaatg atatttccta ttcgcctaca caattctccg atccgtccct 15600
aacaaactag gaggcgtcct tgccctatta ctatccatcc tcatcctagc aataatcccc 15660
atcctccata tatccaaaca acaaagcata atatttcgcc cactaagcca atcactttat 15720
tgactcctag ccgcagacct cctcattcta acctgaatcg gaggacaacc agtaagctac 15780
ccttttacca tcattggaca agtagcatcc gtactatact tcacaacaat cctaatccta 15840
ataccaacta tctccctaat tgaaaacaaa atactcaaat gggcctgtcc ttgtagtata 15900
aactaataca ccagtcttgt aaaccggaga tgaaaacctt tttccaagga caaatcagag 15960
aaaaagtctt taactccacc attagcaccc aaagctaaga ttctaattta aactattctc 16020
tgttctttca tggggaagca gatttgggta ccacccaagt attgactcac ccatcaacaa 16080
ccgctatgta tttcgtacat tactgccagc caccatgaat attgtacggt accataaata 16140
cttgaccacc tgtagtacat aaaaacccaa tccacatcaa aaccccctcc ccatgcttac 16200
aagcaagtac agcaatcaac cctcaactat cacacatcaa ctgcaactcc aaagccaccc 16260
ctcacccact aggataccaa caaacctacc cacccttaac agtacatagt acataaagcc 16320
atttaccgta catagcacat tacagtcaaa tcccttctcg tccccatgga tgacccccct 16380
cagatagggg tcccttgacc accatcctcc gtgaaatcaa tatcccgcac aagagtgcta 16440
ctctcctcgc tccgggccca taacacttgg gggtagctaa agtgaactgt atccgacatc 16500
tggttcctac ttcagggtca taaagcctaa atagcccaca cgttcccctt aaataagaca 16560
tcacgatg 16568
<210> 2
<211> 783
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 2
atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60
attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120
cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180
acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240
actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300
aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360
gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420
ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480
ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540
aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600
acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660
aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720
attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780
taa 783
<210> 3
<211> 300
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 3
atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60
gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120
ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180
attgccatac tagtctttgc cgcctgcgaa gcagcggtgg gcctagccct actagtctca 240
atctccaaca catatggcct agactacgta cataacctaa ccctactcct aatcacataa 300
<210> 4
<211> 781
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 4
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacccag acaattatac cctagccaac 420
cccttaaaca cccctcccca catcaagccc gaatgatatt tcctattcgc ctacacaatt 480
ctccgatccg tccctaacaa actaggaggc gtccttgccc tattactatc catcctcatc 540
ctagcaataa tccccatcct ccatatatcc aaacaacaaa gcataatatt tcgcccacta 600
agccaatcac tttattgact cctagccgca gacctcctca ttctaacctg aatcggagga 660
caaccagtaa gctacccttt taccatcatt ggacaagtag catccgtact atacttcaca 720
acaatcctaa tcctaatacc aactatctcc ctaattgaaa acaaaatact caaatgggcc 780
t 781
<210> 5
<211> 565
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 5
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420
ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480
gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540
gaaaacaaaa tactcaaatg ggcct 565
<210> 6
<211> 1174
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 6
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420
cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480
cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540
caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600
ggagcaaacc acagtttcat gcccatattc ttgcacgaaa cgggatcaaa caacccccta 660
ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 720
ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 780
ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 840
cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 900
ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 960
tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1020
gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1080
attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1140
tccctaattg aaaacaaaat actcaaatgg gcct 1174
<210> 7
<211> 1294
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 7
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tgcactactc accagacgcc tcaaccgcct tttcatcaat cgcccacatc 360
actcgagacg taaattatgg ctgaatcatc cgctaccttc acgccaatgg cgcctcaata 420
ttctttatct gcctcttcct acacatcggg cgaggcctat attacggatc atttctctac 480
tcagaaacct gaaacatcgg cattatcctc ctgcttgcaa ctatagcaac agccttcata 540
ggctatgtcc tcccgtgagg ccaaatatca ttctgagggg ccacagtaat tacaaactta 600
ctatccgcca tcccatacat tgggacagac ctagttcaat gaatctgagg aggctactca 660
gtagacagtc ccaccctcac acgattcttt acctttcact tcatcttgcc cttcattatt 720
gcagccctag caacactcca cctcctattc ttgcacgaaa cgggatcaaa caacccccta 780
ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 840
ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 900
ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 960
cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 1020
ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 1080
tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1140
gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1200
attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1260
tccctaattg aaaacaaaat actcaaatgg gcct 1294
<210> 8
<211> 1228
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 8
atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60
gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120
ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180
attgccatac tagtctttgg cgcctgcctg atcctccaaa tcaccacagg actattccta 240
gccatgcact actcaccaga cgcctcaacc gccttttcat caatcgccca catcactcga 300
gacgtaaatt atggctgaat catccgctac cttcacgcca atggcgcctc aatattcttt 360
atctgcctct tcctacacat cgggcgaggc ctatattacg gatcatttct ctactcagaa 420
acctgaaaca tcggcattat cctcctgctt gcaactatag caacagcctt cataggctat 480
gtcctcccgt gaggccaaat atcattctga ggggccacag taattacaaa cttactatcc 540
gccatcccat acattgggac agacctagtt caatgaatct gaggaggcta ctcagtagac 600
agtcccaccc tcacacgatt ctttaccttt cacttcatct tgcccttcat tattgcagcc 660
ctagcaacac tccacctcct attcttgcac gaaacgggat caaacaaccc cctaggaatc 720
acctcccatt ccgataaaat caccttccac ccttactaca caatcaaaga cgccctcggc 780
ttacttctct tccttctctc cttaatgaca ttaacactat tctcaccaga cctcctaggc 840
gacccagaca attataccct agccaacccc ttaaacaccc ctccccacat caagcccgaa 900
tgatatttcc tattcgccta cacaattctc cgatccgtcc ctaacaaact aggaggcgtc 960
cttgccctat tactatccat cctcatccta gcaataatcc ccatcctcca tatatccaaa 1020
caacaaagca taatatttcg cccactaagc caatcacttt attgactcct agccgcagac 1080
ctcctcattc taacctgaat cggaggacaa ccagtaagct acccttttac catcattgga 1140
caagtagcat ccgtactata cttcacaaca atcctaatcc taataccaac tatctcccta 1200
attgaaaaca aaatactcaa atgggcct 1228
<210> 9
<211> 522
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 9
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
ctcgctgtca ctttcctagg acttctaaca gccctagacc tcaactacct aaccaacaaa 240
cttaaaataa aatccccact atgcacattt tatttctcca acatactcgg attctaccct 300
agcatcacac accgcacaat cccctatcta ggccttctta cgagccaaaa cctgccccta 360
ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 420
atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 480
ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 522
<210> 10
<211> 582
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 10
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420
gccctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 480
atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 540
ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 582
<210> 11
<211> 2208
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 11
atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60
ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120
ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180
catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240
tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300
agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360
ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420
gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480
gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540
acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600
gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660
gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720
cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780
tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840
ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900
acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960
tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020
gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080
tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140
ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200
tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260
gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320
tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1380
tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1440
aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1500
ccctaccaca cattcgaaga acccgtatac ataaaagcag gaataccttt cctcacaggt 1560
ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 1620
ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 1680
ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 1740
accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 1800
actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 1860
acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 1920
aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 1980
taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 2040
cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 2100
caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 2160
ctctctttct tcttcccact catcctaacc ctactcctaa tcacataa 2208
<210> 12
<211> 807
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 12
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg caaacatatc atacacaaac gcctgagccc tatctattac tctcatcgct 240
acctccctga caagcgccta tagcactcga ataattcttc tcaccctaac aggtcaacct 300
cgcttcccca cccttactaa cattaacgaa aataacccca ccctactaaa ccccattaaa 360
cgcctggcag ccggaagcct attcgcagga tttctcatta ctaacaacat ttcccccgca 420
tcccccttcc aaacaacaat ccccctctac ctaaaactca cagccctcgc tgtcactttc 480
ctaggacttc taacagccct agacctcaac tacctaacca acaaacttaa aataaaatcc 540
ccactatgca cattttattt ctccaacata ctcggattct accctagcat cacacaccgc 600
acaatcccct atctaggcct tcttacgagc caaaacctgc ccctactcct cctagaccta 660
acctgactag aaaagctatt acctaaaaca atttcacagc accaaatctc cacctccatc 720
atcacctcaa cccaaaaagg cataattaaa ctttacttcc tctctttctt cttcccactc 780
atcctaaccc tactcctaat cacataa 807
<210> 13
<211> 786
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 13
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420
cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480
cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540
caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600
ggagcaaacc acagtttcat gcccatcgtc ctagacctaa cctgactaga aaagctatta 660
cctaaaacaa tttcacagca ccaaatctcc acctccatca tcacctcaac ccaaaaaggc 720
ataattaaac tttacttcct ctctttcttc ttcccactca tcctaaccct actcctaatc 780
acataa 786
<210> 14
<211> 1905
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 14
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660
tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720
ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905
<210> 15
<211> 1545
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 15
atgacccacc aatcacatgc ctatcatata gtaaaaccca gcccatgacc cctaacaggg 60
gccctctcag ccctcctaat gacctccggc ctagccatgt gatttcactt ccactccata 120
acgctcctca tactaggcct actaaccaac acactaacca tataccaatg atggcgcgat 180
gtaacacgag aaagcacata ccaaggccac cacacaccac ctgtccaaaa aggccttcga 240
tacgggataa tcctatttat tacctcagaa gtttttttct tcgcaggatt tttctgagcc 300
ttttaccact ccagcctagc ccctaccccc caattaggag ggcactggcc cccaacaggc 360
atcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 420
cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 480
agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 540
agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 600
gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 660
ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 720
tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 780
cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 840
tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 900
tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 960
tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1020
accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1080
ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1140
aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1200
gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1260
aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1320
cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1380
ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1440
caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1500
tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1545
<210> 16
<211> 1629
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 16
ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60
acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120
ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180
accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240
acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300
agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360
ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420
gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480
ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540
ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600
cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660
gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720
gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780
ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840
tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900
ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960
ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020
tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080
tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140
aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200
ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260
atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320
ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380
ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440
cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500
ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560
ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620
atcacataa 1629
<210> 17
<211> 642
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 17
atgctaaaac taatcgtccc aacaattata ttactaccac tgacatgact ttccaaaaaa 60
cacataattt gaatcaacac aaccacccac agcctaatta ttagcatcat ccctctacta 120
ttttttaacc aaatcaacaa caacctattt agctgttccc caaccttttc ctccgacccc 180
ctaacaaccc ccctcctaat actaactacc tgactcctac ccctcacaat catggcaagc 240
caacgccact tatccagtga accactatca cgaaaaaaac tctacctctc tatactaatc 300
tccctacaaa tctccttaat tataacattc acagccacag aactaatcat attttatatc 360
ttcttcgaaa ccacacttat ccccaccttg gctatcatca cccgatgagg caaccagcca 420
gaacgcctga acgcaggcac atacttccta ttctacaccc tagtaggctc cctgccccta 480
ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 540
atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 600
ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 642
<210> 18
<211> 129
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 18
atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60
ttcctcatca cccaactaaa aatattaaac acaaactacc acctacctcc ctcaccattg 120
gcagcctag 129
<210> 19
<211> 783
<212> RNA
<213> Human
<400> 19
auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60
auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120
ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180
acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240
acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300
aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360
gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420
cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480
cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540
aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600
acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660
aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720
auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780
uaa 783
<210> 20
<211> 300
<212> RNA
<213> Human
<400> 20
augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60
guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120
uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180
auugccauac uagucuuugc cgccugcgaa gcagcggugg gccuagcccu acuagucuca 240
aucuccaaca cauauggccu agacuacgua cauaaccuaa cccuacuccu aaucacauaa 300
<210> 21
<211> 781
<212> RNA
<213> Human
<400> 21
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgacccag acaauuauac ccuagccaac 420
cccuuaaaca ccccucccca caucaagccc gaaugauauu uccuauucgc cuacacaauu 480
cuccgauccg ucccuaacaa acuaggaggc guccuugccc uauuacuauc cauccucauc 540
cuagcaauaa uccccauccu ccauauaucc aaacaacaaa gcauaauauu ucgcccacua 600
agccaaucac uuuauugacu ccuagccgca gaccuccuca uucuaaccug aaucggagga 660
caaccaguaa gcuacccuuu uaccaucauu ggacaaguag cauccguacu auacuucaca 720
acaauccuaa uccuaauacc aacuaucucc cuaauugaaa acaaaauacu caaaugggcc 780
u 781
<210> 22
<211> 565
<212> RNA
<213> Human
<400> 22
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420
cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480
guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540
gaaaacaaaa uacucaaaug ggccu 565
<210> 23
<211> 1174
<212> RNA
<213> Human
<400> 23
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420
cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480
cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540
caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600
ggagcaaacc acaguuucau gcccauauuc uugcacgaaa cgggaucaaa caacccccua 660
ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 720
cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 780
cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 840
cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 900
ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 960
uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1020
gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1080
auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1140
ucccuaauug aaaacaaaau acucaaaugg gccu 1174
<210> 24
<211> 1294
<212> RNA
<213> Human
<400> 24
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca ugcacuacuc accagacgcc ucaaccgccu uuucaucaau cgcccacauc 360
acucgagacg uaaauuaugg cugaaucauc cgcuaccuuc acgccaaugg cgccucaaua 420
uucuuuaucu gccucuuccu acacaucggg cgaggccuau auuacggauc auuucucuac 480
ucagaaaccu gaaacaucgg cauuauccuc cugcuugcaa cuauagcaac agccuucaua 540
ggcuaugucc ucccgugagg ccaaauauca uucugagggg ccacaguaau uacaaacuua 600
cuauccgcca ucccauacau ugggacagac cuaguucaau gaaucugagg aggcuacuca 660
guagacaguc ccacccucac acgauucuuu accuuucacu ucaucuugcc cuucauuauu 720
gcagcccuag caacacucca ccuccuauuc uugcacgaaa cgggaucaaa caacccccua 780
ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 840
cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 900
cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 960
cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 1020
ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 1080
uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1140
gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1200
auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1260
ucccuaauug aaaacaaaau acucaaaugg gccu 1294
<210> 25
<211> 1228
<212> RNA
<213> Human
<400> 25
augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60
guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120
uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180
auugccauac uagucuuugg cgccugccug auccuccaaa ucaccacagg acuauuccua 240
gccaugcacu acucaccaga cgccucaacc gccuuuucau caaucgccca caucacucga 300
gacguaaauu auggcugaau cauccgcuac cuucacgcca auggcgccuc aauauucuuu 360
aucugccucu uccuacacau cgggcgaggc cuauauuacg gaucauuucu cuacucagaa 420
accugaaaca ucggcauuau ccuccugcuu gcaacuauag caacagccuu cauaggcuau 480
guccucccgu gaggccaaau aucauucuga ggggccacag uaauuacaaa cuuacuaucc 540
gccaucccau acauugggac agaccuaguu caaugaaucu gaggaggcua cucaguagac 600
agucccaccc ucacacgauu cuuuaccuuu cacuucaucu ugcccuucau uauugcagcc 660
cuagcaacac uccaccuccu auucuugcac gaaacgggau caaacaaccc ccuaggaauc 720
accucccauu ccgauaaaau caccuuccac ccuuacuaca caaucaaaga cgcccucggc 780
uuacuucucu uccuucucuc cuuaaugaca uuaacacuau ucucaccaga ccuccuaggc 840
gacccagaca auuauacccu agccaacccc uuaaacaccc cuccccacau caagcccgaa 900
ugauauuucc uauucgccua cacaauucuc cgauccgucc cuaacaaacu aggaggcguc 960
cuugcccuau uacuauccau ccucauccua gcaauaaucc ccauccucca uauauccaaa 1020
caacaaagca uaauauuucg cccacuaagc caaucacuuu auugacuccu agccgcagac 1080
cuccucauuc uaaccugaau cggaggacaa ccaguaagcu acccuuuuac caucauugga 1140
caaguagcau ccguacuaua cuucacaaca auccuaaucc uaauaccaac uaucucccua 1200
auugaaaaca aaauacucaa augggccu 1228
<210> 26
<211> 522
<212> RNA
<213> Human
<400> 26
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
cucgcuguca cuuuccuagg acuucuaaca gcccuagacc ucaacuaccu aaccaacaaa 240
cuuaaaauaa aauccccacu augcacauuu uauuucucca acauacucgg auucuacccu 300
agcaucacac accgcacaau ccccuaucua ggccuucuua cgagccaaaa ccugccccua 360
cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 420
aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 480
uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 522
<210> 27
<211> 582
<212> RNA
<213> Human
<400> 27
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420
gcccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 480
aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 540
uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 582
<210> 28
<211> 2208
<212> RNA
<213> Human
<400> 28
auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60
uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120
cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180
caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240
ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300
agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360
ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420
gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480
gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540
acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600
guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660
gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720
ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780
uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840
ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900
acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960
uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020
gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080
ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140
cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200
ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260
guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320
ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1380
ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1440
aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1500
cccuaccaca cauucgaaga acccguauac auaaaagcag gaauaccuuu ccucacaggu 1560
uucuacucca aagaccacau caucgaaacc gcaaacauau cauacacaaa cgccugagcc 1620
cuaucuauua cucucaucgc uaccucccug acaagcgccu auagcacucg aauaauucuu 1680
cucacccuaa caggucaacc ucgcuucccc acccuuacua acauuaacga aaauaacccc 1740
acccuacuaa accccauuaa acgccuggca gccggaagcc uauucgcagg auuucucauu 1800
acuaacaaca uuucccccgc aucccccuuc caaacaacaa ucccccucua ccuaaaacuc 1860
acagcccucg cugucacuuu ccuaggacuu cuaacagccc uagaccucaa cuaccuaacc 1920
aacaaacuua aaauaaaauc cccacuaugc acauuuuauu ucuccaacau acucggauuc 1980
uacccuagca ucacacaccg cacaaucccc uaucuaggcc uucuuacgag ccaaaaccug 2040
ccccuacucc uccuagaccu aaccugacua gaaaagcuau uaccuaaaac aauuucacag 2100
caccaaaucu ccaccuccau caucaccuca acccaaaaag gcauaauuaa acuuuacuuc 2160
cucucuuucu ucuucccacu cauccuaacc cuacuccuaa ucacauaa 2208
<210> 29
<211> 807
<212> RNA
<213> Human
<400> 29
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg caaacauauc auacacaaac gccugagccc uaucuauuac ucucaucgcu 240
accucccuga caagcgccua uagcacucga auaauucuuc ucacccuaac aggucaaccu 300
cgcuucccca cccuuacuaa cauuaacgaa aauaacccca cccuacuaaa ccccauuaaa 360
cgccuggcag ccggaagccu auucgcagga uuucucauua cuaacaacau uucccccgca 420
ucccccuucc aaacaacaau cccccucuac cuaaaacuca cagcccucgc ugucacuuuc 480
cuaggacuuc uaacagcccu agaccucaac uaccuaacca acaaacuuaa aauaaaaucc 540
ccacuaugca cauuuuauuu cuccaacaua cucggauucu acccuagcau cacacaccgc 600
acaauccccu aucuaggccu ucuuacgagc caaaaccugc cccuacuccu ccuagaccua 660
accugacuag aaaagcuauu accuaaaaca auuucacagc accaaaucuc caccuccauc 720
aucaccucaa cccaaaaagg cauaauuaaa cuuuacuucc ucucuuucuu cuucccacuc 780
auccuaaccc uacuccuaau cacauaa 807
<210> 30
<211> 786
<212> RNA
<213> Human
<400> 30
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420
cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480
cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540
caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600
ggagcaaacc acaguuucau gcccaucguc cuagaccuaa ccugacuaga aaagcuauua 660
ccuaaaacaa uuucacagca ccaaaucucc accuccauca ucaccucaac ccaaaaaggc 720
auaauuaaac uuuacuuccu cucuuucuuc uucccacuca uccuaacccu acuccuaauc 780
acauaa 786
<210> 31
<211> 1905
<212> RNA
<213> Human
<400> 31
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660
uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720
cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905
<210> 32
<211> 1545
<212> RNA
<213> Human
<400> 32
augacccacc aaucacaugc cuaucauaua guaaaaccca gcccaugacc ccuaacaggg 60
gcccucucag cccuccuaau gaccuccggc cuagccaugu gauuucacuu ccacuccaua 120
acgcuccuca uacuaggccu acuaaccaac acacuaacca uauaccaaug auggcgcgau 180
guaacacgag aaagcacaua ccaaggccac cacacaccac cuguccaaaa aggccuucga 240
uacgggauaa uccuauuuau uaccucagaa guuuuuuucu ucgcaggauu uuucugagcc 300
uuuuaccacu ccagccuagc cccuaccccc caauuaggag ggcacuggcc cccaacaggc 360
aucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 420
caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 480
agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 540
agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 600
gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 660
cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 720
uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 780
cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 840
ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 900
uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 960
ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1020
acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1080
cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1140
aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1200
gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1260
aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1320
ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1380
cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1440
caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1500
ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1545
<210> 33
<211> 1629
<212> RNA
<213> Human
<400> 33
auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60
acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120
uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180
accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240
acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300
agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360
uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420
gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480
ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540
ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600
cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660
gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720
guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780
ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840
ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900
cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960
ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020
ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080
uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140
aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200
cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260
aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320
cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380
uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440
cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500
uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560
ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620
aucacauaa 1629
<210> 34
<211> 642
<212> RNA
<213> Human
<400> 34
augcuaaaac uaaucguccc aacaauuaua uuacuaccac ugacaugacu uuccaaaaaa 60
cacauaauuu gaaucaacac aaccacccac agccuaauua uuagcaucau cccucuacua 120
uuuuuuaacc aaaucaacaa caaccuauuu agcuguuccc caaccuuuuc cuccgacccc 180
cuaacaaccc cccuccuaau acuaacuacc ugacuccuac cccucacaau cauggcaagc 240
caacgccacu uauccaguga accacuauca cgaaaaaaac ucuaccucuc uauacuaauc 300
ucccuacaaa ucuccuuaau uauaacauuc acagccacag aacuaaucau auuuuauauc 360
uucuucgaaa ccacacuuau ccccaccuug gcuaucauca cccgaugagg caaccagcca 420
gaacgccuga acgcaggcac auacuuccua uucuacaccc uaguaggcuc ccugccccua 480
cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 540
aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 600
uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 642
<210> 35
<211> 129
<212> RNA
<213> Human
<400> 35
augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60
uuccucauca cccaacuaaa aauauuaaac acaaacuacc accuaccucc cucaccauug 120
gcagccuag 129
<210> 36
<211> 261
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (261)..(261)
<223> Xaa can be any naturally occurring amino acid
<400> 36
Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His
1 5 10 15
Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile
20 25 30
Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser
35 40 45
Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp
50 55 60
Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser
65 70 75 80
Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr
85 90 95
Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys
100 105 110
Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn
115 120 125
Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys
130 135 140
Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp
145 150 155 160
Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr
165 170 175
Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg
180 185 190
Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu
195 200 205
Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser
210 215 220
Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met
225 230 235 240
Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu
245 250 255
Leu Leu Ile Thr Xaa
260
<210> 37
<211> 100
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (100)..(100)
<223> Xaa can be any naturally occurring amino acid
<400> 37
Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu
1 5 10 15
Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys
20 25 30
Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr
35 40 45
Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu
50 55 60
Val Phe Ala Ala Cys Glu Ala Ala Val Gly Leu Ala Leu Leu Val Ser
65 70 75 80
Ile Ser Asn Thr Tyr Gly Leu Asp Tyr Val His Asn Leu Thr Leu Leu
85 90 95
Leu Ile Thr Xaa
100
<210> 38
<211> 261
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (261)..(261)
<223> Xaa can be any naturally occurring amino acid
<400> 38
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr
130 135 140
Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile
145 150 155 160
Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu
165 170 175
Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln
180 185 190
Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu
195 200 205
Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser
210 215 220
Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr
225 230 235 240
Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met
245 250 255
Leu Lys Trp Ala Xaa
260
<210> 39
<211> 189
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (189)..(189)
<223> Xaa can be any naturally occurring amino acid
<400> 39
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr
130 135 140
Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln
145 150 155 160
Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr
165 170 175
Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
180 185
<210> 40
<211> 392
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (392)..(392)
<223> Xaa can be any naturally occurring amino acid
<400> 40
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu
130 135 140
Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu
145 150 155 160
His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro
165 170 175
Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr
180 185 190
Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro
195 200 205
Met Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser
210 215 220
His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala
225 230 235 240
Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe
245 250 255
Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro
260 265 270
Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala
275 280 285
Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala
290 295 300
Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met
305 310 315 320
Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr
325 330 335
Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln
340 345 350
Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu
355 360 365
Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu
370 375 380
Asn Lys Met Leu Lys Trp Ala Xaa
385 390
<210> 41
<211> 432
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (432)..(432)
<223> Xaa can be any naturally occurring amino acid
<400> 41
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met His Tyr Ser Pro Asp Ala Ser Thr
100 105 110
Ala Phe Ser Ser Ile Ala His Ile Thr Arg Asp Val Asn Tyr Gly Trp
115 120 125
Ile Ile Arg Tyr Leu His Ala Asn Gly Ala Ser Met Phe Phe Ile Cys
130 135 140
Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr
145 150 155 160
Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu Leu Ala Thr Met Ala
165 170 175
Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly Gln Met Ser Phe Trp
180 185 190
Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly
195 200 205
Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro
210 215 220
Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile Leu Pro Phe Ile Ile
225 230 235 240
Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu His Glu Thr Gly Ser
245 250 255
Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp Lys Ile Thr Phe His
260 265 270
Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu
275 280 285
Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro
290 295 300
Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr Pro Pro His Ile Lys
305 310 315 320
Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro
325 330 335
Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu
340 345 350
Ala Met Ile Pro Ile Leu His Met Ser Lys Gln Gln Ser Met Met Phe
355 360 365
Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu
370 375 380
Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile
385 390 395 400
Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu
405 410 415
Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
420 425 430
<210> 42
<211> 410
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (410)..(410)
<223> Xaa can be any naturally occurring amino acid
<400> 42
Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu
1 5 10 15
Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys
20 25 30
Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr
35 40 45
Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu
50 55 60
Val Phe Gly Ala Cys Leu Ile Leu Gln Ile Thr Thr Gly Leu Phe Leu
65 70 75 80
Ala Met His Tyr Ser Pro Asp Ala Ser Thr Ala Phe Ser Ser Ile Ala
85 90 95
His Ile Thr Arg Asp Val Asn Tyr Gly Trp Ile Ile Arg Tyr Leu His
100 105 110
Ala Asn Gly Ala Ser Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly
115 120 125
Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile
130 135 140
Gly Ile Ile Leu Leu Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr
145 150 155 160
Val Leu Pro Trp Gly Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr
165 170 175
Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp
180 185 190
Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe
195 200 205
Thr Phe His Phe Ile Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu
210 215 220
His Leu Leu Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile
225 230 235 240
Thr Ser His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys
245 250 255
Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr
260 265 270
Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala
275 280 285
Asn Pro Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu
290 295 300
Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val
305 310 315 320
Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu
325 330 335
His Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser
340 345 350
Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly
355 360 365
Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser
370 375 380
Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu
385 390 395 400
Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa
405 410
<210> 43
<211> 174
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (174)..(174)
<223> Xaa can be any naturally occurring amino acid
<400> 43
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala Leu Ala Val Thr
50 55 60
Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys
65 70 75 80
Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu
85 90 95
Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu
100 105 110
Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu
115 120 125
Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser
130 135 140
Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser
145 150 155 160
Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
165 170
<210> 44
<211> 194
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (194)..(194)
<223> Xaa can be any naturally occurring amino acid
<400> 44
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val
115 120 125
Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Leu Leu Asp
130 135 140
Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln
145 150 155 160
Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu
165 170 175
Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile
180 185 190
Thr Xaa
<210> 45
<211> 736
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (736)..(736)
<223> Xaa can be any naturally occurring amino acid
<400> 45
Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly
1 5 10 15
Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala
20 25 30
Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu
35 40 45
Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val
50 55 60
Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn
65 70 75 80
Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg
85 90 95
Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu
100 105 110
Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val
115 120 125
Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp
130 135 140
Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly
145 150 155 160
Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met
165 170 175
Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala
180 185 190
Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met
195 200 205
Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly
210 215 220
Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His
225 230 235 240
Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His
245 250 255
Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly
260 265 270
Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp
275 280 285
Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr
290 295 300
Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val
305 310 315 320
Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala
325 330 335
Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly
340 345 350
Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His
355 360 365
Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly
370 375 380
Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe
385 390 395 400
Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile
405 410 415
Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly
420 425 430
Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr
435 440 445
Thr Trp Asn Ile Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala
450 455 460
Val Met Leu Met Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg
465 470 475 480
Lys Val Leu Met Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr
485 490 495
Gly Cys Pro Pro Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys
500 505 510
Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile
515 520 525
Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr
530 535 540
Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu
545 550 555 560
Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn
565 570 575
Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly
580 585 590
Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser
595 600 605
Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala
610 615 620
Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr
625 630 635 640
Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn
645 650 655
Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu
660 665 670
Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr
675 680 685
Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser
690 695 700
Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe
705 710 715 720
Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
725 730 735
<210> 46
<211> 269
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (269)..(269)
<223> Xaa can be any naturally occurring amino acid
<400> 46
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Ala
50 55 60
Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala
65 70 75 80
Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu
85 90 95
Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn
100 105 110
Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe
115 120 125
Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln
130 135 140
Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe
145 150 155 160
Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu
165 170 175
Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly
180 185 190
Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu
195 200 205
Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu
210 215 220
Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile
225 230 235 240
Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe
245 250 255
Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
260 265
<210> 47
<211> 262
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (262)..(262)
<223> Xaa can be any naturally occurring amino acid
<400> 47
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu
130 135 140
Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu
145 150 155 160
His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro
165 170 175
Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr
180 185 190
Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro
195 200 205
Ile Val Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile
210 215 220
Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly
225 230 235 240
Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr
245 250 255
Leu Leu Leu Ile Thr Xaa
260
<210> 48
<211> 635
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (635)..(635)
<223> Xaa can be any naturally occurring amino acid
<400> 48
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu
195 200 205
Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser
210 215 220
Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser
225 230 235 240
Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala
245 250 255
Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr
260 265 270
Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile
275 280 285
Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile
290 295 300
Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala
305 310 315 320
Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser
325 330 335
Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln
340 345 350
Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala
355 360 365
Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu
370 375 380
Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr
385 390 395 400
Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe
405 410 415
Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met
420 425 430
Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser
435 440 445
Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly
450 455 460
Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr
465 470 475 480
Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly
485 490 495
Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr
500 505 510
Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly
515 520 525
Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met
530 535 540
Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr
545 550 555 560
Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser
565 570 575
Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu
580 585 590
Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr
595 600 605
Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe
610 615 620
Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
625 630 635
<210> 49
<211> 515
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (515)..(515)
<223> Xaa can be any naturally occurring amino acid
<400> 49
Met Thr His Gln Ser His Ala Tyr His Met Val Lys Pro Ser Pro Trp
1 5 10 15
Pro Leu Thr Gly Ala Leu Ser Ala Leu Leu Met Thr Ser Gly Leu Ala
20 25 30
Met Trp Phe His Phe His Ser Met Thr Leu Leu Met Leu Gly Leu Leu
35 40 45
Thr Asn Thr Leu Thr Met Tyr Gln Trp Trp Arg Asp Val Thr Arg Glu
50 55 60
Ser Thr Tyr Gln Gly His His Thr Pro Pro Val Gln Lys Gly Leu Arg
65 70 75 80
Tyr Gly Met Ile Leu Phe Ile Thr Ser Glu Val Phe Phe Phe Ala Gly
85 90 95
Phe Phe Trp Ala Phe Tyr His Ser Ser Leu Ala Pro Thr Pro Gln Leu
100 105 110
Gly Gly His Trp Pro Pro Thr Gly Ile Thr Pro Leu Leu Gly Leu Leu
115 120 125
Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu
130 135 140
Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser
145 150 155 160
Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro
165 170 175
Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly
180 185 190
Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp
195 200 205
Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met
210 215 220
Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile
225 230 235 240
Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser
245 250 255
Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly
260 265 270
Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser
275 280 285
Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp
290 295 300
His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu
305 310 315 320
Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg
325 330 335
Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr
340 345 350
Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu
355 360 365
Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser
370 375 380
Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr
385 390 395 400
Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn
405 410 415
Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr
420 425 430
Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile
435 440 445
Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu
450 455 460
Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His
465 470 475 480
Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys
485 490 495
Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu
500 505 510
Ile Thr Xaa
515
<210> 50
<211> 543
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (543)..(543)
<223> Xaa can be any naturally occurring amino acid
<400> 50
Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu
1 5 10 15
Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu
20 25 30
Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg
35 40 45
Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu
50 55 60
Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln
65 70 75 80
Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile
85 90 95
Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu
100 105 110
Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe
115 120 125
Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn
130 135 140
Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala
145 150 155 160
Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met
165 170 175
Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val
180 185 190
Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn
195 200 205
Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr
210 215 220
Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile
225 230 235 240
Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile
245 250 255
Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala
260 265 270
Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn
275 280 285
Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr
290 295 300
Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala
305 310 315 320
Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu
325 330 335
Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu
340 345 350
Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu
355 360 365
Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu
370 375 380
Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser
385 390 395 400
Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro
405 410 415
Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val
420 425 430
Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn
435 440 445
Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met
450 455 460
Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly
465 470 475 480
Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp
485 490 495
Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr
500 505 510
Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu
515 520 525
Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
530 535 540
<210> 51
<211> 214
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (214)..(214)
<223> Xaa can be any naturally occurring amino acid
<400> 51
Met Leu Lys Leu Ile Val Pro Thr Ile Met Leu Leu Pro Leu Thr Trp
1 5 10 15
Leu Ser Lys Lys His Met Ile Trp Ile Asn Thr Thr Thr His Ser Leu
20 25 30
Ile Ile Ser Ile Ile Pro Leu Leu Phe Phe Asn Gln Ile Asn Asn Asn
35 40 45
Leu Phe Ser Cys Ser Pro Thr Phe Ser Ser Asp Pro Leu Thr Thr Pro
50 55 60
Leu Leu Met Leu Thr Thr Trp Leu Leu Pro Leu Thr Ile Met Ala Ser
65 70 75 80
Gln Arg His Leu Ser Ser Glu Pro Leu Ser Arg Lys Lys Leu Tyr Leu
85 90 95
Ser Met Leu Ile Ser Leu Gln Ile Ser Leu Ile Met Thr Phe Thr Ala
100 105 110
Thr Glu Leu Ile Met Phe Tyr Ile Phe Phe Glu Thr Thr Leu Ile Pro
115 120 125
Thr Leu Ala Ile Ile Thr Arg Trp Gly Asn Gln Pro Glu Arg Leu Asn
130 135 140
Ala Gly Thr Tyr Phe Leu Phe Tyr Thr Leu Val Gly Ser Leu Pro Leu
145 150 155 160
Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile
165 170 175
Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly
180 185 190
Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr
195 200 205
Leu Leu Leu Ile Thr Xaa
210
<210> 52
<211> 43
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (43)..(43)
<223> Xaa can be any naturally occurring amino acid
<400> 52
Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met
1 5 10 15
Leu Leu Thr Leu Phe Leu Ile Thr Gln Leu Lys Met Leu Asn Thr Asn
20 25 30
Tyr His Leu Pro Pro Ser Pro Leu Ala Ala Xaa
35 40
<210> 53
<211> 951
<212> RNA
<213> Human
<400> 53
augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60
guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120
cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180
cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240
acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300
aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360
auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420
cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480
accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540
auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600
auccuagaaa ucgcugucac uuuccuagga cuucuaacag cccuagaccu caacuaccua 660
accaacaaac uuaaaauaaa auccccacua ugcacauuuu auuucuccaa cauacucgga 720
uucuacccua gcaucacaca ccgcacaauc cccuaucuag gccuucuuac gagccaaaac 780
cugccccuac uccuccuaga ccuaaccuga cuagaaaagc uauuaccuaa aacaauuuca 840
cagcaccaaa ucuccaccuc caucaucacc ucaacccaaa aaggcauaau uaaacuuuac 900
uuccucucuu ucuucuuccc acucauccua acccuacucc uaaucacaua a 951
<210> 54
<211> 951
<212> DNA
<213> Artificial
<220>
<223> cDNA
<400> 54
atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60
gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120
cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180
cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240
acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300
aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360
attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420
ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480
accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540
atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600
atcctagaaa tcgctgtcac tttcctagga cttctaacag ccctagacct caactaccta 660
accaacaaac ttaaaataaa atccccacta tgcacatttt atttctccaa catactcgga 720
ttctacccta gcatcacaca ccgcacaatc ccctatctag gccttcttac gagccaaaac 780
ctgcccctac tcctcctaga cctaacctga ctagaaaagc tattacctaa aacaatttca 840
cagcaccaaa tctccacctc catcatcacc tcaacccaaa aaggcataat taaactttac 900
ttcctctctt tcttcttccc actcatccta accctactcc taatcacata a 951
<210> 55
<211> 317
<212> PRT
<213> Artificial
<220>
<223> putative protein sequence
<220>
<221> misc_feature
<222> (317)..(317)
<223> Xaa can be any naturally occurring amino acid
<400> 55
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly
1 5 10 15
Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro
20 25 30
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
35 40 45
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
50 55 60
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
65 70 75 80
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
85 90 95
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
100 105 110
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
115 120 125
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
130 135 140
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
145 150 155 160
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
165 170 175
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
180 185 190
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Thr Phe
195 200 205
Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu
210 215 220
Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly
225 230 235 240
Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu
245 250 255
Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu
260 265 270
Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile
275 280 285
Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe
290 295 300
Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa
305 310 315
<210> 56
<211> 747
<212> RNA
<213> Human
<220>
<221> misc_feature
<223> Fusion transcript P0026 (MT-CO2 (7586-8038) + MT-ND3
(10110-10404))
<400> 56
auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60
aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120
gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180
auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240
cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300
ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360
uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420
cgaguaguac ucccgauuga agcccccauu cguauaauua uuacauuuug acuaccacaa 480
cucaacggcu acauagaaaa auccaccccu uacgagugcg gcuucgaccc uauauccccc 540
gcccgcgucc cuuucuccau aaaauucuuc uuaguagcua uuaccuucuu auuauuugau 600
cuagaaauug cccuccuuuu accccuacca ugagcccuac aaacaacuaa ccugccacua 660
auaguuaugu caucccucuu auuaaucauc auccuagccc uaagucuggc cuaugaguga 720
cuacaaaaag gauuagacug aaccgaa 747
<210> 57
<211> 747
<212> DNA
<213> Human
<220>
<221> misc_feature
<223> Mutant DNA for fusion transcript P0026
<400> 57
atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60
atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120
gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180
atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240
ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300
ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360
tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420
cgagtagtac tcccgattga agcccccatt cgtataatta ttacattttg actaccacaa 480
ctcaacggct acatagaaaa atccacccct tacgagtgcg gcttcgaccc tatatccccc 540
gcccgcgtcc ctttctccat aaaattcttc ttagtagcta ttaccttctt attatttgat 600
ctagaaattg ccctcctttt acccctacca tgagccctac aaacaactaa cctgccacta 660
atagttatgt catccctctt attaatcatc atcctagccc taagtctggc ctatgagtga 720
ctacaaaaag gattagactg aaccgaa 747
<210> 58
<211> 249
<212> PRT
<213> Human
<220>
<221> misc_feature
<223> Fusion protein corresponding to P0026
<400> 58
Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile
1 5 10 15
Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe
20 25 30
Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr
35 40 45
Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val
50 55 60
Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser
65 70 75 80
Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr
85 90 95
Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp
100 105 110
Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu
115 120 125
Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu
130 135 140
Pro Ile Glu Ala Pro Ile Arg Met Ile Ile Thr Phe Trp Leu Pro Gln
145 150 155 160
Leu Asn Gly Tyr Met Glu Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp
165 170 175
Pro Met Ser Pro Ala Arg Val Pro Phe Ser Met Lys Phe Phe Leu Val
180 185 190
Ala Ile Thr Phe Leu Leu Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro
195 200 205
Leu Pro Trp Ala Leu Gln Thr Thr Asn Leu Pro Leu Met Val Met Ser
210 215 220
Ser Leu Leu Leu Ile Ile Ile Leu Ala Leu Ser Leu Ala Tyr Glu Trp
225 230 235 240
Leu Gln Lys Gly Leu Asp Trp Thr Glu
245
<210> 59
<211> 1544
<212> RNA
<213> Human
<220>
<221> misc_feature
<223> Fusion transcript P0062 (MT-ND1 (3307-4246) + MT-ATP6
(8603-9207))
<400> 59
auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60
augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120
ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180
cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240
aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300
ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360
ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420
ucauaugaag ucacccuagc caucauucua cuaucaacau uacuaauaag uggcuccuuu 480
aaccucucca cccuuaucac aacacaagaa caccucugau uacuccugcc aucaugaccc 540
uuggccauaa uaugauuuau cuccacacua gcagagacca accgaacccc cuucgaccuu 600
gccgaagggg aguccgaacu agucucaggc uucaacaucg aauacgccgc aggccccuuc 660
gcccuauucu ucauagccga auacacaaac auuauuauaa uaaacacccu caccacuaca 720
aucuuccuag gaacaacaua ugacgcacuc uccccugaac ucuacacaac auauuuuguc 780
accaagaccc uacuucuaac cucccuguuc uuaugaauuc gaacagcaua cccccgauuc 840
cgcuacgacc aacucauaca ccuccuauga aaaaacuucc uaccacucac ccuagcauua 900
cuuauaugau augucuccau acccauuaca aucuccagca uucccccucu auugaucccc 960
accuccaaau aucucaucaa caaccgacua aucaccaccc aacaaugacu aaucaaacua 1020
accucaaaac aaaugauaac cauacacaac acuaaaggac gaaccugauc ucuuauacua 1080
guauccuuaa ucauuuuuau ugccacaacu aaccuccucg gacuccugcc ucacucauuu 1140
acaccaacca cccaacuauc uauaaaccua gccauggcca uccccuuaug agcgggcaca 1200
gugauuauag gcuuucgcuc uaagauuaaa aaugcccuag cccacuucuu accacaaggc 1260
acaccuacac cccuuauccc cauacuaguu auuaucgaaa ccaucagccu acucauucaa 1320
ccaauagccc uggccguacg ccuaaccgcu aacauuacug caggccaccu acucaugcac 1380
cuaauuggaa gcgccacccu agcaauauca accauuaacc uucccucuac acuuaucauc 1440
uucacaauuc uaauucuacu gacuauccua gaaaucgcug ucgccuuaau ccaagccuac 1500
guuuucacac uucuaguaag ccucuaccug cacgacaaca caua 1544
<210> 60
<211> 1544
<212> DNA
<213> Human
<220>
<221> misc_feature
<223> Mutant DNA for fusion transcript P0062
<400> 60
atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60
atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120
ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180
ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240
atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300
ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360
tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420
tcatatgaag tcaccctagc catcattcta ctatcaacat tactaataag tggctccttt 480
aacctctcca cccttatcac aacacaagaa cacctctgat tactcctgcc atcatgaccc 540
ttggccataa tatgatttat ctccacacta gcagagacca accgaacccc cttcgacctt 600
gccgaagggg agtccgaact agtctcaggc ttcaacatcg aatacgccgc aggccccttc 660
gccctattct tcatagccga atacacaaac attattataa taaacaccct caccactaca 720
atcttcctag gaacaacata tgacgcactc tcccctgaac tctacacaac atattttgtc 780
accaagaccc tacttctaac ctccctgttc ttatgaattc gaacagcata cccccgattc 840
cgctacgacc aactcataca cctcctatga aaaaacttcc taccactcac cctagcatta 900
cttatatgat atgtctccat acccattaca atctccagca ttccccctct attgatcccc 960
acctccaaat atctcatcaa caaccgacta atcaccaccc aacaatgact aatcaaacta 1020
acctcaaaac aaatgataac catacacaac actaaaggac gaacctgatc tcttatacta 1080
gtatccttaa tcatttttat tgccacaact aacctcctcg gactcctgcc tcactcattt 1140
acaccaacca cccaactatc tataaaccta gccatggcca tccccttatg agcgggcaca 1200
gtgattatag gctttcgctc taagattaaa aatgccctag cccacttctt accacaaggc 1260
acacctacac cccttatccc catactagtt attatcgaaa ccatcagcct actcattcaa 1320
ccaatagccc tggccgtacg cctaaccgct aacattactg caggccacct actcatgcac 1380
ctaattggaa gcgccaccct agcaatatca accattaacc ttccctctac acttatcatc 1440
ttcacaattc taattctact gactatccta gaaatcgctg tcgccttaat ccaagcctac 1500
gttttcacac ttctagtaag cctctacctg cacgacaaca cata 1544
<210> 61
<211> 515
<212> PRT
<213> Human
<220>
<221> misc_feature
<223> Fusion protein corresponding to P0062
<220>
<221> misc_feature
<222> (515)..(515)
<223> Xaa can be any naturally occurring amino acid
<400> 61
Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala
1 5 10 15
Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln
20 25 30
Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro
35 40 45
Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala
50 55 60
Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr
65 70 75 80
Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val
85 90 95
Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala
100 105 110
Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala
115 120 125
Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val
130 135 140
Thr Leu Ala Ile Ile Leu Leu Ser Thr Leu Leu Met Ser Gly Ser Phe
145 150 155 160
Asn Leu Ser Thr Leu Ile Thr Thr Gln Glu His Leu Trp Leu Leu Leu
165 170 175
Pro Ser Trp Pro Leu Ala Met Met Trp Phe Ile Ser Thr Leu Ala Glu
180 185 190
Thr Asn Arg Thr Pro Phe Asp Leu Ala Glu Gly Glu Ser Glu Leu Val
195 200 205
Ser Gly Phe Asn Ile Glu Tyr Ala Ala Gly Pro Phe Ala Leu Phe Phe
210 215 220
Met Ala Glu Tyr Thr Asn Ile Ile Met Met Asn Thr Leu Thr Thr Thr
225 230 235 240
Ile Phe Leu Gly Thr Thr Tyr Asp Ala Leu Ser Pro Glu Leu Tyr Thr
245 250 255
Thr Tyr Phe Val Thr Lys Thr Leu Leu Leu Thr Ser Leu Phe Leu Trp
260 265 270
Ile Arg Thr Ala Tyr Pro Arg Phe Arg Tyr Asp Gln Leu Met His Leu
275 280 285
Leu Trp Lys Asn Phe Leu Pro Leu Thr Leu Ala Leu Leu Met Trp Tyr
290 295 300
Val Ser Met Pro Ile Thr Ile Ser Ser Ile Pro Pro Leu Leu Ile Pro
305 310 315 320
Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp
325 330 335
Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys
340 345 350
Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala
355 360 365
Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr
370 375 380
Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr
385 390 395 400
Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe
405 410 415
Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile
420 425 430
Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu
435 440 445
Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser
450 455 460
Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile
465 470 475 480
Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu
485 490 495
Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Asp
500 505 510
Asn Thr Xaa
515
<210> 62
<211> 999
<212> RNA
<213> Human
<220>
<221> misc_feature
<223> Fusion transcript P0064 (MT-ND1 (3307-3752) + MT-ND2
(4958-5511))
<400> 62
auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60
augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120
ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180
cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240
aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300
ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360
ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420
ucauaugaag ucacccuagc caucauagca ggcaguugag guggauuaaa ccaaacccag 480
cuacgcaaaa ucuuagcaua cuccucaauu acccacauag gaugaauaau agcaguucua 540
ccguacaacc cuaacauaac cauucuuaau uuaacuauuu auauuauccu aacuacuacc 600
gcauuccuac uacucaacuu aaacuccagc accacgaccc uacuacuauc ucgcaccuga 660
aacaagcuaa caugacuaac acccuuaauu ccauccaccc uccucucccu aggaggccug 720
cccccgcuaa ccggcuuuuu gcccaaaugg gccauuaucg aagaauucac aaaaaacaau 780
agccucauca uccccaccau cauagccacc aucacccucc uuaaccucua cuucuaccua 840
cgccuaaucu acuccaccuc aaucacacua cuccccauau cuaacaacgu aaaaauaaaa 900
ugacaguuug aacauacaaa acccacccca uuccucccca cacucaucgc ccuuaccacg 960
cuacuccuac cuaucucccc uuuuauacua auaaucuua 999
<210> 63
<211> 999
<212> DNA
<213> Human
<220>
<221> misc_feature
<223> Mutant DNA for fusion transcript P0064
<400> 63
atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60
atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120
ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180
ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240
atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300
ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360
tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420
tcatatgaag tcaccctagc catcatagca ggcagttgag gtggattaaa ccaaacccag 480
ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat agcagttcta 540
ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct aactactacc 600
gcattcctac tactcaactt aaactccagc accacgaccc tactactatc tcgcacctga 660
aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct aggaggcctg 720
cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac aaaaaacaat 780
agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta cttctaccta 840
cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt aaaaataaaa 900
tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc ccttaccacg 960
ctactcctac ctatctcccc ttttatacta ataatctta 999
<210> 64
<211> 333
<212> PRT
<213> Human
<220>
<221> misc_feature
<223> Fusion protein corresponding to P0064
<400> 64
Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala
1 5 10 15
Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln
20 25 30
Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro
35 40 45
Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala
50 55 60
Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr
65 70 75 80
Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val
85 90 95
Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala
100 105 110
Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala
115 120 125
Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val
130 135 140
Thr Leu Ala Ile Met Ala Gly Ser Trp Gly Gly Leu Asn Gln Thr Gln
145 150 155 160
Leu Arg Lys Ile Leu Ala Tyr Ser Ser Ile Thr His Met Gly Trp Met
165 170 175
Met Ala Val Leu Pro Tyr Asn Pro Asn Met Thr Ile Leu Asn Leu Thr
180 185 190
Ile Tyr Ile Ile Leu Thr Thr Thr Ala Phe Leu Leu Leu Asn Leu Asn
195 200 205
Ser Ser Thr Thr Thr Leu Leu Leu Ser Arg Thr Trp Asn Lys Leu Thr
210 215 220
Trp Leu Thr Pro Leu Ile Pro Ser Thr Leu Leu Ser Leu Gly Gly Leu
225 230 235 240
Pro Pro Leu Thr Gly Phe Leu Pro Lys Trp Ala Ile Ile Glu Glu Phe
245 250 255
Thr Lys Asn Asn Ser Leu Ile Ile Pro Thr Ile Met Ala Thr Ile Thr
260 265 270
Leu Leu Asn Leu Tyr Phe Tyr Leu Arg Leu Ile Tyr Ser Thr Ser Ile
275 280 285
Thr Leu Leu Pro Met Ser Asn Asn Val Lys Met Lys Trp Gln Phe Glu
290 295 300
His Thr Lys Pro Thr Pro Phe Leu Pro Thr Leu Ile Ala Leu Thr Thr
305 310 315 320
Leu Leu Leu Pro Ile Ser Pro Phe Met Leu Met Ile Leu
325 330
<210> 65
<211> 1481
<212> RNA
<213> Human
<220>
<221> misc_feature
<223> Fusion transcript P0176 (MT-ND1 (3307-3872) + MT-CO1
(6530-7445))
<400> 65
auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60
augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120
ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180
cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240
aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300
ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360
ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420
ucauaugaag ucacccuagc caucauucua cuaucaacau uacuaauaag uggcuccuuu 480
aaccucucca cccuuaucac aacacaagaa caccucugau uacuccugcc aucaugaccc 540
uuggccauaa uaugauuuau cuccacacua acagaccgca accucaacac caccuucuuc 600
gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 660
ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 720
uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 780
ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 840
acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 900
uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 960
gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1020
ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1080
cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1140
ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1200
guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1260
ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1320
ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1380
aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1440
cccuaccaca cauucgaaga acccguauac auaaaaucua g 1481
<210> 66
<211> 1481
<212> DNA
<213> Human
<220>
<221> misc_feature
<223> Mutant DNA for fusion transcript P0176
<400> 66
atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60
atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120
ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180
ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240
atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300
ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360
tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420
tcatatgaag tcaccctagc catcattcta ctatcaacat tactaataag tggctccttt 480
aacctctcca cccttatcac aacacaagaa cacctctgat tactcctgcc atcatgaccc 540
ttggccataa tatgatttat ctccacacta acagaccgca acctcaacac caccttcttc 600
gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 660
cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 720
tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 780
ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 840
acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 900
tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 960
gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1020
tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1080
ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1140
tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1200
gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1260
tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1320
tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1380
aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1440
ccctaccaca cattcgaaga acccgtatac ataaaatcta g 1481
<210> 67
<211> 494
<212> PRT
<213> Human
<220>
<221> misc_feature
<223> Fusion protein corresponding to P0176
<220>
<221> misc_feature
<222> (494)..(494)
<223> Xaa can be any naturally occurring amino acid
<400> 67
Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala
1 5 10 15
Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln
20 25 30
Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro
35 40 45
Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala
50 55 60
Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr
65 70 75 80
Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val
85 90 95
Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala
100 105 110
Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala
115 120 125
Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val
130 135 140
Thr Leu Ala Ile Ile Leu Leu Ser Thr Leu Leu Met Ser Gly Ser Phe
145 150 155 160
Asn Leu Ser Thr Leu Ile Thr Thr Gln Glu His Leu Trp Leu Leu Leu
165 170 175
Pro Ser Trp Pro Leu Ala Met Met Trp Phe Ile Ser Thr Leu Thr Asp
180 185 190
Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly Gly Gly Asp Pro
195 200 205
Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His Pro Glu Val Tyr
210 215 220
Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His Ile Val Thr Tyr
225 230 235 240
Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly Met Val Trp Ala
245 250 255
Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp Ala His His Met
260 265 270
Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr Phe Thr Ser Ala
275 280 285
Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val Phe Ser Trp Leu
290 295 300
Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala Ala Val Leu Trp
305 310 315 320
Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly Leu Thr Gly Ile
325 330 335
Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His Asp Thr Tyr Tyr
340 345 350
Val Val Ala His Phe His Tyr Val Leu Ser Met Gly Ala Val Phe Ala
355 360 365
Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe Ser Gly Tyr Thr
370 375 380
Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile Met Phe Ile Gly
385 390 395 400
Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly Leu Ser Gly Met
405 410 415
Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr Thr Trp Asn Ile
420 425 430
Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala Val Met Leu Met
435 440 445
Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg Lys Val Leu Met
450 455 460
Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr Gly Cys Pro Pro
465 470 475 480
Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys Ser Xaa
485 490
Claims (17)
- 미토콘드리아 DNA의 돌연변이에 해당하는 미토콘드리아 융합 전사물의 번역 결과 발생한 아미노산 서열을 포함하며, 상기 아미노산 서열은 서열식별번호 58로 이루어진, 단리 미토콘드리아 융합 단백질.
- 암에 관련된 적어도 하나의 미토콘드리아 융합 단백질의 존재에 관해 포유동물로부터의 조직 샘플을 분석해 상기 포유동물의 암을 검출하기 위한 키트의 제조에 사용되는, 제1항의 미토콘드리아 융합 단백질 중 적어도 일부와 특이적으로 결합하는 항체 또는 이의 항원 결합 단편.
- 제2항에 있어서, 상기 암은 전립선암, 정소암 , 난소암, 유방암, 결장 직장암, 폐암, 및 흑색종 피부암으로 이루어진 군으로부터 선택되는 항체 또는 이의 항원 결합 단편.
- 제1항의 단백질에 대해서 특이적으로 결합하는 항체 또는 이의 항원 결합 단편.
- 제4항에 있어서, 상기 항체는 다클론 또는 단일클론인 항체 또는 이의 항원 결합 단편.
- 제2항에 있어서, 상기 분석은 면역학적 분석을 포함하는 항체 또는 이의 항원 결합 단편.
- 제6항에 있어서, 상기 분석은 제5항의 항체 또는 이의 항원-결합 단편과 함께 행해지는 항체 또는 이의 항원 결합 단편.
- 포유동물의 암의 존재를 검출하는 분석을 하기 위한 키트로서, 제4항의 항체 또는 이의 항원-결합 단편을 포함하는, 키트.
- 서열식별번호 56에 나타난 핵산 서열을 포함하는, 단리 미토콘드리아 융합 전사물.
- 제9항의 융합 전사물을 코드하는 단리 mtDNA.
- 서열식별번호 57에 나타난 서열을 포함하는, 제10항의 단리 mtDNA.
- 제9항의 미토콘드리아 융합 전사물, 또는 제10항 또는 제11항의 mtDNA 중 적어도 일부와 상보하는 핵산 서열을 포함하는 하이브리드화 탐침으로서, 상기 일부는 연접된 유전자들의 연결 점을 포함한, 하이브리드화 탐침.
- 암에 관련된 적어도 하나의 미토콘드리아 융합 전사물의 존재에 관해 포유류로부터의 조직 시료를 분석해 상기 포유류의 암을 검출하기 위한 키트의 제조에 사용되는, 제9항의 단리 미토콘드리아 융합 전사물 중 적어도 일부와 상보하는 핵산 서열을 포함하는 하이브리드화 탐침으로서, 상기 일부는 연접된 유전자들의 연결 점을 포함한, 하이브리드화 탐침.
- 제13항에 있어서, 상기 암은 전립선암, 정소암 , 난소암, 유방암, 결장 직장암, 폐암, 및 흑색종 피부암으로 이루어지는 군으로부터 선택되는 하이브리드화 탐침.
- 포유류의 암의 존재를 검출하는 분석을 하기 위한 키트로서, 제9항에 기재된 단리 미토콘드리아 융합 전사물 중 적어도 일부와 상보하는 핵산 서열을 포함하는 적어도 하나의 하이브리드화 탐침을 포함하고, 상기 일부는 연접된 유전자의 연결 점을 포함하는 키트.
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CAPCTCA2009/000351 | 2009-03-27 | ||
PCT/CA2009/000351 WO2009117811A1 (en) | 2008-03-28 | 2009-03-27 | Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor |
PCT/CA2010/000423 WO2010115261A1 (en) | 2009-03-27 | 2010-03-29 | Aberrant mitochondrial dna, associated fusion transcripts and translation products and hybridization probes therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140014360A KR20140014360A (ko) | 2014-02-06 |
KR101720555B1 true KR101720555B1 (ko) | 2017-03-29 |
Family
ID=42937093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117025261A KR101720555B1 (ko) | 2009-03-27 | 2010-03-29 | 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침 |
Country Status (6)
Country | Link |
---|---|
EP (2) | EP3272871B1 (ko) |
JP (1) | JP5734947B2 (ko) |
KR (1) | KR101720555B1 (ko) |
AU (1) | AU2010234238B2 (ko) |
RU (1) | RU2011137486A (ko) |
WO (1) | WO2010115261A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ588658A (en) | 2008-03-28 | 2012-10-26 | Mitomics Inc | Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor |
TWI709188B (zh) | 2018-09-27 | 2020-11-01 | 財團法人工業技術研究院 | 基於機率融合的分類器、分類方法及分類系統 |
CN113025633B (zh) * | 2019-12-09 | 2024-08-27 | 武汉纽福斯生物科技有限公司 | 编码人nadh脱氢酶亚单位1蛋白的核酸及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006111029A1 (en) * | 2005-04-18 | 2006-10-26 | Genesis Genomics Inc. | Mitochondrial mutations and rearrangements as a diagnostic tool for the detection of sun exposure, prostate cancer and other cancers |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL154598B (nl) | 1970-11-10 | 1977-09-15 | Organon Nv | Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking. |
US3817837A (en) | 1971-05-14 | 1974-06-18 | Syva Corp | Enzyme amplification assay |
US3939350A (en) | 1974-04-29 | 1976-02-17 | Board Of Trustees Of The Leland Stanford Junior University | Fluorescent immunoassay employing total reflection for activation |
US3996345A (en) | 1974-08-12 | 1976-12-07 | Syva Company | Fluorescence quenching with immunological pairs in immunoassays |
US4277437A (en) | 1978-04-05 | 1981-07-07 | Syva Company | Kit for carrying out chemically induced fluorescence immunoassay |
US4275149A (en) | 1978-11-24 | 1981-06-23 | Syva Company | Macromolecular environment control in specific receptor assays |
US4366241A (en) | 1980-08-07 | 1982-12-28 | Syva Company | Concentrating zone method in heterogeneous immunoassays |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US6218117B1 (en) * | 1998-06-15 | 2001-04-17 | Mitokor | Compositions and methods for identifying agents that quantitatively alter detectable extramitochondrial DNA:mitochondrial DNA ratios |
US20030162174A1 (en) * | 2001-06-11 | 2003-08-28 | Sutherland John W. | Detecting nucleic acid deletion sequences |
WO2002101086A2 (en) * | 2001-06-11 | 2002-12-19 | 1304854 Ontario Ltd. | Complete mitochondrial genome sequences as a diagnostic tool for the health sciences |
EP2634267B1 (en) * | 2007-09-26 | 2015-02-18 | Mitomics Inc. | 3.4 kb mitochondrial DNA deletion for use in the detection of cancer |
NZ588658A (en) * | 2008-03-28 | 2012-10-26 | Mitomics Inc | Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor |
-
2010
- 2010-03-29 EP EP17188792.0A patent/EP3272871B1/en active Active
- 2010-03-29 EP EP10761136.0A patent/EP2411522B1/en not_active Not-in-force
- 2010-03-29 JP JP2012501093A patent/JP5734947B2/ja not_active Expired - Fee Related
- 2010-03-29 RU RU2011137486/10A patent/RU2011137486A/ru not_active Application Discontinuation
- 2010-03-29 WO PCT/CA2010/000423 patent/WO2010115261A1/en active Application Filing
- 2010-03-29 AU AU2010234238A patent/AU2010234238B2/en not_active Ceased
- 2010-03-29 KR KR1020117025261A patent/KR101720555B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006111029A1 (en) * | 2005-04-18 | 2006-10-26 | Genesis Genomics Inc. | Mitochondrial mutations and rearrangements as a diagnostic tool for the detection of sun exposure, prostate cancer and other cancers |
Also Published As
Publication number | Publication date |
---|---|
AU2010234238A1 (en) | 2011-09-29 |
EP3272871A1 (en) | 2018-01-24 |
EP2411522A1 (en) | 2012-02-01 |
RU2011137486A (ru) | 2013-05-10 |
JP2012521745A (ja) | 2012-09-20 |
EP3272871B1 (en) | 2020-01-15 |
EP2411522B1 (en) | 2017-09-06 |
AU2010234238B2 (en) | 2016-07-28 |
JP5734947B2 (ja) | 2015-06-17 |
KR20140014360A (ko) | 2014-02-06 |
EP2411522A4 (en) | 2013-01-02 |
WO2010115261A1 (en) | 2010-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8715960B2 (en) | Aberrant mitochondrial DNA, associated fusion transcripts and translation products and hybridization probes therefor | |
US6538108B1 (en) | Compositions and methods relating to DNA mismatch repair genes | |
US7122373B1 (en) | Human genes and gene expression products V | |
DK2456889T3 (en) | Markers of endometrial cancer | |
JP2003518920A (ja) | 新規なヒト遺伝子および遺伝子発現産物 | |
KR101720555B1 (ko) | 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침 | |
CN110564850A (zh) | 一种ewsr1-tfeb融合基因及其检测引物和应用 | |
CA2756824A1 (en) | Aberrant mitochondrial dna, associated fusion transcripts and translation products and hybridization probes therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
N231 | Notification of change of applicant | ||
GRNT | Written decision to grant |