KR20170004033A - 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브 - Google Patents

비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브 Download PDF

Info

Publication number
KR20170004033A
KR20170004033A KR1020167036800A KR20167036800A KR20170004033A KR 20170004033 A KR20170004033 A KR 20170004033A KR 1020167036800 A KR1020167036800 A KR 1020167036800A KR 20167036800 A KR20167036800 A KR 20167036800A KR 20170004033 A KR20170004033 A KR 20170004033A
Authority
KR
South Korea
Prior art keywords
leu
thr
ile
ala
ser
Prior art date
Application number
KR1020167036800A
Other languages
English (en)
Other versions
KR101819852B1 (ko
Inventor
리안 파르
브라이언 레걸리
가브리엘 다쿠보
제니퍼 크리드
케리 로빈슨
Original Assignee
엠디엔에이 라이프 사이언시즈 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠디엔에이 라이프 사이언시즈 인코퍼레이티드 filed Critical 엠디엔에이 라이프 사이언시즈 인코퍼레이티드
Publication of KR20170004033A publication Critical patent/KR20170004033A/ko
Application granted granted Critical
Publication of KR101819852B1 publication Critical patent/KR101819852B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 암을 예측하거나, 진단하거나 및/또는 모니터링하는데 유용한 신규 미토콘드리아 융합 트랜스크립트 및 모 돌연변이 mtDNA 분자를 제공한다. 또한, 본 발명의 방법에 사용하기 위해 그에 상보적인 혼성화 프로브가 제공된다.

Description

비정상적인 미토콘드리아 DNA, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브{ABERRANT MITOCHONDRIAL DNA, ASSOCIATED FUSION TRANSCRIPTS AND HYBRIDIZATION PROBES THEREFOR}
본 발명은 미토콘드리아 유전체학 분야에 관한 것이다. 일 측면에서, 본 발명은 미토콘드리아 게놈 융합 트랜스크립트 및 그에 혼성화된 프로브의 식별 및 용도에 관한 것이다.
미토콘드리아 게놈
미토콘드리아 게놈은 핵산의 작지만 중요한 서열이다. 미토콘드리아 DNA, 또는 "mtDNA"는 33억 bp (haploid)의 광대한 핵 게놈과 대조적으로 16,569 핵산 염기쌍 (bp) (Anderson et al., 1981 ; Andrews et al., 1999)의 작은 게놈을 포함한다. 그의 유전적 보체는 그의 핵 세포 메이트의 그것보다 실질적으로 더 작다 (0.0005%). 그러나, 개개의 세포는 특이적 세포 기능에 따라 103 내지 104개의 미토콘드리아를 어느 곳에나 전달한다 (Singh and Modica-Napolitano 2002). 통신 또는 화학적 시그널링은 핵과 미토콘드리아 게놈 사이에서 관례적으로 발생한다 (Sherratt et al., 1997). 더욱이, 특이적 핵 성분은 미토콘드리아 서열의 유지 및 통합에 책임이 있다 (Croteau et al., 1999). 주어진 개체 내의 모든 mtDNA 게놈들은 일단 수정이 발생하면 난자 내의 미토콘드리아의 클론 확장으로 인해 동일하다. 그러나 돌연변이 유발 사건은 체세포 돌연변이로서 반영된 서열 다양성을 유도할 수 있다. 이들 돌연변이는 헤테로플라즈미로서 공지된 조건에서 신체 전반의 상이한 조직 내에 축적될 수 있다.
미토콘드리아 프로테옴
핵 자리에 대한 심한 미토콘드리아 의존도를 지시하는, 미토콘드리아 게놈에 의해 코드화된 이들 중 단지 37개에 의해 미토콘드리아를 구성하고, 작동시키고 유지하기 위해 약 3,000개의 핵 유전자가 요구된다. 미토콘드리아 게놈은 전자 수송에 필수적인 나머지 13개의 유전자의 정확한 해석을 보장하는 2 rRNAs 및 22 tRNAs를 포함하여 24개 유전자의 보체에 대해 코드화한다 (도 1 참조). 미토콘드리아 게놈은 미토콘드리아 게놈에 의해 공급되는 13개의 폴리펩티드 외에, 이러한 중요한 기능에 필수적인 산화 및 환원 반응을 수행하기 위한 70개의 핵 인코딩된 단백질에 의존한다. 핵 및 미토콘드리아 단백질 모두는 안쪽 미토콘드리아 멤브레인을 스패닝하는 착물을 형성하고 세포 대사에 필요한 화학 연로 아데노신 트리포스페이트 또는 ATP의 80-90%를 총괄적으로 발생시킨다. 에너지 생산 외에, 미토콘드리아는 다른 대사 경로에서 마찬가지로 중심 역할을 한다. 미토콘드리아의 중요한 기능은 세포 사멸 또는 아폽토시스의 조정이다 (Green and Kroemer, 2005 참조). 필수적으로, 바깥쪽 미토콘드리아 멤브레인, 또는 마찬가지로 안쪽 미토콘드리아 멤브레인을 침투할 수 있는 신호 경로가 있다. 특정 미토콘드리아 단백질 시토졸 내로 방출되는 경우, 비-가역적 세포 사멸은 진행중으로 설정된다. 이러한 과정은 몇몇 미토콘드리아 단백질이 갖는 다중-기능적 역할을 강조한다. 이들 멀티-태스킹 단백질은 대안의 기능을 가질 수 있는 다른 미토콘드리아 단백질이 마찬가지로 존재할 수 있음을 시사한다.
미토콘드리아 융합 트랜스크립톰
미토콘드리아 게놈은 그것이 환상의 인트론이 적은 DNA 분자라는 점에서 흔치 않다. 게놈은 특정 길이의 서열 측면에 있는 반복 모티브들과 사이에 배치된다 이들 반복물 사이의 서열은 잘 알려지지 않은 상황 하에 결실되기 쉽다. 미토콘드리아 게놈에서 반복물의 수가 가정되면, 많은 가능한 결실이 존재한다. 최고의 공지된 예는 4977개의 "공통 결실"이다. 이러한 결실은 여러 가지 알려진 상태 및 질병들과 연관되어 있고, 노화됨에 따라 빈도가 증가하는 것으로 생각된다 (Dai et al., 2004; Ro et al., 2003; Barron et al., 2001 ; Lewis et al., 2000; Muller-Hocker, 1998; Porteous et al., 1998) (도 4). 미토콘드리아 유전체학 분야의 현재 생각은 미토콘드리아 결실은 단지 반응성 산소 종들 및 UVR과 같은 작용제들에 의한 미토콘드리아 게놈에 대한 손상의 해로운 부산물 (Krishnan et al 2008, Nature Genetics)이라는 것이다. 더욱이, 높은 레벨의 mtDNA 결실이 세포 호흡에 필요한 유전자 서열을 누락한 결과로서 ATP의 형태로 에너지를 생산하기 위해 세포의 능력에 대해 심각한 결과를 가질 수 있는 것으로 인식되더라도, 이들 결실된 미토콘드리아 분자들은 하류 경로의 일 성분일 수 있고, 의도된 기능적 역할을 하고, 가능하게는 출원인이 예상한 바와 같이 미토콘드리아의 인식된 유전자의 대안의 자연적 형태로서 더욱 적절히 검토될 수 있는 것으로 예상되지 않는다.
mtDNA의 서열 역학은 중요한 진단 도구이다. mtDNA에서 돌연변이는 종종 질병 발현의 예비 지시자이다. 예를 들면, 미토콘드리아 게놈에서 점 돌연변이는 전립선에서 종양 초점의 특징인 것으로 드러나고 있다. 이러한 경향은 또한 종양 조직에 인접하거나 또는 멀리 떨어진 정상적으로 보이는 조직들로 확장한다 (Parr et al. 2006). 이는 미토콘드리아 돌연변이가 악성 형질전환 경로에서 조기 발생함을 시사한다.
예를 들면, 3.4kb 미토콘드리아 결실 빈도는 양성 및 악성 전립선 조직들 사이를 차별화하는데 우수한 유틸리티를 갖는다 (Maki et al. 2008).
미토콘드리아 융합 트랜스크립트는 먼저 대두에서 (Morgens et al. 1984) 및 이후에 희귀한 신경근육 질환인 컨스-세이어 증후군인 2명의 환자들에서와 같이 문헌에 이미 보고되어 있다 (Nakase et al 1990). 중요하게는 이들 트랜스크립트는 임의의 인간 암들과의 연관성을 갖는 것으로 밝혀지지 않았거나 또는 (그에 관하여 조사되지) 않았다.
본 발명의 목적은 비정상적인 미토콘드리아 DNA, 연관된 융합 트랜스크립트 및 그를 위한 혼성화 프로브를 제공하는 것이다.
본 발명의 일 측면에 따라, 암과 연관된 단리된 미토콘드리아 융합 트랜스크립트가 제공된다.
본 발명의 일 측면에 따라, 서열번호 34 내지 49 및 52 중의 임의의 하나에 나타낸 바의 서열을 갖는, 상기 융합 트랜스크립트에 대응하는 미토콘드리아 융합 단백질이 제공된다.
본 발명의 또 다른 측면에 따라, 본 발명의 융합 트랜스크립트를 인코딩한 단리된 mtDNA가 제공된다.
본 발명의 또 다른 측면에 따라, 본 발명의 미토콘드리아 융합 트랜스크립트 또는 mtDNA의 적어도 일부에 상보적인 핵산 서열을 갖는 혼성화 프로브가 제공된다.
본 발명의 또 다른 측면에 따라, 본 발명에 따른 미토콘드리아 융합 트랜스크립트의 적어도 일부에 상보적인 핵산 서열을 갖는 적어도 하나의 혼성화 프로브로 샘플을 혼성화시킴으로써 암과 연관된 적어도 하나의 미토콘드리아 융합 트랜스크립트의 존재에 대해 포유동물로부터 조직 샘플을 분석하는 단계를 포함하는 포유동물에서 암의 검출 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 본 발명에 따른 mtDNA의 적어도 일부에 상보적인 핵산 서열을 갖는 적어도 하나의 혼성화 프로브로 샘플을 혼성화함으로써 암과 연관된 적어도 하나의 비정상적인 mtDNA의 존재에 대해 포유동물로부터 조직 샘플을 분석하는 단계를 포함하는 포유동물에서 암의 검출 방법이 제공된다.
본 발명의 또 다른 측면에 따라, 본 발명의 융합 트랜스크립트 또는 mtDNA의 적어도 일부에 상보적인 적어도 하나의 혼성화 프로브를 포함하는, 포유동물에서 암의 존재를 검출하기 위해 분석을 수행하기 위한 키트가 제공된다.
본 발명의 또 다른 측면에 따라, 암과 연관된 것들을 식별하기 위해 10's, 100's, 또는 1000's의 미토콘드리아 융합 트랜스크립트를 갖는 마이크로어레이로 구성된 선별 도구가 제공된다.
본 발명의 또 다른 측면에 따라, 암과 연관된 것들을 식별하기 위해 미토콘드리아 융합 트랜스크립트에 대응하는 10's, 100's, 또는 1000's의 미토콘드리아 DNA를 갖는 마이크로어레이로 구성된 선별 도구가 제공된다.
본 발명의 또 다른 측면에 따라, 암과 연관된 것들을 식별하기 위해 미토콘드리아 융합 트랜스크립트에 대응하는 10's, 100's, 또는 1000's의 멀티플렉스 분지된 DNA 분석으로 구성된 선별 도구가 제공된다.
본 발명의 또 다른 측면에 따라, 암과 연관된 것들을 식별하기 위해 미토콘드리아 융합 트랜스크립트에 대응하는 10's, 100's, 또는 1000's의 미토콘드리아 DNA를 갖는 멀티플렉스 분지된 DNA 분석으로 구성된 선별 도구가 제공된다.
본 발명의 구체예들은 이하 첨부된 도면을 참조하여 실시예로써만 기재될 것이다:
도 1은 미토콘드리아 코딩 유전자를 보여주는 예시도이다.
도 2는 3.4kb 결실의 손실에 의해 유발된 전립선 샘플에서 폴리아데날화된 융합 트랜스크립트를 보여주는 도면이다.
도 3은 4977kb 공통 결실의 손실에 의해 유발된 전립선 샘플에서 폴리아데날화된 융합 트랜스크립트를 보여주는 도면이다.
도 4는 게놈으로부터 3.4 kb의 손실에 의해 유발된 유방 샘플에서 폴리아데날화된 융합 트랜스크립트를 보여주는 도면이다.
도 5a 및 5b는 유전자의 스플라이싱 전후 미토콘드리아 DNA 영역의 예를 보여주는 도면이다.
도 6a 내지 6g는 대장암 종양의 식별에 있어서 본 발명의 트랜스크립트 2, 3, 8, 9, 10, 11 및 12에 대한 결과를 예시하는 도면이다.
도 7a 내지 7d는 폐암 종양의 식별에 있어서 본 발명의 트랜스크립트 6, 8, 10 및 20에 대한 결과를 예시하는 도면이다.
도 8a 내지 8g는 흑색종의 식별에 있어서 본 발명의 트랜스크립트 6, 10, 11, 14, 15, 16 및 20에 대한 결과를 예시하는 도면이다.
도 9a 내지 9h는 난소암의 식별에 있어서 본 발명의 트랜스크립트 1, 2, 3, 6, 11, 12, 15 및 20에 대한 결과를 예시하는 도면이다.
도 10 내지 18은 고환암의 식별에 있어서 본 발명의 트랜스크립트 2, 3, 4, 11, 12, 13, 15, 16 및 20에 대한 결과를 예시하는 도면이다.
본 발명은 암을 예측하거나, 진단하거나 및/또는 모니터링하는데 유용한 신규 미토콘드리아 융합 트랜스크립트 및 모 돌연변이 mtDNA 분자를 제공한다. 또한, 본 발명은 융합 트랜스크립트 및 연관된 mtDNA 분자를 검출하기 위한 혼성 프로브를 제공하고 그러한 프로브의 용도를 제공한다.
정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 당업계의 통상의 기술을 가진 자에 의해 공통적으로 이해되는 것과 동일한 의미를 갖는다.
본원에 사용된 바와 같이, "수차" 또는 "돌연변이"는 융합 트랜스크립트를 초래하고 삽입, 전좌, 결실, 복제, 재조합, 재배열 또는 이들의 조합을 포함하지만, 이들로만 제한되지 않는 야생형 미토콘드리아 DNA 서열에서 임의의 변형을 포함한다.
본원에 정의된 바, "생물학적 샘플"은 관심을 끄는 분자로부터 획득할 수 있는 세포를 함유하는 조직액 또는 체액을 의미한다. 예를 들면, 생물학적 샘플은 전립선, 유방, 대장, 폐 및 피부와 같은 조직으로부터, 또는 혈액, 타액, 뇌 척수액, 가래, 소변, 점액, 관절낭액, 복막액, 양수 등으로부터 유도될 수 있다. 생물학적 샘플은 수술 표본 또는 생검 표본일 수 있다. 생물학적 샘플은 샘플의 특성을 변형시키기 위해 소스로부터 획득되는 것으로서 직접적으로 또는 전처리 후에 사용될 수 있다. 따라서, 생물학적 샘플은 예를 들면, 혈액으로부터 플라즈마 또는 혈청을 제조하고, 세포들을 분쇄하고, 고체 f세포들을 분쇄하고, 물질로부터 액체를 제조하고, 점성 유체를 희석하고, 액체를 여과하고, 액체를 증류하고, 액체를 농축하고, 간섭 성분을 불활성화하고, 시약을 첨가하는 등에 의해 사용 전에 전처리될 수 있다.
"연속" 트랜스크립트는 두 스플라이스된 유전자의 시작에서 끝까지 리딩 프레임을 유지하는 융합 트랜스크립트이다. "말단" 트랜스크립트는 제2 스플라이스된 유전자의 원시 종결 코돈 전에 미숙한 종결 코돈을 초래하는 융합 트랜스크립트이다.
본원에 사용된 바와 같이, "미토콘드리아 DNA" 또는 "mtDNA"는 미토콘드리아에 존재하는 DNA이다.
본원에 사용된 바와 같이, "미토콘드리아 융합 트랜스크립트" 또는 "융합 트랜스크립트"라는 표현은 돌연변이된 미토콘드리아 DNA 서열의 트랜스크립션의 결과로서 생산되고 여기서 그러한 돌연변이는 미토콘드리아 결실 및 기타 대규모 미토콘드리아 DNA 재배열을 포함할 수 있는 RNA 트랜스크립션 제품을 의미한다.
컴퓨터 분석 및 서열 표적화
상기 고찰한 바와 같이, 미토콘드리아 융합 트랜스크립트는 대두에서 (Morgens et al. 1984) 및 희귀한 신경근육 질환을 앓고 있는 인간에서 (Nakase et al 1990) 보고되고 있다. 그러나 인간 암과 연관된 융합 트랜스크립트는 기재되어 있지 않다.
암과 연관된 인간 미토콘드리아 게놈의 대규모 결실을 매핑한 것으로부터 획득한 지식, 높은 빈도의 이들 결실의 관찰, 및 전사적으로 활성인 돌연변이된 mtDNA 분자의 또 다른 유기체 및 또 다른 질병 유형에서의 증거를 사용함으로써, 출원인은 암과 관련되는 경우 그러한 결실이 DNA 분자 및 손상 및 회복 공정보다 중요할 수 있다고 가설하였다. 이러한 가설을 시험하기 위해, 미토콘드리아 게놈의 컴퓨터 분석이 많은 잠재적 결실 부위를 시사하는 반복 요소들에 특이적으로 수행되었다. 이러한 초기 단계 후, 비-인접 위치 또는 비-탠덤 위치를 갖는 미토콘드리아 서열에서 독특한 반복물을 식별함으로써, 초기화됨에 따라 결실 DNA 분자중의 결실 사건은 개방된 리딩 프레임 (ORF)을 갖는 융합된 DNA 서열을 생산하기 위해 재폐쇄되거나 재결찰될 수 있는 그들 반목물을 확인하기 위해 필터가 적용되었다. 이어서, 18 분자의 서브세트는 1) 그것들이 인간의 자연스러운 생물학적 상태에서 존재하는지 및 2) 그것들이 악성 종양에 대한 관련성을 갖는지 여부를 조사하기 위한 타겟화를 위해 선택되었다. 이들 조사로부터 결과는 이하에 기재된다.
게놈의 돌연변이
미토콘드리아 DNA (mtDNA) 역학은 중요한 진단 도구이다. mtDNA에서 돌연변이는 종종 발전하는 질병의 예비 지시자이고, 질병의 시작과 연관된 위험 인자들을 지시하는 바이오마커로서 작용한다. 본 발명에 따라, 미토콘드리아 게놈에서 대규모 재배열 돌연변이는 암과 연관된 융합 트랜스크립트의 발생을 초래한다. 따라서, 암의 검출, 진단 및 모니커링을 위해 그에 지향된 그러한 트랜스크립트 및 프로브를 인코딩한 mtDNA의 용도가 제공된다.
당업계의 숙련자는 본 발명의 방법에 사용하기 위한 mtDNA 분자가 자연적으로-발생하는 돌연변이체를 통해 유도될 수 있거나, 본원에 기재된 융합 트랜스크립트의 임의의 것의 상보적 서열에 기초할 수 있음을 인정한다. 예시적인 mtDNA 서열 및 융합 트랜스크립트는 출원인들의 미국 우선권 출원 제61/040,616호에 기재되어 있으며, 여기서 참고 문헌으로서 그의 전문을 인용한다.
돌연변이체 게놈의 서열의 검출
본 발명에 따른 돌연변이체 mtDNA 서열은 융합 트랜스크립트의 발생을 초래하는 임의의 변형을 포함할 수 있다. 그러한 변형의 비제한적인 예는 삽입, 전좌, 결실, 복제, 재조합, 재배열 또는 이들의 조합을 포함한다. 그 변형 또는 변화는 단지 몇몇 염기로부터 여러 킬로베이스로 크기가 크게 다양할 수 있고, 바람직하게는 그 변형은 실질적인 결실 또는 다른 대규모 게놈의 수차를 초래한다.
그러한 돌연변이의 존재를 검출하기 위한 DNA의 검출은 업계-인식된 방법을 사용하고, 이어서 미토콘드리아 게놈의 모든 영역 또는 하나의 영역을 증폭시킴으로써 발생할 수 있고, 분자 생물학의 현행 프로토콜에 기재된 바와 같이 미토콘드리아 게놈의 서열화를 포함할 수 있다. 대안으로, 관심있는 특이적 단편의 증폭을 요구하지 않는 기술뿐만 아니라 조잡한 조직 균질물이 사용될 수 있다.
돌연변이를 검출하는 단계는 당업계의 기술자들에게 공지된 바의 임의의 기술로부터 선택될 수 있다. 예를 들면, mtDNA를 분석하는 것은 DNA를 분지화하고, mtDNA를 서열화하고, mtDNA를 PCR, 써던, 노던, 웨스턴 사우쓰-웨스턴 블롯 혼성화에 의해 증폭하고, HPLC를 변성하고, 마이크로어레이, 비이오칩 또는 유전자 칩, 분자 마커 분석, 바이오센서에 대해 혼성화하고, 용융 온도 프로파일링 또는 상기한 것들 중의 임의의 조합에 의한 표적의 선택을 포함할 수 있다.
서열 미토콘드리아 DNA에 대한 임의의 적합한 수단이 사용될 수 있다. 바람직하게는, mtDNA는 서열화에 앞서 PCR에 의해 증폭된다. PCR 방법은 당업계에 공지되어 있고 문헌[MuINs and Faloona, 1987, Methods Enzymol., 155: 335]에 기재된 바와 같이 수행될 수 있다. PCR 제품은 벡터 내로 직접적으로 서열화되거나 또는 클론화될 수 있고 이는 다시 세균 호스트 내에 놓인다. DNA 서열화 방법의 예는 문헌[Brumley, R. L. Jr. and Smith, L. M., 1991, 수평형 초박 겔 전기영동에 의한 고속 DNA 서열화, Nucleic Acids Res. 19:4121-4126 and Luckey, J.A., et al, 1993, 모세관 겔 전기영동에 의한 고속 DNA 서열화, Methods Enzymol. 218: 154-172]에서 발견되었다. PCR 및 mtDNA의 서열화의 조합된 사용은 문헌[Hopgood, R., et al, 1992, PCR 제품으로부터 직접적으로 인간 mtDNA를 자동 서열화하기 위한 전략, Biotechniques 13:82-92 and Tanaka, M. et al, 1996, mtDNA의 자동 서열화, Methods Enzymol. 264: 407-421]에 기재되어 있다.
다양한 프라이머를 제조하기 위한 적합한 서열을 선택하는 방법은 당업계에 공지되어 있다. 예를 들면, 프라이머는 Applied Biosystems USA Inc. (Foster City, California), DuPont, (Wilmington, Del.), 또는 Milligen (Bedford, Mass.)로부터 입수할 수 있는 것들과 같이 상업적으로 입수할 수 있는 장비를 사용하여 통상의 고체-상 합성을 사용하여 제조될 수 있다.
본 발명의 일 측면에 따라, 후보 게놈의 서열을 결정하기 위해, 서열 결실의 접함점이 먼저 확인된다. 서열 결실은 주로 5' 및 3' 말단에서 삭제되어야 할 서열의 측면에 위치하는 직접 및 간접 반복 요소들에 의해 확인된다. 게놈으로부터 뉴클레오티드 섹션의 제거에 이어 게놈의 결찰은 신규한 접합점의 생성을 초래한다.
접합점의 식별에 따라, 접합점의 측면에 위치하는 유전자의 뉴클레오티드는 스플라이스된 유전자를 식별하기 위해 결정된다. 통상적으로 스플라이스된 유전자는 제1 유전자로부터 개시 코돈 및 제2 유전자로부터 종결 코돈을 포함하고, 연속 트랜스크립트 즉, 리딩 프레임을 시작점으로부터 두 스플라이스된 유전자의 말단으로 유지하는 것으로부터 발현될 수 있다. 유전자 서열 내에 함유된 대안의 개시 또는 종결 코돈은 본원에 기재된 서열번호 2 및 서열번호 17에 의해 명백한 것으로 사용될 수 있다. 개방된 리딩 프레임 (ORF)을 갖는 것으로 발견된 일부 공지된 미토콘드리아 결실은 재배열된 서열이 스플라이스 부위에서 재결합되는 경우 표 1에 제공된다.
실험실에서 존재하는 것으로 검증된 본 발명의 방법에 사용하기 위한 예시적인 mtDNA 분자가 이래 제공된다. 이들 mtDNA는 공지된 미토콘드리아 게놈 (서열번호 1)의 변형에 기초하며 융합 또는 "FUS" 지정을 할당하여 왔으며, 여기서 A:B는 제1의 스플라이스된 유전자의 최종 미토콘드리아 뉴클레오티드와 제2의 스플라이스된 유전자의 제1의 미토콘드리아 뉴클레오티드 사이의 접합점을 나타낸다. 스플라이스된 유전자의 식별은 대응하는 서열 식별자에 의해 괄호로 제공된다. 아래 제공되는 경우, (AltMet) 및 (OrigMet)은 대안 및 원시 해독 시작 부위 각각을 의미한다.
FUS 8469:13447 (AltMet) (ATP 신타제 FO 서브유니트 8 내지 NADH 데히드로게나제 서브유니트) (서열번호 2)
FUS 10744:14124 (NADH 데히드로게나제 서브유니트 4L (ND4L) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 3)
FUS 7974:15496 (사이토크롬 c 옥시다제 서브유니트 II (COM) 내지 사이토크롬 b (Cytb)) (서열번호 4)
FUS 7992:15730 (사이토크롬 c 옥시다제 서브유니트 II (COM) 내지 사이토크롬 b (Cytb)) (서열번호 5)
FUS 8210:15339 (사이토크롬 c 옥시다제 서브유니트 II (COM) 내지 사이토크롬 b (Cytb)) (서열번호 6)
FUS 8828:14896 (ATP 신타제 FO 서브유니트 6 (ATPase6) 내지 사이토크롬 b (Cytb)) (서열번호 7)
FUS 10665:14856 (NADH 데히드로게나제 서브유니트 4L (ND4L) 내지 사이토크롬 b (Cytb)) (서열번호 8)
FUS 6075:13799 (사이토크롬 c 옥시다제 서브유니트 I (COI) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 9)
FUS 6325:13989 (사이토크롬 c 옥시다제 서브유니트 I (COI) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 10)
FUS 7438:13476 (사이토크롬 c 옥시다제 서브유니트 I (COI) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 11)
FUS 7775:13532 (사이토크롬 c 옥시다제 서브유니트 II (COM) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 12)
FUS 8213:13991 (사이토크롬 c 옥시다제 서브유니트 II (COM) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 13)
FUS 9191 :12909 (ATP 신타제 FO 서브유니트 6 (ATPase6) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 14)
FUS 9574:12972 (사이토크롬 c 옥시다제 서브유니트 III (COIN) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 15)
FUS 10367:12829 (NADH 데히드로게나제 서브유니트 3 (ND3) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 16)
FUS 8469: 13447 (OrigMet) (ATP 신타제 FO 서브유니트 8 내지 NADH 데히드로게나제 서브유니트) (서열번호 17)
FUS 9144:13816 ((ATP 신타제 FO 서브유니트 6 (ATPase6) 내지 NADH 데히드로게나제 서브유니트 5 (ND5)) (서열번호 51)
본 발명은 또한 암을 예측, 진단 및/또는 모니터링하기 위한 이들 서열의 변이체 또는 단편의 용도를 제공한다
"변이체"는 본원에 사용된 바와 같이, 본 발명의 mtDNA 서열과 상이하지만, 그의 필수적인 특성을 보유하는 핵산을 의미한다. 일반적으로, 변이체들은 전체적으로 매우 유사하고, 많은 영역에서 선택된 mtDNA 서열과 동일하다. 구체적으로, 본 발명의 변이체는 스플라이스된 유전자의 접합점의 적어도 하나의 뉴클레오티드를 포함하고, 그에 인접한 1개 이상의 뉴클레오티드를 추가로 포함할 수 있다. 본 발명의 일 구체예에서, 변이체 서열은 본 발명의 mtDNA 서열 또는 그에 대해 상보적인 스트랜드 중의 임의의 것과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하다.
본 발명에서, "단편"은 기재된 게놈의 서열, 또는 그에 상보적인 스트랜드에 함유된 것의 일부인 짧은 핵산 서열을 의미한다. 이러한 부분은 스플라이스된 유전자의 접합점을 포함하는 적어도 하나의 뉴클레오티드를 포함하고, 그에 인접한 1개 이상의 뉴클레오티드를 추가로 포함할 수 있다. 본 발명의 단편은 바람직하게는 적어도 약 15 nt, 더욱 바람직하게는 적어도 약 20 nt, 더더욱 바람직하게는 적어도 약 30 nt, 한층 더 바람직하게는 적어도 약 40 nt, 적어도 약 50 nt, 적어도 약 75 nt, 또는 적어도 약 150 nt의 길이다. "적어도 20 nt 길이"의 단편은 예를 들면, 상기 mtDNA 서열 중의 임의의 것의 20개 이상의 접촉하는 베이스를 포함하도록 의도된다. 이러한 맥락에서 "약"은 한쪽 말단이나 또는 양쪽 말단에서 여러 (5, 4, 3, 2, 또는 1) 뉴클레오티드에 의해 특정하게 인용된 값, 더 큰 값 또는 더 작은 값을 포함한다. 이들 단편은 본원에 고찰된 바의 진단 프로브 및 프라이머로서 이들을 포함하지만, 이들로만 제한되지 않는 용도를 갖는다. 물론, 더 큰 단편 (예, 50, 150, 500, 600, 2000 뉴클레오티드)이 역시 예상된다.
따라서, 본 발명의 특정 구체예에서, mtDNA 서열은 다음:
서열번호 2 (FUS 8469:13447; AltMet)
서열번호 3 (FUS 10744:14124)
서열번호 4 (FUS 7974:15496)
서열번호 5 (FUS 7992:15730)
서열번호 6 (FUS 8210:15339)
서열번호 7 (FUS 8828:14896)
서열번호 8 (FUS 10665:14856)
서열번호 9 (FUS 6075:13799)
서열번호 10 (FUS 6325:13989)
서열번호 11 (FUS 7438:13476)
서열번호 12 (FUS 7775:13532)
서열번호 13 (FUS 8213:13991)
서열번호 14 (FUS 9191 :12909)
서열번호 15 (FUS 9574:12972)
서열번호 16 (FUS 10367:12829)
서열번호 17(FUS 8469:13447; OrigMet)
서열번호 51 (FUS 9144:13816), 및 이들의 단편 또는 변종으로 이루어진 그룹으로부터 선택된다.
프로브
본 발명의 또 다른 측면은 본 발명의 비정상적인 mtDNA 서열을 인식할 수 있는 혼성화 프로브를 제공하는 것이다. 본원에 사용된 바와 같이, "프로브"라는 용어는 프로브 내의 적어도 하나의 서열과 표적 영역 내의 서열의 상보성으로 인해 표적 핵산 내의 서열과 듀플렉스 구조를 형성하는 올리고뉴클레오티드를 의미한다. 프로브는 당업계에 공지된 방법에 따라 라벨링될 수 있다.
특정 질병과 연관된 비정상적인 mtDNA가 일단 식별되면, 예를 들면 mtDNA의 올리고뉴클레오티드의 어레이에 대한 혼성화는 특정 돌연변이를 식별하기 위해 사용될 수 있지만, 임의의 공지된 혼성화 방법이 사용될 수 있다.
본 발명의 프라이머들에 의해서와 같이, 프로브는 본 발명의 예시적인 mtDNA 융합 분자에 반하여, 또는 그의 단편 또는 변이체에 직접적으로 발생될 수 있다. 예를 들면, 서열번호 2-17 및 51에 나타낸 서열 및 표 1에 기재된 것들은 관심있는 융합 서열을 포함하는 핵산 서열을 검출할 프라이머 또는 프로브를 고안하도록 사용될 수 있다. 당업계의 숙련자들에 의해 이해되는 바와 같이, 이들 핵산 분자를 혼성화시키는 프라이머 또는 프로브는 고도로 엄격한 혼성화 조건 또는 더 낮은 엄격화 조건 하에 그렇게 혼성화될 수 있고, 그러한 조건은 당업계에 공지되어 있고, 예를 들면, 분자 생물학의 현행 프로토콜 [(John Wiley & Sons, New York (1989)), 6.3.1-6.3.6]에서 발견된다.
본 발명의 특정 구체예에서, 본 발명의 프로브는 스플라이스된 유전자의 접합점을 포함하는 비정상적인 mtDNA의 적어도 일부에 상보적인 서열을 함유한다. 이러한 부분은 접합점 A:B에 연루된 적어도 하나의 뉴클레오티드를 포함하고, 그에 인접한 1개 이상의 뉴클레오티드를 추가로 포함할 수 있다. 이러한 관점에서, 본 발명은 접합점 A:B에 연루된 및/또는 인접한 뉴클레오티드를 사용하여 mtDNA 분자를 선택할 임의의 적합한 표적화 메카니즘을 포함한다.
당업계에 공지된 여러 가지 유형의 프로브는 본 발명에 의해 예상된다. 예를 들면, 프로브는 혼성화 프로브일 수 있고, 그의 표적 뉴클레오티드 서열에 대한 결합은 브롬화 에티듐, SYBR® Green, SYBR® Gold 등의 일반적인 DNA 결합 염료를 사용하여 검출될 수 있다. 대안으로, 프로브는 1개 이상의 검출가능한 라벨을 혼입할 수 있다. 검출 가능한 라벨은 그의 성질 또는 특성이 직접적으로 또는 간접적으로 검출될 수 있는 분자 또는 모이어티이고, 프로브가 그의 표적 서열에 의해 혼성화되는 능력이 영향을 받지 않도록 선택된다. 핵산 서열을 라벨링하는 방법은 당업계에 잘 공지되어 있다 (예를 들면, Ausubel et at., (1997 & updates) 분자 생물학에서 현행 프로토콜, Wiley & Sons, New York 참조).
본 발명의 프로브에 의해 사용하기 적합한 라벨은 방사성 동위원소, 형광단, 화학발광단, 효소, 콜로이드성 입자, 형광 마이크로입자, 등과 같이 직접적으로 검출될 수 있는 것들을 포함한다. 당업계의 숙련자는 직접적으로 검출할 수 있는 라벨이 이 라벨의 검출이 가능하도록 기질, 트리거링 시약, 빛 등과 같은 추가의 성분을 요구할 수 있음을 이해할 것이다. 본 발명은 또한 간접적으로 검출된 라벨의 사용을 예상한다.
본 발명의 프로브는 바람직하게는 적어도 약 15 nt, 더욱 바람직하게는 적어도 약 20 nt, 더욱 더 바람직하게는 적어도 약 30 nt, 한층 더 바람직하게는 적어도 약 40 nt, 적어도 약 50 nt, 적어도 약 75 nt, 또는 적어도 약 150 nt의 길이이다. "적어도 20 nt 길이"의 프로브는 예를 들면, 본 발명의 mtDNA 서열에 상보적인 2개 이상의 접촉 염기를 포함하도록 의도된다. 물론, 더 큰 프로브 (예, 50, 150, 500, 600, 2000 뉴클레오티드)가 바람직할 수 있다.
본 발명의 프로브는 또한 생물학적 샘플 내의 핵산 분자에 혼성화될 것이고, 그로 인해 본 발명의 방법을 가능케 한다. 따라서, 본 발명의 일 측면에서, 암을 검출하는데 사용하기 위한 혼성화 프로브가 제공되고, 여기서 프로브는 비정상적인 mtDNA 분자의 적어도 일부에 상보적이다. 또 다른 측면에서, 본 발명은 대장암, 폐암, 유방암, 난소암, 고환암, 전립선암 및/또는 흑색종 피부암의 검출을 위해 프로브 및 그러한 프로브의 사용(또는 그를 사용한 방법)을 제공한다.
분석
생물학적 샘플에서 비정상적인 mtDNA의 레벨을 측정함으로써 피검자에서 1개 이상의 암의 존재를 결정할 수 있다. 따라서, 본 발명은 1개 이상의 생물학적 샘플을 수득하고, 샘플로부터 mtDNA를 추출하고, 샘플 내의 1개 이상의 비정상적인 mtDNA 서열의 양을 정량화하고 검출된 정량을 기준 값과 비교함으로써 비정상적인 mtDNA에 대해 샘플을 분석하는 단계를 포함하는, 암을 예측하거나, 진단하거나 또는 모니터링하는 방법을 포함한다. 당업계의 숙련자들이 이해하는 바와 같이, 기준 값은 그 방법이 암을 예측하거나, 진단하거나 또는 모니터링하고자 하는지 여부에 기초한다. 따라서, 기준 값은 1개 이상의 공지된 비-암성 생물학적 샘플로부터, 1개 이상의 공지된 암성 생물학적 샘플로부터, 및/또는 시간이 경과함에 따라 취한 1개 이상의 생물학적 샘플로부터 수집된 mtDNA 데이터에 관련할 수 있다.
일 측면에서, 본 발명은 비정상적인 미토콘드리아 DNA의 존재에 대해 포유동물로부터 조직 샘플을 분석하는 것을 포함하는, 포유동물에서 암을 검출하는 방법을 제공한다. 본 발명은 또한 적어도 하나의 혼성화 프로브로 샘플을 혼성화함으로써 포유동물로부터 조직 샘플을 분석하는 단계를 포함하는 방법을 제공한다. 프로브는 본원에 기재된 바의 본 발명의 돌연변이체 미토콘드리아 DNA 서열에 반하여 발생될 수 있다.
또 다른 측면에서, 본 발명은 분석이 다음:
a) 적어도 하나의 프로브가 상보적인 비정상적인 미토콘드리아 DNA 서열에 혼성화되도록 적어도 하나의 프로브를 사용하여 혼성화 반응을 수행하는 단계;
b) 적어도 하나의 프로브에 혼성화된 미토콘드리아 DNA의 양을 정량화함으로써 샘플 내의 적어도 하나의 비정상적인 미토콘드리아 DNA 서열의 양을 정량화하는 단계; 및,
c) 샘플 내의 미토콘드리아 DNA의 양을 적어도 하나의 공지된 기준 값에 비교하는 단계를 포함하는 상기한 바의 방법을 제공한다.
또한, 본 발명에 포함된 것은 아래 기재된 진단 이미징 분석을 포함하여 암을 예측, 진단 또는 모니터링하기 위한 방법들이다. 본 발명의 진단 분석 은 고-처리량으로 용이하게 채택될 수 있다. 고-처리량 분석은 다수의 샘플을 동시에 처리하는 장점을 제공하고 다수의 샘플을 선별하는데 요구되는 시간을 현저히 감소시킨다. 따라서, 본 발명은 복수개의 시험 샘플 내의 표적 뉴클레오티드 서열을 검출 및/또는 정량화하기 위해 고-처리량 선별 또는 분석에서 본 발명의 뉴클레오티드의 사용을 예상한다.
융합 트랜스크립트
본 발명은 암을 예측, 진단 및/또는 모니터링하기 위한 방법들에서 유용한 융합 트랜스크립트 및 연관된 혼성화 프로브의 식별을 추가로 제공한다. 당업계의 숙련자라면 그러한 분자가 천연적으로-발생하는 트랜스크립트의 단리를 통해 또는, 대안으로 본 발명의 방법에 따라 단리된 mtDNAs의 재조합 발현에 의해 유도될 수 있음을 인정할 것이다. 고찰된 바와 같이, 그러한 mtDNAs는 통상적으로 제1 유전자로부터 개시 코돈 및 제2 유전자로부터 종결 코돈을 갖는 스플라이스된 유전자를 포함한다. 따라서, 이들로부터 유도된 융합 트랜스크립트는 스플라이스된 유전자와 연관된 접합점을 포함한다.
융합 트랜스크립트의 검출
천연적으로 발생하는 융합 트랜스크립트는 생물학적 샘플로부터 추출될 수 있고 당업계에 공지된 임의의 적합한 방법에 따라 식별되거나, 또는 실시예에 기재된 방법에 따라 수행될 수 있다. 본 발명의 일 구체예에서, 안정한 폴리아데닐화된 융합 트랜스크립트는 폴리-A 테일을 갖는 트랜스크립트를 표적화한 올리고(dT) 프라이머를 사용하고, 이어서 표적 트랜스크립트에 반하여 고안된 프라이머 쌍들을 사용하여 RT-PCR에 의해 식별된다.
다음 예시적인 융합 트랜스크립트는 그러한 방법들을 사용하여 검출되었고 실시예에 지시된 바와 같이 암을 예측, 진단 및/또는 모니터링하는데 유용한 것으로 밝혀졌다. 마찬가지로, 표 1에서 식별된 ORF 서열로부터 유도된 융합 트랜스크립트는 본 발명의 분석 및 방법에 따라 암을 예측, 진단 및/또는 모니터링하는데 유용할 수 있다.
서열번호 18 (트랜스크립트 1;8469: 13447; AltMet)
서열번호 19 (트랜스크립트 2;10744:14124)
서열번호 20 (트랜스크립트 3;7974: 15496)
서열번호 21 (트랜스크립트 4;7992: 15730)
서열번호 22 (트랜스크립트 5;8210: 15339)
서열번호 23 (트랜스크립트 6;8828: 14896)
서열번호 24 (트랜스크립트 7;10665:14856)
서열번호 25 (트랜스크립트 8;6075: 13799)
서열번호 26 (트랜스크립트 9;6325: 13989)
서열번호 27 (트랜스크립트 10;7438: 13476)
서열번호 28 (트랜스크립트 11;7775: 13532)
서열번호 29 (트랜스크립트 12;8213:13991)
서열번호 30 (트랜스크립트 14;9191 : 12909)
서열번호 31 (트랜스크립트 15;9574: 12972)
서열번호 32 (트랜스크립트 16; 10367: 12829)
서열번호 33 (트랜스크립트 20;8469: 13447; OrigMet)
서열번호 50 (트랜스크립트 13; 9144:13816)
더욱이, 본원에 기재된 것들과 동일한 특성의 융합 트랜스크립트는 임상 종양학 분야에서 사용하기 위한 것으로 예상된다.
융합 트랜스크립트는 또한 당업계에 공지된 재조합 기술에 의해 생산될 수 있다. 통상적으로 이것은 관심있는 mtDNA 서열을 포함하는 발현 벡터에 의한 적합한 숙주 세포의 형질전환 (형질감염, 형질 유도 또는 감염을 포함함)과 연루된다.
본원에서 식별된 융합 트랜스크립트의 변이체 또는 단편이 또한 제공된다. 그러한 서열은 게놈의 변이체 및 단편에 관하여 상기 크기 제한 및 상동성 %를 고수할 수 있거나 또는 기술자에 의해 적합한 것으로 결정될 수 있다.
또한, 트랜스크립트 1-16 및 20에 대응하는 추정되는 단백질 서열은 아래 열거된다. 가설적 융합 단백질을 인코딩하는 이들 서열은 본 발명의 추가의 구체예로서 제공된다.
서열번호 34 (트랜스크립트 1)
서열번호 35 (트랜스크립트 2)
서열번호 36 (트랜스크립트 3)
서열번호 37 (트랜스크립트 4)
서열번호 38 (트랜스크립트 5)
서열번호 39 (트랜스크립트 6)
서열번호 40 (트랜스크립트 7)
서열번호 41 (트랜스크립트 8)
서열번호 42 (트랜스크립트 9)
서열번호 43 (트랜스크립트 10)
서열번호 44 (트랜스크립트 11)
서열번호 45 (트랜스크립트 12)
서열번호 46 (트랜스크립트 14)
서열번호 47 (트랜스크립트 15)
서열번호 48 (트랜스크립트 16)
서열번호 49 (트랜스크립트 20)
서열번호 52 (트랜스크립트 13)
프로브
일단 융합 트랜스크립트가 특성화되면, 프라이머 또는 프로브는 생물학적 샘플에서 트랜스크립트를 표적화하도록 개발될 수 있다. 그러한 프라이머 및 프로브는 (상기한 바와 같이) 또는 아래 제공된 실시예들에 나타낸 바와 같이 임의의 공지된 방법을 사용하여 제조될 수 있다. 프로브는 예를 들면 융합 트랜스크립트에 대해 발생될 수 있고, PanomicsTM에 의한 QuantiGene 2.0TM과 같은 검출 기술이 샘플 내의 트랜스크립트의 존재를 검출하기 위해 사용되었다. 프라이머 및 프로브는 본 발명의 예시적인 융합 트랜스크립트에 반하여 직접적으로, 또는 그의 단편 또는 변이체에 대해 발생될 수 있다. 예를 들면, 표 1에 나타낸 서열들 뿐만 아니라 서열번호 18-33 및 50에 나타낸 서열이 관심있는 융합 서열을 포함하는 핵산 서열을 검출할 프로브를 고안하기 위해 사용될 수 있다.
당업계의 숙련자들이 이해할 수 있듯이, 본 발명의 융합 트랜스크립트에 혼성화하도록 고안된 프로브는 스플라이스된 유전자의 접합점을 발현하는 트랜스크립트의 적어도 일부에 상보적인 서열을 함유한다. 이 부분은 발현된 접합점에 상보적인 적어도 하나의 뉴클레오티드를 포함하고, 그에 인접한 1개 이상의 상보적 뉴클레오티드를 추가로 포함할 수 있다. 이러한 관점에서, 본 발명은 스플라이스된 유전자의 접합점에 인접하고 포함된 뉴클레오티드를 사용하는 융합 트랜스크립트를 선택할 임의의 적합한 표적화 메카니즘을 포함한다.
당업계에 공지된 다양한 타입의 프로브 및 라벨링 방법이 트랜스크립트 프로브의 제조를 위해 예상된다. 그러한 타입 및 방법은 게놈의 서열 검출에 관련하여 상기 기재되어 있다. 본 발명의 트랜스크립트 프로브는 바람직하게는 적어도 약 15 nt, 더 바람직하게는 적어도 약 20 nt, 더욱 바람직하게는 적어도 약 30 nt, 한층 더 바람직하게는, 적어도 약 40 nt, 적어도 약 50 nt, 적어도 약 75 nt, 또는 적어도 약 150 nt의 길이이다. "적어도 20 nt 길이"의 프로브는 예를 들면, 본 발명의 mtDNA 서열에 상보적인 20개 이상의 접촉 염기를 포함하도록 의도된다. 물론, 더 큰 프로브 (예, 50, 150, 500, 600, 2000 뉴클레오티드)가 바람직할 수 있다.
일 측면에서, 본 발명은 암을 검출하는데 사용하기 위한 혼성화 프로브를 제공하고, 여기서 프로브는 상기 제공된 미토콘드리아 융합 트랜스크립트의 적어도 일부에 상보적이다.
또 다른 측면에서, 본 발명은 대장암, 폐암, 유방암, 난소암, 고환암, 전립선암 또는 흑색종 피부암의 검출을 위해 프로브 및 그러한 프로브의 사용(또는 그를 사용한 방법)을 제공한다.
분석
생물학적 샘플에서 미토콘드리아 융합 트랜스크립트의 레벨을 측정함으로써 피검자에서 1개 이상의 암의 존재를 결정할 수 있다. 따라서, 본 발명은 1개 이상의 생물학적 샘플을 수득하고, 샘플로부터 미토콘드리아 RNA를 추출하고, 샘플 내의 1개 이상의 융합 트랜스크립트의 양을 정량화하고 검출된 정량을 기준 값과 비교함으로써 융합 트랜스크립트에 대해 샘플을 분석하는 단계를 포함하는, 암을 예측하거나, 진단하거나 또는 모니터링하는 방법을 포함한다. 당업계의 숙련자들이 이해하는 바와 같이, 기준 값은 그 방법이 암을 예측하거나, 진단하거나 또는 또는 모니터링하고자 하는지 여부에 기초한다. 따라서, 기준 값은 1개 이상의 공지된 비-암성 생물학적 샘플로부터, 1개 이상의 공지된 암성 생물학적 샘플로부터, 및/또는 시간이 경과함에 따라 취한 1개 이상의 생물학적 샘플로부터 수집된 트랜스크립트에 관련할 수 있다.
일 측면에서, 본 발명은 포유동물에서 암의 검출 방법을 제공하고, 이 방법은 미토콘드리아 융합 트랜스크립트의 적어도 일부에 상보적인 핵산 서열을 갖는 적어도 하나의 혼성화 프로브로 샘플을 혼성화함으로써 본 발명의 적어도 하나의 융합 트랜스크립트의 존재에 대해 상기 포유동물로부터 조직 샘플을 분석하는 단계를 포함한다.
또 다른 측면에서, 본 발명은 분석이 다음:
a) 적어도 하나의 프로브가 상보적인 비정상적인 미토콘드리아 융합 트랜스크립트에 혼성화되도록 적어도 하나의 프로브를 사용하여 혼성화 반응을 수행하는 단계;
b) 적어도 하나의 프로브에 혼성화된 미토콘드리아 융합 트랜스크립트의 양을 정량화함으로써 샘플 내의 적어도 하나의 미토콘드리아 융합 트랜스크립트의 양을 정량화하는 단계; 및,
c) 샘플 내의 미토콘드리아 융합 트랜스크립트의 양을 적어도 하나의 공지된 기준 값에 비교하는 단계를 포함하는 상기한 바의 방법을 제공한다.
상기 고찰한 바와 같이, 본 발명의 진단 분석은 본원에 기재된 바의 진단 방법 및 선별 도구를 포함하고 고-처리량에 대해 용이하게 채택될 수 있다. 따라서, 본 발명은 복수개의 시험 샘플 내의 표적 뉴클레오티드 서열을 검출 및/또는 정량화하기 위해 고-처리량 선별 또는 분석에서 본 발명의 융합 트랜스크립트 및 연관된 프로브의 사용을 예상한다.
진단 방법 및 선별 도구
특이적 질병을 진단하거나 또는 특이적 미토콘드리아 돌연변이를 식별하기 위한 방법 및 선별 도구가 또한 여기서 예상된다. 임의의 공지된 혼성화 방법은 분지된 DNA 및 qPCR, 두 단일-플렉스 및 멀티-플렉스와 같이 프로브/프라이머 기재 기술을 포함하지만 이것으로만 제한되지 않는 그러한 방법을 수행하기 위해 사용될 수 있다. 기술, 야생형 또는 돌연변이된 영역을 매치시키는 올리고뉴클레오티드 프로브 및 제어 프로브를 갖는 어레이 기술이 사용될 수도 있다. 마이크로어레이 또는 유전자 칩과 같이 상업적으로 입수할 수 있는 어레이가 적합하다. 이들 어레이는 슬라이드 또는 마이크로칩 상에 프로브의 수천 개의 매치된 쌍 및 제어 쌍을 함유하고, 전체 게놈을 매우 신속하게 서열화할 수 있다. 게놈 및 DNA 서열에서 마이크로어레이의 사용을 기재하는 다시보기 기사는 온라인으로 입수할 수 있다.
주어진 생물학적 조건에 관련된 표적을 식별하도록 고안된 선별 도구는 특정 질병 또는 질환과 연관된 핵산의 특이적 배열을 포함할 수 있다. 따라서, 본 발명의 일 구체예에 따라, 1개 이상의 암과 연관된 것들을 식별하기 위해 10's, 100's, 또는 1000's의 미토콘드리아 융합 트랜스크립트를 갖는 마이크로어레이로 구성된 선별 도구가 제공된다. 또 다른 구체예에 따라, 1개 이상의 암과 연관된 것들을 식별하기 위해 미토콘드리아 융합 트랜스크립트에 대응하는 10's, 100's, 또는 1000's의 미토콘드리아 DNA를 갖는 마이크로어레이로 구성된 선별 도구가 제공된다. 또 다른 구체예에서, 1개 이상의 암과 연관된 것들을 식별하기 위해 10's, 100's, 또는 1000's의 미토콘드리아 융합 트랜스크립트를 갖는 멀티플렉스 브랜치된 DNA 분석으로 구성된 선별 도구가 제공된다. 본 발명의 또 다른 구체예에서, 1개 이상의 암과 연관된 것들을 식별하기 위해 미토콘드리아 융합 트랜스크립트에 대응하는 10's, 100's, 또는 1000's의 미토콘드리아 DNA를 갖는 멀티플렉스 브랜치된 DNA 분석으로 구성된 선별 도구가 제공된다.
임상 종양학 분야에서 유용한 접근법이 또한 여기서 예상되고 양전자 방사 단층촬영 (PET), 콘트라스트 자기 공명 영상화 (MRI) 등과 같은 진단 영상화 기술을 포함할 수 있다. 이들 진단 방법은 당업계의 숙련자들에게 잘 알려져 있고, 암의 진단 및 예후에 유용하다.
진단 모니터링
본 발명의 방법은 1개 이상의 분석의 결과에 기초한 치료 과정 또는 모니터링 레짐을 추천하는 단계를 추가로 포함할 수 있다. 이는 환자의 암의 진행 (초기 또는 후속 돌연변이가 발생한 때를 인지함으로써 등) 또는 치료 (돌연변이가 안정화된 때를 인지함으로써 등)를 모니터링함으로써 예를 들면 암 치료법과 같이 내과의사들이 맞춤형 의료를 시행할 수 있게 한다.
현재 다루고 있는 서열 변화의 경계를 알게 됨에 따라, 그 정보는 전-암성 상태 또는 존재하는 암 상태를 진단하기 위해 사용될 수 있다. 더욱이, 시간이 경과함에 따라 연속적인 샘플 내의 비정상적인 mtDNA의 양을 정량화함으로써, 암 증상의 진행이 모니터링될 수 있다. 예를 들면, 야생형으로부터 돌연변이의 제1 세트를 검출하기 위해 제시간 내의 일 시점에 환자의 조직을 분석함으로써 제공된 데이터는 분석, 수차의 변화가 발생된 경우를 결정하기 위해 후속 분석으로부터 제공된 데이터에 반하여 비교될 수 있다.
암의 증상을 아직 발전시키지 않은 개체에서 돌연변이가 발견되는 경우, 그 돌연변이는 암 상태를 발전시킬 유전적 민감성을 지시할 수 있다. 질병에 대한 민감성의 측정 또는 그의 존재의 진단은 존재하는 경우 환자의 가족 병력에서 암 증상 및 다른 위험 인자의 존재, 예를 들면 환경 인자에 대한 노출의 만연 및 환자의 세포가 또 다른 종류의 돌연변이를 수반하는지 여부에 관한 정보에 기초한 정성적 기반으로 추가로 평가될 수 있다.
생물학적 샘플
본 발명은 1개 이상의 생물학적 샘플을 획득 또는 수집하는 것을 포함하는 진단 시험을 제공한다. 본 발명의 맥락에서, "생물학적 샘플"은 그로부터 mtDNA 및 mtRNA가 획득될 수 있는 세포를 함유하는 조직 또는 체액에 관한 것이다. 예를 들면, 생물학적 샘플은 피부, 폐, 유방, 전립선, 신경, 근육, 심장, 위, 결장, 직장 조직 등을 포함하지만, 이들로만 제한되지 않는 조직으로부터; 또는 혈액, 타액, 뇌 척수액, 가래, 소변, 점액, 관절낭액, 복막액, 양수 등으로부터 유도될 수 있다. 생물학적 샘플은 암성 또는 비-암성 조직으로부터 획득될 수 있으며, 수술 표본 또는 생검 표본일 수 있지만, 이들로만 제한되지 않는다.
생물학적 샘플은 이 샘플의 특성을 변조시키기 위해, 소스로부터 획득된 바와 같이 직접적으로 또는 전처리 후에 사용될 수 있다. 따라서, 생물학적 샘플은 예를 들면, 플라즈마 또는 혈청을 혈액으로부터 제조하고, 세포들을 분쇄하고, 고체 물질로부터 액체를 제조하고, 점성 유체를 희석시키고, 액체를 여과하고, 액체를 증류시키고, 액체를 농축시키고, 간섭하는 성분을 불활성화시키고, 시약을 첨가하는 등에 의해 사용 전에 전처리될 수 있다.
당업계의 숙련자는 1개 이상의 샘플 타입이 단일회로 분석될 수 있음을 (즉, 1개 이상의 암을 검출하기 위해) 이해할 것이다. 더욱이, 수집 과정이 예를 들면, 시간이 경과함에 따라 암을 모니터링하기 위해 요구되는 경우, 주어진 샘플은 단독으로 또는 시험 기간 전반에 취해진 다른 샘플과 함께 진단될 수 있다. 이러한 관점에서, 생물학적 샘플은 1회만, 또는 2주로, 매달, 반년에 또는 매년 등과 같이 규칙적인 간격으로 취해질 수 있다.
키트
본 발명은 임상적 환경에서 암을 검출하기 위한 진단/선별 키트를 제공한다. 그러한 키트는 본 발명에 따른 1개 이상의 프로브와 조합하여 1개 이상의 샘플링 수단을 포함할 수 있다.
키트는 임의로 완충액, 염, 검출 시약 등과 같이 진단 분석을 수행하기 위해 요구되는 시약을 포함할 수 있다. 완충액 및 생물학적 샘플의 단리 및/또는 처리를 위해 필요한 용액 등과 같은 다른 성분들이 또한 키트에 포함될 수 있다. 키트의 1개 이상의 성분들은 동결 건조될 수 있고, 키트는 동결 건조된 성분들의 재구성을 위해 적합한 시약을 추가로 포함할 수 있다.
적합한 경우, 키트는 반응 용기, 혼합 용기 및 시험 샘플의 제조를 촉진시키는 다른 성분들을 함유할 수도 있다. 이 키트는 또한 종이 형태로 또는 컴퓨터-판독 가능한 형태로, 예를 들면 디스크, CD, DVD 등으로 제공될 수 있는 설명서를 임의로 포함할 수도 있다.
본 발명의 일 구체예에서 샘플링 수단 및 본 발명의 혼성화 프로브를 포함하는 암을 진단하기 위한 키트가 제공된다.
본 발명의 여러 가지 측면은 다음 실시예들을 사용하여 예시적으로 기재될 것이다. 본원에 제공된 실시예들은 단지 본 발명의 특정 특정 구체예들을 예시하도록 작용하며 본 발명의 범위를 어떠한 방식으로든 제한하고자 의도되지 않는다.
실시예
실시예 1: 미토콘드리아 융합 트랜스크립트의 검출
PCT 출원 제PCT/CA2007/001711호 (그의 전체 내용은 참고로 혼입됨)에서 본 출원인에 의해 이미 확인된 미토콘드리아 4977 "공통 결실" 및 3.4kb 결실은 전립선 조직에서 올리고--dT 선택에 의해 식별된 바 활성 트랜스크립트를 갖는 독특한 개방된 리딩 프레임을 초래한다(도 2 및 3). 유방 조직 샘플의 조사는 또한 3.4kb 결실로부터 기인하는 안정한 폴리아데닐화된 융합 트랜스크립트의 존재를 드러낸다 (도 4).
결실 트랜스크립트 검출을 위한 역 트랜스크립타제-PCR 프로토콜
RNA 단리 cDNA 합성
전체 RNA는 제조자의 설명서에 따라 AurumTM 전체 RNA 지방 및 섬유상 조직 키트 (Bio-Rad, Hercules, CA)를 사용하여 스냅 냉동된 전립선 및 유방 조직 샘플 (종양에 인접한 악성 및 정상 샘플 모두)로부터 단리되었다. 이 실험에서, 게놈의 DNA 오염이 피해져야 했기 때문에, DNase I 치료 단계가 당업계에 공통적으로 공지된 바의 방법을 사용하여 포함되었다. RNA 정량 및 품질은 ND-1000 분광 광도계 (NanoDrop® 테크놀로지스)에 의해 결정되었다. 약 10Og의 출발 물질로부터, 전체 RNA 농도는 1.89 - 2.10 사이에서 260/280 비율로 100 - 1000ng/ul로부터 변화하였다. RNA 농도는 100ng/ul로 조절되었고 각각의 템플릿 2ul가 제조업자 의 설명서에 따라 RT-PCR (Invitrogen)을 위해 SuperscriptTM 제1-스트랜드 합성 시스템에 의해 제1 표준 DNA 합성을 위해 사용되었다. 안정한 폴리아데닐화된 융합 트랜스크립트를 확인하기 위해, 폴리-A 꼬리를 갖는 트랜스크립트를 표적화하는 올리고(dT) 프라이머가 사용되었다.
PCR
실시간 PCR은 DNA 엔진 Opticon® 2 연속 형광 검출 시스템 (Bio-Rad, Hercules, CA) 상에서 iQTM SYBR® 그린 수퍼믹스 (Bio-Rad, Hercules, CA)에 의해 각각의 cDNA 템플릿 5ul를 사용하여 수행되었다. 4977bp 결실을 표적화한 프라이머 쌍은 다음; 8416F 5'-CCTTACACTATTCCTCATCAC-3', 13637R 5'- TGACCTGTTAGGGTGAGAAG-3'이고, 3.4 kb 결실에 대한 것들은 다음; ND4LF 5'- TCGCTCACACCTCATATCCTC-3', ND5R 5'-TGTGATTAGGAGTAGGGTTAGG-3'이다. 반응 칵테일은 다음을 포함하였다: 2X SYBR® 그린 수퍼믹스 (10OmM KCL, 4OmM 트리스-HCI, pH 8.4, 0.4mM의 각각의 dNTP [dATP, dCTP, dGTP, 및 dTTP], iTaqTM DNA 폴리머라제, 50 유니트/ml, 6mM MgCI2, SYBR® 그린 1, 2OnM 플루오레세인, 및 안정제), 25OnM의 각각의 프라이머, 및 ddH2O. PCR 사이클링 파라메터들은 다음과 같았다; (1) 95℃에서 2분 동안, (2) 95℃에서 30초 동안, (3) 55℃ (4977bp 결실에 대해) 및 63℃ (3.4 kb 결실에 대해)에서 30초 동안, (4) 72℃에서 45초 동안, (5) 단계 3 내지 5의 39 주기, 및 4℃에서 최종 인큐베이션 후 판독된 플레이트. 사이클링 임계값 및 용융 곡선 분석과 별도로, 샘플은 증폭 제품의 특이적 가시화를 위해 아가로스 겔 상에서 수행되었다 (도 2 내지 4 참조).
도 2는 미토콘드리아 게놈으로부터 3.4kb의 손실에 의해 환기된 전립선 샘플 내의 폴리아데날화된 융합 트랜스크립트를 보여주는 아가로스 겔이다. 도 2에 대한 범례: B-블랭크, 레인 1-6, cDNA에서 검출된 트랜스크립트; 레인 7-12, 레인 1-6에서 샘플에 대한 어떠한 역 트랜스크립타제 (RT) 대조군도 없음.
도 3은 4977kb 공통 결실의 손실에 의해 환기된 전립선 샘플에서 폴리아데날화된 융합 트랜스크립트를 보여준다. 도 3에 대한 범례: B-블랭크, 레인 1 -6, cDNA에서 검출된 트랜스크립트; 레인 7-12, 레인 1-6에서 샘플에 대한 어떠한 RT 대조군도 없음.
도 4는 mt게놈으로부터 3.4kb의 손실에 의해 환기된 유방 샘플 내의 폴리아데날화된 융합 트랜스크립트를 보여준다. 도 4에 대한 범례: 레인 2-8, 유방 cDNAs로부터 트랜스크립트; 레인 9, 음의 (물) 대조군; 레인 10 및 11, 레인 2 및 3에서 샘플에 대한 음의 어떠한 RT도 없는 대조군.
이들 결과는 안정한 미토콘드리아 융합 트랜스크립트의 존재를 나타낸다.
실시예 2: 융합 제품의 식별 및 타겟화
다양한 혼성화 프로브는 3.4kb 결실 등과 같이 돌연변이된 미토콘드리아 게놈으로부터 기인하는 신규 트랜스크립트의 존재를 검출하고, 추가로 나타내도록 고안되었다. 이러한 목적을 위해, 정량적 유전자 발현 분석을 위한 단일-플렉스 분지된 DNA 플랫폼 (QuantiGene 2.0TM, PanomicsTM)이 이용되었다. 본 실시예에서 특이적 결실 및 열거된 서열은 서열번호 1에 인용된 전체 mtDNA 게놈과 이들의 상대적 위치에 기초한다. 프로브가 이 실시예에서 고안된 4개의 트랜스크립트의 핵산 서열은 여기서 다음과 같이 식별되었다: 트랜스크립트 1 (서열번호 18), 트랜스크립트 2 (서열번호 19), 트랜스크립트 3 (서열번호 20) 및 트랜스크립트 4 (서열번호 21).
3.4kb 미토콘드리아 게놈 결실로부터 연속 트랜스크립트의 예는 유전자 ND4L (NADH 데히드로게나제 서브유니트 4L) 및 ND5 (NADH 데히드로게나제 서브유니트 5)에 의해 발생한다. 서열번호 19에 대한 상보적 서열을 갖는 프로브가 트랜스크립트 2를 검출하기 위해 사용되었다. 반복적인 소자들이 ND4L에서 위치 10745-10754 및 ND5에서 14124-14133에서 발생한다.
3.4kb 결실은 ND4L의 3' 말단의 제거, 완전한 ND4 유전자, tRNA 히스티딘, tRNA 세린2, tRNA 류신2, 및 ND5의 5' 말단의 대다수 (도 5a 참조)의 제거를 초래하고, 10744(ND4L):14124(ND5)의 접합점에 의한 ND4L 및 ND5의 유전자 스플라이스를 초래한다 (도 5b). 서열번호 3은 상기 방식으로 검출된 RNA 트랜스크립트 (서열번호 19)에 대한 상보적 DNA 서열이다.
마찬가지로, 트랜스크립트 1은 ATP아제 8과 위치 8469:13447 (서열번호 18)와 연관된 ND5 사이의 융합 트랜스크립트이다. 트랜스크립트 3 및 4 (서열번호 20 및 서열번호 21, 각각)는 뉴클레오티드 위치 7974:15496 및 7992:15730 각각과 연관된 COII과 Cytb 사이의 융합 트랜스크립트이다. 표 3은 본 실시예에 사용된 여러 가지 서열 사이의 관계의 요약을 제공한다. 표 3은 검출된 융합 트랜스크립트 및 검출된 융합 트랜스크립트에 상보적인 DNA 서열이다.
실시예 3: 전립선암에 대한 적용
상기 고찰된 4개의 융합 트랜스크립트, 즉, 트랜스크립트 1 내지 4를 사용함으로써, 1인의 환자로부터 2개의 전립선 조직 샘플은 신규한 예측된 융합 트랜스크립트의 정량적 차이를 평가하기 위해 분석되었다. 실험 결과는 아래 표 2에 제공되고, 여기서 "Homog 1"은 환자로부터 냉동된 전립선 종양 조직의 호모제네이트를 의미하고, "Homog 2"는 환자의 종양에 인접한 냉동된 정상적 전립선 조직의 호모제네이트를 의미한다. 이들 샘플은 25.8 mg의 Homog 1 및 28.9 mg의 Homog 2으로 시작하여 제조자의 프로토콜 (신선한 동물 조직 및 냉동된 동물 조직에 대한 QuantiGene® 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼) 에 따라 처리되었다 (분석 셋업은 표 5a 및 5b에 나타낸다).
분명히 나타낸 것은 정상적인 인접 전립선 조직에 비교하여 전립선암 조직 내의 미토콘드리아 융합 트랜스크립트의 증가된 존재이다. 융합 트랜스크립트는 훨씬 더 낮은 레벨이더라도 정상적인 조직 내에 존재한다. 프로브를 표적 트랜스크립트에 혼성화시킴으로써 발생된 상대적인 발광 유니트 (RLU)는 풍부한 각각의 트랜스크립트에 직접적으로 비례한다. 표 2는 또한 샘플에 대해 취해진 판독치의 백분율로서 표현된 변화 계수, CV를 지시한다. CV는 값들의 평균으로 나뉜 표준 편차를 포함한다. 암 조직 내의 그러한 안정하게 전사된 미토콘드리아 유전자 제품의 현저성은 질병 진화 및 진행에서 의미를 갖는다.
실시예 4: 유방암에 대한 적용
실시예 3으로부터와 동일하지만 단지 3.4kb mt게놈 결실과 연관된 신규 융합 트랜스크립트인 트랜스크립트 2에만 초점을 맞춘 프로토콜을 사용함으로써, 분석은 유방 종양 조직의 2개의 샘플 및 그들 종양에 인접한 종양이 없는 조직의 2개의 샘플, 뿐만 아니라 인접한 종양이 없는 조직을 포함하는 하나의 샘플인 전립선 종양 조직의 3개의 샘플 상에서 수행되었다. 이러한 실시예에 대한 결과는 표 4에 제공된다. 대응하는 정상 조직 섹션을 갖는 전립선 종양 조직 샘플은 종양 조직이 정상의 인접 조직이 가진 양보다 대략적으로 2배의 양의 융합 트랜스크립트를 갖는다는 점에서 실시예 3에서 분석된 전립선 샘플에 대한 유사한 패턴을 보였다. 유방 종양 샘플은 인접한 비-종양 조직에 비교하는 경우 융합 트랜스크립트 레벨의 현저한 증가를 나타냈다. 호모제네이트의 1:100 희석은 그것이 실시예 3에 인용된 실험에서 가장 재생 가능하게 수행됨에 따라 이러한 분석을 위해 사용되었다.
따라서, 상기 고찰된 결과는 전립선 및 유방 조직 모두의 종양을 검출함에 있어서 본 발명의 트랜스크립트의 적용을 예시한다.
실시예 5: 대장암에 대한 적용
본 연구는 대장암을 검출하는데 있어서 본 발명의 여러 가지 트랜스크립트의 효과를 측정하고자 하였다. 9개의 대조군 (양성) 조직 샘플 (샘플 1 내지 9) 및 10개의 종양 (악성) 조직 샘플 (샘플 10 내지 19)을 포함하는 전체 19개의 샘플이 제조되었다. 이 샘플은 제조업자의 추천 (신선한 동물 조직 및 냉동된 동물 조직에 대한 QuantiGene® 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 균질화되었다. 7개의 표적 트랜스크립트 및 1개의 하우스키퍼 트랜스크립트가 선행된 실시예에서 상기 개략된 방식으로 제조되었다. 트랜스크립트의 특성은 다음과 같이 요약된다:
Figure pat00001
트랜스크립트 2 및 3은 실시예 3 및 4에 관하여 상기 고찰된 것들과 동일한 것이 주지된다.
균질물은 OCT 블록으로부터 대략적으로 25mg의 조직을 사용하여 제조되고, 트랜스크립트 2 및 4에 대해 1:1로, 트랜스크립트 10 및 11에 대해 1:8로 희석된다. 트랜스크립트의 정량은 GlomaxTM 멀티 검출 시스템 (Promega) 상에서 상대적 발광 유니트 RLU에서 측정되었다. 모든 샘플은 각각의 트랜스크립트에 대해 삼중으로 분석되었다. 배경 측정 (어떠한 템플릿도 없음)은 마찬가지로 삼중으로 행해졌다. 분석은 샘플에 대해 RLU 값으로부터 하한치를 감산함으로써 배경을 고려하였다. 입력 RNA는 식 log2 a RLU - log2 h RLU을 사용함으로써 설명되고, 여기서 a는 표적 융합 트랜스크립트이고 h는 하우스키퍼 트랜스크립트이다.
다음 단계로 구성된 데이터의 분석:
a) 삼중 분석을 위해 CV (변화 계수)를 확립하고; < 15%인 경우 수락될 수 있음
b) 표적 융합 트랜스크립트(a) 및 하우스키퍼 트랜스크립트 (h)의 삼중 분석을 위한 평균 RLU 값을 확립한다.
c) 배경 RLU (I)의 삼중 값으로부터 하한치를 확립한다
d) (a)로부터 하한치 (I)를 감산한다.
e) log2 a RLU - log2 h RLU를 산출한다.
결과의 요약:
상기 분석의 결과는 도 6a 내지 6g에 예시되고, 이는 샘플수에 반하여 log2 a RLU - log2 h RLU의 플롯을 포함한다. 또한 각각의 트랜스크립트를 위한 결과로부터 결정된 각각의 ROC (수신기 작동 특성) 곡선이 예시되어 있다.
트랜스크립트 2: 정상 및 악성 그룹 (p>0.09)의 평균 (p<0.10) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 3.6129의 컷오프 값을 사용하는 것은 60%의 민감성 및 89%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.73이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 3: 정상 및 악성 그룹 (p>0.03)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 4.0813의 컷오프 값을 사용하는 것은 60%의 민감성 및 78%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.79이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 8: 정상 및 악성 그룹 (p>0.06)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 -6.0975의 컷오프 값을 사용하는 것은 60%의 민감성 및 89%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.76이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 9: 정상 및 악성 그룹 (p>0.06)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 - 7.5555의 컷오프 값을 사용하는 것은 60%의 민감성 및 89%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.76이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 10: 정상 및 악성 그룹 (p>0.01)의 평균 (p<0.10) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 - 3.8272의 컷오프 값을 사용하는 것은 90%의 민감성 및 67%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.84이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 11: 정상 및 악성 그룹 (p>0.06)의 평균 (p<0.10) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 3.1753의 컷오프 값을 사용하는 것은 70%의 민감성 및 78%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.76이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 12: 정상 및 악성 그룹 (p>0.06)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 3.2626의 컷오프 값을 사용하는 것은 70%의 민감성 및 78%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.76이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
결론:
상기 결과는 대장암을 검출하는데 있어서 및 정상 대장 조직으로부터 악성을 구별하는데 있어서 트랜스크립트 2, 3, 8, 9, 10, 11, 및 12의 유틸리티를 예시한다. 상기 지시된 바와 같이, 트랜스크립트 2 및 3은 또한 전립선암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 2는 또한 유방암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 11은 또한 흑색종 피부암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 10은 또한 폐암 및 흑색종의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 8 은 또한 폐암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 열거된 7개의 트랜스크립트 중 임의의 것이 임상적 세팅으로 대장암의 특성을 검출하기 위한 도구로서 개별적으로 또는 조합하여 사용될 수 있다.
실시예 6: 폐암에 대한 적용
본 연구는 폐암을 검출하는데 있어서 본 발명의 여러 가지 트랜스크립트의 효과를 측정하고자 하였다. 실시예 5에서와 같이, 9개의 대조군 (양성) 조직 샘플 (샘플 1 내지 9) 및 10개의 종양 (악성) 조직 샘플 (샘플 10 내지 19)이 제조업자의 추천 (신선한 동물 조직 및 냉동된 동물 조직에 대한 QuantiGene® 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 균질화되었다. 균질물은 1:8로 희석되었고, 4개의 표적 트랜스크립트 및 1개의 하우스키퍼 트랜스크립트가 GlomaxTM 멀티 검출 시스템 (Promega) 상에서 상대적 발광 유니트 RLU에서 측정되었다. 모든 샘플은 각각의 트랜스크립트에 대해 삼중으로 분석되었다. 배경 측정 (어떠한 템플릿도 없음)은 마찬가지로 삼중으로 행해졌다.
다음 트랜스크립트는 본 실시예를 위해 제조되었다:
Figure pat00002
본 실시예에 사용된 조직 샘플은 다음 특성을 갖는다:
Figure pat00003
데이터의 분석은 실시예 5에 기재된 방법에 따라 수행되었다. 결과는 도 7a, 7b, 7c 및 7d에 예시되어 있다.
결과의 요약:
트랜스크립트 6: 정상 (양성) 및 악성 그룹 (p=0.06)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재하고, ROC 곡선에 의해 나타낸 바 -6.5691의 컷오프 값을 사용하는 것은 80%의 민감성 및 71%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.77이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 8: 정상과 및 악성 그룹의 의미 사이의 차이는 통계학적으로 현저하다 p<0.05 (p=0.02). ROC 곡선에 의해 나타낸 바 -9.6166의 컷오프 값을 사용하는 것은 90%의 민감성 및 86%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.86이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 10: 정상과 및 악성 그룹의 의미 사이의 차이는 통계학적으로 현저하다 p≤0.01 (p=0.01). ROC 곡선에 의해 나타낸 바 -10.6717의 컷오프 값을 사용하는 것은 90%의 민감성 및 86%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.89이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 20: 정상과 및 악성 그룹의 의미 사이의 차이는 통계학적으로 현저하다 p≤0.1 (p=0.1). ROC 곡선에 의해 나타낸 바 2.5071의 컷오프 값을 사용하는 것은 70%의 민감성 및 71%의 특이성을 초래하고, 곡선 아래 영역은 공정한 시험 정확도를 나타내는 0.74이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
결론:
실시예 6으로부터의 결과는 폐암 종양을 검출하는데 있어서 및 악성 및 정상 폐 조직 사이를 구별하는데 있어서 트랜스크립트 6, 8, 10, 및 20의 유틸리티를 예시한다. 이들 3개의 트랜스크립트 중 임의의 것이 임상적 세팅으로 폐암의 결실 또는 특성화를 위해 사용될 수 있다.
실시예 7: 흑색종에 대한 적용
본 연구는 흑색종을 검출하는데 있어서 본 발명의 여러 가지 트랜스크립트의 효과를 측정하고자 하였다. 이 연구에서, 5개의 대조군 (양성) 조직 샘플 및 9개의 악성 조직 샘플을 포함하는 전체 14개의 샘플이 사용되었다. 모든 샘플은 포르말린 고정되고, 파라핀 내장되었다 (FFPE). (FFPE) 조직 샘플은 각각의 샘플이 균질화 전에 20미크론으로 대략화되도록 제조업자의 추천 (FFPE 샘플에 대한 QuantiGene® 2.0 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 튜브 내로 섹션화되고 균질화되었다. 균질물은 1:4로 희석되었고, 7개의 표적 트랜스크립트 및 1개의 하우스키퍼 트랜스크립트의 정량이 GlomaxTM 멀티 검출 시스템 (Promega) 상에서 상대적 발광 유니트 RLU에서 측정되었다. 모든 샘플은 각각의 트랜스크립트에 대해 삼중으로 분석되었다. 배경 측정 (어떠한 템플릿도 없음)은 마찬가지로 삼중으로 행해졌다.
본 실시예에 사용된 14개의 조직 샘플은 다음 특성을 갖는다:
Figure pat00004
다음 트랜스크립트가 본 실시예를 위해 제조되었다:
Figure pat00005
지시된 바와 같이, 트랜스크립트 10 및 11은 또한 실시예 5에 사용되었다. 데이터의 분석은 실시예 5에 기재된 방법에 따라 수행되었다. 그 결과는 도 8a -8g에 예시되어 있다.
결과의 요약:
트랜스크립트 6: 정상 및 악성 그룹 (p=0.01)의 평균 (p≤0.01) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 -5.9531의 컷오프 값을 사용하는 것은 89%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.96이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 10: 정상 및 악성 그룹 (p=0.05)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 - 4.7572의 컷오프 값을 사용하는 것은 89%의 민감성 및 40%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.82이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 11: 정상 및 악성 그룹 (p=0.02)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 1.6762의 컷오프 값을 사용하는 것은 78%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.89이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 14: 정상 및 악성 그룹 (p=0.05)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 -4.9118의 컷오프 값을 사용하는 것은 89%의 민감성 및 60%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.82이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 15: 정상 및 악성 그룹 (p=0.07)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 - 7.3107의 컷오프 값을 사용하는 것은 100%의 민감성 및 67%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.80이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 16: 정상 및 악성 그룹 (p=0.03)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 -10.5963의 컷오프 값을 사용하는 것은 89%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.878이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 20: 정상 및 악성 그룹 (p=0.04)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. 추가로, ROC 곡선에 의해 나타낸 바 -8.3543의 컷오프 값을 사용하는 것은 100%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.89이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
결론:
실시예 7로부터의 결과는 악성 흑색종을 검출하는데 있어서 본 발명의 트랜스크립트 6, 10, 11, 14, 15, 16 및 20의 유틸리티를 예시한다. 상기 지시된 바와 같이, 트랜스크립트 10 및 11은 또한 대장암을 검출하는데 있어서 유틸리티를 갖는 한편, 트랜스크립트 6은 폐암을 검출하는데 있어서 유틸리티를 갖는다. 질병에 의한 트랜스크립트 요약은 표 6에 제공된다.
실시예 8: 난소암에 대한 적용
본 연구는 난소암을 검출하는데 있어서 본 발명의 여러 가지 트랜스크립트의 효과를 측정하고자 하였다. 10개의 대조군 (양성) 조직 샘플 (샘플 1 내지 10) 및 10개의 종양 (악성) 조직 샘플 (샘플 11 내지 20)을 포함하는 전체 20개의 샘플이 제조되었다. 이 샘플은 제조업자의 추천 (신선한 동물 조직 및 냉동된 동물 조직에 대한 QuantiGene® 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 균질화되었다. 8개의 표적 트랜스크립트 및 1개의 하우스키퍼 트랜스크립트가 선행된 실시예에서 상기 개략된 방식으로 제조되었다.
이 샘플에 사용된 20개의 조직 샘플은 다음 특성을 가졌다:
Figure pat00006
트랜스크립트의 특성은 다음과 같이 요약된다:
Figure pat00007
트랜스크립트 1, 2, 3, 6, 11, 12, 15 및 20은 실시예 3-7에 관하여 트랜스크립트 2 및 3은 실시예 3 및 4에 관하여 상기 고찰된 것들과 동일한 것이 주지된다.
균질물은 대략적으로 25mg의 냉동된 조직을 사용하여 제조되고, 1:4로 희석된다. 트랜스크립트의 정량은 GlomaxTM 멀티 검출 시스템 (Promega) 상에서 상대적 발광 유니트 RLU에서 측정되었다. 모든 샘플은 각각의 트랜스크립트에 대해 삼중으로 분석되었다. 배경 측정 (어떠한 템플릿도 없음)은 마찬가지로 삼중으로 행해졌다. 분석은 샘플에 대해 RLU 값으로부터 하한치를 감산함으로써 배경을 고려하였다. 입력 RNA는 식 log2 a RLU - log2 h RLU을 사용함으로써 설명되고, 여기서 a는 표적 융합 트랜스크립트이고 h는 하우스키퍼 트랜스크립트이다.
다음 단계로 구성된 데이터의 분석:
a) 삼중 분석을 위해 CV (변화 계수)를 확립하고; ≤ 15%인 경우 허용될 수 있다.
b) 표적 융합 트랜스크립트(a) 및 하우스키퍼 트랜스크립트 (h)의 삼중 분석을 위한 평균 RLU 값을 확립한다.
c) 배경 RLU (I)의 삼중 값으로부터 하한치를 확립한다
d) (a)로부터 하한치 (I)를 감산한다.
e) log2 a RLU - log2 h RLU를 산출한다.
결과의 요약:
상기 분석의 결과는 도 9a 내지 9h에 예시되고, 이는 샘플수에 반하여 log2 a RLU - log2 h RLU의 플롯을 포함한다. 또한 각각의 트랜스크립트를 위한 결과로부터 결정된 각각의 ROC (수신기 작동 특성) 곡선이 예시되어 있다.
트랜스크립트 1: 정상 및 악성 그룹 (p=0.002)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 11.1503의 컷오프 값을 사용하는 것은 90%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.91이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 2: 정상 및 악성 그룹 (p=0.001)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.6962의 컷오프 값을 사용하는 것은 90%의 민감성 및 1000%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.96이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 3: 정상 및 악성 그룹 (p=0.000)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.6754의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 6: 정상 및 악성 그룹 (p=0.007)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 9.6479의 컷오프 값을 사용하는 것은 90%의 민감성 및 70%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.86이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 11: 정상 및 악성 그룹 (p=0.000)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 1.3794의 컷오프 값을 사용하는 것은 100%의 민감성 및 90%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.99이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 12: 정상 및 악성 그룹 (p=0.001)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 1.2379의 컷오프 값을 사용하는 것은 90%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.96이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 15: 정상 및 악성 그룹 (p=0.023)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 8.6926의 컷오프 값을 사용하는 것은 70%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.80이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 20: 정상 및 악성 그룹 (p=0.000)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.6521의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.76이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
결론:
상기 결과는 난소암을 검출하는데 있어서 및 정상 난소 조직으로부터 악성을 구별하는데 이어서 트랜스크립트 1, 2, 3, 6, 11, 12, 15, 및 20의 유틸 리티를 예시한다. 트랜스크립트 1, 2 및 3은 또한 전립선암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 6은 또한 흑색종 및 폐암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 11은 또한 흑색종 피부암, 대장암 및 고환암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 12는 또한 대장암 및 고환암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 15는 또한 흑색종 및 고환암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. . 트랜스크립트 20은 또한 대장암, 흑색종, 및 고환암을 검출하는데 있어서 유틸리티를 갖는 것으로 밝혀졌다. 열거된 8개의 트랜스크립트중 어느 것이나 임상적 세팅에서 난소암의 검출 또는 특성화를 위한 도구로서 개별적으로 또는 조합하여 사용될 수 있다.
실시예 9: 고환암에 대한 적용
본 연구는 고환암을 검출하는데 있어서 본 발명의 여러 가지 트랜스크립트의 효과를 측정하고자 하였다. 8개의 대조군 (양성) 조직 샘플 (샘플 1 내지 8) 및 9개의 종양 (악성) 조직 샘플 (샘플 9 내지 17)을 포함하는 전체 17개의 샘플이 제조되었고, 악성 샘플중 5개는 비-정상피종 (샘플 9-13)이었고, 4개는 정상피종 (샘플 14-17)이었다. 이 샘플은 제조업자의 추천 (신선한 동물 조직 및 냉동된 동물 조직에 대한 QuantiGene® 샘플 프로세싱 키트; 및 QuantiGene® 2.0 시약 시스템 사용자 매뉴얼)에 따라 균질화되었다. 10개의 표적 트랜스크립트 및 1개의 하우스키퍼 트랜스크립트가 선행된 실시예에서 상기 개략된 방식으로 제조되었다.
이 실시예에 사용된 17개의 조직 샘플은 다음 특성을 가졌다:
Figure pat00008
트랜스크립트의 특성은 다음과 같이 요약된다:
Figure pat00009
트랜스크립트 2, 3, 4, 7, 11, 12, 15, 16 및 20은 실시예 3-8에 관하여 상기 고찰된 것들과 동일한 것이 주지된다.
균질물은 대략적으로 25mg의 냉동된 조직을 사용하여 제조되고, 1:4로 희석되었다. 트랜스크립트의 정량은 GlomaxTM 멀티 검출 시스템 (Promega) 상에서 상대적 발광 유니트 RLU에서 측정되었다. 모든 샘플은 각각의 트랜스크립트에 대해 삼중으로 분석되었다. 배경 측정 (어떠한 템플릿도 없음)은 마찬가지로 삼중으로 행해졌다. 분석은 샘플에 대해 RLU 값으로부터 하한치를 감산함으로써 배경을 고려하였다. 입력 RNA는 식 log2 a RLU - log2 h RLU을 사용함으로써 설명되고, 여기서 a는 표적 융합 트랜스크립트이고 h는 하우스키퍼 트랜스크립트이다.
다음 단계로 구성된 데이터의 분석:
a) 삼중 분석을 위해 CV (변화 계수)를 확립하고; ≤ 15%인 경우 허용될 수 있다.
b) 표적 융합 트랜스크립트(a) 및 하우스키퍼 트랜스크립트 (h)의 삼중 분석을 위한 평균 RLU 값을 확립한다.
c) 배경 RLU (I)의 삼중 값으로부터 하한치를 확립한다
d) (a)로부터 하한치 (I)를 감산한다.
e) log2 a RLU - log2 h RLU를 산출한다.
결과의 요약:
상기 분석의 결과는 도 10 내지 18에 예시되고, 이는 샘플수에 반하여 log2 a RLU - log2 h RLU의 플롯을 포함한다. 또한 각각의 트랜스크립트를 위한 결과로부터 결정된 각각의 ROC (수신기 작동 특성) 곡선이 예시되어 있다.
일부 트랜스크립트는 양성과 악성 고환 조직을 구별하지만, 다른 것들은 정상피종 및 비-정상피종의 종양 서브타입 및/또는 양성 고환 조직 사이의 구별을 제공한다. 따라서, 각각의 클래스로부터 트랜스크립트를 조합하는 것은 고환암의 검출뿐만 아니라 정상피종 또는 비-정상피종의 서브타입으로 분류를 촉진시킬 것이다.
트랜스크립트 2: 정상 그룹과 및 악성 정상피종 (p=0.02)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.5621의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.024)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 2.1006의 컷오프 값을 사용하는 것은 100%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.90이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 3: 정상 그룹과 및 악성 정상피종 (p=0.018)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.969의 컷오프 값을 사용하는 것은 100%의 민감성 및 87.5%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.969이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.017)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.8181의 컷오프 값을 사용하는 것은 100%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.9이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 4: 정상 그룹과 및 악성 그룹 (0.034)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 9.7628의 컷오프 값을 사용하는 것은 67%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.833이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 11: 정상 그룹과 및 악성 정상피종 (p=0.016)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.732의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.016)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 0.9884의 컷오프 값을 사용하는 것은 100%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.90이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 12: 정상 그룹과 및 악성 정상피종 (p=0.056)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.5361의 컷오프 값을 사용하는 것은 100%의 민감성 및 87.5%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.969이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.044)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.6039의 컷오프 값을 사용하는 것은 100%의 민감성 및 80%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.9이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 13: 정상 그룹과 및 악성 그룹 (p=0.019)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 -9.8751의 컷오프 값을 사용하는 것은 87.5%의 민감성 및 78%의 특이성을 초래하고, 곡선 아래 영역은 매우 양호한 시험 정확도를 나타내는 0.875이다. 또한, 악성 비-정상피종과 및 양성 그룹 (p=0.000)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 -13.9519의 컷오프 값을 사용하는 것은 100%의 민감성 및 87.5%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.975이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.001)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 -15.8501의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 15: 정상 그룹과 및 악성 그룹 (p=0.065)의 평균 (p<0.1) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 - 5.4916의 컷오프 값을 사용하는 것은 75%의 민감성 및 89%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.833이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 16: 정상 그룹과 및 정상피종 및 비-정상피종 모두를 포함하는 악성 그룹 (p=0.037)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 -6.448의 컷오프 값을 사용하는 것은 89%의 민감성 및 75%의 특이성을 초래하고, 곡선 아래 영역은 양호한 시험 정확도를 나타내는 0.806이다. 또한, 정상 및 악성 정상피종 (p=0.037)의 평균 (p<0.05) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 -7.4575의 컷오프 값을 사용하는 것은 100%의 민감성 및 87.5%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 0.938이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
트랜스크립트 20: 정상 그룹과 및 악성 정상피종 (p=0.006)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.8364의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 또한, 악성 정상피종과 및 악성 비-정상피종 (p=0.004)의 평균 (p<0.01) 사이에 통계학적으로 현저한 차이가 존재한다. ROC 곡선에 의해 나타낸 바 1.6065의 컷오프 값을 사용하는 것은 100%의 민감성 및 100%의 특이성을 초래하고, 곡선 아래 영역은 우수한 시험 정확도를 나타내는 1.00이다. 선택된 임계 값은 특정 적용을 위한 시험의 특이성이나 또는 민감성을 증가시키도록 조절될 수 있다.
결론:
상기 결과는 고환암, 및 고환암 서브타입의 검출에 있어서, 및 정상 고환 조직으로부터 악성 조직을 구별함에 있어서 트랜스크립트 2, 3, 4, 11, 12, 13, 15, 16, 및 20의 유틸리티를 예시한다. 트랜스크립트 2는 또한 전립선, 유방, 대장 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 3은 또한 전립선, 유방, 흑색종, 대장, 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 4는 또한 전립선 및 대장암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 11은 또한 대장, 흑색종, 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 12는 또한 대장 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 15는 또한 흑색종 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 16은 흑색종 피부암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 트랜스크립트 20은 또한 대장암, 흑색종 및 난소암의 검출에 있어서 유틸리티를 갖는 것으로 밝혀졌다. 열거된 9개의 트랜스크립트 중의 임의의 것은 임상적 세팅에서 고환암의 검출 또는 특성화를 위한 도구로서 개별적으로 또는 조합하여 사용될 수 있다.
일 측면에서, 본 발명은 조직 샘플 내의 암의 존재를 결정하기 위한 분석을 수행하기 위한 키트를 제공한다. 키트는 상기한 바의 분석을 수행하기 위해 필요한 시약을 포함한다. 특히, 키트는 상기한 바와 같이 트랜스크립트 1 내지 17, 및 20에 대응하는 1개 이상의 혼성화 프로브를 함유하는 1개 이상의 용기를 포함한다. 이해할 수 있듯이, 분석을 수행하기 위한 시약은 임의의 필수적인 완충액, 염, 검출 시약 등을 포함할 수 있다. 더욱이, 키트는 예를 들면 균질화 또는 핵산 추출에 의해 필요한 조직 샘플, 이 조직 샘플을 제조하기 위한 시약 또는 물질을 획득하기 위해서, 및 주제의 분석 또는 분석들을 수행하기 위해 임의의 필요한 샘플 수집 장치, 용기 등을 포함할 수 있다. 키트는 또한 병에 걸린 또는 병에 걸리지 않은 조직에 대해 허용되는 값을 확립 또는 인증하기 위해 대조용 조직 또는 샘플을 포함할 수 있다.
본 발명은 특정한 특정 구체예에 기재되었지만, 그의 여러 가지 변형은 이에 첨부된 특허 청구의 범위에 개략된 바의 존 발명의 정신 및 범위에서 벗어남이 없이 당업계의 숙련자들에게 명백할 것이다. 본 출원에 언급된 모든 문서 (기사, 매뉴얼, 특허 출원 등)는 참고 문헌으로서 그의 전문으로 본원에 인용된다.
문헌 목록
무엇보다도 다음 참고 문헌들은 다음 문헌에 인용되었다. 이들 참고 문헌의 전체 내용은 그에 대한 참고 문헌으로서 본원에 인용된다.
Figure pat00010
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
<110> MDNA Life Sciences Inc. <120> ABERRANT MITOCHONDRIAL DNA, ASSOCIATED FUSION TRANSCRIPTS AND HYBRIDIZATION PROBES THEREFOR <130> IPA130770-CA-D1 <140> PCT/CA2009/000351 <150> 61/040,616 <151> 2008-03-28 <160> 52 <170> PatentIn version 3.3 <210> 1 <211> 16568 <212> DNA <213> Human <400> 1 gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60 cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120 gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180 acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240 acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300 aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360 acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420 ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480 ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540 ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600 gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660 ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720 tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780 aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840 acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900 ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960 tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020 tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080 taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140 cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200 agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260 ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320 acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380 aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440 agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500 aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560 cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620 aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680 gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740 agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800 aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860 ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920 acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980 ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040 ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100 caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160 acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220 ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280 accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340 ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400 aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460 aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520 atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580 aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640 acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700 ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760 cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820 cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880 ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940 gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000 ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060 gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacttca aattcctccc 3120 tgtacgaaag gacaagagaa ataaggccta cttcacaaag cgccttcccc cgtaaatgat 3180 atcatctcaa cttagtatta tacccacacc cacccaagaa cagggtttgt taagatggca 3240 gagcccggta atcgcataaa acttaaaact ttacagtcag aggttcaatt cctcttctta 3300 acaacatacc catggccaac ctcctactcc tcattgtacc cattctaatc gcaatggcat 3360 tcctaatgct taccgaacga aaaattctag gctatataca actacgcaaa ggccccaacg 3420 ttgtaggccc ctacgggcta ctacaaccct tcgctgacgc cataaaactc ttcaccaaag 3480 agcccctaaa acccgccaca tctaccatca ccctctacat caccgccccg accttagctc 3540 tcaccatcgc tcttctacta tgaacccccc tccccatacc caaccccctg gtcaacctca 3600 acctaggcct cctatttatt ctagccacct ctagcctagc cgtttactca atcctctgat 3660 cagggtgagc atcaaactca aactacgccc tgatcggcgc actgcgagca gtagcccaaa 3720 caatctcata tgaagtcacc ctagccatca ttctactatc aacattacta ataagtggct 3780 cctttaacct ctccaccctt atcacaacac aagaacacct ctgattactc ctgccatcat 3840 gacccttggc cataatatga tttatctcca cactagcaga gaccaaccga acccccttcg 3900 accttgccga aggggagtcc gaactagtct caggcttcaa catcgaatac gccgcaggcc 3960 ccttcgccct attcttcata gccgaataca caaacattat tataataaac accctcacca 4020 ctacaatctt cctaggaaca acatatgacg cactctcccc tgaactctac acaacatatt 4080 ttgtcaccaa gaccctactt ctaacctccc tgttcttatg aattcgaaca gcataccccc 4140 gattccgcta cgaccaactc atacacctcc tatgaaaaaa cttcctacca ctcaccctag 4200 cattacttat atgatatgtc tccataccca ttacaatctc cagcattccc cctcaaacct 4260 aagaaatatg tctgataaaa gagttacttt gatagagtaa ataataggag cttaaacccc 4320 cttatttcta ggactatgag aatcgaaccc atccctgaga atccaaaatt ctccgtgcca 4380 cctatcacac cccatcctaa agtaaggtca gctaaataag ctatcgggcc cataccccga 4440 aaatgttggt tatacccttc ccgtactaat taatcccctg gcccaacccg tcatctactc 4500 taccatcttt gcaggcacac tcatcacagc gctaagctcg cactgatttt ttacctgagt 4560 aggcctagaa ataaacatgc tagcttttat tccagttcta accaaaaaaa taaaccctcg 4620 ttccacagaa gctgccatca agtatttcct cacgcaagca accgcatcca taatccttct 4680 aatagctatc ctcttcaaca atatactctc cggacaatga accataacca atactaccaa 4740 tcaatactca tcattaataa tcataatagc tatagcaata aaactaggaa tagccccctt 4800 tcacttctga gtcccagagg ttacccaagg cacccctctg acatccggcc tgcttcttct 4860 cacatgacaa aaactagccc ccatctcaat catataccaa atctctccct cactaaacgt 4920 aagccttctc ctcactctct caatcttatc catcatagca ggcagttgag gtggattaaa 4980 ccaaacccag ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat 5040 agcagttcta ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct 5100 aactactacc gcattcctac tactcaactt aaactccagc accacgaccc tactactatc 5160 tcgcacctga aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct 5220 aggaggcctg cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac 5280 aaaaaacaat agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta 5340 cttctaccta cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt 5400 aaaaataaaa tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc 5460 ccttaccacg ctactcctac ctatctcccc ttttatacta ataatcttat agaaatttag 5520 gttaaataca gaccaagagc cttcaaagcc ctcagtaagt tgcaatactt aatttctgta 5580 acagctaagg actgcaaaac cccactctgc atcaactgaa cgcaaatcag ccactttaat 5640 taagctaagc ccttactaga ccaatgggac ttaaacccac aaacacttag ttaacagcta 5700 agcaccctaa tcaactggct tcaatctact tctcccgccg ccgggaaaaa aggcgggaga 5760 agccccggca ggtttgaagc tgcttcttcg aatttgcaat tcaatatgaa aatcacctcg 5820 gagctggtaa aaagaggcct aacccctgtc tttagattta cagtccaatg cttcactcag 5880 ccattttacc tcacccccac tgatgttcgc cgaccgttga ctattctcta caaaccacaa 5940 agacattgga acactatacc tattattcgg cgcatgagct ggagtcctag gcacagctct 6000 aagcctcctt attcgagccg agctgggcca gccaggcaac cttctaggta acgaccacat 6060 ctacaacgtt atcgtcacag cccatgcatt tgtaataatc ttcttcatag taatacccat 6120 cataatcgga ggctttggca actgactagt tcccctaata atcggtgccc ccgatatggc 6180 gtttccccgc ataaacaaca taagcttctg actcttacct ccctctctcc tactcctgct 6240 cgcatctgct atagtggagg ccggagcagg aacaggttga acagtctacc ctcccttagc 6300 agggaactac tcccaccctg gagcctccgt agacctaacc atcttctcct tacacctagc 6360 aggtgtctcc tctatcttag gggccatcaa tttcatcaca acaattatca atataaaacc 6420 ccctgccata acccaatacc aaacgcccct cttcgtctga tccgtcctaa tcacagcagt 6480 cctacttctc ctatctctcc cagtcctagc tgctggcatc actatactac taacagaccg 6540 caacctcaac accaccttct tcgaccccgc cggaggagga gaccccattc tataccaaca 6600 cctattctga tttttcggtc accctgaagt ttatattctt atcctaccag gcttcggaat 6660 aatctcccat attgtaactt actactccgg aaaaaaagaa ccatttggat acataggtat 6720 ggtctgagct atgatatcaa ttggcttcct agggtttatc gtgtgagcac accatatatt 6780 tacagtagga atagacgtag acacacgagc atatttcacc tccgctacca taatcatcgc 6840 tatccccacc ggcgtcaaag tatttagctg actcgccaca ctccacggaa gcaatatgaa 6900 atgatctgct gcagtgctct gagccctagg attcatcttt cttttcaccg taggtggcct 6960 gactggcatt gtattagcaa actcatcact agacatcgta ctacacgaca cgtactacgt 7020 tgtagcccac ttccactatg tcctatcaat aggagctgta tttgccatca taggaggctt 7080 cattcactga tttcccctat tctcaggcta caccctagac caaacctacg ccaaaatcca 7140 tttcactatc atattcatcg gcgtaaatct aactttcttc ccacaacact ttctcggcct 7200 atccggaatg ccccgacgtt actcggacta ccccgatgca tacaccacat gaaacatcct 7260 atcatctgta ggctcattca tttctctaac agcagtaata ttaataattt tcatgatttg 7320 agaagccttc gcttcgaagc gaaaagtcct aatagtagaa gaaccctcca taaacctgga 7380 gtgactatat ggatgccccc caccctacca cacattcgaa gaacccgtat acataaaatc 7440 tagacaaaaa aggaaggaat cgaacccccc aaagctggtt tcaagccaac cccatggcct 7500 ccatgacttt ttcaaaaagg tattagaaaa accatttcat aactttgtca aagttaaatt 7560 ataggctaaa tcctatatat cttaatggca catgcagcgc aagtaggtct acaagacgct 7620 acttccccta tcatagaaga gcttatcacc tttcatgatc acgccctcat aatcattttc 7680 cttatctgct tcctagtcct gtatgccctt ttcctaacac tcacaacaaa actaactaat 7740 actaacatct cagacgctca ggaaatagaa accgtctgaa ctatcctgcc cgccatcatc 7800 ctagtcctca tcgccctccc atccctacgc atcctttaca taacagacga ggtcaacgat 7860 ccctccctta ccatcaaatc aattggccac caatggtact gaacctacga gtacaccgac 7920 tacggcggac taatcttcaa ctcctacata cttcccccat tattcctaga accaggcgac 7980 ctgcgactcc ttgacgttga caatcgagta gtactcccga ttgaagcccc cattcgtata 8040 ataattacat cacaagacgt cttgcactca tgagctgtcc ccacattagg cttaaaaaca 8100 gatgcaattc ccggacgtct aaaccaaacc actttcaccg ctacacgacc gggggtatac 8160 tacggtcaat gctctgaaat ctgtggagca aaccacagtt tcatgcccat cgtcctagaa 8220 ttaattcccc taaaaatctt tgaaataggg cccgtattta ccctatagca ccccctctac 8280 cccctctaga gcccactgta aagctaactt agcattaacc ttttaagtta aagattaaga 8340 gaaccaacac ctctttacag tgaaatgccc caactaaata ctaccgtatg gcccaccata 8400 attaccccca tactccttac actattcctc atcacccaac taaaaatatt aaacacaaac 8460 taccacctac ctccctcacc aaagcccata aaaataaaaa attataacaa accctgagaa 8520 ccaaaatgaa cgaaaatctg ttcgcttcat tcattgcccc cacaatccta ggcctacccg 8580 ccgcagtact gatcattcta tttccccctc tattgatccc cacctccaaa tatctcatca 8640 acaaccgact aatcaccacc caacaatgac taatcaaact aacctcaaaa caaatgataa 8700 ccatacacaa cactaaagga cgaacctgat ctcttatact agtatcctta atcattttta 8760 ttgccacaac taacctcctc ggactcctgc ctcactcatt tacaccaacc acccaactat 8820 ctataaacct agccatggcc atccccttat gagcgggcac agtgattata ggctttcgct 8880 ctaagattaa aaatgcccta gcccacttct taccacaagg cacacctaca ccccttatcc 8940 ccatactagt tattatcgaa accatcagcc tactcattca accaatagcc ctggccgtac 9000 gcctaaccgc taacattact gcaggccacc tactcatgca cctaattgga agcgccaccc 9060 tagcaatatc aaccattaac cttccctcta cacttatcat cttcacaatt ctaattctac 9120 tgactatcct agaaatcgct gtcgccttaa tccaagccta cgttttcaca cttctagtaa 9180 gcctctacct gcacgacaac acataatgac ccaccaatca catgcctatc atatagtaaa 9240 acccagccca tgacccctaa caggggccct ctcagccctc ctaatgacct ccggcctagc 9300 catgtgattt cacttccact ccataacgct cctcatacta ggcctactaa ccaacacact 9360 aaccatatac caatgatggc gcgatgtaac acgagaaagc acataccaag gccaccacac 9420 accacctgtc caaaaaggcc ttcgatacgg gataatccta tttattacct cagaagtttt 9480 tttcttcgca ggatttttct gagcctttta ccactccagc ctagccccta ccccccaatt 9540 aggagggcac tggcccccaa caggcatcac cccgctaaat cccctagaag tcccactcct 9600 aaacacatcc gtattactcg catcaggagt atcaatcacc tgagctcacc atagtctaat 9660 agaaaacaac cgaaaccaaa taattcaagc actgcttatt acaattttac tgggtctcta 9720 ttttaccctc ctacaagcct cagagtactt cgagtctccc ttcaccattt ccgacggcat 9780 ctacggctca acattttttg tagccacagg cttccacgga cttcacgtca ttattggctc 9840 aactttcctc actatctgct tcatccgcca actaatattt cactttacat ccaaacatca 9900 ctttggcttc gaagccgccg cctgatactg gcattttgta gatgtggttt gactatttct 9960 gtatgtctcc atctattgat gagggtctta ctcttttagt ataaatagta ccgttaactt 10020 ccaattaact agttttgaca acattcaaaa aagagtaata aacttcgcct taattttaat 10080 aatcaacacc ctcctagcct tactactaat aattattaca ttttgactac cacaactcaa 10140 cggctacata gaaaaatcca ccccttacga gtgcggcttc gaccctatat cccccgcccg 10200 cgtccctttc tccataaaat tcttcttagt agctattacc ttcttattat ttgatctaga 10260 aattgccctc cttttacccc taccatgagc cctacaaaca actaacctgc cactaatagt 10320 tatgtcatcc ctcttattaa tcatcatcct agccctaagt ctggcctatg agtgactaca 10380 aaaaggatta gactgaaccg aattggtata tagtttaaac aaaacgaatg atttcgactc 10440 attaaattat gataatcata tttaccaaat gcccctcatt tacataaata ttatactagc 10500 atttaccatc tcacttctag gaatactagt atatcgctca cacctcatat cctccctact 10560 atgcctagaa ggaataatac tatcgctgtt cattatagct actctcataa ccctcaacac 10620 ccactccctc ttagccaata ttgtgcctat tgccatacta gtctttgccg cctgcgaagc 10680 agcggtgggc ctagccctac tagtctcaat ctccaacaca tatggcctag actacgtaca 10740 taacctaaac ctactccaat gctaaaacta atcgtcccaa caattatatt actaccactg 10800 acatgacttt ccaaaaaaca cataatttga atcaacacaa ccacccacag cctaattatt 10860 agcatcatcc ctctactatt ttttaaccaa atcaacaaca acctatttag ctgttcccca 10920 accttttcct ccgaccccct aacaaccccc ctcctaatac taactacctg actcctaccc 10980 ctcacaatca tggcaagcca acgccactta tccagtgaac cactatcacg aaaaaaactc 11040 tacctctcta tactaatctc cctacaaatc tccttaatta taacattcac agccacagaa 11100 ctaatcatat tttatatctt cttcgaaacc acacttatcc ccaccttggc tatcatcacc 11160 cgatgaggca accagccaga acgcctgaac gcaggcacat acttcctatt ctacacccta 11220 gtaggctccc ttcccctact catcgcacta atttacactc acaacaccct aggctcacta 11280 aacattctac tactcactct cactgcccaa gaactatcaa actcctgagc caacaactta 11340 atatgactag cttacacaat agcttttata gtaaagatac ctctttacgg actccactta 11400 tgactcccta aagcccatgt cgaagccccc atcgctgggt caatagtact tgccgcagta 11460 ctcttaaaac taggcggcta tggtataata cgcctcacac tcattctcaa ccccctgaca 11520 aaacacatag cctacccctt ccttgtacta tccctatgag gcataattat aacaagctcc 11580 atctgcctac gacaaacaga cctaaaatcg ctcattgcat actcttcaat cagccacata 11640 gccctcgtag taacagccat tctcatccaa accccctgaa gcttcaccgg cgcagtcatt 11700 ctcataatcg cccacgggct tacatcctca ttactattct gcctagcaaa ctcaaactac 11760 gaacgcactc acagtcgcat cataatcctc tctcaaggac ttcaaactct actcccacta 11820 atagcttttt gatgacttct agcaagcctc gctaacctcg ccttaccccc cactattaac 11880 ctactgggag aactctctgt gctagtaacc acgttctcct gatcaaatat cactctccta 11940 cttacaggac tcaacatact agtcacagcc ctatactccc tctacatatt taccacaaca 12000 caatggggct cactcaccca ccacattaac aacataaaac cctcattcac acgagaaaac 12060 accctcatgt tcatacacct atcccccatt ctcctcctat ccctcaaccc cgacatcatt 12120 accgggtttt cctcttgtaa atatagttta accaaaacat cagattgtga atctgacaac 12180 agaggcttac gaccccttat ttaccgagaa agctcacaag aactgctaac tcatgccccc 12240 atgtctaaca acatggcttt ctcaactttt aaaggataac agctatccat tggtcttagg 12300 ccccaaaaat tttggtgcaa ctccaaataa aagtaataac catgcacact actataacca 12360 ccctaaccct gacttcccta attcccccca tccttaccac cctcgttaac cctaacaaaa 12420 aaaactcata cccccattat gtaaaatcca ttgtcgcatc cacctttatt atcagtctct 12480 tccccacaac aatattcatg tgcctagacc aagaagttat tatctcgaac tgacactgag 12540 ccacaaccca aacaacccag ctctccctaa gcttcaaact agactacttc tccataatat 12600 tcatccctgt agcattgttc gttacatggt ccatcataga attctcactg tgatatataa 12660 actcagaccc aaacattaat cagttcttca aatatctact catcttccta attaccatac 12720 taatcttagt taccgctaac aacctattcc aactgttcat cggctgagag ggcgtaggaa 12780 ttatatcctt cttgctcatc agttgatgat acgcccgagc agatgccaac acagcagcca 12840 ttcaagcaat cctatacaac cgtatcggcg atatcggttt catcctcgcc ttagcatgat 12900 ttatcctaca ctccaactca tgagacccac aacaaatagc ccttctaaac gctaatccaa 12960 gcctcacccc actactaggc ctcctcctag cagcagcagg caaatcagcc caattaggtc 13020 tccacccctg actcccctca gccatagaag gccccacccc agtctcagcc ctactccact 13080 caagcactat agttgtagca ggaatcttct tactcatccg cttccacccc ctagcagaaa 13140 atagcccact aatccaaact ctaacactat gcttaggcgc tatcaccact ctgttcgcag 13200 cagtctgcgc ccttacacaa aatgacatca aaaaaatcgt agccttctcc acttcaagtc 13260 aactaggact cataatagtt acaatcggca tcaaccaacc acacctagca ttcctgcaca 13320 tctgtaccca cgccttcttc aaagccatac tatttatgtg ctccgggtcc atcatccaca 13380 accttaacaa tgaacaagat attcgaaaaa taggaggact actcaaaacc atacctctca 13440 cttcaacctc cctcaccatt ggcagcctag cattagcagg aatacctttc ctcacaggtt 13500 tctactccaa agaccacatc atcgaaaccg caaacatatc atacacaaac gcctgagccc 13560 tatctattac tctcatcgct acctccctga caagcgccta tagcactcga ataattcttc 13620 tcaccctaac aggtcaacct cgcttcccca cccttactaa cattaacgaa aataacccca 13680 ccctactaaa ccccattaaa cgcctggcag ccggaagcct attcgcagga tttctcatta 13740 ctaacaacat ttcccccgca tcccccttcc aaacaacaat ccccctctac ctaaaactca 13800 cagccctcgc tgtcactttc ctaggacttc taacagccct agacctcaac tacctaacca 13860 acaaacttaa aataaaatcc ccactatgca cattttattt ctccaacata ctcggattct 13920 accctagcat cacacaccgc acaatcccct atctaggcct tcttacgagc caaaacctgc 13980 ccctactcct cctagaccta acctgactag aaaagctatt acctaaaaca atttcacagc 14040 accaaatctc cacctccatc atcacctcaa cccaaaaagg cataattaaa ctttacttcc 14100 tctctttctt cttcccactc atcctaaccc tactcctaat cacataacct attcccccga 14160 gcaatctcaa ttacaatata tacaccaaca aacaatgttc aaccagtaac tactactaat 14220 caacgcccat aatcatacaa agcccccgca ccaataggat cctcccgaat caaccctgac 14280 ccctctcctt cataaattat tcagcttcct acactattaa agtttaccac aaccaccacc 14340 ccatcatact ctttcaccca cagcaccaat cctacctcca tcgctaaccc cactaaaaca 14400 ctcaccaaga cctcaacccc tgacccccat gcctcaggat actcctcaat agccatcgct 14460 gtagtatatc caaagacaac catcattccc cctaaataaa ttaaaaaaac tattaaaccc 14520 atataacctc ccccaaaatt cagaataata acacacccga ccacaccgct aacaatcaat 14580 actaaacccc cataaatagg agaaggctta gaagaaaacc ccacaaaccc cattactaaa 14640 cccacactca acagaaacaa agcatacatc attattctcg cacggactac aaccacgacc 14700 aatgatatga aaaaccatcg ttgtatttca actacaagaa caccaatgac cccaatacgc 14760 aaaactaacc ccctaataaa attaattaac cactcattca tcgacctccc caccccatcc 14820 aacatctccg catgatgaaa cttcggctca ctccttggcg cctgcctgat cctccaaatc 14880 accacaggac tattcctagc catgcactac tcaccagacg cctcaaccgc cttttcatca 14940 atcgcccaca tcactcgaga cgtaaattat ggctgaatca tccgctacct tcacgccaat 15000 ggcgcctcaa tattctttat ctgcctcttc ctacacatcg ggcgaggcct atattacgga 15060 tcatttctct actcagaaac ctgaaacatc ggcattatcc tcctgcttgc aactatagca 15120 acagccttca taggctatgt cctcccgtga ggccaaatat cattctgagg ggccacagta 15180 attacaaact tactatccgc catcccatac attgggacag acctagttca atgaatctga 15240 ggaggctact cagtagacag tcccaccctc acacgattct ttacctttca cttcatcttg 15300 cccttcatta ttgcagccct agcaacactc cacctcctat tcttgcacga aacgggatca 15360 aacaaccccc taggaatcac ctcccattcc gataaaatca ccttccaccc ttactacaca 15420 atcaaagacg ccctcggctt acttctcttc cttctctcct taatgacatt aacactattc 15480 tcaccagacc tcctaggcga cccagacaat tataccctag ccaacccctt aaacacccct 15540 ccccacatca agcccgaatg atatttccta ttcgcctaca caattctccg atccgtccct 15600 aacaaactag gaggcgtcct tgccctatta ctatccatcc tcatcctagc aataatcccc 15660 atcctccata tatccaaaca acaaagcata atatttcgcc cactaagcca atcactttat 15720 tgactcctag ccgcagacct cctcattcta acctgaatcg gaggacaacc agtaagctac 15780 ccttttacca tcattggaca agtagcatcc gtactatact tcacaacaat cctaatccta 15840 ataccaacta tctccctaat tgaaaacaaa atactcaaat gggcctgtcc ttgtagtata 15900 aactaataca ccagtcttgt aaaccggaga tgaaaacctt tttccaagga caaatcagag 15960 aaaaagtctt taactccacc attagcaccc aaagctaaga ttctaattta aactattctc 16020 tgttctttca tggggaagca gatttgggta ccacccaagt attgactcac ccatcaacaa 16080 ccgctatgta tttcgtacat tactgccagc caccatgaat attgtacggt accataaata 16140 cttgaccacc tgtagtacat aaaaacccaa tccacatcaa aaccccctcc ccatgcttac 16200 aagcaagtac agcaatcaac cctcaactat cacacatcaa ctgcaactcc aaagccaccc 16260 ctcacccact aggataccaa caaacctacc cacccttaac agtacatagt acataaagcc 16320 atttaccgta catagcacat tacagtcaaa tcccttctcg tccccatgga tgacccccct 16380 cagatagggg tcccttgacc accatcctcc gtgaaatcaa tatcccgcac aagagtgcta 16440 ctctcctcgc tccgggccca taacacttgg gggtagctaa agtgaactgt atccgacatc 16500 tggttcctac ttcagggtca taaagcctaa atagcccaca cgttcccctt aaataagaca 16560 tcacgatg 16568 <210> 2 <211> 783 <212> DNA <213> Artificial <220> <223> cDNA <400> 2 atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60 attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120 cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180 acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240 actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300 aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360 gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420 ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480 ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540 aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600 acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660 aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720 attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780 taa 783 <210> 3 <211> 300 <212> DNA <213> Artificial <220> <223> cDNA <400> 3 atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60 gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120 ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180 attgccatac tagtctttgc cgcctgcgaa gcagcggtgg gcctagccct actagtctca 240 atctccaaca catatggcct agactacgta cataacctaa ccctactcct aatcacataa 300 <210> 4 <211> 781 <212> DNA <213> Artificial <220> <223> cDNA <400> 4 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacccag acaattatac cctagccaac 420 cccttaaaca cccctcccca catcaagccc gaatgatatt tcctattcgc ctacacaatt 480 ctccgatccg tccctaacaa actaggaggc gtccttgccc tattactatc catcctcatc 540 ctagcaataa tccccatcct ccatatatcc aaacaacaaa gcataatatt tcgcccacta 600 agccaatcac tttattgact cctagccgca gacctcctca ttctaacctg aatcggagga 660 caaccagtaa gctacccttt taccatcatt ggacaagtag catccgtact atacttcaca 720 acaatcctaa tcctaatacc aactatctcc ctaattgaaa acaaaatact caaatgggcc 780 t 781 <210> 5 <211> 565 <212> DNA <213> Artificial <220> <223> cDNA <400> 5 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420 ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480 gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540 gaaaacaaaa tactcaaatg ggcct 565 <210> 6 <211> 1174 <212> DNA <213> Artificial <220> <223> cDNA <400> 6 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420 cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480 cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540 caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600 ggagcaaacc acagtttcat gcccatattc ttgcacgaaa cgggatcaaa caacccccta 660 ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 720 ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 780 ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 840 cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 900 ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 960 tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1020 gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1080 attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1140 tccctaattg aaaacaaaat actcaaatgg gcct 1174 <210> 7 <211> 1294 <212> DNA <213> Artificial <220> <223> cDNA <400> 7 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tgcactactc accagacgcc tcaaccgcct tttcatcaat cgcccacatc 360 actcgagacg taaattatgg ctgaatcatc cgctaccttc acgccaatgg cgcctcaata 420 ttctttatct gcctcttcct acacatcggg cgaggcctat attacggatc atttctctac 480 tcagaaacct gaaacatcgg cattatcctc ctgcttgcaa ctatagcaac agccttcata 540 ggctatgtcc tcccgtgagg ccaaatatca ttctgagggg ccacagtaat tacaaactta 600 ctatccgcca tcccatacat tgggacagac ctagttcaat gaatctgagg aggctactca 660 gtagacagtc ccaccctcac acgattcttt acctttcact tcatcttgcc cttcattatt 720 gcagccctag caacactcca cctcctattc ttgcacgaaa cgggatcaaa caacccccta 780 ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 840 ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 900 ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 960 cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 1020 ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 1080 tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1140 gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1200 attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1260 tccctaattg aaaacaaaat actcaaatgg gcct 1294 <210> 8 <211> 1228 <212> DNA <213> Artificial <220> <223> cDNA <400> 8 atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60 gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120 ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180 attgccatac tagtctttgg cgcctgcctg atcctccaaa tcaccacagg actattccta 240 gccatgcact actcaccaga cgcctcaacc gccttttcat caatcgccca catcactcga 300 gacgtaaatt atggctgaat catccgctac cttcacgcca atggcgcctc aatattcttt 360 atctgcctct tcctacacat cgggcgaggc ctatattacg gatcatttct ctactcagaa 420 acctgaaaca tcggcattat cctcctgctt gcaactatag caacagcctt cataggctat 480 gtcctcccgt gaggccaaat atcattctga ggggccacag taattacaaa cttactatcc 540 gccatcccat acattgggac agacctagtt caatgaatct gaggaggcta ctcagtagac 600 agtcccaccc tcacacgatt ctttaccttt cacttcatct tgcccttcat tattgcagcc 660 ctagcaacac tccacctcct attcttgcac gaaacgggat caaacaaccc cctaggaatc 720 acctcccatt ccgataaaat caccttccac ccttactaca caatcaaaga cgccctcggc 780 ttacttctct tccttctctc cttaatgaca ttaacactat tctcaccaga cctcctaggc 840 gacccagaca attataccct agccaacccc ttaaacaccc ctccccacat caagcccgaa 900 tgatatttcc tattcgccta cacaattctc cgatccgtcc ctaacaaact aggaggcgtc 960 cttgccctat tactatccat cctcatccta gcaataatcc ccatcctcca tatatccaaa 1020 caacaaagca taatatttcg cccactaagc caatcacttt attgactcct agccgcagac 1080 ctcctcattc taacctgaat cggaggacaa ccagtaagct acccttttac catcattgga 1140 caagtagcat ccgtactata cttcacaaca atcctaatcc taataccaac tatctcccta 1200 attgaaaaca aaatactcaa atgggcct 1228 <210> 9 <211> 522 <212> DNA <213> Artificial <220> <223> cDNA <400> 9 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 ctcgctgtca ctttcctagg acttctaaca gccctagacc tcaactacct aaccaacaaa 240 cttaaaataa aatccccact atgcacattt tatttctcca acatactcgg attctaccct 300 agcatcacac accgcacaat cccctatcta ggccttctta cgagccaaaa cctgccccta 360 ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 420 atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 480 ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 522 <210> 10 <211> 582 <212> DNA <213> Artificial <220> <223> cDNA <400> 10 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240 tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300 agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360 ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420 gccctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 480 atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 540 ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 582 <210> 11 <211> 2208 <212> DNA <213> Artificial <220> <223> cDNA <400> 11 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240 tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300 agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360 ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420 gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480 gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540 acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600 gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660 gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720 cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780 tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840 ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900 acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960 tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020 gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080 tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140 ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200 tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260 gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320 tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1380 tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1440 aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1500 ccctaccaca cattcgaaga acccgtatac ataaaagcag gaataccttt cctcacaggt 1560 ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 1620 ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 1680 ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 1740 accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 1800 actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 1860 acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 1920 aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 1980 taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 2040 cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 2100 caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 2160 ctctctttct tcttcccact catcctaacc ctactcctaa tcacataa 2208 <210> 12 <211> 807 <212> DNA <213> Artificial <220> <223> cDNA <400> 12 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg caaacatatc atacacaaac gcctgagccc tatctattac tctcatcgct 240 acctccctga caagcgccta tagcactcga ataattcttc tcaccctaac aggtcaacct 300 cgcttcccca cccttactaa cattaacgaa aataacccca ccctactaaa ccccattaaa 360 cgcctggcag ccggaagcct attcgcagga tttctcatta ctaacaacat ttcccccgca 420 tcccccttcc aaacaacaat ccccctctac ctaaaactca cagccctcgc tgtcactttc 480 ctaggacttc taacagccct agacctcaac tacctaacca acaaacttaa aataaaatcc 540 ccactatgca cattttattt ctccaacata ctcggattct accctagcat cacacaccgc 600 acaatcccct atctaggcct tcttacgagc caaaacctgc ccctactcct cctagaccta 660 acctgactag aaaagctatt acctaaaaca atttcacagc accaaatctc cacctccatc 720 atcacctcaa cccaaaaagg cataattaaa ctttacttcc tctctttctt cttcccactc 780 atcctaaccc tactcctaat cacataa 807 <210> 13 <211> 786 <212> DNA <213> Artificial <220> <223> cDNA <400> 13 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420 cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480 cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540 caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600 ggagcaaacc acagtttcat gcccatcgtc ctagacctaa cctgactaga aaagctatta 660 cctaaaacaa tttcacagca ccaaatctcc acctccatca tcacctcaac ccaaaaaggc 720 ataattaaac tttacttcct ctctttcttc ttcccactca tcctaaccct actcctaatc 780 acataa 786 <210> 14 <211> 1905 <212> DNA <213> Artificial <220> <223> cDNA <400> 14 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360 attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420 ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480 accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540 atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600 atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660 tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720 ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780 cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840 agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900 agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960 gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020 ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080 tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140 cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200 tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260 tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320 tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380 accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440 ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500 aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560 gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620 aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680 cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740 ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800 caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860 tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905 <210> 15 <211> 1545 <212> DNA <213> Artificial <220> <223> cDNA <400> 15 atgacccacc aatcacatgc ctatcatata gtaaaaccca gcccatgacc cctaacaggg 60 gccctctcag ccctcctaat gacctccggc ctagccatgt gatttcactt ccactccata 120 acgctcctca tactaggcct actaaccaac acactaacca tataccaatg atggcgcgat 180 gtaacacgag aaagcacata ccaaggccac cacacaccac ctgtccaaaa aggccttcga 240 tacgggataa tcctatttat tacctcagaa gtttttttct tcgcaggatt tttctgagcc 300 ttttaccact ccagcctagc ccctaccccc caattaggag ggcactggcc cccaacaggc 360 atcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 420 cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 480 agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 540 agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 600 gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 660 ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 720 tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 780 cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 840 tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 900 tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 960 tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1020 accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1080 ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1140 aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1200 gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1260 aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1320 cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1380 ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1440 caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1500 tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1545 <210> 16 <211> 1629 <212> DNA <213> Artificial <220> <223> cDNA <400> 16 ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60 acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120 ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180 accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240 acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300 agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360 ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420 gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480 ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540 ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600 cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660 gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720 gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780 ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840 tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900 ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960 ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020 tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080 tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140 aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200 ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260 atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320 ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380 ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440 cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500 ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560 ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620 atcacataa 1629 <210> 17 <211> 129 <212> DNA <213> Artificial <220> <223> cDNA <400> 17 atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60 ttcctcatca cccaactaaa aatattaaac acaaactacc acctacctcc ctcaccattg 120 gcagcctag 129 <210> 18 <211> 783 <212> RNA <213> Human <400> 18 auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60 auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120 ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180 acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240 acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300 aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360 gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420 cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480 cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540 aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600 acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660 aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720 auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780 uaa 783 <210> 19 <211> 300 <212> RNA <213> Human <400> 19 augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60 guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120 uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180 auugccauac uagucuuugc cgccugcgaa gcagcggugg gccuagcccu acuagucuca 240 aucuccaaca cauauggccu agacuacgua cauaaccuaa cccuacuccu aaucacauaa 300 <210> 20 <211> 781 <212> RNA <213> Human <400> 20 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgacccag acaauuauac ccuagccaac 420 cccuuaaaca ccccucccca caucaagccc gaaugauauu uccuauucgc cuacacaauu 480 cuccgauccg ucccuaacaa acuaggaggc guccuugccc uauuacuauc cauccucauc 540 cuagcaauaa uccccauccu ccauauaucc aaacaacaaa gcauaauauu ucgcccacua 600 agccaaucac uuuauugacu ccuagccgca gaccuccuca uucuaaccug aaucggagga 660 caaccaguaa gcuacccuuu uaccaucauu ggacaaguag cauccguacu auacuucaca 720 acaauccuaa uccuaauacc aacuaucucc cuaauugaaa acaaaauacu caaaugggcc 780 u 781 <210> 21 <211> 565 <212> RNA <213> Human <400> 21 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420 cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480 guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540 gaaaacaaaa uacucaaaug ggccu 565 <210> 22 <211> 1174 <212> RNA <213> Human <400> 22 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420 cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480 cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540 caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600 ggagcaaacc acaguuucau gcccauauuc uugcacgaaa cgggaucaaa caacccccua 660 ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 720 cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 780 cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 840 cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 900 ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 960 uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1020 gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1080 auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1140 ucccuaauug aaaacaaaau acucaaaugg gccu 1174 <210> 23 <211> 1294 <212> RNA <213> Human <400> 23 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca ugcacuacuc accagacgcc ucaaccgccu uuucaucaau cgcccacauc 360 acucgagacg uaaauuaugg cugaaucauc cgcuaccuuc acgccaaugg cgccucaaua 420 uucuuuaucu gccucuuccu acacaucggg cgaggccuau auuacggauc auuucucuac 480 ucagaaaccu gaaacaucgg cauuauccuc cugcuugcaa cuauagcaac agccuucaua 540 ggcuaugucc ucccgugagg ccaaauauca uucugagggg ccacaguaau uacaaacuua 600 cuauccgcca ucccauacau ugggacagac cuaguucaau gaaucugagg aggcuacuca 660 guagacaguc ccacccucac acgauucuuu accuuucacu ucaucuugcc cuucauuauu 720 gcagcccuag caacacucca ccuccuauuc uugcacgaaa cgggaucaaa caacccccua 780 ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 840 cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 900 cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 960 cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 1020 ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 1080 uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1140 gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1200 auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1260 ucccuaauug aaaacaaaau acucaaaugg gccu 1294 <210> 24 <211> 1228 <212> RNA <213> Human <400> 24 augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60 guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120 uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180 auugccauac uagucuuugg cgccugccug auccuccaaa ucaccacagg acuauuccua 240 gccaugcacu acucaccaga cgccucaacc gccuuuucau caaucgccca caucacucga 300 gacguaaauu auggcugaau cauccgcuac cuucacgcca auggcgccuc aauauucuuu 360 aucugccucu uccuacacau cgggcgaggc cuauauuacg gaucauuucu cuacucagaa 420 accugaaaca ucggcauuau ccuccugcuu gcaacuauag caacagccuu cauaggcuau 480 guccucccgu gaggccaaau aucauucuga ggggccacag uaauuacaaa cuuacuaucc 540 gccaucccau acauugggac agaccuaguu caaugaaucu gaggaggcua cucaguagac 600 agucccaccc ucacacgauu cuuuaccuuu cacuucaucu ugcccuucau uauugcagcc 660 cuagcaacac uccaccuccu auucuugcac gaaacgggau caaacaaccc ccuaggaauc 720 accucccauu ccgauaaaau caccuuccac ccuuacuaca caaucaaaga cgcccucggc 780 uuacuucucu uccuucucuc cuuaaugaca uuaacacuau ucucaccaga ccuccuaggc 840 gacccagaca auuauacccu agccaacccc uuaaacaccc cuccccacau caagcccgaa 900 ugauauuucc uauucgccua cacaauucuc cgauccgucc cuaacaaacu aggaggcguc 960 cuugcccuau uacuauccau ccucauccua gcaauaaucc ccauccucca uauauccaaa 1020 caacaaagca uaauauuucg cccacuaagc caaucacuuu auugacuccu agccgcagac 1080 cuccucauuc uaaccugaau cggaggacaa ccaguaagcu acccuuuuac caucauugga 1140 caaguagcau ccguacuaua cuucacaaca auccuaaucc uaauaccaac uaucucccua 1200 auugaaaaca aaauacucaa augggccu 1228 <210> 25 <211> 522 <212> RNA <213> Human <400> 25 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 cucgcuguca cuuuccuagg acuucuaaca gcccuagacc ucaacuaccu aaccaacaaa 240 cuuaaaauaa aauccccacu augcacauuu uauuucucca acauacucgg auucuacccu 300 agcaucacac accgcacaau ccccuaucua ggccuucuua cgagccaaaa ccugccccua 360 cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 420 aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 480 uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 522 <210> 26 <211> 582 <212> RNA <213> Human <400> 26 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240 ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300 agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360 ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420 gcccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 480 aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 540 uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 582 <210> 27 <211> 2208 <212> RNA <213> Human <400> 27 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240 ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300 agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360 ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420 gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480 gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540 acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600 guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660 gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720 ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780 uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840 ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900 acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960 uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020 gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080 ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140 cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200 ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260 guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320 ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1380 ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1440 aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1500 cccuaccaca cauucgaaga acccguauac auaaaagcag gaauaccuuu ccucacaggu 1560 uucuacucca aagaccacau caucgaaacc gcaaacauau cauacacaaa cgccugagcc 1620 cuaucuauua cucucaucgc uaccucccug acaagcgccu auagcacucg aauaauucuu 1680 cucacccuaa caggucaacc ucgcuucccc acccuuacua acauuaacga aaauaacccc 1740 acccuacuaa accccauuaa acgccuggca gccggaagcc uauucgcagg auuucucauu 1800 acuaacaaca uuucccccgc aucccccuuc caaacaacaa ucccccucua ccuaaaacuc 1860 acagcccucg cugucacuuu ccuaggacuu cuaacagccc uagaccucaa cuaccuaacc 1920 aacaaacuua aaauaaaauc cccacuaugc acauuuuauu ucuccaacau acucggauuc 1980 uacccuagca ucacacaccg cacaaucccc uaucuaggcc uucuuacgag ccaaaaccug 2040 ccccuacucc uccuagaccu aaccugacua gaaaagcuau uaccuaaaac aauuucacag 2100 caccaaaucu ccaccuccau caucaccuca acccaaaaag gcauaauuaa acuuuacuuc 2160 cucucuuucu ucuucccacu cauccuaacc cuacuccuaa ucacauaa 2208 <210> 28 <211> 807 <212> RNA <213> Human <400> 28 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg caaacauauc auacacaaac gccugagccc uaucuauuac ucucaucgcu 240 accucccuga caagcgccua uagcacucga auaauucuuc ucacccuaac aggucaaccu 300 cgcuucccca cccuuacuaa cauuaacgaa aauaacccca cccuacuaaa ccccauuaaa 360 cgccuggcag ccggaagccu auucgcagga uuucucauua cuaacaacau uucccccgca 420 ucccccuucc aaacaacaau cccccucuac cuaaaacuca cagcccucgc ugucacuuuc 480 cuaggacuuc uaacagcccu agaccucaac uaccuaacca acaaacuuaa aauaaaaucc 540 ccacuaugca cauuuuauuu cuccaacaua cucggauucu acccuagcau cacacaccgc 600 acaauccccu aucuaggccu ucuuacgagc caaaaccugc cccuacuccu ccuagaccua 660 accugacuag aaaagcuauu accuaaaaca auuucacagc accaaaucuc caccuccauc 720 aucaccucaa cccaaaaagg cauaauuaaa cuuuacuucc ucucuuucuu cuucccacuc 780 auccuaaccc uacuccuaau cacauaa 807 <210> 29 <211> 786 <212> RNA <213> Human <400> 29 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420 cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480 cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540 caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600 ggagcaaacc acaguuucau gcccaucguc cuagaccuaa ccugacuaga aaagcuauua 660 ccuaaaacaa uuucacagca ccaaaucucc accuccauca ucaccucaac ccaaaaaggc 720 auaauuaaac uuuacuuccu cucuuucuuc uucccacuca uccuaacccu acuccuaauc 780 acauaa 786 <210> 30 <211> 1905 <212> RNA <213> Human <400> 30 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360 auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420 cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480 accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540 auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600 auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660 uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720 cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780 caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840 agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900 agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960 gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020 cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080 uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140 cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200 ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260 uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320 ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380 acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440 cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500 aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560 gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620 aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680 ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740 cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800 caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860 ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905 <210> 31 <211> 1545 <212> RNA <213> Human <400> 31 augacccacc aaucacaugc cuaucauaua guaaaaccca gcccaugacc ccuaacaggg 60 gcccucucag cccuccuaau gaccuccggc cuagccaugu gauuucacuu ccacuccaua 120 acgcuccuca uacuaggccu acuaaccaac acacuaacca uauaccaaug auggcgcgau 180 guaacacgag aaagcacaua ccaaggccac cacacaccac cuguccaaaa aggccuucga 240 uacgggauaa uccuauuuau uaccucagaa guuuuuuucu ucgcaggauu uuucugagcc 300 uuuuaccacu ccagccuagc cccuaccccc caauuaggag ggcacuggcc cccaacaggc 360 aucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 420 caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 480 agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 540 agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 600 gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 660 cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 720 uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 780 cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 840 ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 900 uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 960 ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1020 acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1080 cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1140 aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1200 gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1260 aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1320 ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1380 cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1440 caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1500 ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1545 <210> 32 <211> 1629 <212> RNA <213> Human <400> 32 auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60 acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120 uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180 accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240 acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300 agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360 uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420 gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480 ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540 ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600 cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660 gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720 guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780 ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840 ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900 cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960 ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020 ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080 uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140 aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200 cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260 aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320 cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380 uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440 cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500 uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560 ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620 aucacauaa 1629 <210> 33 <211> 129 <212> RNA <213> Human <400> 33 augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60 uuccucauca cccaacuaaa aauauuaaac acaaacuacc accuaccucc cucaccauug 120 gcagccuag 129 <210> 34 <211> 261 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (261)..(261) <223> Xaa can be any naturally occurring amino acid <400> 34 Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His 1 5 10 15 Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile 20 25 30 Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser 35 40 45 Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp 50 55 60 Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser 65 70 75 80 Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr 85 90 95 Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys 100 105 110 Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn 115 120 125 Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys 130 135 140 Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp 145 150 155 160 Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr 165 170 175 Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg 180 185 190 Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu 195 200 205 Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser 210 215 220 Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met 225 230 235 240 Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu 245 250 255 Leu Leu Ile Thr Xaa 260 <210> 35 <211> 100 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (100)..(100) <223> Xaa can be any naturally occurring amino acid <400> 35 Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu 1 5 10 15 Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys 20 25 30 Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr 35 40 45 Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu 50 55 60 Val Phe Ala Ala Cys Glu Ala Ala Val Gly Leu Ala Leu Leu Val Ser 65 70 75 80 Ile Ser Asn Thr Tyr Gly Leu Asp Tyr Val His Asn Leu Thr Leu Leu 85 90 95 Leu Ile Thr Xaa 100 <210> 36 <211> 261 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (261)..(261) <223> Xaa can be any naturally occurring amino acid <400> 36 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr 130 135 140 Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile 145 150 155 160 Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu 165 170 175 Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln 180 185 190 Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu 195 200 205 Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser 210 215 220 Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr 225 230 235 240 Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met 245 250 255 Leu Lys Trp Ala Xaa 260 <210> 37 <211> 189 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (189)..(189) <223> Xaa can be any naturally occurring amino acid <400> 37 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr 130 135 140 Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln 145 150 155 160 Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr 165 170 175 Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 180 185 <210> 38 <211> 392 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (392)..(392) <223> Xaa can be any naturally occurring amino acid <400> 38 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu 130 135 140 Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu 145 150 155 160 His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro 165 170 175 Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr 180 185 190 Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro 195 200 205 Met Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser 210 215 220 His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala 225 230 235 240 Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe 245 250 255 Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro 260 265 270 Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala 275 280 285 Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala 290 295 300 Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met 305 310 315 320 Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr 325 330 335 Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln 340 345 350 Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu 355 360 365 Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu 370 375 380 Asn Lys Met Leu Lys Trp Ala Xaa 385 390 <210> 39 <211> 432 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (432)..(432) <223> Xaa can be any naturally occurring amino acid <400> 39 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met His Tyr Ser Pro Asp Ala Ser Thr 100 105 110 Ala Phe Ser Ser Ile Ala His Ile Thr Arg Asp Val Asn Tyr Gly Trp 115 120 125 Ile Ile Arg Tyr Leu His Ala Asn Gly Ala Ser Met Phe Phe Ile Cys 130 135 140 Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr 145 150 155 160 Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu Leu Ala Thr Met Ala 165 170 175 Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly Gln Met Ser Phe Trp 180 185 190 Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly 195 200 205 Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro 210 215 220 Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile Leu Pro Phe Ile Ile 225 230 235 240 Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu His Glu Thr Gly Ser 245 250 255 Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp Lys Ile Thr Phe His 260 265 270 Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu 275 280 285 Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro 290 295 300 Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr Pro Pro His Ile Lys 305 310 315 320 Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro 325 330 335 Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu 340 345 350 Ala Met Ile Pro Ile Leu His Met Ser Lys Gln Gln Ser Met Met Phe 355 360 365 Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu 370 375 380 Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile 385 390 395 400 Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu 405 410 415 Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 420 425 430 <210> 40 <211> 410 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (410)..(410) <223> Xaa can be any naturally occurring amino acid <400> 40 Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu 1 5 10 15 Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys 20 25 30 Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr 35 40 45 Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu 50 55 60 Val Phe Gly Ala Cys Leu Ile Leu Gln Ile Thr Thr Gly Leu Phe Leu 65 70 75 80 Ala Met His Tyr Ser Pro Asp Ala Ser Thr Ala Phe Ser Ser Ile Ala 85 90 95 His Ile Thr Arg Asp Val Asn Tyr Gly Trp Ile Ile Arg Tyr Leu His 100 105 110 Ala Asn Gly Ala Ser Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly 115 120 125 Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile 130 135 140 Gly Ile Ile Leu Leu Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr 145 150 155 160 Val Leu Pro Trp Gly Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr 165 170 175 Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp 180 185 190 Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe 195 200 205 Thr Phe His Phe Ile Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu 210 215 220 His Leu Leu Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile 225 230 235 240 Thr Ser His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys 245 250 255 Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr 260 265 270 Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala 275 280 285 Asn Pro Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu 290 295 300 Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val 305 310 315 320 Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu 325 330 335 His Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser 340 345 350 Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly 355 360 365 Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser 370 375 380 Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu 385 390 395 400 Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 405 410 <210> 41 <211> 174 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (174)..(174) <223> Xaa can be any naturally occurring amino acid <400> 41 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala Leu Ala Val Thr 50 55 60 Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys 65 70 75 80 Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu 85 90 95 Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu 100 105 110 Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu 115 120 125 Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser 130 135 140 Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser 145 150 155 160 Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 165 170 <210> 42 <211> 194 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (194)..(194) <223> Xaa can be any naturally occurring amino acid <400> 42 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val 50 55 60 Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn 65 70 75 80 Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg 85 90 95 Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu 100 105 110 Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val 115 120 125 Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Leu Leu Asp 130 135 140 Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln 145 150 155 160 Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu 165 170 175 Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile 180 185 190 Thr Xaa <210> 43 <211> 736 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (736)..(736) <223> Xaa can be any naturally occurring amino acid <400> 43 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val 50 55 60 Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn 65 70 75 80 Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg 85 90 95 Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu 100 105 110 Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val 115 120 125 Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp 130 135 140 Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly 145 150 155 160 Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met 165 170 175 Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala 180 185 190 Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met 195 200 205 Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly 210 215 220 Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His 225 230 235 240 Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His 245 250 255 Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly 260 265 270 Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp 275 280 285 Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr 290 295 300 Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val 305 310 315 320 Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala 325 330 335 Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly 340 345 350 Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His 355 360 365 Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly 370 375 380 Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe 385 390 395 400 Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile 405 410 415 Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly 420 425 430 Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr 435 440 445 Thr Trp Asn Ile Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala 450 455 460 Val Met Leu Met Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg 465 470 475 480 Lys Val Leu Met Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr 485 490 495 Gly Cys Pro Pro Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys 500 505 510 Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile 515 520 525 Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr 530 535 540 Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu 545 550 555 560 Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn 565 570 575 Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly 580 585 590 Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser 595 600 605 Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala 610 615 620 Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr 625 630 635 640 Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn 645 650 655 Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu 660 665 670 Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr 675 680 685 Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser 690 695 700 Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe 705 710 715 720 Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 725 730 735 <210> 44 <211> 269 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (269)..(269) <223> Xaa can be any naturally occurring amino acid <400> 44 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Ala 50 55 60 Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala 65 70 75 80 Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu 85 90 95 Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn 100 105 110 Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe 115 120 125 Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln 130 135 140 Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe 145 150 155 160 Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu 165 170 175 Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly 180 185 190 Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu 195 200 205 Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu 210 215 220 Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile 225 230 235 240 Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe 245 250 255 Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 260 265 <210> 45 <211> 262 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (262)..(262) <223> Xaa can be any naturally occurring amino acid <400> 45 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu 130 135 140 Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu 145 150 155 160 His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro 165 170 175 Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr 180 185 190 Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro 195 200 205 Ile Val Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile 210 215 220 Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly 225 230 235 240 Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr 245 250 255 Leu Leu Leu Ile Thr Xaa 260 <210> 46 <211> 635 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (635)..(635) <223> Xaa can be any naturally occurring amino acid <400> 46 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr 100 105 110 Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe 115 120 125 Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile 130 135 140 Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu 145 150 155 160 Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser 165 170 175 Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile 180 185 190 Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu 195 200 205 Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser 210 215 220 Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser 225 230 235 240 Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala 245 250 255 Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr 260 265 270 Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile 275 280 285 Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile 290 295 300 Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala 305 310 315 320 Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser 325 330 335 Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln 340 345 350 Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala 355 360 365 Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu 370 375 380 Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr 385 390 395 400 Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe 405 410 415 Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met 420 425 430 Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser 435 440 445 Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly 450 455 460 Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr 465 470 475 480 Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly 485 490 495 Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr 500 505 510 Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly 515 520 525 Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met 530 535 540 Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr 545 550 555 560 Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser 565 570 575 Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu 580 585 590 Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr 595 600 605 Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe 610 615 620 Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 625 630 635 <210> 47 <211> 515 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (515)..(515) <223> Xaa can be any naturally occurring amino acid <400> 47 Met Thr His Gln Ser His Ala Tyr His Met Val Lys Pro Ser Pro Trp 1 5 10 15 Pro Leu Thr Gly Ala Leu Ser Ala Leu Leu Met Thr Ser Gly Leu Ala 20 25 30 Met Trp Phe His Phe His Ser Met Thr Leu Leu Met Leu Gly Leu Leu 35 40 45 Thr Asn Thr Leu Thr Met Tyr Gln Trp Trp Arg Asp Val Thr Arg Glu 50 55 60 Ser Thr Tyr Gln Gly His His Thr Pro Pro Val Gln Lys Gly Leu Arg 65 70 75 80 Tyr Gly Met Ile Leu Phe Ile Thr Ser Glu Val Phe Phe Phe Ala Gly 85 90 95 Phe Phe Trp Ala Phe Tyr His Ser Ser Leu Ala Pro Thr Pro Gln Leu 100 105 110 Gly Gly His Trp Pro Pro Thr Gly Ile Thr Pro Leu Leu Gly Leu Leu 115 120 125 Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu 130 135 140 Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser 145 150 155 160 Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro 165 170 175 Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly 180 185 190 Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp 195 200 205 Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met 210 215 220 Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile 225 230 235 240 Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser 245 250 255 Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly 260 265 270 Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser 275 280 285 Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp 290 295 300 His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu 305 310 315 320 Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg 325 330 335 Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr 340 345 350 Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu 355 360 365 Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser 370 375 380 Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr 385 390 395 400 Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn 405 410 415 Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr 420 425 430 Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile 435 440 445 Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu 450 455 460 Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His 465 470 475 480 Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys 485 490 495 Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu 500 505 510 Ile Thr Xaa 515 <210> 48 <211> 543 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (543)..(543) <223> Xaa can be any naturally occurring amino acid <400> 48 Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu 1 5 10 15 Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu 20 25 30 Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg 35 40 45 Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu 50 55 60 Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln 65 70 75 80 Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile 85 90 95 Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu 100 105 110 Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe 115 120 125 Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn 130 135 140 Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala 145 150 155 160 Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met 165 170 175 Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val 180 185 190 Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn 195 200 205 Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr 210 215 220 Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile 225 230 235 240 Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile 245 250 255 Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala 260 265 270 Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn 275 280 285 Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr 290 295 300 Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala 305 310 315 320 Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu 325 330 335 Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu 340 345 350 Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu 355 360 365 Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu 370 375 380 Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser 385 390 395 400 Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro 405 410 415 Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val 420 425 430 Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn 435 440 445 Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met 450 455 460 Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly 465 470 475 480 Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp 485 490 495 Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr 500 505 510 Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu 515 520 525 Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 530 535 540 <210> 49 <211> 43 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (43)..(43) <223> Xaa can be any naturally occurring amino acid <400> 49 Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met 1 5 10 15 Leu Leu Thr Leu Phe Leu Ile Thr Gln Leu Lys Met Leu Asn Thr Asn 20 25 30 Tyr His Leu Pro Pro Ser Pro Leu Ala Ala Xaa 35 40 <210> 50 <211> 951 <212> RNA <213> Human <400> 50 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360 auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420 cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480 accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540 auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600 auccuagaaa ucgcugucac uuuccuagga cuucuaacag cccuagaccu caacuaccua 660 accaacaaac uuaaaauaaa auccccacua ugcacauuuu auuucuccaa cauacucgga 720 uucuacccua gcaucacaca ccgcacaauc cccuaucuag gccuucuuac gagccaaaac 780 cugccccuac uccuccuaga ccuaaccuga cuagaaaagc uauuaccuaa aacaauuuca 840 cagcaccaaa ucuccaccuc caucaucacc ucaacccaaa aaggcauaau uaaacuuuac 900 uuccucucuu ucuucuuccc acucauccua acccuacucc uaaucacaua a 951 <210> 51 <211> 951 <212> DNA <213> Artificial <220> <223> cDNA <400> 51 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360 attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420 ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480 accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540 atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600 atcctagaaa tcgctgtcac tttcctagga cttctaacag ccctagacct caactaccta 660 accaacaaac ttaaaataaa atccccacta tgcacatttt atttctccaa catactcgga 720 ttctacccta gcatcacaca ccgcacaatc ccctatctag gccttcttac gagccaaaac 780 ctgcccctac tcctcctaga cctaacctga ctagaaaagc tattacctaa aacaatttca 840 cagcaccaaa tctccacctc catcatcacc tcaacccaaa aaggcataat taaactttac 900 ttcctctctt tcttcttccc actcatccta accctactcc taatcacata a 951 <210> 52 <211> 317 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (317)..(317) <223> Xaa can be any naturally occurring amino acid <400> 52 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr 100 105 110 Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe 115 120 125 Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile 130 135 140 Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu 145 150 155 160 Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser 165 170 175 Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile 180 185 190 Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Thr Phe 195 200 205 Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu 210 215 220 Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly 225 230 235 240 Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu 245 250 255 Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu 260 265 270 Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile 275 280 285 Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe 290 295 300 Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 305 310 315

Claims (16)

  1. 서열번호 19로 나타낸 핵산 서열을 포함하는, 암과 연관된 단리된 미토콘드리아 융합 트랜스크립트.
  2. 제1항의 융합 트랜스크립트에 대응하거나 서열번호 35 나타낸 아미노산 서열을 갖는, 미토콘드리아 융합 단백질.
  3. 제1항의 융합 트랜스크립트를 인코딩하는, 단리된 미토콘드리아 DNA (mtDNA) 분자.
  4. 제3항에 있어서, 서열번호 3으로 나타낸 핵산 서열을 포함하는, 단리된 mtDNA 분자.
  5. 제1항에 따른 미토콘드리아 융합 트랜스크립트 또는 제3항 또는 제4항에 따른 mtDNA 분자의 적어도 일부에 상보적인 핵산 서열을 포함하고, 상기 일부가 스플라이스된 유전자의 접합점을 포함하는, 혼성화 프로브.
  6. 제1항에 따른 미토콘드리아 융합 트랜스크립트의 적어도 일부에 상보적인 핵산 서열을 갖고 상기 일부가 스플라이스된 유전자의 접합점을 포함하는 혼성화 프로브를 포함하는, 암과 연관된 적어도 하나의 미토콘드리아 융합 트랜스크립트의 존재를 검출하기 위한 조성물.
  7. 제3항에 따른 mtDNA 분자의 적어도 일부에 상보적인 핵산 서열을 갖고 상기 일부가 스플라이스된 유전자의 접합점을 포함하는 혼성화 프로브를 포함하는, 암과 연관된 적어도 하나의 비정상적인 mtDNA 분자의 존재를 검출하기 위한 조성물.
  8. 제6항에 있어서, 암이 전립선암, 고환암, 난소암, 유방암, 또는 대장암 중 하나 이상인, 조성물.
  9. 제7항에 있어서, 암이 전립선암, 고환암, 난소암, 유방암, 또는 대장암 중 하나 이상인, 조성물.
  10. 제8항 또는 제9에 있어서,
    상기 검출이,
    a) 적어도 하나의 프로브가 상보적 미토콘드리아 융합 트랜스크립트 또는 mtDNA에 혼성화도록 적어도 하나의 프로브를 사용하여 혼성화 반응을 수행하는 단계;
    b) 적어도 하나의 프로브에 혼성화된 트랜스크립트 또는 mtDNA의 양을 정량화시킴으로써 샘플 내의 적어도 하나의 미토콘드리아 융합 트랜스크립트 또는 mtDNA의 양을 정량화하는 단계; 및
    c) 샘플 내의 미토콘드리아 융합 트랜스크립트 또는 mtDNA의 양을 적어도 하나의 공지된 기준 값과 비교하는 단계를 수행하는, 조성물.
  11. 제10항에 있어서, 상기 검출은 진단 영상화 기술을 사용하여 수행되는, 조성물.
  12. 제11항에 있어서, 상기 진단 영상화 기술은 고처리량의 마이크로어레이 분석을 포함하는, 조성물.
  13. 제12항에 있어서, 상기 검출은 분지된(branched) DNA 기술을 사용하여 수행되는, 조성물.
  14. 제13항에 있어서, 상기 검출은 PCR을 사용하여 수행되는, 조성물.
  15. 제1항의 융합 트랜스크립트 또는 제3항 또는 제4항의 mtDNA 분자의 적어도 일부에 상보적이고 상기 일부가 스플라이스된 유전자의 접합점을 포함하는 적어도 하나의 혼성화 프로브를 포함하는, 포유동물에서 암의 존재를 검출하기 위한 분석을 수행하기 위한 키트.
  16. 제1항에 있어서, 암이 전립선암, 고환암, 난소암, 유방암, 대장암, 폐암, 흑색종 피부암 또는 이들의 조합인, 단리된 미토콘드리아 융합 트랜스크립트.
KR1020167036800A 2008-03-28 2009-03-27 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브 KR101819852B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US4061608P 2008-03-28 2008-03-28
US61/040,616 2008-03-28
PCT/CA2009/000351 WO2009117811A1 (en) 2008-03-28 2009-03-27 Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020107024109A Division KR101693387B1 (ko) 2008-03-28 2009-03-27 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브

Publications (2)

Publication Number Publication Date
KR20170004033A true KR20170004033A (ko) 2017-01-10
KR101819852B1 KR101819852B1 (ko) 2018-02-28

Family

ID=41112880

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020107024109A KR101693387B1 (ko) 2008-03-28 2009-03-27 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브
KR1020167036800A KR101819852B1 (ko) 2008-03-28 2009-03-27 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020107024109A KR101693387B1 (ko) 2008-03-28 2009-03-27 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브

Country Status (10)

Country Link
US (4) US20110172113A1 (ko)
EP (1) EP2274426B1 (ko)
JP (1) JP5938690B2 (ko)
KR (2) KR101693387B1 (ko)
CN (3) CN107011428B (ko)
AU (1) AU2009227935B2 (ko)
CA (2) CA3044262C (ko)
NZ (2) NZ602175A (ko)
SG (3) SG192453A1 (ko)
WO (1) WO2009117811A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009117811A1 (en) * 2008-03-28 2009-10-01 Genesis Genomics Inc. Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor
EP2411522B1 (en) * 2009-03-27 2017-09-06 MDNA Life Sciences Inc. Aberrant mitochondrial dna, associated fusion transcripts and translation products and hybridization probes therefor
WO2011106892A1 (en) * 2010-03-01 2011-09-09 Mitomics Inc. Uv associated mtdna fusion transcripts and methods and uses thereof
US9850296B2 (en) 2010-08-10 2017-12-26 Ecole Polytechnique Federale De Lausanne (Epfl) Erythrocyte-binding therapeutics
JP6017422B2 (ja) 2010-08-10 2016-11-02 エコール・ポリテクニーク・フェデラル・ドゥ・ローザンヌ(ウペエフエル)Ecole Polytechnique Federale de Lausanne (EPFL) 赤血球結合療法
US9517257B2 (en) 2010-08-10 2016-12-13 Ecole Polytechnique Federale De Lausanne (Epfl) Erythrocyte-binding therapeutics
US10946079B2 (en) 2014-02-21 2021-03-16 Ecole Polytechnique Federale De Lausanne Glycotargeting therapeutics
US10953101B2 (en) 2014-02-21 2021-03-23 École Polytechnique Fédérale De Lausanne (Epfl) Glycotargeting therapeutics
JP6744227B2 (ja) 2014-02-21 2020-08-19 エコール・ポリテクニーク・フェデラル・ドゥ・ローザンヌ(ウペエフエル)Ecole Polytechnique Federale de Lausanne (EPFL) 糖標的化治療剤
US10046056B2 (en) 2014-02-21 2018-08-14 École Polytechnique Fédérale De Lausanne (Epfl) Glycotargeting therapeutics
AU2017280210A1 (en) * 2016-06-22 2019-01-24 Degen Zhuo Method and kit for detecting fusion transcripts
WO2018144782A1 (en) * 2017-02-01 2018-08-09 The Translational Genomics Research Institute Methods of detecting somatic and germline variants in impure tumors
WO2018232176A1 (en) 2017-06-16 2018-12-20 The University Of Chicago Compositions and methods for inducing immune tolerance
WO2019191079A1 (en) * 2018-03-26 2019-10-03 The University Of Chicago Methods and compositions for targeting liver and lymph node sinusoidal endothelial cell c-type lectin (lsectin)
CN117384269A (zh) * 2023-09-21 2024-01-12 南方医科大学南方医院 短肽mfrlp及其在制备动脉重塑相关疾病药物中的应用

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154598B (nl) * 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
US3817837A (en) * 1971-05-14 1974-06-18 Syva Corp Enzyme amplification assay
US3939350A (en) * 1974-04-29 1976-02-17 Board Of Trustees Of The Leland Stanford Junior University Fluorescent immunoassay employing total reflection for activation
US3996345A (en) * 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4277437A (en) * 1978-04-05 1981-07-07 Syva Company Kit for carrying out chemically induced fluorescence immunoassay
US4275149A (en) * 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4366241A (en) * 1980-08-07 1982-12-28 Syva Company Concentrating zone method in heterogeneous immunoassays
US5807522A (en) * 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US6605433B1 (en) * 1998-08-20 2003-08-12 The Johns Hopkins University Mitochondrial dosimeter
US6203990B1 (en) * 1998-11-06 2001-03-20 Mitokor Method and system for pattern analysis, such as for analyzing oligonucleotide primer extension assay products
US6933120B2 (en) * 2000-06-20 2005-08-23 Michael D. Seidman Method of determining biological/molecular age
CA2450403A1 (en) * 2001-06-11 2002-12-19 1304854 Ontario Ltd. Complete mitochondrial genome sequences as a diagnostic tool for the health sciences
US20030162174A1 (en) * 2001-06-11 2003-08-28 Sutherland John W. Detecting nucleic acid deletion sequences
US20050026167A1 (en) * 2001-06-11 2005-02-03 Mark Birch-Machin Complete mitochondrial genome sequences as a diagnostic tool for the health sciences
GB2380194B (en) * 2001-10-01 2005-06-22 Roger Michael Marchbanks A mitochondrial mutation associated with schizophrenia and increased oxidative stress
US20060051796A1 (en) * 2004-09-09 2006-03-09 Inga Boell Real time PCR with the addition of pyrophosphatase
KR101363032B1 (ko) * 2005-04-18 2014-02-13 미토믹스 인크. 일광 노출, 전립선암 및 다른 암의 검출용 진단 도구로서미토콘드리아 돌연변이 및 전위
US20070134678A1 (en) * 2005-12-12 2007-06-14 Rees Dianne M Comparative genome hybridization of organelle genomes
CN101874119B (zh) 2007-09-26 2015-01-28 米托米克斯公司 3.4kb线粒体DNA缺失用于检测癌症
WO2009117811A1 (en) 2008-03-28 2009-10-01 Genesis Genomics Inc. Aberrant mitochondrial dna, associated fusion transcripts and hybridization probes therefor
EP2411522B1 (en) 2009-03-27 2017-09-06 MDNA Life Sciences Inc. Aberrant mitochondrial dna, associated fusion transcripts and translation products and hybridization probes therefor
WO2011106892A1 (en) * 2010-03-01 2011-09-09 Mitomics Inc. Uv associated mtdna fusion transcripts and methods and uses thereof

Also Published As

Publication number Publication date
SG10201400985RA (en) 2014-05-29
CN107011428B (zh) 2022-02-25
KR101693387B1 (ko) 2017-01-05
US10266899B2 (en) 2019-04-23
AU2009227935A1 (en) 2009-10-01
US20130059299A1 (en) 2013-03-07
EP2274426A4 (en) 2011-11-16
AU2009227935B2 (en) 2015-07-09
SG174514A1 (en) 2011-10-28
KR20110004860A (ko) 2011-01-14
CA2719718C (en) 2019-07-02
JP2011515091A (ja) 2011-05-19
CN102016039B (zh) 2017-06-09
US20170152567A1 (en) 2017-06-01
CA3044262A1 (en) 2009-10-01
JP5938690B2 (ja) 2016-06-22
SG192453A1 (en) 2013-08-30
KR101819852B1 (ko) 2018-02-28
CN102388140B (zh) 2015-07-08
CA2719718A1 (en) 2009-10-01
EP2274426A1 (en) 2011-01-19
WO2009117811A1 (en) 2009-10-01
US20110172113A1 (en) 2011-07-14
EP2274426B1 (en) 2016-11-16
US20190382846A1 (en) 2019-12-19
NZ588658A (en) 2012-10-26
US8715960B2 (en) 2014-05-06
CN107011428A (zh) 2017-08-04
CN102388140A (zh) 2012-03-21
CA3044262C (en) 2023-02-28
NZ602175A (en) 2014-03-28
CN102016039A (zh) 2011-04-13

Similar Documents

Publication Publication Date Title
KR101819852B1 (ko) 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브
KR101074841B1 (ko) 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 진단용키트 및 칩
WO1995016793A1 (en) Compositions and methods relating to dna mismatch repair genes
CN110628894A (zh) 用于帕金森病基因突变检测的靶向捕获测序试剂盒及其应用
KR101720555B1 (ko) 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침
KR100892587B1 (ko) 대장암 특이적 발현감소 유전자의 메틸화된 프로모터를함유하는 암 진단용 조성물 및 그 용도
KR20130057760A (ko) 유방암 또는 난소암의 유전성 소인 예측에 유용한 brca1, brca2 유전자 돌연변이
EP1717320A1 (en) Identification of human gene sequences of cancer antigens expressed in metastatic carcinoma and involved in metastasis formation, and their use in cancer diagnosis, prognosis and therapy
JP2006166789A (ja) 癌の新規診断方法
KR20130100075A (ko) 유방암 또는 난소암의 유전성 소인 예측에 유용한 brca2 유전자 돌연변이
KR20110036553A (ko) 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 진단용 키트 및 칩
KR20110036554A (ko) 방광암 특이적 메틸화 마커 유전자를 이용한 방광암 진단용 키트 및 칩

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant