KR101720555B1

KR101720555B1 - 이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침

Info

Publication number: KR101720555B1
Application number: KR1020117025261A
Authority: KR
Inventors: 라이언 파르; 가브리엘 다쿠보; 앤드류 하보틀; 브라이언 레귤리; 제니퍼 크리드; 케리 로빈슨; 다니엘 클라인
Original assignee: 엠디엔에이 라이프 사이언시즈 인코퍼레이티드
Priority date: 2009-03-27
Filing date: 2010-03-29
Publication date: 2017-03-29
Also published as: AU2010234238A1; EP3272871A1; EP2411522A1; RU2011137486A; JP2012521745A; EP3272871B1; EP2411522B1; AU2010234238B2; JP5734947B2; KR20140014360A; EP2411522A4; WO2010115261A1

Abstract

본 발명은 암을 예견, 진단 및/또는 모니터하기 위한 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자, 및 생성되는 번역 산물(단백질)을 제공한다. 본 발명의 방법에 사용하기 위한 상기에 상보성인 하이브리드화 탐침을 또한 제공한다.

Description

이상 미토콘드리아 디엔에이, 관련된 융합 전사물 및 번역 산물 및 이에 대한 하이브리드화 탐침{ABERRANT MITOCHONDRIAL DNA, ASSOCIATED FUSION TRANSCRIPTS AND TRANSLATION PRODUCTS AND HYBRIDIZATION PROBES THEREFOR}

선행 출원에 대한 상호 참조

본 출원은 2009년 3월 27일자로 출원된 PCT 출원 제 PCT/CA2009/000351 호의 일부 계속 출원이며, 이는 2008년 3월 28일자로 출원된 미국 가 출원 제 61/040,616 호로부터 우선권을 청구한다. 상기와 같은 선행 출원들의 전체 내용은 본 발명에 참고로 인용된다.

발명의 분야

본 발명은 미토콘드리아 유전체학 및 단백질체학의 분야에 관한 것이다. 하나의 태양에서, 본 발명은 미토콘드리아 게놈 융합 전사물 및 번역 산물뿐만 아니라 이에 하이브리드화하는 탐침의 확인 및 용도에 관한 것이다.

미토콘드리아 게놈

미토콘드리아 게놈은 핵산의 작지만 중요한 서열이다. 미토콘드리아 DNA, 또는 "mtDNA"는 33억 bp(반수체)의 광대한 핵 게놈과 대조적으로 16,569 핵산 염기쌍(bp)의 작은 게놈(Anderson et al., 1981; Andrews et al., 1999)을 포함한다. 그의 유전자 보체는 그의 핵 세포 짝의 경우보다 실질적으로 더 적다(0.0005%). 그러나, 개별적인 세포들은 어디에서나 특정한 세포 작용에 따라 10³ 내지 10⁴ 개의 미토콘드리아를 가지고 있다(Singh and Modica-Napolitano 2002). 상기 핵과 미토콘드리아 게놈 간에는 연통 또는 화학적 신호전달이 통상적으로 일어난다(Sherratt et al., 1997). 더욱이, 특정 핵 성분들이 미토콘드리아 서열의 유지 및 보전에 기여한다(Croteau et al., 1999). 주어진 개체 중의 모든 mtDNA 게놈들은 일단 수정이 일어나면 난자 내에서 미토콘드리아의 클론 확장으로 인해 동일하다. 그러나, 돌연변이 유발 사건들은 체세포 돌연변이로서 반영되는 서열 다양성을 유도할 수 있다. 이러한 돌연변이는 이종조직성으로서 공지된 조건에서 몸 전체를 통해 상이한 조직에 축적될 수도 있다.

미토콘드리아 프로테옴

약 3,000 개의 핵 유전자가 미토콘드리아를 구성하고, 작동시키고 유지시키는데 필요하며, 이들 중 단지 37 개만이 미토콘드리아 게놈에 의해 암호화되는데, 이는 핵 유전자 좌에 대한 강한 미토콘드리아 의존성을 가리킨다. 상기 미토콘드리아 게놈은 24 개 유전자의 보체를 암호화하며, 전자 전달에 지극히 중요한 나머지 13 개 유전자의 정확한 번역을 보장하는 2rRNA 및 22tRNA를 포함한다(도 1 참조). 상기 미토콘드리아 게놈은 상기 미토콘드리아 게놈에 의해 공급된 13 개 폴리펩타이드 이외에, 상기 지극히 중요한 작용에 필요한 산화 및 환원 반응을 수행하기 위해 70 개의 핵 암호화된 단백질에 의존한다. 핵 및 미토콘드리아 단백질은 모두 내부 미토콘드리아 막에 걸쳐 있는 복합체들을 형성하며 집합적으로, 세포 대사에 필요한 화학 연료 아데노신 트라이포스페이트 또는 ATP의 80 내지 90%를 생성시킨다. 에너지 생산 이외에, 미토콘드리아는 다른 대사 경로에도 또한 중추적인 역할을 한다. 상기 미토콘드리아의 중요한 기능은 세포 사 또는 세포사멸의 중재이다(Green and Kroemer, 2005 참조). 본질적으로, 외부 미토콘드리아 막, 또는 또한 내부 미토콘드리아 막을 또한 투과성으로 만드는 신호 경로들이 존재한다. 특정한 미토콘드리아 단백질이 시토졸 내로 방출되면, 비가역적인 세포 사에 시동이 걸린다. 이러한 과정은 일부 미토콘드리아 단백질들이 갖는 다기능 역할을 강조한다. 이들 다중작업 단백질들은 교체 기능을 가질 수도 있는 다른 미토콘드리아 단백질들이 또한 존재함을 암시한다.

미토콘드리아 융합 전사체 /프로테옴

미토콘드리아 게놈은 원형의, 인트론이 없는 DNA 분자라는 점에서 특이하다. 상기 게놈에는 특정한 길이의 서열들과 접하고 있는 반복 동기들이 산재하여 있다. 이들 반복부 사이의 서열은 잘 이해되지 않은 상황 하에서 결실되기 쉽다. 상기 미토콘드리아 게놈 중의 반복부의 번호가 제공되는 경우, 다수의 가능한 결실들이 존재한다. 가장 잘 알려진 예가 4977 "공통 결실"이다. 상기 결실은 여러 가지 소문난 병 및 질병들과 관련되었으며 노화에 따라 빈도가 증가하는 것으로 여겨진다(Dai et al., 2004; Ro et al., 2003; Barron et al., 2001; Lewis et al., 2000; Muller-Hocker, 1998; Porteous et al., 1988)(도 4). 미토콘드리아 게놈학 분야의 현재의 생각은 미토콘드리아 결실은 단지 반응성 산소 종 및 UVR과 같은 작용제들에 의한 상기 미토콘드리아 게놈에 대한 손상의 유해 부산물이라는 것이다(Krishnan et al 2008, Nature Genetics). 더욱이, 높은 수준의 mtDNA 결실은 세포 호흡에 필요한 유전자 서열의 누락의 결과로서 ATP 형태의 에너지를 생산하는 세포의 능력에 심한 영향을 미칠 수 있음이 인식되고 있지만, 이들 결실된 미토콘드리아 분자가, 하부 경로의 요소일 수도 있고 의도하는 기능 역할을 가지며 가능하게는 상기 미토콘드리아의 인지된 유전자의 또 다른 천연 형태로서 보다 적합하게 간주될 수 있을 것으로는 예상되지 않는다.

mtDNA의 서열 역학은 중요한 진단 도구이다. mtDNA의 돌연변이는 종종 발병의 예비 지표이다. 예를 들어, 미토콘드리아 게놈 중의 점 돌연변이는 전립선 중의 종양 유전자 좌의 특징인 것으로 입증되었다. 이러한 성향은 종양 조직에 인접한 및 상기 조직에서 떨어져 있는 정상으로 보이는 조직까지 확장된다(Parr et al. 2006). 이는 미토콘드리아 돌연변이가 악성 형질전환 경로의 초기에 존재함을 암시한다.

예를 들어, 3.4 kb 미토콘드리아 결실의 빈도는 양성과 악성 전립선 조직을 식별하는데 탁월한 유용성을 갖는다(Maki et al., 2008). 더욱 또한, 상기 질병 관련된 결실, 및 상기 분자의 재-폐쇄를 통해 생성된 신규 서열에 대한 연구는 다수의 개방 판독 프레임들을 확인하며, 이는 독특한 미토콘드리아 융합 단백질들의 가능성을 암시한다.

미토콘드리아 융합 전사물은 앞서 문헌에서, 먼저 대두 중에서(Morgens et al. 1984) 및 이어서 나중에 희귀 신경근 장애인 컨즈-세이레 증후군에 관한 2 개의 특허(Nakase et al 1990)에서 보고되었다. 중요하게는, 이들 전사물은 어떠한 인간 암과도 관련이 있지 않은(또는 상기에 관해 조사되지 않은) 것으로 밝혀졌다.

핵 융합 프로테옴

융합 단백질 및 암에 대한 이의 생성 효과에 대한 중요한 핵 선행이 존재한다. 핵 MLL 유전자 짝 전좌는 국소이성화효소 II를 표적화하는 작용제에 의한 치료에 따른 고 위험 급성 백혈병 및 치료 관련된 급성 골수성 백혈병과 관련하여 잘 확립되어 있다(Libura et al., 2005). 현재 인간 MLL 유전자의 대략 50 개의 전좌가 이들 암과 관련되는 것으로 알려져 있다(Meyer et al., 2005). 이들 돌연변이에 대한 중지점은, 부분적인 직렬 중복이든 전좌든 간에, 이들 사건의 대부분의 경우, Alu I와 같은 핵 특이적인 반복성 동기 내에 존재한다. 이들 돌연변이의 대부분은 상호 전좌이며(84%) 약 40 개의 상이한 유전자를 포함한다(Libura et al. 2005).

악성 질병의 과정에 영향을 미치는 상기 재배열 중 일부로부터 생성되는 공지된 작용성 키메릭 단백질들이 존재한다. 예를 들어, MLL-ENL로부터의 단백질을 발현하는 쥐 세포는 에토포시드에의 노출에 생존하는 세포에서 염색체 이상의 보급을 가속화한다(Eguchi et al., 2006). 특히 흥미로운 것은 MLL-SMAP1 및 상호 SMAP1-MLL이다. SMAP1은 칼슘과 결합하며 그 자체로서 세포 신호전달 및 수송에 참여한다.

미토콘드리아 융합 단백질들은, 특히 미토콘드리아 및 미토콘드리아 단백질이 신호전달 및 세포사멸에서 유사한 역할을 수행하기 때문에, 핵 융합 단백질들과 유사한 특성을 갖는 것으로 추정될 수 있다.

본 발명의 목적은 이상 미토콘드리아 DNA, 관련된 융합 전사물 및 번역 산물, 및 이에 대한 하이브리드화 탐침을 제공하는 것이다.

본 발명의 하나의 태양에 따라, 암과 관련된 단리된 미토콘드리아 융합 전사물을 제공한다.

본 발명의 또 다른 태양에 따라, 본 발명의 융합 전사물을 암호화하는 단리된 mtDNA를 제공한다.

본 발명의 또 다른 태양에 따라, 본 발명의 미토콘드리아 융합 전사물 또는 mtDNA의 적어도 일부에 상보성인 핵산 서열을 갖는 하이브리드화 탐침을 제공한다.

본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 본 발명에 따른 미토콘드리아 융합 전사물의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 암과 관련된 하나 이상의 미토콘드리아 융합 전사물의 존재를 분석함을 포함한다.

본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 본 발명에 따른 mtDNA의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 암과 관련된 하나 이상의 이상 mtDNA의 존재를 분석함을 포함한다.

본 발명의 또 다른 태양에 따라, 포유동물의 암의 존재를 검출하기 위한 분석을 수행하기 위한 키트를 제공하며, 상기 키트는 본 발명의 융합 전사물 또는 mtDNA의 적어도 일부에 상보성인 하나 이상의 하이브리드화 탐침을 포함한다.

본 발명의 또 다른 태양에 따라, 미토콘드리아 융합 단백질을 제공하며, 상기 단백질은 본 발명의 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는다.

본 발명의 또 다른 태양에 따라, 포유동물의 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함하고, 상기 단백질은 본 발명에 따른 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는다.

본 발명은 미토콘드리아 DNA 중 돌연변이에 상응하는 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는, 단리된 미토콘드리아 융합 단백질을 제공한다.

또한 본 발명은 포유동물에게서 암을 검출하는 방법으로서, 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함하고, 상기 단백질이 DNA 중 돌연변이에 상응하는 미토콘드리아 융합 전사물의 번역으로부터 생성되는 아미노산 서열을 갖는 방법을 제공한다.

본 발명은 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자 및 생성되는 번역 산물을 이용하여 암를 예견하거나 암의 진단 또는 모니터가 가능한 효과가 있다.

또한 본 발명은 하이브리드화 탐침을 이용하여 융합 전사물 및 관련된 mtDNA 분자를 검출할 수 있는 효과가 있다.

이제 본 발명의 실시태양들을 첨부된 도면을 단지 참고로 하여 예로서 개시할 것이며, 도면에서:
도 1은 미토콘드리아 단백질 암호화 유전자들을 나타내는 도해이다.
도 2는 3.4 kb 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 3은 4977 kb 공통 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 4는 상기 mt게놈으로부터의 3.4 kb 분절의 상실에 의해 촉발된 유방 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다.
도 5a 및 5b는 유전자들의 연접(splicing) 전후의 미토콘드리아 DNA 영역의 예를 나타낸다.
도 6a 내지 6g는 결장직장 암 종양의 확인에서 본 발명의 전사물 2, 3, 8, 9, 10, 11 및 12의 결과를 예시한다.
도 7a 내지 7d는 폐암 종양의 확인에서 본 발명의 전사물 6, 8, 10 및 20의 결과를 예시한다.
도 8a 내지 8g는 흑색종의 확인에서 본 발명의 전사물 6, 10, 11, 14, 15, 16 및 20의 결과를 예시한다.
도 9a 내지 9h는 난소암의 확인에서 본 발명의 전사물 1, 2, 3, 6, 11, 12, 15 및 20의 결과를 예시한다.
도 10 내지 18은 고환 암의 확인에서 본 발명의 전사물 2, 3, 4, 11, 12, 13, 15, 16 및 20의 결과를 예시한다.
도 19는 융합 단백질 발견 단계 중에 수행된 RWPE1 및 WPE1-NA22 세포 주의 시토졸 및 미토콘드리아 분획의 SDS PAGE 젤을 예시한다.
도 20a는 펩타이드 ILYMTDEVNDPSLTIK 및 STPYECGFDPMSP를 기본으로 하는 융합 전사물 P0026의 확인된 단백질을 예시한다.
도 20b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 5에서 확인된 야생형 CO2 단백질을 예시한다.
도 21a는 펩타이드 KGPNVVGPYGLLQPFADAMK, YDQLMHLLWK 및 LITTQQWLIK를 기본으로 하는 융합 전사물 P0062의 확인된 단백질을 예시한다.
도 21b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 젤 조각 5에서 확인된 ND1의 확인된 펩타이드를 예시한다.
도 22는 펩타이드 KGPNVVGPYGLLQPFADAMK 및 WAIIEEFTK를 기본으로 하는 융합 전사물 P0064의 확인된 단백질을 예시한다.
도 23a는 펩타이드 KGPNVVGPYGLLQPFADAMK, VFSWLATLHGSNMK 및 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK를 기본으로 하는 융합 전사물 P0176의 확인된 단백질을 예시한다.
도 23b는 인간(SwissProt) 데이터베이스의 검색 후에 도 19의 미토콘드리아 NA22 세포 주 젤 조각 4에서 확인된 야생형 CO1 단백질을 예시한다.
도 24a 내지 24d는 각각 융합 전사물 P0026, P0062, P0064 및 P0176의 정량적인 측정의 결과를 예시한다.

본 발명은 암의 예견, 진단 및/또는 모니터에 유용한 신규의 미토콘드리아 융합 전사물, 모 돌연변이된 mtDNA 분자, 및 생성되는 번역 산물을 제공한다. 본 발명은 또한 융합 전사물 및 관련된 mtDNA 분자의 검출을 위한 하이브리드화 탐침 및 상기와 같은 탐침의 용도를 제공한다.

정의

달리 나타내지 않는 한, 본 발명에 사용된 모든 기술 및 과학 용어들은 본 발명이 속하는 분야의 통상적인 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다.

"포함하다", "포함된" 또는 "포함하는"이란 용어를 본 설명에 사용할 수 있다. 본 발명(명세서 및/또는 청구의 범위 포함)에 사용된 바와 같이, 이들 용어는 진술된 특징, 정수, 단계 또는 성분들의 존재를 명시하는 바와 같이 해석해야 하며, 관련 분야의 통상적인 숙련가에게 자명한 바와 같은 하나 이상의 다른 특징, 정수, 단계, 성분 또는 그의 그룹을 제외하는 것으로서 해석해서는 안 된다.

본 발명에 사용된 바와 같이, "이상" 또는 "돌연변이"는 융합 전사물을 생성시키는 야생형 미토콘드리아 DNA 서열의 임의의 변경을 포함하며, 비 제한적으로 삽입, 전좌, 결실, 중복, 재조합, 재배열 또는 이들의 조합을 포함한다.

본 발명에 정의된 바와 같이, "생물학적 샘플"은 관심 분자를 수득할 수 있는 세포를 함유하는 조직 또는 체액을 지칭한다. 예를 들어, 상기 생물학적 샘플은 전립선, 유방, 결장직장, 폐 및 피부와 같은 조직으로부터, 또는 혈액, 타액, 뇌척수액, 객담, 뇨, 점액, 활액, 복막 액, 양수 등으로부터 유래할 수 있다. 상기 생물학적 샘플은 외과적 시편 또는 생검 시편일 수 있다. 상기 생물학적 샘플을 공급원으로부터 수득된 대로 바로 또는 상기 샘플의 특징을 변경시키기 위한 전-처리에 이어서 사용할 수 있다. 따라서, 상기 생물학적 샘플을 사용 전에, 예를 들어 혈액으로부터 혈장 또는 혈청을 제조하고, 세포를 파괴하고, 고형 물질로부터 액체를 제조하고, 점성 유체를 희석하고, 액체를 여과하고, 액체를 증류시키고, 액체를 농축시키고, 방해 성분들을 불활성화시키고, 시약을 첨가함 등에 의해 전-처리할 수 있다.

"연속적인" 전사물은 판독 프레임을 양쪽 연접된 유전자들의 시작에서부터 단부까지 유지하는 융합 전사물이다. "단부" 전사물은 두 번째 연접된 유전자의 원래 종결 코돈 앞에 조기 종결 코돈을 생성시키는 융합 전사물이다.

본 발명에 사용된 바와 같이, "미토콘드리아 DNA" 또는 "mtDNA"는 미토콘드리아 중에 존재하는 DNA이다.

본 발명에 사용된 바와 같이, "미토콘드리아 융합 단백질" 또는 "융합 단백질"이란 표현은 돌연변이된 미토콘드리아 DNA의 전사 및 번역에 의해 생성된 펩타이드 산물을 지칭하며, 여기에서 상기와 같은 돌연변이는 결실 또는 다른 "대규모" 미토콘드리아 DNA 재배열을 포함한다. 또한, 또는 한편으로, 인-프레임 단백질은 상기 서열 내에 또 다른 초기 및 종결 코돈으로부터 번역될 수도 있다.

본 발명에 사용된 바와 같이, "미토콘드리아 융합 전사물" 또는 "융합 전사물"이란 표현은 돌연변이된 미토콘드리아 DNA 서열의 전사의 결과로서 생성된 RNA 전사 산물을 지칭하며, 여기에서 상기와 같은 돌연변이는 결실 및 다른 대규모 미토콘드리아 DNA 재배열을 포함할 수 있다.

본 발명에 사용된 바와 같이, "미토콘드리아 번역 산물" 또는 "번역 산물"이란 표현은 펩타이드, 폴리펩타이드 및 단백질을 포함하여 미토콘드리아 융합 전사물로부터 유도된 임의의 아미노산 쇄를 지칭한다. "미토콘드리아 번역 산물"이 상기 정의한 바와 같이, "융합 단백질"을 포함함을 알 것이다.

컴퓨터 분석 및 서열 표적화

상기 논의된 바와 같이, 미토콘드리아 융합 전사물은 대두(Morgens et al. 1984) 및 희귀 신경근 질환을 앓고 있는 인간(Nakase et al 1990)에서 보고되었다. 그러나 인간 암과 관련된 융합 전사물들은 개시되지 않았다.

암과 관련된 인간 미토콘드리아 게놈의 대규모 결실을 지도화함으로써 얻은 지식, 상기 결실의 높은 빈도의 관찰, 및 또 다른 유기체 및 또 다른 질병 유형에서 전사적으로 활성인 돌연변이된 mtDNA 분자의 증거를 사용하여, 본 발명자들은 상기와 같은 결실이 암과 관련이 있으므로 상기 DNA 분자 및 손상 및 복원 과정 외에 중요성을 가질 수도 있다는 가설을 세웠다. 이러한 가설을 시험하기 위해서, 다수의 잠재적인 결실 부위들을 암시하는 반복 요소들에 특이적인 상기 미토콘드리아 게놈의 컴퓨터 분석을 수행하였다. 비-인접 또는 비-직렬 배치를 갖는 미토콘드리아 서열 중의 독특한 반복부를 확인하는 상기 초기 단계에 이어서, 필터를 적용하여, 상기 DNA 분자의 결실 사건이 개시될 때 개방 판독 프레임(ORF)을 갖는 융합된 DNA 서열을 생성하도록 재폐쇄 또는 재연결하는 듯하고 따라서 상기 미토콘드리아 전사 기구에 의해 전사될 수 있는 반복부들을 확인하였다. 이어서 이들 분자 중 18 개의 부분집합을, 이들이 인간의 타고난 생물학적 상태로 존재하는지; 이들이 폴리아데닐화되고 따라서 단백질 합성으로 진행할 것이 예상되는지; 이들이 암과 관련성을 갖는지를 조사하기 위한 표적화를 위해 선택하였다. 이들 조사로부터의 결과는 3 개의 질문 모두에 대한 긍정을 입증하였으며 이를 이후에 개시한다.

게놈 돌연변이

미토콘드리아 DNA(mtDNA) 역학은 중요한 진단 도구이다. mtDNA의 돌연변이는 종종 발병의 예비 지표이며 질병 개시와 관련된 위험 인자들을 가리키는 생물마커로서 작용할 수도 있다. 본 발명에 따라, 상기 미토콘드리아 게놈의 돌연변이는 암과 관련된 융합 전사물을 생성시킨다. 따라서, 암의 검출, 진단 및 모니터를 위한 상기와 같은 전사물을 암호화하는 mtDNA 및 그에 대한 탐침의 용도를 제공한다.

당해 분야의 숙련가는 본 발명의 방법에 사용하기 위한 mtDNA 분자가 천연 돌연변이체의 단리를 통해 유도되거나 또는 본 발명에 개시된 융합 전사물들 중 어느 하나의 상보적인 서열을 기본으로 할 수 있음을 알 것이다. 예시적인 mtDNA 서열 및 융합 전사물들은 출원인의 동시 계류중인 미국 출원 제 61/040,616 호 및 공개된 PCT 출원 제 PCT/CA2009/000351 호(WO 2009/117811로서 공개됨)에 개시되어 있다.

돌연변이 게놈 서열의 검출

본 발명에 따른 돌연변이 mtDNA 서열은 융합 전사물을 생성시키는 임의의 변경을 포함할 수 있다. 상기와 같은 변경의 비 제한적인 예로는 삽입, 전좌, 결실, 재조합, 재배열 또는 이들의 조합이 있다. 상기 변경 또는 변화가 크기에 있어서 단지 수 개의 염기에서부터 수 킬로 염기까지 매우 다양할 수 있지만, 바람직하게는 상기 변경은 상당한 결실 또는 다른 대규모 게놈 이상을 생성시킨다.

상기와 같은 돌연변이의 존재를 검출하기 위한 DNA의 추출은 당해 분야에서 인정된 방법들의 사용, 이어서 상기 미토콘드리아 게놈의 전부 또는 부분의 증폭에 의해 일어날 수 있으며, 문헌[Current Protocols in Molecular Biology]에 개시된 바와 같이, 상기 미토콘드리아 게놈의 서열화를 포함할 수도 있다.

상기 돌연변이의 검출 단계를 당해 분야에 공지된 임의의 기법으로부터 선택할 수 있다. 예를 들어 mtDNA 분석은 상기 mtDNA 서열화, PCR에 의한 mtDNA 증폭, 서던, 노던, 웨스턴 사우스-웨스턴 블럿 하이브리드화, 변성 HPLC, 미세배열, 바이오칩 또는 유전자 칩에의 하이브리드화, 분자 마커 분석, 바이오센서, 용융 온도 프로파일링 또는 이들 중 임의의 것들의 조합을 포함할 수 있다.

미토콘드리아 DNA의 서열화에 적합한 임의의 수단을 사용할 수도 있다. 바람직하게는, mtDNA를 서열화에 앞서 PCR에 의해 증폭시킨다. PCR 방법은 당해 분야에 널리 공지되어 있으며 문헌[Mullis and Faloona, 1987, Methods Enzymol., 155:335]에 개시된 바와 같이 수행될 수 있다. PCR 산물을 직접 서열화하거나 또는 벡터 내로 클로닝하고 이어서 세균 숙주 내에 넣을 수 있다. DNA 서열화 방법의 예가 문헌[Brumley, R.L. Jr. and Smith, L.M., 1991, 수평 초박 젤 전기영동에 의한 신속한 DNA 서열화, Nucleic Acids Res. 19:4121-4126] 및 [Luckey, J.A., et al., 1993, 모세관 젤 전기영동에 의한 고속 DNA 서열화, Methods Enzymol. 218:154-172]에서 발견된다. PCR의 병용 및 mtDNA의 서열화는 문헌[Hopgood, R., et al., 1992, 직접 PCT 산물로부터 인간 mtDNA의 자동화된 서열화 전략, Biotechniques 13:82-92] 및 [Tanaka, M. et al., 1996, mtDNA의 자동화된 서열화, Methods Enzymol. 264:407-421]에 개시되어 있다.

다양한 프라이머들의 제조를 위한 적합한 서열의 선택 방법이 또한 당해 분야에 공지되어 있다. 예를 들어, 상기 프라이머를 상업적으로 입수할 수 있는 장비, 예를 들어 어플라이드 바이오시스템스 유에스에이 인코포레이티드(Applied Biosystems USA Inc.)(Foster City, CA), 듀퐁(Wilmington, Del.) 또는 밀리젠(Milligen)(Bedford, Mass.)으로부터 입수할 수 있는 것을 사용하여 통상적인 고상 합성으로 제조할 수 있다.

본 발명의 하나의 태양에 따라, 후보 게놈 서열들을 결정하기 위해서, 먼저 서열 결실의 연결 점(junction point)을 확인한다. 서열 결실은 주로 5' 및 3' 단부에서 결실되는 서열에 인접한 직접 및 간접 반복 요소들에 의해 확인된다. 상기 게놈으로부터 뉴클레오타이드의 구획을 제거한 다음 상기 게놈을 연결시켜 새로운 연결 점을 생성시킨다.

상기 연결 점의 확인 시, 상기 연결 점에 인접하고 있는 유전자들의 뉴클레오타이드들을, 연접된 유전자의 확인을 위해 측정한다. 전형적으로 상기 연접된 유전자는 상기 첫 번째 유전자로부터의 개시 코돈 및 두 번째 유전자의 종결 코돈을 포함하며, 연속적인 전사물, 즉 상기 2 개의 연접된 유전자 모두의 시작에서부터 단부까지 판독 프레임을 유지하는 것으로서 발현될 수 있다. 재배열된 서열들이 상기 연접 부위에서 재결합될 때 개방 판독 프레임(ORF)을 갖는 것으로 발견된 일부 공지된 미토콘드리아 결실들을 표 1에 제공한다.

본 발명의 방법에 사용하기 위한 예시적인 mtDNA 분자들을 하기에 제공한다. 이들 mtDNA는 공지된 미토콘드리아 게놈(서열식별번호: 1)의 변경을 기본으로 하며 융합물 또는 "FUS"라는 명칭이 지정되었고, 여기에서 A:B는 첫 번째 연접된 유전자의 최종 미토콘드리아 뉴클레오타이드와 두 번째 연접된 유전자의 첫 번째 미토콘드리아 뉴클레오타이드 간의 연결 점을 나타낸다. 상기 연접된 유전자의 확인을 괄호 안에 제공하며, 이어서 상응하는 서열 식별자를 제공한다. 하기에 제공되는 경우, (AltMet) 및 (OrigMet)는 각각 교체 및 원래의 번역 출발 부위들을 지칭한다.

FUS 8469:13447(AltMet)(ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛)(서열식별번호: 2)

FUS 10744:14124(NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 3)

FUS 7974:15496(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 4)

FUS 7992:15730(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 5)

FUS 8210:15339(시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb))(서열식별번호: 6)

FUS 8828:14896(ATP 신타제 F0 서브유닛 6(ATPase6) 대 시토크롬 b(Cytb))(서열식별번호: 7)

FUS 10665:14856(NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 시토크롬 b(Cytb))(서열식별번호: 8)

FUS 6075:13799(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 9)

FUS 6325:13989(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 10)

FUS 7438:13476(시토크롬 c 옥시다제 서브유닛 I(COI) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 11)

FUS 7775:13532(시토크롬 c 옥시다제 서브유닛 II(COII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 12)

FUS 8213:13991(시토크롬 c 옥시다제 서브유닛 II(COII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 13)

FUS 9191:12909(ATP 신타제 F0 서브유닛 6(ATPase6) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 14)

FUS 9574:12972(시토크롬 c 옥시다제 서브유닛 III(COIII) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 15)

FUS 10367:12829(NADH 데하이드로게나제 서브유닛 3(ND3) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 16)

FUS 11232:13980(NADH 데하이드로게나제 서브유닛 4(ND4) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 17)

FUS 8469:13447(OrigMet)(ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛)(서열식별번호: 18)

FUS 9144:13816(ATP 신타제 F0 서브유닛 6(ATPase6) 대 NADH 데하이드로게나제 서브유닛 5(ND5))(서열식별번호: 54)

본 발명은 또한 암의 예견, 진단 및/또는 모니터를 위한 상기 서열들의 변체 또는 단편들의 용도를 제공한다.

본 발명에 사용된 바와 같이, "변체"는 본 발명의 mtDNA 서열과 상이하지만 그의 필수 성질은 유지하는 핵산을 지칭한다. 일반적으로, 변체는 전체적으로 밀접하게 유사하며, 다수의 영역들에서 선택 mtDNA 서열과 동일하다. 구체적으로, 본 발명의 변체는 상기 연접된 유전자들의 연결 점의 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 본 발명의 하나의 실시태양에서, 상기 변체 서열은 본 발명의 mtDNA 서열들 중 어느 하나 또는 그의 상보성 가닥과 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일하다.

본 발명에서, "단편"은 개시된 게놈 서열들 또는 그의 상보성 가닥 중에 함유된 것의 일부인 짧은 핵산 서열을 지칭한다. 이 부분은 상기 연접된 유전자들의 연결 점의 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 본 발명의 단편은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 단편은 예를 들어 상기 나열된 mtDNA 서열들 중 어느 하나의 20 개 이상의 연속된 염기들을 포함함을 의미한다. 이와 관련하여 "약"은 어느 한 말단 또는 양쪽 말단에서 특별히 인용된 값, 여러 개(5, 4, 3, 2 또는 1) 뉴클레오타이드까지 더 크거나 더 작은 값을 포함한다. 이들 단편은 비 제한적으로 본 발명에 논의된 바와 같은 진단 탐침 및 프라이머로서의 용도를 포함한 용도를 갖는다. 물론, 더 큰 단편들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 또한 고려된다.

따라서, 본 발명의 특정한 실시태양에서, 상기 mtDNA 서열은 하기로 이루어진 그룹 중에서 선택된다:

서열식별번호: 2(FUS 8469:13477; AltMet)

서열식별번호: 3(FUS 10774:14124)

서열식별번호: 4(FUS 7974:15496)

서열식별번호: 5(FUS 7992:15730)

서열식별번호: 6(FUS 8210:15339)

서열식별번호: 7(FUS 8828:14896)

서열식별번호: 8(FUS 10665:14856)

서열식별번호: 9(FUS 6075:13799)

서열식별번호: 10(FUS 6325:13989)

서열식별번호: 11(FUS 7438:13476)

서열식별번호: 12(FUS 7775:13532)

서열식별번호: 13(FUS 8213:13991)

서열식별번호: 14(FUS 9191:12909)

서열식별번호: 15(FUS 9574:12972)

서열식별번호: 16(FUS 10367:12829)

서열식별번호: 17(FUS 11232:13980)

서열식별번호: 18(FUS 8469:13447; OrigMet)

서열식별번호: 54(FUS 9144:13816)

및 이들의 단편 또는 변체.

탐침

본 발명의 또 다른 태양은 본 발명의 이상 mtDNA 서열을 인식할 수 있는 하이브리드화 탐침을 제공하는 것이다. 본 발명에 사용된 바와 같이, "탐침"이란 용어는 표적 영역 중의 서열을 갖는 탐침 중의 하나 이상의 서열의 상보성으로 인해, 표적 핵산 중의 서열을 갖는 이중 구조를 형성하는 올리고뉴클레오타이드를 지칭한다. 상기 탐침을 당해 분야에 공지된 방법들에 따라 표지할 수도 있다.

일단 특정 질병과 관련된 이상 mtDNA가 확인되면, 예를 들어 올리고뉴클레오타이드들의 배열에 대한 mtDNA의 하이브리드화를 사용하여 특정 돌연변이를 확인할 수 있으나, 임의의 공지된 하이브리드화 방법을 사용할 수도 있다.

본 발명의 프라이머와 마찬가지로, 탐침을 본 발명의 예시적인 mtDNA 융합 분자 또는 그의 단편 또는 변체에 대해 직접 생성시킬 수도 있다. 예를 들어 서열식별번호: 2 내지 18 및 54에 나열된 서열 및 표 1에 개시된 서열들을 사용하여 관심 융합 서열을 포함하는 핵산 서열을 검출하는 프라이머 또는 탐침을 디자인할 수 있다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 이들 핵산 분자에 하이브리드화하는 프라이머 또는 탐침은 매우 엄격한 하이브리드화 조건 또는 보다 덜 엄격한 조건 하에서 그렇게 할 수 있으며, 상기와 같은 조건은 당해 분야에 공지되어 있고 예를 들어 문헌[Current Protocols in Molecular Biology, John Wiley & Sons, New York(1989)), 6.3.1-6.3.6]에서 발견된다.

본 발명의 특정 실시태양에서, 본 발명의 탐침은 상기 연접된 유전자들의 연결 점을 포함하는 이상 mtDNA의 적어도 일부에 상보적인 서열을 함유한다. 이 부분은 상기 연결 점 A:B에 포함된 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 뉴클레오타이드들을 추가로 포함할 수도 있다. 이에 관하여, 본 발명은 상기 연결 점 A:B에 포함되고/되거나 이에 인접한 뉴클레오타이드를 사용하여 mtDNA 분자를 선택하는 임의의 적합한 표적화 기전을 포함한다.

당해 분야에 공지된 다양한 유형의 탐침들이 본 발명에 고려된다. 예를 들어, 상기 탐침은 표적 뉴클레오타이드 서열에의 결합을 일반적인 DNA 결합 염료, 예를 들어 에티디움 브로마이드, SYBR(등록상표) 그린, SYBR(등록상표) 골드 등을 사용하여 검출할 수 있는 하이브리드화 탐침일 수 있다. 한편으로, 상기 탐침은 하나 이상의 검출 가능한 표지들을 포함할 수 있다. 검출 가능한 표지는, 성질 또는 특징이 직접 또는 간접적으로 검출될 수 있고 표적 서열과 하이브리드화하는 탐침의 능력에 영향을 미치지 않도록 선택되는 분자 또는 부분이다. 핵산 서열의 표지화 방법은 당해 분야에 널리 공지되어 있다(예를 들어 문헌[Ausubel et al., (1997 & updates) Current Protocols in Molecular Biology, Wiley & Sons, New York]을 참조하시오).

본 발명의 탐침에 사용하기에 적합한 표지는 직접 검출될 수 있는 것들, 예를 들어 방사성 동위원소, 형광단, 화학발광단, 효소, 콜로이드 입자, 형광 미세입자 등을 포함한다. 당해 분야의 숙련가는, 직접 검출할 수 있는 표지는 상기 표지의 검출을 가능하게 하기 위해서 추가적인 성분들, 예를 들어 기질, 촉발 시약, 빛 등을 필요로 할 수도 있음을 알 것이다. 본 발명은 또한 간접적으로 검출되는 표지들의 사용을 고려한다.

본 발명의 탐침은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 탐침은 예를 들어 본 발명의 mtDNA 서열에 상보성인 20 개 이상의 연속된 염기들을 포함함을 의미한다. 물론, 더 큰 탐침들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 바람직할 수도 있다.

본 발명의 탐침들은 또한 생물학적 샘플 중의 핵산 분자에 하이브리드화하여, 본 발명의 방법을 가능하게 할 것이다. 따라서, 본 발명의 하나의 태양에서, 하이브리드화 탐침을 암의 검출에 사용하며, 여기에서 상기 탐침은 이상 mtDNA 분자의 적어도 일부에 상보성이다. 본 발명의 또 다른 태양은 탐침 및 직장결장암, 폐암, 유방암, 난소암, 고환암, 전립선암 및/또는 흑색종 피부암의 검출을 위한 상기 탐침의 용도(또는 사용 방법)를 제공한다.

분석

생물학적 샘플 중의 이상 mtDNA 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 mtDNA를 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 이상 mtDNA 서열의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 이상 mtDNA에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 mtDNA 데이터와 관련이 있을 수 있다.

하나의 태양에서, 본 발명은 포유동물의 암의 검출 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 상술한 이상 미토콘드리아 DNA의 존재에 대해 분석함을 포함한다. 본 발명은 또한 상기 포유동물로부터의 조직 샘플을 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 상기 샘플을 분석함을 포함하는 방법을 제공한다. 상기 탐침을 본 발명에 개시된 바와 같은 본 발명의 돌연변이 미토콘드리아 DNA 서열에 대해 생성될 수 있다.

또 다른 태양에서, 본 발명은 상기와 같은 방법을 제공하며, 여기에서 상기 분석은

a) 상기 탐침 중 하나 이상을 사용하여 하이브리드화 반응을 수행하여 상기 하나 이상의 탐침을 상보적인 이상 미토콘드리아 DNA 서열에 하이브리드화할 수 있게 하고;

b) 상기 하나 이상의 탐침에 하이브리드화된 미토콘드리아 DNA의 양을 정량분석함으로써 상기 샘플 중의 상기 하나 이상의 이상 미토콘드리아 DNA 서열의 양을 정량화하고;

c) 상기 샘플 중의 미토콘드리아 DNA의 양을 하나 이상의 공지된 기준 값과 비교함

을 포함한다.

또한 본 발명은 하기 개시하는 바와 같은 진단 영상 분석을 포함하는 암의 예견, 진단 또는 모니터 방법을 포함한다. 본 발명의 진단 분석을 고도의 자료처리 분석에 쉽게 적응시킬 수 있다. 고도의 자료처리 분석은 다수의 샘플들을 동시에 처리하는 이점을 제공하며 다수의 샘플을 선별하는데 필요한 시간을 현저하게 감소시킨다. 따라서 본 발명은 다수의 시험 샘플들 중의 표적 뉴클레오타이드 서열을 검출하고/하거나 정량화하기 위한 고도의 자료 처리 선별 또는 분석에 있어서 본 발명 뉴클레오타이드의 용도를 고려한다.

융합 전사물

본 발명은 암의 예견, 진단 및/또는 모니터 방법에 유용한 융합 전사물 및 관련된 하이브리드화 탐침의 확인을 추가로 제공한다. 당해 분야의 숙련가는 상기와 같은 분자가 천연 전사물의 단리를 통해 또는 한편으로, 본 발명의 방법에 따라 단리된 mtDNA의 재조합 발현에 의해 유도될 수 있음을 알 것이다. 논의된 바와 같이, 상기와 같은 mtDNA는 전형적으로는 첫 번째 유전자로부터의 개시 코돈 및 두 번째 유전자의 종결 코돈을 갖는 연접된 유전자를 포함한다. 따라서, 상기로부터 유도된 융합 전사물은 상기 연접된 유전자들과 결합된 연결 점을 포함한다.

융합 전사물의 검출

천연 융합 전사물을 생물학적 샘플로부터 추출하고 당해 분야에 공지된 임의의 적합한 방법에 따라 확인하거나, 또는 실시예에 개시된 방법에 따라 수행할 수도 있다. 본 발명의 하나의 실시태양에서, 안정한 폴리아데닐화된 융합 전사물을 폴리-A 꼬리로 전사물을 표적화하는 올리고(dT) 프라이머를 사용하여 확인한 다음 상기 표적 전사물에 대해 디자인된 프라이머 쌍을 사용하여 RT-PCR을 수행한다.

하기의 예시적인 융합 전사물을 상기와 같은 방법을 사용하여 검출하였으며 이는 실시예에서 가리킨 바와 같이 암의 예견, 진단 및/또는 모니터에 유용한 것으로 밝혀졌다. 마찬가지로, 표 1에 나타낸 ORF 서열들로부터 유도된 융합 전사물이 암의 예견, 진단 및/또는 모니터에 유용할 수 있다.

서열식별번호: 19(전사물 1; 8469:13477; AltMet)

서열식별번호: 20(전사물 2; 10774:14124)

서열식별번호: 21(전사물 3; 7974:15496)

서열식별번호: 22(전사물 4; 7992:15730)

서열식별번호: 23(전사물 5; 8210:15339)

서열식별번호: 24(전사물 6; 8828:14896)

서열식별번호: 25(전사물 7; 10665:14856)

서열식별번호: 26(전사물 8; 6075:13799)

서열식별번호: 27(전사물 9; 6325:13989)

서열식별번호: 28(전사물 10; 7438:13476)

서열식별번호: 29(전사물 11; 7775:13532)

서열식별번호: 30(전사물 12; 8213:13991)

서열식별번호: 31(전사물 14; 9191:12909)

서열식별번호: 32(전사물 15; 9574:12972)

서열식별번호: 33(전사물 16; 10367:12829)

서열식별번호: 34(전사물 17; 11232:13980)

서열식별번호: 35(전사물 20; 8469:13447; OrigMet)

서열식별번호: 53(전사물 13; 9144:13816)

융합 전사물들을 또한 당해 분야에 공지된 재조합 기법에 의해 생성시킬 수 있다. 전형적으로 이는 관심 mtDNA 서열을 포함하는 발현 벡터로 적합한 숙주 세포를 형질전환(형질감염, 형질도입 또는 감염 포함)시킴을 포함한다.

본 발명에서 확인된 융합 전사물들의 변체 또는 단편들을 또한 제공한다. 상기와 같은 서열들은 게놈 변체 및 단편에 관하여 상술한, 또는 숙련가에 의해 적합한 것으로 결정된 바와 같은 크기 제한 및 일치율을 고수할 수 있다.

탐침

일단 융합 전사물이 특성화되었으면, 프라이머 또는 탐침을 생물학적 샘플 중의 전사물을 표적화하기 위해서 개발할 수 있다. 상기와 같은 프라이머 및 탐침을 임의의 공지된 방법(상술한 바와 같은)을 사용하거나 또는 하기 제공된 실시예에 나타낸 바와 같이 제조할 수 있다. 탐침은 예를 들어 상기 융합 전사물에 대해 생성될 수 있으며, 검출 기술, 예를 들어 QuantiGene 2.0^TM by Panomics^TM를 샘플 중의 전사물의 존재를 검출하기 위해 사용할 수 있다. 프라이머 및 탐침을 본 발명의 예시적인 융합 전사물, 또는 그의 단편 또는 변체에 대해 직접 생성시킬 수 있다. 예를 들어 서열식별번호: 19 내지 35에 나타낸 서열들뿐만 아니라 표 1에 개시된 것들을 사용하여 관심 융합 서열을 포함하는 핵산 서열을 검출하는 탐침을 디자인할 수 있다.

당해 분야의 숙련가들에 의해 이해되는 바와 같이, 본 발명의 융합 전사물에 하이브리드화하도록 디자인된 탐침은 상기 연접된 유전자의 연결 점을 발현하는 전사물의 적어도 일부에 상보적인 서열을 함유한다. 이 부분은 상기 발현된 연결 점에 상보적인 뉴클레오타이드들 중 하나 이상을 포함하며, 이에 인접한 하나 이상의 상보성 뉴클레오타이드를 추가로 포함할 수도 있다. 이에 관하여, 본 발명은 상기 연접된 유전자의 연결 점을 포함하고 이에 인접한 뉴클레오타이드를 사용하는 융합 전사물을 선택하는 임의의 적합한 표적화 기전을 포함한다.

당해 분야에 공지된 다양한 유형의 탐침 및 표적화 방법들을 전사물 탐침의 제조에 고려한다. 상기와 같은 유형 및 방법들은 게놈 서열의 검출에 관하여 상기 개시되어 있다. 본 발명의 전사물 탐침은 길이가 바람직하게는 약 15 nt 이상, 보다 바람직하게는 약 20 nt 이상, 훨씬 더 바람직하게는 약 30 nt 이상, 훨씬 더 바람직하게는 약 40 nt 이상, 약 50 nt 이상, 약 75 nt 이상, 또는 약 150 nt 이상이다. "길이가 20 nt 이상"인 탐침은 예를 들어 본 발명의 mtDNA 서열에 상보성인 20 개 이상의 연속된 염기들을 포함함을 의미한다. 물론, 더 큰 탐침들(예를 들어 50, 150, 500, 600, 2000 뉴클레오타이드)이 바람직할 수도 있다.

하나의 태양에서, 본 발명은 암 검출에 사용하기 위한 하이브리드화 탐침을 제공하며, 여기에서 상기 탐침은 상기 제공된 미토콘드리아 융합 전사물의 적어도 일부에 상보성이다.

또 다른 태양에서, 본 발명은 탐침 및 결장직장암, 폐암, 유방암, 난소암, 고환암, 전립선암 또는 흑색종 피부암의 검출을 위한 상기와 같은 탐침의 용도(또는 사용 방법)를 제공한다.

분석

생물학적 샘플 중의 미토콘드리아 융합 전사물 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 미토콘드리아 RNA를 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 융합 전사물의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 융합 전사물에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 전사물 데이터와 관련이 있을 수 있다.

하나의 태양에서, 본 발명은 포유동물의 암의 검출 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 상기 미토콘드리아 융합 전사물의 적어도 일부에 상보성인 핵산 서열을 갖는 하나 이상의 하이브리드화 탐침과 하이브리드화시킴으로써 본 발명의 하나 이상의 융합 전사물의 존재에 대해 분석함을 포함한다.

a) 상기 탐침 중 하나 이상을 사용하여 하이브리드화 반응을 수행하여 상기 하나 이상의 탐침을 상보적인 미토콘드리아 융합 전사물에 하이브리드화할 수 있게 하고;

b) 상기 하나 이상의 탐침에 하이브리드화된 전사물의 양을 정량분석함으로써 상기 샘플 중의 상기 하나 이상의 미토콘드리아 융합 전사물의 양을 정량화하고;

c) 상기 샘플 중의 미토콘드리아 융합 전사물의 양을 하나 이상의 공지된 기준 값과 비교함

을 포함한다.

상기 논의된 바와 같이, 본 발명의 진단 분석은 본 발명에 개시된 바와 같은 진단 영상 방법을 또한 포함하며 이를 고도의 자료처리 분석에 쉽게 적응시킬 수 있다. 따라서, 본 발명은 다수의 시험 샘플들 중의 표적 뉴클레오타이드 서열을 검출하고/하거나 정량화하기 위한 고도의 자료 처리 선별 또는 분석에 있어서 본 발명의 융합 전사물 및 관련된 탐침의 용도를 고려한다.

번역 산물

지금까지, 미토콘드리아 융합 단백질은 검출되거나 단리되지 않았다. 그러나, 미토콘드리아 융합 전사물의 수준이 하기에 제공된 실시예들로부터 관찰되었으며 상기 전사물이 폴리아데닐화된다는 표시는 상기와 같은 미토콘드리아 융합 단백질의 존재를 지지하는 추가의 증거를 제공한다. 따라서, 본 발명은 암의 예견, 진단 및/또는 모니터를 위한 융합 단백질의 확인을 제공한다.

상기 개시된 방법에 사용하기 위해 고려되는 융합 단백질은 천연 폴리펩타이드의 단리를 통해 또는 유전자 발현을 통해 유도될 수 있다. 상기와 같은 폴리펩타이드를 당해 분야에 공지된 방법, 예를 들어 세포 추출물로부터의 정제 또는 재조합 기법의 사용에 의해 제조할 수 있다.

전사물 1 내지 17 및 20에 상응하는 추정적인 단백질 서열들을 하기에 각각의 서열 식별자와 함께 제공한다. 이들뿐만 아니라 표 1에 개시된 결실 서열들에 상응하는 추정적인 단백질 서열들을 본 발명의 방법에 사용하기 위해 본 발명에서 고려한다.

서열식별번호: 36(전사물 1)

서열식별번호: 37(전사물 2)

서열식별번호: 38(전사물 3)

서열식별번호: 39(전사물 4)

서열식별번호: 40(전사물 5)

서열식별번호: 41(전사물 6)

서열식별번호: 42(전사물 7)

서열식별번호: 43(전사물 8)

서열식별번호: 44(전사물 9)

서열식별번호: 45(전사물 10)

서열식별번호: 46(전사물 11)

서열식별번호: 47(전사물 12)

서열식별번호: 48(전사물 14)

서열식별번호: 49(전사물 15)

서열식별번호: 50(전사물 16)

서열식별번호: 51(전사물 17)

서열식별번호: 52(전사물 20)

서열식별번호: 55(전사물 13)

융합 단백질의 검출

본 발명의 융합 단백질을 황산 암모늄 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록실아파타이트 크로마토그래피, 소수성 전하 상호작용 크로마토그래피 및 렉틴 크로마토그래피를 포함한 널리 공지된 방법들에 의해 생물학적 샘플로부터 회수하고 정제할 수 있다. 가장 바람직하게는, 고성능 액체 크로마토그래피("HPLC")가 정제에 사용된다.

생물학적 샘플 중의 융합 단백질 수준의 분석을 다양한 기법을 사용하여 수행할 수 있다. 예를 들어, 조직 중 단백질 발현을 전통적인 면역조직학적 방법(Jalkanen et al., J. Cell. Biol. 101:976-985(1985); Jalkanen, M. et al., J. Cell. Biol. 105:3087-3096(1987))으로 연구할 수 있다. 단백질 발현의 검출에 유용한 다른 방법은 면역분석, 예를 들어 효소 결합된 면역흡수 분석(ELISA) 및 방사성면역분석(RIA)을 포함한다. 적합한 항체 분석 표지가 당해 분야에 공지되어 있으며 효소 표지, 예를 들어 글루코스 옥시다제, 및 방사성 동위원소, 예를 들어 요오드(<125>I, <121>I), 탄소(<14>C), 황(<35>S), 삼중수소(<3>H), 인듐(<112>In), 및 테크네슘(<99m>Tc) 및 형광 표지, 예를 들어 플루오레세인 및 로다민, 및 비오틴을 포함한다.

본 발명의 폴리펩타이드를 또한 당해 분야에 공지된 재조합 기법에 의해 제조할 수 있다. 전형적으로 이는 관심 단백질 또는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 발현 벡터로 적합한 숙주 세포를 형질전환(형질감염, 형질도입 또는 감염 포함)시킴을 포함한다.

항체

본 발명의 분석에 사용하기 위한 단백질 특이 항체를 본 발명의 야생형 또는 발현된 미토콘드리아 융합 단백질 또는 그의 항원성 폴리펩타이드 단편에 대해 생성시킬 수 있으며, 이들은 담체 단백질, 예를 들어 알부민과 함께 동물계(예를 들어 토끼 또는 마우스)로 제공되거나, 충분히 긴 경우(약 25 아미노산 이상), 담체 없이 제공될 수 있다.

본 발명에 사용된 바와 같이, "항체"(Ab) 또는 "단클론 항체"(Mab)란 용어는 미토콘드리아 융합 단백질에 특이적으로 결합하거나 상기 단백질에 대한 "특이성"을 가질 수 있는 완전한 분자뿐만 아니라 항체 단편, 또는 그의 항원-결합 단편(예를 들어 Fab 및 F(ab')2 단편)을 포함함을 의미한다. Fab 및 F(ab')2 단편은 완전 항체의 Fc 단편이 결여되며, 순환으로부터 보다 빠르게 제거되고, 완전 항체의 덜 비-특이적인 조직 결합을 가질 수도 있다(Wahl et al., J. Nucl. Med. 24:316-325(1983)). 따라서, 이들 단편이 바람직하다.

본 발명의 항체를 임의의 다양한 방법들에 의해 제조할 수 있다. 예를 들어 상기 미토콘드리아 융합 단백질 또는 그의 항원 단편을 발현하는 세포를 다클론 항체를 함유하는 혈청의 생산을 유도하기 위해서 동물에게 투여할 수 있다. 하나의 방법에서, 미토콘드리아 융합 단백질의 제제를 제조하고 천연 오염물질이 실질적으로 없도록 정제한다. 이어서 상기와 같은 제제를 보다 큰 특이 활성의 다클론 항혈청을 생성시키기 위해서 동물에게 도입시킨다.

관련된 방법에서, 본 발명의 항체는 단클론 항체이다. 상기와 같은 단클론 항체를 하이브리도마 기술을 사용하여 제조할 수 있다(Kohler et al., Nature 256:495(1975); Kohler et al., Eur. J. Immunol. 6:511(1976); Kohler et al., Eur. J. Immunol. 6:292(1976); Hammerling et al., in: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., (1981) pp. 563-681). 일반적으로, 상기와 같은 과정은 동물(바람직하게는 마우스)을 미토콘드리아 융합 단백질 항원 또는 미토콘드리아 융합 단백질-발현 세포로 면역함을 포함한다.

본 발명은 본 발명에 개시된 융합 단백질에 대해 특이성을 갖는 항체 또는 항원-결합 단편을 사용하는 면역학적 분석을 포함한다. 상기와 같은 면역학적 분석은 임의의 다른 필요 시약, 시험 스트립, 물질, 설명서 등과 함께 항체 또는 항원-결합 단편을 함유하는 키트에 의해 용이해 질 수 있다.

분석

생물학적 샘플 중의 융합 단백질과 같은 번역 산물의 수준의 측정은 환자에게서 하나 이상의 암의 존재를 결정할 수 있다. 따라서 본 발명은 암의 예견, 진단 또는 모니터 방법을 포함하며, 상기 방법은 하나 이상의 생물학적 샘플을 수득하고, 상기 샘플로부터 미토콘드리아 융합 단백질을 추출하고, 상기 샘플을, 상기 샘플 중의 하나 이상의 상기와 같은 분자의 양을 정량화하고 기준 값과 검출된 양을 비교함으로써 상기 분자에 대해 분석함을 포함한다. 당해 분야의 숙련가들에 의해 이해되는 바와 같이, 상기 기준 값은 상기 방법이 암을 예견하고자 하는지, 진단하고자 하는지 또는 모니터하고자 하는지에 의거한다. 따라서, 상기 기준 값은 하나 이상의 공지된 비-암성 생물학적 샘플, 하나 이상의 공지된 암성 생물학적 샘플, 및/또는 시간에 따라 취한 하나 이상의 생물학적 샘플로부터 수집한 전사물 데이터와 관련이 있을 수 있다.

샘플 중의 단백질을 정량화하는 기법은 당해 분야에 널리 공지되어 있으며 예를 들어, 전통적인 면역조직학적 방법(Jalkanen et al., J. Cell. Biol. 101:976-985(1985); Jalkanen, M. et al., J. Cell. Biol. 105:3087-3096(1987))을 포함한다. 단백질 발현의 검출에 유용한 추가적인 방법은 면역분석, 예를 들어 효소 결합된 면역흡수 분석(ELISA) 및 방사성면역분석(RIA)을 포함한다.

하나의 태양에서, 본 발명은 포유동물에게서 암을 검출하는 방법을 제공하며, 상기 방법은 상기 포유동물로부터의 조직 샘플을 하나 이상의 미토콘드리아 융합 단백질의 존재에 대해 분석함을 포함한다. 또 다른 태양에서, 본 발명은 결장직장암, 폐암, 유방암, 난소암, 고환 암, 전립선암 및/또는 흑색종 피부암의 진단에서 미토콘드리아 융합 단백질의 검출을 제공한다.

진단 영상화

진단 장치

본 발명은 특정 질병을 진단하거나 특정 돌연변이를 확인하는데 사용되는 바이오칩, 유전자 칩 또는 미세배열 등의 진단 장치를 포함한다. 모든 서열화된 미토콘드리아 게놈들은 염기쌍 배열의 일치 구조를 생성시키는 것으로 평가되며 특정 질병 또는 질환과 관련된 염기쌍 결실 및 돌연변이의 비율에 대한 금지율을 지정한다. 상기 진단 설비를 사용하여 바이오칩, 유전자 칩 또는 미세배열을 생성시킨다.

일단 특정 질병, 질병 상태 또는 질환과 관련된 서열이 확인되면, 올리고뉴클레오타이드의 배열에 대한 미토콘드리아 뉴클레오타이드 샘플의 하이브리드화를 사용하여 특정 돌연변이를 확인할 수 있다. 임의의 공지된 하이브리드화 방법을 사용할 수 있다. 바람직하게는, 야생형 또는 돌연변이된 영역과 합치하는 올리고뉴클레오타이드 탐침, 및 대조용 탐침을 갖는 배열을 사용한다. 상업적으로 입수할 수 있는 배열, 예를 들어 미세배열 또는 유전자 칩이 적합하다. 이들 배열은 슬라이드 또는 미세 칩 상에 수천의 합치된 및 대조용 탐침 쌍을 함유하며, 전체 게놈을 매우 신속하게 서열화할 수 있다. 게놈 및 DNA 서열 분석에서 미세배열들의 용도를 개시하는 고찰 논문들을 온-라인 상에서 입수할 수 있다.

미세배열

폴리뉴클레오타이드 배열은 하나 이상의 표적 핵산 서열을 포함하는 샘플 중의 다수의 폴리뉴클레오타이드를 분석할 수 있는 고도의 자료처리 기법을 제공한다. 본 발명의 배열은 유전자 발현 분석, 질병의 진단 및 질병의 예후(예를 들어 치료에 대한 환자의 반응 모니터 등)에 유용하다.

질병, 또는 질병의 진행을 가리키는 mtDNA의 폴리뉴클레오타이드 서열의 임의의 조합을 미세배열의 제작을 위해 사용한다.

미세배열을 사용하여 분석하려는 표적 핵산 샘플은 앞서 개시한 바와 같이 적합한 양의 mtDNA를 함유하는 임의의 인간 조직 또는 유체로부터 유래한다. 상기 표적 핵산 샘플을 상보적인 핵산 구성원/표적 복합체의 하이브리드화 패턴을 생성시키기에 충분한 하이브리드화 조건 하에서 폴리뉴클레오타이드 구성원들과 접촉시킨다.

미세배열의 제작

상기 미세배열은 고체 지지체의 한 표면에 결합된 다수의 독특한 폴리뉴클레오타이드들을 포함하며, 여기에서 상기 폴리뉴클레오타이드들은 각각 상기 고체 지지체의 표면에 동일하지 않은 소정의 영역에서 결합된다. 상기 배열상의 각각의 결합된 샘플은 하기에 보다 상세히 개시되는 바와 같이, 공지된 정체, 대개는 공지된 서열의 폴리뉴클레오타이드 조성물을 포함한다. 임의의 가능한 기질들을 본 발명에 사용할 수 있다.

상기 배열을 임의의 공지된 수단을 사용하여 제작한다. 상기 핵산 구성원을 확립된 기법들, 예를 들어 폴리머라제 쇄 반응(PCR) 및 역 전사(RT)를 사용하여 생성시킬 수 있다. 이들 방법은 당해 분야에 현재 공지된 것들과 유사하다(예를 들어 문헌[PCR Strategies, Michael A. Innis(Editor), et al.(1995)] 및 [PCR: Introduction to Biotechniques Series, C.R. Newton, A. Graham(1997)]을 참조하시오). 증폭된 폴리뉴클레오타이드를 당해 분야에 널리 공지된 방법(예를 들어 컬럼 정제)에 의해 정제한다. 폴리뉴클레오타이드는 목적하는 폴리뉴클레오타이드의 합성 중에 생성되는 불완전 산물 및 프라이머들이 실질적으로 없도록 단리되었을 때 순수한 것으로 간주된다. 바람직하게는, 정제된 폴리뉴클레오타이드는 또한 상기 분자의 결합 활성을 방해하거나 또는 달리 가릴 수도 있는 오염물질이 실질적으로 없을 것이다.

본 발명의 배열에서, 상기 폴리뉴클레오타이드 조성물은 고체 지지체의 표면과 안정하게 결합하며, 여기에서 상기 지지체는 가요성이거나 강성의 고체 지지체일 수 있다.

핵산 구성원이 결합될 수도 있는 임의의 고체 지지체를 본 발명에 사용할 수 있다. 적합한 고체 지지체 물질의 예로는 비 제한적으로, 실리케이트, 예를 들어 유리 및 실리카젤, 셀룰로스 및 나이트로셀룰로스 페이퍼, 나일론, 폴리스타이렌, 폴리메트아크릴레이트, 라텍스, 고무, 및 플루오로카본 수지, 예를 들어 TEFLON^TM이 있다.

상기 고체 지지체 물질을 비 제한적으로 슬라이드 및 비드를 포함한 광범위하게 다양한 모양으로 사용할 수 있다. 슬라이드는 여러 가지 작용 이점들을 제공하며 따라서 고체 지지체의 바람직한 형태이다. 유리 슬라이드를 사용하는 경우 그의 평평한 표면으로 인해 탐침 및 하이브리드화 시약이 최소화된다. 슬라이드는 또한 시약들의 표적화된 적용을 가능하게 하며, 일정한 온도를 유지하기가 쉽고, 세척이 용이하며, 상기 고체 지지체 상에 고정화된 RNA 및/또는 DNA의 직접적인 가시화를 촉진한다. 상기 고체 지지체 상에 고정화된 RNA 및/또는 DNA의 제거가 또한 슬라이드를 사용하여 촉진된다.

상기 고체 지지체로서 선택된 특정 물질은 상기 물질이 상기 개시된 작용을 제공하는 한 본 발명에 필수적이지 않다. 통상적으로는, 본 발명을 만들거나 이용하는 사람들은 비용 및 유효성의 경제학, 최종 생성물의 예상된 적용 요건, 및 전체 제조 공정의 요구를 근거로 최선의 상업적으로 입수할 수 있는 물질을 선택할 것이다.

본 발명의 핵산 구성원들을 기질에 결합시키기 위한 다수의 방법들(스폿팅이라 지칭되는 공정)이 사용된다. 예를 들어, 폴리뉴클레오타이드를 예를 들어 미국 특허 제 5,807,522 호(중합체 결합 방법을 교시하기 위해 본 발명에 참고로 인용됨)의 기법을 사용하여 결합시킨다. 한편으로, 스폿팅을 접촉 인쇄 기술을 사용하여 수행한다.

각각의 조성물 중에 존재하는 폴리뉴클레오타이드의 양은 상기 배열을 사용하는 분석 중에 표적 폴리뉴클레오타이드 서열의 적합한 하이브리드화 및 검출을 제공하기에 충분할 것이다. 일반적으로, 상기 배열의 고체 지지체와 안정하게 결합하는 각 핵산 구성원의 양은 약 0.1 ng 이상, 바람직하게는 약 0.5 ng 이상 및 보다 바람직하게는 약 1 ng 이상이며, 이때 상기 량은 1000 ng 이상 정도로 높을 수 있으나, 대개는 약 20 ng을 초과하지 않을 것이다.

대조용 폴리뉴클레오타이드를, 상기 탐침이 향하는 표적 이외의 샘플 중의 폴리뉴클레오타이드에 대한 비-특이적 결합 또는 교차-하이브리드화를 모니터하기 위해서 상기 배열상에 스폿팅하고 표적 발현 대조용 폴리뉴클레오타이드 및 불일치 대조용 뉴클레오타이드로서 사용할 수 있다. 따라서 불일치 탐침은 하이브리드화가 특이적인지 아닌지를 가리킨다. 예를 들어, 상기 표적이 존재하는 경우, 완벽하게 일치된 탐침은 불일치된 탐침보다 일관되게 더 밝을 것이다. 또한, 모든 중심 불일치가 존재하는 경우, 상기 불일치 탐침들을 사용하여 돌연변이를 검출한다.

표적 제조

상기 미세배열의 표적들은 하나 이상의 생물학적 탐침들로부터 유래할 수 있다. 하이브리드화 전에 표적 핵산 샘플을 증폭시키는 것이 바람직할 수도 있다. 당해 분야의 숙련가는 사용되는 증폭 방법이 무엇이든 간에, 정량적인 결과를 원하는 경우, 상기 증폭된 폴리뉴클레오타이드의 상대 빈도를 유지하거나 조절하는 방법을 주의해서 사용해야 한다. "정량적인" 증폭의 방법들은 당해 분야의 숙련가들에게 널리 공지되어 있다. 예를 들어, 정량적인 PCR은 동일한 프라이머를 사용하여 기지 량의 대조용 서열을 동시에 함께 증폭시킴을 포함한다. 이는 PCR 반응을 눈금화하는데 사용될 수 있는 내부 기준을 제공한다. 이어서 고 밀도 배열은 상기 증폭된 폴리뉴클레오타이드의 정량화에 대한 내부 기준에 특이적인 탐침을 포함할 수 있다. 정량적인 PCR에 대한 상세한 프로토콜이 문헌[PCR Protocols, A Guide to Methods and Applications, Innis et al., Academic Press, Inc. N.Y.,(1990)]에 제공되어 있다. 다른 적합한 증폭 방법으로는 비 제한적으로 폴리머라제 쇄 반응(PCR)(Innis, et al., PCR Protocols. A guide to Methods and Application. Academic Press, Inc. San Diego, (1990)), 리가제 쇄 반응(LCR)(Wu and Wallace, Genomics, 4:560(1989), Landegren, et al., Science, 241:1077(1988) 및 Barringer et al., Gene, 89:117(1990)), 전사 증폭(Kwoh, et al, Proc. Natl. Acad. Sci. USA, 86:1173(1989)), 및 자립 서열 복제(Guatelli, et al., Proc. Nat. Acad. Sci. USA, 87:1874(1990))가 있다.

본 발명은 상술한 바와 같은 표지된 표적 또는 표지된 탐침을 제공한다. 미세배열의 경우, 분자에 결합하거나 분자 내로 통합되는 임의의 분석학적으로 검출 가능한 마커를 본 발명에 사용할 수 있다. 분석학적으로 검출 가능한 마커는 분석학적으로 검출되고 정량화되는 임의의 분자, 부분 또는 원자를 지칭한다. 본 발명에 사용하기에 적합한 검출 가능한 표지는 분광학적, 광화학적, 생화학적, 면역화학적, 전기, 광학 또는 화학적 수단에 의해 검출 가능한 임의의 조성물을 포함한다. 본 발명에 유용한 표지는 표지된 스트렙트아비딘 접합체에 의한 염색을 위한 비오틴, 자기 비드(예를 들어 Dynabeads^TM), 형광 염료(예를 들어 플루오레세인, 텍사스 레드, 로다민, 녹색 형광 단백질 등), 방사성 표지(예를 들어 3H, 125I, 35S, 14C, 또는 32P), 효소(예를 들어 양고추 냉이 퍼옥시다제, 알칼리성 포스파타제, 및 ELISA에 통상적으로 사용되는 것들), 및 비색측정 표지, 예를 들어 콜로이드성 금 또는 착색된 유리 또는 플라스틱(예를 들어 폴리스타이렌, 폴리프로필렌, 라텍스 등) 비드를 포함한다. 상기와 같은 표지의 사용을 교시하는 특허들로는 미국 특허 제 3,817,837; 3,850,752; 3,939,350; 3,996,345; 4,277,437; 4,275,149; 및 4,366,241 호가 있다.

상기와 같은 표지의 검출 수단은 당해 분야의 숙련가들에게 널리 공지되어 있다. 따라서 예를 들어 방사성 표지를 사진 필름 또는 섬광 계수기를 사용하여 검출할 수 있고, 형광 마커를 방출된 빛을 검출하는 광검출기를 사용하여 검출할 수 있다. 효소 표지는 전형적으로는 상기 효소에 기질을 제공하고 상기 기질 상에서 상기 효소의 작용에 의해 생성된 반응 산물을 검출함으로써 검출하며, 비색 측정 표지는 착색된 표지를 단순히 가시화함으로써 검출한다.

상기 표지들을 당해 분야의 숙련가들에게 널리 공지된 다수의 수단들 중 임의의 수단에 의해 통합시킬 수 있다. 그러나, 바람직한 실시태양에서, 상기 표지를 상기 샘플 폴리뉴클레오타이드의 제조에서 증폭 단계 중에 동시에 통합시킨다. 따라서, 예를 들어 표지된 프라이머 또는 표지된 뉴클레오타이드와의 폴리머라제 쇄 반응(PCR)은 표지된 증폭 산물을 제공할 것이다. 바람직한 실시태양에서, 표지된 뉴클레오타이드(예를 들어 플루오레세인-표지된 UTP 및/또는 CTP)를 사용하는, 상술한 바와 같은 전사 증폭은 표지를 상기 전사된 폴리뉴클레오타이드 내로 통합시킨다. 한편으로, 상기 증폭을 완료한 후에 표지를 원래의 폴리뉴클레오타이드 샘플(예를 들어 mRNA, 폴리A mRNA, cDNA 등)에 또는 증폭 산물에 직접 가할 수도 있다. 폴리뉴클레오타이드에 표지를 결합시키는 수단은 당해 분야의 숙련가들에게 널리 공지되어 있으며, 예를 들어 틈 번역 또는 상기 폴리뉴클레오타이드의 키나제 처리 및 상기 샘플 폴리뉴클레오타이드를 표지(예를 들어 형광단)에 결합시키는 폴리뉴클레오타이드 링커의 후속적인 결합(연결)에 의한 단부-표지화(예를 들어 표지된 RNA에 의해)를 포함한다.

바람직한 실시태양에서, 상기 표적은 상기 미세배열상의 대조용 탐침에 하이브리드화하여 상기 미세배열로부터 생성되는 신호들을 표준화하는 하나 이상의 대조용 분자들을 포함할 것이다. 표지된 표준화 표적들은 상술한 바와 같이 상기 미세배열상에 스폿팅되는 대조용 올리고뉴클레오타이드에 완벽하게 상보성인 폴리뉴클레오타이드 서열이다. 하이브리드화 후 상기 표준화 대조군으로부터 획득한 신호는 하이브리드화 조건에서 변화에 대한 조절, 표지 강도, "판독" 효율, 및 배열들 간에 완벽한 하이브리드화의 신호의 변화를 야기할 수 있는 다른 인자들을 제공한다.

영상 획득 및 데이터 분석

하이브리드화 및 임의의 세척 단계(들) 및/또는 통상적인 성질의 후속 처리에 이어서, 생성된 하이브리드화 패턴이 검출된다. 상기 하이브리드화 패턴의 검출 또는 가시화에서, 상기 표지의 강도 또는 신호 값은 검출될 뿐만 아니라 정량화될 것이며, 이는 상기 하이브리드화의 각 스폿으로부터의 신호가 측정되고 기지의 수의 단부 표지된 표적 폴리뉴클레오타이드에 의해 방출되는 신호에 상응하는 단위 값과 비교되어 상기 배열상의 특정 스폿에 상기 하이브리드화 패턴으로 하이브리드화되는 각각의 단부-표지된 표적의 사본 수의 수 또는 절대 값을 획득함을 의미한다.

배열에 대한 하이브리드화로부터 수집한 데이터의 분석 방법은 당해 분야에 널리 공지되어 있다. 예를 들어, 하이브리드화의 검출이 형광 표지를 수반하는 경우, 데이터 분석은 상기 수집된 데이터로부터 기질 위치의 함수로서 형광 강도를 측정하고, 이상치들, 즉 소정의 통계 분포로부터 벗어난 데이터를 제거하고, 나머지 데이터로부터 상기 시험 폴리뉴클레오타이드의 상대 결합 친화성을 계산하는 단계를 포함할 수 있다. 상기 생성 데이터는 관련된 올리고뉴클레오타이드들 및/또는 폴리뉴클레오타이드들과 시험 폴리뉴클레오타이드들 간의 결합 친화성에 따라 변하는 각 영역 중의 강도를 갖는 영상으로서 표시된다.

진단 시험

검출 또는 가시화에 이어서, 상기 하이브리드화 패턴을 사용하여 상기 하이브리드화 패턴을 생성시키는 배열과 접촉한 표지된 표적 폴리뉴클레오타이드 샘플의 유전자 프로파일뿐만 아니라 상기 샘플이 유래된 조직, 유체, 기관, 세포 등의 상태 또는 조건에 대한 정량적인 정보를 측정한다. 이에 관하여, 본 발명은 암 검출을 위한 진단 시험을 추가로 제공한다. 본 발명은 또한 환자의 상태를 모니터함을 제공한다. 본 발명의 방법에 따라, 암의 존재를 환자로부터의 생물학적 샘플을 획득하여 검출한다. 핵산을 포함하는 시험 샘플을 상기 생물학적 샘플로부터 제조한다. 상기 샘플로부터 추출한 핵산을 고체 기질 및 다수의 핵산 구성원들을 포함하는 배열에 하이브리드화하며, 여기에서 각각의 구성원들은 질병의 존재 또는 암에 대한 소인을 가리킨다. 상기 진단 시험에 따라, 상기 배열상의 하나 이상의 핵산 구성원에 대한 핵산을 포함하는 상기 샘플의 하이브리드화는 암 또는 암에 대한 소인을 가리킨다.

진단 모니터링

본 발명의 방법은 하나 이상의 분석들의 결과를 기본으로 하는 요법의 모니터링 섭생 또는 과정을 추천하는 단계를 추가로 포함할 수 있다. 이는 임상의들이 개인화된 투약을 실행하게 한다, 예를 들어 환자의 암의 진행(예를 들어 초기 또는 후속 돌연변이가 발생하는 때를 인식함으로써) 또는 치료(예를 들어 돌연변이가 안정화된 때를 인식함으로써)를 모니터함으로써 암 치료를 실행하게 한다.

연구중인 서열 변화의 한계들에 대한 지식과 함께, 상기 정보를 사용하여 전암성 상태 또는 기존의 암 상태를 진단할 수 있다. 더욱이, 시간에 따른 연속적인 샘플 중의 이상 mtDNA의 양을 정량분석함으로써, 암 상태의 진행을 모니터할 수 있다. 예를 들어, 야생형으로부터 첫 번째 돌연변이 세트를 검출하기 위해 하나의 시점에서 환자의 조직을 분석함으로써 제공된 데이터를, 상기 이상의 변화가 발생했는지를 측정하기 위해서, 후속 분석으로부터 제공된 데이터와 비교할 수 있다.

아직 암의 증상들이 나타나지 않은 개인에게서 돌연변이가 발견되는 경우, 상기 돌연변이는 암 상태를 나타낼 유전학적 민감성을 가리킬 수 있다. 질병에 대한 민감성의 측정 또는 상기 존재의 진단을, 환자의 가족력에서 암 상태(존재하는 경우)의 이환율 및 다른 위험 인자들의 존재, 예를 들어 환경 인자들에의 노출 및 상기 환자의 세포가 또 다른 종류의 돌연변이를 또한 갖는지에 관한 정보에 근거한 정량적인 기준으로 추가로 평가할 수 있다.

생물학적 샘플

본 발명은 하나 이상의 생물학적 샘플을 수득하거나 수집함을 포함하는 진단 시험을 제공한다. 본 발명과 관련하여, "생물학적 샘플"은 mtDNA, mtRNA 및 번역 산물 또는 융합 단백질이 수득될 수 있는 세포들을 함유하는 조직 또는 체액을 지칭한다. 예를 들어, 상기 생물학적 샘플은 비 제한적으로 피부, 폐, 유방, 전립선, 신경, 근육, 심장, 위, 결장, 직장 조직 등을 포함하는 조직으로부터; 또는 혈액, 타액, 뇌척수액, 객담, 뇨, 점액, 활액, 복막액, 양수 등으로부터 유래할 수 있다. 상기 생물학적 샘플을 암성 또는 비 암성 조직으로부터 수득할 수 있으며 상기 샘플은 비 제한적으로 외과적 시편 또는 생검 시편일 수 있다.

상기 생물학적 샘플을 상기 공급원으로부터 수득한 대로 바로 사용하거나 상기 샘플의 특성을 변경시키기 위해 전-처리에 이어서 사용할 수 있다. 따라서, 상기 생물학적 샘플을 사용 전에, 예를 들어 혈액으로부터 혈장 또는 혈청을 제조하고, 세포를 파괴하고, 고체 물질로부터 액체를 제조하고, 점성 유체를 희석하고, 액체를 여과하고, 액체를 증류하고, 액체를 농축시키고, 간섭 성분들을 불활성화시키고, 시약들을 첨가하는 등에 의해 전처리할 수 있다.

당해 분야의 숙련가는 하나보다 많은 유형의 샘플(즉 하나보다 많은 암의 검출을 위해)을 한번에 분석할 수 있음을 알 것이다. 더욱 또한, 수집 과정이 필요한 경우, 예를 들어 시간에 따라 암을 모니터하는 경우, 주어진 샘플을 단독으로 또는 시험기간 전체를 통해 취한 다른 샘플들과 함께 진단할 수 있다. 이에 관하여, 생물학적 샘플을 단지 1회만, 또는 규칙적인 간격으로, 예를 들어 2주마다, 달마다, 반년마다 또는 매년 취할 수 있다.

키트

본 발명은 임상적인 환경에서 암을 검출하기 위한 진단/선별 키트를 제공한다. 상기와 같은 키트는 하나 이상의 샘플링 수단을 본 발명에 따른 하나 이상의 탐침과 함께 포함할 수도 있다. 한편으로, 또는 상기 이외에, 상기 키트는 본 발명의 번역 산물을 검출하기 위한 수단을 포함할 수도 있다.

상기 키트는 진단 분석을 수행하는데 필요한 시약들, 예를 들어 완충제, 염, 검출 시약 등을 임의로 포함할 수 있다. 다른 성분들, 예를 들어 완충제 및 생물학적 샘플의 단리 및/또는 처리를 위한 용액들을 또한 상기 키트에 포함시킬 수 있다. 상기 키트의 상기 성분들 중 하나 이상을 동결건조시킬 수도 있으며 상기 키트는 상기 동결건조된 성분들의 재조성에 적합한 시약들을 추가로 포함할 수 있다.

적합한 경우, 상기 키트는 반응 용기, 혼합 용기 및 상기 시험 샘플의 제조를 촉진하는 다른 성분들을 또한 함유할 수 있다. 상기 키트는 사용 설명서를 또한 임의로 포함할 수 있으며, 상기 설명서는 종이 형태로 또는 컴퓨터 판독 가능한 형태, 예를 들어 디스크, CD, DVD 등의 형태로 제공될 수 있다.

본 발명의 하나의 실시태양에서, 샘플링 수단 및 본 발명의 하이브리드화 탐침을 포함하는 암 진단용 키트를 제공한다.

또 다른 실시태양에서, 본 발명의 키트는 면역학적 분석을 포함할 수도 있다. 상기와 같은 경우에, 상기 키트는 본 발명에 개시된 융합 단백질에 대한 특이성을 갖는 항체 또는 항원-결합 단편을 포함할 수 있다. 상기와 같은 면역학적 분석에 필요한 다양한 다른 시약들, 시험 스트립 등이 사용자에게 필요한 상기 설명서처럼 상기 키트 중에 함유될 것이다.

실시예

본 발명의 다양한 태양들을 하기 실시예들을 사용하여 예시에 의해 개시할 것이다. 본 발명에 제공된 실시예들은 단지 본 발명의 몇몇 특정 실시태양들을 예시하는 것이며 본 발명의 범위를 어떠한 식으로도 제한하고자 하는 것은 아니다.

실시예 1: 미토콘드리아 융합 전사물의 검출

PCT 출원 제 PCT/CA2007/001711 호(WO 2009/039601번으로 공개됨, 그의 전체 내용이 참고로 인용됨)에서 본 출원인에 의해 앞서 확인된 미토콘드리아 4977 "공통 결실" 및 3.4 kb 결실은 전립선 조직에서 올리고-dT 선택에 의해 확인된 바와 같은 활성 전사물을 갖는 독특한 개방 판독 프레임을 생성시킨다(도 2 및 3). 유방 조직 샘플의 검사는 상기 3.4 kb 결실로부터 생성되는 안정한 폴리아데틸화된 융합 전사물의 존재를 또한 밝힌다(도 4).

결실 전사물 검출을 위한 역 전사효소-PCR 프로토콜

RNA 단리 cDNA 합성

전체 RNA를 제조자의 설명에 따라 Aurum^TM 전체 RNA 지방 및 섬유 조직 키트(Bio-Rad, Hercules, CA)를 사용하여 급속 동결된 전립선 및 유방 조직 샘플(악성 및 종양에 인접한 정상 샘플 모두)로부터 단리하였다. 본 실험에서 게놈 DNA 오염을 피해야 했기 때문에, DNase I 처리 단계를 당해 분야에 통상적으로 공지된 바와 같은 방법을 사용하여 포함시켰다. RNA 양 및 질을 ND-1000 분광광도계(NanoDrop(등록상표) technologies)로 측정하였다. 약 100 g의 출발 물질로부터, 전체 RNA 농도는 100 내지 1000 ng/ul로 변하였으며 이때 260/280 비는 1.89 내지 2.10이었다. RNA 농도를 100 ng/ul로 조절하고 각각의 주형 2 ul을 제조자의 설명에 따라 RT-PCR을 위한 슈퍼스크립트(SuperScript)^TM 첫 번째 가닥 합성 시스템(Invitrogen)과 함께 첫 번째 가닥 DNA 합성에 사용하였다. 안정한 폴리아데틸화된 융합 전사물을 확인하기 위해서, 폴리-A 꼬리로 전사물을 표적화하는 올리고(dT) 프라이머를 사용하였다.

PCR

실시간 PCR을 DNA 엔진 옵티콘(Engine Opticon^®) 2 연속 형광 검출 시스템(Bio-Rad, Hercules, CA) 상의 iQ^TM SYBR^® 그린 수퍼믹스(Bio-Rad, Hercules, CA)와 함께 각각의 cDNA 주형 5 ul을 사용하여 수행하였다. 상기 4977 bp 결실을 표적화하는 프라이머 쌍은 8416F 5'-CCTTACACTATTCCTCATCAC-3', 13637R 5'-TGACCTGTTAGGGTGAGAAG-3'이고; 상기 3.4 kb 결실에 대한 것은 ND4LF 5'-TCGCTCACACCTCATATCCTC-3', ND5R 5'-TGTGATTAGGAGTAGGGTTAGG-3'이다. 상기 반응 칵테일은 2X SYBR^® 그린 수퍼믹스(100 mM KCL, 40 mM 트리스-HCl, pH 8.4, 0.4 mM의 각각의 dNTP[dATP, dCTP, dGTP 및 dTTP], iTaq^TM DNA 폴리머라제, 50 단위/㎖, 6 mM MgCl₂, SYBR^® 그린 1, 20 nM 플루오레세인, 및 안정제), 250 nM 각각의 프라이머, 및 ddH₂O를 포함하였다. PCR 순환 매개변수는 하기와 같았다: (1) 95 ℃ 2 분, (2) 95 ℃ 30 초, (3) 55 ℃(상기 4977 bp 결실의 경우) 및 63 ℃(상기 3.4 kb 결실의 경우), (4) 72 ℃ 45 초, (5) 플레이트 판독, 이어서 39 주기의 단계 3 내지 5, 및 4 ℃에서 최종 배양. 순환 역치 및 용융 곡선 분석과 별개로, 샘플들을 증폭 산물의 특수 가시화를 위해 아가로스 젤 상에서 실행시켰다(도 2 내지 4 참조).

도 2는 상기 미토콘드리아 게놈으로부터 3.4 kb 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시하는 아가로스 젤이다. 도 2에 대한 범례: B-블랭크, 레인 1 내지 6, cDNA에서 검출된 전사물들; 레인 7 내지 12, 레인 1 내지 6의 샘플들에 대한 역 전사효소(RT) 대조군이 없음.

도 3은 4977 kb 공통 결실의 상실에 의해 촉발된 전립선 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다. 도 3에 대한 범례: B-블랭크, 레인 1 내지 6, cDNA에서 검출된 전사물들; 레인 7 내지 12, 레인 1 내지 6의 샘플들에 대한 RT 대조군이 없음.

도 4는 상기 mt게놈으로부터의 3.4 kb의 상실에 의해 촉발된 유방 샘플 중의 폴리아데닐화된 융합 전사물을 도시한다. 도 4에 대한 범례: 레인 2 내지 8, 유방 cDNA로부터의 전사물들; 레인 9, 음성(물) 대조군; 레인 10 및 11, 음성, 레인 2 및 3의 샘플들에 대한 대조군인 RT 없음.

이들 결과는 안정한 미토콘드리아 융합 전사물의 존재를 입증한다.

실시예 2: 융합 산물의 확인 및 표적화

다양한 하이브리드화 탐침들을 돌연변이된 미토콘드리아 게놈으로부터 생성되는 신규의 전사물, 예를 들어 3.4 kb 결실의 존재를 검출하고 추가로 입증하도록 디자인하였다. 이를 위해서, 정량적인 유전자 발현 분석을 위한 단일 분지된 DNA 플랫폼(QuantiGene 2.0^TM, Panomics^TM)을 사용하였다. 본 실시예에 나열된 특정한 결실 및 서열들은 서열식별번호: 1로 인용된 전체 mtDNA 게놈에 대한 그들의 상대적인 위치에 근거한다. 본 실시예에서 디자인된 상기 탐침들에 대한 4 개 전사물들의 핵산 서열은 본 발명에서 하기와 같이 확인된다: 전사물 1(서열식별번호: 19), 전사물 2(서열식별번호: 20), 전사물 3(서열식별번호: 21), 및 전사물 4(서열식별번호: 22).

상기 3.4 kb 미토콘드리아 게놈 결실로부터의 연속적인 전사물의 예는 유전자 ND4L(NADH 데하이드로게나제 서브유닛 4L) 및 ND5(NADH 데하이드로게나제 서브유닛 5)에 대해서 존재한다. 서열식별번호: 20에 대한 상보성 서열을 갖는 탐침을 사용하여 전사물 2를 검출하였다. 반복적인 요소들이 ND4L 중의 10745 내지 10754 위치 및 ND5 중의 14124 내지 14133 위치에 존재한다.

상기 3.4 kb 결실은 ND4L의 3' 단부, 전체 ND4 유전자, tRNA 히스티딘, tRNA 세린2, tRNA 류신2, 및 ND5의 5' 단부의 대부분을 제거시켜(도 5a 참조), 10744(ND4L):14124(ND5)의 연결 점을 갖는 ND4L과 ND5의 유전자 연접을 생성시킨다(도 5b).

상기 첫 번째 유전자, ND4L의 원래 개시 코돈에서 출발함으로써, 아미노산 서열이 종결 코돈이 나타날 때까지 번역되었다. 본 실시예에서 상기 종결 코돈은 ND5의 원래 종결 코돈이다. 따라서, 2 개의 유전자를 함께 연접시킴에도 불구하고, 상기 판독 프레임은 완전하게 유지되어 길이가 100 아미노산(또는 300 bp)인 가설적인 또는 예견된 전사물이 생성된다. 상기 융합 단백질 전사물 생성물을 본 발명에서 서열식별번호: 37로서 나타낸다. 상기와 같은 단백질을 암호화하는 뉴클레오타이드 서열(서열식별번호: 3)은 10470 내지 10744:14124 내지 14148의 미토콘드리아 게놈 위치에 상응한다. 서열식별번호: 3은 상술한 방식으로 검출된 RNA 전사물(서열식별번호: 20)에 상보적인 DNA 서열이다.

유사하게, 전사물 1은 위치 8469:13447(서열식별번호: 19)과 결합된 ATPase 8과 ND5 사이의 융합 전사물이다. 전사물 3 및 4(각각 서열식별번호: 21 및 서열식별번호: 22)는 각각 뉴클레오타이드 위치 7974:15496 및 7992:15730과 결합된 COII와 Cytb 사이의 융합 전사물이다. 표 3은 본 실시예에 사용된 다양한 서열들 간의 관계에 대한 요약을 제공한다. 표 3은 검출된 융합 전사물, 상기 검출된 융합 전사물에 상보성인 DNA 서열 및 각 전사물에 대한 가설적인 번역 산물을 포함한다.

실시예 3: 전립선암에의 적용

상기 논의된 4 개의 융합 전사물, 즉 전사물 1 내지 4를 사용하여, 한 명의 환자로부터의 2 개의 전립선 조직 샘플을 분석하여 새로운 예견된 융합 전사물의 정량적인 차이를 평가하였다. 상기 실험의 결과를 하기 표 2에 제공하며, 여기에서 "Homog 1"은 환자로부터의 동결된 전립선 종양 조직의 균질물을 지칭하고, "Homog 2"는 상기 환자의 종양에 인접한 동결된 정상 전립선 조직의 균질물을 지칭한다. 이들 샘플을 25.8 ㎎의 Homog 1 및 28.9 ㎎의 Homog 2로 시작하는 제조자의 프로토콜(신선한 또는 동결된 동물 조직용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^®2.0 시약 시스템 사용자 매뉴얼)에 따라 처리하였다(분석 구성을 표 5에 나타낸다).

정상적인 인접 전립선 조직에 비해 전립선암 조직 중의 증가된 미토콘드리아 융합 전사물의 존재가 명백히 입증된다. 상기 융합 전사물은 훨씬 더 낮은 수준이긴 하지만, 상기 정상 조직 중에도 존재한다. 표적 전사물에 대한 탐침의 하이브리드화에 의해 발생된 상대적인 발광 단위(RLU)는 각 전사물의 풍부성에 직접 비례한다. 표 2는 또한 상기 샘플들에 대해서 취한 판독의 변화 계수 CV(퍼센트로서 나타냄)를 나타낸다. 상기 CV는 상기 값들의 평균으로 나눈 표준 편차를 포함한다. 암 조직에서 상기와 같은 안정하게 전사된 미토콘드리아 유전자 산물의 의미는 질병의 발전 및 진행을 암시한다.

실시예 4: 유방암에의 적용

실시예 3과 동일한 프로토콜을 사용하여, 그러나 오직 3.4 kb 게놈 결실과 관련된 신규의 융합 전사물인 전사물 2에만 초점을 두어, 2 개의 유방 종양 조직 샘플 및 2 개의 상기 종양에 인접한 종양 비 함유 조직 샘플뿐만 아니라 3 개의 전립선 종양 조직 샘플(하나의 샘플은 인접한 종양 비 함유 조직을 포함한다)에 대해 분석을 수행하였다. 이들 실시예의 결과를 표 4에 제공한다. 상응하는 정상 조직 구획을 갖는 전립선 종양 조직 샘플은 상기 종양 조직이 정상의 인접 조직보다 대략 2 배의 융합 전사물 양을 갖는다는 점에서 실시예 3에서 분석된 전립선 샘플과 유사한 패턴을 나타내었다. 상기 유방 종양 샘플은 인접한 비 종양 조직에 비해 융합 전사물 수준이 현저하게 증가된 것으로 나타났다. 상기 균질물의 1:100 희석을, 상기 희석이 실시예 3에서 인용된 실험에서 가장 재현적으로 수행되었으므로 상기 분석에 사용하였다.

따라서, 상기 논의된 결과는 전립선과 유방 조직 모두의 종양 검출에 있어서 본 발명 전사물의 적용을 예시한다.

실시예 5: 직장결장암에의 적용

본 연구는 직장결장암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 9 개의 대조군(양성) 조직 샘플(샘플 1 내지 9) 및 10 개의 종양(악성) 조직 샘플(샘플 10 내지 19)을 포함한 총 19 개의 샘플을 제조하였다. 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^® 2.0 시약 시스템 사용자 매뉴얼). 7 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다. 상기 전사물들의 특징을 하기와 같이 요약한다:

유방암 전사물들의 특징
전사물 ID	연결 부위	유전자 연결
2	10744:14124	ND4L:ND5
3	7974:15496	COII:Cytb
10	7438:13476	COI:ND5
11	7775:13532	COII:ND5
12	8213:13991	COII:ND5
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼")	N/A	N/A

전사물 2 및 3은 실시예 3 및 4에 대해 상기 논의된 바와 동일함에 주목한다.

균질물들을 OCT 블록으로부터 대략 25 ㎎의 조직을 사용하여 제조하고 전사물 2 및 4의 경우 1:1 희석하고 전사물 10 및 11의 경우 1:8 희석하였다. 상기 전사물들의 양을 글로맥스(Glomax)^TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다. 상기 분석은 상기 샘플들에 대한 RLU 값들로부터 하한을 감하여 배경을 나타내었다. 입력 RNA는 식 log₂ aRLU - log₂ hRLU(여기에서 a는 표적 융합 전사물이고 h는 하우스키퍼 전사물이다)을 사용하여 나타내었다.

상기 데이터의 분석은 하기의 단계들을 포함하였다:

a) 3중 분석을 위해 CV(변화 계수)를 설정한다; ≤15%의 경우 허용 가능하다.

b) 표적 융합 전사물(a) 및 하우스키퍼 전사물(h)의 3중 분석을 위해 평균 RLU 값을 설정한다.

c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.

d) 하한(l)을 (a)로부터 감한다.

e) log2 aRLU - log2 hRLU를 계산한다.

결과의 요약:

상기 분석의 결과를 도 6a 내지 6g에 예시하며, 이는 샘플 번호에 대한 log₂ aRLU - log₂ hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.

전사물 2:

정상(p<0.10) 및 악성(p>0.09) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.6129의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.73이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 3:

정상(p<0.05) 및 악성(p=0.03) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 4.0813의 컷오프 값을 사용하여 60%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.79이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 8:

정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -6.0975의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 9:

정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -7.5555의 컷오프 값을 사용하여 60%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 10:

정상(p≤0.01) 및 악성(p=0.01) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -3.8272의 컷오프 값을 사용하여 90%의 감도 및 67%의 특이성이 생성되고 상기 곡선 아래 면적은 0.84이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 11:

정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.1753의 컷오프 값을 사용하여 70%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 12:

정상(p<0.1) 및 악성(p=0.06) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 3.2626의 컷오프 값을 사용하여 70%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

결론:

상기 결과들은 결장직장암의 검출 및 정상 결장직장 조직으로부터 악성의 식별에 있어서 전사물 2, 3, 8, 9, 10, 11 및 12의 유용성을 예시한다. 상기 가리킨 바와 같이, 전사물 2 및 3은 또한 전립선암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 2는 또한 유방암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 흑색종 피부암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 10은 또한 폐암 및 흑색종의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 8은 또한 폐암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 7 개의 전사물들 중 임의의 것을 임상 현장에서 결장직장암의 특징 검출을 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.

실시예 6: 폐암에의 적용

본 연구는 폐암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 실시예 5에서와 같이, 9 개의 대조군(양성) 조직 샘플(샘플 1 내지 9) 및 10 개의 종양(악성) 조직 샘플(샘플 10 내지 19)을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^® 2.0 시약 시스템 사용자 매뉴얼). 균질물들을 1:8 희석하였고 4 개의 표적 전사물 및 1 개의 하우스키퍼 전사물의 양을 글로맥스(Glomax)^TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다.

본 실시예를 위해 하기의 전사물들을 제조하였다:

폐암 전사물들의 특징
전사물 ID	연결 부위	유전자 연결
6	8828:14896	ATPase6:Cytb
8	6075:13799	COI:ND5
10	7438:13476	COI:ND5
20	8469:13447	ATPase8:ND5
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼")	N/A	N/A

본 실시예에 사용된 조직 샘플들은 하기의 특징들을 가졌다:

폐암 샘플들의 특징
샘플	악성	설명(조직의 공급원)
1	없음	간질성 폐질병
2	없음	폐기종
3	없음	동맥류
4	없음	기관지폐렴, COPD
5	없음	간의 악성 신생물, 기원을 알 수 없음, 폐의 석회화된 육아종
6	없음	사후 12 시간째, 순한 폐기종
7	없음	사후 12 시간째, 대 B 세포 림프종, 폐 부종, 폐렴
8	없음	폐렴, 부종, 폐포 손상
9	없음	울혈 및 부종
10	있음	선암종, 비-소 세포
11	있음	소 세포
12	있음	편평세포 암종, NSC, 폐기종
13	있음	선암종, 폐암, nsc, 전이
14	있음	편평세포 암종, 비-소 세포
15	있음	혼합된 편평 및 선암종
16	있음	비-소 세포 암종, 편평
17	있음	소 세포 암종
18	있음	선암종, 폐암, nsc
19	있음	선암종, 폐암, nsc, 전이

상기 데이터의 분석을 실시예 5에 개시된 방법에 따라 수행하였다. 상기 결과를 도 7a, 7b, 7c 및 7d에 예시한다.

결과의 요약:

전사물 6:

정상(양성, p<0.1) 및 악성(p=0.60) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -6.5691의 컷오프 값을 사용하여 80%의 감도 및 71%의 특이성이 생성되고 상기 곡선 아래 면적은 0.77이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 8:

정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p<0.05, p=0.02). 상기 ROC 곡선에 의해 입증된 바와 같은 -9.6166의 컷오프 값을 사용하여 90%의 감도 및 86%의 특이성이 생성되고 상기 곡선 아래 면적은 0.86이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 10:

정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p≤0.01, p=0.01). 상기 ROC 곡선에 의해 입증된 바와 같은 -10.6717의 컷오프 값을 사용하여 90%의 감도 및 86%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 20:

정상과 악성 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다(p≤0.1, p=0.1). 상기 ROC 곡선에 의해 입증된 바와 같은 2.5071의 컷오프 값을 사용하여 70%의 감도 및 71%의 특이성이 생성되고 상기 곡선 아래 면적은 0.74이며 이는 시험이 상당히 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

결론:

상기 실시예 6으로부터의 결과들은 폐암 종양의 검출 및 악성과 정상 폐암 조직간의 식별에 있어서 전사물 6, 8, 10, 및 20의 유용성을 예시한다. 이들 3 개의 전사물들 중 임의의 것을 임상 현장에서 폐암의 검출 또는 특성화를 위해 사용할 수 있다.

실시예 7: 흑색종에의 적용

본 연구는 흑색종의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 본 연구에서, 5 개의 대조군(양성) 조직 샘플 및 9 개의 악성 조직 샘플을 포함하여 총 14 개의 샘플을 사용하였다. 모든 샘플들을 포르말린 고정시켰으며, 파라핀 매몰시켰다(FFPE). 상기 FFPE 조직 샘플들을 균질화 전에 각각의 샘플이 대략 20 마이크론이 되도록 튜브 내로 절편화하고 제조자의 권고에 따라 균질화하였다(FFPE 샘플용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^® 2.0 시약 시스템 사용자 매뉴얼). 균질물들을 1:4 희석하였고 7 개의 표적 전사물 및 1 개의 하우스키퍼 전사물의 양을 글로맥스(Glomax)^TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다.

본 실시예에 사용된 14 개의 조직 샘플들은 하기의 특징들을 가졌다:

흑색종 암 샘플들의 특징
샘플	악성	설명(조직의 공급원)
1	없음	유방축소 조직(피부)
2	없음	유방축소 조직(피부)
3	없음	유방축소 조직(피부)
4	없음	유방축소 조직(피부)
5	없음	유방축소 조직(피부)
6	있음	악성흑색점, (같은 장소 흑색종) 침습성 흑색종 존재하지 않음
7	있음	침습성 악성 흑색종
8	있음	결절성 흑색종, pT3b, 악성흑색점의 관련 특징
9	있음	잔류성의 표면에 퍼져있는 침습성 악성 흑색종, 클라크 수준 II
10	있음	표면에 퍼져있는 악성 흑색종, 클라크 수준 II
11	있음	결절성 악성 흑색종, 클라크 수준 IV
12	있음	같은 장소에서 표면에 퍼져있는 악성 흑색종, 침습의 증거 없음
13	있음	표면에 퍼져있는 악성 흑색종, 클라크 수준 II, 집중하여 존재하는 수직 상
14	있음	같은 장소에서 표면에 퍼져있는 악성 흑색종, 클라크 수준 I

본 실시예를 위해 하기의 전사물들을 제조하였다:

흑색종 암 전사물들의 특징
전사물 ID	연결 부위	유전자 연결
6	8828:4896	ATPase6:Cytb
10	7438:13476	COI:ND5
11	7775:13532	COII:ND5
14	9191:12909	ATPase6:ND5
15	9574:12972	COIII:ND5
16	10367:12829	ND3:ND5
20	8469:13447	ATPase8:ND5
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼")	N/A	N/A

나타낸 바와 같이, 전사물 10 및 11을 또한 실시예 5에 사용하였다. 상기 데이터의 분석을 실시예 5에 개시된 방법에 따라 수행하였다. 상기 결과를 도 8a 내지 8g에 예시한다.

결과의 요약:

전사물 6:

정상(p≤0.01) 및 악성(p=0.01) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -5.9531의 컷오프 값을 사용하여 89%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 10:

정상(p≤0.05) 및 악성(p=0.05) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -4.7572의 컷오프 값을 사용하여 89%의 감도 및 40%의 특이성이 생성되고 상기 곡선 아래 면적은 0.82이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 11:

정상(p<0.05) 및 악성(p=0.02) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 1.6762의 컷오프 값을 사용하여 78%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 14:

정상(p≤0.05) 및 악성(p=0.05) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -4.9118의 컷오프 값을 사용하여 89%의 감도 및 60%의 특이성이 생성되고 상기 곡선 아래 면적은 0.82이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 15:

정상(p<0.1) 및 악성(p=0.07) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재하며, 상기 ROC 곡선에 의해 입증된 바와 같은 -7.3107의 컷오프 값을 사용하여 100%의 감도 및 67%의 특이성이 생성되고 상기 곡선 아래 면적은 0.80이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 16:

정상(p<0.05) 및 악성(p=0.03) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -10.5963의 컷오프 값을 사용하여 89%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.878이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 20:

정상(p<0.05) 및 악성(p=0.04) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 더욱이, 상기 ROC 곡선에 의해 입증된 바와 같은 -8.3543의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.89이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

결론:

상기 실시예 7로부터의 결과들은 악성 흑색종의 검출에 있어서 전사물 6, 10, 11, 14, 15, 16 및 20의 유용성을 예시한다. 상기 나타낸 바와 같이, 전사물 10 및 11은 또한 결장직장암의 검출에서도 유용성을 갖는 반면 전사물 6은 폐암의 검출에서 유용성을 갖는 것으로 밝혀졌다. 질병에 의한 전사물 요약을 표 6에 제공한다.

실시예 8: 난소암에의 적용

본 연구는 난소암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 10 개의 대조군(양성) 조직 샘플(샘플 1 내지 10) 및 10 개의 종양(악성) 조직 샘플(샘플 11 내지 20)을 포함한 총 20 개의 샘플을 제조하였다. 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^® 2.0 시약 시스템 사용자 매뉴얼). 8 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다.

본 실시예에 사용된 20 개의 조직 샘플들은 하기의 특징들을 가졌다:

난소암 샘플들의 특징
샘플	진단	설명
1	정상	난포낭종
2	정상	섬유종
3	정상	난소에 병적인 변화 없음
4	정상	난포낭종
5	정상	세포성 섬유종
6	정상	양성 난포 및 단순 낭종
7	정상	평활근종, 백체
8	정상	백체 및 상피 봉입낭
9	정상	백체
10	정상	백체, 표면 봉입낭, 난포낭종
11	악성	장막을 포함한 고 등급의 불충분하게 분화된 유두 장액 암종
12	악성	자궁내막성 선암종, 국소 장액 분화에 따라 잘 분화된 것에서부터 보통으로 분화된 것
13	악성	유두 장액 암종
14	악성	혼합된 상피 암종 우세한 유두 장액 암종
15	악성	고 등급: 장액 암종, 유두 및 고형 성장 패턴
16	악성	고 등급(3/3)의 유두 장액 암종
17	악성	유두 장액 암종, 높은 핵 등급
18	악성	유두 장액 낭성선암종 등급: III
19	악성	불충분하게 분화된 유두 장액 암종
20	악성	잘 분화된 선암종, 자궁내막성 유형, 등급 1

상기 전사물들의 특징을 하기와 같이 요약한다:

난소암 전사물들의 특징
전사물 ID	연결 부위	유전자 연결
1	8469:13447	ATPase8:ND5
2	10744:14124	ND4L:ND5
3	7974:15496	COII:Cytb
6	8828:14896	ATPase6:Cytb
11	7775:13532	COII:ND5
12	8213:13991	COII:ND5
15	9574:12972	COIII:ND5
20	8469:13447	ATPase8:ND5
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼")	N/A	N/A

전사물 1, 2, 3, 6, 11, 12, 15 및 20은 실시예 3 내지 7에 대해 상기 논의된 바와 동일함에 주목한다.

균질물들을 대략 25 ㎎의 동결된 조직을 사용하여 제조하고 1:4 희석하였다. 상기 전사물들의 양을 글로맥스(Glomax)^TM 다중 검출 시스템(Promega) 상의 상대 발광 단위 RLU로 측정하였다. 모든 샘플들을 각 전사물에 대해 3 회 중복 분석하였다. 배경 측정(주형 없음)을 또한 3 회 중복 수행하였다. 상기 분석은 상기 샘플들에 대한 RLU 값들로부터 하한을 감하여 배경을 나타내었다. 입력 RNA는 식 log₂ aRLU - log₂ hRLU(여기에서 a는 표적 융합 전사물이고 h는 하우스키퍼 전사물이다)을 사용하여 나타내었다.

상기 데이터의 분석은 하기의 단계들을 포함하였다:

c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.

d) 하한(l)을 (a)로부터 감한다.

e) log₂ aRLU - log₂ hRLU를 계산한다.

결과의 요약:

상기 분석의 결과를 도 9a 내지 9h에 예시하며, 이는 샘플 번호에 대한 log₂ aRLU - log₂ hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.

전사물 1:

정상(p<0.05) 및 악성(p=0.002) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -11.1503의 컷오프 값을 사용하여 90%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.91이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 2:

정상(p<0.01) 및 악성(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6962의 컷오프 값을 사용하여 90%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 3:

정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6754의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 6:

정상(p<0.01) 및 악성(p=0.007) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.6479의 컷오프 값을 사용하여 90%의 감도 및 70%의 특이성이 생성되고 상기 곡선 아래 면적은 0.86이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 11:

정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -1.3794의 컷오프 값을 사용하여 100%의 감도 및 90%의 특이성이 생성되고 상기 곡선 아래 면적은 0.99이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 12:

정상(p<0.01) 및 악성(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -1.2379의 컷오프 값을 사용하여 90%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.96이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 15:

정상(p<0.05) 및 악성(p=0.023) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -8.6926의 컷오프 값을 사용하여 70%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.80이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 20:

정상(p<0.01) 및 악성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.6521의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.76이며 이는 시험이 상당히 내지 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

결론:

상기 결과들은 난소암의 검출 및 정상 난소 조직으로부터 악성의 식별에 있어서 전사물 1, 2, 3, 6, 11, 12, 15 및 20의 유용성을 예시한다. 전사물 1, 2 및 3은 또한 전립선암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 6은 또한 흑색종 및 폐암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 흑색종 피부암, 결장직장암 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 12는 또한 결장직장암 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 15는 또한 흑색종 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 20은 또한 결장직장암, 흑색종 및 고환암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 8 개의 전사물들 중 임의의 것을 임상 현장에서 난소암의 특징 검출을 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.

실시예 9: 고환암에의 적용

본 연구는 고환암의 검출에서 본 발명의 여러 전사물의 유효성을 측정하고자 하였다. 8 개의 대조군(양성) 조직 샘플(샘플 1 내지 8) 및 9 개의 종양(악성) 조직 샘플(샘플 9 내지 17)을 포함한 총 17 개의 샘플을 제조하였으며, 상기 악성 샘플 중 5 개는 비-정상피종이고(샘플 9 내지 13) 4 개는 정상피종이었다(샘플 14 내지 17). 상기 샘플들을 제조자의 권고에 따라 균질화하였다(신선한 또는 동결된 동물 조직용의 QuantiGene^® 샘플 처리 키트; 및 QuantiGene^® 2.0 시약 시스템 사용자 매뉴얼). 10 개의 표적 전사물 및 하나의 하우스키퍼 전사물을 선행 실시예들에서 상기 개략한 바와 같은 방식으로 제조하였다.

본 실시예에 사용된 17 개의 조직 샘플들은 하기의 특징들을 가졌다:

고환암 샘플들의 특징
샘플	일반적인 진단	계층화된 악성 진단
1	양성	양성
2	양성	양성
3	양성	양성
4	양성	양성
5	양성	양성
6	양성	양성
7	양성	양성
8	양성	양성
9	악성	비-정상피종
10	악성	비-정상피종
11	악성	비-정상피종
12	악성	비-정상피종
13	악성	비-정상피종
14	악성	정상피종
15	악성	정상피종
16	악성	정상피종
17	악성	정상피종

상기 전사물들의 특징을 하기와 같이 요약한다:

고환암 전사물들의 특징
전사물 ID	연결 부위	유전자 연결
2	10744:14124	ND4L:ND5
3	7974:15496	COII:Cytb
4	7992:15730	COII:Cytb
11	7775:13532	COII:ND5
12	8213:13991	COII:ND5
13	9144:13816	ATPase6:ND5
15	9574:12972	COIII:ND5
16	10367:12829	ND3:ND5
20	8469:13447	ATPase8:ND5
펩티딜프로필 아이소머라제 B(PPIB)("하우스키퍼")	N/A	N/A

전사물 2, 3, 4, 11, 12, 15, 16 및 20은 실시예 3 내지 8에 대해 상기 논의된 바와 동일함에 주목한다.

상기 데이터의 분석은 하기의 단계들을 포함하였다:

c) 배경 RLU(l)의 3중 값으로부터 하한을 설정한다.

d) 하한(l)을 (a)로부터 감한다.

e) log₂ aRLU - log₂ hRLU를 계산한다.

결과의 요약:

상기 분석의 결과를 도 10 내지 18에 예시하며, 이는 샘플 번호에 대한 log₂ aRLU - log₂ hRLU의 플롯을 포함한다. 또한 각각의 전사물에 대한 결과로부터 결정된 각각의 ROC(수신자 조작 특성) 곡선을 예시한다.

일부 전사물들은 양성과 악성 고환 조직 사이를 식별하지만, 다른 것들은 정상피종 및 비-정상피종 및/또는 양성 고환 조직의 종양 서브유형들 간의 구별을 나타낸다. 따라서 각 부류로부터의 전사물들의 병용은 고환암의 검출뿐만 아니라 정상피종 또는 비-정상피종의 서브유형들로의 분류를 용이하게 할 것이 기대된다.

전사물 2:

정상(p<0.05) 및 악성 정상피종(p=0.02) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.5621의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.024) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 2.1006의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.90이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 3:

정상(p<0.05) 및 악성 정상피종(p=0.018) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.969의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.969이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.017) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.8181의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.9이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 4:

정상(p<0.05) 및 악성 (p=0.034) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.7628의 컷오프 값을 사용하여 67%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 0.833이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 11:

정상(p<0.05) 및 악성 정상피종(p=0.016) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.732의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.016) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 0.9884의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.90이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 12:

정상(p<0.1) 및 악성 정상피종(p=0.056) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.5361의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.969이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.05) 및 악성 비-정상피종(p=0.044) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.6039의 컷오프 값을 사용하여 100%의 감도 및 80%의 특이성이 생성되고 상기 곡선 아래 면적은 0.9이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 13:

정상(p<0.05) 및 악성(p=0.019) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -9.8751의 컷오프 값을 사용하여 87.5%의 감도 및 78%의 특이성이 생성되고 상기 곡선 아래 면적은 0.875이며 이는 시험이 매우 양호하게 정확함을 가리킨다. 또한 악성 비-정상피종(p<0.01) 및 양성(p=0.000) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -13.9519의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.975이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.01) 및 악성 비-정상피종(p=0.001) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -15.8501의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 15:

정상(p<0.1) 및 악성 (p=0.065) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -5.4916의 컷오프 값을 사용하여 75%의 감도 및 89%의 특이성이 생성되고 상기 곡선 아래 면적은 0.833이며 이는 시험이 양호하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 16:

정상(p<0.05) 및 정상피종과 비-정상피종 모두를 포함하는 악성(p=0.037) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -6.448의 컷오프 값을 사용하여 89%의 감도 및 75%의 특이성이 생성되고 상기 곡선 아래 면적은 0.806이며 이는 시험이 양호하게 정확함을 가리킨다. 또한 정상(p<0.05) 및 악성 정상피종(p=0.037) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 -7.4575의 컷오프 값을 사용하여 100%의 감도 및 87.5%의 특이성이 생성되고 상기 곡선 아래 면적은 0.938이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

전사물 20:

정상(p<0.01) 및 악성 정상피종(p=0.006) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.8364의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 또한 악성 정상피종(p<0.01) 및 악성 비-정상피종(p=0.004) 그룹들의 평균 간에 통계학적 유의수준 차이가 존재한다. 상기 ROC 곡선에 의해 입증된 바와 같은 1.6065의 컷오프 값을 사용하여 100%의 감도 및 100%의 특이성이 생성되고 상기 곡선 아래 면적은 1.00이며 이는 시험이 탁월하게 정확함을 가리킨다. 상기 선택된 역치를 조절하여 특정 용도에 대해 상기 시험의 특이성 또는 감도를 증가시킬 수도 있다.

결론:

상기 결과들은 고환암 및 고환암 서브유형들의 검출 및 정상 고환 조직으로부터 악성의 식별에 있어서 전사물 2, 3, 4, 11, 12, 13, 15, 16 및 20의 유용성을 예시한다. 전사물 2는 또한 전립선, 유방, 결장직장 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 3은 또한 전립선, 유방, 흑색종, 결장직장 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 4는 또한 전립선 및 결장직장암 의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 11은 또한 결장직장, 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 12는 또한 결장직장암 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 15는 또한 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 16은 또한 결흑색종 피부암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 전사물 20은 또한 결장직장암, 흑색종 및 난소암의 검출에도 유용성을 갖는 것으로 밝혀졌다. 나열된 9 개의 전사물들 중 임의의 것을 임상 현장에서 난소암의 검출 또는 특성화를 위한 도구로서 개별적으로 또는 함께 사용할 수 있다.

하나의 태양에서, 본 발명은 조직 샘플 중의 암의 존재를 측정하기 위한 분석을 수행하기 위한 키트를 제공한다. 상기 키트는 상술한 바와 같은 분석을 수행하는데 필요한 시약들을 포함한다. 특히, 상기 키트는 상술한 전사물 1 내지 17, 및 20에 상응하는 하나 이상의 하이브리드화 탐침을 함유하는 하나 이상의 용기를 포함한다. 이해되는 바와 같이, 상기 분석을 수행하기 위한 시약들은 임의의 필수 완충제, 염, 검출 시약 등을 포함할 수도 있다. 더욱이, 상기 키트는 예를 들어 균질화 또는 핵산 추출에 의해 상기 조직 샘플을 제조하는데 필요한 조직 샘플, 시약 또는 물질을 수득하기 위해서, 및 주 분석 또는 분석들을 수행하기 위해 임의의 필수 샘플 수집 장치, 용기 등을 포함할 수 있다. 상기 키트는 병든 또는 병들지 않은 조직에 허용 가능한 값을 설정 또는 확인하기 위해서 대조용 조직 또는 샘플을 또한 포함할 수도 있다.

실시예 10: 융합 단백질의 검출

세포주

융합 단백질의 존재를 2 개의 인간 전립선 세포주에서 조사하였다. 첫 번째로 정상 전립선 세포주 RWPE-1(ATCC Cat# CRL-11609), 상기 세포는 누드 마우스에서 비 종양발생성이며, 조직학적으로 정상인 성인 인간 전립선 세포 중 인간 유두종 바이러스 18에 의한 감염에 의해 확립되었다. 두 번째로 종양발생 세포주 WPE1-NA22를 검사하였다(ATCC Cat#CRL-2849). 상기 세포를 N-메틸-N-니트로소유레아에의 노출에 이어서 상기 RWPE-1 세포로부터 유도하였다. 상기 세포는 그의 모 세포주 RWPE-1과 달리 누드 마우스에서 종양발생성이다.

상기 두 세포주 모두 각질세포 무 혈청 배지(Invitrogen Cat#17005-042)에서 증식시켰으며, 배지는 소 뇌하수체 추출물 및 인간 재조합 표피 성장 인자가 보충된다. 세포를 90% 융합률로 증식시키고 이어서 TrypLE 셀렉트(Invitrogen Cat#12563029)를 사용하여 트립신 처리하였다. 이어서 세포를 자동화된 계수 시스템(Invitrogen Countess Cat#C10227)을 사용하여 카운트하고, 이어서 분액들을 급속 동결시키고 -80 ℃에서 보관하였다.

단백질 추출

세포 분획물을 큐프로테옴(Qproteome) 미토콘드리아 단리 키트(Qiagen Cat#37612)를 사용하여 RWPE1 및 WPE1-NA22 세포주 모두로부터 추출하였다. 미토콘드리아 및 세포질 분획물들을 모두 1 x 10⁷ 세포로부터 추출하였다. 이어서 단백질 농도를 퀴비트(Qubit) 형광계(Invitrogen Cat#Q32857) 상에서 측정되는 형광 단백질 분석(Quant-IT Protein, Invitrogen Cat#Q33211)을 사용하여 계산하였다.

SDS - PAGE 젤 전기영동

SDS-Page 전기영동을 큐프로테옴 미토콘드리아 단리 키트를 사용하여 제조한 미토콘드리아 및 시토졸 분획물 상에서 수행하였다. 20 ㎍의 단백질을 MES 실행 완충제(Invitrogen Cat#NP00020)를 사용하여, 4 내지 12% 미리성형된(Invitrogen Nupage Cat#NP0321) 비스-트리스 젤 환원 젤 상의 각 레인에서 실행시켰다. 상기 젤을 콜로이드성 청색 젤 색소(Invitrogen Cat#LC6025)로 밤새 염색하였다. 결과를 도 19에 예시한다. 도 19에 예시된 8 개의 젤 조각들 각각에 함유되는 것으로 예견되는 단백질들의 대략적인 크기(kD) 범위는 하기와 같다:

1	60-80
2	50-60
3	40-50
4	30-40
5	20-30
6	15-20
7	10-15
8	3.5-10

LCMS

8 개의 젤 조각을 콜로이드성의 청색 염색된 1D SDS-PAGE(도 19)의 각 레인으로부터 및 하기의 표준 과정에 따라 트립신으로 절단된 젤 중에서 절단하였다.

상기 절단 산물들은 상기 젤로부터 용출되고 증발되었다. 1 회 분취량을 LCMS 시스템(Dionex/Thermo LTQ XL orbitrap에 온라인 연결된 LC Packings Ultimate 3000) 상에 주입하고 5% MeCN에서 출발하여 110 분에 걸쳐 40% MeCN으로 가는 선형 구배 및 이온쌍 작용제로서의 포름산을 사용하여 300 ㎖/분의 유속으로 25 ㎝(75 um ID) PepMap(Dionex) 상에서 분리시켰다. MS 스펙트럼을 60000(400 Da)의 분해능으로 상기 오비트랩(orbitrap)에서 수집하고 MSMS 스펙트럼은 낮은 분해능으로 선형 이온 트랩에서 수집하였다.

데이터를 써모 프로테옴 디스커버러(Thermo Proteome Discoverer)를 사용하여 처리하여 .mgf(마스코트 유전자 포맷) 피크 목록 파일을 생성시켰으며, 이를 집에서 X!Tandem에 제출하여, 인간 프로테옴(ensembl) 및 앞서 개시된 융합 전사물들을 기본으로 하는 예견된 융합 단백질을 포함하는 맞춤 데이터베이스를 검색하였다. 오류 발견율(FDR)을 계산하기 위해서, 상기 검색된 데이터베이스는 모든 단백질들의 역 서열을 또한 포함하였다.

단백질 복합체 분석

상기 X!Tandem 맞춤 데이터베이스 검색의 종료 시, 모든 확인된 단백질 및 융합 전사물들은 반송되었다. 상기 단백질들을 그들의 log(e)⁺ 값에 의해 평가하고 상기 log(e)⁺ 가 -1 미만인 경우 유의수준으로서 분류하였으며, -3 미만의 log(e)⁺ 를 갖는 단백질들이 바람직하다. 융합 단백질들을 상기 샘플 젤 조각 중에 존재하는 융합 전사물의 기여 유전자들 각각으로부터의 하나 이상의 펩타이드의 존재에 의해 확인하였다. 상기 LC/MS-MS에 의한 상기 확인된 펩타이드로부터의 단백질 서열 유효범위를 적색으로 나타낸다. 실험 조건으로 인해 펩타이드를 관찰하기 어려울 수도 있는 단백질의 서열은 녹색으로 나타낸다. 최종적으로, 검은색으로 나타낸 단백질 서열은 펩타이드를 확인할 가능성이 애매함을 나타낸다.

확인된 융합 단백질의 실시예

다수의 미토콘드리아 융합 단백질들을 본 방법을 사용하여 확인하였다. 상기와 같은 융합 단백질들 중 4 개를 전형적인 예로서 하기에 개시한다.

실시예 융합 단백질 1

도 20a는 P0026으로서 확인된 융합 전사물에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 시토크롬 c 옥시다제 서브유닛 2(CO2) N-말단 펩타이드 ILYMTDEVNDPSLTIK 및 NADH-유비퀴논 옥시도리덕타제 쇄 3(ND3) C-말단 펩타이드 STPYECGFDPMSP(도 20a)의 존재로부터 상기 미토콘드리아 NA22 세포주(도 19)의 조각 7에서 확인되었다(log(e)⁺ = -13.2).

야생형 CO2의 가장 C-말단의 트립신 펩타이드, IFEMGPVFTL을 모든 미토콘드리아 NA22 세포 주 젤 조각.xml 데이터에 대해 검색하였다. 상기 펩타이드는 오직 젤 조각 5에서만 관찰되었다(도 19). 이는 모든 젤 조각들에 대해 인간(SwissProt) 데이터베이스(융합 전사물 없음)를 검색한 후 오직 미토콘드리아 NA22 세포 주 젤 조각 5에서 CO2 야생형 (log(e)⁺ = -42.9)(도 20b)을 확인함으로써 추가로 입증되었다.

시토크롬 c 옥시다제 서브유닛 2 펩타이드 ILYMTDEVNDPSLTIK가 젤 조각 5 및 7에서 관찰되었다. 이는 ∼25 kD의 분자량을 갖는 야생형 CO2가 20-30 kDa 젤 조각 5 중에 존재하고, CO2 N-말단의 단편이 젤 조각 7 중에 존재함을 가리킨다. DN3으로부터의 트립신 펩타이드 STPYECGFDPMSP는 오직 젤 조각 7(10-15 kDa)에서 확인되며, 상기 조각 7은 야생형 유전자(13 kDa) 및 P0026의 C-말단을 나타낸다.

융합 전사물 P0026의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 56, 서열식별번호: 57 및 서열식별번호: 58로서 제공된다.

실시예 융합 단백질 2

도 21a는 융합 전사물 P0062에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 NADH 데하이드로게나제 서브유닛 1(ND1) N-말단 펩타이드 KGPNVVGPYGLLQPFADAMK 및 YDQLMHLLWK 및 ATP 신타제 서브유닛 6 C-말단 펩타이드 LITTQQWLIK의 존재로부터 상기 미토콘드리아 NA22 세포주의 조각 5(20-30 kDa)(도 19에 도시됨)에서 확인되었다(log(e)⁺ = -41.2). 3 개의 펩타이드는 모두 미토콘드리아 NA22 세포 주 젤 조각 5(도 19)에서 확인되었지만 ND1의 가장 C-말단의 펩타이드(YDQLMHLLWK)는 오직 젤 조각 5에서만 존재하며, 상기 야생형(도 21b) 및 융합 전사물 P0062에 상응하는 융합 단백질 모두가 존재할 수 있다.

융합 전사물 P0062의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 59, 서열식별번호: 60 및 서열식별번호: 61로서 제공된다.

실시예 융합 단백질 3

도 22는 융합 전사물 P0064에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 ND1의 N-말단으로부터의 펩타이드 KGPNVVGPYGLLQPFADAMK 및 NADH 데하이드로게나제 서브유닛 2(ND2) C-말단 펩타이드 WAIIEEFTK를 갖는 상기 미토콘드리아 NA22 세포주의 조각 4(도 19에 도시됨)에서 확인되었다(log(e)⁺ = -22). 상기 ND1 C-말단 펩타이드 YDQLMHLLWK는 젤 조각 4에서 관찰되지 않았으며 P0064 및 ND2의 예상된 크기를 근거로 젤 조각 4가 P0064 및 ND2를 함유함을 암시한다.

융합 전사물 P0064의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 62, 서열식별번호: 63 및 서열식별번호: 64로서 제공된다.

실시예 융합 단백질 4

도 23a는 융합 전사물 P0176에 상응하는 융합 단백질의 아미노산 서열을 예시하며, 상기 전사물은 ND1의 N-말단으로부터의 펩타이드 KGPNVVGPYGLLQPFADAMK 및 시토크롬 c 옥시다제 서브유닛 1(CO1) C-말단 펩타이드 VFSWLATLHGSNMK 및 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK를 갖는 상기 미토콘드리아 NA22 세포주(도 19)의 조각 4에서 확인되었다(log(e)⁺ = -33.8). 상기 CO1 펩타이드들 모두는 55 kDa의 예상 크기에도 불구하고 오직 상기 미토콘드리아 NA22 세포 주의 젤 조각 4(30-40 kDa)에서만 함께 관찰되었다. 이는 모든 젤 조각들에 대해 인간(SwissProt) 데이터베이스(융합 전사물 없음)를 검색한 후 오직 미토콘드리아 NA22 세포 주 젤 조각 4에서 CO1 야생형 (log(e)⁺ = -14.6)(도 23b)을 확인함으로써 추가로 입증되었다.

젤 조각 4에서 관찰된 유일한 ND1 펩타이드는 KGPNVVGPYGLLQPFADAMK이었다. 상기 ND1 C-말단 펩타이드 YDQLMHLLWK가 존재하지 않았으므로, 야생형 D1은 상기 조각에 존재하지 않으며, 이는 P0176의 존재를 지지한다.

융합 전사물 P0176의 서열, 상기로부터 유도되는 돌연변이 DNA 및 생성 단백질들은 각각 본 발명에 서열식별번호: 65, 서열식별번호: 66 및 서열식별번호: 67로서 제공된다.

상응하는 융합 전사물

상기 4 개의 융합 단백질들 각각과 관련된 융합 전사물들의 정량적인 측정을 일련의 세포주들에서 수행하였으며, 상기 세포주들 중 2개는 LC-MS/MS 실험에 사용된 것들, 구체적으로 RWPE-1 및 WPE1-NA22(침습 잠재성이 낮은 악성 세포주이다)이었다. 이들 측정의 결과를 도 24a 내지 24d에 예시하며, 이들은 상기 논의된 4 개의 단백질에 상응한다. 도 24a-d에서, 세포주 RWPE-1은 NO로서 나타내고 세포주 WPE1-NA22는 LI로서 나타낸다. 본 실험에 포함된 추가의 세포주들은 보통 침습 잠재성(MI), 높은 침습 잠재성(HI), 및 매우 높은 침습 잠재성(VH)을 갖는 암의 계속되는 진행을 나타낸다.

상기 세포를 용해시키고 본 발명에 개시된 바와 같이 또는 앞서 PCT 출원 제 PCT/CA2009/000351 호(WO2009/117811번으로서 공개됨)(이의 전체 내용은 본 발명에 참고로 인용된다)에 개시된 바와 같이 분지하는 DNA 플랫폼상의 각각의 융합 전사물에 특이적인 맞춤 탐침을 사용하여 분석하였다. 결과는 높은 발현 수준을 나타내었다(10⁶ 내지 10⁸ 범위의 RLU 값을 가짐). 각 융합 전사물의 양에 있어서, 정상 세포에서부터 악성 세포(NO-LI)로의 초기 변형이 상기 전사물의 양의 현저한 변화에 의해서, 이어서 악성의 진행이 LI에서부터 VH로 진행함에 따라 상기 양의 연속적인 증가 또는 연속적인 감소에 의해 중단된다는 일반적인 성향이 관찰되었다.

본 발명을 몇몇 특정한 실시태양들을 참고로 개시하였지만, 본 발명의 다양한 변경들이 첨부된 청구의 범위에 개략된 바와 같은 본 발명의 목적 및 범위로부터 이탈되지 않음은 당해 분야의 숙련가들에게 자명할 것이다. 본 발명에 제공된 임의의 실시예들은 단지 본 발명을 예시할 목적으로 포함되며 본 발명을 어떠한 식으로도 제한하고자 하지 않는다. 본 발명에 제공된 임의의 도면들은 오직 본 발명의 다양한 태양들을 예시하기 위한 것이며 본 발명을 어떠한 식으로도 축소하거나 제한하고자 하는 것은 아니다. 본 발명에 인용된 모든 종래 기술들의 내용은 그 전체가 본 발명에 참고로 인용된다.

인용문헌

특히 하기의 참고문헌들을 상기 설명에 인용하였다. 이들 참고문헌의 전체 내용을 본 발명에 참고로 인용한다.

신규의 미토콘드리아 융합 전사물들에 의한 전립선암 검출

RNA	Homog 1	Homog 2	RNA	Homog 1	Homog 2	RNA	Homog 1	Homog 2	RNA
전사물 1	전사물 1	전사물 1	전사물 2	전사물 2	전사물 2	전사물 3	전사물 3	전사물 3	전사물 4
1	2	3	4	5	6	7	8	9	10
2957	353	233	144838	75374	17192	348424	333189	213844	509
3174	475	298	202793	100062	31750	320877	278137	210265	401
1041	262	114	106195	98403	36191	238467	248677	123497	181
1040	272	176	120308	116930	50323	239231	262520	129778	153
318	170	110	25155	64823	27725	100345	164606	85287	72
287	150	109	23500	50524	24629	100856	178527	84731	83
100	76	123	3002	12960	252	29203	102309	137	31
94	83	91	1263	5796	285	29092	97257	96	45

5.0	20.9	17.3	23.6	19.9	42.1	5.8	12.7	1.2	16.9
0.1	2.5	30.1	8.8	12.2	23.1	0.2	3.8	3.5	12.0
7.1	9.0	0.6	4.8	17.5	8.4	0.4	5.7	0.5	9.8
4.7	6.0	20.8	57.7	54.0	8.8	0.3	3.6	25.0	27.0

^*표에서 결과 단위들은 RLU(상대 발광 단위)이며; 데이터를 Glorunner^TM 상에서 판독한다.

%CV = 변화 계수(%로서)

범례: Homog = 균질물

Homog 1: 환자로부터의 전립선 종양 조직 샘플;

Homog 2: 환자로부터의 종양에 인접한 조직학적으로 정상인 조직

RNA: 대조용: 전립선 조직(Ambion p/n 7988)으로부터 전체 RNA

음영: 배경 측정치)

결실/전사물/가상 번역 산물 관계
결실	RNA 전사물	RNA 전사물에 상보적인 결실을 갖는 DNA 서열	전사물 번호	가상 융합 단백질
ATP 신타제 F0 서브유닛 8 대 NADH 데하이드로게나제 서브유닛 미토콘드리아 위치 8366-14148 (서열식별번호: 1과 관련하여) 번역서열은 8389번 위치에서 시작한다	서열식별번호: 19	서열식별번호: 2	1	서열식별번호: 36
NADH 데하이드로게나제 서브유닛 4L(ND4L) 대 NADH 데하이드로게나제 서브유닛 5(ND5); 미토콘드리아 위치 10470-14148(서열식별번호: 1과 관련하여)	서열식별번호: 20	서열식별번호: 3	2	서열식별번호: 37
시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb); 미토콘드리아 위치 7586-15887 (서열식별번호: 1과 관련하여)	서열식별번호: 21	서열식별번호: 4	3	서열식별번호: 38
시토크롬 c 옥시다제 서브유닛 II(COII) 대 시토크롬 b(Cytb); 미토콘드리아 위치 7586-15887 (서열식별번호: 1과 관련하여)	서열식별번호: 22	서열식별번호: 5	4	서열식별번호: 39

유방 및 전립선암 검출

		유방종양 1	유방종양에 인접한 정상 1	유방종양 2	유방종양에 인접한 정상 2	전립선 종양 3	전립선 종양 4	전립선 종양 5
		1	2	3	4	5	6	7
1:100 희석	E	68920	2971	49108	1245	46723	56679	99836
1:100 희석 복제물	F	92409	3017	60637	1512	53940	56155	100582
	G	420	3	31	6	26	25	44
	H	518	3	4	5	5	3	4

	% CV	20.6	1.1	14.9	13.7	10.1	0.7	0.5

-표의 결과 단위는 RLU(상대 발광 단위)이다

-배경 G1, H1

-빈 웰 G2-G8, H2-H8)

균질물 1 - 26 ㎎의 조직을 사용하여 프로테이나제 K(PK)로 700 ul H 용액 중에서 균질화시킴. Qiagen TissueRuptor 사용됨. 희석을 위해 균질물 상등액 400 ul, 20, 10 및 5 ul 사용됨.

균질물 1 = 종양성 전립선으로부터의 종양 조직

균질물 2 - 29 ㎎의 조직을 사용하여 PK로 700 ul H 용액 중에서 균질화시킴. Qiagen TissueRuptor 사용됨. 희석을 위해 균질물 상등액 400 ul, 20, 10 및 5 ul 사용됨.

균질물 2 = 종양성 전립선으로부터의 정상 조직

RNA 희석을 하기와 같이 수행하였다. RNA는 Ambion 으로부터의 정상 전립선으로부터의 것이었다. 분석을 중복 수행하였다.

질병에 따른 전사물 요약

탐침	전립선암	유방암	결장직장암	흑색종 피부암	폐암	난소암	고환암
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
20

<110> Genesis Genomics Inc. Parr, Ryan Dakubo, Gabriel Harbottle, Andrew Reguly, Brian Creed, Jennifer Robinson, Kerry Klein, Daniel <120> Aberrant Mitochondrial DNA, Associated Fusion Transcripts and Translation Products and Hybridization Probes Therefor <130> 102222/00099 <140> PCT <141> 2010-03-29 <150> PCT/CA2009/000351 <151> 2009-03-27 <150> US 61/040616 <151> 2008-03-28 <160> 67 <170> PatentIn version 3.5 <210> 1 <211> 16568 <212> DNA <213> Human <400> 1 gatcacaggt ctatcaccct attaaccact cacgggagct ctccatgcat ttggtatttt 60 cgtctggggg gtatgcacgc gatagcattg cgagacgctg gagccggagc accctatgtc 120 gcagtatctg tctttgattc ctgcctcatc ctattattta tcgcacctac gttcaatatt 180 acaggcgaac atacttacta aagtgtgtta attaattaat gcttgtagga cataataata 240 acaattgaat gtctgcacag ccactttcca cacagacatc ataacaaaaa atttccacca 300 aaccccccct cccccgcttc tggccacagc acttaaacac atctctgcca aaccccaaaa 360 acaaagaacc ctaacaccag cctaaccaga tttcaaattt tatcttttgg cggtatgcac 420 ttttaacagt caccccccaa ctaacacatt attttcccct cccactccca tactactaat 480 ctcatcaata caacccccgc ccatcctacc cagcacacac acaccgctgc taaccccata 540 ccccgaacca accaaacccc aaagacaccc cccacagttt atgtagctta cctcctcaaa 600 gcaatacact gaaaatgttt agacgggctc acatcacccc ataaacaaat aggtttggtc 660 ctagcctttc tattagctct tagtaagatt acacatgcaa gcatccccgt tccagtgagt 720 tcaccctcta aatcaccacg atcaaaagga acaagcatca agcacgcagc aatgcagctc 780 aaaacgctta gcctagccac acccccacgg gaaacagcag tgattaacct ttagcaataa 840 acgaaagttt aactaagcta tactaacccc agggttggtc aatttcgtgc cagccaccgc 900 ggtcacacga ttaacccaag tcaatagaag ccggcgtaaa gagtgtttta gatcaccccc 960 tccccaataa agctaaaact cacctgagtt gtaaaaaact ccagttgaca caaaatagac 1020 tacgaaagtg gctttaacat atctgaacac acaatagcta agacccaaac tgggattaga 1080 taccccacta tgcttagccc taaacctcaa cagttaaatc aacaaaactg ctcgccagaa 1140 cactacgagc cacagcttaa aactcaaagg acctggcggt gcttcatatc cctctagagg 1200 agcctgttct gtaatcgata aaccccgatc aacctcacca cctcttgctc agcctatata 1260 ccgccatctt cagcaaaccc tgatgaaggc tacaaagtaa gcgcaagtac ccacgtaaag 1320 acgttaggtc aaggtgtagc ccatgaggtg gcaagaaatg ggctacattt tctaccccag 1380 aaaactacga tagcccttat gaaacttaag ggtcgaaggt ggatttagca gtaaactaag 1440 agtagagtgc ttagttgaac agggccctga agcgcgtaca caccgcccgt caccctcctc 1500 aagtatactt caaaggacat ttaactaaaa cccctacgca tttatataga ggagacaagt 1560 cgtaacatgg taagtgtact ggaaagtgca cttggacgaa ccagagtgta gcttaacaca 1620 aagcacccaa cttacactta ggagatttca acttaacttg accgctctga gctaaaccta 1680 gccccaaacc cactccacct tactaccaga caaccttagc caaaccattt acccaaataa 1740 agtataggcg atagaaattg aaacctggcg caatagatat agtaccgcaa gggaaagatg 1800 aaaaattata accaagcata atatagcaag gactaacccc tataccttct gcataatgaa 1860 ttaactagaa ataactttgc aaggagagcc aaagctaaga cccccgaaac cagacgagct 1920 acctaagaac agctaaaaga gcacacccgt ctatgtagca aaatagtggg aagatttata 1980 ggtagaggcg acaaacctac cgagcctggt gatagctggt tgtccaagat agaatcttag 2040 ttcaacttta aatttgccca cagaaccctc taaatcccct tgtaaattta actgttagtc 2100 caaagaggaa cagctctttg gacactagga aaaaaccttg tagagagagt aaaaaattta 2160 acacccatag taggcctaaa agcagccacc aattaagaaa gcgttcaagc tcaacaccca 2220 ctacctaaaa aatcccaaac atataactga actcctcaca cccaattgga ccaatctatc 2280 accctataga agaactaatg ttagtataag taacatgaaa acattctcct ccgcataagc 2340 ctgcgtcaga ttaaaacact gaactgacaa ttaacagccc aatatctaca atcaaccaac 2400 aagtcattat taccctcact gtcaacccaa cacaggcatg ctcataagga aaggttaaaa 2460 aaagtaaaag gaactcggca aatcttaccc cgcctgttta ccaaaaacat cacctctagc 2520 atcaccagta ttagaggcac cgcctgccca gtgacacatg tttaacggcc gcggtaccct 2580 aaccgtgcaa aggtagcata atcacttgtt ccttaaatag ggacctgtat gaatggctcc 2640 acgagggttc agctgtctct tacttttaac cagtgaaatt gacctgcccg tgaagaggcg 2700 ggcataacac agcaagacga gaagacccta tggagcttta atttattaat gcaaacagta 2760 cctaacaaac ccacaggtcc taaactacca aacctgcatt aaaaatttcg gttggggcga 2820 cctcggagca gaacccaacc tccgagcagt acatgctaag acttcaccag tcaaagcgaa 2880 ctactatact caattgatcc aataacttga ccaacggaac aagttaccct agggataaca 2940 gcgcaatcct attctagagt ccatatcaac aatagggttt acgacctcga tgttggatca 3000 ggacatcccg atggtgcagc cgctattaaa ggttcgtttg ttcaacgatt aaagtcctac 3060 gtgatctgag ttcagaccgg agtaatccag gtcggtttct atctacttca aattcctccc 3120 tgtacgaaag gacaagagaa ataaggccta cttcacaaag cgccttcccc cgtaaatgat 3180 atcatctcaa cttagtatta tacccacacc cacccaagaa cagggtttgt taagatggca 3240 gagcccggta atcgcataaa acttaaaact ttacagtcag aggttcaatt cctcttctta 3300 acaacatacc catggccaac ctcctactcc tcattgtacc cattctaatc gcaatggcat 3360 tcctaatgct taccgaacga aaaattctag gctatataca actacgcaaa ggccccaacg 3420 ttgtaggccc ctacgggcta ctacaaccct tcgctgacgc cataaaactc ttcaccaaag 3480 agcccctaaa acccgccaca tctaccatca ccctctacat caccgccccg accttagctc 3540 tcaccatcgc tcttctacta tgaacccccc tccccatacc caaccccctg gtcaacctca 3600 acctaggcct cctatttatt ctagccacct ctagcctagc cgtttactca atcctctgat 3660 cagggtgagc atcaaactca aactacgccc tgatcggcgc actgcgagca gtagcccaaa 3720 caatctcata tgaagtcacc ctagccatca ttctactatc aacattacta ataagtggct 3780 cctttaacct ctccaccctt atcacaacac aagaacacct ctgattactc ctgccatcat 3840 gacccttggc cataatatga tttatctcca cactagcaga gaccaaccga acccccttcg 3900 accttgccga aggggagtcc gaactagtct caggcttcaa catcgaatac gccgcaggcc 3960 ccttcgccct attcttcata gccgaataca caaacattat tataataaac accctcacca 4020 ctacaatctt cctaggaaca acatatgacg cactctcccc tgaactctac acaacatatt 4080 ttgtcaccaa gaccctactt ctaacctccc tgttcttatg aattcgaaca gcataccccc 4140 gattccgcta cgaccaactc atacacctcc tatgaaaaaa cttcctacca ctcaccctag 4200 cattacttat atgatatgtc tccataccca ttacaatctc cagcattccc cctcaaacct 4260 aagaaatatg tctgataaaa gagttacttt gatagagtaa ataataggag cttaaacccc 4320 cttatttcta ggactatgag aatcgaaccc atccctgaga atccaaaatt ctccgtgcca 4380 cctatcacac cccatcctaa agtaaggtca gctaaataag ctatcgggcc cataccccga 4440 aaatgttggt tatacccttc ccgtactaat taatcccctg gcccaacccg tcatctactc 4500 taccatcttt gcaggcacac tcatcacagc gctaagctcg cactgatttt ttacctgagt 4560 aggcctagaa ataaacatgc tagcttttat tccagttcta accaaaaaaa taaaccctcg 4620 ttccacagaa gctgccatca agtatttcct cacgcaagca accgcatcca taatccttct 4680 aatagctatc ctcttcaaca atatactctc cggacaatga accataacca atactaccaa 4740 tcaatactca tcattaataa tcataatagc tatagcaata aaactaggaa tagccccctt 4800 tcacttctga gtcccagagg ttacccaagg cacccctctg acatccggcc tgcttcttct 4860 cacatgacaa aaactagccc ccatctcaat catataccaa atctctccct cactaaacgt 4920 aagccttctc ctcactctct caatcttatc catcatagca ggcagttgag gtggattaaa 4980 ccaaacccag ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat 5040 agcagttcta ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct 5100 aactactacc gcattcctac tactcaactt aaactccagc accacgaccc tactactatc 5160 tcgcacctga aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct 5220 aggaggcctg cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac 5280 aaaaaacaat agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta 5340 cttctaccta cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt 5400 aaaaataaaa tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc 5460 ccttaccacg ctactcctac ctatctcccc ttttatacta ataatcttat agaaatttag 5520 gttaaataca gaccaagagc cttcaaagcc ctcagtaagt tgcaatactt aatttctgta 5580 acagctaagg actgcaaaac cccactctgc atcaactgaa cgcaaatcag ccactttaat 5640 taagctaagc ccttactaga ccaatgggac ttaaacccac aaacacttag ttaacagcta 5700 agcaccctaa tcaactggct tcaatctact tctcccgccg ccgggaaaaa aggcgggaga 5760 agccccggca ggtttgaagc tgcttcttcg aatttgcaat tcaatatgaa aatcacctcg 5820 gagctggtaa aaagaggcct aacccctgtc tttagattta cagtccaatg cttcactcag 5880 ccattttacc tcacccccac tgatgttcgc cgaccgttga ctattctcta caaaccacaa 5940 agacattgga acactatacc tattattcgg cgcatgagct ggagtcctag gcacagctct 6000 aagcctcctt attcgagccg agctgggcca gccaggcaac cttctaggta acgaccacat 6060 ctacaacgtt atcgtcacag cccatgcatt tgtaataatc ttcttcatag taatacccat 6120 cataatcgga ggctttggca actgactagt tcccctaata atcggtgccc ccgatatggc 6180 gtttccccgc ataaacaaca taagcttctg actcttacct ccctctctcc tactcctgct 6240 cgcatctgct atagtggagg ccggagcagg aacaggttga acagtctacc ctcccttagc 6300 agggaactac tcccaccctg gagcctccgt agacctaacc atcttctcct tacacctagc 6360 aggtgtctcc tctatcttag gggccatcaa tttcatcaca acaattatca atataaaacc 6420 ccctgccata acccaatacc aaacgcccct cttcgtctga tccgtcctaa tcacagcagt 6480 cctacttctc ctatctctcc cagtcctagc tgctggcatc actatactac taacagaccg 6540 caacctcaac accaccttct tcgaccccgc cggaggagga gaccccattc tataccaaca 6600 cctattctga tttttcggtc accctgaagt ttatattctt atcctaccag gcttcggaat 6660 aatctcccat attgtaactt actactccgg aaaaaaagaa ccatttggat acataggtat 6720 ggtctgagct atgatatcaa ttggcttcct agggtttatc gtgtgagcac accatatatt 6780 tacagtagga atagacgtag acacacgagc atatttcacc tccgctacca taatcatcgc 6840 tatccccacc ggcgtcaaag tatttagctg actcgccaca ctccacggaa gcaatatgaa 6900 atgatctgct gcagtgctct gagccctagg attcatcttt cttttcaccg taggtggcct 6960 gactggcatt gtattagcaa actcatcact agacatcgta ctacacgaca cgtactacgt 7020 tgtagcccac ttccactatg tcctatcaat aggagctgta tttgccatca taggaggctt 7080 cattcactga tttcccctat tctcaggcta caccctagac caaacctacg ccaaaatcca 7140 tttcactatc atattcatcg gcgtaaatct aactttcttc ccacaacact ttctcggcct 7200 atccggaatg ccccgacgtt actcggacta ccccgatgca tacaccacat gaaacatcct 7260 atcatctgta ggctcattca tttctctaac agcagtaata ttaataattt tcatgatttg 7320 agaagccttc gcttcgaagc gaaaagtcct aatagtagaa gaaccctcca taaacctgga 7380 gtgactatat ggatgccccc caccctacca cacattcgaa gaacccgtat acataaaatc 7440 tagacaaaaa aggaaggaat cgaacccccc aaagctggtt tcaagccaac cccatggcct 7500 ccatgacttt ttcaaaaagg tattagaaaa accatttcat aactttgtca aagttaaatt 7560 ataggctaaa tcctatatat cttaatggca catgcagcgc aagtaggtct acaagacgct 7620 acttccccta tcatagaaga gcttatcacc tttcatgatc acgccctcat aatcattttc 7680 cttatctgct tcctagtcct gtatgccctt ttcctaacac tcacaacaaa actaactaat 7740 actaacatct cagacgctca ggaaatagaa accgtctgaa ctatcctgcc cgccatcatc 7800 ctagtcctca tcgccctccc atccctacgc atcctttaca taacagacga ggtcaacgat 7860 ccctccctta ccatcaaatc aattggccac caatggtact gaacctacga gtacaccgac 7920 tacggcggac taatcttcaa ctcctacata cttcccccat tattcctaga accaggcgac 7980 ctgcgactcc ttgacgttga caatcgagta gtactcccga ttgaagcccc cattcgtata 8040 ataattacat cacaagacgt cttgcactca tgagctgtcc ccacattagg cttaaaaaca 8100 gatgcaattc ccggacgtct aaaccaaacc actttcaccg ctacacgacc gggggtatac 8160 tacggtcaat gctctgaaat ctgtggagca aaccacagtt tcatgcccat cgtcctagaa 8220 ttaattcccc taaaaatctt tgaaataggg cccgtattta ccctatagca ccccctctac 8280 cccctctaga gcccactgta aagctaactt agcattaacc ttttaagtta aagattaaga 8340 gaaccaacac ctctttacag tgaaatgccc caactaaata ctaccgtatg gcccaccata 8400 attaccccca tactccttac actattcctc atcacccaac taaaaatatt aaacacaaac 8460 taccacctac ctccctcacc aaagcccata aaaataaaaa attataacaa accctgagaa 8520 ccaaaatgaa cgaaaatctg ttcgcttcat tcattgcccc cacaatccta ggcctacccg 8580 ccgcagtact gatcattcta tttccccctc tattgatccc cacctccaaa tatctcatca 8640 acaaccgact aatcaccacc caacaatgac taatcaaact aacctcaaaa caaatgataa 8700 ccatacacaa cactaaagga cgaacctgat ctcttatact agtatcctta atcattttta 8760 ttgccacaac taacctcctc ggactcctgc ctcactcatt tacaccaacc acccaactat 8820 ctataaacct agccatggcc atccccttat gagcgggcac agtgattata ggctttcgct 8880 ctaagattaa aaatgcccta gcccacttct taccacaagg cacacctaca ccccttatcc 8940 ccatactagt tattatcgaa accatcagcc tactcattca accaatagcc ctggccgtac 9000 gcctaaccgc taacattact gcaggccacc tactcatgca cctaattgga agcgccaccc 9060 tagcaatatc aaccattaac cttccctcta cacttatcat cttcacaatt ctaattctac 9120 tgactatcct agaaatcgct gtcgccttaa tccaagccta cgttttcaca cttctagtaa 9180 gcctctacct gcacgacaac acataatgac ccaccaatca catgcctatc atatagtaaa 9240 acccagccca tgacccctaa caggggccct ctcagccctc ctaatgacct ccggcctagc 9300 catgtgattt cacttccact ccataacgct cctcatacta ggcctactaa ccaacacact 9360 aaccatatac caatgatggc gcgatgtaac acgagaaagc acataccaag gccaccacac 9420 accacctgtc caaaaaggcc ttcgatacgg gataatccta tttattacct cagaagtttt 9480 tttcttcgca ggatttttct gagcctttta ccactccagc ctagccccta ccccccaatt 9540 aggagggcac tggcccccaa caggcatcac cccgctaaat cccctagaag tcccactcct 9600 aaacacatcc gtattactcg catcaggagt atcaatcacc tgagctcacc atagtctaat 9660 agaaaacaac cgaaaccaaa taattcaagc actgcttatt acaattttac tgggtctcta 9720 ttttaccctc ctacaagcct cagagtactt cgagtctccc ttcaccattt ccgacggcat 9780 ctacggctca acattttttg tagccacagg cttccacgga cttcacgtca ttattggctc 9840 aactttcctc actatctgct tcatccgcca actaatattt cactttacat ccaaacatca 9900 ctttggcttc gaagccgccg cctgatactg gcattttgta gatgtggttt gactatttct 9960 gtatgtctcc atctattgat gagggtctta ctcttttagt ataaatagta ccgttaactt 10020 ccaattaact agttttgaca acattcaaaa aagagtaata aacttcgcct taattttaat 10080 aatcaacacc ctcctagcct tactactaat aattattaca ttttgactac cacaactcaa 10140 cggctacata gaaaaatcca ccccttacga gtgcggcttc gaccctatat cccccgcccg 10200 cgtccctttc tccataaaat tcttcttagt agctattacc ttcttattat ttgatctaga 10260 aattgccctc cttttacccc taccatgagc cctacaaaca actaacctgc cactaatagt 10320 tatgtcatcc ctcttattaa tcatcatcct agccctaagt ctggcctatg agtgactaca 10380 aaaaggatta gactgaaccg aattggtata tagtttaaac aaaacgaatg atttcgactc 10440 attaaattat gataatcata tttaccaaat gcccctcatt tacataaata ttatactagc 10500 atttaccatc tcacttctag gaatactagt atatcgctca cacctcatat cctccctact 10560 atgcctagaa ggaataatac tatcgctgtt cattatagct actctcataa ccctcaacac 10620 ccactccctc ttagccaata ttgtgcctat tgccatacta gtctttgccg cctgcgaagc 10680 agcggtgggc ctagccctac tagtctcaat ctccaacaca tatggcctag actacgtaca 10740 taacctaaac ctactccaat gctaaaacta atcgtcccaa caattatatt actaccactg 10800 acatgacttt ccaaaaaaca cataatttga atcaacacaa ccacccacag cctaattatt 10860 agcatcatcc ctctactatt ttttaaccaa atcaacaaca acctatttag ctgttcccca 10920 accttttcct ccgaccccct aacaaccccc ctcctaatac taactacctg actcctaccc 10980 ctcacaatca tggcaagcca acgccactta tccagtgaac cactatcacg aaaaaaactc 11040 tacctctcta tactaatctc cctacaaatc tccttaatta taacattcac agccacagaa 11100 ctaatcatat tttatatctt cttcgaaacc acacttatcc ccaccttggc tatcatcacc 11160 cgatgaggca accagccaga acgcctgaac gcaggcacat acttcctatt ctacacccta 11220 gtaggctccc ttcccctact catcgcacta atttacactc acaacaccct aggctcacta 11280 aacattctac tactcactct cactgcccaa gaactatcaa actcctgagc caacaactta 11340 atatgactag cttacacaat agcttttata gtaaagatac ctctttacgg actccactta 11400 tgactcccta aagcccatgt cgaagccccc atcgctgggt caatagtact tgccgcagta 11460 ctcttaaaac taggcggcta tggtataata cgcctcacac tcattctcaa ccccctgaca 11520 aaacacatag cctacccctt ccttgtacta tccctatgag gcataattat aacaagctcc 11580 atctgcctac gacaaacaga cctaaaatcg ctcattgcat actcttcaat cagccacata 11640 gccctcgtag taacagccat tctcatccaa accccctgaa gcttcaccgg cgcagtcatt 11700 ctcataatcg cccacgggct tacatcctca ttactattct gcctagcaaa ctcaaactac 11760 gaacgcactc acagtcgcat cataatcctc tctcaaggac ttcaaactct actcccacta 11820 atagcttttt gatgacttct agcaagcctc gctaacctcg ccttaccccc cactattaac 11880 ctactgggag aactctctgt gctagtaacc acgttctcct gatcaaatat cactctccta 11940 cttacaggac tcaacatact agtcacagcc ctatactccc tctacatatt taccacaaca 12000 caatggggct cactcaccca ccacattaac aacataaaac cctcattcac acgagaaaac 12060 accctcatgt tcatacacct atcccccatt ctcctcctat ccctcaaccc cgacatcatt 12120 accgggtttt cctcttgtaa atatagttta accaaaacat cagattgtga atctgacaac 12180 agaggcttac gaccccttat ttaccgagaa agctcacaag aactgctaac tcatgccccc 12240 atgtctaaca acatggcttt ctcaactttt aaaggataac agctatccat tggtcttagg 12300 ccccaaaaat tttggtgcaa ctccaaataa aagtaataac catgcacact actataacca 12360 ccctaaccct gacttcccta attcccccca tccttaccac cctcgttaac cctaacaaaa 12420 aaaactcata cccccattat gtaaaatcca ttgtcgcatc cacctttatt atcagtctct 12480 tccccacaac aatattcatg tgcctagacc aagaagttat tatctcgaac tgacactgag 12540 ccacaaccca aacaacccag ctctccctaa gcttcaaact agactacttc tccataatat 12600 tcatccctgt agcattgttc gttacatggt ccatcataga attctcactg tgatatataa 12660 actcagaccc aaacattaat cagttcttca aatatctact catcttccta attaccatac 12720 taatcttagt taccgctaac aacctattcc aactgttcat cggctgagag ggcgtaggaa 12780 ttatatcctt cttgctcatc agttgatgat acgcccgagc agatgccaac acagcagcca 12840 ttcaagcaat cctatacaac cgtatcggcg atatcggttt catcctcgcc ttagcatgat 12900 ttatcctaca ctccaactca tgagacccac aacaaatagc ccttctaaac gctaatccaa 12960 gcctcacccc actactaggc ctcctcctag cagcagcagg caaatcagcc caattaggtc 13020 tccacccctg actcccctca gccatagaag gccccacccc agtctcagcc ctactccact 13080 caagcactat agttgtagca ggaatcttct tactcatccg cttccacccc ctagcagaaa 13140 atagcccact aatccaaact ctaacactat gcttaggcgc tatcaccact ctgttcgcag 13200 cagtctgcgc ccttacacaa aatgacatca aaaaaatcgt agccttctcc acttcaagtc 13260 aactaggact cataatagtt acaatcggca tcaaccaacc acacctagca ttcctgcaca 13320 tctgtaccca cgccttcttc aaagccatac tatttatgtg ctccgggtcc atcatccaca 13380 accttaacaa tgaacaagat attcgaaaaa taggaggact actcaaaacc atacctctca 13440 cttcaacctc cctcaccatt ggcagcctag cattagcagg aatacctttc ctcacaggtt 13500 tctactccaa agaccacatc atcgaaaccg caaacatatc atacacaaac gcctgagccc 13560 tatctattac tctcatcgct acctccctga caagcgccta tagcactcga ataattcttc 13620 tcaccctaac aggtcaacct cgcttcccca cccttactaa cattaacgaa aataacccca 13680 ccctactaaa ccccattaaa cgcctggcag ccggaagcct attcgcagga tttctcatta 13740 ctaacaacat ttcccccgca tcccccttcc aaacaacaat ccccctctac ctaaaactca 13800 cagccctcgc tgtcactttc ctaggacttc taacagccct agacctcaac tacctaacca 13860 acaaacttaa aataaaatcc ccactatgca cattttattt ctccaacata ctcggattct 13920 accctagcat cacacaccgc acaatcccct atctaggcct tcttacgagc caaaacctgc 13980 ccctactcct cctagaccta acctgactag aaaagctatt acctaaaaca atttcacagc 14040 accaaatctc cacctccatc atcacctcaa cccaaaaagg cataattaaa ctttacttcc 14100 tctctttctt cttcccactc atcctaaccc tactcctaat cacataacct attcccccga 14160 gcaatctcaa ttacaatata tacaccaaca aacaatgttc aaccagtaac tactactaat 14220 caacgcccat aatcatacaa agcccccgca ccaataggat cctcccgaat caaccctgac 14280 ccctctcctt cataaattat tcagcttcct acactattaa agtttaccac aaccaccacc 14340 ccatcatact ctttcaccca cagcaccaat cctacctcca tcgctaaccc cactaaaaca 14400 ctcaccaaga cctcaacccc tgacccccat gcctcaggat actcctcaat agccatcgct 14460 gtagtatatc caaagacaac catcattccc cctaaataaa ttaaaaaaac tattaaaccc 14520 atataacctc ccccaaaatt cagaataata acacacccga ccacaccgct aacaatcaat 14580 actaaacccc cataaatagg agaaggctta gaagaaaacc ccacaaaccc cattactaaa 14640 cccacactca acagaaacaa agcatacatc attattctcg cacggactac aaccacgacc 14700 aatgatatga aaaaccatcg ttgtatttca actacaagaa caccaatgac cccaatacgc 14760 aaaactaacc ccctaataaa attaattaac cactcattca tcgacctccc caccccatcc 14820 aacatctccg catgatgaaa cttcggctca ctccttggcg cctgcctgat cctccaaatc 14880 accacaggac tattcctagc catgcactac tcaccagacg cctcaaccgc cttttcatca 14940 atcgcccaca tcactcgaga cgtaaattat ggctgaatca tccgctacct tcacgccaat 15000 ggcgcctcaa tattctttat ctgcctcttc ctacacatcg ggcgaggcct atattacgga 15060 tcatttctct actcagaaac ctgaaacatc ggcattatcc tcctgcttgc aactatagca 15120 acagccttca taggctatgt cctcccgtga ggccaaatat cattctgagg ggccacagta 15180 attacaaact tactatccgc catcccatac attgggacag acctagttca atgaatctga 15240 ggaggctact cagtagacag tcccaccctc acacgattct ttacctttca cttcatcttg 15300 cccttcatta ttgcagccct agcaacactc cacctcctat tcttgcacga aacgggatca 15360 aacaaccccc taggaatcac ctcccattcc gataaaatca ccttccaccc ttactacaca 15420 atcaaagacg ccctcggctt acttctcttc cttctctcct taatgacatt aacactattc 15480 tcaccagacc tcctaggcga cccagacaat tataccctag ccaacccctt aaacacccct 15540 ccccacatca agcccgaatg atatttccta ttcgcctaca caattctccg atccgtccct 15600 aacaaactag gaggcgtcct tgccctatta ctatccatcc tcatcctagc aataatcccc 15660 atcctccata tatccaaaca acaaagcata atatttcgcc cactaagcca atcactttat 15720 tgactcctag ccgcagacct cctcattcta acctgaatcg gaggacaacc agtaagctac 15780 ccttttacca tcattggaca agtagcatcc gtactatact tcacaacaat cctaatccta 15840 ataccaacta tctccctaat tgaaaacaaa atactcaaat gggcctgtcc ttgtagtata 15900 aactaataca ccagtcttgt aaaccggaga tgaaaacctt tttccaagga caaatcagag 15960 aaaaagtctt taactccacc attagcaccc aaagctaaga ttctaattta aactattctc 16020 tgttctttca tggggaagca gatttgggta ccacccaagt attgactcac ccatcaacaa 16080 ccgctatgta tttcgtacat tactgccagc caccatgaat attgtacggt accataaata 16140 cttgaccacc tgtagtacat aaaaacccaa tccacatcaa aaccccctcc ccatgcttac 16200 aagcaagtac agcaatcaac cctcaactat cacacatcaa ctgcaactcc aaagccaccc 16260 ctcacccact aggataccaa caaacctacc cacccttaac agtacatagt acataaagcc 16320 atttaccgta catagcacat tacagtcaaa tcccttctcg tccccatgga tgacccccct 16380 cagatagggg tcccttgacc accatcctcc gtgaaatcaa tatcccgcac aagagtgcta 16440 ctctcctcgc tccgggccca taacacttgg gggtagctaa agtgaactgt atccgacatc 16500 tggttcctac ttcagggtca taaagcctaa atagcccaca cgttcccctt aaataagaca 16560 tcacgatg 16568 <210> 2 <211> 783 <212> DNA <213> Artificial <220> <223> cDNA <400> 2 atggcccacc ataattaccc ccatactcct tacactattc ctcatcaccc aactaaaaat 60 attaaacaca aactaccacc tacctccctc accattggca gcctagcatt agcaggaata 120 cctttcctca caggtttcta ctccaaagac cacatcatcg aaaccgcaaa catatcatac 180 acaaacgcct gagccctatc tattactctc atcgctacct ccctgacaag cgcctatagc 240 actcgaataa ttcttctcac cctaacaggt caacctcgct tccccaccct tactaacatt 300 aacgaaaata accccaccct actaaacccc attaaacgcc tggcagccgg aagcctattc 360 gcaggatttc tcattactaa caacatttcc cccgcatccc ccttccaaac aacaatcccc 420 ctctacctaa aactcacagc cctcgctgtc actttcctag gacttctaac agccctagac 480 ctcaactacc taaccaacaa acttaaaata aaatccccac tatgcacatt ttatttctcc 540 aacatactcg gattctaccc tagcatcaca caccgcacaa tcccctatct aggccttctt 600 acgagccaaa acctgcccct actcctccta gacctaacct gactagaaaa gctattacct 660 aaaacaattt cacagcacca aatctccacc tccatcatca cctcaaccca aaaaggcata 720 attaaacttt acttcctctc tttcttcttc ccactcatcc taaccctact cctaatcaca 780 taa 783 <210> 3 <211> 300 <212> DNA <213> Artificial <220> <223> cDNA <400> 3 atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60 gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120 ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180 attgccatac tagtctttgc cgcctgcgaa gcagcggtgg gcctagccct actagtctca 240 atctccaaca catatggcct agactacgta cataacctaa ccctactcct aatcacataa 300 <210> 4 <211> 781 <212> DNA <213> Artificial <220> <223> cDNA <400> 4 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacccag acaattatac cctagccaac 420 cccttaaaca cccctcccca catcaagccc gaatgatatt tcctattcgc ctacacaatt 480 ctccgatccg tccctaacaa actaggaggc gtccttgccc tattactatc catcctcatc 540 ctagcaataa tccccatcct ccatatatcc aaacaacaaa gcataatatt tcgcccacta 600 agccaatcac tttattgact cctagccgca gacctcctca ttctaacctg aatcggagga 660 caaccagtaa gctacccttt taccatcatt ggacaagtag catccgtact atacttcaca 720 acaatcctaa tcctaatacc aactatctcc ctaattgaaa acaaaatact caaatgggcc 780 t 781 <210> 5 <211> 565 <212> DNA <213> Artificial <220> <223> cDNA <400> 5 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactcctagc cgcagacctc 420 ctcattctaa cctgaatcgg aggacaacca gtaagctacc cttttaccat cattggacaa 480 gtagcatccg tactatactt cacaacaatc ctaatcctaa taccaactat ctccctaatt 540 gaaaacaaaa tactcaaatg ggcct 565 <210> 6 <211> 1174 <212> DNA <213> Artificial <220> <223> cDNA <400> 6 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420 cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480 cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540 caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600 ggagcaaacc acagtttcat gcccatattc ttgcacgaaa cgggatcaaa caacccccta 660 ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 720 ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 780 ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 840 cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 900 ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 960 tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1020 gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1080 attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1140 tccctaattg aaaacaaaat actcaaatgg gcct 1174 <210> 7 <211> 1294 <212> DNA <213> Artificial <220> <223> cDNA <400> 7 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tgcactactc accagacgcc tcaaccgcct tttcatcaat cgcccacatc 360 actcgagacg taaattatgg ctgaatcatc cgctaccttc acgccaatgg cgcctcaata 420 ttctttatct gcctcttcct acacatcggg cgaggcctat attacggatc atttctctac 480 tcagaaacct gaaacatcgg cattatcctc ctgcttgcaa ctatagcaac agccttcata 540 ggctatgtcc tcccgtgagg ccaaatatca ttctgagggg ccacagtaat tacaaactta 600 ctatccgcca tcccatacat tgggacagac ctagttcaat gaatctgagg aggctactca 660 gtagacagtc ccaccctcac acgattcttt acctttcact tcatcttgcc cttcattatt 720 gcagccctag caacactcca cctcctattc ttgcacgaaa cgggatcaaa caacccccta 780 ggaatcacct cccattccga taaaatcacc ttccaccctt actacacaat caaagacgcc 840 ctcggcttac ttctcttcct tctctcctta atgacattaa cactattctc accagacctc 900 ctaggcgacc cagacaatta taccctagcc aaccccttaa acacccctcc ccacatcaag 960 cccgaatgat atttcctatt cgcctacaca attctccgat ccgtccctaa caaactagga 1020 ggcgtccttg ccctattact atccatcctc atcctagcaa taatccccat cctccatata 1080 tccaaacaac aaagcataat atttcgccca ctaagccaat cactttattg actcctagcc 1140 gcagacctcc tcattctaac ctgaatcgga ggacaaccag taagctaccc ttttaccatc 1200 attggacaag tagcatccgt actatacttc acaacaatcc taatcctaat accaactatc 1260 tccctaattg aaaacaaaat actcaaatgg gcct 1294 <210> 8 <211> 1228 <212> DNA <213> Artificial <220> <223> cDNA <400> 8 atgcccctca tttacataaa tattatacta gcatttacca tctcacttct aggaatacta 60 gtatatcgct cacacctcat atcctcccta ctatgcctag aaggaataat actatcgctg 120 ttcattatag ctactctcat aaccctcaac acccactccc tcttagccaa tattgtgcct 180 attgccatac tagtctttgg cgcctgcctg atcctccaaa tcaccacagg actattccta 240 gccatgcact actcaccaga cgcctcaacc gccttttcat caatcgccca catcactcga 300 gacgtaaatt atggctgaat catccgctac cttcacgcca atggcgcctc aatattcttt 360 atctgcctct tcctacacat cgggcgaggc ctatattacg gatcatttct ctactcagaa 420 acctgaaaca tcggcattat cctcctgctt gcaactatag caacagcctt cataggctat 480 gtcctcccgt gaggccaaat atcattctga ggggccacag taattacaaa cttactatcc 540 gccatcccat acattgggac agacctagtt caatgaatct gaggaggcta ctcagtagac 600 agtcccaccc tcacacgatt ctttaccttt cacttcatct tgcccttcat tattgcagcc 660 ctagcaacac tccacctcct attcttgcac gaaacgggat caaacaaccc cctaggaatc 720 acctcccatt ccgataaaat caccttccac ccttactaca caatcaaaga cgccctcggc 780 ttacttctct tccttctctc cttaatgaca ttaacactat tctcaccaga cctcctaggc 840 gacccagaca attataccct agccaacccc ttaaacaccc ctccccacat caagcccgaa 900 tgatatttcc tattcgccta cacaattctc cgatccgtcc ctaacaaact aggaggcgtc 960 cttgccctat tactatccat cctcatccta gcaataatcc ccatcctcca tatatccaaa 1020 caacaaagca taatatttcg cccactaagc caatcacttt attgactcct agccgcagac 1080 ctcctcattc taacctgaat cggaggacaa ccagtaagct acccttttac catcattgga 1140 caagtagcat ccgtactata cttcacaaca atcctaatcc taataccaac tatctcccta 1200 attgaaaaca aaatactcaa atgggcct 1228 <210> 9 <211> 522 <212> DNA <213> Artificial <220> <223> cDNA <400> 9 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 ctcgctgtca ctttcctagg acttctaaca gccctagacc tcaactacct aaccaacaaa 240 cttaaaataa aatccccact atgcacattt tatttctcca acatactcgg attctaccct 300 agcatcacac accgcacaat cccctatcta ggccttctta cgagccaaaa cctgccccta 360 ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 420 atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 480 ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 522 <210> 10 <211> 582 <212> DNA <213> Artificial <220> <223> cDNA <400> 10 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240 tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300 agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360 ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420 gccctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 480 atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 540 ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 582 <210> 11 <211> 2208 <212> DNA <213> Artificial <220> <223> cDNA <400> 11 atgttcgccg accgttgact attctctaca aaccacaaag acattggaac actataccta 60 ttattcggcg catgagctgg agtcctaggc acagctctaa gcctccttat tcgagccgag 120 ctgggccagc caggcaacct tctaggtaac gaccacatct acaacgttat cgtcacagcc 180 catgcatttg taataatctt cttcatagta atacccatca taatcggagg ctttggcaac 240 tgactagttc ccctaataat cggtgccccc gatatggcgt ttccccgcat aaacaacata 300 agcttctgac tcttacctcc ctctctccta ctcctgctcg catctgctat agtggaggcc 360 ggagcaggaa caggttgaac agtctaccct cccttagcag ggaactactc ccaccctgga 420 gcctccgtag acctaaccat cttctcctta cacctagcag gtgtctcctc tatcttaggg 480 gccatcaatt tcatcacaac aattatcaat ataaaacccc ctgccataac ccaataccaa 540 acgcccctct tcgtctgatc cgtcctaatc acagcagtcc tacttctcct atctctccca 600 gtcctagctg ctggcatcac tatactacta acagaccgca acctcaacac caccttcttc 660 gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 720 cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 780 tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 840 ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 900 acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 960 tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 1020 gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1080 tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1140 ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1200 tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1260 gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1320 tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1380 tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1440 aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1500 ccctaccaca cattcgaaga acccgtatac ataaaagcag gaataccttt cctcacaggt 1560 ttctactcca aagaccacat catcgaaacc gcaaacatat catacacaaa cgcctgagcc 1620 ctatctatta ctctcatcgc tacctccctg acaagcgcct atagcactcg aataattctt 1680 ctcaccctaa caggtcaacc tcgcttcccc acccttacta acattaacga aaataacccc 1740 accctactaa accccattaa acgcctggca gccggaagcc tattcgcagg atttctcatt 1800 actaacaaca tttcccccgc atcccccttc caaacaacaa tccccctcta cctaaaactc 1860 acagccctcg ctgtcacttt cctaggactt ctaacagccc tagacctcaa ctacctaacc 1920 aacaaactta aaataaaatc cccactatgc acattttatt tctccaacat actcggattc 1980 taccctagca tcacacaccg cacaatcccc tatctaggcc ttcttacgag ccaaaacctg 2040 cccctactcc tcctagacct aacctgacta gaaaagctat tacctaaaac aatttcacag 2100 caccaaatct ccacctccat catcacctca acccaaaaag gcataattaa actttacttc 2160 ctctctttct tcttcccact catcctaacc ctactcctaa tcacataa 2208 <210> 12 <211> 807 <212> DNA <213> Artificial <220> <223> cDNA <400> 12 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg caaacatatc atacacaaac gcctgagccc tatctattac tctcatcgct 240 acctccctga caagcgccta tagcactcga ataattcttc tcaccctaac aggtcaacct 300 cgcttcccca cccttactaa cattaacgaa aataacccca ccctactaaa ccccattaaa 360 cgcctggcag ccggaagcct attcgcagga tttctcatta ctaacaacat ttcccccgca 420 tcccccttcc aaacaacaat ccccctctac ctaaaactca cagccctcgc tgtcactttc 480 ctaggacttc taacagccct agacctcaac tacctaacca acaaacttaa aataaaatcc 540 ccactatgca cattttattt ctccaacata ctcggattct accctagcat cacacaccgc 600 acaatcccct atctaggcct tcttacgagc caaaacctgc ccctactcct cctagaccta 660 acctgactag aaaagctatt acctaaaaca atttcacagc accaaatctc cacctccatc 720 atcacctcaa cccaaaaagg cataattaaa ctttacttcc tctctttctt cttcccactc 780 atcctaaccc tactcctaat cacataa 807 <210> 13 <211> 786 <212> DNA <213> Artificial <220> <223> cDNA <400> 13 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420 cgagtagtac tcccgattga agcccccatt cgtataataa ttacatcaca agacgtcttg 480 cactcatgag ctgtccccac attaggctta aaaacagatg caattcccgg acgtctaaac 540 caaaccactt tcaccgctac acgaccgggg gtatactacg gtcaatgctc tgaaatctgt 600 ggagcaaacc acagtttcat gcccatcgtc ctagacctaa cctgactaga aaagctatta 660 cctaaaacaa tttcacagca ccaaatctcc acctccatca tcacctcaac ccaaaaaggc 720 ataattaaac tttacttcct ctctttcttc ttcccactca tcctaaccct actcctaatc 780 acataa 786 <210> 14 <211> 1905 <212> DNA <213> Artificial <220> <223> cDNA <400> 14 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360 attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420 ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480 accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540 atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600 atcctagaaa tcgctgtcgc cttaatccaa gcctacgttt tcacacttct agtaagcctc 660 tacctacact ccaactcatg agacccacaa caaatagccc ttctaaacgc taatccaagc 720 ctcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 780 cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 840 agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 900 agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 960 gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 1020 ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 1080 tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 1140 cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 1200 tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 1260 tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 1320 tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1380 accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1440 ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1500 aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1560 gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1620 aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1680 cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1740 ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1800 caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1860 tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1905 <210> 15 <211> 1545 <212> DNA <213> Artificial <220> <223> cDNA <400> 15 atgacccacc aatcacatgc ctatcatata gtaaaaccca gcccatgacc cctaacaggg 60 gccctctcag ccctcctaat gacctccggc ctagccatgt gatttcactt ccactccata 120 acgctcctca tactaggcct actaaccaac acactaacca tataccaatg atggcgcgat 180 gtaacacgag aaagcacata ccaaggccac cacacaccac ctgtccaaaa aggccttcga 240 tacgggataa tcctatttat tacctcagaa gtttttttct tcgcaggatt tttctgagcc 300 ttttaccact ccagcctagc ccctaccccc caattaggag ggcactggcc cccaacaggc 360 atcaccccac tactaggcct cctcctagca gcagcaggca aatcagccca attaggtctc 420 cacccctgac tcccctcagc catagaaggc cccaccccag tctcagccct actccactca 480 agcactatag ttgtagcagg aatcttctta ctcatccgct tccaccccct agcagaaaat 540 agcccactaa tccaaactct aacactatgc ttaggcgcta tcaccactct gttcgcagca 600 gtctgcgccc ttacacaaaa tgacatcaaa aaaatcgtag ccttctccac ttcaagtcaa 660 ctaggactca taatagttac aatcggcatc aaccaaccac acctagcatt cctgcacatc 720 tgtacccacg ccttcttcaa agccatacta tttatgtgct ccgggtccat catccacaac 780 cttaacaatg aacaagatat tcgaaaaata ggaggactac tcaaaaccat acctctcact 840 tcaacctccc tcaccattgg cagcctagca ttagcaggaa tacctttcct cacaggtttc 900 tactccaaag accacatcat cgaaaccgca aacatatcat acacaaacgc ctgagcccta 960 tctattactc tcatcgctac ctccctgaca agcgcctata gcactcgaat aattcttctc 1020 accctaacag gtcaacctcg cttccccacc cttactaaca ttaacgaaaa taaccccacc 1080 ctactaaacc ccattaaacg cctggcagcc ggaagcctat tcgcaggatt tctcattact 1140 aacaacattt cccccgcatc ccccttccaa acaacaatcc ccctctacct aaaactcaca 1200 gccctcgctg tcactttcct aggacttcta acagccctag acctcaacta cctaaccaac 1260 aaacttaaaa taaaatcccc actatgcaca ttttatttct ccaacatact cggattctac 1320 cctagcatca cacaccgcac aatcccctat ctaggccttc ttacgagcca aaacctgccc 1380 ctactcctcc tagacctaac ctgactagaa aagctattac ctaaaacaat ttcacagcac 1440 caaatctcca cctccatcat cacctcaacc caaaaaggca taattaaact ttacttcctc 1500 tctttcttct tcccactcat cctaacccta ctcctaatca cataa 1545 <210> 16 <211> 1629 <212> DNA <213> Artificial <220> <223> cDNA <400> 16 ataaacttcg ccttaatttt aataatcaac accctcctag ccttactact aataattatt 60 acattttgac taccacaact caacggctac atagaaaaat ccacccctta cgagtgcggc 120 ttcgacccta tatcccccgc ccgcgtccct ttctccataa aattcttctt agtagctatt 180 accttcttat tatttgatct agaaattgcc ctccttttac ccctaccatg agccctacaa 240 acaactaacc tgccactaat agttatgtca tccctcttat taatcatcat cctagcccta 300 agtctggcca acacagcagc cattcaagca atcctataca accgtatcgg cgatatcggt 360 ttcatcctcg ccttagcatg atttatccta cactccaact catgagaccc acaacaaata 420 gcccttctaa acgctaatcc aagcctcacc ccactactag gcctcctcct agcagcagca 480 ggcaaatcag cccaattagg tctccacccc tgactcccct cagccataga aggccccacc 540 ccagtctcag ccctactcca ctcaagcact atagttgtag caggaatctt cttactcatc 600 cgcttccacc ccctagcaga aaatagccca ctaatccaaa ctctaacact atgcttaggc 660 gctatcacca ctctgttcgc agcagtctgc gcccttacac aaaatgacat caaaaaaatc 720 gtagccttct ccacttcaag tcaactagga ctcataatag ttacaatcgg catcaaccaa 780 ccacacctag cattcctgca catctgtacc cacgccttct tcaaagccat actatttatg 840 tgctccgggt ccatcatcca caaccttaac aatgaacaag atattcgaaa aataggagga 900 ctactcaaaa ccatacctct cacttcaacc tccctcacca ttggcagcct agcattagca 960 ggaatacctt tcctcacagg tttctactcc aaagaccaca tcatcgaaac cgcaaacata 1020 tcatacacaa acgcctgagc cctatctatt actctcatcg ctacctccct gacaagcgcc 1080 tatagcactc gaataattct tctcacccta acaggtcaac ctcgcttccc cacccttact 1140 aacattaacg aaaataaccc caccctacta aaccccatta aacgcctggc agccggaagc 1200 ctattcgcag gatttctcat tactaacaac atttcccccg catccccctt ccaaacaaca 1260 atccccctct acctaaaact cacagccctc gctgtcactt tcctaggact tctaacagcc 1320 ctagacctca actacctaac caacaaactt aaaataaaat ccccactatg cacattttat 1380 ttctccaaca tactcggatt ctaccctagc atcacacacc gcacaatccc ctatctaggc 1440 cttcttacga gccaaaacct gcccctactc ctcctagacc taacctgact agaaaagcta 1500 ttacctaaaa caatttcaca gcaccaaatc tccacctcca tcatcacctc aacccaaaaa 1560 ggcataatta aactttactt cctctctttc ttcttcccac tcatcctaac cctactccta 1620 atcacataa 1629 <210> 17 <211> 642 <212> DNA <213> Artificial <220> <223> cDNA <400> 17 atgctaaaac taatcgtccc aacaattata ttactaccac tgacatgact ttccaaaaaa 60 cacataattt gaatcaacac aaccacccac agcctaatta ttagcatcat ccctctacta 120 ttttttaacc aaatcaacaa caacctattt agctgttccc caaccttttc ctccgacccc 180 ctaacaaccc ccctcctaat actaactacc tgactcctac ccctcacaat catggcaagc 240 caacgccact tatccagtga accactatca cgaaaaaaac tctacctctc tatactaatc 300 tccctacaaa tctccttaat tataacattc acagccacag aactaatcat attttatatc 360 ttcttcgaaa ccacacttat ccccaccttg gctatcatca cccgatgagg caaccagcca 420 gaacgcctga acgcaggcac atacttccta ttctacaccc tagtaggctc cctgccccta 480 ctcctcctag acctaacctg actagaaaag ctattaccta aaacaatttc acagcaccaa 540 atctccacct ccatcatcac ctcaacccaa aaaggcataa ttaaacttta cttcctctct 600 ttcttcttcc cactcatcct aaccctactc ctaatcacat aa 642 <210> 18 <211> 129 <212> DNA <213> Artificial <220> <223> cDNA <400> 18 atgccccaac taaatactac cgtatggccc accataatta cccccatact ccttacacta 60 ttcctcatca cccaactaaa aatattaaac acaaactacc acctacctcc ctcaccattg 120 gcagcctag 129 <210> 19 <211> 783 <212> RNA <213> Human <400> 19 auggcccacc auaauuaccc ccauacuccu uacacuauuc cucaucaccc aacuaaaaau 60 auuaaacaca aacuaccacc uaccucccuc accauuggca gccuagcauu agcaggaaua 120 ccuuuccuca cagguuucua cuccaaagac cacaucaucg aaaccgcaaa cauaucauac 180 acaaacgccu gagcccuauc uauuacucuc aucgcuaccu cccugacaag cgccuauagc 240 acucgaauaa uucuucucac ccuaacaggu caaccucgcu uccccacccu uacuaacauu 300 aacgaaaaua accccacccu acuaaacccc auuaaacgcc uggcagccgg aagccuauuc 360 gcaggauuuc ucauuacuaa caacauuucc cccgcauccc ccuuccaaac aacaaucccc 420 cucuaccuaa aacucacagc ccucgcuguc acuuuccuag gacuucuaac agcccuagac 480 cucaacuacc uaaccaacaa acuuaaaaua aaauccccac uaugcacauu uuauuucucc 540 aacauacucg gauucuaccc uagcaucaca caccgcacaa uccccuaucu aggccuucuu 600 acgagccaaa accugccccu acuccuccua gaccuaaccu gacuagaaaa gcuauuaccu 660 aaaacaauuu cacagcacca aaucuccacc uccaucauca ccucaaccca aaaaggcaua 720 auuaaacuuu acuuccucuc uuucuucuuc ccacucaucc uaacccuacu ccuaaucaca 780 uaa 783 <210> 20 <211> 300 <212> RNA <213> Human <400> 20 augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60 guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120 uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180 auugccauac uagucuuugc cgccugcgaa gcagcggugg gccuagcccu acuagucuca 240 aucuccaaca cauauggccu agacuacgua cauaaccuaa cccuacuccu aaucacauaa 300 <210> 21 <211> 781 <212> RNA <213> Human <400> 21 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgacccag acaauuauac ccuagccaac 420 cccuuaaaca ccccucccca caucaagccc gaaugauauu uccuauucgc cuacacaauu 480 cuccgauccg ucccuaacaa acuaggaggc guccuugccc uauuacuauc cauccucauc 540 cuagcaauaa uccccauccu ccauauaucc aaacaacaaa gcauaauauu ucgcccacua 600 agccaaucac uuuauugacu ccuagccgca gaccuccuca uucuaaccug aaucggagga 660 caaccaguaa gcuacccuuu uaccaucauu ggacaaguag cauccguacu auacuucaca 720 acaauccuaa uccuaauacc aacuaucucc cuaauugaaa acaaaauacu caaaugggcc 780 u 781 <210> 22 <211> 565 <212> RNA <213> Human <400> 22 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuagc cgcagaccuc 420 cucauucuaa ccugaaucgg aggacaacca guaagcuacc cuuuuaccau cauuggacaa 480 guagcauccg uacuauacuu cacaacaauc cuaauccuaa uaccaacuau cucccuaauu 540 gaaaacaaaa uacucaaaug ggccu 565 <210> 23 <211> 1174 <212> RNA <213> Human <400> 23 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420 cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480 cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540 caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600 ggagcaaacc acaguuucau gcccauauuc uugcacgaaa cgggaucaaa caacccccua 660 ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 720 cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 780 cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 840 cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 900 ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 960 uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1020 gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1080 auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1140 ucccuaauug aaaacaaaau acucaaaugg gccu 1174 <210> 24 <211> 1294 <212> RNA <213> Human <400> 24 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca ugcacuacuc accagacgcc ucaaccgccu uuucaucaau cgcccacauc 360 acucgagacg uaaauuaugg cugaaucauc cgcuaccuuc acgccaaugg cgccucaaua 420 uucuuuaucu gccucuuccu acacaucggg cgaggccuau auuacggauc auuucucuac 480 ucagaaaccu gaaacaucgg cauuauccuc cugcuugcaa cuauagcaac agccuucaua 540 ggcuaugucc ucccgugagg ccaaauauca uucugagggg ccacaguaau uacaaacuua 600 cuauccgcca ucccauacau ugggacagac cuaguucaau gaaucugagg aggcuacuca 660 guagacaguc ccacccucac acgauucuuu accuuucacu ucaucuugcc cuucauuauu 720 gcagcccuag caacacucca ccuccuauuc uugcacgaaa cgggaucaaa caacccccua 780 ggaaucaccu cccauuccga uaaaaucacc uuccacccuu acuacacaau caaagacgcc 840 cucggcuuac uucucuuccu ucucuccuua augacauuaa cacuauucuc accagaccuc 900 cuaggcgacc cagacaauua uacccuagcc aaccccuuaa acaccccucc ccacaucaag 960 cccgaaugau auuuccuauu cgccuacaca auucuccgau ccgucccuaa caaacuagga 1020 ggcguccuug cccuauuacu auccauccuc auccuagcaa uaauccccau ccuccauaua 1080 uccaaacaac aaagcauaau auuucgccca cuaagccaau cacuuuauug acuccuagcc 1140 gcagaccucc ucauucuaac cugaaucgga ggacaaccag uaagcuaccc uuuuaccauc 1200 auuggacaag uagcauccgu acuauacuuc acaacaaucc uaauccuaau accaacuauc 1260 ucccuaauug aaaacaaaau acucaaaugg gccu 1294 <210> 25 <211> 1228 <212> RNA <213> Human <400> 25 augccccuca uuuacauaaa uauuauacua gcauuuacca ucucacuucu aggaauacua 60 guauaucgcu cacaccucau auccucccua cuaugccuag aaggaauaau acuaucgcug 120 uucauuauag cuacucucau aacccucaac acccacuccc ucuuagccaa uauugugccu 180 auugccauac uagucuuugg cgccugccug auccuccaaa ucaccacagg acuauuccua 240 gccaugcacu acucaccaga cgccucaacc gccuuuucau caaucgccca caucacucga 300 gacguaaauu auggcugaau cauccgcuac cuucacgcca auggcgccuc aauauucuuu 360 aucugccucu uccuacacau cgggcgaggc cuauauuacg gaucauuucu cuacucagaa 420 accugaaaca ucggcauuau ccuccugcuu gcaacuauag caacagccuu cauaggcuau 480 guccucccgu gaggccaaau aucauucuga ggggccacag uaauuacaaa cuuacuaucc 540 gccaucccau acauugggac agaccuaguu caaugaaucu gaggaggcua cucaguagac 600 agucccaccc ucacacgauu cuuuaccuuu cacuucaucu ugcccuucau uauugcagcc 660 cuagcaacac uccaccuccu auucuugcac gaaacgggau caaacaaccc ccuaggaauc 720 accucccauu ccgauaaaau caccuuccac ccuuacuaca caaucaaaga cgcccucggc 780 uuacuucucu uccuucucuc cuuaaugaca uuaacacuau ucucaccaga ccuccuaggc 840 gacccagaca auuauacccu agccaacccc uuaaacaccc cuccccacau caagcccgaa 900 ugauauuucc uauucgccua cacaauucuc cgauccgucc cuaacaaacu aggaggcguc 960 cuugcccuau uacuauccau ccucauccua gcaauaaucc ccauccucca uauauccaaa 1020 caacaaagca uaauauuucg cccacuaagc caaucacuuu auugacuccu agccgcagac 1080 cuccucauuc uaaccugaau cggaggacaa ccaguaagcu acccuuuuac caucauugga 1140 caaguagcau ccguacuaua cuucacaaca auccuaaucc uaauaccaac uaucucccua 1200 auugaaaaca aaauacucaa augggccu 1228 <210> 26 <211> 522 <212> RNA <213> Human <400> 26 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 cucgcuguca cuuuccuagg acuucuaaca gcccuagacc ucaacuaccu aaccaacaaa 240 cuuaaaauaa aauccccacu augcacauuu uauuucucca acauacucgg auucuacccu 300 agcaucacac accgcacaau ccccuaucua ggccuucuua cgagccaaaa ccugccccua 360 cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 420 aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 480 uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 522 <210> 27 <211> 582 <212> RNA <213> Human <400> 27 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240 ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300 agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360 ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420 gcccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 480 aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 540 uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 582 <210> 28 <211> 2208 <212> RNA <213> Human <400> 28 auguucgccg accguugacu auucucuaca aaccacaaag acauuggaac acuauaccua 60 uuauucggcg caugagcugg aguccuaggc acagcucuaa gccuccuuau ucgagccgag 120 cugggccagc caggcaaccu ucuagguaac gaccacaucu acaacguuau cgucacagcc 180 caugcauuug uaauaaucuu cuucauagua auacccauca uaaucggagg cuuuggcaac 240 ugacuaguuc cccuaauaau cggugccccc gauauggcgu uuccccgcau aaacaacaua 300 agcuucugac ucuuaccucc cucucuccua cuccugcucg caucugcuau aguggaggcc 360 ggagcaggaa cagguugaac agucuacccu cccuuagcag ggaacuacuc ccacccugga 420 gccuccguag accuaaccau cuucuccuua caccuagcag gugucuccuc uaucuuaggg 480 gccaucaauu ucaucacaac aauuaucaau auaaaacccc cugccauaac ccaauaccaa 540 acgccccucu ucgucugauc cguccuaauc acagcagucc uacuucuccu aucucuccca 600 guccuagcug cuggcaucac uauacuacua acagaccgca accucaacac caccuucuuc 660 gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 720 ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 780 uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 840 ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 900 acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 960 uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 1020 gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1080 ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1140 cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1200 ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1260 guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1320 ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1380 ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1440 aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1500 cccuaccaca cauucgaaga acccguauac auaaaagcag gaauaccuuu ccucacaggu 1560 uucuacucca aagaccacau caucgaaacc gcaaacauau cauacacaaa cgccugagcc 1620 cuaucuauua cucucaucgc uaccucccug acaagcgccu auagcacucg aauaauucuu 1680 cucacccuaa caggucaacc ucgcuucccc acccuuacua acauuaacga aaauaacccc 1740 acccuacuaa accccauuaa acgccuggca gccggaagcc uauucgcagg auuucucauu 1800 acuaacaaca uuucccccgc aucccccuuc caaacaacaa ucccccucua ccuaaaacuc 1860 acagcccucg cugucacuuu ccuaggacuu cuaacagccc uagaccucaa cuaccuaacc 1920 aacaaacuua aaauaaaauc cccacuaugc acauuuuauu ucuccaacau acucggauuc 1980 uacccuagca ucacacaccg cacaaucccc uaucuaggcc uucuuacgag ccaaaaccug 2040 ccccuacucc uccuagaccu aaccugacua gaaaagcuau uaccuaaaac aauuucacag 2100 caccaaaucu ccaccuccau caucaccuca acccaaaaag gcauaauuaa acuuuacuuc 2160 cucucuuucu ucuucccacu cauccuaacc cuacuccuaa ucacauaa 2208 <210> 29 <211> 807 <212> RNA <213> Human <400> 29 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg caaacauauc auacacaaac gccugagccc uaucuauuac ucucaucgcu 240 accucccuga caagcgccua uagcacucga auaauucuuc ucacccuaac aggucaaccu 300 cgcuucccca cccuuacuaa cauuaacgaa aauaacccca cccuacuaaa ccccauuaaa 360 cgccuggcag ccggaagccu auucgcagga uuucucauua cuaacaacau uucccccgca 420 ucccccuucc aaacaacaau cccccucuac cuaaaacuca cagcccucgc ugucacuuuc 480 cuaggacuuc uaacagcccu agaccucaac uaccuaacca acaaacuuaa aauaaaaucc 540 ccacuaugca cauuuuauuu cuccaacaua cucggauucu acccuagcau cacacaccgc 600 acaauccccu aucuaggccu ucuuacgagc caaaaccugc cccuacuccu ccuagaccua 660 accugacuag aaaagcuauu accuaaaaca auuucacagc accaaaucuc caccuccauc 720 aucaccucaa cccaaaaagg cauaauuaaa cuuuacuucc ucucuuucuu cuucccacuc 780 auccuaaccc uacuccuaau cacauaa 807 <210> 30 <211> 786 <212> RNA <213> Human <400> 30 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420 cgaguaguac ucccgauuga agcccccauu cguauaauaa uuacaucaca agacgucuug 480 cacucaugag cuguccccac auuaggcuua aaaacagaug caauucccgg acgucuaaac 540 caaaccacuu ucaccgcuac acgaccgggg guauacuacg gucaaugcuc ugaaaucugu 600 ggagcaaacc acaguuucau gcccaucguc cuagaccuaa ccugacuaga aaagcuauua 660 ccuaaaacaa uuucacagca ccaaaucucc accuccauca ucaccucaac ccaaaaaggc 720 auaauuaaac uuuacuuccu cucuuucuuc uucccacuca uccuaacccu acuccuaauc 780 acauaa 786 <210> 31 <211> 1905 <212> RNA <213> Human <400> 31 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360 auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420 cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480 accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540 auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600 auccuagaaa ucgcugucgc cuuaauccaa gccuacguuu ucacacuucu aguaagccuc 660 uaccuacacu ccaacucaug agacccacaa caaauagccc uucuaaacgc uaauccaagc 720 cucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 780 caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 840 agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 900 agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 960 gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 1020 cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 1080 uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 1140 cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 1200 ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 1260 uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 1320 ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1380 acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1440 cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1500 aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1560 gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1620 aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1680 ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1740 cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1800 caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1860 ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1905 <210> 32 <211> 1545 <212> RNA <213> Human <400> 32 augacccacc aaucacaugc cuaucauaua guaaaaccca gcccaugacc ccuaacaggg 60 gcccucucag cccuccuaau gaccuccggc cuagccaugu gauuucacuu ccacuccaua 120 acgcuccuca uacuaggccu acuaaccaac acacuaacca uauaccaaug auggcgcgau 180 guaacacgag aaagcacaua ccaaggccac cacacaccac cuguccaaaa aggccuucga 240 uacgggauaa uccuauuuau uaccucagaa guuuuuuucu ucgcaggauu uuucugagcc 300 uuuuaccacu ccagccuagc cccuaccccc caauuaggag ggcacuggcc cccaacaggc 360 aucaccccac uacuaggccu ccuccuagca gcagcaggca aaucagccca auuaggucuc 420 caccccugac uccccucagc cauagaaggc cccaccccag ucucagcccu acuccacuca 480 agcacuauag uuguagcagg aaucuucuua cucauccgcu uccacccccu agcagaaaau 540 agcccacuaa uccaaacucu aacacuaugc uuaggcgcua ucaccacucu guucgcagca 600 gucugcgccc uuacacaaaa ugacaucaaa aaaaucguag ccuucuccac uucaagucaa 660 cuaggacuca uaauaguuac aaucggcauc aaccaaccac accuagcauu ccugcacauc 720 uguacccacg ccuucuucaa agccauacua uuuaugugcu ccggguccau cauccacaac 780 cuuaacaaug aacaagauau ucgaaaaaua ggaggacuac ucaaaaccau accucucacu 840 ucaaccuccc ucaccauugg cagccuagca uuagcaggaa uaccuuuccu cacagguuuc 900 uacuccaaag accacaucau cgaaaccgca aacauaucau acacaaacgc cugagcccua 960 ucuauuacuc ucaucgcuac cucccugaca agcgccuaua gcacucgaau aauucuucuc 1020 acccuaacag gucaaccucg cuuccccacc cuuacuaaca uuaacgaaaa uaaccccacc 1080 cuacuaaacc ccauuaaacg ccuggcagcc ggaagccuau ucgcaggauu ucucauuacu 1140 aacaacauuu cccccgcauc ccccuuccaa acaacaaucc cccucuaccu aaaacucaca 1200 gcccucgcug ucacuuuccu aggacuucua acagcccuag accucaacua ccuaaccaac 1260 aaacuuaaaa uaaaaucccc acuaugcaca uuuuauuucu ccaacauacu cggauucuac 1320 ccuagcauca cacaccgcac aauccccuau cuaggccuuc uuacgagcca aaaccugccc 1380 cuacuccucc uagaccuaac cugacuagaa aagcuauuac cuaaaacaau uucacagcac 1440 caaaucucca ccuccaucau caccucaacc caaaaaggca uaauuaaacu uuacuuccuc 1500 ucuuucuucu ucccacucau ccuaacccua cuccuaauca cauaa 1545 <210> 33 <211> 1629 <212> RNA <213> Human <400> 33 auaaacuucg ccuuaauuuu aauaaucaac acccuccuag ccuuacuacu aauaauuauu 60 acauuuugac uaccacaacu caacggcuac auagaaaaau ccaccccuua cgagugcggc 120 uucgacccua uaucccccgc ccgcgucccu uucuccauaa aauucuucuu aguagcuauu 180 accuucuuau uauuugaucu agaaauugcc cuccuuuuac cccuaccaug agcccuacaa 240 acaacuaacc ugccacuaau aguuauguca ucccucuuau uaaucaucau ccuagcccua 300 agucuggcca acacagcagc cauucaagca auccuauaca accguaucgg cgauaucggu 360 uucauccucg ccuuagcaug auuuauccua cacuccaacu caugagaccc acaacaaaua 420 gcccuucuaa acgcuaaucc aagccucacc ccacuacuag gccuccuccu agcagcagca 480 ggcaaaucag cccaauuagg ucuccacccc ugacuccccu cagccauaga aggccccacc 540 ccagucucag cccuacucca cucaagcacu auaguuguag caggaaucuu cuuacucauc 600 cgcuuccacc cccuagcaga aaauagccca cuaauccaaa cucuaacacu augcuuaggc 660 gcuaucacca cucuguucgc agcagucugc gcccuuacac aaaaugacau caaaaaaauc 720 guagccuucu ccacuucaag ucaacuagga cucauaauag uuacaaucgg caucaaccaa 780 ccacaccuag cauuccugca caucuguacc cacgccuucu ucaaagccau acuauuuaug 840 ugcuccgggu ccaucaucca caaccuuaac aaugaacaag auauucgaaa aauaggagga 900 cuacucaaaa ccauaccucu cacuucaacc ucccucacca uuggcagccu agcauuagca 960 ggaauaccuu uccucacagg uuucuacucc aaagaccaca ucaucgaaac cgcaaacaua 1020 ucauacacaa acgccugagc ccuaucuauu acucucaucg cuaccucccu gacaagcgcc 1080 uauagcacuc gaauaauucu ucucacccua acaggucaac cucgcuuccc cacccuuacu 1140 aacauuaacg aaaauaaccc cacccuacua aaccccauua aacgccuggc agccggaagc 1200 cuauucgcag gauuucucau uacuaacaac auuucccccg caucccccuu ccaaacaaca 1260 aucccccucu accuaaaacu cacagcccuc gcugucacuu uccuaggacu ucuaacagcc 1320 cuagaccuca acuaccuaac caacaaacuu aaaauaaaau ccccacuaug cacauuuuau 1380 uucuccaaca uacucggauu cuacccuagc aucacacacc gcacaauccc cuaucuaggc 1440 cuucuuacga gccaaaaccu gccccuacuc cuccuagacc uaaccugacu agaaaagcua 1500 uuaccuaaaa caauuucaca gcaccaaauc uccaccucca ucaucaccuc aacccaaaaa 1560 ggcauaauua aacuuuacuu ccucucuuuc uucuucccac ucauccuaac ccuacuccua 1620 aucacauaa 1629 <210> 34 <211> 642 <212> RNA <213> Human <400> 34 augcuaaaac uaaucguccc aacaauuaua uuacuaccac ugacaugacu uuccaaaaaa 60 cacauaauuu gaaucaacac aaccacccac agccuaauua uuagcaucau cccucuacua 120 uuuuuuaacc aaaucaacaa caaccuauuu agcuguuccc caaccuuuuc cuccgacccc 180 cuaacaaccc cccuccuaau acuaacuacc ugacuccuac cccucacaau cauggcaagc 240 caacgccacu uauccaguga accacuauca cgaaaaaaac ucuaccucuc uauacuaauc 300 ucccuacaaa ucuccuuaau uauaacauuc acagccacag aacuaaucau auuuuauauc 360 uucuucgaaa ccacacuuau ccccaccuug gcuaucauca cccgaugagg caaccagcca 420 gaacgccuga acgcaggcac auacuuccua uucuacaccc uaguaggcuc ccugccccua 480 cuccuccuag accuaaccug acuagaaaag cuauuaccua aaacaauuuc acagcaccaa 540 aucuccaccu ccaucaucac cucaacccaa aaaggcauaa uuaaacuuua cuuccucucu 600 uucuucuucc cacucauccu aacccuacuc cuaaucacau aa 642 <210> 35 <211> 129 <212> RNA <213> Human <400> 35 augccccaac uaaauacuac cguauggccc accauaauua cccccauacu ccuuacacua 60 uuccucauca cccaacuaaa aauauuaaac acaaacuacc accuaccucc cucaccauug 120 gcagccuag 129 <210> 36 <211> 261 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (261)..(261) <223> Xaa can be any naturally occurring amino acid <400> 36 Met Ala His His Asn Tyr Pro His Thr Pro Tyr Thr Ile Pro His His 1 5 10 15 Pro Thr Lys Asn Ile Lys His Lys Leu Pro Pro Thr Ser Leu Thr Ile 20 25 30 Gly Ser Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser 35 40 45 Lys Asp His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp 50 55 60 Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser 65 70 75 80 Thr Arg Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr 85 90 95 Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys 100 105 110 Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn 115 120 125 Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys 130 135 140 Leu Thr Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp 145 150 155 160 Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr 165 170 175 Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg 180 185 190 Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu 195 200 205 Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser 210 215 220 Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met 225 230 235 240 Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu 245 250 255 Leu Leu Ile Thr Xaa 260 <210> 37 <211> 100 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (100)..(100) <223> Xaa can be any naturally occurring amino acid <400> 37 Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu 1 5 10 15 Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys 20 25 30 Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr 35 40 45 Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu 50 55 60 Val Phe Ala Ala Cys Glu Ala Ala Val Gly Leu Ala Leu Leu Val Ser 65 70 75 80 Ile Ser Asn Thr Tyr Gly Leu Asp Tyr Val His Asn Leu Thr Leu Leu 85 90 95 Leu Ile Thr Xaa 100 <210> 38 <211> 261 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (261)..(261) <223> Xaa can be any naturally occurring amino acid <400> 38 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr 130 135 140 Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile 145 150 155 160 Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu 165 170 175 Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met Ser Lys Gln 180 185 190 Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu 195 200 205 Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser 210 215 220 Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr 225 230 235 240 Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met 245 250 255 Leu Lys Trp Ala Xaa 260 <210> 39 <211> 189 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (189)..(189) <223> Xaa can be any naturally occurring amino acid <400> 39 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr 130 135 140 Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln 145 150 155 160 Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr 165 170 175 Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 180 185 <210> 40 <211> 392 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (392)..(392) <223> Xaa can be any naturally occurring amino acid <400> 40 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu 130 135 140 Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu 145 150 155 160 His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro 165 170 175 Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr 180 185 190 Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro 195 200 205 Met Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile Thr Ser 210 215 220 His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys Asp Ala 225 230 235 240 Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr Leu Phe 245 250 255 Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala Asn Pro 260 265 270 Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu Phe Ala 275 280 285 Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val Leu Ala 290 295 300 Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu His Met 305 310 315 320 Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser Leu Tyr 325 330 335 Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly Gly Gln 340 345 350 Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser Val Leu 355 360 365 Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu Ile Glu 370 375 380 Asn Lys Met Leu Lys Trp Ala Xaa 385 390 <210> 41 <211> 432 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (432)..(432) <223> Xaa can be any naturally occurring amino acid <400> 41 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met His Tyr Ser Pro Asp Ala Ser Thr 100 105 110 Ala Phe Ser Ser Ile Ala His Ile Thr Arg Asp Val Asn Tyr Gly Trp 115 120 125 Ile Ile Arg Tyr Leu His Ala Asn Gly Ala Ser Met Phe Phe Ile Cys 130 135 140 Leu Phe Leu His Ile Gly Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr 145 150 155 160 Ser Glu Thr Trp Asn Ile Gly Ile Ile Leu Leu Leu Ala Thr Met Ala 165 170 175 Thr Ala Phe Met Gly Tyr Val Leu Pro Trp Gly Gln Met Ser Phe Trp 180 185 190 Gly Ala Thr Val Ile Thr Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly 195 200 205 Thr Asp Leu Val Gln Trp Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro 210 215 220 Thr Leu Thr Arg Phe Phe Thr Phe His Phe Ile Leu Pro Phe Ile Ile 225 230 235 240 Ala Ala Leu Ala Thr Leu His Leu Leu Phe Leu His Glu Thr Gly Ser 245 250 255 Asn Asn Pro Leu Gly Ile Thr Ser His Ser Asp Lys Ile Thr Phe His 260 265 270 Pro Tyr Tyr Thr Ile Lys Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu 275 280 285 Ser Leu Met Thr Leu Thr Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro 290 295 300 Asp Asn Tyr Thr Leu Ala Asn Pro Leu Asn Thr Pro Pro His Ile Lys 305 310 315 320 Pro Glu Trp Tyr Phe Leu Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro 325 330 335 Asn Lys Leu Gly Gly Val Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu 340 345 350 Ala Met Ile Pro Ile Leu His Met Ser Lys Gln Gln Ser Met Met Phe 355 360 365 Arg Pro Leu Ser Gln Ser Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu 370 375 380 Ile Leu Thr Trp Ile Gly Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile 385 390 395 400 Ile Gly Gln Val Ala Ser Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu 405 410 415 Met Pro Thr Ile Ser Leu Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 420 425 430 <210> 42 <211> 410 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (410)..(410) <223> Xaa can be any naturally occurring amino acid <400> 42 Met Pro Leu Ile Tyr Met Asn Ile Met Leu Ala Phe Thr Ile Ser Leu 1 5 10 15 Leu Gly Met Leu Val Tyr Arg Ser His Leu Met Ser Ser Leu Leu Cys 20 25 30 Leu Glu Gly Met Met Leu Ser Leu Phe Ile Met Ala Thr Leu Met Thr 35 40 45 Leu Asn Thr His Ser Leu Leu Ala Asn Ile Val Pro Ile Ala Met Leu 50 55 60 Val Phe Gly Ala Cys Leu Ile Leu Gln Ile Thr Thr Gly Leu Phe Leu 65 70 75 80 Ala Met His Tyr Ser Pro Asp Ala Ser Thr Ala Phe Ser Ser Ile Ala 85 90 95 His Ile Thr Arg Asp Val Asn Tyr Gly Trp Ile Ile Arg Tyr Leu His 100 105 110 Ala Asn Gly Ala Ser Met Phe Phe Ile Cys Leu Phe Leu His Ile Gly 115 120 125 Arg Gly Leu Tyr Tyr Gly Ser Phe Leu Tyr Ser Glu Thr Trp Asn Ile 130 135 140 Gly Ile Ile Leu Leu Leu Ala Thr Met Ala Thr Ala Phe Met Gly Tyr 145 150 155 160 Val Leu Pro Trp Gly Gln Met Ser Phe Trp Gly Ala Thr Val Ile Thr 165 170 175 Asn Leu Leu Ser Ala Ile Pro Tyr Ile Gly Thr Asp Leu Val Gln Trp 180 185 190 Ile Trp Gly Gly Tyr Ser Val Asp Ser Pro Thr Leu Thr Arg Phe Phe 195 200 205 Thr Phe His Phe Ile Leu Pro Phe Ile Ile Ala Ala Leu Ala Thr Leu 210 215 220 His Leu Leu Phe Leu His Glu Thr Gly Ser Asn Asn Pro Leu Gly Ile 225 230 235 240 Thr Ser His Ser Asp Lys Ile Thr Phe His Pro Tyr Tyr Thr Ile Lys 245 250 255 Asp Ala Leu Gly Leu Leu Leu Phe Leu Leu Ser Leu Met Thr Leu Thr 260 265 270 Leu Phe Ser Pro Asp Leu Leu Gly Asp Pro Asp Asn Tyr Thr Leu Ala 275 280 285 Asn Pro Leu Asn Thr Pro Pro His Ile Lys Pro Glu Trp Tyr Phe Leu 290 295 300 Phe Ala Tyr Thr Ile Leu Arg Ser Val Pro Asn Lys Leu Gly Gly Val 305 310 315 320 Leu Ala Leu Leu Leu Ser Ile Leu Ile Leu Ala Met Ile Pro Ile Leu 325 330 335 His Met Ser Lys Gln Gln Ser Met Met Phe Arg Pro Leu Ser Gln Ser 340 345 350 Leu Tyr Trp Leu Leu Ala Ala Asp Leu Leu Ile Leu Thr Trp Ile Gly 355 360 365 Gly Gln Pro Val Ser Tyr Pro Phe Thr Ile Ile Gly Gln Val Ala Ser 370 375 380 Val Leu Tyr Phe Thr Thr Ile Leu Ile Leu Met Pro Thr Ile Ser Leu 385 390 395 400 Ile Glu Asn Lys Met Leu Lys Trp Ala Xaa 405 410 <210> 43 <211> 174 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (174)..(174) <223> Xaa can be any naturally occurring amino acid <400> 43 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala Leu Ala Val Thr 50 55 60 Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys 65 70 75 80 Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu 85 90 95 Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu 100 105 110 Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu 115 120 125 Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser 130 135 140 Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser 145 150 155 160 Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 165 170 <210> 44 <211> 194 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (194)..(194) <223> Xaa can be any naturally occurring amino acid <400> 44 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val 50 55 60 Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn 65 70 75 80 Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg 85 90 95 Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu 100 105 110 Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val 115 120 125 Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Leu Leu Asp 130 135 140 Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln 145 150 155 160 Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu 165 170 175 Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile 180 185 190 Thr Xaa <210> 45 <211> 736 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (736)..(736) <223> Xaa can be any naturally occurring amino acid <400> 45 Met Phe Ala Asp Arg Trp Leu Phe Ser Thr Asn His Lys Asp Ile Gly 1 5 10 15 Thr Leu Tyr Leu Leu Phe Gly Ala Trp Ala Gly Val Leu Gly Thr Ala 20 25 30 Leu Ser Leu Leu Ile Arg Ala Glu Leu Gly Gln Pro Gly Asn Leu Leu 35 40 45 Gly Asn Asp His Ile Tyr Asn Val Ile Val Thr Ala His Ala Phe Val 50 55 60 Met Ile Phe Phe Met Val Met Pro Ile Met Ile Gly Gly Phe Gly Asn 65 70 75 80 Trp Leu Val Pro Leu Met Ile Gly Ala Pro Asp Met Ala Phe Pro Arg 85 90 95 Met Asn Asn Met Ser Phe Trp Leu Leu Pro Pro Ser Leu Leu Leu Leu 100 105 110 Leu Ala Ser Ala Met Val Glu Ala Gly Ala Gly Thr Gly Trp Thr Val 115 120 125 Tyr Pro Pro Leu Ala Gly Asn Tyr Ser His Pro Gly Ala Ser Val Asp 130 135 140 Leu Thr Ile Phe Ser Leu His Leu Ala Gly Val Ser Ser Ile Leu Gly 145 150 155 160 Ala Ile Asn Phe Ile Thr Thr Ile Ile Asn Met Lys Pro Pro Ala Met 165 170 175 Thr Gln Tyr Gln Thr Pro Leu Phe Val Trp Ser Val Leu Ile Thr Ala 180 185 190 Val Leu Leu Leu Leu Ser Leu Pro Val Leu Ala Ala Gly Ile Thr Met 195 200 205 Leu Leu Thr Asp Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly 210 215 220 Gly Gly Asp Pro Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His 225 230 235 240 Pro Glu Val Tyr Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His 245 250 255 Ile Val Thr Tyr Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly 260 265 270 Met Val Trp Ala Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp 275 280 285 Ala His His Met Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr 290 295 300 Phe Thr Ser Ala Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val 305 310 315 320 Phe Ser Trp Leu Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala 325 330 335 Ala Val Leu Trp Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly 340 345 350 Leu Thr Gly Ile Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His 355 360 365 Asp Thr Tyr Tyr Val Val Ala His Phe His Tyr Val Leu Ser Met Gly 370 375 380 Ala Val Phe Ala Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe 385 390 395 400 Ser Gly Tyr Thr Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile 405 410 415 Met Phe Ile Gly Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly 420 425 430 Leu Ser Gly Met Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr 435 440 445 Thr Trp Asn Ile Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala 450 455 460 Val Met Leu Met Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg 465 470 475 480 Lys Val Leu Met Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr 485 490 495 Gly Cys Pro Pro Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys 500 505 510 Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile 515 520 525 Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr 530 535 540 Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu 545 550 555 560 Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn 565 570 575 Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly 580 585 590 Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser 595 600 605 Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala 610 615 620 Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr 625 630 635 640 Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn 645 650 655 Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu 660 665 670 Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr 675 680 685 Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser 690 695 700 Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe 705 710 715 720 Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 725 730 735 <210> 46 <211> 269 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (269)..(269) <223> Xaa can be any naturally occurring amino acid <400> 46 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Ala 50 55 60 Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala 65 70 75 80 Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu 85 90 95 Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn 100 105 110 Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe 115 120 125 Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln 130 135 140 Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe 145 150 155 160 Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu 165 170 175 Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly 180 185 190 Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu 195 200 205 Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu 210 215 220 Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile 225 230 235 240 Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe 245 250 255 Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 260 265 <210> 47 <211> 262 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (262)..(262) <223> Xaa can be any naturally occurring amino acid <400> 47 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu 130 135 140 Pro Ile Glu Ala Pro Ile Arg Met Met Ile Thr Ser Gln Asp Val Leu 145 150 155 160 His Ser Trp Ala Val Pro Thr Leu Gly Leu Lys Thr Asp Ala Ile Pro 165 170 175 Gly Arg Leu Asn Gln Thr Thr Phe Thr Ala Thr Arg Pro Gly Val Tyr 180 185 190 Tyr Gly Gln Cys Ser Glu Ile Cys Gly Ala Asn His Ser Phe Met Pro 195 200 205 Ile Val Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile 210 215 220 Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly 225 230 235 240 Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr 245 250 255 Leu Leu Leu Ile Thr Xaa 260 <210> 48 <211> 635 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (635)..(635) <223> Xaa can be any naturally occurring amino acid <400> 48 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr 100 105 110 Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe 115 120 125 Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile 130 135 140 Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu 145 150 155 160 Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser 165 170 175 Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile 180 185 190 Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu 195 200 205 Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Ser 210 215 220 Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn Ala Asn Pro Ser 225 230 235 240 Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala Gly Lys Ser Ala 245 250 255 Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met Glu Gly Pro Thr 260 265 270 Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val Val Ala Gly Ile 275 280 285 Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn Ser Pro Leu Ile 290 295 300 Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr Leu Phe Ala Ala 305 310 315 320 Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile Val Ala Phe Ser 325 330 335 Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile Gly Ile Asn Gln 340 345 350 Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala Phe Phe Lys Ala 355 360 365 Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn Leu Asn Asn Glu 370 375 380 Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr Met Pro Leu Thr 385 390 395 400 Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala Gly Met Pro Phe 405 410 415 Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu Thr Ala Asn Met 420 425 430 Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu Ile Ala Thr Ser 435 440 445 Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu Thr Leu Thr Gly 450 455 460 Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu Asn Asn Pro Thr 465 470 475 480 Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser Leu Phe Ala Gly 485 490 495 Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro Phe Gln Thr Thr 500 505 510 Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val Thr Phe Leu Gly 515 520 525 Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu Lys Met 530 535 540 Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly Phe Tyr 545 550 555 560 Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu Thr Ser 565 570 575 Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu 580 585 590 Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr 595 600 605 Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe 610 615 620 Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 625 630 635 <210> 49 <211> 515 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (515)..(515) <223> Xaa can be any naturally occurring amino acid <400> 49 Met Thr His Gln Ser His Ala Tyr His Met Val Lys Pro Ser Pro Trp 1 5 10 15 Pro Leu Thr Gly Ala Leu Ser Ala Leu Leu Met Thr Ser Gly Leu Ala 20 25 30 Met Trp Phe His Phe His Ser Met Thr Leu Leu Met Leu Gly Leu Leu 35 40 45 Thr Asn Thr Leu Thr Met Tyr Gln Trp Trp Arg Asp Val Thr Arg Glu 50 55 60 Ser Thr Tyr Gln Gly His His Thr Pro Pro Val Gln Lys Gly Leu Arg 65 70 75 80 Tyr Gly Met Ile Leu Phe Ile Thr Ser Glu Val Phe Phe Phe Ala Gly 85 90 95 Phe Phe Trp Ala Phe Tyr His Ser Ser Leu Ala Pro Thr Pro Gln Leu 100 105 110 Gly Gly His Trp Pro Pro Thr Gly Ile Thr Pro Leu Leu Gly Leu Leu 115 120 125 Leu Ala Ala Ala Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu 130 135 140 Pro Ser Ala Met Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser 145 150 155 160 Ser Thr Met Val Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro 165 170 175 Leu Ala Glu Asn Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly 180 185 190 Ala Ile Thr Thr Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp 195 200 205 Ile Lys Lys Ile Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met 210 215 220 Met Val Thr Ile Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile 225 230 235 240 Cys Thr His Ala Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser 245 250 255 Ile Ile His Asn Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly 260 265 270 Leu Leu Lys Thr Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser 275 280 285 Leu Ala Leu Ala Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp 290 295 300 His Ile Ile Glu Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu 305 310 315 320 Ser Ile Thr Leu Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg 325 330 335 Met Ile Leu Leu Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr 340 345 350 Asn Ile Asn Glu Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu 355 360 365 Ala Ala Gly Ser Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser 370 375 380 Pro Ala Ser Pro Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr 385 390 395 400 Ala Leu Ala Val Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn 405 410 415 Tyr Leu Thr Asn Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr 420 425 430 Phe Ser Asn Met Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile 435 440 445 Pro Tyr Leu Gly Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu 450 455 460 Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His 465 470 475 480 Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys 485 490 495 Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu 500 505 510 Ile Thr Xaa 515 <210> 50 <211> 543 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (543)..(543) <223> Xaa can be any naturally occurring amino acid <400> 50 Met Asn Phe Ala Leu Ile Leu Met Ile Asn Thr Leu Leu Ala Leu Leu 1 5 10 15 Leu Met Ile Ile Thr Phe Trp Leu Pro Gln Leu Asn Gly Tyr Met Glu 20 25 30 Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp Pro Met Ser Pro Ala Arg 35 40 45 Val Pro Phe Ser Met Lys Phe Phe Leu Val Ala Ile Thr Phe Leu Leu 50 55 60 Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro Leu Pro Trp Ala Leu Gln 65 70 75 80 Thr Thr Asn Leu Pro Leu Met Val Met Ser Ser Leu Leu Leu Ile Ile 85 90 95 Ile Leu Ala Leu Ser Leu Ala Asn Thr Ala Ala Ile Gln Ala Ile Leu 100 105 110 Tyr Asn Arg Ile Gly Asp Ile Gly Phe Ile Leu Ala Leu Ala Trp Phe 115 120 125 Ile Leu His Ser Asn Ser Trp Asp Pro Gln Gln Met Ala Leu Leu Asn 130 135 140 Ala Asn Pro Ser Leu Thr Pro Leu Leu Gly Leu Leu Leu Ala Ala Ala 145 150 155 160 Gly Lys Ser Ala Gln Leu Gly Leu His Pro Trp Leu Pro Ser Ala Met 165 170 175 Glu Gly Pro Thr Pro Val Ser Ala Leu Leu His Ser Ser Thr Met Val 180 185 190 Val Ala Gly Ile Phe Leu Leu Ile Arg Phe His Pro Leu Ala Glu Asn 195 200 205 Ser Pro Leu Ile Gln Thr Leu Thr Leu Cys Leu Gly Ala Ile Thr Thr 210 215 220 Leu Phe Ala Ala Val Cys Ala Leu Thr Gln Asn Asp Ile Lys Lys Ile 225 230 235 240 Val Ala Phe Ser Thr Ser Ser Gln Leu Gly Leu Met Met Val Thr Ile 245 250 255 Gly Ile Asn Gln Pro His Leu Ala Phe Leu His Ile Cys Thr His Ala 260 265 270 Phe Phe Lys Ala Met Leu Phe Met Cys Ser Gly Ser Ile Ile His Asn 275 280 285 Leu Asn Asn Glu Gln Asp Ile Arg Lys Met Gly Gly Leu Leu Lys Thr 290 295 300 Met Pro Leu Thr Ser Thr Ser Leu Thr Ile Gly Ser Leu Ala Leu Ala 305 310 315 320 Gly Met Pro Phe Leu Thr Gly Phe Tyr Ser Lys Asp His Ile Ile Glu 325 330 335 Thr Ala Asn Met Ser Tyr Thr Asn Ala Trp Ala Leu Ser Ile Thr Leu 340 345 350 Ile Ala Thr Ser Leu Thr Ser Ala Tyr Ser Thr Arg Met Ile Leu Leu 355 360 365 Thr Leu Thr Gly Gln Pro Arg Phe Pro Thr Leu Thr Asn Ile Asn Glu 370 375 380 Asn Asn Pro Thr Leu Leu Asn Pro Ile Lys Arg Leu Ala Ala Gly Ser 385 390 395 400 Leu Phe Ala Gly Phe Leu Ile Thr Asn Asn Ile Ser Pro Ala Ser Pro 405 410 415 Phe Gln Thr Thr Ile Pro Leu Tyr Leu Lys Leu Thr Ala Leu Ala Val 420 425 430 Thr Phe Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn 435 440 445 Lys Leu Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met 450 455 460 Leu Gly Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly 465 470 475 480 Leu Leu Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp 485 490 495 Leu Glu Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr 500 505 510 Ser Ile Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu 515 520 525 Ser Phe Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 530 535 540 <210> 51 <211> 214 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (214)..(214) <223> Xaa can be any naturally occurring amino acid <400> 51 Met Leu Lys Leu Ile Val Pro Thr Ile Met Leu Leu Pro Leu Thr Trp 1 5 10 15 Leu Ser Lys Lys His Met Ile Trp Ile Asn Thr Thr Thr His Ser Leu 20 25 30 Ile Ile Ser Ile Ile Pro Leu Leu Phe Phe Asn Gln Ile Asn Asn Asn 35 40 45 Leu Phe Ser Cys Ser Pro Thr Phe Ser Ser Asp Pro Leu Thr Thr Pro 50 55 60 Leu Leu Met Leu Thr Thr Trp Leu Leu Pro Leu Thr Ile Met Ala Ser 65 70 75 80 Gln Arg His Leu Ser Ser Glu Pro Leu Ser Arg Lys Lys Leu Tyr Leu 85 90 95 Ser Met Leu Ile Ser Leu Gln Ile Ser Leu Ile Met Thr Phe Thr Ala 100 105 110 Thr Glu Leu Ile Met Phe Tyr Ile Phe Phe Glu Thr Thr Leu Ile Pro 115 120 125 Thr Leu Ala Ile Ile Thr Arg Trp Gly Asn Gln Pro Glu Arg Leu Asn 130 135 140 Ala Gly Thr Tyr Phe Leu Phe Tyr Thr Leu Val Gly Ser Leu Pro Leu 145 150 155 160 Leu Leu Leu Asp Leu Thr Trp Leu Glu Lys Leu Leu Pro Lys Thr Ile 165 170 175 Ser Gln His Gln Ile Ser Thr Ser Ile Ile Thr Ser Thr Gln Lys Gly 180 185 190 Met Ile Lys Leu Tyr Phe Leu Ser Phe Phe Phe Pro Leu Ile Leu Thr 195 200 205 Leu Leu Leu Ile Thr Xaa 210 <210> 52 <211> 43 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (43)..(43) <223> Xaa can be any naturally occurring amino acid <400> 52 Met Pro Gln Leu Asn Thr Thr Val Trp Pro Thr Met Ile Thr Pro Met 1 5 10 15 Leu Leu Thr Leu Phe Leu Ile Thr Gln Leu Lys Met Leu Asn Thr Asn 20 25 30 Tyr His Leu Pro Pro Ser Pro Leu Ala Ala Xaa 35 40 <210> 53 <211> 951 <212> RNA <213> Human <400> 53 augaacgaaa aucuguucgc uucauucauu gcccccacaa uccuaggccu acccgccgca 60 guacugauca uucuauuucc cccucuauug auccccaccu ccaaauaucu caucaacaac 120 cgacuaauca ccacccaaca augacuaauc aaacuaaccu caaaacaaau gauaaccaua 180 cacaacacua aaggacgaac cugaucucuu auacuaguau ccuuaaucau uuuuauugcc 240 acaacuaacc uccucggacu ccugccucac ucauuuacac caaccaccca acuaucuaua 300 aaccuagcca uggccauccc cuuaugagcg ggcacaguga uuauaggcuu ucgcucuaag 360 auuaaaaaug cccuagccca cuucuuacca caaggcacac cuacaccccu uauccccaua 420 cuaguuauua ucgaaaccau cagccuacuc auucaaccaa uagcccuggc cguacgccua 480 accgcuaaca uuacugcagg ccaccuacuc augcaccuaa uuggaagcgc cacccuagca 540 auaucaacca uuaaccuucc cucuacacuu aucaucuuca caauucuaau ucuacugacu 600 auccuagaaa ucgcugucac uuuccuagga cuucuaacag cccuagaccu caacuaccua 660 accaacaaac uuaaaauaaa auccccacua ugcacauuuu auuucuccaa cauacucgga 720 uucuacccua gcaucacaca ccgcacaauc cccuaucuag gccuucuuac gagccaaaac 780 cugccccuac uccuccuaga ccuaaccuga cuagaaaagc uauuaccuaa aacaauuuca 840 cagcaccaaa ucuccaccuc caucaucacc ucaacccaaa aaggcauaau uaaacuuuac 900 uuccucucuu ucuucuuccc acucauccua acccuacucc uaaucacaua a 951 <210> 54 <211> 951 <212> DNA <213> Artificial <220> <223> cDNA <400> 54 atgaacgaaa atctgttcgc ttcattcatt gcccccacaa tcctaggcct acccgccgca 60 gtactgatca ttctatttcc ccctctattg atccccacct ccaaatatct catcaacaac 120 cgactaatca ccacccaaca atgactaatc aaactaacct caaaacaaat gataaccata 180 cacaacacta aaggacgaac ctgatctctt atactagtat ccttaatcat ttttattgcc 240 acaactaacc tcctcggact cctgcctcac tcatttacac caaccaccca actatctata 300 aacctagcca tggccatccc cttatgagcg ggcacagtga ttataggctt tcgctctaag 360 attaaaaatg ccctagccca cttcttacca caaggcacac ctacacccct tatccccata 420 ctagttatta tcgaaaccat cagcctactc attcaaccaa tagccctggc cgtacgccta 480 accgctaaca ttactgcagg ccacctactc atgcacctaa ttggaagcgc caccctagca 540 atatcaacca ttaaccttcc ctctacactt atcatcttca caattctaat tctactgact 600 atcctagaaa tcgctgtcac tttcctagga cttctaacag ccctagacct caactaccta 660 accaacaaac ttaaaataaa atccccacta tgcacatttt atttctccaa catactcgga 720 ttctacccta gcatcacaca ccgcacaatc ccctatctag gccttcttac gagccaaaac 780 ctgcccctac tcctcctaga cctaacctga ctagaaaagc tattacctaa aacaatttca 840 cagcaccaaa tctccacctc catcatcacc tcaacccaaa aaggcataat taaactttac 900 ttcctctctt tcttcttccc actcatccta accctactcc taatcacata a 951 <210> 55 <211> 317 <212> PRT <213> Artificial <220> <223> putative protein sequence <220> <221> misc_feature <222> (317)..(317) <223> Xaa can be any naturally occurring amino acid <400> 55 Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly 1 5 10 15 Leu Pro Ala Ala Val Leu Ile Ile Leu Phe Pro Pro Leu Leu Ile Pro 20 25 30 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 35 40 45 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 50 55 60 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 65 70 75 80 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 85 90 95 Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr 100 105 110 Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe 115 120 125 Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile 130 135 140 Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu 145 150 155 160 Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser 165 170 175 Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile 180 185 190 Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Thr Phe 195 200 205 Leu Gly Leu Leu Thr Ala Leu Asp Leu Asn Tyr Leu Thr Asn Lys Leu 210 215 220 Lys Met Lys Ser Pro Leu Cys Thr Phe Tyr Phe Ser Asn Met Leu Gly 225 230 235 240 Phe Tyr Pro Ser Ile Thr His Arg Thr Ile Pro Tyr Leu Gly Leu Leu 245 250 255 Thr Ser Gln Asn Leu Pro Leu Leu Leu Leu Asp Leu Thr Trp Leu Glu 260 265 270 Lys Leu Leu Pro Lys Thr Ile Ser Gln His Gln Ile Ser Thr Ser Ile 275 280 285 Ile Thr Ser Thr Gln Lys Gly Met Ile Lys Leu Tyr Phe Leu Ser Phe 290 295 300 Phe Phe Pro Leu Ile Leu Thr Leu Leu Leu Ile Thr Xaa 305 310 315 <210> 56 <211> 747 <212> RNA <213> Human <220> <221> misc_feature <223> Fusion transcript P0026 (MT-CO2 (7586-8038) + MT-ND3 (10110-10404)) <400> 56 auggcacaug cagcgcaagu aggucuacaa gacgcuacuu ccccuaucau agaagagcuu 60 aucaccuuuc augaucacgc ccucauaauc auuuuccuua ucugcuuccu aguccuguau 120 gcccuuuucc uaacacucac aacaaaacua acuaauacua acaucucaga cgcucaggaa 180 auagaaaccg ucugaacuau ccugcccgcc aucauccuag uccucaucgc ccucccaucc 240 cuacgcaucc uuuacauaac agacgagguc aacgaucccu cccuuaccau caaaucaauu 300 ggccaccaau gguacugaac cuacgaguac accgacuacg gcggacuaau cuucaacucc 360 uacauacuuc ccccauuauu ccuagaacca ggcgaccugc gacuccuuga cguugacaau 420 cgaguaguac ucccgauuga agcccccauu cguauaauua uuacauuuug acuaccacaa 480 cucaacggcu acauagaaaa auccaccccu uacgagugcg gcuucgaccc uauauccccc 540 gcccgcgucc cuuucuccau aaaauucuuc uuaguagcua uuaccuucuu auuauuugau 600 cuagaaauug cccuccuuuu accccuacca ugagcccuac aaacaacuaa ccugccacua 660 auaguuaugu caucccucuu auuaaucauc auccuagccc uaagucuggc cuaugaguga 720 cuacaaaaag gauuagacug aaccgaa 747 <210> 57 <211> 747 <212> DNA <213> Human <220> <221> misc_feature <223> Mutant DNA for fusion transcript P0026 <400> 57 atggcacatg cagcgcaagt aggtctacaa gacgctactt cccctatcat agaagagctt 60 atcacctttc atgatcacgc cctcataatc attttcctta tctgcttcct agtcctgtat 120 gcccttttcc taacactcac aacaaaacta actaatacta acatctcaga cgctcaggaa 180 atagaaaccg tctgaactat cctgcccgcc atcatcctag tcctcatcgc cctcccatcc 240 ctacgcatcc tttacataac agacgaggtc aacgatccct cccttaccat caaatcaatt 300 ggccaccaat ggtactgaac ctacgagtac accgactacg gcggactaat cttcaactcc 360 tacatacttc ccccattatt cctagaacca ggcgacctgc gactccttga cgttgacaat 420 cgagtagtac tcccgattga agcccccatt cgtataatta ttacattttg actaccacaa 480 ctcaacggct acatagaaaa atccacccct tacgagtgcg gcttcgaccc tatatccccc 540 gcccgcgtcc ctttctccat aaaattcttc ttagtagcta ttaccttctt attatttgat 600 ctagaaattg ccctcctttt acccctacca tgagccctac aaacaactaa cctgccacta 660 atagttatgt catccctctt attaatcatc atcctagccc taagtctggc ctatgagtga 720 ctacaaaaag gattagactg aaccgaa 747 <210> 58 <211> 249 <212> PRT <213> Human <220> <221> misc_feature <223> Fusion protein corresponding to P0026 <400> 58 Met Ala His Ala Ala Gln Val Gly Leu Gln Asp Ala Thr Ser Pro Ile 1 5 10 15 Met Glu Glu Leu Ile Thr Phe His Asp His Ala Leu Met Ile Ile Phe 20 25 30 Leu Ile Cys Phe Leu Val Leu Tyr Ala Leu Phe Leu Thr Leu Thr Thr 35 40 45 Lys Leu Thr Asn Thr Asn Ile Ser Asp Ala Gln Glu Met Glu Thr Val 50 55 60 Trp Thr Ile Leu Pro Ala Ile Ile Leu Val Leu Ile Ala Leu Pro Ser 65 70 75 80 Leu Arg Ile Leu Tyr Met Thr Asp Glu Val Asn Asp Pro Ser Leu Thr 85 90 95 Ile Lys Ser Ile Gly His Gln Trp Tyr Trp Thr Tyr Glu Tyr Thr Asp 100 105 110 Tyr Gly Gly Leu Ile Phe Asn Ser Tyr Met Leu Pro Pro Leu Phe Leu 115 120 125 Glu Pro Gly Asp Leu Arg Leu Leu Asp Val Asp Asn Arg Val Val Leu 130 135 140 Pro Ile Glu Ala Pro Ile Arg Met Ile Ile Thr Phe Trp Leu Pro Gln 145 150 155 160 Leu Asn Gly Tyr Met Glu Lys Ser Thr Pro Tyr Glu Cys Gly Phe Asp 165 170 175 Pro Met Ser Pro Ala Arg Val Pro Phe Ser Met Lys Phe Phe Leu Val 180 185 190 Ala Ile Thr Phe Leu Leu Phe Asp Leu Glu Ile Ala Leu Leu Leu Pro 195 200 205 Leu Pro Trp Ala Leu Gln Thr Thr Asn Leu Pro Leu Met Val Met Ser 210 215 220 Ser Leu Leu Leu Ile Ile Ile Leu Ala Leu Ser Leu Ala Tyr Glu Trp 225 230 235 240 Leu Gln Lys Gly Leu Asp Trp Thr Glu 245 <210> 59 <211> 1544 <212> RNA <213> Human <220> <221> misc_feature <223> Fusion transcript P0062 (MT-ND1 (3307-4246) + MT-ATP6 (8603-9207)) <400> 59 auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60 augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120 ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180 cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240 aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300 ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360 ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420 ucauaugaag ucacccuagc caucauucua cuaucaacau uacuaauaag uggcuccuuu 480 aaccucucca cccuuaucac aacacaagaa caccucugau uacuccugcc aucaugaccc 540 uuggccauaa uaugauuuau cuccacacua gcagagacca accgaacccc cuucgaccuu 600 gccgaagggg aguccgaacu agucucaggc uucaacaucg aauacgccgc aggccccuuc 660 gcccuauucu ucauagccga auacacaaac auuauuauaa uaaacacccu caccacuaca 720 aucuuccuag gaacaacaua ugacgcacuc uccccugaac ucuacacaac auauuuuguc 780 accaagaccc uacuucuaac cucccuguuc uuaugaauuc gaacagcaua cccccgauuc 840 cgcuacgacc aacucauaca ccuccuauga aaaaacuucc uaccacucac ccuagcauua 900 cuuauaugau augucuccau acccauuaca aucuccagca uucccccucu auugaucccc 960 accuccaaau aucucaucaa caaccgacua aucaccaccc aacaaugacu aaucaaacua 1020 accucaaaac aaaugauaac cauacacaac acuaaaggac gaaccugauc ucuuauacua 1080 guauccuuaa ucauuuuuau ugccacaacu aaccuccucg gacuccugcc ucacucauuu 1140 acaccaacca cccaacuauc uauaaaccua gccauggcca uccccuuaug agcgggcaca 1200 gugauuauag gcuuucgcuc uaagauuaaa aaugcccuag cccacuucuu accacaaggc 1260 acaccuacac cccuuauccc cauacuaguu auuaucgaaa ccaucagccu acucauucaa 1320 ccaauagccc uggccguacg ccuaaccgcu aacauuacug caggccaccu acucaugcac 1380 cuaauuggaa gcgccacccu agcaauauca accauuaacc uucccucuac acuuaucauc 1440 uucacaauuc uaauucuacu gacuauccua gaaaucgcug ucgccuuaau ccaagccuac 1500 guuuucacac uucuaguaag ccucuaccug cacgacaaca caua 1544 <210> 60 <211> 1544 <212> DNA <213> Human <220> <221> misc_feature <223> Mutant DNA for fusion transcript P0062 <400> 60 atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60 atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120 ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180 ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240 atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300 ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360 tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420 tcatatgaag tcaccctagc catcattcta ctatcaacat tactaataag tggctccttt 480 aacctctcca cccttatcac aacacaagaa cacctctgat tactcctgcc atcatgaccc 540 ttggccataa tatgatttat ctccacacta gcagagacca accgaacccc cttcgacctt 600 gccgaagggg agtccgaact agtctcaggc ttcaacatcg aatacgccgc aggccccttc 660 gccctattct tcatagccga atacacaaac attattataa taaacaccct caccactaca 720 atcttcctag gaacaacata tgacgcactc tcccctgaac tctacacaac atattttgtc 780 accaagaccc tacttctaac ctccctgttc ttatgaattc gaacagcata cccccgattc 840 cgctacgacc aactcataca cctcctatga aaaaacttcc taccactcac cctagcatta 900 cttatatgat atgtctccat acccattaca atctccagca ttccccctct attgatcccc 960 acctccaaat atctcatcaa caaccgacta atcaccaccc aacaatgact aatcaaacta 1020 acctcaaaac aaatgataac catacacaac actaaaggac gaacctgatc tcttatacta 1080 gtatccttaa tcatttttat tgccacaact aacctcctcg gactcctgcc tcactcattt 1140 acaccaacca cccaactatc tataaaccta gccatggcca tccccttatg agcgggcaca 1200 gtgattatag gctttcgctc taagattaaa aatgccctag cccacttctt accacaaggc 1260 acacctacac cccttatccc catactagtt attatcgaaa ccatcagcct actcattcaa 1320 ccaatagccc tggccgtacg cctaaccgct aacattactg caggccacct actcatgcac 1380 ctaattggaa gcgccaccct agcaatatca accattaacc ttccctctac acttatcatc 1440 ttcacaattc taattctact gactatccta gaaatcgctg tcgccttaat ccaagcctac 1500 gttttcacac ttctagtaag cctctacctg cacgacaaca cata 1544 <210> 61 <211> 515 <212> PRT <213> Human <220> <221> misc_feature <223> Fusion protein corresponding to P0062 <220> <221> misc_feature <222> (515)..(515) <223> Xaa can be any naturally occurring amino acid <400> 61 Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala 1 5 10 15 Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln 20 25 30 Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro 35 40 45 Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala 50 55 60 Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr 65 70 75 80 Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val 85 90 95 Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala 100 105 110 Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala 115 120 125 Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val 130 135 140 Thr Leu Ala Ile Ile Leu Leu Ser Thr Leu Leu Met Ser Gly Ser Phe 145 150 155 160 Asn Leu Ser Thr Leu Ile Thr Thr Gln Glu His Leu Trp Leu Leu Leu 165 170 175 Pro Ser Trp Pro Leu Ala Met Met Trp Phe Ile Ser Thr Leu Ala Glu 180 185 190 Thr Asn Arg Thr Pro Phe Asp Leu Ala Glu Gly Glu Ser Glu Leu Val 195 200 205 Ser Gly Phe Asn Ile Glu Tyr Ala Ala Gly Pro Phe Ala Leu Phe Phe 210 215 220 Met Ala Glu Tyr Thr Asn Ile Ile Met Met Asn Thr Leu Thr Thr Thr 225 230 235 240 Ile Phe Leu Gly Thr Thr Tyr Asp Ala Leu Ser Pro Glu Leu Tyr Thr 245 250 255 Thr Tyr Phe Val Thr Lys Thr Leu Leu Leu Thr Ser Leu Phe Leu Trp 260 265 270 Ile Arg Thr Ala Tyr Pro Arg Phe Arg Tyr Asp Gln Leu Met His Leu 275 280 285 Leu Trp Lys Asn Phe Leu Pro Leu Thr Leu Ala Leu Leu Met Trp Tyr 290 295 300 Val Ser Met Pro Ile Thr Ile Ser Ser Ile Pro Pro Leu Leu Ile Pro 305 310 315 320 Thr Ser Lys Tyr Leu Ile Asn Asn Arg Leu Ile Thr Thr Gln Gln Trp 325 330 335 Leu Ile Lys Leu Thr Ser Lys Gln Met Met Thr Met His Asn Thr Lys 340 345 350 Gly Arg Thr Trp Ser Leu Met Leu Val Ser Leu Ile Ile Phe Ile Ala 355 360 365 Thr Thr Asn Leu Leu Gly Leu Leu Pro His Ser Phe Thr Pro Thr Thr 370 375 380 Gln Leu Ser Met Asn Leu Ala Met Ala Ile Pro Leu Trp Ala Gly Thr 385 390 395 400 Val Ile Met Gly Phe Arg Ser Lys Ile Lys Asn Ala Leu Ala His Phe 405 410 415 Leu Pro Gln Gly Thr Pro Thr Pro Leu Ile Pro Met Leu Val Ile Ile 420 425 430 Glu Thr Ile Ser Leu Leu Ile Gln Pro Met Ala Leu Ala Val Arg Leu 435 440 445 Thr Ala Asn Ile Thr Ala Gly His Leu Leu Met His Leu Ile Gly Ser 450 455 460 Ala Thr Leu Ala Met Ser Thr Ile Asn Leu Pro Ser Thr Leu Ile Ile 465 470 475 480 Phe Thr Ile Leu Ile Leu Leu Thr Ile Leu Glu Ile Ala Val Ala Leu 485 490 495 Ile Gln Ala Tyr Val Phe Thr Leu Leu Val Ser Leu Tyr Leu His Asp 500 505 510 Asn Thr Xaa 515 <210> 62 <211> 999 <212> RNA <213> Human <220> <221> misc_feature <223> Fusion transcript P0064 (MT-ND1 (3307-3752) + MT-ND2 (4958-5511)) <400> 62 auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60 augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120 ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180 cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240 aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300 ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360 ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420 ucauaugaag ucacccuagc caucauagca ggcaguugag guggauuaaa ccaaacccag 480 cuacgcaaaa ucuuagcaua cuccucaauu acccacauag gaugaauaau agcaguucua 540 ccguacaacc cuaacauaac cauucuuaau uuaacuauuu auauuauccu aacuacuacc 600 gcauuccuac uacucaacuu aaacuccagc accacgaccc uacuacuauc ucgcaccuga 660 aacaagcuaa caugacuaac acccuuaauu ccauccaccc uccucucccu aggaggccug 720 cccccgcuaa ccggcuuuuu gcccaaaugg gccauuaucg aagaauucac aaaaaacaau 780 agccucauca uccccaccau cauagccacc aucacccucc uuaaccucua cuucuaccua 840 cgccuaaucu acuccaccuc aaucacacua cuccccauau cuaacaacgu aaaaauaaaa 900 ugacaguuug aacauacaaa acccacccca uuccucccca cacucaucgc ccuuaccacg 960 cuacuccuac cuaucucccc uuuuauacua auaaucuua 999 <210> 63 <211> 999 <212> DNA <213> Human <220> <221> misc_feature <223> Mutant DNA for fusion transcript P0064 <400> 63 atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60 atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120 ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180 ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240 atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300 ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360 tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420 tcatatgaag tcaccctagc catcatagca ggcagttgag gtggattaaa ccaaacccag 480 ctacgcaaaa tcttagcata ctcctcaatt acccacatag gatgaataat agcagttcta 540 ccgtacaacc ctaacataac cattcttaat ttaactattt atattatcct aactactacc 600 gcattcctac tactcaactt aaactccagc accacgaccc tactactatc tcgcacctga 660 aacaagctaa catgactaac acccttaatt ccatccaccc tcctctccct aggaggcctg 720 cccccgctaa ccggcttttt gcccaaatgg gccattatcg aagaattcac aaaaaacaat 780 agcctcatca tccccaccat catagccacc atcaccctcc ttaacctcta cttctaccta 840 cgcctaatct actccacctc aatcacacta ctccccatat ctaacaacgt aaaaataaaa 900 tgacagtttg aacatacaaa acccacccca ttcctcccca cactcatcgc ccttaccacg 960 ctactcctac ctatctcccc ttttatacta ataatctta 999 <210> 64 <211> 333 <212> PRT <213> Human <220> <221> misc_feature <223> Fusion protein corresponding to P0064 <400> 64 Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala 1 5 10 15 Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln 20 25 30 Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro 35 40 45 Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala 50 55 60 Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr 65 70 75 80 Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val 85 90 95 Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala 100 105 110 Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala 115 120 125 Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val 130 135 140 Thr Leu Ala Ile Met Ala Gly Ser Trp Gly Gly Leu Asn Gln Thr Gln 145 150 155 160 Leu Arg Lys Ile Leu Ala Tyr Ser Ser Ile Thr His Met Gly Trp Met 165 170 175 Met Ala Val Leu Pro Tyr Asn Pro Asn Met Thr Ile Leu Asn Leu Thr 180 185 190 Ile Tyr Ile Ile Leu Thr Thr Thr Ala Phe Leu Leu Leu Asn Leu Asn 195 200 205 Ser Ser Thr Thr Thr Leu Leu Leu Ser Arg Thr Trp Asn Lys Leu Thr 210 215 220 Trp Leu Thr Pro Leu Ile Pro Ser Thr Leu Leu Ser Leu Gly Gly Leu 225 230 235 240 Pro Pro Leu Thr Gly Phe Leu Pro Lys Trp Ala Ile Ile Glu Glu Phe 245 250 255 Thr Lys Asn Asn Ser Leu Ile Ile Pro Thr Ile Met Ala Thr Ile Thr 260 265 270 Leu Leu Asn Leu Tyr Phe Tyr Leu Arg Leu Ile Tyr Ser Thr Ser Ile 275 280 285 Thr Leu Leu Pro Met Ser Asn Asn Val Lys Met Lys Trp Gln Phe Glu 290 295 300 His Thr Lys Pro Thr Pro Phe Leu Pro Thr Leu Ile Ala Leu Thr Thr 305 310 315 320 Leu Leu Leu Pro Ile Ser Pro Phe Met Leu Met Ile Leu 325 330 <210> 65 <211> 1481 <212> RNA <213> Human <220> <221> misc_feature <223> Fusion transcript P0176 (MT-ND1 (3307-3872) + MT-CO1 (6530-7445)) <400> 65 auacccaugg ccaaccuccu acuccucauu guacccauuc uaaucgcaau ggcauuccua 60 augcuuaccg aacgaaaaau ucuaggcuau auacaacuac gcaaaggccc caacguugua 120 ggccccuacg ggcuacuaca acccuucgcu gacgccauaa aacucuucac caaagagccc 180 cuaaaacccg ccacaucuac caucacccuc uacaucaccg ccccgaccuu agcucucacc 240 aucgcucuuc uacuaugaac cccccucccc auacccaacc cccuggucaa ccucaaccua 300 ggccuccuau uuauucuagc caccucuagc cuagccguuu acucaauccu cugaucaggg 360 ugagcaucaa acucaaacua cgcccugauc ggcgcacugc gagcaguagc ccaaacaauc 420 ucauaugaag ucacccuagc caucauucua cuaucaacau uacuaauaag uggcuccuuu 480 aaccucucca cccuuaucac aacacaagaa caccucugau uacuccugcc aucaugaccc 540 uuggccauaa uaugauuuau cuccacacua acagaccgca accucaacac caccuucuuc 600 gaccccgccg gaggaggaga ccccauucua uaccaacacc uauucugauu uuucggucac 660 ccugaaguuu auauucuuau ccuaccaggc uucggaauaa ucucccauau uguaacuuac 720 uacuccggaa aaaaagaacc auuuggauac auagguaugg ucugagcuau gauaucaauu 780 ggcuuccuag gguuuaucgu gugagcacac cauauauuua caguaggaau agacguagac 840 acacgagcau auuucaccuc cgcuaccaua aucaucgcua uccccaccgg cgucaaagua 900 uuuagcugac ucgccacacu ccacggaagc aauaugaaau gaucugcugc agugcucuga 960 gcccuaggau ucaucuuucu uuucaccgua gguggccuga cuggcauugu auuagcaaac 1020 ucaucacuag acaucguacu acacgacacg uacuacguug uagcccacuu ccacuauguc 1080 cuaucaauag gagcuguauu ugccaucaua ggaggcuuca uucacugauu uccccuauuc 1140 ucaggcuaca cccuagacca aaccuacgcc aaaauccauu ucacuaucau auucaucggc 1200 guaaaucuaa cuuucuuccc acaacacuuu cucggccuau ccggaaugcc ccgacguuac 1260 ucggacuacc ccgaugcaua caccacauga aacauccuau caucuguagg cucauucauu 1320 ucucuaacag caguaauauu aauaauuuuc augauuugag aagccuucgc uucgaagcga 1380 aaaguccuaa uaguagaaga acccuccaua aaccuggagu gacuauaugg augcccccca 1440 cccuaccaca cauucgaaga acccguauac auaaaaucua g 1481 <210> 66 <211> 1481 <212> DNA <213> Human <220> <221> misc_feature <223> Mutant DNA for fusion transcript P0176 <400> 66 atacccatgg ccaacctcct actcctcatt gtacccattc taatcgcaat ggcattccta 60 atgcttaccg aacgaaaaat tctaggctat atacaactac gcaaaggccc caacgttgta 120 ggcccctacg ggctactaca acccttcgct gacgccataa aactcttcac caaagagccc 180 ctaaaacccg ccacatctac catcaccctc tacatcaccg ccccgacctt agctctcacc 240 atcgctcttc tactatgaac ccccctcccc atacccaacc ccctggtcaa cctcaaccta 300 ggcctcctat ttattctagc cacctctagc ctagccgttt actcaatcct ctgatcaggg 360 tgagcatcaa actcaaacta cgccctgatc ggcgcactgc gagcagtagc ccaaacaatc 420 tcatatgaag tcaccctagc catcattcta ctatcaacat tactaataag tggctccttt 480 aacctctcca cccttatcac aacacaagaa cacctctgat tactcctgcc atcatgaccc 540 ttggccataa tatgatttat ctccacacta acagaccgca acctcaacac caccttcttc 600 gaccccgccg gaggaggaga ccccattcta taccaacacc tattctgatt tttcggtcac 660 cctgaagttt atattcttat cctaccaggc ttcggaataa tctcccatat tgtaacttac 720 tactccggaa aaaaagaacc atttggatac ataggtatgg tctgagctat gatatcaatt 780 ggcttcctag ggtttatcgt gtgagcacac catatattta cagtaggaat agacgtagac 840 acacgagcat atttcacctc cgctaccata atcatcgcta tccccaccgg cgtcaaagta 900 tttagctgac tcgccacact ccacggaagc aatatgaaat gatctgctgc agtgctctga 960 gccctaggat tcatctttct tttcaccgta ggtggcctga ctggcattgt attagcaaac 1020 tcatcactag acatcgtact acacgacacg tactacgttg tagcccactt ccactatgtc 1080 ctatcaatag gagctgtatt tgccatcata ggaggcttca ttcactgatt tcccctattc 1140 tcaggctaca ccctagacca aacctacgcc aaaatccatt tcactatcat attcatcggc 1200 gtaaatctaa ctttcttccc acaacacttt ctcggcctat ccggaatgcc ccgacgttac 1260 tcggactacc ccgatgcata caccacatga aacatcctat catctgtagg ctcattcatt 1320 tctctaacag cagtaatatt aataattttc atgatttgag aagccttcgc ttcgaagcga 1380 aaagtcctaa tagtagaaga accctccata aacctggagt gactatatgg atgcccccca 1440 ccctaccaca cattcgaaga acccgtatac ataaaatcta g 1481 <210> 67 <211> 494 <212> PRT <213> Human <220> <221> misc_feature <223> Fusion protein corresponding to P0176 <220> <221> misc_feature <222> (494)..(494) <223> Xaa can be any naturally occurring amino acid <400> 67 Met Pro Met Ala Asn Leu Leu Leu Leu Ile Val Pro Ile Leu Ile Ala 1 5 10 15 Met Ala Phe Leu Met Leu Thr Glu Arg Lys Ile Leu Gly Tyr Met Gln 20 25 30 Leu Arg Lys Gly Pro Asn Val Val Gly Pro Tyr Gly Leu Leu Gln Pro 35 40 45 Phe Ala Asp Ala Met Lys Leu Phe Thr Lys Glu Pro Leu Lys Pro Ala 50 55 60 Thr Ser Thr Ile Thr Leu Tyr Ile Thr Ala Pro Thr Leu Ala Leu Thr 65 70 75 80 Ile Ala Leu Leu Leu Trp Thr Pro Leu Pro Met Pro Asn Pro Leu Val 85 90 95 Asn Leu Asn Leu Gly Leu Leu Phe Ile Leu Ala Thr Ser Ser Leu Ala 100 105 110 Val Tyr Ser Ile Leu Trp Ser Gly Trp Ala Ser Asn Ser Asn Tyr Ala 115 120 125 Leu Ile Gly Ala Leu Arg Ala Val Ala Gln Thr Ile Ser Tyr Glu Val 130 135 140 Thr Leu Ala Ile Ile Leu Leu Ser Thr Leu Leu Met Ser Gly Ser Phe 145 150 155 160 Asn Leu Ser Thr Leu Ile Thr Thr Gln Glu His Leu Trp Leu Leu Leu 165 170 175 Pro Ser Trp Pro Leu Ala Met Met Trp Phe Ile Ser Thr Leu Thr Asp 180 185 190 Arg Asn Leu Asn Thr Thr Phe Phe Asp Pro Ala Gly Gly Gly Asp Pro 195 200 205 Ile Leu Tyr Gln His Leu Phe Trp Phe Phe Gly His Pro Glu Val Tyr 210 215 220 Ile Leu Ile Leu Pro Gly Phe Gly Met Ile Ser His Ile Val Thr Tyr 225 230 235 240 Tyr Ser Gly Lys Lys Glu Pro Phe Gly Tyr Met Gly Met Val Trp Ala 245 250 255 Met Met Ser Ile Gly Phe Leu Gly Phe Ile Val Trp Ala His His Met 260 265 270 Phe Thr Val Gly Met Asp Val Asp Thr Arg Ala Tyr Phe Thr Ser Ala 275 280 285 Thr Met Ile Ile Ala Ile Pro Thr Gly Val Lys Val Phe Ser Trp Leu 290 295 300 Ala Thr Leu His Gly Ser Asn Met Lys Trp Ser Ala Ala Val Leu Trp 305 310 315 320 Ala Leu Gly Phe Ile Phe Leu Phe Thr Val Gly Gly Leu Thr Gly Ile 325 330 335 Val Leu Ala Asn Ser Ser Leu Asp Ile Val Leu His Asp Thr Tyr Tyr 340 345 350 Val Val Ala His Phe His Tyr Val Leu Ser Met Gly Ala Val Phe Ala 355 360 365 Ile Met Gly Gly Phe Ile His Trp Phe Pro Leu Phe Ser Gly Tyr Thr 370 375 380 Leu Asp Gln Thr Tyr Ala Lys Ile His Phe Thr Ile Met Phe Ile Gly 385 390 395 400 Val Asn Leu Thr Phe Phe Pro Gln His Phe Leu Gly Leu Ser Gly Met 405 410 415 Pro Arg Arg Tyr Ser Asp Tyr Pro Asp Ala Tyr Thr Thr Trp Asn Ile 420 425 430 Leu Ser Ser Val Gly Ser Phe Ile Ser Leu Thr Ala Val Met Leu Met 435 440 445 Ile Phe Met Ile Trp Glu Ala Phe Ala Ser Lys Arg Lys Val Leu Met 450 455 460 Val Glu Glu Pro Ser Met Asn Leu Glu Trp Leu Tyr Gly Cys Pro Pro 465 470 475 480 Pro Tyr His Thr Phe Glu Glu Pro Val Tyr Met Lys Ser Xaa 485 490

Claims

미토콘드리아 DNA의 돌연변이에 해당하는 미토콘드리아 융합 전사물의 번역 결과 발생한 아미노산 서열을 포함하며, 상기 아미노산 서열은 서열식별번호 58로 이루어진, 단리 미토콘드리아 융합 단백질.
암에 관련된 적어도 하나의 미토콘드리아 융합 단백질의 존재에 관해 포유동물로부터의 조직 샘플을 분석해 상기 포유동물의 암을 검출하기 위한 키트의 제조에 사용되는, 제1항의 미토콘드리아 융합 단백질 중 적어도 일부와 특이적으로 결합하는 항체 또는 이의 항원 결합 단편.
제2항에 있어서, 상기 암은 전립선암, 정소암 , 난소암, 유방암, 결장 직장암, 폐암, 및 흑색종 피부암으로 이루어진 군으로부터 선택되는 항체 또는 이의 항원 결합 단편.
제1항의 단백질에 대해서 특이적으로 결합하는 항체 또는 이의 항원 결합 단편.
제4항에 있어서, 상기 항체는 다클론 또는 단일클론인 항체 또는 이의 항원 결합 단편.
제2항에 있어서, 상기 분석은 면역학적 분석을 포함하는 항체 또는 이의 항원 결합 단편.
제6항에 있어서, 상기 분석은 제5항의 항체 또는 이의 항원-결합 단편과 함께 행해지는 항체 또는 이의 항원 결합 단편.
포유동물의 암의 존재를 검출하는 분석을 하기 위한 키트로서, 제4항의 항체 또는 이의 항원-결합 단편을 포함하는, 키트.
서열식별번호 56에 나타난 핵산 서열을 포함하는, 단리 미토콘드리아 융합 전사물.
제9항의 융합 전사물을 코드하는 단리 mtDNA.
서열식별번호 57에 나타난 서열을 포함하는, 제10항의 단리 mtDNA.
제9항의 미토콘드리아 융합 전사물, 또는 제10항 또는 제11항의 mtDNA 중 적어도 일부와 상보하는 핵산 서열을 포함하는 하이브리드화 탐침으로서, 상기 일부는 연접된 유전자들의 연결 점을 포함한, 하이브리드화 탐침.
암에 관련된 적어도 하나의 미토콘드리아 융합 전사물의 존재에 관해 포유류로부터의 조직 시료를 분석해 상기 포유류의 암을 검출하기 위한 키트의 제조에 사용되는, 제9항의 단리 미토콘드리아 융합 전사물 중 적어도 일부와 상보하는 핵산 서열을 포함하는 하이브리드화 탐침으로서, 상기 일부는 연접된 유전자들의 연결 점을 포함한, 하이브리드화 탐침.
제13항에 있어서, 상기 암은 전립선암, 정소암 , 난소암, 유방암, 결장 직장암, 폐암, 및 흑색종 피부암으로 이루어지는 군으로부터 선택되는 하이브리드화 탐침.
포유류의 암의 존재를 검출하는 분석을 하기 위한 키트로서, 제9항에 기재된 단리 미토콘드리아 융합 전사물 중 적어도 일부와 상보하는 핵산 서열을 포함하는 적어도 하나의 하이브리드화 탐침을 포함하고, 상기 일부는 연접된 유전자의 연결 점을 포함하는 키트.
삭제
삭제