KR100862049B1

KR100862049B1 - 약독화된 재조합 뉴캐슬병 바이러스

Info

Publication number: KR100862049B1
Application number: KR1020070086175A
Authority: KR
Inventors: 조선희; 권혁준; 김선중; 김태은; 안영진; 고미정; 김일환; 박영호; 김채현; 한장혁; 김태환
Original assignee: 주식회사 고려비엔피; 조선희
Priority date: 2007-08-27
Filing date: 2007-08-27
Publication date: 2008-10-09
Also published as: KR20080028277A

Abstract

본 발명은 재조합 뉴캐슬병 바이러스 게놈 전사 벡터, 이를 통해 제작된 병원성 뉴캐슬병 바이러스의 표면 항원을 갖는 약병원성 재조합 뉴캐슬병 바이러스, 상기의 게놈 전사 벡터를 사용하여 뉴캐슬병에 대해 탁월한 예방효능을 가지면서 병원성은 낮은 재조합 뉴캐슬병 바이러스를 제조하는 방법, 및 상기 재조합 뉴캐슬병 바이러스를 함유하는 뉴캐슬병 백신에 관한 것이다.

Description

약독화된 재조합 뉴캐슬병 바이러스{ATTENUATED RECOMBINANT NEWCASTLE DISEASE VIRUS}

도 1은 국내 강병원성 뉴캐슬병 바이러스 (Newcastle disease virus, NDV)인 KBNP-4152의 게놈 RNA RT-PCR 결과와 증폭 산물의 이름 및 위치를 나타낸 것이다.

도 2는 도 1의 증폭산물을 TA-클로닝 벡터에 클로닝 한 결과이다.

도 3은 재조합 NDV 게놈의 양쪽 말단을 정확하게 만들어낼 수 있도록 인식부위와 절단부위가 상이한 제한효소인 BsmBI과 BsaI 인식 염기서열을 삽입하는 과정을 보여주는 것이다.

도 4는 NDV 게놈 DNA 클로닝을 위한 모벡터 pTMH 제작을 위한 링커 염기서열과 링커의 제작을 위한 프라이머 염기서열을 나타낸 것이다.

도 5는 pTMH 벡터의 제조 과정을 모식적으로 나타낸 것이다.

도 6은 pTMH의 주요 부위의 염기서열을 나타낸 것이다.

도 7은 pTMH 벡터의 전체 염기서열을 나타낸 것이다.

도 8은 라소타주의 게놈 RNA RT-PCR 결과 및 증폭산물의 이름과 위치를 나타낸 것이다.

도 9는 도 8의 증폭산물을 TA-클로닝 벡터에 클로닝 한 결과이다.

도 10은 NDV의 게놈 DNA 클로닝 과정을 나타낸 것이다.

도 11은 NDV의 NP, P 및 L 유전자 발현 플라스미드의 제작 과정을 보여주는 것으로, A의 2,3,4 레인은 각각 NP, P, L 유전자의 RT-PCR결과이며, 6,7,8 레인은 각각 NP, P, L 유전자를 pcDNA3.1/topo에 클로닝한 후 NotI으로 처리하여 삽입 유전자를 확인한 사진이고, B는 이에 대한 모식도 이다.

도 12는 PTDS 기법을 이용한 F 및 HN 유전자 반합성 과정을 나타낸 것이다.

도 13은 본 발명의 재조합 바이러스의 M 및 F 유전자 연결부 및 F 단백질의 퓨린 인식 부위의 뉴클레오티드 서열을 나타낸 것이다.

도 14는 PTDS 및 site-directed mutagenesis를 이용한 F 단백질의 furin (퓨린) 인식부위에 돌연변이가 유발된 유전자 합성 과정을 나타낸 것이다.

도 15는 KBNP-4152 HN (1-566) 유전자와 라소타주의 HN말단 (567-577번) 유전자 연결을 위한 PTDS용 프라이머 설계도이다.

도 16은 재조합 바이러스인 KBNP-C4152R2L의 제작 과정을 나타낸 것이다.

도 17은 다양한 퓨린 인식부위를 갖는 재조합 바이러스 클론의 제작과정을 나타낸 것이다.

도 18은 계태아에 접종한 KBNP-C4152R2L의 증식 여부를 평판 혈구응집 반응시험으로 확인한 것이다.

도 19는 KBNP-C4152R2L의 병원성을 알아보기 위한 pathotype-specific RT-PCR 결과를 나타낸 것이다.

도 20은 KBNP-4152와 KBNP-C4152R2L의 F 단백질의 퓨린 인식 부위의 염기서 열을 비교한 것이다.

도 21은 교차 혈구응집억제법을 이용하여 라소타주, KBNP-4152 및 KBNP-C4152R2L의 항원적 관련성을 나타낸 것이다.

도 22는 KBNP-C4152R2L의 세포변성효과를 나타낸 것이다.

도 23은 pTMH에 클로닝 된 KBNP-C4152R2L의 게놈지도 및 게놈의 염기서열을 나타낸 것이다.

본 발명은 재조합 NDV 게놈 전사 벡터, 이를 통해 제작된 병원성 NDV의 표면 항원을 갖는 약병원성 재조합 NDV, 상기의 게놈 전사벡터를 사용하여 뉴캐슬병에 대해 탁월한 예방효능을 가지면서 병원성은 낮은 재조합 NDV를 제조하는 방법 및 상기 재조합 NDV를 함유하는 ND 백신에 관한 것이다.

뉴캐슬병((Newcastle Disease, ND)은 국제적으로 가장 중요한 가축 질병 15종 중 하나로, 급성 열성 호흡기 질병이며, 면역이 안 된 가금에 감염되는 경우 100% 폐사하는 법정 제1종 전염병이다. 우리나라는 뉴캐슬병바이러스(Newcastle disease virus, NDV) 상재지역으로, 이 질병의 근절에 상당한 어려움이 있을 것으로 예상된다. 또한, 우리나라와 활발한 교역을 하고 있는 동남아시아, 중국, 및 대만에는 다양한 뉴캐슬병 바이러스들이 유행하고 있어서 잠재적인 위해 요인으로 존재하므로, 아시아형 뉴캐슬병 백신의 개발이 절실한 시점이다.

뉴캐슬병 바이러스는 단일 가닥(single stranded) RNA 바이러스로 아부라바이러스 속(genus Avulavirus)에 속한다. 뉴캐슬병 바이러스는 엔벨롭(envelope)을 가지고 있으며 엔벨롭에는 바이러스가 숙주 세포에 결합할 수 있도록 해주는 HN(Haemagglutinin-Neuraminidase) 단백질과 엔벨롭과 숙주 세포의 융합을 일으키는 F(Fusion) 단백질이 있다. F 단백질과 HN 단백질은 글리코단백질(glycoprotein)로서 엔벨롭의 표면에 분포되어 있다.

F 단백질은 Ⅰ형 막 글리코단백질(type Ⅰ membrane glycoprotein)로써 삼합체(trimeric) 구조를 형성한다. F 단백질은 비활성 전구체 형태(F0)로 만들어지고 골지 막(Golgi membranes)을 통해 이동하는 동안 활성 형태인 F1과 F2로 잘리게 된다. 이러한 과정은 F1 소단위체(subunit)의 아미노 말단에서 소수성 도메인(domain)을 노출시키고 이것은 성숙한 단백질의 생물학적 활성에 중요한 역할을 한다. 융합 펩티드(fusion peptide)라 불리는 소수성 도메인은 파라믹소바이러스(paramyxovirus) F 단백질에서 매우 보존되어 있고 막 융합을 매개하는데 직접적으로 관여하고 있을 것이라 여겨지고 있다. 파라믹소바이러스 F 단백질은 7개 반복(heptad repeats)을 포함하고 알파 헬릭스 구조를 형성할 가능성이 있는 두 지역을 포함하는 여러 개의 공통된 구조 형태를 갖고 있다. 두 반복중 가장 긴 7개 반복 A(heptad repeat A)는 F1의 아미노 말단에서 소수성 융합 펩티드와 인접해 있으며, 7개 반복 B는 관통막(transmembrane) 지역의 윗부분에 밀착하여 있다. 7개 반복 B는 매 7개 잔기마다 매우 보존된 류신 또는 이소류신의 연속으로 구성되어 있다.

HN 단백질은 Ⅱ형 막 글리코단백질(type Ⅱ membrane glycoprotein)로 바이러스 엔벨롭의 표면에서 4합체(tetramer)를 형성하여 세포막에 침투한다(Gorman et al., 1988; Ng et al., 1989). HN 단백질은 비리온(virion)이 글리코접합(glycoconjugates)의 시알산(sialic acids)에 결합함으로써 호스트 세포 표면에 위치시키는 기능을 한다. HN 단백질은 관통막(transmembrane) 도메인, 줄기(stalk) 도메인 및 구형(globular) 도메인의 세 지역으로 나뉜다. 항원성인 수용체 결합과 뉴라미니다제(neuraminidase) 활성 위치는 모두 구형 도메인에 위치해 있다. 융합 유도 활성은 줄기 도메인에 위치해 있고 이것은 F 단백질과 상호작용 한다(Sergei et al., 1993). 줄기 도메인은 예상되는 형태로 α-헬릭스와 함께 2개의 7개 반복 지역 A(74-88 위치)와 7개 반복 지역 B(96-110 위치)를 갖고 있다. 또한, 구조를 파괴하는 어떤 돌연변이도 수용체 결합과 뉴라미니다제 활성을 감소시키는 원인이 된다는 보고가 있다.

NDV은 닭에서 질병 정도에 따라 아래와 같은 병원성 타입(phathotype)으로 분류된다: 1) 소화기 병변과 높은 폐사율을 보이는 장 친화 강병원성 (velogenic) NDV; 그리고 호흡기 및 신경학적 증상이 주로 나타나며 높은 폐사율을 보이는 신경 친화 강병원성 NDV; 2) 낮은 치사율, 일부 조류에서 급성 호흡기 질환 및 신경성 증상을 보이는 중병원성 (methogenic) NDV; 3) 경증 또는 무증상의 호흡기 감염을 유발하는 약병원성 (lentogenic) 및 무병원성 (apathogenic) NDV.

NDV이 세포에 감염성을 갖기 위해서는 F1 및 F2로 절단될 전구체 당단백질 Fo이 필요하다. 이 번역-후 절단은 숙주 세포 프로테아제들에 의해 중재된다. 만 약 절단이 일어나는 것이 실패되면, 비-감염성 바이러스 입자들이 생성되고 그리고 바이러스 복제가 진행할 수 없다. 독성 바이러스의 Fo 단백질은 광범위한 프로테아제에 의해 절단될 수 있으나, 낮은 독성의 바이러스들에서 Fo 단백질들은 그들의 감수성에 제약되고 이들 바이러스는 단지 특정 숙주 세포 타입에서만 증식가능하다.

약병원성인 렌토제닉 바이러스는 단지 호흡기 또는 장관과 같은 트립신-같은 효소들을 갖는 영역에서만 복제하는 반면에, 독성 바이러스들은 조직 및 기관의 범위에서 복제할 수 있어 치명적인 전신감염을 초래한다.

Fo 전구체의 아미노산 사열화는 약 병원성 바이러스들은 F2 및 F1 사슬을 연결하는 단일 아르기닌 (R)을 갖는 반면에, 중간독 이상의 균주들은 절단 부위에 K/R-X-K/R-R-F와 같은 두 쌍을 형성하는 추가의 기본 아미노산들을 보유한다는 것을 보여주었다. 게다가, 중병원성이상의 병원성을 갖는 균주들의 F2 사슬은 일반적으로 페닐알라닌 (phenylalanine) 잔기로 개시하는 반면에, 약병원성 이하의 병원성을 보이는 균주들의 F2 사슬은 일반적으로 류신 (leucine)으로 개시한다.

미국에서 뉴캐슬병의 동정은 불활화 백신의 사용을 이끌어 냈다 (Hofstad, 1953). 일부 동물 풍토병 바이러스가 단지 순한 질환을 생산했다는 관찰은 최초로 미소제닉 생 백신 Roakin의 개발의 결과를 가져왔고, 이어서, 더 순한 Hitchner B1 및 LaSota (Goldhaft, 1980)의 개발을 가져왔다.

생백신들의 주요한 이점중 하나는 비용이 싼 대량 적용 기술에 의해 투여될 수 있다는 것이다. 통상적인 적용 방법은 물을 마시는 것을 통하는 것이다.

스프레이 및 에어로졸에 의한 생백신의 대량 적용은 많은 수의 새가 짧은 시간내에 백신 접종될 수 있다는 용이성 때문에 또한 매우 인기가 좋다. 입자들이 발생되는 조들을 조절함에 의해 정확한 입자 크기를 달성하는 것이 중요하다.

최근 사용되는 생백신들은 몇가지 문제점을 가지고 있다. 이 백신은 여전히 약간의 병원성을 가지고 있어 경우에 따라 백신 부작용이 나타 날 수 있다. 게다가, 모계로부터 물려받은 항체들이 생백신 바이러스를 중화하여 성공적인 면역 형성이 방해 될 수 있다. 그러므로 1차 백신 접종은 극히 순한 바이러스를 사용하는 것이 중요하며, 모체 이행 항체의 극복이 가능한 백신이 요구된다.

불활화된 백신은 바이러스를 죽이기 위해 포말린 또는 베타프로피오락톤으로 처리되고 적절한 보조제와 혼합된 감염성 요낭액으로부터 보통 생산된다. 불활화된 백신들은 근육 또는 피하 주사로 투여된다. 그러나 불활화된 백신들은 생산하고 적용하는데 비용이 비싼 단점이 있다.

최근 국내외에서 발생하고 있는 강병원성 NDV는 항원성에서 백신주와 많은 차이를 보일 것으로 추정되는데 이에 대한 근거로는 백신주의 유전형과 상당한 차이를 보이는 야외주의 발견과 백신 항체역가가 충분히 높지 않은 경우 폐사는 막을 수 있지만 산란율 저하는 막지 못한다는 사실 등을 들 수 있다.

NDV의 유전형은 F 유전자의 부분 염기서열에 기초한 계통 분석에 의하여 I형부터 IX형까지로 분류된다. 국내에 분포하는 뉴캐슬병 바이러스는 대부분 분자역학 상 VI형과 VII형에 속한다. 이 중, VI형의 경우 집중적인 백신 접종에 의하여 변이주가 출현하였지만, VII형에 비해서는 상대적으로 낮은 분리율을 보이고 있으 며, 2000년 이후에는 대부분 VII형 바이러스만이 분리되고 있어서, 멸종의 가능성도 있는 것으로 생각되고 있다. 따라서 염기서열 분석 및 게놈사업을 통한 최근 NDV의 유전자 구조 결정 및 최근 GenBank에 등록되어 있는 전 세계 NDV와의 유전자 비교를 통한 분자역학 연구는 최적의 백신주 개발에 있어 매우 중요하다.

현재 상용화 된 뉴캐슬병 (ND) 불활화 오일백신은 약병원성 NDV인 클론 30 또는 라소타주를 사용하여 생산된 것이며, 강병원성 NDV를 이용한 불활화 백신은 안전성 문제 때문에 제조가 금지 되어 있다. 따라서 보다 안전하고, 경제적이며, 야외주와 유사한 항원성을 보이는 ND 백신 생산기술의 필요성이 증대되고 있는데 현재 역유전학 (Reverse Genetics) 기술을 이용한 백신 개발이 이러한 요구에 가장 근접한 기술이다.

네거티브 가닥 RNA 바이러스의 역유전학(Reverse Genetics) 기술은 바이러스 게놈으로부터 감염성 있는 바이러스를 회수하는 기술로서 제안된 방식이다 (US Patent No. 5,166,057 등 참조). 이러한 기술은 원래 인플루엔자 바이러스 게놈을 조작하기 위하여 제안된 것이지만, 인플루엔자 바이러스 이외의 RNA 바이러스인 광견병 바이러스(Rabies Virus), 호흡기 합포체 바이러스 (Respiratory Syncytial Virus), 센다이 바이러스 (Sendaivirus)를 비롯하여 다양한 분절과 비분절 네거티브 가닥 RNA 바이러스에 성공적으로 적용되고 있다.

본 발명자들은 상기와 같은 역유전학 기술을 이용하여 신규 백신주 개발을 위한 연구를 거듭한 결과, 야외주와 유사한 항원성을 갖는 안전한 ND 백신주 생산 기술을 개발하여 본 발명을 완성하였다.

본 발명의 목적은 재조합 NDV 게놈 전사 벡터를 제공하는 것이다.

본 발명의 또 다른 목적은 병원성 NDV의 표면 항원을 갖는 약병원성 재조합 NDV를 제공하는 것이다.

본 발명의 또 다른 목적은 상기와 같은 재조합 NDV 게놈 전사 벡터를 사용하여 ND에 대해 탁월한 예방효능을 가지면서 병원성은 낮은 재조합 NDV를 제조하는 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 역유전학 기술을 이용하여 NDV의 면역원성은 높이고 병원성은 낮추는 NDV의 약독화 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 상기 재조합 NDV를 함유하는 ND 백신을 제공하는 것이다.

본 발명은 재조합 뉴캐슬병 바이러스 게놈 전사 벡터, 이를 포함하는 병원성 뉴캐슬병 바이러스의 표면 항원을 갖는 약병원성 재조합 뉴캐슬병 바이러스, 상기의 재조합 뉴캐슬병 바이러스 게놈 전사 벡터를 사용하여 ND에 대해 탁월한 예방효능을 가지면서 병원성은 낮은 재조합 NDV를 제조하는 방법, 및 상기 재조합 뉴캐슬병 바이러스를 함유하는 뉴캐슬병 백신에 관한 것이다.

본 발명의 F 유전자 (384bp; F 유전자 뉴클레오타이드 위치 1~384bp)와 Neighber-Joining법을 이용한 뉴캐슬바이러스의 계통 분석 결과는 다음과 같다:

상기 그림에 나타난 균주들은 예시에 불과한 것이며, 현재 수많은 종류의 뉴캐슬병 바이러스 균주들이 상기와 같이 I형 내지 IX형으로 분류되어 있으며, 뉴캐슬병 바이러스를 분자 역학적으로 분류한 결과가 많이 보고되어 있어서, 상기와 같은 분류의 기준과 각 유형에 속하는 균주들은 이 발명이 속하는 기술 분야의 통상 의 지식을 가진 자가 용이하게 알 수 있을 것으로 생각된다. 본 명세서에서의 균주 분류 및 그 기준은 다음과 같은 참고 문헌에 기재된 내용을 인용하며, 하기의 문헌들은 모두 본 명세서에 참조로서 포함된다:

1. Kwon H.J. PhD Thesis. Seoul National University, 2000.

2. Lomniczi B., Wehmann E., Herczeg J., Ballagi-Pordㅱny A., Kaleta E.F., Werner O., Meulemans G., Jorgensen P.H., Mante A.P., Gielkens A.L.J., Capua I., and Damoser J., Arch Virol143, 49-64, 1998.

3. Herczeg J., Wehmann E., Bragg R.R., Travassos Dias P.M., Hadjiev G., Werner O., andLomniczi, B. Arch Virol144, 2087-2099, 1999.

4. Yang C.Y., Shieh H.K., Lin Y.L., Chang P.C., Avian Dis 43, 125-130, 1999.

5. Kwon H.J., Cho S.H., Ahn Y.J., Seo S.H., Choi K.S., and Kim S.J. Vet Microbiol95, 39-48,2003.

6. Liu X.F., Wan H.Q., Ni X.X., Wu Y.T., and Liu W.B. (2003). Pathotypical and genotypical characterization of strains of Newcastle disease virus isolated from outbreaks in chicken and goose flocks in some regions of China during 1985-2001. Arch Virol, 148, 1387-1403.

7. Tsai H.J., Chang K.H., Tseng C.H., Frost K.M., Manvell R.J., and Alexander D.J. Vet Microbiol, 104, 19-30, 2004.

현재 백신주로서 사용되는 라소타/46은 II형인데 반하여, 현재 야외주로서 발견되고 있는 균주들은 이와 유전적으로 거리가 먼 VI형 내지 VII형이 대부분이다. 예컨대, NDV의 HN 단백질에서 345-PDEQDYQIR-353 부위가 중화항체를 형성하는 중요한 선형항원으로 알려져 있다. 국내 병원성 NDV는 VI형 (95-98, 99-70, 99-71)과 VII형 바이러스가 공존해 왔으나 VI형 NDV는 1999년을 마지막으로 2000년부터 2006년까지는 전혀 분리되지 않고 있고, 1995년 가금에서 최초로 분리된 VIIa형의 NDV는 이후 분리되지 않고, VIId 형의 NDV만 분리되고 있다. VI 형 바이러스의 경우 선형항원의 변이 (E347K)가 1993년과 1994년 분리주들 (SNU9358GG, SNU9444)에서 처음 확인된 이후로 95-98, 99-70, 99-71에서도 지속적으로 관찰되어 이러한 변이주가 한동안은 면역을 회피하여 생존해왔던 것으로 판단되며, 2000년 이후 VIId형 바이러스의 전국적인 확산 이후 거의 멸종 된 것으로 판단된다. VII형 바이러스들의 경우 1995년부터 2001까지 분리된 바이러스들은 모두 라소타주의 선형항원과 동일하였으나 2002년에 처음으로 선형항원 변이주 (E347K)가 출현하였고, 2005년에는 추가적인 변이를 보이는 NDV가 우점하는 양상을 보여 주었다 (아래 표 참조).

	Classical epitope	Variant epitope
Year	346DEQDYQIRM354	346-K------M/K-354
1995	1	-
2000	16	-
2001	1	-
2002	15 (79%)	4 (10.5%)
2003	1	1
2004	-	1
2005	1 (6.25%)	15 (93.75%)
2006	-	2

이러한 점을 감안할 때, 기존의 백신주 라소타/46으로는 현재 유행하고 있는 뉴캐슬병에 대한 효과적인 예방이 불가능할 것으로 생각되며, 본 발명은 야외주에 대하여 우수한 항원성을 갖는 백신주 개발 기술을 제공한다는 점에서 가장 큰 의의가 있다고 할 수 있다.

본 명세서에 있어서, 강병원성 뉴캐슬병 바이러스는, 별도의 언급이 없는 한, 통상적으로 분류되는 강병원성 뉴캐슬병 바이러스 뿐 아니라 중간 이상의 병원성을 갖는 모든 병원성 뉴캐슬병 바이러스를 포함하는 의미로 사용된다. 본 발명에 있어서, 강병원성 뉴캐슬병 바이러스는 동물 감염 시 체내 모든 세포에서 감염성 있는 바이러스가 만들어짐으로써 병원성을 나타내는 것으로, F 단백질의 113번째부터 116번째 아미노산 서열이 다음의 식 1과 같이 표현되는 경우 체내 대부분의 세포 내에 분포하는 퓨린 또는 퓨린 유사 단백질분해효소 (이하 퓨린)에 의해 절단되어 활성을 갖는 구조를 갖게 되므로 바이러스의 감염능력이 생기게 된다. 따라서 병원성 뉴캐슬병 바이러스는 F 단백질의 113번째부터 116번째 아미노산 서열의 코딩 서열로서 다음의 식 1로 표현되는 아미노산 서열을 코딩하는 염기서열을 갖는 것으로 정의된다:

[식 1]

113-X₁X₂X₃X₄-116

상기 식 중

X₁, X₃ 및 X₄는 각각 독립적으로 아르기닌 (R) 또는 리신 (K)이고,

X₂는 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르 트산, 글루타민산, 아르기닌, 히스티딘 및 리신으로 이루어진 군 중에서 선택된 아미노산임.

이 때, F의 112번째 아미노산도 아르기닌 또는 리신과 같은 염기성 아미노산인 경우 더욱 강한 병원성을 나타내게 된다.

또한, 본 명세서에 있어서, 약병원성 뉴캐슬병 바이러스는, 별도의 언급이 없는 한, 통상적으로 분류되는 약병원성 뉴캐슬병 바이러스 분 아니라 무독 뉴캐슬병 바이러스를 포함하는 의미로 사용된다. 본 발명에 있어서, 약병원성 뉴캐슬병 바이러스는 동물 감염 시 체내 일부 세포 내와 소화관 및 호흡기관의 세포외 단백질 분해효소에 의해서만 활성화되어 국소적인 바이러스 증식이 일어나 약한 병원성을 나타내는 것으로, F의 113번째부터 116번째 아미노산 서열이 다음의 식 2와 같이 표현되는 경우를 의미한다. 따라서 약병원성 뉴캐슬병 바이러스는 F의 113번째부터 116번째 아미노산 서열의 코딩 서열로서 다음의 식 2로 표현되는 아미노산 서열을 코딩하는 염기서열을 갖는 것으로 정의 된다:

[식 2]

113-X₅X₆X₇X₈-116

상기 식 중

X₅, X₆ 및 X₇은 각각 독립적으로 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 발린, 아스파라긴, 시스테인, 글루타민, 글리신, 세린, 트레오닌, 티로신, 아스파르트산, 글루타민산, 아르기닌, 히스티딘 및 리신으로 이 루어진 군 중에서 선택된 아미노산이고, X₅와 X₇은 동시에 아르기닌 (R) 또는 리신 (K)이 아니며,

X₈은 아르기닌 (R) 또는 리신 (K)임.

뉴캐슬병 바이러스는 퓨린에 의하여 F 단백질에 위치하는 퓨린 인식 부위(cleavage site)가 절단되어 세포막과 융합되는 F 단백질의 융합 펩티드 부위가 노출되면 비로소 감염능력을 갖게 된다. 퓨린은 동물의 전신에 분포하는 효소이므로, 퓨린에 의한 바이러스 감염능력 활성화는 전신에서 발생하여 병원성을 나타낸다. 따라서, 뉴캐슬병 바이러스의 병원성은 F 단백질에 위치하는 퓨린 절단 부위가 퓨린에 의하여 인지되고 절단되는 정도에 따라서 달라진다.

뉴캐슬병 바이러스 F 단백질의 퓨린 인식 부위 (113 내지 116번째 아미노산)가 상기의 식 1의 아미노산 서열과 같이 적어도 3개 이상의 염기성 아미노산 (113-R-X-K/R-R-116)을 갖는 경우, 퓨린에 의한 바이러스 감염이 전신적으로 일어나므로 병원성을 나타내게 된다. 그러나 상기의 식 2의 아미노산 서열과 같이, 하나 이상의 염기성 아미노산이 비염기성 아미노산으로 치환되는 경우에는 퓨린에 의한 인식 및 절단이 거의 일어나지 않고, 오로지 국소적으로 존재하는 세포 내 또는 세포 외 단백분해효소에 의해 절단이 이루어지므로 치명적인 전신감염은 일어나지 않아 병원성은 낮다.

본 발명은 약병원성 뉴캐슬병 바이러스의 게놈을 근간으로 하면서, 표면 항원과 관련된 F 단백질 및 HN 단백질 코딩 부위를 국내 및 아시아 지역에서 유행하 는 강병원성 바이러스의 것으로 치환시킴으로써 강병원성 바이러스에 대한 방어효능을 높이는 동시에, 강병원성 뉴캐슬병 바이러스의 115번째 코돈을 비염기성 아미노산을 코딩하는 코돈으로 치환하되 적어도 2번 이상의 점 돌연변이를 거쳐야 염기성 아미노산을 코딩하는 코돈으로 변하는 특정 코돈으로 치환시켜 유전적으로 안정한 약독 재조합 뉴캐슬병 바이러스를 제작하는 기술에 관한 것이다. 본 발명에 따른 재조합 뉴캐슬병 바이러스는 상기한 바와 같이, 야외주와 동일 또는 유사한 표면 항원을 나타내어 야외주에 대한 항원성이 높고, 효과적으로 약독화되어 있을 뿐 아니라, 115번 코돈에서 적어도 2번 이상의 점 돌연변이를 거쳐야 강병원성으로 변환 가능하므로, 안정성과 안전성 면에서 탁월한 특성을 가지고 있다.

또한, 병원성 뉴캐슬병 바이러스는 세포변성효과에 따라 합포체 (syncytium)를 형성하는 합포체형과 과립 (granules)을 형성하는 과립형 (granulation)으로 분류할 수 있는데, 일반적으로 합포체 형이 과립 형보다 병원성이 강한 것으로 알려져 있다. 본 발명은 F 및 HN 코딩 부위를 제공하는 강병원성 뉴캐슬병 바이러스로서 과립-형에 속하는 바이러스 클론을 사용하여 병원성을 대폭 감소시켰다는 특징이 있다. 또한, 뉴캐슬병 바이러스의 HN에 있어서도, 강병원성 뉴캐슬병 바이러스는 상대적으로 짧은 571개의 아미노산만 갖는 반면, 약병원성 뉴캐슬병 바이러스는 이보다 긴 577개 또는 616개의 아미노산을 가지고 있어서, HN의 C 말단 아미노산 서열에 의해 강병원성주와 약병원성주가 구분될 수 있다. 따라서, 본 발명에서는 상기와 같은 HN의 C 말단을 약병원성주와 같도록 변형 (577개 아미노산)시켜 더욱 더 약독화 된 재조합 뉴캐슬병 바이러스를 제작하였다.

본 명세서에 있어서, 본 발명에 따른 뉴캐슬병 바이러스의 게놈 전사 벡터와 재조합 뉴캐스병 바이러스에 포함된 것으로 기재된 P, M, F, HN 및 L 단백질의 코딩 서열은 상기 각각의 단백질을 직접 코딩하는 염기서열 뿐 아니라, 발현된 단백질에 영향을 미치지 않는 한, P, M, F, HN 및 L 유전자에 존재할 수 있는 모든 비암호화 (non-coding) 서열도 포함할 수 있는 것으로 해석된다.

보다 구체적으로, 본 발명은 뉴캐슬병 바이러스의 NP, P, M, F, HN 및 L 단백질의 코딩 서열로 구성된 유전자 절편; 상기 유전자 절편에 작동 가능하게 연결된 프로모터 및 터미네이터를 포함하는 뉴캐슬병 바이러스의 게놈 전사 벡터로서,

상기 NP, P, M 및 L 유전자는 약병원성 뉴캐슬병 바이러스인 라소타주 게놈으로부터 유래한 것이고, 상기 F 및 HN 유전자는 강병원성 뉴캐슬병 바이러스인 KBNP-4152 게놈에서 유래한 것이고,

상기 F 단백질 코딩 서열에 있어서, KBNP-4152를 포함하는 강병원성 뉴캐슬병 바이러스 F의 115번째에 위치하는 염기성 아미노산을 코딩하는 코돈이 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; 및 UAC 및 UAU로 이루어진 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환된 것을 특징으로 하는,

뉴캐슬병 바이러스의 게놈 전사 벡터에 관한 것이다.

상기 벡터의 HN 유전자는 1번부터 569번 코돈까지는 강병원성 뉴캐슬병 바이러스의 아미노산을 코딩하고, 570번 이후의 코돈은 라소타주를 포함하는 약병원성 뉴캐슬병 바이러스의 아미노산을 코딩하도록 추가적으로 변이된 것일 수 있다.

또한, 상기 프로모터와 터미네이터는 사용된 플라스미드에서 뉴캐슬병 바이러스 게놈과 작동가능하게 연결될 수 있는 것이면 제한 없이 사용할 수 있으며, 이러한 프로모터와 터미네이터는 이 발명이 속하는 기술 분야의 통상의 지식을 가진 자라면 용이하게 선택하여 사용할 수 있을 것이다. 본 발명의 일 실시예에 있어서, 상기 프로모터 및 터미네이터로서 T7 프로모터 및 T7 터미네이터를 사용할 수 있다.

본 발명의 구체예에 있어서, 상기 게놈 전사 벡터는 SEQ ID NOs: 2 내지 7의 아미노산 서열을 코딩하는 뉴클레오티드 서열 또는 아래의 SEQ ID NO: 1의 염기서열을 갖는 것일 수 있다 (도 23 참조).

Gene start

1 accaaacagagaatccgtgagttacgataaaaggcgaaggagcaattgaagtcgc acggg

61 tagaa ggtgtgaatctcgagtgcgagcccgaagcacaaactcgagaaagccttctgccaa

M S S V F D E Y E Q L L A A Q T R P N G ·

121 c ATG TCTTCCGTATTTGATGAGTACGAACAGCTCCTCGCGGCTCAGACTCGCCCCAATGG

·A H G G G E K G S T L K V D V P V F T L ·

181 AGCTCATGGAGGGGGAGAAAAAGGGAGTACCTTAAAAGTAGACGTCCCGGTATTCACTCT

·N S D D P E D R W S F V V F C L R I A V ·

241 TAACAGTGATGACCCAGAAGATAGATGGAGCTTTGTGGTATTCTGCCTCCGGATTGCTGT

·S E D A N K P L R Q G A L I S L L C S H ·

301 TAGCGAAGATGCCAACAAACCACTCAGGCAAGGTGCTCTCATATCTCTTTTATGCTCCCA

·S Q V M R N H V A I A G K Q N E A T L A ·

361 CTCACAGGTAATGAGGAACCATGTTGCCATTGCAGGGAAACAGAATGAAGCCACATTGGC

·V L E I D G F A N G T P Q F N N R S G V ·

421 CGTGCTTGAGATTGATGGCTTTGCCAACGGCACGCCCCAGTTCAACAATAGGAGTGGAGT

·S E E R A Q R F A M I A G S L P R A C S ·

481 GTCTGAAGAGAGAGCACAGAGATTTGCGATGATAGCAGGATCTCTCCCTCGGGCATGCAG

·N G T P F V T A G A E D D A P E D I T D ·

541 CAACGGAACCCCGTTCGTCACAGCCGGGGCAGAAGATGATGCACCAGAAGACATCACCGA

·T L E R I L S I Q A Q V W V T V A K A M ·

601 TACCCTGGAGAGGATCCTCTCTATCCAGGCTCAAGTATGGGTCACAGTAGCAAAAGCCAT

·T A Y E T A D E S E T R R I N K Y M Q Q ·

661 GACTGCGTATGAGACTGCAGATGAGTCGGAAACAAGGCGAATCAATAAGTATATGCAGCA

·G R V Q K K Y I L Y P V C R S T I Q L T ·

721 AGGCAGGGTCCAAAAGAAATACATCCTCTACCCCGTATGCAGGAGCACAATCCAACTCAC

·I R Q S L A V R I F L V S E L K R G R N ·

781 GATCAGACAGTCTCTTGCAGTCCGCATCTTTTTGGTTAGCGAGCTCAAGAGAGGCCGCAA

·T A G G T S T Y Y N L V G D V D S Y I R ·

841 CACGGCAGGTGGTACCTCTACTTATTATAACCTGGTAGGGGACGTAGACTCATACATCAG

·N T G L T A F F L T L K Y G I N T K T S ·

901 GAATACCGGGCTTACTGCATTCTTCTTGACACTCAAGTACGGAATCAACACCAAGACATC

·A L A L S S L S G D I Q K M K Q L M R L ·

961 AGCCCTTGCACTTAGTAGCCTCTCAGGCGACATCCAGAAGATGAAGCAGCTCATGCGTTT

·Y R M K G D N A P Y M T L L G D S D Q M ·

1021 GTATCGGATGAAAGGAGATAATGCGCCGTACATGACATTACTTGGTGATAGTGACCAGAT

·S F A P A E Y A Q L Y S F A M G M A S V ·

1081 GAGCTTTGCGCCTGCCGAGTATGCACAACTTTACTCCTTTGCCATGGGTATGGCATCAGT

·L D K G T G K Y Q F A R D F M S T S F W ·

1141 CCTAGATAAAGGTACTGGGAAATACCAATTTGCCAGGGACTTTATGAGCACATCATTCTG

·R L G V E Y A Q A Q G S S I N E D M A A ·

1201 GAGACTTGGAGTAGAGTACGCTCAGGCTCAGGGAAGTAGCATTAACGAGGATATGGCTGC

·E L K L T P A A M K G L A A A A Q R V S ·

1261 CGAGCTAAAGCTAACCCCAGCAGCAATGAAGGGCCTGGCAGCTGCTGCCCAACGGGTCTC

·D D T S S I Y M P T Q Q V G V L T G L S ·

1321 CGACGATACCAGCAGCATATACATGCCTACTCAACAAGTCGGAGTCCTCACTGGGCTTAG

·E G G S Q A L Q G G S N R S Q G Q P E A ·

1381 CGAGGGGGGGTCCCAAGCTCTACAAGGCGGATCGAATAGATCGCAAGGGCAACCAGAAGC

·G D G E T Q F L D L M R A V A N S M R E ·

1441 CGGGGATGGGGAGACCCAATTCCTGGATCTGATGAGAGCGGTAGCAAATAGCATGAGGGA

·A P N S A Q G T P Q S G P P P T P G P S ·

1501 GGCGCCAAACTCTGCACAGGGCACTCCCCAATCGGGGCCTCCCCCAACTCCTGGGCCATC

·Q D N D T D W G Y

1561 CCAAGATAACGACACCGACTGGGGGTATTGAtggacaaaacccagcctgcttccacaaaa

1621 acatcccaatgccctcacccgtagtcgacccctcgatttgcggctctatatgaccacacc

1681 ctcaaacaaacatccccctctttcctccctccccctgctgtacaactccgcacgccctag

gene End

1741 ataccacaggcacaatgcggctcactaacaatcaaaacagagccgagggaa ttagaaaaa

gene start

1801 a gt acgggtagaa gagggatattcagagatcagggcaagtctcccgagtctctgctctct

M A T F T D A E I D E L

1861 cctctacctgatagaccaggacaaac ATG GCCACCTTTACAGATGCAGAGATCGACGAGC

· F E T S G T V I D N I I T A Q G K P A E ·

1921 TATTTGAGACAAGTGGAACTGTCATTGACAACATAATTACAGCCCAGGGTAAACCAGCAG

· T V G R S A I P Q G K T K V L S A A W E ·

1981 AGACTGTTGGAAGGAGTGCAATCCCACAAGGCAAGACCAAGGTGCTGAGCGCAGCATGGG

· K H G S I Q P P A S Q D N P D R Q D R S ·

2041 AGAAGCATGGGAGCATCCAGCCACCGGCCAGTCAAGACAACCCCGATCGACAGGACAGAT

· D K Q P S T P E Q T T P H D S P P A T S ·

2101 CTGACAAACAACCATCCACACCCGAGCAAACGACCCCGCATGACAGCCCGCCGGCCACAT

· A D Q P P T Q A T D E A V D T Q F R T G ·

2161 CCGCCGACCAGCCCCCCACCCAGGCCACAGACGAAGCCGTCGACACACAGTTCAGGACCG

· A S N S L L L M L D K L S N K S S N A K ·

2221 GAGCAAGCAACTCTCTGCTGTTGATGCTTGACAAGCTCAGCAATAAATCGTCCAATGCTA

ApaI

· K G P W S S P Q E G N H Q R P T Q Q Q G ·

2281 AAAA GGGCCC ATGGTCGAGCCCCCAAGAGGGGAATCACCAACGTCCGACTCAACAGCAGG

· S Q P S R G N S Q E R P Q N Q V K A A P ·

2341 GGAGTCAACCCAGTCGCGGAAACAGTCAGGAAAGACCGCAGAACCAAGTCAAGGCCGCCC

· G N Q G T D V N T A Y H G Q W E E S Q L ·

2401 CTGGAAACCAGGGCACAGACGTGAACACAGCATATCATGGACAATGGGAGGAGTCACAAC

· S A G A T P H A L R S R Q S Q D N T L V ·

2461 TATCAGCTGGTGCAACCCCTCATGCTCTCCGATCAAGGCAGAGCCAAGACAATACCCTTG

· S A D H V Q P P V D F V Q A M M S M M E ·

2521 TATCTGCGGATCATGTCCAGCCGCCTGTAGACTTTGTGCAAGCGATGATGTCTATGATGG

· A I S Q R V S K V D Y Q L D L V L K Q T ·

2581 AGGCGATATCACAGAGAGTAAGTAAGGTTGACTATCAGCTAGATCTTGTCTTGAAACAGA

· S S I P M M R S E I Q Q L K T S V A V M ·

2641 CATCCTCCATCCCTATGATGCGGTCCGAAATCCAACAGCTGAAAACATCTGTTGCAGTCA

· E A N L G M M K I L D P G C A N I S S L ·

2701 TGGAAGCCAACTTGGGAATGATGAAGATTCTGGATCCCGGTTGTGCCAACATTTCATCTC

· S D L R A V A R S H P V L V S G P G D P ·

2761 TGAGTGATCTACGGGCAGTTGCCCGATCTCACCCGGTTTTAGTTTCAGGCCCTGGAGACC

· S P Y V T Q G G E M A L N K L S Q P V P ·

2821 CCTCTCCCTATGTGACACAAGGAGGCGAAATGGCACTTAATAAACTTTCGCAACCAGTGC

· H P S E L I K P A T A C G P D I G V E K ·

2881 CACATCCATCTGAATTGATTAAACCCGCCACTGCATGCGGGCCTGATATAGGAGTGGAAA

· D T V R A L I M S R P M H P S S S A K L ·

2941 AGGACACTGTCCGTGCATTGATCATGTCACGCCCAATGCACCCGAGTTCTTCAGCCAAGC

· L S K L D A A G S I E E I R K I K R L A ·

3001 TCCTAAGCAAGTTAGATGCAGCCGGGTCGATCGAGGAAATCAGGAAAATCAAGCGCCTTG

· L N G

3061 CTCTAAATGGC TAA ttactactgccacacgtagcgggtccctgtccactcggcatcacac

3121 ggaatctgcaccgagttcccccccgcagacccaaggtccaactctccaagcggcaatcct

3181 ctctcgcttcctcagccccactgaatgatcgcgtaaccgtaattaatctagctacattta

Gene End Gene start M D S S ·

3241 agat taagaaaaaa t acgggtagaa ttggagtgccccaattgtgccaag ATG GACTCATC

· R T I G L Y F D S A H S S S N L L A F P ·

3301 TAGGACAATTGGGCTGTACTTTGATTCTGCCCATTCTTCTAGCAACCTGTTAGCATTTCC

· I V L Q D T G D G K K Q I A P Q Y R I Q ·

3361 GATCGTCCTACAAGACACAGGAGATGGGAAGAAGCAAATCGCCCCGCAATATAGGATCCA

· R L D L W T D S K E D S V F I T T Y G F ·

3421 GCGCCTTGACTTGTGGACTGATAGTAAGGAGGACTCAGTATTCATCACCACCTATGGATT

· I F Q V G N E E A T V G M I D D K P K R ·

3481 CATCTTTCAAGTTGGGAATGAAGAAGCCACTGTCGGCATGATCGATGATAAACCCAAGCG

AvrII

· E L L S A A M L C L G S V P N T G D L I ·

3541 CGAGTTACTTTCCGCTGCGATGCTCTG CCTAGG AAGCGTCCCAAATACCGGAGACCTTAT

· E L A R A C L T M I V T C K K S A T N T ·

3601 TGAGCTGGCAAGGGCCTGTCTCACTATGATAGTCACATGCAAGAAGAGTGCAACTAATAC

· E R M V F S V V Q A P Q V L Q S C R V V ·

3661 TGAGAGAATGGTTTTCTCAGTAGTGCAGGCACCCCAAGTGCTGCAAAGCTGTAGGGTTGT

· A N K Y S S V N A V K H V K A P E K I P ·

3721 GGCAAACAAATACTCATCAGTGAATGCAGTCAAGCACGTGAAAGCGCCAGAGAAGATTCC

· G S G T L E Y K V N F V S L T V V P K K ·

3781 CGGGAGTGGAACCCTAGAATACAAGGTGAACTTTGTCTCCTTGACTGTGGTACCGAAGAA

· D V Y K I P A A V L K V S G S S L Y N L ·

3841 GGATGTCTACAAGATCCCAGCTGCAGTATTGAAGGTTTCTGGCTCGAGTCTGTACAATCT

· A L N V T I N V E V D P R S P L V K S L ·

3901 TGCGCTCAATGTCACTATTAATGTGGAGGTAGACCCGAGGAGTCCTTTGGTTAAATCTCT

· S K S D S G Y Y A N L F L H I G L M T T ·

3961 GTCTAAGTCTGACAGCGGATACTATGCTAACCTCTTCTTGCATATTGGACTTATGACCAC

· V D R K G K K V T F D K L E K K I R S L ·

4021 CGTAGATAGGAAGGGGAAGAAAGTGACATTTGACAAGCTGGAAAAGAAAATAAGGAGCCT

· D L S V G L S D V L G P S V L V K A R G ·

4081 TGATCTATCTGTCGGGCTCAGTGATGTGCTCGGGCCTTCCGTGTTGGTAAAAGCAAGAGG

· A R T K L L A P F F S S S G T A C Y P I ·

4141 TGCACGGACTAAGCTTTTGGCACCTTTCTTCTCTAGCAGTGGGACAGCCTGCTATCCCAT

· A N A S P Q V A K I L W S Q T A C L R S ·

4201 AGCAAATGCTTCTCCTCAGGTGGCCAAGATACTCTGGAGTCAAACCGCGTGCCTGCGGAG

· V K I I I Q A G T Q R A V A V T A D H E ·

4261 CGTTAAAATCATTATCCAAGCAGGTACCCAACGCGCTGTCGCAGTGACCGCCGACCACGA

· V T S T K L E K G H T L A K Y N P F K K ·

4321 GGTTACCTCTACTAAGCTGGAGAAGGGGCACACCCTTGCCAAATACAATCCTTTTAAGAA

·

4381 A TAA gctgcgtctctgagattgcgctccgcccactcacccagatcatcatgacacaaaaa

Gene End MluI

4441 actaatctgtcttgattatttacagttagtttacctgtctatcaag ttagaaaaaa c acg

Gene start M G S K ·

4501 cgtacgggtagaa gagtctggatcccgaccggcacattcaggacgcaatATGGGCTCCAA

· L S T R I P A P L M L T T R I T L I L S ·

4561 ACTTTCTACCAGGATTCCAGCACCTCTGATGCTGACCACCCGGATTACGCTGATATTGAG

· C I R P T S S L D G R P L A A A G I V V ·

4621 CTGTATCCGTCCGACAAGCTCTCTTGACGGCAGGCCTCTTGCAGCTGCAGGAATTGTAGT

· T G D K A V N V Y T S S Q T G S I I V K ·

4681 AACAGGAGATAAGGCAGTCAATGTATACACCTCGTCTCAGACAGGGTCAATCATAGTCAA

· L L P N M P R D K E A C A K A P L E A Y ·

4741 GTTGCTCCCGAATATGCCCAGGGATAAAGAGGCGTGTGCAAAAGCCCCATTAGAGGCATA

· N R T L T T L L T P L G D S I R K I Q G ·

4801 TAACAGAACACTGACTACTTTGCTAACTCCTCTTGGCGACTCCATCCGCAAGATCCAAGG

Cleavage site

· S V S T S G G G R Q A R L I G A V I G S ·

4861 GTCTGTGTCCACGTCTGGAGGAGGCAGACAAGCACGCCTGATAGGTGCTGTTATTGGCAG

NotI

· V A L G V A T A A Q I T A A A A L I Q A ·

4921 TGTAGCTCTTGGGGTTGCAACAGCGGCACAGATAACAGCA GCGGCCGC CCTAATACAAGC

· N Q N A A N I L R L K E S I A A T N E A ·

4981 CAACCAGAATGCCGCCAACATCCTCCGGCTTAAGGAGAGCATTGCTGCAACCAATGAAGC

· V H E V T D G L S Q L S V A V G K M Q Q ·

5041 TGTGCATGAAGTCACCGACGGATTATCACAACTATCAGTGGCAGTTGGGAAGATGCAGCA

· F V N D Q F N N T A R E L D C I K I T Q ·

5101 GTTCGTCAATGACCAGTTTAATAATACAGCACGAGAATTGGACTGTATAAAAATCACACA

· Q V G V E L N L Y L T E L T T V F G P Q ·

5161 ACAGGTTGGTGTAGAGCTAAACCTATACCTAACTGAATTGACTACAGTATTCGGGCCACA

· I T S P A L T Q L T I Q A L Y N L A G G ·

5221 GATCACTTCCCCTGCATTAACTCAGTTGACCATCCAAGCACTTTATAATTTAGCTGGTGG

· N M N Y L L T K L G I G N N Q L S S L I ·

5281 CAATATGAATTACTTATTAACTAAGTTAGGTATAGGGAACAATCAACTCAGCTCATTAAT

· G S G L I T G Y P I L Y D S Q T Q L L G ·

5341 TGGTAGCGGCCTGATCACTGGTTACCCTATACTGTATGATTCACAGACTCAACTCTTGGG

· I Q V N L P S V G N L N N M R A T Y L E ·

5401 CATACAAGTGAATTTGCCCTCAGTCGGGAACTTAAATAATATGCGTGCCACCTATTTGGA

· T L S V S T T K G Y A S A L V P K V V T ·

5461 GACCTTATCTGTAAGTACAACCAAAGGATATGCCTCAGCACTTGTCCCGAAAGTAGTGAC

· Q V G S V I E E L D T S Y C I E S D L D ·

5521 ACAGGTCGGTTCTGTGATAGAAGAGCTCGACACCTCATACTGCATAGAGTCCGATCTGGA

· L Y C T R I V T F P M S P G I Y S C L S ·

5581 TTTATATTGTACTAGAATAGTGACATTCCCCATGTCCCCAGGTATTTATTCCTGCTTGAG

· G N T S A C M Y S K T E G A L T T P Y M ·

5641 CGGCAACACATCAGCTTGCATGTATTCAAAGACTGAAGGCGCACTCACTACGCCGTATAT

· A L K G S V I A N C K I T T C R C T D P ·

5701 GGCCCTTAAAGGCTCGGTTATTGCCAATTGTAAGATAACAACATGTAGATGTACAGACCC

· P G I I S Q N Y G E A V S L I D R H S C ·

5761 TCCTGGTATCATATCGCAAAATTATGGAGAAGCCGTATCCCTGATAGATAGACATTCGTG

· N V L S L D G I T L R L S G E F D A T Y ·

5821 CAATGTCTTATCATTAGACGGGATAACTCTGAGGCTCAGTGGGGAATTTGATGCAACTTA

· Q K N I S I L D S Q V I V T G N L D I S ·

5881 TCAAAAGAACATCTCAATACTAGATTCTCAAGTCATCGTGACAGGCAATCTTGATATCTC

· T E L G N V N N S I S N A L D S L A E S ·

5941 AACTGAACTTGGAAACGTCAACAATTCAATCAGCAATGCCTTGGATAGTTTGGCAGAAAG

· N S K L E K I N V R L T S T S A L I T Y ·

6001 CAACAGCAAGCTGGAAAAAATCAATGTCAGACTAACCAGCACATCTGCTCTCATTACCTA

· I V L T V I S L V F G A F S L G L A C Y ·

6061 TATTGTTCTAACTGTCATTTCTCTAGTTTTCGGTGCATTTAGTTTGGGTTTAGCGTGTTA

· L M Y K Q K A Q Q K T L L W L G N N T L ·

6121 CCTGATGTACAAACAGAAGGCACAACAAAAGACCTTGCTATGGCTTGGGAATAATACCCT

· D Q M R A T T R A

6181 CGATCAGATGAGAGCCACTACAAGAGCA TGA atgcagataagaggtgggtatatacccaa

Gene End

6241 cagcagcctgtgtatcaattccgataacctgtcaagtagaagact taagaaaaaa ctact

Gene start

6301 gggaataagcaaccaaagagcactac acgggtagaa cgatcagaggagccacccttcaat

M

6361 cggaaattaggcttcacaacatccgttctaccgcatcaccaacaacaagagtcaatc ATG

HpaI

D R A V N R V V L E N E E R E A K N T W

6421 GACCGCGCG GTTAAC AGAGTCGTGCTGGAGAATGAGGAAAGAGAAGCAAAGAACACATGG

R L V F R I A V L L L M V M T L A I S S

6481 CGCCTGGTTTTCCGGATCGCAGTTTTACTTTTAATGGTAATGACTCTAGCTATCTCCTCA

A A L A Y S T G A S T P H D L A S I L T

6541 GCTGCCCTGGCATACAGCACGGGGGCCAGTACGCCGCACGACCTCGCAAGCATATTGACT

V I S K T E D K V T S L L S S S Q D V I

6601 GTGATCTCCAAGACAGAAGATAAGGTTACGTCTTTACTCAGTTCAAGTCAAGACGTGATA

D R I Y K Q V A L E S P L A L L N T E S

6661 GATAGGATATACAAGCAGGTGGCTCTTGAATCCCCGCTGGCACTACTAAACACTGAATCT

V I M N A I T S L S Y Q I N G A A N N S

6721 GTAATTATGAATGCAATAACCTCTCTTTCTTATCAAATTAACGGGGCTGCGAACAATAGC

G C G A P V H D P D Y I G G I G K E L I

6781 GGATGTGGGGCGCCTGTTCATGACCCAGATTATATCGGGGGGATAGGCAAAGAACTCATA

V D D I S D V T S F Y P S A Y Q E H L N

6841 GTGGACGACATCAGTGATGTTACATCATTTTATCCTTCTGCATATCAAGAACACTTGAAT

F I P A P T T G S G C T R I P S F D M S

6901 TTCATCCCGGCACCTACTACAGGATCCGGTTGCACTCGGATACCCTCGTTTGACATGAGC

T T H Y C Y T H N V I L S G C R D H S H

6961 ACCACCCATTATTGTTATACTCACAATGTGATACTATCCGGTTGCAGAGATCACTCACAC

S H Q Y L A L G V L R T S A T G R V F F

7021 TCACATCAATACTTAGCACTTGGTGTGCTTCGGACATCTGCAACAGGGAGGGTATTCTTT

S T L R S I N L D D T Q N R K S C S V S

7081 TCTACTCTGCGCTCTATCAATTTAGATGACACCCAAAATCGGAAGTCCTGCAGTGTGAGT

A T P L G C D M L C S K V T G T E E E D

7141 GCAACCCCTTTAGGTTGTGATATGCTGTGCTCCAAGGTCACAGGGACTGAAGAGGAGGAT

Y K S V A P T S M V H G R L G F D G Q Y

7201 TACAAGTCAGTTGCCCCCACATCAATGGTGCACGGAAGGCTAGGGTTTGACGGTCAATAC

H E K D L D T T V L F K D W V A N Y P G

7261 CATGAAAAGGACTTAGACACCACGGTCTTATTTAAGGATTGGGTGGCAAATTACCCAGGA

A G G G S F I D D R V W F P V Y G G L K

7321 GCGGGAGGAGGGTCTTTTATTGACGACCGTGTATGGTTCCCAGTTTACGGAGGGCTCAAA

P D S P S D T A Q E G K Y V I Y K R H N

7381 CCCGATTCACCCAGTGACACTGCACAAGAAGGGAAATACGTAATATACAAGCGCCATAAC

N T C P D K Q D Y Q I R K A K S S Y K P

7441 AACACATGCCCCGATAAACAAGATTACCAAATTCGGAAGGCTAAGTCTTCATATAAACCC

G R F G G K R V Q Q A I L S I K V S T S

7501 GGGCGATTTGGTGGGAAGCGCGTACAGCAAGCCATCTTATCCATCAAAGTGTCAACATCT

L G K D P V L T I P P N T I T L M G A E

7561 TTGGGTAAGGACCCGGTGCTGACTATTCCACCTAATACAATCACACTCATGGGAGCCGAA

G R I L T V G T S H F L Y Q R G S S Y F

7621 GGCAGAATTCTCACAGTGGGGACATCTCACTTCTTGTACCAACGAGGGTCTTCATATTTC

S P A L L Y P M T V N N K T A T L H S P

7681 TCCCCTGCCTTATTATATCCCATGACAGTAAATAACAAAACGGCTACACTCCATAGTCCT

Y T F N A F T R P G S V P C Q A S A R C

7741 TATACGTTTAATGCTTTCACTCGGCCAGGTAGTGTCCCTTGCCAGGCATCAGCAAGATGC

P N S C I T G V Y T D P Y P L I F H R N

7801 CCCAACTCATGCATTACTGGAGTCTATACTGATCCATATCCCTTAATCTTCCATAGGAAT

H T L R G V F G T M L D D E Q A R L N P

7861 CATACTCTACGAGGGGTCTTCGGAACGATGCTTGATGATGAACAAGCGAGACTTAACCCC

V S A V F D N V S R S R V T R V S S S S

7921 GTATCCGCAGTATTCGACAACGTATCCCGCAGTCGTGTCACCCGGGTGAGTTCAAGCAGC

T K A A Y T T S T C F K V V K T N K T Y

7981 ACCAAGGCAGCATACACGACATCGACATGTTTCAAAGTTGTCAAGACCAATAAAACTTAT

C L S I A E I S N T L F G E F R I V P L

8041 TGTCTTAGTATTGCAGAAATATCCAATACCCTGTTCGGGGAATTTAGGATCGTTCCCTT A

SpeI

L V E I L K D D G V R E A R S G

8101 CTAGT TGAGATCCTCAAGGATGACGGGGTTAGAGAAGCCAGGTCTGGC TAG ttgagtcaa

8161 ttataaaggagttggaaagatggcattgtatcacctatcttctgtgacatcaagaatcaa

8221 accgaatgccggcgcgtgctcgaattccatgttgccagttgaccacaatcagccagtgct

Gene End

8281 catgcgatcagattaagccttgtcaatagtctcttgat taagaaaaaa tgtaagtggcaa

Gene start M A S S G ·

8341 tgagatacaaggcaaaacagctcatggtaaataat acgggtagga c ATG GCGAGCTCCGG

·P E R A E H Q I I L P E S H L S S P L V ·

8401 TCCTGAAAGGGCAGAGCATCAGATTATCCTACCAGAGTCACACCTGTCTTCACCATTGGT

·K H K L L Y Y W K L T G L P L P D E C D ·

8461 CAAGCACAAACTACTCTATTACTGGAAATTAACTGGGCTACCGCTTCCTGATGAATGTGA

·F D H L I L S R Q W K K I L E S A S P D ·

8521 CTTCGACCACCTCATTCTCAGCCGACAATGGAAAAAAATACTTGAATCGGCCTCTCCTGA

·T E R M I K L G R A V H Q T L N H N S R ·

8581 TACTGAGAGAATGATAAAACTCGGAAGGGCAGTACACCAAACTCTTAACCACAATTCCAG

·I T G V L H P R C L E E L A N I E V P D ·

8641 AATAACCGGAGTGCTCCACCCCAGGTGTTTAGAAGAACTGGCTAATATTGAGGTCCCAGA

·S T N K F R K I E K K I Q I H N T R Y G ·

8701 TTCAACCAACAAATTTCGGAAGATTGAGAAGAAGATCCAAATTCACAACACGAGATATGG

·E L F T R L C T H I E K K L L G S S W S ·

8761 AGAACTGTTCACAAGGCTGTGTACGCATATAGAGAAGAAACTGCTGGGGTCATCTTGGTC

BsiWI

·N N V P R S E E F S S I R T D P A F W F ·

8821 TAACAATGTCCCCCGGTCAGAGGAGTTCAGCAGCATT CGTACG GATCCGGCATTCTGGTT

·H S K W S T A K F A W L H I K Q I Q R H ·

8881 TCACTCAAAATGGTCCACAGCCAAGTTTGCATGGCTCCATATAAAACAGATCCAGAGGCA

·L M V A A R T R S A A N K L V M L T H K ·

8941 TCTGATGGTGGCAGCTAGGACAAGGTCTGCGGCCAACAAATTGGTGATGCTAACCCATAA

·V G Q V F V T P E L V V V T H T N E N K ·

9001 GGTAGGCCAAGTCTTTGTCACTCCTGAACTTGTCGTTGTGACGCATACGAATGAGAACAA

·F T C L T Q E L V L M Y A D M M E G R D ·

9061 GTTCACATGTCTTACCCAGGAACTTGTATTGATGTATGCAGATATGATGGAGGGCAGAGA

·M V N I I S T T A V H L R S L S E K I D ·

9121 TATGGTCAACATAATATCAACCACGGCGGTGCATCTCAGAAGCTTATCAGAGAAAATTGA

·D I L R L I D A L A K D L G N Q V Y D V ·

9181 TGACATTTTGCGGTTAATAGACGCTCTGGCAAAAGACTTGGGTAATCAAGTCTACGATGT

·V S L M E G F A Y G A V Q L L E P S G T ·

9241 CGTATCACTAATGGAGGGATTTGCATACGGAGCTGTCCAGCTACTCGAGCCGTCAGGTAC

·F A G D F F A F N L Q E L K D I L I G L ·

9301 ATTTGCAGGAGATTTCTTCGCATTCAACCTGCAGGAGCTTAAAGACATTCTAATTGGCCT

·L P N D I A E S V T H A I A T V F S G L ·

9361 CCTCCCCAATGATATAGCAGAATCCGTGACTCATGCAATCGCTACTGTATTCTCTGGTTT

·E Q N Q A A E M L C L L R L W G H P L L ·

9421 AGAACAGAATCAAGCAGCTGAGATGTTGTGTCTGTTGCGTCTGTGGGGTCACCCACTGCT

·E S R I A A K A V R S Q M C A P K M V D ·

9481 TGAGTCCCGTATTGCAGCAAAGGCAGTCAGGAGCCAAATGTGCGCACCGAAAATGGTAGA

·F D M I L Q V L S F F K G T I I N G Y R ·

9541 CTTTGATATGATCCTTCAGGTACTGTCTTTCTTCAAGGGAACAATCATCAACGGGTACAG

·K K N A G V W P R V K V D T I Y G K V I ·

9601 AAAGAAGAATGCAGGTGTGTGGCCGCGAGTCAAAGTGGATACAATATATGGGAAGGTCAT

·G Q L H A D S A E I S H D I M L R E Y K ·

9661 TGGGCAACTACATGCAGATTCAGCAGAGATTTCACACGATATCATGTTAAGAGAGTATAA

·S L S A L E F E P C I E Y D P V T N L S ·

9721 GAGTTTATCTGCACTTGAATTTGAGCCATGTATAGAATATGACCCTGTCACCAACCTGAG

·M F L K D K A I A H P N D N W L A S F R ·

9781 CATGTTCCTAAAAGACAAGGCAATCGCACACCCCAACGATAATTGGCTTGCCTCGTTTAG

·R N L L S E D Q K K H V K E A T S T N R ·

9841 GCGGAACCTTCTCTCCGAAGACCAGAAGAAACATGTAAAAGAAGCAACTTCGACTAATCG

·L L I E F L E S N D F D P Y K E M E Y L ·

9901 CCTCTTGATAGAGTTTTTAGAGTCAAATGATTTTGATCCATATAAAGAGATGGAATATCT

·T T L E Y L R D D N V A V S Y S L K E K ·

9961 GACGACCCTTGAGTACCTTAGAGATGACAATGTGGCAGTATCATACTCGCTCAAGGAGAA

·E V K V N G R I F A K L T K K L R N C Q ·

10021 GGAAGTGAAAGTTAATGGACGGATCTTCGCTAAGCTGACAAAGAAGTTAAGGAACTGTCA

·V M A E G I L A D Q I A P F F Q G N G V ·

10081 GGTGATGGCGGAAGGGATCCTAGCCGATCAGATTGCACCTTTCTTTCAGGGAAATGGAGT

·I Q D S I S L T K S M L A M S Q L S F N ·

10141 CATTCAGGATAGCATATCCTTGACCAAGAGTATGCTAGCGATGAGTCAACTGTCTTTTAA

·S N K K R I T D C K E R V S S N R N H D ·

10201 CAGCAATAAGAAACGTATCACTGACTGTAAAGAAAGAGTATCTTCAAACCGCAATCATGA

·P K S K N R R R V A T F I T T D L Q K Y ·

10261 TCCGAAAAGCAAGAACCGTCGGAGAGTTGCAACCTTCATAACAACTGACCTGCAAAAGTA

·C L N W R Y Q T I K L F A H A I N Q L M ·

10321 CTGTCTTAATTGGAGATATCAGACAATCAAATTGTTCGCTCATGCCATCAATCAGTTGAT

·G L P H F F E W I H L R L M D T T M F V ·

10381 GGGCCTACCTCACTTCTTCGAATGGATTCACCTAAGACTGATGGACACTACGATGTTCGT

·G D P F N P P S D P T D C D L S R V P N ·

10441 AGGAGACCCTTTCAATCCTCCAAGTGACCCTACTGACTGTGACCTCTCAAGAGTCCCTAA

·D D I Y I V S A R G G I E G L C Q K L W ·

10501 TGATGACATATATATTGTCAGTGCCAGAGGGGGTATCGAAGGATTATGCCAGAAGCTATG

·T M I S I A A I Q L A A A R S H C R V A ·

10561 GACAATGATCTCAATTGCTGCAATCCAACTTGCTGCAGCTAGATCGCATTGTCGTGTTGC

·C M V Q G D N Q V I A V T R E V R S D D ·

10621 CTGTATGGTACAGGGTGATAATCAAGTAATAGCAGTAACGAGAGAGGTAAGATCAGACGA

·S P E M V L T Q L H Q A S D N F F K E L ·

10681 CTCTCCGGAGATGGTGTTGACACAGTTGCATCAAGCCAGTGATAATTTCTTCAAGGAATT

·I H V N H L I G H N L K D R E T I R S D ·

10741 AATTCATGTCAATCATTTGATTGGCCATAATTTGAAGGATCGTGAAACCATCAGGTCAGA

·T F F I Y S K R I F K D G A I L S Q V L ·

10801 CACATTCTTCATATACAGCAAACGAATCTTCAAAGATGGAGCAATCCTCAGTCAAGTCCT

·K N S S K L V L V S G D L S E N T V M S ·

10861 CAAAAATTCATCTAAATTAGTGCTAGTGTCAGGTGATCTCAGTGAAAACACCGTAATGTC

·C A N I A S T V A R L C E N G L P K D F ·

10921 CTGTGCCAACATTGCCTCTACTGTAGCACGGCTATGCGAGAACGGGCTTCCCAAAGACTT

·C Y Y L N Y I M S C V Q T Y F D S E F S ·

10981 CTGTTACTATTTAAACTATATAATGAGTTGTGTGCAGACATACTTTGACTCTGAGTTCTC

·I T N N S H P D L N Q S W I E D I S F V ·

11041 CATCACCAACAATTCGCACCCCGATCTTAATCAGTCGTGGATTGAGGACATCTCTTTTGT

·H S Y V L T P A Q L G G L S N L Q Y S R ·

11101 GCACTCATATGTTCTGACTCCTGCCCAATTAGGGGGACTGAGTAACCTTCAATACTCAAG

·L Y T R N I G D P G T T A F A E I K R L ·

11161 GCTCTACACTAGAAATATCGGTGACCCGGGGACTACTGCTTTTGCAGAGATCAAGCGACT

·E A V G L L S P N I M T N I L T R P P G ·

11221 AGAAGCAGTGGGATTACTGAGTCCTAACATTATGACTAATATCTTAACTAGGCCGCCTGG

·N G D W A S L C N D P Y S F N F E T V A ·

11281 GAATGGAGATTGGGCCAGTCTGTGCAACGACCCATACTCTTTCAATTTTGAGACTGTTGC

·S P N I V L K K H T Q R V L F E T C S N ·

11341 AAGCCCAAATATTGTTCTTAAGAAACATACGCAAAGAGTCCTATTTGAAACTTGTTCAAA

·P L L S G V H T E D N E A E E K A L A E ·

11401 TCCCTTATTGTCTGGAGTGCACACAGAGGATAATGAGGCAGAAGAGAAGGCATTGGCTGA

·F L L N Q E V I H P R V A H A I M E A S ·

11461 ATTCTTGCTTAATCAAGAGGTGATTCATCCCCGCGTTGCGCATGCCATCATGGAGGCAAG

·S V G R R K Q I Q G L V D T T N T V I K ·

11521 CTCTGTAGGTAGGAGAAAGCAAATTCAAGGGCTTGTTGACACAACAAACACCGTAATTAA

·I A L T R R P L G I K R L M R I V N Y S ·

11581 GATTGCGCTTACTAGGAGGCCATTAGGCATCAAGAGGCTGATGCGGATAGTCAATTATTC

·S M H A M L F R D D V F S S S R S N H P ·

11641 TAGCATGCATGCAATGCTGTTTAGAGACGATGTTTTTTCCTCCAGTAGATCCAACCACCC

·L V S S N M C S L T L A D Y A R N R S W ·

11701 CTTAGTCTCTTCTAATATGTGTTCTCTGACACTGGCAGACTATGCACGGAATAGAAGCTG

·S P L T G G R K I L G V S N P D T I E L ·

11761 GTCACCTTTGACGGGAGGCAGGAAAATACTGGGTGTATCTAATCCTGATACGATAGAACT

·V E G E I L S V S G G C T R C D S G D E ·

11821 CGTAGAGGGTGAGATTCTTAGTGTAAGCGGAGGGTGTACAAGATGTGACAGCGGAGATGA

·Q F T W F H L P S N I E L T D D T S K N ·

11881 ACAATTTACTTGGTTCCATCTTCCAAGCAATATAGAATTGACCGATGACACCAGCAAGAA

·P P M R V P Y L G S K T Q E R R A A S L ·

11941 TCCTCCGATGAGGGTACCATATCTCGGGTCAAAGACACAGGAGAGGAGAGCTGCCTCACT

·A K I A H M S P H V K A A L R A S S V L ·

12001 TGCAAAAATAGCTCATATGTCGCCACATGTAAAGGCTGCCCTAAGGGCATCATCCGTGTT

·I W A Y G D N E V N W T A A L T I A K S ·

12061 GATCTGGGCTTATGGGGATAATGAAGTAAATTGGACTGCTGCTCTTACGATTGCAAAATC

·R C N V N L E Y L R L L S P L P T A G N ·

12121 TCGGTGTAATGTAAACTTAGAGTATCTTCGGTTACTGTCCCCTTTACCCACGGCTGGGAA

·L Q H R L D D G I T Q M T F T P A S L Y ·

12181 TCTTCAACATAGACTAGATGATGGTATAACTCAGATGACATTCACCCCTGCATCTCTCTA

·R V S P Y I H I S N D S Q R L F T E E G ·

12241 CAGGGTGTCACCTTACATTCACATATCCAATGATTCTCAAAGGCTGTTCACTGAAGAAGG

·V K E G N V V Y Q Q I M L L G L S L I E ·

12301 AGTCAAAGAGGGGAATGTGGTTTACCAACAGATCATGCTCTTGGGTTTATCTCTAATCGA

ClaI

·S I F P M T T T R T Y D E I T L H L H S ·

12361 ATCGAT ATTTCCAATGACAACAACCAGGACATATGATGAGATCACACTGCACCTACATAG

·K F S C C I R E A P V A V P F E L L G V ·

12421 TAAATTTAGTTGCTGTATCAGAGAAGCACCTGTTGCGGTTCCTTTCGAGCTACTTGGGGT

·V P E L R T V T S N K F M Y D P S P V S ·

12481 GGTACCGGAACTGAGGACAGTGACCTCAAATAAGTTTATGTATGATCCTAGCCCTGTATC

·E G D F A R L D L A I F K S Y E L N L E ·

12541 GGAGGGAGACTTTGCGAGACTTGACTTAGCTATCTTCAAGAGTTATGAGCTTAATCTGGA

·S Y P T I E L M N I L S I S S G K L I G ·

12601 GTCATATCCCACGATAGAGCTAATGAACATTCTTTCAATATCCAGCGGGAAGTTGATTGG

·Q S V V S Y D E D T S I K N D A I I V Y ·

12661 CCAGTCTGTGGTTTCTTATGATGAAGATACCTCCATAAAGAATGACGCCATAATAGTGTA

·D N T R N W I S E A Q N S D V V R L F E ·

12721 TGACAATACCCGAAATTGGATCAGTGAAGCTCAGAATTCAGATGTGGTCCGCCTATTTGA

·Y A A L E V L L D C S Y Q L Y Y L R V R ·

12781 ATATGCAGCACTTGAAGTGCTCCTCGACTGTTCTTACCAACTCTATTACCTGAGAGTAAG

·G L D N I V L Y M G D L Y K N M P G I L ·

12841 AGGCCTAGACAATATTGTCTTATATATGGGTGATTTATACAAGAATATGCCAGGAATTCT

·L S N I A A T I S H P V I H S R L H A V ·

12901 ACTTTCCAACATTGCAGCTACAATATCTCATCCCGTCATTCATTCAAGGTTACATGCAGT

·G L V N H D G S H Q L A D T D F I E M S ·

12961 GGGCCTGGTCAACCATGACGGATCACACCAACTTGCAGATACGGATTTTATCGAAATGTC

·A K L L V S C T R R V I S G L Y S G N K ·

13021 TGCAAAACTATTAGTATCTTGCACCCGACGTGTGATCTCCGGCTTATATTCAGGAAATAA

·Y D L L F P S V L D D N L N E K M L Q L ·

13081 GTATGATCTGCTGTTCCCATCTGTCTTAGATGATAACCTGAATGAGAAGATGCTTCAGCT

·I S R L C C L Y T V L F A T T R E I P K ·

13141 GATATCCCGGTTATGCTGTCTGTACACGGTACTCTTTGCTACAACAAGAGAAATCCCGAA

·I R G L T A E E K C S I L T E Y L L S D ·

13201 AATAAGAGGCTTAACTGCAGAAGAGAAATGTTCAATACTCACTGAGTATTTACTGTCGGA

·A V K P L L S P D Q V S S I M S P N I I ·

13261 TGCTGTGAAACCATTACTTAGCCCCGATCAAGTGAGCTCTATCATGTCTCCTAACATAAT

·T F P A N L Y Y M S R K S L N L I R E R ·

13321 TACATTCCCAGCTAATCTGTACTACATGTCTCGGAAGAGCCTCAATTTGATCAGGGAAAG

·E D R D T I L A L L F P Q E P L L E F P ·

13381 GGAGGACAGGGATACTATCCTGGCGTTGTTGTTCCCCCAAGAGCCATTATTAGAGTTCCC

·S V Q D I G A R V K D P F T R Q P A A F ·

13441 TTCTGTGCAAGATATTGGTGCTCGAGTGAAAGATCCATTCACCCGACAACCTGCGGCATT

·L Q E L D L S A P A R Y D A F T L S Q I ·

13501 TTTGCAAGAGTTAGATTTGAGTGCTCCAGCAAGGTATGACGCATTCACACTTAGTCAGAT

·H P E L T S P N P E E D Y L V R Y L F R ·

13561 TCATCCTGAACTCACATCTCCAAATCCGGAGGAAGACTACTTAGTACGATACTTGTTCAG

·G I G T A S S S W Y K A S H L L S V P E ·

13621 AGGGATAGGGACTGCATCTTCCTCTTGGTATAAGGCATCCCATCTCCTTTCTGTACCCGA

·V R C A R H G N S L Y L A E G S G A I M ·

13681 GGTAAGATGTGCAAGACACGGGAACTCCTTATACTTAGCTGAAGGGAGCGGAGCCATCAT

·S L L E L H V P H E T I Y Y N T L F S N ·

13741 GAGTCTTCTCGAACTGCATGTACCACATGAAACTATCTATTACAATACGCTCTTTTCAAA

·E M N P P Q R H F G P T P T Q F L N S V ·

13801 TGAGATGAACCCCCCGCAACGACATTTCGGGCCGACCCCAACTCAGTTTTTGAATTCGGT

·V Y R N L Q A E V T C K D G F V Q E F R ·

13861 TGTTTATAGGAATCTACAGGCGGAGGTAACATGCAAAGATGGATTTGTCCAAGAGTTCCG

·P L W R E N T E E S D L T S D K A V G Y ·

13921 TCCATTATGGAGAGAAAATACAGAGGAAAGTGACCTGACCTCAGATAAAGCAGTGGGGTA

·I T S A V P Y R S V S L L H C D I E I P ·

13981 TATTACATCTGCAGTGCCCTACAGATCTGTATCATTGCTGCATTGTGACATTGAAATTCC

·P G S N Q S L L D Q L A I N L S L I A M ·

14041 TCCAGGGTCCAATCAAAGCTTACTAGATCAACTAGCTATCAATTTATCTCTGATTGCCAT

·H S V R E G G V V I I K V L Y A M G Y Y ·

14101 GCATTCTGTAAGGGAGGGCGGGGTAGTAATCATCAAAGTGTTGTATGCAATGGGATACTA

·F H L L M N L F A P C S T K G Y I L S N ·

14161 CTTTCATCTACTCATGAACTTGTTTGCTCCGTGTTCCACAAAAGGATATATTCTCTCTAA

·G Y A C R G D M E C Y L V F V M G Y L G ·

14221 TGGTTATGCATGTCGAGGAGATATGGAGTGTTACCTGGTATTTGTCATGGGTTACCTGGG

·G P T F V H E V V R M A K T L V Q R H G ·

14281 CGGGCCTACATTTGTACATGAGGTGGTGAGGATGGCAAAAACTCTGGTGCAGCGGCACGG

·T L L S K S D E I T L T R L F T S Q R Q ·

14341 TACGCTTTTGTCTAAATCAGATGAGATCACACTGACCAGGTTATTCACCTCACAGCGGCA

·R V T D I L S S P L P R L I K Y L R K N ·

14401 GCGTGTGACAGACATCCTATCCAGTCCTTTACCAAGATTAATAAAGTACTTGAGGAAGAA

·I D T A L I E A G G Q P V R P F C A E S ·

14461 TATTGACACTGCGCTGATTGAAGCCGGGGGACAGCCCGTCCGTCCATTCTGTGCGGAGAG

·L V S T L A N I T Q I T Q I I A S H I D ·

14521 TCTGGTGAGCACGCTAGCGAACATAACTCAGATAACCCAGATCATCGCTAGTCACATTGA

·T V I R S V I Y M E A E G D L A D T V F ·

14581 CACAGTTATCCGGTCTGTGATATATATGGAAGCTGAGGGTGATCTCGCTGACACAGTATT

·L F T P Y N L S T D G K K R T S L K Q C ·

14641 TCTATTTACCCCTTACAATCTCTCTACTGACGGGAAAAAGAGGACATCACTTAAACAGTG

·T R Q I L E V T I L G L R V E N L N K I ·

14701 CACGAGACAGATCCTAGAGGTTACAATACTAGGTCTTAGAGTCGAAAATCTCAATAAAAT

·G D I I S L V L K G M I S M E D L I P L ·

14761 AGGCGATATAATCAGCCTAGTGCTTAAAGGCATGATCTCCATGGAGGACCTTATCCCACT

AvrII

·R T Y L K H S T C P K Y L K A V L G I T ·

14821 AAGGACATACTTGAAGCATAGTACCTGCCCTAAATATTTGAAGGCTGT CCTAGG TATTAC

·K L K E M F T D T S V L Y L T R A Q Q K ·

14881 CAAACTCAAAGAAATGTTTACAGACACTTCTGTACTGTACTTGACTCGTGCTCAACAAAA

·F Y M K T I G N A V K G Y Y S N C D S

14941 ATTCTACATGAAAACTATAGGCAATGCAGTCAAAGGATATTACAGTAACTGTGACTCTTA

15001 Acgaaaatcacatattaataggctccttttttggccaattgtattcttgttgatttaatc

Gene End

15061 atattatg ttagaaaaaa gttgaaccctgactccttaggactcgaattcgaactcaaata

15121 aatgtcttaaaaaaaggttgcgcacaattattcttgagtgtagtctcgtcattcaccaaa

HDV ribozyme sequences

15181 tctttgtttggtGGGTCGGCATGGCATCTCCACCTCCTCGCGGTCCGACCTGGGCATCCG

15241 AAGGAGGACGTCGTCCACTCGGATGGCTAAGGGAGAGCtcggatccggctgctaacaaag

T7 terminator

15301 cccgaaaggaagctgagttggctgctgccaccgctgagcaataaCTAGCATAACCCCTTG

15361 GGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGcatatgcggtgtgaaataccgcacagat

15421 gcgtaaggagaaaataccgcatcaggcgctcttccgcttcctcgctcactgactcgctgc

15481 gctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttat

15541 ccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggcca

15601 ggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagc

15661 atcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagatacc

15721 aggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccg

15781 gatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgta

15841 ggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccg

15901 ttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagac

15961 acgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtag

16021 gcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtat

16081 ttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgat

16141 ccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgc

16201 gcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagt

16261 ggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacct

16321 agatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaactt

16381 ggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttc

16441 gttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttac

16501 catctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttat

16561 cagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccg

16621 cctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaata

16681 gtttgcgcaacgttgttgccattgctgcaggcatcgtggtgtcacgctcgtcgtttggta

16741 tggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgt

16801 gcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcag

16861 tgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaa

16921 gatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggc

16981 gaccgagttgctcttgcccggcgtcaacacgggataataccgcgccacatagcagaactt

17041 taaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgc

17101 tgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatctttta

17161 ctttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaa

17221 taagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagca

17281 tttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaac

17341 aaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccatta

17401 ttatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtcttcaagaat

T7 Promoter

17461 TCTAATACGACTCACTATAGG

또 다른 측면에 있어서, 본 발명은 NP, P, M, F, HN 및 L 유전자의 코딩부위를 갖는 뉴캐슬병 바이러스에 있어서, 상기 NP, P, M 및 L 유전자의 코딩부위는 약병원성 뉴캐슬병 바이러스로부터 유래한 것이고, 상기 F 및 HN 단백질 코딩 서열은 강병원성 뉴캐슬병 바이러스로부터 유래한 것이며, 상기 강병원성 뉴캐슬병 바이러스 F 단백질의 115번 아미노산을 코딩하는 코돈이 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코 딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; UAC 및 UAU로 이루어진 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환된 것을 특징으로 하는, 재조합 뉴캐슬병 바이러스에 관한 것이다. 상기 재조합 뉴캐슬병 바이러스의 HN 유전자는 1번부터 569번 코돈까지는 강병원성 뉴캐슬병 바이러스의 아미노산을 코딩하고, 570번 이후의 코돈은 라소타주를 포함하는 약병원성 뉴캐슬병 바이러스의 아미노산을 코딩하도록 추가적으로 변이된 것일 수 있다.

본 발명의 구체예에 있어서, 상기 재조합 뉴캐슬병 바이러스는 KCTC 10984BP일 수 있다.

본 발명에 따른 재조합 뉴캐슬병 바이러스는 강병원성 야외주와 동일 또는 유사한 표면 항원을 갖기 때문에 야외주와 동일 또는 유사한 항원성을 나타내면서도, 기존의 약병원성 백신주보다도 감소된 병원성을 나타내는 것을 특징으로 한다. 병원성 뉴캐슬병 바이러스는 F에 퓨린 절단부위를 가지며, 퓨린에 절단됨으로써 세포막과 융합되는 F 단백질의 융합 펩티드가 노출됨으로써 바이러스의 감염능력이 생긴다. 퓨린은 체내 대부분의 세포 내에 분포하므로 뉴캐슬병 바이러스의 전신감염이 일어나므로 강병원성을 나타낼 수 있다.

본 발명의 게놈 전사 벡터에 있어서, 상기 약병원성 뉴캐슬병 바이러스는 상기에 정의된 바와 같으며, 예컨대, 뉴캐슬병 바이러스 I형 또는 II형에 속하는 균주들로 이루어진 군 중에서 선택된 것일 수 있으며, 본 발명의 구체예에 있어서, II형에 속하는 라소타/46 균주 (AY845400)를 사용할 수 있다. 상기 강병원성 뉴캐 슬병 바이러스는 상기에 정의된 바와 같으며, 현재 전 세계적으로 유행하는 야외주로서 III, V, VI, VII, VIII, XI형을 사용할 수 있고, 바람직하게는 뉴캐슬병 바이러스 VI형 및 VII형 균주들로 이루어진 군 중에서 선택된 것일 수 있다. 본 발명의 구체예에 있어서, 상기 강병원성 뉴캐슬병 바이러스는 KBNP-4152(기탁번호: KCTC 10919BP)일 수 있다. 상기 KBNP-4152 균주의 제조 방법 및 특성은 대한민국 특허출원 제2006-0026667호 및 'Cho SH, Ahn YJ, Kim SJ, Kwon HJ. Characterization of a Newcastle disease virus with variation in the major Hemagglutinin-Neuraminidase (HN) linearepitope. The49th Annual Meeting of the Korean Society of Veterinary Science 2005, 45 (3,suppl),199.'에 기재된 바와 같다 (상기 문헌들은 모두 본 명세서에 참조로서 포함된다). 본 명세서에 있어서, 강병원성 뉴캐슬병 바이러스와 약병원성 뉴캐슬병 바이러스는 특별한 언급이 없는 한, 상기와 같이 정의된다.

이전의 역 유전학을 이용한 뉴캐슬병 바이러스의 약독화에서는 115번째 아미노산을 글리신으로 치환시킨 예가 있었으나, 이와 같이 글리신으로 치환된 경우에는 이를 코딩하는 코돈 중 단지 하나의 염기만 변이되어도 염기성 아미노산인 리신 또는 아르기닌으로 치환되어 다시 병원성을 회복하게 된다는 문제점이 있다.

그러나, 본 발명에 따른 재조합 뉴캐슬병 바이러스는 F 단백질의 115번째 코돈이 적어도 2번 이상의 점 돌연변이를 거쳐야 염기성 아미노산을 코딩하는 코돈으로 변하는 비 염기성 아미노산 코딩 코돈을 가지므로, 병원성을 회복할 가능성이 매우 낮으며, 기존의 약 독화된 변이주와 비교하여 안정성이 현저하게 증가된 것을 특징으로 한다. 본 발명과 같이 F 단백질의 퓨린 절단부위가 변형된 경우에는, 퓨린에 의한 절단이 일어나지 않아 전신감염이 일어나지 않으며, 일부 체내 세포, 호흡기 및 소화기관에 분포하는 트립신 또는 트립신 유사 효소에 의해서만 분해되므로 국소 감염만이 일어나게 되는 것이다.

이러한 효과를 달성하기 위하여, 본 발명의 F 단백질의 115번째 코돈은 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; 및 UAC 및 UAU 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환된 것을 특징으로 하는 것이다.

또 다른 측면에 있어서, 본 발명은 약병원성 뉴캐슬병 바이러스의 F 단백질 및 HN 단백질 코딩 부위를 강병원성 뉴캐슬병 바이러스의 F 및 HN 단백질 코딩 서열로 치환시키고, 상기 F 유전자의 115번 코돈을 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; 및 UAC 및 UAU 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환시켜, 강병원성 뉴캐슬병 바이러스와 동일 또는 유사한 항원성을 발현시키고, 병원성을 감소시키는 것을 특징으로 하는, 재조합 뉴캐슬병 바이러스의 제조 방법에 관한 것이다.

상기 재조합 뉴캐슬병 바이러스의 제조를 위해 상기 HN 유전자는 1번부터 569번 코돈까지는 강병원성 뉴캐슬병 바이러스의 아미노산을 코딩하고, 570번 이후의 코돈은 라소타주를 포함하는 약병원성 뉴캐슬병 바이러스의 아미노산을 코딩하도록 추가적으로 변이시킨 것일 수 있다.

본 발명의 재조합 뉴캐슬병 바이러스의 제조 방법은 상기한 바와 같은 본 발명에 따른 뉴캐슬병 바이러스의 게놈 전사 벡터를 숙주 세포에서 발현시키는 단계를 포함하는 것일 수 있다. 본 발명에서 사용 가능한 숙주 세포에는 제한이 없으며, 본 발명의 구체예에 있어서 Hep2 및 BHK21로 이루어진 군 중에서 선택된 동물 세포를 사용할 수 있다.

또 다른 측면에 있어서, 본 발명은 약병원성 뉴캐슬병 바이러스의 F 및 HN 유전자의 코딩부위를 강병원성 뉴캐슬병 바이러스의 F 및 HN 단백질 코딩 서열로 치환시키고, 상기 F 유전자의 115번 염기성 아미노산 코딩 코돈을 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; UAC 및 UAU 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환시키는 것을 특징으로 하는, 뉴캐슬병 바이러스 의 항원성 및 안정성 증가 및 약독화 방법에 관한 것이다.

상기 방법은 상기 HN 유전자는 1번부터 569번 코돈까지는 강병원성 뉴캐슬병 바이러스의 아미노산을 코딩하고, 570번 이후의 코돈은 라소타주를 포함하는 약병원성 뉴캐슬병 바이러스의 아미노산을 코딩하도록 추가적으로 변이시키는 단계를 추가로 포함하는 것일 수 있다. 또한, 상기 방법은 본 발명에 따른 재조합 뉴캐슬병 바이러스 게놈 전사 벡터를 사용하는 것일 수 있다.

또 다른 측면에 있어서, 본 발명은 상기와 같은 항원성이 증가하고 병원성이 감소된 재조합 뉴캐슬병 바이러스를 함유하는 뉴캐슬병 백신에 관한 것이다. 상기 뉴캐슬병 백신은 상기 재조합 뉴캐슬병 바이러스를 불활화시킨 사독 백신형태일 수 있다. 상기 불활화는 이 발명이 속하는 기술 분야에 알려진 모든 통상적인 방법을 사용할 수 있으며, 예컨대, 포름알데하이드 또는 브로모메틸아민 하이드로브로마이드 등을 사용하는 것일 수 있다. 또한, 상기 뉴캐슬병 백신은 병원성이 매우 낮고 안정성 및 안전성이 높은 균주이기 때문에, 생백신 형태로 사용하거나, 수정란에 직접 사용하는 in ovo 백신 형태로 사용할 수 있다. 생백신 형태로 사용되는 경우, 그 투여 방법에는 제한이 없으며, 증상 및 목적에 따라서, 피하 또는 근육 투여, 직접적인 계태아 주사법 (in ovo 백신), 또는 스프레이 또는 음수 등을 이용하여 투여할 수 있다. 본 발명의 백신 투여량은 투여 방법 및 투여 대상 개체의 상태에 따라서 달라지며, 예컨대, 10¹ EID₅₀ 내지 10¹² EID⁵⁰ 균주/개체의 양으로 사용 가능하다. 구체적으로, 사독 백신의 경우 바람직하게는 10^6.0~12 EID₅₀/수 가 적당하며, 보다 바람직하게는 10^8.0~10 EID₅₀/수 양으로 사용 가능하다. In ovo 백신의 경우 종란의 모체이행항체 정도에 따라 10^1~9.0 EID₅₀/종란의 양으로 사용이 가능하지만, 보다 바람직하게는 10^3.0~7.0EID₅₀/종란 의 양으로 사용 될 수 있다.

상기한 바와 같이, 뉴캐슬병 바이러스의 병원성은 F 단백질의 퓨린 절단부위 아미노산 서열에 따라 결정된다. 즉, F 단백질의 퓨린 절단부위의 아미노산 서열이 R-X-K/R-R (113번째부터 116번째 아미노산 위치, 이하, 특별한 언급이 없는 한, 모든 아미노산 테트라머에 적용됨)이면 모든 세포내에 존재 하는 퓨린에 의해 잘라져 활성화 되므로 전신감염이 일어나 강병원성을 나타낸다. 그러나 R-Q-G-R 또는 G-Q-G-R과 같이 염기성 아미노산이 단 1개 혹은 떨어져서 1개만 존재하게 되면 일부 세포내, 소화관 및 기관의 상피세포 일부에 존재하는 트립신 및 유사 효소에 의해서만 활성화 되므로 국소감염만 일어나게 되어 병원성이 낮다. HN에 있어서도, 강병원성 바이러스는 상대적으로 짧은 571개의 아미노산만 가지고 있다. 반면, 약병원성 뉴캐슬병 바이러스의 경우에는 보다 긴 577개 또는 616개의 아미노산을 가지고 있으며, 이 뒷부분의 아미노산에 의해 강병원성주와 구분된다. 그러므로 F의 퓨린 절단부위와 HN의 C 말단 부위를 다양하게 조합한 재조합 바이러스를 만들어 다양한 단계의 병원성을 가진 바이러스를 제작할 수 있는 것이다.

특히, 본 발명은, 유전적 변이에 의해 병원성을 획득하지 못하도록 F의 퓨린 절단 부위의 아미노산 서열을 보다 안전한 아미노산 서열로 바꾼 것을 특징으로 한다. 약병원성의 F의 퓨린 절단 부위의 아마노산 서열은 R-Q-G-R또는 K-Q-G-R이다. 강병원성주가 되기 위해서는 R-X-K/R-R로 변해야 하므로 3번째 위치하고 있는 글리신 (G)이 아르기닌 (R) 또는 리신 (K)으로 바뀌어야만 한다. 그러나 G에서 R/K로의 변환은 한 개의 점 돌연변이만으로 쉽게 일어날 수 있다. 즉 글리신의 코돈은 GGA, GGC, GGG 또는 GGU인데 아르기닌/리신의 코돈은 AGA, AGG, CGA, CGC, CGG, CGU, AAA 또는 AAG이므로 글리신의 코돈이 무엇이든 단 한 번의 돌연변이로도 쉽게 아르기닌이나 리신으로 치환되어 강병원성 뉴캐슬병 바이러스로 변환될 수 있는 것이다. 실제로 2001년 호주에서는 비병원성 NDV인 울스터주가 유사한 기전으로 병원성이 증가하여 NDV가 발생한 사례가 보고되었다.

따라서 본 발명에서는 이러한 백신주의 점 돌연변이에 의한 병원성 증가 확률을 기존의 백신주보다 현저히 낮추기 위하여, PTDS (PCR based Two steps DNA synthesis) 기법 등 통상적으로 알려진 기술을 이용하여 점 돌연변이에 의한 리신/아르기닌으로의 아미노산 변화가 일어날 확률이 낮은 아미노산과 코돈을 갖는 재조합 바이러스를 제작한 것이다. 즉, R-Q-A-R 또는 G-Q-A-R과 같이, 기존의 약병원성 뉴캐슬병 바이러스 F의 115번 아미노산 글리신을 알라닌, 아스파르트산, 페닐알라닌, 이소류신, 류신, 세린, 트레오닌, 발린 및 티로신으로 이루어진 군 중에서 선택된 아미노산으로 치환시킴으로써, 이들 아미노산의 코딩 코돈의 전부 또는 일부는 최소 2 개 이상의 염기가 동시에 변이된 경우만 R/K로 변이가 일어나므로, 보 다 안전한 백신주의 제조가 가능하게 된 것이다.

본 발명에 따라 제작된 재조합 뉴캐슬병 바이러스의 병원성 정도는 평균치사시간 (Mean Death Time; MDT) 및 뇌 내 병원성 지수 (Intracerebral Pathogenicity Index; ICPI)를 측정하여 결정하였으며, 그 생물학적 성상은 EID₅₀(50% egg-infectious dose) 및 혈구 응집 해리 양상 등에 의하여 확인하였다. 이와 같은 측정 결과, 본 발명의 재조합 뉴캐슬병 바이러스는 기존의 약병원성 균주보다도 병원성이 감소된 것으로 나타났다.

이하, 본 발명을 실시예를 들어 보다 상세하게 설명하고자 한다. 그러나 이들 실시예는 본 발명을 예시하기 위한 것일 뿐이며, 본 발명의 범위가 이들 실시예에 의하여 제한되는 것은 아니다.

[실시예]

실시예 1: 바이러스 유전자 클로닝

1.1. 바이러스 cDNA의 합성

최근 국내에서 유행하는 강병원성 항원성 변이주 뉴캐슬병 바이러스를 대표할 수 있는 바이러스로서, 서울대학교 수의과대학 조류질병학실에서 분리된 SNU4152주를 선정하였다. 이 바이러스를 계태아섬유아세포 (CEF) 상에서 3회 플라크 정제를 하여 클로닝 하였고, SPF 발육란에서 2회 계배배양 하여 KBNP-4152(기탁번호 KCTC 10919BP)로 명명하였다.

RNA의 조작은 RNase가 없는 유리제품 및 플라스틱 제품에서 수행되었고, 사 용된 모든 용액은 1% 디에틸-피로카보네이트 (DEPC)를 처리하여 고압멸균 한 3차 증류수 (DEPC-DW)를 사용하였다. 이후 바이러스를 Beckman SW40 로터 (Beckman)에서 40℃, 21000rpm에서 70분간 원심분리 하였고, 펠렛을 완충용액 (50mM Tris HCl pH7.5, 50mM EDTA, 0.5% SDS)에 재부유시켜 교반하면서 37℃에서 90분간 프로테아제 K(200㎍/ml, Invitrogen co.)를 처리한 후 산성 페놀 추출법으로 RNA를 추출하였다. 그 후 에탄올 침전법으로 RNA를 침전시킨 후, 75% 에탄올로 세척하여 건조한 후 DEPC-DW에 부유시켰다. 자외선 분광기(Eppendorf, Biophotometer)로 정량 (15㎍/㎕) 하여 RNA 1㎕와 아래의 표 1에 나타낸 프라이머 (10pmol/㎕) 1㎕를 DEPC-DW 10㎕와 혼합하고, 70℃에서 10분간 변성시킨 후, 5ㅧ RT 완충용액 4㎕ (250mM Tris-HCl, pH 8.3, 375 mM KCl, 15mM MgCl₂; GibcoBRL/Life Technologies), 0.1M DTT 2㎕ 및 10mM dNTPs (각각 2.5mM) 2㎕를 첨가해 42℃에서 2분간 배양하였다. 그 후 역전사효소 1㎕(200unit, Invitrogen co.)를 첨가하고 42℃에서 60분간 배양하였다.

[표 1] KBNP-4152 cDNA 합성용 프라이머

프라이머	프라이머 서열 (5'->3')
ND-ZJ-1F	cgtctcgaccaaacagagaatctgtgaggtac (SEQ ID NO: 8)
ND-ZJ-1746F	gacaacacaggcacagctcg (SEQ ID NO: 9)
ND-ZJ-2827F	catctccttacgtgacacaagg (SEQ ID NO: 10)
ND-ZJ-F-F	tcgcgacgcaatatgg ctccaaactt tc (SEQ ID NO: 11)
ND-ZJ-HN-F	ccgcggcaccgacaac aagagtcaat catg (SEQ ID NO: 12)
ND-ZJ-8100F	actagttgagatcctcaaggatgatag (SEQ ID NO: 13)
ND-ZJ-11648F	catgcaatgttgtccagagatg (SEQ ID NO: 14)
ND-ZJ-12539F	tcagagagagatttcgcgagac (SEQ ID NO: 15)
ND-ZJ-14021F	cattgtgacattgagattcctcc (SEQ ID NO: 16)

1.2. 바이러스 유전자의 클로닝

GeneBank의 데이터를 기초로 하여 15,192bp에 달하는 상기 합성된 9종의 바이러스 cDNA를 다음의 표 2에 나타난 바와 같은 9개의 프라이머 쌍으로 PCR 법을 통해 유전자를 증폭하였고, 클로닝하여 얻어진 클론을 Z1 내지 Z9이라 명명하였다.

[표 2] KBNP-4152 유전자 클로닝용 프라이머

프라이머	프라이머 서열 (5'->3')
ND-ZJ-1F	cgtctcgaccaaacagagaatctgtgaggtac (SEQ ID NO: 8)
ND-ZJ-1844R	tcgtcttggtctctggatgtctc (SEQ ID NO: 17)
ND-ZJ-1746F	gacaacacaggcacagctcg (SEQ ID NO: 9)
ND-ZJ-2948R	cttctccactcccatgtcagg (SEQ ID NO: 18)
ND-ZJ-2827F	catctccttacgtgacacaagg (SEQ ID NO: 10)
ND-ZJ-4612R	cagcataatccgggtgatcagc (SEQ ID NO: 19)
ND-ZJ-F-F	tcgcgacgcaatatggctccaaactttc (SEQ ID NO: 11)
ND-ZJ-F-R	ccgcggtagaacggatgttgtgaagcctaa (SEQ ID NO: 20)
ND-ZJ-HN-F	ccgcggcaccgacaacaagagtcaatcatg (SEQ ID NO: 12)
ND-ZJ-HN-R	ctcaacta g taagggaacgatcctaaattcc (SEQ ID NO: 21)
ND-ZJ-8100F	actagttgagatcctcaaggatgatag (SEQ ID NO: 13)
ND-ZJ-11815R	tatggtatcagggttggatacacc (SEQ ID NO: 22)
ND-ZJ-11648F	catgcaatgttgtccagagatg (SEQ ID NO: 14)
ND-ZJ-12591R	agctcataactcttgaagatagc (SEQ ID NO: 23)
ND-ZJ-12539F	tcagagagagatttcgcgagac (SEQ ID NO: 15)
ND-ZJ-14110R	cacagaatgcatggcaatcagg (SEQ ID NO: 24)
ND-ZJ-14021F	cattgtgacattgagattcctcc (SEQ ID NO: 16)
ND-ZJ-15118R	actgaatccgaatacgacttcc (SEQ ID NO: 25)

PCR 과정 중에 발생하는 인위적인 돌연변이율을 낮추기 위해 교정 기능이 있는 DNA 중합효소 Pwo (Invitrogen co.)를 사용하였고, PCR 증폭산물은 용액의 경우 Boehringer Mannheim 사의 정제키트를 아가로스 겔인 경우 Qiagen사의 정제 키트를 사용하였다.

상기 PCR 결과 얻어진 KBNP-4152 바이러스 유전자 RT-PCR및 각 PCR산물의 위치를 도 1에 나타내었다.

상기에서 정제된 9종의 증폭산물은 XL-topo, pCR8/GW/Topo 또는 pcDNA3.1V5 topo 벡터 (Invitrogen co.)에 TA 클로닝 하였으며, 각각 3개 이상의 클론을 확보하여 플라스미드를 추출 정제하여 염기서열을 결정하였다.

모든 염기서열은 cyclic sequencing kit (PRISM Ready Reaction Dye terminator kit)와 자동염기서열분석기 (ABI310, Applied Biosystems Co.)로 결정하였다.

염기서열 분석에 사용된 primer는 M13 forward, M13 reverse primer를 사용하였고, 이들 프라이머로 모두 읽히지 않는 fragments의 경우 primer walking의 방법에 의해 다음 표 3의 프라이머를 사용하여 분석하였다.

[표 3] KBNP-4152 바이러스 염기서열 분석용 프라이머.

Primer	Primer sequence (5'->3')
ND-ZJ-597F	ctgacactctggaaagaatcc (SEQ ID NO: 26)
ND-ZJ-3421F	gatccagcgc cttgattcgt (SEQ ID NO: 27)
ND-ZJ-8662F	caggtgtttagaagaactggc (SEQ ID NO: 28)
ND-ZJ-5759F	cctcctggtatcatatcgca (SEQ ID NO: 29)
ND-ZJ-4679	gtaacaggagataaggcagtc (SEQ ID NO: 30)
ND-ZJ-7670	ttcttgtaccaacgagggtc (SEQ ID NO: 31)
ND-ZJ-9328F	cctacaggagctcaaagacac (SEQ ID NO: 32)
ND-ZJ-9977F	ctaagagatgacagtgtggc (SEQ ID NO: 33)
ND-ZJ-10588F	acttgctgcagcaagatctc (SEQ ID NO: 34)
ND-ZJ-13052F	gtggtctcaggcttatatgc (SEQ ID NO: 35)

상기와 같은 TA-클로닝 벡터를 아래의 도 2B에 나타내었으며, PCR을 통하여 EcoRI으로 처리하여 삽입된 절편의 크기를 확인하여 2A에 나타내었다.

KBNP-4152 균주는 중국의 거위 유래 SF02와 가장 높은 염기서열 및 아미노산 서열 상동성을 보였는데, 바이러스 단백질 중 NP, P, M, L의 경우 98% 이상의 높은 상동성을 보인 반면 P, V 및 HN의 경우 각각 96.2%, 95.0%와 97.6%의 비교적 낮은 상동성을 보였다. 서열 상동성 측정 결과를 표 4에 나타내었다.

[표 4] 분리된 KBNP-4152 균주와 다른 균주와의 서열 상동성

KBNP-4152	NP aa^a (nt^b)	P aa (nt)	V aa (nt)	M aa (nt)	F aa (nt)	HN aa (nt)	L aa (nt)
VII(SF02) (AF473851) VII(ZJ-1) (AF431744) Ulster (AY562991) La Sota (AY845400)	99.2 (97.1) 99.0 (97.0) 94.1 (87.2) 91.3 (84.5)	96.2 (97.6) 94.7 (97.1) 81.6 (83.1) 80.9 (81.6)	95.0 (96.8) 92.9 (95.7) 75.5 (79.0) 76.3 (78.6)	98.6 (98.0) 98.1 (97.4) 89.1 (86.6) 87.4 (84.7)	98.4 (97.6) 97.7 (97.5) 90.3 (86.2) 88.8 (84.2)	97.6 (97.6) 97.9 (97.7) 89.9 (84.4) 88.5 (81.7)	98.9 (98.0) 98.9 (98.0) 94.3 (87.2) 92.0 (85.9)

^a: 아미노산 서열 상동성 퍼센티지 (%)

^b: 뉴클레오타이드 서열 상동성 퍼센티지 (%)

특히 세포내 인터페론 발현을 방해하는 V 단백질에서의 변이가 큰 것은 세포내 방어 체계를 극복하는 과정에서 아미노산 변이가 축적된 결과일 수 있으며, HN 단백질의 변이가 비교적 큰 것은-선형항원의 변이에서 알 수 있듯이-체액성 면역 반응을 회피하는 과정에서 특정 아미노산 변이를 갖는 바이러스들이 선택되었기 때문인 것으로 사료된다. 상기 KBNP-4152 균주의 유전자 염기서열 및 각 유전자의 코딩 아미노산 서열을 GenBank에 등록하였다 (Accession No. DQ839397).

이 외에도 HN 및 F 단백질의 시스테인 및 N-linked glycosylation 위치의 변화, HN의 구조 및 극성에 영향을 줄 수 있는 아미노산의 변화 및 F의 구조 및 극성에 영향을 줄 수 있는 아미노산의 변화를 측정하여 각각 표 5 내지 7에 나타내었다.

[표 5] HN 및 F 단백질의 시스틴 및 N-linked glycosylation 위치의 변화

[표 6] HN의 구조 및 극성에 영향을 줄 수 있는 아미노산의 변화

KBNP-4152

(508-510) NVS

60 L

128 C

256 G

269 S

293 K

310 D

323 D

340 H

347 K

354 K

384 K

479 H

494 D

495 E

VII(SL03)

NIS

S

-

N

-

M

-

VII(consensus)

NIS

S

-

N

-

E

M

-

Ulster

SIS

P

-

E

-

E

N

Y

E

M

E

Y

-

K

La Sota

STS

P

W

E

R

G

S

N

Y

E

M

E

Y

G

V

VGGA

STS

P

W

E

R

G

S

N

Y

E

M

E

Y

G

-

^a Not done.

[표 7] F의 구조 및 극성에 영향을 줄 수 있는 아미노산의 변화

KBNP-4152

27 R

76 C

104 G

112 R

115 K

145 N

192 N

195 R

232 Q

247 N

403 D

422 H

430 D

480 S

486 S

VII(consensus)

-

D

-

R

-

Ulster

C

F

E

G

-

K

Q

-

D

-

Q

-

K

-

La Sota

C

-

E

G

K

Q

K

D

N

Q

G

K

R

VGGA

C

-

E

G

K

Q

K

D

N

Q

G

K

R

상기한 결과들로부터 알 수 있는 바와 같이, 본 발명에서 사용된 KBNP-4152 균주는 VII형과 유사한 유전자형을 갖는 것으로 나타났으며, 기존의 백신주인 La Sota주를 비롯하여 다른 유형의 바이러스와 유전적으로 차이가 있는 균주인 것으로 나타났다.

실시예 2: 라소타주를 기본 백본(back bone)으로 한 재조합 뉴캐슬병 바이러스 게놈 전사 벡터의 제조

2.1. 뉴캐슬병 바이러스 (NDV) 발현 모벡터 pTMH의 설계 및 제작

NDV의 cDNA로부터 바이러스를 만들어내기 위해서는 바이러스 게놈의 5'과 3'양쪽 끝에 불필요한 염기의 첨가 없이 바이러스 게놈과 똑같은 구조로 전사되어야 한다. 이러한 구조를 얻기 위해서 다음과 같은 특징의 모벡터 pTMH를 제조하였다 (SEQ ID NO: 84):

1) 전사(transcription) 개시부 바로 앞에 T7 프로모터가 위치하도록 하였다. (도 3 및 4 참조).

2) NDV 안티게놈(antigenomic) RNA 직후에는 간염 델타 바이러스(Hepatitis delta virus; HDV) 리보자임 (ribozyme) RNA을 위치시켜 self cleavage가 일어날 수 있도록 하였다.

3) T7프로모터와 HDV 리보자임 사이에는 최종적으로 NDV 게놈을 클로닝 할 수 있는 Multi-Cloning Site (MCS)를 갖도록 하였다 (도 4 참조).

4) 15 kb에 달하는 NDV 안티게놈 전체를 포함하고도 클로닝 벡터가 대장균 내에서 안정적으로 존재 할 수 있도록 pBR322의 복제 개시 염기서열 (ori)을 갖도록 하였다.

5) T7 프로모터와 NDV 전사 개시가 되는 안티게놈 5'-말단 사이, 및 NDV전사가 끝나는 안티게놈 3'-말단과 HDV 리보자임 사이에 각각 인식부위와 절단부위가 상이한 BsmB I과 Bsa I 인식 염기서열을 위치시켜 NDV 안티게놈으로부터 바이러스 게놈 RNA의 양쪽 말단이 정확하게 전사되도록 하였다 (도 3 참조).

도 4에 나타낸 바와 같이, 링커 제작용 프라이머 TM p1-p4중 TM p2와 TM p3는 1.5pmole 씩 그리고 TM p1과 TM p4는 30pmole 씩을 한 PCR tube에 넣고, 10xPCR buffer 5㎕, 2.5mM dNTP 5㎕, Taq polymerase 2.5U을 각각 넣어 총 부피가 50㎕가 되도록 DW를 넣어 준 후, 94℃-1분, 90℃-30초- 55℃-45초-72℃-15초 반응을 25회 반복 하였고, 72℃-5분 반응시켰다. PCR amplicon을 확인한 후 pCR8/GW/Topo TA 클로닝 벡터에 클로닝 하였고, 정확한 염기서열을 갖는 클론을 pCR-TM vector로 명명하였다.

상기의 HDV F, R primer를 이용하여 pTV vecter (목암 생명공학연구소 박만훈 박사 제공)부터 HDV ribozyme과 T7 terminator부분을 PCR방법으로 증폭하여 얻은 fragments 역시 pCR8/GW/Topo TA cloning 벡터에 클로닝 하였고, 정확한 염기서열을 갖는 클론을 pCR-HDV로 명명하였다.

pCR-HDV vector를 BsaI과 NdeI 제한 효소로 절단하여 얻은 HDV fragment와 BsaI과 NdeI 제한 효소로 절단한 pCR-TM 벡터를 T4 DNA ligase로 ligation 하였고, Top10F' competent cell에 transformation하여 얻은 벡터를 pCR-TMH라 명명하였다. 대장균에 안정적으로 클로닝 할 수 있도록 pBR322 벡터 (Promega co, Cat. # D1511) 에 pCR-TMH 벡터의 T7 promoter-MCS-HDV ribozyme 부분을 EcoRI과 NdeI 제한효소를 이용하여 subcloning하였으며, 이를 pTMH 벡터라 명명하였다 (SEQ ID NO: 84).

상기의 pTMH 벡터 제작 과정을 도 5에 모식적으로 나타내었으며, 제작된 모벡터 pTMP의 개략적인 개열 지도와 주요 부위 염기서열을 도 6에 나타내었으며, 제작된 pTMH 벡터의 염기서열을 도 7에 나타내었다.

본 실시예에서 제작된 모벡터 pTMH의 제한효소 인식 부위는 다음과 같다:

인식부위가 없는 경우 (No site found)

AccI AflII AgeI AvaI BclI BglII BsaAI BsaBI BsmF I BsmI BspMI BssHII BstBI BstEII Bsu36I EagI EcoRV HindIII HpaI KpnI Mfe I MluI NaeI NcoI NheI NotI NsiI PmeI PvuII SalI SfiI SmaI SphI XbaI Xcm I XhoI XmaI

인식부위가 하나인 경우

XmnI 1959 SspI 2166 SpeI 64 SacII 55

SacI 175 RsrI 0 PstI 1605 NspI 471

NruI 49 NdeI 293 HincII 1903 FspI 1584

EcoRI 0 EaeI 1752 ClaI 43 BstXI 155

BsmB I 30 BsiWI 70 Bmr I 1404 BglI 1478

BanI 1312 BamHI 181 AvrII 76 AseI 1535

Apo I 0 ApaI 35 AlwNI 882 AflIII 471

인식부위가 2개인 경우

StyI 76, 256 RsaI 71, 1843 HaeII 345, 715

ApaLI 785, 2031 AatII 147, 2282 Bsa I 82, 1431*

2.2. 라소타주의 전체 cDNA 클로닝

라소타/46 균주(AY845400)에 대한 RNA 추출 및 cDNA 합성은 상기 실시예 1에 기재된 방법에 따라 실시하였다.

2.2.1. NDV 전장 cDNA의 PCR

GenBank의 data를 기초로 하여, 총 15,186bp에 달하는 NDV cDNA 전체를 클로닝하기 위해 모두 8부분 (S1 내지 S9)으로 나누어 아래의 표 4에 기재한 프라이머를 사용하여 실시예 1에 기재된 방법에 따라 중합효소연쇄반응(PCR)을 수행하였다.

[표 8] 라소타 전체 게놈 유전자 클로닝용 프라이머

Primer	Primer sequence (5'->3')
S1-F	cgtctcgaccaaacagagaatccgtgagttacg (SEQ ID NO: 36)
S1-R	ccatgggccc tttttagcat tggacg (SEQ ID NO: 37)
S2-F	aaaagggccc atggtcgagc cc (SEQ ID NO: 38)
S2-R	tatcatcgat catgccgaca gtg (SEQ ID NO: 39)
S3-F	catgatcgat gataaaccca agc (SEQ ID NO: 40)
S3-R	tcgcgaatgagccggt cgggatccag ac (SEQ ID NO: 41)
S4-F	tcgcgacgcaatatgg ctccaaactt tc (SEQ ID NO: 42)
S4-R	ccgcggtagaacggat gttgtgaagc ctaa (SEQ ID NO: 43)
S5-F	ccgcggcaccgacaac aagagtcaat catg (SEQ ID NO: 44)
S5-R	ctcaacta g t aagggaacga tcctaaattc c (SEQ ID NO: 45)
S6-F	a c tagt tgagat cctcaaggat gatag (SEQ ID NO: 46)
S7-R	gatccgtacg aatgcagctg aactc (SEQ ID NO: 47)
S9-F	cctagg tatt accaaactca aaga (SEQ ID NO: 48)
S9-R	GGTCTCaaccaaacaaa gatttggtga atg (SEQ ID NO: 49)

상기와 같은 라소타주 유전자 RT-PCR 및 각 PCR산물의 위치를 도 8에 나타내었다.

라소타주의 유전자 8부분을 각각 TA-클로닝 벡터에 클로닝한 모습을 도 9B에 나타내었으며, PCR로 EcoRI으로 처리하여 삽입된 절편의 크기를 확인하여 도 9A에 나타내었다.

2.2.2. NDV 전장 cDNA의 클로닝 및 염기서열 결정

상기 PCR에 의해 얻어진 산물은 아가로스 겔에서 전기영동한 뒤 GeneClean III^TM(Qbio co.)를 사용하여 정제하고, Topo cloning kit (Invitrogen) 또는 XL-Topo Tcloning kit (Invitrogen)를 사용하여 클로닝 하였다. 클로닝 된 각 클론들 은 벡터 내에 있는 M13 forward, M13 reverse등과 같은 프라이머를 이용하거나, 아래의 표 9에 기재된 프라이머를 사용하여 전체 염기서열 분석을 통해 이미 알려진 라소타주의 염기서열과 동일한, 즉 돌연변이가 발생하지 않은 클론들만 선별하였다.

[표 9] 라소타주 게놈 염기서열 분석용 프라이머.

Primer	Primer sequence (5'->3')
La-601	taccctggagaggatcctc (SEQ ID NO: 50)
La-1261	cgagctaaagctaaccccag (SEQ ID NO: 51)
La-1901	agatgcagagatcgacgagc (SEQ ID NO: 52)
La-2581	aggcgatatcacagagagta (SEQ ID NO: 53)
La-3271	gtgccccaattgtgccaag (SEQ ID NO: 54)
S6-F-La	actagttgagatcctcaaagatgacgg (SEQ ID NO: 55)
S6-R-La	tgctctgccctttcaggaccggagctcgccatg (SEQ ID NO: 56)
S7-F-La	catggcgagctccggtcctgaaagggcagagca (SEQ ID NO: 57)
La-5121	cagctcaggaattagactgc (SEQ ID NO: 58)
La-5711	gtcatcgccaactgcaagat (SEQ ID NO: 59)
La-7042	ctccggacatctgcaacag (SEQ ID NO: 60)
La-8591	aaactcggaagggcagtac (SEQ ID NO: 61)
La-9311	ttcgcattcaacctgcagg (SEQ ID NO: 62)
La-9971	cttagagatgacaatgtggc (SEQ ID NO: 63)
La-10661	gtaagatcagacgactctcc (SEQ ID NO:64)
La-11321	tttgagactgttgcaagcc (SEQ ID NO: 65)
La-12012	tgtcgccacatgtaaaggc (SEQ ID NO: 66)
La-12721	tacccgaaattggatcagtg (SEQ ID NO: 67)
La-13339	catgtctcggaagagcctc (SEQ ID NO: 68)
La-13981	atctgcagtgccctacaga (SEQ ID NO: 69)
La14976	acagtaactgtgactcttaacgaaaatcacatattaataggctcc (SEQ ID NO: 70)
La15020R	ggagcctattaatatgtgattttcgttaagagtcacagttactgt (SEQ ID NO: 71)
S7-R	gatccgtacgaatgctgctgaactc (SEQ ID NO: 72)
NDV-Pt-R	tgccactgmtagttgygata (SEQ ID NO: 73)
NDcomF156	atacacctcrtcycagacag (SEQ ID NO: 74)
La-8892R	gagccatgcaaacttggctgtggacc (SEQ ID NO: 75)
La-14708	acagtgcacgagacagatcc (SEQ ID NO: 76)
La-15092R	gtcctaaggagtcagggttc (SEQ ID NO: 77)

염기서열에 변이가 없는 모든 클론들은 모벡터인 pTMH의 다중 제한효소 부위로 각각 순차적으로 도 10에 표시한 바와 같이 클로닝 하였다. L gene 사이에 새로운 제한효소 인식 부위 (ClaI)를 도입하였다. 상기 클로닝 과정을 도 10에 나타내었다.

2.2.3. RNP 복합체를 형성하기 위한 NP, P 및 L 유전자 게놈 전사 벡터 제조

뉴캐슬 바이러스 NP, P 및 L 유전자 게놈 전사 벡터를 제조하기 위하여 아래의 표 10의 프라이머로 라소타주의 NP, P 및 L 유전자를 각각 RT-PCR 하였고, 이를 TA-클로닝 벡터에 클로닝 하였다. 클론들을 염기서열 분석한 후, 돌연변이가 없는 클론들만 NotI으로 처리하여 pcDNA6/V5 벡터의 NotI 위치로 서브-클로닝 하였다.

[표 10] 라소타주 NP, P, L 유전자 증폭 및 클로닝 용 프라이머

Primer	Primer sequence (5'->3')
NDV-NP-F	gagcggccgc-accatgagtacgagcagctcc (SEQ ID NO: 78)
NDV-NP-R	gagcggccgc-tcagtacccccagtcggtg (SEQ ID NO: 79)
NDV-P-F	gagcggccgc-accatggccacctttacagatg (SEQ ID NO: 80)
NDV-P-R	gagcggccgc-ttagccatttagagcaaggc (SEQ ID NO: 81)
NDV-L-F	gagcggccgc-accatggcgagcctccgatcctgaaa (SEQ ID NO: 82)
NDV-L-R	gagcggccgc-ttaagagtcacagttactgtaatatcc (SEQ ID NO: 83)

상기 RT-PCR에 의한 NP, P, L 유전자 증폭 결과를 도 11의 A에 나타내었다. 각 유전자는 TA-cloning vector에 클로닝 하여 염기서열을 분석하여 돌연변이 없는 클론을 선발하였다. 이와 같이 선발된 클론을 도 11의 B에 나타내었다.

2.3. 야외 강병원성 NDV의 표면 항원을 갖는 재조합 약병원성 NDV 제조

2.3.1. 강병원성 KBNP-4152의 F와 HN 유전자를 약독화한 재조합 클론 제작

본 실시예에서는 최근 국내에서 유행하는 강병원성 뉴캐슬병 바이러스인 KBNP-4152의 F와 HN 유전자를 라소타주를 기본 백본으로 한 라소타주 전사 벡터(rNDV)에 삽입한 재조합 NDV 게놈 전사 벡터를 제작하였다.

2.3.2. 재조합 바이러스의 유전자 합성

각각의 F와 HN 유전자는 site-directed mutagenesis 또는 PTDS (PCR based Two steps DNA synthesis)를 이용하여 퓨린 절단 부위가 변형된 각각의 F와 HN 유전자를 얻었다 (Xiong, A. S. et al., 2004, Nucleic Acids Research, Vol32,No.12 e98). 상기 제작 과정을 도 12 내지 도 15에 나타내었다.

(가) 라소타의 M 유전자 3′-말단 부, KBNP-4152 F 유전자 연결부 및 퓨린 절단 부위의 염기서열이 변이된 유전자를 합성하였다.

재조합 바이러스를 제조하기 위하여, M 유전자 3′-말단까지는 라소타주의 게놈 서열을 갖도록 하고, 유전자간 염기서열 (intergenic sequence)과 유전자 시작 염기서열 (gene start sequence)부터는 KBNP-4152의 염기서열을 갖도록 두 개의 유전자를 융합시켰다 (도 13 참조). F 유전자를 약독화 하기 위하여 퓨린 절단 부위의 코돈들을 염기성 아미노산이 2개 또는 1개만 코딩 (112-RRQKRF-117에서 112-GRQARL-117)되도록 유전자 변이를 일으키고, 도 14와 같이 프라이머를 합성하여 화살표 방향대로 조합된 프라이머를 넣어, site directed mutagenesis 법 및 PTDS 법으로 인공합성 하였다.

(나) 그 후, KBNP-4152 HN (1-569) 유전자와 라소타주의 HN 유전자 말단 (570-577번)을 연결시켰다. 이와 같이 연결된 연결부위의 염기서열은 아래와 같다 (SEQ ID NO: 85, 밑줄 그은 부분부터 라소타주의 HN C-말단 코딩 염기서열임).

ccctttACTAGTTGAGATTCTCAAGGATGATGGGGTTAGGGAGGCCAGGGCTGGCCGCTT

GAGTCAATTGCGAGAGGGTTGGAAAGATGACATTGTATCACCTATCTTTTGCGACGCCAA

GAATCAAACTGAGTACCGGCGTGAGCTCGAGTCTTACGCTGCCAGCTGGCCA TAA TCAGC

TAGCGCTAATGTGATTAGATTAAATCTTGTCGATAGTCACTTGATTAAGAAAAAATGTAA

GTGGCAATGAGATACAAGGCAAAACAGCTCATGGTAAATAATACGGGTAGGACATGGCGA

(다) 상기와 같이 KBNP-4152 HN 유전자 (1-569)와 라소타주의 HN 유전자 말단 (570-577)을 연결하기 위해 도 15와 같이 프라이머를 설계하여 PTDS를 수행하였다.

2.3.3. 키메라 NDV (KBNP-C4152R2L) rescue

Hep-2 (한국유전자은행) 또는 BHK21 세포주 (목암생명공학 연구소의 박만훈 박사팀으로부터 제공받음)를 6웰 플레이트에서 80% 가량 키워놓은 후(37℃, 5% CO₂), vaccinia T7 바이러스 (목암생명공학 연구소의 박만훈 박사팀으로부터 제공받음)를 감염시켰다. 상기 세포주에 NDV의 RNP복합체를 형성하기 위한 NP, P, L 유전자 게놈 전사 벡터인 pcDNA3.1-NP, pcDNA3.1-P 및 pcDNA3.1-L 3 개의 벡터 (도 11의 B)와 약독화 된 KBNP-4152 F 유전자의 전사 시작부에서 HN 유전자 569까지를 라소타주 게놈 전사 벡터 (rNDV?) 중 M 유전자 뒤의 유전자간 서열 (intergenic sequence) 부분과 HN 유전자의 570사이에 삽입하여 재조합 NDV 게놈을 전사 할 수 있는 pTMH C4152-R2L (SEQ ID NO: 1, 도 23 참조)를 제작하였다.

상기 플라스미드 벡터를 각각 1:1:0.1:1비율로 섞은 플라스미드 DNA 4㎍당 10㎕의 Lipofectamine^TM(Invitrogen Co.)과 혼합하여 트랜스펙션 하였다. 여기에 1㎕/ml 의 아세틸화 트립신을 첨가하여 약병원성 재조합 바이러스가 생성되어 감염성을 갖도록 하였다. 얻어진 세포주를 2-3일간 37℃에서 배양한 후 6웰의 세포 및 세포 배양액을 수확하여 급동결 및 급해동을 3회 거쳐 9~11일령의 SPF 발육란에 접종하고, 요막액을 수확하여 재조합 뉴캐슬병 바이러스를 얻었으며, 이를 KBNP-C4152R2L이라 명명하였다. 상기 균주 KBNP-C4152R2L는 2006년 9월 12일자로 대한민국 대전광역시 유성구 어은동 52번지에 소재하는 한국생명공학연구원 생물자원센터에 기탁하여, 기탁번호 KCTC 10984BP를 부여받았다.

이와 같은 KBNP-C4152R2L의 생성 과정을 도 16에 나타내었다.

상기와 동일한 방법으로, F 단백질의 퓨린 절단 부위에 4 개의 염기성 아미노산을 갖는 강병원성 NDV (RRQKRF; KBNP-C4152R4L이라 명명)와 1 개의 염기성 아미노산을 갖는 약병원성 NDV (GGQARL; KBNP-C4152R1L이라 명명)을 각각 제조하였다. 상기 균주 이름은 퓨린 절단 부위의 염기성 아미노산 수에 따라 정한 것으로, R 뒤의 숫자는 퓨린 절단 부위의 112에서 116번 아미노산 중의 염기성 아미노산의 개수를 의미하며, L (long)은 HN 단백질의 길이가 라소타주와 같은 577개 아미노산인 것을 나타낸다.

상기 얻어진 KBNP-C4152R1L, KBNP-C4152R2L 및 KBNP-C4152R4L의 모식도를 도 17에 나타내었다.

실시예 3: KBNP-C4152R2L 분석

3.1. 키메라 NDV의 일반적 특성 조사

상기에서 얻어진 KBNP-C4152R2L을 9~10령의 SPF 발육란에 접종한 후, 3~5일 뒤 요막액을 수확하여 평판 혈구응집검사를 통해 재조합 NDV가 증식하였는지 확인하였다. 그 결과를 도 18에 나타내었다. 도 18에서 알 수 있는 바와 같이, KBNP- C4152R2L을 접종하여 얻은 요막액에서 혈구 응집이 관찰되었으며, 이를 통하여 KBNP-C4152R2L의 증식을 확인하였다.

KBNP-C4152R2L은 대부분의 F 및 HN 유전자가 야외 강병원성 주인 KBNP-4152와 동일하지만, F의 퓨린 절단 부위가 인공적으로 합성된 바이러스로, 강병원성 NDV 특이 프라이머를 사용한 PCR로는 바이러스의 RNA가 검출 되지 않으며, 모든 NDV를 공통적으로 검출하는 프라이머를 통해서만 바이러스의 RNA가 검출되는 것으로 나타났다. 이러한 사실은 표 5의 NDV-pt-R과 NDVcomF156 프라이머를 사용하는 RT-PCR로 증폭된 바이러스의 RNA 염기서열을 결정하여 재조합 NDV의 유전자 표지를 확인하였다. 상기의 RT-PCR 방법을 통하여 키메라 바이러스를 검출하고 병원성 유형을 확인하여 그 결과를 도 19에 나타내었다. 도 19에 나타낸 바와 같이, KBNP-C4152R2L은 NDV 공통 프라이머로(NDVcomF156)는 검출 가능하지만, 병원성주 특이 프라이머(NDV-pt-R)(특허 제0451883호)로는 검출이 불가능하였다.

보다 정밀한 바이러스 동정을 위하여 RT-PCR 후 염기서열을 분석하여 인공적으로 합성된 F의 퓨린 절단 부위를 코딩하는 유전자 염기서열을 확인하여 그 결과를 도 20에 나타내었다. 도 20에 나타낸 바와 같이, 모 균주인 KBNP-4152의 F의 퓨린 절단 부위는 112-RRQKRF-117의 구조를 갖는 반면, KBNP-C4152R2L은 112-GRQARL-117의 구조를 갖는 것으로 나타났다. 특히 115번째 아미노산 위치에 존재하는 알라닌(A)은 자연계의 NDV는 가지고 있지 않는 본 발명의 키메라 바이러스만의 특징이라고 할 수 있다.

3.2. 키메라 NDV의 혈청학적 특성 조사

KBNP-C4152R2L의 F 및 HN은 KBNP-4152와 유사하고 라소타주와는 뚜렷한 차이를 보이므로, KBNP-C4152R2L는 KBNP-4152와 혈청학적으로 유사하나 라소타주와는 차이를 보일 것으로 예상된다. 이를 확인하기 위하여 교차-혈구응집억제 검사를 실시하여 혈청학적 특성을 조사하였으며, 그 결과를 도 21에 나타내었다. 예상한 바와 같이, KBNP-C4152R2L은 KBNP-4152와 유사한 혈청학적 특성을 보이는 것으로 나타났다. 즉 항라소타 항혈청은 라소타주와 비교하여 KBNP-C4152R2L 및 KBNP-4152에 대해 4 내지 8배 낮은 혈구응집역가를 보였고, 항KBNP-4152 항혈청은 자신이나 KBNP-C4152R2L에 대해 거의 유사한 혈구응집역가를 보이는 것으로 나타났다.

3.3. KBNP-C4152R2L의 병원성 지수 측정

3.3.1. 평균치사시간 (Mean Death Time; MDT) 측정

MDT측정은 Alexander(1988)의 방법에 준하여 실시하였다. 본 발명의 KBNP-C4152R2L을 멸균 PBS로 10^-6으로 희석한 바이러스를 10개의 발육 계란을 5개씩 두 그룹으로 나누어 접종하였다. 첫 번째 그룹은 오전 9시에 접종을 실시하며, 두 번째 그룹은 오후 5시에 실시하였다. 접종 후 7 일간 37℃에서 배양하면서 매일 오전 9시와 5시에 검란을 실시하여 치사시간을 기록하여 MDT를 계산하였다. 측정된 MDT가 60시간 이내의 경우 강병원성, 60-90시간 이상의 경우 중간 독, 90~120시간은 약병원성, 그리고 120~∞는 무병원성으로 판정하였다. 백신 바이러스의 MDT는 최소 90시간이상이어야 한다. 그 결과, 본 발명의 KBNP-C4152R2L은 평균치사시간이 168시간 이상으로 측정되어 무병원성 NDV로 분류되었다.

3.3.2. 뇌 내 병원성 지수 (Intracerebral Pathogenicity Index, ICPI) 측정

1 일령 병아리 각각 10마리에 멸균 식염수로 10배 희석한 요막액 (실시예 12.3.3) 50㎕를 1cc주사기를 이용해 뇌 내로 접종한 후 매일 정상 병아리는 0, 병증을 보인 병아리는 1, 죽은 병아리는 2로 점수를 매겨 매일 합계를 내어 8일간의 총 점수를 80으로 나누어 계산하였다. 무병원성은 0.0~0.2, 약병원성은 0.2~0.5, 중병원성은 1.0~1.5, 강병원성은 1.5~2.0으로 분류하였다. 국내에서 백신 바이러스로 활용하기 위해서는 최소 0.5이하의 병원성 지수를 보여야하므로, 0.0~0.5까지의 재조합 바이러스를 선정하였다.

KBNP-4152, KBNP-C4152R2L 및 라소타주의 ICPI를 측정한 결과를 각각 표 11 내지 13에 나타내었다.

[표 11] KBNP-4152의 ICPI 측정.

Day	1	2	3	4	5	6	7	8	Sum(index)
Sign	6	0	0	0	0	0	0	0	6 x 1
Dead	4	10	10	10	10	10	10	10	74 x 2
Normal	0	0	0	0	0	0	0	0
							Total =		154

ICPI = 154/80 = 1.925

[표 12] KBNP-C4152R2L의 ICPI 측정.

Day	1	2	3	4	5	6	7	8	Sum(index)
Sign	0	0	0	0	0	0	0	0	0 x 1
Dead	0	0	0	0	0	0	0	0	0 x 2
Normal	10	10	10	10	10	10	10	10
							Total =		154

ICPI = 0/80 = 0.0

[표 13] 라소타주의 ICPI 측정.

Day	1	2	3	4	5	6	7	8	Sum(index)
Sign	0	0	0	0	0	3	5	2	10 x 1
Dead	0	0	0	0	0	0	1	4	5 x 2
Normal	10	10	10	10	10	10	10	10
							Total =		20

ICPI = 20/80 = 0.25

상기 평균치사시간(MDT) 및 ICPI 결과를 보면, KBNP-C4152R2L은 MDT가 168시간 이상이었으며, ICPI 또한 0.0으로 병원성이 거의 없는 바이러스로 확인되었다. 이러한 병원성 감소 결과는 본 발명의 KBNP-C4152R2L 균주가 기존의 약독화 된 라소타주보다도 훨씬 약독화 되어 병원성이 낮다는 것을 보여주며, 이러한 병원성의 급격한 저하는 세포변성 효과에 있어서 합포체 형성능력이 뛰어난 야외주의 F와 HN 유전자 대신 과립형의 세포 변성 효과를 보이는 야외 NDV의 F 및 HN 유전자를 도입하여 만든 재조합 바이러스에서 나타 날 수 있는 결과이다. 지금까지 강병원성 NDV 중 합포체형과 과립형의 세포변성효과를 나타내는 클론이 존재한다는 사실은 전세계적으로도 국내에서 거의 멸종한 것으로 의심되는 VI형 바이러스에서만 알려져 있었는데 합포체형 NDV 클론인 SNU9358GS (서울대학교 수의과대학 조류질병학실 보유)의 ICPI 수치 (1.95)보다 과립형 클론인 SNU9358GG (AF535861)의 수치 (1.78)가 더 낮아 병원성이 낮다는 것이 알려져 있었다. 그러나 VII형을 포함한 나머지 III, IV, V, VIII, XI 형 병원성 NDV에서는 이러한 과립형 세포변성효과를 일으키는 NDV 클론은 전혀 알려져 있지 않았는 바 본 연구자들은 VII형 NDV에서 과립형 NDV를 최초로 클로닝 하는데 성공하여 이 바이러스의 F 및 HN 유전자를 이용하여 과립형 세포변성효과를 나타내는 라소타주 보다 낮은 병원성을 갖는 재조합 NDV를 제작하는데 성공하였다.

3.4. KBNP-C4152R2L의 유전적 안정성 시험

본 발명의 재조합 바이러스 KBNP-C4152R2L을 계태아에서 9번 이상 계대 배양한 후, 키메라 게놈 뉴클레오티드 4030~8889까지를 RT-PCR로 증폭한 후 염기서열 분석한 결과, 염기서열에 변화가 없어 매우 안정한 것으로 확인되었다.

3.5. KBNP-C4152R2L의 생산성 측정: EID ₅₀ (50% egg-infectious dose) 측정

바이러스를 10진 희석하여 각 희석 배수 당 9~10일령 계태아 5~7개에 0.1ml 씩 요막강 내로 접종하고, 5~7일 간 37℃에서 배양한 후 계태아를 chilling 하며 요막액을 수확하여 혈구응집 반응을 통해 바이러스의 증식 여부를 판정하여 정해진 계산식에 따라 산출하였다. 그 결과, KBNP-C4152R2L의 EID₅₀는 10^10.1/㎖로 기존의 라소타주와 유사하여 생산성이 매우 높은 것으로 나타났다.

3.6. 혈구해리양상 측정

혈구응집 해리에 대한 조사는 Spalatin (1970)의 방법에 준하여 실시하였다. 즉 macro플레이트 웰에 CMF-PBS로 2진 희석한 라소타주와 KBNP-C4152R2L 각각 0.5ml에 1% 닭혈구를 0.25ml씩 넣고 실온에서 1시간 반응시킨 후 혈구응집 역가를 측정하였다. 1차 판독이 끝난 후 플레이트를 4℃에서 24시간 정치한 후에 혈구응집 역가를 측정하고 재 부유 2시간 후에 다시 혈구응집역가를 측정한다. 역가는 응집이 일어나는 최고 희석배수의 역수로 하였다. 판정 방법은 해리양상의 판정은 혈구응집 반응 24시간 후에 완전하게 해리가 일어나고 재 부유 2시간 후에도 혈구응집이 나타나지 않을 때 rapid eluter, 그렇지 않을 때 slow eluter로 판정하였 다.

그 결과, 라소타주는 slow eluter였으나 KBNP-C4152R2L은 rapid eluter로서 KBNP-4152와 동일한 생물학적 특성을 갖는 것으로 나타났다.

3.7. 세포변성 효과 측정

계태아 섬유아세포(CEF)를 96웰 플레이트 전면에 단층을 형성하도록 배양한 후 라소타주, KBNP-4152 및 KBNP-C4152R2L로 각각 감염시킨 후 (각각 200 TCID₅₀/well), FBS 0.5%, trypsin 20㎍/㎖을 첨가한 배지로 교체하여 배양하고, 3일 뒤에 관찰한 결과를 도 22에 나타내었다. 사진 중간의 붉은 화살표는 NDV의 전형적인 세포변성 효과인 합포체가 형성된 모습을 나타내는 것으로, 실제로 KBNP-C4152R2L는 트립신 첨가 시 NDV의 특징적인 합포체를 형성하는 것을 확인할 수 있다 (도 22의 E의 붉은 화살표).

이러한 세포 변성 효과는 키메라 바이러스가 합포체 형성에 트립신 의존성을 갖는 약 병원성주임을 의미하나, 라소타주와 KBNP-4152주와는 달리 전형적인 합포체를 거의 형성하지 않고, 도 22의 D와 같이 과립형의 세포변성효과를 보였다.

3.8. KBNP-C4152R2L의 불활화 백신 실험

KBNP-C4152R2L의 계태아 배양 원액, 이를 10배 농축한 농축액 및 라소타주 계태아 배양액을 각각 0.3% 포름알데히드로 불활화 하였으며, 불활화 된 각각의 바이러스 항원 부유액 30%에 ISA70오일 70%를 유화하여 각각의 불활화 백신을 제조하였다. 이와 같이 제조된 불활화 백신을 6주령의 SPF 닭의 피하에 접종하였으며, 백신 접종 3주 후에 검역원에서 표준으로 사용하는 교정원주 10⁶TCID₅₀ (AY6304009)를 비강 및 구강으로 공격하였다. 공격 접종 후 10일까지의 폐사율을 관찰하였으며, 그 결과를 아래의 표 14에 나타내었다.

[표 14]

상기 표 14에 나타낸 바와 같이, KBNP-C4152R2L은 라소타주에 비하여 HA역가로 계산한 항원량이 낮은 경우에도 항체를 형성시키는 능력은 기존 백신에 비해 탁월한 것으로 나타났으며, 특히 혈청학적으로 라소타주에 비해 야외주에 대한 면역을 더욱 잘 형성하는 것으로 나타났다.

3.9. KBNP-C4152R2L의 in ovo 백신 실험

KBNP-C4152R2L은 현재 백신으로 사용되고 있는 균주보다도 병원성이 매우 낮아 in ovo 백신의 가능성이 높아 이를 확인하기 위해 18일령 상용계의 계태아를 이용하여 in ovo 백신을 투여했으며, 부화율 및 부화 2주 후의 증체율을 대조군과 비교하였고, 2주령 이후의 항체가를 검사함으로써 모체이행 항체 극복 여부와 면역 수준을 비교하였으며, 2주 후 강병원성 바이러스를 공격 접종하여 방어율을 확인하였다.

시험에 사용한 계태아는 상용 산란계로 18일령의 계태아에 10^7.0EID₅₀/ml이 되도록 희석한 각 백신주를 0.1cc씩 접종하였다. 또한 음성 대조군에는 멸균 PBS 0.1cc를 접종하였다. 모체이행항체의 수준을 알아보기 위해서 음성 대조군 중 5수를 부화 직후 희생시켜 혈청을 확보하였다. 부화 후 17일령에 각 그룹 당 개체 별 체중을 측정하고 채혈 하였으며, 강독주인 KBNP-4152 10^6.5TCID₅₀를 비강 및 구강으로 공격 접종하였다. 생존율은 공격 접종 후 10일까지 관찰하였다. 이와 같이 하여 얻은 결과를 아래의 표 15에 나타내었다.

[표 15] KBNP-C4152R2L의 in ovo 백신 효능 비교.

상기 표 15와 같이 KBNP-C4152R2L 접종군과 음성 대조군은 부화율 및 증체율에서 유의적인 차이가 없었으나, 부화 후 17일령의 항체 역가는 대조군에 비해 KBNP-C4152R2L 접종군에서 높게 유지되고 있음을 확인할 수 있다. 즉, 대조군의 경우 1일령의 경우 모체이행항체가 라소타주에 대한 혈구 응집 억제(HI)역가가 평균 5.8 ± 2.7에서 2.7 ± 1.7로 떨어진 반면 KBNP-C4152R2L 접종군은 라소타주에 대해서는 4.9 ± 1.1 그리고 자신에 대해서는 5.5 ± 1.4로 비교적 높은 역가를 보여 주었다. 또한 공격 접종 후 대조군에서 33.3%의 폐사를 보였으나 재조합 백신 접종군의 경우 100% 생존하였다.

이와 같은 결과는 Akzo Nobel N.V.(NL)사가 가지고 있는 기존의 "Recombinant Newcastle disease virus as an embryo vaccine"을 제목으로 하는 "US6,699,479B1" 특허 보다 월등한 결과 이며, P gene editing에 의한 약독화를 이 용하지 않고, 새로운 방법으로 개발된 KBNP-C4152R2L로부터 얻어진 것이라는 점에서 의미가 있다.

최근 선진국에서는 접종의 용이성 및 경제성 등의 이유로 병아리가 부화되기 전인 계태아에 직접 백신 하는 In ovo 백신이 선호되고 있지만, 뉴캐슬병의 경우 현재까지 알려진 생독 백신주들은 계태아 병원성이 있어 적용에 한계가 있었다. 그러나 본 발명의 KBNP-C4152R2L은 경우 계태아 병원성이 없는 것으로 확인되어 in ovo 백신으로서의 활용 가치가 매우 높을 것으로 기대된다.

상기에서 살펴본 바와 같이 본 발명의 재조합 뉴캐슬병 바이러스는 국내 및 아시아 지역에서 유행하는 강병원성 뉴캐슬병바이러스와 항원성이 유사하며, 병원성은 현재 사용되고 있는 백신주들과 유사하거나 현저하게 낮아 in ovo 백신으로 사용할 수 있고, 점 돌연변이에 의한 병원성 획득 가능성도 기존의 백신주에 비해 훨씬 낮은 유전자 구조를 가지고 있어 국내 뿐 아니라 아시아 지역의 뉴캐슬병 예방을 위한 사독백신 뿐 아니라 생독백신 및 in ovo 백신 제조에 유용하게 사용할 수 있다.

<110> KBNP, INC. <120> ATTENUATED RECOMBINANT NEWCASTLE DISEASE VIRUS AND VACCINE CONTAINING THE SAME <160> 85 <170> KopatentIn 1.71 <210> 1 <211> 17481 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of full length genomic clone of pTMH c4152-R2L <220> <221> CDS <222> (122)..(1588) <223> NP protein coding site <220> <221> CDS <222> (1887)..(3071) <223> P protein coding site <220> <221> CDS <222> (3290)..(4381) <223> M protein coding site <220> <221> CDS <222> (4550)..(6208) <223> F protein coding site <220> <221> CDS <222> (6418)..(8148) <223> HN protein coding site <220> <221> CDS <222> (8387)..(14998) <223> L protein coding site <400> 1 accaaacaga gaatccgtga gttacgataa aaggcgaagg agcaattgaa gtcgcacggg 60 tagaaggtgt gaatctcgag tgcgagcccg aagcacaaac tcgagaaagc cttctgccaa 120 c atg tct tcc gta ttt gat gag tac gaa cag ctc ctc gcg gct 163 Met Ser Ser Val Phe Asp Glu Tyr Glu Gln Leu Leu Ala Ala 1 5 10 cag act cgc ccc aat gga gct cat gga ggg gga gaa aaa ggg agt acc 211 Gln Thr Arg Pro Asn Gly Ala His Gly Gly Gly Glu Lys Gly Ser Thr 15 20 25 30 tta aaa gta gac gtc ccg gta ttc act ctt aac agt gat gac cca gaa 259 Leu Lys Val Asp Val Pro Val Phe Thr Leu Asn Ser Asp Asp Pro Glu 35 40 45 gat aga tgg agc ttt gtg gta ttc tgc ctc cgg att gct gtt agc gaa 307 Asp Arg Trp Ser Phe Val Val Phe Cys Leu Arg Ile Ala Val Ser Glu 50 55 60 gat gcc aac aaa cca ctc agg caa ggt gct ctc ata tct ctt tta tgc 355 Asp Ala Asn Lys Pro Leu Arg Gln Gly Ala Leu Ile Ser Leu Leu Cys 65 70 75 tcc cac tca cag gta atg agg aac cat gtt gcc att gca ggg aaa cag 403 Ser His Ser Gln Val Met Arg Asn His Val Ala Ile Ala Gly Lys Gln 80 85 90 aat gaa gcc aca ttg gcc gtg ctt gag att gat ggc ttt gcc aac ggc 451 Asn Glu Ala Thr Leu Ala Val Leu Glu Ile Asp Gly Phe Ala Asn Gly 95 100 105 110 acg ccc cag ttc aac aat agg agt gga gtg tct gaa gag aga gca cag 499 Thr Pro Gln Phe Asn Asn Arg Ser Gly Val Ser Glu Glu Arg Ala Gln 115 120 125 aga ttt gcg atg ata gca gga tct ctc cct cgg gca tgc agc aac gga 547 Arg Phe Ala Met Ile Ala Gly Ser Leu Pro Arg Ala Cys Ser Asn Gly 130 135 140 acc ccg ttc gtc aca gcc ggg gca gaa gat gat gca cca gaa gac atc 595 Thr Pro Phe Val Thr Ala Gly Ala Glu Asp Asp Ala Pro Glu Asp Ile 145 150 155 acc gat acc ctg gag agg atc ctc tct atc cag gct caa gta tgg gtc 643 Thr Asp Thr Leu Glu Arg Ile Leu Ser Ile Gln Ala Gln Val Trp Val 160 165 170 aca gta gca aaa gcc atg act gcg tat gag act gca gat gag tcg gaa 691 Thr Val Ala Lys Ala Met Thr Ala Tyr Glu Thr Ala Asp Glu Ser Glu 175 180 185 190 aca agg cga atc aat aag tat atg cag caa ggc agg gtc caa aag aaa 739 Thr Arg Arg Ile Asn Lys Tyr Met Gln Gln Gly Arg Val Gln Lys Lys 195 200 205 tac atc ctc tac ccc gta tgc agg agc aca atc caa ctc acg atc aga 787 Tyr Ile Leu Tyr Pro Val Cys Arg Ser Thr Ile Gln Leu Thr Ile Arg 210 215 220 cag tct ctt gca gtc cgc atc ttt ttg gtt agc gag ctc aag aga ggc 835 Gln Ser Leu Ala Val Arg Ile Phe Leu Val Ser Glu Leu Lys Arg Gly 225 230 235 cgc aac acg gca ggt ggt acc tct act tat tat aac ctg gta ggg gac 883 Arg Asn Thr Ala Gly Gly Thr Ser Thr Tyr Tyr Asn Leu Val Gly Asp 240 245 250 gta gac tca tac atc agg aat acc ggg ctt act gca ttc ttc ttg aca 931 Val Asp Ser Tyr Ile Arg Asn Thr Gly Leu Thr Ala Phe Phe Leu Thr 255 260 265 270 ctc aag tac gga atc aac acc aag aca tca gcc ctt gca ctt agt agc 979 Leu Lys Tyr Gly Ile Asn Thr Lys Thr Ser Ala Leu Ala Leu Ser Ser 275 280 285 ctc tca ggc gac atc cag aag atg aag cag ctc atg cgt ttg tat cgg 1027 Leu Ser Gly Asp Ile Gln Lys Met Lys Gln Leu Met Arg Leu Tyr Arg 290 295 300 atg aaa gga gat aat gcg ccg tac atg aca tta ctt ggt gat agt gac 1075 Met Lys Gly Asp Asn Ala Pro Tyr Met Thr Leu Leu Gly Asp Ser Asp 305 310 315 cag atg agc ttt gcg cct gcc gag tat gca caa ctt tac tcc ttt gcc 1123 Gln Met Ser Phe Ala Pro Ala Glu Tyr Ala Gln Leu Tyr Ser Phe Ala 320 325 330 atg ggt atg gca tca gtc cta gat aaa ggt act ggg aaa tac caa ttt 1171 Met Gly Met Ala Ser Val Leu Asp Lys Gly Thr Gly Lys Tyr Gln Phe 335 340 345 350 gcc agg gac ttt atg agc aca tca ttc tgg aga ctt gga gta gag tac 1219 Ala Arg Asp Phe Met Ser Thr Ser Phe Trp Arg Leu Gly Val Glu Tyr 355 360 365 gct cag gct cag gga agt agc att aac gag gat atg gct gcc gag cta 1267 Ala Gln Ala Gln Gly Ser Ser Ile Asn Glu Asp Met Ala Ala Glu Leu 370 375 380 aag cta acc cca gca gca atg aag ggc ctg gca gct gct gcc caa cgg 1315 Lys Leu Thr Pro Ala Ala Met Lys Gly Leu Ala Ala Ala Ala Gln Arg 385 390 395 gtc tcc gac gat acc agc agc ata tac atg cct act caa caa gtc gga 1363 Val Ser Asp Asp Thr Ser Ser Ile Tyr Met Pro Thr Gln Gln Val Gly 400 405 410 gtc ctc act ggg ctt agc gag ggg ggg tcc caa gct cta caa ggc gga 1411 Val Leu Thr Gly Leu Ser Glu Gly Gly Ser Gln Ala Leu Gln Gly Gly 415 420 425 430 tcg aat aga tcg caa ggg caa cca gaa gcc ggg gat ggg gag acc caa 1459 Ser Asn Arg Ser Gln Gly Gln Pro Glu Ala Gly Asp Gly Glu Thr Gln 435 440 445 ttc ctg gat ctg atg aga gcg gta gca aat agc atg agg gag gcg cca 1507 Phe Leu Asp Leu Met Arg Ala Val Ala Asn Ser Met Arg Glu Ala Pro 450 455 460 aac tct gca cag ggc act ccc caa tcg ggg cct ccc cca act cct ggg 1555 Asn Ser Ala Gln Gly Thr Pro Gln Ser Gly Pro Pro Pro Thr Pro Gly 465 470 475 cca tcc caa gat aac gac acc gac tgg ggg tat tg atggacaaaa 1600 Pro Ser Gln Asp Asn Asp Thr Asp Trp Gly Tyr 480 485 cccagcctgc ttccacaaaa acatcccaat gccctcaccc gtagtcgacc cctcgatttg 1660 cggctctata tgaccacacc ctcaaacaaa catccccctc tttcctccct ccccctgctg 1720 tacaactccg cacgccctag ataccacagg cacaatgcgg ctcactaaca atcaaaacag 1780 agccgaggga attagaaaaa agtacgggta gaagagggat attcagagat cagggcaagt 1840 ctcccgagtc tctgctctct cctctacctg atagaccagg acaaac atg gcc acc 1895 Met Ala Thr 1 ttt aca gat gca gag atc gac gag cta ttt gag aca agt gga act gtc 1943 Phe Thr Asp Ala Glu Ile Asp Glu Leu Phe Glu Thr Ser Gly Thr Val 5 10 15 att gac aac ata att aca gcc cag ggt aaa cca gca gag act gtt gga 1991 Ile Asp Asn Ile Ile Thr Ala Gln Gly Lys Pro Ala Glu Thr Val Gly 20 25 30 35 agg agt gca atc cca caa ggc aag acc aag gtg ctg agc gca gca tgg 2039 Arg Ser Ala Ile Pro Gln Gly Lys Thr Lys Val Leu Ser Ala Ala Trp 40 45 50 gag aag cat ggg agc atc cag cca ccg gcc agt caa gac aac ccc gat 2087 Glu Lys His Gly Ser Ile Gln Pro Pro Ala Ser Gln Asp Asn Pro Asp 55 60 65 cga cag gac aga tct gac aaa caa cca tcc aca ccc gag caa acg acc 2135 Arg Gln Asp Arg Ser Asp Lys Gln Pro Ser Thr Pro Glu Gln Thr Thr 70 75 80 ccg cat gac agc ccg ccg gcc aca tcc gcc gac cag ccc ccc acc cag 2183 Pro His Asp Ser Pro Pro Ala Thr Ser Ala Asp Gln Pro Pro Thr Gln 85 90 95 gcc aca gac gaa gcc gtc gac aca cag ttc agg acc gga gca agc aac 2231 Ala Thr Asp Glu Ala Val Asp Thr Gln Phe Arg Thr Gly Ala Ser Asn 100 105 110 115 tct ctg ctg ttg atg ctt gac aag ctc agc aat aaa tcg tcc aat gct 2279 Ser Leu Leu Leu Met Leu Asp Lys Leu Ser Asn Lys Ser Ser Asn Ala 120 125 130 aaa aag ggc cca tgg tcg agc ccc caa gag ggg aat cac caa cgt ccg 2327 Lys Lys Gly Pro Trp Ser Ser Pro Gln Glu Gly Asn His Gln Arg Pro 135 140 145 act caa cag cag ggg agt caa ccc agt cgc gga aac agt cag gaa aga 2375 Thr Gln Gln Gln Gly Ser Gln Pro Ser Arg Gly Asn Ser Gln Glu Arg 150 155 160 ccg cag aac caa gtc aag gcc gcc cct gga aac cag ggc aca gac gtg 2423 Pro Gln Asn Gln Val Lys Ala Ala Pro Gly Asn Gln Gly Thr Asp Val 165 170 175 aac aca gca tat cat gga caa tgg gag gag tca caa cta tca gct ggt 2471 Asn Thr Ala Tyr His Gly Gln Trp Glu Glu Ser Gln Leu Ser Ala Gly 180 185 190 195 gca acc cct cat gct ctc cga tca agg cag agc caa gac aat acc ctt 2519 Ala Thr Pro His Ala Leu Arg Ser Arg Gln Ser Gln Asp Asn Thr Leu 200 205 210 gta tct gcg gat cat gtc cag ccg cct gta gac ttt gtg caa gcg atg 2567 Val Ser Ala Asp His Val Gln Pro Pro Val Asp Phe Val Gln Ala Met 215 220 225 atg tct atg atg gag gcg ata tca cag aga gta agt aag gtt gac tat 2615 Met Ser Met Met Glu Ala Ile Ser Gln Arg Val Ser Lys Val Asp Tyr 230 235 240 cag cta gat ctt gtc ttg aaa cag aca tcc tcc atc cct atg atg cgg 2663 Gln Leu Asp Leu Val Leu Lys Gln Thr Ser Ser Ile Pro Met Met Arg 245 250 255 tcc gaa atc caa cag ctg aaa aca tct gtt gca gtc atg gaa gcc aac 2711 Ser Glu Ile Gln Gln Leu Lys Thr Ser Val Ala Val Met Glu Ala Asn 260 265 270 275 ttg gga atg atg aag att ctg gat ccc ggt tgt gcc aac att tca tct 2759 Leu Gly Met Met Lys Ile Leu Asp Pro Gly Cys Ala Asn Ile Ser Ser 280 285 290 ctg agt gat cta cgg gca gtt gcc cga tct cac ccg gtt tta gtt tca 2807 Leu Ser Asp Leu Arg Ala Val Ala Arg Ser His Pro Val Leu Val Ser 295 300 305 ggc cct gga gac ccc tct ccc tat gtg aca caa gga ggc gaa atg gca 2855 Gly Pro Gly Asp Pro Ser Pro Tyr Val Thr Gln Gly Gly Glu Met Ala 310 315 320 ctt aat aaa ctt tcg caa cca gtg cca cat cca tct gaa ttg att aaa 2903 Leu Asn Lys Leu Ser Gln Pro Val Pro His Pro Ser Glu Leu Ile Lys 325 330 335 ccc gcc act gca tgc ggg cct gat ata gga gtg gaa aag gac act gtc 2951 Pro Ala Thr Ala Cys Gly Pro Asp Ile Gly Val Glu Lys Asp Thr Val 340 345 350 355 cgt gca ttg atc atg tca cgc cca atg cac ccg agt tct tca gcc aag 2999 Arg Ala Leu Ile Met Ser Arg Pro Met His Pro Ser Ser Ser Ala Lys 360 365 370 ctc cta agc aag tta gat gca gcc ggg tcg atc gag gaa atc agg aaa 3047 Leu Leu Ser Lys Leu Asp Ala Ala Gly Ser Ile Glu Glu Ile Arg Lys 375 380 385 atc aag cgc ctt gct cta aat ggc taattacta ctgccacacg tagcgggtcc 3100 Ile Lys Arg Leu Ala Leu Asn Gly 390 395 ctgtccactc ggcatcacac ggaatctgca ccgagttccc ccccgcagac ccaaggtcca 3160 actctccaag cggcaatcct ctctcgcttc ctcagcccca ctgaatgatc gcgtaaccgt 3220 aattaatcta gctacattta agattaagaa aaaatacggg tagaattgga gtgccccaat 3280 tgtgccaag atg gac tca tct agg aca att ggg ctg tac ttt gat tct gcc 3331 Met Asp Ser Ser Arg Thr Ile Gly Leu Tyr Phe Asp Ser Ala 1 5 10 cat tct tct agc aac ctg tta gca ttt ccg atc gtc cta caa gac aca 3379 His Ser Ser Ser Asn Leu Leu Ala Phe Pro Ile Val Leu Gln Asp Thr 15 20 25 30 gga gat ggg aag aag caa atc gcc ccg caa tat agg atc cag cgc ctt 3427 Gly Asp Gly Lys Lys Gln Ile Ala Pro Gln Tyr Arg Ile Gln Arg Leu 35 40 45 gac ttg tgg act gat agt aag gag gac tca gta ttc atc acc acc tat 3475 Asp Leu Trp Thr Asp Ser Lys Glu Asp Ser Val Phe Ile Thr Thr Tyr 50 55 60 gga ttc atc ttt caa gtt ggg aat gaa gaa gcc act gtc ggc atg atc 3523 Gly Phe Ile Phe Gln Val Gly Asn Glu Glu Ala Thr Val Gly Met Ile 65 70 75 gat gat aaa ccc aag cgc gag tta ctt tcc gct gcg atg ctc tgc cta 3571 Asp Asp Lys Pro Lys Arg Glu Leu Leu Ser Ala Ala Met Leu Cys Leu 80 85 90 gga agc gtc cca aat acc gga gac ctt att gag ctg gca agg gcc tgt 3619 Gly Ser Val Pro Asn Thr Gly Asp Leu Ile Glu Leu Ala Arg Ala Cys 95 100 105 110 ctc act atg ata gtc aca tgc aag aag agt gca act aat act gag aga 3667 Leu Thr Met Ile Val Thr Cys Lys Lys Ser Ala Thr Asn Thr Glu Arg 115 120 125 atg gtt ttc tca gta gtg cag gca ccc caa gtg ctg caa agc tgt agg 3715 Met Val Phe Ser Val Val Gln Ala Pro Gln Val Leu Gln Ser Cys Arg 130 135 140 gtt gtg gca aac aaa tac tca tca gtg aat gca gtc aag cac gtg aaa 3763 Val Val Ala Asn Lys Tyr Ser Ser Val Asn Ala Val Lys His Val Lys 145 150 155 gcg cca gag aag att ccc ggg agt gga acc cta gaa tac aag gtg aac 3811 Ala Pro Glu Lys Ile Pro Gly Ser Gly Thr Leu Glu Tyr Lys Val Asn 160 165 170 ttt gtc tcc ttg act gtg gta ccg aag aag gat gtc tac aag atc cca 3859 Phe Val Ser Leu Thr Val Val Pro Lys Lys Asp Val Tyr Lys Ile Pro 175 180 185 190 gct gca gta ttg aag gtt tct ggc tcg agt ctg tac aat ctt gcg ctc 3907 Ala Ala Val Leu Lys Val Ser Gly Ser Ser Leu Tyr Asn Leu Ala Leu 195 200 205 aat gtc act att aat gtg gag gta gac ccg agg agt cct ttg gtt aaa 3955 Asn Val Thr Ile Asn Val Glu Val Asp Pro Arg Ser Pro Leu Val Lys 210 215 220 tct ctg tct aag tct gac agc gga tac tat gct aac ctc ttc ttg cat 4003 Ser Leu Ser Lys Ser Asp Ser Gly Tyr Tyr Ala Asn Leu Phe Leu His 225 230 235 att gga ctt atg acc acc gta gat agg aag ggg aag aaa gtg aca ttt 4051 Ile Gly Leu Met Thr Thr Val Asp Arg Lys Gly Lys Lys Val Thr Phe 240 245 250 gac aag ctg gaa aag aaa ata agg agc ctt gat cta tct gtc ggg ctc 4099 Asp Lys Leu Glu Lys Lys Ile Arg Ser Leu Asp Leu Ser Val Gly Leu 255 260 265 270 agt gat gtg ctc ggg cct tcc gtg ttg gta aaa gca aga ggt gca cgg 4147 Ser Asp Val Leu Gly Pro Ser Val Leu Val Lys Ala Arg Gly Ala Arg 275 280 285 act aag ctt ttg gca cct ttc ttc tct agc agt ggg aca gcc tgc tat 4195 Thr Lys Leu Leu Ala Pro Phe Phe Ser Ser Ser Gly Thr Ala Cys Tyr 290 295 300 ccc ata gca aat gct tct cct cag gtg gcc aag ata ctc tgg agt caa 4243 Pro Ile Ala Asn Ala Ser Pro Gln Val Ala Lys Ile Leu Trp Ser Gln 305 310 315 acc gcg tgc ctg cgg agc gtt aaa atc att atc caa gca ggt acc caa 4291 Thr Ala Cys Leu Arg Ser Val Lys Ile Ile Ile Gln Ala Gly Thr Gln 320 325 330 cgc gct gtc gca gtg acc gcc gac cac gag gtt acc tct act aag ctg 4339 Arg Ala Val Ala Val Thr Ala Asp His Glu Val Thr Ser Thr Lys Leu 335 340 345 350 gag aag ggg cac acc ctt gcc aaa tac aat cct ttt aag aaa taagctgcg 4390 Glu Lys Gly His Thr Leu Ala Lys Tyr Asn Pro Phe Lys Lys 355 360 tctctgagat tgcgctccgc ccactcaccc agatcatcat gacacaaaaa actaatctgt 4450 cttgattatt tacagttagt ttacctgtct atcaagttag aaaaaacacg cgtacgggta 4510 gaagagtctg gatcccgacc ggcacattca ggacgcaat atg ggc tcc aaa ctt 4564 Met Gly Ser Lys Leu 1 5 tct acc agg att cca gca cct ctg atg ctg acc acc cgg att acg ctg 4612 Ser Thr Arg Ile Pro Ala Pro Leu Met Leu Thr Thr Arg Ile Thr Leu 10 15 20 ata ttg agc tgt atc cgt ccg aca agc tct ctt gac ggc agg cct ctt 4660 Ile Leu Ser Cys Ile Arg Pro Thr Ser Ser Leu Asp Gly Arg Pro Leu 25 30 35 gca gct gca gga att gta gta aca gga gat aag gca gtc aat gta tac 4708 Ala Ala Ala Gly Ile Val Val Thr Gly Asp Lys Ala Val Asn Val Tyr 40 45 50 acc tcg tct cag aca ggg tca atc ata gtc aag ttg ctc ccg aat atg 4756 Thr Ser Ser Gln Thr Gly Ser Ile Ile Val Lys Leu Leu Pro Asn Met 55 60 65 ccc agg gat aaa gag gcg tgt gca aaa gcc cca tta gag gca tat aac 4804 Pro Arg Asp Lys Glu Ala Cys Ala Lys Ala Pro Leu Glu Ala Tyr Asn 70 75 80 85 aga aca ctg act act ttg cta act cct ctt ggc gac tcc atc cgc aag 4852 Arg Thr Leu Thr Thr Leu Leu Thr Pro Leu Gly Asp Ser Ile Arg Lys 90 95 100 atc caa ggg tct gtg tcc acg tct gga gga ggc aga caa gca cgc ctg 4900 Ile Gln Gly Ser Val Ser Thr Ser Gly Gly Gly Arg Gln Ala Arg Leu 105 110 115 ata ggt gct gtt att ggc agt gta gct ctt ggg gtt gca aca gcg gca 4948 Ile Gly Ala Val Ile Gly Ser Val Ala Leu Gly Val Ala Thr Ala Ala 120 125 130 cag ata aca gca gcg gcc gcc cta ata caa gcc aac cag aat gcc gcc 4996 Gln Ile Thr Ala Ala Ala Ala Leu Ile Gln Ala Asn Gln Asn Ala Ala 135 140 145 aac atc ctc cgg ctt aag gag agc att gct gca acc aat gaa gct gtg 5044 Asn Ile Leu Arg Leu Lys Glu Ser Ile Ala Ala Thr Asn Glu Ala Val 150 155 160 165 cat gaa gtc acc gac gga tta tca caa cta tca gtg gca gtt ggg aag 5092 His Glu Val Thr Asp Gly Leu Ser Gln Leu Ser Val Ala Val Gly Lys 170 175 180 atg cag cag ttc gtc aat gac cag ttt aat aat aca gca cga gaa ttg 5140 Met Gln Gln Phe Val Asn Asp Gln Phe Asn Asn Thr Ala Arg Glu Leu 185 190 195 gac tgt ata aaa atc aca caa cag gtt ggt gta gag cta aac cta tac 5188 Asp Cys Ile Lys Ile Thr Gln Gln Val Gly Val Glu Leu Asn Leu Tyr 200 205 210 cta act gaa ttg act aca gta ttc ggg cca cag atc act tcc cct gca 5236 Leu Thr Glu Leu Thr Thr Val Phe Gly Pro Gln Ile Thr Ser Pro Ala 215 220 225 tta act cag ttg acc atc caa gca ctt tat aat tta gct ggt ggc aat 5284 Leu Thr Gln Leu Thr Ile Gln Ala Leu Tyr Asn Leu Ala Gly Gly Asn 230 235 240 245 atg aat tac tta tta act aag tta ggt ata ggg aac aat caa ctc agc 5332 Met Asn Tyr Leu Leu Thr Lys Leu Gly Ile Gly Asn Asn Gln Leu Ser 250 255 260 tca tta att ggt agc ggc ctg atc act ggt tac cct ata ctg tat gat 5380 Ser Leu Ile Gly Ser Gly Leu Ile Thr Gly Tyr Pro Ile Leu Tyr Asp 265 270 275 tca cag act caa ctc ttg ggc ata caa gtg aat ttg ccc tca gtc ggg 5428 Ser Gln Thr Gln Leu Leu Gly Ile Gln Val Asn Leu Pro Ser Val Gly 280 285 290 aac tta aat aat atg cgt gcc acc tat ttg gag acc tta tct gta agt 5476 Asn Leu Asn Asn Met Arg Ala Thr Tyr Leu Glu Thr Leu Ser Val Ser 295 300 305 aca acc aaa gga tat gcc tca gca ctt gtc ccg aaa gta gtg aca cag 5524 Thr Thr Lys Gly Tyr Ala Ser Ala Leu Val Pro Lys Val Val Thr Gln 310 315 320 325 gtc ggt tct gtg ata gaa gag ctc gac acc tca tac tgc ata gag tcc 5572 Val Gly Ser Val Ile Glu Glu Leu Asp Thr Ser Tyr Cys Ile Glu Ser 330 335 340 gat ctg gat tta tat tgt act aga ata gtg aca ttc ccc atg tcc cca 5620 Asp Leu Asp Leu Tyr Cys Thr Arg Ile Val Thr Phe Pro Met Ser Pro 345 350 355 ggt att tat tcc tgc ttg agc ggc aac aca tca gct tgc atg tat tca 5668 Gly Ile Tyr Ser Cys Leu Ser Gly Asn Thr Ser Ala Cys Met Tyr Ser 360 365 370 aag act gaa ggc gca ctc act acg ccg tat atg gcc ctt aaa ggc tcg 5716 Lys Thr Glu Gly Ala Leu Thr Thr Pro Tyr Met Ala Leu Lys Gly Ser 375 380 385 gtt att gcc aat tgt aag ata aca aca tgt aga tgt aca gac cct cct 5764 Val Ile Ala Asn Cys Lys Ile Thr Thr Cys Arg Cys Thr Asp Pro Pro 390 395 400 405 ggt atc ata tcg caa aat tat gga gaa gcc gta tcc ctg ata gat aga 5812 Gly Ile Ile Ser Gln Asn Tyr Gly Glu Ala Val Ser Leu Ile Asp Arg 410 415 420 cat tcg tgc aat gtc tta tca tta gac ggg ata act ctg agg ctc agt 5860 His Ser Cys Asn Val Leu Ser Leu Asp Gly Ile Thr Leu Arg Leu Ser 425 430 435 ggg gaa ttt gat gca act tat caa aag aac atc tca ata cta gat tct 5908 Gly Glu Phe Asp Ala Thr Tyr Gln Lys Asn Ile Ser Ile Leu Asp Ser 440 445 450 caa gtc atc gtg aca ggc aat ctt gat atc tca act gaa ctt gga aac 5956 Gln Val Ile Val Thr Gly Asn Leu Asp Ile Ser Thr Glu Leu Gly Asn 455 460 465 gtc aac aat tca atc agc aat gcc ttg gat agt ttg gca gaa agc aac 6004 Val Asn Asn Ser Ile Ser Asn Ala Leu Asp Ser Leu Ala Glu Ser Asn 470 475 480 485 agc aag ctg gaa aaa atc aat gtc aga cta acc agc aca tct gct ctc 6052 Ser Lys Leu Glu Lys Ile Asn Val Arg Leu Thr Ser Thr Ser Ala Leu 490 495 500 att acc tat att gtt cta act gtc att tct cta gtt ttc ggt gca ttt 6100 Ile Thr Tyr Ile Val Leu Thr Val Ile Ser Leu Val Phe Gly Ala Phe 505 510 515 agt ttg ggt tta gcg tgt tac ctg atg tac aaa cag aag gca caa caa 6148 Ser Leu Gly Leu Ala Cys Tyr Leu Met Tyr Lys Gln Lys Ala Gln Gln 520 525 530 aag acc ttg cta tgg ctt ggg aat aat acc ctc gat cag atg aga gcc 6196 Lys Thr Leu Leu Trp Leu Gly Asn Asn Thr Leu Asp Gln Met Arg Ala 535 540 545 act aca aga gca tg aatgcagata agaggtgggt atatacccaa cagcagcctg 6250 Thr Thr Arg Ala 550 tgtatcaatt ccgataacct gtcaagtaga agacttaaga aaaaactact gggaataagc 6310 aaccaaagag cactacacgg gtagaacgat cagaggagcc acccttcaat cggaaattag 6370 gcttcacaac atccgttcta ccgcatcacc aacaacaaga gtcaatc atg gac cgc 6426 Met Asp Arg 1 gcg gtt aac aga gtc gtg ctg gag aat gag gaa aga gaa gca aag aac 6474 Ala Val Asn Arg Val Val Leu Glu Asn Glu Glu Arg Glu Ala Lys Asn 5 10 15 aca tgg cgc ctg gtt ttc cgg atc gca gtt tta ctt tta atg gta atg 6522 Thr Trp Arg Leu Val Phe Arg Ile Ala Val Leu Leu Leu Met Val Met 20 25 30 35 act cta gct atc tcc tca gct gcc ctg gca tac agc acg ggg gcc agt 6570 Thr Leu Ala Ile Ser Ser Ala Ala Leu Ala Tyr Ser Thr Gly Ala Ser 40 45 50 acg ccg cac gac ctc gca agc ata ttg act gtg atc tcc aag aca gaa 6618 Thr Pro His Asp Leu Ala Ser Ile Leu Thr Val Ile Ser Lys Thr Glu 55 60 65 gat aag gtt acg tct tta ctc agt tca agt caa gac gtg ata gat agg 6666 Asp Lys Val Thr Ser Leu Leu Ser Ser Ser Gln Asp Val Ile Asp Arg 70 75 80 ata tac aag cag gtg gct ctt gaa tcc ccg ctg gca cta cta aac act 6714 Ile Tyr Lys Gln Val Ala Leu Glu Ser Pro Leu Ala Leu Leu Asn Thr 85 90 95 gaa tct gta att atg aat gca ata acc tct ctt tct tat caa att aac 6762 Glu Ser Val Ile Met Asn Ala Ile Thr Ser Leu Ser Tyr Gln Ile Asn 100 105 110 115 ggg gct gcg aac aat agc gga tgt ggg gcg cct gtt cat gac cca gat 6810 Gly Ala Ala Asn Asn Ser Gly Cys Gly Ala Pro Val His Asp Pro Asp 120 125 130 tat atc ggg ggg ata ggc aaa gaa ctc ata gtg gac gac atc agt gat 6858 Tyr Ile Gly Gly Ile Gly Lys Glu Leu Ile Val Asp Asp Ile Ser Asp 135 140 145 gtt aca tca ttt tat cct tct gca tat caa gaa cac ttg aat ttc atc 6906 Val Thr Ser Phe Tyr Pro Ser Ala Tyr Gln Glu His Leu Asn Phe Ile 150 155 160 ccg gca cct act aca gga tcc ggt tgc act cgg ata ccc tcg ttt gac 6954 Pro Ala Pro Thr Thr Gly Ser Gly Cys Thr Arg Ile Pro Ser Phe Asp 165 170 175 atg agc acc acc cat tat tgt tat act cac aat gtg ata cta tcc ggt 7002 Met Ser Thr Thr His Tyr Cys Tyr Thr His Asn Val Ile Leu Ser Gly 180 185 190 195 tgc aga gat cac tca cac tca cat caa tac tta gca ctt ggt gtg ctt 7050 Cys Arg Asp His Ser His Ser His Gln Tyr Leu Ala Leu Gly Val Leu 200 205 210 cgg aca tct gca aca ggg agg gta ttc ttt tct act ctg cgc tct atc 7098 Arg Thr Ser Ala Thr Gly Arg Val Phe Phe Ser Thr Leu Arg Ser Ile 215 220 225 aat tta gat gac acc caa aat cgg aag tcc tgc agt gtg agt gca acc 7146 Asn Leu Asp Asp Thr Gln Asn Arg Lys Ser Cys Ser Val Ser Ala Thr 230 235 240 cct tta ggt tgt gat atg ctg tgc tcc aag gtc aca ggg act gaa gag 7194 Pro Leu Gly Cys Asp Met Leu Cys Ser Lys Val Thr Gly Thr Glu Glu 245 250 255 gag gat tac aag tca gtt gcc ccc aca tca atg gtg cac gga agg cta 7242 Glu Asp Tyr Lys Ser Val Ala Pro Thr Ser Met Val His Gly Arg Leu 260 265 270 275 ggg ttt gac ggt caa tac cat gaa aag gac tta gac acc acg gtc tta 7290 Gly Phe Asp Gly Gln Tyr His Glu Lys Asp Leu Asp Thr Thr Val Leu 280 285 290 ttt aag gat tgg gtg gca aat tac cca gga gcg gga gga ggg tct ttt 7338 Phe Lys Asp Trp Val Ala Asn Tyr Pro Gly Ala Gly Gly Gly Ser Phe 295 300 305 att gac gac cgt gta tgg ttc cca gtt tac gga ggg ctc aaa ccc gat 7386 Ile Asp Asp Arg Val Trp Phe Pro Val Tyr Gly Gly Leu Lys Pro Asp 310 315 320 tca ccc agt gac act gca caa gaa ggg aaa tac gta ata tac aag cgc 7434 Ser Pro Ser Asp Thr Ala Gln Glu Gly Lys Tyr Val Ile Tyr Lys Arg 325 330 335 cat aac aac aca tgc ccc gat aaa caa gat tac caa att cgg aag gct 7482 His Asn Asn Thr Cys Pro Asp Lys Gln Asp Tyr Gln Ile Arg Lys Ala 340 345 350 355 aag tct tca tat aaa ccc ggg cga ttt ggt ggg aag cgc gta cag caa 7530 Lys Ser Ser Tyr Lys Pro Gly Arg Phe Gly Gly Lys Arg Val Gln Gln 360 365 370 gcc atc tta tcc atc aaa gtg tca aca tct ttg ggt aag gac ccg gtg 7578 Ala Ile Leu Ser Ile Lys Val Ser Thr Ser Leu Gly Lys Asp Pro Val 375 380 385 ctg act att cca cct aat aca atc aca ctc atg gga gcc gaa ggc aga 7626 Leu Thr Ile Pro Pro Asn Thr Ile Thr Leu Met Gly Ala Glu Gly Arg 390 395 400 att ctc aca gtg ggg aca tct cac ttc ttg tac caa cga ggg tct tca 7674 Ile Leu Thr Val Gly Thr Ser His Phe Leu Tyr Gln Arg Gly Ser Ser 405 410 415 tat ttc tcc cct gcc tta tta tat ccc atg aca gta aat aac aaa acg 7722 Tyr Phe Ser Pro Ala Leu Leu Tyr Pro Met Thr Val Asn Asn Lys Thr 420 425 430 435 gct aca ctc cat agt cct tat acg ttt aat gct ttc act cgg cca ggt 7770 Ala Thr Leu His Ser Pro Tyr Thr Phe Asn Ala Phe Thr Arg Pro Gly 440 445 450 agt gtc cct tgc cag gca tca gca aga tgc ccc aac tca tgc att act 7818 Ser Val Pro Cys Gln Ala Ser Ala Arg Cys Pro Asn Ser Cys Ile Thr 455 460 465 gga gtc tat act gat cca tat ccc tta atc ttc cat agg aat cat act 7866 Gly Val Tyr Thr Asp Pro Tyr Pro Leu Ile Phe His Arg Asn His Thr 470 475 480 cta cga ggg gtc ttc gga acg atg ctt gat gat gaa caa gcg aga ctt 7914 Leu Arg Gly Val Phe Gly Thr Met Leu Asp Asp Glu Gln Ala Arg Leu 485 490 495 aac ccc gta tcc gca gta ttc gac aac gta tcc cgc agt cgt gtc acc 7962 Asn Pro Val Ser Ala Val Phe Asp Asn Val Ser Arg Ser Arg Val Thr 500 505 510 515 cgg gtg agt tca agc agc acc aag gca gca tac acg aca tcg aca tgt 8010 Arg Val Ser Ser Ser Ser Thr Lys Ala Ala Tyr Thr Thr Ser Thr Cys 520 525 530 ttc aaa gtt gtc aag acc aat aaa act tat tgt ctt agt att gca gaa 8058 Phe Lys Val Val Lys Thr Asn Lys Thr Tyr Cys Leu Ser Ile Ala Glu 535 540 545 ata tcc aat acc ctg ttc ggg gaa ttt agg atc gtt ccc tta cta gtt 8106 Ile Ser Asn Thr Leu Phe Gly Glu Phe Arg Ile Val Pro Leu Leu Val 550 555 560 gag atc ctc aag gat gac ggg gtt aga gaa gcc agg tct ggc ta 8150 Glu Ile Leu Lys Asp Asp Gly Val Arg Glu Ala Arg Ser Gly 565 570 575 gttgagtcaa ttataaagga gttggaaaga tggcattgta tcacctatct tctgtgacat 8210 caagaatcaa accgaatgcc ggcgcgtgct cgaattccat gttgccagtt gaccacaatc 8270 agccagtgct catgcgatca gattaagcct tgtcaatagt ctcttgatta agaaaaaatg 8330 taagtggcaa tgagatacaa ggcaaaacag ctcatggtaa ataatacggg taggac 8386 atg gcg agc tcc ggt cct gaa agg gca gag cat cag att atc cta cca 8434 Met Ala Ser Ser Gly Pro Glu Arg Ala Glu His Gln Ile Ile Leu Pro 1 5 10 15 gag tca cac ctg tct tca cca ttg gtc aag cac aaa cta ctc tat tac 8482 Glu Ser His Leu Ser Ser Pro Leu Val Lys His Lys Leu Leu Tyr Tyr 20 25 30 tgg aaa tta act ggg cta ccg ctt cct gat gaa tgt gac ttc gac cac 8530 Trp Lys Leu Thr Gly Leu Pro Leu Pro Asp Glu Cys Asp Phe Asp His 35 40 45 ctc att ctc agc cga caa tgg aaa aaa ata ctt gaa tcg gcc tct cct 8578 Leu Ile Leu Ser Arg Gln Trp Lys Lys Ile Leu Glu Ser Ala Ser Pro 50 55 60 gat act gag aga atg ata aaa ctc gga agg gca gta cac caa act ctt 8626 Asp Thr Glu Arg Met Ile Lys Leu Gly Arg Ala Val His Gln Thr Leu 65 70 75 80 aac cac aat tcc aga ata acc gga gtg ctc cac ccc agg tgt tta gaa 8674 Asn His Asn Ser Arg Ile Thr Gly Val Leu His Pro Arg Cys Leu Glu 85 90 95 gaa ctg gct aat att gag gtc cca gat tca acc aac aaa ttt cgg aag 8722 Glu Leu Ala Asn Ile Glu Val Pro Asp Ser Thr Asn Lys Phe Arg Lys 100 105 110 att gag aag aag atc caa att cac aac acg aga tat gga gaa ctg ttc 8770 Ile Glu Lys Lys Ile Gln Ile His Asn Thr Arg Tyr Gly Glu Leu Phe 115 120 125 aca agg ctg tgt acg cat ata gag aag aaa ctg ctg ggg tca tct tgg 8818 Thr Arg Leu Cys Thr His Ile Glu Lys Lys Leu Leu Gly Ser Ser Trp 130 135 140 tct aac aat gtc ccc cgg tca gag gag ttc agc agc att cgt acg gat 8866 Ser Asn Asn Val Pro Arg Ser Glu Glu Phe Ser Ser Ile Arg Thr Asp 145 150 155 160 ccg gca ttc tgg ttt cac tca aaa tgg tcc aca gcc aag ttt gca tgg 8914 Pro Ala Phe Trp Phe His Ser Lys Trp Ser Thr Ala Lys Phe Ala Trp 165 170 175 ctc cat ata aaa cag atc cag agg cat ctg atg gtg gca gct agg aca 8962 Leu His Ile Lys Gln Ile Gln Arg His Leu Met Val Ala Ala Arg Thr 180 185 190 agg tct gcg gcc aac aaa ttg gtg atg cta acc cat aag gta ggc caa 9010 Arg Ser Ala Ala Asn Lys Leu Val Met Leu Thr His Lys Val Gly Gln 195 200 205 gtc ttt gtc act cct gaa ctt gtc gtt gtg acg cat acg aat gag aac 9058 Val Phe Val Thr Pro Glu Leu Val Val Val Thr His Thr Asn Glu Asn 210 215 220 aag ttc aca tgt ctt acc cag gaa ctt gta ttg atg tat gca gat atg 9106 Lys Phe Thr Cys Leu Thr Gln Glu Leu Val Leu Met Tyr Ala Asp Met 225 230 235 240 atg gag ggc aga gat atg gtc aac ata ata tca acc acg gcg gtg cat 9154 Met Glu Gly Arg Asp Met Val Asn Ile Ile Ser Thr Thr Ala Val His 245 250 255 ctc aga agc tta tca gag aaa att gat gac att ttg cgg tta ata gac 9202 Leu Arg Ser Leu Ser Glu Lys Ile Asp Asp Ile Leu Arg Leu Ile Asp 260 265 270 gct ctg gca aaa gac ttg ggt aat caa gtc tac gat gtc gta tca cta 9250 Ala Leu Ala Lys Asp Leu Gly Asn Gln Val Tyr Asp Val Val Ser Leu 275 280 285 atg gag gga ttt gca tac gga gct gtc cag cta ctc gag ccg tca ggt 9298 Met Glu Gly Phe Ala Tyr Gly Ala Val Gln Leu Leu Glu Pro Ser Gly 290 295 300 aca ttt gca gga gat ttc ttc gca ttc aac ctg cag gag ctt aaa gac 9346 Thr Phe Ala Gly Asp Phe Phe Ala Phe Asn Leu Gln Glu Leu Lys Asp 305 310 315 320 att cta att ggc ctc ctc ccc aat gat ata gca gaa tcc gtg act cat 9394 Ile Leu Ile Gly Leu Leu Pro Asn Asp Ile Ala Glu Ser Val Thr His 325 330 335 gca atc gct act gta ttc tct ggt tta gaa cag aat caa gca gct gag 9442 Ala Ile Ala Thr Val Phe Ser Gly Leu Glu Gln Asn Gln Ala Ala Glu 340 345 350 atg ttg tgt ctg ttg cgt ctg tgg ggt cac cca ctg ctt gag tcc cgt 9490 Met Leu Cys Leu Leu Arg Leu Trp Gly His Pro Leu Leu Glu Ser Arg 355 360 365 att gca gca aag gca gtc agg agc caa atg tgc gca ccg aaa atg gta 9538 Ile Ala Ala Lys Ala Val Arg Ser Gln Met Cys Ala Pro Lys Met Val 370 375 380 gac ttt gat atg atc ctt cag gta ctg tct ttc ttc aag gga aca atc 9586 Asp Phe Asp Met Ile Leu Gln Val Leu Ser Phe Phe Lys Gly Thr Ile 385 390 395 400 atc aac ggg tac aga aag aag aat gca ggt gtg tgg ccg cga gtc aaa 9634 Ile Asn Gly Tyr Arg Lys Lys Asn Ala Gly Val Trp Pro Arg Val Lys 405 410 415 gtg gat aca ata tat ggg aag gtc att ggg caa cta cat gca gat tca 9682 Val Asp Thr Ile Tyr Gly Lys Val Ile Gly Gln Leu His Ala Asp Ser 420 425 430 gca gag att tca cac gat atc atg tta aga gag tat aag agt tta tct 9730 Ala Glu Ile Ser His Asp Ile Met Leu Arg Glu Tyr Lys Ser Leu Ser 435 440 445 gca ctt gaa ttt gag cca tgt ata gaa tat gac cct gtc acc aac ctg 9778 Ala Leu Glu Phe Glu Pro Cys Ile Glu Tyr Asp Pro Val Thr Asn Leu 450 455 460 agc atg ttc cta aaa gac aag gca atc gca cac ccc aac gat aat tgg 9826 Ser Met Phe Leu Lys Asp Lys Ala Ile Ala His Pro Asn Asp Asn Trp 465 470 475 480 ctt gcc tcg ttt agg cgg aac ctt ctc tcc gaa gac cag aag aaa cat 9874 Leu Ala Ser Phe Arg Arg Asn Leu Leu Ser Glu Asp Gln Lys Lys His 485 490 495 gta aaa gaa gca act tcg act aat cgc ctc ttg ata gag ttt tta gag 9922 Val Lys Glu Ala Thr Ser Thr Asn Arg Leu Leu Ile Glu Phe Leu Glu 500 505 510 tca aat gat ttt gat cca tat aaa gag atg gaa tat ctg acg acc ctt 9970 Ser Asn Asp Phe Asp Pro Tyr Lys Glu Met Glu Tyr Leu Thr Thr Leu 515 520 525 gag tac ctt aga gat gac aat gtg gca gta tca tac tcg ctc aag gag 10018 Glu Tyr Leu Arg Asp Asp Asn Val Ala Val Ser Tyr Ser Leu Lys Glu 530 535 540 aag gaa gtg aaa gtt aat gga cgg atc ttc gct aag ctg aca aag aag 10066 Lys Glu Val Lys Val Asn Gly Arg Ile Phe Ala Lys Leu Thr Lys Lys 545 550 555 560 tta agg aac tgt cag gtg atg gcg gaa ggg atc cta gcc gat cag att 10114 Leu Arg Asn Cys Gln Val Met Ala Glu Gly Ile Leu Ala Asp Gln Ile 565 570 575 gca cct ttc ttt cag gga aat gga gtc att cag gat agc ata tcc ttg 10162 Ala Pro Phe Phe Gln Gly Asn Gly Val Ile Gln Asp Ser Ile Ser Leu 580 585 590 acc aag agt atg cta gcg atg agt caa ctg tct ttt aac agc aat aag 10210 Thr Lys Ser Met Leu Ala Met Ser Gln Leu Ser Phe Asn Ser Asn Lys 595 600 605 aaa cgt atc act gac tgt aaa gaa aga gta tct tca aac cgc aat cat 10258 Lys Arg Ile Thr Asp Cys Lys Glu Arg Val Ser Ser Asn Arg Asn His 610 615 620 gat ccg aaa agc aag aac cgt cgg aga gtt gca acc ttc ata aca act 10306 Asp Pro Lys Ser Lys Asn Arg Arg Arg Val Ala Thr Phe Ile Thr Thr 625 630 635 640 gac ctg caa aag tac tgt ctt aat tgg aga tat cag aca atc aaa ttg 10354 Asp Leu Gln Lys Tyr Cys Leu Asn Trp Arg Tyr Gln Thr Ile Lys Leu 645 650 655 ttc gct cat gcc atc aat cag ttg atg ggc cta cct cac ttc ttc gaa 10402 Phe Ala His Ala Ile Asn Gln Leu Met Gly Leu Pro His Phe Phe Glu 660 665 670 tgg att cac cta aga ctg atg gac act acg atg ttc gta gga gac cct 10450 Trp Ile His Leu Arg Leu Met Asp Thr Thr Met Phe Val Gly Asp Pro 675 680 685 ttc aat cct cca agt gac cct act gac tgt gac ctc tca aga gtc cct 10498 Phe Asn Pro Pro Ser Asp Pro Thr Asp Cys Asp Leu Ser Arg Val Pro 690 695 700 aat gat gac ata tat att gtc agt gcc aga ggg ggt atc gaa gga tta 10546 Asn Asp Asp Ile Tyr Ile Val Ser Ala Arg Gly Gly Ile Glu Gly Leu 705 710 715 720 tgc cag aag cta tgg aca atg atc tca att gct gca atc caa ctt gct 10594 Cys Gln Lys Leu Trp Thr Met Ile Ser Ile Ala Ala Ile Gln Leu Ala 725 730 735 gca gct aga tcg cat tgt cgt gtt gcc tgt atg gta cag ggt gat aat 10642 Ala Ala Arg Ser His Cys Arg Val Ala Cys Met Val Gln Gly Asp Asn 740 745 750 caa gta ata gca gta acg aga gag gta aga tca gac gac tct ccg gag 10690 Gln Val Ile Ala Val Thr Arg Glu Val Arg Ser Asp Asp Ser Pro Glu 755 760 765 atg gtg ttg aca cag ttg cat caa gcc agt gat aat ttc ttc aag gaa 10738 Met Val Leu Thr Gln Leu His Gln Ala Ser Asp Asn Phe Phe Lys Glu 770 775 780 tta att cat gtc aat cat ttg att ggc cat aat ttg aag gat cgt gaa 10786 Leu Ile His Val Asn His Leu Ile Gly His Asn Leu Lys Asp Arg Glu 785 790 795 800 acc atc agg tca gac aca ttc ttc ata tac agc aaa cga atc ttc aaa 10834 Thr Ile Arg Ser Asp Thr Phe Phe Ile Tyr Ser Lys Arg Ile Phe Lys 805 810 815 gat gga gca atc ctc agt caa gtc ctc aaa aat tca tct aaa tta gtg 10882 Asp Gly Ala Ile Leu Ser Gln Val Leu Lys Asn Ser Ser Lys Leu Val 820 825 830 cta gtg tca ggt gat ctc agt gaa aac acc gta atg tcc tgt gcc aac 10930 Leu Val Ser Gly Asp Leu Ser Glu Asn Thr Val Met Ser Cys Ala Asn 835 840 845 att gcc tct act gta gca cgg cta tgc gag aac ggg ctt ccc aaa gac 10978 Ile Ala Ser Thr Val Ala Arg Leu Cys Glu Asn Gly Leu Pro Lys Asp 850 855 860 ttc tgt tac tat tta aac tat ata atg agt tgt gtg cag aca tac ttt 11026 Phe Cys Tyr Tyr Leu Asn Tyr Ile Met Ser Cys Val Gln Thr Tyr Phe 865 870 875 880 gac tct gag ttc tcc atc acc aac aat tcg cac ccc gat ctt aat cag 11074 Asp Ser Glu Phe Ser Ile Thr Asn Asn Ser His Pro Asp Leu Asn Gln 885 890 895 tcg tgg att gag gac atc tct ttt gtg cac tca tat gtt ctg act cct 11122 Ser Trp Ile Glu Asp Ile Ser Phe Val His Ser Tyr Val Leu Thr Pro 900 905 910 gcc caa tta ggg gga ctg agt aac ctt caa tac tca agg ctc tac act 11170 Ala Gln Leu Gly Gly Leu Ser Asn Leu Gln Tyr Ser Arg Leu Tyr Thr 915 920 925 aga aat atc ggt gac ccg ggg act act gct ttt gca gag atc aag cga 11218 Arg Asn Ile Gly Asp Pro Gly Thr Thr Ala Phe Ala Glu Ile Lys Arg 930 935 940 cta gaa gca gtg gga tta ctg agt cct aac att atg act aat atc tta 11266 Leu Glu Ala Val Gly Leu Leu Ser Pro Asn Ile Met Thr Asn Ile Leu 945 950 955 960 act agg ccg cct ggg aat gga gat tgg gcc agt ctg tgc aac gac cca 11314 Thr Arg Pro Pro Gly Asn Gly Asp Trp Ala Ser Leu Cys Asn Asp Pro 965 970 975 tac tct ttc aat ttt gag act gtt gca agc cca aat att gtt ctt aag 11362 Tyr Ser Phe Asn Phe Glu Thr Val Ala Ser Pro Asn Ile Val Leu Lys 980 985 990 aaa cat acg caa aga gtc cta ttt gaa act tgt tca aat ccc tta ttg 11410 Lys His Thr Gln Arg Val Leu Phe Glu Thr Cys Ser Asn Pro Leu Leu 995 1000 1005 tct gga gtg cac aca gag gat aat gag gca gaa gag aag gca ttg gct 11458 Ser Gly Val His Thr Glu Asp Asn Glu Ala Glu Glu Lys Ala Leu Ala 1010 1015 1020 gaa ttc ttg ctt aat caa gag gtg att cat ccc cgc gtt gcg cat gcc 11506 Glu Phe Leu Leu Asn Gln Glu Val Ile His Pro Arg Val Ala His Ala 1025 1030 1035 1040 atc atg gag gca agc tct gta ggt agg aga aag caa att caa ggg ctt 11554 Ile Met Glu Ala Ser Ser Val Gly Arg Arg Lys Gln Ile Gln Gly Leu 1045 1050 1055 gtt gac aca aca aac acc gta att aag att gcg ctt act agg agg cca 11602 Val Asp Thr Thr Asn Thr Val Ile Lys Ile Ala Leu Thr Arg Arg Pro 1060 1065 1070 tta ggc atc aag agg ctg atg cgg ata gtc aat tat tct agc atg cat 11650 Leu Gly Ile Lys Arg Leu Met Arg Ile Val Asn Tyr Ser Ser Met His 1075 1080 1085 gca atg ctg ttt aga gac gat gtt ttt tcc tcc agt aga tcc aac cac 11698 Ala Met Leu Phe Arg Asp Asp Val Phe Ser Ser Ser Arg Ser Asn His 1090 1095 1100 ccc tta gtc tct tct aat atg tgt tct ctg aca ctg gca gac tat gca 11746 Pro Leu Val Ser Ser Asn Met Cys Ser Leu Thr Leu Ala Asp Tyr Ala 1105 1110 1115 1120 cgg aat aga agc tgg tca cct ttg acg gga ggc agg aaa ata ctg ggt 11794 Arg Asn Arg Ser Trp Ser Pro Leu Thr Gly Gly Arg Lys Ile Leu Gly 1125 1130 1135 gta tct aat cct gat acg ata gaa ctc gta gag ggt gag att ctt agt 11842 Val Ser Asn Pro Asp Thr Ile Glu Leu Val Glu Gly Glu Ile Leu Ser 1140 1145 1150 gta agc gga ggg tgt aca aga tgt gac agc gga gat gaa caa ttt act 11890 Val Ser Gly Gly Cys Thr Arg Cys Asp Ser Gly Asp Glu Gln Phe Thr 1155 1160 1165 tgg ttc cat ctt cca agc aat ata gaa ttg acc gat gac acc agc aag 11938 Trp Phe His Leu Pro Ser Asn Ile Glu Leu Thr Asp Asp Thr Ser Lys 1170 1175 1180 aat cct ccg atg agg gta cca tat ctc ggg tca aag aca cag gag agg 11986 Asn Pro Pro Met Arg Val Pro Tyr Leu Gly Ser Lys Thr Gln Glu Arg 1185 1190 1195 1200 aga gct gcc tca ctt gca aaa ata gct cat atg tcg cca cat gta aag 12034 Arg Ala Ala Ser Leu Ala Lys Ile Ala His Met Ser Pro His Val Lys 1205 1210 1215 gct gcc cta agg gca tca tcc gtg ttg atc tgg gct tat ggg gat aat 12082 Ala Ala Leu Arg Ala Ser Ser Val Leu Ile Trp Ala Tyr Gly Asp Asn 1220 1225 1230 gaa gta aat tgg act gct gct ctt acg att gca aaa tct cgg tgt aat 12130 Glu Val Asn Trp Thr Ala Ala Leu Thr Ile Ala Lys Ser Arg Cys Asn 1235 1240 1245 gta aac tta gag tat ctt cgg tta ctg tcc cct tta ccc acg gct ggg 12178 Val Asn Leu Glu Tyr Leu Arg Leu Leu Ser Pro Leu Pro Thr Ala Gly 1250 1255 1260 aat ctt caa cat aga cta gat gat ggt ata act cag atg aca ttc acc 12226 Asn Leu Gln His Arg Leu Asp Asp Gly Ile Thr Gln Met Thr Phe Thr 1265 1270 1275 1280 cct gca tct ctc tac agg gtg tca cct tac att cac ata tcc aat gat 12274 Pro Ala Ser Leu Tyr Arg Val Ser Pro Tyr Ile His Ile Ser Asn Asp 1285 1290 1295 tct caa agg ctg ttc act gaa gaa gga gtc aaa gag ggg aat gtg gtt 12322 Ser Gln Arg Leu Phe Thr Glu Glu Gly Val Lys Glu Gly Asn Val Val 1300 1305 1310 tac caa cag atc atg ctc ttg ggt tta tct cta atc gaa tcg ata ttt 12370 Tyr Gln Gln Ile Met Leu Leu Gly Leu Ser Leu Ile Glu Ser Ile Phe 1315 1320 1325 cca atg aca aca acc agg aca tat gat gag atc aca ctg cac cta cat 12418 Pro Met Thr Thr Thr Arg Thr Tyr Asp Glu Ile Thr Leu His Leu His 1330 1335 1340 agt aaa ttt agt tgc tgt atc aga gaa gca cct gtt gcg gtt cct ttc 12466 Ser Lys Phe Ser Cys Cys Ile Arg Glu Ala Pro Val Ala Val Pro Phe 1345 1350 1355 1360 gag cta ctt ggg gtg gta ccg gaa ctg agg aca gtg acc tca aat aag 12514 Glu Leu Leu Gly Val Val Pro Glu Leu Arg Thr Val Thr Ser Asn Lys 1365 1370 1375 ttt atg tat gat cct agc cct gta tcg gag gga gac ttt gcg aga ctt 12562 Phe Met Tyr Asp Pro Ser Pro Val Ser Glu Gly Asp Phe Ala Arg Leu 1380 1385 1390 gac tta gct atc ttc aag agt tat gag ctt aat ctg gag tca tat ccc 12610 Asp Leu Ala Ile Phe Lys Ser Tyr Glu Leu Asn Leu Glu Ser Tyr Pro 1395 1400 1405 acg ata gag cta atg aac att ctt tca ata tcc agc ggg aag ttg att 12658 Thr Ile Glu Leu Met Asn Ile Leu Ser Ile Ser Ser Gly Lys Leu Ile 1410 1415 1420 ggc cag tct gtg gtt tct tat gat gaa gat acc tcc ata aag aat gac 12706 Gly Gln Ser Val Val Ser Tyr Asp Glu Asp Thr Ser Ile Lys Asn Asp 1425 1430 1435 1440 gcc ata ata gtg tat gac aat acc cga aat tgg atc agt gaa gct cag 12754 Ala Ile Ile Val Tyr Asp Asn Thr Arg Asn Trp Ile Ser Glu Ala Gln 1445 1450 1455 aat tca gat gtg gtc cgc cta ttt gaa tat gca gca ctt gaa gtg ctc 12802 Asn Ser Asp Val Val Arg Leu Phe Glu Tyr Ala Ala Leu Glu Val Leu 1460 1465 1470 ctc gac tgt tct tac caa ctc tat tac ctg aga gta aga ggc cta gac 12850 Leu Asp Cys Ser Tyr Gln Leu Tyr Tyr Leu Arg Val Arg Gly Leu Asp 1475 1480 1485 aat att gtc tta tat atg ggt gat tta tac aag aat atg cca gga att 12898 Asn Ile Val Leu Tyr Met Gly Asp Leu Tyr Lys Asn Met Pro Gly Ile 1490 1495 1500 cta ctt tcc aac att gca gct aca ata tct cat ccc gtc att cat tca 12946 Leu Leu Ser Asn Ile Ala Ala Thr Ile Ser His Pro Val Ile His Ser 1505 1510 1515 1520 agg tta cat gca gtg ggc ctg gtc aac cat gac gga tca cac caa ctt 12994 Arg Leu His Ala Val Gly Leu Val Asn His Asp Gly Ser His Gln Leu 1525 1530 1535 gca gat acg gat ttt atc gaa atg tct gca aaa cta tta gta tct tgc 13042 Ala Asp Thr Asp Phe Ile Glu Met Ser Ala Lys Leu Leu Val Ser Cys 1540 1545 1550 acc cga cgt gtg atc tcc ggc tta tat tca gga aat aag tat gat ctg 13090 Thr Arg Arg Val Ile Ser Gly Leu Tyr Ser Gly Asn Lys Tyr Asp Leu 1555 1560 1565 ctg ttc cca tct gtc tta gat gat aac ctg aat gag aag atg ctt cag 13138 Leu Phe Pro Ser Val Leu Asp Asp Asn Leu Asn Glu Lys Met Leu Gln 1570 1575 1580 ctg ata tcc cgg tta tgc tgt ctg tac acg gta ctc ttt gct aca aca 13186 Leu Ile Ser Arg Leu Cys Cys Leu Tyr Thr Val Leu Phe Ala Thr Thr 1585 1590 1595 1600 aga gaa atc ccg aaa ata aga ggc tta act gca gaa gag aaa tgt tca 13234 Arg Glu Ile Pro Lys Ile Arg Gly Leu Thr Ala Glu Glu Lys Cys Ser 1605 1610 1615 ata ctc act gag tat tta ctg tcg gat gct gtg aaa cca tta ctt agc 13282 Ile Leu Thr Glu Tyr Leu Leu Ser Asp Ala Val Lys Pro Leu Leu Ser 1620 1625 1630 ccc gat caa gtg agc tct atc atg tct cct aac ata att aca ttc cca 13330 Pro Asp Gln Val Ser Ser Ile Met Ser Pro Asn Ile Ile Thr Phe Pro 1635 1640 1645 gct aat ctg tac tac atg tct cgg aag agc ctc aat ttg atc agg gaa 13378 Ala Asn Leu Tyr Tyr Met Ser Arg Lys Ser Leu Asn Leu Ile Arg Glu 1650 1655 1660 agg gag gac agg gat act atc ctg gcg ttg ttg ttc ccc caa gag cca 13426 Arg Glu Asp Arg Asp Thr Ile Leu Ala Leu Leu Phe Pro Gln Glu Pro 1665 1670 1675 1680 tta tta gag ttc cct tct gtg caa gat att ggt gct cga gtg aaa gat 13474 Leu Leu Glu Phe Pro Ser Val Gln Asp Ile Gly Ala Arg Val Lys Asp 1685 1690 1695 cca ttc acc cga caa cct gcg gca ttt ttg caa gag tta gat ttg agt 13522 Pro Phe Thr Arg Gln Pro Ala Ala Phe Leu Gln Glu Leu Asp Leu Ser 1700 1705 1710 gct cca gca agg tat gac gca ttc aca ctt agt cag att cat cct gaa 13570 Ala Pro Ala Arg Tyr Asp Ala Phe Thr Leu Ser Gln Ile His Pro Glu 1715 1720 1725 ctc aca tct cca aat ccg gag gaa gac tac tta gta cga tac ttg ttc 13618 Leu Thr Ser Pro Asn Pro Glu Glu Asp Tyr Leu Val Arg Tyr Leu Phe 1730 1735 1740 aga ggg ata ggg act gca tct tcc tct tgg tat aag gca tcc cat ctc 13666 Arg Gly Ile Gly Thr Ala Ser Ser Ser Trp Tyr Lys Ala Ser His Leu 1745 1750 1755 1760 ctt tct gta ccc gag gta aga tgt gca aga cac ggg aac tcc tta tac 13714 Leu Ser Val Pro Glu Val Arg Cys Ala Arg His Gly Asn Ser Leu Tyr 1765 1770 1775 tta gct gaa ggg agc gga gcc atc atg agt ctt ctc gaa ctg cat gta 13762 Leu Ala Glu Gly Ser Gly Ala Ile Met Ser Leu Leu Glu Leu His Val 1780 1785 1790 cca cat gaa act atc tat tac aat acg ctc ttt tca aat gag atg aac 13810 Pro His Glu Thr Ile Tyr Tyr Asn Thr Leu Phe Ser Asn Glu Met Asn 1795 1800 1805 ccc ccg caa cga cat ttc ggg ccg acc cca act cag ttt ttg aat tcg 13858 Pro Pro Gln Arg His Phe Gly Pro Thr Pro Thr Gln Phe Leu Asn Ser 1810 1815 1820 gtt gtt tat agg aat cta cag gcg gag gta aca tgc aaa gat gga ttt 13906 Val Val Tyr Arg Asn Leu Gln Ala Glu Val Thr Cys Lys Asp Gly Phe 1825 1830 1835 1840 gtc caa gag ttc cgt cca tta tgg aga gaa aat aca gag gaa agt gac 13954 Val Gln Glu Phe Arg Pro Leu Trp Arg Glu Asn Thr Glu Glu Ser Asp 1845 1850 1855 ctg acc tca gat aaa gca gtg ggg tat att aca tct gca gtg ccc tac 14002 Leu Thr Ser Asp Lys Ala Val Gly Tyr Ile Thr Ser Ala Val Pro Tyr 1860 1865 1870 aga tct gta tca ttg ctg cat tgt gac att gaa att cct cca ggg tcc 14050 Arg Ser Val Ser Leu Leu His Cys Asp Ile Glu Ile Pro Pro Gly Ser 1875 1880 1885 aat caa agc tta cta gat caa cta gct atc aat tta tct ctg att gcc 14098 Asn Gln Ser Leu Leu Asp Gln Leu Ala Ile Asn Leu Ser Leu Ile Ala 1890 1895 1900 atg cat tct gta agg gag ggc ggg gta gta atc atc aaa gtg ttg tat 14146 Met His Ser Val Arg Glu Gly Gly Val Val Ile Ile Lys Val Leu Tyr 1905 1910 1915 1920 gca atg gga tac tac ttt cat cta ctc atg aac ttg ttt gct ccg tgt 14194 Ala Met Gly Tyr Tyr Phe His Leu Leu Met Asn Leu Phe Ala Pro Cys 1925 1930 1935 tcc aca aaa gga tat att ctc tct aat ggt tat gca tgt cga gga gat 14242 Ser Thr Lys Gly Tyr Ile Leu Ser Asn Gly Tyr Ala Cys Arg Gly Asp 1940 1945 1950 atg gag tgt tac ctg gta ttt gtc atg ggt tac ctg ggc ggg cct aca 14290 Met Glu Cys Tyr Leu Val Phe Val Met Gly Tyr Leu Gly Gly Pro Thr 1955 1960 1965 ttt gta cat gag gtg gtg agg atg gca aaa act ctg gtg cag cgg cac 14338 Phe Val His Glu Val Val Arg Met Ala Lys Thr Leu Val Gln Arg His 1970 1975 1980 ggt acg ctt ttg tct aaa tca gat gag atc aca ctg acc agg tta ttc 14386 Gly Thr Leu Leu Ser Lys Ser Asp Glu Ile Thr Leu Thr Arg Leu Phe 1985 1990 1995 2000 acc tca cag cgg cag cgt gtg aca gac atc cta tcc agt cct tta cca 14434 Thr Ser Gln Arg Gln Arg Val Thr Asp Ile Leu Ser Ser Pro Leu Pro 2005 2010 2015 aga tta ata aag tac ttg agg aag aat att gac act gcg ctg att gaa 14482 Arg Leu Ile Lys Tyr Leu Arg Lys Asn Ile Asp Thr Ala Leu Ile Glu 2020 2025 2030 gcc ggg gga cag ccc gtc cgt cca ttc tgt gcg gag agt ctg gtg agc 14530 Ala Gly Gly Gln Pro Val Arg Pro Phe Cys Ala Glu Ser Leu Val Ser 2035 2040 2045 acg cta gcg aac ata act cag ata acc cag atc atc gct agt cac att 14578 Thr Leu Ala Asn Ile Thr Gln Ile Thr Gln Ile Ile Ala Ser His Ile 2050 2055 2060 gac aca gtt atc cgg tct gtg ata tat atg gaa gct gag ggt gat ctc 14626 Asp Thr Val Ile Arg Ser Val Ile Tyr Met Glu Ala Glu Gly Asp Leu 2065 2070 2075 2080 gct gac aca gta ttt cta ttt acc cct tac aat ctc tct act gac ggg 14674 Ala Asp Thr Val Phe Leu Phe Thr Pro Tyr Asn Leu Ser Thr Asp Gly 2085 2090 2095 aaa aag agg aca tca ctt aaa cag tgc acg aga cag atc cta gag gtt 14722 Lys Lys Arg Thr Ser Leu Lys Gln Cys Thr Arg Gln Ile Leu Glu Val 2100 2105 2110 aca ata cta ggt ctt aga gtc gaa aat ctc aat aaa ata ggc gat ata 14770 Thr Ile Leu Gly Leu Arg Val Glu Asn Leu Asn Lys Ile Gly Asp Ile 2115 2120 2125 atc agc cta gtg ctt aaa ggc atg atc tcc atg gag gac ctt atc cca 14818 Ile Ser Leu Val Leu Lys Gly Met Ile Ser Met Glu Asp Leu Ile Pro 2130 2135 2140 cta agg aca tac ttg aag cat agt acc tgc cct aaa tat ttg aag gct 14866 Leu Arg Thr Tyr Leu Lys His Ser Thr Cys Pro Lys Tyr Leu Lys Ala 2145 2150 2155 2160 gtc cta ggt att acc aaa ctc aaa gaa atg ttt aca gac act tct gta 14914 Val Leu Gly Ile Thr Lys Leu Lys Glu Met Phe Thr Asp Thr Ser Val 2165 2170 2175 ctg tac ttg act cgt gct caa caa aaa ttc tac atg aaa act ata ggc 14962 Leu Tyr Leu Thr Arg Ala Gln Gln Lys Phe Tyr Met Lys Thr Ile Gly 2180 2185 2190 aat gca gtc aaa gga tat tac agt aac tgt gac tct ta acgaaaatca 15010 Asn Ala Val Lys Gly Tyr Tyr Ser Asn Cys Asp Ser 2195 2200 catattaata ggctcctttt ttggccaatt gtattcttgt tgatttaatc atattatgtt 15070 agaaaaaagt tgaaccctga ctccttagga ctcgaattcg aactcaaata aatgtcttaa 15130 aaaaaggttg cgcacaatta ttcttgagtg tagtctcgtc attcaccaaa tctttgtttg 15190 gtgggtcggc atggcatctc cacctcctcg cggtccgacc tgggcatccg aaggaggacg 15250 tcgtccactc ggatggctaa gggagagctc ggatccggct gctaacaaag cccgaaagga 15310 agctgagttg gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa 15370 acgggtcttg aggggttttt tgcatatgcg gtgtgaaata ccgcacagat gcgtaaggag 15430 aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 15490 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 15550 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 15610 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 15670 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 15730 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 15790 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 15850 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 15910 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 15970 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 16030 agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 16090 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 16150 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 16210 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 16270 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 16330 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 16390 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 16450 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 16510 cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 16570 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 16630 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 16690 cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 16750 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 16810 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 16870 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 16930 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 16990 ctcttgcccg gcgtcaacac gggataatac cgcgccacat agcagaactt taaaagtgct 17050 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 17110 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 17170 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 17230 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 17290 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 17350 tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 17410 attaacctat aaaaataggc gtatcacgag gccctttcgt cttcaagaat tctaatacga 17470 ctcactatag g 17481 <210> 2 <211> 489 <212> PRT <213> Artificial Sequence <400> 2 Met Ser Ser Val Phe Asp Glu Tyr Glu Gln Leu Leu Ala Ala Gln Thr 1 5 10 15 Arg Pro Asn Gly Ala His Gly Gly Gly Glu Lys Gly Ser Thr Leu Lys 20 25 30 Val Asp Val Pro Val Phe Thr Leu Asn Ser Asp Asp Pro Glu Asp Arg 35 40 45 Trp Ser Phe Val Val Phe Cys Leu Arg Ile Ala Val Ser Glu Asp Ala 50 55 60 Asn Lys Pro Leu Arg Gln Gly Ala Leu Ile Ser Leu Leu Cys Ser His 65 70 75 80 Ser Gln Val Met Arg Asn His Val Ala Ile Ala Gly Lys Gln Asn Glu 85 90 95 Ala Thr Leu Ala Val Leu Glu Ile Asp Gly Phe Ala Asn Gly Thr Pro 100 105 110 Gln Phe Asn Asn Arg Ser Gly Val Ser Glu Glu Arg Ala Gln Arg Phe 115 120 125 Ala Met Ile Ala Gly Ser Leu Pro Arg Ala Cys Ser Asn Gly Thr Pro 130 135 140 Phe Val Thr Ala Gly Ala Glu Asp Asp Ala Pro Glu Asp Ile Thr Asp 145 150 155 160 Thr Leu Glu Arg Ile Leu Ser Ile Gln Ala Gln Val Trp Val Thr Val 165 170 175 Ala Lys Ala Met Thr Ala Tyr Glu Thr Ala Asp Glu Ser Glu Thr Arg 180 185 190 Arg Ile Asn Lys Tyr Met Gln Gln Gly Arg Val Gln Lys Lys Tyr Ile 195 200 205 Leu Tyr Pro Val Cys Arg Ser Thr Ile Gln Leu Thr Ile Arg Gln Ser 210 215 220 Leu Ala Val Arg Ile Phe Leu Val Ser Glu Leu Lys Arg Gly Arg Asn 225 230 235 240 Thr Ala Gly Gly Thr Ser Thr Tyr Tyr Asn Leu Val Gly Asp Val Asp 245 250 255 Ser Tyr Ile Arg Asn Thr Gly Leu Thr Ala Phe Phe Leu Thr Leu Lys 260 265 270 Tyr Gly Ile Asn Thr Lys Thr Ser Ala Leu Ala Leu Ser Ser Leu Ser 275 280 285 Gly Asp Ile Gln Lys Met Lys Gln Leu Met Arg Leu Tyr Arg Met Lys 290 295 300 Gly Asp Asn Ala Pro Tyr Met Thr Leu Leu Gly Asp Ser Asp Gln Met 305 310 315 320 Ser Phe Ala Pro Ala Glu Tyr Ala Gln Leu Tyr Ser Phe Ala Met Gly 325 330 335 Met Ala Ser Val Leu Asp Lys Gly Thr Gly Lys Tyr Gln Phe Ala Arg 340 345 350 Asp Phe Met Ser Thr Ser Phe Trp Arg Leu Gly Val Glu Tyr Ala Gln 355 360 365 Ala Gln Gly Ser Ser Ile Asn Glu Asp Met Ala Ala Glu Leu Lys Leu 370 375 380 Thr Pro Ala Ala Met Lys Gly Leu Ala Ala Ala Ala Gln Arg Val Ser 385 390 395 400 Asp Asp Thr Ser Ser Ile Tyr Met Pro Thr Gln Gln Val Gly Val Leu 405 410 415 Thr Gly Leu Ser Glu Gly Gly Ser Gln Ala Leu Gln Gly Gly Ser Asn 420 425 430 Arg Ser Gln Gly Gln Pro Glu Ala Gly Asp Gly Glu Thr Gln Phe Leu 435 440 445 Asp Leu Met Arg Ala Val Ala Asn Ser Met Arg Glu Ala Pro Asn Ser 450 455 460 Ala Gln Gly Thr Pro Gln Ser Gly Pro Pro Pro Thr Pro Gly Pro Ser 465 470 475 480 Gln Asp Asn Asp Thr Asp Trp Gly Tyr 485 <210> 3 <211> 395 <212> PRT <213> Artificial Sequence <400> 3 Met Ala Thr Phe Thr Asp Ala Glu Ile Asp Glu Leu Phe Glu Thr Ser 1 5 10 15 Gly Thr Val Ile Asp Asn Ile Ile Thr Ala Gln Gly Lys Pro Ala Glu 20 25 30 Thr Val Gly Arg Ser Ala Ile Pro Gln Gly Lys Thr Lys Val Leu Ser 35 40 45 Ala Ala Trp Glu Lys His Gly Ser Ile Gln Pro Pro Ala Ser Gln Asp 50 55 60 Asn Pro Asp Arg Gln Asp Arg Ser Asp Lys Gln Pro Ser Thr Pro Glu 65 70 75 80 Gln Thr Thr Pro His Asp Ser Pro Pro Ala Thr Ser Ala Asp Gln Pro 85 90 95 Pro Thr Gln Ala Thr Asp Glu Ala Val Asp Thr Gln Phe Arg Thr Gly 100 105 110 Ala Ser Asn Ser Leu Leu Leu Met Leu Asp Lys Leu Ser Asn Lys Ser 115 120 125 Ser Asn Ala Lys Lys Gly Pro Trp Ser Ser Pro Gln Glu Gly Asn His 130 135 140 Gln Arg Pro Thr Gln Gln Gln Gly Ser Gln Pro Ser Arg Gly Asn Ser 145 150 155 160 Gln Glu Arg Pro Gln Asn Gln Val Lys Ala Ala Pro Gly Asn Gln Gly 165 170 175 Thr Asp Val Asn Thr Ala Tyr His Gly Gln Trp Glu Glu Ser Gln Leu 180 185 190 Ser Ala Gly Ala Thr Pro His Ala Leu Arg Ser Arg Gln Ser Gln Asp 195 200 205 Asn Thr Leu Val Ser Ala Asp His Val Gln Pro Pro Val Asp Phe Val 210 215 220 Gln Ala Met Met Ser Met Met Glu Ala Ile Ser Gln Arg Val Ser Lys 225 230 235 240 Val Asp Tyr Gln Leu Asp Leu Val Leu Lys Gln Thr Ser Ser Ile Pro 245 250 255 Met Met Arg Ser Glu Ile Gln Gln Leu Lys Thr Ser Val Ala Val Met 260 265 270 Glu Ala Asn Leu Gly Met Met Lys Ile Leu Asp Pro Gly Cys Ala Asn 275 280 285 Ile Ser Ser Leu Ser Asp Leu Arg Ala Val Ala Arg Ser His Pro Val 290 295 300 Leu Val Ser Gly Pro Gly Asp Pro Ser Pro Tyr Val Thr Gln Gly Gly 305 310 315 320 Glu Met Ala Leu Asn Lys Leu Ser Gln Pro Val Pro His Pro Ser Glu 325 330 335 Leu Ile Lys Pro Ala Thr Ala Cys Gly Pro Asp Ile Gly Val Glu Lys 340 345 350 Asp Thr Val Arg Ala Leu Ile Met Ser Arg Pro Met His Pro Ser Ser 355 360 365 Ser Ala Lys Leu Leu Ser Lys Leu Asp Ala Ala Gly Ser Ile Glu Glu 370 375 380 Ile Arg Lys Ile Lys Arg Leu Ala Leu Asn Gly 385 390 395 <210> 4 <211> 364 <212> PRT <213> Artificial Sequence <400> 4 Met Asp Ser Ser Arg Thr Ile Gly Leu Tyr Phe Asp Ser Ala His Ser 1 5 10 15 Ser Ser Asn Leu Leu Ala Phe Pro Ile Val Leu Gln Asp Thr Gly Asp 20 25 30 Gly Lys Lys Gln Ile Ala Pro Gln Tyr Arg Ile Gln Arg Leu Asp Leu 35 40 45 Trp Thr Asp Ser Lys Glu Asp Ser Val Phe Ile Thr Thr Tyr Gly Phe 50 55 60 Ile Phe Gln Val Gly Asn Glu Glu Ala Thr Val Gly Met Ile Asp Asp 65 70 75 80 Lys Pro Lys Arg Glu Leu Leu Ser Ala Ala Met Leu Cys Leu Gly Ser 85 90 95 Val Pro Asn Thr Gly Asp Leu Ile Glu Leu Ala Arg Ala Cys Leu Thr 100 105 110 Met Ile Val Thr Cys Lys Lys Ser Ala Thr Asn Thr Glu Arg Met Val 115 120 125 Phe Ser Val Val Gln Ala Pro Gln Val Leu Gln Ser Cys Arg Val Val 130 135 140 Ala Asn Lys Tyr Ser Ser Val Asn Ala Val Lys His Val Lys Ala Pro 145 150 155 160 Glu Lys Ile Pro Gly Ser Gly Thr Leu Glu Tyr Lys Val Asn Phe Val 165 170 175 Ser Leu Thr Val Val Pro Lys Lys Asp Val Tyr Lys Ile Pro Ala Ala 180 185 190 Val Leu Lys Val Ser Gly Ser Ser Leu Tyr Asn Leu Ala Leu Asn Val 195 200 205 Thr Ile Asn Val Glu Val Asp Pro Arg Ser Pro Leu Val Lys Ser Leu 210 215 220 Ser Lys Ser Asp Ser Gly Tyr Tyr Ala Asn Leu Phe Leu His Ile Gly 225 230 235 240 Leu Met Thr Thr Val Asp Arg Lys Gly Lys Lys Val Thr Phe Asp Lys 245 250 255 Leu Glu Lys Lys Ile Arg Ser Leu Asp Leu Ser Val Gly Leu Ser Asp 260 265 270 Val Leu Gly Pro Ser Val Leu Val Lys Ala Arg Gly Ala Arg Thr Lys 275 280 285 Leu Leu Ala Pro Phe Phe Ser Ser Ser Gly Thr Ala Cys Tyr Pro Ile 290 295 300 Ala Asn Ala Ser Pro Gln Val Ala Lys Ile Leu Trp Ser Gln Thr Ala 305 310 315 320 Cys Leu Arg Ser Val Lys Ile Ile Ile Gln Ala Gly Thr Gln Arg Ala 325 330 335 Val Ala Val Thr Ala Asp His Glu Val Thr Ser Thr Lys Leu Glu Lys 340 345 350 Gly His Thr Leu Ala Lys Tyr Asn Pro Phe Lys Lys 355 360 <210> 5 <211> 553 <212> PRT <213> Artificial Sequence <400> 5 Met Gly Ser Lys Leu Ser Thr Arg Ile Pro Ala Pro Leu Met Leu Thr 1 5 10 15 Thr Arg Ile Thr Leu Ile Leu Ser Cys Ile Arg Pro Thr Ser Ser Leu 20 25 30 Asp Gly Arg Pro Leu Ala Ala Ala Gly Ile Val Val Thr Gly Asp Lys 35 40 45 Ala Val Asn Val Tyr Thr Ser Ser Gln Thr Gly Ser Ile Ile Val Lys 50 55 60 Leu Leu Pro Asn Met Pro Arg Asp Lys Glu Ala Cys Ala Lys Ala Pro 65 70 75 80 Leu Glu Ala Tyr Asn Arg Thr Leu Thr Thr Leu Leu Thr Pro Leu Gly 85 90 95 Asp Ser Ile Arg Lys Ile Gln Gly Ser Val Ser Thr Ser Gly Gly Gly 100 105 110 Arg Gln Ala Arg Leu Ile Gly Ala Val Ile Gly Ser Val Ala Leu Gly 115 120 125 Val Ala Thr Ala Ala Gln Ile Thr Ala Ala Ala Ala Leu Ile Gln Ala 130 135 140 Asn Gln Asn Ala Ala Asn Ile Leu Arg Leu Lys Glu Ser Ile Ala Ala 145 150 155 160 Thr Asn Glu Ala Val His Glu Val Thr Asp Gly Leu Ser Gln Leu Ser 165 170 175 Val Ala Val Gly Lys Met Gln Gln Phe Val Asn Asp Gln Phe Asn Asn 180 185 190 Thr Ala Arg Glu Leu Asp Cys Ile Lys Ile Thr Gln Gln Val Gly Val 195 200 205 Glu Leu Asn Leu Tyr Leu Thr Glu Leu Thr Thr Val Phe Gly Pro Gln 210 215 220 Ile Thr Ser Pro Ala Leu Thr Gln Leu Thr Ile Gln Ala Leu Tyr Asn 225 230 235 240 Leu Ala Gly Gly Asn Met Asn Tyr Leu Leu Thr Lys Leu Gly Ile Gly 245 250 255 Asn Asn Gln Leu Ser Ser Leu Ile Gly Ser Gly Leu Ile Thr Gly Tyr 260 265 270 Pro Ile Leu Tyr Asp Ser Gln Thr Gln Leu Leu Gly Ile Gln Val Asn 275 280 285 Leu Pro Ser Val Gly Asn Leu Asn Asn Met Arg Ala Thr Tyr Leu Glu 290 295 300 Thr Leu Ser Val Ser Thr Thr Lys Gly Tyr Ala Ser Ala Leu Val Pro 305 310 315 320 Lys Val Val Thr Gln Val Gly Ser Val Ile Glu Glu Leu Asp Thr Ser 325 330 335 Tyr Cys Ile Glu Ser Asp Leu Asp Leu Tyr Cys Thr Arg Ile Val Thr 340 345 350 Phe Pro Met Ser Pro Gly Ile Tyr Ser Cys Leu Ser Gly Asn Thr Ser 355 360 365 Ala Cys Met Tyr Ser Lys Thr Glu Gly Ala Leu Thr Thr Pro Tyr Met 370 375 380 Ala Leu Lys Gly Ser Val Ile Ala Asn Cys Lys Ile Thr Thr Cys Arg 385 390 395 400 Cys Thr Asp Pro Pro Gly Ile Ile Ser Gln Asn Tyr Gly Glu Ala Val 405 410 415 Ser Leu Ile Asp Arg His Ser Cys Asn Val Leu Ser Leu Asp Gly Ile 420 425 430 Thr Leu Arg Leu Ser Gly Glu Phe Asp Ala Thr Tyr Gln Lys Asn Ile 435 440 445 Ser Ile Leu Asp Ser Gln Val Ile Val Thr Gly Asn Leu Asp Ile Ser 450 455 460 Thr Glu Leu Gly Asn Val Asn Asn Ser Ile Ser Asn Ala Leu Asp Ser 465 470 475 480 Leu Ala Glu Ser Asn Ser Lys Leu Glu Lys Ile Asn Val Arg Leu Thr 485 490 495 Ser Thr Ser Ala Leu Ile Thr Tyr Ile Val Leu Thr Val Ile Ser Leu 500 505 510 Val Phe Gly Ala Phe Ser Leu Gly Leu Ala Cys Tyr Leu Met Tyr Lys 515 520 525 Gln Lys Ala Gln Gln Lys Thr Leu Leu Trp Leu Gly Asn Asn Thr Leu 530 535 540 Asp Gln Met Arg Ala Thr Thr Arg Ala 545 550 <210> 6 <211> 577 <212> PRT <213> Artificial Sequence <400> 6 Met Asp Arg Ala Val Asn Arg Val Val Leu Glu Asn Glu Glu Arg Glu 1 5 10 15 Ala Lys Asn Thr Trp Arg Leu Val Phe Arg Ile Ala Val Leu Leu Leu 20 25 30 Met Val Met Thr Leu Ala Ile Ser Ser Ala Ala Leu Ala Tyr Ser Thr 35 40 45 Gly Ala Ser Thr Pro His Asp Leu Ala Ser Ile Leu Thr Val Ile Ser 50 55 60 Lys Thr Glu Asp Lys Val Thr Ser Leu Leu Ser Ser Ser Gln Asp Val 65 70 75 80 Ile Asp Arg Ile Tyr Lys Gln Val Ala Leu Glu Ser Pro Leu Ala Leu 85 90 95 Leu Asn Thr Glu Ser Val Ile Met Asn Ala Ile Thr Ser Leu Ser Tyr 100 105 110 Gln Ile Asn Gly Ala Ala Asn Asn Ser Gly Cys Gly Ala Pro Val His 115 120 125 Asp Pro Asp Tyr Ile Gly Gly Ile Gly Lys Glu Leu Ile Val Asp Asp 130 135 140 Ile Ser Asp Val Thr Ser Phe Tyr Pro Ser Ala Tyr Gln Glu His Leu 145 150 155 160 Asn Phe Ile Pro Ala Pro Thr Thr Gly Ser Gly Cys Thr Arg Ile Pro 165 170 175 Ser Phe Asp Met Ser Thr Thr His Tyr Cys Tyr Thr His Asn Val Ile 180 185 190 Leu Ser Gly Cys Arg Asp His Ser His Ser His Gln Tyr Leu Ala Leu 195 200 205 Gly Val Leu Arg Thr Ser Ala Thr Gly Arg Val Phe Phe Ser Thr Leu 210 215 220 Arg Ser Ile Asn Leu Asp Asp Thr Gln Asn Arg Lys Ser Cys Ser Val 225 230 235 240 Ser Ala Thr Pro Leu Gly Cys Asp Met Leu Cys Ser Lys Val Thr Gly 245 250 255 Thr Glu Glu Glu Asp Tyr Lys Ser Val Ala Pro Thr Ser Met Val His 260 265 270 Gly Arg Leu Gly Phe Asp Gly Gln Tyr His Glu Lys Asp Leu Asp Thr 275 280 285 Thr Val Leu Phe Lys Asp Trp Val Ala Asn Tyr Pro Gly Ala Gly Gly 290 295 300 Gly Ser Phe Ile Asp Asp Arg Val Trp Phe Pro Val Tyr Gly Gly Leu 305 310 315 320 Lys Pro Asp Ser Pro Ser Asp Thr Ala Gln Glu Gly Lys Tyr Val Ile 325 330 335 Tyr Lys Arg His Asn Asn Thr Cys Pro Asp Lys Gln Asp Tyr Gln Ile 340 345 350 Arg Lys Ala Lys Ser Ser Tyr Lys Pro Gly Arg Phe Gly Gly Lys Arg 355 360 365 Val Gln Gln Ala Ile Leu Ser Ile Lys Val Ser Thr Ser Leu Gly Lys 370 375 380 Asp Pro Val Leu Thr Ile Pro Pro Asn Thr Ile Thr Leu Met Gly Ala 385 390 395 400 Glu Gly Arg Ile Leu Thr Val Gly Thr Ser His Phe Leu Tyr Gln Arg 405 410 415 Gly Ser Ser Tyr Phe Ser Pro Ala Leu Leu Tyr Pro Met Thr Val Asn 420 425 430 Asn Lys Thr Ala Thr Leu His Ser Pro Tyr Thr Phe Asn Ala Phe Thr 435 440 445 Arg Pro Gly Ser Val Pro Cys Gln Ala Ser Ala Arg Cys Pro Asn Ser 450 455 460 Cys Ile Thr Gly Val Tyr Thr Asp Pro Tyr Pro Leu Ile Phe His Arg 465 470 475 480 Asn His Thr Leu Arg Gly Val Phe Gly Thr Met Leu Asp Asp Glu Gln 485 490 495 Ala Arg Leu Asn Pro Val Ser Ala Val Phe Asp Asn Val Ser Arg Ser 500 505 510 Arg Val Thr Arg Val Ser Ser Ser Ser Thr Lys Ala Ala Tyr Thr Thr 515 520 525 Ser Thr Cys Phe Lys Val Val Lys Thr Asn Lys Thr Tyr Cys Leu Ser 530 535 540 Ile Ala Glu Ile Ser Asn Thr Leu Phe Gly Glu Phe Arg Ile Val Pro 545 550 555 560 Leu Leu Val Glu Ile Leu Lys Asp Asp Gly Val Arg Glu Ala Arg Ser 565 570 575 Gly <210> 7 <211> 2204 <212> PRT <213> Artificial Sequence <400> 7 Met Ala Ser Ser Gly Pro Glu Arg Ala Glu His Gln Ile Ile Leu Pro 1 5 10 15 Glu Ser His Leu Ser Ser Pro Leu Val Lys His Lys Leu Leu Tyr Tyr 20 25 30 Trp Lys Leu Thr Gly Leu Pro Leu Pro Asp Glu Cys Asp Phe Asp His 35 40 45 Leu Ile Leu Ser Arg Gln Trp Lys Lys Ile Leu Glu Ser Ala Ser Pro 50 55 60 Asp Thr Glu Arg Met Ile Lys Leu Gly Arg Ala Val His Gln Thr Leu 65 70 75 80 Asn His Asn Ser Arg Ile Thr Gly Val Leu His Pro Arg Cys Leu Glu 85 90 95 Glu Leu Ala Asn Ile Glu Val Pro Asp Ser Thr Asn Lys Phe Arg Lys 100 105 110 Ile Glu Lys Lys Ile Gln Ile His Asn Thr Arg Tyr Gly Glu Leu Phe 115 120 125 Thr Arg Leu Cys Thr His Ile Glu Lys Lys Leu Leu Gly Ser Ser Trp 130 135 140 Ser Asn Asn Val Pro Arg Ser Glu Glu Phe Ser Ser Ile Arg Thr Asp 145 150 155 160 Pro Ala Phe Trp Phe His Ser Lys Trp Ser Thr Ala Lys Phe Ala Trp 165 170 175 Leu His Ile Lys Gln Ile Gln Arg His Leu Met Val Ala Ala Arg Thr 180 185 190 Arg Ser Ala Ala Asn Lys Leu Val Met Leu Thr His Lys Val Gly Gln 195 200 205 Val Phe Val Thr Pro Glu Leu Val Val Val Thr His Thr Asn Glu Asn 210 215 220 Lys Phe Thr Cys Leu Thr Gln Glu Leu Val Leu Met Tyr Ala Asp Met 225 230 235 240 Met Glu Gly Arg Asp Met Val Asn Ile Ile Ser Thr Thr Ala Val His 245 250 255 Leu Arg Ser Leu Ser Glu Lys Ile Asp Asp Ile Leu Arg Leu Ile Asp 260 265 270 Ala Leu Ala Lys Asp Leu Gly Asn Gln Val Tyr Asp Val Val Ser Leu 275 280 285 Met Glu Gly Phe Ala Tyr Gly Ala Val Gln Leu Leu Glu Pro Ser Gly 290 295 300 Thr Phe Ala Gly Asp Phe Phe Ala Phe Asn Leu Gln Glu Leu Lys Asp 305 310 315 320 Ile Leu Ile Gly Leu Leu Pro Asn Asp Ile Ala Glu Ser Val Thr His 325 330 335 Ala Ile Ala Thr Val Phe Ser Gly Leu Glu Gln Asn Gln Ala Ala Glu 340 345 350 Met Leu Cys Leu Leu Arg Leu Trp Gly His Pro Leu Leu Glu Ser Arg 355 360 365 Ile Ala Ala Lys Ala Val Arg Ser Gln Met Cys Ala Pro Lys Met Val 370 375 380 Asp Phe Asp Met Ile Leu Gln Val Leu Ser Phe Phe Lys Gly Thr Ile 385 390 395 400 Ile Asn Gly Tyr Arg Lys Lys Asn Ala Gly Val Trp Pro Arg Val Lys 405 410 415 Val Asp Thr Ile Tyr Gly Lys Val Ile Gly Gln Leu His Ala Asp Ser 420 425 430 Ala Glu Ile Ser His Asp Ile Met Leu Arg Glu Tyr Lys Ser Leu Ser 435 440 445 Ala Leu Glu Phe Glu Pro Cys Ile Glu Tyr Asp Pro Val Thr Asn Leu 450 455 460 Ser Met Phe Leu Lys Asp Lys Ala Ile Ala His Pro Asn Asp Asn Trp 465 470 475 480 Leu Ala Ser Phe Arg Arg Asn Leu Leu Ser Glu Asp Gln Lys Lys His 485 490 495 Val Lys Glu Ala Thr Ser Thr Asn Arg Leu Leu Ile Glu Phe Leu Glu 500 505 510 Ser Asn Asp Phe Asp Pro Tyr Lys Glu Met Glu Tyr Leu Thr Thr Leu 515 520 525 Glu Tyr Leu Arg Asp Asp Asn Val Ala Val Ser Tyr Ser Leu Lys Glu 530 535 540 Lys Glu Val Lys Val Asn Gly Arg Ile Phe Ala Lys Leu Thr Lys Lys 545 550 555 560 Leu Arg Asn Cys Gln Val Met Ala Glu Gly Ile Leu Ala Asp Gln Ile 565 570 575 Ala Pro Phe Phe Gln Gly Asn Gly Val Ile Gln Asp Ser Ile Ser Leu 580 585 590 Thr Lys Ser Met Leu Ala Met Ser Gln Leu Ser Phe Asn Ser Asn Lys 595 600 605 Lys Arg Ile Thr Asp Cys Lys Glu Arg Val Ser Ser Asn Arg Asn His 610 615 620 Asp Pro Lys Ser Lys Asn Arg Arg Arg Val Ala Thr Phe Ile Thr Thr 625 630 635 640 Asp Leu Gln Lys Tyr Cys Leu Asn Trp Arg Tyr Gln Thr Ile Lys Leu 645 650 655 Phe Ala His Ala Ile Asn Gln Leu Met Gly Leu Pro His Phe Phe Glu 660 665 670 Trp Ile His Leu Arg Leu Met Asp Thr Thr Met Phe Val Gly Asp Pro 675 680 685 Phe Asn Pro Pro Ser Asp Pro Thr Asp Cys Asp Leu Ser Arg Val Pro 690 695 700 Asn Asp Asp Ile Tyr Ile Val Ser Ala Arg Gly Gly Ile Glu Gly Leu 705 710 715 720 Cys Gln Lys Leu Trp Thr Met Ile Ser Ile Ala Ala Ile Gln Leu Ala 725 730 735 Ala Ala Arg Ser His Cys Arg Val Ala Cys Met Val Gln Gly Asp Asn 740 745 750 Gln Val Ile Ala Val Thr Arg Glu Val Arg Ser Asp Asp Ser Pro Glu 755 760 765 Met Val Leu Thr Gln Leu His Gln Ala Ser Asp Asn Phe Phe Lys Glu 770 775 780 Leu Ile His Val Asn His Leu Ile Gly His Asn Leu Lys Asp Arg Glu 785 790 795 800 Thr Ile Arg Ser Asp Thr Phe Phe Ile Tyr Ser Lys Arg Ile Phe Lys 805 810 815 Asp Gly Ala Ile Leu Ser Gln Val Leu Lys Asn Ser Ser Lys Leu Val 820 825 830 Leu Val Ser Gly Asp Leu Ser Glu Asn Thr Val Met Ser Cys Ala Asn 835 840 845 Ile Ala Ser Thr Val Ala Arg Leu Cys Glu Asn Gly Leu Pro Lys Asp 850 855 860 Phe Cys Tyr Tyr Leu Asn Tyr Ile Met Ser Cys Val Gln Thr Tyr Phe 865 870 875 880 Asp Ser Glu Phe Ser Ile Thr Asn Asn Ser His Pro Asp Leu Asn Gln 885 890 895 Ser Trp Ile Glu Asp Ile Ser Phe Val His Ser Tyr Val Leu Thr Pro 900 905 910 Ala Gln Leu Gly Gly Leu Ser Asn Leu Gln Tyr Ser Arg Leu Tyr Thr 915 920 925 Arg Asn Ile Gly Asp Pro Gly Thr Thr Ala Phe Ala Glu Ile Lys Arg 930 935 940 Leu Glu Ala Val Gly Leu Leu Ser Pro Asn Ile Met Thr Asn Ile Leu 945 950 955 960 Thr Arg Pro Pro Gly Asn Gly Asp Trp Ala Ser Leu Cys Asn Asp Pro 965 970 975 Tyr Ser Phe Asn Phe Glu Thr Val Ala Ser Pro Asn Ile Val Leu Lys 980 985 990 Lys His Thr Gln Arg Val Leu Phe Glu Thr Cys Ser Asn Pro Leu Leu 995 1000 1005 Ser Gly Val His Thr Glu Asp Asn Glu Ala Glu Glu Lys Ala Leu Ala 1010 1015 1020 Glu Phe Leu Leu Asn Gln Glu Val Ile His Pro Arg Val Ala His Ala 1025 1030 1035 1040 Ile Met Glu Ala Ser Ser Val Gly Arg Arg Lys Gln Ile Gln Gly Leu 1045 1050 1055 Val Asp Thr Thr Asn Thr Val Ile Lys Ile Ala Leu Thr Arg Arg Pro 1060 1065 1070 Leu Gly Ile Lys Arg Leu Met Arg Ile Val Asn Tyr Ser Ser Met His 1075 1080 1085 Ala Met Leu Phe Arg Asp Asp Val Phe Ser Ser Ser Arg Ser Asn His 1090 1095 1100 Pro Leu Val Ser Ser Asn Met Cys Ser Leu Thr Leu Ala Asp Tyr Ala 1105 1110 1115 1120 Arg Asn Arg Ser Trp Ser Pro Leu Thr Gly Gly Arg Lys Ile Leu Gly 1125 1130 1135 Val Ser Asn Pro Asp Thr Ile Glu Leu Val Glu Gly Glu Ile Leu Ser 1140 1145 1150 Val Ser Gly Gly Cys Thr Arg Cys Asp Ser Gly Asp Glu Gln Phe Thr 1155 1160 1165 Trp Phe His Leu Pro Ser Asn Ile Glu Leu Thr Asp Asp Thr Ser Lys 1170 1175 1180 Asn Pro Pro Met Arg Val Pro Tyr Leu Gly Ser Lys Thr Gln Glu Arg 1185 1190 1195 1200 Arg Ala Ala Ser Leu Ala Lys Ile Ala His Met Ser Pro His Val Lys 1205 1210 1215 Ala Ala Leu Arg Ala Ser Ser Val Leu Ile Trp Ala Tyr Gly Asp Asn 1220 1225 1230 Glu Val Asn Trp Thr Ala Ala Leu Thr Ile Ala Lys Ser Arg Cys Asn 1235 1240 1245 Val Asn Leu Glu Tyr Leu Arg Leu Leu Ser Pro Leu Pro Thr Ala Gly 1250 1255 1260 Asn Leu Gln His Arg Leu Asp Asp Gly Ile Thr Gln Met Thr Phe Thr 1265 1270 1275 1280 Pro Ala Ser Leu Tyr Arg Val Ser Pro Tyr Ile His Ile Ser Asn Asp 1285 1290 1295 Ser Gln Arg Leu Phe Thr Glu Glu Gly Val Lys Glu Gly Asn Val Val 1300 1305 1310 Tyr Gln Gln Ile Met Leu Leu Gly Leu Ser Leu Ile Glu Ser Ile Phe 1315 1320 1325 Pro Met Thr Thr Thr Arg Thr Tyr Asp Glu Ile Thr Leu His Leu His 1330 1335 1340 Ser Lys Phe Ser Cys Cys Ile Arg Glu Ala Pro Val Ala Val Pro Phe 1345 1350 1355 1360 Glu Leu Leu Gly Val Val Pro Glu Leu Arg Thr Val Thr Ser Asn Lys 1365 1370 1375 Phe Met Tyr Asp Pro Ser Pro Val Ser Glu Gly Asp Phe Ala Arg Leu 1380 1385 1390 Asp Leu Ala Ile Phe Lys Ser Tyr Glu Leu Asn Leu Glu Ser Tyr Pro 1395 1400 1405 Thr Ile Glu Leu Met Asn Ile Leu Ser Ile Ser Ser Gly Lys Leu Ile 1410 1415 1420 Gly Gln Ser Val Val Ser Tyr Asp Glu Asp Thr Ser Ile Lys Asn Asp 1425 1430 1435 1440 Ala Ile Ile Val Tyr Asp Asn Thr Arg Asn Trp Ile Ser Glu Ala Gln 1445 1450 1455 Asn Ser Asp Val Val Arg Leu Phe Glu Tyr Ala Ala Leu Glu Val Leu 1460 1465 1470 Leu Asp Cys Ser Tyr Gln Leu Tyr Tyr Leu Arg Val Arg Gly Leu Asp 1475 1480 1485 Asn Ile Val Leu Tyr Met Gly Asp Leu Tyr Lys Asn Met Pro Gly Ile 1490 1495 1500 Leu Leu Ser Asn Ile Ala Ala Thr Ile Ser His Pro Val Ile His Ser 1505 1510 1515 1520 Arg Leu His Ala Val Gly Leu Val Asn His Asp Gly Ser His Gln Leu 1525 1530 1535 Ala Asp Thr Asp Phe Ile Glu Met Ser Ala Lys Leu Leu Val Ser Cys 1540 1545 1550 Thr Arg Arg Val Ile Ser Gly Leu Tyr Ser Gly Asn Lys Tyr Asp Leu 1555 1560 1565 Leu Phe Pro Ser Val Leu Asp Asp Asn Leu Asn Glu Lys Met Leu Gln 1570 1575 1580 Leu Ile Ser Arg Leu Cys Cys Leu Tyr Thr Val Leu Phe Ala Thr Thr 1585 1590 1595 1600 Arg Glu Ile Pro Lys Ile Arg Gly Leu Thr Ala Glu Glu Lys Cys Ser 1605 1610 1615 Ile Leu Thr Glu Tyr Leu Leu Ser Asp Ala Val Lys Pro Leu Leu Ser 1620 1625 1630 Pro Asp Gln Val Ser Ser Ile Met Ser Pro Asn Ile Ile Thr Phe Pro 1635 1640 1645 Ala Asn Leu Tyr Tyr Met Ser Arg Lys Ser Leu Asn Leu Ile Arg Glu 1650 1655 1660 Arg Glu Asp Arg Asp Thr Ile Leu Ala Leu Leu Phe Pro Gln Glu Pro 1665 1670 1675 1680 Leu Leu Glu Phe Pro Ser Val Gln Asp Ile Gly Ala Arg Val Lys Asp 1685 1690 1695 Pro Phe Thr Arg Gln Pro Ala Ala Phe Leu Gln Glu Leu Asp Leu Ser 1700 1705 1710 Ala Pro Ala Arg Tyr Asp Ala Phe Thr Leu Ser Gln Ile His Pro Glu 1715 1720 1725 Leu Thr Ser Pro Asn Pro Glu Glu Asp Tyr Leu Val Arg Tyr Leu Phe 1730 1735 1740 Arg Gly Ile Gly Thr Ala Ser Ser Ser Trp Tyr Lys Ala Ser His Leu 1745 1750 1755 1760 Leu Ser Val Pro Glu Val Arg Cys Ala Arg His Gly Asn Ser Leu Tyr 1765 1770 1775 Leu Ala Glu Gly Ser Gly Ala Ile Met Ser Leu Leu Glu Leu His Val 1780 1785 1790 Pro His Glu Thr Ile Tyr Tyr Asn Thr Leu Phe Ser Asn Glu Met Asn 1795 1800 1805 Pro Pro Gln Arg His Phe Gly Pro Thr Pro Thr Gln Phe Leu Asn Ser 1810 1815 1820 Val Val Tyr Arg Asn Leu Gln Ala Glu Val Thr Cys Lys Asp Gly Phe 1825 1830 1835 1840 Val Gln Glu Phe Arg Pro Leu Trp Arg Glu Asn Thr Glu Glu Ser Asp 1845 1850 1855 Leu Thr Ser Asp Lys Ala Val Gly Tyr Ile Thr Ser Ala Val Pro Tyr 1860 1865 1870 Arg Ser Val Ser Leu Leu His Cys Asp Ile Glu Ile Pro Pro Gly Ser 1875 1880 1885 Asn Gln Ser Leu Leu Asp Gln Leu Ala Ile Asn Leu Ser Leu Ile Ala 1890 1895 1900 Met His Ser Val Arg Glu Gly Gly Val Val Ile Ile Lys Val Leu Tyr 1905 1910 1915 1920 Ala Met Gly Tyr Tyr Phe His Leu Leu Met Asn Leu Phe Ala Pro Cys 1925 1930 1935 Ser Thr Lys Gly Tyr Ile Leu Ser Asn Gly Tyr Ala Cys Arg Gly Asp 1940 1945 1950 Met Glu Cys Tyr Leu Val Phe Val Met Gly Tyr Leu Gly Gly Pro Thr 1955 1960 1965 Phe Val His Glu Val Val Arg Met Ala Lys Thr Leu Val Gln Arg His 1970 1975 1980 Gly Thr Leu Leu Ser Lys Ser Asp Glu Ile Thr Leu Thr Arg Leu Phe 1985 1990 1995 2000 Thr Ser Gln Arg Gln Arg Val Thr Asp Ile Leu Ser Ser Pro Leu Pro 2005 2010 2015 Arg Leu Ile Lys Tyr Leu Arg Lys Asn Ile Asp Thr Ala Leu Ile Glu 2020 2025 2030 Ala Gly Gly Gln Pro Val Arg Pro Phe Cys Ala Glu Ser Leu Val Ser 2035 2040 2045 Thr Leu Ala Asn Ile Thr Gln Ile Thr Gln Ile Ile Ala Ser His Ile 2050 2055 2060 Asp Thr Val Ile Arg Ser Val Ile Tyr Met Glu Ala Glu Gly Asp Leu 2065 2070 2075 2080 Ala Asp Thr Val Phe Leu Phe Thr Pro Tyr Asn Leu Ser Thr Asp Gly 2085 2090 2095 Lys Lys Arg Thr Ser Leu Lys Gln Cys Thr Arg Gln Ile Leu Glu Val 2100 2105 2110 Thr Ile Leu Gly Leu Arg Val Glu Asn Leu Asn Lys Ile Gly Asp Ile 2115 2120 2125 Ile Ser Leu Val Leu Lys Gly Met Ile Ser Met Glu Asp Leu Ile Pro 2130 2135 2140 Leu Arg Thr Tyr Leu Lys His Ser Thr Cys Pro Lys Tyr Leu Lys Ala 2145 2150 2155 2160 Val Leu Gly Ile Thr Lys Leu Lys Glu Met Phe Thr Asp Thr Ser Val 2165 2170 2175 Leu Tyr Leu Thr Arg Ala Gln Gln Lys Phe Tyr Met Lys Thr Ile Gly 2180 2185 2190 Asn Ala Val Lys Gly Tyr Tyr Ser Asn Cys Asp Ser 2195 2200 <210> 8 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-1F primer <400> 8 cgtctcgacc aaacagagaa tctgtgaggt ac 32 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-1746F primer <400> 9 gacaacacag gcacagctcg 20 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-2827F primer <400> 10 catctcctta cgtgacacaa gg 22 <210> 11 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-F-F primer <400> 11 tcgcgacgca atatggctcc aaactttc 28 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-HN-F primer <400> 12 ccgcggcacc gacaacaaga gtcaatcatg 30 <210> 13 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-8100F primer <400> 13 actagttgag atcctcaagg atgatag 27 <210> 14 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-11648F primer <400> 14 catgcaatgt tgtccagaga tg 22 <210> 15 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-12539F primer <400> 15 tcagagagag atttcgcgag ac 22 <210> 16 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-14021F primer <400> 16 cattgtgaca ttgagattcc tcc 23 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-1844R primer <400> 17 tcgtcttggt ctctggatgt ctc 23 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-2948R primer <400> 18 cttctccact cccatgtcag g 21 <210> 19 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-4612R primer <400> 19 cagcataatc cgggtgatca gc 22 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-F-R primer <400> 20 ccgcggtaga acggatgttg tgaagcctaa 30 <210> 21 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-HN-R primer <400> 21 ctcaactagt aagggaacga tcctaaattc c 31 <210> 22 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-11815R primer <400> 22 tatggtatca gggttggata cacc 24 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-12591R primer <400> 23 agctcataac tcttgaagat agc 23 <210> 24 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-14110R primer <400> 24 cacagaatgc atggcaatca gg 22 <210> 25 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-15118R primer <400> 25 actgaatccg aatacgactt cc 22 <210> 26 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-597F primer <400> 26 ctgacactct ggaaagaatc c 21 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-3421F primer <400> 27 gatccagcgc cttgattcgt 20 <210> 28 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-8662F primer <400> 28 caggtgttta gaagaactgg c 21 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-5759F primer <400> 29 cctcctggta tcatatcgca 20 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-4679 primer <400> 30 gtaacaggag ataaggcagt c 21 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-7670 primer <400> 31 ttcttgtacc aacgagggtc 20 <210> 32 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-9328F primer <400> 32 cctacaggag ctcaaagaca c 21 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-9977F primer <400> 33 ctaagagatg acagtgtggc 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-10588F primer <400> 34 acttgctgca gcaagatctc 20 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> ND-ZJ-13052F primer <400> 35 gtggtctcag gcttatatgc 20 <210> 36 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> S1-F primer <400> 36 cgtctcgacc aaacagagaa tccgtgagtt acg 33 <210> 37 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> S1-R primer <400> 37 ccatgggccc tttttagcat tggacg 26 <210> 38 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> S2-F primer <400> 38 aaaagggccc atggtcgagc cc 22 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> S2-R primer <400> 39 tatcatcgat catgccgaca gtg 23 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> S3-F primer <400> 40 catgatcgat gataaaccca agc 23 <210> 41 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> S3-R primer <400> 41 tcgcgaatga gccggtcggg atccagac 28 <210> 42 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> S4-F primer <400> 42 tcgcgacgca atatggctcc aaactttc 28 <210> 43 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> S4-R primer <400> 43 ccgcggtaga acggatgttg tgaagcctaa 30 <210> 44 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> S5-F primer <400> 44 ccgcggcacc gacaacaaga gtcaatcatg 30 <210> 45 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> S5-R primer <400> 45 ctcaactagt aagggaacga tcctaaattc c 31 <210> 46 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> S6-F primer <400> 46 actagttgag atcctcaagg atgatag 27 <210> 47 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> S7-R primer <400> 47 gatccgtacg aatgcagctg aactc 25 <210> 48 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> S9-F primer <400> 48 cctaggtatt accaaactca aaga 24 <210> 49 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> S9-R primer <400> 49 ggtctcaacc aaacaaagat ttggtgaatg 30 <210> 50 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-601 primer <400> 50 taccctggag aggatcctc 19 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-1261 primer <400> 51 cgagctaaag ctaaccccag 20 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-1901 primer <400> 52 agatgcagag atcgacgagc 20 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-2581 primer <400> 53 aggcgatatc acagagagta 20 <210> 54 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-3271 primer <400> 54 gtgccccaat tgtgccaag 19 <210> 55 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> S6-F-La priemr <400> 55 actagttgag atcctcaaag atgacgg 27 <210> 56 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> S6-R-La primer <400> 56 tgctctgccc tttcaggacc ggagctcgcc atg 33 <210> 57 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> S7-F-La primer <400> 57 catggcgagc tccggtcctg aaagggcaga gca 33 <210> 58 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-5121 primer <400> 58 cagctcagga attagactgc 20 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-5711 primer <400> 59 gtcatcgcca actgcaagat 20 <210> 60 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-7042 primer <400> 60 ctccggacat ctgcaacag 19 <210> 61 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-8591 primer <400> 61 aaactcggaa gggcagtac 19 <210> 62 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-9311 primer <400> 62 ttcgcattca acctgcagg 19 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-9971 primer <400> 63 cttagagatg acaatgtggc 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-10661 primer <400> 64 gtaagatcag acgactctcc 20 <210> 65 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-11321 primer <400> 65 tttgagactg ttgcaagcc 19 <210> 66 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-12012 primer <400> 66 tgtcgccaca tgtaaaggc 19 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-12721 primer <400> 67 tacccgaaat tggatcagtg 20 <210> 68 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-13339 primer <400> 68 catgtctcgg aagagcctc 19 <210> 69 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> La-13981 primer <400> 69 atctgcagtg ccctacaga 19 <210> 70 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> La14976 primer <400> 70 acagtaactg tgactcttaa cgaaaatcac atattaatag gctcc 45 <210> 71 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> La15020R primer <400> 71 ggagcctatt aatatgtgat tttcgttaag agtcacagtt actgt 45 <210> 72 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> S7-R primer <400> 72 gatccgtacg aatgctgctg aactc 25 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NDV-Pt-R primer <400> 73 tgccactgmt agttgygata 20 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> NDcomF156 primer <400> 74 atacacctcr tcycagacag 20 <210> 75 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> La-8892R primer <400> 75 gagccatgca aacttggctg tggacc 26 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-14708 primer <400> 76 acagtgcacg agacagatcc 20 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> La-15092R primer <400> 77 gtcctaagga gtcagggttc 20 <210> 78 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> NDV-NP-F primer <400> 78 gagcggccgc accatgagta cgagcagctc c 31 <210> 79 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> NDV-NP-R primer <400> 79 gagcggccgc tcagtacccc cagtcggtg 29 <210> 80 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> NDV-P-F primer <400> 80 gagcggccgc accatggcca cctttacaga tg 32 <210> 81 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> NDV-P-R primer <400> 81 gagcggccgc ttagccattt agagcaaggc 30 <210> 82 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> NDV-L-F primer <400> 82 gagcggccgc accatggcga gcctccgatc ctgaaa 36 <210> 83 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> NDV-L-R primer <400> 83 gagcggccgc ttaagagtca cagttactgt aatatcc 37 <210> 84 <211> 2357 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of pTMH vector <400> 84 gaattctaat acgactcact ataggaccaa gagacgggcc catatcgatt cgcgaccgcg 60 ggatactagt cgtacgccta ggggtctctt ggtgggtcgg catggcatct ccacctcctc 120 gcggtccgac ctgggcatcc gaaggaggac gtcgtccact cggatggcta agggagagct 180 cggatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc 240 aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgcatatgc 300 ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt 360 cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 420 caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 480 caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 540 ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 600 cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 660 ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 720 tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 780 gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 840 ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 900 ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 960 gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 1020 aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 1080 tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 1140 ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 1200 tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 1260 aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 1320 tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa 1380 ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 1440 gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 1500 gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 1560 taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg 1620 tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag 1680 ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg 1740 tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc 1800 ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat 1860 tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata 1920 ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa 1980 aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca 2040 actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc 2100 aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc 2160 tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg 2220 aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 2280 ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga 2340 ggccctttcg tcttcaa 2357 <210> 85 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of HN gene (1-569) of KBNP-4152 and HN terminus (570-577) of Lasota stain <400> 85 ccctttacta gttgagattc tcaaggatga tggggttagg gaggccaggg ctggccgctt 60 gagtcaattg cgagagggtt ggaaagatga cattgtatca cctatctttt gcgacgccaa 120 gaatcaaact gagtaccggc gtgagctcga gtcttacgct gccagctggc cataatcagc 180 tagcgctaat gtgattagat taaatcttgt cgatagtcac ttgattaaga aaaaatgtaa 240 gtggcaatga gatacaaggc aaaacagctc atggtaaata atacgggtag gacatggcga 300 300

Claims

삭제
삭제
약병원성 뉴캐슬병 바이러스인 라소타/46 균주 (AY845400)의 NP, P, M 및 L 단백질 코딩 서열; 및

강병원성 뉴캐슬병 바이러스인 KBNP-C4152(기탁번호: KCTC 10919BP)의 F 및 HN 단백질 코딩 서열을 포함하며,

상기 F 단백질 코딩 서열에 있어서, 강병원성 뉴캐슬병 바이러스 F 단백질의 115번째 아미노산의 코딩 코돈이 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; UAC 및 UAU 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 코돈으로 치환된 것을 특징으로 하는,

뉴캐슬병 바이러스의 게놈 전사 벡터.
제3항에 있어서, 상기 HN 단백질 코딩 서열이 강병원성 뉴캐슬병 바이러스인 KBNP-C4152(기탁번호: KCTC 10919BP)의 HN의 569번째 아미노산의 C 말단에 약병원성 뉴캐슬병 바이러스인 라소타/46 균주 (AY845400)의 HN 단백질의 570번째 이후의 아미노산 서열이 추가로 삽입된 재조합 HN 단백질을 코딩하는 것인 게놈 전사 벡터.
제3항에 있어서, SEQ ID NO: 1의 염기 서열로 표현되는 게놈 전사 벡터.
삭제
삭제
약병원성 뉴캐슬병 바이러스인 라소타/46 균주 (AY845400)의 NP, P, M 및 L 단백질 코딩 서열, 및

강병원성 뉴캐슬병 바이러스인 KBNP-C4152 (기탁번호: KCTC 10919BP)의 F 및 HN 단백질 코딩 서열을 가지며,

상기 F 단백질 코딩 서열에 있어서, 강병원성 뉴캐슬병 바이러스의 F 단백질의 115번째 아미노산의 코딩 코돈이 GCA, GCC, GCG 및 GCU로 이루어진 알라닌 코딩 코돈; GAC 및 GAU로 이루어진 아스파르트산 코딩 코돈; UUC 및 UUU로 이루어진 페닐알라닌 코딩 코돈; AUC 및 AUU로 이루어진 이소류신 코딩 코돈; UUA 및 UUG로 이루어진 류신 코딩 코돈; UCA, UCC, UCG 및 UCU로 이루어진 세린 코딩 코돈; ACC 및 ACU로 이루어진 트레오닌 코딩 코돈; GUA, GUC, GUG 및 GUU로 이루어진 발린 코딩 코돈; UAC 및 UAU 티로신 코딩 코돈으로 이루어진 군 중에서 선택된 어느 하나의 코돈으로 치환된 것을 특징으로 하는,

재조합 뉴캐슬병 바이러스 균주
제8항에 있어서, 상기 HN 코딩 서열이 강병원성 뉴캐슬병 바이러스인 KBNP-C4152 (기탁번호: KCTC 10919BP)의 HN의 569번 아미노산의 C 말단에 약병원성 뉴캐슬병 바이러스인 라소타/46 균주 (AY845400)의 HN의 570번째 이후의 아미노산 서열이 추가로 연결된 재조합 HN 단백질을 코딩하는 것인 재조합 뉴캐슬병 바이러스 균주.
제8항에 있어서, 기탁번호 KCTC 10984BP인 재조합 뉴캐슬병 바이러스 균주.
삭제
삭제