KR100950104B1

KR100950104B1 - 코어 글리코실화된 ｈｃｖ 엔빌로프 단백질

Info

Publication number: KR100950104B1
Application number: KR1020037013778A
Authority: KR
Inventors: 데플라에릭; 보스만알폰스; 더치햄스기르트; 사브론어윙; 슈브코맨프레드; 삼슨이사벨; 베르하이든게르트
Original assignee: 이노제네틱스, 엔. 브이.
Priority date: 2001-04-24
Filing date: 2002-04-24
Publication date: 2010-03-30
Also published as: WO2002086100A3; KR20030094359A; MXPA03009626A; JP2004532029A; WO2002085932A3; BR0209034A; EP1381671A2; RU2003130955A; WO2002086100A2; WO2002085932A2; AR035868A1; ZA200308277B; NZ529019A; AU2002308449B2; YU84103A; BR0209033A; RU2274643C2; AU2002252856A1; OA13092A; US7048930B2

Abstract

본 발명은 진핵생물 세포에서의 발현산물인 HCV 엔빌로프 단백질 또는 그의 일부에 관한 것이다. 보다 자세하게는, 상기 HCV 엔빌로프 단백질은 N-글리코실화 부위의 평균 80% 까지가 코어-글리코실화되는 것을 특징으로 한다. 이들 N-글리코실화된 부위중 70% 이상은 8 내지 10개 만노오스를 함유하는 올리고만노오스에 의해 글리코실화된다. 또한, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.45 이하이다. 10% 미만의 올리고만노오스는 α1,3 결합된 만노오스에 의해 종료된다. 본 발명의 HCV 엔빌로프 단백질은 진단, 예방 및 치료 목적에 특히 적합하다. 본 발명의 HCV 엔빌로프 단백질을 생산하기 위해 적합한 진핵생물 세포는 한세눌라(Hansenula) 세포이다.

코어-글리코실화, HCV 엔빌로프 단백질, 올리고만노오스, 한세눌라 세포

Description

코어 글리코실화된 ＨＣＶ 엔빌로프 단백질{Core-glycosylated HCV envelope proteins}

본 발명은 일반적 재조합 단백질 발현, HCV 감염의 진단, HCV 감염의 치료 또는 예방, 및 만성간염에 걸린 개인을 치료할 때 임상적 효과를 진단/조절하는 것과 천연 질병의 진단/조절에도 관한 것이다.

보다 자세하게는, 본 발명은 코어-글리코실화된 바이러스성 엔빌로프 (envelope) 단백질의 발현에 적합한 효모, 효모 균주에서 C형 간염 바이러스 엔빌로프 단백질의 발현, 및 본 발명에 따른 HCV 엔빌로프 단백질의 진단, 예방 또는 치료에서의 용도에도 관한 것이다.

C형 간염 바이러스(HCV) 감염은 개발국과 개도국 모두에서 주요 건강 문제이다. 세계 인구의 약 1 내지 5%가 이 바이러스에 감염된 것으로 추산된다. HCV 감염은 수혈과 관련된 간염의 가장 중요한 원인으로 보이며 흔히 만성적인 간 손상으로까지 진행한다. 또한, HCV가 간세포암의 유도에 관여함을 보여주는 증거가 존재한다. 따라서, 안정적인 진단법과 효과적인 치료제에 대한 요구가 높다. HCV-오염된 혈액 산물을 예민하고 특이하게 스크리닝하는 방법과 HCV를 배양하는 향상된 방법도 또한 요구된다.

HCV는 약 3000개 아미노산의 단일 폴리단백질을 암호화하는 약 9,600개 염기의 양성 표준 RNA 바이러스이다. 번역과 동시에 생기는 수식 및 번역후 수식에 결부된 전구체의 단백질 분해는 적어도 3개의 구조 단백질 및 6개의 비-구조적 단백질을 생성하는 것으로 나타나있다. 서열 상동성을 기초로 하여, 구조적 단백질은 1개의 단일 코어 단백질 및 2개의 엔빌로프 당단백질 E1 및 E2로 기능적으로 특정된다. 상기 E1 단백질은 192개의 아미노산으로 구성되며 또 HCV 유전형에 따라서 4 내지 5개의 N-글리코실화 부위를 함유한다. E2 단백질은 363 내지 370개 아미노산으로 구성되고 또 HCV 유전형에 따라서 9 내지 11개의 N-글리코실화 부위를 함유한다 (Major and Feinstone, 1997; Maertens and Stuyver, 1997 참조). E1 단백질은 다양한 가변 도메인을 함유한다(Maertens and Stuyver, 1997 참조). E2 단백질은 3개의 초가변적인 도메인을 함유하며, 이들의 주요 도메인은 단백질의 N-말단에 위치한다(Maertens and Stuyver, 1997 참조). HCV 당단백질은 ER에 주로 존재하며, 그곳에서 HCV 당단백질은 수식되어 올리고머성 복합체로 조립된다.

진핵생물에서, 당 잔기는 일반적으로 4개의 상이한 아미노산 잔기에 결합된다. 이들 아미노산 잔기는 O-결합된 잔기(세린, 트레오닌 및 히드록시리신) 및 N-결합된 잔기(아스파라긴)로 분류된다. O-결합된 당은 뉴클레오티드 당으로부터 골지체 또는 조면 소포체(ER)에서 합성된다. N-결합된 당은 통상의 전구체로부터 합성된 다음 가공된다. HCV 엔빌로프 단백질은 N-글리코실화되는 것으로 믿어진다. N-결합된 탄수화물 사슬의 부가는 접힘현상(folding) 중간체의 안정화 및 효과적인 접힘현상, 잘못된 접힘현상의 예방 및 소포체에서 분해, 올리고머화, 생물학적 활 성 및 당단백질의 수송에 중요한 역할을 하는 것으로 당분야에 공지되어 있다 (Rose 등, 1988; Doms 등, 1993; Helenius, 1994 에 의한 문헌 참조). 폴리펩티드상에서 세 개펩티드 서열 Asn-X-Ser 및 Asn-X-Thr (식중, X는 임의의 아미노산임)은 N-결합된 올리고당이 결합하기 위한 콘센서스(consensus) 부위이다. N-결합된 올리고당을 폴리펩티드에 부가한 후, 올리고당을 복합체 유형(N-아세틸글루코사민, 만노오스, 푸코오스, 갈락토오스 및 시알산을 함유) 또는 고-만노오스 유형(N-아세틸글루코사민 및 만노오스 함유)으로 더욱 가공한다. HCV 엔빌로프 단백질은 고-만노오스 유형일 것으로 보인다. N-결합된 올리고당의 효모에서의 가공은 포유동물 골지체 가공과는 아주 상이하다. 효모에서는, 올리고당 사슬은 만노오스의 점진적인 부가를 통하여 골지체에서 연장되어 "초글리코실화"로 불리는 정교한 고 만노오스 구조를 형성한다. 이와 대조적으로, 원핵생물에서 발현된 단백질은 글리코실화되지 않는다.

단백질 또는 펩티드의 고-만노오스 글리코실화의 패턴은 다양한 진핵생물 세포에 따라 결정된다. 포유동물 세포에서는, 평균 5 내지 9개의 만노오스 단위체가 코어-글리코실화 유형 올리고당중의 2개의 N-아세틸글루코사민 잔기에 결합된다(이 구조를 간단히 Man(5-9)GlcNAc(2)라 칭함). 코어 글리코실화는 Herscovics 및 Orleans(1993)의 도 3에서 박스(boxed) 구조와 유사한 구조를 지칭한다.

메틸로트로픽(methylotrophic) 효모 피치아 파스토리스(Pichia pastoris)는 글리코실화 부위당 평균 8 내지 14개 만노오스 단위, 즉 Man(8-14)GlcNAc(2)를 부착하고 있고(EP0256421호에서 Tschopp에 의해) 또 약 85%의 N-결합된 올리고당이 Man(8-14)GlcNAc(2) (Grinna 및 Tschopp 1989) 크기 범위에 있다고 보고되어 있다. 다른 연구자들은 피. 파스토리스(P. pastoris)에서 발현된 이종 단백질에 부착된 약간 상이한 올리고당 구조를 공개하였다: Man(8-9)GlcNAc(2) (Montesino 등, 1998), Man(9-14)GlcNAc(2) 또는 Man(9-15)GlcNAc(2) (Kalidas 등 2001), 및 Man(8-18)GlcNAc(2), 이때 Man(9-12)GlcNAc(2)가 우세하고 대부분의 올리고당은 Man(10)GlcNAc(2) (Miele 등, 1998)이다. Trimble 등(1991)은 약 75%의 N-결합된 올리고당에서 Man(8)GlcNAc(2) 및 Man(9)GlcNAc(2)의 분포가 동일하며 부가적으로 17%의 N-글리코실화 부위는 Man(10)GlcNAc(2)에 의해 점유되고 나머지 8%의 부위는 Man(11)GlcNAc(2)에 의해 점유된다고 보고하였다. 피. 파스토리스(P. pastoris)-발현된 단백질의 초글리코실화는 경우에 따라 보고되었다(Scorer 등 1993).

아스페르길루스 니거(Aspergillus niger)는 Man(5-10)GlcNAc(2)를 N-글리코실화 부위에 부가한다 (Panchal 및 Wodzinski 1998).

사카로마이세스 세레비시아애(Saccharomyces cerevisiae) 글리코실화 결핍 돌연변이체 mnn9는, mnn9 세포가 초글리코실화된 단백질 대신, Man(9-13)GlcNAc(2)으로 구성된 수식된 올리고당을 갖는 글리코실화 단백질을 생산하는 점에서 야생형 사카로마이세스 세레비시아애 (Saccharomyces cerevisiae)와 상이하다 (US 5,135,854호에서 Mackay 등 및 WO 94/01132호에서 Knisken 등 참조). 다른 에스. 세레비시아애(S. cerevisiae) 돌연변이체, ochlmnn9는 단백질중의 N-글리코실화 부위에 Man(8)GlcNAc(2)를 부가하는 것으로 보고되었다 (JP06277086호에서 Yoshifumi 등 참조).

에스. 세레비시아애(S. cerevisiae)(야생형 및 mnn9 돌연변이체) 코어 올리고당의 특징은 말단 α1,3-결합된 만노오스 잔기가 존재하는 점이다(Montesino 등 1998). 피. 파스토리스(P. pastoris) 또는 에스. 세레비시아애(S. cerevisiae) och1mnn1에서 발현된 단백질의 N-글리코실화 부위에 부착된 올리고당은 이러한 말단 α1,3-결합된 만노오스를 갖고 있지 않다(Gellissen 등 2000). 말단 α1,3-결합된 만노오스는 알레르기 유발물질로 간주된다(Jenkins 등 1996). 따라서, 자신에 당에 말단 α1,3-결합된 만노오스 잔기를 갖는 단백질은 진단 또는 치료 목적용으로는 적합하지 않다.

메틸로트로픽 효모 한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 단백질에서 글리코실화 패턴은 다수의 이종 단백질의 생산을 위해 상기 효모에서 사용됨에도 불구하고 (Gellissen 등, 2000에서 표 3 참조), 그다지 자세하게 연구되지 않았다. Janowicz 등 (1991) 및 Diminsky 등(1997)의 실험으로부터, 에이치. 폴리모르파(H. polymorpha)는 대형 또는 소형의 B형 간염 바이러스성 표면 항원(HBsAg)을 글리코실화시키지 않거나 극히 적게 글리코실화시키는 것으로 보인다. 이것은 HBsAg가 시그널 펩티드없이 발현됨으로 인하여, 생산된 HBsAg가 소포체의 세포간극으로 들어가지 못하게 하여 글리코실화를 방해하기 때문으로 보여진다. 에이치. 폴리모르파(H. polymorpha)에서 생산된 G-CSF (과립구 군체 자극인자)에 대한 모노- 또는 디헥소오스의 제한된 부가는 보고되어 있다 (Fischer 등 WO 00/40727호에 보고). 한편, 에이치. 폴리모르파(H. polymorpha) 세포에서 발현된 이종 α-갈락토시다제의 초글리코실화가 보고되어 있다(Fellinger 등 1991).

지금까지, 질병에 대한 백신처리는 질병을 제어하는 가장 비용 효과적이고 효율적인 방법으로 알려져 왔다. 그러나, 유망한 결과에도 불구하고 효과적인 HCV 백신을 개발하려는 노력은 여러 문제에 직면하였다. 백신에 대한 필수조건은 환자에서 면역반응을 유발하는 것이다. 따라서, HCV 항원결정부위를 확인해야하고, 적합한 조건에서 환자에게 투여되어야한다. 항원결정부위는 적어도 2개 형태, 즉 선형 및 입체적 항원결정부위로 분류될 수 있다. 입체적 항원결정부위는 글리코실화와 같은 번역과 동시에 생기는 수식 및 번역후 수식을 비롯한 3차원 공간에서 분자의 접힘현상에 기인한다. 일반적으로, 입체적 항원결정부위는 대부분의 효과적인 백신을 실현할 수 있을 것으로 보는데, 그 이유는 입체적 항원결정부위는 천연과 유사한 HCV 항원결정부위와 유사하고 또 실제의 선형 아미노산 서열보다 더 잘 보존될 수 있는 항원결정부위를 나타내기 때문이다. 따라서, HCV 엔빌로프 단백질의 글리코실화의 실제 정도는 천연 HCV 항원 결정기를 생성하는데 가장 중요하다. 그러나, HCV를 배양하는 것은 무수한 문제를 갖고 있어, 극히 소량의 비리온을 초래할 뿐이다. 또한, 재조합 단백질의 발현과 정제에도 다수의 문제가 존재하므로, 소량의 단백질, 초글리코실화된 단백질 또는 글리코실화되지 않은 단백질을 초래하게된다.

HCV 엔빌로프 단백질은 대장균(Escherichia coli), 곤충 세포, 효모 세포 및 포유동물 세포에서 재조합 수법에 의해 생산되었다. 그러나, 더 고등한 진핵생물에서의 발현은 실제의 백신 제조를 위한 다량의 항원을 얻는데 어려움이 존재한다. 대장균(E.coli)과 같은 원핵생물에서 발현은 글리코실화되지 않은 HCV 엔빌로프 단 백질을 초래한다. 효모에서의 HCV 엔빌로프 단백질의 발현은 초글리코실화를 초래한다. WO 96/04385에서 Maertens 등에 의해 이미 나타낸 바와 같이, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 HCV 엔빌로프 단백질 E2의 발현은 상당히 글리코실화된 단백질을 초래한다. 이러한 초글리코실화는 단백질 항원결정부위를 숨기게된다. Mustilli 등(1999)는 에스. 세레비시아애(S. cerevisiae)에서 HCV E2의 발현이 코어-글리코실화를 초래하지만, 세포내적으로 발현된 물질의 결과는 그 일부가 초글리코실화되는 반면에 나머지 물질의 정확한 가공이 나타나지 않는다고 주장하였다. 더구나, Mustilli 등 (1999)에 의해 관찰된 초글리코실화는 튜니카마이신(글리코실화 억제제의 일종)의 존재하에서만 방지될 수 있고, 또 이것은 정상적인 천연 생장 조건하에서 생기는 글리코실화를 나타내지 않는다. 세포내 공급원으로부터 유도된 HCV 엔빌로프 단백질에 대한 필요는 잘 받아들여지고 있다 (WO 96/04385에서 Maertens 등, Heile 등, 2000). 이러한 필요성은 Mustilli 등(1999)의 도 5에서 분명한 바와 같이 포유동물 세포 배양액 유래 E2 단백질에 의해 면역화된 침팬지의 혈청과 분비된 효모 유래 E2의 불량한 반응성으로 부터도 더욱 예시된다. 이러한 것은 효모 유래 HCV 엔빌로프 단백질을 사용한 면역화가 그러한 도전으로 보호하는데 실패하였음을 보여주는 로사 등(1996)에 의한 문헌에 수록되어 있다.

따라서, 말단 α1,3-결합된 만노오스를 갖지 않는 천연과 유사한 글리코실화 패턴을 동시에 갖는 단백질을 다량으로 또 비용 효과적으로 얻을 수 있는 효과적인 발현계가 요망되고 있다. 특히, 이러한 계는 HCV 엔빌로프 단백질의 제조에 필요 하다.

발명의 요지

본 발명의 제1 요지는 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 특히, 상기 코어-글리코실화 부위의 70% 이상이 글리코실화되고 올리고만노오스는 Man(8-10)-GlcNAc(2)에 의해 정의된 구조를 갖는다. 또한, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스의 비율은 0.45 미만 또는 0.45 이다. 보다 자세하게는, 상기 올리고만노오스는 10% 미만의 말단 α1,3 만노오스를 함유한다. 상기 분리된 HCV 엔빌로프 단백질 또는 그의 일부를 발현하는 진핵생물 세포는 한세눌라(Hansenulla) 세포와 같은 효모 세포일 수 있다.

본 발명의 다른 요지는 HCV 엔빌로프 단백질 또는 그의 단편에 결합된 조류의 리소짐(lysozyme) 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유래한 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부에 관한 것이다. 보다 자세하게는, 상기 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 하기 구조식을 특징으로 하는 단백질로부터 유래된다:

CL-[(Al)_a-(PS1)_b-(A2)_c]-HCVENV-[(A3)_d-(PS2)_e-(A4) _f]

식중에서,

CL은 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물이고,

A1, A2, A3 및 A4는 상이하거나 동일할 수 있는 어댑터(adptor) 펩티드이며,

PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,

HCVENV는 HCV 엔빌로프 단백질 또는 그의 일부이며,

a, b, c, d, e 및 f는 0 또는 1이고, 또

경우에 따라, A1 및/또는 A2는 PS1의 일부이고 및/또는 A3 및/또는 A4는 PS2의 일부이다.

본 발명의 다른 요지는 단량체, 동종이합체, 이종이합체, 동종-올리고머 및 이종-올리고머로 구성되 군으로부터 선택된 구조에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함한다. 다르게는, 본 발명에 따른 상기 분리된 HCV 엔빌로프 단백질 또는 그의 단편은 바이러스-유사 입자를 포함한다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편은 시스테인 티올기가 화학적으로 수식된 시스테인을 포함할 수 있다.

본 발명의 특정 요지는 항원성 또는 면역원성이고 및/또는 T-세포 자극 항원결정부위를 포함하는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 또 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함하는 조성물에 관한 것이다. 이러한 조성물은 약제학적으로 허용되는 담체를 더 포함할 수 있으며 또 의약 또는 백신일 수 있다.

본 발명은 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 생산하는 방법에 관한 것이다.

본 발명의 다른 방법은,

(i) 제1항 내지 제15항중 어느 한 항에 따른 HCV 엔빌로프 단백질 또는 그의 일부를, HCV 엔빌로프 단백질 또는 그의 일부와 항-HCV 항체의 복합체 형성을 허용하는 조건하에서 항-HCV 항체를 포함할 것으로 추정되는 샘플과 접촉시키는 단계,

(ii) (i)에서 형성된 복합체를 검출하는 단계, 및

(iii) (ii)으로부터 상기 샘플에서 항-HCV 항체의 존재를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하는 방법이다.

보다 자세하게는, 상기 방법은 상기 접촉이 경쟁 조건하에서 생기는 단계(i)를 포함할 수 있다. 특히 상기 방법은 상기 HCV 엔빌로프 단백질 또는 그의 일부가 부착되어 있는 고형 지지체를 이용할 수 있다.

본 발명은 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트에도 관한 것이다. 보다 자세하게는, 상기 키트는 고형 지지체에 부착된 상기 HCV 엔빌로프 단백질 또는 그의 일부를 포함할 수 있다.

본 발명은 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 의약 또는 백신에도 관한 것이다.

본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부 및 경우에 따 라 약제학적으로 허용되는 보조제를 포함하는 포유동물에서 HCV-특이적 면역반응을 유발하는 약제학적 조성물도 본 발명에 포함된다. 이러한 약제학적 조성물은 예방적 조성물 또는 치료적 조성물일 수 있다. 특히, 상기 포유동물은 인간이다.

발명의 상세한 설명

본 발명에 따른 실시에서, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris) 및 한세눌라 폴리모르파(Hansenula polymorpha)에서 글리코실화된 HCV 엔빌로프 단백질의 발현은 상기 HCV 엔빌로프 단백질을 상기 HCV 엔빌로프 단백질에 결합된 시그널 펩티드 서열을 포함하는 단백질로서 발현하는 것에 의해 가능함이 밝혀졌다. 그러나 이들 세 개 효모 종에서 발현된 HCV 엔빌로프 단백질의 글리코실화 패턴은 아주 상이하다 (실시예 6, 10, 13 및 25 참조). 보다 자세하게는, 에스.세레비시아애(S. cerevisiae) (글리코실화 결핍 돌연변이체)- 및 에이치. 폴리모르파(H. polymorpha)-발현된 HCV 엔빌로프 단백질은 코어-글리코실화 유사한 방식으로 글리코실화되었다. 피치아 파스토리스(Pichia pastoris)에서 발현된 HCV 엔빌로프 단백질은 상기 효모에서 발현된 단백질은 보통 초글리코실화되지 않는다(Gellissen 등 2000, Sugrue 등 1997)는 이전의 보고에도 불구하고 초글리코실화되었다.

에스.세레비시아애(S. cerevisiae) (글리코실화 결핍 균주), 에이치. 폴리모르파(H. polymorpha) 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에서 생산된 HCV 단백질의 글리코실화 패턴을 더욱 분석하면, 놀랍게도 한세눌라(Hansenula) 생산된 HCV 엔빌로프 단백질은 HCV 엔빌로프 단백질의 진단, 예방 및 치료용으로 아주 유리한 글리코실화 패턴을 나타낸다는 것이 밝혀졌다 (실시예 21-24 및 26-29 참조). 이러한 예상치 못한 발견은 이하에 기재한 본 발명의 상이한 요지 및 실시예에 반영되어 있다.

본 발명의 제1 요지는 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는, 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 보다 자세하게는, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상의 N-글리코실화 부위는 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

"Man(8-10)-GlcNAc(2)에 의해 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된 N-글리코실화 부위"는 상기 N-글리코실화 부위가 1개의 Man(8)-GlcNAc(2), Man(9)-GlcNAc(2) 또는 Man(10)-GlcNAc(2)에 의해 글리코실화됨을 의미한다.

2개의 단백질에서 동일한 N-글리코실화 부위는 상이한 올리고만노오스에 의해 점유될 수 있다는 것은 분명하다.

용어 "단백질"은 아미노산의 중합체를 지칭하며 특정 길이의 생성물을 의미하지 않는다; 따라서 펩티드, 올리고펩티드 및 폴리펩티드는 단백질의 정의내에 포함된다. 이 용어는 글리코실화, 아세틸화, 포스포릴화 등과 같은 단백질의 발현후 수식을 지칭하거나 또는 배제하지 않는다. 예컨대 아미노산(예컨대 비천연 아미노산, PNA 등 포함)의 1개 이상의 유사체를 함유하는 폴리펩티드, 치환된 결합 뿐만 아니라 천연산출 또는 비-천연산출의 당업계에서 공지된 다른 수식을 갖는 폴리펩티드도 상기 정의에 포함된다.

본 명세서에서 "프리-프로-단백질" 또는 "프리-단백질"은 목적하는 단백질에 결합된 프리-프로-서열을 포함하는 단백질 또는 목적하는 단백질에 결합된 프로-서열을 포함하는 단백질을 의미한다. "프리-서열"에 대한 다른 예로서, 용어 "시그널 서열", "시그널 펩티드", "리더 펩티드" 또는 "리더 서열"이 사용된다; 이들은 모두 (N)-글리코실화에 대한 전제조건인 조면 소포체(ER)에 대한 프리-단백질을 목표로하는 아미노산 서열을 지칭한다. "시그널 서열", "시그널 펩티드", "리더 펩티드" 또는 "리더 서열"은 시그널 펩티다제로 불리는 숙주 특이적 프로테아제에 의해 상기 ER의 간극 측상에서 목적하는 단백질에 결합된 시그널 서열을 포함하는 단 백질로부터 제거된다. 마찬가지로, 프리-프로-단백질은 ER의 루멘으로 전위시킬 때 프로-단백질로 전환된다. "프로"아미노산 서열의 성질에 따라서, 프리-프로-단백질을 발현하는 숙주 세포에 의해 제거될 수 있거나 제거될 수 없다. 공지된 프리-프로-아미노산 서열은 에스. 세레비시아애(S. cerevisiae) α 메이팅 인자의 α 메이팅 인자 프리-프로-서열이다.

"HCV 엔빌로프 단백질"은 HCV E1 및 HCV E2 엔빌로프 단백질 또는 그의 일부를 의미하며, 상기 단백질은 임의의 유전형의 HCV 균주로부터 유도될 수 있다. 보다 자세하게는, HCVENV는 아미노산 서열이 90% 이상 서로 동일한 서열번호 85 내지 98 및 그의 단편으로 구성된 아미노산 서열군으로부터 선택된다. "동일한" 아미노산은 상술한 바와 같이 보존되는 아미노산 군, 즉 Met, Ile, Leu 및 Val로 구성된 군; Arg, Lys 및 His로 구성된 군; Phe, Trp 및 Tyr로 구성된 군; Asp 및 Glu로 구성된 군; Asn 및 Gln로 구성된 군; Cys, Ser 및 Thr로 구성된 군; 및 Ala 및 Gly로 구성된 군으로 간주된다.

보다 자세하게는, 용어 "HCV 엔빌로프 단백질"은 글리코실화 부위 이외에 E1 또는 E2 영역의 한 개 이상의 HCV 항원결정부위를 정의하는 아미노산 서열(및/또는 아미노산 유사체)를 포함하는 폴리펩티드 또는 그의 유사체(예컨대 미모토프)에 관한 것이다. 이들 엔빌로프 단백질은 재조합적으로 발현되는 엔빌로프 단백질의 단량체, 헤테로-올리고머 또는 동종-올리고머 형태일 수 있다. 전형적으로, 항원결정부위를 규정하는 서열은 HCV의 E1 또는 E2 영역의 아미노산 서열에 상응한다(동일하거나 또는 항원결정부위를 파괴하지 않는 천연 아미노산 잔기의 유사체의 치환 을 통하여).

HCV 항원결정부위는 글리코실화 부위와 동일한 위치에 있을 수 있음이 알려져 있다.

일반적으로, 항원결정부위를 규정하는 서열은 3 또는 4개 아미노산 서열 길이, 보다 전형적으로 5, 6 또는 7개 아미노산 길이, 보다 전형적으로 8 또는 9개 아미노산 길이, 더욱 전형적으로 10개 이상의 아미노산 길이이다. 입체적 항원결정부위의 경우, 항원결정부위를 규정하는 서열의 길이는 다양할 수 있는데, 이는 이들 항원결정부위가 항원의 3차원 형상에 의해(예컨대 접힘현상) 형성되기 때문이라고 사료된다. 따라서, 항원결정부위를 규정하는 아미노산은 비교적 개수가 적을 수 있지만, 분자의 길이를 통하여 다양하게 분포되어 접힘현상을 통하여 정확한 항원결정부위 입체로 될 수 있다. 항원결정부위를 규정하는 잔기 사이의 항원 부분은 항원결정부위의 입체 구조에 중요하지 않을 수 있다. 예컨대, 이들 개제 서열의 결실 또는 항원결정부위 입체에 중요한 서열(예컨대 디술피드 결합, 글리코실화 부위에 관여되는 시스테인)이 유지되는 한 항원결정부위 입체에 영향을 주지 않을 수 있다. 입체적 항원결정부위는 동종-올리고머 또는 이종-올리고머의 서브유닛의 2개 이상의 필수 영역에 의해 형성될 수 있다.

본 명세서에서는, 지정된 폴리펩티드의 항원결정부위는 지정된 폴리펩티드에 있는 항원결정부위와 동일한 아미노산 서열을 갖는 항원결정부위 및 그의 면역학적 등가물을 의미한다. 이러한 등가물은 균주, 서브타입(=유전형), 또는 타입(그룹) 특이적 변이체를 포함하며, 예컨대 현재 공지된 서열 또는 균주는 유전형 1a, 1b, 1c, 1d, 1e, 1f, 2a, 2b, 2c, 2d, 2e, 2f, 2g, 2h, 2i, 3a, 3b, 3c, 3d, 3e, 3f, 3g, 4a, 4b, 4c, 4d, 4e, 4f, 4g, 4h, 4i, 4j, 4k, 4l, 5a, 5b, 6a, 6b, 6c, 7a, 7b, 7c, 8a, 8b, 9a, 9b, 10a, 11 (및 그의 서브타입), 12 (및 그의 서브타입) 또는 13(및 그의 서브타입) 또는 다른 새롭게 정의된 HCV (서브)타입에 속한다. 항원결정부위를 구성하는 아미노산은 선형 서열의 일부가 아닐 수 있지만, 임의 개수의 아미노산에 의해 산재될 수 있으므로, 입체적 항원결정부위를 형성할 수 있음을 주목해야한다.

본 발명의 HCV 항원은 HCV의 E1 및/또는 E2 (엔빌로프) 도메인으로부터의 입체적 항원결정부위를 포함한다. 바이러스성 엔빌로프 단백질에 상응하는 E1 도메인은 현재 HCV 폴리단백질의 아미노산 192-382에 걸쳐 존재하는 것으로 추정된다 (Hijikata 등, 1991). 포유동물 계에서 발현되면(글리코실화되면), SDS-PAGE에 의해 결정된 바와 같이 약 35 kDa의 분자량을 가질 것이다. 전에는 NS1로 불린 E2 단백질은 HCV 폴리단백질의 아미노산 384-809 및 384-746에 걸쳐 존재(Grakoui 등, 1993)하고 엔빌로프 단백질인 것으로 예상된다. 백시니아 계에서 발현되면(글리코실화되면), 약 72 kDa의 겔 분자량을 가질 것으로 생각된다. 이들 단백질 종점은 근사치임을 이해해야한다(예컨대 아미노산 730, 735, 740, 742, 744, 745, 바람직하게는 746, 747, 748, 750, 760, 770, 780, 790, 800, 809, 810, 820에서 끝남). E2 단백질은 E1, 및/또는 코어(aa 1-191), 및/또는 P7 (aa 747-809), 및/또는 NS2 (aa 810-1026), 및/또는 NS3 (aa 1027-1657), 및/또는 NS4A (aa 1658-1711) 및/또는 NS4B (aa 1712-1972) 및/또는 NS5A (aa 1973-2420), 및/또는 NS5B (aa 2421- 3011), 및/또는 E2와는 상이한 HCV 단백질의 임의 부분과 함께 발현될 수 있다. 마찬가지로, E1 단백질은 또한 E2, 및/또는 코어(aa 1-191), 및/또는 P7 (aa 747-809), 및/또는 NS2 (aa 810-1026), 및/또는 NS3 (aa 1027-1657), 및/또는 NS4A (aa 1658-1711) 및/또는 NS4B (aa 1712-1972), 및/또는 NS5A (aa 1973-2420), 및/또는 NS5B (aa 2421-3011), 및/또는 E1과는 상이한 HCV 단백질의 일부와 함께 발현될 수 있다. 이들 HCV 단백질과의 발현은 정확한 단백질 접힘현상을 얻는데 중요할 수 있다.

본 명세서에 사용한 용어 "E1"는 천연 E1과 면역학적으로 교차반응하는 유사체 및 절단된 형태를 포함하며 또 유전형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13의 E1 단백질 또는 다른 새롭게 동정된 HCV 유형 또는 서브유형을 포함한다. 본 명세서에서 사용된 용어 "E2"는 천연 E2와 면역학적으로 교차반응하는 유사체 및 절단된 형태를 포함하며 또 유전형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13의 E2 단백질 또는 다른 새롭게 동정된 HCV 유형 또는 서브유형을 포함한다. 예컨대 코돈 383과 384 사이에 복수의 코돈을 삽입하는 것 뿐만 아니라 아미노산 384-387의 결실이 카토 등(1992)에 의해 보고되어 있다. 따라서, 본 발명의 실시예 부분에서 사용된 분리물은 본 발명의 범위를 제한하기 위한 것이 아니며 또 유형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13으로부터의 HCV 분리물 또는 새로운 유전형의 HCV는 본 발명을 실시하기 위한 E1 및/또는 E2 서열의 적합한 공급원이라는 것을 알 수 있다. 유사하게, 상기 기재한 바와 같이, 본 발명의 HCV 엔빌로프 단백질과 함께 발현되는 HCV 단백질은 임의의 HCV 유형으로부터 유도될 수 있고, 또한 본 발명의 HCV 엔빌로프 단백질과 동일한 유형으로부터 유도될 수 있다.

본 명세서에서 사용된 "E1/E2"는 하나 이상의 E1 성분 및 하나 이상의 E2 성분을 함유하는 엔빌로프 단백질의 올리고머 형태를 지칭한다.

용어 "특정 올리고머" E1 및/또는 E2 및/또는 E1/E2 엔빌로프 단백질은 응집되지 않는 재조합적으로 발현된 E1 및/또는 E2 엔빌로프 단백질의 모든 가능한 올리고머 형태를 지칭한다. E1 및/또는 E2 특정 올리고머 엔빌로프 단백질은 또한 동종-올리고머 E1 또는 E2 엔빌로프 단백질(이하 참조)로도 불린다. 용어 "단일 또는 특정 올리고머성" E1 및/또는 E2 및/또는 E1/E2 엔빌로프 단백질은 단일 단량체성 E1 또는 E2 단백질(엄밀한 단어 의미대로의 단일함) 뿐만 아니라 특정 올리고머성 E1 및/또는 E2 및/또는 E1/E2 재조합적으로 발현된 단백질을 지칭한다. 본 발명에 따른 이들 단일 또는 특정 올리고머성 엔빌로프 단백질은 화학식 (E1)_x(E2)_y 에 의해 더욱 정의될 수 있으며, 이때 x는 0 내지 100의 수일 수 있고, 또 y는 0 내지 100의 수일 수 있으며, 단 x 및 y는 동시에 0이 아니다. x =1 및 y = 0일 때 상기 엔빌로프 단백질은 단량체성 E1을 포함한다.

본 명세서에 사용된 용어 "동종-올리고머"는 1개 이상의 E1 또는 E2 단량체를 함유하는 E1 또는 E2의 복합체를 지칭하며, 예컨대 E1/E1 이합체, E1/E1/E1 삼합체 또는 E1/E1/E1/E1 사합체 및 E2/E2 이합체, E2/E2/E2 삼합체 또는 E2/E2/E2/E2 사합체, E1 펜타머 및 헥사머, E2 펜타머 및 헥사머 또는 더 높은 E1 또는 E2의 동종-올리고머가 본 발명의 범위내의 "동종-올리고머"이다. 이들 올리고머는 본 출원인에 의해 출원된 WO 94/25601호 및 WO96/13590호에서 Maertens 등에 의해 기재된 바와 같은 것을 비롯한 C형 간염 바이러스의 상이한 유형 또는 서브타입으로부터 얻은 1개, 2개 또는 몇 개의 상이한 E1 또는 E2 단량체를 함유할 수 있다. 이러한 혼합된 올리고머는 본 발명의 범위내에 속하는 동종-올리고머이며 또 HCV의 보다 일반적인 진단, 예방 또는 치료를 허용한다.

본 발명에서 사용된 E1 및 E2 항원은 전체 길이의 바이러스성 단백질, 그의 실질적으로 전체 길이 버전 또는 그의 기능적 단편(예컨대 하나 이상의 항원결정부위 및/또는 글리코실화 부위를 포함하는 단편)일 수 있다. 또한, 본 발명의 HCV 항원은 목적하는 입체적 항원결정부위의 형성을 차단하거나 방해하지 않는 다른 서열을 포함할 수 있다. 입체적 항원결정부위의 존재 또는 부재는 목적하는 항원을 항체(입체적 항원결정부위에 대한 폴리클로날 혈청 또는 모노클로날)를 사용하여 스크리닝하고 그의 반응성을, 선형 항원결정부위만을 함유하는 변성버전 항원의 반응성과 비교하는 것에 의해 용이하게 결정할 수 있다. 폴리클로날 항체를 사용한 이러한 스크리닝에서는, 변성된 항원을 사용하여 폴리클로날 혈청을 먼저 흡착한 다음 항체가 목적하는 항원을 함유하고 있는지를 조사하는 것이 바람직하다.

본 발명의 HCV 단백질은 글리코실화될 수 있다. 글리코실화된 단백질은 한 개 이상의 탄수화물 기, 특히 당기를 함유하는 단백질을 의미한다. 일반적으로, 모든 진핵생물 세포는 단백질을 글리코실화할 수 있다. HCV 유전형의 상이한 엔빌로프 단백질 서열을 정렬한 후, 적합한 접힘현상과 반응성을 위해 HCV E1 단백질상 의 6개 글리코실화 부위 모두가 필요한 것은 아니다라는 것을 유추할 수 있다. 또한 위치 325에 있는 글리코실화 부위는 N-글리코실화에 의해 변형되지 않는다는 것도 알려져 있다(Fournillier-Jacob 등, 1996, Meunier 등 1999). 또한 HCV 서브타입 1b E1 단백질은 6개의 글리코실화 부위를 함유하지만, 이들 글리코실화 부위의 일부는 특정 다른 (서브)타입에는 존재하지 않는다. 4번째 탄화수소 모티프(Asn250)는 타입 1b, 6a, 7, 8 및 9에 존재하지만, 지금까지 공지된 다른 모든 타입에는 존재하지 않는다. 이러한 당-부가 모티프는 돌연변이되어 향상된 반응성을 갖는 타입 1b E1 단백질을 생성할 수 있다. 또한 타입 2b 서열은 V5 영역(Asn299상)에서 여분의 글리코실화 부위를 나타낸다. 유전형 2c에 속하는 분리물 S83은 V1 영역(Asn 상)에서 제1 탄수화물 모티프가 결여되어 있는 반면에, 모든 다른 분미물에는 존재한다(Stuyver 등 1994). 그러나, 완전히 보존된 당-부가 모티프중에서도, 탄수화물의 존재는 접힘현상에 반드시 필요한 것은 아니지만, 면역 감독의 기피에는 어떤 역할을 가질 수 있다. 따라서, 글리코실화의 역할의 확인은 글리코실화 모티프의 돌연변이에 의해 더욱 시험될 수 있다. 글리코실화 모티프(NXS 또는 NXT 서열)의 돌연변이는 N, S 또는 T에 대한 코돈을 돌연변이 유발시켜 N의 경우 그 코돈이 N과는 상이한 아미노산을 암호화하게하고, 및/또는 S인 경우 및 T인 경우 S 또는 T와 다른 아미노산을 암호화하게 한다. 다르게는, NPS 또는 NPT는 탄수화물에 의해 흔히 변형되지 않기 때문에 X 위치는 P로 돌연변이될 수 있다. 접힘현상 및/또는 반응성에 어떤 탄수화물 부가 모티프가 필요하고 필요하지 않은지를 확립한 후, 이러한 돌연변이의 조합을 실시할 수 있다. 이러한 실 험은 Maertens 등에 의해 본 명세서에 참고문헌으로 포함된 WO96/04385호의 실시예 8에 자세하게 기재되어 있다.

본 명세서에서 사용된 용어 글리코실화는 특별히 언급하지 않는 한 N-글리코실화를 의미한다.

특히, 본 발명은 코어-글리코실화되는 HCV 엔빌로프 단백질, 또는 그의 일부에 관한 것이다. 이와 관련하여, 용어 "코어-글리코실화"는 Herscovics 및 Orlean (1993)의 도 3에서 박스 구조로 나타낸 구조와 "유사한" 구조를 의미한다. 따라서, 탄수화물 구조는 10 내지 11개 단당류를 함유하는 것을 의미한다. 상기 기재내용은 참고문헌으로 본 명세서에 포함되어 있다. 용어 "유사한"은 4개 이하의 단당류가 구조에 부가되거나 또는 약 3개 이하의 단당류가 구조로부터 제거됨을 의미한다. 따라서, 본 명세서에서 말하는 코어-글리코실화 탄화수소 구조는 최소한 7개 단당류 및 최대한 15개 단당류로 구성되며 또 8, 9, 10, 11, 12, 13 또는 14개 단당류로 구성될 수 있다. 단당류는 바람직하게는 글루코오스, 만노오스 또는 N-아세틸 글루코사민을 의미할 수 있다.

본 발명의 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상이 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화되는 것을 특징으로 하는, 한 개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

본 발명의 또 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위가 올리고만노오스에 의해 점유되며, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하인 것을 특징으로 하는, 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 또한 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

본 발명의 다른 요지는 비-포유동물 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위의 개수가, 백시니아 바이러스로 감염되기 쉬운 진핵생물에서 백시니아 바이러스로부터 발현된 단백질 또는 그의 단편에 있는 N-글리코실화 부위의 개수보다 적어도 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14% 또는 15% 미만인 것을 특징으로 하는 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로 프 단백질 또는 그의 단편에 관한 것이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 N-글리코실화 부위의 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80%까지는 코어-글리코실화되어 있다. 보다 자세하게는, N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상이 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

본 발명의 다른 요지로서, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 효모 세포에서 발현산물이다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 사카로마이세스 세레비시아애 (Saccharomyces cerevisiae), 사카로마이세스 클루이베리(Saccharomyces kluyveri) 또는 사카로마이세스 우바룸 (Saccharomyces uvarum)와 같은 사카로아이세스 (Saccharomyces) 균주; 시조사카로마이세스 폼베 (Saccharomyces pombe)와 같은 시조사카로마이세스 (Schizosaccharomyces) 균주; 클루이베로마이세스 락티스 (Kluyveromyces lactis)와 같은 클루이베로마이세스 (Kluyveromyces) 균주; 야로비아 리폴리티카 (Yarowia lipolytica)와 같은 야로비아(Yarowia) 균주; 한세눌라 폴리모르파(Hansenula polymorpha)와 같은 한세눌라(Hansenula) 균주; 피치아 파스토리스(Pichia pastoris)와 같은 피치아(Pichia) 균주, 아스페르길루스(Aspergillus) 종; 뉴로스포라 크라사(Neurospora crassa)와 같은 뉴로스포라(Neurospora) 균주; 또는 슈바니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis)와 같은 슈바니오마이세스(Schwanniomyces) 균주의 세포; 또는 이들로부터 유래한 돌연변이 세포에서의 발현산물이다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 한세눌라(Hansenula) 세포에서의 발현산물이다. 더욱 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 효모, 예컨대 투니카마이신과 같은 글리코실화 억제제가 존재하지 않는 한세눌라(Hansenula) 세포에서의 발현산물이다.

본 발명의 다른 요지로서, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 상기 HCV 엔빌로프 단백질 또는 그의 단편에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유도된다. 보다 자세하게는, 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부는 하기 구조식으로 특징지워지는 단백질로부터 유도된다:

식중에서,

PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,

HCVENV는 HCV 엔빌로프 단백질 또는 그의 일부이며,

a, b, c, d, e 및 f는 0 또는 1이고, 또

"HCV 엔빌로프 단백질 또는 그의 일부에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물"은 상기 리더 펩티드의 C-말단 아미노산이 펩티드 결합을 통하여 상기 HCV 엔빌로프 단백질 또는 그의 일부의 N-말단 아미노산에 공유결합되는 것을 의미한다. 다르게는, 상기 리더 펩티드의 C-말단 아미노산은 펩티드 또는 단백질에 의해 상기 HCV 엔빌로프 단백질 또는 그의 일부의 N-말단 아미노산으로부터 분리된다. 상기 펩티드 또는 단백질은 상기 정의한 바와 같은

구조를 가질 수 있다.

HCV 엔빌로프 단백질 또는 그의 일부에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물을 포함하는 단백질로부터 목적하는 HCV 엔빌로프 단백질의 유도 또는

구조를 특징으로 하는 단백질의 유도는 프리-단백질 단백질이 발현되어 있는 세포의 단백질 분해 기전에 의해 생체내에서 실시될 수 있다. 보다 자세하게는, 조류의 리더 펩티드를 제거하는 것으로 구성된 단계는 바람직하게는 프리-단백질이 발현되어 있는 세포의 단백질 분해 기전에 의해 생체내에서 실시된다. 그러나, 상기와 같은 유도는 프리-단백질을 발현하는 세포로부터 및/또는 프리-단백질을 발현하는 세포가 생장하는 배양액으로부터 프리-단백질 및/또는 단백질을 분리 및/또는 정제한 후 및/또는 동안 시험관내에서 모두 실시될 수 있다. 다르게는, 상기 생체내 유도는 시험관내 유도와 조합되어 실시될 수 있다. 재조합적으로 발현된 프리-단백질로부터 목적하는 HCV 단백질을 유도하는 것은 가공 단계에서 단백질분해 효소를 사용하는 것을 더 포함할 수 있으며, 목적하는 단백질과 함께 존재하는 모든 또는 대부분의 오염 단백질은 분해되고 목적하는 단백질은 상기 가공성 단백질분해 효소에 견딘다. 유도와 가공과정은 서로 배타적인 과정이 아니며 동일한 단일의 단백질분해 효소를 사용하여 실시될 수 있다. 예로서 Lys-잔기가 부족한 HCV 유전형 1b(서열번호: 2)의 HCV E1 단백질을 들 수 있다. 상기 HCV E1 단백질을 함유하는 단백질 추출물을 엔도프로테이나제 Lys-C (endo-lys C)를 사용하여 분해시키는 것에 의해, E1 단백질은 분해되지 않는 반면에 1개 이상의 Lys-잔기를 함유하는 오염 단백질은 분해된다. 이러한 과정은 HCV E1 단백질의 분리 및/또는 정제를 현저히 단순화하거나 향상시킬 수 있다. 또한, 프리-단백질에 부가적인 Lys-잔기, 예컨대 리더 펩티드 및 HCV E1 단백질을 포함하는 것에 의해, HCV E1 프리-단백질로부터 리더 펩티드의 정확한 시험관내 분리를 할 수 있는 부가적 이점을 가질 수 있다. 다른 HCV E1 단백질은 위치 4, 40, 42, 44, 61, 65 또는 179 (위치 1은 E1 단백질의제1 N-말단 천연 아미노산이고, 즉 HCV 폴리단백질중의 위치 192)의 1개 이상에서 Lys-잔기를 포함할 수 있다. 상술한 바와 같은 endo-lys C를 사용할 수 있기 위해서는, 상기 Lys-잔기는 다른 아미노산 잔기, 바람직하게는 Arg-잔기로 돌연변이될 수 있다.

"정확하게 제거된" 리더 펩티드는 고효율(즉 다수의 프리-(프로-)단백질이 (프로-)단백질로 전환됨) 및 고 적합도(즉, 프리-아미노산 서열이 제거될 뿐만 아니라 상기 프리-아미노산 서열에 결합된 목적하는 단백질의 아미노산도 제거됨)로 목적하는 단백질에 결합된 시그널 서열을 포함하는 단백질로부터 상기 리더 펩티드가 제거됨을 의미한다. "고 효율로 리더 펩티드를 제거"하는 것은 프리-단백질의 약 40% 이상, 더욱 바람직하게는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%가, 프리-서열이 제거된 단백질로 전환됨을 의미한다. 다르게는, 발현된 프리-단백질의 일부가 프리-서열이 제거된 단백질로 전환되지 않으면, 이들 프리-단백질은 더욱 정제되거나 또는 정제하는 동안 제거될 수 있다.

"조류의 리소짐(CL) 리더 펩티드의 기능적 등가물"은 CL 리더 펩티드를 의미하며, 1개 이상의 아미노산은 다른 아미노산으로 치환되며 또 상기 치환은 보존적 아미노산 치환임을 의미한다. "보존적 아미노산 치환"은 보존되는 아미노산 군에 속하는 아미노산을, 보존되는 아미노산의 동일 군에 속하는 다른 아미노산으로 치환시키는 것을 의미한다. 보존되는 아미노산 군으로서는 다음을 고려할 수 있다: Met, Ile, Leu 및 Val로 구성된 군; Arg, Lys 및 His로 구성된 군; Phe, Trp 및 Tyr로 구성된 군; Asp 및 Glu로 구성된 군; Asn 및 Gln로 구성된 군; Cys, Ser 및 Thr로 구성된 군; 및 Ala 및 Gly로 구성된 군. CL 리더 펩티드에서 보존적 아미노 산 치환의 예는 위치 6에서의 자연적 변이이며, 상기 위치에서의 아미노산은 Val 또는 Ile이며; 다른 변이는 위치 17에서 생기며, 이 위치에서의 아미노산은 그 중에서 Leu 또는 Pro (서열번호: 1 참조) 이다. 생성한 CL 리더 펩티드는 기능적 등가물로 볼 수 있다. CL 리더 펩티드의 다른 기능적 등가물은, 결실 변이체 및 삽입 변이체를 비롯하여, 본 발명을 통하여 기재된 바와 같이 CL 리더 펩티드와 동일한 기술적 특징을 재현하는 리더 펩티드를 포함한다.

"A" 또는 "어댑터 펩티드"는 예컨대 리더 펩티드와 가공 부위(PS) 사이, 리더 펩티드와 목적하는 단백질 사이, PS와 목적하는 단백질 사이, 및/또는 목적하는 단백질과 PS 사이에서 링커로서 작용할 수 있거나; 및/또는 예컨대 리더 펩티드, PS 또는 목적하는 단백질의 링커 N- 또는 C-말단으로 작용할 수 있는 펩티드(예컨대 1 내지 30개 아미노산) 또는 단백질을 의미한다. 어댑터 펩티드 "A"는 특정 3차원 구조, 예컨대 α-나선형 또는 β-쉬트 구조 또는 이들을 조합한 구조일 수 있다. 다르게는, A의 3차원 구조는 잘 규정되지 않으며, 예컨대 코일드-코일 구조일 수 있다. 어댑터 A는 예컨대 프리-서열, 프로-서열, 목적하는 서열의 단백질 또는 가공 부위의 일부일 수 있다. 어댑터 A는 A가 일부인 단백질의 결실 및/또는 정제 및/또는 가공을 향상시키거나 가능하게 하는 태그(tag)로서 작용할 수 있다. A 펩티드의 일례는 his-tag 펩티드 (HHHHHH; 서열번호: 63) Hn이며, n은 6이지만, 7, 8, 9, 10, 11 또는 12일 수 있다. A-펩티드의 다른 예는 펩티드 EEGEPK (WO 98/28429호에서 Kjeldsen 등; 서열번호: 64) 또는 EEAEPK (WO 98/28429호에서 Kjeldsen 등; 서열번호: 65)를 포함하며, 목적하는 단백질의 N-말단에 존재할 때는 발효수율을 증가시키는 것으로 보고되어 있지만, 디펩티딜 아미노펩티다제에 의한 가공으로부터 목적하는 단백질의 N-말단을 보호하므로, 폴리펩티드의 균질한 N-말단을 초래할 수 있다. 동시에, 목적하는 단백질의 시험관내 성숙, 즉 상기 펩티드 EEGEPK (서열번호: 64) 및 EEAEPK (서열번호: 65)를 목적하는 단백질로부터 제거하는 것은 상기 펩티드내의 Lys-잔기의 C-말단을 분해하는 엔도-lys C를 사용함으로써 달성할 수 있다. 따라서 상기 펩티드는 어댑터 펩티드(A) 뿐만 아니라 가공 부위(PS)의 작용도 한다 (이하 참조). 어댑터 펩티드는 서열번호: 63-65, 70-72 및 74-82에 기재되어 있다. 어댑터 펩티드의 다른 예는 G4S 면역침묵(immunosilent) 링커이다. 어댑터 펩티드 또는 어댑터 단백질의 다른 예는 Stevens (Stevens 등 2000)의 표 2에 수록되어 있다.

"PS" 또는 "가공부위"는 특정 단백질 가공 또는 가공가능한 부위를 의미한다. 상기 가공은 효소적으로 또는 화학적으로 생길 수 있다. 특정 효소적 가공되기 쉬운 가공부위의 예는 IEGR↓X (서열번호: 66), IDGR↓X (서열번호: 67), AEGR↓X (서열번호: 68)을 포함하며, 이들은 모두 Arg 및 Xaa (임의 아미노산) 잔기 사이에 "↓"로 표시한 바와 같이 소의 인자 Xa 프로테아제(나가이, 케이 및 토게르센, 에이치.씨. 1984)에 의해 인식되어 분해된다. PS 부위의 다른 예는 이염기성 부위, 예컨대 Arg-Arg, Lys-Lys, Arg-Lys 또는 Lys-Arg이며, 효모 Kex2 프로테아제에 의해 분해될 수 있다(Julius, D 등 1984). PS 부위는 단염기성 Lys-부위일 수 있다. 상기 단염기성 Lys-PS-부위는 A 펩티드의 C-말단에 포함될 수 있다. C 말단의 일염기성 Lys-PS-부위를 포함하는 A 어댑터 펩티드의 예는 서열번호: 64-65 및 74-76에 기재되어 있다. His-tag (HHHHHH; 서열번호: 63)의 엑소단백질분해 제거는 디펩티딜 아미노펩티다제 I(DAPase)를 단독 사용하거나 또는 글루타민 시클로트랜스퍼라제(Qcyclase 제조) 및 피로글루타민 아미노펩티다제 (pGAPase) (Pedersen, J 등 1999)와 조합하여 실시한다. 재조합 His-태그를 포함하는 상기 엑소펩티다제(고정 금속-치환성 크로마토그래피(IMAC)에 의해 반응 혼합물로부터 펩티다제를 제거할 수 있음)는 유니자임 라보라토리스 (Hφrsholm, DK)에 의해 TAGZyme System으로서 시판되고 있다. "가공"은 일반적으로 가공 부위가 단백질에 존재할 때, 단백질을 하나 이상의 가공 부위에서 특이적으로 분해 또는 절단되는 방법 또는 과정을 의미한다. PS는 엔도프로테오리틱 분해되기 쉽거나 또는 상기 분해가 특이적일 때, 즉 단백질분해 효소를 가공하는 것에 의해 인식된 부위 이외의 부위로 확대되지 않는 엑소프로테오리틱 분해될 수 있다. 다수의 PS 부위가 서열번호: 66-68 및 83-84에 기재되어 있다.

상기 기재한 바와 같은

구조의 다양성은 일부 실시예에 의해 예시할 수 있다. 일례로서, 상기 구조는 프리-단백질에 포함되어 있는 목적하는 단백질의 C-말단에 존재할 수 있고 또 A3은 인자 Xa "IEGRX" PS 부위(서열번호: 66)와 중복되는 "VIEGR" 펩티드 (서열번호: 69)이고 또 X = A4는 히스티딘-태그 (서열번호: 63)(이때, d, e 및 f는 상기 경우 모두 1임)이다. 목적하는 HCV 단백질은 경우에 따라 IMAC에 의해 정제될 수 있다. 인자 Xa로 가공한 후, (경우에 따라 정제된) 목적하는 HCV 단백질은, 그의 C-말단에, 가공된 PS 부 위, "IEGR"(서열번호: 70)을 가질 것이다. 변이체 가공된 인자 Xa 가공부위는 IDGR(서열번호: 71) 또는 AEGR (서열번호: 72)일 수 있다. 다른 예로서,

구조는 목적하는 HCV 단백질의 N-말단에 존재한다. 또한 A1은 히스티딘-태그(서열번호: 63)이고, PS는 인자 Xa 인식 부위 (임의의 서열번호: 66-68)이며, X는 목적하는 단백질이고, a=b=1 및 c = 0 이다. 숙주세포에 의해 리더 펩티드를 정확히 제거할 때, 생긴 목적하는 HCV 단백질은 IMAC(임의적)에 의해 정제될 수 있다. 인자 Xa를 사용하여 가공한 후, 목적하는 단백질은

구조를 갖지 않을 것이다.

A1, A2, A3, A4, PS1 및 PS2는 존재하는 경우, 반복 구조로 존재함이 분명하다. 이러한 반복 구조는, 존재할 경우, 1로 카운트하며, 즉 A1이 2 반복체(A1-A1)로 생기더라도 a, b, c, d, e 또는 f는 1이다.

본 발명의 다른 요지는 시스테인 티올 기가 화학적으로 수식(修飾)된 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 다른 요지는 항원성인 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 더 다른 요지는 면역원성인 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 더 다른 요지는 T-세포 자극 항원결정부위를 포함하는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 더 다른 요지는 단량체, 동종이합체, 이종이합체, 동종올리고머 및 이종올리고머로 구성된 군으로부터 선택되는 구조에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

본 발명의 또 다른 요지는 바이러스-유사 입자에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.

1개 이상의 시스테인 잔기를 포함하지만 바람직하게는 2개 이상의 시스테인 잔기를 포함하는 상기 기재한 바와 같은 HCV 엔빌로프 단백질 또는 그의 일부에서, 시스테인 티올 기는 화학적 또는 효소적 수단에 의해 비가역적으로 보호될 수 있다. 특히, 화학적 수단에 의한 "비가역적 보호" 또는 "비가역적 차단"은 알킬화, 바람직하게는 활성 할로겐, 에틸렌이민 또는 N-(요오도에틸)트리플루오로-아세트아미드와 같은 알킬화제를 사용하여 HCV 엔빌로프 단백질을 알킬화하는 것을 의미한다. 이와 관련하여, 시스테인 티올 기의 알킬화는 티올-수소를 (CH₂)_nR (n은 0, 1, 2, 3 또는 4이고 또 R = H, COOH, NH₂, CONH₂, 페닐 또는 그의 유도체임)에 의해 치환되는 것을 의미한다. 알킬화는 예컨대 활성 할로겐 X(CH₂)_nR (식중, X는 I, Br, Cl 또는 F와 같은 할로겐임)과 같이 당업자에게 공지된 방법에 의해 실시된다. 활성 할로겐의 예는 메틸요오다이드, 요오도아세트산, 요오도아세트아미드 및 2-브로모에틸아민이다. 알킬화의 다른 방법은 NEM (N-에틸말레이미드) 또는 비오틴-NEM, 그의 혼합물 또는 에틸렌이민 또는 N-(요오도에틸)트리플루오로아세트아미드의 사용을 포함하며, 그에 의해 -H가 -CH₂-CH₂-NH₂ (Hermanson, G. T. 1996)에 의해 치환된다. 본 명세서에 사용된 용어 "알킬화제"는 본 명세서에 기재한 바와 같이 알킬 화를 실시할 수 있는 화합물을 지칭한다. 이러한 알킬화는 결국 수식된 시스테인을 초래할 것이고, 이것은 다른 아미노산을 모방할 수 있다. 에틸렌이민에 의한 알킬화는 구조적으로 유사한 리신을 초래하며, 그에 의해 트립신에 대한 새로운 분해 부위가 도입된다 (Hermanson, G.T. 1996). 유사하게, 메틸요오다이드의 사용은 메티오닌과 유사한 아미노산을 초래하는 반면, 요오도아세테이트 및 요오도아세트아미드를 사용하면 글루탐산 및 글루타민과 유사한 아미노산을 초래한다. 이와 비슷하게, 상기 아미노산은 바람직하게는 시스테인을 직접적으로 돌연변이시키는데도 사용된다. 따라서, 본 발명은 본 명세서에 기재된 HCV 엔빌로프 단백질의 하나 이상의 시스테인 잔기가 돌연변이되어 천연의 아미노산으로, 바람직하게는 메티오닌, 글루타민산, 글루타민 또는 리신으로 된 HCV 엔빌로프 단백질에도 관한 것이다. 용어 "돌연변이된"은 상기 아미노산을 암호화하는 핵산의 부위-특이적 돌연변이, 즉 예컨대 PCR에 의한 부위-특이적 돌연변이 또는 (Sambrook, J. 등 1989)에 기재된 바와 같은 올리고뉴클레오티드-매개 돌연변이를 통하는 것과 같은 당업자에게 공지된 방법을 지칭한다. 본 발명의 실시예 부분의 경우 알킬화는 특별히 언급하지 않는 한 알킬화제인 요오도-아세트아미드를 사용하는 것을 의미함을 이해해야한다.

또한 정제과정에서, 본 발명의 HCV 단백질 또는 그의 일부의 시스테인 티올-기는 가역적으로 보호될 수 있음을 이해해야한다. 가역적 보호의 목적은 HCV 단백질 또는 그의 일부를 안정화시키기 위한 것이다. 특히, 가역적 보호 후 황-함유 기능적 기(예컨대 티올 및 디술피드)는 비-반응성 조건으로 유지된다. 황-함유 기 능적 기는 다른 화합물과 반응할 수 없는데, 예컨대 다음과 같은 디술피드 결합을 형성하거나 변경하는 경향을 손실하였다:

티올 및/또는 디술피드 잔기 사이의 상기 반응은 분자상호간 과정에 한정되지 않지만, 분자내에서도 생길 수 있다.

본 명세서에서 사용된 용어 "가역적 보호" 또는 "가역적 차단"은 수식제를 시스테인 티올 기에 공유결합시키는 것 뿐만 아니라 HCV 단백질 자체의 환경을 조작하여 시스테인 티올-기의 산화환원 상태가 후속 정제단계를 통하여 영향을 받지 않고 유지되게하는(보호하는) 것을 의미한다. 시스테인 티올 기의 가역적 보호는 화학적으로 또는 효소적으로 실시할 수 있다.

본 명세서에서 사용된 용어 "효소적 수단에 의한 가역적 보호"는 예컨대 아실 트랜스퍼라제와 같은 효소에 의해 매개되는 가역적 보호를 의미할 수 있으며, 상기 아실 트랜스퍼라제는 팔미토일 아실트랜스퍼라제와 같은 티오-에스테르화를 촉진하는데 관여한다(하기 내용 참조).

본 명세서에서 사용된 용어 "화학적 수단에 의한 가역적 보호"는 다음과 같은 가역적 보호를 고려할 수 있다:

1. 예컨대 술폰화 반응 및 티오-에스테르화 반응과 같은 시스테이닐을 가역적으로 수식시키는 수식제(modification agent)에 의함;

술폰화는 디술피드 브릿지에 관여하는 티올 또는 시스테인이 수식되어 S-술포네이트를 형성하는 반응이다: RSH → RS-SO₃ ^- (Darbre, A. 1986) 또는 RS-SR → 2 RS-SO₃ ^- (술피톨리시스; (Kumar, N. 등 1986)). 술폰화 시약은 예컨대 Na₂SO ₃ 또는 나트륨 테트라티오네이트이다. 술폰화를 위한 후자 시약은 10-200 mM 농도, 보다 바람직하게는 50-200 mM의 농도로 사용된다. 경우에 따라 술폰화반응은 예컨대 Cu²⁺ (100 μM-1mM) 또는 시스테인 (1-10 mM)과 같은 촉매 존재하에서 실시될 수 있다.

상기 반응은 단백질 변성조건 뿐만 아니라 천연 조건하에서 실시될 수 있다 (Kumar, N 등 1985, Kumar, N 등 1986). 티오에스테르 결합 형성 또는 티오-에스테르화 반응은 다음과 같이 특징지워질 수 있다:

RSH + R'COX → RS-COR'

(식중, X는 바람직하게는 화합물 R'CO-X에 있는 할로게나이드이다).

2. 예컨대 중금속, 특히 Zn²⁺, Cd²⁺, 모노-, 디티오- 및 디술피드 화합물 (예컨대 아릴- 및 알킬메탄티오술포네이트, 디티오피리딘, 디티오모르폴린, 디히드로리포아미드, 엘만 시약, 알드로티올^TM (알드리히 제조) (Rein, A 등 1996), 디티오카르바메이트) 또는 티올화제 (예컨대 글루타티온, N-아세틸 시스테인, 시스테인아민)와 같은 본 발명의 시스테인을 가역적으로 수식시키는 수식제에 의함. 디티오 카르바메이트는 술피드릴 기와의 반응성을 부여하는 R₁R₂NC(S)SR₃ 작용기를 갖는 광범위한 범위의 분자를 포함한다. 티올 함유 화합물은 바람직하게는 0.1-50 mM 농도, 보다 바람직하게는 1-50 mM 농도, 더욱 바람직하게는 10-50 mM 농도로 사용된다.

3. 티올 상태를 보존하는(안정화시키는) 수식제, 특히 DTT, 디히드로아스코르베이트, 비타민 및 유도체, 만니톨, 아미노산, 펩티드 및 유도체(예컨대 히스티딘, 에르고티오네인, 카르노신, 메티오닌), 갈레이트, 히드록시아니솔, 히드록시톨루엔, 히드로퀴논, 히드록시메틸페놀 및 이들의 유도체와 같은 산화방지제가 10μM-10 mM 농도, 보다 바람직하게는 1-10 mM 농도로 존재하는 것에 의함.

4. 티올 안정화 조건에 의해, 예컨대 (i) 금속 이온(Zn²⁺, Mg²⁺), ATP와 같은 보조인자, (ii) pH 제어 (예컨대 대부분의 단백질의 경우 pH ~5 이거나 또는 pH는 바람직하게는 티올 pKa -2임; 예컨대 역상 크로마토그래피에 의해 정제된 펩티드의 경우는 pH ~2).

상기 (1), (2), (3) 및 (4)에 기재된 바와 같은 가역 보호를 조합하면 유사하게 순수하고 재구성된 HCV 단백질을 얻을 수 있다. 실제로, 예컨대 Z103 (Zn 카르노신)과 같은 조합 화합물은 바람직하게는 1-10 mM 농도로 사용될 수 있다. 가역보호는 또한 상기 기재한 바와 같은 수식기 또는 보호 이외에, 펩티드 주쇄를 파괴하지 않고 효소적으로 또는 화학적으로 가역적인 시스테이닐 보호방법을 의미함을 이해해야한다. 이와 관련하여, 본 발명은 특히 티오에스테르 결합이 티오에스 테르분해효소 (티오에스테라제), 염기성 완충액 조건(Beekman, N, J. 1997)에 의해 또는 히드록실아민 처리(Vingerhoeds, M. H. 등 1996)에 의해 분해되는 전통적인 화학적 합성법(상기 기재)에 의해 제조된 펩티드를 주목하고 있다.

티올 함유 HCV 단백질은 예컨대 (1) 디술피드 결합을 함유하는 분해가능한 커넥터 아암(connector arm) [예컨대, 고정화된 5,5' 디티오비스(2-니트로벤조산) (Jayabaskaran, C. 등 1987) 및 활성화된 티올-세파로오스 4B (파마시아 제조)상에서의 공유결합 크로마토그래피] 또는 (2) 고정화된 리간드인 아미노헥사노일-4-아미노페닐아르신을 함유하는 친화성 크로마토그래피 수지상에서 정제될 수 있다. 후자 친화성 매트릭스는 단백질의 정제를 위해 사용되었고, 산화환원 조절 및 산화적 스트레스의 표적인 티올 단백질 처리된다 (Kalef, E. 등 1993).

가역적 보호는 펩티드의 용해화 및 추출을 증가시키기 위해 사용될 수 있다 (Pomroy, N.C. 및 Deber, C. M. 1998).

가역적 보호 및 티올 안정화 화합물은 단량체성, 중합체성 또는 리포좀 형태로 존재할 수 있다.

시스테인 잔기의 가역적 보호상태의 제거는 예컨대 다음과 같이 화학적으로 또는 효소적으로 실시될 수 있다:

- 1-200 mM의 농도, 보다 바람직하게는 50-200 mM 농도의 환원제, 특히 DTT, DTE, 2-머캅토에탄올, 디티오나이트, SnCl₂, 붕소수소화나트륨, 히드록실아민, TCEP.

- 예컨대 pH증가에 의한 티올 안정화 조건 또는 티올안정화제의 제거.

- 0.01-5 μM의 농도, 더욱 특히 0.1-5 μM 농도 범위의 효소, 특히 티오에스테르 분해효소, 글루타르레독신, 티오레독신.

- 상기 기재한 화학적 및/또는 효소적 조건의 조합.

시스테인 잔기의 가역적 보호상태의 제거는 시험관내 또는 생체내에서, 예컨대 세포내 또는 개체내에서 실시될 수 있다.

정제 과정에서, 시스테인 잔기는 경우에 따라 비가역적으로 차단되거나 또는 상기 수록한 가역적 수식제에 의해 치환될 수 있다.

본 발명에 따른 환원제는 시스테인 잔기, 예컨대 "S-S" 디술피드 브릿지에 있는 황을 환원시키거나, 시스테인 잔기의 탈술폰화 (RS-SO₃ ^- → RSH)할 수 있는 물질이다. 산화방지제는 티올상태를 보존하거나 또는 "S-S"형성 및/또는 변경을 최소화시키는 물질이다. "S-S" 디술피드 브릿지의 환원은 화학적 반응이며, 그에 의해 디술피드는 티올 (-SH)로 환원된다. WO 96/04385호에서 Maertens 등에 의해 기재된 디술피드 브릿지를 파괴하는 물질 및 방법은 본 명세서에 참고문헌으로 포함된다. "S-S" 환원은 (1) 효소적 캐스케이드 경로에 의해 또는 (2) 화합물을 환원시키는 것에 의해 달성할 수 있다. 티오레독신, 글루타르레독신과 같은 효소는 디술피드의 생체내 환원에 관여하는 것으로 알려져 있으며 또한 시험관내에서 "S-S"브릿지를 환원시키는데 효과적으로 알려져 있다. 디술피드 결합은 pH 7.0에서, 환원된 티오레독신에 의해 신속하게 분해되며, DTT와의 반응에 대해 상응하는 속도 상수보다 10⁴배 더 큰 2차 속도로 분해된다. 환원 키네틱은 단백질 용액을 1 mM DTT 또는 디히드로리포아미드와 예비배양하는 것에 의해 현저하게 증가될 수 있다 (Holmgren, A. 1979). 단백질 디술피드 브릿지를 환원시킬 수 있는 티올 화합물은 예컨대 디티오트레이톨(DTT), 디티오에리트리톨 (DTE), β-머캅토에탄올, 티오카르바메이트, 비스(2-머캅토에틸)술폰 및 N,N'-비스(머캅토아세틸)히드라진 및 나트륨-디티오나이트이다. 모노클로날 항체에서 디술피드 브릿지의 환원에 아주 유용한 (Thakur, M. L. 등 1991) 것으로 알려져 있는 아스코르베이트 또는 염화주석(SnCl₂)과 같은 티올기를 갖지 않는 환원제는 HCV 단백질의 환원에도 사용될 수 있다. 또한, pH값에서의 변화는 HCV 단백질의 산화환원 상태에 영향을 줄 수 있다. 붕소수소화나트륨 처리는 펩티드중의 디술피드 브릿지의 환원에 효과적인 것으로 드러났다 (Gailit, J. 1993). 트리스(2-카르복시에틸)포스핀 (TCEP)은 낮은 pH에서 디술피드를 환원시킬 수 있다 (Burns, J. 등 1991). 셀레놀은, DTT 또는 붕소수소화 나트륨이 환원제로 사용될 때, 디술피드가 티올로 환원되는 것을 촉진한다. 상업적으로 시판되는 디셀레나이드인 셀레노시스테아민은 촉매의 전구체로서 사용되었다 (Singh, R. 및 Kats, L. 1995).

용어 "면역원성"은 단백질 또는 물질이 면역반응을 유발할 수 있는 능력을 지칭한다. 면역반응은 항원의 도입에 대한 몸의 전체적 반응으로서, 항체 형성, 세포성 면역, 과민반응 또는 면역학적 내성을 포함한다. 세포성 면역은 T-헬퍼 세포 반응 및/또는 CTL-반응이라 칭한다.

용어 "항원성"은 단백질 또는 물질이 항체형성을 유발하거나 세포성 반응을 유도하는 능력을 지칭한다.

본 발명에 따른 표현 "T-세포 자극 항원결정부위"는 T-세포 또는 CTL-세포를 각각 자극할 수 있는 항원결정부위를 지칭한다. T-헬퍼 세포 자극 항원결정부위는 자신의 아미노산 서열에 (임의의) T-세포 자극 항원결정부위를 함유하는 폴리펩티드에 대한 림프증식성 반응을 모니터링하는 것에 의해 선택될 수 있다. 상기 림프증식성 반응은 환자혈청으로부터 얻은 말초혈액 단핵성 세포(PMBC)를 시험관내에서 T-세포 자극 활성에 대해 시험할 다양한 농도의 펩티드를 사용하여 자극시킨 다음 방사성표지된 티미딘 흡수량을 계산하는 것을 포함하는 T-헬퍼 에세이법에 의해 측정할 수 있다. CTL-자극 항원결정부위는 ⁵¹Cr 방출을 이용한 세포독성 세포의 용균(lytic) 활성을 측정하는 세포독성 T-세포 (CTL) 에세이법을 이용하여 선택할 수 있다. 자극지수(항원-자극된 배양액의 평균 cpm/대조용 배양액의 평균 cpm)가 1 이상, 바람직하게는 2 이상, 가장 바람직하게는 3 이상일 때 증식은 양성으로 간주된다.

본 발명의 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함하는 조성물에 관한 것이다. 상기 조성물은 약제학적으로 허용되는 담체를 포함할 수 있고 또 의약 또는 백신일 수 있다.

본 발명의 다른 요지는 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 의약 또는 백신을 포함한다.

본 발명의 다른 요지는 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부 및 경우에 따라 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV 특이적 면역반응을 유발하기 위한 약제학적 조성물을 포함한다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 상기 약제학적 조성물은 포유동물에서 HCV 특이적 항체를 유발할 수 있거나, 포유동물에서 T-세포 작용을 유발할 수 있다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 상기 약제학적 조성물은 예방적 조성물 또는 치료적 조성물일 수 있다. 특정 구체예로서, 상기 포유동물은 사람이다.

"포유동물"은 사람을 비롯한 포유강(Mammalia)의 고등 척추동물로 이해되며, 출생, 체모 및 암컷에 유선세포를 갖고 있어서 어린애들을 먹이기 위한 젖을 분비하는 것을 특징으로 한다. 포유동물은 비인간 영장류 및 트리메라 마우스(Zauberman 등 1999)도 포함한다.

"백신" 또는 "의약"은 일부 또는 전면적이든 질병이든, 급성 또는 만성 질병이든 질병으로부터 보호할 수 있는 조성물이다; 백신 또는 의약은 예방적 백신 또는 의약일 수 있다. 백신 또는 의약은 이미 병에 걸린 개체의 치료에 유용하며, 이 경우 치료적 백신 또는 의약이라 불린다. 마찬가지로, 약제학적 조성물은 예방적 및/또는 치료적 조성물인 경우 예방적 및/또는 치료적 목적으로 사용될 수 있다.

본 발명의 HCV 엔빌로프 단백질은 비오티닐화된 형태(WO 93/18054호에 설명됨)로 사용될 수 있거나 및/또는 뉴트랄라이트 아비딘(Neutralite Avidin) (미국 오리건 유진에 소재하는 Molecular Probes Inc. 제조), 아비딘 또는 스트랩트아비딘에 착화될 수 있다. "백신" 또는 "의약"은 활성 물질 이외에, 그 자체로는 조성물을 받아들이는 개체에 유해한 항체 생산을 유발하지 않고 보호를 유발하지도 않는 적합한 부형제, 희석제, 담체 및/또는 보조제일 수 있는 "약제학적으로 허용되는 담체" 또는 "약제학적으로 허용되는 보조제"를 포함할 수 있다. 적합한 담체는 전형적으로 단백질, 다당류, 폴리락틱산, 폴리글리콜산, 중합성 아미노산, 아미노산 공중합체 및 불활성 바이러스 입자와 같은 전형적으로 크고 느리게 대사되는 거대분자이다. 이러한 담체는 당업자에게 공지되어 있다. 조성물의 효과를 향상시키기 위한 바람직한 보조제는 다음을 포함하지만, 이들에 한정되는 것은 아니다: 수산화알루미늄, WO 93/19780호에 기재된 바와 같은 3-O-데아실화된 모노포스포릴 지질 A와 조합된 알루미늄, WO 93/24148호에 기재된 인산알루미늄, 미국특허 4,606,918호에 기재된 N-아세틸-무라밀-L-트레오닐-D-이소글루타민, N-아세틸-노르무라밀-L-알라닐-D-이소글루타민, N-아세틸무라밀-L-알라닐-D-이소글루타밀-L-알라민 2-(1'2'디팔미토일-sn-글리세로-3-히드록시포스포릴옥시)에틸아민, 모노포스포릴 지질 A를 함유하는 RIBI (ImmunoChem Research Inc. 제조, 미국 미네소타 해밀톤 소재), 해독된 엔도톡신, 트레할로오스-6,6-디미콜레이트 및 2% 스쿠알렌/Tween 80 유제중의 세포벽 구조(MPL + TDM + CWS). 세 개 성분 MPL, TDM 또는 CWS의 어떤 것도 단독으로 또는 2개씩 조합될 수 있다. MPL은 RC-529로 불리는 그의 합성 유사체로 교체될 수 있다. 부가적으로, Stimulon (캠브릿지 바이오사이언스 제조, 미국 미네소타 와세스터 소재), SAF-1 (Syntex 제조) 또는 ISS (Dynavax 제조) 또 는 CpG (Coley Pharmaceuticals 제조)와 같은 세균성 DNA-기제 보조제와 같은 보조제는 QS21 및 3-de-O-아세틸화 모노포스포릴 지질 A (WO 94/00153)의 조합물, 또는 MF-59 (Chiron 제조), 또는 폴리[디(카르복시라토페녹시)포스파젠] 기제 보조제 (Virus Research Institute 제조), 또는 Optivax (Vaxcel, Cythx 제조)와 같은 블록공중합체 기제 보조제 또는 Algammulin 및 GammaInulin (Anutech 제조)과 같은 이눌린-기제 보조제, 불완전 프로인드 보조제 (IFA) 또는 Gerbu 제제 (Gerbu Biotechnik 제조)와 같은 보조제도 사용될 수 있다. 완전 프로인드 보조제(CFA)는 비-인간 용도 및 연구 목적에 사용될 수 있다. "백신 조성물"은 또한 고유하게 비독성이고 비치료성인 부형제 및 희석제, 예컨대 물, 염수, 글리세롤, 에탄올, 습윤제 또는 유화제, pH 완충 물질, 보존제 등을 더 함유할 수 있다. 전형적으로, 백신 조성물은 주사가능하게, 예컨대 액체 용액 또는 현탁액으로 제조된다. 주사는 피하주사, 근육내 주사, 정맥주사, 복강내주사, 지주막하 주사, 피내주사일 수 있다. 다른 형태의 투여는 이식, 좌약, 경구 섭취, 장내 적용, 흡입, 에어로졸화 또는 경비 분무 또는 점적투여를 포함한다. 주사하기 전, 액체 전색제상에서 용액 또는 액제 전색제중에서 현탁액으로 되기 적합한 고상 형태도 제조될 수 있다. 이러한 제제는 보조제 효과를 향상시키기 위하여 리포좀에 유화되거나 유제화될 수 있다. 폴리펩티드는 사포닌과 함께 면역자극 복합체(Immune Stimulating Complex), 예컨대 Quil A(ISCOMS)에 혼입될 수 있다. 백신 조성물은 유효량의 활성물질 뿐만 아니라 상술한 성분 이외의 것도 포함한다. 활성성분의 "유효량"은 단일 투여 또는 일련의 투여의 일부로서 그 양을 개체에게 투여하면 질병의 예방 또는 치료에 효과적 이거나 또는 소망하는 효과를 유발하는데 효과적이라는 것을 의미한다. 이 양은 처리될 개체의 건강 및 신체적 조건, 처리될 개체의 분류학적 그룹 (예컨대 인간, 비인간 영장류, 영장류 등), 효과적인 면역반응에 도달하는 개별 면역 계의 능력, 소망하는 보호정도, 백신의 제형, 치료 의사의 평가, 감염 병원체의 균주 및 다른 관련 인자에 따라서 달라질 수 있다. 상기 양은 일반적인 실험을 통하여 결정될 수 있는 비교적 넓은 범위내에 포함될 수 있다. 통상, 상기 양은 0.01 내지 1000 ㎍/투여, 보다 자세하게는 0.1 내지 100 ㎍/투여로 다양할 수 있다. 투여 처리는 단일 투여 스케쥴 또는 다중 투여 스케쥴일 수 있다. 백신은 다른 면역조절제와 함께 투여될 수 있다.

본 발명의 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 제조하는 방법에도 관한 것이다.

HCV 엔빌로프 단백질 또는 그의 일부를 제조하는 방법은 예컨대 HCV 엔빌로프 단백질 또는 그의 일부를 암호화하는 오픈 리딩 프레임을 포함하는 재조합 핵산 또는 벡터를 사용하여 숙주 세포를 형질전환시키는 것을 포함하며, 상기 숙주 세포는 상기 HCV 엔빌로프 단백질 또는 그의 일부를 발현할 수 있다. 상기 방법은 또한 상기 숙주 세포를 적합한 배지에서 배양하여 상기 단백질의 발현을 얻고, 발현된 단백질을 상기 숙주 세포의 배양액으로부터 또는 상기 숙주 세포로부터 분리하는 것을 더 포함한다. 상기 분리는 (i) 카오트로픽제(chaotropic agent) 존재하에서 상기 숙주 세포를 용균시키거나, (ii) 분리된 단백질중에 있는 시스테인 티올 기를 가역적 또는 비가역적일 수 있게 화학적으로 수식시키거나 및 (iii) 헤파린 친화성 크로마토그래피 처리하는 등 1개 이상을 포함할 수 있다.

"카오트로픽제"의 예는 염화 구아니디늄 또는 요소이다. 일반적으로, 카오트로픽제는 물의 수소결합 구조를 파괴할 수 있는 화학물질이다. 농축 용액에서, 이들은 소수성 효과를 감소시키기 때문에 단백질을 변성시킬 수 있다.

"재조합 핵산"은 재조합 효소 분해, PCR, 결찰, 탈인산반응, 인산화반응, 돌연변이, 이종 세포에서 발현을 위한 코돈의 개질과 같은 재조합 DNA 수법 조작의 하나 이상에 처리된 천연 또는 합성 기원의 핵산을 의미한다. 일반적으로, 재조합 핵산은 천연산출 핵산의 단편이거나 또는 천연적으로 관련이 없는 2개 이상의 핵산 단편을 포함하거나 또는 완전한 합성 핵산이다.

본 명세서에 사용된 용어 "폴리뉴클레오티드", "폴리핵산", "핵산서열", "뉴클레오티드 서열", "핵산 분자", "올리고뉴클레오티드", "프로브" 또는 "프라이머"는 임의 길이 또는 형상의 중합체 형태 (예컨대 측쇄 DNA)의 뉴클레오티드, 리보뉴클레오티드, 데옥시리보뉴클레오티드, 펩티드 뉴클레오티드 또는 로크(locked)된 뉴클레오티드, 또는 이들의 조합물을 지칭한다. 상기 용어는 또한 이중 가닥(ds) 및 단일가닥(ss) 폴리뉴클레오티드 뿐만 아니라 삼중가닥 폴리뉴클레오티드를 포함한다. 상기 용어는 메틸화, 고리화 및 "캡스"와 같은 공지 뉴클레오티드 수식 및 1개 이상의 천연산출 뉴클레오티드를 이노신과 같은 유사체 또는 HEG (헥에틸렌 글리콜)과 같은 비-증식성 단량체로의 치환을 포함한다. 리보뉴클레오티드는 NTP로 표시하고, 데옥시리보뉴클레오티드는 dNTP로 표시하며 또 디데옥시리보뉴클레오티드는 ddNTP로 표시한다.

뉴클레오티드는 일반적으로 방사선, 화학적발광, 형광적으로, 인광적으로 또는 적외선 염료에 의해 또는 표면향상된 라만 표지 또는 플라스몬 공명 입자(PRP)에 의해 표지될 수 있다.

상기 용어 "폴리뉴클레오티드", "폴리핵산", "핵산 서열", "뉴클레오티드 서열", "핵산 분자", "올리고뉴클레오티드", "프로브" 또는 "프라이머"는 또한 펩티드 핵산(PNA), 주쇄가 당이 아니라 N-(2-아미노에틸)-글리신 단위체로 구성된 슈도펩티드인 DNA 유사체를 포함한다. PNA는 DNA의 특징과 유사하고 상보적 핵산 가닥과 결합된다. PNA의 중성 주쇄는 보통 얻어지는 것 보다 더 강한 결합과 더 큰 특이성을 초래한다. 또한, PNA의 독특한 화학적, 물리적 및 생물학적 특성은 강력한 바이오분자 도구, 안티센스 및 항원제, 분자 프로브 및 바이오센서를 생성하기 위해 이용될 수 있다. PNA 프로브는 DNA 프로브보다 더 짧을 수 있고 또 일반적으로 6 내지 20개 염기 길이이며, 가장 최적인 길이는 12 내지 18개 염기 길이이다(Nielsen, P. E. 2001). 상기 용어는 또한 리보오스 고리가 2'-산소와 4'-탄소 사이의 메틸렌 결합에 의해 속박되는 RNA 유도체인 로크된 핵산(LNA)를 더 포함한다. LNA는 DNA 또는 RNA 표적 서열에 대하여 예상치 못한 결합 친화력을 나타낸다. LNA 뉴클레오티드는 올리고머화될 수 있고 또 키메라 또는 혼합-mer성 LNA/DNA 또는 LNA/RNA 분자에 혼입될 수 있다. LNA는 배양액에 대하여 비독성으로 보인다(Orum, H. 및 Wngel, J. 2001, Wahlestedt, C. 등 2000). 일반적으로, DNA, RNA, PNA 및 LNA의 키메라 또는 혼합-mer는 티민이 우라실로 치환된 임의의 어느 하나로 간주될 수 있다.

상기 내용으로부터, 본 발명은 본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질 또는 본 발명에 따른 조성물의 HCV 백신 조성물 제조를 위한 용도에 관한 것임이 분명하다. 특히, 본 발명은 만성 HCV 보균자에서 HCV에 대한 면역성을 유발하기 위한 본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질의 용도에도 관한 것이다. 보다 특히, 본 발명은 소량의 HCV 치료 약물 투여와 조합하거나 또는 조합하지 않고도, 공지된 인터페론 요법과 같은 다른 요법을 실시하기 전, 실시함과 동시에 또는 실시한 후, 만성 HCV 보균자에서 HCV에 대한 면역성을 유발하기 위한 상기 정의한 바와 같은 코어-글리코실화된 HCV 엔빌로프 단백질의 용도에 관한 것이다. 이러한 조성물은 간 이식전 또는 이식후 또는 예컨대 주사바늘 손상과 같은 예상할 수 있는 감염 후 이용될 수 있다.

본 발명의 다른 요지는,

(i) HCV 엔빌로프 단백질 또는 그의 일부가 항-HCV 항체와 복합체를 형성하게하는 조건하에서, 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 항-HCV 항체를 갖는 것으로 추정되는 샘플과 접촉시키는 단계,

(ii) (i)에서 형성된 복합체를 검출하는 단계, 및

(iii) (ii)로부터 상기 샘플에 항-HCV 항체가 존재하는지를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플중에서 항-HCV 항체의 존재를 검출하는 방법에 관한 것이다.

특정 실시예로서, 상기 방법의 단계(i)에서의 접촉은 경쟁적 조건하에서 실시된다. 상기 방법에 대한 다른 특정 실시예로서, 상기 HCV 엔빌로프 단백질 또는 그의 일부는 고형 지지체에 부착된다. 다른 실시예로서, 항-HCV 항체를 포함할 것으로 추정되는 샘플은 생물학적 샘플이다.

본 발명의 다른 요지는 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트에 관한 것이다. 특정 실시예로서, 상기 HCV 엔빌로프 단백질 또는 그의 일부는 고형 지지체에 부착된다. 다른 실시예로서, 항-HCV 항체를 포함할 것으로 추정되는 샘플은 생물학적 샘플이다.

본 명세서에 사용된 용어 "생물학적 샘플"은 개체로부터 분리된 조직 또는 체액 샘플이며, 예컨대 혈청, 플라즈마, 림프액, 피부의 외부 분비물, 호흡관, 내장 또는 생식기-비뇨기, 난모세포, 눈물, 타액, 우유, 혈액세포, 종양, 기관, 위장 분비, 점액, 척수액, 대변, 소변, 정자 등과 같이 외부로 분비되는 물질을 들 수 있고, 이들에 한정되는 것은 아니다.

본 발명의 HCV 엔빌로프 단백질 또는 그의 일부는 HCV의 검출 및/또는 HCV의 유전자형 확정, HCV 질병의 진단/모니터링을 위한 면역에세이법과 같은 방법에 혼입되기에 적합하거나 또는 치료제로서 적합하다.

본 발명에 따른 면역에세이법과 같은 방법은 HCV에 의해 감염된 개체로부터 혈청에 있는 항체에 의해 확인되는 선형(펩티드인 경우) 및 입체적 항원결정부위를 유지하는 본 발명의 HCV 엔빌로프 단백질을 이용한다. 본 발명의 HCV E1 및 E2 항원은 항체를 검출하기 위한 공지된 항원을 이용하는 임의의 에세이 포맷으로 이용될 수 있다. 물론, HCV 입체적 항원결정부위를 변성시키는 포맷은 피해야하거나 또는 변경되어야한다. 이들 에세이법의 공통되는 특징은 항원이 성분중에 존재하는 항체와 결합하게하는 조건하에서 HCV 항체를 함유할 것으로 추정되는 체내 성분을 항원과 접촉시키는 것이다. 항원과 시편을 배양한 다음 항원으로 구성된 면역 복합체의 검출을 실시한다.

면역에세이법의 디자인은 다양하게 변화될 수 있으며, 많은 포맷이 당분야에 공지되어 있다. 실험방법은 예컨대 고형 지지체 또는 면역침전을 이용할 수 있다. 대부분의 에세이법은 라벨링된 항체 또는 폴리펩티드의 사용을 포함하며; 상기 라벨은 예컨대 효소적, 형광적, 화학발광적, 방사활성적 또는 염료 분자일 수 있다. 면역 복합체로부터의 신호를 증폭시키는 에세이법은 또한 공지되어 있다; 그 예는 비오틴 및 아비딘 또는 스트렙트아비딘을 이용하는 에세이법, 및 ELISA 및 RIA 에세이법과 같은 효소-라벨링된 및 매개된 면역에세이법이다.

면역에세이법은 비제한적으로 이종 또는 동종 포맷일 수 있고 또 표준형 또는 경쟁형일 수 있다. 이종 포맷의 경우, 폴리펩티드는 전형적으로 고형 매트릭스 또는 지지체에 결합되어 배양후 폴리펩티드로부터 샘플의 분리를 촉진시킨다. 사용될 수 있는 고형 지지체의 예는 니트로셀룰로오스 (예컨대 막 또는 마이크로티터 웰 형태), 염화폴리비닐 (예컨대, 쉬트 또는 마이크로티터 웰), 폴리스티렌 라텍스 (예컨대, 비이드 또는 마이크로티터 플레이트), 폴리비닐리덴 플루오라이드 (Immunolon^TM 으로 공지), 디아조화 종이, 나일론 막, 활성화된 비이드, 및 단백질 A 비이드이다. 예컨대, Dynatech Immunolon^TM 1 또는 Immunolon^TM 2 마이크로티터 플레이트는 이종 포맷으로 사용될 수 있다. 항원 폴리펩티드를 함유하는 고형 지지체는 전형적으로 시험 샘플로부터 분리한 후 및 결합항체를 검출하기 전에 세척된다. 표준 및 경쟁 표맷은 당업계에 공지되어 있다.

동종 포맷의 경우, 시험 샘플은 용액에서 항원 조합과 배양된다. 예컨대, 형성된 항원-항체 복합체를 석출하는 조건하에서 실시된다. 이들 에세이에 대한 표준 및 경쟁적 포맷은 당업계에 공지되어 있다.

표준 포맷의 경우, 항체-항원 복합체에서 항-HCV 항원과 같은 항체의 양은 직접적으로 조절된다. 이것은 상기 항-HCV 항체와 같은 항체상의 항원결정부위를 인식하는 라벨링된 항-이종발생성(xenogeneic) (항-인간) 항체가 복합체 형성으로 인하여 결합되는지 여부를 결정하는 것에 의해 달성된다. 경쟁적 포맷의 경우, 샘플에서 상기 항-HCV 항체와 같은 항체의 양은 공지 양의 복합체중의 (라벨링된) 항체 (또는 기타 경쟁적 리간드) 또는 항원의 결합에 대한 경쟁적 효과를 조절하는 것에 의해 감소된다.

항원-항체 복합체는 포맷에 따라 다수의 공지 수법에 의해 검출될 수 있다. 예컨대, 복합체중의 항-HCV 항체와 같은 라벨링되지 않은 항체는 라벨(예컨대 효소 라벨)과 복합체를 이룬 항-이종발생성 Ig 콘쥬게이트를 사용하여 검출될 수 있다.

면역석출법 또는 응집 에세이 포맷에서, 항원과 항체 사이의 반응은 용액 또는 현탁액으로부터 석출되는 단백질 덩어리를 형성하며 석출물의 가시층 또는 필름 을 형성한다. 항체가 시편 또는 샘플에 존재하지 않으면, 이러한 석출물은 형성되지 않는다.

입체적 항원결정부위로 구성된 본 발명의 HCV 엔빌로프 단백질 또는 특정 부위는 상기 면역에세이법에 사용하기 위한 키트 형태로 팩케이지된다. 상기 키트는 별도의 용기에 천연 HCV항원, 대조 항체 제제(양성 및/또는 음성), 에세이 포맷이 동일한 신호 생성 시약(예컨대 효소 기질)을 필요로 할 때 라벨이 신호를 직접적으로 발생하지 않으면, 라벨링된 항체를 함유한다. 천연 HCV 항원은 고형 매트릭스에 이미 결합되어 있거나 매트릭스에 결합되기 위한 시약과 별도로 존재한다. 상기 에세이법을 실시하기 위한 지시사항(문헌, 테이프, CD-롬 등)은 키트에 포함되어 있다.

선택된 고상은 중합성 또는 유리 비이드, 니트로셀룰로오스, 마이크로입자, 반응 트레이의 마이크로웰, 시험 관 및 자기 비이드를 포함할 수 있다. 신호 발생 화합물은 효소, 발광 화합물, 발색물질, 방사성 요소 및 화학발광성 화합물을 포함할 수 있다. 효소의 예는 알칼리성 포스파타제, 꽃양배추 퍼옥시다제 및 베타-갈락토시다제를 포함한다. 인헨서 화합물의 예는 비오틴, 항-비오틴 및 아비딘을 포함한다. 인헨서 화합물 결합 막의 예는 비오틴, 항-비오틴 및 아비딘을 포함한다. 관절염 인자 유사 물질의 효과를 차단하기 위하여, 시험 샘플을 관절염 인자 유사 물질의 효과를 차단하기에 충분한 조건에 처리시킨다. 이들 조건은 시험 샘플을 다량의 항-인간 IgG와 접촉시켜 혼합물을 형성시킨 다음, 관절염 인자 유사 물질을 실질적으로 갖지 않는 반응 혼합물 생성물을 형성하기에 충분한 시간 및 조건하에 서 상기 혼합물을 배양하는 것을 포함한다.

특히, 본 발명은 진단 키트를 제조하기 위한 본 발명에 따른 HCV 엔비로프 단백질 또는 그의 일부의 용도에 관한 것이다.

본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질은 면역원성이 높고 또 체액성 및 세포성 면역반응을 자극하기 때문에, 본 발명은 본 발명의 올리고머성 입자 또는 정제된 단일 HCV 엔빌로프 단백질을 포함하는 HCV 관련 T 세포 반응을 검출하기 위한 키트에 관한 것이다. HCV T 세포 반응은 WO 95/12677호에서 Leroux-Roels 등에 의해 기재된 바와 같이 측정될 수 있다.

본 발명의 다른 요지는 경우에 따라 약제학적으로 허용되는 보조제를 포함하는 유효량의 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는, 포유동물에서 HCV 특이적 면역반응을 유발하는 방법에 관한 것이다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는 상기 방법은 포유동물에서 HCV 특이적 항체를 유발하기 위해 또는 포유동물에서 특정 T-세포 작용을 유발하기 위해 사용될 수 있다. 상기 방법에서, 상기 투여는 예방적 목적, 즉 예방적 투여 또는 치료적 목적, 즉 치료적 투여일 수 있다.

본 발명의 다른 요지는 경우에 따라 약제학적으로 허용되는 담체를 포함하는 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는 포유동물을 면역화시키는 방법에 관한 것이다.

본 발명은 또한 경우에 따라 약제학적으로 허용되는 담체를 포함하는 본 발 명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는, HCV에 감염된 포유동물을 치료하는 방법에 관한 것이다.

상기 기재한 본 발명의 요지 또는 상기 요지에 특이적인 실시예는 진핵생물에서의 발현산물이고 2개의 상이한 HCV 엔빌로프 단백질에 대하여 상기 기재한 동일한 글리코실화 특성에 의해 특징지워지는 목적하는 단백질에도 적용된다.

보다 자세하게는, 본 발명은 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는, 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 보다 자세하게는, N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상은 N-글리코실화 부위가 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

본 발명의 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위가 올리고만노오스에 의해 점유되며, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하인 것을 특징으로 하는, 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 또한 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.

특히, 상기 목적하는 분리된 단백질 또는 그의 단편은 한세눌라(Hansenula) 세포와 같은 효모 세포에서의 발현산물이다. 상기 목적하는 분리된 단백질 또는 그의 단편은 바이러스성 엔빌로프 단백질 또는 그의 단편, 예컨대 HCV 엔빌로프 단백질 또는 HBV(B형 간염) 엔빌로프 단백질, 그의 단편이다. 다른 바이러스성 엔빌로프 단백질의 예는 HIV (인간 면역결핍 바이러스) 엔빌로프 단백질 gp120 및 플라비리데아애(Flavirideae)에 속하는 바이러스의 바이러스성 엔빌로프 단백질을 포함한다. 일반적으로, 상기 목적하는 분리된 단백질 또는 그의 단편은 본 발명의 N-글리코실화 특징을 필요로하는 단백질일 수 있다.

"HCV-재조합 백시니아 바이러스"는 HCV 단백질 또는 그의 일부를 암호화하는 핵산 서열을 포함하는 백시니아 바이러스를 의미한다.

본 명세서에 기재된 "HCV 엔빌로프 단백질로 형성된 HCV 바이러스-유사 입 자", "HCV 엔빌로프 단백질로 형성된 올리고머 입자"는 스스로가 1 또는 2개의 E1 및/또는 E2 단량체로 구성되는 HCV E1 및/또는 E2 엔빌로프 단백질의 몇 개의 기본 단위를 함유하는 특정 성질 및 형상의 구조로 정의된다. 본 발명의 입자는 감염성 HCV RNA 게놈을 갖고 있지 않는 것으로 정의됨이 분명하다. 본 발명의 입자는 비어져 있을 수 있고 지질, 세제, HCV 코어 단백질 또는 보조제 분자가 혼입될 수 있는 엔빌로프 단백질의 쉘로 구성되는 구형입자의 고급 입자일 수 있다. 후자 입자는 아포리포단백질 B 또는 저밀도 리포단백질과 같은 리포좀 또는 아포리포단백질에 의해, 또는 특정 기관 또는 조직에 대해 입자를 표적화시키는 기타 수단에 의해 캡슐화될 수 있다. 상기 경우, 빈 구형 입자는 흔히 "바이러스-유사 입자" 또는 VLP라 칭한다. 다르게는, 고급 입자는 고상의 구형입자일 수 있으며, 완전한 구형은 HCV E1 또는 E2 엔빌로프 단백질 올리고머로 구성되며, 이때 지질, 세제, HCV 코어 단백질 또는 보조제 분자는 더욱 혼입될 수 있거나, 또는 다르게 리포좀 또는 아포리포단백질에 의해, 예컨대 아포리포단백질 B, 저밀도 리포단백질에 의해 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화하기 위한 다른 수단에 의해 캡슐화될 수 있다. 입자는 흔히 원형(하기 참조)이고 또 HCV 엔빌로프 단백질의 단일층 1개 이상을 함유하지 않는 소형 구조(상기 기재한 비워있거나 고형의 구형 구조)로 구성된다. 이러한 소형 입자의 전형적인 예는 적은 수의 HCV 엔빌로프 단백질, 흔히 4 내지 16개로 구성되는 장미모양 구조이다. 후자의 특정 예는 E1의 8 내지 10개 단량체를 함유하는 것으로 예시된 바와 같이 0.2% CHAPS중에서 E1으로 수득한 소형 입자를 포함한다. 이러한 장미모양 구조는 평면형으로 구성되며 원형, 예컨대 바퀴 형태이다. 지질, 세제, HCV 코어 단백질 또는 보조제 분자는 부가적으로 혼입될 수 있거나, 또는 작은 입자가 리포좀 또는 아포리포단백질, 예컨대 아포리포단백질 B 또는 저밀도 리포단백질에 의해, 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화시키는 다른 수단에 의해 캡슐화될 수 있다. 더 작은 입자는유사한 적은 개수의 HCV E1 또는 E2 엔빌로프 단백질로 구성된 작은 구형 또는 글로불라 구조를 형성할 수 있고, 지질, 세제, HCV 코어 단백질, 또는 보조제 분자는 부가적으로 혼입되거나, 또는 리포좀 또는 아포리포단백질, 예컨대 아포리포단백질 B 또는 저밀도 리포단백질에 의해, 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화시키는 다른 수단에 의해 캡슐화될 수 있다. 상기 정의된 입자의 크기(즉, 입경)은 당업자에게 공지된 동적 광산란 수법(실시예 부분 참조)에 의해 측정된 바와 같이 보통 1 내지 100 nm, 보다 바람직하게는 2 내지 70 nm, 더욱 바람직하게는 2 내지 40 nm, 3 내지 20 nm, 5 내지 16 nm, 7 내지 14 nm 또는 8 내지 12 nm 이다.

특히, 본 발명은,

(i) HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;

(ii) 상기 HCV E1 및/또는 HCV E2 유전자 또는 그의 일부를 발현시키는 단계; 및

(iii) 상기 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일 부를 상기 세포 배양액으로부터 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어 글리코실화된 C형간염 바이러스 (HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.

본 발명은 또한,

(iii) 형질전환된 숙주 세포를 용균시켜 상기 세포내 발현된 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어 글리코실화된 C형간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.

본 발명은,

(i) 2개 이상의 Cys-아미노산을 포함하는 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;

(iii) 상기 Cys-아미노산이 화학적 및/또는 효소적 수단에 의해 가역적으로 보호되는 상기 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 상기 배양액으로부터 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어-글리코실화된 C형간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.

본 발명은,

(iii) 형질전환된 숙주 세포를 용균처리하여 상기 Cys-아미노산이 화학적 및/또는 효소적 수단에 의해 가역적으로 보호되는 상기 세포내 발현된 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어-글리코실화된 C형 간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.

본 발명은 특히 헤파린 친화성 크로마토그래피를 포함하는 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.

따라서, 본 발명은 화학적 수단이 술폰화인 것을 특징으로 하는 상기 기재한 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.

따라서, 본 발명은 Cys-아미노산의 가역적 보호는 화학적 및/또는 효소적 수단에 의해 비가역적 보호로 변경되는 것을 특징으로 하는, 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.

본 발명은 또한 상기 화학적 수단에 의한 비가역적 보호가 요오도-아세트아미드인 것을 특징으로 하는, 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.

따라서, 본 발명은 상기 화학적 수단에 의한 비가역적 보호가 NEM 또는 비오틴-NEM 또는 그의 혼합물인 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 단편을 정제하는 방법에 관한 것이다.

본 발명은 HCV 코어, E1, E2, P7, NS2, NS3, NS4A, NS4B, NS5A 및/또는 NS5B 단백질 또는 그의 일부를 또한 포함하는 상기 정의한 바와 같은 조성물에도 관한 것이다. 본 발명에 따른 코어-글리코실화된 단백질 E1, E2 및/또는 E1/E2는 예컨대 코어, P7, NS3, NS4A, NS4B, NS5A 및/또는 NS5B와 같은 기타 HCV 항원과 조합될 수 있다. 이들 NS3 단백질의 정제는 바람직하게는 시스테인 잔기의 가역적 수식을 포함하고, 또 더욱 바람직하게는 시스테인의 술폰화를 포함한다. 이러한 가역적 수식을 얻기 위한 술폰화를 비롯한 방법은 Maertens 등(PCT/EP99/02547호)에 의해 NS3 단백질에 대해 개시되었다. 후술한 문서의 모든 정의를 비롯한 전체 내용은 본 발명에 참고문헌으로 포함되어 있음을 유념해야한다.

또한 본 발명은 코어-글리코실화된 엔빌로프 단백질을 일련의 시간 및 화합물의 일부로서 사용하는 것을 특징으로 하는 HCV에 대한 면역을 유발하기 위한 본 명세서에 기재된 바와 같은 코어-글리코실화된 엔빌로프 단백질의 용도에도 관한 것이다. 이와 관련하여, 용어 "일련의 시간 및 화합물"은 면역반응을 유발하기 위해 사용된 화합물을 개체에 시간 간격을 두고 투여하는 것을 의미한다. 후자 화합물은 하기 성분을 더 포함할 수 있다: 코어-글리코실화된 엔빌로프 단백질, HCV DNA 백신 조성물, HCV 폴리펩티드. 이 점에서, 시리즈는 다음을 투여하는 것을 포함한다:

(i) 코어-글리코실화된 엔빌로프 단백질과 같은 HCV 항원을 시간 간격을 두고 투여; 또는

(ii) 코어-글리코실화된 엔빌로프 단백질 올리고머 입자 및 HCV DNA 백신 조성물을 포함하는 HCV DNA 백신 조성물과 조합된 코어-글리코실화된 엔빌로프 단백질과 같은 HCV 항원을 동시에 투여하거나, 또는 교대 시간 간격을 비롯한 상이한 시간 간격으로 투여하거나, 또는

(iii) 시간 간격을 두고 다른 HCV 펩티드와 함께 (i) 또는 (ii)를 조합하여 실시.

이렇게하여, HCV DNA 백신 조성물은 E1-, E2-, E1/E2-펩티드, NS3 펩티드, 기타 HCV 펩티드를 비롯한 HCV 엔빌로프 펩티드, 또는 상기 펩티드의 일부를 암호화하는 핵산을 포함하는 것이 분명하다. 또한, 상기 HCV 펩티드는 E1-, E2-, E1/E2-펩티드, NS3 펩티드, 기타 HCV 펩티드를 비롯한 HCV 엔빌로프 펩티드 또는 그의 일부를 포함한다. 용어 "기타 HCV 펩티드"는 HCV 펩티드 또는 그의 단편을 의미한다. 상기 계획 (ii)에서, HCV DNA 백신 조성물은 HCV 엔빌로프 펩티드를 암호화하는 핵산을 우선적으로 포함한다. 상기 계획의 (ii)에서, HCV DNA 백신 조성물은 바람직하게는 HCV-NS3 DNA 백신 조성물과 조합되어 HCV 엔빌로프 펩티드를 암호화하는 핵산으로 더욱 바람직하게 구성된다. 이렇게 하여, HCV DNA 백신 조성물은 전사 조절 요소에 기능적으로 결합된, 상기와 같은 HCV 펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함한다. 본 명세서에서는, "플라스미드 벡터"는 결합된 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 바람직한 벡터는 결합된 핵산을 자동 복제 및/또는 발현할 수 있는 벡터이다. 일반적으로, 여기에 한정되는 것은 아니라, 플라스미드 벡터는 환형 이중가닥 DNA 루프이고, 이 벡터 형태에서는 염색체에 결합되지 않는다. 본 명세서에서 이용된 바와 같이, "폴리뉴클레오티드 서열"은 데옥시리보핵산(DNA)와 같은 폴리뉴클레오티드를 의미하며, 필요한 경우, 리보핵산(RNA)을 의미한다. 상기 용어는 등가물로서, 뉴클레오티드 유사체 및 단일(센스 또는 안티센스) 및 이중가닥 폴리뉴클레오티드로부터 제조된 RNA 또는 DNA의 유사체를 포함하는 것으로 이해되어야한다. 본 명세서에서는, 용어 "전사 조절 요소"는 살아있는 척추세포에 도입되면 세포성 기전에 작용하여 폴리뉴클레오티드에 의해 암호화되는 번역산물을 생성하게 하는 필수 조절서열을 함유하는 뉴클레오티드 서열을 지칭한다. 용어 "기능적으로 결합된"은 성분이 통상의 작용을 실시하도록 구성된 배치를 지칭한다. 따라서, 뉴클레오티드 서열에 기능적으로 결합된 전사조절서열은 상기 뉴클레오티드 서열의 발현에 영향을 줄 수 있다.

당업자는 상이한 전사 프로모터, 터미네이터, 캐리어 벡터 또는 특정 유전자 서열이 성공적으로 사용될 수 있음을 숙지하고 있을 것이다. 다르게는, DNA 백신은 아데노바이러스, 카나리아 수두 바이러스, MVA 등과 같은 생존 벡터를 통하여 전달될 수 있다.

본 발명은 하기 실시예에 의해 더욱 자세하게 설명한다. 이들 실시예는 예시하기 위한 것으로 어떠한 의미로든 제한을 의미하지 않는다.

도 1은 서열번호 6에 정의된 바와 같은 서열을 갖는 벡터 pGEMT-E1sH6RB의 개략도이다.

도 2는 서열번호 9에 정의된 바와 같은 서열을 갖는 벡터 pCHH-Hir의 개략도이다.

도 3은 서열번호 12에 정의된 바와 같은 서열을 갖는 벡터 pFPMT121의 개략도이다.

도 4는 서열번호 13에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CHH-E1-H6 의 개략도이다.

도 5는 서열번호 16에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-MFa-E1-H6의 개략도이다.

도 6은 서열번호 17에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-MFa-E1-H6 의 개략도이다.

도 7은 서열번호 20에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL-E1- H6 의 개략도이다.

도 8은 서열번호 21에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E1-H6 의 개략도이다.

도 9는 서열번호 22에 정의된 바와 같은 서열을 갖는 벡터 pSP72E2H6 의 개략도이다.

도 10은 서열번호 23에 정의된 바와 같은 서열을 갖는 벡터 pMPT121 의 개략도이다.

도 11은 서열번호 24에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-MFa-E2-H6 의 개략도이다.

도 12는 서열번호 25에 정의된 바와 같은 서열을 갖는 벡터 pMPT-MFa-E2-H6 의 개략도이다.

도 13은 서열번호 28에 정의된 바와 같은 서열을 갖는 벡터 pMF30의 개략도이다.

도 14는 서열번호 32에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E2-H6 의 개략도이다.

도 15는 서열번호 35에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL-E1 의 개략도이다.

도 16은 서열번호 36에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E1의 개략도이다.

도 17은 서열번호 39에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL- H6-E1-K-H6 의 개략도이다.

도 18은 서열번호 40에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-H6-K-E1 의 개략도이다.

도 19는 서열번호 41에 정의된 바와 같은 서열을 갖는 벡터 pYIG5 의 개략도이다.

도 20은 서열번호 42에 정의된 바와 같은 서열을 갖는 벡터 pYIG5E1H6 의 개략도이다.

도 21은 서열번호 43에 정의된 바와 같은 서열을 갖는 벡터 pSY1의 개략도이다.

도 22는 서열번호 44에 정의된 바와 같은 서열을 갖는 벡터 pSY1aMFE1sH6a 의 개략도이다.

도 23은 서열번호 45에 정의된 바와 같은 서열을 갖는 벡터 pBSK-E2sH6의 개략도이다.

도 24는 서열번호 46에 정의된 바와 같은 서열을 갖는 벡터 pYIG5HCCL-22aH6 의 개략도이다.

도 25는 서열번호 47에 정의된 바와 같은 서열을 갖는 벡터 pYYIGSE2H6 의 개략도이다.

도 26은 서열번호 48에 정의된 바와 같은 서열을 갖는 벡터 pYIG7 의 개략도이다.

도 27은 서열번호 49에 정의된 바와 같은 서열을 갖는 벡터 pYIG7E1 의 개략 도이다.

도 28은 서열번호 50에 정의된 바와 같은 서열을 갖는 벡터 pSY1YIG7E1s 의 개략도이다.

도 29는 서열번호 51에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaA 의 개략도이다.

도 30은 서열번호 52에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD' 의 개략도이다.

도 31은 서열번호 53에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE' 의 개략도이다.

도 32는 서열번호 58에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD'E1sH6 의 개략도이다.

도 33은 서열번호 59에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE'E1sH6 의 개략도이다.

도 34는 서열번호 60에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD'E2sH6의 개략도이다.

도 35는 서열번호 61에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE'E2sH6 의 개략도이다.

도 36은 서열번호 62에 정의된 바와 같은 서열을 갖는 벡터 pUC18MFa 의 개략도이다.

도 37. MFα-E2-H6-발현 한세눌라 폴리모르파(Hansenula polymorpha)로부터 발현된 IMAC-정제된 E2-H6 단백질의 크기 배제 크로마토그래피의 용출 프로필 (실시예 15 참조). X축은 용출 부피(mL)를 나타낸다. 용출 프로필을 통과하는 수직선은 수집된 분획을 나타낸다. "P1"는 모아진 분획 4-9, "P2"는 모아진 분획 30-35, 그리고 "P3"는 모아진 분획 37-44를 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출부피(mL)를 나타낸다.

도 38. 크기 배제 크로마토그래피(도 37 참조) 이후 수집된 상이한 푸울(pool) 및 분획을 비환원성 SDS-PAGE에 의해 분석한 다음 폴리아크릴아미드 겔을 은 염색하였다. 분석된 푸울("P1", "P2", 및 "P3") 및 분획(16-26)은 은-염색된 겔의 사진의 상부에서 나타난다. 좌측(레인"M")에서는 분자 질량 마커의 크기를 나타낸다.

도 39. 도 37에 도시한 바와 같은 크기 배제 크로마토그래피의 분획 17-23을 모아서 알킬화시켰다. 그후, 단백질물질을 엔도 H 처리하여 탈글리코실화시켰다. 미처리 물질 및 엔도 H-처리된 물질을 SDS-PAGE 겔상에서 분리하여 PVDF 막에 블로팅시켰다. 이 블럿을 아미도 블랙으로 염색시켰다.

레인 1: 엔도 H-처리전 알킬화된 E2-H6

레인 2: 엔도 H-처리후 알킬화된 E2-H6

도 40은 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 발현된 E1의 세포 용균물의 웨스턴-블럿 분석이다. 웨스턴-블럿은 E1-특이적 모노클로날 항체 IGH201을 사용하여 개발되었다.

레인 1-4: E1-H6에 결합된 닭의 리소짐 리더 펩티드를 암호화하는 뉴클레오 티드 서열을 포함하는 pSY1YIG7E1s (서열번호: 50, 도 28)에 의해 형질전환된 사카로마이세스(Saccharomyces) 클론에서 각기 발현된 지 2, 3, 5 또는 7일 후의 발현산물.

레인 5-7: E1-H6에 결합된 α-메이팅 인자 리더 펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 pSY1aMFE1sH6aYIG1 (서열번호: 44, 도 22)에 의해 형질전환된 사카로마이세스(Saccharomyces) 클론에서 각기 발현된 지 2, 3 또는 5일 후의 발현산물.

레인 8: 나타낸 크기를 갖는 분자량 마커.

레인 9: HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 정제된 E1s.

도 41. 에이치. 폴리모르파(H. polymorpha)에 의해 CL-E2-H6에서 부터 E2-H6 까지 발현되고 가공된 고정화된 이온 친화성 크로마토그래피(IMAC)-정제된 E2-H6 단백질의 분석(실시예 17 참조). 상이한 세척 분획(레인 2 내지 4) 및 용출 분획(레인 5 내지 7)에 있는 단백질은 환원성 SDS-PAGE 실시한 다음 겔을 은 염색(A, 도면 상부)하거나 또는 E2에 관한 특정 모노클로날 항체를 사용한 웨스턴 블럿(B, 도면 하단)에 의해 분석하였다. 분자량 마커의 크기는 좌측에 나타낸다.

도 42. 에이치. 폴리모르파(H. polymorpha)에 의해 생산된 술폰화된 H6-K-E1 단백질을 정제하기 위한 Ni-IDA 칼럼(Ni²⁺가 로딩된 Chelating Sepharose FF, 파마시아 제조)상에서 제1 IMAC 크로마토그래피 단계의 용출 프로파일(실시예 18 참 조). 상기 칼럼은 20 mM 이미다졸이 보충된 완충액 A(50 mM 포스페이트, 6m GuHCl, 1% Empigen BB (v/v), pH 7.2)로 균형을 이루었다. 샘플을 적용한 후, 칼럼을 20 mM 및 50 mM 이미다졸을 각각 함유하는 완충액 A를 사용하여 순차적으로 세척하였다 (크로마토그램상에 나타낸 바와 같음). 각기 50 mM 이미다졸 및 200 mM 이미다졸이 보충된 완충액 B(PBS, 1% empigen BB, pH 7.2)를 순차적으로 적용하여 His-태깅된 생성물의 추가의 세척 및 용출단계를 실시하였다 (크로마토그램상에 나타낸 바와 같음). 분획을 모았다: 세척 푸울 1(분획 8 내지 11, 50 mM 이미다졸에 의해 세척됨). 용출된 물질을 별도의 분획 63 내지 72로 수집하거나 용출 푸울(분획 63 내지 69)로서 수집하였다. Y-축은 흡수도(mAU)(milli absorbance units)를 나타낸다. X축은 용출 부피(mL)를 나타낸다.

도 43. 에이치. 폴리모르파(H. polymorpha)에 의해 발현되고 가공된 IMAC-정제된 H6-K-E1 단백질(도 42 참조)의 분석. 세척 푸울 1(레인 12) 및 용출 분획 63-72(레인 2 내지 11)중의 단백질은 환원성 SDS-PAGE를 실시한 다음 겔을 은 염색(A, 상부 도면)하여 분석하였다. IMAC 전의 샘플(레인 2), 유동 푸울(레인 4), 세척 푸울 1(레인 5) 및 용출 푸울(레인 6)에 존재하는 단백질은 E1에 대한 특이적인 모노클로날 항체를 사용한 웨스턴 블럿(B, 하부 도면; 레인 3에서는 어떤 샘플도 로딩되지 않았음)에 의해 분석하였다. 분자량 마커(레인 M)의 크기는 좌측에 나타낸다.

도 44. Endo Lys-C를 갖는 H6-K-E1 (정제: 도 42 참조)의 시험관내 가공으 로 기인한 E1의 정제에 대한 Ni-IDA 칼럼(Ni²⁺가 로딩된 Chelating Sepharose FF) 상에서 제2 IMAC 크로마토그래피 단계의 용출 프로필. 유량은 E1s-생성물의 존재에 대해 스크리닝된 상이한 분획(1 내지 40)으로 수집되었다. H6-K-E1으로부터 가공된 완전 E1를 함유하는 분획(7 내지 28)을 모았다. Y축은 mAU로 나타낸 흡수도이다. X축은 용출부피(mL)이다.

도 45. 비오티닐화된 헤파린과 반응하는 특정 E1s 단백질 밴드를 나타내는 웨스턴 블럿 분석(실시예 19 참조). HCV-재조합 백시니아 바이러스-감염된 포유동물 세포 배양액으로부터 정제되거나 또는 에이치. 폴리모르파(H. polymorpha)에 의해 발현된 E1s 제제를 분석하였다. 수직선으로부터 우측에 있는 패널은 비오티닐화된 E1 특정 모노클로날 IGH200에 의해 생긴 웨스턴-블럿을 도시한다. 수직선으로부터 좌측에 있는 패널은 비오티닐화된 헤파린을 사용하여 생긴 웨스턴-블럿을 도시한다. 이들 결과로부터, 글리코실화가 덜된 E1s는 헤파린에 대하여 높은 친화성을 갖는다고 결론지을 수 있다.

레인 M: 분자량 마커 (좌측에 나타낸 분자량)

레인 1: 포유동물 세포로부터 얻으며, 분리하는 동안 알킬화된 E1s.

레인 2: 에이치. 폴리모르파(H. polymorpha)에 의해 발현되며 분리하는 동안 술폰화된 E1s-H6.

레인 3: 에이치. 폴리모르파(H. polymorpha)에 의해 발현되며 분리하는 동안 알킬화된 E1s-H6.

레인 4: 레인 2에 로딩된 것과 동일 재료이지만 디티오트레이톨에 의해 처리되어 술폰화된 Cys-티올기를 Cys-티올로 전환시킴.

도 46. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 술폰화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E2-H6의 크기 배제 크로마토그래피(SEC) 프로필. 더 연구하기 위해 사용된 VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.

도 47. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 알킬화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E2-H6의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.

도 48. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 술폰화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E1의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.

도 49. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 알킬화된 형태의 정제된 에이치. 폴리모르파(H. polymorpha)-발현된 E1의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.

도 50. 도 48 및 49에 기재한 바와 같이 크기 배제 크로마토그래피(SEC)를 실시한 후 분리된 VLP를 SDS-PAGE(환원성 조건하) 및 웨스턴 블럿 분석. 좌측 패널: 은-염색된 SDS-PAGE 겔. 우측 패널: E1에 대한 특정 모노클로날 항체(IGH201)를 사용한 웨스턴 블럿. 레인 1: 분자량 마커 (좌측에 나타낸 분자량); 레인 2: 술폰화된 E1을 함유하는 VPS의 푸울 (도 48 참조); 레인 3: 알킬화된 E1을 함유하는 VLP의 푸울 (도 49 참조). 실시예 20 또한 참조.

도 51. 포유동물 세포에서 생산된 E1 ("M") 또는 한세눌라(Hansenula)-생산된 E1 ("H")를 ELISA 고형 지지체상에 피복함으로써, 포유동물 세포에서 생산된 E1을 사용하여 마우스를 백신처리한 후(패널 상부) 또는 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 하부) 혈청에 존재하는 항체의 종점 역가를 결정한다. 종점 역가(배가-희석)는 Y축상에 나타낸다. 실시예 22 참조.

도 52. 한세눌라(Hansenula)-생산된 E1을 알킬화("A") 또는 술폰화("S") 시킨 다음 ELISA 고형 지지체상에 피복함으로써, 알킬화된 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 상부), 또는 술폰화된 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 하부) 혈 청에 존재하는 항체의 종점 역가를 결정한다. 수평 선은 평균 항체 역가를 나타낸다. 종점 역가(배가-희석)는 Y축상에 나타낸다. 실시예 23 참조.

도 53. HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1 및 에이치. 폴리모르파(H. polymorpha)에 의해 생산된 HCV E1을 직접적으로 ELISA 플레이트에 피복하였다. 항체의 종점 역가는 포유동물 세포에 의해 생산된 E1으로 백신처리된 침팬지의 혈청 (상부 패널) 및 포유동물 세포에 의해 생산된 E1에 대한 쥐의 모노클로날 항체의 혈청(하부 패널)에서 결정하였다. 침팬지 요란(Yoran)과 마티(Marti)를 예방적으로 백신처리하였다. 흑색 막대: 포유동물 세포에 의해 생산된 E1에 의해 피복된 ELISA 플레이트. 빈 막대: 한세눌라(Hansenula)에 의해 생산된 E1으로 피복된 ELISA 플레이트. 종점 역가(배가-희석)는 Y축에 나타낸다. 실시예 24 또한 참조.

도 54. 재조합 백시니아 바이러스-감염된 포유동물 세포로부터 방출된 올리고당 및 한세눌라(Hansenula)에 의해 생산된 E1-H6 단백질로부터 방출된 올리고당의 형광-보조된 탄수화물 겔 전기영동.

레인 1: 좌측에 단당류의 개수를 나타낸 글루코오스 사다리 표준 (3 내지 10, G3 내지 G10으로 표시).

레인 2: 포유동물 세포에 의해 생산된 (알킬화된) E1으로부터 방출된 25 ㎍ N-결합된 올리고당.

레인 3: 한세눌라(Hansenula)에 의해 생산된 (알킬화된) E1-H6으로부터 방출된 25 ㎍ N-결합된 올리고당.

레인 4: 100 피코몰의 말토테트라오스.

실시예 25 또한 참조.

도 55. 이 도면은 표준 올리고만노오스, Man-9 (도 55. A), Man-8 (도 55. B), Man-7 (도 55. C), Man-6 (도 55.D) 및 Man-5 (도 55.E)의 단순화된 구조를 도시한다. "Man" = 만노오스; "GlcNAc" = N-아세틸글루코사민; "α" = 2개 만노오스 사이의 α-결합; "β" = 2개 만노오스 사이의 β-결합; "(1-3)" , "(1-4)" 및 "(1-6)" = 2개 만노오스 사이의 (1-3), (1-4) 및 (1-6) 결합을 각각 나타낸다. 도 55.B 및 도 55.C에서 괄호는 괄호로부터 좌측에 있는 각각 2 및 1개의 만노오스 잔기가 괄호로부터 우측에 있는 3개 만노오스 잔기의 2 및 1에 대하여 α(1-2) 결합으로 결합됨을 나타낸다. 실시예 26 또한 참조.

도 56. 치토바이오스에 결합된 10개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 각 말단 만노오스 잔기는 비-말단 만노오스 잔기에 대하여 α1-3 결합에 의해 연결된다. 얇은 상방향 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합(이 올리고만노오스에는 적용되지 않음)을 나타내고, 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α1-2 결합 만노오스의 제거후 α-만노시다제에 의해 분해되기 쉬운 올리고당 결합(상기 올리고만노오스에는 적용되지 않음)을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 57. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만 노오스를 도시한다. 상기 올리고만노오스에서, 1개 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합된다. 얇은 상방향 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α1-2 결합 만노오스의 제거후 α-만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 58. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-9를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단성 만노오스 잔기에 결합된다. 얇은 상방을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 59. 치토바이오스에 결합된 8개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-8를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-3 또는 α1-6 결합에 의해 비-말단성 만노오스 잔기에 결합되므로 이 구조는 α1-2 만노시다제에 의한 분해에 충분히 견딜 수 있게 된다. 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분 해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 60. 치토바이오스에 결합된 7개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-7을 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-3 결합에 의해 비-말단성 만노오스 잔기에 결합되므로 이 구조는 α1-2 만노시다제에 의한 분해에 충분히 견딜 수 있게 된다. 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 61. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단성 만노오스 잔기에 결합된다. 얇은 상방향을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 또는 좌측을 나타내는 화살표는 α 1-2 결합된 만노오스의 제거후 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.

도 62. 치토바이오스에 결합된 1 또는 2개의 글루코오스 잔기 및 8개의 만노오스 잔기로 구성된 임의의 글루코오스-함유 올리고당을 도시한다. 상기 올리고당에서, A- 또는 B-브랜치 (도면에서 "A →" 및 "B→")의 말단 α1-2 결합된 만노오스 잔기의 하나는 (Glc)Glc로 표시한 바와 같이 괄호의 좌측에 1 또는 2개의 글 루코오스 잔기를 갖고 있다. 얇은 상방을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합은 말단 만노오스 잔기에 대하여 글루코오스를 부착하고 있지 않음을 나타낸다. 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α 1-2 결합된 만노오스의 제거후 α만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 가능한 반응 산물의 개요는 실시예 26의 표 10에 나타낸다.

도 63. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 Man-9의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.

크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 Man-9의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 Man-5 및 Man-6의 혼합물의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 Man-9를 1시간 및 철야 배양한 후 4'-β-만노실 치토바이오스의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 Man-9를 철야 배양한 후 치토바이오스의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.

도의 상단에 글자 A 내지 K로 표시한 피이크는 다음을 의미한다: A, 치토바이오스; B, 4'-β-만노실-치토바이오스; C, Man-2; D, Man-3; E, Man-4; F, Man-5; G, Man-6; H, Man-7; I, Man-7; J, Man-8; 및 K, Man-10. 실시예 26 또한 참조.

도 64. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유도된 올리고당의 반응 산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.

크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.

도 65. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 백시니아 감염된 포유동물 세포에서 생산된 E1으로부터 유도된 올리고당의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다 음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.

크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출 을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.

도 66. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유도된 올리고당의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.

크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매구배를 도시한다.

도 67. 한세눌라(Hansenula)에 의해 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 E1 단백질의 SDS-PAGE 분석 및 쿠마씨 브릴리언트 블루 염색.

레인 1: 좌측에 나타낸 분자량을 갖는 분자량 마커; 레인 2: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화 E1 (10 ㎍); 레인 3: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화된 E1 (5 ㎍); 레인 4: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화된 E1 (2.5 ㎍); 레인 5: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (10 ㎍); 레인 6: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (5 ㎍); 레인 7: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (2.5 ㎍). 실시예 27 또한 참조.

도 68. 글리코실 제거된 단백질의 트립신 단편(박스로 표시한 서열)을 나타내는 HCV E2-H6 단백질의 서열(서열번호: 5). 글리코실화된 Asn-잔기는 PNGase F 효소에 의해 Asp-잔기로 전환되며 이는 서열하에서 "^*"로 표시한다. Asn-잔기는 Asp-N 엔도프로테이나제(endoproteinase)에 의해 단백질 분해되기 쉽다. E2-H6에 서 가능한 N-글리코실화 부위는 HCV 폴리단백질내 번호에 따른 N₄₁₇, N₄₂₃, N₄₃₀, N₄₄₈, N₄₇₈, N₅₃₂, N₅₄₀, N₅₅₆, N₅₇₆, N₆₂₃ 및 N₆₄₅이다; 이들 부위는 도면에서 N₃₄, N₄₀, N₄₇, N₆₅, N₉₅, N₁₄₉, N₁₅₇, N₁₇₃, N₁₉₃, N₂₄₀ 및 N₂₆₂번호로 되어 있다. 실시예 28 또한 참조.

실시예 1

pFPMT-MFα-E1-H6 셔틀 벡터의 작성

한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. pFPMT-MFα-E1-H6 셔틀벡터는 다단계 과정으로 작성하였다. 먼저 HCV E1 단백질을 암호화하는 핵산서열(서열번호: 2)을 CHH 리더 서열 (CHH = 카르시누스 마애나스(Carcinus maenas) 고혈당증 호르몬) 뒤에 클로닝한 다음 MFα리더 서열 (MFα = 사카로마이세스 세레비시아애(Saccharomyces cerevisiae) α-메이팅 인자)에 대해 변경시켰다.

먼저, 이음매없는(seamless) 클로닝 방법(Padgett, K. A. 및 Sorge, J. A. 1996)에 의해 EcoRI/BamHI 단편으로서 CHH-E1-H6 단위를 포함하는 pUC18 유도체를 작성하였다. 여기에, 이하에 기재한 바와 같이 PCR에 의해 E1s-H6-암호화 DNA 단편 및 pCHH-Hir-유도된 어셉터 플라스미드를 생성하였다.

E1s-H6-암호화 DNA 단편의 생성

E1-H6-암호화 DNA 단편 (6 His-잔기에 의해 연장된 E1의 아미노산 192 내지 326으로 구성된 HCV형 1b E1 단백질을 코딩; 서열번호: 5)은 플라스미드 pGEMTE1sH6 (서열번호: 6; 도 1)로부터 PCR에 의해 분리하였다. 하기 프라이머를 사용하였다:

Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHH-링크의 염기와 상보적이다. 마킹되지 않은 염기는 센스 방향으로 E1(192-326)의 개시 영역내에서 결합된다; 및

Eam1104I 부위는 밑줄 표시하고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 MF30-rechts 와 상보적이다. 나중의 클로닝 과정에 유용한 BamHI 부위를 형성하는 염기는 이탤릭체로 인쇄되어 있다. 마킹되지 않은 염기는 종지코돈 및 종지코돈과 BamHI 부위 사이에 3개의 부가적 염기를 포함하는 E1-H6 단위의 마지막내에서 안티센스 방향으로 결합된다.

상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 Eco311-선형화된 pGEMTE1sH6, 각각 0.2μM의 프라이머 CHHE1-F 및 CHHE1-R, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.

프로그램 1을 이용하며, 이 프로그램은 다음 단계로 구성된다:

1. 변성: 95℃에서 5분;

2. 95℃에서 30초간 변성하고, 65℃에서 30초간 결합한 다음 68℃에서 130초간 연장시키는 주기 10회;

3. 4℃에서 종료.

이어, 5 μL 10 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H₂O 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 프로그램 1로부터 얻은 샘플에 부가하고, 다음 단계로 구성된 프로그램 2에 의해 추가의 증폭을 실시하였다:

1. 변성: 95℃에서 5분;

2. 95℃에서 45초간 변성, 65℃에서 30초간 결합, 및 68℃에서 130초간 연장하는 주기 5회;

3. 4℃에서 종료.

pCHH-Hir-유도된 어셉터 플라스미드의 생성

어셉터 단편은 pCHH-Hir 플라스미드 (서열번호: 9; 도 2)로부터 PCR에 의해 제조하였으며 Hir-코딩 서열이 PCR 산물에 존재하지 않는 이외에는 완전한 pCHH-Hir 플라스미드로 구성된다. 하기 프라이머가 PCR에 사용되었다:

Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHHE1-F의 염기와 상보적이다. 마킹되지 않은 염 기는 CHH 서열의 마지막내에서 안티센스 방향으로 결합된다; 및

Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHHE1-R의 염기와 상보적이다. 마킹되지 않은 염기는 클론된 pCHH-Hir의 CHH-Hirudin HL 20 뒤의 pUC18 서열내에서 결합되어, 삽입물로부터 떨어져있다.

상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 Asp718I-선형화된 pCHH-Hir, 각각 0.2μM의 프라이머 CHH-링크 및 MF30-rechts, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.

상기 기재한 바와 같은 프로그램 1을 이용하였다.

이어, 5 μL 10 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H₂O, 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 프로그램 1로부터 얻은 샘플에 부가하고, 상기 기재한 바와 같은 프로그램 2에 의해 추가의 증폭을 실시하였다.

벡터 pCHHE1의 생성

상기 기재한 바와 같이 PCR에 의해 생성된 E1s-H6-암호화 DNA 단편 및 pCHH-Hir-유래 어셉터 플라스미드는 공급자의 명세에 따라 PCR 산물 정제키트(Quagen 제조)를 이용하여 정제하였다. 이어 정제된 단편을 Eam1104I에 의해 개별적으로 분해시켰다. 이어, E1s-H6 DNA 단편을, 공급자의 명세를 따라 T4 리가제(뵈링거 제조)를 사용하여 pCHH-Hir-유래 어셉터 플라스미드에 결찰시켰다.

대장균 XL-골드 세포를 결찰 혼합물을 사용하여 형질전환시키고 몇 개의 암피실린-내성 콜로니의 플라스미드 DNA는 EcoRI 및 BamHI를 사용한 분해에 의해 분석하였다. 양성 클론을 선택하고 pCHHE1으로 명명하였다.

벡터 pFPMT-CHH-E1H6의 생성

pCHHE1의 EcoRI/BamHI 단편을 EcoRI/BamHI 분해된 벡터 pFPMT121 (서열번호: 12; 도 3)에 결찰시켰다. 공급자의 지시에 따라서 T4 리가제(뵈링거 제조)를 사용하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시켰다. 몇 개의 형질전환체를 플라스미드 DNA의 제한패턴에 대해 분석하고 양성 클론을 pFPMT-CHH-E1H6 (서열번호: 13; 도 4)으로 명명하였다.

pFPMT-MFα-E1-H6의 생성

마지막으로, 하기에 기재한 세 개 단편을 결찰시키는 것에 의해 셔틀벡터 pFPMT-MFα-E1-H6을 생성하였다:

1. 6.961 kb의 EcoRI/BamHI 분해된 pFPMT121 (서열번호: 12; 도 3),

2. pUC18-MFα(서열번호: 62; 도 36)의 0.245 kb EcoRI/HindIII 단편, 및

3. pFPMT-CHH-E1H6으로부터 유래한 0.454 kb PCR 산물의 0.442 kb HindIII/BamHI 단편.

단편 번호 3을 생성한 0.454 kb PCR 산물은 다음과 같은 프라이머를 사용한 PCR에 의해 얻었다:

상기 반응 혼합물은 다음과 같이 구성된다: 반응 혼합물 부피 50 μL, pFPMT-CHH-E1-H6 (Eco311-선형화됨; 15 ng/μL), 0.5 μL; 프라이머 MFa-Eq f-Hi (50 μM), 0.25 μL; 프라이머 E1 back-Bam (50 μM), 0.25μL; dNTP (모두 0.2 μM), 5 μL; DMSO, 5 μL; H₂O, 33.5 μL; Expand Long Template PCR System (뵈링거 만하임 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 5 μL; Expand Long Template PCR System 중합효소 혼합물 (1U/μL), 0.75 μL.

하기 단계로 구성된 PCR 프로그램을 이용하였다:

1. 변성: 95℃에서 5분;

2. 95℃에서 45초간 변성하고, 55℃에서 45초간 결합한 다음 68℃에서 40초간 연장시키는 주기 29회;

3. 4℃에서 종료.

사용된 프라이머를 기준으로 하여, 생성한 0.454 kb의 PCR 산물은 E1(192-326) 코돈에 이어, 6개의 히스티딘 코돈 및 "taa" 종지코돈, MFα 프리프로 서열 (클로닝 관련 HindIII 부위와 6개의 염기쌍 오버헹을 포함)과 접하는 상류 및 (클로닝 관련) BamHI 부위 및 6개의 염기쌍 오버헹과 접하는 하류를 함유하였다.

결찰 반응의 경우, 제조자의 조건 (샘플 부피 20 μL)에 따라 T4 DNA 리가제(뵈링거 만하임 제조)를 사용하였다.

대장균 HB101 세포를 결찰 혼합물로 형질전환시켰고 또 몇 개의 형질전환체로부터 분리된 플라스미드의 제한분석후 양성 클론을 보류시켰다. 양성 플라스미드를 선택하고 pFPMT-MFα-E1-H6 (서열번호: 16; 도 5)로 명명하였다.

실시예 2

pFPMT-CL-E1-H6 셔틀 벡터의 작성

한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. pFPMT-CL-E1-H6 셔틀 벡터는 pFPMT-MFα-E1-H6 (서열번호: 16, 도 5)로부터 출발하여 3단계로 작성하였다.

첫 단계로서, pFPMT-MFα-E1-H6의 MFα-E1-H6 리딩 프레임을 pUC18 벡터에 서브클로닝하였다. 따라서, pFPMT-MFα-E1-H6 (FMD 프로모터 및 MFα-E1-H6 함유)의 1.798 kb SalI/BamHI 단편을 제조자의 조건에 따라 T4 리가제(뵈링거 제조)를 사용하여 pUC18의 SalI/BamHI 벡터 단편에 결찰시켰다. 그 결과 도 6에 도시한 플라스미드(서열번호: 17)를 생성하며, 이것을 pMa12-1 (pUC18-FMD-MFα-E1-H6)으로 명명하였다. 이 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시켰다. 몇 개의 암피실린 내성 콜로니를 선택하고 선택된 클론으로부터 분리한 플라스미드 DNA를 제한효소 분해시켜 분석하였다. MFα-E1-H6 코딩 서열의 DNA 서열을 결정하는 것에 의해 양성 클론을 더 분석하였다. 정확한 클론을 PCR 특이적 돌연변이에 사용하여 MFα프리-프로-서열을 조류의 리소짐 프리-서열의 코돈("CL"; 조류 리소짐의 아미노산 1 내지 18에 상응; 서열번호: 1)으로 치환하였다. 적용된 PCR 특이적 돌연변이의 원리는 프라이머의 5'-말단에 위치한 소망하는 변형을 갖는 전체 플라스미드의 증폭에 기초로 한다. 하류 단계에서, 선형 PCR 산물의 말단은 자가-결찰 되기 전에 변형되어 소망하는 변형된 플라스미드를 생성한다.

하기 프라이머가 상기 PCR 반응에 사용되었다:

프라이머의 밑줄친 5' 영역은 조류의 리소짐 프리-서열의 약 1/2의 코돈을 함유한다. 프라이머 CL her neu는 SpeI 제한 부위(이탤릭체)를 포함한다. 프라이머의 밑줄치지 않은 영역은 E1의 아미노산 잔기 192-199에 대한 코돈 또는 FMD 프로모터의 위치 -19 (EcoRI 부위로부터 계산)까지의 EcoRI 부위에 대한 "atg" 개시코돈과 함께 결합된다. 프라이머는 완전한 pMa12-1를 증폭하도록 고안되어, MFα 프리-프로-서열의 코돈을 조류의 리소짐 프리 서열의 코돈으로 치환시킨다.

반응 혼합물은 다음과 같이 구성된다: pUC18-FMD-Mfα-E1-H6 (pMa12-1; 1.3 ng/μL), 1μL; 프라이머 CL hin (100 μM), 2μL; 프라이머 CL her neu (100 μM), 2μL; dNTP (모두 2.5 mM), 8μL; H₂O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1 U/μL), 0.75 μL.

하기 단계로 구성된 PCR 프로그램을 적용하였다:

1. 변성: 95℃에서 15분;

2. 95℃에서 30초간 변성하고, 60℃에서 1분간 결합한 다음 72℃에서 1분간 연장시키는 주기 35회;

3. 4℃에서 종료.

생성한 PCR 산물은 아가로오스 겔 전기영동법에 의해 정확한 크기(3.5 kb)를 확인하였다. 상기 PCR 산물로부터 3'-A 오버헹을 T4 중합효소 반응에 의해 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 따라서, 상기 PCR 산물을 T4 중합효소(뵈링거 제조; 1U/μL)로 처리시키고; 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소 및 4 μL dNTP (모두 2.5 mM)를 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL H₂O에 용해시켰다.

이어, 키나제 반응에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다. 이어, DNA를 1% 아가로오스 겔에 가하고 정확한 생성물 밴드는 제조자의 조건에 따라 겔 추출 키트(Qiagen 제조)에 의하여 분리하였다. 정제된 생성물의 50 ng을 제조자의 조건에 따라 T4 리가제 (뵈링거)를 사용하여 자가 결찰시켰 다. 16℃에서 72시간 동안 배양한 후, 결찰 혼합물중의 DNA를 에탄올에 의해 석출시키고 20 μL 물에 용해시켰다.

대장균 DH5α-F 세포는 10 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론의 플라스미드 DNA는 제한효소 분해에 의해 확인하였다. 양성 클론을 유지시키고 p27d-3 (pUC18-FMD-CL-E1-H6, 서열번호: 20, 도 7)로 명명하였다. 이어 CL-E1-H6 리딩 프레임은 DNA 서열결정법에 의해 확인하였다.

마지막 단계로, pFPMT-CL-E1-H6 셔틀 벡터는 다음과 같이 작성하였다. p27d-3 (CL-E1 (192-3260)-H6 포함)의 0.486 kb EcoRI/BamHI 단편을 EcoRI/BamHI-분해된 pFPMT121 (서열번호: 12, 도 3)에 결찰시켰다. 이 반응의 경우, 제조자의 추천에 따라 T4 리가제(뵈링거 제조)를 사용하였다. 결찰 샘플중의 DNA를 에탄올을 사용하여 석출시키고 10 μL의 H₂O에 용해시켰다. 대장균 DH5αF' 세포를 10 μL의 결찰 샘플을 사용하여 형질전환시키고 몇 개의 암피실린-내성 콜로니의 플라스미드 DNA를 EcoRI 및 BamHI을 사용하여 분해시킴으로써 분석하였다. 플라스미드 클론 p37-5 (pFPMT-CL-E1-H6; 서열번호: 21, 도 8)는 0.486 kb 및 6.96 kb의 소망하는 단편 크기를 나타내었다. p37-5의 CL-E1-H6의 정확한 서열은 서열결정법에 의해 확인하였다.

실시예 3

pFPMT-MFα-E2-H6 및 pMPT-MFα-E2-H6 셔틀 벡터의 작성

한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. MFα-E2s (HCV E2의 아미노산 384-673)-VIEGR-His6 (서열번호: 5)를 암호화하는 DNA 서열은 플라스미드 pSP72E2H6 (서열번호: 22, 도 9)로부터 1.331kb EcoRI/BglII 단편으로서 분리하였다. 이 단편을 제조자의 추천에 따라서 T4 DNA 리가제 (뵈링거 만하임 제조)를 사용하여 EcoRI/BglII-분해된 벡터 pFPMT121 (서열번호: 12, 도 C+2) 또는 pMPT121 (서열번호: 23, 도 10)에 결찰시켰다. 대장균을 형질전환시키고 상이한 형질전환체로부터 분리된 플라스미드 DNA를 제한효소 분해에 의해 확인한 후, 양성 클론을 유지시키고 생성한 셔틀 벡터를 각각 pFPMT-MFα-E2-H6 (서열번호: 22, 도 11) 및 pMPT-MFα-E2-H6 (서열번호: 23, 도 12)로 명명하였다.

실시예 4

pFPMT-CL-E2-H6 셔틀 벡터의 작성

셔틀 벡터 pFPMT-CL-E2-H6는 3단계 과정으로 조립하였다. E2 코딩 서열이 슈바니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis)의 α-아밀라제의 시그널 서열 뒤에 클로닝된 중간체 작성물을 제조하였다. 이것은 이음매없는 클로닝방법(Padgett, K. A. 및 Sorge, J. A. 1996)에 의해 실시되었다.

E2-H6 암호화 DNA 단편의 생성

먼저, E2-H6를 암호화하는 DNA 서열(링커 펩티드 "VIEGR" 및 6개의 His 잔기를 갖도록 연장된 HCV E2의 아미노산 384 내지 673, 서열번호: 5)은 PCR에 의해 pSP72E2H6 플라스미드 (서열번호: 24, 도 11)로부터 증폭하였다. 사용된 프라이머를 MF30E2/F 및 MF30E2/R로 표시하며 다음과 같은 서열을 갖는다:

Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 에스. 옥시덴탈리스((S. occidentalis) 시그널 신호의 마지막 코돈은 볼드체로 인쇄하며; 또 마킹되지 않은 염기는 E2의 코돈(HCV E2의 아미노산 384-390)과 결합시킨다;

Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼드체로 인쇄된 염기는 프라이머 MF30-Rechts (이하 참조)의 볼드체 인쇄된 염기와 상보적이며; 상기 작성물에 도입될 BamHI 부위는 이탤릭체로 인쇄되며; 마킹되지 않은 서열은 종지코돈 및 E2 (384-673)-VIEGR-H6 (서열번호: 5)의 6개의 말단 His 코돈과 결합된다.

상기 반응 혼합물은 다음과 같이 구성된다: pSP72E2H6의 1.33 kb EcoRI/BglII 단편 20 ng, 각 0.2μM의 프라이머 MF30E2/F 및 MF30E2/R, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.

다음 단계로 구성된 PCR 프로그램 3을 이용하였다:

1. 변성: 95℃에서 5분;

2. 95℃에서 30초간 변성하고, 65℃에서 30초간 결합한 다음 68℃에서 1분간 연장시키는 주기 10회;

3. 4℃에서 종료.

이어, 10 μL 10 x 완충액 2(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H₂O 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 PCR 프로그램 3으로부터 얻은 샘플에 부가하고, 다음 단계로 구성된 PCR 프로그램 4를 계속하였다:

1. 변성: 95℃에서 5분;

2. 95℃에서 45초간 변성, 65℃에서 30초간 결합, 및 68℃에서 1분간 연장하는 주기 5회;

3. 4℃에서 종료.

pMF30-유도된 어셉터 플라스미드의 생성

플라스미드 pMF30 (서열번호: 28, 도 13)으로부터 유래한 제2 단편, 암플리콘은 에스. 옥시덴탈리스((S. occidentalis)의 성숙 α-아밀라제의 코돈을 제외하고는 완전한 pMF30 플라스미드이고, 클로닝에 관련된 변경은 프라이머 디자인에 의해 도입되었다. 이하의 프라이머 세트가 사용되었다:

Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼 드체로 인쇄한 "cct"는 프라이머 MF30E2/F (상기 참조)의 볼드체 인쇄된 "agg"와 상보적이며; 마킹되지 않은 염기 및 볼드체로 인쇄된 염기는 pMF30중의 에스. 옥시덴탈리스(S. occidentalis)의 α-아밀라제의 코돈의 26개 말단 염기와 결합시킨다);

Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼드체로 인쇄한 "ctg"는 프라이머 MF30E2/R (상기 참조)의 볼드체 인쇄된 "cag"와 상보적이며; 마킹되지 않은 염기는 pMF30중의 에스. 옥시덴탈리스 (S. occidentalis)의 α-아밀라제의 종지코돈의 하류에 있는 pUC18 서열과 결합시킨다).

상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 BglII-선형화된 pMF30, 각 0.2μM의 프라이머 MF30-링크 및 MF30-Rechts, dNTP (각각 0.2 μM), 1 x 완충액 1 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL. 연장 기간을 1분에서 4분으로 변경한 이외에는 상기 기재한 동일 PCR 프로그램 (프로그램 3 및 4)을 이용하였다.

벡터 pAMY-E2의 생성

E2-H6 암호화 DNA 단편 및 PCR에 의해 얻은 pMF30-유래 어셉터 플라스미드는 1% 아가로오스 겔상에서 겔 전기영동에 의해 각각의 크기별로 제어하였다. PCR 산물을 제조자의 지시에 따라 PCR 산물 정제 키트(Qiagen 제조)에 의해 정제하였다. 이어 정제된 단편을 별도로 Eam11004I로 분해시켰다. 제조자의 추천에 따라서 T4 리가제(뵈링거 제조)를 사용하여 E2-H6 단편과 pMF30-유래 어셉터 플라스미드의 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고 몇 개의 클론의 플라스미드 DNA를 EcoRI/BamHI 분해에 의해 분석하였다. 양성 클론을 선택하고, 그 플라스미드를 pAMY-E2로 명명하며 이하에 나타낸 추가의 변경에 이용하였다.

벡터 pUC18-CL-E2-H6의 생성

α-아밀라제 시그널 서열의 코돈을 조류의 리소짐 프리 서열의 코돈으로 치환하기 위하여 pAMY-E2를 PCR 특이적 돌연변이 처리시켰다. 이것을 "CL"로 표시하며, 조류 리소짐 ORF (서열번호: 1)의 첫째 18개 아미노산에 상응한다. 상기 돌연변이의 경우 이하의 프라이머가 사용되있다:

프라이머의 밑줄 친 5'-영역은 조류의 리소짐 프리 서열의 약 1/2의 DNA 서열을 함유한다. 프라이머 CL2 her는 SpeI (이탤릭체) 및 EcoRI(이탤릭체, 이중밑줄) 제한부위를 포함한다. 프라이머의 밑줄치지 않은 영역은 E2의 아미노산 잔기 384-392 (CL2 hin)의 코돈과 결합되거나 또는 위치-19 (EcoRI 부위로부터 계산) 프로모터 까지의 EcoRI 부위에 있는 "atg" 개시코돈과 결합된다. 이 프라이머는 완전 pAMY-E2 벡터를 증폭시키기 위하여 고안되며, 그에 의해 α-아밀라제 시그널 서열의 코돈을 조류의 리소짐 프리-서열의 코돈으로 치환한다.

하기 프로그램에 따라 PCR 반응을 실시하였다:

1. 변성: 95℃에서 15분;

3. 4℃에서 종료.

하기 반응 혼합물을 사용하였다: pAMY-E2 (1 ng/μL), 1 μL; 프라이머 CL2 hin (100 μM), 2μL; 프라이머 CL2 (100 μM), 2μL; dNTP (각각 2.5 μM), 8 μL; H₂O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1U/μL), 07.5 μL.

생성한 PCR 산물은 1% 아가로오스 겔상에서 겔 전기영동에 의해 확인하였다. 결찰하기 전에, PCR 단편은 다음과 같이 변경시켰다. T4 중합효소에 의해 3'-A 오버헹을 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소 (뵈링거 제조, 1U/μL)를 4 μL dNTP (각각 2.5 mM)와 함께 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL 탈이온수에 용해시켰다. 이어, 키나제 처리에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 용해된 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다.

상기 키나제 처리된 샘플을 1% 아가로오스 겔상에서 분리하였다. 생성물 밴드를 분리하였다. 제조자의 추천에 따라 겔 추출 키트(Qiagen 제조)에 의하여 아가로오스로부터 DNA를 추출하였다. 정제된 생성물 50 ng을 제조자의 조건에 따라 T4 리가제 (뵈링거)를 사용하여 자가 결찰시켰다. 16℃에서 16시간 동안 배양한 후, 결찰 혼합물중의 DNA를 에탄올에 의해 석출시키고 20 μL 물에 용해시켰다(결찰 샘플).

대장균 DH5αF' 세포는 상기 10 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론은 분리된 플라스미드 DNA의 제한효소 분해에 의해 더 확인하였다. 양성 클론을 pUC18-CL-E2-H6로 명명하고 또 이하에 기재한 바와 같이 추가의 변경에 이용하였다.

셔틀벡터 pFPMT-CL-E2-H6의 생성

pUC18-CL-E2-H6 (CL-E2(384-673)-VIEGR-H6 포함)으로부터 0.966 kb EcoRI/BamHI 단편을 분리하고 이것을 EcoRI/BamHI-분해된 pFPMT121 (서열번호: 12, 도 3)에 결찰시켰다. 이 반응의 경우, 제조자의 조건에 따라 T4 리가제 (뵈링거 제조)를 사용하였다. 결찰 샘플중의 DNA를 에탄올을 사용하여 석출시키고 10 μL의 물에 용해시켰다. 이것을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 제 한효소 분석 후 양성 클론을 유지시키고 각각의 플라스미드를 pFPMT-CL-E2-H6 (서열번호: 32, 도 14)로 명명하였다.

실시예 5

pFPMT-CL-K-H6-E1 셔틀벡터의 작성

셔틀벡터의 작성은 다음 2단계를 포함한다.

첫 단계로서, pUC18-FMD-CL-H6-K-E1-H6 작성물은 부위특이적 돌연변이에 의해 작성하였다. pUC18-FMD-CL-E1-H6을 주형(서열번호: 20; 도 7)으로 사용하였다. 하기 프라이머를 사용하였다:

PCR 반응 혼합물은 다음과 같이 구성된다: pUC18-FMD-CL-E1-H6 (2 ng/μL), 1μL; 프라이머 H6K hin neu (100 μM), 2μL; 프라이머 H6KRK her neu (100 μM), 2μL; dNTP (각각 2.5 mM), 8μL; H₂O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1 U/μL), 0.75 μL.

하기 단계로 구성된 PCR 프로그램을 적용하였다:

1. 변성: 95℃에서 15분;

2. 95℃에서 30초간 변성하고, 60℃에서 1분간 결합한 다음 72℃에서 5분간 연장시키는 주기 35회;

3. 4℃에서 종료.

PCR 샘플의 알리쿼트를 1% 아가로오스 겔상에서 분석하여 그 정확한 크기를 확인하였다 (~4.2 kb).

그후 상기 PCR 산물로부터 3'-A 오버헹을 T4 중합효소 반응에 의해 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 따라서, 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소(뵈링거 제조; 1U/μL) 및 4 μL dNTP (각각 2.5 mM)를 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL H₂O에 용해시켰다.

이어, 키나제 반응에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다.

이어, 샘플을 1% 아가로오스 겔에 가하고 정확한 생성물 밴드를 제조자의 조건에 따라 겔 추출 키트(Qiagen 제조)에 의하여 분리하였다. 정제된 생성물의 50 ng을 제조자의 추천에 따라 T4 리가제 (뵈링거)를 사용하여 자가결찰시켰다. 16℃에서 72시간 동안 배양한 후, 결찰 샘플중의 DNA를 에탄올에 의해 석출시키고 10 μL 물에 용해시켰다.

대장균 DH5αF' 세포는 5 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론의 플라스미드 DNA는 제한효소 분해에 의해 확인하며, 양성 클론을 유지시키고 pUC18-FMD-CL-H6-K-E1-H6 (서열번호: 39, 도 17)로 명명하였다.

두 번째 단계로, 전달 벡터는 2개의 단편 결찰에 의해 작성하였다. 하기 작성에서는 BclI 접착성 말단을 갖는 단편이 포함되었다. BclI는 메틸화되지 않은 DNA상에서만 그 부위를 절단할 수 있기 때문에, 대장균 dam^- 균주는 관련된 플라스미드 pUC18-FMD-CL-H6-K-E1-H6 (서열번호: 39, 도 17) 및 pFPMT-CL-E1 (서열번호: 36, 도 16)에 의해 형질전환되었다. 각 형질전환으로부터, 암피실린 내성 콜로니를 선택하여, 액제 배지에서 생장시키고 메틸화되지 않은 플라스미드 DNA를 다음 사용을 위해 준비하였다. 메틸화되지 않은 플라스미드 pUC18-FMD-CL-H6-K-E1-H6 (FMD 프로모터, CL-H6-K 단위의 코돈 및 E1의 개시를 포함)의 1.273 kb BclI/HindIII 단편 및 플라스미드 pFPMT-CL-E1(BclI 부위로부터 개시하는 E1 리딩 프레임의 결실 부분, C-말단 없는 His tag, FMD 프로모터를 제외한 pFPMT121-위치 요소 포함)의 6.057 kb BclI/HindIII 단편을 준비하고 제조자의 명세에 따라 20 μL의 전체 부피의 T4 리가제 (뵈링거 제조)를 사용하여 16℃에서 72시간 동안 결찰시켰다. 이어, 결찰 혼합물을 멸균 이온수중에 떠 있는 니트로셀룰로오스 막 조각에 놓아 결찰 혼합물을 탈염시켰다 (실온에서 30분간 배양). 대장균 TOP10 세포 를 5 μL의 탈염 샘플과 함께 전기영동시키는 것에 의해 형질전환시켰다. 생성한 몇 개의 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pFPMT-CL-H6-K-E1 (서열번호: 40, 도 18)으로 명명하였다.

실시예 6

한세눌라 폴리모르파( Hansenula polymorpha )의 형질전환 및 형질전환체의 선택

에이치. 폴리모르파(H. polymorpha) 균주 RB11을 실시예 1 내지 5에 기재된 상이한 어버이 셔틀벡터를 사용한 수식(Roggenkamp, R. 등 1986)에 의하여 형질전환시켰다((Klebe, R. 등 1983)에 의해 기재된 바와 같은 PEG-매개된 DNA 흡수 과정). 각 형질전환의 경우, 72개 우라실-기본영양군(prototrophic) 콜로니를 선택하여 다음 과정에 의해 균주 생성에 이용하였다. 각 콜로니의 경우, 2 mL 액체 배양액을 접종하고 또 선택 배지(YNB/글루코오스, 디프코 제조)중의 시험관에서 48시간 (37℃; 160 rpm; 각도 45°) 동안 생장시켰다. 이 단계를 제1 통과 단계로 정의한다. 상기 제1 통과 단계의 배양액의 150 μL 알리쿼트를 사용하여 2 mL의 신선한 YNB/글루코오스 배지에 접종시켰다. 다시, 상기 배양물을 상기 기재한 바와 같이 배양하였다(제2 통과 단계). 또한, 이러한 통과 단계를 8회 실시하였다. 제3 및 제8 통과 단계후의 배양의 알리쿼트를 사용하여 2 mL의 비-선택적 YPD 배지(디프코 제조)에 접종시켰다. 37℃에서 48시간 동안 배양한 후(160 rpm; 각도 45°; 소위 제1 안정화 단계), 이들 YPD 배양물의 150 μL 알리쿼트를 사용하여 신선한 2 mL YPD 배지에 접종시킨 다음 상기 기재한 바와 같이 배양하였다(제2 안정화 단계). 제2 안정화 단계의 배양액의 알리쿼트를 선택성 YNB/한천을 함유하는 플레이트상에 스트리킹하였다. 이들 플레이트를 거시적 콜로니가 보일 때 까지 4일간 배양하였다. 각 분리의 잘 정의된 단일 콜로니를 균주로 정의하고 발현 분석에 사용하였다.

발현분석은 소규모 진탕 플라스크 배양물상에서 실시하였다. 상기 언급한 YNB/한천 플레이트로부터 콜로니를 선발하고 상기 기재한 바와 같이 2 mL YPD에서 접종하여 48시간 동안 배양하였다. 2 mL-알리쿼트를 20 mL 진탕 플라스크 배양물에 대한 종자 배양으로 사용하였다. YPGlyerol (1%)를 배지로 사용하고 진탕 플라스크를 회전 진탕기(200 rpm, 37℃)상에서 배양하였다. 48시간의 생장 후 1% MeOH를 배양액에 부가하여 발현 카세트를 유발시켰다. 상이한 시간 간격으로 1 mL 알리쿼트의 세포 펠릿을 수집하고 추가의 분석때 까지 -20℃에서 저장하였다. 특정 단백질 발현은 SDS-PAGE/웨스턴 블러팅에 의해 분석하였다. 따라서 세포 펠릿은 샘플 완충액(트리스HCl-SDS)에 용해시키고 95℃에서 15분 이상 배양하였다. 15% 폴리아크릴-아미드 겔상에서 단백질을 분리하고 니트로셀룰로오스 막상에 블러팅(웨트-블러트; 중탄산염 완충액)하였다. 블러트는 제1 항체로서 특정 쥐 항-E1 (IGH201) 또는 쥐의 항-E2 (IGH216, WO 96/04385호에서 Maertens 등에 의해 기재)를 사용하고 또 제2 항체로서는 토끼-항-마우스-AP를 사용하여 발색되었다. 염색은 NBT-BCIP를 사용하여 실시하였다. 양성 균주는 다음 연구를 위해 유지하였다.

이들 양성 클론중 5개를 진탕 플라스크 발현 실험에 사용하였다. 각 균주의 콜로니를 YNB 플레이트로부터 선택하고 2mL YPD를 접종시키는데 사용하였다. 이들 배양액을 상기와 같이 배양하였다. 상기 세포 현탁액을 사용하여 500 mL 진탕 플라스크중의 100 mL YPD 배지의 제2 종자 배양액을 접종하였다. 이 진탕 플라스크를 회전 진탕기상, 37℃에서 48시간 동안 200 rpm으로 배양하였다. 상기 종자 배양액의 25 mL 알리쿼트를 사용하여 250 mL YPGlycerol (1%) 배지를 접종하였고 상기 기재한 조건하에, 격벽이 있는 2-1 진탕 플라스크에서 배양하였다. 배양한지 48시간 후 1% MeOH (프로모터 유도)를 부가하고 진탕 플라스크를 상기 기재한 조건하에서 더 배양하였다. 유도한지 24시간 후, 실험을 중지시키고 세포 펠릿을 원심분리에 의해 수집하였다. 5개의 상이한 클론의 발현수준을 SDS-PAGE/웨스턴 블럿(상기와 같은 조건)에 의해 분석하였다. 각 클론의 적정 시리즈를 겔에 로딩하고 가장 생산적인 균주를 선택하여 다음 발효 및 정제 시험용으로 준비하였다.

놀랍게도, 피치아 파스토리스(Pichia pastoris)와 가장 밀접하게 관련된 효모 균주인 에이치. 폴리모르파(H. polymorpha)는 초글리코실화없이도 HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 발현된 HCV 엔빌로프 단백질에 그 크기가 필적하는 당 잔기를 갖는 HCV 단백질을 발현할 수 있다.

한세눌라 폴리모르파(Hansenula polymorpha) 균주 RB11은 부다페스트 조약하에, Mycotheque de 1'UCL (MUCL), Universite Catholique de Louvain, Laboratoire de mycologie, Place Croix du Sud 3 bte 6, B-1348 Louvain-la-Neuve, Belgium에 2002년 4월 19일에 MUCL 수탁번호 MUCL43805로 기탁되었다.

실시예 7

pSY1aMFE1sH6a 벡터의 작성

에스. 세레비시아애(S. cerevisiae) 발현 플라스미드는 다음과 같이 작성하였다. E1 코딩 서열은, 무딘 말단으로 만들고(T4 DNA 중합효소를 사용) 또 공급자의 명세에 따라서 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG5 벡터(서열번호: 41, 도 19)에 클로닝된 pGEMT-E1sH6 (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리되었다. 클로닝은 E1s-H6 암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 대장균 DH5αF' 세포에서 형질전환시켰다. 이어, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG5E1H6 (ICCG3470; 서열번호: 42, 도 20)로 명명하였다.

발현카세트(αMF-서열 및 E1s-코딩 영역과 His-tag를 함유하는)는 pYIG5E1H6의 BamHI 단편(2790 bp)으로서 BamHI-분해된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 21, 도 43)에 전달되었다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSY1aMFE1sH6a (ICCG3479; 서열번호: 44, 도 22)로 명명하였다.

실시예 8

pSYYIGSE2H6 벡터의 작성

에스. 세레비시아애(S. cerevisiae) 발현 플라스미드 pSYYIGSE2H6은 다음과 같이 작성하였다. E2 코딩 서열은, 무딘 말단으로 만든(T4 DNA 중합효소를 사용) 다음 제조자의 설계에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG5 벡터(서열번호: 41, 도 19)에 클로닝된 pBSK-E2sH6 (서열번호: 45, 도 23)으로부터 SalI/KpnI 단편으로 분리되었다. 클로닝은 E2-H6 암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시시키고, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG5HCCL-22aH6 (ICCG2424; 서열번호: 46, 도 24)으로 명명하였다.

발현카세트(αMF-서열 및 E2(384-673) 코딩 영역과 His-tag를 함유하는)는 pYIG5HCCL-22aH6의 BamHI 단편(3281 bp)으로서 BamHI 개방된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 43, 도 21)에 전달되었다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSYYIGSE2H6 (ICCG2466; 서열번호: 47, 도 25)으로 명명하였다.

실시예 9

pSY1YIG7E1s 벡터의 작성

에스. 세레비시아애(S. cerevisiae) 발현 플라스미드 pSY1YIG7E1는 다음과 같이 작성하였다. E1 코딩 서열은, 무딘 말단으로 만든 다음 제조자의 설계에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG7 벡터(서열번호: 48, 도 26)에 클로닝된 pGEMT-E1s (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리되었다. 클로닝은 E1-암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 대장균 DH5αF' 세포로 형질전환시키고, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG7E1 (서열번호: 49, 도 27)로 명명하였다.

발현카세트(CL 리더 서열 및 E1 (192-326) 코딩 영역 함유)는, pYIG7E1의 BamHI 단편 (2790 bp)으로서 BamHI-분해된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 43, 도 21)에 전달하였다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSY1YIG7E1s (서열번호: 50, 도 28)로 명명하였다.

실시예 10

사카로마이세스 세레비시아애( Saccharomyces cerevisiae )의 형질전환 및 형질전환체의 선택

초-글리코실화 문제를 해결하기 위하여, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 단백질 과발현을 위해 돌연변이 스크 리닝이 고안되었다. 이 스크리닝은 Ballou (Ballou, L. 등 1991)의 방법을 기초로하며, 그에 의해 자연적인 수동 오르토바나데이트-내성 돌연변이를 선택하였다. 초기 균주 선택은 천연의 겔 전기영동후에 관찰된 바와 같이 인버타제의 글리코실화 패턴을 기본으로 하여 실시되었다. 글리코실화 능력이 감소된 균주는 재조합 단백질 반현 실험을 위해 유지시키고 균주 IYCC155로 명명하였다. 돌연변이체의 성질은 더 이상 연구하지 않았다.

상기 글리코실화-결핍 균주 IYCC155는 Elble (Elble, R. 1992)에 의해 기재된 바와 같은 아세트산리튬 방법에 의해 실시예 7 내지 9에 기재된 바와 같이 플라스미드를 형질전환시켰다. 몇 개의 Ura 보충 균주를 선택성 YNB + 2% 한천 플레이트 (디프코 제조)로부터 선택하여 2 ml YNB+2% 글루코오스를 접종시켰다. 이들 배양물을 오르비탈 진탕기상에, 37℃에서 72시간, 200 rpm으로 배양하고, 배양 상층액 및 세포내 분획을 E1 특이적 주위 모노클로날 항체(IGH 201)를 사용하여 발색된 웨스턴 블럿에 의해 E1의 발현에 대해 분석하였다.

사용된 에스. 세레비시아애(S. cerevisiae) 글리코실화 결핍 돌연변이주에서 단백질의 발현은 이러한 균주의 차선의 생장 특성에 의해 제한됨으로써 바이오매스 수율 감소를 초래하므로 야생형 S에 대하여 소망하는 단백질의 수율이 낮다. 소망하는 단백질의 수율은 포유동물 세포에서 보다 훨씬 더 높았다.

실시예 11

pPICZalphaD'E1sH6 및 pPICZalphaE'E1sH6 벡터의 작성

셔틀벡터 pPICZalphaE'E1sH6은 pPICZalphaA 벡터 (Invitrogen 제조; 서열번호: 51, 도 29)로부터 출발하여 작성하였다. 첫 단계로서, 상기 벡터를 변경시켜 E1 코딩 서열이 KEX2 또는 STE13 가공 프로테아제의 절단부위 바로 뒤에 클로닝되도록 하였다. 따라서 pPICZalphaA를 XhoI 및 NotI로 분해시켰다. 분해물을 1% 아가로오스 겔상에서 분리하고 3519 kb 단편(벡터의 주요 부분)을 분리하고 겔 추출 키트(Qiagen 제조)에 의해 정제하였다. 이 단편은 특정 올리고뉴클레오티드의 존재하, 제조자의 조건에 따라서 T4 중합효소(베링거 제조)를 사용하여 결찰시켜 pPICZalphaD' (서열번호: 52, 도 30) 또는 pPICZalphaE' (서열번호: 53, 도 31)을 얻었다.

하기 올리고뉴클레오티드를 사용하였다.

- pPICZalphaD' 작성용:

결합후, 하기 링커 올리고뉴클레오티드를 얻음:

- pPICZalphaE' 작성용

결합후, 하기 링커 올리고뉴클레오티드를 얻음:

이들 셔틀벡터 pPICZalphaD' 및 pPICZalphaE'를 각 가공 프로테아제 KEX2 및 STE13의 절단부위 바로 뒤에 있는 클로닝 부위에 새롭게 도입하였다. E1-H6 코딩 서열은 pGEMT-E1sH6 (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리하였다. 분해물을 1% 아가로오스 겔상에서 분리한 후 겔 추출 키트(Qiagen 제조)를 사용하여 단편을 정제하였다. 생성한 단편은 무딘 말단(T4 DNA 중합효소)이며 가공 프로테아제 절단부위 바로 뒤의 pPICZalphaD' 또는 pPICZalphaE'에 결찰시켰다.

결찰 혼합물을 대장균 TOP10F' 세포로 형질전환시키고 몇 개의 제오신 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pPICZalphaD'E1sH6 (ICCG3694; 서열번호: 58, 도 32) 및 pPICZalphaE'E1sH6 (ICCG3475; 서열번호: 59, 도 33)으로 명명하였다.

실시예 12

pPICZalphaD'E2sH6 및 pPICZalphaE'E2sH6 벡터의 작성

셔틀벡터 pPICZalphaD' 및 pPICZalphaE'는 실시예 11에 기재한 바와 같이 작성하였다.

E2-H6 코딩 서열은 pBSK-E2sH6 (서열번호: 45, 도 23)으로부터 SalI/KpnI 단편으로서 분리하였다. 분해물을 1% 아가로오스 겔상에서 분리한 후 겔 추출 키트(Qiagen 제조)에 의해 단편을 정제하였다. 생성한 단편을 무딘 말단(T4 DNA 중합효소 사용)으로 만든 다음 각 가공 프로테아제 절단 부위 바로 뒤에 있는 pPICZalphaD' 또는 pPICZalphaE'에 결찰시켰다.

결찰 혼합물을 대장균 TOP10F'세포로 형질전환시키고 몇 개의 제오신 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pPICZalphaD'E2sH6 (ICCG3692; 서열번호: 60, 도 34) 및 pPICZalphaE'E2sH6 (ICGG3476; 서열번호: 61, 도 35)로 명명하였다.

실시예 13

피치아 파스토리스( Pichia pastoris )의 형질전환 및 형질전환체의 선택

실시예 11 및 12에 기재된 바와 같은 피. 파스토리스(P. pastoris) 셔틀벡터를 사용하여 제조자의 조건(Invitrogen 제조)에 따라 피. 파스토리스(P. pastoris) 세포를 형질전환시켰다. E1- 및 E2-생성 균주를 다음 특징화를 위해 유지시켰다.

초글리코실화가 보통 존재하지 않고(Gellissen, G. 2000) 또 전에는 dengue 바이러스 E 단백질을 GST 융합물(Sugrue, R. J. 등, 1997)로서 발현하기 위해 사용된 점에서 공지된 효모 균주인 피. 파스토리스(P. pastoris)에서 HCV 엔빌로프 단백질을 발현시켰다. 생성한 피.파스토리스(P. pastoris)-발현된 HCV 엔빌로프 단백질은 야생형 사카로마이세스 균주에서 관찰된 글리코실화에 필적하는 글리코실화를 나타내었다. 보다 자세하게는, 피. 파스토리스(P. pastoris)에 의해 생산된 HCV 엔빌로프 단백질은 초글리코실화되었다(형질전환된 피. 파스토리스 세포로부터 분리된 단백질의 웨스턴-블럿에서 검출된 발현 산물의 분자량을 기준).

실시예 14

사카로마이세스 세레비시아애( Saccharomyces cerevisiae ), 한세눌라 폴리모르파( Hansenula polymorpha ) 및 피치아 파스토리스( Pichia pastoris )에 대한 배양 조건

사카로마이세스 세레비시아애( Saccharomyces cerevisiae )

세포 뱅킹

선택된 재조합 클론중에서 마스터 세포 뱅크 및 작용 세포 뱅크를 제조하였다.

중간-지수적으로 생장한 진탕 플라스크 배양액으로부터 냉동-바이얼을 준비하였다(발효 종자 배양액에서와 같은 배양조건, 하기 참조). 글리세롤을 냉동보호제로서 부가하였다(50% 최종 농도).

발효

종자 배양은 냉동저장된 작용 세포 뱅크 바이얼로부터 개시하여 2L 엘렌마이어 진탕 플라스크중의 500 mL 배지(2% 수크로오스 보충된 YNB, 디프코 제조)에서 37℃, 200 rpm으로 48시간 동안 생장시켰다.

발효는 작용부피가 15 L인 Biostat C 발효기(B. Braun Int., Melsungen, 독일)중에서 전형적으로 실시하였다. 발효 배지는 1% 효모 추출액, 2% 펩톤 및 탄소 공급원으로서 2% 수크로오스를 함유하였다. 폴리-에틸렌 글리콜은 소포제로서 사용하였다.

발효하는 동안 온도, pH 및 용존산소는 전형적으로 제어되며, 적용가능한 세트 포인트는 하기 표 1에 요약하였다. 용존 산소는 교반/통기에 의해 계단식으로 제어하였다. NaOH (0.5M) 또는 H₃PO₄ 용액 (8.5%)를 부가하는 것에 의해 pH를 제어하였다.

10% 종자-배지를 부가하는 것에 의해 발효를 개시하였다. 생장기 동안 수크로오스 농도는 HPLC 분석(Polysphere Column OAKC Merck 제조)에 의해 오프라인으로 조절하였다.

생장상 동안 용존 산소는 계단식으로 제어(교반/통기)하였다. 수크로오스를 완전히 대사시킨 후 이종 단백질 생산은 약 0.5% 농도(오프라인 HPLC 분석, Polysphere OAKC 칼럼)로 유지시키기 위하여 EtOH를 계단식으로 보충한 내인성 생산된 에탄올에 의해 유발되었다. 상기 유도 상 동안, 용존 산소는 공기량 및 교반 속도의 수동 조작을 통하여 5% 미만의 공기-포화으로 제어된다.

전형적으로, 발효는 유도한지 48 내지 74시간 후에 수확되며, 탄젠트 유동 여과에 의해 농축시킨 다음 농축된 세포 현탁액을 원심분리시킴으로써 세포 펠릿을 얻었다. 즉시 분석하지 않으면, 세포 펠릿은 -70℃에서 저장하였다.

한세눌라 폴리모르파( Hansenula polymorpha )

세포 뱅킹

발효

종자 배양은 냉동저장된 작용 세포 뱅크 바이얼로부터 개시하여 2L 엘렌마이어 진탕 플라스크중의 500 mL 배지(YNB, 디프코 제조)에서 37℃, 200 rpm으로 48시간 동안 생장시켰다.

발효는 작용부피가 15 L인 Biostat C 발효기(B. Braun Int., Melsungen, 독일)중에서 전형적으로 실시하였다. 발효 배지는 1% 효모 추출액, 2% 펩톤 및 탄소 공급원으로서 1% 글리세롤을 함유하였다. 폴리-에틸렌 글리콜은 소포제로서 사용하였다.

발효하는 동안 온도, pH 및 용존산소는 전형적으로 제어되며, 적용가능한 세트 포인트는 하기 표 2에 요약하였다. 용존 산소는 교반에 의해 계단식으로 제어하였다. NaOH (0.5M) 또는 H₃PO₄ 용액 (8.5%)를 부가하는 것에 의해 pH를 제어하였다.

10% 종자-배지를 부가하는 것에 의해 발효를 개시하였다. 생장기 동안 글리세롤 농도는 오프라인 (Polysphere Column OAKC Merck)으로 조절하였고 완전히 글리세롤을 소비한 지 24시간 후 1% 메탄올을 부가하여 이종 단백질 발현을 유발하였다. 발효는 유도한지 24 시간 후에 수확되며, 탄젠트 유동 여과에 의해 농축시킨 다음 농축된 세포 현탁액을 원심분리시킴으로써 세포 펠릿을 얻었다. 즉시 분석하지 않으면, 세포 펠릿은 -70℃에서 저장하였다.

피치아 파스토리스( Pichia pastoris )

재조합 피치아 파스토리스(Pichia pastoris)를 사용한 소규모 단백질 생산실험은 진탕 플라스크 배양으로 설계하였다. 종자 배양은 YPD 배지(디프코 제조)에서 철야로 생장하였다. 초기 배지 pH는 4.5로 정하였다. 진탕 플라스크를 회전 진탕기상에서 200-250 rpm으로 37℃에서 배양하였다.

소규모 생산은 전형적으로 2L 진탕 플라스크내의 500 mL 규모로 실시하였고 1% 효모 추출액, 2% 펩톤(디프코 제조) 및 탄소 공급원으로서 2% 글리세롤을 함유하는 발현배지중에서 10% 접종시키는 것에 의해 개시하였다. 배양 조건은 종자 배 양과 동일하다. 접종한 지 약 72시간 후 1% MeOH를 부가하는 것에 의해 배양을 개시하였다. 유도한 지 24시간 후 원심분리에 의해 세포를 수집하였다. 즉시 분석하지 않을 경우, 세포 펠릿은 -70℃에서 저장하였다.

실시예 15

선택된 효모 세포에서 발현된 MFα-E1-H6 및 MFα-E2-H6 단백질로부터 리더 펩티드의 제거

에스. 세레비시아애(S. cerevisiae)의 α-메이팅 인자 (αMF) 리더 서열을 갖는 HCV E1 및 E2 단백질 작성물의 글리코실화 결핍 균주 한세눌라 폴리모르파(Hansenula polymorpha) 및 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 발현산물을 더욱 분석하였다. 유전형 1b HCV E1s (aa 192-326) 및 HCV E2s (VIEGR (서열번호: 69)-서열에 의해 연장된 aa 383-673)는 C-말단 his-tagged (H6, HHHHHH, 서열번호: 63; 상기 HCV 단백질은 본 실시예에서 αMF-E1-H6 및 αMF-E2-H6으로 명명됨) 단백질로 발현되기 때문에, 효모 세포의 염화 구아니디늄 (GuHCl)-용해화후 발현된 산물의 신속하고도 효과적인 정제는 Ni-IDA (Ni-이미노디아세트산)상에서 실시하였다. 320 mM (4% w/v) 아황산나트륨 및 65 mM (2% w/v) 테트라티온산 나트륨의 존재하, 실온(RT)에서 단백질을 철야로 술폰화하였다. 냉동-해동 주기후 용균물을 원심분리(10,000 g, 30 분, 4℃)에 의해 깨끗하게 만들고 Empigen (Albright & Wilson 제조, UK) 및 이미다졸을 최종 농도 1% (w/v) 및 20 mM로 각각 상층액에 부가하였다. 샘플을 여과하고(0.22 μM) 또 Ni-IDA 세파로 오스 FF 칼럼상에 걸고, 50 mM 인산염, 6M GuHCl, 20 mM 이미다졸이 보충된 1% Empigen (완충액 A)으로 평형으로 유지시켰다. 이 칼럼은, 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 20 mM 및 50 mM 이미다졸을 각각 함유하는 완충액 A로 순차적으로 세척하였다. 완충액 D, 50 mM 포스페이트, 6M GuHCl, 0.2% (E1의 경우) 또는 1% (E2의 경우) Empigen, 200 mM 이미다졸을 적용하는 것에 의해 his-태깅된 산물을 용출시켰다. 용출된 물질을 SDS-PAGE 및 E1 (IGH201) 또는 E2(IGH212)에 대해 특이적인 특정 모노클로날 항체를 사용하는 웨스턴-블럿에 의해 분석하였다.

E1-산물은 에드만 분해에 의해 즉시 분석하였다.

이 단계에서, SDS-PAGE는 HCV E2에 대한 아주 복잡한 단백질 밴드 그림을 나타내므로, 크기 배제 크로마토그래피에 의해 분별처리(fractionation)를 실시하였다. Ni-IDA 용출액을 한외여과(MWCO 10 kDa, 세??리플러스, 아미콘, 밀리포어)에 의해 농축시키고 PBS, 1% Empigen 또는 PBS, 3% Empigen중의 Superdex G200 (10/30 또는 16/60; 파마시아 제조)상에 걸었다. E2 생성물을 함유하며 Mr 범위가 ~80 kDa 내지 ~45 kDa인 용출 분획, SDS-PAGE (도 38)상의 이동을 기초로 하여 도 37에서의 용출 프로필의 분획 17-23을 모아서 알킬화시켰다 (실온에서 10 mM DTT를 사용하여 3시간 동안 배양시킨 다음 30 mM 요오도-아세트아미드를 사용하여 실온에서 3시간 동안 배양하였다). 아미노 말단 서열결정을 위한 샘플을 Endo H (로쉐 바이오케미컬스 제조)로 처리하거나 또는 처리하지 않았다. 글리코실화된 E2 생성물 및 탈글리코실화된 E2 생성물을 말단 서열결정을 위해 PVDF-막상에 블러팅시켰다. 글리코실화된 E2 및 탈글리코실화된 E2의 아미도-블랙 염색된 블럿을 도 39에 도시한다.

E1 및 E2 정제 산물의 서열결정은 HCV 엔빌로프 단백질로부터 시그널 서열의 제거가 오직 부분적으로만 생긴다는 실망스런 관찰을 초래한다(표 3). 또한, 부생성물(분해 산물 및 리더 서열 또는 그의 일부를 여전히 함유하는 생성물)의 대다수는 글리코실화되어 있다. 이러한 글리코실화는 N-글리코실화 부위를 함유하는 시그널 서열의 비-절단 단편상에서도 부분적으로 존재한다. 이러한 부위는 돌연변이되어 글리코실화가 적은 부생성물을 초래한다. 그러나, 더욱 문제가 되는 것은 일부 절단된 생성물이 소망하는 완전한 엔빌로프 단백질과 비교하여 1 내지 4개 아미노산 상이점을 갖는 점이다. 따라서, 상이한 발현산물 사이의 생화학적 특징을 충분히 구별할 수 없기 때문에, 정확하게 처리된 생성물의 정제도 실질적으로 불가능하다. 분해 생성물의 일부는 Kex-2와 유사한 절단(예컨대 아르기닌 이후의 절단인 E1의 aa 196 이후에 관측된 절단)의 결과일 수 있으며, 이것은 α-메이팅 인자 리더의 절단을 필요로하므로 상기 필수 과정을 방해함없이 차단될 수 없다.

에스. 세레비시아애(S. cerevisiae) IYCC155를 pSY1YIG7E1s (서열번호: 50, 도 28)를 사용하여 형질전환시켜 유도된 E1을 다량생산하는 클론을 에스. 세레비시아애(S. cerevisiae) IYCC155를 pSY1aMFE1sH6aYIG1E1s (서열번호: 44, 도 22)로써 형질전환시켜 유도된 고생산 클론과 비교하였다. E1 단백질의 세포내 발현은 도입한지 2 내지 7일 후에 E1 특이적 모노클로날 항체(IGH 201)를 사용하는 웨스턴-블럿에 의하여 평가하였다. 도 40으로부터 판명할 수 있듯이, 최대 발현은 양쪽 균 주 공히 2일 후에 관찰되었지만, 양쪽 균주에 대한 발현 패턴은 완전히 상이하였다. α-메이팅 인자 리더를 갖는 발현은 아주 복잡한 밴드 패턴을 초래하는데, 이는 리더의 가공이 효과적이지 않다는 사실로부터 기인한다. 이는 상이한 아미노 말단을 갖는 몇 개의 발현 산물을 초래하고 또 그 일부는 1 내지 5개 N-글리코실화에 의해 변경된다. 그러나, CL 리더와 함께 발현된 E1의 경우, 제한된 개수의 분명한 밴드가 관찰되며, 이는 정확한 CL 리더 제거가 고효율로 이루어졌음을 반영하며 또 이러한 정확하게 가공된 물질만이 N-글리코실화(1 내지 5개 사슬)에 의해 변경될 수 있다는 사실은 동일 CL 리더를 사용하여 발현된 한세눌라-유도된 E1에서 관찰된 바와 같다(실시예 16 참조).

E1에 대해 특이적인 모노클로날 항체(IGH201)를 생산하는 하이브리도마 세포주는 부다페스트 조약하에, European Collection of Cell Cultures, Centre for Applied Microbilogy & Research (영국 윌셔 에스피4 0제이지이, 살리스베리 소재)에 수탁번호 ECACC 98031216으로 1998년 3월 12일에 기탁되었다. E2에 대한 특이적인 모노클로날 항체(IGH212)는 WO 96/04385호에서 Maertens 등에 의해 실시예 7.4에 항체 12D11F2로서 기재되어있다.

주: 에스. 세레비시아애(S. cerevisiae) 및 에이치. 폴리모르파(H. polymorpha) 에서 발현된 αMF-E1-H6 및 αMF-E2-H6 단백질의 N-말단의 동정. N-말단 서열결정을 기준으로 하여, 천연 E1-H6 및 E2-H6의 N-말단의 양을 산출할 수있었다("성숙"은 αMF 시그널 서열이 정확하게 제거된 것을 지시한다). 단백질 산물의 전체량은 에드만 분해에 의해 회수된 피이크의 세기를 기초로하여 단백질의 pmol로 산출하였다. 이어, 각 특정 단백질(즉, 각각의 "검출된 N-말단"에 대하여)에 대하여, 전체량에 대한 몰%를 산출하였다.

실시예 16

대량생산에 적합한 효모에서 E1 작성물의 발현 및 정제

에스.세레비시아애 αMF 리더 펩티드를 치환하기 위하여 몇 개의 다른 리더 서열, 즉 CHH(카르시누스 마에나스(Carcinus maenas) 고혈당 호르몬의 리더 서열), Amyl1 (에스. 옥시덴탈리스(S.occidentalis)로부터 아밀라제의 리더 서열), Gam1 (에스. 옥시덴탈리스(S.occidentalis)로부터 글루코아밀라제의 리더 서열), Phy5 (진균의 피타제로 부터의 리더 서열), pho1 (피치아 파스토리스(Pichia pastoris)로 부터의 산 포스파타제의 리더 서열) 및 CL (조류의 리조짐 C, 1,4-베타-N-아세틸무라미다제 C의 리더)를 사용하여 E1-H6(즉, C-말단 his-태그를 갖는 E1)에 결찰시켰다. 모든 구조물을 한세눌라 폴리모르파(Hansenula polymorpha)에서 발현시키고 생성한 세포 용균물 각각을 웨스턴 블럿 분석처리하였다. 상기에 의해, 리더 또는 시그널 서열 또는 펩티드의 제거정도는 CL이 리더 펩티드로 사용된 구조물을 제외하고는 극히 낮다는 것을 결론지을 수 있다. 이것은 Ni-IDA 정제된 물질의 에드만 분해에 의해 CHH-E1-H6 구조물에 대해서도 확인되었다: 몇 개의 상이한 서열이 회수되긴 했으나 완전히 절단된 생성물은 검출되지 않았다 (표 4 참조).

주: SDS-PAGE 및 PVDF-막으로 블러팅하는 것에 의해 분리한 후 상이한 단백 질 밴드의 N-아미노산 서열결정을 기초로 하여 에이치. 폴리모르파(H. polymorpha)에서 발현된 CHH-E1-H6 단백질의 N-말단의 동정.

상기 기재한 바와 같이, 세포 용균물의 웨스턴-블럿에 의해 E1 특이적 단백질 밴드 패턴이 밝혀졌으며, 이는 CL 리더 펩티드의 정확한 제거 정도가 높음을 나타낸다. 이는 상기 리더가 효모로부터 유래한 것이 아니기 때문에 놀라운 것이다. GuHCl 용해되고 Ni-IDA 정제된 물질의 에드만 분해에 의해 아미노산 서열결정하면 84%의 E1 단백질이 정확하게 제거되며 또 그 물질은 분해 산물을 실질적으로 갖지 않음이 확인되었다. 16%의 가공되지 않은 물질이 존재하지만, 이 물질은 글리코실화되지 않은 것이어서 혼합물로부터 용이하게 제거될 수 있어 정확하게 절단되고 글리코실화된 E1을 특이적으로 농축시킬 수 있다. 이러한 농축방법은 렉틴상의 친화성 크로마토그래피이며, 다른 사항에 대해서는 실시예 19에 나타낸 바와 같다. 다르게는, 소수성 특징이 더 큰 비-글리코실화 물질을 선택사용하여 다른 농축과정을 최적화할 수 있다. CL-H1-H6 단백질로부터 CL 리더 펩티드를 정확하게 제거하는 것은 질량 분광계에 의해 확인하며, 이에 의해 유전형 1b E1의 5개의 N-글리코실화 부위중 4개 까지가 점유될 수 있음이 확인되며, 서열 NNSS (아미노산 233-236; 서열 번호: 73)는 단일 N-글리코실화 부위로 간주될 수 있다.

실시예 17

한세눌라 폴리모르파( Hansenula polymorpha )에서 CL-E2-H6 암호화 구조물로 부터 발현된 HCV E2 단백질의 정제 및 생화학적 특징

한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 CL-E2-VIEGR-H6 (본 실시예에서는 "CL-E2-H6"으로도 표시됨) 단백질로부터 CL 리더 펩티드를 제거하는 효율을 분석하였다. HCV E2s (aa 383-673)은 his-태깅된 단백질로 발현되기 때문에, 수집된 세포의 GuHCl-용해후 발현된 단백질의 신속하고 효과적인 정제를 Ni-IDA상에서 실시하였다. 간단히 말해, 세포 펠릿을 30 mM 인산염, 6M GuHCl, pH 7.2 (9 mL 완충액/g 세포)에 재현탁시켰다. 이 단백질을 320 mM (4% w/v) 아황산나트륨 및 65 mM (2% w/v) 테트라티온산 나트륨 존재하, 실온에서 철야로 술폰화시켰다. 냉동-해동 주기 후 용균물을 원심분리(10,000 g, 30분, 4℃)에 의해 깨끗하게 만들었다. Empigen BB (Albright & Wilson) 및 이미다졸을 최종 농도 1% (w/v) 및 20 mM로 각각 부가하였다. 다른 추가의 크로마토그래피 단계를 Åkta FPLC 워크스테이션(파마시아 제조)상에서 실시하였다. 샘플을 0.22 ㎛ 포어 크기의 막(셀룰로오스 아세테이트)을 통하여 여과시키고 Ni-IDA 칼럼(Ni²⁺가 로딩된 Chelating Sepharose FF, 파마시아 제조)상에 걸고, 50 mM 인산염, 6 M GuHCl, 20 mM 이미다졸이 보충된 1% Empigen BB, pH 7.2 (완충액 A)를 사용하여 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 평형처리시켰다. 완충액 D, 50 mM 인산염, 6M GuHCl, 0.2 % Empigen BB (pH 7.2), 200 mM 이미다졸을 적용하는 것에 의해 his-태깅된 생성물을 용출시켰다. 정제된 물질은 SDS-PAGE 및 E2에 특이적인 특정 모노클로날 항체(IGH212)를 사용하는 웨스턴-블럿에 의해 분석하였다(도 41). IMAC-정제된 E2- H6 단백질은 에드만 분해에 의해 N-말단 서열결정처리시켰다. 이 단백질을 N-글리코시다제 F(로쉐 제조) (0.2 U/㎍ E2, PBS3% empigen BB중 37℃에서 1시간 배양)처리시키거나 또는 미처리 상태로 둔다. 글리코실화된 E2-H6 단백질 및 탈글리코실화된 E2-H6 단백질을 SDS-PAGE처리시키고 PVDF-막상에 블러팅하여 아미노산 서열결정하였다(분석은 PROCISE^TM 492 단백질 서열결정기(어플라이드 바이오시스템스 제조) 상에서 실시하였다). 이 단계에서 SDS-PAGE는 일부 분해 산물을 나타내므로, 크기 배제 크로마토그래피에 의해 분별처리를 실시하였다. Ni-IDA 용출액을 한외여과(MWCO 10kDa, 센트리플러스, 아미콘, 밀리포어)에 의해 농축시키고 PBS, 1% Empigen BB중의 Superdex G200 (파마시아 제조)상에 로딩하였다. SDS-PAGE상에서의 이동을 기준으로 하여 ~30kDa 내지 ~70kDa사이의 Mr을 갖는 완전한 E2s 관련 생성물을 함유하는 용출 분획을 모아서 알킬화시켰다 (5 mM DTT를 사용하여 37℃에서 30분간 배양한 다음 20 mM 요오도아세트아미드를 사용하여 37℃에서 30분간 배양함). IMAC 정제후 있을 수 있는 분해 생성물은 크기 배제 크로마토그래피에 의해 완전한 생성물을 분별하는 것에 의해 극복될 수 있다. 예상치 못한 양호한 결과를 얻었다. N-말단 서열결정화를 기준으로 하여, CL 리더 펩티드가 제거된 E2 생성물의 양을 산출할 수 있었다. 단백질 생성물의 전체 양은 에드만 분해에 의해 회수된 피이크의 세기를 기본으로 하여 단백질의 pmol로 계산하였다. 이어, 각 특정 단백질(예컨대 각 "검출된 N-말단")의 경우, 전체양에 대한 몰%를 산출하였다. 현재의 실험에서, E2-H6의 정확한 N-말단만이 검출되었으며 또 E2 단백질에 포함되 지 않는 E2 단백질의 아미노산을 갖지 않거나 또는 N-말단 아미노산을 함유하는 E2-H6 변이체는 존재하지 않았다. 결론적으로, 에이치. 폴리모르파 (H. polymorpha)에 의해 CL-E2-H6 단백질로서 발현된 E2-H6 단백질은 시험관에서 추가의 가공없이 95% 이상의 정확하게 절단된 단백질로서 분리되었다. 이것은 E2-H6 단백질에 대한 αMF-E2-H6 단백질의 에이치. 폴리모르파(H. polymorpha)에 의한 리더 펩티드 제거의 충실성과 명확한 대조를 이루며, 분리된 단백질의 25%로 발생하는 것으로 계산되었다 (표 3 참조).

실시예 18

CL-H6-K-E1 암호화 구조물로부터 한세눌라 폴리모르파( Hansenula polymorpha )에서 발현된 HCV E1 단백질의 정제 및 생화학적 특징 및 H6-함유 단백질의 시험관내 가공

한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 CL-H6-K-E1로부터 CL 리더 펩티드의 제거 효율 뿐만 아니라 h6(his-tag)-어댑터 펩티드 및 Endo Lys-C 가공부위를 제거하기 위한 시험관내 가공의 효율을 분석하였다. HCV E1s(aa 192-326)은 N-말단 His-K-태깅된 단백질 CL-H6-K-E1으로서 발현되기 때문에, 실시예 17에 기재된 바와 같이 신속하고 효과적인 정제를 실시할 수 있다. H6-K-E1 ( 및 가능하게는 잔류 CL-H6-K-E1) 단백질의 IMAC-크로마토그래피 정제의 용출 프로필은 도 42에 도시한다. SDS-PAGE 및 겔의 은 염색 그리고 E1에 특이적인 특정 모노클로날 항체(IGH201)를 사용한 웨스턴-블럿 분석(도 43) 후, 재조합 E1s 생성물 을 함유하는 용출 분획(63-69)을 모으고('IMAC 푸울') 또 철야로 엔도프로테아나제 Lys-C (로쉐) 처리 (효소/기질 비 1/50 (w/w), 37℃)시킴으로써 H6-K-융합 테일을 제거하였다. 비-처리 융합 생성물의 제거는 Ni-IDA 칼럼상에서 음성 IMAC 크로마토그래피 단계에 의해 실시함으로써 Endo-Lys-C-가공된 단백질을 유동 분획으로 수집하였다. 여기서 Endo-Lys-C 분해된 단백질 샘플을 10 mM NaH₂PO₄.3H₂O, 1% (v/v) Empigen B, pH 7.2 (완충액 B)에 의해 10배 희석시킨 후 Ni-IDA 칼럼상에 적용한 다음 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 완충액 B를 사용하여 세척하였다. 유량을 상이한 분획(1-40)으로 수집한 다음 E1s-생성물이 존재하는지 스크리닝하였다(도 44). N-말단 H6-K (및 가능하게는 잔류 CL-H6-K) 테일이 제거 (SDS-PAGE에서의 이동을 기준으로 하여 ~15 kDa 내지 ~30 kDa 범위의 Mr을 가짐)된 다음, 은 염색 또는 E1에 대하여 특이적인 특정 모노클로날 항체(IGH201)를 사용하여 웨스턴 블럿 분석시켜 온전한 E1을 함유하는 분획(7-28)을 모아서 알킬화시켰다 (5 mM DTT를 사용하여 37℃에서 30분간 배양한 다음 20 mM 요오도아세트아미드를 사용하여 37℃에서 30분간 배양함).

상기 물질을 N-말단 서열결정처리(에드만 분해)하였다. 단백질 샘플은 N-글리코시다제 R (로쉐 제조) (0.2U/㎍ E1, PBS/3% empigen BB중 37℃에서 1시간 배양)로 처리되거나 또는 미처리 상태로 보존한다. 글리코실화된 E1 단백질 및 탈글리코실화된 E1 단백질은 SDS-PAGE에 의해 분리하였고 PVDF-막상에 블러팅하여 에드만 분해(PROCISE^TM 492 단백질 서열기(어플라이드 바이오시스템스 제조)상에서 분석 을 실시함)에 의해 더욱 분석하였다. N-말단 서열결정화를 기본으로 하여 정확하게 가공된 E1 생성물의 양을 산출할 수 있었다 (가공은 H6-K-서열의 정확한 절단을 포함함). 단백질 생성물의 전체 양은 에드만 분해에 의해 회수된 피이크의 세기를 기준으로 하여 단백질의 pmol로 산출하였다. 이어, 특정 단백질(즉, 각 "검출된 N-말단")의 경우, 전체에 대한 몰%를 산출하였다. 현재 실험에서, E1의 정확한 N- 말단만이 검출되었고 또 H6-K-E1의 다른 가공 변이체의 N-말단은 검출되지 않았다. 이를 기준으로 하여, E1 단백질에 대한 H6-K-E1의 E1 (및 가능하게는 잔류하는 CL-H6-K-E1) 단백질의 Endo Lys-C에 의한 시험관내 가공은 95% 이상의 충실성을 갖도록 생성하는 것으로 산출되었다.

실시예 19

저-글리코실화된 형태의 HCV E1의 헤파린에 의한 특이적 제거

효모 세포로부터 HCV 엔빌로프 단백질을 특이적으로 정제하기 위한 단계를 찾기 위하여 헤파린과의 결합을 평가하였다. 헤파린은 몇 개의 바이러스에 결합하는 것으로 알려져 있으므로 HCV 엔빌로프에 대한 결합은 이미 제시된 바 있었다 (Garson, J. A. 등 1999). 이러한 가능한 결합을 분석하기 위하여, 헤파린을 비오티닐화시키고 HCV E1과의 상호작용을 마이크로티터플레이트에서 분석하며, 이때 마이크로티터플레이트는 에이치.폴리모르파로부터의 술폰화된 HCV E1, 에이치. 폴리모르파로부터 알킬화된 HCV E1 (양쪽 모두 실시에 16에 기재된 바와 같이 제조됨) 및 백시니아 발현벡터로 감염된 포유동물 세포 배양액으로부터 알킬화된 HCV E1으 로 피복된 것이다. 놀랍게도, 강한 결합은 에이치.폴리모르파로부터의 술폰화된 HCV E1에 의해서만 관찰될 수 있었던 반면에, 포유동물 세포 배양액으로부터의 알킬화된 HCV E1과의 결합은 전혀 존재하지 않았다. 웨스턴-블럿에 의하여, 본 발명자는 상기 결합은 HCV E1 단백질 혼합물의 저분자량 밴드, 즉 저-글리코실화된 성숙 HCV E1s에 특이적(도 45)이라는 것을 알 수 있었다. 도 45는 술폰화 결합의 제거시 저분자량 E1 (레인 4)이 여전히 관찰되기 때문에 술폰화는 헤파린 결합에 필수적이 아니라는 것을 나타낸다. 그러나, 알킬화는 상기 결합력을 실질적으로 감소시키는데, 이는 본 실시예에 사용된 특정의 알킬화제(요오도-아세트아미드)에 의해 유발될 수 있다. 이러한 발견은 또한 본 발명자들이 고도의 글리코실화를 갖는 (즉, 더 많은 글리코실화 부위가 점유됨) HCV E1 단백질 제제를 위하여 HCV E1 제제를 농축시킬 수 있기 때문에 효모용 CL-HCV-엔빌로프 발현 카세트의 공업적 능력도 나타낸다.

실시예 20

바이러스-유사 입자(virus-like particle: VLP)의 형성 및 분석

에이치. 폴리모르파에서 발현된 HCV E1 및 E2 엔빌로프 단백질이 VLP로 전환(실시예 16 내지 18)하는 것은 WO99/67285호에서 데프라 등에 의해 및 WO01/30815호에서 보스만 등에 의해 기재된 바와 같이 실질적으로 실시하였다. 간단히 말해, HCV 엔빌로프 단백질이 발현되는 형질전환된 에이치. 폴리모르파의 배양후, 세포를 수집하고 GuHCl에서 용균시키고 또 실시예 17에 기재된 바와 같이 술 폰화시켰다. His-태그된 단백질을 IMAC에 의해 정제한 다음 실시예 17에 기재된 바와 같이 한외여과에 의해 농축시켰다.

술폰화된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP-형성

분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질은 환원처리시키지 않고 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하고 PBS, 1% (v/v) Empigen으로 평형화시켰다. 용출 분획은 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시켰다.

비가역적으로 수식된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP 형성

분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질을 환원처리(PBS중 5 mM DTT존재하에서 배양)시켜 술폰화 Cys-티올기를 유리 Cys-티올기로 전환시켰다. 비가역적 Cys-티올 수식은 (i) 20 mM 요오도아세트아미드 존재하에서 30분간 배양하거나, 또는 (ii) 5 mM N-에틸말레이미드 (NEM) 및 15 mM 비오틴-N-에틸말레이미드의 존재하에 30분간 배양하는 것에 의해 실시하였다. 이 단백질을 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하며, 요오도아세트아미드 블로킹인 경우 PBS, 1% (v/v) Empigen을 사용하여 평형화시키거나, 또는 NEM 및 비오틴-NEM에 의한 블로킹의 경우 PBS, 0.2% CHAPS를 사용하여 평형화시켰다. 용출된 분획을 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 또 요오도아세트아미드 블로킹인 경우 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시키거나, 또는 NEM 및 비오틴-NEM을 사용한 블로킹인 경우 PBS, 0.05% CHAPS를 사용하여 탈염시켰다.

가역적으로 수식된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP 형성

분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질을 환원처리(PBS중 5 mM DTT 존재하에서 배양)시켜 술폰화 Cys-티올기를 유리 Cys-티올기로 전환시켰다. 가역적 Cys-티올 수식은 디티오디피리딘 (DTDP), 디티오카르바메이트(DTC) 또는 시스테인의 존재하에서 30분간 배양하는 것에 의해 실시하였다. 이 단백질을 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하고, PBS, 1% (v/v) Empigen으로 평형화시켰다. 용출된 분획을 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 또 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시켰다.

에이치.폴리모르파-발현된 E2-H6의 VLP를 얻기 위한 PBS, 3% (w/v) 베타인을 사용한 크기 배제 크로마토그래피의 용출 프로필은 도 46 (술폰화됨) 및 도 47(요오도아세트아미드를 사용하여 알킬화됨)에 도시되어 있다.

에이치.폴리모르파-발현된 E1의 VLP를 얻기 위한 PBS, 3% (w/v) 베타인을 사 용한 크기 배제 크로마토그래피의 용출 프로필은 도 48 (술폰화됨) 및 도 49(요오도아세트아미드를 사용하여 알킬화됨)에 도시되어 있다. 생성한 VLP는 도 50에 도시한 바와 같이 SDS-PAGE 및 웨스턴-블럿에 의해 분석하였다.

에이치.폴리모르파-발현된 HCV 엔빌로프 단백질에 의해 형성된 VLP의 크기 분석

VLP 입자 크기는 동적광산란(Dynamic Light Scattering)에 의해 측정하였다. 광 산란 실험의 경우, 입자 크기 분석기 (모델 Zetasizer 1000 HS, 영국 워세스터 말버른에 소재하는 말버른 인트스루먼트 리미티드 제조)를 이용하며, 이것은 광자 상관관계 분광계(PCS) 소프트웨어에 의해 제어되었다. 광자 상관관계 분광계 또는 동적광산란(DLS)은 브라운 운동을 측정하여서 그것을 입자 크기와 관련시키는 광학적 방법이다. 연속적인, 가시 레이저 비임으로부터 광은 현탁액중의 거대분자 또는 입자의 앙상블을 직접 통과하고 브라운 운동하에서 이동한다. 레이저 광의 일부는 입자에 의해 산란되며 이러한 산란광은 광증배관에 의해 측정된다. 산란광의 세기변동은 전기적 펄스로 전환되어 상관검출기로 공급된다. 이로써 컴퓨터를 거치는 자기상관함수가 생성되며, 적합한 데이터 분석을 실시한다. 사용된 레이저는 고정파장 633 nm을 갖는 10 mW 단색성, 간섭성 He-Ne 레이저이다. 각 샘플의 경우, 3 내지 6회의 연속 측정을 실시하였다. 이 실험의 결과를 하기 표 5에 수록한다.

주: 에이치. 폴리모르파(H. polymorpha)에 의해 발현된 HCV 엔빌로프 단백질의 표시된 VLP-조성에 대한 동적광산란 분석의 결과. VLP 입자 크기는 입자의 평균 직경으로 나타낸다.

에이치.폴리모르파로부터 유도된 술폰화된 HCV E1는 여전히 한세눌라로부터 유도된 알킬화된 HCV E1과 동일한 크기 범위를 갖는 입자를 형성한다는 관찰은 놀라운 것이다. 술폰화의 결과로서 네가티브 변화의 높은 순수 증가(8개 이하의 Cys-티올 기가 HCV E1상에서 수식될 수 있다)는 서브유닛 간의 이온 반발을 유도할 것이므로 상기와 같은 효과는 예상치 못한 것이었다. 시험된 다른 가역적 시스테인 수식제는 입자 형성을 허용하였지만, 이런 방식으로 생성된 HCV E1은 술폰화된 물질에 비하여 안정하지 않은 것으로 밝혀져, HCV E1의 디술피드-기제 응집을 초래하게 된다. 이들 다른 가역적 블로커(blocker)를 사용하기 위하여, 다른 최적 조건이 필요할 수 있다.

실시예 21

한세눌라-생성된 HCV E1-H6 및 백시니아-감염된 포유동물 세포로부터 생산된 HCV E1의 항원성 등가

WO 99/67285호에서 Depla 등에 의해 기재한 바와 같이, 한세눌라-생산된 HCV E1-H6과 HCV 만성 보균자 혈청과의 반응을 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1의 반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, HCV E1 제제는 NEM 및 비오틴-NEM에 의해 알킬화되어 있었다. 양쪽 HCV E1 VLP-제제와 HCV 만성 보균자 혈청과의 반응성은 ELISA에 의해 결정하였다. 결과를 하기 표 6에 수록한다. 표 6으로부터 알 수 있듯이, HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에서 발현된 HCV E1과 에이치.폴리모르파에서 발현된 HCV E1 사이에는 반응성에서 아무런 차이가 나타나지 않았다.

주: 포유동물 세포 배양액에서 생산된 E1 또는 에이치.폴리모르파에서 생산된 E1의 항원성을, 인간 HCV 만성 보균자로부터 얻은 혈청 패널상에서 평가하였다. 이를 위하여, 비오티닐화된 E1을 스트렙트아비딘 피복된 ELISA 플레이트에 결합시켰다. 그후, 인간 혈청을 1/20 희석하여 부가하고 또 혈청으로부터 E1에 결합된 면역글로불린은 퍼옥시다제로 라벨링된 토끼-항-인간 IgG-Fc 특이적 이차 항체를 이용하여 검출하였다. 결과는 OD값으로 표시한다. 평균치는 시험한 모든 혈청 샘플의 OD값의 평균치이다.

실시예 22

한세눌라 생산된 HCV E1-H6 및 백시니아-감염된 포유동물 세포에 의해 생산된 HCV E1의 면역원성 등가

WO 99/67285호에서 Depla 등에 의해 기재한 바와 같이, 한세눌라-생산된 HCV E1-H6의 면역원성을 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1의 면역원성반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, HCV E1 단백질은 요오도아세트아미드에 의해 알킬화되었다. 양쪽 VLP 제제는 알룸과 함께 제형화되며 Balb/c 마우스에 주사하였다(각 주사당 3주 간격으로 3회 근육내/피하주사하며 각 주사는 0.13% Alhydrogel(덴마크 수퍼포스 제조)을 함유하는 125 ㎕중의 5㎍ E1으로 구성된다). 3회 면역화시킨지 10일 후 마우스로부터 혈액을 채취하였다.

이 실험 결과를 도 51에 도시한다. 도 51의 상부의 경우, 포유동물 세포에서 생산된 E1의 VLP에 의해 면역화되어 형성된 항체를 측정하였다. 항체 역가는 ELISA (실시예 21 참조)에 의해 측정하였으며, 이때 포유동물 세포에서 생산된 "E1"("M") 또는 한세눌라-생산된 E1 ("H")는 ELISA 고형 지지체상에 직접적으로 피복시킨 후 ELISA 플레이트를 카세인으로 블로킹하였다. 도 5의 하부의 경우, 한세눌라-생산된 E1의 VLP에 의해 면역화된 후 생성된 항체를 측정하였다. 항체 역가는 ELISA (실시예 21 참조)에 의해 측정하였으며, 이때 포유동물 세포에서 생산된 "E1" ("M") 또는 한세눌라-생산된 E1 ("H")를 ELISA 고형 지지체상에 직접적으로 피복시킨 후 ELISA 플레이트를 카세인으로 블로킹하였다.

측정된 항체 역가는 종점 역가이었다. 종점 역가는 혈청을 희석시켜 결정하며, 에세이의 바탕시험의 평균의 2배에 상당하는 OD(ELISA에 의해 측정됨)를 초래한다.

도 51은 양쪽 E1 조성물의 면역원성 특성 사이에 현저한 차이가 없고 또 측정된 항체 역가는 종점 역가를 실시하기 위한 ELISA에 사용된 항원과는 독립적이라는 것을 도시한다.

효모-유도된 HCV E1은 백신처리시 포유동물 세포 배양액으로부터 유도된 알킬화된 HCV E1을 사용한 백신처리시 얻을 수 있는 보호반응과 유사한 보호반응을 유발하였다. 후자의 반응은 급성 감염 이후 HCV의 만성적 발병을 예방할 수 있다.

실시예 23

술폰화된 한세눌라-생산된 HCV E1-H6의 항원성 및 면역원성 프로필

한세눌라-생산된 HCV E1-H6과 HCV 만성 보균자 혈청의 반응성을, WO 99/67285호에서 Depla 등에 의해 기재된 바와 같이, HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 HCV E1의 반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, 이때 한세눌라-생산된 HCV E1 단백질은 술폰화되고 또 포유동물 세포에 의해 생산된 HCV E1은 알킬화되었다. 결과를 표 7에 나타낸다. 전체적(평균) 반응성이 동일하였지만, 개별 혈청에 대해 주요한 차이가 확인되었다. 이것은 술폰화된 물질이 알킬화된 HCV E1과는 상이한 방식으로 그의 항원결정부위의 일부를 제공한다는 사실을 의미한다.

술폰화된 한세눌라-생산된 HCV E1-H6의 면역원성을 알킬화된 한세눌라-생산된 HCV E1-H6의 면역원성과 비교하였다. 시험한 양쪽 HCV-E1 제제는 VLP로 구성되었다. 양쪽 VLP 제제를 알룸과 함께 제제화해서 Balb/c 마우스에 주사하였다((각 주사당 3주 간격으로 3회 근육내/피하주사하며 각 주사는 0.13% Alhydrogel(덴마크 수퍼포스 제조)을 함유하는 125 ㎕중의 5㎍ E1으로 구성된다. 3회 면역화시킨지 10일 후 마우스로부터 혈액을 채취하였다.

항체 역가는 실시예 22에 기재된 것과 유사하게 측정하였다. 놀랍게도, 술폰화된 물질을 사용한 면역화는 역가를 평가하기 위한 ELISA에 사용된 항체와 상관없이 더 높은 항체 역가를 초래하였다 (도 51; 상부 패널: 알킬화된 E1에 대해 생성된 항체의 적정; 하부 패널: 술폰화된 E1에 대하여 생성된 항체의 적정; "A": ELISA 플레이트상에 피복된 알킬화된 E1; "S": ELISA 플레이트상에 피복된 술폰화된 E1). 그러나, 상기 실험에서 개별 역가는 분석에 사용된 항원에 따라 상이한데, 이는 HCV 환자의 혈청에서 주목된 관찰을 확인시켜주는 것이다. 따라서, 시스테인 티올 기가 가역적 방식으로 수식된 HCV E1은 면역원성이 더 높으므로 HCV(만성 감염)로부터 보호하는 백신으로서 능력이 더 높다. 또한, 비가역적 블로킹에 의해 유발된 신-항원결정부위에 대한 반응의 유도는 덜 생길 것이다.

주: 알킬화된 E1 (포유동물 세포 배양액에서 생산) 또는 술폰화된 E1-H6 (에이치.폴리모르파에서 생산)의 항원성을, 인간 HCV 만성 보균자로부터 얻은 혈청 패널 및 대조용 혈청("혈액 공여자 혈청") 패널상에서 평가하였다. 이를 위하여 E1을 ELISA 플레이트에 결합시키고 상기 플레이트를 카세인으로 포화시켰다. 인간 혈청을 1/20 희석시켜 부가하고 또 결합된 면역글로불린은 퍼옥시다제로 라벨링된 토끼-항-인간 IgG-Fc 특이적 이차 항체를 이용하여 검출하였다. 결과는 OD값으로 표시한다. 평균치는 시험한 모든 혈청 샘플의 OD값의 평균치이다.

실시예 24

한세눌라-생산된 HCV E1-H6 및 백시니아-감염된 포유동물 세포에서 생산된 HCV E1과 백신처리된 침팬지로부터 얻은 혈청과의 동일한 항원 반응성

HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 E1 및 한세눌라에 의해 생산된 E1-H6 (양쪽 모두 알킬화됨)과 백신 처리된 침팬지의 혈청 과의 반응 및 모노클로날항체와의 반응을 비교하였다. 상기 E1 단백질을 ELISA 플레이트에 직접 피복한 다음 카세인을 사용하여 상기 플레이트를 포화시켰다. ELISA 플레이트에 피복된 E1 단백질에 결합하는 항체의 종점 역가를 침팬지 혈청에 대해 및 특정 쥐의 모노클로날 항체에 대해 측정하였으며, 이들 모두는 포유동물 세포에 의해 생산된 E1에 의해 면역화된 동물로부터 얻었다. 종점 역가 측정은 실시예 22에 기재된 바와 같이 실시하였다. 사용한 쥐의 모노클로날 항체는 IGH201 (실시예 25 참조), IGH198 (IGH198 = 23C12, WO96/04385호에 Maertens 등에 의해 기재됨), IGH203 (IGH203 = 15G6, WO96/04385호에서 Maertens 등에 의해 기재됨) 및 IGH202 (IGH202 = 3F3, WO99/50310호에 Maertens 등에 의해 기재됨)이었다.

도 53으로부터 알 수 있듯이, 한세눌라 또는 포유동물 세포에 의해 생산된 E1 단백질과 시험할 때, 7개의 상이한 침팬지의 반응성은 동일하였다. HCV E1에 대한 모노클로날 항체의 반응성 또한 거의 동일하였다. 예방적 백신 연구에는 2개의 침팬지(요란 및 마티)를 이용하였고 또 면역검사(challlenge)시 급성 감염을 일소시킬 수 있었던 반면에 대조용 동물은 감염을 일소시키지 못하였다. 5개의 다른 침팬지(톤, 필, 마셀, 페기, 펨마)를 치료적 백신 연구에 이용하였고, 혈청중의 ALT 및/또는 HCV E1 면역화시 간 생검에서 조직학적 활성 지수에 의해 측정된 바와 같이, 간 손상의 감소를 나타내었다.

이 실험에서 얻은 결과는 사카로마이세스 세레비시아애(Saccharomyces cerevisiae) 및 클루이베로마이세스 락티스(Kluyveromyces lactis)에서 HCV E2 단백질을 발현시켰던 무스틸리와 그 동료(Mustilli, A.C. 등, 1999)의 발견과는 완전히 상이하였다. 그러나, 정제된 효모-생산된 E2는 포유동물 세포에 의해 생산된 HCV E2에 의해 면역화된 침팬지로부터 얻은 혈청을 사용하는 경우 반응성이 더 낮은 반면에, 모노클로날 항체와의 반응성은 효모 생산된 HCV E2에 대해 더 높은 점에서 포유동물 세포(CHO) 세포에 의해 생산된 HCV E2와는 상이하였다.

실시예 25

형광 보조된 탄수화물 전기영동(fluorophore-assisted carbohydrate electrophoresis: FACE)에 의한 HCV E1의 글리코실화 프로필

한세눌라-생산된 HCV E1 및 HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 HCV E1의 글리코실화 프로필을 WO99/67285호에서 Depla 등에 의해 기재된 바와 같이 비교하였다. 이것은 형광보조된 탄수화물 전기영동(FACE)에 의해 실시하였다. 포유동물 세포 또는 한세눌라에 의해 생산된 E1s로부터 펩티드-N-글리코시다제(PNGase F)에 의해 올리고당을 방출시키고 ANTS로 라벨링하였다(E1 단백질은 PNGase F 분해전에 요오도아세트아미드에 의해 알킬화시켰다). ANTS-라벨링된 올리고당은 21% 폴리아크릴아미드 겔상에서 PAGE에 의해 15 mA의 전류로 4℃에서 2 내지 3시간 동안 분리하였다. 도 54로부터, 포유동물 세포에 의해 생산된 E1 및 한세눌라에 의해 생산된 E1-H6상의 올리고당은 7 내지 11 단 당류의 중합도를 갖는 올리고말토오스처럼 이동한다고 결론지을 수 있었다. 이것은 한세눌라 발현 시스템은 놀랍게도 초글리코실화되지 않고 또 포유동물 세포에서 생산된 E1 단백질에 부가된 당쇄와 유사한 길이를 갖는 당쇄를 갖는 E1 단백질을 초래한다는 것을 나타낸다.

실시예 26

사카로마이세스( Saccharomyces )- 및 한세눌라( Hansenula )-생산된 E1s 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 E1s로부터 유도된 N-결합된 올리고당의 서열결정화

사카로마이세스(Saccharomyces) 또는 한세눌라(Hansenula) 배양액(실시예 15-16 참조) 또는 HCV-재조합 백시니아 바이러스 (WO96/04385호에서 Maertens 등 참조)에 감염된 RK13 세포의 배양액으로부터 정제되고 PBS, 05% 베타인중에 존재하는 E1s (225 ㎍)를 탈글리코실화 배양 완충액 (50 mM Na₂PO₄, 0.75% Nonidet P-40)을 사용하여 희석시켜 최종 농도 140 ㎍/mL로 만들었다. 이 용액의 pH를 농축 H₃PO₄를 사용하여 pH 5.5로 조정하였다. 이 용액에 2U PNGase F (플라보박테륨 메니고셉티쿰(Flavobacterium menigosepticum)의 펩티드-N⁴-(아세틸-베타-글루코사미닐)-아스파라긴 아미다제; EC 3.5.1.52; 로쉐로부터 구입)를 부가하고 그 샘플을 37℃에서 철야로 배양하였다. 철야 배양후, 용액의 pH는 농축 H₃PO₄를 사용하여 pH 5.5로 조정하였다. 4부피의 아세톤(-20℃에서)을 부가하는 것에 의해 단백질 및 올 리고당을 석출시키고 또 그 혼합물을 -20℃에서 15분간 배양하였다. 샘플을 4℃에서 13000 rpm으로 5분간 원심분리시켰다. 아세톤 상층액을 제거하고 펠릿은 -20℃에서 1시간 배양한 후 150 μL 빙냉된 60% 메탄올을 부가하였다. 방출된 올리고당을 함유하는 메탄올 상층액을 수집하고 회전 증발기(SpeedVac 제조)에 의해 건조시켰다.

건조된 E1s 글리칸 뿐만 아니라 기준 올리고당 (모두 Glyko 제조, 영국 비세스터 소재; 도 55 참조) Man-9 (11 당단류 단위), Man-8 (10 단당류 단위), Man-7 (9 단당류 단위), Man-6 (8 단당류 단위) 및 Man-5 (7 단당류 단위)를 5 μL의 2-아미노벤즈아미드 (2-AB) 라벨링제(30% HOAc/70% DMSO중의 ±0.35 M 2-AB+ ± 1M NaCNBH₃)중에 용해시켜 최종 글리칸 농도 5 내지 100 μM로 만들었다. 상기 글리칸 용액을 65℃에서 2시간 동안 배양하였다. 30분 후, 샘플을 보르텍스에 의해 혼합하였다. 결합시킨 후, 과량의 2-AB를 제거하였다. 샘플을 16-μL 정제수(MilliQ)로 희석시키고 Sephadex G-10 칼럼(직경 1 cm, 높이 1.2 cm, 아머샴 바이오사이언스 제조; VacElut 시스템(바리언)에 결합됨)에 부가한 다음 칼럼을 건조시켰다.

2 x 100 μL 정제수(MilliQ)를 칼럼에 적용함으로써 라벨링된 올리고당을 용출시켰다. 기준 탄수화물(Man-9, Man-8, Man-7 및 Man-6)의 용출액을 건조시키고 HPLC 분석할 때 까지 -70℃에서 저장하였다. E1s 샘플 분만 아니라 Man-9 기준 글리칸의 용출물을 4개의 PCR 튜브에 분포시키고 건조시켰다. 표 8에 약술된 반응을 실시하였으며, 이들 반응 모두는 37℃에서 철야로 진행되며, 다만 튜브 3에서의 반 응은 1시간 후에 종료되었다. 사용된 엑소글리코시다제 효소(모두 Glyko로부터 구입, 영국 비세스터 소재)의 최종 농도는 다음과 같았다: α1-2 만노시다제의 경우(아스페르길루스 사이토이): 2 ml/mL; α-만노시다제 (Jack Bean): 50 U/mL; 및 β-만노시다제 (헬릭스 포마티아(Helix pomatia)): 4 U/mL.

도 56은 치토바이오스에 결합된 10개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 각 말단 만노오스 잔기는 α1-3 결합에 의해 비-말단 만노오스 잔기에 결합된다. 도 56의 올리고만노오스는 엑소글리코시다제 α1-2 만노시다제에 의해 절단에 완전히 내성이다. 도 56의 올리고만노오스를 엑소글리코시다제 α-만노시다제와 장기간(철야) 배양하면 모든 α-결합(α 1-2, α1-3, α1-6)의 절단을 초래하지만, β-결합은 절단시키지 않는다. 따라서 생성한 올리고당은 4'-β-만노실 치토바이오스일 것이다. 이 4'-β-만노실 치토바이오스 잔기는 엑소글리코시다제 β만노시다제의 작용을 통하여 만노오스 및 치토바이오스로 전환될 수 있다. 공급자(Glyko)의 명세에 따르면, α-만노시다제는 기준 올리고당 Man-6 (도 55.D 참조)을 4'-β-만노실 치토바이오스로 완전히 전환시키고 또 β-만노시다제에 의한 만노오스 및 치토바이오스로 더 전환되는 것은 완전한 것으로 보고되어 있다.

도 57은 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 이 올리고만노오스에서, 1개 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합된다. 엑소글리코시다제 α1-2 만노시다제의 작용시, 상기 α1-2-결합된 만노오스는 제거될 것이다. 이어 α-만노시다제 및 β-만노시다제를 작용시키면, 도 56의 올리고만노오스에 기재된 바와 같은 반응 생성물을 얻을 것이다. 공급자(Glyko)의 명세에 따르면, α1-2 만노시다제는 기준 올리고당 Man-9 및 Man-6을 Man-5 (도 55 참조)로 >90%의 효율로 전환시킬 수 있다.

도 58은 치토바이오스에 결합된 9게 만노오스 잔기로 구성된 기준의 고급 올리고만노오스 Man-9를 도시한다. 이 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합되어 있다. 엑소글리코시다제 α1-2 만노시다제를 작용시키면, Man-9는 공급자의 명세에 따른 >90%의 효율로 Man-5로 전환될 것이다. 이어 α-만노시다제를 사용하여 분해하면 Man-5를 4'-β-만노실 치오바이오스로 전환할 것이다.

표 8에 나타낸 바와 같이 상이한 반응 튜브의 함량을 원심분리성 진공 증발기 또는 냉동건조기에서 건조시키고 HPLC 분석까지 -70℃에서 저장하였다. 칼럼에 부가하기 전에, 각 샘플(E1s 및 기준용)을 25 μL 물에 용해시켜서 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에 로딩시켰다.

올리고당의 분리는 주위온도에서 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중의 0.1% 아세트산으로 구성되며 또 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성되었다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대해 28% B 이소크래틱을 사용한 다음 15개 칼럼 부피에 대해 45% B로 선형적으로 증가시켜 실시하였다.

기준 올리고당 Man-6은 53±1 분간 용출시켰고, Man-7은 59±분간 용출시켰으며, Man-8은 67±2분간, 그리고 Man-9는 70±1분간 용출시켰다; 4'-β-만노실 치토바이오스는 10±1분간 용출시켰고 또 치토바이오스는 6±1분간(도시하지 않음) 용출시켰다. 이것은 엑소글리코시다제없이 철야 배양한 후(도 63의 크로마토그램의 트레이스1; Man-9), α1-2 만노시아제를 사용하여 철야 배양한 후(도 63의 크로마토그램의 트레이스 2); Man-5 및 Man-6의 혼합물), α-만노시다제를 사용하여 1시간 또는 철야 배양한 후 (도 63의 크로마토그램의 트레이스 3 및 4; 4'-β-만노실 치토바이오스) 및 α- 및 β-만노시다제를 사용하여 철야 배양한 후 (도 6의 크로마토그램의 트레이스 5; 치토바이오스), Man-9의 반응 생성물에 대해 예시한 것이다. 도 63의 크로마토그램의 트레이스 6은 공급된 용매 구배를 나타낸다.

엑소글리코시다제없이 사카로마이세스-생산된 E1s(PNGaseF 처리한 후 얻음)의 올리고당의 반응생성물은 주로 59±1분(15%), 67±1분(45%), 70±1분(25%) 및 75±1분(15%)에서 용출되는 주로 4개 탄수화물이었다. 사카로마이세스-생산된 E1s 에서 Man(8)-GlcNAc(2) 및 Man(9)GlcNAc(2)의 전체 함량은 ~65% 이었다. α1-2 만노시다제와의 반응에서는 오직 70±1분의 체류시간을 갖는 탄수화물만이 사라졌다. 75±1분의 체류시간을 갖는 탄수화물의 세기 및 67±1분의 체류시간을 갖는 탄수화물의 세기는 증가하였다. 이것은 모두 말단 만노오스 단위는 α(1-2) 구조를 갖는다는 것을 의미한다. α 만노시다제와 철야 배양한 후 모든 탄수화물 사슬은 4'-β-만노실 치토바이오스로 환원된다. 이것은 탄수화물은 고 만노오스이고 또 1개를 제외한 모든 만노오스 잔기는 α 구조를 갖는다는 것을 의미한다. 상기 4'-β-만노실 치토바이오스 잔기를 치토바이오스로 환원시키는 것은 β-만노시다제를 사용하여 철야 배양한 후 분명하였다. 생성한 크로마토그램을 도 64에 도시하며, 이것은 도 63의 크로마토그램에 기재된 것과 동일한 조건하에서 얻은 것이었다. 결과를 하기 표 9에 수록한다.

백시니아 감염된 세포에 의해 생산된 E1s을 사용하여 동일 실험을 반복하면 놀랍게도 완전히 상이한 그림을 나타내었다. 효소를 사용하지 않은 반응에서, 탄수화물의 복합체 혼합물이 존재하였다(도 65 및 표 9 참조). 단당류(8)-GlcNAc(2) 및 단당류(9)-GlcNAc(2)의 전체 함량은 37% 이었다. α1-2 만노시다제를 사용한 반응후, 체류시간이 70±1분 및 59±1분인 탄수화물은 사라졌다. α 만노시다제를 사용하여 철야 배양한 후, 단당류(6)-GlcNAc(2)의 실제 양은 4'-만노실 치토바이오스 생성물과 함께 유지되었다. 이것은 올리고당 브랜치의 1개는 α만노시다제 분해를 견딘다는 것을 나타낸다. 이것은 N-결합된 올리고당의 Manα(1-2) 말단 브랜치에 결합된 1 또는 2개의 글루코오스 잔기의 존재에 의해 설명될 수 있다. 글루코 오스-함유 올리고당의 임의 구조는 도 62에 도시되어 있다. 글루코오스 함유 올리고당의 가능한 반응 생성물은 표 10에 나타내어져 있다. α1-2 만노시다제 반응후에는 Man-7-등가의 올리고당(즉, 9개 단당류로 구성된 올리고당)은 존재하지 않는 것처럼, 이들 글루코오스 잔기는 도 62에 도시된 올리고당 구조의 B-브랜치에 결합될 것으로 보인다. 그러나, 도 62에 도시된 올리고당의 A- 및 B-브랜치 모두는 글루코오스에 의해 부분적으로 종료되어 있는 것은 배제할 수 없다.

4'-β-만노실 치토바이오스 잔기를 치토바이오스로 환원하는 것은 β만노시다제와의 철야 배양후 분명하였다. 그 결과 얻은 크로마토그램은 도 65에 도시되어 있으며, 이것은 도 63-64의 크로마토그램에 기재된 것과 동일한 조건하에서 얻었다.

얻은 결과를 하기 표 9에 수록한다.

한세눌라-생산된 E1s를 사용하여 동일한 실험을 반복하면 놀랍게도 완전히 상이한 그림을 나타내었다. 효소를 사용하지 않는 반응에서는 주로 체류시간이 67±2분 및 70±1분인 2개의 탄수화물이 존재하며, 각각 Man-8 및 Man-9에 상응한다. 한세눌라-생산된 E1s에서 Man(8)-GlcNAc(2) 및 Man(9)GlcNAc(2)의 전체 함량은 ~90% 이었다. α1-2 만노시다제와 반응한 후, 탄수화물은 주로 체류시간 45±1분의 Man-5 및 체류시간 53±1분인 Man-6으로 환원되었다. α만노시다제와의 철야 배양후, 모든 탄수화물 사슬은 4'-β-만노실 치토바이오스 잔기로 환원되었다. 이것은 탄수화물은 고만노오스형이며 또 1개를 제외한 모든 만노오스 잔기는 α구조를 갖고 있음을 의미한다. 4'-β-만노실 치토바이오스 잔기가 치토바이오스로 환 원하는 것은 β-만노시다제와의 철야 반응후 분명하였다. 그 결과 얻은 크로마토그램을 도 66에 도시하며, 이것은 도 63 내지 65의 크로마토그램에 기재된 것과 동일한 조건하에서 얻은 것이었다.

얻은 결과를 하기 표 9에 수록한다.

주: 사카로마이세스("Sc") 및 한세눌라("Hp")-생산된 E1s 뿐만 아니라 HCV-재조합 백시니아-감염된 포유동물 세포("Vac")에 의해 생산된 E1s로부터 유도된 올리고만노오스를 분해시켜 얻은 올리고만노오스. 크로마토그램 체류시간("Rt", 분) 및 전체 올리고만노오스 함량(전체 줄)에 상대적인 소정 올리고만노오스의 % 뿐만 아니라 도 55-62중의 하나를 기준으로 하여 표시한 각각 관찰된 올리고만노오스의 가장 유망한 구조를 갖는 상이한 올리고만노오스를 나타내었다. 말단 α1-3 만노오스를 갖는 올리고만노오스는 "^O"로 표시하였다. 말단 글루코오스를 갖는 올리고 만노오스는 "^*"로 표시하였고, 일부 참조용은 "62^*로부터"로 표시하였는데, 이것은 이 구조가 도 62에 도시된 구조로부터 유도될 수 있음을 의미한다. "1"은 엑소글리코시다제를 사용하지 않는 "반응"이고, "2"는 α1-2 만노시다제를 사용한 반응이다. 체류시간 45±1분인 올리고만노오스는 치토바이오스에 결합된 5개의 만노오스 잔기를 포함하는 올리고만노오스로 추정된다. 체류시간 75±1분인 올리고만노오스는 치토바이오스에 결합된 10개 만노오스 잔기를 포함하는 올리고만노오스로 추정된다.

실시예 27

재조합 HCV E1에서 N-글리코실화 부위의 점유

점유된 N-글리코실화 부위의 양에 따라서, E1s은 SDS-PAGE 분석에서 상이한 이동특성을 나타낸다. 이러한 특성을 기본으로 하여, E1 생성물중의 점유된 N-글리코실화 부위의 평균 양을 산출할 수 있었다. 지금까지, 정제된 E1-생성물의 샘플을 SDS-PAGE처리시키고 코마씨 브릴리언트 블루 염색(도 67)시킨 다음 ImageMaster 1D 프라임 소프트웨어 패킷(파마시아 제조)을 이용하여 분석하였다. 요컨대, 특정 단백질 밴드에 대해 겔을 스캐닝하고 또 % 점유(상이한 밴드의 전체 세기에 대한 그의 세기, 따라서 모든 밴드의 합은 100%임)를 산출하였다 (표 11). 각 특정 단백질 밴드는 동일한 개수의 점유된 N-글리코실화 부위를 갖는 E1s-분자를 나타낸다.

얻은 결과는 한세눌라-생산된 E1-생성물의 대부분(>90%)은 백시니아 발현 계(WO 96/04385호에서 Maertens 등에 의해 기재됨)로부터 얻은 E1s 보다 N-글리코실화 부위가 1개 이상 더 적다. 백시니아 유도된 E1 생성물에서 모든 N-글리코실화 부위가 점유 (E1의 위치 233-236상의 점유서열 "NNSS"(서열번호: 73)은 1개 글리코실화 부위로 간주됨)되어 있다고 가정하면, 한세눌라-발현된 E1 단백질에서 점유된 N-글리코실화 부위는 전체 가능한 N-글리코실화 부위의 80%를 초과하지 않는다고 결론짓는 것이 안전하다.

주: 한세눌라 폴리모르파(Hansenula polymorpha) 및 백시니아/베로 발현 계로부터 얻은 E1 단백질에서 점유된 N-글리코실화 부위의 평균 개수를 SDS-PAGE 및 쿠마씨 브릴리언트 블루 염색 세기 분석에 의해 산출함. 단백질 밴드는 분자량으로 나타낸다. 도 67 참조.

실시예 28

재조합 HCV E2에서 N-글리코실화 부위의 점유

한세눌라에 의해 생산된 E2-H6 단백질 200 ㎍을 PNGaseF를 사용하여 탈글리코실화시켰다. 탈글리코실화된 E2s-H6을 미니-겔(10 ㎍/레인)상에 로딩시켰다. 단백질 밴드를 트립신 및 endo Asp-N으로 분해시켰다. 생성한 펩티드의 질량은 Maldi-MS(건조된 방울 및 박층법)에 의해 측정하였다. 이 방법은 N-글리코실화 정도를 측정하기 위해 이용될 수 있다: 효소 PNG-ase F를 사용하여 탈글리코실화시키 는 동안, 완전한 당쇄를 절단시키고, 그와 동시에 아스파라긴(N)을 아스파탐산(D)으로 가수분해시킨다. 이들 2개 아미노산 간의 질량 차이는 1 Da이며, 이것은 질량 분광시험에 의해 측정될 수 있다. 부가적으로, N에서 D로 가수분해하는 것은 Asp-N 효소에 대한 새로운 절단부위를 만든다.

E2s에서 가능한 글리코실화 부위는 N₄₁₇, N₄₂₃, N₄₃₀, N₄₄₈, N₄₇₈, N₅₃₂, N₅₄₀, N₅₅₆, N₅₇₆, N₆₂₃ 및 N₆₄₅(도 68 참조)이다. Maldi-MS 분석에 의하면, 각 이들 글리코실화 부위의 경우 N-글리코실화가 완전하지 않은데, 이는 PNGaseF를 사용하여 탈글리코실화시킨 후, 펩티드는 글리코실화 부위에 N 또는 D를 갖는(질량 차이 1 Da) 것으로 밝혀졌기 때문이다. N-잔기에 대한 D-잔기의 비율은 한세눌라에 의해 발현되며 분석된 샘플내에 당쇄에 의해 단일 N-글리코실화 부위로 존재하는 모든 E2 단백질에 대한 평균 점유율을 나타낸다. 이들 결과를 하기 표 12 내지 14에 수록한다.

상기 결과로부터, 평균해서 각 글리코실화 부위는 54% 정도 글리코실화됨이 산출되었다.

실시예 29

혈액 공여자 혈청과 사카로마이세스 또는 한세눌라에 의해 생산된 HCV E1의 반응성

사카로마이세스에 의해 생산된 E1s-H6 (α-MF 리더를 갖도록 발현) 및 한세눌라에 의해 생산된 E1s-H6 (CL 리더를 갖도록 발현)을 실시예 15 및 16에 기재된 바와 같이 정제하고 또 마지막으로 실시예 20에 기재된 바와 같이 알킬화처리 및 VLP 형성시켰다. 모든 단백질을 마이크로티터플레이트상에 0.5 ㎍/mL (37℃에서 1시간)으로 직접 흡착시키고 HCV-걸러진 혈청으로 플레이트(PBS-0.1% 카세인, 1시간, 37℃)를 블로킹시킨 후 음성 혈액 공여자를 1/20 (PBS-0.5% 카세인, 10%(w/v) 수크로오스, 0.2% (v/v) 트리톤 X-705, 1시간, 37℃)로 희석시켜 배양하였다. 마지 막으로, 퍼옥시다제에 결합된 이차 토끼 항-인간 IgG-F_C 특이적 항혈청(Dako, 덴마크)을 1/50000 (PBS-0.1% 카세인, 1시간, RT)의 희석율로 사용하여 결합을 검출한 다음 발색처리시켰다. 모든 단계 사이에 플레이트를 PBS-0.05% (w/v) 트윈-20을 사용하여 3회 세척하였다. 대조를 위하여, WO99/67285호에서 Depla 등에 의해 기재된 바와 같이 생산되고 정제된 포유동물 세포 유도된 Els에서도 동일한 방식으로 혈청을 분석하였다.

ELISA에 대한 컷오프는 배경치(즉, 스트렙트아비딘이 웰에 흡착된 이외는 동일한 설정에서 모든 혈청의 반응성)의 평균의 2배값으로 설정되었다.

표 15로부터, 많은(75%) 혈청은 사카로마이세스-생산된 E1 에 대하여 컷오프 이상의 반응성을 나타내지만, 한세눌라-생산된 E1에 대해서는 소수의 혈청(6%)만이 컷오프 이상의 반응성을 나타내었다. 이러한 반응성 차이는 실시예 26에서도 분명한 바와 같이 사카로마이세스-생산된 E1상에 있는 α1-2 만노오스에 결합된 말단 α1-3 만노오스의 존재에 기인한 것이었다. Young과 그의 동료들(1998)은 이미 상기 유형의 만노오스는 인간 혈청과 사카로마이세스-유도 만난과의 반응성에 관여한다는 것을 이미 보고하였다. 사카로마이세스 유도 E1에 대한 반응성이 상기 유형의 만노오스 잔기에 기인한 것임을 더 확인하기 위하여, 희석 완충액에 부가된 1 또는 5 mg/mL 만난(시그마 제조)과 예비배양(37℃에서 1시간)된 혈액공여자 혈청을 희석시킴으로써 사카로마이세스-생산된 E1상에서의 ELISA를 반복하였다. 표 16으로부터 판정되듯이, 만난과의 예비배양은 상기 E1과 혈액공여자 혈청과의 반응을 농도 의존적 방식으로 분석된 1개(F556) 혈청에 대해 바탕치까지 감소시켰다. (평균 OD는 5 mg 만난/mL을 사용한 경우 만난에 의한 경쟁없이 0.24로 감소되었다)

참고목록

SEQUENCE LISTING <110> Innogenetics N.V. <120> Core-glycosylated HCV envelope proteins <130> 135 PCT <160> 98 <170> PatentIn version 3.1 <210> 1 <211> 18 <212> PRT <213> Artificial sequence <220> <223> avian lysozyme signal peptide <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa is Arg, Lys or Val <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa is Ser, Ala, Val, Arg or Met <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is Leu or Phe <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is Leu or Ala <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa is Ile, Thr, Phe or Val <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa is Leu, Phe or Ala <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa is Val, Ile, Ala, Leu or Cys <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa is Leu, Phe, Ala or Ile <220> <221> MISC_FEATURE <222> (10)..(10) <223> Xaa is Cys, Phe, Ser or Leu <220> <221> MISC_FEATURE <222> (11)..(11) <223> Xaa is Phe, Leu, Ser or Pro <220> <221> MISC_FEATURE <222> (12)..(12) <223> Xaa is Leu, Ala or Met <220> <221> MISC_FEATURE <222> (13)..(13) <223> Xaa is Pro, Ala or Ile <220> <221> MISC_FEATURE <222> (14)..(14) <223> Xaa is Leu or Ala <220> <221> MISC_FEATURE <222> (15)..(15) <223> Xaa is Ala, Val, Ser or Met <220> <221> MISC_FEATURE <222> (16)..(16) <223> Xaa is Ala, Lys or Ser <220> <221> MISC_FEATURE <222> (17)..(17) <223> Xaa is Leu, Pro, Gln or Ile <400> 1 Met Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Gly <210> 2 <211> 135 <212> PRT <213> hepatitis C virus <400> 2 Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys 1 5 10 15 Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr 20 25 30 Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp 35 40 45 Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr 50 55 60 Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe 65 70 75 80 Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val 85 90 95 Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp 100 105 110 Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala 115 120 125 Trp Asp Met Met Met Asn Trp 130 135 <210> 3 <211> 290 <212> PRT <213> hepatitis C virus <400> 3 His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu 1 5 10 15 Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn 20 25 30 Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp 35 40 45 Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe 50 55 60 Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp 65 70 75 80 Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser 85 90 95 Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly 100 105 110 Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro 115 120 125 Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr 130 135 140 Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg 145 150 155 160 Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly 165 170 175 Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly 180 185 190 Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu 195 200 205 Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys 210 215 220 Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn 225 230 235 240 Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg 245 250 255 Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu 260 265 270 Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu 275 280 285 Trp Gln 290 <210> 4 <211> 141 <212> PRT <213> hepatitis C virus <400> 4 Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys 1 5 10 15 Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr 20 25 30 Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp 35 40 45 Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr 50 55 60 Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe 65 70 75 80 Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val 85 90 95 Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp 100 105 110 Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala 115 120 125 Trp Asp Met Met Met Asn Trp His His His His His His 130 135 140 <210> 5 <211> 301 <212> PRT <213> hepatitis C virus <400> 5 His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu 1 5 10 15 Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn 20 25 30 Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp 35 40 45 Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe 50 55 60 Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp 65 70 75 80 Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser 85 90 95 Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly 100 105 110 Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro 115 120 125 Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr 130 135 140 Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg 145 150 155 160 Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly 165 170 175 Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly 180 185 190 Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu 195 200 205 Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys 210 215 220 Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn 225 230 235 240 Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg 245 250 255 Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu 260 265 270 Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu 275 280 285 Trp Gln Val Ile Glu Gly Arg His His His His His His 290 295 300 <210> 6 <211> 3448 <212> DNA <213> Artificial sequence <220> <223> vector pGEMTE1sH6 <400> 6 aatcactagt gcggccgcct gcaggtcgac catatgggag agctcccaac gcgttggatg 60 catagcttga gtattctata gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg 120 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 180 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 240 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 300 gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 360 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 420 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 480 aggaaccgta aaaaggccgc gttgctggcg tttttcgata ggctccgccc ccctgacgag 540 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 600 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 660 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 720 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 780 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 840 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 900 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 960 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 1020 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 1080 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 1140 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 1200 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1260 tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1320 cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1380 ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 1440 tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 1500 gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 1560 agtttgcgca acgttgttgg cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 1620 atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 1680 tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 1740 gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 1800 agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata ccgcgcccgg 1860 cgaccgagtt gctcttgccc ggcgtcaata cgggataata gtgtatgaca tagcagaact 1920 ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 1980 ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2040 actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2100 ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2160 atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2220 caaatagggg ttccgcgcac atttccccga aaagtgccac ctgtatgcgg tgtgaaatac 2280 cgcacagatg cgtaaggaga aaataccgca tcaggcgaaa ttgtaaacgt taatattttg 2340 ttaaaattcg cgttaaatat ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 2400 ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt 2460 tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc 2520 tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt gcggtcgagg 2580 tgccgtaaag ctctaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga 2640 aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg 2700 ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg 2760 ctacagggcg cgtccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc 2820 gggcctcttc gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt 2880 gggtaacgcc agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat 2940 acgactcact atagggcgaa ttgggcccga cgtcgcatgc tcccggccgc catggccgcg 3000 ggattccaat gcatatgagg tgcgcaacgt gtccgggatg taccatgtca cgaacgactg 3060 ctccaactca agcattgtgt atgaggcagc ggacatgatc atgcacaccc ccgggtgcgt 3120 gccctgcgtt cgggagaaca actcttcccg ctgctgggta gcgctcaccc ccacgctcgc 3180 agctaggaac gccagcgtcc ccactacgac aatacgacgc cacgtcgatt tgctcgttgg 3240 ggcggctgct ttctgttccg ctatgtacgt gggggatctc tgcggatctg tcttcctcgt 3300 ctcccagctg ttcaccatct cgcctcgccg gcatgagacg gtgcaggact gcaattgctc 3360 aatctatccc ggccacataa caggtcaccg tatggcttgg gatatgatga tgaactggca 3420 ccaccaccat caccattaag gatccaag 3448 <210> 7 <211> 37 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 7 agttactctt caaggtatga ggtgcgcaac gtgtccg 37 <210> 8 <211> 47 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 8 agttactctt cacagggatc ctccttaatg gtgatggtgg tggtgcc 47 <210> 9 <211> 3067 <212> DNA <213> Artificial sequence <220> <223> vector pCHH-Hir <400> 9 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc 240 atgcctgcag gtcgacccta gatctctatt actgcaggta ttcttccggg atttcttcga 300 agtcgccgtc gttgtgagac tgcggacgcg gggtaccttc gccagtaacg cactggttac 360 gttcgccttt agagcccagg atgcatttgt tgccctggcc gcaaacgtta gagccttcgc 420 acaggcacag gttctgaccg gattcagtgc agtcagtgta aacaaccctc ttttccaacg 480 ggtgtgtagt tccattctcc accgctaggg ctgcgctggg ctccattggc gaggttttca 540 aggccgctag gatgcgatcc atgcgtccgt agccttgcgt ggagcgtgcg tgtgcgtgcg 600 ggagtgcgca taggtaggct acggtgatga ttgctagcat ggcgggaata gttttgctat 660 acatgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 720 aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 780 gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt 840 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 900 tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 960 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 1020 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 1080 tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 1140 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 1200 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 1260 agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 1320 ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 1380 gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 1440 gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 1500 tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 1560 acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 1620 aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 1680 cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 1740 gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 1800 cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 1860 tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 1920 tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 1980 ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 2040 tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 2100 gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 2160 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 2220 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 2280 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 2340 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 2400 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 2460 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 2520 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 2580 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 2640 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 2700 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 2760 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 2820 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 2880 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 2940 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 3000 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 3060 cggaaga 3067 <210> 10 <211> 35 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 10 agttactctt cacctctttt ccaacgggtg tgtag 35 <210> 11 <211> 34 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 11 agtcactctt cactgcaggc atgcaagctt ggcg 34 <210> 12 <211> 6973 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT121 <400> 12 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcccg 360 atgaagcaga gagcgcagga ggcggtattt atagtgccat tcccctctct gagagacccg 420 gatggtagtc gagtgtatcg gagacagctt gatgtagact ccgtgcctgc cggctcctct 480 tattggcgga caccagtgag acaccccgga acttgctgtt tttctgcaaa atccggggtg 540 accagtggga gcctatttgc acacacgagc gggacacccc actctggtga agagtgccaa 600 agtcattctt tttcccgttg cggggcagcc gattgcatgt tttaggaaaa tattaccttt 660 gctacaccct gtcagattta ccctccacac atatatattc cgtcacctcc agggactatt 720 attcgtcgtt gcgccgccag cggaagatat ccagaagctg ttttccgaga gactcggttg 780 gcgcctggta tatttgatgg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt 840 gggatctcgg gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga 900 tcgccgcctc taaattgtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt 960 ttagatacag tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat 1020 tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttcccat tggctgctgc 1080 gcagcttcgt ataactcgag ttattgttgc gctctgcctc ggcgtactgg ctcatgatct 1140 ggatcttgtc cgtgtcgctt ttcttcgagt gtttctcgca aacgatgtgc acggcctgca 1200 gtgtccaatc ggagtcgagc tggcgccgaa actggcggat ctgagcctcc acactgccct 1260 gtttctctat ccacggcgga accgcctcct gccgtttcag aatgttgttc aagtggtact 1320 ctgtgcggtc aatgaaggcg ttattgccgg tgaaatcttt gggaagcggt tttcctcggg 1380 gaagattacg aaattccccg cgtcgttgcg cttcctggat ctcgaggaga tcgttctccg 1440 cgtcgaggag atcgttctcc gcgtcgacac cattccttgc ggcggcggtg ctcaacggcc 1500 tcaacctact actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgacaaa 1560 cccgcgtttg agaacttgct caagcttctg gtaaacgttg tagtactctg aaacaaggcc 1620 ctagcactct gatctgtttc tcttgggtag cggtgagtgg tttattggag ttcactggtt 1680 tcagcacatc tgtcatctag acaatattgt tactaaattt ttttgaacta caattgttcg 1740 taattcatct attattatac atcctcgtca gcaatttctg gcagacggag tttactaacg 1800 tcttgagtat gaggccgaga atccagctct gtggccatac tcagtcttga cagcctgctg 1860 atgtggctgc gttcaacgca ataagcgtgt cctccgactc cgagttgtgc tcgttatcgt 1920 cgttctcatc ctcggaaaaa tcacacgaaa gaacatactc accagtaggc tttctggtcc 1980 ctggggcacg gctgtttctg acgtattccg gcgttgataa tagctcgaaa gtgaacgccg 2040 agtcgcggga gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg 2100 gcgcggggca tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta 2160 ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg 2220 acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc 2280 gtcactggtc ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg 2340 gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc 2400 attatgattc ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc 2460 aggcaggtag atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc 2520 ctaacttcga tcactggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca 2580 tggaacgggt tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg 2640 cgtcgcggtg catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta 2700 acggattcac cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc 2760 aaaccaaccc ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc 2820 gcatcggggg gggggggggg gggggggggc aaacaattca tcattttttt tttattcttt 2880 tttttgattt cggtttcttt gaaatttttt tgattcggta atctccgaac agaaggaaga 2940 acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac 3000 atgaaattgc ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag 3060 ataaatcatg tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc 3120 tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt 3180 tcgtaccacc aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact 3240 aaaaacacat gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa 3300 ggcattatcc gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg 3360 taatacagtc aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat 3420 tacgaatgca cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga 3480 agaagtaaca aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc 3540 cctatctact ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt 3600 tgttatcggc tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt 3660 gattatgaca cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag 3720 aaccgtggat gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt 3780 tgcaaaggga agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc 3840 atatttgaga agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat 3900 actaaactca caaattagag cttcaattta attatatcag ttattacccg ggaatctcgg 3960 tcgtaatgat ttttataatg acgaaaaaaa aaaaattgga aagaaaagcc cccccccccc 4020 cccccccccc cccccccccc ccgcagcgtt gggtcctggc cacgggtgcg catgatcgtg 4080 ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta gcagaatgaa 4140 tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc gacctgagca 4200 acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg 4260 ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc ctgtggaaca 4320 cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct ctggtcccgc 4380 cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc atgttcatca 4440 tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac ccccatgaac 4500 agaaattccc ccttacacgg aggcatcaag tgaccaaaca ggaaaaaacc gcccttaaca 4560 tggcccgctt tatcagaagc cagacattaa cgcttctgga gaaactcaac gagctggacg 4620 cggatgaaca ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag ctttaccgca 4680 gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 4740 cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 4800 cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt 4860 atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg 4920 tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 4980 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 5040 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 5100 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 5160 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 5220 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 5280 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 5340 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 5400 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 5460 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 5520 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 5580 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 5640 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 5700 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 5760 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 5820 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 5880 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 5940 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 6000 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 6060 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 6120 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 6180 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc 6240 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 6300 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 6360 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 6420 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 6480 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 6540 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 6600 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 6660 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 6720 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 6780 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 6840 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 6900 cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 6960 ctttcgtctt caa 6973 <210> 13 <211> 7591 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT-CHH-E1H6 <400> 13 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360 gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420 gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480 ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540 cgccccaacc agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600 agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660 gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720 ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat acctcttttc 780 caacgggtgt gtagttccat tctccaccgc tagggctgcg ctgggctcca ttggcgaggt 840 tttcaaggcc gctaggatgc gatccatgcg tccgtagcct tgcgtggagc gtgcgtgtgc 900 gtgcgggagt gcgcataggt aggctacggt gatgattgct agcatggcgg gaatagtttt 960 gctatacatg aattcccgat gaagcagaga gcgcaggagg cggtatttat agtgccattc 1020 ccctctctga gagacccgga tggtagtcga gtgtatcgga gacagcttga tgtagactcc 1080 gtgcctgccg gctcctctta ttggcggaca ccagtgagac accccggaac ttgctgtttt 1140 tctgcaaaat ccggggtgac cagtgggagc ctatttgcac acacgagcgg gacaccccac 1200 tctggtgaag agtgccaaag tcattctttt tcccgttgcg gggcagccga ttgcatgttt 1260 taggaaaata ttacctttgc tacaccctgt cagatttacc ctccacacat atatattccg 1320 tcacctccag ggactattat tcgtcgttgc gccgccagcg gaagatatcc agaagctgtt 1380 ttccgagaga ctcggttggc gcctggtata tttgatggat gtcgcgctgc ctcacgtccc 1440 ggtacccagg aacgcggtgg gatctcgggc ccatcgaaga ctgtgctcca gactgctcgc 1500 ccagcaggtg tttcttgatc gccgcctcta aattgtccgc gcatcgccgg taacattttt 1560 ccagctcgga gtttgcgttt agatacagtt tctgcgatgc caaaggagcc tgcagattat 1620 aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg ctgtatttct 1680 gttcccattg gctgctgcgc agcttcgtat aactcgagtt attgttgcgc tctgcctcgg 1740 cgtactggct catgatctgg atcttgtccg tgtcgctttt cttcgagtgt ttctcgcaaa 1800 cgatgtgcac ggcctgcagt gtccaatcgg agtcgagctg gcgccgaaac tggcggatct 1860 gagcctccac actgccctgt ttctctatcc acggcggaac cgcctcctgc cgtttcagaa 1920 tgttgttcaa gtggtactct gtgcggtcaa tgaaggcgtt attgccggtg aaatctttgg 1980 gaagcggttt tcctcgggga agattacgaa attccccgcg tcgttgcgct tcctggatct 2040 cgaggagatc gttctccgcg tcgaggagat cgttctccgc gtcgacacca ttccttgcgg 2100 cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag gagtcgcata 2160 agggagagcg tcgacaaacc cgcgtttgag aacttgctca agcttctggt aaacgttgta 2220 gtactctgaa acaaggccct agcactctga tctgtttctc ttgggtagcg gtgagtggtt 2280 tattggagtt cactggtttc agcacatctg tcatctagac aatattgtta ctaaattttt 2340 ttgaactaca attgttcgta attcatctat tattatacat cctcgtcagc aatttctggc 2400 agacggagtt tactaacgtc ttgagtatga ggccgagaat ccagctctgt ggccatactc 2460 agtcttgaca gcctgctgat gtggctgcgt tcaacgcaat aagcgtgtcc tccgactccg 2520 agttgtgctc gttatcgtcg ttctcatcct cggaaaaatc acacgaaaga acatactcac 2580 cagtaggctt tctggtccct ggggcacggc tgtttctgac gtattccggc gttgataata 2640 gctcgaaagt gaacgccgag tcgcgggagt cgaccgatgc ccttgagagc cttcaaccca 2700 gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc 2760 tttatcatgc aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac 2820 cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac 2880 gccctcgctc aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc 2940 attatcgccg gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga 3000 ggctggatgg ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg 3060 ttgcaggcca tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg 3120 ctcgcggctc ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat 3180 gccgcctcgg cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt 3240 gtctgcctcc ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa 3300 gccggcggca cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc 3360 ggagaactgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct 3420 ccagcagccg cacgcggcgc atcggggggg gggggggggg gggggggcaa acaattcatc 3480 attttttttt tattcttttt tttgatttcg gtttctttga aatttttttg attcggtaat 3540 ctccgaacag aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat 3600 atgtagtgtt gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa 3660 aacctgcagg aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac 3720 tcatcctagt cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt 3780 gtgtgcttca ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg 3840 tcccaaaatt tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg 3900 cacagttaag ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag 3960 aaaatttgct gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat 4020 agcagaatgg gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg 4080 tttgaagcag gcggcagaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga 4140 attgtcatgc aagggctccc tatctactgg agaatatact aagggtactg ttgacattgc 4200 gaagagcgac aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga 4260 tgaaggttac gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagacgc 4320 attgggtcaa cagtatagaa ccgtggatga tgtggtctct acaggatctg acattattat 4380 tgttggaaga ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag 4440 aaaagcaggc tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt 4500 ataagtaaat gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt 4560 attacccggg aatctcggtc gtaatgattt ttataatgac gaaaaaaaaa aaattggaaa 4620 gaaaagcccc cccccccccc cccccccccc cccccccccc gcagcgttgg gtcctggcca 4680 cgggtgcgca tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt 4740 actggttagc agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa 4800 acgtctgcga cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg 4860 gaaacgcgga agtcagcgcc ctgcaccatt atgttccgga tctgcatcgc aggatgctgc 4920 tggctaccct gtggaacacc tacatctgta ttaacgaagc gctggcattg accctgagtg 4980 atttttctct ggtcccgccg catccatacc gccagttgtt taccctcaca acgttccagt 5040 aaccgggcat gttcatcatc agtaacccgt atcgtgagca tcctctctcg tttcatcggt 5100 atcattaccc ccatgaacag aaattccccc ttacacggag gcatcaagtg accaaacagg 5160 aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga 5220 aactcaacga gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg 5280 ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac 5340 acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 5400 cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac 5460 gtagcgatag cggagtgtat actggcttaa ctatgcggca tcagagcaga ttgtactgag 5520 agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 5580 gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 5640 ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 5700 aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 5760 ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 5820 gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 5880 cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 5940 gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 6000 tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 6060 cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 6120 cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 6180 gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 6240 agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 6300 cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 6360 tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 6420 tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 6480 ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 6540 cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 6600 cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 6660 accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 6720 ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 6780 ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 6840 tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 6900 acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 6960 tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 7020 actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 7080 ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 7140 aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 7200 ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 7260 cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 7320 aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 7380 actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 7440 cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 7500 ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa 7560 taggcgtatc acgaggccct ttcgtcttca a 7591 <210> 14 <211> 50 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 14 aggggtaagc ttggataaaa ggtatgaggt gcgcaacgtg tccgggatgt 50 <210> 15 <211> 42 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 15 agttacggat ccttaatggt gatggtggtg gtgccagttc at 42 <210> 16 <211> 7648 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT-Mfalfa-E1-H6 <400> 16 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360 gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420 gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480 ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540 cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600 agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660 gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720 ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat accttttatc 780 caagcttacc ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa 840 cccgttattt gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc 900 tgagtaaccg atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt 960 gactggagca gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa 1020 tctcatgaat tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc 1080 tctctgagag acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg 1140 cctgccggct cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct 1200 gcaaaatccg gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct 1260 ggtgaagagt gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag 1320 gaaaatatta cctttgctac accctgtcag atttaccctc cacacatata tattccgtca 1380 cctccaggga ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc 1440 cgagagactc ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt 1500 acccaggaac gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca 1560 gcaggtgttt cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca 1620 gctcggagtt tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac 1680 ctcggatgct gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt 1740 cccattggct gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt 1800 actggctcat gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga 1860 tgtgcacggc ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag 1920 cctccacact gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt 1980 tgttcaagtg gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa 2040 gcggttttcc tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga 2100 ggagatcgtt ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg 2160 cggtgctcaa cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg 2220 gagagcgtcg acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta 2280 ctctgaaaca aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat 2340 tggagttcac tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg 2400 aactacaatt gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga 2460 cggagtttac taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt 2520 cttgacagcc tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt 2580 tgtgctcgtt atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag 2640 taggctttct ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct 2700 cgaaagtgaa cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc 2760 agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt 2820 atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc 2880 tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc 2940 ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt 3000 atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc 3060 tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg 3120 caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc 3180 gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc 3240 gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc 3300 tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc 3360 ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga 3420 gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca 3480 gcagccgcac gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt 3540 ttttttttat tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc 3600 cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg 3660 tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac 3720 ctgcaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca 3780 tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg 3840 tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc 3900 caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac 3960 agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa 4020 atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc 4080 agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt 4140 gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt 4200 gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa 4260 gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga 4320 aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt 4380 gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt 4440 tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa 4500 agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata 4560 agtaaatgca tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt 4620 acccgggaat ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa 4680 aagccccccc cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg 4740 gtgcgcatga tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact 4800 ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg 4860 tctgcgacct gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa 4920 acgcggaagt cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg 4980 ctaccctgtg gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt 5040 tttctctggt cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac 5100 cgggcatgtt catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc 5160 attaccccca tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa 5220 aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac 5280 tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg 5340 atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 5400 tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 5460 gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 5520 gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 5580 gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 5640 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 5700 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 5760 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 5820 gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 5880 gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 5940 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 6000 aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 6060 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 6120 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 6180 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 6240 gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 6300 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 6360 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 6420 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 6480 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 6540 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 6600 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 6660 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 6720 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 6780 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 6840 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc 6900 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 6960 atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 7020 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 7080 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 7140 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac 7200 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 7260 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 7320 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 7380 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 7440 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 7500 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 7560 aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 7620 gcgtatcacg aggccctttc gtcttcaa 7648 <210> 17 <211> 4453 <212> DNA <213> Artificial sequence <220> <223> vector pUC18-FMD-MFalfa-E1-H6 <220> <221> misc_feature <222> (1207)..(1208) <223> N is any nucleotide <220> <221> misc_feature <222> (1386)..(1387) <223> N is any nucleotide <400> 17 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240 cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300 ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360 catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420 cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480 gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540 agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600 tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660 cggacacgtt gcgcacctca taccttttat ccaagcttac cccttcttct ttagcagcaa 720 tgctggcaat agtagtattt ataaacaata acccgttatt tgtgctgttg gaaaatggca 780 aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc gatgacagct tcagccggaa 840 tttgtgccgt ttcatcttct gttgtagtgt tgactggagc agctaatgcg gaggatgctg 900 cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa ttcccgatga aggcagagag 960 cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga 1020 gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca 1080 ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc 1140 ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt 1200 tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt 1260 cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg 1320 cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta 1380 tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg 1440 gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc 1500 taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat 1560 ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt 1620 aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa 1680 ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc 1740 tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg 1800 cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc 1860 cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat 1920 ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc 1980 ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca 2040 ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 2100 ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 2160 aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 2220 tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 2280 gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 2340 acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 2400 ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 2460 gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 2520 caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 2580 attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 2640 aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 2700 tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 2760 agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2820 gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2880 cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2940 agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 3000 taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 3060 tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 3120 taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 3180 acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 3240 ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 3300 cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 3360 agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 3420 tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 3480 agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 3540 tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 3600 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 3660 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 3720 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3780 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 3840 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3900 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3960 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 4020 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 4080 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 4140 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 4200 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 4260 gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 4320 ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 4380 ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 4440 aggaagcgga aga 4453 <210> 18 <211> 51 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 18 tgcttcctac cactagcagc actaggatat gaggtgcgca acgtgtccgg g 51 <210> 19 <211> 52 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 19 tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag cg 52 <210> 20 <211> 4252 <212> DNA <213> Artificial sequence <220> <223> vector pUC18-FMD-CL-E1-H6 <220> <221> misc_feature <222> (1006)..(1007) <223> N is any nucleotide <220> <221> misc_feature <222> (1185)..(1186) <223> N is any nucleotide <400> 20 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240 cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300 ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360 catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420 cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480 gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540 agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600 tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660 cggacacgtt gcgcacctca tatcctagtg ctgctagtgg taggaagcat agtactagta 720 ttagtaggct tcgcatgaat tcccgatgaa ggcagagagc gcaaggaggc ggtatttata 780 gtgccattcc cctctctgag agacccggat ggtagtcgag tgttatcgga gacagcttga 840 tgtagactcc gtgcctgccg gtcctcttat tggcggacac cagtgagaca ccccggaact 900 tgctgttttt ctgcaaaatc cggggtgacc agtgggagcc tatttgcaca cacgagcggg 960 acaccccact ctggtgaaga gtgccaaagt cattcttttt cccgtnncgg ggcagccgat 1020 tgcatgtttt aggaaaatat tacctttgct acaccctgtc agatttaccc tccacacata 1080 tatattccgt cacctccagg gactattctt ggctcgttgc gccgccgcgg aagatatcca 1140 gaagctgtgt tttccgagag actcggttgg cgcctggtat atttnnagga tgtcgcgctg 1200 cctcacgtcc cggtacccag gaacgcggtg ggatctcggg cccatcgaag actgtgctcc 1260 agactgctcg cccagcaggt gtttcttgat tgccgcctct aaatagtccg cgcatcgccg 1320 gtaacatttt tccagctcgg agtttgcgtt tagatacatt tctgcgatgc caaaggagcc 1380 tgcagattat aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg 1440 ctgtatttct gttccattgg ctgctggacg ttcgtataac tcgagttatt gttgcgctct 1500 gcctcggcgt actggctcat gactgactgc ggtcgcttct cgagtgttct cgcaacagga 1560 cgcctgcagg tcatcgagtc gagctggcgc cgaaactggc ggatctgacc tccacactgc 1620 cctgtatctc tatccaccgg gaaccgcctc ctgccgttcc agaatgttgt tcaagtggta 1680 gctctgtgcg gtcaatgaag gcgttattgc cggtgaaatc tttgggaagc ggtttatcct 1740 cggggaagat tacgaaattc ccgcgcgtcg ttgcgcttcc tggatctcga ggaagatcgt 1800 tctccgcgtc gaggagatcg ttctccgcgt cgacctgcag gcatgcaagc ttggcactgg 1860 ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 1920 cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 1980 cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc 2040 atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg 2100 catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 2160 tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 2220 ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 2280 tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa 2340 atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 2400 tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 2460 aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 2520 acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 2580 acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 2640 ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 2700 ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 2760 caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 2820 ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 2880 aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 2940 aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 3000 tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 3060 aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 3120 cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 3180 ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 3240 gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 3300 agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 3360 atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 3420 cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 3480 cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3540 cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3600 tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 3660 tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3720 ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 3780 aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 3840 cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 3900 ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 3960 agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 4020 ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 4080 acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 4140 cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 4200 gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ga 4252 <210> 21 <211> 7447 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT-CL-E1-H6 <400> 21 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360 gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420 gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480 ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540 cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600 agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660 gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720 ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat atcctagtgc 780 tgctagtggt aggaagcata gtactagtat tagtaggctt cgcatgaatt cccgatgaag 840 cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt 900 agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg 960 cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt 1020 gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat 1080 tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca 1140 ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt 1200 cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct 1260 ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc 1320 tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg 1380 cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat 1440 acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg 1500 cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct 1560 tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct 1620 tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc 1680 aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct 1740 ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc 1800 ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat 1860 tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga 1920 ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc 1980 tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg 2040 tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca 2100 ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca 2160 catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc 2220 atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga 2280 gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg 2340 ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct 2400 catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg 2460 cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc 2520 gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 2580 ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 2640 gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg 2700 atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact 2760 ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac 2820 gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg 2880 attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag 2940 gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact 3000 tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac 3060 gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc 3120 ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat 3180 tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca 3240 acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg 3300 gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg 3360 atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 3420 gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 3480 ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 3540 catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 3600 gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 3660 caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 3720 acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 3780 atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 3840 agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 3900 tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 3960 aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 4020 tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 4080 cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 4140 gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 4200 ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 4260 gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 4320 gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 4380 ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 4440 tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc 4500 cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg 4560 tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 4620 atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca 4680 tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc 4740 accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca 4800 tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc 4860 cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 4920 acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat 4980 tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc 5040 gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 5100 aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 5160 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 5220 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 5280 ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 5340 gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat 5400 accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac 5460 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5520 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5580 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 5640 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 5700 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 5760 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 5820 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 5880 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 5940 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6000 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6060 aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6120 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6180 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6240 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6300 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6360 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6420 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6480 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 6540 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6600 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 6660 gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 6720 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 6780 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 6840 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 6900 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 6960 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca 7020 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7080 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7140 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7200 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7260 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7320 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 7380 agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 7440 tcttcaa 7447 <210> 22 <211> 3730 <212> DNA <213> Artificial sequence <220> <223> vector pSP72E2H6 <400> 22 gaactcgagc agctgaagct tgaattcatg agatttcctt caatttttac tgcagtttta 60 ttcgcagcat cctccgcatt agctgctcca gtcaacacta caacagaaga tgaaacggca 120 caaattccgg ctgaagctgt catcggttac tcagatttag aaggggattt cgatgttgct 180 gttttgccat tttccaacag cacaaataac gggttattgt ttataaatac tactattgcc 240 agcattgctg ctaaagaaga aggggtatct ctagataaaa ggcatacccg cgtgtcagga 300 ggggcagcag cctccgatac caggggcctt gtgtccctct ttagccccgg gtcggctcag 360 aaaatccagc tcgtaaacac caacggcagt tggcacatca acaggactgc cctgaactgc 420 aacgactccc tccaaacagg gttctttgcc gcactattct acaaacacaa attcaactcg 480 tctggatgcc cagagcgctt ggccagctgt cgctccatcg acaagttcgc tcaggggtgg 540 ggtcccctca cttacactga gcctaacagc tcggaccaga ggccctactg ctggcactac 600 gcgcctcgac cgtgtggtat tgtacccgcg tctcaggtgt gcggtccagt gtattgcttc 660 accccgagcc ctgttgtggt ggggacgacc gatcggtttg gtgtccccac gtataactgg 720 ggggcgaacg actcggatgt gctgattctc aacaacacgc ggccgccgcg aggcaactgg 780 ttcggctgta catggatgaa tggcactggg ttcaccaaga cgtgtggggg ccccccgtgc 840 aacatcgggg gggccggcaa caacaccttg acctgcccca ctgactgttt tcggaagcac 900 cccgaggcca cttacgccag atgcggttct gggccctggc tgacacctag gtgtatggtt 960 cattacccat ataggctctg gcactacccc tgcactgtca acttcaccat cttcaaggtt 1020 aggatgtacg tggggggcgt ggagcacagg ttcgaagccg catgcaattg gactcgagga 1080 gagcgttgtg acttggagga cagggataga tcagagctta gctcgctgct gctgtctaca 1140 acagagtggc aggtgatcga gggcagacac catcaccacc atcactaata gttaattaac 1200 gatctcgact tggttgaaca cgttgccaag gcttaagtga atttacttta aagtcttgca 1260 tttaaataaa ttttcttttt atagctttat gacttagttt caatttatat actattttaa 1320 tgacattttc gattcattga ttgaaagcta tcagatctgc cggtctccct atagtgagtc 1380 gtattaattt cgataagcca ggttaacctg cattaatgaa tcggccaacg cgcggggaga 1440 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 1500 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 1560 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 1620 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 1680 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 1740 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 1800 tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 1860 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 1920 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 1980 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2040 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2100 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2160 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2220 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2280 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 2340 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 2400 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 2460 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 2520 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 2580 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 2640 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 2700 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 2760 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 2820 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 2880 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 2940 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 3000 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 3060 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 3120 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 3180 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 3240 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 3300 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3360 gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 3420 acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat 3480 gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 3540 gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 3600 tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat ggacatattg 3660 tcgttagaac gcggctacaa ttaatacata accttatgta tcatacacat acgatttagg 3720 tgacactata 3730 <210> 23 <211> 7370 <212> DNA <213> Artificial sequence <220> <223> vector pMPT121 <220> <221> misc_feature <222> (778)..(778) <223> N is any nucleotide <400> 23 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcgtt 360 tttgtacttt agattgatgt caccaccgtg cactggcagc agtatttata gatggaccgt 420 gtggggacgg ttgggtacac ttagcggcag cgctgacccc atctgtgatc aagtagggca 480 aaaactgggg atgtcggagt cgctgcacgg tagcataaga atttactttc tggccggttc 540 acccgcattt gcactgtgga gaaacagcct gtccgacacc ccaccagttg ccacatcggc 600 cctctgctgc tctggtgatt ttctggtagc aggcacagac agcagtgggt agcgccgtcc 660 ggttaggcaa ggtcacgttg taggctaccc cagcaaacag agcctcacat gacaccatcc 720 agctgcgtcc tcgaagcgaa aagttcggtt gcggctgcag aaccccctca gttgccanat 780 tcacaagttt tacgcgacgg ctaaagcgag tgggttttaa aaacttgcgg tgcaaggatg 840 catgcggcaa caattaattg gtgcatccag cacagcaagc ccagtctcga gatgtccagt 900 cgctacagag tggagtacgc actcaaggaa caccgtcgag atggcctcat agaatggatc 960 aagggcctgc tggccacgcc gttcgtcctg tacgcggtga agagcaacgg catctctgca 1020 gtggacgacc tcatggtaaa ctctgaggca aaacgccgct acgcggaaat cttccacgac 1080 ctcgaactcc tcatcgacga caacattgaa atgaccaaag ccggcacccc cgaattgtct 1140 cggctcgtgc agctggttcc gagcgttggc agcttcttca cgagactgcc tctggaaaag 1200 gccttctaca tcgaggacga gcgccgcgcc atcagcaaac gccggcttgt ggccccctcg 1260 ttcaacgacg tccggctcat tctcaacacg gcccagctgt tggagatgtc gcggttcttc 1320 cattccaaaa ccatccgaga tcgcaagctg cagctcatta cattcgatgg tgacatcaca 1380 ctgtacgacg acggcaaaaa tttcgatgcc gagtcgccca tcctgcccca cctcatcaaa 1440 ctaatggcca aggacctcta tgtgggtatc gtcaccgcgg ccggctacag cgacggaaca 1500 agtactacga gcgcctcaag ggcctcatcg acgccgtcca gacgtccccg ctgctcacag 1560 gccaccagaa agagaacctg ttcattatgg gcggcgaggc aaactacctc ttccggtaca 1620 gtaacgagga gcagagatta cgcttctact ccaaagacag atggctgctc gagaacatgc 1680 tgaattggtc cgaggaggac attcatctga cactggactt tgcgcaggac gttctaaacg 1740 acctcgttca caaactgggc tcgccagcca ccgtggtccg caaggagcgt cgcgtcggcc 1800 tggttccatt accgggccac aagctgatcc gcgagcagct cgaggagatc gttctccgcg 1860 tcgacaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc 1920 ctaatgcagg agtcgcataa gggagagcgt cgactcccgc gactcggcgt tcactttcga 1980 gctattatca acgccggaat acgtcagaaa cagccgtgcc ccagggacca gaaagcctac 2040 tggtgagtat gttctttcgt gtgatttttc cgaggatgag aacgacgata acgagcacaa 2100 ctcggagtcg gaggacacgc ttattgcgtt gaacgcagcc acatcagcag gctgtcaaga 2160 ctgagtatgg ccacagagct ggattctcgg cctcatactc aagacgttag taaactccgt 2220 ctgccagaaa ttgctgacga ggatgtataa taatagatga attacgaaca attgtagttc 2280 aaaaaaattt agtaacaata ttgtctagat gacagatgtg ctgaaaccag tgaactccaa 2340 taaaccactc accgctaccc aagagaaaca gatcagagtg ctagggcctt gtttcagagt 2400 actacaacgt ttaccagaag cttgagcaag ttctcaaacg cgggtttgtc gaccgatgcc 2460 cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc 2520 cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctg 2580 ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc 2640 ggtattcgga atcttgcacg ccctcgctca agccttcgtc actggtcccg ccaccaaacg 2700 tttcggcgag aagcaggcca ttatcgccgg catggcggcc gacgcgctgg gctacgtctt 2760 gctggcgttc gcgacgcgag gctggatggc cttccccatt atgattcttc tcgcttccgg 2820 cggcatcggg atgcccgcgt tgcaggccat gctgtccagg caggtagatg acgaccatca 2880 gggacagctt caaggatcgc tcgcggctct taccagccta acttcgatca ctggaccgct 2940 gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg aacgggttgg catggattgt 3000 aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc 3060 cacctcgacc tgaatggaag ccggcggcac ctcgctaacg gattcaccac tccaagaatt 3120 ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa ccaacccttg gcagaacata 3180 tccatcgcgt ccgccatctc cagcagccgc acgcggcgca tcgggggggg gggggggggg 3240 ggggggcaaa caattcatca tttttttttt attctttttt ttgatttcgg tttctttgaa 3300 atttttttga ttcggtaatc tccgaacaga aggaagaacg aaggaaggag cacagactta 3360 gattggtata tatacgcata tgtagtgttg aagaaacatg aaattgccca gtattcttaa 3420 cccaactgca cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat 3480 ataaggaacg tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc 3540 acgaaaagca aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg 3600 agttagttga agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga 3660 ctgatttttc catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt 3720 ttttactctt cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact 3780 ctgcgggtgt atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg 3840 gcccaggtat tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag 3900 gccttttgat gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta 3960 agggtactgt tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa 4020 gagacatggg tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt 4080 tagatgacaa gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta 4140 caggatctga cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg 4200 tagagggtga acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc 4260 aaaactaaaa aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt 4320 caatttaatt atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg 4380 aaaaaaaaaa aattggaaag aaaagccccc cccccccccc cccccccccc cccccccccg 4440 cagcgttggg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct 4500 aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 4560 aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 4620 ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat 4680 ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg 4740 ctggcattga ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt 4800 accctcacaa cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat 4860 cctctctcgt ttcatcggta tcattacccc catgaacaga aattccccct tacacggagg 4920 catcaagtga ccaaacagga aaaaaccgcc cttaacatgg cccgctttat cagaagccag 4980 acattaacgc ttctggagaa actcaacgag ctggacgcgg atgaacaggc agacatctgt 5040 gaatcgcttc acgaccacgc tgatgagctt taccgcagct gcctcgcgcg tttcggtgat 5100 gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 5160 gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 5220 gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac tatgcggcat 5280 cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac agatgcgtaa 5340 ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 5400 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 5460 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 5520 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 5580 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 5640 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 5700 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 5760 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 5820 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 5880 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 5940 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 6000 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6060 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6120 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6180 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6240 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6300 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6360 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6420 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6480 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 6540 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 6600 gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 6660 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 6720 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 6780 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 6840 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 6900 gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag 6960 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7020 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7080 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7140 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7200 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7260 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 7320 tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa 7370 <210> 24 <211> 8298 <212> DNA <213> Artificial sequence <220> <223> vector pFMPT-MFalfa-E2-H6 <400> 24 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt 360 caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc 420 tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca 480 acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg 540 ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc 600 ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc 660 tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag 720 tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg 780 catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg 840 ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg 900 ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc 960 agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc 1020 cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt 1080 acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta 1140 ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg 1200 gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag 1260 aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg 1320 ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc 1380 ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc 1440 ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt 1500 gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg 1560 atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca 1620 gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat 1680 tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc tctctgagag 1740 acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg cctgccggct 1800 cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct gcaaaatccg 1860 gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct ggtgaagagt 1920 gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag gaaaatatta 1980 cctttgctac accctgtcag atttaccctc cacacatata tattccgtca cctccaggga 2040 ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc cgagagactc 2100 ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt acccaggaac 2160 gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca gcaggtgttt 2220 cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca gctcggagtt 2280 tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac ctcggatgct 2340 gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt cccattggct 2400 gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt actggctcat 2460 gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga tgtgcacggc 2520 ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag cctccacact 2580 gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt tgttcaagtg 2640 gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa gcggttttcc 2700 tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga ggagatcgtt 2760 ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg cggtgctcaa 2820 cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg 2880 acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta ctctgaaaca 2940 aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat tggagttcac 3000 tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg aactacaatt 3060 gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga cggagtttac 3120 taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt cttgacagcc 3180 tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt tgtgctcgtt 3240 atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag taggctttct 3300 ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct cgaaagtgaa 3360 cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 3420 ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 3480 tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga 3540 gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag 3600 ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca 3660 tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct 3720 tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc 3780 tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta 3840 ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga 3900 gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg 3960 cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct 4020 cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa 4080 tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac 4140 gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt ttttttttat 4200 tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc cgaacagaag 4260 gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg tagtgttgaa 4320 gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa 4380 cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct 4440 gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg 4500 gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt 4560 ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg 4620 ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac 4680 attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca 4740 gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg 4800 gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag 4860 ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa gagcgacaaa 4920 gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat 4980 tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag 5040 tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga 5100 ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg 5160 gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca 5220 tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt acccgggaat 5280 ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa aagccccccc 5340 cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg gtgcgcatga 5400 tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga 5460 atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct 5520 gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt 5580 cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg 5640 gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt 5700 cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt 5760 catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca 5820 tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct 5880 taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct 5940 ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta 6000 ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc 6060 ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc 6120 gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg 6180 agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg 6240 cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct 6300 tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 6360 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 6420 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 6480 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 6540 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 6600 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 6660 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6720 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6780 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6840 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6900 ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6960 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 7020 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 7080 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 7140 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 7200 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 7260 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 7320 actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 7380 cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 7440 agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 7500 gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg 7560 gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 7620 gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 7680 gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 7740 cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 7800 ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat 7860 accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 7920 aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 7980 aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 8040 caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 8100 ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 8160 gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 8220 cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg 8280 aggccctttc gtcttcaa 8298 <210> 25 <211> 8695 <212> DNA <213> Artificial sequence <220> <223> vector pMPT-Mfalfa-E2-H6 <220> <221> misc_feature <222> (2103)..(2103) <223> N is any nucleotide <400> 25 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt 360 caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc 420 tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca 480 acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg 540 ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc 600 ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc 660 tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag 720 tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg 780 catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg 840 ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg 900 ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc 960 agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc 1020 cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt 1080 acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta 1140 ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg 1200 gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag 1260 aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg 1320 ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc 1380 ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc 1440 ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt 1500 gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg 1560 atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca 1620 gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat 1680 tcgtttttgt actttagatt gatgtcacca ccgtgcactg gcagcagtat ttatagatgg 1740 accgtgtggg gacggttggg tacacttagc ggcagcgctg accccatctg tgatcaagta 1800 gggcaaaaac tggggatgtc ggagtcgctg cacggtagca taagaattta ctttctggcc 1860 ggttcacccg catttgcact gtggagaaac agcctgtccg acaccccacc agttgccaca 1920 tcggccctct gctgctctgg tgattttctg gtagcaggca cagacagcag tgggtagcgc 1980 cgtccggtta ggcaaggtca cgttgtaggc taccccagca aacagagcct cacatgacac 2040 catccagctg cgtcctcgaa gcgaaaagtt cggttgcggc tgcagaaccc cctcagttgc 2100 canattcaca agttttacgc gacggctaaa gcgagtgggt tttaaaaact tgcggtgcaa 2160 ggatgcatgc ggcaacaatt aattggtgca tccagcacag caagcccagt ctcgagatgt 2220 ccagtcgcta cagagtggag tacgcactca aggaacaccg tcgagatggc ctcatagaat 2280 ggatcaaggg cctgctggcc acgccgttcg tcctgtacgc ggtgaagagc aacggcatct 2340 ctgcagtgga cgacctcatg gtaaactctg aggcaaaacg ccgctacgcg gaaatcttcc 2400 acgacctcga actcctcatc gacgacaaca ttgaaatgac caaagccggc acccccgaat 2460 tgtctcggct cgtgcagctg gttccgagcg ttggcagctt cttcacgaga ctgcctctgg 2520 aaaaggcctt ctacatcgag gacgagcgcc gcgccatcag caaacgccgg cttgtggccc 2580 cctcgttcaa cgacgtccgg ctcattctca acacggccca gctgttggag atgtcgcggt 2640 tcttccattc caaaaccatc cgagatcgca agctgcagct cattacattc gatggtgaca 2700 tcacactgta cgacgacggc aaaaatttcg atgccgagtc gcccatcctg ccccacctca 2760 tcaaactaat ggccaaggac ctctatgtgg gtatcgtcac cgcggccggc tacagcgacg 2820 gaacaagtac tacgagcgcc tcaagggcct catcgacgcc gtccagacgt ccccgctgct 2880 cacaggccac cagaaagaga acctgttcat tatgggcggc gaggcaaact acctcttccg 2940 gtacagtaac gaggagcaga gattacgctt ctactccaaa gacagatggc tgctcgagaa 3000 catgctgaat tggtccgagg aggacattca tctgacactg gactttgcgc aggacgttct 3060 aaacgacctc gttcacaaac tgggctcgcc agccaccgtg gtccgcaagg agcgtcgcgt 3120 cggcctggtt ccattaccgg gccacaagct gatccgcgag cagctcgagg agatcgttct 3180 ccgcgtcgac accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct 3240 gcttcctaat gcaggagtcg cataagggag agcgtcgact cccgcgactc ggcgttcact 3300 ttcgagctat tatcaacgcc ggaatacgtc agaaacagcc gtgccccagg gaccagaaag 3360 cctactggtg agtatgttct ttcgtgtgat ttttccgagg atgagaacga cgataacgag 3420 cacaactcgg agtcggagga cacgcttatt gcgttgaacg cagccacatc agcaggctgt 3480 caagactgag tatggccaca gagctggatt ctcggcctca tactcaagac gttagtaaac 3540 tccgtctgcc agaaattgct gacgaggatg tataataata gatgaattac gaacaattgt 3600 agttcaaaaa aatttagtaa caatattgtc tagatgacag atgtgctgaa accagtgaac 3660 tccaataaac cactcaccgc tacccaagag aaacagatca gagtgctagg gccttgtttc 3720 agagtactac aacgtttacc agaagcttga gcaagttctc aaacgcgggt ttgtcgaccg 3780 atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc 3840 gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 3900 ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg 3960 cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc 4020 aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc gctgggctac 4080 gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat tcttctcgct 4140 tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt agatgacgac 4200 catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc gatcactgga 4260 ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg gttggcatgg 4320 attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc 4380 cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc accactccaa 4440 gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac ccttggcaga 4500 acatatccat cgcgtccgcc atctccagca gccgcacgcg gcgcatcggg gggggggggg 4560 gggggggggg gcaaacaatt catcattttt tttttattct tttttttgat ttcggtttct 4620 ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga aggagcacag 4680 acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt gcccagtatt 4740 cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca tgtcgaaagc 4800 tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc tatttaatat 4860 catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca ccaaggaatt 4920 actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat 4980 cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta 5040 caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca 5100 gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt 5160 ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc 5220 tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata 5280 tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg gctttattgc 5340 tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt 5400 gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt 5460 ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc 5520 taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg 5580 ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag 5640 agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg atttttataa 5700 tgacgaaaaa aaaaaaattg gaaagaaaag cccccccccc cccccccccc cccccccccc 5760 ccccgcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc gttgaggacc 5820 cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat acgcgagcga 5880 acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg aatggtcttc 5940 ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac cattatgttc 6000 cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc tgtattaacg 6060 aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca taccgccagt 6120 tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac ccgtatcgtg 6180 agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc ccccttacac 6240 ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc tttatcagaa 6300 gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa caggcagaca 6360 tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc gcgcgtttcg 6420 gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 6480 aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 6540 ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 6600 ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 6660 cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 6720 ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 6780 cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 6840 gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 6900 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 6960 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 7020 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 7080 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 7140 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 7200 cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 7260 cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 7320 tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 7380 cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 7440 cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 7500 gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 7560 gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 7620 gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 7680 ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 7740 atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 7800 agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 7860 ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 7920 tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat 7980 ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 8040 caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 8100 gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 8160 atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 8220 accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt 8280 aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 8340 gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 8400 tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 8460 aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 8520 ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 8580 aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 8640 tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc ttcaa 8695 <210> 26 <211> 36 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 26 agtcactctt caaggcatac ccgcgtgtca ggaggg 36 <210> 27 <211> 39 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 27 agtcactctt cacagggatc cttagtgatg gtggtgatg 39 <210> 28 <211> 4190 <212> DNA <213> Artificial sequence <220> <223> vector pMF30 <400> 28 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc 240 atgcctgcag ttgattgcag atgccagatc ccgaaagaac agaggacgga gcgtaaactt 300 gtggcattcc accagaaatt gatacagata agcttccgga gtcaccagct aaaacggaat 360 tgcaagaaat aatatcgata actttatcac cactagaata gccggtgttg ctgacagtaa 420 tatcctgtga cccgtttgaa cctaaattat taaaaatgga aatcaattga ttagcatcgc 480 tacccttcct agtggctata tagtggtctg aagaagaaac aactgaggat ttgtaagttg 540 aataggcaga atccttctta atagcttgat ttcttatttg atttagttta ctgattagct 600 cgtagtattc tgaatcggta ttatatccac ttaaccataa agcttctcta ttggcaggat 660 cggaaccacc attgagacct tgttcttggc cataataaat aattgggata ccatcaccca 720 aaattataaa agccatgtca ttcttaatca aggatgtgtc tgaggtaact gatggaaatc 780 taacttggtc atggttttca ataaagtttc ccaacaaaga gacgtccgaa caagatgact 840 gtaacgtgga gatcattgaa gttaactcac tggaagtcgc cgaagtatca ctgaagaatc 900 tatatactgg atagtataat ggatagttgg taactccttt catataattc tgatatggac 960 aagtataagt tggatctcct tgataaactt cacctaagtt ataaacacca gaagcgtcct 1020 caaacttcgt taatgaagcg gtatctacgt gctttgcact atcaattctt aaaccatcga 1080 ttgaatagtt ttgaacaaaa tctgacaccc aagtttgaaa tactcctata acttcattat 1140 cctcggtact taaatctgga agggagactt cagtatcacc ttcccaacaa tcttcaacat 1200 tggtttgatc attataattt gtaatcaaac aataatcgtg gaagtaagat tgttgattga 1260 atggagtgaa actagaataa tctacgcttg aaccatctcc gttccaagca taatggttgt 1320 aaacaacgtc gaccatcaat aacatgcttc tggaatgcaa ttcgctagct aattgtttca 1380 attcatcagc ggtaccaaaa ttagtgttca attcatcaat atttttcatc caataaccat 1440 ggtaagcata accataagca gtattgtcag gaatttgctc aacaactggg gagatccaga 1500 tcgcagtgaa acccatacct tgaatataat ccaacttgtc gataatccct ttataagatc 1560 caccacagta cttgcgatca ctcactaaac agtcagctgt ggtcgagcca tcagatctgg 1620 caaacctatc agtaacgatt tgataaatcg attggtcttt ccatttatca gctgacgagc 1680 taacatccct cttgtcaaaa ataatcggtt gagcagatac caatcttgag aatgctaaaa 1740 ttgctgcaac aactttactt gtaaatcctt cagttgaaaa tctcattgaa ttcactggcc 1800 gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 1860 gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 1920 caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct ccttacgcat 1980 ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 2040 tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2100 ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2160 ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 2220 taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 2280 gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 2340 agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 2400 catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 2460 ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 2520 atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 2580 ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 2640 gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 2700 ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 2760 ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 2820 gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 2880 ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 2940 gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 3000 ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 3060 gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 3120 gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 3180 caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 3240 cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 3300 ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 3360 taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 3420 tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 3480 gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 3540 agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 3600 aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 3660 gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 3720 gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 3780 tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 3840 agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 3900 cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 3960 gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 4020 gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 4080 ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 4140 cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 4190 <210> 29 <211> 38 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 29 agtcactctt cacctcttgt caaaaataat cggttgag 38 <210> 30 <211> 52 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 30 tgcttcctac cactagcagc actaggacat acccgcgtgt caggaggggc ag 52 <210> 31 <211> 57 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 31 tagtactagt attagtaggc ttcgcatgga attcactggc cgtcgtttta caacgtc 57 <210> 32 <211> 7927 <212> DNA <213> Artificial sequence <220> <223> vector pFMPT-CL-E2-H6 <400> 32 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttagt gatggtggtg 360 atggtgtctg ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc 420 tgatctatcc ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc 480 gaacctgtgc tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt 540 gcaggggtag tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg 600 cccagaaccg catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca 660 ggtcaaggtg ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt 720 gaacccagtg ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt 780 gttgagaatc agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg 840 atcggtcgtc cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg 900 agacgcgggt acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc 960 cgagctgtta ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga 1020 gcgacagctg gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag 1080 tgcggcaaag aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg 1140 ccaactgccg ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga 1200 cacaaggccc ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gtcctagtgc 1260 tgctagtggt aggaagcata gtactagtat tagtaggctg cgcatgaatt cccgatgaag 1320 cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt 1380 agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg 1440 cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt 1500 gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat 1560 tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca 1620 ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt 1680 cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct 1740 ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc 1800 tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg 1860 cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat 1920 acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg 1980 cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct 2040 tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct 2100 tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc 2160 aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct 2220 ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc 2280 ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat 2340 tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga 2400 ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc 2460 tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg 2520 tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca 2580 ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca 2640 catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc 2700 atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga 2760 gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg 2820 ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct 2880 catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg 2940 cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc 3000 gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 3060 ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 3120 gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg 3180 atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact 3240 ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac 3300 gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg 3360 attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag 3420 gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact 3480 tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac 3540 gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc 3600 ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat 3660 tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca 3720 acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg 3780 gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg 3840 atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 3900 gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 3960 ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 4020 catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 4080 gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 4140 caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 4200 acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 4260 atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 4320 agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 4380 tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 4440 aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 4500 tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 4560 cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 4620 gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 4680 ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 4740 gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 4800 gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 4860 ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 4920 tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc 4980 cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg 5040 tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 5100 atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca 5160 tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc 5220 accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca 5280 tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc 5340 cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 5400 acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat 5460 tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc 5520 gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 5580 aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 5640 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 5700 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 5760 ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 5820 gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat 5880 accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac 5940 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 6000 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 6060 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 6120 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 6180 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 6240 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 6300 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 6360 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 6420 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6480 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6540 aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6600 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6660 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6720 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6780 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6840 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6900 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6960 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 7020 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 7080 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 7140 gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 7200 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 7260 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 7320 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 7380 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 7440 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca 7500 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7560 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7620 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7680 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7740 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7800 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 7860 agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 7920 tcttcaa 7927 <210> 33 <211> 24 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 33 taaggatccc cgggtaccga gctc 24 <210> 34 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 34 ccagttcatc atcatatccc aagcc 25 <210> 35 <211> 4234 <212> DNA <213> Artificial sequence <220> <223> vector pUC18-FMD-CL-E1 <220> <221> misc_feature <222> (988)..(989) <223> N is any nucleotide <220> <221> misc_feature <222> (1167)..(1168) <223> N is any nucleotide <400> 35 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240 cggtacccgg ggatccttac cagttcatca tcatatccca agccatacgg tgacctgtta 300 tgtggccggg atagattgag caattgcagt cctgcaccgt ctcatgccgg cgaggcgaga 360 tggtgaacag ctgggagacg aggaagacag atccgcagag atcccccacg tacatagcgg 420 aacagaaagc agccgcccca acgagcaaat cgacgtggcg tcgtattgtc gtagtgggga 480 cgctggcgtt cctagctgcg agcgtggggg tgagcgctac ccagcagcgg gaagagttgt 540 tctcccgaac gcagggcacg cacccggggg tgtgcatgat catgtccgct gcctcataca 600 caatgcttga gttggagcag tcgttcgtga catggtacat cccggacacg ttgcgcacct 660 catatcctag tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga 720 attcccgatg aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg 780 agagacccgg atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc 840 cggtcctctt attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa 900 tccggggtga ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa 960 gagtgccaaa gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat 1020 attacctttg ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca 1080 gggactattc ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag 1140 agactcggtt ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc 1200 aggaacgcgg tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag 1260 gtgtttcttg attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc 1320 ggagtttgcg tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg 1380 atgctgtcat tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt 1440 ggctgctgga cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc 1500 atgactgact gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag 1560 tcgagctggc gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc 1620 gggaaccgcc tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga 1680 aggcgttatt gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat 1740 tcccgcgcgt cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat 1800 cgttctccgc gtcgacctgc aggcatgcaa gcttggcact ggccgtcgtt ttacaacgtc 1860 gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 1920 ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 1980 tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 2040 accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 2100 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 2160 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 2220 cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 2280 taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 2340 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 2400 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 2460 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 2520 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 2580 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 2640 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 2700 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 2760 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 2820 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 2880 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 2940 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 3000 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 3060 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 3120 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 3180 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 3240 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 3300 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 3360 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 3420 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 3480 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 3540 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 3600 caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 3660 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 3720 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 3780 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 3840 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 3900 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 3960 cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 4020 gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 4080 tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg 4140 tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 4200 agcgcagcga gtcagtgagc gaggaagcgg aaga 4234 <210> 36 <211> 7429 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT-CL-E1 <400> 36 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat 360 catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc 420 ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga 480 tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc 540 gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt 600 gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt 660 gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac 720 atggtacatc ccggacacgt tgcgcacctc atatcctagt gctgctagtg gtaggaagca 780 tagtactagt attagtaggc ttcgcatgaa ttcccgatga agcagagagc gcaggaggcg 840 gtatttatag tgccattccc ctctctgaga gacccggatg gtagtcgagt gtatcggaga 900 cagcttgatg tagactccgt gcctgccggc tcctcttatt ggcggacacc agtgagacac 960 cccggaactt gctgtttttc tgcaaaatcc ggggtgacca gtgggagcct atttgcacac 1020 acgagcggga caccccactc tggtgaagag tgccaaagtc attctttttc ccgttgcggg 1080 gcagccgatt gcatgtttta ggaaaatatt acctttgcta caccctgtca gatttaccct 1140 ccacacatat atattccgtc acctccaggg actattattc gtcgttgcgc cgccagcgga 1200 agatatccag aagctgtttt ccgagagact cggttggcgc ctggtatatt tgatggatgt 1260 cgcgctgcct cacgtcccgg tacccaggaa cgcggtggga tctcgggccc atcgaagact 1320 gtgctccaga ctgctcgccc agcaggtgtt tcttgatcgc cgcctctaaa ttgtccgcgc 1380 atcgccggta acatttttcc agctcggagt ttgcgtttag atacagtttc tgcgatgcca 1440 aaggagcctg cagattataa cctcggatgc tgtcattcag cgcttttaat ttgacctcca 1500 gatagttgct gtatttctgt tcccattggc tgctgcgcag cttcgtataa ctcgagttat 1560 tgttgcgctc tgcctcggcg tactggctca tgatctggat cttgtccgtg tcgcttttct 1620 tcgagtgttt ctcgcaaacg atgtgcacgg cctgcagtgt ccaatcggag tcgagctggc 1680 gccgaaactg gcggatctga gcctccacac tgccctgttt ctctatccac ggcggaaccg 1740 cctcctgccg tttcagaatg ttgttcaagt ggtactctgt gcggtcaatg aaggcgttat 1800 tgccggtgaa atctttggga agcggttttc ctcggggaag attacgaaat tccccgcgtc 1860 gttgcgcttc ctggatctcg aggagatcgt tctccgcgtc gaggagatcg ttctccgcgt 1920 cgacaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc 1980 taatgcagga gtcgcataag ggagagcgtc gacaaacccg cgtttgagaa cttgctcaag 2040 cttctggtaa acgttgtagt actctgaaac aaggccctag cactctgatc tgtttctctt 2100 gggtagcggt gagtggttta ttggagttca ctggtttcag cacatctgtc atctagacaa 2160 tattgttact aaattttttt gaactacaat tgttcgtaat tcatctatta ttatacatcc 2220 tcgtcagcaa tttctggcag acggagttta ctaacgtctt gagtatgagg ccgagaatcc 2280 agctctgtgg ccatactcag tcttgacagc ctgctgatgt ggctgcgttc aacgcaataa 2340 gcgtgtcctc cgactccgag ttgtgctcgt tatcgtcgtt ctcatcctcg gaaaaatcac 2400 acgaaagaac atactcacca gtaggctttc tggtccctgg ggcacggctg tttctgacgt 2460 attccggcgt tgataatagc tcgaaagtga acgccgagtc gcgggagtcg accgatgccc 2520 ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc 2580 gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctctgg 2640 gtcattttcg gcgaggaccg ctttcgctgg agcgcgacga tgatcggcct gtcgcttgcg 2700 gtattcggaa tcttgcacgc cctcgctcaa gccttcgtca ctggtcccgc caccaaacgt 2760 ttcggcgaga agcaggccat tatcgccggc atggcggccg acgcgctggg ctacgtcttg 2820 ctggcgttcg cgacgcgagg ctggatggcc ttccccatta tgattcttct cgcttccggc 2880 ggcatcggga tgcccgcgtt gcaggccatg ctgtccaggc aggtagatga cgaccatcag 2940 ggacagcttc aaggatcgct cgcggctctt accagcctaa cttcgatcac tggaccgctg 3000 atcgtcacgg cgatttatgc cgcctcggcg agcacatgga acgggttggc atggattgta 3060 ggcgccgccc tataccttgt ctgcctcccc gcgttgcgtc gcggtgcatg gagccgggcc 3120 acctcgacct gaatggaagc cggcggcacc tcgctaacgg attcaccact ccaagaattg 3180 gagccaatca attcttgcgg agaactgtga atgcgcaaac caacccttgg cagaacatat 3240 ccatcgcgtc cgccatctcc agcagccgca cgcggcgcat cggggggggg gggggggggg 3300 gggggcaaac aattcatcat ttttttttta ttcttttttt tgatttcggt ttctttgaaa 3360 tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc acagacttag 3420 attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag tattcttaac 3480 ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga aagctacata 3540 taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta atatcatgca 3600 cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg aattactgga 3660 gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg atatcttgac 3720 tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca agtacaattt 3780 tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat tgcagtactc 3840 tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg gtgtggtggg 3900 cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg aacctagagg 3960 ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag aatatactaa 4020 gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta ttgctcaaag 4080 agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg gtgtgggttt 4140 agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg tggtctctac 4200 aggatctgac attattattg ttggaagagg actatttgca aagggaaggg atgctaaggt 4260 agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat gcggccagca 4320 aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa ttagagcttc 4380 aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt ataatgacga 4440 aaaaaaaaaa attggaaaga aaagcccccc cccccccccc cccccccccc ccccccccgc 4500 agcgttgggt cctggccacg ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta 4560 ggctggcggg gttgccttac tggttagcag aatgaatcac cgatacgcga gcgaacgtga 4620 agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa catgaatggt cttcggtttc 4680 cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct gcaccattat gttccggatc 4740 tgcatcgcag gatgctgctg gctaccctgt ggaacaccta catctgtatt aacgaagcgc 4800 tggcattgac cctgagtgat ttttctctgg tcccgccgca tccataccgc cagttgttta 4860 ccctcacaac gttccagtaa ccgggcatgt tcatcatcag taacccgtat cgtgagcatc 4920 ctctctcgtt tcatcggtat cattaccccc atgaacagaa attccccctt acacggaggc 4980 atcaagtgac caaacaggaa aaaaccgccc ttaacatggc ccgctttatc agaagccaga 5040 cattaacgct tctggagaaa ctcaacgagc tggacgcgga tgaacaggca gacatctgtg 5100 aatcgcttca cgaccacgct gatgagcttt accgcagctg cctcgcgcgt ttcggtgatg 5160 acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg 5220 atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg 5280 cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact atgcggcatc 5340 agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag 5400 gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 5460 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 5520 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 5580 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 5640 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 5700 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 5760 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 5820 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 5880 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 5940 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 6000 tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 6060 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 6120 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 6180 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 6240 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 6300 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 6360 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 6420 catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 6480 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 6540 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 6600 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 6660 caacgttgtt gccattgctg caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 6720 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 6780 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 6840 actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 6900 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 6960 ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca catagcagaa ctttaaaagt 7020 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 7080 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 7140 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 7200 gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 7260 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 7320 ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 7380 gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcaa 7429 <210> 37 <211> 39 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 37 catcacaaat atgaggtgcg caacgtgtcc gggatgtac 39 <210> 38 <211> 42 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 38 gtgatggtgg tgtcctagtg ctgctagtgg taggaagcat ag 42 <210> 39 <211> 4273 <212> DNA <213> Artificial sequence <220> <223> vector pUC18-FMD-CL-E1-H-K6 <220> <221> misc_feature <222> (1027)..(1028) <223> N is any nucleotide <220> <221> misc_feature <222> (1206)..(1207) <223> N is any nucleotide <400> 39 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240 cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300 ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360 catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420 cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480 gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540 agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600 tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660 cggacacgtt gcgcacctca tatttgtgat ggtgatggtg gtgtcctagt gctgctagtg 720 gtaggaagca tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag 780 cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga 840 gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca 900 ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc 960 ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt 1020 tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt 1080 cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg 1140 cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta 1200 tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg 1260 gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc 1320 taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat 1380 ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt 1440 aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa 1500 ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc 1560 tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg 1620 cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc 1680 cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat 1740 ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc 1800 ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca 1860 ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 1920 ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 1980 aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 2040 tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 2100 gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 2160 acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 2220 ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 2280 gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 2340 caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 2400 attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 2460 aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 2520 tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 2580 agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2640 gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2700 cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2760 agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 2820 taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 2880 tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 2940 taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 3000 acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 3060 ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 3120 cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 3180 agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 3240 tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 3300 agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 3360 tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 3420 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 3480 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 3540 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3600 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 3660 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3720 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3780 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3840 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3900 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3960 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 4020 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 4080 gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 4140 ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 4200 ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 4260 aggaagcgga aga 4273 <210> 40 <211> 7330 <212> DNA <213> Artificial sequence <220> <223> vector pFPMT-CL-H6-K-E1 <220> <221> misc_feature <222> (1098)..(1099) <223> N is any nucleotide <220> <221> misc_feature <222> (1277)..(1278) <223> N is any nucleotide <400> 40 ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60 tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120 gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180 aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240 ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300 ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat 360 catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc 420 ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga 480 tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc 540 gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt 600 gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt 660 gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac 720 atggtacatc ccggacacgt tgcgcacctc atatttgtga tggtgatggt ggtgtcctag 780 tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga attcccgatg 840 aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg agagacccgg 900 atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc cggtcctctt 960 attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa tccggggtga 1020 ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa gagtgccaaa 1080 gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat attacctttg 1140 ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca gggactattc 1200 ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag agactcggtt 1260 ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc aggaacgcgg 1320 tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag gtgtttcttg 1380 attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc ggagtttgcg 1440 tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat 1500 tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt ggctgctgga 1560 cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc atgactgact 1620 gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag tcgagctggc 1680 gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc gggaaccgcc 1740 tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga aggcgttatt 1800 gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat tcccgcgcgt 1860 cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat cgttctccgc 1920 gtcgacctgc aggcatgcaa gcttctggta aacgttgtag tactctgaaa caaggcccta 1980 gcactctgat ctgtttctct tgggtagcgg tgagtggttt attggagttc actggtttca 2040 gcacatctgt catctagaca atattgttac taaatttttt tgaactacaa ttgttcgtaa 2100 ttcatctatt attatacatc ctcgtcagca atttctggca gacggagttt actaacgtct 2160 tgagtatgag gccgagaatc cagctctgtg gccatactca gtcttgacag cctgctgatg 2220 tggctgcgtt caacgcaata agcgtgtcct ccgactccga gttgtgctcg ttatcgtcgt 2280 tctcatcctc ggaaaaatca cacgaaagaa catactcacc agtaggcttt ctggtccctg 2340 gggcacggct gtttctgacg tattccggcg ttgataatag ctcgaaagtg aacgccgagt 2400 cgcgggagtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt ccggtgggcg 2460 cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga 2520 caggtgccgg cagcgctctg ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg 2580 atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg ccctcgctca agccttcgtc 2640 actggtcccg ccaccaaacg tttcggcgag aagcaggcca ttatcgccgg catggcggcc 2700 gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag gctggatggc cttccccatt 2760 atgattcttc tcgcttccgg cggcatcggg atgcccgcgt tgcaggccat gctgtccagg 2820 caggtagatg acgaccatca gggacagctt caaggatcgc tcgcggctct taccagccta 2880 acttcgatca ctggaccgct gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg 2940 aacgggttgg catggattgt aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt 3000 cgcggtgcat ggagccgggc cacctcgacc tgaatggaag ccggcggcac ctcgctaacg 3060 gattcaccac tccaagaatt ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa 3120 ccaacccttg gcagaacata tccatcgcgt ccgccatctc cagcagccgc acgcggcgca 3180 tcgggggggg gggggggggg ggggggcaaa caattcatca tttttttttt attctttttt 3240 ttgatttcgg tttctttgaa atttttttga ttcggtaatc tccgaacaga aggaagaacg 3300 aaggaaggag cacagactta gattggtata tatacgcata tgtagtgttg aagaaacatg 3360 aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga aacgaagata 3420 aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc ctgttgctgc 3480 caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat tggatgttcg 3540 taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt gtttactaaa 3600 aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc cgctaaaggc 3660 attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg acattggtaa 3720 tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg cagacattac 3780 gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg cggcagaaga 3840 agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca agggctccct 3900 atctactgga gaatatacta agggtactgt tgacattgcg aagagcgaca aagattttgt 3960 tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg attggttgat 4020 tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac agtatagaac 4080 cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag gactatttgc 4140 aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct gggaagcata 4200 tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg catgtatact 4260 aaactcacaa attagagctt caatttaatt atatcagtta ttacccggga atctcggtcg 4320 taatgatttt tataatgacg aaaaaaaaaa aattggaaag aaaagccccc cccccccccc 4380 cccccccccc cccccccccg cagcgttggg tcctggccac gggtgcgcat gatcgtgctc 4440 ctgtcgttga ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca 4500 ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca 4560 acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 4620 tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 4680 acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 4740 atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 4800 gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 4860 aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 4920 cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 4980 atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 5040 gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 5100 tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 5160 gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 5220 ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 5280 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 5340 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 5400 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 5460 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 5520 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 5580 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 5640 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 5700 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 5760 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 5820 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 5880 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 5940 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 6000 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 6060 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 6120 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 6180 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 6240 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 6300 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 6360 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 6420 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 6480 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 6540 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 6600 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 6660 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 6720 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 6780 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 6840 atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 6900 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 6960 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 7020 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 7080 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 7140 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 7200 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 7260 ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 7320 tcgtcttcaa 7330 <210> 41 <211> 5202 <212> DNA <213> Artificial sequence <220> <223> vector pYIG5 <400> 41 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240 cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa 300 ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa 360 atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt 420 gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc 480 acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc 540 ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa 600 tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt 660 taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc 720 ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca 780 gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa 840 gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg 900 taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca 960 gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta 1020 atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg 1080 gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac 1140 gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag 1200 agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt 1260 ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 1320 attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 1380 agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat 1440 ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca 1500 acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag 1560 atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt 1620 tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag 1680 ataaaaggcc tgtcgacggt accagatctc gacttggttg aacacgttgc caaggcttaa 1740 gtgaatttac tttaaagtct tgcatttaaa taaattttct ttttatagct ttatgactta 1800 gtttcaattt atatactatt ttaatgacat tttcgattca ttgattgaaa gctttgtgtt 1860 ttttcttgat gcgctattgc attgttcttg tctttttcgc cacatgtaat atctgtagta 1920 gatacctgat acattgtgga tgctgagtga aattttagtt aataatggag gcgctcttaa 1980 taattttggg gatattggct ttttttttta aagtttacaa atgaattttt tccgccagga 2040 taacgattct gaagttactc ttagcgttcc tatcggtaca gccatcaaat catgcctata 2100 aatcatgcct atatttgcgt gcagtcagta tcatctacat gaaaaaaact cccgcaattt 2160 cttatagaat acgttgaaaa ttaaatgtac gcgccaagat aagataacat atatctagct 2220 agatgcagta atatacacag attcccgcgg acgtgggaag gaaaaaatta gataacaaaa 2280 tctgagtgat atggaaattc cgctgtatag ctcatatctt tcccttcaac accagaaatg 2340 taaaaatctt gttacgaagg atctttttgc taatgtttct cgctcaatcc tcatttcttc 2400 cctacgaaga gtcaaatcta cttgttttct gccggtatca agatccatat cttctagttt 2460 caccatcaaa gtccaatttc tagtatacag tttatgtccc aacgtaacag acaatcaaaa 2520 ttggaaagga taagtatcct tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg 2580 ggaacagaga agtccaaaac gatgctataa gaaccagaaa taaaacgata aaaccatacc 2640 aggatccaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 2700 ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 2760 aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg 2820 taaacgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta 2880 accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt 2940 tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 3000 aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa 3060 gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 3120 ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 3180 gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 3240 ccgcgcttaa tgcgccgcta cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg 3300 gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 3360 aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 3420 gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 3480 cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3540 tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3600 tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 3660 agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3720 cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3780 tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3840 ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3900 tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3960 cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 4020 actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 4080 ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 4140 tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 4200 ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 4260 aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 4320 ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 4380 agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 4440 ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 4500 tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4560 cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4620 ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4680 gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4740 ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4800 aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg 4860 cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4920 ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4980 gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 5040 ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 5100 ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 5160 gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga ag 5202 <210> 42 <211> 5613 <212> DNA <213> Artificial sequence <220> <223> vector pYIG5E1H6 <400> 42 ggatccttca atatgcgcac atacgctgtt atgttcaagg tcccttcgtt taagaacgaa 60 agcggtcttc cttttgaggg atgtttcaag ttgttcaaat ctatcaaatt tgcaaatccc 120 cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt taattaaatt gatggtgtca 180 ccattaccag gtctagatat accaatggca aactgagcac aacaatacca gtccggatca 240 actggcacca tctctcccgt agtctcatct aatttttctt ccggatgagg ttccagatat 300 accgcaacac ctttattatg gtttccctga gggaataata gaatgtccca ttcgaaatca 360 ccaattctaa acctgggcga attgtatttc gggtttgtta actcgttcca gtcaggaatg 420 ttccacgtga agctatcttc cagcaaagtc tccacttctt catcaaattg tggagaatac 480 tcccaatgct cttatctatg ggacttccgg gaaacacagt accgatactt cccaattcgt 540 cttcagagct cattgtttgt ttgaagagac taatcaaaga atcgttttct caaaaaaatt 600 aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta ggggcaaaca aacggaaaaa 660 tcgtttctca aattttctga tgccaagaac tctaaccagt cttatctaaa aattgcctta 720 tgatccgtct ctccggttac agcctgtgta actgattaat cctgcctttc taatcaccat 780 tctaatgttt taattaaggg attttgtctt cattaacggc tttcgctcat aaaaatgtta 840 tgacgttttg cccgcaggcg ggaaaccatc cacttcacga gactgatctc ctctgccgga 900 acaccgggca tctccaactt ataagttgga gaaataagag aatttcagat tgagagaatg 960 aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt 1020 gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa 1080 acttcttaaa ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt 1140 agtttcgaat aaacacacat aaacaaacac catgagattt ccttcaattt ttactgcagt 1200 tttattcgca gcatcctccg cattagctgc tccagtcaac actacaacag aagatgaaac 1260 ggcacaaatt ccggctgaag ctgtcatcgg ttacttagat ttagaagggg atttcgatgt 1320 tgctgttttg ccattttcca acagcacaaa taacgggtta ttgtttataa atactactat 1380 tgccagcatt gctgctaaag aagaaggggt atctctagat aaaaggtatg aggtgcgcaa 1440 cgtgtccggg atgtaccatg tcacgaacga ctgctccaac tcaagcattg tgtatgaggc 1500 agcggacatg atcatgcaca cccccgggtg cgtgccctgc gttcgggaga acaactcttc 1560 ccgctgctgg gtagcgctca cccccacgct cgcagctagg aacgccagcg tccccactac 1620 gacaatacga cgccacgtcg atttgctcgt tggggcggct gctttctgtt ccgctatgta 1680 cgtgggggat ctctgcggat ctgtcttcct cgtctcccag ctgttcacca tctcgcctcg 1740 ccggcatgag acggtgcagg actgcaattg ctcaatctat cccggccaca taacaggtca 1800 ccgtatggct tgggatatga tgatgaactg gcaccaccac catcaccatt aaagatctcg 1860 acttggttga acacgttgcc aaggcttaag tgaatttact ttaaagtctt gcatttaaat 1920 aaattttctt tttatagctt tatgacttag tttcaattta tatactattt taatgacatt 1980 ttcgattcat tgattgaaag ctttgtgttt tttcttgatg cgctattgca ttgttcttgt 2040 ctttttcgcc acatgtaata tctgtagtag atacctgata cattgtggat gctgagtgaa 2100 attttagtta ataatggagg cgctcttaat aattttgggg atattggctt ttttttttaa 2160 agtttacaaa tgaatttttt ccgccaggat aacgattctg aagttactct tagcgttcct 2220 atcggtacag ccatcaaatc atgcctataa atcatgccta tatttgcgtg cagtcagtat 2280 catctacatg aaaaaaactc ccgcaatttc ttatagaata cgttgaaaat taaatgtacg 2340 cgccaagata agataacata tatctagcta gatgcagtaa tatacacaga ttcccgcgga 2400 cgtgggaagg aaaaaattag ataacaaaat ctgagtgata tggaaattcc gctgtatagc 2460 tcatatcttt cccttcaaca ccagaaatgt aaaaatcttg ttacgaagga tctttttgct 2520 aatgtttctc gctcaatcct catttcttcc ctacgaagag tcaaatctac ttgttttctg 2580 ccggtatcaa gatccatatc ttctagtttc accatcaaag tccaatttct agtatacagt 2640 ttatgtccca acgtaacaga caatcaaaat tggaaaggat aagtatcctt caaagaatga 2700 ttctgcgctg gctcctgaac cgcctaatgg gaacagagaa gtccaaaacg atgctataag 2760 aaccagaaat aaaacgataa aaccatacca ggatccaagc ttggcactgg ccgtcgtttt 2820 acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 2880 ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 2940 gcgcagcctg aatggcgaat gggaaattgt aaacgttaat attttgttaa aattcgcgtt 3000 aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 3060 taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 3120 actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 3180 cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact 3240 aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 3300 ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 3360 ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc 3420 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 3480 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 3540 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 3600 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 3660 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 3720 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 3780 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 3840 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 3900 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 3960 gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 4020 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 4080 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 4140 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 4200 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 4260 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 4320 agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 4380 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 4440 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 4500 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 4560 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 4620 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 4680 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 4740 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 4800 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 4860 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 4920 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 4980 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5040 aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5100 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 5160 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 5220 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 5280 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 5340 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 5400 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 5460 tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 5520 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 5580 cgaatttaat acgactcact atagggaatt cga 5613 <210> 43 <211> 13020 <212> DNA <213> Artificial sequence <220> <223> vector pSY1 <400> 43 atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60 ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120 acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180 tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240 aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300 atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360 aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420 atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480 agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540 tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600 gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660 aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720 aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780 ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840 gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900 tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960 atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020 gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080 ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140 ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200 taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260 tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320 tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440 gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500 cgaccacacc cgtcctgtgg atcctctacg ccggacgcat cgtggccggc atcaccggcg 1560 ccacaggtgc ggttgctggc ccctatatcg ccgacatcac cgatggggaa gatcgggctc 1620 gccacttcgg gctcatgagc gcttgtttcg gcgtgggtat ggtggcaggc cccgtggccg 1680 ggggactgtt gggcgccatc tccttgcatg caccattcct tgcggcggcg gtgctcaacg 1740 gcctcaacct actactgggc tgcttcctaa tgcaggagtc gcataaggga gagcgtcgac 1800 cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg ggcatgacta 1860 tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag gtgccggcag 1920 cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg atcggcctgt 1980 cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact ggtcccgcca 2040 ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac gcgctgggct 2100 acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg attcttctcg 2160 cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag gtagatgacg 2220 accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact tcgatcactg 2280 gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac gggttggcat 2340 ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc ggtgcatgga 2400 gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat tcaccactcc 2460 aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca acccttggca 2520 gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatct cgggcagcgt 2580 tgggtcctgg ccacgggtgc gcatgatcgt gctcctgtcg ttgaggaccc ggctaggctg 2640 gcggggttgc cttactggtt agcagaatga atcaccgata cgcgagcgaa cgtgaagcga 2700 ctgctgctgc aaaacgtctg cgacctgagc aacaacatga atggtcttcg gtttccgtgt 2760 ttcgtaaagt ctggaaacgc ggaagtcagc gccctgcacc attatgttcc ggatctgcat 2820 cgcaggatgc tgctggctac cctgtggaac acctacatct gtattaacga agcgctggca 2880 ttgaccctga gtgatttttc tctggtcccg ccgcatccat accgccagtt gtttaccctc 2940 acaacgttcc agtaaccggg catgttcatc atcagtaacc cgtatcgtga gcatcctctc 3000 tcgtttcatc ggtatcatta cccccatgaa cagaaattcc cccttacacg gaggcatcaa 3060 gtgaccaaac aggaaaaaac cgcccttaac atggcccgct ttatcagaag ccagacatta 3120 acgcttctgg agaaactcaa cgagctggac gcggatgaac aggcagacat ctgtgaatcg 3180 cttcacgacc acgctgatga gctttaccgc agctgcctcg cgcgtttcgg tgatgacggt 3240 gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggtgccg 3300 ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca 3360 tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca 3420 gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 3480 ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 3540 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 3600 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 3660 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 3720 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 3780 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 3840 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 3900 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 3960 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4020 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4080 gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 4140 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 4200 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 4260 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 4320 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 4380 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 4440 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 4500 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 4560 tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 4620 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 4680 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 4740 tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 4800 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 4860 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 4920 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 4980 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5040 ttgcccggcg tcaacacggg ataataccgc gccacatagc agaactttaa aagtgctcat 5100 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 5160 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 5220 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 5280 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 5340 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 5400 gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 5460 aacctataaa aaataggcgt atcacgaggc cctttcgtct tcaagaattc tcatgtttga 5520 cagcttatca tcgatccact tgtatatttg gatgaatttt tgaggaattc tgaaccagtc 5580 ctaaaacgag taaataggac cggcaattct tcaagcaata aacaggaata ccaattatta 5640 aaagataact tagtcagatc gtacaataaa gctttgaaga aaaatgcgcc ttattcaatc 5700 tttgcataaa aaaatggccc aaaatctcac attggaagac atttgatgac ctcatttctt 5760 tcaatgaagg gcctaacgga gttgactaat gttgtgggaa attggaccga taagcgtgct 5820 tctgccgtgg ccaggacaac gtatactcat cagataacag caatacctga tcactacttc 5880 gcactagttt ctcggtacta tgcatatgat ccaatatcaa aggaaatgat agcattgaag 5940 gatgagacta atccaattga ggagtggcag catatagaac agctaaaggg tagtgctgaa 6000 ggaagcatac gataccccgc atggaatggg ataatatcac aggaggtact agactacctt 6060 tcatcctaca taaatagacg catataagta cgcatttaag cataaacacg cactatgccg 6120 ttcttctcat gtatatatat atacaggcaa cacgcagata taggtgcgac gtgaacagtg 6180 agctgtatgt gcgcagctcg cgttgcattt tcggaagcgc tcgttttcgg aaacgctttg 6240 aagttcctat tccgaagttc ctattctcta gaaagtatag gaacttcaga gcgcttttga 6300 aaaccaaaag cgctctgaag acgcactttc aaaaaaccaa aaacgcaccg gactgtaacg 6360 agctactaaa atattgcgaa taccgcttcc acaaacattg ctcaaaagta tctctttgct 6420 atatatctct gtgctatatc cctatataac catcccatcc acctttcgct ccttgaactt 6480 gcatctaaac tcgacctcta cattttttat gtttatctct agtattacct cttagacaaa 6540 aaaattgtag taagaactat tcatagagtt aatcgaaaac aatacgaaaa tgtaaacatt 6600 tcctatacgt agtatataga gacaaaatag aagaaaccgt tcataatttt ctgaccaatg 6660 aagaatcatc aacgctatca ctttctgttc acaaagtatg cgcaatccac atcggtatag 6720 aatataatcg gggatgcctt tatcttgaaa aaatgcaccc gcagcttcgc tagtaatcag 6780 taaacgcggg aagtggagtc aggctttttt tatggaagag aaaatagaca ccaaagtagc 6840 cttcttctaa ccttaacgga cctacagtgc aaaaagttat caagagactg cattatagag 6900 cgcacaaagg agaaaaaaag taatctaaga tgctttgtta gaaaaatagc gctctcggga 6960 tgcatttttg tagaacaaaa aagaagtata gattcttgtt ggtaaaatag cgctctcgcg 7020 ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat tagcgctctc 7080 gcgttgcatt tttgttttac aaaaatgaag cacagattct tcgttggtaa aatagcgctt 7140 tcgcgttgca tttctgttct gtaaaaatgc agctcagatt ctttgtttga aaaattagcg 7200 ctctcgcgtt gcatttttgt tctacaaaat gaagcacaga tgcttcgtta acaaagatat 7260 gctattgaag tgcaagatgg aaacgcagaa aatgaaccgg ggatgcgacg tgcaagatta 7320 cctatgcaat agatgcaata gtttctccag gaaccgaaat acatacattg tcttccgtaa 7380 agcgctagac tatatattat tatacaggtt caaatatact atctgtttca gggaaaactc 7440 ccaggttcgg atgttcaaaa ttcaatgatg ggtaacaagt acgatcgtaa atctgtaaaa 7500 cagtttgtcg gatattaggc tgtatctcct caaagcgtat tcgaatatca ttgagaagct 7560 gcattttttt tttttttttt tttttttttt tttttatata tatttcaagg atataccatt 7620 gtaatgtctg cccctaagaa gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc 7680 acagccgaag ccattaaggt tcttaaagct atttctgatg ttcgttccaa tgtcaagttc 7740 gatttcgaaa atcatttaat tggtggtgct gctatcgatg ctacaggtgt cccacttcca 7800 gatgaggcgc tggaagcctc caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt 7860 cctaaatggg gtaccggtag tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa 7920 cttcaattgt acgccaactt aagaccatgt aactttgcat ccgactctct tttagactta 7980 tctccaatca agccacaatt tgctaaaggt actgacttcg ttgttgtcag agaattagtg 8040 ggaggtattt actttggtaa gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt 8100 gaacaataca ccgttccaga agtgcaaaga atcacaagaa tggccgcttt catggcccta 8160 caacatgagc caccattgcc tatttggtcc ttggataaag ctaatgtttt ggcctcttca 8220 agattatgga gaaaaactgt ggaggaaacc atcaagaacg aattccctac attgaaggtt 8280 caacatcaat tgattgattc tgccgccatg atcctagtta agaacccaac ccacctaaat 8340 ggtattataa tcaccagcaa catgtttggt gatatcatct ccgatgaagc ctccgttatc 8400 ccaggttcct tgggtttgtt gccatctgcg tccttggcct ctttgccaga caagaacacc 8460 gcatttggtt tgtacgaacc atgccacggt tctgctccag atttgccaaa gaataaggtt 8520 gaccctatcg ccactatctt gtctgctgca atgatgttga aattgtcatt gaacttgcct 8580 gaagaaggta aggccattga agatgcagtt aaaaaggttt tggatgcagg tatcagaact 8640 ggtgatttag gtggttccaa cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt 8700 aagaaaatcc ttgcttaaaa agattctctt tttttatgat atttgtacaa aaaaaaaaaa 8760 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcagc gtcacatcgg ataataatga 8820 tggcagccat tgtagaagtg ccttttgcat ttctagtctc tttctcggtc tagctagttt 8880 tactacatcg cgaagataga atcttagatc acactgcctt tgctgagctg gatcatatga 8940 gtaacaaaag agtggtaagg cctcgttaaa ggacaaggac ctgagcggaa gtgtatcgta 9000 aagtagacgg agtatactag tatagtctat agtccgtgga attctaagtg ccagctttat 9060 aatgtcattc tccttactac agacccgcct gaaagtagac acatcatcat cagtaagctt 9120 tgacaaaaag cattgagtag ctaactcttc tatgcaatct atagctgttt tataaggcat 9180 tcaatggaca gattgaggtt tttgaaacat actagtgaaa ttagccttaa tcccttctcg 9240 aagttaatca tgcattatgg tgtaaaaaat gcaactcgcg ttgctctact ttttcccgaa 9300 tttccaaata cgcagctggg gtgattgctc gatttcgtaa cgaaagtttt gtttataaaa 9360 accgcgaaaa ccttctgtaa cagatagatt tttacagcgc tgatatacaa tgacatcagc 9420 tgtaatggaa aataactgaa atatgaatgg cgagagactg cttgcttgta ttaagcaatg 9480 tattatgcag cacttccaac ctatggtgta cgatgaaagt aggtgtgtaa tcgagacgac 9540 aagggggact tttccagttc ctgatcatta taagaaatac aaaacgttag catttgcatt 9600 tgttggacat gtactgaata cagacgacac accggtaatt gaaaaagaac tggattggcc 9660 tgatcctgca ctagtgtaca atacaattgt cgatcgaatc ataaatcacc cagaattatc 9720 acagtttata tcggttgcat ttattagtca gttaaaggcc accatcggag agggtttaga 9780 tattaatgta aaaggcacgc taaaccgcag gggaaagggt atcagaaggc ctaaaggcgt 9840 attttttaga tacatggaat ctccatttgt caatacaaag gtcactgcat tcttctctta 9900 tcttcgagat tataataaaa ttgcctcaga atatcacaat aatactaaat tcattctcac 9960 gttttcatgt caagcatatt gggcatctgg cccaaacttc tccgccttga agaatgttat 10020 ttggtgctcc ataattcatg aatacatttc taagtttgtg gaaagagaac aggataaagg 10080 tcatatagga gatcaggagc taccgcctga agaggaccct tctcgtgaac taaacaatgt 10140 acaacatgaa gtcaatagtt taacggaaca agatgcggag gcggatgaag gattgtgggg 10200 tgaaatagat tcattatgtg aaaaatggca gtctgaagcg gagagtcaaa ctgaggcgga 10260 gataatagcc gacaggataa ttggaaatag ccagaggatg gcgaacctca aaattcgtcg 10320 tacaaagttc aaaagtgtct tgtatcatat actaaaggaa ctaattcaat ctcagggaac 10380 cgtaaaggtt tatcgcggta gtagtttttc acacgattcg ataaagataa gcttacatta 10440 tgaagagcag catattacag ccgtatgggt ctacttgata gtaaaatttg aagagcattg 10500 gaagcctgtt gatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 10560 gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgaggcaatg 10620 tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt 10680 tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata 10740 ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct 10800 tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct 10860 gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa 10920 atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat 10980 attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct 11040 atatgctgcc actcctcaat tggattagtc tcatccttca atgcattcat ttcctttgat 11100 attggatcat accctagaag tattacgtga ttttctgccc cttaccctcg ttgctactct 11160 cctttttttc gtgggaaccg ctttagggcc ctcagtgatg gtgttttgta atttatatgc 11220 tcctcttgca tttgtgtctc tacttcttgt tcgcctggag ggaacttctt catttgtatt 11280 agcatggttc acttcagtcc ttccttccaa ctcactcttt ttttgctgta aacgattctc 11340 tgccgccagt tcattgaaac tattgaatat atcctttaga gattccggga tgaataaatc 11400 acctattaaa gcagcttgac gatctggtgg aactaaagta agcaattggg taacgacgct 11460 tacgagcttc ataacatctt cttccgttgg agctggtggg actaataact gtgtacaatc 11520 catttttctc atgagcattt cggtagctct cttcttgtct ttctcgggca atcttcctat 11580 tattatagca atagatttgt atagttgctt tctattgtct aacagcttgt tattctgtag 11640 catcaaatct atggcagcct gacttgcttc ttgtgaagag agcataccat ttccaatcga 11700 agatacgctg gaatcttctg cgctagaatc aagaccatac ggcctaccgg ttgtgagaga 11760 ttccatgggc cttatgacat atcctggaaa gagtagctca tcagacttac gtttactctc 11820 tatatcaata tctacatcag gagcaatcat ttcaataaac agccgacata catcccagac 11880 gctataagct gtacgtgctt ttaccgtcag attcttggct gtttcaatgt cgtccatttt 11940 ggttttcttt taccagtatt gttcgtttga taatgtattc ttgcttatta cattataaaa 12000 tctgtgcaga tcacatgtca aaacaacttt ttatcacaag atagtaccgc aaaacgaacc 12060 tgcgggccgt ctaaaaatta aggaaaagca gcaaaggtgc atttttaaaa tatgaaatga 12120 agataccgca gtaccaatta ttttcgcagt acaaataatg cgcggccggt gcatttttcg 12180 aaagaacgcg agacaaacag gacaattaaa gttagttttt cgagttagcg tgtttgaata 12240 ctgcaagata caagataaat agagtagttg aaactagata tcaattgcac acaagatcgg 12300 cgctaagcat gccacaattt ggtatattat gtaaaacacc acctaaggtg cttgttcgtc 12360 agtttgtgga aaggtttgaa agaccttcag gtgagaaaat agcattatgt gctgctgaac 12420 taacctattt atgttggatg attacacata acggaacagc aatcaagaga gccacattca 12480 tgagctataa tactatcata agcaattcgc tgagtttcga tattgtcaat aaatcactcc 12540 agtttaaata caagacgcaa aaagcaacaa ttctggaagc ctcattaaag aaattgattc 12600 ctgcttggga atttacaatt attccttact atggacaaaa acatcaatct gatatcactg 12660 atattgtaag tagtttgcaa ttacagttcg aatcatcgga agaagcagat aagggaaata 12720 gccacagtaa aaaaatgcta aagcacttct aagtgagggt gaaagcatct gggagatcac 12780 tgagaaaata ctaaattcgt ttgagtatac ttcgagattt acaaaaacaa aaactttata 12840 ccaattcctc ttcctagcta ctttcatcaa ttgtggaaga ttcagcgata ttaagaacgt 12900 tgatccgaaa tcatttaaat tagtccaaaa taagtatctg ggagtaataa tccagtgttt 12960 agtgacagag acaaagacaa gcgttagtag gcacatatac ttctttagcg caaggggtag 13020 <210> 44 <211> 15810 <212> DNA <213> Artificial sequence <220> <223> vector pSY1AMFE1sH6a <400> 44 atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60 ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120 acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180 tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240 aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300 atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360 aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420 atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480 agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540 tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600 gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660 aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720 aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780 ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840 gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900 tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960 atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020 gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080 ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140 ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200 taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260 tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320 tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440 gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500 cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc 1560 ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct 1620 atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta 1680 attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa 1740 caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc 1800 ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga 1860 atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac 1920 tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca 1980 tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac 2040 cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat 2100 cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg 2160 ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct 2220 tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc 2280 tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt 2340 tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga 2400 ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa 2460 tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct 2520 gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc 2580 tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt 2640 ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc 2700 ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac 2760 tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt 2820 agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt 2880 gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa 2940 aaggtatgag gtgcgcaacg tgtccgggat gtaccatgtc acgaacgact gctccaactc 3000 aagcattgtg tatgaggcag cggacatgat catgcacacc cccgggtgcg tgccctgcgt 3060 tcgggagaac aactcttccc gctgctgggt agcgctcacc cccacgctcg cagctaggaa 3120 cgccagcgtc cccactacga caatacgacg ccacgtcgat ttgctcgttg gggcggctgc 3180 tttctgttcc gctatgtacg tgggggatct ctgcggatct gtcttcctcg tctcccagct 3240 gttcaccatc tcgcctcgcc ggcatgagac ggtgcaggac tgcaattgct caatctatcc 3300 cggccacata acgggtcacc gtatggcttg ggatatgatg atgaactggc accaccacca 3360 tcaccattaa agatctcgac ttggttgaac acgttgccaa ggcttaagtg aatttacttt 3420 aaagtcttgc atttaaataa attttctttt tatagcttta tgacttagtt tcaatttata 3480 tactatttta atgacatttt cgattcattg attgaaagct ttgtgttttt tcttgatgcg 3540 ctattgcatt gttcttgtct ttttcgccac atgtaatatc tgtagtagat acctgataca 3600 ttgtggatgc tgagtgaaat tttagttaat aatggaggcg ctcttaataa ttttggggat 3660 attggctttt ttttttaaag tttacaaatg aattttttcc gccaggataa cgattctgaa 3720 gttactctta gcgttcctat cggtacagcc atcaaatcat gcctataaat catgcctata 3780 tttgcgtgca gtcagtatca tctacatgaa aaaaactccc gcaatttctt atagaatacg 3840 ttgaaaatta aatgtacgcg ccaagataag ataacatata tctagctaga tgcagtaata 3900 tacacagatt cccgcggacg tgggaaggaa aaaattagat aacaaaatct gagtgatatg 3960 gaaattccgc tgtatagctc atatctttcc cttcaacacc agaaatgtaa aaatcttgtt 4020 acgaaggatc tttttgctaa tgtttctcgc tcaatcctca tttcttccct acgaagagtc 4080 aaatctactt gttttctgcc ggtatcaaga tccatatctt ctagtttcac catcaaagtc 4140 caatttctag tatacagttt atgtcccaac gtaacagaca atcaaaattg gaaaggataa 4200 gtatccttca aagaatgatt ctgcgctggc tcctgaaccg cctaatggga acagagaagt 4260 ccaaaacgat gctataagaa ccagaaataa aacgataaaa ccataccagg atcctctacg 4320 ccggacgcat cgtggccggc atcaccggcg ccacaggtgc ggttgctggc ccctatatcg 4380 ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc gcttgtttcg 4440 gcgtgggtat ggtggcaggc cccgtggccg ggggactgtt gggcgccatc tccttgcatg 4500 caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc tgcttcctaa 4560 tgcaggagtc gcataaggga gagcgtcgac cgatgccctt gagagccttc aacccagtca 4620 gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta 4680 tcatgcaact cgtaggacag gtgccggcag cgctctgggt cattttcggc gaggaccgct 4740 ttcgctggag cgcgacgatg atcggcctgt cgcttgcggt attcggaatc ttgcacgccc 4800 tcgctcaagc cttcgtcact ggtcccgcca ccaaacgttt cggcgagaag caggccatta 4860 tcgccggcat ggcggccgac gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct 4920 ggatggcctt ccccattatg attcttctcg cttccggcgg catcgggatg cccgcgttgc 4980 aggccatgct gtccaggcag gtagatgacg accatcaggg acagcttcaa ggatcgctcg 5040 cggctcttac cagcctaact tcgatcactg gaccgctgat cgtcacggcg atttatgccg 5100 cctcggcgag cacatggaac gggttggcat ggattgtagg cgccgcccta taccttgtct 5160 gcctccccgc gttgcgtcgc ggtgcatgga gccgggccac ctcgacctga atggaagccg 5220 gcggcacctc gctaacggat tcaccactcc aagaattgga gccaatcaat tcttgcggag 5280 aactgtgaat gcgcaaacca acccttggca gaacatatcc atcgcgtccg ccatctccag 5340 cagccgcacg cggcgcatct cgggcagcgt tgggtcctgg ccacgggtgc gcatgatcgt 5400 gctcctgtcg ttgaggaccc ggctaggctg gcggggttgc cttactggtt agcagaatga 5460 atcaccgata cgcgagcgaa cgtgaagcga ctgctgctgc aaaacgtctg cgacctgagc 5520 aacaacatga atggtcttcg gtttccgtgt ttcgtaaagt ctggaaacgc ggaagtcagc 5580 gccctgcacc attatgttcc ggatctgcat cgcaggatgc tgctggctac cctgtggaac 5640 acctacatct gtattaacga agcgctggca ttgaccctga gtgatttttc tctggtcccg 5700 ccgcatccat accgccagtt gtttaccctc acaacgttcc agtaaccggg catgttcatc 5760 atcagtaacc cgtatcgtga gcatcctctc tcgtttcatc ggtatcatta cccccatgaa 5820 cagaaattcc cccttacacg gaggcatcaa gtgaccaaac aggaaaaaac cgcccttaac 5880 atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac 5940 gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc 6000 agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 6060 acggtcacag cttgtctgta agcggtgccg ggagcagaca agcccgtcag ggcgcgtcag 6120 cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt 6180 atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg 6240 tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 6300 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6360 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6420 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6480 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6540 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6600 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6660 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6720 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6780 gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6840 cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6900 cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 6960 agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7020 caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7080 ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7140 aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7200 tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 7260 agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 7320 gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 7380 accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 7440 tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 7500 tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc 7560 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 7620 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 7680 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 7740 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 7800 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 7860 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 7920 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 7980 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8040 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8100 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8160 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 8220 cgtctaagaa accattatta tcatgacatt aacctataaa aaataggcgt atcacgaggc 8280 cctttcgtct tcaagaattc tcatgtttga cagcttatca tcgatccact tgtatatttg 8340 gatgaatttt tgaggaattc tgaaccagtc ctaaaacgag taaataggac cggcaattct 8400 tcaagcaata aacaggaata ccaattatta aaagataact tagtcagatc gtacaataaa 8460 gctttgaaga aaaatgcgcc ttattcaatc tttgcataaa aaaatggccc aaaatctcac 8520 attggaagac atttgatgac ctcatttctt tcaatgaagg gcctaacgga gttgactaat 8580 gttgtgggaa attggaccga taagcgtgct tctgccgtgg ccaggacaac gtatactcat 8640 cagataacag caatacctga tcactacttc gcactagttt ctcggtacta tgcatatgat 8700 ccaatatcaa aggaaatgat agcattgaag gatgagacta atccaattga ggagtggcag 8760 catatagaac agctaaaggg tagtgctgaa ggaagcatac gataccccgc atggaatggg 8820 ataatatcac aggaggtact agactacctt tcatcctaca taaatagacg catataagta 8880 cgcatttaag cataaacacg cactatgccg ttcttctcat gtatatatat atacaggcaa 8940 cacgcagata taggtgcgac gtgaacagtg agctgtatgt gcgcagctcg cgttgcattt 9000 tcggaagcgc tcgttttcgg aaacgctttg aagttcctat tccgaagttc ctattctcta 9060 gaaagtatag gaacttcaga gcgcttttga aaaccaaaag cgctctgaag acgcactttc 9120 aaaaaaccaa aaacgcaccg gactgtaacg agctactaaa atattgcgaa taccgcttcc 9180 acaaacattg ctcaaaagta tctctttgct atatatctct gtgctatatc cctatataac 9240 catcccatcc acctttcgct ccttgaactt gcatctaaac tcgacctcta cattttttat 9300 gtttatctct agtattacct cttagacaaa aaaattgtag taagaactat tcatagagtt 9360 aatcgaaaac aatacgaaaa tgtaaacatt tcctatacgt agtatataga gacaaaatag 9420 aagaaaccgt tcataatttt ctgaccaatg aagaatcatc aacgctatca ctttctgttc 9480 acaaagtatg cgcaatccac atcggtatag aatataatcg gggatgcctt tatcttgaaa 9540 aaatgcaccc gcagcttcgc tagtaatcag taaacgcggg aagtggagtc aggctttttt 9600 tatggaagag aaaatagaca ccaaagtagc cttcttctaa ccttaacgga cctacagtgc 9660 aaaaagttat caagagactg cattatagag cgcacaaagg agaaaaaaag taatctaaga 9720 tgctttgtta gaaaaatagc gctctcggga tgcatttttg tagaacaaaa aagaagtata 9780 gattcttgtt ggtaaaatag cgctctcgcg ttgcatttct gttctgtaaa aatgcagctc 9840 agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttttac aaaaatgaag 9900 cacagattct tcgttggtaa aatagcgctt tcgcgttgca tttctgttct gtaaaaatgc 9960 agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt tctacaaaat 10020 gaagcacaga tgcttcgtta acaaagatat gctattgaag tgcaagatgg aaacgcagaa 10080 aatgaaccgg ggatgcgacg tgcaagatta cctatgcaat agatgcaata gtttctccag 10140 gaaccgaaat acatacattg tcttccgtaa agcgctagac tatatattat tatacaggtt 10200 caaatatact atctgtttca gggaaaactc ccaggttcgg atgttcaaaa ttcaatgatg 10260 ggtaacaagt acgatcgtaa atctgtaaaa cagtttgtcg gatattaggc tgtatctcct 10320 caaagcgtat tcgaatatca ttgagaagct gcattttttt tttttttttt tttttttttt 10380 tttttatata tatttcaagg atataccatt gtaatgtctg cccctaagaa gatcgtcgtt 10440 ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt tcttaaagct 10500 atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat tggtggtgct 10560 gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc caagaaggtt 10620 gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag tgttagacct 10680 gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt aagaccatgt 10740 aactttgcat ccgactctct tttagactta tctccaatca agccacaatt tgctaaaggt 10800 actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa gagaaaggaa 10860 gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga agtgcaaaga 10920 atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc tatttggtcc 10980 ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt ggaggaaacc 11040 atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc tgccgccatg 11100 atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa catgtttggt 11160 gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt gccatctgcg 11220 tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc atgccacggt 11280 tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt gtctgctgca 11340 atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga agatgcagtt 11400 aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa cagtaccacc 11460 gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa agattctctt 11520 tttttatgat atttgtacaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11580 aaaatgcagc gtcacatcgg ataataatga tggcagccat tgtagaagtg ccttttgcat 11640 ttctagtctc tttctcggtc tagctagttt tactacatcg cgaagataga atcttagatc 11700 acactgcctt tgctgagctg gatcatatga gtaacaaaag agtggtaagg cctcgttaaa 11760 ggacaaggac ctgagcggaa gtgtatcgta aagtagacgg agtatactag tatagtctat 11820 agtccgtgga attctaagtg ccagctttat aatgtcattc tccttactac agacccgcct 11880 gaaagtagac acatcatcat cagtaagctt tgacaaaaag cattgagtag ctaactcttc 11940 tatgcaatct atagctgttt tataaggcat tcaatggaca gattgaggtt tttgaaacat 12000 actagtgaaa ttagccttaa tcccttctcg aagttaatca tgcattatgg tgtaaaaaat 12060 gcaactcgcg ttgctctact ttttcccgaa tttccaaata cgcagctggg gtgattgctc 12120 gatttcgtaa cgaaagtttt gtttataaaa accgcgaaaa ccttctgtaa cagatagatt 12180 tttacagcgc tgatatacaa tgacatcagc tgtaatggaa aataactgaa atatgaatgg 12240 cgagagactg cttgcttgta ttaagcaatg tattatgcag cacttccaac ctatggtgta 12300 cgatgaaagt aggtgtgtaa tcgagacgac aagggggact tttccagttc ctgatcatta 12360 taagaaatac aaaacgttag catttgcatt tgttggacat gtactgaata cagacgacac 12420 accggtaatt gaaaaagaac tggattggcc tgatcctgca ctagtgtaca atacaattgt 12480 cgatcgaatc ataaatcacc cagaattatc acagtttata tcggttgcat ttattagtca 12540 gttaaaggcc accatcggag agggtttaga tattaatgta aaaggcacgc taaaccgcag 12600 gggaaagggt atcagaaggc ctaaaggcgt attttttaga tacatggaat ctccatttgt 12660 caatacaaag gtcactgcat tcttctctta tcttcgagat tataataaaa ttgcctcaga 12720 atatcacaat aatactaaat tcattctcac gttttcatgt caagcatatt gggcatctgg 12780 cccaaacttc tccgccttga agaatgttat ttggtgctcc ataattcatg aatacatttc 12840 taagtttgtg gaaagagaac aggataaagg tcatatagga gatcaggagc taccgcctga 12900 agaggaccct tctcgtgaac taaacaatgt acaacatgaa gtcaatagtt taacggaaca 12960 agatgcggag gcggatgaag gattgtgggg tgaaatagat tcattatgtg aaaaatggca 13020 gtctgaagcg gagagtcaaa ctgaggcgga gataatagcc gacaggataa ttggaaatag 13080 ccagaggatg gcgaacctca aaattcgtcg tacaaagttc aaaagtgtct tgtatcatat 13140 actaaaggaa ctaattcaat ctcagggaac cgtaaaggtt tatcgcggta gtagtttttc 13200 acacgattcg ataaagataa gcttacatta tgaagagcag catattacag ccgtatgggt 13260 ctacttgata gtaaaatttg aagagcattg gaagcctgtt gatgtagagg tcgagtttag 13320 atgcaagttc aaggagcgaa aggtggatgg gtaggttata tagggatata gcacagagat 13380 atatagcaaa gagatacttt tgaggcaatg tttgtggaag cggtattcgc aatattttag 13440 tagctcgtta cagtccggtg cgtttttggt tttttgaaag tgcgtcttca gagcgctttt 13500 ggttttcaaa agcgctctga agttcctata ctttctagag aataggaact tcggaatagg 13560 aacttcaaag cgtttccgaa aacgagcgct tccgaaaatg caacgcgagc tgcgcacata 13620 cagctcactg ttcacgtcgc acctatatct gcgtgttgcc tgtatatata tatacatgag 13680 aagaacggca tagtgcgtgt ttatgcttaa atgcgtactt atatgcgtct atttatgtag 13740 gatgaaaggt agtctagtac ctcctgtgat attatcccat tccatgcggg gtatcgtatg 13800 cttccttcag cactaccctt tagctgttct atatgctgcc actcctcaat tggattagtc 13860 tcatccttca atgcattcat ttcctttgat attggatcat accctagaag tattacgtga 13920 ttttctgccc cttaccctcg ttgctactct cctttttttc gtgggaaccg ctttagggcc 13980 ctcagtgatg gtgttttgta atttatatgc tcctcttgca tttgtgtctc tacttcttgt 14040 tcgcctggag ggaacttctt catttgtatt agcatggttc acttcagtcc ttccttccaa 14100 ctcactcttt ttttgctgta aacgattctc tgccgccagt tcattgaaac tattgaatat 14160 atcctttaga gattccggga tgaataaatc acctattaaa gcagcttgac gatctggtgg 14220 aactaaagta agcaattggg taacgacgct tacgagcttc ataacatctt cttccgttgg 14280 agctggtggg actaataact gtgtacaatc catttttctc atgagcattt cggtagctct 14340 cttcttgtct ttctcgggca atcttcctat tattatagca atagatttgt atagttgctt 14400 tctattgtct aacagcttgt tattctgtag catcaaatct atggcagcct gacttgcttc 14460 ttgtgaagag agcataccat ttccaatcga agatacgctg gaatcttctg cgctagaatc 14520 aagaccatac ggcctaccgg ttgtgagaga ttccatgggc cttatgacat atcctggaaa 14580 gagtagctca tcagacttac gtttactctc tatatcaata tctacatcag gagcaatcat 14640 ttcaataaac agccgacata catcccagac gctataagct gtacgtgctt ttaccgtcag 14700 attcttggct gtttcaatgt cgtccatttt ggttttcttt taccagtatt gttcgtttga 14760 taatgtattc ttgcttatta cattataaaa tctgtgcaga tcacatgtca aaacaacttt 14820 ttatcacaag atagtaccgc aaaacgaacc tgcgggccgt ctaaaaatta aggaaaagca 14880 gcaaaggtgc atttttaaaa tatgaaatga agataccgca gtaccaatta ttttcgcagt 14940 acaaataatg cgcggccggt gcatttttcg aaagaacgcg agacaaacag gacaattaaa 15000 gttagttttt cgagttagcg tgtttgaata ctgcaagata caagataaat agagtagttg 15060 aaactagata tcaattgcac acaagatcgg cgctaagcat gccacaattt ggtatattat 15120 gtaaaacacc acctaaggtg cttgttcgtc agtttgtgga aaggtttgaa agaccttcag 15180 gtgagaaaat agcattatgt gctgctgaac taacctattt atgttggatg attacacata 15240 acggaacagc aatcaagaga gccacattca tgagctataa tactatcata agcaattcgc 15300 tgagtttcga tattgtcaat aaatcactcc agtttaaata caagacgcaa aaagcaacaa 15360 ttctggaagc ctcattaaag aaattgattc ctgcttggga atttacaatt attccttact 15420 atggacaaaa acatcaatct gatatcactg atattgtaag tagtttgcaa ttacagttcg 15480 aatcatcgga agaagcagat aagggaaata gccacagtaa aaaaatgcta aagcacttct 15540 aagtgagggt gaaagcatct gggagatcac tgagaaaata ctaaattcgt ttgagtatac 15600 ttcgagattt acaaaaacaa aaactttata ccaattcctc ttcctagcta ctttcatcaa 15660 ttgtggaaga ttcagcgata ttaagaacgt tgatccgaaa tcatttaaat tagtccaaaa 15720 taagtatctg ggagtaataa tccagtgttt agtgacagag acaaagacaa gcgttagtag 15780 gcacatatac ttctttagcg caaggggtag 15810 <210> 45 <211> 3928 <212> DNA <213> Artificial sequence <220> <223> vector pBKS-E2sH6 <400> 45 cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 60 ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 120 cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 180 ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 240 accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 300 gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 360 gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 420 caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct 480 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600 ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg 660 gccccccctc gaggtcgacg gtatcgataa gcttgcatgc ctgcagttaa ttaactatta 720 gtgatggtgg tgatggtgtc tgccctcgat cacctgccac tctgttgtag acagcagcag 780 cgggctaagc tctgatctat ccctgtcctc caagtcacaa cgctctcctc gagtccaatt 840 gcatgcggct tcgaacctgt gctccacgcc ccccacgtac atcctaacct tgaagatggt 900 gaagttgaca gtgcaggggt agtgccagag cctatatggg taatgaacca tacacctagg 960 tgtcagccag ggcccagaac cgcatctggc gtaggtggcc tcggggtgct tccgaaaaca 1020 gtcagtgggg caggtcaagg tgttgttgcc ggcccccccg atgttgcacg gggggccccc 1080 acacgtcttg gtgaacccag tgccattcat ccatgtacag ccgaaccagt tgcctcgcgg 1140 cggccgcgtg ttgttgagaa tcagcacatc cgagtcgttc gccccccagt tatacgtggg 1200 gacaccaaac cgatcggtcg tccccaccac aacagggctc ggggtgaagc aatacactgg 1260 accgcacacc tgagacgcgg gtacaatacc acacggtcga ggcgcgtagt gccagcagta 1320 gggcctctgg tccgagctgt taggctcagt gtaagtgagg ggaccccacc cctgagcgaa 1380 cttgtcgatg gagcgacagc tggccaagcg ctctgggcat ccagacgagt tgaatttgtg 1440 tttgtagaat agtgcggcaa agaaccctgt ttggagggag tcgttgcagt tcagggcagt 1500 cctgttgatg tgccaactgc cgttggtgtt tacgagctgg attttctgag ccgacccggg 1560 gctaaagagg gacacaaggc ccctggtatc ggaggctgct gcccctcctg acacgcgggt 1620 atggtaccgg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 1680 agcccggggg atccactagt tctagagcgg ccgccaccgc ggtggagctc cagcttttgt 1740 tccctttagt gagggttaat ttcgagcttg gcgtaatcat ggtcatagct gtttcctgtg 1800 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 1860 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 1920 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 1980 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 2040 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2100 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2160 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2220 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2280 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2340 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 2400 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 2460 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 2520 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2580 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2640 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2700 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2760 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2820 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 2880 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 2940 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 3000 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 3060 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 3120 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 3180 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 3240 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 3300 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 3360 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 3420 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 3480 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 3540 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 3600 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 3660 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 3720 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 3780 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 3840 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3900 gttccgcgca catttccccg aaaagtgc 3928 <210> 46 <211> 6104 <212> DNA <213> Artificial sequence <220> <223> vector pYIG5HCCL-22aH6 <400> 46 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240 cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa 300 ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa 360 atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt 420 gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc 480 acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc 540 ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa 600 tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt 660 taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc 720 ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca 780 gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa 840 gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg 900 taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca 960 gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta 1020 atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg 1080 gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac 1140 gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag 1200 agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt 1260 ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 1320 attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 1380 agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat 1440 ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca 1500 acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag 1560 atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt 1620 tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag 1680 ataaaaggca tacccgcgtg tcaggagggg cagcagcctc cgataccagg ggccttgtgt 1740 ccctctttag ccccgggtcg gctcagaaaa tccagctcgt aaacaccaac ggcagttggc 1800 acatcaacag gactgccctg aactgcaacg actccctcca aacagggttc tttgccgcac 1860 tattctacaa acacaaattc aactcgtctg gatgcccaga gcgcttggcc agctgtcgct 1920 ccatcgacaa gttcgctcag gggtggggtc ccctcactta cactgagcct aacagctcgg 1980 accagaggcc ctactgctgg cactacgcgc ctcgaccgtg tggtattgta cccgcgtctc 2040 aggtgtgcgg tccagtgtat tgcttcaccc cgagccctgt tgtggtgggg acgaccgatc 2100 ggtttggtgt ccccacgtat aactgggggg cgaacgactc ggatgtgctg attctcaaca 2160 acacgcggcc gccgcgaggc aactggttcg gctgtacatg gatgaatggc actgggttca 2220 ccaagacgtg tgggggcccc ccgtgcaaca tcgggggggc cggcaacaac accttgacct 2280 gccccactga ctgttttcgg aagcaccccg aggccactta cgccagatgc ggttctgggc 2340 cctggctgac acctaggtgt atggttcatt acccatatag gctctggcac tacccctgca 2400 ctgtcaactt caccatcttc aaggttagga tgtacgtggg gggcgtggag cacaggttcg 2460 aagccgcatg caattggact cgaggagagc gttgtgactt ggaggacagg gatagatcag 2520 agcttagctc gctgctgctg tctacaacag agtggcaggt gatcgagggc agacaccatc 2580 accaccatca ctaatagtta attaacgatc tcgacttggt tgaacacgtt gccaaggctt 2640 aagtgaattt actttaaagt cttgcattta aataaatttt ctttttatag ctttatgact 2700 tagtttcaat ttatatacta ttttaatgac attttcgatt cattgattga aagctttgtg 2760 ttttttcttg atgcgctatt gcattgttct tgtctttttc gccacatgta atatctgtag 2820 tagatacctg atacattgtg gatgctgagt gaaattttag ttaataatgg aggcgctctt 2880 aataattttg gggatattgg cttttttttt taaagtttac aaatgaattt tttccgccag 2940 gataacgatt ctgaagttac tcttagcgtt cctatcggta cagccatcaa atcatgccta 3000 taaatcatgc ctatatttgc gtgcagtcag tatcatctac atgaaaaaaa ctcccgcaat 3060 ttcttataga atacgttgaa aattaaatgt acgcgccaag ataagataac atatatctag 3120 ctagatgcag taatatacac agattcccgc ggacgtggga aggaaaaaat tagataacaa 3180 aatctgagtg atatggaaat tccgctgtat agctcatatc tttcccttca acaccagaaa 3240 tgtaaaaatc ttgttacgaa ggatcttttt gctaatgttt ctcgctcaat cctcatttct 3300 tccctacgaa gagtcaaatc tacttgtttt ctgccggtat caagatccat atcttctagt 3360 ttcaccatca aagtccaatt tctagtatac agtttatgtc ccaacgtaac agacaatcaa 3420 aattggaaag gataagtatc cttcaaagaa tgattctgcg ctggctcctg aaccgcctaa 3480 tgggaacaga gaagtccaaa acgatgctat aagaaccaga aataaaacga taaaaccata 3540 ccaggatcca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 3600 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 3660 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatgggaaat 3720 tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt 3780 taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 3840 gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt 3900 caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc 3960 aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg 4020 atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa 4080 aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc 4140 cgccgcgctt aatgcgccgc tacagggcgc gtcaggtggc acttttcggg gaaatgtgcg 4200 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4260 ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4320 ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4380 aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4440 actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4500 gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4560 agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4620 cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4680 catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 4740 aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 4800 gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 4860 aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 4920 agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 4980 ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5040 actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5100 aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5160 gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5220 atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5280 tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5340 tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5400 ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5460 agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 5520 ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5580 tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5640 gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 5700 cgaactgaga tacctacagc gtgagcattg agaaagcgcc acgcttcccg aagggagaaa 5760 ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 5820 agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 5880 tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 5940 ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 6000 ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 6060 ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaag 6104 <210> 47 <211> 16301 <212> DNA <213> Artificial sequence <220> <223> vector pYYIGSE2H6 <400> 47 atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60 ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120 acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180 tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240 aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300 atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360 aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420 atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480 agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540 tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600 gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660 aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720 aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780 ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840 gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900 tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960 atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020 gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080 ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140 ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200 taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260 tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320 tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440 gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500 cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc 1560 ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct 1620 atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta 1680 attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa 1740 caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc 1800 ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga 1860 atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac 1920 tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca 1980 tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac 2040 cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat 2100 cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg 2160 ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct 2220 tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc 2280 tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt 2340 tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga 2400 ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa 2460 tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct 2520 gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc 2580 tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt 2640 ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc 2700 ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac 2760 tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt 2820 agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt 2880 gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa 2940 aaggcatacc cgcgtgtcag gaggggcagc agcctccgat accaggggcc ttgtgtccct 3000 ctttagcccc gggtcggctc agaaaatcca gctcgtaaac accaacggca gttggcacat 3060 caacaggact gccctgaact gcaacgactc cctccaaaca gggttctttg ccgcactatt 3120 ctacaaacac aaattcaact cgtctggatg cccagagcgc ttggccagct gtcgctccat 3180 cgacaagttc gctcaggggt ggggtcccct cacttacact gagcctaaca gctcggacca 3240 gaggccctac tgctggcact acgcgcctcg accgtgtggt attgtacccg cgtctcaggt 3300 gtgcggtcca gtgtattgct tcaccccgag ccctgttgtg gtggggacga ccgatcggtt 3360 tggtgtcccc acgtataact ggggggcgaa cgactcggat gtgctgattc tcaacaacac 3420 gcggccgccg cgaggcaact ggttcggctg tacatggatg aatggcactg ggttcaccaa 3480 gacgtgtggg ggccccccgt gcaacatcgg gggggccggc aacaacacct tgacctgccc 3540 cactgactgt tttcggaagc accccgaggc cacttacgcc agatgcggtt ctgggccctg 3600 gctgacacct aggtgtatgg ttcattaccc atataggctc tggcactacc cctgcactgt 3660 caacttcacc atcttcaagg ttaggatgta cgtggggggc gtggagcaca ggttcgaagc 3720 cgcatgcaat tggactcgag gagagcgttg tgacttggag gacagggata gatcagagct 3780 tagctcgctg ctgctgtcta caacagagtg gcaggtgatc gagggcagac accatcacca 3840 ccatcactaa tagttaatta acgatctcga cttggttgaa cacgttgcca aggcttaagt 3900 gaatttactt taaagtcttg catttaaata aattttcttt ttatagcttt atgacttagt 3960 ttcaatttat atactatttt aatgacattt tcgattcatt gattgaaagc tttgtgtttt 4020 ttcttgatgc gctattgcat tgttcttgtc tttttcgcca catgtaatat ctgtagtaga 4080 tacctgatac attgtggatg ctgagtgaaa ttttagttaa taatggaggc gctcttaata 4140 attttgggga tattggcttt tttttttaaa gtttacaaat gaattttttc cgccaggata 4200 acgattctga agttactctt agcgttccta tcggtacagc catcaaatca tgcctataaa 4260 tcatgcctat atttgcgtgc agtcagtatc atctacatga aaaaaactcc cgcaatttct 4320 tatagaatac gttgaaaatt aaatgtacgc gccaagataa gataacatat atctagctag 4380 atgcagtaat atacacagat tcccgcggac gtgggaagga aaaaattaga taacaaaatc 4440 tgagtgatat ggaaattccg ctgtatagct catatctttc ccttcaacac cagaaatgta 4500 aaaatcttgt tacgaaggat ctttttgcta atgtttctcg ctcaatcctc atttcttccc 4560 tacgaagagt caaatctact tgttttctgc cggtatcaag atccatatct tctagtttca 4620 ccatcaaagt ccaatttcta gtatacagtt tatgtcccaa cgtaacagac aatcaaaatt 4680 ggaaaggata agtatccttc aaagaatgat tctgcgctgg ctcctgaacc gcctaatggg 4740 aacagagaag tccaaaacga tgctataaga accagaaata aaacgataaa accataccag 4800 gatcctctac gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg 4860 cccctatatc gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag 4920 cgcttgtttc ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat 4980 ctccttgcat gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg 5040 ctgcttccta atgcaggagt cgcataaggg agagcgtcga ccgatgccct tgagagcctt 5100 caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac 5160 tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg 5220 cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat 5280 cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa 5340 gcaggccatt atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc 5400 gacgcgaggc tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat 5460 gcccgcgttg caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca 5520 aggatcgctc gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc 5580 gatttatgcc gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct 5640 ataccttgtc tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg 5700 aatggaagcc ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa 5760 ttcttgcgga gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc 5820 gccatctcca gcagccgcac gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg 5880 cgcatgatcg tgctcctgtc gttgaggacc cggctaggct ggcggggttg ccttactggt 5940 tagcagaatg aatcaccgat acgcgagcga acgtgaagcg actgctgctg caaaacgtct 6000 gcgacctgag caacaacatg aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg 6060 cggaagtcag cgccctgcac cattatgttc cggatctgca tcgcaggatg ctgctggcta 6120 ccctgtggaa cacctacatc tgtattaacg aagcgctggc attgaccctg agtgattttt 6180 ctctggtccc gccgcatcca taccgccagt tgtttaccct cacaacgttc cagtaaccgg 6240 gcatgttcat catcagtaac ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt 6300 acccccatga acagaaattc ccccttacac ggaggcatca agtgaccaaa caggaaaaaa 6360 ccgcccttaa catggcccgc tttatcagaa gccagacatt aacgcttctg gagaaactca 6420 acgagctgga cgcggatgaa caggcagaca tctgtgaatc gcttcacgac cacgctgatg 6480 agctttaccg cagctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 6540 agctcccgga gacggtcaca gcttgtctgt aagcggtgcc gggagcagac aagcccgtca 6600 gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga 6660 tagcggagtg tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac 6720 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct 6780 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 6840 gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 6900 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 6960 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 7020 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 7080 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 7140 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 7200 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 7260 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 7320 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 7380 aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 7440 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 7500 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 7560 atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 7620 atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 7680 tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 7740 gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 7800 tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 7860 gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 7920 cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 7980 gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc 8040 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 8100 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 8160 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 8220 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 8280 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaacacgg 8340 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 8400 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 8460 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 8520 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 8580 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 8640 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 8700 gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaaataggcg 8760 tatcacgagg ccctttcgtc ttcaagaatt ctcatgtttg acagcttatc atcgatccac 8820 ttgtatattt ggatgaattt ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga 8880 ccggcaattc ttcaagcaat aaacaggaat accaattatt aaaagataac ttagtcagat 8940 cgtacaataa agctttgaag aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc 9000 caaaatctca cattggaaga catttgatga cctcatttct ttcaatgaag ggcctaacgg 9060 agttgactaa tgttgtggga aattggaccg ataagcgtgc ttctgccgtg gccaggacaa 9120 cgtatactca tcagataaca gcaatacctg atcactactt cgcactagtt tctcggtact 9180 atgcatatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 9240 aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 9300 catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 9360 gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 9420 tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 9480 gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 9540 cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 9600 gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 9660 ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 9720 ccctatataa ccatcccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 9780 acatttttta tgtttatctc tagtattacc tcttagacaa aaaaattgta gtaagaacta 9840 ttcatagagt taatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 9900 agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 9960 actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 10020 ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 10080 caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 10140 acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 10200 gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 10260 aaagaagtat agattcttgt tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa 10320 aaatgcagct cagattcttt gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta 10380 caaaaatgaa gcacagattc ttcgttggta aaatagcgct ttcgcgttgc atttctgttc 10440 tgtaaaaatg cagctcagat tctttgtttg aaaaattagc gctctcgcgt tgcatttttg 10500 ttctacaaaa tgaagcacag atgcttcgtt aacaaagata tgctattgaa gtgcaagatg 10560 gaaacgcaga aaatgaaccg gggatgcgac gtgcaagatt acctatgcaa tagatgcaat 10620 agtttctcca ggaaccgaaa tacatacatt gtcttccgta aagcgctaga ctatatatta 10680 ttatacaggt tcaaatatac tatctgtttc agggaaaact cccaggttcg gatgttcaaa 10740 attcaatgat gggtaacaag tacgatcgta aatctgtaaa acagtttgtc ggatattagg 10800 ctgtatctcc tcaaagcgta ttcgaatatc attgagaagc tgcatttttt tttttttttt 10860 tttttttttt ttttttatat atatttcaag gatataccat tgtaatgtct gcccctaaga 10920 agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa gccattaagg 10980 ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa 11040 ttggtggtgc tgctatcgat gctacaggtg tcccacttcc agatgaggcg ctggaagcct 11100 ccaagaaggt tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta 11160 gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg tacgccaact 11220 taagaccatg taactttgca tccgactctc ttttagactt atctccaatc aagccacaat 11280 ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt tactttggta 11340 agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac accgttccag 11400 aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag ccaccattgc 11460 ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg agaaaaactg 11520 tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa ttgattgatt 11580 ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata atcaccagca 11640 acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc ttgggtttgt 11700 tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt ttgtacgaac 11760 catgccacgg ttctgctcca gatttgccaa agaataaggt tgaccctatc gccactatct 11820 tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt aaggccattg 11880 aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta ggtggttcca 11940 acagtaccac cgaagtcggt gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa 12000 aagattctct ttttttatga tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12060 aaaaaaaaaa aaaaatgcag cgtcacatcg gataataatg atggcagcca ttgtagaagt 12120 gccttttgca tttctagtct ctttctcggt ctagctagtt ttactacatc gcgaagatag 12180 aatcttagat cacactgcct ttgctgagct ggatcatatg agtaacaaaa gagtggtaag 12240 gcctcgttaa aggacaagga cctgagcgga agtgtatcgt aaagtagacg gagtatacta 12300 gtatagtcta tagtccgtgg aattctaagt gccagcttta taatgtcatt ctccttacta 12360 cagacccgcc tgaaagtaga cacatcatca tcagtaagct ttgacaaaaa gcattgagta 12420 gctaactctt ctatgcaatc tatagctgtt ttataaggca ttcaatggac agattgaggt 12480 ttttgaaaca tactagtgaa attagcctta atcccttctc gaagttaatc atgcattatg 12540 gtgtaaaaaa tgcaactcgc gttgctctac tttttcccga atttccaaat acgcagctgg 12600 ggtgattgct cgatttcgta acgaaagttt tgtttataaa aaccgcgaaa accttctgta 12660 acagatagat ttttacagcg ctgatataca atgacatcag ctgtaatgga aaataactga 12720 aatatgaatg gcgagagact gcttgcttgt attaagcaat gtattatgca gcacttccaa 12780 cctatggtgt acgatgaaag taggtgtgta atcgagacga caagggggac ttttccagtt 12840 cctgatcatt ataagaaata caaaacgtta gcatttgcat ttgttggaca tgtactgaat 12900 acagacgaca caccggtaat tgaaaaagaa ctggattggc ctgatcctgc actagtgtac 12960 aatacaattg tcgatcgaat cataaatcac ccagaattat cacagtttat atcggttgca 13020 tttattagtc agttaaaggc caccatcgga gagggtttag atattaatgt aaaaggcacg 13080 ctaaaccgca ggggaaaggg tatcagaagg cctaaaggcg tattttttag atacatggaa 13140 tctccatttg tcaatacaaa ggtcactgca ttcttctctt atcttcgaga ttataataaa 13200 attgcctcag aatatcacaa taatactaaa ttcattctca cgttttcatg tcaagcatat 13260 tgggcatctg gcccaaactt ctccgccttg aagaatgtta tttggtgctc cataattcat 13320 gaatacattt ctaagtttgt ggaaagagaa caggataaag gtcatatagg agatcaggag 13380 ctaccgcctg aagaggaccc ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt 13440 ttaacggaac aagatgcgga ggcggatgaa ggattgtggg gtgaaataga ttcattatgt 13500 gaaaaatggc agtctgaagc ggagagtcaa actgaggcgg agataatagc cgacaggata 13560 attggaaata gccagaggat ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc 13620 ttgtatcata tactaaagga actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt 13680 agtagttttt cacacgattc gataaagata agcttacatt atgaagagca gcatattaca 13740 gccgtatggg tctacttgat agtaaaattt gaagagcatt ggaagcctgt tgatgtagag 13800 gtcgagttta gatgcaagtt caaggagcga aaggtggatg ggtaggttat atagggatat 13860 agcacagaga tatatagcaa agagatactt ttgaggcaat gtttgtggaa gcggtattcg 13920 caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc 13980 agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac 14040 ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag 14100 ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat 14160 atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc 14220 tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg 14280 ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa 14340 ttggattagt ctcatccttc aatgcattca tttcctttga tattggatca taccctagaa 14400 gtattacgtg attttctgcc ccttaccctc gttgctactc tccttttttt cgtgggaacc 14460 gctttagggc cctcagtgat ggtgttttgt aatttatatg ctcctcttgc atttgtgtct 14520 ctacttcttg ttcgcctgga gggaacttct tcatttgtat tagcatggtt cacttcagtc 14580 cttccttcca actcactctt tttttgctgt aaacgattct ctgccgccag ttcattgaaa 14640 ctattgaata tatcctttag agattccggg atgaataaat cacctattaa agcagcttga 14700 cgatctggtg gaactaaagt aagcaattgg gtaacgacgc ttacgagctt cataacatct 14760 tcttccgttg gagctggtgg gactaataac tgtgtacaat ccatttttct catgagcatt 14820 tcggtagctc tcttcttgtc tttctcgggc aatcttccta ttattatagc aatagatttg 14880 tatagttgct ttctattgtc taacagcttg ttattctgta gcatcaaatc tatggcagcc 14940 tgacttgctt cttgtgaaga gagcatacca tttccaatcg aagatacgct ggaatcttct 15000 gcgctagaat caagaccata cggcctaccg gttgtgagag attccatggg ccttatgaca 15060 tatcctggaa agagtagctc atcagactta cgtttactct ctatatcaat atctacatca 15120 ggagcaatca tttcaataaa cagccgacat acatcccaga cgctataagc tgtacgtgct 15180 tttaccgtca gattcttggc tgtttcaatg tcgtccattt tggttttctt ttaccagtat 15240 tgttcgtttg ataatgtatt cttgcttatt acattataaa atctgtgcag atcacatgtc 15300 aaaacaactt tttatcacaa gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt 15360 aaggaaaagc agcaaaggtg catttttaaa atatgaaatg aagataccgc agtaccaatt 15420 attttcgcag tacaaataat gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca 15480 ggacaattaa agttagtttt tcgagttagc gtgtttgaat actgcaagat acaagataaa 15540 tagagtagtt gaaactagat atcaattgca cacaagatcg gcgctaagca tgccacaatt 15600 tggtatatta tgtaaaacac cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga 15660 aagaccttca ggtgagaaaa tagcattatg tgctgctgaa ctaacctatt tatgttggat 15720 gattacacat aacggaacag caatcaagag agccacattc atgagctata atactatcat 15780 aagcaattcg ctgagtttcg atattgtcaa taaatcactc cagtttaaat acaagacgca 15840 aaaagcaaca attctggaag cctcattaaa gaaattgatt cctgcttggg aatttacaat 15900 tattccttac tatggacaaa aacatcaatc tgatatcact gatattgtaa gtagtttgca 15960 attacagttc gaatcatcgg aagaagcaga taagggaaat agccacagta aaaaaatgct 16020 aaagcacttc taagtgaggg tgaaagcatc tgggagatca ctgagaaaat actaaattcg 16080 tttgagtata cttcgagatt tacaaaaaca aaaactttat accaattcct cttcctagct 16140 actttcatca attgtggaag attcagcgat attaagaacg ttgatccgaa atcatttaaa 16200 ttagtccaaa ataagtatct gggagtaata atccagtgtt tagtgacaga gacaaagaca 16260 agcgttagta ggcacatata cttctttagc gcaaggggta g 16301 <210> 48 <211> 4989 <212> DNA <213> Artificial sequence <220> <223> vector pYIG7 <400> 48 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240 cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg 300 tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat 360 ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt 420 taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac 480 aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt 540 ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata 600 gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta 660 actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt 720 catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt 780 accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga 840 atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta 900 ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt 960 cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat 1020 cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc 1080 tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga 1140 gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag 1200 aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc 1260 ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat 1320 tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag 1380 ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct 1440 ttgctaatac tagtgctttg cttcctgccc ctggctgctc tgggggtacc agatctcgac 1500 ttggttgaac acgttgccaa ggcttaagtg aatttacttt aaagtcttgc atttaaataa 1560 attttctttt tatagcttta tgacttagtt tcaatttata tactatttta atgacatttt 1620 cgattcattg attgaaagct ttgtgttttt tcttgatgcg ctattgcatt gttcttgtct 1680 ttttcgccac atgtaatatc tgtagtagat acctgataca ttgtggatgc tgagtgaaat 1740 tttagttaat aatggaggcg ctcttaataa ttttggggat attggctttt ttttttaaag 1800 tttacaaatg aattttttcc gccaggataa cgattctgaa gttactctta gcgttcctat 1860 cggtacagcc atcaaatcat gcctataaat catgcctata tttgcgtgca gtcagtatca 1920 tctacatgaa aaaaactccc gcaatttctt atagaatacg ttgaaaatta aatgtacgcg 1980 ccaagataag ataacatata tctagctaga tgcagtaata tacacagatt cccgcggacg 2040 tgggaaggaa aaaattagat aacaaaatct gagtgatatg gaaattccgc tgtatagctc 2100 atatctttcc cttcaacacc agaaatgtaa aaatcttgtt acgaaggatc tttttgctaa 2160 tgtttctcgc tcaatcctca tttcttccct acgaagagtc aaatctactt gttttctgcc 2220 ggtatcaaga tccatatctt ctagtttcac catcaaagtc caatttctag tatacagttt 2280 atgtcccaac gtaacagaca atcaaaattg gaaaggataa gtatccttca aagaatgatt 2340 ctgcgctggc tcctgaaccg cctaatggga acagagaagt ccaaaacgat gctataagaa 2400 ccagaaataa aacgataaaa ccataccagg atccaagctt ggcactggcc gtcgttttac 2460 aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc 2520 ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 2580 gcagcctgaa tggcgaatgg gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa 2640 atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata 2700 aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac 2760 tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc 2820 cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa 2880 atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg 2940 cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg 3000 tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcag 3060 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 3120 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 3180 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 3240 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 3300 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 3360 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 3420 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 3480 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 3540 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 3600 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 3660 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 3720 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 3780 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 3840 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 3900 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 3960 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 4020 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 4080 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 4140 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 4200 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 4260 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 4320 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 4380 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 4440 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 4500 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 4560 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa 4620 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 4680 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 4740 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 4800 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 4860 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 4920 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 4980 aagcggaag 4989 <210> 49 <211> 5422 <212> DNA <213> Artificial sequence <220> <223> vector pYIG7E1 <400> 49 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240 cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg 300 tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat 360 ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt 420 taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac 480 aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt 540 ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata 600 gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta 660 actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt 720 catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt 780 accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga 840 atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta 900 ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt 960 cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat 1020 cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc 1080 tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga 1140 gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag 1200 aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc 1260 ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat 1320 tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag 1380 ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct 1440 ttgctaatac tagtgctttg cttcctgccc ctggctgctc tggggtatga ggtgcgcaac 1500 gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt gtatgaggca 1560 gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa caactcttcc 1620 cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt ccccaccacg 1680 acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc cgctatgtac 1740 gtgggggacc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat ctcgcctcgc 1800 cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat aacgggtcac 1860 cgtatggctt gggatatgat gatgaactgg taatagaccc ttctcacctc ggccgataag 1920 ctcagatctc gacttggttg aacacgttgc caaggcttaa gtgaatttac tttaaagtct 1980 tgcatttaaa taaattttct ttttatagct ttatgactta gtttcaattt atatactatt 2040 ttaatgacat tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc 2100 attgttcttg tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga 2160 tgctgagtga aattttagtt aataatggag gcgctcttaa taattttggg gatattggct 2220 ttttttttta aagtttacaa atgaattttt tccgccagga taacgattct gaagttactc 2280 ttagcgttcc tatcggtaca gccatcaaat catgcctata aatcatgcct atatttgcgt 2340 gcagtcagta tcatctacat gaaaaaaact cccgcaattt cttatagaat acgttgaaaa 2400 ttaaatgtac gcgccaagat aagataacat atatctagct agatgcagta atatacacag 2460 attcccgcgg acgtgggaag gaaaaaatta gataacaaaa tctgagtgat atggaaattc 2520 cgctgtatag ctcatatctt tcccttcaac accagaaatg taaaaatctt gttacgaagg 2580 atctttttgc taatgtttct cgctcaatcc tcatttcttc cctacgaaga gtcaaatcta 2640 cttgttttct gccggtatca agatccatat cttctagttt caccatcaaa gtccaatttc 2700 tagtatacag tttatgtccc aacgtaacag acaatcaaaa ttggaaagga taagtatcct 2760 tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg ggaacagaga agtccaaaac 2820 gatgctataa gaaccagaaa taaaacgata aaaccatacc aggatccaag cttggcactg 2880 gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 2940 gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 3000 tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg taaacgttaa tattttgtta 3060 aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 3120 aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 3180 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 3240 cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 3300 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 3360 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 3420 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 3480 cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 3540 ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 3600 taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 3660 tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 3720 gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 3780 atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 3840 ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 3900 cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 3960 ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 4020 aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 4080 ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 4140 gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 4200 ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 4260 gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 4320 ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 4380 tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 4440 cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 4500 tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 4560 atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 4620 tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 4680 tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 4740 ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 4800 cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 4860 ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 4920 gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 4980 tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 5040 gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 5100 ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 5160 tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 5220 ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 5280 tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 5340 attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 5400 tcagtgagcg aggaagcgga ag 5422 <210> 50 <211> 15621 <212> DNA <213> Artificial sequence <220> <223> vector pSY1YIG7E1s <400> 50 atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60 ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120 acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180 tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240 aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300 atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360 aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420 atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480 agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540 tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600 gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660 aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720 aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780 ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840 gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900 tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960 atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020 gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080 ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140 ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200 taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260 tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320 tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380 tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440 gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500 cgaccacacc cgtcctgtgg atcctggtat ggttttatcg ttttatttct ggttcttata 1560 gcatcgtttt ggacttctct gttcccatta ggcggttcag gagccagcgc agaatcattc 1620 tttgaaggat acttatcctt tccaattttg attgtctgtt acgttgggac ataaactgta 1680 tactagaaat tggactttga tggtgaaact agaagatatg gatcttgata ccggcagaaa 1740 acaagtagat ttgactcttc gtagggaaga aatgaggatt gagcgagaaa cattagcaaa 1800 aagatccttc gtaacaagat ttttacattt ctggtgttga agggaaagat atgagctata 1860 cagcggaatt tccatatcac tcagattttg ttatctaatt ttttccttcc cacgtccgcg 1920 ggaatctgtg tatattactg catctagcta gatatatgtt atcttatctt ggcgcgtaca 1980 tttaattttc aacgtattct ataagaaatt gcgggagttt ttttcatgta gatgatactg 2040 actgcacgca aatataggca tgatttatag gcatgatttg atggctgtac cgataggaac 2100 gctaagagta acttcagaat cgttatcctg gcggaaaaaa ttcatttgta aactttaaaa 2160 aaaaaagcca atatccccaa aattattaag agcgcctcca ttattaacta aaatttcact 2220 cagcatccac aatgtatcag gtatctacta cagatattac atgtggcgaa aaagacaaga 2280 acaatgcaat agcgcatcaa gaaaaaacac aaagctttca atcaatgaat cgaaaatgtc 2340 attaaaatag tatataaatt gaaactaagt cataaagcta taaaaagaaa atttatttaa 2400 atgcaagact ttaaagtaaa ttcacttaag ccttggcaac gtgttcaacc aagtcgagat 2460 ctgagcttat cggccgaggt gagaagggtc tattaccagt tcatcatcat atcccaagcc 2520 atacggtgac ccgttatgtg gccgggatag attgagcaat tgcagtcctg caccgtctca 2580 tgccggcgag gcgagatggt gaacagctgg gagacgagga agacagatcc gcagaggtcc 2640 cccacgtaca tagcggaaca gaaagcagcc gccccaacga gcaaatcgac gtggcgtcgt 2700 attgtcgtgg tggggacgct ggcgttccta gctgcgagcg tgggggtgag cgctacccag 2760 cagcgggaag agttgttctc ccgaacgcag ggcacgcacc cgggggtgtg catgatcatg 2820 tccgctgcct catacacaat gcttgagttg gagcagtcgt tcgtgacatg gtacatcccg 2880 gacacgttgc gcacctcata ccccagagca gccaggggca ggaagcaaag cactagtatt 2940 agcaaagacc tcatggtgtt tgtttatgtg tgtttattcg aaactaagtt cttggtgttt 3000 taaaactaaa aaaaagacta actataaaag tagaatttaa gaagtttaag aaatagattt 3060 acagaattac aatcaatacc taccgtcttt atatacttat tagtcaagta ggggaataat 3120 ttcagggaac tggtttcaac cttttttttc agggtttttt tttttcattc tctcaatctg 3180 aaattctctt atttctccaa cttataagtt ggagatgccc ggtgttccgg cagaggagat 3240 cagtctcgtg aagtggatgg tttcccgcct gcgggcaaaa cgtcataaca tttttatgag 3300 cgaaagccgt taatgaagac aaaatccctt aattaaaaca ttagaatggt gattagaaag 3360 gcaggattaa tcagttacac aggctgtaac cggagagacg gatcataagg caatttttag 3420 ataagactgg ttagagttct tggcatcaga aaatttgaga aacgattttt ccgtttgttt 3480 gcccctacgt tttgcccctt tgatcaaact atcagttaag atattaattt ttttgagaaa 3540 acgattcttt gattagtctc ttcaaacaaa caatgagctc tgaagacgaa ttgggaagta 3600 tcggtactgt gtttcccgga agtcccatag ataagagcat tgggagtatt ctccacaatt 3660 tgatgaagaa gtggagactt tgctggaaga tagcttcacg tggaacattc ctgactggaa 3720 cgagttaaca aacccgaaat acaattcgcc caggtttaga attggtgatt tcgaatggga 3780 cattctatta ttccctcagg gaaaccataa taaaggtgtt gcggtatatc tggaacctca 3840 tccggaagaa aaattagatg agactacggg agagatggtg ccagttgatc cggactggta 3900 ttgttgtgct cagtttgcca ttggtatatc tagacctggt aatggtgaca ccatcaattt 3960 aattaacaaa tcgcatcacc gattcaacgc tctagataca gactggggat ttgcaaattt 4020 gatagatttg aacaacttga aacatccctc aaaaggaaga ccgctttcgt tcttaaacga 4080 agggaccttg aacataacag cgtatgtgcg catattgaag gatcctctac gccggacgca 4140 tcgtggccgg catcaccggc gccacaggtg cggttgctgg cccctatatc gccgacatca 4200 ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc ggcgtgggta 4260 tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat gcaccattcc 4320 ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta atgcaggagt 4380 cgcataaggg agagcgtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 4440 ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 4500 tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga 4560 gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag 4620 ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca 4680 tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct 4740 tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc 4800 tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta 4860 ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga 4920 gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg 4980 cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct 5040 cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa 5100 tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac 5160 gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc 5220 gttgaggacc cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat 5280 acgcgagcga acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg 5340 aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac 5400 cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc 5460 tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca 5520 taccgccagt tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac 5580 ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc 5640 ccccttacac ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc 5700 tttatcagaa gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa 5760 caggcagaca tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc 5820 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 5880 gcttgtctgt aagcggtgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 5940 gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct 6000 taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc 6060 gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga 6120 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6180 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6240 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6300 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6360 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6420 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 6480 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6540 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6600 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6660 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6720 gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6780 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6840 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 6900 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 6960 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7020 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7080 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7140 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7200 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7260 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7320 agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc 7380 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7440 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7500 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7560 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7620 tatgcggcga ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag 7680 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7740 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7800 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7860 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 7920 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 7980 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8040 aaccattatt atcatgacat taacctataa aaaataggcg tatcacgagg ccctttcgtc 8100 ttcaagaatt ctcatgtttg acagcttatc atcgatccac ttgtatattt ggatgaattt 8160 ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga ccggcaattc ttcaagcaat 8220 aaacaggaat accaattatt aaaagataac ttagtcagat cgtacaataa agctttgaag 8280 aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc caaaatctca cattggaaga 8340 catttgatga cctcatttct ttcaatgaag ggcctaacgg agttgactaa tgttgtggga 8400 aattggaccg ataagcgtgc ttctgccgtg gccaggacaa cgtatactca tcagataaca 8460 gcaatacctg atcactactt cgcactagtt tctcggtact atgcatatga tccaatatca 8520 aaggaaatga tagcattgaa ggatgagact aatccaattg aggagtggca gcatatagaa 8580 cagctaaagg gtagtgctga aggaagcata cgataccccg catggaatgg gataatatca 8640 caggaggtac tagactacct ttcatcctac ataaatagac gcatataagt acgcatttaa 8700 gcataaacac gcactatgcc gttcttctca tgtatatata tatacaggca acacgcagat 8760 ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc gcgttgcatt ttcggaagcg 8820 ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt cctattctct agaaagtata 8880 ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa gacgcacttt caaaaaacca 8940 aaaacgcacc ggactgtaac gagctactaa aatattgcga ataccgcttc cacaaacatt 9000 gctcaaaagt atctctttgc tatatatctc tgtgctatat ccctatataa ccatcccatc 9060 cacctttcgc tccttgaact tgcatctaaa ctcgacctct acatttttta tgtttatctc 9120 tagtattacc tcttagacaa aaaaattgta gtaagaacta ttcatagagt taatcgaaaa 9180 caatacgaaa atgtaaacat ttcctatacg tagtatatag agacaaaata gaagaaaccg 9240 ttcataattt tctgaccaat gaagaatcat caacgctatc actttctgtt cacaaagtat 9300 gcgcaatcca catcggtata gaatataatc ggggatgcct ttatcttgaa aaaatgcacc 9360 cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt caggcttttt ttatggaaga 9420 gaaaatagac accaaagtag ccttcttcta accttaacgg acctacagtg caaaaagtta 9480 tcaagagact gcattataga gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt 9540 agaaaaatag cgctctcggg atgcattttt gtagaacaaa aaagaagtat agattcttgt 9600 tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa aaatgcagct cagattcttt 9660 gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta caaaaatgaa gcacagattc 9720 ttcgttggta aaatagcgct ttcgcgttgc atttctgttc tgtaaaaatg cagctcagat 9780 tctttgtttg aaaaattagc gctctcgcgt tgcatttttg ttctacaaaa tgaagcacag 9840 atgcttcgtt aacaaagata tgctattgaa gtgcaagatg gaaacgcaga aaatgaaccg 9900 gggatgcgac gtgcaagatt acctatgcaa tagatgcaat agtttctcca ggaaccgaaa 9960 tacatacatt gtcttccgta aagcgctaga ctatatatta ttatacaggt tcaaatatac 10020 tatctgtttc agggaaaact cccaggttcg gatgttcaaa attcaatgat gggtaacaag 10080 tacgatcgta aatctgtaaa acagtttgtc ggatattagg ctgtatctcc tcaaagcgta 10140 ttcgaatatc attgagaagc tgcatttttt tttttttttt tttttttttt ttttttatat 10200 atatttcaag gatataccat tgtaatgtct gcccctaaga agatcgtcgt tttgccaggt 10260 gaccacgttg gtcaagaaat cacagccgaa gccattaagg ttcttaaagc tatttctgat 10320 gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa ttggtggtgc tgctatcgat 10380 gctacaggtg tcccacttcc agatgaggcg ctggaagcct ccaagaaggt tgatgccgtt 10440 ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta gtgttagacc tgaacaaggt 10500 ttactaaaaa tccgtaaaga acttcaattg tacgccaact taagaccatg taactttgca 10560 tccgactctc ttttagactt atctccaatc aagccacaat ttgctaaagg tactgacttc 10620 gttgttgtca gagaattagt gggaggtatt tactttggta agagaaagga agacgatggt 10680 gatggtgtcg cttgggatag tgaacaatac accgttccag aagtgcaaag aatcacaaga 10740 atggccgctt tcatggccct acaacatgag ccaccattgc ctatttggtc cttggataaa 10800 gctaatgttt tggcctcttc aagattatgg agaaaaactg tggaggaaac catcaagaac 10860 gaattcccta cattgaaggt tcaacatcaa ttgattgatt ctgccgccat gatcctagtt 10920 aagaacccaa cccacctaaa tggtattata atcaccagca acatgtttgg tgatatcatc 10980 tccgatgaag cctccgttat cccaggttcc ttgggtttgt tgccatctgc gtccttggcc 11040 tctttgccag acaagaacac cgcatttggt ttgtacgaac catgccacgg ttctgctcca 11100 gatttgccaa agaataaggt tgaccctatc gccactatct tgtctgctgc aatgatgttg 11160 aaattgtcat tgaacttgcc tgaagaaggt aaggccattg aagatgcagt taaaaaggtt 11220 ttggatgcag gtatcagaac tggtgattta ggtggttcca acagtaccac cgaagtcggt 11280 gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa aagattctct ttttttatga 11340 tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaatgcag 11400 cgtcacatcg gataataatg atggcagcca ttgtagaagt gccttttgca tttctagtct 11460 ctttctcggt ctagctagtt ttactacatc gcgaagatag aatcttagat cacactgcct 11520 ttgctgagct ggatcatatg agtaacaaaa gagtggtaag gcctcgttaa aggacaagga 11580 cctgagcgga agtgtatcgt aaagtagacg gagtatacta gtatagtcta tagtccgtgg 11640 aattctaagt gccagcttta taatgtcatt ctccttacta cagacccgcc tgaaagtaga 11700 cacatcatca tcagtaagct ttgacaaaaa gcattgagta gctaactctt ctatgcaatc 11760 tatagctgtt ttataaggca ttcaatggac agattgaggt ttttgaaaca tactagtgaa 11820 attagcctta atcccttctc gaagttaatc atgcattatg gtgtaaaaaa tgcaactcgc 11880 gttgctctac tttttcccga atttccaaat acgcagctgg ggtgattgct cgatttcgta 11940 acgaaagttt tgtttataaa aaccgcgaaa accttctgta acagatagat ttttacagcg 12000 ctgatataca atgacatcag ctgtaatgga aaataactga aatatgaatg gcgagagact 12060 gcttgcttgt attaagcaat gtattatgca gcacttccaa cctatggtgt acgatgaaag 12120 taggtgtgta atcgagacga caagggggac ttttccagtt cctgatcatt ataagaaata 12180 caaaacgtta gcatttgcat ttgttggaca tgtactgaat acagacgaca caccggtaat 12240 tgaaaaagaa ctggattggc ctgatcctgc actagtgtac aatacaattg tcgatcgaat 12300 cataaatcac ccagaattat cacagtttat atcggttgca tttattagtc agttaaaggc 12360 caccatcgga gagggtttag atattaatgt aaaaggcacg ctaaaccgca ggggaaaggg 12420 tatcagaagg cctaaaggcg tattttttag atacatggaa tctccatttg tcaatacaaa 12480 ggtcactgca ttcttctctt atcttcgaga ttataataaa attgcctcag aatatcacaa 12540 taatactaaa ttcattctca cgttttcatg tcaagcatat tgggcatctg gcccaaactt 12600 ctccgccttg aagaatgtta tttggtgctc cataattcat gaatacattt ctaagtttgt 12660 ggaaagagaa caggataaag gtcatatagg agatcaggag ctaccgcctg aagaggaccc 12720 ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt ttaacggaac aagatgcgga 12780 ggcggatgaa ggattgtggg gtgaaataga ttcattatgt gaaaaatggc agtctgaagc 12840 ggagagtcaa actgaggcgg agataatagc cgacaggata attggaaata gccagaggat 12900 ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc ttgtatcata tactaaagga 12960 actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt agtagttttt cacacgattc 13020 gataaagata agcttacatt atgaagagca gcatattaca gccgtatggg tctacttgat 13080 agtaaaattt gaagagcatt ggaagcctgt tgatgtagag gtcgagttta gatgcaagtt 13140 caaggagcga aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa 13200 agagatactt ttgaggcaat gtttgtggaa gcggtattcg caatatttta gtagctcgtt 13260 acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc agagcgcttt tggttttcaa 13320 aagcgctctg aagttcctat actttctaga gaataggaac ttcggaatag gaacttcaaa 13380 gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag ctgcgcacat acagctcact 13440 gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat atatacatga gaagaacggc 13500 atagtgcgtg tttatgctta aatgcgtact tatatgcgtc tatttatgta ggatgaaagg 13560 tagtctagta cctcctgtga tattatccca ttccatgcgg ggtatcgtat gcttccttca 13620 gcactaccct ttagctgttc tatatgctgc cactcctcaa ttggattagt ctcatccttc 13680 aatgcattca tttcctttga tattggatca taccctagaa gtattacgtg attttctgcc 13740 ccttaccctc gttgctactc tccttttttt cgtgggaacc gctttagggc cctcagtgat 13800 ggtgttttgt aatttatatg ctcctcttgc atttgtgtct ctacttcttg ttcgcctgga 13860 gggaacttct tcatttgtat tagcatggtt cacttcagtc cttccttcca actcactctt 13920 tttttgctgt aaacgattct ctgccgccag ttcattgaaa ctattgaata tatcctttag 13980 agattccggg atgaataaat cacctattaa agcagcttga cgatctggtg gaactaaagt 14040 aagcaattgg gtaacgacgc ttacgagctt cataacatct tcttccgttg gagctggtgg 14100 gactaataac tgtgtacaat ccatttttct catgagcatt tcggtagctc tcttcttgtc 14160 tttctcgggc aatcttccta ttattatagc aatagatttg tatagttgct ttctattgtc 14220 taacagcttg ttattctgta gcatcaaatc tatggcagcc tgacttgctt cttgtgaaga 14280 gagcatacca tttccaatcg aagatacgct ggaatcttct gcgctagaat caagaccata 14340 cggcctaccg gttgtgagag attccatggg ccttatgaca tatcctggaa agagtagctc 14400 atcagactta cgtttactct ctatatcaat atctacatca ggagcaatca tttcaataaa 14460 cagccgacat acatcccaga cgctataagc tgtacgtgct tttaccgtca gattcttggc 14520 tgtttcaatg tcgtccattt tggttttctt ttaccagtat tgttcgtttg ataatgtatt 14580 cttgcttatt acattataaa atctgtgcag atcacatgtc aaaacaactt tttatcacaa 14640 gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt aaggaaaagc agcaaaggtg 14700 catttttaaa atatgaaatg aagataccgc agtaccaatt attttcgcag tacaaataat 14760 gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca ggacaattaa agttagtttt 14820 tcgagttagc gtgtttgaat actgcaagat acaagataaa tagagtagtt gaaactagat 14880 atcaattgca cacaagatcg gcgctaagca tgccacaatt tggtatatta tgtaaaacac 14940 cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga aagaccttca ggtgagaaaa 15000 tagcattatg tgctgctgaa ctaacctatt tatgttggat gattacacat aacggaacag 15060 caatcaagag agccacattc atgagctata atactatcat aagcaattcg ctgagtttcg 15120 atattgtcaa taaatcactc cagtttaaat acaagacgca aaaagcaaca attctggaag 15180 cctcattaaa gaaattgatt cctgcttggg aatttacaat tattccttac tatggacaaa 15240 aacatcaatc tgatatcact gatattgtaa gtagtttgca attacagttc gaatcatcgg 15300 aagaagcaga taagggaaat agccacagta aaaaaatgct aaagcacttc taagtgaggg 15360 tgaaagcatc tgggagatca ctgagaaaat actaaattcg tttgagtata cttcgagatt 15420 tacaaaaaca aaaactttat accaattcct cttcctagct actttcatca attgtggaag 15480 attcagcgat attaagaacg ttgatccgaa atcatttaaa ttagtccaaa ataagtatct 15540 gggagtaata atccagtgtt tagtgacaga gacaaagaca agcgttagta ggcacatata 15600 cttctttagc gcaaggggta g 15621 <210> 51 <211> 3593 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaA <400> 51 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200 tgaagctgaa ttcacgtggc ccagccggcc gtctcggatc ggtacctcga gccgcggcgg 1260 ccgccagctt tctagaacaa aaactcatct cagaagagga tctgaatagc gccgtcgacc 1320 atcatcatca tcatcattga gtttgtagcc ttagacatga ctgttcctca gttcaagttg 1380 ggcacttacg agaagaccgg tcttgctaga ttctaatcaa gaggatgtca gaatgccatt 1440 tgcctgagag atgcaggctt catttttgat acttttttat ttgtaaccta tatagtatag 1500 gatttttttt gtcattttgt ttcttctcgt acgagcttgc tcctgatcag cctatctcgc 1560 agctgatgaa tatcttgtgg taggggtttg ggaaaatcat tcgagtttga tgtttttctt 1620 ggtatttccc actcctcttc agagtacaga agattaagtg agaccttcgt ttgtgcggat 1680 cccccacaca ccatagcttc aaaatgtttc tactcctttt ttactcttcc agattttctc 1740 ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact aaattttccc 1800 tctttcttcc tctagggtgt cgttaattac ccgtactaaa ggtttggaaa agaaaaaaga 1860 gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat cacgtttctt 1920 tttcttgaaa tttttttttt tagttttttt ctctttcagt gacctccatt gatatttaag 1980 ttaataaacg gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact 2040 ttttttactt cttgttcatt agaaagaaag catagcaatc taatctaagg ggcggtgttg 2100 acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa 2160 ccatggccaa gttgaccagt gccgttccgg tgctcaccgc gcgcgacgtc gccggagcgg 2220 tcgagttctg gaccgaccgg ctcgggttct cccgggactt cgtggaggac gacttcgccg 2280 gtgtggtccg ggacgacgtg accctgttca tcagcgcggt ccaggaccag gtggtgccgg 2340 acaacaccct ggcctgggtg tgggtgcgcg gcctggacga gctgtacgcc gagtggtcgg 2400 aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc catgaccgag atcggcgagc 2460 agccgtgggg gcgggagttc gccctgcgcg acccggccgg caactgcgtg cacttcgtgg 2520 ccgaggagca ggactgacac gtccgacggc ggcccacggg tcccaggcct cggagatccg 2580 tccccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 2640 ccccccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 2700 atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 2760 ttttttctgt acagacgcgt gtacgcatgt aacattatac tgaaaacctt gcttgagaag 2820 gttttgggac gctcgaaggc tttaatttgc aagctggaga ccaacatgtg agcaaaaggc 2880 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 2940 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3000 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3060 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa 3120 tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3180 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3240 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3300 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3360 agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3420 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3480 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3540 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag atc 3593 <210> 52 <211> 3547 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaD' <400> 52 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggggccc 1200 gaattcgcat gcggccgcca gctttctaga acaaaaactc atctcagaag aggatctgaa 1260 tagcgccgtc gaccatcatc atcatcatca ttgagtttgt agccttagac atgactgttc 1320 ctcagttcaa gttgggcact tacgagaaga ccggtcttgc tagattctaa tcaagaggat 1380 gtcagaatgc catttgcctg agagatgcag gcttcatttt tgatactttt ttatttgtaa 1440 cctatatagt ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc ttgctcctga 1500 tcagcctatc tcgcagctga tgaatatctt gtggtagggg tttgggaaaa tcattcgagt 1560 ttgatgtttt tcttggtatt tcccactcct cttcagagta cagaagatta agtgagacct 1620 tcgtttgtgc ggatccccca cacaccatag cttcaaaatg tttctactcc ttttttactc 1680 ttccagattt tctcggactc cgcgcatcgc cgtaccactt caaaacaccc aagcacagca 1740 tactaaattt tccctctttc ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg 1800 gaaaagaaaa aagagaccgc ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt 1860 ttatcacgtt tctttttctt gaaatttttt tttttagttt ttttctcttt cagtgacctc 1920 cattgatatt taagttaata aacggtcttc aatttctcaa gtttcagttt catttttctt 1980 gttctattac aacttttttt acttcttgtt cattagaaag aaagcatagc aatctaatct 2040 aaggggcggt gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa 2100 ggtgaggaac taaaccatgg ccaagttgac cagtgccgtt ccggtgctca ccgcgcgcga 2160 cgtcgccgga gcggtcgagt tctggaccga ccggctcggg ttctcccggg acttcgtgga 2220 ggacgacttc gccggtgtgg tccgggacga cgtgaccctg ttcatcagcg cggtccagga 2280 ccaggtggtg ccggacaaca ccctggcctg ggtgtgggtg cgcggcctgg acgagctgta 2340 cgccgagtgg tcggaggtcg tgtccacgaa cttccgggac gcctccgggc cggccatgac 2400 cgagatcggc gagcagccgt gggggcggga gttcgccctg cgcgacccgg ccggcaactg 2460 cgtgcacttc gtggccgagg agcaggactg acacgtccga cggcggccca cgggtcccag 2520 gcctcggaga tccgtccccc ttttcctttg tcgatatcat gtaattagtt atgtcacgct 2580 tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 2640 aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 2700 ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa 2760 ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcaagctg gagaccaaca 2820 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2880 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 2940 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 3000 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 3060 tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 3120 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 3180 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 3240 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 3300 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 3360 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 3420 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3480 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3540 tgagatc 3547 <210> 53 <211> 3558 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaE' <400> 53 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200 tgaagcctgc agcatatgct cgaggccgcc agctttctag aacaaaaact catctcagaa 1260 gaggatctga atagcgccgt cgaccatcat catcatcatc attgagtttg tagccttaga 1320 catgactgtt cctcagttca agttgggcac ttacgagaag accggtcttg ctagattcta 1380 atcaagagga tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt 1440 tttatttgta acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag 1500 cttgctcctg atcagcctat ctcgcagctg atgaatatct tgtggtaggg gtttgggaaa 1560 atcattcgag tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt 1620 aagtgagacc ttcgtttgtg cggatccccc acacaccata gcttcaaaat gtttctactc 1680 cttttttact cttccagatt ttctcggact ccgcgcatcg ccgtaccact tcaaaacacc 1740 caagcacagc atactaaatt ttccctcttt cttcctctag ggtgtcgtta attacccgta 1800 ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt cgaaaaaggc 1860 aataaaaatt tttatcacgt ttctttttct tgaaattttt ttttttagtt tttttctctt 1920 tcagtgacct ccattgatat ttaagttaat aaacggtctt caatttctca agtttcagtt 1980 tcatttttct tgttctatta caactttttt tacttcttgt tcattagaaa gaaagcatag 2040 caatctaatc taaggggcgg tgttgacaat taatcatcgg catagtatat cggcatagta 2100 taatacgaca aggtgaggaa ctaaaccatg gccaagttga ccagtgccgt tccggtgctc 2160 accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg 2220 gacttcgtgg aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc 2280 gcggtccagg accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg 2340 gacgagctgt acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg 2400 ccggccatga ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg 2460 gccggcaact gcgtgcactt cgtggccgag gagcaggact gacacgtccg acggcggccc 2520 acgggtccca ggcctcggag atccgtcccc cttttccttt gtcgatatca tgtaattagt 2580 tatgtcacgc ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt 2640 tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 2700 gttatttata tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat 2760 tatactgaaa accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcaagct 2820 ggagaccaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 2880 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 2940 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 3000 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 3060 ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 3120 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3180 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3240 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3300 gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3360 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3420 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3480 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3540 gattttggtc atgagatc 3558 <210> 54 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 54 tcgagaaaag gggcccgaat tcgcatgc 28 <210> 55 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 55 ggccgcatgc gaattcgggc cccttttc 28 <210> 56 <211> 35 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 56 tcgagaaaag agaggctgaa gcctgcagca tatgc 35 <210> 57 <211> 35 <212> DNA <213> Artificial sequence <220> <223> synthetic probe or primer <400> 57 ggccgcatat gctgcaggct tcagcctctc ttttc 35 <210> 58 <211> 3997 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaD' E1sH6 <400> 58 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggtatga 1200 ggtgcgcaac gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt 1260 gtatgaggca gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa 1320 caactcttcc cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt 1380 ccccactacg acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc 1440 cgctatgtac gtgggggatc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat 1500 ctcgcctcgc cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat 1560 aacaggtcac cgtatggctt gggatatgat gatgaactgg caccaccacc atcaccatta 1620 aagatctaag cttgaatccc gcggccatgc gaattcgcat gcggccgcca gctttctaga 1680 acaaaaactc atctcagaag aggatctgaa tagcgccgtc gaccatcatc atcatcatca 1740 ttgagtttgt agccttagac atgactgttc ctcagttcaa gttgggcact tacgagaaga 1800 ccggtcttgc tagattctaa tcaagaggat gtcagaatgc catttgcctg agagatgcag 1860 gcttcatttt tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt 1920 ttgtttcttc tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt 1980 gtggtagggg tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct 2040 cttcagagta cagaagatta agtgagacct tcgtttgtgc ggatccccca cacaccatag 2100 cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc cgcgcatcgc 2160 cgtaccactt caaaacaccc aagcacagca tactaaattt tccctctttc ttcctctagg 2220 gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc ctcgtttctt 2280 tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt gaaatttttt 2340 tttttagttt ttttctcttt cagtgacctc cattgatatt taagttaata aacggtcttc 2400 aatttctcaa gtttcagttt catttttctt gttctattac aacttttttt acttcttgtt 2460 cattagaaag aaagcatagc aatctaatct aaggggcggt gttgacaatt aatcatcggc 2520 atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg ccaagttgac 2580 cagtgccgtt ccggtgctca ccgcgcgcga cgtcgccgga gcggtcgagt tctggaccga 2640 ccggctcggg ttctcccggg acttcgtgga ggacgacttc gccggtgtgg tccgggacga 2700 cgtgaccctg ttcatcagcg cggtccagga ccaggtggtg ccggacaaca ccctggcctg 2760 ggtgtgggtg cgcggcctgg acgagctgta cgccgagtgg tcggaggtcg tgtccacgaa 2820 cttccgggac gcctccgggc cggccatgac cgagatcggc gagcagccgt gggggcggga 2880 gttcgccctg cgcgacccgg ccggcaactg cgtgcacttc gtggccgagg agcaggactg 2940 acacgtccga cggcggccca cgggtcccag gcctcggaga tccgtccccc ttttcctttg 3000 tcgatatcat gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc 3060 taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag 3120 ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac 3180 gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga 3240 aggctttaat ttgcaagctg gagaccaaca tgtgagcaaa aggccagcaa aaggccagga 3300 accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 3360 acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 3420 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 3480 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt 3540 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 3600 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 3660 acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 3720 gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg 3780 gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 3840 gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 3900 gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 3960 acgaaaactc acgttaaggg attttggtca tgagatc 3997 <210> 59 <211> 4004 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaE' E1sH6 <400> 59 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200 tgaagcctat gaggtgcgca acgtgtccgg gatgtaccat gtcacgaacg actgctccaa 1260 ctcaagcatt gtgtatgagg cagcggacat gatcatgcac acccccgggt gcgtgccctg 1320 cgttcgggag aacaactctt cccgctgctg ggtagcgctc acccccacgc tcgcagctag 1380 gaacgccagc gtccccacta cgacaatacg acgccacgtc gatttgctcg ttggggcggc 1440 tgctttctgt tccgctatgt acgtggggga tctctgcgga tctgtcttcc tcgtctccca 1500 gctgttcacc atctcgcctc gccggcatga gacggtgcag gactgcaatt gctcaatcta 1560 tcccggccac ataacgggtc accgtatggc ttgggatatg atgatgaact ggcaccacca 1620 ccatcaccat taaagatcta agcttgaatc ccgcggccat ggcatatgcg gccgccagct 1680 ttctagaaca aaaactcatc tcagaagagg atctgaatag cgccgtcgac catcatcatc 1740 atcatcattg agtttgtagc cttagacatg actgttcctc agttcaagtt gggcacttac 1800 gagaagaccg gtcttgctag attctaatca agaggatgtc agaatgccat ttgcctgaga 1860 gatgcaggct tcatttttga tactttttta tttgtaacct atatagtata ggattttttt 1920 tgtcattttg tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagctgatga 1980 atatcttgtg gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc 2040 cactcctctt cagagtacag aagattaagt gagaccttcg tttgtgcgga tcccccacac 2100 accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc 2160 gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc 2220 ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc 2280 gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttcttgaa 2340 attttttttt ttagtttttt tctctttcag tgacctccat tgatatttaa gttaataaac 2400 ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac tttttttact 2460 tcttgttcat tagaaagaaa gcatagcaat ctaatctaag gggcggtgtt gacaattaat 2520 catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca 2580 agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct 2640 ggaccgaccg gctcgggttc tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc 2700 gggacgacgt gaccctgttc atcagcgcgg tccaggacca ggtggtgccg gacaacaccc 2760 tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt 2820 ccacgaactt ccgggacgcc tccgggccgg ccatgaccga gatcggcgag cagccgtggg 2880 ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt gcacttcgtg gccgaggagc 2940 aggactgaca cgtccgacgg cggcccacgg gtcccaggcc tcggagatcc gtcccccttt 3000 tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tccccccaca 3060 tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 3120 tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3180 tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3240 cgctcgaagg ctttaatttg caagctggag accaacatgt gagcaaaagg ccagcaaaag 3300 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3360 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3420 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3480 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 3540 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3600 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3660 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3720 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 3780 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3840 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3900 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3960 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gatc 4004 <210> 60 <211> 4492 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaD' E2sH6 <400> 60 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggcatac 1200 ccgcgtgtca ggaggggcag cagcctccga taccaggggc cttgtgtccc tctttagccc 1260 cgggtcggct cagaaaatcc agctcgtaaa caccaacggc agttggcaca tcaacaggac 1320 tgccctgaac tgcaacgact ccctccaaac agggttcttt gccgcactat tctacaaaca 1380 caaattcaac tcgtctggat gcccagagcg cttggccagc tgtcgctcca tcgacaagtt 1440 cgctcagggg tggggtcccc tcacttacac tgagcctaac agctcggacc agaggcccta 1500 ctgctggcac tacgcgcctc gaccgtgtgg tattgtaccc gcgtctcagg tgtgcggtcc 1560 agtgtattgc ttcaccccga gccctgttgt ggtggggacg accgatcggt ttggtgtccc 1620 cacgtataac tggggggcga acgactcgga tgtgctgatt ctcaacaaca cgcggccgcc 1680 gcgaggcaac tggttcggct gtacatggat gaatggcact gggttcacca agacgtgtgg 1740 gggccccccg tgcaacatcg ggggggccgg caacaacacc ttgacctgcc ccactgactg 1800 ttttcggaag caccccgagg ccacctacgc cagatgcggt tctgggccct ggctgacacc 1860 taggtgtatg gttcattacc catataggct ctggcactac ccctgcactg tcaacttcac 1920 catcttcaag gttaggatgt acgtgggggg cgtggagcac aggttcgaag ccgcatgcaa 1980 ttggactcga ggagagcgtt gtgacttgga ggacagggat agatcagagc ttagcccgct 2040 gctgctgtct acaacagagt ggcaggtgat cgagggcaga caccatcacc accatcacta 2100 atagttaatt aactgcaggc atgcaagctt atcgataccg tcgacgaatt cgcatgcggc 2160 cgccagcttt ctagaacaaa aactcatctc agaagaggat ctgaatagcg ccgtcgacca 2220 tcatcatcat catcattgag tttgtagcct tagacatgac tgttcctcag ttcaagttgg 2280 gcacttacga gaagaccggt cttgctagat tctaatcaag aggatgtcag aatgccattt 2340 gcctgagaga tgcaggcttc atttttgata cttttttatt tgtaacctat atagtatagg 2400 attttttttg tcattttgtt tcttctcgta cgagcttgct cctgatcagc ctatctcgca 2460 gctgatgaat atcttgtggt aggggtttgg gaaaatcatt cgagtttgat gtttttcttg 2520 gtatttccca ctcctcttca gagtacagaa gattaagtga gaccttcgtt tgtgcggatc 2580 ccccacacac catagcttca aaatgtttct actccttttt tactcttcca gattttctcg 2640 gactccgcgc atcgccgtac cacttcaaaa cacccaagca cagcatacta aattttccct 2700 ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag 2760 accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt 2820 ttcttgaaat tttttttttt agtttttttc tctttcagtg acctccattg atatttaagt 2880 taataaacgg tcttcaattt ctcaagtttc agtttcattt ttcttgttct attacaactt 2940 tttttacttc ttgttcatta gaaagaaagc atagcaatct aatctaaggg gcggtgttga 3000 caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 3060 catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt 3120 cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg 3180 tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga 3240 caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga 3300 ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca 3360 gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc 3420 cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc ggagatccgt 3480 cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 3540 cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 3600 tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt 3660 tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg cttgagaagg 3720 ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga gcaaaaggcc 3780 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 3840 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 3900 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 3960 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 4020 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 4080 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 4140 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 4200 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 4260 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 4320 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 4380 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 4440 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga tc 4492 <210> 61 <211> 4431 <212> DNA <213> Artificial sequence <220> <223> vector pPICZalphaE' E2sH6 <400> 61 agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60 gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120 tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180 agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240 acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300 tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360 agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420 gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480 ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540 cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600 ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660 ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720 gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780 atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840 actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900 caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960 tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020 agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080 tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140 tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200 tgaagcccat acccgcgtgt caggaggggc agcagcctcc gataccaggg gccttgtgtc 1260 cctctttagc cccgggtcgg ctcagaaaat ccagctcgta aacaccaacg gcagttggca 1320 catcaacagg actgccctga actgcaacga ctccctccaa acagggttct ttgccgcact 1380 attctacaaa cacaaattca actcgtctgg atgcccagag cgcttggcca gctgtcgctc 1440 catcgacaag ttcgctcagg ggtggggtcc cctcacttac actgagccta acagctcgga 1500 ccagaggccc tactgctggc actacgcgcc tcgaccgtgt ggtattgtac ccgcgtctca 1560 ggtgtgcggt ccagtgtatt gcttcacccc gagccctgtt gtggtgggga cgaccgatcg 1620 gtttggtgtc cccacgtata actggggggc gaacgactcg gatgtgctga ttctcaacaa 1680 cacgcggccg ccgcgaggca actggttcgg ctgtacatgg atgaatggca ctgggttcac 1740 caagacgtgt gggggccccc cgtgcaacat cgggggggcc ggcaacaaca ccttgacctg 1800 ccccactgac tgttttcgga agcaccccga ggccacctac gccagatgcg gttctgggcc 1860 ctggctgaca cctaggtgta tggttcatta cccatatagg ctctggcact acccctgcac 1920 tgtcaacttc accatcttca aggttaggat gtacgtgggg ggcgtggagc acaggttcga 1980 agccgcatgc aattggactc gaggagagcg ttgtgacttg gaggacaggg atagatcaga 2040 gcttagcccg ctgctgctgt ctacaacaga gtggcaggtg atcgagggca gacaccatca 2100 ccaccatcac taatagttaa ttaactgcag gcatgcaagc ttatcgatac cgtcgaccat 2160 catcatcatc atcattgagt ttgtagcctt agacatgact gttcctcagt tcaagttggg 2220 cacttacgag aagaccggtc ttgctagatt ctaatcaaga ggatgtcaga atgccatttg 2280 cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga 2340 ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag 2400 ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg 2460 tatttcccac tcctcttcag agtacagaag attaagtgag accttcgttt gtgcggatcc 2520 cccacacacc atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg 2580 actccgcgca tcgccgtacc acttcaaaac acccaagcac agcatactaa attttccctc 2640 tttcttcctc tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga 2700 ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt 2760 tcttgaaatt ttttttttta gtttttttct ctttcagtga cctccattga tatttaagtt 2820 aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 2880 ttttacttct tgttcattag aaagaaagca tagcaatcta atctaagggg cggtgttgac 2940 aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 3000 atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 3060 gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 3120 gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 3180 aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 3240 gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 3300 ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 3360 gaggagcagg actgacacgt ccgacggcgg cccacgggtc ccaggcctcg gagatccgtc 3420 ccccttttcc tttgtcgata tcatgtaatt agttatgtca cgcttacatt cacgccctcc 3480 ccccacatcc gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat 3540 ttattttttt atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt 3600 ttttctgtac agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt 3660 tttgggacgc tcgaaggctt taatttgcaa gctggagacc aacatgtgag caaaaggcca 3720 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3780 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3840 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3900 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg 3960 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 4020 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 4080 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 4140 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 4200 aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 4260 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 4320 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 4380 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat c 4431 <210> 62 <211> 2880 <212> DNA <213> Artificial sequence <220> <223> vector pUC18MFa <400> 62 gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60 cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180 tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttac 240 cccttcttct ttagcagcaa tgctggcaat agtagtattt ataaacaata acccgttatt 300 tgtgctgttg gaaaatggca aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc 360 gatgacagct tcagccggaa tttgtgccgt ttcatcttct gttgtagtgt tgactggagc 420 agctaatgcg gaggatgctg cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa 480 ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 540 tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 600 tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct 660 ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc 720 tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg 780 ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat 840 gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg 900 cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt 960 tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 1020 tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 1080 gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 1140 ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 1200 agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 1260 agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 1320 tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 1380 tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 1440 cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1500 aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1560 tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1620 tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1680 ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1740 ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1800 cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1860 gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1920 actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1980 aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 2040 caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 2100 aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 2160 accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 2220 aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 2280 ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 2340 agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 2400 accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 2460 gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2520 tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2580 cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2640 cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2700 cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2760 ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2820 taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2880 <210> 63 <211> 6 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 63 His His His His His His 1 5 <210> 64 <211> 6 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 64 Glu Glu Gly Glu Pro Lys 1 5 <210> 65 <211> 6 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 65 Glu Glu Ala Glu Pro Lys 1 5 <210> 66 <211> 5 <212> PRT <213> Artificial sequence <220> <223> processing site <220> <221> MISC_FEATURE <222> (5)..(5) <223> X is any amino acid <400> 66 Ile Glu Gly Arg Xaa 1 5 <210> 67 <211> 5 <212> PRT <213> Artificial sequence <220> <223> processing site <220> <221> MISC_FEATURE <222> (5)..(5) <223> X is any amino acid <400> 67 Ile Asp Gly Arg Xaa 1 5 <210> 68 <211> 5 <212> PRT <213> Artificial sequence <220> <223> processing site <220> <221> MISC_FEATURE <222> (5)..(5) <223> X is any amino acid <400> 68 Ala Glu Gly Arg Xaa 1 5 <210> 69 <211> 5 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 69 Val Ile Glu Gly Arg 1 5 <210> 70 <211> 4 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 70 Ile Glu Gly Arg 1 <210> 71 <211> 4 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 71 Ile Asp Gly Arg 1 <210> 72 <211> 4 <212> PRT <213> Artificial sequence <220> <223> adaptor peptide <400> 72 Ala Glu Gly Arg 1 <210> 73 <211> 4 <212> PRT <213> Artificial sequence <220> <223> HCV E1 <400> 73 Asn Asn Ser Ser 1 <210> 74 <211> 8 <212> PRT <213> Artificial sequence <220> <223> FLAG epitope <400> 74 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 75 <211> 12 <212> PRT <213> Artificial sequence <220> <223> Protein C epitope <400> 75 Glu Asp Gln Val Asp Pro Arg Leu Ile Asp Gly Lys 1 5 10 <210> 76 <211> 11 <212> PRT <213> Artificial sequence <220> <223> VSV epitope <400> 76 Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys 1 5 10 <210> 77 <211> 9 <212> PRT <213> Artificial sequence <220> <223> streptag <400> 77 Ala Trp Arg His Pro Gln Phe Gly Gly 1 5 <210> 78 <211> 12 <212> PRT <213> Artificial sequence <220> <223> Tag100 epitope <400> 78 Glu Glu Thr Ala Arg Phe Gln Pro Gly Tyr Arg Ser 1 5 10 <210> 79 <211> 10 <212> PRT <213> Artificial sequence <220> <223> c-myc epitope <400> 79 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 80 <211> 11 <212> PRT <213> Artificial sequence <220> <223> HA epitope <400> 80 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu 1 5 10 <210> 81 <211> 9 <212> PRT <213> Artificial sequence <220> <223> HA epitope <400> 81 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 82 <211> 12 <212> PRT <213> Artificial sequence <220> <223> HA epitope <400> 82 Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu 1 5 10 <210> 83 <211> 6 <212> PRT <213> Artificial sequence <220> <223> thrombin cleavage site <400> 83 Leu Val Pro Arg Gly Ser 1 5 <210> 84 <211> 4 <212> PRT <213> Artificial sequence <220> <223> collagenase recognition site <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa is any amino acid but most frequently a neutral amino acid <400> 84 Pro Xaa Gly Pro 1 <210> 85 <211> 192 <212> PRT <213> hepatitis C virus <400> 85 Tyr Gln Val Arg Asn Ser Ser Gly Leu Tyr His Val Thr Asn Asp Cys 1 5 10 15 Pro Asn Ser Ser Val Val Tyr Glu Ala Ala Asp Ala Ile Leu His Thr 20 25 30 Pro Gly Cys Val Pro Cys Val Arg Glu Gly Asn Ala Ser Arg Cys Trp 35 40 45 Val Ala Val Thr Pro Thr Val Ala Thr Arg Asp Gly Lys Leu Pro Thr 50 55 60 Thr Gln Leu Arg Arg His Ile Asp Leu Leu Val Gly Ser Ala Thr Leu 65 70 75 80 Cys Ser Ala Leu Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val 85 90 95 Gly Gln Leu Phe Thr Phe Ser Pro Arg His His Trp Thr Thr Gln Asp 100 105 110 Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala 115 120 125 Trp Asp Met Met Met Asn Trp Ser Pro Thr Ala Ala Leu Val Val Ala 130 135 140 Gln Leu Leu Arg Ile Pro Gln Ala Ile Met Asp Met Ile Ala Gly Ala 145 150 155 160 His Trp Gly Val Leu Ala Gly Ile Ala Tyr Phe Ser Met Val Gly Asn 165 170 175 Trp Ala Glu Val Leu Val Val Leu Leu Leu Phe Ala Gly Val Asp Ala 180 185 190 <210> 86 <211> 209 <212> PRT <213> hepatitis C virus <400> 86 Met Leu Gly Lys Leu Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg 20 25 30 Ala Leu Ala His Gly Ala Arg Val Leu Glu Asp Gly Val Ile Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Tyr Gln Val Arg Asn Ser 65 70 75 80 Ser Gly Leu Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Val Val 85 90 95 Tyr Glu Ala Ala Asp Ala Ile Leu His Thr Pro Gly Cys Val Pro Cys 100 105 110 Val Arg Glu Gly Asn Ala Ser Arg Cys Trp Val Ala Val Thr Pro Thr 115 120 125 Val Ala Thr Arg Asp Gly Lys Leu Pro Thr Thr Gln Leu Arg Arg His 130 135 140 Ile Asp Leu Leu Val Gly Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val 145 150 155 160 Gly Asp Leu Cys Gly Ser Val Phe Leu Val Gly Gln Leu Phe Thr Phe 165 170 175 Ser Pro Arg His His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr 180 185 190 Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 87 <211> 192 <212> PRT <213> hepatitis C virus <400> 87 Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys 1 5 10 15 Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr 20 25 30 Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp 35 40 45 Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr 50 55 60 Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe 65 70 75 80 Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val 85 90 95 Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp 100 105 110 Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala 115 120 125 Trp Asp Met Met Met Asn Trp Ser Pro Thr Thr Ala Leu Val Val Ser 130 135 140 Gln Leu Leu Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala 145 150 155 160 His Trp Gly Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn 165 170 175 Trp Ala Lys Val Leu Val Val Met Leu Leu Phe Ala Gly Val Asp Gly 180 185 190 <210> 88 <211> 209 <212> PRT <213> hepatitis C virus <400> 88 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Tyr Glu Val Arg Asn Val 65 70 75 80 Ser Gly Met Tyr His Val Thr Asn Asp Cys Ser Asn Ser Ser Ile Val 85 90 95 Tyr Glu Ala Ala Asp Met Ile Met His Thr Pro Gly Cys Val Pro Cys 100 105 110 Val Arg Glu Asn Asn Ser Ser Arg Cys Trp Val Ala Leu Thr Pro Thr 115 120 125 Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr Thr Ile Arg Arg His 130 135 140 Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val 145 150 155 160 Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser Gln Leu Phe Thr Ile 165 170 175 Ser Pro Arg Arg His Glu Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr 180 185 190 Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 89 <211> 209 <212> PRT <213> hepatitis C virus <400> 89 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Ile Thr Thr Pro Val Ser Ala Val Glu Val Lys Asn Asn 65 70 75 80 Ser Asn Ser Tyr Met Ala Thr Asn Asp Cys Ser Asn Ser Ser Ile Ile 85 90 95 Trp Gln Leu Glu Gly Ala Val Leu His Thr Pro Gly Cys Val Pro Cys 100 105 110 Glu Leu Ala Asp Asn Thr Ser Arg Cys Trp Val Pro Val Thr Pro Asn 115 120 125 Met Ala Ile Arg Gln Pro Gly Glu Leu Thr Lys Gly Leu Arg Ala His 130 135 140 Val Asp Val Ile Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val 145 150 155 160 Gly Asp Val Cys Gly Ala Leu Met Ile Ala Ala Gln Val Val Val Val 165 170 175 Ser Pro Gln His His His Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr 180 185 190 Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 90 <211> 209 <212> PRT <213> hepatitis C virus <400> 90 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Val Thr Ala Pro Val Ser Ala Val Glu Val Lys Asn Thr 65 70 75 80 Ser Gln Ala Tyr Met Ala Thr Asn Asp Cys Ser Asn Asn Ser Ile Val 85 90 95 Trp Gln Leu Glu Asp Ala Val Leu His Val Pro Gly Cys Val Pro Cys 100 105 110 Glu Asn Ser Ser Gly Arg Phe His Cys Trp Ile Pro Ile Ser Pro Asn 115 120 125 Ile Ala Val Ser Lys Pro Gly Ala Leu Thr Lys Gly Leu Arg Ala Arg 130 135 140 Ile Asp Ala Val Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val 145 150 155 160 Gly Asp Val Cys Gly Ala Val Met Ile Ala Ala Gln Ala Phe Ile Val 165 170 175 Ala Pro Lys Arg His Tyr Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr 180 185 190 Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 91 <211> 209 <212> PRT <213> hepatitis C virus <400> 91 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Phe Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Phe Ser Cys Leu Ile His Pro Ala Ala Ser Leu Glu Trp Arg Asn Thr 65 70 75 80 Ser Gly Leu Tyr Val Leu Thr Asn Asp Cys Ser Asn Ser Ser Ile Val 85 90 95 Tyr Glu Ala Asp Asp Val Ile Leu His Thr Pro Gly Cys Ile Pro Cys 100 105 110 Val Gln Asp Gly Asn Thr Ser Thr Cys Trp Thr Pro Val Thr Pro Thr 115 120 125 Val Ala Val Lys Tyr Val Gly Ala Thr Thr Ala Ser Ile Arg Ser His 130 135 140 Val Asp Leu Leu Val Gly Ala Ala Thr Met Cys Ser Ala Leu Tyr Val 145 150 155 160 Gly Asp Met Cys Gly Ala Val Phe Leu Val Gly Gln Ala Phe Thr Phe 165 170 175 Arg Pro Arg Arg His Gln Thr Val Gln Thr Cys Asn Cys Ser Leu Tyr 180 185 190 Pro Gly His Leu Ser Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 92 <211> 209 <212> PRT <213> hepatitis C virus <400> 92 Met Ser Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Val Pro Thr Ser Ala Val Asn Tyr Arg Asn Ala 65 70 75 80 Ser Gly Val Tyr His Ile Thr Asn Asp Cys Pro Asn Ser Ser Ile Val 85 90 95 Tyr Glu Thr Glu His His Ile Leu His Leu Pro Gly Cys Leu Pro Cys 100 105 110 Val Arg Val Gly Asn Gln Ser Arg Cys Trp Val Ala Leu Thr Pro Thr 115 120 125 Val Ala Ala Pro Tyr Ile Gly Ala Pro Leu Glu Ser Leu Arg Ser His 130 135 140 Val Asp Leu Met Val Gly Ala Ala Thr Ala Cys Ser Ala Leu Tyr Ile 145 150 155 160 Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly Gln Met Phe Ser Phe 165 170 175 Gln Pro Arg Arg His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr 180 185 190 Ala Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 93 <211> 209 <212> PRT <213> hepatitis C virus <400> 93 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Leu Val Gly Gly Pro Ile Gly Gly Val Ala Arg 20 25 30 Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Ile Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val Pro Tyr Arg Asn Ala 65 70 75 80 Ser Gly Ile Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Ile Val 85 90 95 Tyr Glu Ala Asp Asn Leu Ile Leu His Ala Pro Gly Cys Val Pro Cys 100 105 110 Val Met Thr Gly Asn Val Ser Arg Cys Trp Val Gln Ile Thr Pro Thr 115 120 125 Leu Ser Ala Pro Ser Leu Gly Ala Val Thr Ala Pro Leu Arg Arg Ala 130 135 140 Val Asp Tyr Leu Ala Gly Gly Ala Ala Leu Cys Ser Ala Leu Tyr Val 145 150 155 160 Gly Asp Ala Cys Gly Ala Leu Phe Leu Val Gly Gln Met Phe Thr Tyr 165 170 175 Arg Pro Arg Gln His Ala Thr Val Gln Asn Cys Asn Cys Ser Ile Tyr 180 185 190 Ser Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 94 <211> 209 <212> PRT <213> hepatitis C virus <400> 94 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Val Ala Ala 20 25 30 Ala Phe Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Leu Thr Tyr Gly Asn Ser 65 70 75 80 Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val 85 90 95 Leu Glu Ala Asp Ala Met Ile Leu His Leu Pro Gly Cys Leu Pro Cys 100 105 110 Val Arg Val Asn Asn Gln Ser Thr Cys Trp His Ala Val Ser Pro Thr 115 120 125 Leu Ala Ile Pro Asn Ala Ser Thr Pro Ala Thr Gly Phe Arg Arg His 130 135 140 Val Asp Leu Leu Ala Gly Ala Ala Val Val Cys Ser Ser Leu Tyr Ile 145 150 155 160 Gly Asp Leu Cys Gly Ser Leu Phe Leu Ala Gly Gln Leu Phe Thr Phe 165 170 175 Gln Pro Arg Arg His Trp Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr 180 185 190 Thr Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 95 <211> 209 <212> PRT <213> hepatitis C virus <400> 95 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Ile Ala Ala 20 25 30 Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Val His Tyr Ala Asn Lys 65 70 75 80 Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val 85 90 95 Tyr Glu Ala Pro Ala Val Ile Met His Leu Pro Gly Cys Val Pro Cys 100 105 110 Val Lys Val Gly Asn Gln Ser Thr Cys Trp Leu Pro Ala Ser Pro Thr 115 120 125 Leu Ala Val Pro Asn Ala Ser Thr Pro Leu Thr Arg Phe Arg Lys His 130 135 140 Val Asp Leu Met Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val 145 150 155 160 Gly Asp Ile Cys Gly Gly Leu Phe Leu Leu Gly Gln Val Val Thr Ile 165 170 175 Arg Pro Arg Leu His Gln Thr Val Gln Glu Cys Asn Cys Ser Ile Tyr 180 185 190 Thr Gly Lys Ile Thr Gly His Arg Met Ala Trp Asp Ile Met Met Asn 195 200 205 Trp <210> 96 <211> 209 <212> PRT <213> hepatitis C virus <400> 96 Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Leu Ala Asp Leu 1 5 10 15 Met Gly Tyr Ile Pro Val Leu Gly Gly Pro Leu Gly Gly Val Ala Ala 20 25 30 Ala Leu Ala His Gly Val Arg Ala Ile Glu Asp Gly Val Asn Tyr Ala 35 40 45 Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Leu Leu Leu Ala Leu 50 55 60 Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Ile Gln Val Lys Asn Ala 65 70 75 80 Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Ser Asn Asn Ser Ile Val 85 90 95 Phe Glu Ala Glu Thr Met Ile Leu His Leu Pro Gly Cys Val Pro Cys 100 105 110 Ile Lys Ala Gly Asn Glu Ser Arg Cys Trp Leu Pro Val Ser Pro Thr 115 120 125 Leu Ala Val Pro Asn Ser Ser Val Pro Ile His Gly Phe Arg Arg His 130 135 140 Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Ile 145 150 155 160 Gly Asp Leu Cys Gly Ser Ile Phe Leu Val Gly Gln Leu Phe Thr Phe 165 170 175 Arg Pro Lys Tyr His Gln Val Thr Gln Asp Cys Asn Cys Ser Ile Tyr 180 185 190 Ala Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 195 200 205 Trp <210> 97 <211> 363 <212> PRT <213> hepatitis C virus <400> 97 Glu Thr His Val Thr Gly Gly Asn Ala Gly Arg Thr Thr Ala Gly Pro 1 5 10 15 Val Gly Leu Leu Thr Pro Gly Ala Lys Gln Asn Ile Gln Leu Ile Asn 20 25 30 Thr Asn Gly Ser Trp His Ile Asn Ser Thr Ala Leu Asn Cys Asn Glu 35 40 45 Ser Leu Asn Thr Gly Trp Leu Ala Gly Leu Phe Tyr Gln His Lys Phe 50 55 60 Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Arg Leu Thr 65 70 75 80 Asp Phe Ala Gln Gly Trp Gly Pro Ile Ser Tyr Ala Asn Gly Ser Gly 85 90 95 Leu Asp Glu Arg Pro Tyr Cys Trp His Tyr Pro Pro Arg Pro Cys Gly 100 105 110 Ile Val Pro Ala Lys Ser Val Cys Gly Pro Val Tyr Cys Phe Thr Pro 115 120 125 Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Ala Pro Thr Tyr 130 135 140 Ser Trp Gly Ala Asn Asp Thr Asp Val Phe Val Leu Asn Asn Thr Arg 145 150 155 160 Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly 165 170 175 Phe Thr Lys Val Cys Gly Ala Pro Pro Cys Val Ile Gly Gly Val Gly 180 185 190 Asn Asn Thr Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu 195 200 205 Ala Thr Tyr Ser Arg Cys Gly Ser Gly Pro Trp Ile Thr Pro Arg Cys 210 215 220 Met Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Ile Asn 225 230 235 240 Tyr Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg 245 250 255 Leu Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu 260 265 270 Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Gln 275 280 285 Trp Gln Val Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr 290 295 300 Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr 305 310 315 320 Gly Val Gly Ser Ser Ile Ala Ser Trp Ala Ile Lys Trp Glu Tyr Val 325 330 335 Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Glu Phe 340 345 350 Trp Met Met Leu Leu Ile Ser Gln Ala Glu Ala 355 360 <210> 98 <211> 363 <212> PRT <213> hepatitis C virus <400> 98 His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu 1 5 10 15 Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn 20 25 30 Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp 35 40 45 Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe 50 55 60 Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp 65 70 75 80 Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser 85 90 95 Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly 100 105 110 Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro 115 120 125 Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr 130 135 140 Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg 145 150 155 160 Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly 165 170 175 Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly 180 185 190 Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu 195 200 205 Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys 210 215 220 Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn 225 230 235 240 Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg 245 250 255 Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu 260 265 270 Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu 275 280 285 Trp Gln Ile Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr 290 295 300 Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr 305 310 315 320 Gly Val Gly Ser Ala Val Val Ser Leu Val Ile Lys Trp Glu Tyr Val 325 330 335 Leu Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Ile Cys Ala Cys Leu 340 345 350 Trp Met Met Leu Leu Ile Ala Gln Ala Glu Ala 355 360

Claims

한 개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV(C형 간염바이러스) E1 또는 E2 단백질에 있어서:

상기 단백질이 메틸로트로픽(methylotrophic) 효모 세포에서의 발현산물이고 또 (포유동물세포에서 발현된) N-글리코실화 부위의 50~80% 까지가 코어-글리코실화되어 있으며;

상기 효모 세포가 한세눌라(Hansenulla) 세포인 것을 특징으로 하는 분리된 HCV(C형 간염바이러스) E1 또는 E2 단백질.
제 1항에 있어서, 상기 코어-글리코실화 부위의 70% 이상이 8 내지 10개 만노오스를 함유하는 올리고만노오스에 의해 글리코실화되는 분리된 HCV E1 또는 E2 단백질.
제2항에 있어서, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율이 0.45 이하인 분리된 HCV E1 또는 E2 단백질.
제3항에 있어서, 상기 올리고만노오스는 10% 미만의 말단 α1,3 만노오스를 함유하는 분리된 HCV E1 또는 E2 단백질.
삭제
삭제
제4항에 있어서, HCV E1 또는 E2 단백질에 결합된 조류의 리소짐(lysozyme) 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유도되는 분리된 HCV E1 또는 E2 단백질.
제 7항에 있어서, 하기 구조식을 갖는 것을 특징으로 하는 단백질로부터 유도되는 분리된 HCV E1 또는 E2 단백질.

CL-[(Al)_a-(PS1)_b-(A2)_c]-HCVENV-[(A3)_d-(PS2)_e-(A4)_f]

식중에서,

CL은 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물이고,

A1, A2, A3 및 A4는 상이하거나 동일할 수 있는 어댑터(adptor) 펩티드이며,

PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,

HCVENV는 HCV E1 또는 E2 단백질이며,

a, b, c, d, e 및 f는 0 또는 1이고, 또

경우에 따라, A1나 A2는 PS1의 일부이고, A3나 A4는 PS2의 일부임.
제 8항에 있어서, 상기 조류의 리소짐 리더 펩티드 CL은 서열번호: 1에 정의된 아미노산 서열을 갖는 분리된 HCV E1 또는 E2 단백질.
제 8항에 있어서, A는 서열번호: 63-65, 70-72 및 74-82로부터 선택된 아미노산 서열을 갖고, PS는 서열번호: 66-68 및 83-84으로부터 선택된 아미노산 서열을 갖거나, 또는 PS는 Lys-Lys, Arg-Arg, Lys-Arg 및 Arg-Lys와 같은 이염기성 부위 또는 Lys와 같은 일염기성이며, 또 HCVENV는 서열번호: 85-98로부터 선택되는 분리된 HCV E1 또는 E2 단백질.
제10항에 있어서, 단량체, 동종이합체, 이종이합체, 동종올리고머 및 이종올리고머로 구성된 군으로부터 선택된 구조에 포함되는 분리된 HCV E1 또는 E2 단백질.
제10항에 있어서, 바이러스-유사 입자에 포함되는 분리된 HCV E1 또는 E2 단백질.
제12항에 있어서, 시스테인 티올 기가 화학적으로 수식된 분리된 HCV E1 또는 E2 단백질.
제13항에 있어서, 항원성인 분리된 HCV E1 또는 E2 단백질.
제13항에 있어서, 면역원성인 분리된 HCV E1 또는 E2 단백질.
제13항에 있어서, T-세포 항원결정부위를 포함하는 분리된 HCV E1 또는 E2 단백질.
제16항에 따른 분리된 HCV E1 또는 E2 단백질을 포함한 C형 간염치료용 조성물.
제 17항에 있어서, 약제학적으로 허용되는 담체를 더 포함하는 C형 간염치료용 조성물.
제 17항에 있어서, 약제학적으로 허용되는 담체를 더 포함하며 또 백신인 조성물.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 분리된 HCV E1 또는 E2 단백질을 생산하는 방법.
(i) 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을, HCV E1 또는 E2 단백질과 항-HCV 항체의 복합체화를 허용하는 조건하에서 항-HCV 항체를 포함할 것으로 추정되는 샘플과 접촉시키는 단계,

(ii) (i)에서 형성된 복합체를 검출하는 단계, 및

(iii) (ii)으로부터 상기 샘플에서 항-HCV 항체의 존재를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하는 방법.
제 21항에 있어서, 상기 단계(i)에서의 접촉은 경쟁 조건하에서 생기는 방법.
제 21항에 있어서, 상기 HCV E1 또는 E2 단백질이 고형 지지체에 부착되는 방법.
제1항 내지 제16항중 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트.
제 24항에 있어서, 상기 HCV E1 또는 E2 단백질이 고형 지지체에 부착되어 있는 진단 키트.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는 HCV 감염치료용 의약.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는 백신.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 경우에 따라 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV-특이적 면역반응을 유발하는 약제학적 조성물.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV-특이적 항체를 유발하기 위한 약제학적 조성물.
제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 T-세포 작용을 유발하기 위한 약제학적 조성물.
제30항에 있어서, 예방적 조성물인 약제학적 조성물.
제30항에 있어서, 치료적 조성물인 약제학적 조성물.
제30항에 있어서, 상기 포유동물이 인간인 약제학적 조성물.