KR20080068817A - 감염성 c형 간염 바이러스 입자 고산생계 - Google Patents

감염성 c형 간염 바이러스 입자 고산생계 Download PDF

Info

Publication number
KR20080068817A
KR20080068817A KR1020087009938A KR20087009938A KR20080068817A KR 20080068817 A KR20080068817 A KR 20080068817A KR 1020087009938 A KR1020087009938 A KR 1020087009938A KR 20087009938 A KR20087009938 A KR 20087009938A KR 20080068817 A KR20080068817 A KR 20080068817A
Authority
KR
South Korea
Prior art keywords
leu
ala
gly
val
thr
Prior art date
Application number
KR1020087009938A
Other languages
English (en)
Other versions
KR101355903B1 (ko
Inventor
준이치 타나베
사부로 소네
타카지 와키타
코지 이시이
료스케 스즈키
테츠로 스즈키
타츠오 미야무라
Original Assignee
국립감염증연구소장이 대표하는 일본국
도레이 가부시끼가이샤
도쿄 메트로폴리탄 오거니제이션 포 메디칼 리서치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국립감염증연구소장이 대표하는 일본국, 도레이 가부시끼가이샤, 도쿄 메트로폴리탄 오거니제이션 포 메디칼 리서치 filed Critical 국립감염증연구소장이 대표하는 일본국
Publication of KR20080068817A publication Critical patent/KR20080068817A/ko
Application granted granted Critical
Publication of KR101355903B1 publication Critical patent/KR101355903B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24241Use of virus, viral particle or viral elements as a vector
    • C12N2770/24243Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24251Methods of production or purification of viral material
    • C12N2770/24252Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법으로서, RNA 폴리메라아제 I 프로모터의 하류에, HCV의 5'비번역 영역 및 구조 단백질 및 임의로 비구조 단백질을 코드하는 DNA 서열과 HCV JFH1주 유래의 비구조 단백질 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA 단편을 더 포함하는 발현 벡터를 HCV의 증식을 허용하는 세포에 도입하는 공정을 포함하는 방법에 관한 것이다.
Figure P1020087009938
c형 간염 바이러스 입자

Description

감염성 C형 간염 바이러스 입자 고산생계{HIGH PRODUCTION SYSTEM FOR INFECTIOUS HEPATITIS C VIRUS PARTICLE}
본 발명은 감염성 인간 C형 간염 바이러스 입자의 고산생 방법에 관한 것이다.
인간 C형 간염 바이러스(HCV)는 지속적으로 감염시킴으로써 만성 간염을 야기하는 단일쇄의 RNA 바이러스이다. 현재, 세계적 규모로 확인되는 만성 간염의 주된 원인이 HCV 지속 감염이다. 실제로, 지속 감염자의 50%정도가 만성 간염을 발병하고, 그 중 약 20%의 환자가 10년∼20년을 경과해서 간경변으로 이행하고, 또한 그 일부는 간암이라고 하는 치사적인 병의 형태로 진전한다.
이렇게 중대한 질환의 치료 방법을 개발하기 위한 연구를 방해하고 있는 주된 원인은 HCV 증식에 효율적인 세포 배양계가 없는 것, HCV 감염에 적절한 소동물모델이 없는 것, 낮은 레벨의 바이러스 복제, 및 바이러스 게놈의 유전적인 불균일성에 의한다.
따라서, 세포 배양계에서의 HCV 게놈의 복제계의 개발은 바이러스의 복제, 바이러스와 세포의 상호 작용을 이해하고, HCV에 의해 야기되는 질환의 치료약의 평가계를 제공하는 것으로 이루어진다고 기대되고 있다.
최근에 들어, HCV 유래의 자율 복제 능력을 갖는 RNA로서, HCV 서브 게놈 RNA 레플리콘이 제작됨으로써(특허문헌 1, 특허문헌 2 및 비특허문헌 1∼3), 배양 세포를 사용하여 HCV의 복제 기구를 해석하는 것이 가능해졌다. 이들의 HCV 서브 게놈RNA 레플리콘은 HCV 게놈 RNA의 5'비번역 영역 중의 HCV IRES의 하류에 존재하는 구조 단백질을 네오마이신 내성 유전자 및 그 하류에 연결한 EMCV-IRES에 의하여 치환한 것이다. 이 RNA 레플리콘을 인간 간암 세포 Huh7에 도입해서 네오마이신 존재 하에서 배양함으로써, Huh7 세포내에서 RNA 레플리콘이 자율 복제하는 것이 증명되었다. 그러나, 이 실험계는 HCV 바이러스의 증식 복제 과정에 있어서의 바이러스 RNA 복제만 평가가능한 실험계이고, 바이러스 입자를 생산하지 않으므로, HCV 입자의 감염 세포내에서의 형성과 세포밖으로의 방출, 또한 새로운 세포로의 감염이라고 하는 과정을 평가할 수는 없다.
이 과제에 대하여, 배양 세포계로 바이러스 입자를 생산하는 방법이 보고되어 있다. RNA 레플리콘을 사용하지 않고, HCV 전체 게놈 RNA의 cDNA를 이용한 계이다.
Lim 등은 테트라사이클린 응답 프로모터의 하류에 유전자형 1b의 HCV-S1주의 게놈 RNA의 cDNA를 연결한 발현 벡터를 Huh7 세포에 도입해서 얻은 세포주를 테트라 사이클린으로 처리하고, HCV 입자의 생산을 시험했다. 그들은 그 배양 상청에는 1∼6×105 카피/ml의 HCV 입자의 존재를 확인했지만, 그 HCV 입자의 감염성은 낮다고 기재하고 있다(비특허문헌 4).
그러나, HCV cDNA를 CMV 등의 RNA 폴리메라아제 II형의 프로모터 제어하에서 발현시키면, 전사된 RNA의 5'말단에는 CAP 구조가 3' 말단에는 폴리 A쇄가 부가되기 때문에, 리보솜에서 단백질 합성의 주형으로서 이용되어버려, 전사된 RNA의 복제가 일어나지 않는다고 하는 문제도 있다.
이 문제를 해결하기 위해서, Heller 등은 HCV 게놈의 5'말단과 3'말단에 리보자임 서열을 연결하고, 세포내에서 RNA 폴리메라아제 II로 전사시킨 후, 리보자임으로 절단시킴으로써, 캡과 폴리 A가 부가되어 있지 않은 HCV RNA를 세포내에서 합성할 수 있도록 컨스트럭트를 제작했다(비특허문헌 5). 또한, 리보자임으로 5' 말단에 캡을 부가시키지 않는 방법은 헤어핀형 RNA를 세포내에서 합성하는 방법에 이용되고 있다(비특허문헌 6). 실제로, 2개의 리보자임으로 끼워진 HCV 컨스트럭트를 지닌 발현 벡터를 Huh 7로 발현시킴으로써, 1 x 107 카피/ml의 HCV 입자가 생산되는 것이 나타내어져 있다. 단, 이 입자에 감염성이 있을지에 관해서는 검토되어 있지 않다.
또한, 최근, HCV 전체 게놈 RNA로부터 세포 배양계로 감염 능력을 갖는 HCV 입자를 생산할 수 있는 것이 나타나 있다(특허문헌 3, 비특허문헌 7, 비특허문헌 8). 이 계에서의 HCV 입자의 생산량은 약 1×107카피/ml이다. 또한, HCV의 유전자형 1b의 con1주의 비구조 단백질 영역을 유전자형 2a의 바이러스주의 유전자로 치환한 키메라 바이러스 RNA에 대해서, 세포 배양계로 감염 능력을 갖는 HCV입자를 생산할 수 있는 것이 나타내어져 있다(비특허문헌 9). 이 계에서의 HCV 입자 생산량의 구 체적 수치 에 관해서는 개시되어 있지 않다.
이상의 결과로부터, HCV 입자의 감염 세포내에서의 형성과 세포밖으로의 방출, 또한 새로운 세포로의 감염이라고 하는 과정을 평가하는 실험계의 제작이 가능해 졌다.
그러나, Lim 등의 계에서는 생산성이 낮고, Heller들의 계에서는 감염성이 불분명하고, HCV 전체 게놈 RNA를 사용한 계에서는, RNA의 복제시에 변이가 일어날 가능성이 생각되어진다. HCV 게놈에 변이가 일어나면, 복제가 일어나지 않게 될 경우가 있는 것이 알려져 있다. 실제로 HCV 비구조 단백질인 NS5B 단백질 중의 GDD 아미노산 서열이 GND로 변이하면 복제가 일어나지 않는 것이 나타내어져 있다. 한편, HCV 입자의 생산량에 대해서는, 양자 모두 약 1×107복사/ml이고, 또한 생산량을 상승시키는 것이 기대된다.
HCV 바이러스 입자의 생산량을 상승시키는 방법으로서, 레플리콘 생산량의 높은 세포의 제작이 검토되었다. HCV 바이러스의 복제에는 인간 간장 유래의 Huh7세포가 사용되어 있지만, 이 주로부터 파생하는 세포가 몇몇이 클론화되었다. 그 중에서 Huh7.5라고 명명되어진 세포는 친주(親侏)의 약 3배의 HCV RNA 레플리콘을 복제하는 것이 나타내어졌다(비특허문헌 10).
이상의 상황에 있어서, HCV 전체 게놈 RNA의 cDNA을 이용하여 감염성 HCV 입자의 고생산계를 개발하는 것이 중요한 것이 상기된다.
RNA 바이러스의 게놈 RNA에 대응하는 cDNA를 이용하여 바이러스 입자를 생산 시키는 계로서는, 인풀루엔자 바이러스(마이너스 쇄의 RNA 바이러스)의 동물 세포계에서의 생산에 사용되고 있는 RNA 폴리메라아제 I 프로모터와 터미네이터를 사용한 계(비특허문헌 11)도 알려져 있다. 그러나, 이러한 RNA 폴리메라아제 I 프로모터와 터미네이터를 사용한 인풀루엔자 바이러스 입자의 생산계는 종래의 인플루엔자 바이러스 입자 생산계보다도 생산량에 있어서 뛰어나고 있다고는 말할 수 없다.또한, 비특허문헌 11에는 플러스 쇄의 RNA 바이러스인 HCV의 생산계에 관해서는 기재도 시사도 없다.
특허문헌 1: 일본특허공개 2001-17187호 공보
특허문헌 2: WO2004/104198A1
특허문헌 3: WO05080575A1
비특허문헌 1: Blight et al., Science, 290(2000) p1972-74
비특허문헌 2: Friebe et al., J. Virol., 75(2001) p12047-57
비특허문헌 3: Kato, T. et al., Gastroenterology, 125(2003) p1808-17
비특허문헌 4: Lim SP. et al., Virology, 303(2002) p79-p99
비특허문헌 5: Heller, T. et al. Proc. Natl. Acad. Sci. USA., 102(2005) p2579-83
비특허문헌 6: Shinagawa, T. & Ishii, S.,Genes Dev., 17(2003) p1340-45
비특허문헌 7: Wakita et al. Nature Med. 11(2005) p791-96
비특허문헌 8: Lindenbach BD. et al., Science. 309(2005) p623-26
비특허문헌 9: Pietschmann T. et al., 11th International Symposium on Hepatitis C Virus and Related Viruses,(2004)
비특허문헌 10: Blight, KJ. et al., J. Virol., 76(2002) p13001-14
비특허문헌 11: Neumann, G. et al., Virology, 202(1994) p477-479
본 발명의 목적은 재조합 DNA로부터 감염성 C형 간염 바이러스 입자를 배양 세포계에서 고생산하기 위한 방법을 제공하는 것에 있다
본 발명자들은 HCV 게놈 cDNA로부터 복제 능력이 있는 HCV 게놈 RNA를 세포내에서 합성하는 방법을 구축하기 위해서, 유전자형이 다른 HCV 게놈, 이것을 발현시키기 위한 프로모터/터미네이터를 검토하여 HCV 게놈 RNA가 복제되는 신규한 조합을 발견하였다. 이어서, 상기 HCV 게놈 RNA를 합성하는 세포를 배양하고, 지금까지 보고되어 있는 것 보다도 감염성 HCV 입자가 고생산되어 있는 것을 확인하고, 본 발명을 완성시키는데 이르렀다.
즉, 본 발명은 이하의 (a)부터 (c)에 관한 것이다.
(a) 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법으로서, 리보솜 RNA 유전자 유래의 RNA 폴리메라아제 I가 인식하는 프로모터의 하류에 JFH1주 유래의 HCV 게놈 cDNA를 포함하고, 그 하류에 리보솜 RNA 유전자 유래의 RNA 폴리메라아제 I가 인식하는 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터를, HCV의 증식을 허용하는 세포에 도입하는 공정을 포함한 감염성 HCV 입자를 산생하는 방법,
(b) HCV의 증식을 허용하는 세포가 Huh7, RCYM1RC, 5-15RC, HepG2 및 그들의 세포로부터 파생된 주화 세포로 이루어지는 군에서 선택되는 (a)의 감염성 HCV 입자를 생산하는 방법,
(c) 감염성 C형 간염 바이러스(HCV) 입자를 생산하기 위한 벡터로서, 리보솜RNA 유전자 유래의 RNA 폴리메라아제 I가 인식하는 프로모터의 하류에 JFH1주 유래의 HCV 게놈 cDNA를 포함하는 그 하류에 리보솜 RNA유전자 유래의 RNA 폴리메라아제 I가 인식하는 터미네이터를 갖는 DNA를 포함하는 발현 벡터.
또한 본 발명은 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법으로서, RNA 폴리메라아제 I 프로모터의 하류에, HCV의 5'비번역 영역 및 구조 단백질 및 임의로 비구조 단백질을 코드하는 DNA 서열과, HCV JFH1주 유래의 비구조 단백질 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터를, HCV의 증식을 허용하는 세포에 도입하는 공정을 포함하는 방법에도 관한 것이다.
보다 구체적으로는, 본 발명은 이하의 (1)∼(4)의 방법에 관한 것이다.
(1) 이하의 i) 또는 ii)의 발현 벡터를 Huh7, RCYM1RC, 5-15RC, HepG2 및 그들의 세포로부터 파생된 주화 세포로 이루어지는 군에서 선택되는 세포에 도입하는 공정을 포함한 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법:
i) RNA 폴리메라아제 I 프로모터의 하류에, HCV주 유래의 5'비번역 영역, Core단백질, E1단백질, E2단백질, p7단백질, NS2단백질을 코드하는 DNA 서열과, HCV JFH1주 유래의 NS3, NS4A, NS4B, NS5A 및 NS5B단백질 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터, 또는
ii) RNA 폴리메라아제 I 프로모터의 하류에, HCV주 유래의 5'비번역 영역, Core단백질, E1단백질, E2단백질, p7단백질을 코드하는 DNA 서열과, HCV JFH1주 유래의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B단백질 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터.
(2) 상기 HCV주가 유전자형 1 또는 유전자형 2의 HCV주인 상기(1)의 방법.
(3) 유전자형 1의 HCV주가 H77c주, 1주, H주, HC-J1주, J1주, con1주, TH주, J주, JT주, BK주로 이루어지는 군에서 선택되는 것인 상기(2)의 방법.
(4) 유전자형 2의 HCV주가 J6CF주, JFH1주, JCH1주, HC-J8주로 이루어지는 군에서 선택되는 것인 상기 (2)의 방법.
(발명의 효과)
본 발명에 의하면, 재조합 DNA로부터 감염성 C형 간염 바이러스 입자를 배양 세포계로 생산하기 위한 방법에 있어서, 종래의 방법에 대하여, 감염성을 갖는 HCV입자를 약 60배의 고밀도로 고생산할 수 있다.
도 1a는 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터의 구축도를 나타낸다.
도 1b는 pHH H77c, pHH JFH1, pHH JFH1/GND의 맵을 나타낸다.
도 1c는 pHH H77c(C-p7)/JFH1, pHH J6(C-p7)/JFH1, pHH J1(C-p7)/JFH1 및 pHH J1(C-NS2)/JFH1의 맵을 나타낸다.
도 2는 RNA 폴리메라아제 I 프로모터/터미네이터계의 HCV 발현 벡터를 도입한 세포에 있어서, HCV RNA가 전사되어 있는 것을 확인한 실험 결과를 나타내는 사진이다. 레인 1, 3은 pHH JFH1을 각각 Huh7 및 HepG2에 도입했을 때, 레인 2, 4는 pHH JFH1/GND를 각각 Huh7 및 HepG2에 도입했을 때의 결과이다.
도 3은 폴리메라아제 I 프로모터/터미네이터계의 발현 벡터로 전사된 HCV RNA의 5'말단의 서열을 나타내고 있다. PHH JFH1 및 pHH JFH1/GND를 도입한 세포로 전사되는 HCV RNA의 5'말단은 JFH1 게놈 RNA의 서열과 동일했다.
도 4는 RNA 폴리메라아제 I 프로모터/터미네이터계의 HCV 발현 벡터를 도입한 세포에 있어서, HCV 단백질이 번역되어 있는지에 대해서 확인한 실험 결과를 나타내는 사진이다. pHH JFH1을 도입한 세포에서는 코어 단백질 및 NS5A 단백질이 번역되어 있는 것이 나타나 있다. pHH H77c 및 pHH JFH1/GND를 도입한 세포에서는 HCV단백질은 번역되어 있지 않다.
도 5는 pHH JFH1 및 pHH JFH1/GND를 GFP 발현 벡터와 함께, Huh7, RCYM1RC, 5-15RC, HepG2 및 293T세포에 도입한 후, 그들의 세포에서의 HCV 단백질의 발현과 벡터의 도입 효율을 GFP의 발현에 의하여 나타내는 사진이다. pHH JFH1은 293T 이외의 세포로 코어 단백질을 발현시켰다. 한편 pHH JFH1/GND는 어느 쪽의 세포로도 코어 단백질을 발현시키지 않았다.
도 6a는 pHH JFH1을 도입한 HepG2 세포 중의 코어 단백질을 나타내는 사진이다. 도 6b는 pHH JFH1을 도입한 HepG2 세포 배양액을 수크로오스 밀도 원심으로 분획한 시료의 코어 단백질량을 나타낸다. pHH JFH1 배양 상청(▲)의 코어 단백질의 비중이 1.15g/ml의 분획으로 발견되어 코어 단백질이 바이러스 입자로서 분비되어지는 것이 나타나 있다. 한편 코어, E1, E2, p7을 발현시킨 세포의 배양 상청(X)은 브로드하게 된다.
도 7은 pHH JFH1을 도입한 HepG2 세포 배양액을 NP40 처리한 경우, 비처리와 비교하여, 코어 단백질의 피크가 변동하는 것을 나타낸다. NP40 비처리(◆)와 비교하여, NP40으로 처리하면 (■)코어 단백질의 피크는 비중 1.20g/ml로 시프트했다. 비중이 가벼운 표면막이 NP40에 의해 바이러스 입자로부터 박리된 것을 나타내고 있다.
도 8은 한외 여과막으로 농축한 pHH JFH1을 도입한 HepG2 세포 배양액(A) 또는 Huh7 세포 배양액(B)을 Huh7.5.1에 접종하고, 4일 후에 항 NS5A항체로 염색한 결과를 나타내는 사진이다. 항 NS5A항체 양성 세포(감염 세포)가 검출되는 것을 나타낸다.
도 9는 pHH JFH1에 SV40 프로모터 제어 하에 Zeocin 내성 유전자를 발현하는 카세트가 삽입된 벡터의 맵을 나타낸다.
도 10은 삽입 단편 J6(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 10a는 그 가장 5'말단측의 서열을 나타낸다.
도 10은 삽입 단편 J6(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 10b는 도 10a의 서열의 3'측에 연속하는 서열을 나타낸다.
도 10은 삽입 단편 J6(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 10c는 도 10b의 서열의 3'측에 연속하는 서열을 나타낸다.
도 10은 삽입 단편 J6(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 10d는 도 10c의 서열의 3'측에 연속하는 가장 3'말단측의 서열을 나타낸다.
도 11은 삽입 단편 H77c(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 11a는 그 가장 5'말단측의 서열을 나타낸다.
도 11은 삽입 단편 H77c(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 11b는 도 11a의 서열의 3'측에 연속하는 서열을 나타낸다.
도 11은 삽입 단편 H77c(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 11c는 도 11b의 서열의 3'측에 연속하는 서열을 나타낸다.
도 11은 삽입 단편 H77c(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 11d는 도 11c의 서열의 3'측에 연속하는 가장 3'말단측의 서열을 나타낸다.
도 12는 삽입 단편 J1(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 12a는 그 가장 5'말단측의 서열을 나타낸다.
도 12는 삽입 단편 J1(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 12b는 도 12a의 서열의 3'측에 연속하는 서열을 나타낸다.
도 12은 삽입 단편 J1(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 12c는 도 12b의 서열의 3'측에 연속하는 서열을 나타낸다.
도 12은 삽입 단편 J1(C-p7)JFH1의 DNA 서열을 나타내는 도이고, 도 12d는 도 12c의 서열의 3'측에 연속하는 가장 3'말단측의 서열을 나타낸다.
도 13은 삽입 단편 J1(C-NS2)JFH1의 DNA 서열을 나타내는 도이고, 도 13a는 그 가장 5'말단측의 서열을 나타낸다.
도 13은 삽입 단편 J1(C-NS2)JFH1의 DNA 서열을 나타내는 도이고, 도 13b는 도 13a의 서열의 3'측에 연속하는 서열을 나타낸다.
도 13은 삽입 단편 J1(C-NS2)JFH1의 DNA 서열을 나타내는 도이고, 도 13c는 도 13b의 서열의 3'측에 연속하는 서열을 나타낸다.
도 13은 삽입 단편 J1(C-NS2)JFH1의 DNA 서열을 나타내는 도이고, 도 13d는 도 13c의 서열의 3'측에 계속되는 가장 3'말단측의 서열을 나타낸다.
1. RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터의 구축
RNA를 전사하는 RNA 폴리메라아제에는 3종류가 알려져 있다. RNA 폴리메라아제 I는 리보솜 RNA 유전자로부터 rRNA를, RNA 폴리메라아제 II는 단백질을 코드하는 유전자로부터 mRNA를, RNA 폴리메라아제 III는 tRNA 유전자로부터 tRNA를 전사한다.
RNA 폴리메라아제 I 및 III에 의하여 전사되는 게놈 RNA는 각각의 터미네이터를 가지고, 그 터미네이터 서열에 의하여 전사가 종결된다. 한편, RNA 폴리메라아제 II에 의한 전사에서는 터미네이터 서열은 필요로 되지 않는다. 그 전사 종결의 양식은 명확하지는 않지만, mRNA의 3'말단의 형성에 중요한 것은 전사 종결 그것이 아니라, 1차 전사 산물의 절단 반응에 의한 것이라 생각되고 있다.
RNA 폴리메라아제 I 및 III 프로모터의 하류에 연결된 유전자의 전사 산물에는 RNA 폴리메라아제 II 프로모터의 하류에 있는 유전자의 전사 산물과는 달리, 그 5' 및 3'말단에 각각 캡, 폴리 A가 부가되지 않는다. 천연의 HCV 게놈 RNA는 5' 및 3' 말단에는 캡 및 폴리 A가 부가되어 있지 않다. 이것으로부터, HCV 게놈 DNA를 RNA 폴리메라아제 I 또는 III 프로모터로 발현시킴으로써, HCV 바이러스 게놈 RNA와 같은 RNA를 전사할 수 있다고 기대할 수 있다.
이용할 수 있는 프로모터는 전사되는 RNA의 5' 및 3' 말단에 각각 캡, 폴리 A가 부가되지 않는 것이면 좋지만, 바람직하게는 RNA 폴리메라아제 I 프로모터가 좋고, 더욱 바람직하게는 rRNA 유전자 유래의 프로모터가 좋다. 또한 프로모터의 유래는 동물 유래의 것이라면 좋지만, 바람직하게는 마우스, 인간 유래의 것이 좋다.특히 바람직한 RNA 폴리메라아제 I 프로모터는 인간 리보솜 RNA(rRNA) 유전자의 프로모터이다.
또한, 터미네이터의 서열도 RNA 폴리메라아제 I 터미네이터가 좋고, 바람직하게는 rRNA 유전자 유래의 터미네이터가 좋다. 또한, 터미네이터의 유래는 동물 유래의 것이면 되지만, 바람직하게는 마우스, 인간 유래의 것이 좋다. 특히 바람직한 RNA 폴리메라아제 I 터미네이터는 마우스 리보솜 RNA(rRNA) 유전자의 터미네이터이다.
RNA 폴리메라아제 I 프로모터/터미네이터계는 인플루엔자 바이러스 입자의 재구성에 사용되고 있다(Neumann, G. et al., Virology, 202(1994) p477-479, Neumann, G. & Kawaoka, Y., Virology 287(2001) p.243-250, 일본특허공표 2003-520573). 본 발명의 방법에는 RNA 폴리메라아제 I 프로모터/터미네이터계 벡터인 pHH21(Neumann G. et al., Proc. Natl. Acad. Sci. USA, 96(1999) p9345-9350)을 사용할 수 있다. pHH21은 프로모터로서 인간 RNA 폴리메라아제 I 프로모터를 포함 하고, 터미네이터로서 마우스 RNA 폴리메라아제 I 터미네이터를 포함하는 발현 벡터이다.
HCV 게놈 cDNA의 5'말단 및 3'말단에 PCR을 사용하여 제한 효소 BsmBI 인식 서열을 각각 부가한 후, BsmBI으로 소화하고, pHH21의 BsmBI 부위에 HCV 게놈을 삽입하면, 프로모터/터미네이터와 HCV 게놈 cDNA의 사이에 여분인 염기 서열을 포함하는 경우 없이 그들을 연결할 수 있다.
또한, 상기 프로모터, HCV 게놈 cDNA 및 터미네이터를 적절하게 연결시킴으로써, 본 발명의 방법에 사용하는 발현 벡터를 새롭게 구축할 수 있다.
HCV주의 염기 서열을 사용한 계통 해석법에서는 HCV는 유전자형 1a, 유전자형 1b, 유전자형 2a, 유전자형 2b, 유전자형 3a, 유전자형 3b의 6타입으로 분류되고, 또한 그들 각 타입이 몇개의 서브 타입으로 분류된다. 그리고, HCV의 복수의 유전자형에 대해서는 그 게놈 전체 길이의 염기 서열도 결정되어 있다(Simmonds, P. et al., Hepatology, 10(1994) p1321-1324, 및 Choo, Q.L et al., Science, 244(1989) p359-362, Okamoto, H et al., J. Gen. Virol., 73(1992) p673-679, Mori, S. et al., Biochem. Biophis. Res. Commun. 183(1992) p334-342).
본 발명에서는 HCV주로서, 구체적으로는 유전자형 1(유전자형 1a 및 1b이 포함된다)의 H77c(H77주의 컨센서스 서열: GenBank 수납 번호 AF011751), 1주(GenBank 수납 번호 M62321), H주(GenBank 수납 번호 M67463), HC-J1주(GenBank 수납 번호 D10749), J1주(GenBank 수납 번호 D89815), con1주(GenBank 수납 번호 AJ238799), TH주(Wakita, T. et al., J. Biol. Chem.,(1994) 269, p. 14205- 14210), J주(GenBank 수납 번호 D90208), JT주(GenBank 수납 번호 D01171), BK주(GenBank 수납 번호 M58335) 등이 유전자형 2(유전자형 2a 및 2b가 포함된다)의 J6CF주(GenBank 수납 번호 AF177036), JFH1주(GenBank 수납 번호 AB047639, JFH-1주라 하는 경우도 있다), JCH1주(GenBank 수납 번호 AB047640), HC-J8주(GenBank 수납 번호 D01221) 등을 사용할 수 있다. 또한 그 밖의 주에 관해서도 이미 GenBank 수납 번호의 리스트가 보고되고 있어(Tokita, T. et al., J. Gen. Virol. (1998) 79, p.1847-1857, Cristina J. & Colina R. Virolgy Journal, (2006) 3, p.1-8 ) 입수가능하다.
RNA 폴리메라아제 I 프로모터/터미네이터계 벡터에 삽입하는 HCV 게놈 RNA 유래의 cDNA는 상기 유전형의 어느 타입에도 이용할 수 있고, 또는 그들의 키메라로 이루어지는 것도 이용할 수 있다. 바람직하게는 Huh7 등의 HCV 허용성의 세포에 도입했을 경우에 HCV 게놈 RNA의 자율 복제가 일어나는 유전자형 유래의 것이고 (Wakita, T., et al. Nat. Med., 11, (2005) p791-796 , Lindenbach BD., et al., Science, 309(2005) p623-626), 더욱 바람직하게는 유전자형 2a의 JFH1주(일본특허공개2002-171978호 공보)의 게놈 RNA에 대응하는 게놈 cDNA 서열(GenBank 수납 번호AB047639, Kato, T. et al., Gastroenterology, 125(2003) p1808-1817; 서열 번호27)이 열거된다.
C형 간염 바이러스(HCV)의 게놈은 약 9600 뉴클레오티드로 이루어지는 (+)쇄의 단일쇄 RNA이다. 이 게놈 RNA는 5'비번역 영역(5'NTR 또는 5'UTR라고도 표기한다), 구조 영역과 비구조 영역으로 구성되는 번역 영역, 및 3'비번역 영역(3'NTR 또는 3'UTR이라고도 표기한다)으로 이루어진다. 그 구조 영역에는 HCV의 구조 단백질이 코드되어 있고, 비구조 영역에는 복수의 비구조 단백질이 코드되어 있다.
이러한 HCV의 구조 단백질(Core, E1, E2 및 p7)과 비구조 단백질(NS2, NS3, NS4A, NS4B, NS5A, 및 NS5B)은 번역 영역으로부터 일련의 폴리프로테인로서 번역된 후, 프로테아제에 의한 한정 분해를 받아서 유리, 생성된다. 이들의 구조 단백질 및 비구조 단백질(즉, HCV의 바이러스 단백질) 중, Core는 코어 단백질이고, E1 및 E2은 엔벨롭 단백질이다. 비구조 단백질은 바이러스 자신의 복제에 관여하는 단백질이고, NS2는 메탈로프로테아제 활성, NS3는 세린프로테아제 활성(N말단측의 3분의 1)과 헬리카제 활성(C말단측의 3분의 2)을 갖는 것이 알려져 있다. 또한, NS4A는 NS3의 프로테아제 활성에 대한 코팩터이고, NS5B는 RNA 의존 RNA 폴리메라아제 활성을 갖는 것도 보고되어 있다.
본 발명의 HCV 입자를 생산하는 방법에 사용하는 발현 벡터는 RNA 폴리메라아제 I가 인식하는 프로모터(RNA 폴리메라아제 I 프로모터)의 하류에 HCV 게놈 cDNA의 5'비번역 영역, Core단백질 코드 서열, E1, E2단백질 코드 서열, p7단백질 코드 서열, NS2, NS3, NS4(NS4A 및 NS4B을 포함한다), NS5A 및 NS5B단백질 코드 서열 및 3'비번역 영역이 이 순서로 나열된 서열로 이루어지는 DNA를 갖고, 또한 그 하류에 RNA 폴리메라아제 I가 인식하는 터미네이터(RNA 폴리메라아제 I 터미네이터)을 포함하고 있으면 좋다. 이들의 서열은 일련의 폴리프로테인으로서 번역된 후에, 프로테아제에 의한 한정 분해를 받아서 유리, 생성되어 HCV 입자가 생산된다.
본 발명의 HCV입자를 생산하는 방법에서는 RNA 폴리메라아제 I 프로모터의 하류에, 임의의 HCV주 유래의 HCV 게놈 RNA로부터 합성한 cDNA를 연결하고, 또한 그 하류에 RNA 폴리메라아제 I 터미네이터를 연결한 DNA 단편을 포함하는 발현 벡터를 사용한다. RNA 폴리메라아제 I 프로모터의 하류 및 RNA 폴리메라아제 I 터미네이터의 상류에 연결하는 그러한 HCV cDNA는 1종의 HCV주(바람직하게는 JFH1주) 유래의 게놈 RNA에 대응하는 게놈 cDNA이어도 좋고, 2종 이상의 HCV주(바람직하게는, 적어도 그 1종이 JFH1주이다) 유래의 게놈 RNA로부터 합성한 cDNA로부터 유도되는 키메라 핵산이어도 좋다. RNA 폴리메라아제 I 프로모터와 RNA 폴리메라아제 I 터미네이터의 사이에 연결되는 그러한 HCV cDNA는, HCV의 5'비번역 영역, 구조 단백질(Core, E1, E2 및 p7), 비구조 단백질(NS2, NS3, NS4A, NS4B, NS5A 및 NS5B) 및 3'비번역 영역을 코드하는 DNA 서열을 이 순서로 1개씩 함유하는 HCV 전체 게놈 유사 cDNA 서열인 것이 바람직하다.
특히, RNA 폴리메라아제 I 프로모터의 하류에, HCV주(바람직하게는, 유전자형 1 또는 2의 HCV주) 유래의 5'비번역 영역 및 구조 단백질을 각각 코드하는 DNA 서열, 또한 필요에 따라서 HCV주 유래의 비구조 단백질을 코드하는 DNA 서열, 계속해서 HCV JFH1주 유래의 비구조 단백질 및 3'비번역 영역을 각각 코드하는 DNA 서열을 이 순서로 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA 단편을 더 포함하는 키메라 HCV 발현 벡터는 감염성 HCV 생산 능력이 높으므로 매우 바람직하다.
본 발명에 따른 보다 바람직한 발현 벡터는 RNA 폴리메라아제 I 프로모터의 하류에 임의의 HCV주 유래의 HCV 게놈 cDNA(즉, HCV 게놈 RNA 전체 길이를 코드하 는 DNA)의 5'비번역 영역 코드 서열, Core단백질 코드 서열, E1, E2단백질 코드 서열, p7단백질 코드 서열, NS2단백질 코드 서열과, JFH1주 유래의 HCV 게놈 cDNA의 NS3, NS4A, NS4B, NS5A 및 NS5B단백질 코드 서열 및 3'비번역 영역 코드 서열로 이루어지는 HCV 게놈 cDNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 함유하는 것이다. 또한 다른 바람직한 발현 벡터는 RNA 폴리메라아제 I 프로모터의 하류에 임의의 HCV주 유래의 HCV 게놈 cDNA의 5'비번역 영역, Core단백질 코드 서열, E1, E2단백질 코드 서열, p7단백질 코드 서열과, JFH1주 유래의 HCV 게놈 cDNA의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B단백질 코드 서열 및 3'비번역 영역 코드 서열로 이루어지는 HCV 게놈 cDNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 함유하는 것이다.
상기 발현 벡터에 있어서, 임의의 HCV주로서는 바람직하게는 유전자형 1 또는 2의 HCV주이다. 또한, 상기 발현 벡터에 있어서의 5'비번역 영역 코드 서열은 JFH1주 유래의 서열 또는 유전자형 1 및 유전자형 2의 HCV주에서 선택되는 2종 이상의 HCV주 유래의 키메라 서열인 것이 바람직하고, 키메라 서열인 경우, JFH1주 유래의 서열이 포함되는 것이 더욱 바람직하다. 유전자형 1의 HCV주로서는, 예를 들면 H77c주, 1주, H주, HC-J1주, J1주, con1주, TH주, J주, JT주, BK주 등을 사용할 수 있다. 유전자형 2의 HCV주로서는, 예를 들면 J6CF주, JFH1주, JCH1주, HC-J8주 등을 사용할 수도 있다. 보다 바람직한 HCV주로서, JFH1주, J6CF주, J1주, H77c주가 열거된다.
일례로서, JFH1주 유래의 전체 길이 게놈 cDNA에 있어서, 본 발명의 발현 벡 터에 도입될 수 있는 5'비번역 영역으로부터 NS2단백질까지를 코드하는 영역은 서열 번호 27(GenBank 수납 번호 AB047639의 DNA 서열)로 나타내지는 염기 서열에 있어서 염기 번호 1∼3430이고, 또 NS3단백질로부터 3'비번역 영역까지를 코드하는 영역은 염기 번호 3431∼9678이다. 동일하게 JFH1주 유래의 전체 길이 게놈 cDNA에 있어서, 5’비번역 영역으로부터 p7단백질까지를 코드하는 영역은 서열 번호 27로 나타내는 염기 서열에 있어서 염기번호 1∼2779이고, 또 NS2단백질로부터 3'비번역 영역까지를 코드하는 영역은 염기 번호 2780∼9678이다. 다른 HCV주 유래의 게놈 cDNA상의 각 영역의 위치에 관해서도, 이 JFH1주의 게놈 cDNA 서열을 기준으로서 정할 수 있다.
본 발명에 따른 특히 바람직한 발현 벡터의 예는 후술의 실시예에 나타내는 DNA 단편 J6(C-p7)JFH1(서열 번호 29), H77c(C-p7)JFH1(서열 번호 30), J1(C-p7)JFH1(서열 번호 31), J1(C-NS2)JFH1(서열 번호 32) 중 어느 하나를 함유하는 발현 벡터이다. 이들의 DNA 단편은 벡터 중의 발현 프로모터의 제어하에 삽입되는 것이 바람직하다.
HCV의 비구조 단백질 NS5B 중의 GDD 아미노산 서열이 GND로 변이하면, 자율 복제가 일어나지 않는 것이 나타나 있으므로(Kato, T. et al., Gastroenterology, 125(2003) p1808-1817), 실험의 대조로서, NS5B단백질의 아미노산 서열이 GND로 변이한 것을 사용할 수 있다.
2. 세포내에서의 HCV RNA의 합성 확인
상기한 바와 같이 하여 제작되는 본 발명의 발현 벡터를 세포내에 도입해서 HCV RNA를 전사할 수 있다. 세포로의 DNA의 도입은 일렉트로포레이션법, 리포펙션법, 인산 칼슘법 등 일반적인 방법을 이용하여 행할 수 있다.
발현 벡터 DNA로부터 전사되는 HCV RNA의 해석은 통상의 분자 생물학적 방법(Molecular Cloning 3rd Edition Sambrook & Russell Cold Spring Harbor Laboratory Press 2001)으로 해석할 수 있다. 구체적으로는, 노던블롯법, 리보뉴클레아제 프로텍션 애세이법, RT-PCR법 및 RACE법 등을 사용하여, 전사된 RNA의 양 또는 서열을 해석할 수 있다. RNA의 정량을 행하는 경우에는 노던 블롯법이나 RT-PCR법이 RNA의 서열을 해석하는 경우에는 RACE법이 사용된다.
세포내에서 전사된 HCV RNA의 5'말단의 서열을 해석할 경우, 특정한 서열의 합성 RNA 링커를 HCV RNA에 RNA 리가제를 사용하여 연결하고, 이것을 주형으로서, HCV RNA에 상보적인 합성 DNA 프라이머를 이용하여 역전사 효소로 cDNA를 합성한다. 다음에 링커내의 서열과 앞에서 사용한 프라이머보다 5'측의 프라이머로 PCR를 행하여 HCV RNA에 상보적인 단편을 증폭하고, 플러스미드 벡터에 클론화 후, 염기 서열을 결정함으로써 세포내로 전사된 HCV RNA의 서열을 해석할 수 있다. 최초의 PCR로 DNA 단편이 증폭되지 않은 경우에는 nested-PCR법으로 행하면 해석을 행하는 것이 가능해진다.
3. 세포내에서의 HCV 단백질의 발현 확인
HCV가 감염하고, HCV 게놈 RNA가 복제되어 있는 세포에서는, 상기의 HCV 단백질이 발현되어 있다. 따라서, HCV 게놈 RNA 복제 세포로부터 추출한 단백질 중에서 HCV 단백질이 검출되면, 그 세포는 HCV 게놈 RNA를 복제하고 있는 것이라고 판 단할 수 있다. HCV 단백질의 검출은 공지의 임의의 단백질 검출법에 따라서 행할 수 있고, 예를 들면 도입된 HCV 게놈 RNA로부터 발현되어야 할 HCV 단백질에 대한 항체를 세포로부터 추출한 단백질과 반응시킴으로써 행할 수 있다. 보다 구체적으로는, 예를 들면 세포로부터 추출한 단백질 시료를 니트로셀룰로오스 막에 블로팅하고, 그것에 대해서 항 HCV 단백질 항체(예를 들면 항 NS3특이적 항체, 또는 C형 간염 환자로부터 채취한 항혈청)를 반응시키고, 또한 그 항 HCV 단백질 항체를 검출함으로써 행할 수 있다.
HCV 단백질을 발현시키기 위한 숙주세포는, 계대 배양 가능한 세포이면, 특별하게 한정되지 않지만, 진핵 세포인 것이 바람직하고, 인간 세포인 것이 보다 바람직하고, 인간 간 유래세포, 인간 자궁경 유래 세포, 또는 인간 태아 신장 유래 세포인 것이 더욱 바람직하다. 또한 세포로서는, 암 세포주나 간 세포주 등을 포함하는 증식성 세포가 바람직하고, Huh7 세포(ATCC CCL-185), HepG2 세포(ATCC HB 8065), IMY-N9 세포(Date, T. et al., J. Biol. Chem.,(2004) 279, p.22371-22376), HeLa 세포(ECACC 93021013), RCYM1RC 세포(Murakami, K., et al., Virology, 351, 381-392, 2006), 5-15RC 세포(Pietschmann T., et al., J Virol.(2001) 75, p.1252-1264), 및 그들의 세포로부터 파생된 주화 세포 등이 보다 바람직하다. 특히 바람직한 세포로서는 Huh7 세포, RCYM1RC 세포, 5-15RC 세포, HepG2 세포 및 그들의 세포로부터 파생된 주화 세포가 열거된다. 이들의 세포는 시판하는 것을 이용해도 좋고, 세포 기탁 기관으로부터 입수해서 사용해도 좋고, 임의의 세포(예를 들면, 암 세포 또는 간 세포)로부터 주화한 세포를 사용해도 좋다. Huh7 세포로부터 파생된 세포주로서, Huh7.5 세포(Blight, KJ. Et al., J. Virol., (2002) 76, p.13001-13014) 및 Huh7.5.1 세포(Zhong, J. et al., Proc. Natl. Acad. Sci USA, (2005) 102, p.9294-9299)가 열거된다. 전자는 Huh7 세포에 레플리콘을 유전자 도입한 후에 수립된 레플리콘 복제 세포를 인터페론 처리로 레플리콘을 배제함으로써 HCV 복제 능력이 높게 된 세포이고, 후자는 Huh7.5 세포로 제작한 레플리콘 복제 세포로부터 인터페론 γ처리로 레플리콘을 배제한 레플리콘 복제 효율이 좋은 세포이다.
4. HCV 입자의 생산 확인
본 발명의 발현 벡터를 HCV 허용성 세포(HCV의 증식을 허용하는 세포)에 도입하고, 그 세포를 배양함으로써, 본 발명의 발현 벡터로부터 전사된 HCV 게놈 RNA를 갖는 C형 간염 바이러스(HCV) 입자를 산생할 수 있다. HCV 허용성 세포로서는 Huh7 세포, RCYM1RC 세포, 5-15RC 세포, HepG2 세포 및 그들의 세포로부터 파생된 주화 세포 등을 바람직하게 사용할 수 있다. 이렇게 하여 산생된 C형 간염 바이러스(HCV) 입자는 다른 세포로의 감염성을 유지하고 있다. 본 발명은 이러한 감염성 C형 간염 바이러스 입자의 산생 방법에 관한 것이다.
세포의 바이러스 입자 산생 능력은 공지의 임의의 바이러스 검출법을 이용하여 확인할 수 있다. 예를 들면 바이러스 입자를 산생하고 있다고 생각되는 세포의 배양액을 수크로오스 밀도 구배에 의해 분획하고, 각 분획의 밀도, HCV 코어 단백질농도, 및 HCV 게놈 RNA의 양을 측정한 결과, HCV 코어 단백질과 HCV 게놈 RNA의 피크가 일치하고, 게다가 그 피크가 검출되는 단편의 밀도가 배양 상청을 0.25% NP40(폴리옥시에틸렌(9)옥틸페닐에테르[Polyoxyethylene(9)Octylphenyl Ether])로 처리하고 나서 분획했을 경우의 동일 단편의 밀도와 비교해서 가벼운 경우에는, 상기 세포는 바이러스 입자 산생 능력을 갖는다고 판정할 수 있다. 또한 프리의 HCV입자의 비중은 1.14∼1.16g/ml라 보고되어 있으므로(Kaito, M. et al., J. Gen. Virol. 75(1994) p1755-1760), 이 값과 비교할 수도 있다.
배양액 중에 방출된 HCV 바이러스 입자는 예를 들면 Core단백질, E1단백질,또는 E2단백질에 대한 항체를 이용하여 검출할 수도 있다. 또한 배양액 중의 HCV 바이러스 입자가 함유하는 HCV 게놈 RNA를, 특이적 프라이머를 사용한 RT-PCR법에 의해 증폭해서 검출함으로써, HCV 바이러스 입자의 존재를 간접적으로 검출할 수도 있다.
5. 본 발명의 HCV 입자의 다른 세포로의 감염
본 발명의 방법에서 산생되는 HCV 바이러스 입자는 세포(바람직하게는 HCV 허용성(감수성) 세포)로의 감염 능력을 갖는다. 본 발명은 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 도입한 세포를 배양하고, 얻어진 배양물(바람직하게는, 배양액) 중의 바이러스 입자를 다른 세포(바람직하게는 HCV 감수성 세포)에 감염시키는 것을 포함한 C형 간염 바이러스 감염 세포의 제조방법도 제공한다. 여기서, HCV 허용성 세포란, HCV 게놈 RNA의 복제 능력 및/또는 HCV에 감염하는 능력을 갖는 세포이다. HCV 허용성 세포는 바람직하게는 간장 세포 또는 림파주계 세포이지만, 이들에 한정되는 것은 아니다. 구체적으로는, 간장 세포로서는 초대 간장 세포나, Huh7세포, HepG2세포, IMY-N9세포, HeLa세포, 293 세포 등이 열거되고, 림파주계 세포로서는 Molt4세포나, HPB-Ma세포, Daudi세포 등이 열거되지만, 이들에 한정되는 것은 아니다. 특히 바람직한 HCV 허용성 세포로서는 Huh7세포, RCYM1RC세포, 5-15RC세포, HepG2세포 및 그들의 세포로부터 파생된(제작된)주화 세포가 열거된다. Huh7세포로부터 파생된 세포로 바람직한 세포로서, Huh7.5세포 및 Huh7.5.1세포가 열거된다.
본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 도입한 세포에 있어서 산생된 HCV 입자를 세포(예를 들면, HCV 허용성 세포)에 감염시키면, 그 감염 세포 중에서는 HCV 게놈 RNA가 복제되고, 또한 바이러스 입자가 형성된다.
본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 도입한 세포에 있어서 산생된 HCV 바이러스 입자는 침팬지 등의 HCV 바이러스에 감염될 수 있는 동물에 감염되고, HCV 유래의 간염을 야기할 수 있다.
본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 도입한 세포에 있어서 산생된 HCV 입자가 감염성을 갖고 있는지의 여부는 본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 도입한 세포를 배양해서 얻어진 상청을 HCV 허용성 세포(예를 들면, Huh7)로 처리하고, 예를 들면 48시간 후에 세포 항코어 항체에서 면역 염색하여 감염 세포수를 헤아리거나, 세포의 추출물을 SDS-폴리아크릴아미드 겔로 전기영동하고, 웨스턴 블롯으로 코어 단백질을 검출하는 것으로 판단할 수 있다.
6. 감염성 HCV 입자 산생 세포주의 취득
본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터가 안정적으로 도입된 세포는 감염성 HCV 입자를 지속적으로 생산할 수 있다. 본 발명의 RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터를 안정적으로 발현시키는 세포주를 얻기 위해서는 본 벡터내에 약제 저항성 유전자를 도입하여 두는 것이 바람직하다. 약제 저항성 유전자로서, G418 저항성 유전자, 하이그로마이신 저항성 유전자, 퓨로마이신 저항성 유전자, Zeocin 저항성 유전자, 블라스트사이딘 저항성 유전자 등이 열거된다. 또한 약제 저항성을 지표로 하여 선별된 클론의 HCV 입자 산생 능력은 그들의 클론의 배양 상청 중의 Core 단백질량이나 클론으로 복제되는 HCV RNA량을 노던 블롯이나 정량적 RT-PCR로 검출하는 것으로 추정할 수 있다.
본 명세서는 본원의 우선권 주장의 기초로 하는 일본국 특허출원 2005-287646호의 명세서 및/또는 도면에 기재되는 내용을 포함한다.
본 명세서에서 인용한 모든 간행물, 특허 및 특허 출원의 전체가 참조에 의해 본 명세서에 포함된 것으로 한다.
(실시예)
이하에 실시예를 들어 본 발명을 보다 구체적으로 설명한다. 단, 이들의 실시예는 설명을 위한 것이고, 본 발명의 기술적 범위를 제한하는 것은 아니다.
[실시예 1]
RNA 폴리메라아제 I 프로모터/터미네이터계를 사용한 HCV 발현 벡터의 구축
HCV 게놈 RNA의 cDNA로서, 유전자형 2a의 JFH1주 유래 게놈 RNA의 cDNA(GenBank 수납 번호 AB047639, Kato, T. et al., Gastroenterology, 125(2003) p1808-1817), JFH1주의 NS5B 중의 GDD아미노산 서열이 GND가 되도록 DNA 서열을 변환한 JFH1주 유래 게놈 RNA의 cDNA(Wakita, T. et al. Nat. Med., 11(2005) p.791-796), J6CF주 유래 게놈 RNA의 cDNA(GenBank 수납 번호 AF177036, Yanagi, M. et al. Virology,262(1999) p.250-263), 유전자형 1a의 H77c주 유래의 게놈 RNA의 cDNA(GenBank 수납 번호 AF011751, Yanagi, M. et al., Proc. Natl. Acad. Sci. USA, 94(1997) p.8738-8743), 및 유전자형 1b의 J1주 유래의 게놈 RNA의 cDNA(GenBank 수납 번호 D89815, Aizaki, H. et al. Hepatology, 27(1998) p.621-627)을 사용했다.
상기의 HCV 게놈 cDNA(JFH1, JFH1/GND 및 H77c)의 5'말단 및 3'말단에 PCR 을 이용하여 제한 효소 BsmBI 인식 서열을 각각 부가했다. BsmBI의 절단 부위가 그 효소의 인식 부위로부터 떨어져 있는 성질을 이용하고, 인간 RNA 폴리메라아제 I 프로모터 및 마우스 RNA 폴리메라아제 I 터미네이터의 서열을 갖는 pHH21벡터(Neumann G. et al., Proc. Natl. Acad. Sci. USA, 96(1999) p9345-9350)의 BsmBI 부위에 HCV 게놈을 프로모터/터미네이터와 HCV 게놈의 사이에 여분인 염기 서열을 포함하는 경우 없이 삽입시켰다(도 1a). 또한 각각의 클론의 맵은 도 1b에 나타냈다. 얻어진 HCV 게놈 cDNA를 포함하는 벡터를 각각 pHH JFH1, pHH JFH1/GND 및 pHH H77c라고 부른다.
또한, J6CF와 JFH1, H77c와 JFH1, J1과 JFH1의 게놈 cDNA에서 각각 유래하는 키메라 HCV 발현 벡터의 제작은 이하에 나타내는 방법으로 행하였다.
pHH J6(C-p7)/JFH1의 제작
JFH1주 유래 게놈 RNA 전체 영역에 대응하는 cDNA를 pUC19 플러스미드 중에 클로닝함으로써 구축된 플러스미드 DNA인 pJFH1(Wakita, T. et al. Nat. Med., 11(2005) p791-796, 국제공개 WO2004/104198)을 AgeI로 소화 후, 또한 BclI으로 부분 소화하고, AgeI 부위로부터 최초의 BclI부위까지의 단편(2672 bp)이 제거된 플러스미드 DNA 단편을 정제했다. 한편, J6CF주 유래 게놈 cDNA를 AgeI와 BclI로 부분소화해서 얻어진 2672 bp의 단편을 상기의 단편에 연결하고, pUC J6/JFH1을 얻었다.
다음에 pHH JFH1을 NocI로 소화해서 얻어지는 약 4.3kb의 단편과 pUC J6/JFH1을 NocI로 소화해서 얻어지는 약 8.2kb의 단편을 리가제에 의해 연결하고, 발현 벡터 pHH J6(C-p7)/JFH1을 얻었다. 이 pHH J6(C-p7)/JFH1의 삽입 단편(J6(C-p7)JFH1; 서열 번호 29, 도 10a∼d)은 JFH1주 및 J6CF주 유래의 키메라로 이루어지는 5'비번역 영역과, J6CF주 유래의 Core단백질, E1단백질, E2단백질 및 p7단백질을 각각 코드하는 DNA 서열과, JFH1주 유래의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B단백질 및 3'비번역 영역을 각각 코드하는 DNA 서열을 포함한다.
pHH H77c(C-p7)/JFH1의 제작
상기 JFH1 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 5-JFH-S(서열 번호 10: GCCATGGCGTTAGTATGAGTGTCGT) 및 5-JFH-A(서열 번호 11: TCGTGCTCATGGTGCACGGTCTACGAGACC)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하 여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)를 1㎕ 가하고 나서, PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 30사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.1으로 했다. 다음에 JFH1 게놈 cDNA를 주형으로서, LA-PCR키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-JFH-S(서열 번호 12: GGCATACGCATATGACGCACCTGTGCACGG) 및 3-JFH-A(서열 번호 13: GCTCTGACGAAGTACGGCACATGTGTC)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서, PCR 반응을 행했다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.2라고 했다. 또한, 상기 H77c 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 5-H77-S(서열 번호 14: ACCGTGCACCATGAGCACGAATCCTAAACC) 및 5-H77-A(서열 번호 15: GAAGCCGCACGTAAGGGTATCGATG:)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오사)을 1㎕ 가하고 나서, PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행했다. 얻어진 PCR 산물을 PCR 산물 no.3라고 했다. 다음에 H77c 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-H77-S(서열 번호 16: CATTGTGCCCGCAAAGAGCGTGTGT) 및 3-H77-A(서열 번호 17: GTGCGTCATATGCGTATGCCCGCTGAGGCA)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서, PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행했다. 얻어진 PCR 산물을 PCR 산물 no.4라고 했다.
다음에 각각의 PCR 산물을 정제하고, 50㎕의 H2O에 녹였다. PCR 산물 no.1과 PCR 산물 no.3의 DNA를 100배 희석해서 각 1㎕을 혼합했다. 이 혼합액을 템플릿(template)으로 하여 프라이머를 가하지 않고 상기의 조건으로 PCR을 5사이클 행하였다. 그 후, 프라이머 5-JFH-S(서열 번호 10) 및 5-H77-A(서열 번호 15)을 첨가하고, 또한 PCR을 25사이클 행하고, 그것에 의해 증폭된 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR5HJ로 명명했다. 또한, PCR 산물 no.2와 PCR 산물 no.4를 100배 희석해서 각1㎕을 1개에 혼합했다. 이 혼합액을 템플릿으로 하고, 프라이머를 가하지 않고 상기의 조건으로 PCR을 5사이클 행하였다. 그 후, 프라이머 3-H77-S(서열 번호 16) 및 3-JFH-A(서열 번호 13)을 첨가하고, 또한 PCR은 25사이클 행하고, 그것에 의해 증폭한 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII 에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR3HJ라고 명명 했다.
이어서, pCR5HJ를 제한 효소 AgeI 및 KpnI로, H77c 게놈 cDNA를 제한 효소KpnI 및 AscI로, pCR3HJ를 제한 효소 AscI 및 NotI로 소화하고, 각 HCV cDNA 단편을 아가로스 겔전기 영동으로 분획하고, 정제했다. 이들 3개의 DNA 단편을, pHH JFH1을 AgeI 및 NotI로 소화해서 얻어진 벡터에 연결했다. 이 벡터를 pHH H77c(C-p7)/JFH라고 명명했다. 이 발현 벡터 pHH H77c(C-p7)/JFH의 삽입 단편(H77c(C-p7)JFH; 서열 번호 30, 도 11a∼d)은, JFH1주 및 H77c주 유래의 키메라로 이루어지는 5'비번역 영역, H77c주 유래의 Core단백질, E1단백질, E2단백질,및 p7단백질을 각각 코드하는 DNA 서열과, JFH1주 유래의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B 단백질 및 3'비번역 영역을 각각 코드하는 DNA 서열을 포함한다.
pHH J1(C-p7)/JFH1의 제작
상기 JFH1 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 5-JFH-S(서열 번호 10: GCCATGGCGTTAGTATGAGTGTCGT) 및 5-JFH-A2(서열 번호 18: TTGTGCTCATGGTGCACGGTCTACGAGACC)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가해 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서 PCR 반응을 행했다. PCR 반응은, 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.5로 했다.
다음에 JFH1 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오사)에 첨부 되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-JFH-S2(서열 번호 19: AGCTTACGCCTATGACGCACCTGTGCACGG) 및 3-JFH-A(서열 번호 13: GCTCTGACGAAGTACGGCACATGTGTC)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오사)를 1㎕ 가하고 나서, PCR 반응을 행했다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행했다. 얻어진 PCR 산물을 PCR 산물no.6으로 했다.
유전자형 1b의 J1주 유래의 게놈 RNA에 대응하는 cDNA(GenBank 수납 번호D89815, Aizaki, H. et al. Hepatology, 27(1998) p.621-627)을 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합 액을 5㎕, 10μM의 프라이머 5-J1-S(서열 번호 20: ACCGTGCACCATGAGCACAAATCCTAAACC) 및 5-J1-A(서열 번호 21: AAGCGGGATGTACCCCATGAG)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서 PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.7이라고 했다.
다음에 상기의 J1주 유래 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-J1-S(서열 번호 22: CGGCTGTACATGGATGAATAGCACTGGGTT) 및 3-J1-A(서열 번 호 23: GTGCGTCATAGGCGTAAGCTCGTGGTGGTA)를 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 하였다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서 PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행했다. 얻어진 PCR 산물을 PCR 산물 no.8이라 했다.
각각의 PCR 산물을 정제하고, 50㎕의 H2O에 녹였다. PCR 산물 no.5와 PCR 산물 no.7의 DNA를 100배 희석하여 각 1㎕을 1개에 혼합했다. 이 혼합액을 템플릿으로 하여 프라이머를 가하지 않고 상기의 조건으로 PCR을 5사이클 행하였다. 그 후, 프라이머 5-JFH-S(서열 번호 10) 및 5-J1-A(서열 번호 21)를 첨가하고, 또한 PCR을 25사이클 행하고, 그것에 의해 증폭된 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR5JJ라 명명했다.
또한, PCR 산물 no.6과 PCR 산물 no.8의 DNA를 100배 희석해서 각 1㎕을 혼합했다. 이 혼합액을 템플릿으로 하고, 프라이머를 가하지 않고 상기의 조건으로 PCR을 5사이클 행하였다. 그 후, 프라이머 3-J1-S(서열 번호 22) 및 3-JFH-A(서열 번호 13)을 첨가하고, 또한 PCR을 25사이클 행하고, 그것에 의해 증폭한 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR3JJ라고 명명했다.
pCR5JJ을 제한 효소 AgeI 및 ClaI로, J1 게놈 cDNA를 제한 효소 ClaI 및 AvrII로, pCR3JJ를 제한 효소 AvrII 및 KpnI으로 소화하고, 각 HCV cDNA 단편을 아가로스겔 전기영동으로 분획하고, 정제했다. 이들 3개의 DNA 단편을 pHH JFH1을 AgeI 및 KpnI로 소화하여 얻어진 벡터에 연결했다. 이 벡터를 pHH J1(C-p7)/JFH라고 명명했다. 이 발현 벡터 pHH J1(C-p7)/JFH의 삽입 단편(J1(C-p7)JFH; 서열 번호 31, 도 12a∼d)은 JFH1주 및 J1주 유래의 키메라로 이루어지는 5'비번역 영역, J1주 유래의 Core단백질, E1단백질, E2단백질 및 p7단백질을 각각 코드하는 DNA 서열과 JFH1주 유래의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B단백질 및 3'비번역 영역을 각각 코드하는 DNA 서열을 포함한다.
pHH J1(C-NS2)/JFH1의 제작
상기 JFH1 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 5-JFH-S(서열 번호 10: GCCATGGCGTTAGTATGAGTGTCGT) 및 5-JFH-A2(서열 번호 18: TTGTGCTCATGGTGCACGGTCTACGAGACC)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 하였다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서 PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행했다. 얻어진 PCR 산물을 PCR 산물 no.9라고 했다.
다음에, JFH1 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오사)에 첨 부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-JFH-NS3-S(서열 번호 24: GCGACTCCTTGCTCCCATCACTGCTTATGC) 및 3-JFH-NS3-A(서열 번호 25: TGGGAGACCTTGTAACAACGTCGAGTGT)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 하였다. 다음에 Takara LA Taq(타카라 바이오사)을 1㎕ 가하고 나서, PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.10으로 했다.
유전자형 1b의 J1주 유래의 게놈 RNA의 cDNA(GenBank 수납 번호 D89815, Aizaki, H. et al. Hepatology, 27(1998) p.621-627)을 주형으로서, LA-PCR 키트(타카라 바이오사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 5-J1-S(서열 번호 20: ACCGTGCACCATGAGCACAAATCCTAAACC) 및 5-J1-A(서열 번호 21: AAGCGGGATGTACCCCATGAG)을 각각 1㎕ 가하고, 최종적으로 탈이온수를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오사)을 1㎕ 가하고 나서 PCR 반응을 행했다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.11로 했다.
다음에 J1주 유래의 게놈 cDNA를 주형으로서, LA-PCR 키트(타카라 바이오 사)에 첨부되어 있던 10×완충액을 5㎕, 2.5mM dNTP 혼합액을 5㎕, 10μM의 프라이머 3-J1-S(서열 번호 22: CGGCTGTACATGGATGAATAGCACTGGGTT) 및 3-J1-NS3-A(서열 번호 26: CATAAGCAGTGATGGGAGCAAGGAGTCGCC)을 각각 1㎕ 가하고, 최종적으로 탈이온수 를 가하여 전체량을 49㎕로 했다. 다음에 Takara LA Taq(타카라 바이오 사)을 1㎕ 가하고 나서, PCR 반응을 행하였다. PCR 반응은 94℃ 1분, 64℃ 2분, 72℃ 3분으로 이루어지는 공정을 1사이클로 하여 25사이클의 조건으로 행하였다. 얻어진 PCR 산물을 PCR 산물 no.12라고 했다.
각각의 PCR 산물을 정제하고, 50㎕의 H2O에 녹였다. PCR 산물 no.9과 PCR 산물 no.11의 DNA를 100배 희석해서 각 1㎕을 1개에 혼합했다. 이 혼합액을 템플릿으로 하고 프라이머를 가하지 않고 상기의 조건으로 PCR를 5사이클 행하였다. 그 후, 5-JFH-S(서열 번호 10) 및 5-J1-A(서열 번호 21)을 프라이머로서 첨가하고, 또한 PCR을 25사이클 행하고, 그것에 의해 증폭된 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR5JJ라고 명명했다.
또한, PCR 산물 no.10과 PCR 산물 no.12의 DNA를 100배 희석해서 각 1㎕을 1개에 혼합했다. 이 혼합액을 템플릿으로 하고 프라이머를 가하지 않고 상기의 조건으로 PCR을 5사이클 행했다. 그 후에 3-J1-S(서열 번호 22) 및 3-JFH-NS3-A(서열 번호 25)을 프라이머로서 첨가하고, 또한 PCR을 25사이클 행하고, 그것에 의해 증폭된 키메라 DNA 단편을 정제했다. 이 단편을 플러스미드 벡터 pCRII에 클론화하고, 그 DNA 단편의 염기 서열을 결정하고, 염기 서열이 옳은 것을 확인했다. pCRII에 키메라 DNA 단편을 클론화한 이 플러스미드를 pCR3JJNS3이라고 명명했다.
pCR5JJ을 제한 효소 AgeI 및 ClaI로, J1게놈 cDNA를 제한 효소 ClaI 및 AvrII로, pCR3JJNS3을 제한 효소 AvrII 및 BspDI로 소화하고, 각 HCV cDNA 단편을 아가로스겔 전기영동으로 분획하고, 정제했다. 이들 3개의 DNA 단편을 pHH JFH1을 AgeI 및 BspDI으로 소화해서 얻어진 벡터에 연결했다. 이 벡터를 pHH J1(C-NS2)/JFH라고 명명했다. 이 발현 벡터 pHH J1(C-NS2)/JFH의 삽입 단편(J1(C-NS2)JFH; 서열 번호 32, 도 13a∼d)는 JFH1주 및 J1주 유래의 키메라로 이루어지는 5'비번역 영역, J1주 유래의 Core단백질, E1단백질, E2단백질, p7단백질 및 NS2단백질을 각각 코드하는 DNA 서열과 JFH1주 유래의 NS3, NS4A, NS4B, NS5A 및 NS5B단백질 및 3'비번역 영역을 각각 코드하는 DNA 서열을 포함한다.
각각의 발현 벡터 클론의 맵을 도 1c에 나타냈다.
[실시예 2]
세포내에서의 HCV RNA의 합성 확인
실시예 1에서 제작한 pHH JFH1 및 pHH JFH1/GND를 Huh7 및 HepG2세포에 Fugene 6(로슈 사)을 이용하여, 첨부 메뉴얼을 따라서 도입했다. 24시간 후에 각 세포로부터 RNA를 Isogen(니폰진 사)으로, 첨부 메뉴얼을 따라서 조제했다.
이들의 RNA를 주형으로서 아래와 같이, RACE법으로 pHH JFH1 및 pHH JFH1/GND로부터 HCV RNA가 합성되었는지에 대해서 확인했다.
2μg의 상기한 바와 같이 조제한 RNA와 2.5μM의 RNA 링커(서열 번호 1: GCUGAUGGCGAUGAAUGAACACUGCGUUUGCUGGCUUUGAUGAAA)을 T4 RNA 리가제(Takara 사)에 의해, 첨부 완충액을 이용하여 연결했다. 다음에 RNA 링커가 연결된 RNA를 주형으 로서, HCV RNA에 상보적인 프라이머(서열 번호 2: gtaccccatgaggtcggcaaag)을 이용하여, 역전사 효소 SuperScript III(인비트로젠 사)으로 첨부 메뉴얼을 따라서 cDNA를 합성했다.
이어서, 합성된 상기 cDNA를 주형으로 하고, 5'말단의 RNA 링커에 대한 센스 프라이머(서열 번호 3: GCTGATGGCGATGAATGAACACTG)와 3'말단측 안티센스 프라이머(서열 번호 4: gaccgctccgaagttttccttg)의 2종류의 프라이머를 이용하여, PCR에 의해 DNA를 증폭했다. 또한, 증폭된 DNA를 주형으로서, 증폭된 DNA의 내측의 서열로 이루어지는 5'말단측 프라이머(서열 번호 5: GAACACTGCGTTTGCTGGCTTTGATG) 및 3'말단측 프라이머(서열 번호 6: cgccctatcaggcagtaccacaag)의 프라이머 셋트를 이용하여, 제 2 PCR을 행했다. 또, 이 PCR은 시판의 키트: Ex Taq(Takara)을 사용하고, 96℃에서 5분간 가열 처리 후, 96℃에서 1분간, 55㎕에서 1분간, 72℃에서 2분간의 반응 사이클을 35회 반복, 그 후 4℃에서 보존함으로서 행하였다. 이어서, 상기 2회째의 PCR 산물이 얻어졌는지를 확인하기 위해서, 반응액의 일부를 아가로스 겔 전기영동으로 확인했다. 그 결과(도 2), Huh7 세포 및 HepG2 세포 모두 pHH JFH1과 pHH JFH1/GND로부터 HCV RNA의 전사가 일어나고 있는 것을 확인할 수 있었다. 또한, 2회째의 PCR 산물을 pGEM-T Easy(Promega 사)벡터에 클론화했다. 얻어진 플러스미드 DNA에 클론화된 DNA의 염기 서열을 DNA 시퀀서(ABI PRISM 377)를 이용하여 결정했다. 그 결과, pHH JFH1 및 pHH JFH1/GND로부터 전사된 HCV RNA의 5'말단의 서열은 HCV 게놈의 5'말단과 동일한 것이 명확하게 되었다. 도 3에, pHH JFH1로부터 전사된 HCV RNA의 5'말단과 링커의 서열을 나타냈다.
[실시예 3]
세포내에서의 HCV 단백질의 발현 확인
pHH JFH1, pHH H77c 및 pHH JFH1/GND를 도입한 세포로 전사에 이어서 HCV 단백질의 번역이 일어나고 있는지에 대해서 확인했다.
pHH JFH1, pHH H77c 및 pHH JFH1/GND를 Huh7세포에 Fugene 6(로슈 사)을 이용하여, 첨부 메뉴얼에 따라서 도입했다. 배양 4일 후, 통상의 방법에 의해, 세포 추출액을 조제했다. 이어서, 이들의 추출액 중의 단백질을 SDS-PAGE 및 웨스턴 블롯법에 의해 해석했다. 해석에 있어서, Core유전자를 포함하는 발현 플러스미드 DNA를 Huh7세포에 트랜젠트로 트랜스펙션하여 얻어진 세포 추출액을 양성 대조로 했다. 또한, 트랜스펙션하지 않는 Huh7세포로부터 얻어진 세포 추출액을 음성 대조로 했다. 각각의 세포 클론으로부터 추출한 시료를 SDS-PAGE를 행한 후, PVDF막(Immobilon- P, Millipore사 제작)에 블로팅하고, 항 Core 특이적 항체(토끼 폴리크로날 항체) 및 항 NS5A항체로서 마우스 모노크로날(Austral 사)과 이들의 항체를 인식하는 HRP 표식 2차 항체를 이용하여, ECL(아머샴 파루마시아 사)으로 세포내에서 번역된 Core단백질 및 NS5A단백질을 검출했다.
그 결과, 도 4에 나타나 있는 바와 같이 pHH JFH1을 도입한 세포에서는 Core 및 NS5A단백질의 발현이 확인되었다. 그러나, pHH H77c 및 pHH JFH1/GND를 도입한 세포에서는 이들의 단백질의 발현은 검출할 수 없었다. 이 결과는 pHH JFH1이 도입된 세포에서는 pHH JFH1으로부터 RNA가 전사된 후, 이 RNA가 세포내에서 복제된 후, 단백질의 번역이 일어나고, 단백질의 검출가능한 레벨에 달하는 것에 반하여 pHH JFH1/GND를 도입한 세포에서는 pHH JFH1/GND로부터 RNA가 전사된 후, 이 RNA는 NS5B에 변이가 있으므로 세포내에서 복제되지 않고, 단백질을 검출할 수 있는 레벨에 달하지 않은 것을 나타내고 있다고 생각되었다. 한편, HCV 게놈 RNA는 배양 세포로 자율 복제하는데도 불구하고(Yi, M. & Lemon ST., J. Virol.,78(2004) p7904-7915), pHH H77c에 있어서 HCV단백질의 발현을 검출할 수 없었던 원인은 불분명하다.
다음에, 어떠한 세포주로 HCV 단백질이 발현되는지에 대해서 검토했다. pHH JFH1 및 pHH JFH1/GND를 GFP발현 벡터(pGreenLantern: Life Technologies Inc.)와 함께 Huh7, RCYM1RC, 5-15RC, HepG2 및 293T세포에 Fugen 6(로슈 사)을 이용하여 첨부 메뉴얼에 따라서 도입했다. 도입 4일 후, 형광 현미경으로 GFP의 발현을 관찰하고, 각 벡터가 도입되어 있는 것을 확인 후, 각 세포로부터 세포 추출액을 조제했다. 이어서, 이들의 추출액 중의 Core단백질을 SDS-PAGE 및 웨스턴 블롯법에 의해 해석했다. Core단백질의 검출은 항 Core 특이적 토끼 폴리크로날 항체와 이 항체를 인식하는 HRP 표식 2차 항체를 이용하여, ECL(아머샴 파루마시아 사)에서 행하였다. 그 결과, 도 5에 나타내는 바와 같이, Huh7, RCYM1RC, 5-15RC, HepG2세포에서 Core단백질을 검출할 수 있었다.
[실시예 4]
HCV 입자의 생산
다음에 pHH JFH1 도입 세포로부터 HCV입자가 산생되는지 어떤지를 확인하기 위해서, 배양 상청 중의 Core단백질의 해석을 행하였다. pHH JFH1 및 대조로서 Core, E1, E2 및 p7을 발현하는 벡터 pCAG327JFH1을 HepG2세포에 Fugene 6을 이용하여 도입해서 2일 후에 배양 상청을 제거하고, 신선한 배지를 가하여 2일간 더 배양했다. 이어서, 세포와 배양액을 회수하고, 세포로부터 단백질을 추출하고, 실시예 3에 나타내는 방법으로, 세포 중의 코어 단백질의 발현을 해석했다. 그 결과, 코어 단백질이 발현되고 있는 것을 확인했다(도 6a). 배양액 중의 HCV입자의 존재를 확인하기 위해서, 배양액을 수크로오스밀도 구배에 의해 분획했다. 10∼60%(중량/중량)의 밀도구배 수크로오스 용액(50mM Tris pH7.5/0.1M NaCl/1mM EDTA에 용해)에, 또한 샘플의 배양 상청을 0.2ml 중층했다. 이것을 베크만 로터 SW41E로 35,000RPM, 4℃, 16시간 원심하고, 원심 종료 후 원심 튜브의 저부으로부터 0.5ml 씩 분획 회수했다. 각 분획의 밀도, HCV Core 단백질 농도를 정량했다. HCV Core 단백질의 측정은 오르쏘 HCV항원 IRMA테스트를 사용하여 행하였다(Aoyagi et al., J. Clin. Microbiol.,37(1999) p.1802-1808).
도 6b에 나타나 있는 바와 같이 1.15∼1.18mg/ml의 단편에서 Core단백질의 피크가 나타내어졌다. 그것에 대하여, Core, E1, E2 및 p7을 발현하는 세포에서는 Core 단백질의 피크는 관찰되지 않았다.
1.15∼1.18mg/ml의 단편에 존재하는 Core단백질과 HCV RNA가 HCV입자 구조를 형성하고 있다고 하면, 계면활성제 NP40에서의 처리에 감수성이 있을 것이다. 따라서, pHH JFH1을 HepG2에 도입하고, 2일부터 4일간의 배양액을 0.2%의 NP40에서 20분간 처리한 후에 수크로오스 밀도 구배에 의해 분획했다. 도 7에 나타나 있는 바와 같이 NP40처리를 행함으로써 Core단백질의 피크는 1.20 mg/ml의 단편에서 확인 되었다. 즉, 지질을 함유한 비중이 가벼운 표면막이 NP40에 의해 바이러스 입자로부터 박리되고, 바이러스 유사 구조를 유지하지 않는 핵산과 Core단백질만의 Core입자가 되고, 비중이 무거워진 것이라 생각되었다.
이상의 결과로부터, pHH JFH1을 HepG2 세포로 도입함으로써 HCV 게놈 cDNA로부터 바이러스 RNA가 전사된 후, 바이러스 단백질의 합성과 바이러스 RNA의 복제가 일어나고, 바이러스 입자가 형성되어, 배양액 중에 분비되어진 것이 확인되었다.
[실시예 5]
HCV 입자의 감염성 확인
실시예 4에서 얻어진 HCV입자가 감염성을 갖고 있는지에 대해서 검토했다. pHH JFH1을 Huh7세포 및 HepG2세포에 Fugene 6을 이용하여 도입하고, 3일부터 5일간 배양한 배양 상청을 한외여과막(cut off 1×105 Da)을 이용하여 30배로 농축했다. 다음에 농축한 HCV입자를 포함하는 배양액 100㎕로 Huh7.5.1세포를 15mm커버 슬립 상에서 배양하고, 4일 후에 세포를 항NS5A 항체에서 형광 염색했다. 항NS5A 항체 염색 양성, 즉, 감염 세포를 헤아린 바, 도 8에 나타나 있는 바와 같이 일부의 감염 세포가 확인되었다. 이들의 결과로부터, pHH JFH1을 Huh7 또는 HepG2 세포로 도입함으로써, 배양액 중에 분비된 HCV입자는 감염하는 능력을 갖는 것이 확인되었다.
[실시예 6]
감염성 HCV 입자 산생 세포주의 취득
상기 실시예에서 나타낸 시스템을 이용하고, 감염성 HCV입자를 지속적으로 생산하는 세포주의 수립(樹立)을 시험하였다.
pHH JFH1을 Nhe I로 소화하고, 그 부위에 pSV40/Zeo2(Invitrogen 사)를 Nhe I와 Xba I로 소화해서 꺼낸 SV40프로모터의 하류에 Zeocin 저항성 유전자가 연결되고, 또한 그 하류에 SV40폴리 A부가 시그널이 연결된 발현 유닛(SV40 프로모터/Zeo/polyA)을 포함한 벡터를 제작했다. 그 벡터를 pHH/ZeoJFH1이라고 명명했다 (도 9).
pHH/ZeoJFH1을 Hep G2세포에 Fugene 6으로 도입했다. Zeocin 함유 배지에서 배양했다. 그 후에 주(週)에 2회 배양액을 교환하면서 Zeocin함유 배지에서 배양을 계속했다. 상기의 배양 21일 후의 배양 디쉬로부터 생존 세포의 콜로니를 클론화하고, 배양을 계속했다. 이러한 콜로니의 클로닝에 의해, 100개의 세포 클론을 취득했다.그들의 클론의 배양 상청 중의 Core단백질량은 오르쏘 HCV 항원 IRMA테스트를 이용하여 행하고(Aoyagi et al., J. Clin. Microbiol.,37(1999) p.1802-1808), Core단백질의 발현량이 많은 클론 HepG2/No59 세포를 선출했다.
2×106개의 HepG2/No59 세포를 10cm의 디쉬를 이용하여, 8ml의 배지에서 배양했다. 48시간 후, 배양 상청을 회수했다.
배양 상청 중의 Core단백질을 측정한 결과, HepG2/No59세포는 1,400fmol/L의 Core단백질을 생산하고 있는 것이 확인되었다.
또한, 배양 상청 중에서 조제한 RNA로부터, HCV 게놈 RNA량의 측정을 행하였 다. HCV RNA의 정량적 RT-PCR에 의한 검출은 Takeuchi 등의 방법(Takeuchi T. et al., Gastroenterology, 116(1999) p.636-642)을 따라 HCV RNA의 5'비번역 영역의 RNA를 검출함으로써 행하였다. 구체적으로는, 세포로부터 추출한 RNA에 포함되는 HCV RNA를, 이하의 합성 프라이머와 EZ rTth RNA PCR kit(Applied Biosystems)을 이용하여 PCR증폭하고, ABI prism 7700 sequence detector system(Applied Biosystems)에 의해 검출했다.
R6-130-S17: 5'-CGGGAGAGCCATAGTGG-3'(서열 번호 7)
R6-290-R19: 5'-AGTACCACAAGGCCTTTCG-3'(서열 번호 8)
TaqMan probe, R6-148-S21FT: 5'-CTGCGGAACCGGTGAGTACAC-3'(서열 번호 9)
그 결과, HepG2/No59 세포 배양 상청 중의 HCV RNA는 6.1×108카피/ml인 것이 확인되었다. 이 생산량은 지금까지 보고 된 양보다 약 60배 높다.
또한, HepG2/No59 세포 배양 상청을 한외여과막(cut off 1×105Da)을 이용하여 30배로 농축하고, 농축한 HCV입자를 포함하는 배양액 100㎕로 Huh7.5.1 세포를 15mm 커버 슬립상에서 배양하고, 4일 후에 세포를 항 NS5A항체로 면역 염색했다. 그 결과, 항 NS5A항체 염색 양성, 즉, 감염 세포를 검출할 수 있었다. 이상으로부터, HepG2/No59 세포 배양액 중에 분비된 HCV입자는 감염하는 능력을 갖는 것이 확인되었다.
[실시예 7]
키메라 HCV 발현 벡터에 의한 HCV 입자의 제작
실시예 1에서 제작된 키메라 HCV발현 벡터 pHH H77c(C-p7)/JFH1, pHH J6(C-p7)/JFH1, pHH J1(C-p7)/JFH1 및 pHH J1(C-NS2)/JFH1을, Huh7세포로부터 파생된 주화 세포인 Huh7.5.1세포(Zhong, J. et al., Proc. Natl. Acad. Sci USA, 102, 9294-9299,(2005))에 Fugene 6(로슈 사)을 이용하고, 첨부 메뉴얼에 따라서 도입했다. 도입 3일 후에 그들의 배양 상청을 회수하고, 배양 상청 중에 포함되는 Core단백질의 양을 측정했다. Core 단백질양의 측정에는 오르쏘 HCV항원 IRMA테스트를 사용했다(Aoyagi et al., J. Clin. Microbiol., 37(1999) p.1802-1808). 음성 대조로서 벡터를 도입하지 않는 세포의 배양 상청, 양성 대조로서, pHH JFH1을 도입한 세포의 배양 상청을 사용했다. 그들 실험 결과의 일례를 표 1에 나타낸다. 각키메라 HCV발현 벡터를 도입한 세포 상청에 Core단백질을 확인할 수 있었으므로, 바이러스 입자가 산생되었다고 판단되었다. 또한 pHH J6(C-p7)/JFH1은 pHH JFH1보다 10배이상 높은 HCV생산 능력을 갖는 것도 판명되었다.
발현 벡터 벡터 도입 3일 후의 Core단백질량(fmol/L)
비도입 0
pHH JFH1 252.164
pHH J6(C-p7)/JFH1 2272.878
pHH H77c(C-p7)/JFH1 29.555
pHH J1(C-p7)/JFH1 0.403
pHH J1(C-NS2)/JFH1 11.004
[실시예 8]
pHH J6(C-p7)/JFH1 및 pHH J1(C-p7)/JFH1을 실시예 7에 나타낸 방법으로 Huh7.5.1세포에 도입하고, 도입 후 3일 후의 배양 상청을 한외여과막(cut off 1×105 Da)을 이용하여 농축했다. 농축한 HCV 입자를 포함하는 배양 상청 100㎕을 가하여 Huh7.5.1 세포를 15mm 커버 슬립상에서 배양하고, 4일 후에 세포를 항 NS5A항체로 면역염색했다. 그 결과, pHH J6(C-p7)/JFH1을 도입한 세포로부터 얻어진 배양 상청으로 처리한 세포에서는 항 NS5A항체로 강하게 염색되는 세포가 보여졌다. 한편, pHH J1(C-p7)/JFH1을 도입한 세포로부터 얻어진 배양 상청으로 처리한 세포에서는 pHH J6(C-p7)/JFH1과 비교하면 항 NS5A항체로 염색되는 강도는 약하지만, 대조의 세포와 비교해서 분명하게 염색되어 있었다. 이상으로부터, pHH J6(C-p7)/JFH1 및 pHH J1(C-p7)/JFH1이 도입된 세포에서는 감염성 HCV가 생산된 것이 판명되었다.
또한 pHH J1(C-p7)/JFH1에 실시예 6에 나타낸 방법으로, Zeocin 저항성 유전자 발현 유닛을 삽입한 pHH/Zeo J1(C-p7)/JFH1을 제작했다. 다음에 pHH/Zeo J1(C-p7)/JFH1을 Huh7.5.1에 도입하고, Zeocin 함유 배지에서 증식하는 바이러스 입자를 안정적으로 발현 가능한 세포를 얻었다. 이 세포의 배양 상청 8ml을 한외여과막(cut off 1×105 Da)을 사용하여 농축했다. 이 농축한 배양 상청 중의 HCV Core단백질량은 2365fmol/L이었다. 이 농축 배양 상청 100㎕을 이용하여 Huh7.5.1을 감염시키고, 4일 후에 세포를 항 NS5A항체에서 면역염색했다. 그 결과, pHH/Zeo J1(C-p7)/JFH1을 도입한 안정적 발현성 세포로부터 얻어진 배양 상청으로 처리한 세포에서는 항 NS5A항체로 강하게 염색되는 세포가 보여졌다. 이것으로부터, 본 세포로부터 감염성 HCV가 생산된 것이 판명되었다.
상기와 같은 키메라 HCV 발현 벡터가 그것을 감염시킨 세포내에서 감염성 HCV를 생산할 수 있는 것이 나타내졌다.
(서열 표 프리 텍스트)
서열 번호 1의 서열은 합성 RNA를 나타낸다.
서열 번호 2∼서열 번호 9의 서열은 합성 DNA를 나타낸다.
서열 번호 10∼26의 서열은 프라이머를 나타낸다.
서열 번호 29∼32의 서열은 키메라 DNA를 나타낸다.
서열 번호 33∼45의 서열은 합성 DNA를 나타낸다.
SEQUENCE LISTING <110> Director General of National Institute of Infectious Diseases Tokyo Metropolitan Organization for Medical Research TORAY Industries, Inc. <120> A system for highly producing infectious Hepatits C virus particle <130> PH-2922-PCT <150> JP 2005-287646 <151> 2005-09-30 <160> 45 <170> PatentIn Ver. 2.1 <210> 1 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <220> <223> Inventor: Tanabe, Jun-ichi; Sone, Saburo; Wakita, Takaji Inventor: Ishii, Takashi; Suzuki, Ryosuke; Suzuki, Tetsurou Inventor: Miyamura Tatsuo <400> 1 gcugauggcg augaaugaac acugcguuug cuggcuuuga ugaaa 45 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 2 gtaccccatg aggtcggcaa ag 22 <210> 3 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 3 gctgatggcg atgaatgaac actg 24 <210> 4 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 4 gaccgctccg aagttttcct tg 22 <210> 5 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 5 gaacactgcg tttgctggct ttgatg 26 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 6 cgccctatca ggcagtacca caag 24 <210> 7 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 7 cgggagagcc atagtgg 17 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 8 agtaccacaa ggcctttcg 19 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 9 ctgcggaacc ggtgagtaca c 21 <210> 10 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 10 gccatggcgt tagtatgagt gtcgt 25 <210> 11 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 11 tcgtgctcat ggtgcacggt ctacgagacc 30 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 12 ggcatacgca tatgacgcac ctgtgcacgg 30 <210> 13 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 13 gctctgacga agtacggcac atgtgtc 27 <210> 14 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 14 accgtgcacc atgagcacga atcctaaacc 30 <210> 15 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 15 gaagccgcac gtaagggtat cgatg 25 <210> 16 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 16 cattgtgccc gcaaagagcg tgtgt 25 <210> 17 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 17 gtgcgtcata tgcgtatgcc cgctgaggca 30 <210> 18 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 18 ttgtgctcat ggtgcacggt ctacgagacc 30 <210> 19 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 19 agcttacgcc tatgacgcac ctgtgcacgg 30 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 20 accgtgcacc atgagcacaa atcctaaacc 30 <210> 21 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 21 aagcgggatg taccccatga g 21 <210> 22 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 22 cggctgtaca tggatgaata gcactgggtt 30 <210> 23 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 23 gtgcgtcata ggcgtaagct cgtggtggta 30 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 24 gcgactcctt gctcccatca ctgcttatgc 30 <210> 25 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 25 tgggagacct tgtaacaacg tcgagtgt 28 <210> 26 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: primer <400> 26 cataagcagt gatgggagca aggagtcgcc 30 <210> 27 <211> 9678 <212> DNA <213> Hepatitis C virus <220> <221> CDS <222> (341)..(9442) <400> 27 acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60 cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120 ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccggg 180 aagactgggt cctttcttgg ataaacccac tctatgcccg gccatttggg cgtgcccccg 240 caagactgct agccgagtag cgttgggttg cgaaaggcct tgtggtactg cctgataggg 300 cgcttgcgag tgccccggga ggtctcgtag accgtgcacc atg agc aca aat cct 355 Met Ser Thr Asn Pro 1 5 aaa cct caa aga aaa acc aaa aga aac acc aac cgt cgc cca gaa gac 403 Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Glu Asp 10 15 20 gtt aag ttc ccg ggc ggc ggc cag atc gtt ggc gga gta tac ttg ttg 451 Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu 25 30 35 ccg cgc agg ggc ccc agg ttg ggt gtg cgc acg aca agg aaa act tcg 499 Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Thr Thr Arg Lys Thr Ser 40 45 50 gag cgg tcc cag cca cgt ggg aga cgc cag ccc atc ccc aaa gat cgg 547 Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys Asp Arg 55 60 65 cgc tcc act ggc aag gcc tgg gga aaa cca ggt cgc ccc tgg ccc cta 595 Arg Ser Thr Gly Lys Ala Trp Gly Lys Pro Gly Arg Pro Trp Pro Leu 70 75 80 85 tat ggg aat gag gga ctc ggc tgg gca gga tgg ctc ctg tcc ccc cga 643 Tyr Gly Asn Glu Gly Leu Gly Trp Ala Gly Trp Leu Leu Ser Pro Arg 90 95 100 ggc tct cgc ccc tcc tgg ggc ccc act gac ccc cgg cat agg tcg cgc 691 Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg His Arg Ser Arg 105 110 115 aac gtg ggt aaa gtc atc gac acc cta acg tgt ggc ttt gcc gac ctc 739 Asn Val Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu 120 125 130 atg ggg tac atc ccc gtc gta ggc gcc ccg ctt agt ggc gcc gcc aga 787 Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Ser Gly Ala Ala Arg 135 140 145 gct gtc gcg cac ggc gtg aga gtc ctg gag gac ggg gtt aat tat gca 835 Ala Val Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala 150 155 160 165 aca ggg aac cta ccc ggt ttc ccc ttt tct atc ttc ttg ctg gcc ctg 883 Thr Gly Asn Leu Pro Gly Phe Pro Phe Ser Ile Phe Leu Leu Ala Leu 170 175 180 ttg tcc tgc atc acc gtt ccg gtc tct gct gcc cag gtg aag aat acc 931 Leu Ser Cys Ile Thr Val Pro Val Ser Ala Ala Gln Val Lys Asn Thr 185 190 195 agt agc agc tac atg gtg acc aat gac tgc tcc aat gac agc atc act 979 Ser Ser Ser Tyr Met Val Thr Asn Asp Cys Ser Asn Asp Ser Ile Thr 200 205 210 tgg cag ctc gag gct gcg gtt ctc cac gtc ccc ggg tgc gtc ccg tgc 1027 Trp Gln Leu Glu Ala Ala Val Leu His Val Pro Gly Cys Val Pro Cys 215 220 225 gag aga gtg ggg aat acg tca cgg tgt tgg gtg cca gtc tcg cca aac 1075 Glu Arg Val Gly Asn Thr Ser Arg Cys Trp Val Pro Val Ser Pro Asn 230 235 240 245 atg gct gtg cgg cag ccc ggt gcc ctc acg cag ggt ctg cgg acg cac 1123 Met Ala Val Arg Gln Pro Gly Ala Leu Thr Gln Gly Leu Arg Thr His 250 255 260 atc gat atg gtt gtg atg tcc gcc acc ttc tgc tct gct ctc tac gtg 1171 Ile Asp Met Val Val Met Ser Ala Thr Phe Cys Ser Ala Leu Tyr Val 265 270 275 ggg gac ctc tgt ggc ggg gtg atg ctc gcg gcc cag gtg ttc atc gtc 1219 Gly Asp Leu Cys Gly Gly Val Met Leu Ala Ala Gln Val Phe Ile Val 280 285 290 tcg ccg cag tac cac tgg ttt gtg caa gaa tgc aat tgc tcc atc tac 1267 Ser Pro Gln Tyr His Trp Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr 295 300 305 cct ggc acc atc act gga cac cgc atg gca tgg gac atg atg atg aac 1315 Pro Gly Thr Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn 310 315 320 325 tgg tcg ccc acg gcc acc atg atc ctg gcg tac gtg atg cgc gtc ccc 1363 Trp Ser Pro Thr Ala Thr Met Ile Leu Ala Tyr Val Met Arg Val Pro 330 335 340 gag gtc atc ata gac atc gtt agc ggg gct cac tgg ggc gtc atg ttc 1411 Glu Val Ile Ile Asp Ile Val Ser Gly Ala His Trp Gly Val Met Phe 345 350 355 ggc ttg gcc tac ttc tct atg cag gga gcg tgg gcg aag gtc att gtc 1459 Gly Leu Ala Tyr Phe Ser Met Gln Gly Ala Trp Ala Lys Val Ile Val 360 365 370 atc ctt ctg ctg gcc gct ggg gtg gac gcg ggc acc acc acc gtt gga 1507 Ile Leu Leu Leu Ala Ala Gly Val Asp Ala Gly Thr Thr Thr Val Gly 375 380 385 ggc gct gtt gca cgt tcc acc aac gtg att gcc ggc gtg ttc agc cat 1555 Gly Ala Val Ala Arg Ser Thr Asn Val Ile Ala Gly Val Phe Ser His 390 395 400 405 ggc cct cag cag aac att cag ctc att aac acc aac ggc agt tgg cac 1603 Gly Pro Gln Gln Asn Ile Gln Leu Ile Asn Thr Asn Gly Ser Trp His 410 415 420 atc aac cgt act gcc ttg aat tgc aat gac tcc ttg aac acc ggc ttt 1651 Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp Ser Leu Asn Thr Gly Phe 425 430 435 ctc gcg gcc ttg ttc tac acc aac cgc ttt aac tcg tca ggg tgt cca 1699 Leu Ala Ala Leu Phe Tyr Thr Asn Arg Phe Asn Ser Ser Gly Cys Pro 440 445 450 ggg cgc ctg tcc gcc tgc cgc aac atc gag gct ttc cgg ata ggg tgg 1747 Gly Arg Leu Ser Ala Cys Arg Asn Ile Glu Ala Phe Arg Ile Gly Trp 455 460 465 ggc acc cta cag tac gag gat aat gtc acc aat cca gag gat atg agg 1795 Gly Thr Leu Gln Tyr Glu Asp Asn Val Thr Asn Pro Glu Asp Met Arg 470 475 480 485 ccg tac tgc tgg cac tac ccc cca aag ccg tgt ggc gta gtc ccc gcg 1843 Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys Gly Val Val Pro Ala 490 495 500 agg tct gtg tgt ggc cca gtg tac tgt ttc acc ccc agc ccg gta gta 1891 Arg Ser Val Cys Gly Pro Val Tyr Cys Phe Thr Pro Ser Pro Val Val 505 510 515 gtg ggc acg acc gac aga cgt gga gtg ccc acc tac aca tgg gga gag 1939 Val Gly Thr Thr Asp Arg Arg Gly Val Pro Thr Tyr Thr Trp Gly Glu 520 525 530 aat gag aca gat gtc ttc cta ctg aac agc acc cga ccg ccg cag ggc 1987 Asn Glu Thr Asp Val Phe Leu Leu Asn Ser Thr Arg Pro Pro Gln Gly 535 540 545 tca tgg ttc ggc tgc acg tgg atg aac tcc act ggt ttc acc aag act 2035 Ser Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly Phe Thr Lys Thr 550 555 560 565 tgt ggc gcg cca cct tgc cgc acc aga gct gac ttc aac gcc agc acg 2083 Cys Gly Ala Pro Pro Cys Arg Thr Arg Ala Asp Phe Asn Ala Ser Thr 570 575 580 gac ttg ttg tgc cct acg gat tgt ttt agg aag cat cct gat gcc act 2131 Asp Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys His Pro Asp Ala Thr 585 590 595 tat att aag tgt ggt tct ggg ccc tgg ctc aca cca aag tgc ctg gtc 2179 Tyr Ile Lys Cys Gly Ser Gly Pro Trp Leu Thr Pro Lys Cys Leu Val 600 605 610 cac tac cct tac aga ctc tgg cat tac ccc tgc aca gtc aat ttt acc 2227 His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn Phe Thr 615 620 625 atc ttc aag ata aga atg tat gta ggg ggg gtt gag cac agg ctc acg 2275 Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val Glu His Arg Leu Thr 630 635 640 645 gcc gca tgc aac ttc act cgt ggg gat cgc tgc gac ttg gag gac agg 2323 Ala Ala Cys Asn Phe Thr Arg Gly Asp Arg Cys Asp Leu Glu Asp Arg 650 655 660 gac agg agt cag ctg tct cct ctg ttg cac tct acc acg gaa tgg gcc 2371 Asp Arg Ser Gln Leu Ser Pro Leu Leu His Ser Thr Thr Glu Trp Ala 665 670 675 atc ctg ccc tgc acc tac tca gac tta ccc gct ttg tca act ggt ctt 2419 Ile Leu Pro Cys Thr Tyr Ser Asp Leu Pro Ala Leu Ser Thr Gly Leu 680 685 690 ctc cac ctt cac cag aac atc gtg gac gta caa tac atg tat ggc ctc 2467 Leu His Leu His Gln Asn Ile Val Asp Val Gln Tyr Met Tyr Gly Leu 695 700 705 tca cct gct atc aca aaa tac gtc gtt cga tgg gag tgg gtg gta ctc 2515 Ser Pro Ala Ile Thr Lys Tyr Val Val Arg Trp Glu Trp Val Val Leu 710 715 720 725 tta ttc ctg ctc tta gcg gac gcc aga gtc tgc gcc tgc ttg tgg atg 2563 Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ala Cys Leu Trp Met 730 735 740 ctc atc ttg ttg ggc cag gcc gaa gca gca ttg gag aag ttg gtc gtc 2611 Leu Ile Leu Leu Gly Gln Ala Glu Ala Ala Leu Glu Lys Leu Val Val 745 750 755 ttg cac gct gcg agt gcg gct aac tgc cat ggc ctc cta tat ttt gcc 2659 Leu His Ala Ala Ser Ala Ala Asn Cys His Gly Leu Leu Tyr Phe Ala 760 765 770 atc ttc ttc gtg gca gct tgg cac atc agg ggt cgg gtg gtc ccc ttg 2707 Ile Phe Phe Val Ala Ala Trp His Ile Arg Gly Arg Val Val Pro Leu 775 780 785 acc acc tat tgc ctc act ggc cta tgg ccc ttc tgc cta ctg ctc atg 2755 Thr Thr Tyr Cys Leu Thr Gly Leu Trp Pro Phe Cys Leu Leu Leu Met 790 795 800 805 gca ctg ccc cgg cag gct tat gcc tat gac gca cct gtg cac gga cag 2803 Ala Leu Pro Arg Gln Ala Tyr Ala Tyr Asp Ala Pro Val His Gly Gln 810 815 820 ata ggc gtg ggt ttg ttg ata ttg atc acc ctc ttc aca ctc acc ccg 2851 Ile Gly Val Gly Leu Leu Ile Leu Ile Thr Leu Phe Thr Leu Thr Pro 825 830 835 ggg tat aag acc ctc ctc ggc cag tgt ctg tgg tgg ttg tgc tat ctc 2899 Gly Tyr Lys Thr Leu Leu Gly Gln Cys Leu Trp Trp Leu Cys Tyr Leu 840 845 850 ctg acc ctg ggg gaa gcc atg att cag gag tgg gta cca ccc atg cag 2947 Leu Thr Leu Gly Glu Ala Met Ile Gln Glu Trp Val Pro Pro Met Gln 855 860 865 gtg cgc ggc ggc cgc gat ggc atc gcg tgg gcc gtc act ata ttc tgc 2995 Val Arg Gly Gly Arg Asp Gly Ile Ala Trp Ala Val Thr Ile Phe Cys 870 875 880 885 ccg ggt gtg gtg ttt gac att acc aaa tgg ctt ttg gcg ttg ctt ggg 3043 Pro Gly Val Val Phe Asp Ile Thr Lys Trp Leu Leu Ala Leu Leu Gly 890 895 900 cct gct tac ctc tta agg gcc gct ttg aca cat gtg ccg tac ttc gtc 3091 Pro Ala Tyr Leu Leu Arg Ala Ala Leu Thr His Val Pro Tyr Phe Val 905 910 915 aga gct cac gct ctg ata agg gta tgc gct ttg gtg aag cag ctc gcg 3139 Arg Ala His Ala Leu Ile Arg Val Cys Ala Leu Val Lys Gln Leu Ala 920 925 930 ggg ggt agg tat gtt cag gtg gcg cta ttg gcc ctt ggc agg tgg act 3187 Gly Gly Arg Tyr Val Gln Val Ala Leu Leu Ala Leu Gly Arg Trp Thr 935 940 945 ggc acc tac atc tat gac cac ctc aca cct atg tcg gac tgg gcc gct 3235 Gly Thr Tyr Ile Tyr Asp His Leu Thr Pro Met Ser Asp Trp Ala Ala 950 955 960 965 agc ggc ctg cgc gac tta gcg gtc gcc gtg gaa ccc atc atc ttc agt 3283 Ser Gly Leu Arg Asp Leu Ala Val Ala Val Glu Pro Ile Ile Phe Ser 970 975 980 ccg atg gag aag aag gtc atc gtc tgg gga gcg gag acg gct gca tgt 3331 Pro Met Glu Lys Lys Val Ile Val Trp Gly Ala Glu Thr Ala Ala Cys 985 990 995 ggg gac att cta cat gga ctt ccc gtg tcc gcc cga ctc ggc cag gag 3379 Gly Asp Ile Leu His Gly Leu Pro Val Ser Ala Arg Leu Gly Gln Glu 1000 1005 1010 atc ctc ctc ggc cca gct gat ggc tac acc tcc aag ggg tgg aag ctc 3427 Ile Leu Leu Gly Pro Ala Asp Gly Tyr Thr Ser Lys Gly Trp Lys Leu 1015 1020 1025 ctt gct ccc atc act gct tat gcc cag caa aca cga ggc ctc ctg ggc 3475 Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly 1030 1035 1040 1045 gcc ata gtg gtg agt atg acg ggg cgt gac agg aca gaa cag gcc ggg 3523 Ala Ile Val Val Ser Met Thr Gly Arg Asp Arg Thr Glu Gln Ala Gly 1050 1055 1060 gaa gtc caa atc ctg tcc aca gtc tct cag tcc ttc ctc gga aca acc 3571 Glu Val Gln Ile Leu Ser Thr Val Ser Gln Ser Phe Leu Gly Thr Thr 1065 1070 1075 atc tcg ggg gtt ttg tgg act gtt tac cac gga gct ggc aac aag act 3619 Ile Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr 1080 1085 1090 cta gcc ggc tta cgg ggt ccg gtc acg cag atg tac tcg agt gct gag 3667 Leu Ala Gly Leu Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu 1095 1100 1105 ggg gac ttg gta ggc tgg ccc agc ccc cct ggg acc aag tct ttg gag 3715 Gly Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu 1110 1115 1120 1125 ccg tgc aag tgt gga gcc gtc gac cta tat ctg gtc acg cgg aac gct 3763 Pro Cys Lys Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala 1130 1135 1140 gat gtc atc ccg gct cgg aga cgc ggg gac aag cgg gga gca ttg ctc 3811 Asp Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu 1145 1150 1155 tcc ccg aga ccc att tcg acc ttg aag ggg tcc tcg ggg ggg ccg gtg 3859 Ser Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val 1160 1165 1170 ctc tgc cct agg ggc cac gtc gtt ggg ctc ttc cga gca gct gtg tgc 3907 Leu Cys Pro Arg Gly His Val Val Gly Leu Phe Arg Ala Ala Val Cys 1175 1180 1185 tct cgg ggc gtg gcc aaa tcc atc gat ttc atc ccc gtt gag aca ctc 3955 Ser Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu 1190 1195 1200 1205 gac gtt gtt aca agg tct ccc act ttc agt gac aac agc acg cca ccg 4003 Asp Val Val Thr Arg Ser Pro Thr Phe Ser Asp Asn Ser Thr Pro Pro 1210 1215 1220 gct gtg ccc cag acc tat cag gtc ggg tac ttg cat gct cca act ggc 4051 Ala Val Pro Gln Thr Tyr Gln Val Gly Tyr Leu His Ala Pro Thr Gly 1225 1230 1235 agt gga aag agc acc aag gtc cct gtc gcg tat gcc gcc cag ggg tac 4099 Ser Gly Lys Ser Thr Lys Val Pro Val Ala Tyr Ala Ala Gln Gly Tyr 1240 1245 1250 aaa gta cta gtg ctt aac ccc tcg gta gct gcc acc ctg ggg ttt ggg 4147 Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly 1255 1260 1265 gcg tac cta tcc aag gca cat ggc atc aat ccc aac att agg act gga 4195 Ala Tyr Leu Ser Lys Ala His Gly Ile Asn Pro Asn Ile Arg Thr Gly 1270 1275 1280 1285 gtc agg acc gtg atg acc ggg gag gcc atc acg tac tcc aca tat ggc 4243 Val Arg Thr Val Met Thr Gly Glu Ala Ile Thr Tyr Ser Thr Tyr Gly 1290 1295 1300 aaa ttt ctc gcc gat ggg ggc tgc gct agc ggc gcc tat gac atc atc 4291 Lys Phe Leu Ala Asp Gly Gly Cys Ala Ser Gly Ala Tyr Asp Ile Ile 1305 1310 1315 ata tgc gat gaa tgc cac gct gtg gat gct acc tcc att ctc ggc atc 4339 Ile Cys Asp Glu Cys His Ala Val Asp Ala Thr Ser Ile Leu Gly Ile 1320 1325 1330 gga acg gtc ctt gat caa gca gag aca gcc ggg gtc aga cta act gtg 4387 Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Val Arg Leu Thr Val 1335 1340 1345 ctg gct acg gcc aca ccc ccc ggg tca gtg aca acc ccc cat ccc gat 4435 Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Thr Pro His Pro Asp 1350 1355 1360 1365 ata gaa gag gta ggc ctc ggg cgg gag ggt gag atc ccc ttc tat ggg 4483 Ile Glu Glu Val Gly Leu Gly Arg Glu Gly Glu Ile Pro Phe Tyr Gly 1370 1375 1380 agg gcg att ccc cta tcc tgc atc aag gga ggg aga cac ctg att ttc 4531 Arg Ala Ile Pro Leu Ser Cys Ile Lys Gly Gly Arg His Leu Ile Phe 1385 1390 1395 tgc cac tca aag aaa aag tgt gac gag ctc gcg gcg gcc ctt cgg ggc 4579 Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Ala Leu Arg Gly 1400 1405 1410 atg ggc ttg aat gcc gtg gca tac tat aga ggg ttg gac gtc tcc ata 4627 Met Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Ile 1415 1420 1425 ata cca gct cag gga gat gtg gtg gtc gtc gcc acc gac gcc ctc atg 4675 Ile Pro Ala Gln Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met 1430 1435 1440 1445 acg ggg tac act gga gac ttt gac tcc gtg atc gac tgc aat gta gcg 4723 Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Val Ala 1450 1455 1460 gtc acc caa gct gtc gac ttc agc ctg gac ccc acc ttc act ata acc 4771 Val Thr Gln Ala Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Thr 1465 1470 1475 aca cag act gtc cca caa gac gct gtc tca cgc agt cag cgc cgc ggg 4819 Thr Gln Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly 1480 1485 1490 cgc aca ggt aga gga aga cag ggc act tat agg tat gtt tcc act ggt 4867 Arg Thr Gly Arg Gly Arg Gln Gly Thr Tyr Arg Tyr Val Ser Thr Gly 1495 1500 1505 gaa cga gcc tca gga atg ttt gac agt gta gtg ctt tgt gag tgc tac 4915 Glu Arg Ala Ser Gly Met Phe Asp Ser Val Val Leu Cys Glu Cys Tyr 1510 1515 1520 1525 gac gca ggg gct gcg tgg tac gat ctc aca cca gcg gag acc acc gtc 4963 Asp Ala Gly Ala Ala Trp Tyr Asp Leu Thr Pro Ala Glu Thr Thr Val 1530 1535 1540 agg ctt aga gcg tat ttc aac acg ccc ggc cta ccc gtg tgt caa gac 5011 Arg Leu Arg Ala Tyr Phe Asn Thr Pro Gly Leu Pro Val Cys Gln Asp 1545 1550 1555 cat ctt gaa ttt tgg gag gca gtt ttc acc ggc ctc aca cac ata gac 5059 His Leu Glu Phe Trp Glu Ala Val Phe Thr Gly Leu Thr His Ile Asp 1560 1565 1570 gcc cac ttc ctc tcc caa aca aag caa gcg ggg gag aac ttc gcg tac 5107 Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Glu Asn Phe Ala Tyr 1575 1580 1585 cta gta gcc tac caa gct acg gtg tgc gcc aga gcc aag gcc cct ccc 5155 Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Lys Ala Pro Pro 1590 1595 1600 1605 ccg tcc tgg gac gcc atg tgg aag tgc ctg gcc cga ctc aag cct acg 5203 Pro Ser Trp Asp Ala Met Trp Lys Cys Leu Ala Arg Leu Lys Pro Thr 1610 1615 1620 ctt gcg ggc ccc aca cct ctc ctg tac cgt ttg ggc cct att acc aat 5251 Leu Ala Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Pro Ile Thr Asn 1625 1630 1635 gag gtc acc ctc aca cac cct ggg acg aag tac atc gcc aca tgc atg 5299 Glu Val Thr Leu Thr His Pro Gly Thr Lys Tyr Ile Ala Thr Cys Met 1640 1645 1650 caa gct gac ctt gag gtc atg acc agc acg tgg gtc cta gct gga gga 5347 Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp Val Leu Ala Gly Gly 1655 1660 1665 gtc ctg gca gcc gtc gcc gca tat tgc ctg gcg act gga tgc gtt tcc 5395 Val Leu Ala Ala Val Ala Ala Tyr Cys Leu Ala Thr Gly Cys Val Ser 1670 1675 1680 1685 atc atc ggc cgc ttg cac gtc aac cag cga gtc gtc gtt gcg ccg gat 5443 Ile Ile Gly Arg Leu His Val Asn Gln Arg Val Val Val Ala Pro Asp 1690 1695 1700 aag gag gtc ctg tat gag gct ttt gat gag atg gag gaa tgc gcc tct 5491 Lys Glu Val Leu Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser 1705 1710 1715 agg gcg gct ctc atc gaa gag ggg cag cgg ata gcc gag atg ttg aag 5539 Arg Ala Ala Leu Ile Glu Glu Gly Gln Arg Ile Ala Glu Met Leu Lys 1720 1725 1730 tcc aag atc caa ggc ttg ctg cag cag gcc tct aag cag gcc cag gac 5587 Ser Lys Ile Gln Gly Leu Leu Gln Gln Ala Ser Lys Gln Ala Gln Asp 1735 1740 1745 ata caa ccc gct atg cag gct tca tgg ccc aaa gtg gaa caa ttt tgg 5635 Ile Gln Pro Ala Met Gln Ala Ser Trp Pro Lys Val Glu Gln Phe Trp 1750 1755 1760 1765 gcc aga cac atg tgg aac ttc att agc ggc atc caa tac ctc gca gga 5683 Ala Arg His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly 1770 1775 1780 ttg tca aca ctg cca ggg aac ccc gcg gtg gct tcc atg atg gca ttc 5731 Leu Ser Thr Leu Pro Gly Asn Pro Ala Val Ala Ser Met Met Ala Phe 1785 1790 1795 agt gcc gcc ctc acc agt ccg ttg tcg acc agt acc acc atc ctt ctc 5779 Ser Ala Ala Leu Thr Ser Pro Leu Ser Thr Ser Thr Thr Ile Leu Leu 1800 1805 1810 aac atc atg gga ggc tgg tta gcg tcc cag atc gca cca ccc gcg ggg 5827 Asn Ile Met Gly Gly Trp Leu Ala Ser Gln Ile Ala Pro Pro Ala Gly 1815 1820 1825 gcc acc ggc ttt gtc gtc agt ggc ctg gtg ggg gct gcc gtg ggc agc 5875 Ala Thr Gly Phe Val Val Ser Gly Leu Val Gly Ala Ala Val Gly Ser 1830 1835 1840 1845 ata ggc ctg ggt aag gtg ctg gtg gac atc ctg gca gga tat ggt gcg 5923 Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala 1850 1855 1860 ggc att tcg ggg gcc ctc gtc gca ttc aag atc atg tct ggc gag aag 5971 Gly Ile Ser Gly Ala Leu Val Ala Phe Lys Ile Met Ser Gly Glu Lys 1865 1870 1875 ccc tct atg gaa gat gtc atc aat cta ctg cct ggg atc ctg tct ccg 6019 Pro Ser Met Glu Asp Val Ile Asn Leu Leu Pro Gly Ile Leu Ser Pro 1880 1885 1890 gga gcc ctg gtg gtg ggg gtc atc tgc gcg gcc att ctg cgc cgc cac 6067 Gly Ala Leu Val Val Gly Val Ile Cys Ala Ala Ile Leu Arg Arg His 1895 1900 1905 gtg gga ccg ggg gag ggc gcg gtc caa tgg atg aac agg ctt att gcc 6115 Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala 1910 1915 1920 1925 ttt gct tcc aga gga aac cac gtc gcc cct act cac tac gtg acg gag 6163 Phe Ala Ser Arg Gly Asn His Val Ala Pro Thr His Tyr Val Thr Glu 1930 1935 1940 tcg gat gcg tcg cag cgt gtg acc caa cta ctt ggc tct ctt act ata 6211 Ser Asp Ala Ser Gln Arg Val Thr Gln Leu Leu Gly Ser Leu Thr Ile 1945 1950 1955 acc agc cta ctc aga aga ctc cac aat tgg ata act gag gac tgc ccc 6259 Thr Ser Leu Leu Arg Arg Leu His Asn Trp Ile Thr Glu Asp Cys Pro 1960 1965 1970 atc cca tgc tcc gga tcc tgg ctc cgc gac gtg tgg gac tgg gtt tgc 6307 Ile Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Val Cys 1975 1980 1985 acc atc ttg aca gac ttc aaa aat tgg ctg acc tct aaa ttg ttc ccc 6355 Thr Ile Leu Thr Asp Phe Lys Asn Trp Leu Thr Ser Lys Leu Phe Pro 1990 1995 2000 2005 aag ctg ccc ggc ctc ccc ttc atc tct tgt caa aag ggg tac aag ggt 6403 Lys Leu Pro Gly Leu Pro Phe Ile Ser Cys Gln Lys Gly Tyr Lys Gly 2010 2015 2020 gtg tgg gcc ggc act ggc atc atg acc acg cgc tgc cct tgc ggc gcc 6451 Val Trp Ala Gly Thr Gly Ile Met Thr Thr Arg Cys Pro Cys Gly Ala 2025 2030 2035 aac atc tct ggc aat gtc cgc ctg ggc tct atg agg atc aca ggg cct 6499 Asn Ile Ser Gly Asn Val Arg Leu Gly Ser Met Arg Ile Thr Gly Pro 2040 2045 2050 aaa acc tgc atg aac acc tgg cag ggg acc ttt cct atc aat tgc tac 6547 Lys Thr Cys Met Asn Thr Trp Gln Gly Thr Phe Pro Ile Asn Cys Tyr 2055 2060 2065 acg gag ggc cag tgc gcg ccg aaa ccc ccc acg aac tac aag acc gcc 6595 Thr Glu Gly Gln Cys Ala Pro Lys Pro Pro Thr Asn Tyr Lys Thr Ala 2070 2075 2080 2085 atc tgg agg gtg gcg gcc tcg gag tac gcg gag gtg acg cag cat ggg 6643 Ile Trp Arg Val Ala Ala Ser Glu Tyr Ala Glu Val Thr Gln His Gly 2090 2095 2100 tcg tac tcc tat gta aca gga ctg acc act gac aat ctg aaa att cct 6691 Ser Tyr Ser Tyr Val Thr Gly Leu Thr Thr Asp Asn Leu Lys Ile Pro 2105 2110 2115 tgc caa cta cct tct cca gag ttt ttc tcc tgg gtg gac ggt gtg cag 6739 Cys Gln Leu Pro Ser Pro Glu Phe Phe Ser Trp Val Asp Gly Val Gln 2120 2125 2130 atc cat agg ttt gca ccc aca cca aag ccg ttt ttc cgg gat gag gtc 6787 Ile His Arg Phe Ala Pro Thr Pro Lys Pro Phe Phe Arg Asp Glu Val 2135 2140 2145 tcg ttc tgc gtt ggg ctt aat tcc tat gct gtc ggg tcc cag ctt ccc 6835 Ser Phe Cys Val Gly Leu Asn Ser Tyr Ala Val Gly Ser Gln Leu Pro 2150 2155 2160 2165 tgt gaa cct gag ccc gac gca gac gta ttg agg tcc atg cta aca gat 6883 Cys Glu Pro Glu Pro Asp Ala Asp Val Leu Arg Ser Met Leu Thr Asp 2170 2175 2180 ccg ccc cac atc acg gcg gag act gcg gcg cgg cgc ttg gca cgg gga 6931 Pro Pro His Ile Thr Ala Glu Thr Ala Ala Arg Arg Leu Ala Arg Gly 2185 2190 2195 tca cct cca tct gag gcg agc tcc tca gtg agc cag cta tca gca ccg 6979 Ser Pro Pro Ser Glu Ala Ser Ser Ser Val Ser Gln Leu Ser Ala Pro 2200 2205 2210 tcg ctg cgg gcc acc tgc acc acc cac agc aac acc tat gac gtg gac 7027 Ser Leu Arg Ala Thr Cys Thr Thr His Ser Asn Thr Tyr Asp Val Asp 2215 2220 2225 atg gtc gat gcc aac ctg ctc atg gag ggc ggt gtg gct cag aca gag 7075 Met Val Asp Ala Asn Leu Leu Met Glu Gly Gly Val Ala Gln Thr Glu 2230 2235 2240 2245 cct gag tcc agg gtg ccc gtt ctg gac ttt ctc gag cca atg gcc gag 7123 Pro Glu Ser Arg Val Pro Val Leu Asp Phe Leu Glu Pro Met Ala Glu 2250 2255 2260 gaa gag agc gac ctt gag ccc tca ata cca tcg gag tgc atg ctc ccc 7171 Glu Glu Ser Asp Leu Glu Pro Ser Ile Pro Ser Glu Cys Met Leu Pro 2265 2270 2275 agg agc ggg ttt cca cgg gcc tta ccg gct tgg gca cgg cct gac tac 7219 Arg Ser Gly Phe Pro Arg Ala Leu Pro Ala Trp Ala Arg Pro Asp Tyr 2280 2285 2290 aac ccg ccg ctc gtg gaa tcg tgg agg agg cca gat tac caa ccg ccc 7267 Asn Pro Pro Leu Val Glu Ser Trp Arg Arg Pro Asp Tyr Gln Pro Pro 2295 2300 2305 acc gtt gct ggt tgt gct ctc ccc ccc ccc aag aag gcc ccg acg cct 7315 Thr Val Ala Gly Cys Ala Leu Pro Pro Pro Lys Lys Ala Pro Thr Pro 2310 2315 2320 2325 ccc cca agg aga cgc cgg aca gtg ggt ctg agc gag agc acc ata tca 7363 Pro Pro Arg Arg Arg Arg Thr Val Gly Leu Ser Glu Ser Thr Ile Ser 2330 2335 2340 gaa gcc ctc cag caa ctg gcc atc aag acc ttt ggc cag ccc ccc tcg 7411 Glu Ala Leu Gln Gln Leu Ala Ile Lys Thr Phe Gly Gln Pro Pro Ser 2345 2350 2355 agc ggt gat gca ggc tcg tcc acg ggg gcg ggc gcc gcc gaa tcc ggc 7459 Ser Gly Asp Ala Gly Ser Ser Thr Gly Ala Gly Ala Ala Glu Ser Gly 2360 2365 2370 ggt ccg acg tcc cct ggt gag ccg gcc ccc tca gag aca ggt tcc gcc 7507 Gly Pro Thr Ser Pro Gly Glu Pro Ala Pro Ser Glu Thr Gly Ser Ala 2375 2380 2385 tcc tct atg ccc ccc ctc gag ggg gag cct gga gat ccg gac ctg gag 7555 Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Glu 2390 2395 2400 2405 tct gat cag gta gag ctt caa cct ccc ccc cag ggg ggg ggg gta gct 7603 Ser Asp Gln Val Glu Leu Gln Pro Pro Pro Gln Gly Gly Gly Val Ala 2410 2415 2420 ccc ggt tcg ggc tcg ggg tct tgg tct act tgc tcc gag gag gac gat 7651 Pro Gly Ser Gly Ser Gly Ser Trp Ser Thr Cys Ser Glu Glu Asp Asp 2425 2430 2435 acc acc gtg tgc tgc tcc atg tca tac tcc tgg acc ggg gct cta ata 7699 Thr Thr Val Cys Cys Ser Met Ser Tyr Ser Trp Thr Gly Ala Leu Ile 2440 2445 2450 act ccc tgt agc ccc gaa gag gaa aag ttg cca atc aac cct ttg agt 7747 Thr Pro Cys Ser Pro Glu Glu Glu Lys Leu Pro Ile Asn Pro Leu Ser 2455 2460 2465 aac tcg ctg ttg cga tac cat aac aag gtg tac tgt aca aca tca aag 7795 Asn Ser Leu Leu Arg Tyr His Asn Lys Val Tyr Cys Thr Thr Ser Lys 2470 2475 2480 2485 agc gcc tca cag agg gct aaa aag gta act ttt gac agg acg caa gtg 7843 Ser Ala Ser Gln Arg Ala Lys Lys Val Thr Phe Asp Arg Thr Gln Val 2490 2495 2500 ctc gac gcc cat tat gac tca gtc tta aag gac atc aag cta gcg gct 7891 Leu Asp Ala His Tyr Asp Ser Val Leu Lys Asp Ile Lys Leu Ala Ala 2505 2510 2515 tcc aag gtc agc gca agg ctc ctc acc ttg gag gag gcg tgc cag ttg 7939 Ser Lys Val Ser Ala Arg Leu Leu Thr Leu Glu Glu Ala Cys Gln Leu 2520 2525 2530 act cca ccc cat tct gca aga tcc aag tat gga ttc ggg gcc aag gag 7987 Thr Pro Pro His Ser Ala Arg Ser Lys Tyr Gly Phe Gly Ala Lys Glu 2535 2540 2545 gtc cgc agc ttg tcc ggg agg gcc gtt aac cac atc aag tcc gtg tgg 8035 Val Arg Ser Leu Ser Gly Arg Ala Val Asn His Ile Lys Ser Val Trp 2550 2555 2560 2565 aag gac ctc ctg gaa gac cca caa aca cca att ccc aca acc atc atg 8083 Lys Asp Leu Leu Glu Asp Pro Gln Thr Pro Ile Pro Thr Thr Ile Met 2570 2575 2580 gcc aaa aat gag gtg ttc tgc gtg gac ccc gcc aag ggg ggt aag aaa 8131 Ala Lys Asn Glu Val Phe Cys Val Asp Pro Ala Lys Gly Gly Lys Lys 2585 2590 2595 cca gct cgc ctc atc gtt tac cct gac ctc ggc gtc cgg gtc tgc gag 8179 Pro Ala Arg Leu Ile Val Tyr Pro Asp Leu Gly Val Arg Val Cys Glu 2600 2605 2610 aaa atg gcc ctc tat gac att aca caa aag ctt cct cag gcg gta atg 8227 Lys Met Ala Leu Tyr Asp Ile Thr Gln Lys Leu Pro Gln Ala Val Met 2615 2620 2625 gga gct tcc tat ggc ttc cag tac tcc cct gcc caa cgg gtg gag tat 8275 Gly Ala Ser Tyr Gly Phe Gln Tyr Ser Pro Ala Gln Arg Val Glu Tyr 2630 2635 2640 2645 ctc ttg aaa gca tgg gcg gaa aag aag gac ccc atg ggt ttt tcg tat 8323 Leu Leu Lys Ala Trp Ala Glu Lys Lys Asp Pro Met Gly Phe Ser Tyr 2650 2655 2660 gat acc cga tgc ttc gac tca acc gtc act gag aga gac atc agg acc 8371 Asp Thr Arg Cys Phe Asp Ser Thr Val Thr Glu Arg Asp Ile Arg Thr 2665 2670 2675 gag gag tcc ata tac cag gcc tgc tcc ctg ccc gag gag gcc cgc act 8419 Glu Glu Ser Ile Tyr Gln Ala Cys Ser Leu Pro Glu Glu Ala Arg Thr 2680 2685 2690 gcc ata cac tcg ctg act gag aga ctt tac gta gga ggg ccc atg ttc 8467 Ala Ile His Ser Leu Thr Glu Arg Leu Tyr Val Gly Gly Pro Met Phe 2695 2700 2705 aac agc aag ggt caa acc tgc ggt tac aga cgt tgc cgc gcc agc ggg 8515 Asn Ser Lys Gly Gln Thr Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly 2710 2715 2720 2725 gtg cta acc act agc atg ggt aac acc atc aca tgc tat gtg aaa gcc 8563 Val Leu Thr Thr Ser Met Gly Asn Thr Ile Thr Cys Tyr Val Lys Ala 2730 2735 2740 cta gcg gcc tgc aag gct gcg ggg ata gtt gcg ccc aca atg ctg gta 8611 Leu Ala Ala Cys Lys Ala Ala Gly Ile Val Ala Pro Thr Met Leu Val 2745 2750 2755 tgc ggc gat gac cta gta gtc atc tca gaa agc cag ggg act gag gag 8659 Cys Gly Asp Asp Leu Val Val Ile Ser Glu Ser Gln Gly Thr Glu Glu 2760 2765 2770 gac gag cgg aac ctg aga gcc ttc acg gag gcc atg acc agg tac tct 8707 Asp Glu Arg Asn Leu Arg Ala Phe Thr Glu Ala Met Thr Arg Tyr Ser 2775 2780 2785 gcc cct cct ggt gat ccc ccc aga ccg gaa tat gac ctg gag cta ata 8755 Ala Pro Pro Gly Asp Pro Pro Arg Pro Glu Tyr Asp Leu Glu Leu Ile 2790 2795 2800 2805 aca tcc tgt tcc tca aat gtg tct gtg gcg ttg ggc ccg cgg ggc cgc 8803 Thr Ser Cys Ser Ser Asn Val Ser Val Ala Leu Gly Pro Arg Gly Arg 2810 2815 2820 cgc aga tac tac ctg acc aga gac cca acc act cca ctc gcc cgg gct 8851 Arg Arg Tyr Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala 2825 2830 2835 gcc tgg gaa aca gtt aga cac tcc cct atc aat tca tgg ctg gga aac 8899 Ala Trp Glu Thr Val Arg His Ser Pro Ile Asn Ser Trp Leu Gly Asn 2840 2845 2850 atc atc cag tat gct cca acc ata tgg gtt cgc atg gtc cta atg aca 8947 Ile Ile Gln Tyr Ala Pro Thr Ile Trp Val Arg Met Val Leu Met Thr 2855 2860 2865 cac ttc ttc tcc att ctc atg gtc caa gac acc ctg gac cag aac ctc 8995 His Phe Phe Ser Ile Leu Met Val Gln Asp Thr Leu Asp Gln Asn Leu 2870 2875 2880 2885 aac ttt gag atg tat gga tca gta tac tcc gtg aat cct ttg gac ctt 9043 Asn Phe Glu Met Tyr Gly Ser Val Tyr Ser Val Asn Pro Leu Asp Leu 2890 2895 2900 cca gcc ata att gag agg tta cac ggg ctt gac gcc ttt tct atg cac 9091 Pro Ala Ile Ile Glu Arg Leu His Gly Leu Asp Ala Phe Ser Met His 2905 2910 2915 aca tac tct cac cac gaa ctg acg cgg gtg gct tca gcc ctc aga aaa 9139 Thr Tyr Ser His His Glu Leu Thr Arg Val Ala Ser Ala Leu Arg Lys 2920 2925 2930 ctt ggg gcg cca ccc ctc agg gtg tgg aag agt cgg gct cgc gca gtc 9187 Leu Gly Ala Pro Pro Leu Arg Val Trp Lys Ser Arg Ala Arg Ala Val 2935 2940 2945 agg gcg tcc ctc atc tcc cgt gga ggg aaa gcg gcc gtt tgc ggc cga 9235 Arg Ala Ser Leu Ile Ser Arg Gly Gly Lys Ala Ala Val Cys Gly Arg 2950 2955 2960 2965 tat ctc ttc aat tgg gcg gtg aag acc aag ctc aaa ctc act cca ttg 9283 Tyr Leu Phe Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Leu 2970 2975 2980 ccg gag gcg cgc cta ctg gac tta tcc agt tgg ttc acc gtc ggc gcc 9331 Pro Glu Ala Arg Leu Leu Asp Leu Ser Ser Trp Phe Thr Val Gly Ala 2985 2990 2995 ggc ggg ggc gac att ttt cac agc gtg tcg cgc gcc cga ccc cgc tca 9379 Gly Gly Gly Asp Ile Phe His Ser Val Ser Arg Ala Arg Pro Arg Ser 3000 3005 3010 tta ctc ttc ggc cta ctc cta ctt ttc gta ggg gta ggc ctc ttc cta 9427 Leu Leu Phe Gly Leu Leu Leu Leu Phe Val Gly Val Gly Leu Phe Leu 3015 3020 3025 ctc ccc gct cgg tag agcggcacac actaggtaca ctccatagct aactgttcct 9482 Leu Pro Ala Arg 3030 tttttttttt tttttttttt tttttttttt tttttttttt ttcttttttt tttttttccc 9542 tctttcttcc cttctcatct tattctactt tctttcttgg tggctccatc ttagccctag 9602 tcacggctag ctgtgaaagg tccgtgagcc gcatgactgc agagagtgcc gtaactggtc 9662 tctctgcaga tcatgt 9678 <210> 28 <211> 3033 <212> PRT <213> Hepatitis C virus <400> 28 Met Ser Thr Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn 1 5 10 15 Arg Arg Pro Glu Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly 20 25 30 Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Thr 35 40 45 Thr Arg Lys Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro 50 55 60 Ile Pro Lys Asp Arg Arg Ser Thr Gly Lys Ala Trp Gly Lys Pro Gly 65 70 75 80 Arg Pro Trp Pro Leu Tyr Gly Asn Glu Gly Leu Gly Trp Ala Gly Trp 85 90 95 Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro 100 105 110 Arg His Arg Ser Arg Asn Val Gly Lys Val Ile Asp Thr Leu Thr Cys 115 120 125 Gly Phe Ala Asp Leu Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu 130 135 140 Ser Gly Ala Ala Arg Ala Val Ala His Gly Val Arg Val Leu Glu Asp 145 150 155 160 Gly Val Asn Tyr Ala Thr Gly Asn Leu Pro Gly Phe Pro Phe Ser Ile 165 170 175 Phe Leu Leu Ala Leu Leu Ser Cys Ile Thr Val Pro Val Ser Ala Ala 180 185 190 Gln Val Lys Asn Thr Ser Ser Ser Tyr Met Val Thr Asn Asp Cys Ser 195 200 205 Asn Asp Ser Ile Thr Trp Gln Leu Glu Ala Ala Val Leu His Val Pro 210 215 220 Gly Cys Val Pro Cys Glu Arg Val Gly Asn Thr Ser Arg Cys Trp Val 225 230 235 240 Pro Val Ser Pro Asn Met Ala Val Arg Gln Pro Gly Ala Leu Thr Gln 245 250 255 Gly Leu Arg Thr His Ile Asp Met Val Val Met Ser Ala Thr Phe Cys 260 265 270 Ser Ala Leu Tyr Val Gly Asp Leu Cys Gly Gly Val Met Leu Ala Ala 275 280 285 Gln Val Phe Ile Val Ser Pro Gln Tyr His Trp Phe Val Gln Glu Cys 290 295 300 Asn Cys Ser Ile Tyr Pro Gly Thr Ile Thr Gly His Arg Met Ala Trp 305 310 315 320 Asp Met Met Met Asn Trp Ser Pro Thr Ala Thr Met Ile Leu Ala Tyr 325 330 335 Val Met Arg Val Pro Glu Val Ile Ile Asp Ile Val Ser Gly Ala His 340 345 350 Trp Gly Val Met Phe Gly Leu Ala Tyr Phe Ser Met Gln Gly Ala Trp 355 360 365 Ala Lys Val Ile Val Ile Leu Leu Leu Ala Ala Gly Val Asp Ala Gly 370 375 380 Thr Thr Thr Val Gly Gly Ala Val Ala Arg Ser Thr Asn Val Ile Ala 385 390 395 400 Gly Val Phe Ser His Gly Pro Gln Gln Asn Ile Gln Leu Ile Asn Thr 405 410 415 Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp Ser 420 425 430 Leu Asn Thr Gly Phe Leu Ala Ala Leu Phe Tyr Thr Asn Arg Phe Asn 435 440 445 Ser Ser Gly Cys Pro Gly Arg Leu Ser Ala Cys Arg Asn Ile Glu Ala 450 455 460 Phe Arg Ile Gly Trp Gly Thr Leu Gln Tyr Glu Asp Asn Val Thr Asn 465 470 475 480 Pro Glu Asp Met Arg Pro Tyr Cys Trp His Tyr Pro Pro Lys Pro Cys 485 490 495 Gly Val Val Pro Ala Arg Ser Val Cys Gly Pro Val Tyr Cys Phe Thr 500 505 510 Pro Ser Pro Val Val Val Gly Thr Thr Asp Arg Arg Gly Val Pro Thr 515 520 525 Tyr Thr Trp Gly Glu Asn Glu Thr Asp Val Phe Leu Leu Asn Ser Thr 530 535 540 Arg Pro Pro Gln Gly Ser Trp Phe Gly Cys Thr Trp Met Asn Ser Thr 545 550 555 560 Gly Phe Thr Lys Thr Cys Gly Ala Pro Pro Cys Arg Thr Arg Ala Asp 565 570 575 Phe Asn Ala Ser Thr Asp Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys 580 585 590 His Pro Asp Ala Thr Tyr Ile Lys Cys Gly Ser Gly Pro Trp Leu Thr 595 600 605 Pro Lys Cys Leu Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys 610 615 620 Thr Val Asn Phe Thr Ile Phe Lys Ile Arg Met Tyr Val Gly Gly Val 625 630 635 640 Glu His Arg Leu Thr Ala Ala Cys Asn Phe Thr Arg Gly Asp Arg Cys 645 650 655 Asp Leu Glu Asp Arg Asp Arg Ser Gln Leu Ser Pro Leu Leu His Ser 660 665 670 Thr Thr Glu Trp Ala Ile Leu Pro Cys Thr Tyr Ser Asp Leu Pro Ala 675 680 685 Leu Ser Thr Gly Leu Leu His Leu His Gln Asn Ile Val Asp Val Gln 690 695 700 Tyr Met Tyr Gly Leu Ser Pro Ala Ile Thr Lys Tyr Val Val Arg Trp 705 710 715 720 Glu Trp Val Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys 725 730 735 Ala Cys Leu Trp Met Leu Ile Leu Leu Gly Gln Ala Glu Ala Ala Leu 740 745 750 Glu Lys Leu Val Val Leu His Ala Ala Ser Ala Ala Asn Cys His Gly 755 760 765 Leu Leu Tyr Phe Ala Ile Phe Phe Val Ala Ala Trp His Ile Arg Gly 770 775 780 Arg Val Val Pro Leu Thr Thr Tyr Cys Leu Thr Gly Leu Trp Pro Phe 785 790 795 800 Cys Leu Leu Leu Met Ala Leu Pro Arg Gln Ala Tyr Ala Tyr Asp Ala 805 810 815 Pro Val His Gly Gln Ile Gly Val Gly Leu Leu Ile Leu Ile Thr Leu 820 825 830 Phe Thr Leu Thr Pro Gly Tyr Lys Thr Leu Leu Gly Gln Cys Leu Trp 835 840 845 Trp Leu Cys Tyr Leu Leu Thr Leu Gly Glu Ala Met Ile Gln Glu Trp 850 855 860 Val Pro Pro Met Gln Val Arg Gly Gly Arg Asp Gly Ile Ala Trp Ala 865 870 875 880 Val Thr Ile Phe Cys Pro Gly Val Val Phe Asp Ile Thr Lys Trp Leu 885 890 895 Leu Ala Leu Leu Gly Pro Ala Tyr Leu Leu Arg Ala Ala Leu Thr His 900 905 910 Val Pro Tyr Phe Val Arg Ala His Ala Leu Ile Arg Val Cys Ala Leu 915 920 925 Val Lys Gln Leu Ala Gly Gly Arg Tyr Val Gln Val Ala Leu Leu Ala 930 935 940 Leu Gly Arg Trp Thr Gly Thr Tyr Ile Tyr Asp His Leu Thr Pro Met 945 950 955 960 Ser Asp Trp Ala Ala Ser Gly Leu Arg Asp Leu Ala Val Ala Val Glu 965 970 975 Pro Ile Ile Phe Ser Pro Met Glu Lys Lys Val Ile Val Trp Gly Ala 980 985 990 Glu Thr Ala Ala Cys Gly Asp Ile Leu His Gly Leu Pro Val Ser Ala 995 1000 1005 Arg Leu Gly Gln Glu Ile Leu Leu Gly Pro Ala Asp Gly Tyr Thr Ser 1010 1015 1020 Lys Gly Trp Lys Leu Leu Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr 1025 1030 1035 1040 Arg Gly Leu Leu Gly Ala Ile Val Val Ser Met Thr Gly Arg Asp Arg 1045 1050 1055 Thr Glu Gln Ala Gly Glu Val Gln Ile Leu Ser Thr Val Ser Gln Ser 1060 1065 1070 Phe Leu Gly Thr Thr Ile Ser Gly Val Leu Trp Thr Val Tyr His Gly 1075 1080 1085 Ala Gly Asn Lys Thr Leu Ala Gly Leu Arg Gly Pro Val Thr Gln Met 1090 1095 1100 Tyr Ser Ser Ala Glu Gly Asp Leu Val Gly Trp Pro Ser Pro Pro Gly 1105 1110 1115 1120 Thr Lys Ser Leu Glu Pro Cys Lys Cys Gly Ala Val Asp Leu Tyr Leu 1125 1130 1135 Val Thr Arg Asn Ala Asp Val Ile Pro Ala Arg Arg Arg Gly Asp Lys 1140 1145 1150 Arg Gly Ala Leu Leu Ser Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser 1155 1160 1165 Ser Gly Gly Pro Val Leu Cys Pro Arg Gly His Val Val Gly Leu Phe 1170 1175 1180 Arg Ala Ala Val Cys Ser Arg Gly Val Ala Lys Ser Ile Asp Phe Ile 1185 1190 1195 1200 Pro Val Glu Thr Leu Asp Val Val Thr Arg Ser Pro Thr Phe Ser Asp 1205 1210 1215 Asn Ser Thr Pro Pro Ala Val Pro Gln Thr Tyr Gln Val Gly Tyr Leu 1220 1225 1230 His Ala Pro Thr Gly Ser Gly Lys Ser Thr Lys Val Pro Val Ala Tyr 1235 1240 1245 Ala Ala Gln Gly Tyr Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala 1250 1255 1260 Thr Leu Gly Phe Gly Ala Tyr Leu Ser Lys Ala His Gly Ile Asn Pro 1265 1270 1275 1280 Asn Ile Arg Thr Gly Val Arg Thr Val Met Thr Gly Glu Ala Ile Thr 1285 1290 1295 Tyr Ser Thr Tyr Gly Lys Phe Leu Ala Asp Gly Gly Cys Ala Ser Gly 1300 1305 1310 Ala Tyr Asp Ile Ile Ile Cys Asp Glu Cys His Ala Val Asp Ala Thr 1315 1320 1325 Ser Ile Leu Gly Ile Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly 1330 1335 1340 Val Arg Leu Thr Val Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr 1345 1350 1355 1360 Thr Pro His Pro Asp Ile Glu Glu Val Gly Leu Gly Arg Glu Gly Glu 1365 1370 1375 Ile Pro Phe Tyr Gly Arg Ala Ile Pro Leu Ser Cys Ile Lys Gly Gly 1380 1385 1390 Arg His Leu Ile Phe Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala 1395 1400 1405 Ala Ala Leu Arg Gly Met Gly Leu Asn Ala Val Ala Tyr Tyr Arg Gly 1410 1415 1420 Leu Asp Val Ser Ile Ile Pro Ala Gln Gly Asp Val Val Val Val Ala 1425 1430 1435 1440 Thr Asp Ala Leu Met Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile 1445 1450 1455 Asp Cys Asn Val Ala Val Thr Gln Ala Val Asp Phe Ser Leu Asp Pro 1460 1465 1470 Thr Phe Thr Ile Thr Thr Gln Thr Val Pro Gln Asp Ala Val Ser Arg 1475 1480 1485 Ser Gln Arg Arg Gly Arg Thr Gly Arg Gly Arg Gln Gly Thr Tyr Arg 1490 1495 1500 Tyr Val Ser Thr Gly Glu Arg Ala Ser Gly Met Phe Asp Ser Val Val 1505 1510 1515 1520 Leu Cys Glu Cys Tyr Asp Ala Gly Ala Ala Trp Tyr Asp Leu Thr Pro 1525 1530 1535 Ala Glu Thr Thr Val Arg Leu Arg Ala Tyr Phe Asn Thr Pro Gly Leu 1540 1545 1550 Pro Val Cys Gln Asp His Leu Glu Phe Trp Glu Ala Val Phe Thr Gly 1555 1560 1565 Leu Thr His Ile Asp Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly 1570 1575 1580 Glu Asn Phe Ala Tyr Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg 1585 1590 1595 1600 Ala Lys Ala Pro Pro Pro Ser Trp Asp Ala Met Trp Lys Cys Leu Ala 1605 1610 1615 Arg Leu Lys Pro Thr Leu Ala Gly Pro Thr Pro Leu Leu Tyr Arg Leu 1620 1625 1630 Gly Pro Ile Thr Asn Glu Val Thr Leu Thr His Pro Gly Thr Lys Tyr 1635 1640 1645 Ile Ala Thr Cys Met Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp 1650 1655 1660 Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr Cys Leu Ala 1665 1670 1675 1680 Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Val Asn Gln Arg Val 1685 1690 1695 Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe Asp Glu Met 1700 1705 1710 Glu Glu Cys Ala Ser Arg Ala Ala Leu Ile Glu Glu Gly Gln Arg Ile 1715 1720 1725 Ala Glu Met Leu Lys Ser Lys Ile Gln Gly Leu Leu Gln Gln Ala Ser 1730 1735 1740 Lys Gln Ala Gln Asp Ile Gln Pro Ala Met Gln Ala Ser Trp Pro Lys 1745 1750 1755 1760 Val Glu Gln Phe Trp Ala Arg His Met Trp Asn Phe Ile Ser Gly Ile 1765 1770 1775 Gln Tyr Leu Ala Gly Leu Ser Thr Leu Pro Gly Asn Pro Ala Val Ala 1780 1785 1790 Ser Met Met Ala Phe Ser Ala Ala Leu Thr Ser Pro Leu Ser Thr Ser 1795 1800 1805 Thr Thr Ile Leu Leu Asn Ile Met Gly Gly Trp Leu Ala Ser Gln Ile 1810 1815 1820 Ala Pro Pro Ala Gly Ala Thr Gly Phe Val Val Ser Gly Leu Val Gly 1825 1830 1835 1840 Ala Ala Val Gly Ser Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu 1845 1850 1855 Ala Gly Tyr Gly Ala Gly Ile Ser Gly Ala Leu Val Ala Phe Lys Ile 1860 1865 1870 Met Ser Gly Glu Lys Pro Ser Met Glu Asp Val Ile Asn Leu Leu Pro 1875 1880 1885 Gly Ile Leu Ser Pro Gly Ala Leu Val Val Gly Val Ile Cys Ala Ala 1890 1895 1900 Ile Leu Arg Arg His Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met 1905 1910 1915 1920 Asn Arg Leu Ile Ala Phe Ala Ser Arg Gly Asn His Val Ala Pro Thr 1925 1930 1935 His Tyr Val Thr Glu Ser Asp Ala Ser Gln Arg Val Thr Gln Leu Leu 1940 1945 1950 Gly Ser Leu Thr Ile Thr Ser Leu Leu Arg Arg Leu His Asn Trp Ile 1955 1960 1965 Thr Glu Asp Cys Pro Ile Pro Cys Ser Gly Ser Trp Leu Arg Asp Val 1970 1975 1980 Trp Asp Trp Val Cys Thr Ile Leu Thr Asp Phe Lys Asn Trp Leu Thr 1985 1990 1995 2000 Ser Lys Leu Phe Pro Lys Leu Pro Gly Leu Pro Phe Ile Ser Cys Gln 2005 2010 2015 Lys Gly Tyr Lys Gly Val Trp Ala Gly Thr Gly Ile Met Thr Thr Arg 2020 2025 2030 Cys Pro Cys Gly Ala Asn Ile Ser Gly Asn Val Arg Leu Gly Ser Met 2035 2040 2045 Arg Ile Thr Gly Pro Lys Thr Cys Met Asn Thr Trp Gln Gly Thr Phe 2050 2055 2060 Pro Ile Asn Cys Tyr Thr Glu Gly Gln Cys Ala Pro Lys Pro Pro Thr 2065 2070 2075 2080 Asn Tyr Lys Thr Ala Ile Trp Arg Val Ala Ala Ser Glu Tyr Ala Glu 2085 2090 2095 Val Thr Gln His Gly Ser Tyr Ser Tyr Val Thr Gly Leu Thr Thr Asp 2100 2105 2110 Asn Leu Lys Ile Pro Cys Gln Leu Pro Ser Pro Glu Phe Phe Ser Trp 2115 2120 2125 Val Asp Gly Val Gln Ile His Arg Phe Ala Pro Thr Pro Lys Pro Phe 2130 2135 2140 Phe Arg Asp Glu Val Ser Phe Cys Val Gly Leu Asn Ser Tyr Ala Val 2145 2150 2155 2160 Gly Ser Gln Leu Pro Cys Glu Pro Glu Pro Asp Ala Asp Val Leu Arg 2165 2170 2175 Ser Met Leu Thr Asp Pro Pro His Ile Thr Ala Glu Thr Ala Ala Arg 2180 2185 2190 Arg Leu Ala Arg Gly Ser Pro Pro Ser Glu Ala Ser Ser Ser Val Ser 2195 2200 2205 Gln Leu Ser Ala Pro Ser Leu Arg Ala Thr Cys Thr Thr His Ser Asn 2210 2215 2220 Thr Tyr Asp Val Asp Met Val Asp Ala Asn Leu Leu Met Glu Gly Gly 2225 2230 2235 2240 Val Ala Gln Thr Glu Pro Glu Ser Arg Val Pro Val Leu Asp Phe Leu 2245 2250 2255 Glu Pro Met Ala Glu Glu Glu Ser Asp Leu Glu Pro Ser Ile Pro Ser 2260 2265 2270 Glu Cys Met Leu Pro Arg Ser Gly Phe Pro Arg Ala Leu Pro Ala Trp 2275 2280 2285 Ala Arg Pro Asp Tyr Asn Pro Pro Leu Val Glu Ser Trp Arg Arg Pro 2290 2295 2300 Asp Tyr Gln Pro Pro Thr Val Ala Gly Cys Ala Leu Pro Pro Pro Lys 2305 2310 2315 2320 Lys Ala Pro Thr Pro Pro Pro Arg Arg Arg Arg Thr Val Gly Leu Ser 2325 2330 2335 Glu Ser Thr Ile Ser Glu Ala Leu Gln Gln Leu Ala Ile Lys Thr Phe 2340 2345 2350 Gly Gln Pro Pro Ser Ser Gly Asp Ala Gly Ser Ser Thr Gly Ala Gly 2355 2360 2365 Ala Ala Glu Ser Gly Gly Pro Thr Ser Pro Gly Glu Pro Ala Pro Ser 2370 2375 2380 Glu Thr Gly Ser Ala Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly 2385 2390 2395 2400 Asp Pro Asp Leu Glu Ser Asp Gln Val Glu Leu Gln Pro Pro Pro Gln 2405 2410 2415 Gly Gly Gly Val Ala Pro Gly Ser Gly Ser Gly Ser Trp Ser Thr Cys 2420 2425 2430 Ser Glu Glu Asp Asp Thr Thr Val Cys Cys Ser Met Ser Tyr Ser Trp 2435 2440 2445 Thr Gly Ala Leu Ile Thr Pro Cys Ser Pro Glu Glu Glu Lys Leu Pro 2450 2455 2460 Ile Asn Pro Leu Ser Asn Ser Leu Leu Arg Tyr His Asn Lys Val Tyr 2465 2470 2475 2480 Cys Thr Thr Ser Lys Ser Ala Ser Gln Arg Ala Lys Lys Val Thr Phe 2485 2490 2495 Asp Arg Thr Gln Val Leu Asp Ala His Tyr Asp Ser Val Leu Lys Asp 2500 2505 2510 Ile Lys Leu Ala Ala Ser Lys Val Ser Ala Arg Leu Leu Thr Leu Glu 2515 2520 2525 Glu Ala Cys Gln Leu Thr Pro Pro His Ser Ala Arg Ser Lys Tyr Gly 2530 2535 2540 Phe Gly Ala Lys Glu Val Arg Ser Leu Ser Gly Arg Ala Val Asn His 2545 2550 2555 2560 Ile Lys Ser Val Trp Lys Asp Leu Leu Glu Asp Pro Gln Thr Pro Ile 2565 2570 2575 Pro Thr Thr Ile Met Ala Lys Asn Glu Val Phe Cys Val Asp Pro Ala 2580 2585 2590 Lys Gly Gly Lys Lys Pro Ala Arg Leu Ile Val Tyr Pro Asp Leu Gly 2595 2600 2605 Val Arg Val Cys Glu Lys Met Ala Leu Tyr Asp Ile Thr Gln Lys Leu 2610 2615 2620 Pro Gln Ala Val Met Gly Ala Ser Tyr Gly Phe Gln Tyr Ser Pro Ala 2625 2630 2635 2640 Gln Arg Val Glu Tyr Leu Leu Lys Ala Trp Ala Glu Lys Lys Asp Pro 2645 2650 2655 Met Gly Phe Ser Tyr Asp Thr Arg Cys Phe Asp Ser Thr Val Thr Glu 2660 2665 2670 Arg Asp Ile Arg Thr Glu Glu Ser Ile Tyr Gln Ala Cys Ser Leu Pro 2675 2680 2685 Glu Glu Ala Arg Thr Ala Ile His Ser Leu Thr Glu Arg Leu Tyr Val 2690 2695 2700 Gly Gly Pro Met Phe Asn Ser Lys Gly Gln Thr Cys Gly Tyr Arg Arg 2705 2710 2715 2720 Cys Arg Ala Ser Gly Val Leu Thr Thr Ser Met Gly Asn Thr Ile Thr 2725 2730 2735 Cys Tyr Val Lys Ala Leu Ala Ala Cys Lys Ala Ala Gly Ile Val Ala 2740 2745 2750 Pro Thr Met Leu Val Cys Gly Asp Asp Leu Val Val Ile Ser Glu Ser 2755 2760 2765 Gln Gly Thr Glu Glu Asp Glu Arg Asn Leu Arg Ala Phe Thr Glu Ala 2770 2775 2780 Met Thr Arg Tyr Ser Ala Pro Pro Gly Asp Pro Pro Arg Pro Glu Tyr 2785 2790 2795 2800 Asp Leu Glu Leu Ile Thr Ser Cys Ser Ser Asn Val Ser Val Ala Leu 2805 2810 2815 Gly Pro Arg Gly Arg Arg Arg Tyr Tyr Leu Thr Arg Asp Pro Thr Thr 2820 2825 2830 Pro Leu Ala Arg Ala Ala Trp Glu Thr Val Arg His Ser Pro Ile Asn 2835 2840 2845 Ser Trp Leu Gly Asn Ile Ile Gln Tyr Ala Pro Thr Ile Trp Val Arg 2850 2855 2860 Met Val Leu Met Thr His Phe Phe Ser Ile Leu Met Val Gln Asp Thr 2865 2870 2875 2880 Leu Asp Gln Asn Leu Asn Phe Glu Met Tyr Gly Ser Val Tyr Ser Val 2885 2890 2895 Asn Pro Leu Asp Leu Pro Ala Ile Ile Glu Arg Leu His Gly Leu Asp 2900 2905 2910 Ala Phe Ser Met His Thr Tyr Ser His His Glu Leu Thr Arg Val Ala 2915 2920 2925 Ser Ala Leu Arg Lys Leu Gly Ala Pro Pro Leu Arg Val Trp Lys Ser 2930 2935 2940 Arg Ala Arg Ala Val Arg Ala Ser Leu Ile Ser Arg Gly Gly Lys Ala 2945 2950 2955 2960 Ala Val Cys Gly Arg Tyr Leu Phe Asn Trp Ala Val Lys Thr Lys Leu 2965 2970 2975 Lys Leu Thr Pro Leu Pro Glu Ala Arg Leu Leu Asp Leu Ser Ser Trp 2980 2985 2990 Phe Thr Val Gly Ala Gly Gly Gly Asp Ile Phe His Ser Val Ser Arg 2995 3000 3005 Ala Arg Pro Arg Ser Leu Leu Phe Gly Leu Leu Leu Leu Phe Val Gly 3010 3015 3020 Val Gly Leu Phe Leu Leu Pro Ala Arg 3025 3030 <210> 29 <211> 9678 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: chimeric DNA <400> 29 acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60 cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120 ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccggg 180 aagactgggt cctttcttgg ataaacccac tctatgcccg gccatttggg cgtgcccccg 240 caagactgct agccgagtag cgttgggttg cgaaaggcct tgtggtactg cctgataggg 300 tgcttgcgag tgccccggga ggtctcgtag accgtgcacc atgagcacaa atcctaaacc 360 tcaaagaaaa accaaaagaa acaccaaccg tcgcccacaa gacgttaagt ttccgggcgg 420 cggccagatc gttggcggag tatacttgtt gccgcgcagg ggccccaggt tgggtgtgcg 480 cgcgacaagg aagacttcgg agcggtccca gccacgtgga aggcgccagc ccatccctaa 540 agatcggcgc tccactggca aatcctgggg aaaaccagga tacccctggc ccctatacgg 600 gaatgaggga ctcggctggg caggatggct cctgtccccc cgaggttccc gtccctcttg 660 gggccccaat gacccccggc ataggtcgcg caacgtgggt aaggtcatcg ataccctaac 720 gtgcggcttt gccgacctca tggggtacat ccctgtcgtg ggcgccccgc tcggcggcgt 780 cgccagagct ctcgcgcatg gcgtgagagt cctggaggac ggggttaatt ttgcaacagg 840 gaacttaccc ggttgctcct tttctatctt cttgctggcc ctgctgtcct gcatcaccac 900 cccggtctcc gctgccgaag tgaagaacat cagtaccggc tacatggtga ctaacgactg 960 caccaatgac agcattacct ggcagctcca ggctgctgtc ctccacgtcc ccgggtgcgt 1020 cccgtgcgag aaagtgggga atgcatctca gtgctggata ccggtctcac cgaatgtggc 1080 cgtgcagcgg cccggcgccc tcacgcaggg cttgcggacg cacatcgaca tggttgtgat 1140 gtccgccacg ctctgctctg ccctctacgt gggggacctc tgcggtgggg tgatgctcgc 1200 agcccaaatg ttcattgtct cgccgcagca ccactggttt gtccaagact gcaattgctc 1260 catctaccct ggtaccatca ctggacaccg catggcatgg gacatgatga tgaactggtc 1320 gcccacggct accatgatct tggcgtacgc gatgcgtgtc cccgaggtca ttatagacat 1380 cattagcggg gctcattggg gcgtcatgtt cggcttggcc tacttctcta tgcagggagc 1440 gtgggcgaaa gtcgttgtca tccttctgtt ggccgccggg gtggacgcgc gcacccatac 1500 tgttgggggt tctgccgcgc agaccaccgg gcgcctcacc agcttatttg acatgggccc 1560 caggcagaaa atccagctcg ttaacaccaa tggcagctgg cacatcaacc gcaccgccct 1620 gaactgcaat gactccttgc acaccggctt tatcgcgtct ctgttctaca cccacagctt 1680 caactcgtca ggatgtcccg aacgcatgtc cgcctgccgc agtatcgagg ccttccgggt 1740 gggatggggc gccttgcaat atgaggataa tgtcaccaat ccagaggata tgagacccta 1800 ttgctggcac tacccaccaa ggcagtgtgg cgtggtctcc gcgaagactg tgtgtggccc 1860 agtgtactgt ttcaccccca gcccagtggt agtgggcacg accgacaggc ttggagcgcc 1920 cacttacacg tggggggaga atgagacaga tgtcttccta ttgaacagca ctcgaccacc 1980 gctggggtca tggttcggct gcacgtggat gaactcttct ggctacacca agacttgcgg 2040 cgcaccaccc tgccgtacta gagctgactt caacgccagc acggacctgt tgtgccccac 2100 ggactgtttt aggaagcatc ctgataccac ttacctcaaa tgcggctctg ggccctggct 2160 cacgccaagg tgcctgatcg actaccccta caggctctgg cattacccct gcacagttaa 2220 ctataccatc ttcaaaataa ggatgtatgt gggaggggtt gagcacaggc tcacggctgc 2280 atgcaatttc actcgtgggg atcgttgcaa cttggaggac agagacagaa gtcaactgtc 2340 tcctttgttg cactccacca cggaatgggc cattttacct tgctcttact cggacctgcc 2400 cgccttgtcg actggtcttc tccacctcca ccaaaacatc gtggacgtac aattcatgta 2460 tggcctatca cctgccctca caaaatacat cgtccgatgg gagtgggtaa tactcttatt 2520 cctgctctta gcggacgcca gggtttgcgc ctgcttatgg atgctcatct tgttgggcca 2580 ggccgaagca gcactagaga agctggtcat cttgcacgct gcgagcgcag ctagctgcaa 2640 tggcttccta tattttgtca tctttttcgt ggctgcttgg tacatcaagg gtcgggtagt 2700 ccccttagct acctattccc tcactggcct gtggtccttt agcctactgc tcctagcatt 2760 gccccaacag gcttatgctt atgacgcatc tgtgcatggc cagataggag cggctctgct 2820 ggtaatgatc accctcttca cactcacccc ggggtataag accctcctcg gccagtgtct 2880 gtggtggttg tgctatctcc tgaccctggg ggaagccatg attcaggagt gggtaccacc 2940 catgcaggtg cgcggcggcc gcgatggcat cgcgtgggcc gtcactatat tctgcccggg 3000 tgtggtgttt gacattacca aatggctttt ggcgttgctt gggcctgctt acctcttaag 3060 ggccgctttg acacatgtgc cgtacttcgt cagagctcac gctctgataa gggtatgcgc 3120 tttggtgaag cagctcgcgg ggggtaggta tgttcaggtg gcgctattgg cccttggcag 3180 gtggactggc acctacatct atgaccacct cacacctatg tcggactggg ccgctagcgg 3240 cctgcgcgac ttagcggtcg ccgtggaacc catcatcttc agtccgatgg agaagaaggt 3300 catcgtctgg ggagcggaga cggctgcatg tggggacatt ctacatggac ttcccgtgtc 3360 cgcccgactc ggccaggaga tcctcctcgg cccagctgat ggctacacct ccaaggggtg 3420 gaagctcctt gctcccatca ctgcttatgc ccagcaaaca cgaggcctcc tgggcgccat 3480 agtggtgagt atgacggggc gtgacaggac agaacaggcc ggggaagtcc aaatcctgtc 3540 cacagtctct cagtccttcc tcggaacaac catctcgggg gttttgtgga ctgtttacca 3600 cggagctggc aacaagactc tagccggctt acggggtccg gtcacgcaga tgtactcgag 3660 tgctgagggg gacttggtag gctggcccag cccccctggg accaagtctt tggagccgtg 3720 caagtgtgga gccgtcgacc tatatctggt cacgcggaac gctgatgtca tcccggctcg 3780 gagacgcggg gacaagcggg gagcattgct ctccccgaga cccatttcga ccttgaaggg 3840 gtcctcgggg gggccggtgc tctgccctag gggccacgtc gttgggctct tccgagcagc 3900 tgtgtgctct cggggcgtgg ccaaatccat cgatttcatc cccgttgaga cactcgacgt 3960 tgttacaagg tctcccactt tcagtgacaa cagcacgcca ccggctgtgc cccagaccta 4020 tcaggtcggg tacttgcatg ctccaactgg cagtggaaag agcaccaagg tccctgtcgc 4080 gtatgccgcc caggggtaca aagtactagt gcttaacccc tcggtagctg ccaccctggg 4140 gtttggggcg tacctatcca aggcacatgg catcaatccc aacattagga ctggagtcag 4200 gaccgtgatg accggggagg ccatcacgta ctccacatat ggcaaatttc tcgccgatgg 4260 gggctgcgct agcggcgcct atgacatcat catatgcgat gaatgccacg ctgtggatgc 4320 tacctccatt ctcggcatcg gaacggtcct tgatcaagca gagacagccg gggtcagact 4380 aactgtgctg gctacggcca caccccccgg gtcagtgaca accccccatc ccgatataga 4440 agaggtaggc ctcgggcggg agggtgagat ccccttctat gggagggcga ttcccctatc 4500 ctgcatcaag ggagggagac acctgatttt ctgccactca aagaaaaagt gtgacgagct 4560 cgcggcggcc cttcggggca tgggcttgaa tgccgtggca tactatagag ggttggacgt 4620 ctccataata ccagctcagg gagatgtggt ggtcgtcgcc accgacgccc tcatgacggg 4680 gtacactgga gactttgact ccgtgatcga ctgcaatgta gcggtcaccc aagctgtcga 4740 cttcagcctg gaccccacct tcactataac cacacagact gtcccacaag acgctgtctc 4800 acgcagtcag cgccgcgggc gcacaggtag aggaagacag ggcacttata ggtatgtttc 4860 cactggtgaa cgagcctcag gaatgtttga cagtgtagtg ctttgtgagt gctacgacgc 4920 aggggctgcg tggtacgatc tcacaccagc ggagaccacc gtcaggctta gagcgtattt 4980 caacacgccc ggcctacccg tgtgtcaaga ccatcttgaa ttttgggagg cagttttcac 5040 cggcctcaca cacatagacg cccacttcct ctcccaaaca aagcaagcgg gggagaactt 5100 cgcgtaccta gtagcctacc aagctacggt gtgcgccaga gccaaggccc ctcccccgtc 5160 ctgggacgcc atgtggaagt gcctggcccg actcaagcct acgcttgcgg gccccacacc 5220 tctcctgtac cgtttgggcc ctattaccaa tgaggtcacc ctcacacacc ctgggacgaa 5280 gtacatcgcc acatgcatgc aagctgacct tgaggtcatg accagcacgt gggtcctagc 5340 tggaggagtc ctggcagccg tcgccgcata ttgcctggcg actggatgcg tttccatcat 5400 cggccgcttg cacgtcaacc agcgagtcgt cgttgcgccg gataaggagg tcctgtatga 5460 ggcttttgat gagatggagg aatgcgcctc tagggcggct ctcatcgaag aggggcagcg 5520 gatagccgag atgttgaagt ccaagatcca aggcttgctg cagcaggcct ctaagcaggc 5580 ccaggacata caacccgcta tgcaggcttc atggcccaaa gtggaacaat tttgggccag 5640 acacatgtgg aacttcatta gcggcatcca atacctcgca ggattgtcaa cactgccagg 5700 gaaccccgcg gtggcttcca tgatggcatt cagtgccgcc ctcaccagtc cgttgtcgac 5760 cagtaccacc atccttctca acatcatggg aggctggtta gcgtcccaga tcgcaccacc 5820 cgcgggggcc accggctttg tcgtcagtgg cctggtgggg gctgccgtgg gcagcatagg 5880 cctgggtaag gtgctggtgg acatcctggc aggatatggt gcgggcattt cgggggccct 5940 cgtcgcattc aagatcatgt ctggcgagaa gccctctatg gaagatgtca tcaatctact 6000 gcctgggatc ctgtctccgg gagccctggt ggtgggggtc atctgcgcgg ccattctgcg 6060 ccgccacgtg ggaccggggg agggcgcggt ccaatggatg aacaggctta ttgcctttgc 6120 ttccagagga aaccacgtcg cccctactca ctacgtgacg gagtcggatg cgtcgcagcg 6180 tgtgacccaa ctacttggct ctcttactat aaccagccta ctcagaagac tccacaattg 6240 gataactgag gactgcccca tcccatgctc cggatcctgg ctccgcgacg tgtgggactg 6300 ggtttgcacc atcttgacag acttcaaaaa ttggctgacc tctaaattgt tccccaagct 6360 gcccggcctc cccttcatct cttgtcaaaa ggggtacaag ggtgtgtggg ccggcactgg 6420 catcatgacc acgcgctgcc cttgcggcgc caacatctct ggcaatgtcc gcctgggctc 6480 tatgaggatc acagggccta aaacctgcat gaacacctgg caggggacct ttcctatcaa 6540 ttgctacacg gagggccagt gcgcgccgaa accccccacg aactacaaga ccgccatctg 6600 gagggtggcg gcctcggagt acgcggaggt gacgcagcat gggtcgtact cctatgtaac 6660 aggactgacc actgacaatc tgaaaattcc ttgccaacta ccttctccag agtttttctc 6720 ctgggtggac ggtgtgcaga tccataggtt tgcacccaca ccaaagccgt ttttccggga 6780 tgaggtctcg ttctgcgttg ggcttaattc ctatgctgtc gggtcccagc ttccctgtga 6840 acctgagccc gacgcagacg tattgaggtc catgctaaca gatccgcccc acatcacggc 6900 ggagactgcg gcgcggcgct tggcacgggg atcacctcca tctgaggcga gctcctcagt 6960 gagccagcta tcagcaccgt cgctgcgggc cacctgcacc acccacagca acacctatga 7020 cgtggacatg gtcgatgcca acctgctcat ggagggcggt gtggctcaga cagagcctga 7080 gtccagggtg cccgttctgg actttctcga gccaatggcc gaggaagaga gcgaccttga 7140 gccctcaata ccatcggagt gcatgctccc caggagcggg tttccacggg ccttaccggc 7200 ttgggcacgg cctgactaca acccgccgct cgtggaatcg tggaggaggc cagattacca 7260 accgcccacc gttgctggtt gtgctctccc cccccccaag aaggccccga cgcctccccc 7320 aaggagacgc cggacagtgg gtctgagcga gagcaccata tcagaagccc tccagcaact 7380 ggccatcaag acctttggcc agcccccctc gagcggtgat gcaggctcgt ccacgggggc 7440 gggcgccgcc gaatccggcg gtccgacgtc ccctggtgag ccggccccct cagagacagg 7500 ttccgcctcc tctatgcccc ccctcgaggg ggagcctgga gatccggacc tggagtctga 7560 tcaggtagag cttcaacctc ccccccaggg ggggggggta gctcccggtt cgggctcggg 7620 gtcttggtct acttgctccg aggaggacga taccaccgtg tgctgctcca tgtcatactc 7680 ctggaccggg gctctaataa ctccctgtag ccccgaagag gaaaagttgc caatcaaccc 7740 tttgagtaac tcgctgttgc gataccataa caaggtgtac tgtacaacat caaagagcgc 7800 ctcacagagg gctaaaaagg taacttttga caggacgcaa gtgctcgacg cccattatga 7860 ctcagtctta aaggacatca agctagcggc ttccaaggtc agcgcaaggc tcctcacctt 7920 ggaggaggcg tgccagttga ctccacccca ttctgcaaga tccaagtatg gattcggggc 7980 caaggaggtc cgcagcttgt ccgggagggc cgttaaccac atcaagtccg tgtggaagga 8040 cctcctggaa gacccacaaa caccaattcc cacaaccatc atggccaaaa atgaggtgtt 8100 ctgcgtggac cccgccaagg ggggtaagaa accagctcgc ctcatcgttt accctgacct 8160 cggcgtccgg gtctgcgaga aaatggccct ctatgacatt acacaaaagc ttcctcaggc 8220 ggtaatggga gcttcctatg gcttccagta ctcccctgcc caacgggtgg agtatctctt 8280 gaaagcatgg gcggaaaaga aggaccccat gggtttttcg tatgataccc gatgcttcga 8340 ctcaaccgtc actgagagag acatcaggac cgaggagtcc atataccagg cctgctccct 8400 gcccgaggag gcccgcactg ccatacactc gctgactgag agactttacg taggagggcc 8460 catgttcaac agcaagggtc aaacctgcgg ttacagacgt tgccgcgcca gcggggtgct 8520 aaccactagc atgggtaaca ccatcacatg ctatgtgaaa gccctagcgg cctgcaaggc 8580 tgcggggata gttgcgccca caatgctggt atgcggcgat gacctagtag tcatctcaga 8640 aagccagggg actgaggagg acgagcggaa cctgagagcc ttcacggagg ccatgaccag 8700 gtactctgcc cctcctggtg atccccccag accggaatat gacctggagc taataacatc 8760 ctgttcctca aatgtgtctg tggcgttggg cccgcggggc cgccgcagat actacctgac 8820 cagagaccca accactccac tcgcccgggc tgcctgggaa acagttagac actcccctat 8880 caattcatgg ctgggaaaca tcatccagta tgctccaacc atatgggttc gcatggtcct 8940 aatgacacac ttcttctcca ttctcatggt ccaagacacc ctggaccaga acctcaactt 9000 tgagatgtat ggatcagtat actccgtgaa tcctttggac cttccagcca taattgagag 9060 gttacacggg cttgacgcct tttctatgca cacatactct caccacgaac tgacgcgggt 9120 ggcttcagcc ctcagaaaac ttggggcgcc acccctcagg gtgtggaaga gtcgggctcg 9180 cgcagtcagg gcgtccctca tctcccgtgg agggaaagcg gccgtttgcg gccgatatct 9240 cttcaattgg gcggtgaaga ccaagctcaa actcactcca ttgccggagg cgcgcctact 9300 ggacttatcc agttggttca ccgtcggcgc cggcgggggc gacatttttc acagcgtgtc 9360 gcgcgcccga ccccgctcat tactcttcgg cctactccta cttttcgtag gggtaggcct 9420 cttcctactc cccgctcggt agagcggcac acactaggta cactccatag ctaactgttc 9480 cttttttttt tttttttttt tttttttttt tttttttttt ttttcttttt tttttttttc 9540 cctctttctt cccttctcat cttattctac tttctttctt ggtggctcca tcttagccct 9600 agtcacggct agctgtgaaa ggtccgtgag ccgcatgact gcagagagtg ccgtaactgg 9660 tctctctgca gatcatgt 9678 <210> 30 <211> 9666 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: chimeric DNA <400> 30 acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60 cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120 ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccagg 180 acgaccgggt cctttcttgg ataaacccgc tcaatgcctg gagatttggg cgtgcccccg 240 caagactgct agccgagtag tgttgggtcg cgaaaggcct tgtggtactg cctgataggg 300 tgcttgcgag tgccccggga ggtctcgtag accgtgcacc atgagcacga atcctaaacc 360 tcaaagaaaa accaaacgta acaccaaccg tcgcccacag gacgtcaagt tcccgggtgg 420 cggtcagatc gttggtggag tttacttgtt gccgcgcagg ggccctagat tgggtgtgcg 480 cgcgacgagg aagacttccg agcggtcgca acctcgaggt agacgtcagc ctatccccaa 540 ggcacgtcgg cccgagggca ggacctgggc tcagcccggg tacccttggc ccctctatgg 600 caatgagggt tgcgggtggg cgggatggct cctgtctccc cgtggctctc ggcctagctg 660 gggccccaca gacccccggc gtaggtcgcg caatttgggt aaggtcatcg atacccttac 720 gtgcggcttc gccgacctca tggggtacat accgctcgtc ggcgcccctc ttggaggcgc 780 tgccagggcc ctggcgcatg gcgtccgggt tctggaagac ggcgtgaact atgcaacagg 840 gaaccttcct ggttgctctt tctctatctt ccttctggcc ctgctctctt gcctgactgt 900 gcccgcttca gcctaccaag tgcgcaattc ctcggggctt taccatgtca ccaatgattg 960 ccctaactcg agtattgtgt acgaggcggc cgatgccatc ctgcacactc cggggtgtgt 1020 cccttgcgtt cgcgagggta acgcctcgag gtgttgggtg gcggtgaccc ccacggtggc 1080 caccagggac ggcaaactcc ccacaacgca gcttcgacgt catatcgatc tgcttgtcgg 1140 gagcgccacc ctctgctcgg ccctctacgt gggggacctg tgcgggtctg tctttcttgt 1200 tggtcaactg tttaccttct ctcccaggcg ccactggacg acgcaagact gcaattgttc 1260 tatctatccc ggccatataa cgggtcatcg catggcatgg gatatgatga tgaactggtc 1320 ccctacggca gcgttggtgg tagctcagct gctccggatc ccacaagcca tcatggacat 1380 gatcgctggt gctcactggg gagtcctggc gggcatagcg tatttctcca tggtggggaa 1440 ctgggcgaag gtcctggtag tgctgctgct atttgccggc gtcgacgcgg aaacccacgt 1500 caccggggga aatgccggcc gcaccacggc tgggcttgtt ggtctcctta caccaggcgc 1560 caagcagaac atccaactga tcaacaccaa cggcagttgg cacatcaata gcacggcctt 1620 gaattgcaat gaaagcctta acaccggctg gttagcaggg ctcttctatc aacacaaatt 1680 caactcttca ggctgtcctg agaggttggc cagctgccga cgccttaccg attttgccca 1740 gggctggggt cctatcagtt atgccaacgg aagcggcctc gacgaacgcc cctactgctg 1800 gcactaccct ccaagacctt gtggcattgt gcccgcaaag agcgtgtgtg gcccggtata 1860 ttgcttcact cccagccccg tggtggtggg aacgaccgac aggtcgggcg cgcctaccta 1920 cagctggggt gcaaatgata cggatgtctt cgtccttaac aacaccaggc caccgctggg 1980 caattggttc ggttgtacct ggatgaactc aactggattc accaaagtgt gcggagcgcc 2040 cccttgtgtc atcggagggg tgggcaacaa caccttgctc tgccccactg attgcttccg 2100 caaacatccg gaagccacat actctcggtg cggctccggt ccctggatta cacccaggtg 2160 catggtcgac tacccgtata ggctttggca ctatccttgt accatcaatt acaccatatt 2220 caaagtcagg atgtacgtgg gaggggtcga gcacaggctg gaagcggcct gcaactggac 2280 gcggggcgaa cgctgtgatc tggaagacag ggacaggtcc gagctcagcc cgttgctgct 2340 gtccaccaca cagtggcagg tccttccgtg ttctttcacg accctgccag ccttgtccac 2400 cggcctcatc cacctccacc agaacattgt ggacgtgcag tacttgtacg gggtagggtc 2460 aagcatcgcg tcctgggcca ttaagtggga gtacgtcgtt ctcctgttcc ttctgcttgc 2520 agacgcgcgc gtctgctcct gcttgtggat gatgttactc atatcccaag cggaggcggc 2580 tttggagaac ctcgtaatac tcaatgcagc atccctggcc gggacgcacg gtcttgtgtc 2640 cttcctcgtg ttcttctgct ttgcgtggta tctgaagggt aggtgggtgc ccggagcggt 2700 ctacgccctc tacgggatgt ggcctctcct cctgctcctg ctggcgttgc ctcagcgggc 2760 atacgcatat gacgcacctg tgcacggaca gataggcgtg ggtttgttga tattgatcac 2820 cctcttcaca ctcaccccgg ggtataagac cctcctcggc cagtgtctgt ggtggttgtg 2880 ctatctcctg accctggggg aagccatgat tcaggagtgg gtaccaccca tgcaggtgcg 2940 cggcggccgc gatggcatcg cgtgggccgt cactatattc tgcccgggtg tggtgtttga 3000 cattaccaaa tggcttttgg cgttgcttgg gcctgcttac ctcttaaggg ccgctttgac 3060 acatgtgccg tacttcgtca gagctcacgc tctgataagg gtatgcgctt tggtgaagca 3120 gctcgcgggg ggtaggtatg ttcaggtggc gctattggcc cttggcaggt ggactggcac 3180 ctacatctat gaccacctca cacctatgtc ggactgggcc gctagcggcc tgcgcgactt 3240 agcggtcgcc gtggaaccca tcatcttcag tccgatggag aagaaggtca tcgtctgggg 3300 agcggagacg gctgcatgtg gggacattct acatggactt cccgtgtccg cccgactcgg 3360 ccaggagatc ctcctcggcc cagctgatgg ctacacctcc aaggggtgga agctccttgc 3420 tcccatcact gcttatgccc agcaaacacg aggcctcctg ggcgccatag tggtgagtat 3480 gacggggcgt gacaggacag aacaggccgg ggaagtccaa atcctgtcca cagtctctca 3540 gtccttcctc ggaacaacca tctcgggggt tttgtggact gtttaccacg gagctggcaa 3600 caagactcta gccggcttac ggggtccggt cacgcagatg tactcgagtg ctgaggggga 3660 cttggtaggc tggcccagcc cccctgggac caagtctttg gagccgtgca agtgtggagc 3720 cgtcgaccta tatctggtca cgcggaacgc tgatgtcatc ccggctcgga gacgcgggga 3780 caagcgggga gcattgctct ccccgagacc catttcgacc ttgaaggggt cctcgggggg 3840 gccggtgctc tgccctaggg gccacgtcgt tgggctcttc cgagcagctg tgtgctctcg 3900 gggcgtggcc aaatccatcg atttcatccc cgttgagaca ctcgacgttg ttacaaggtc 3960 tcccactttc agtgacaaca gcacgccacc ggctgtgccc cagacctatc aggtcgggta 4020 cttgcatgct ccaactggca gtggaaagag caccaaggtc cctgtcgcgt atgccgccca 4080 ggggtacaaa gtactagtgc ttaacccctc ggtagctgcc accctggggt ttggggcgta 4140 cctatccaag gcacatggca tcaatcccaa cattaggact ggagtcagga ccgtgatgac 4200 cggggaggcc atcacgtact ccacatatgg caaatttctc gccgatgggg gctgcgctag 4260 cggcgcctat gacatcatca tatgcgatga atgccacgct gtggatgcta cctccattct 4320 cggcatcgga acggtccttg atcaagcaga gacagccggg gtcagactaa ctgtgctggc 4380 tacggccaca ccccccgggt cagtgacaac cccccatccc gatatagaag aggtaggcct 4440 cgggcgggag ggtgagatcc ccttctatgg gagggcgatt cccctatcct gcatcaaggg 4500 agggagacac ctgattttct gccactcaaa gaaaaagtgt gacgagctcg cggcggccct 4560 tcggggcatg ggcttgaatg ccgtggcata ctatagaggg ttggacgtct ccataatacc 4620 agctcaggga gatgtggtgg tcgtcgccac cgacgccctc atgacggggt acactggaga 4680 ctttgactcc gtgatcgact gcaatgtagc ggtcacccaa gctgtcgact tcagcctgga 4740 ccccaccttc actataacca cacagactgt cccacaagac gctgtctcac gcagtcagcg 4800 ccgcgggcgc acaggtagag gaagacaggg cacttatagg tatgtttcca ctggtgaacg 4860 agcctcagga atgtttgaca gtgtagtgct ttgtgagtgc tacgacgcag gggctgcgtg 4920 gtacgatctc acaccagcgg agaccaccgt caggcttaga gcgtatttca acacgcccgg 4980 cctacccgtg tgtcaagacc atcttgaatt ttgggaggca gttttcaccg gcctcacaca 5040 catagacgcc cacttcctct cccaaacaaa gcaagcgggg gagaacttcg cgtacctagt 5100 agcctaccaa gctacggtgt gcgccagagc caaggcccct cccccgtcct gggacgccat 5160 gtggaagtgc ctggcccgac tcaagcctac gcttgcgggc cccacacctc tcctgtaccg 5220 tttgggccct attaccaatg aggtcaccct cacacaccct gggacgaagt acatcgccac 5280 atgcatgcaa gctgaccttg aggtcatgac cagcacgtgg gtcctagctg gaggagtcct 5340 ggcagccgtc gccgcatatt gcctggcgac tggatgcgtt tccatcatcg gccgcttgca 5400 cgtcaaccag cgagtcgtcg ttgcgccgga taaggaggtc ctgtatgagg cttttgatga 5460 gatggaggaa tgcgcctcta gggcggctct catcgaagag gggcagcgga tagccgagat 5520 gttgaagtcc aagatccaag gcttgctgca gcaggcctct aagcaggccc aggacataca 5580 acccgctatg caggcttcat ggcccaaagt ggaacaattt tgggccagac acatgtggaa 5640 cttcattagc ggcatccaat acctcgcagg attgtcaaca ctgccaggga accccgcggt 5700 ggcttccatg atggcattca gtgccgccct caccagtccg ttgtcgacca gtaccaccat 5760 ccttctcaac atcatgggag gctggttagc gtcccagatc gcaccacccg cgggggccac 5820 cggctttgtc gtcagtggcc tggtgggggc tgccgtgggc agcataggcc tgggtaaggt 5880 gctggtggac atcctggcag gatatggtgc gggcatttcg ggggccctcg tcgcattcaa 5940 gatcatgtct ggcgagaagc cctctatgga agatgtcatc aatctactgc ctgggatcct 6000 gtctccggga gccctggtgg tgggggtcat ctgcgcggcc attctgcgcc gccacgtggg 6060 accgggggag ggcgcggtcc aatggatgaa caggcttatt gcctttgctt ccagaggaaa 6120 ccacgtcgcc cctactcact acgtgacgga gtcggatgcg tcgcagcgtg tgacccaact 6180 acttggctct cttactataa ccagcctact cagaagactc cacaattgga taactgagga 6240 ctgccccatc ccatgctccg gatcctggct ccgcgacgtg tgggactggg tttgcaccat 6300 cttgacagac ttcaaaaatt ggctgacctc taaattgttc cccaagctgc ccggcctccc 6360 cttcatctct tgtcaaaagg ggtacaaggg tgtgtgggcc ggcactggca tcatgaccac 6420 gcgctgccct tgcggcgcca acatctctgg caatgtccgc ctgggctcta tgaggatcac 6480 agggcctaaa acctgcatga acacctggca ggggaccttt cctatcaatt gctacacgga 6540 gggccagtgc gcgccgaaac cccccacgaa ctacaagacc gccatctgga gggtggcggc 6600 ctcggagtac gcggaggtga cgcagcatgg gtcgtactcc tatgtaacag gactgaccac 6660 tgacaatctg aaaattcctt gccaactacc ttctccagag tttttctcct gggtggacgg 6720 tgtgcagatc cataggtttg cacccacacc aaagccgttt ttccgggatg aggtctcgtt 6780 ctgcgttggg cttaattcct atgctgtcgg gtcccagctt ccctgtgaac ctgagcccga 6840 cgcagacgta ttgaggtcca tgctaacaga tccgccccac atcacggcgg agactgcggc 6900 gcggcgcttg gcacggggat cacctccatc tgaggcgagc tcctcagtga gccagctatc 6960 agcaccgtcg ctgcgggcca cctgcaccac ccacagcaac acctatgacg tggacatggt 7020 cgatgccaac ctgctcatgg agggcggtgt ggctcagaca gagcctgagt ccagggtgcc 7080 cgttctggac tttctcgagc caatggccga ggaagagagc gaccttgagc cctcaatacc 7140 atcggagtgc atgctcccca ggagcgggtt tccacgggcc ttaccggctt gggcacggcc 7200 tgactacaac ccgccgctcg tggaatcgtg gaggaggcca gattaccaac cgcccaccgt 7260 tgctggttgt gctctccccc cccccaagaa ggccccgacg cctcccccaa ggagacgccg 7320 gacagtgggt ctgagcgaga gcaccatatc agaagccctc cagcaactgg ccatcaagac 7380 ctttggccag cccccctcga gcggtgatgc aggctcgtcc acgggggcgg gcgccgccga 7440 atccggcggt ccgacgtccc ctggtgagcc ggccccctca gagacaggtt ccgcctcctc 7500 tatgcccccc ctcgaggggg agcctggaga tccggacctg gagtctgatc aggtagagct 7560 tcaacctccc ccccaggggg ggggggtagc tcccggttcg ggctcggggt cttggtctac 7620 ttgctccgag gaggacgata ccaccgtgtg ctgctccatg tcatactcct ggaccggggc 7680 tctaataact ccctgtagcc ccgaagagga aaagttgcca atcaaccctt tgagtaactc 7740 gctgttgcga taccataaca aggtgtactg tacaacatca aagagcgcct cacagagggc 7800 taaaaaggta acttttgaca ggacgcaagt gctcgacgcc cattatgact cagtcttaaa 7860 ggacatcaag ctagcggctt ccaaggtcag cgcaaggctc ctcaccttgg aggaggcgtg 7920 ccagttgact ccaccccatt ctgcaagatc caagtatgga ttcggggcca aggaggtccg 7980 cagcttgtcc gggagggccg ttaaccacat caagtccgtg tggaaggacc tcctggaaga 8040 cccacaaaca ccaattccca caaccatcat ggccaaaaat gaggtgttct gcgtggaccc 8100 cgccaagggg ggtaagaaac cagctcgcct catcgtttac cctgacctcg gcgtccgggt 8160 ctgcgagaaa atggccctct atgacattac acaaaagctt cctcaggcgg taatgggagc 8220 ttcctatggc ttccagtact cccctgccca acgggtggag tatctcttga aagcatgggc 8280 ggaaaagaag gaccccatgg gtttttcgta tgatacccga tgcttcgact caaccgtcac 8340 tgagagagac atcaggaccg aggagtccat ataccaggcc tgctccctgc ccgaggaggc 8400 ccgcactgcc atacactcgc tgactgagag actttacgta ggagggccca tgttcaacag 8460 caagggtcaa acctgcggtt acagacgttg ccgcgccagc ggggtgctaa ccactagcat 8520 gggtaacacc atcacatgct atgtgaaagc cctagcggcc tgcaaggctg cggggatagt 8580 tgcgcccaca atgctggtat gcggcgatga cctagtagtc atctcagaaa gccaggggac 8640 tgaggaggac gagcggaacc tgagagcctt cacggaggcc atgaccaggt actctgcccc 8700 tcctggtgat ccccccagac cggaatatga cctggagcta ataacatcct gttcctcaaa 8760 tgtgtctgtg gcgttgggcc cgcggggccg ccgcagatac tacctgacca gagacccaac 8820 cactccactc gcccgggctg cctgggaaac agttagacac tcccctatca attcatggct 8880 gggaaacatc atccagtatg ctccaaccat atgggttcgc atggtcctaa tgacacactt 8940 cttctccatt ctcatggtcc aagacaccct ggaccagaac ctcaactttg agatgtatgg 9000 atcagtatac tccgtgaatc ctttggacct tccagccata attgagaggt tacacgggct 9060 tgacgccttt tctatgcaca catactctca ccacgaactg acgcgggtgg cttcagccct 9120 cagaaaactt ggggcgccac ccctcagggt gtggaagagt cgggctcgcg cagtcagggc 9180 gtccctcatc tcccgtggag ggaaagcggc cgtttgcggc cgatatctct tcaattgggc 9240 ggtgaagacc aagctcaaac tcactccatt gccggaggcg cgcctactgg acttatccag 9300 ttggttcacc gtcggcgccg gcgggggcga catttttcac agcgtgtcgc gcgcccgacc 9360 ccgctcatta ctcttcggcc tactcctact tttcgtaggg gtaggcctct tcctactccc 9420 cgctcggtag agcggcacac actaggtaca ctccatagct aactgttcct tttttttttt 9480 tttttttttt tttttttttt tttttttttt ttcttttttt tttttttccc tctttcttcc 9540 cttctcatct tattctactt tctttcttgg tggctccatc ttagccctag tcacggctag 9600 ctgtgaaagg tccgtgagcc gcatgactgc agagagtgcc gtaactggtc tctctgcaga 9660 tcatgt 9666 <210> 31 <211> 9666 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic DNA <400> 31 acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60 cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120 ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccagg 180 acgaccgggt cctttcttgg atcaacccgc tcaatgcctg gagatttggg cgtgcccccg 240 cgagactgct agccgagtag tgttgggtcg cgaaaggcct tgtggtactg cctgataggg 300 tgcttgcgag tgccccggga ggtctcgtag accgtgcatc atgagcacaa atcctaaacc 360 ccaaagaaaa accaaacgta acaccaaccg tcgcccacag gacgttaagt tcccgggcgg 420 tggtcagatc gtcggtggag tttacttgtt gccgcgcagg ggccccaggt tgggtgtgcg 480 tgcgactagg aagacttccg agcggtcgca acctcgtgga aggcgacaac ctatccccaa 540 ggctcgccgg cccgagggca ggacctgggc tcagcctggg tatccttggc ccctctatgg 600 caatgagggc ttggggtggg caggatggct cctgtcaccc cgcggctctc ggcctagttg 660 gggccctaat gacccccggc gtaggtcgcg taatttgggt aaggtcatcg atacccttac 720 atgcggcttc gccgacctca tggggtacat cccgcttgtc ggcgccccct tagggggcgc 780 tgccagggcc ctggcacatg gtgtccgggt tctggaggac ggcgtgaact atgcaacagg 840 gaatttgccc ggttgctctt tctctatctt cctcttagct ctgctgtcct gtttgaccat 900 cccagcttcc gcttatgaag tgcgcaacgt gtccgggata taccatgtca caaacgactg 960 ctccaactca agcattgtgt atgaggcggc ggacgtgatc atgcatgccc ccgggtgcgt 1020 gccctgcgtt cgggagaaca attcctcccg ttgctgggta gcgctcactc ccacgctcgc 1080 ggccaggaat gccagcgtcc ccactacgac attacgacgc cacgtcgact tgctcgttgg 1140 gacggctgct ttctgctccg ctatgtacgt gggggatctc tgcggatctg ttttcctcat 1200 ctcccagctg ttcaccttct cgcctcgccg gcatgagaca gtacaggact gcaactgctc 1260 aatctatccc ggccacgtat caggccatcg tatggcttgg gatatgatga tgaactggtc 1320 gcccacggca gccttagtgg tgtcgcagtt actccggatc ccacaagctg tcatggacat 1380 ggtggcgggg gcccactggg gagtcctagc gggccttgcc tactattcca tggtggggaa 1440 ctgggctaag gttttgattg tgatgctact ctttgccggc gttgacgggc atacccgcgt 1500 gacggggggg gtgcaaggcc atgtcacctc tacactcacg tccctcttta gacctggggc 1560 gtcccagaaa attcagcttg taaacaccaa tggcagttgg catatcaaca ggactgccct 1620 gaactgcaat gactccctca aaactgggtt tcttgccgcg ctgttctaca cacacaagtt 1680 caacgcgtcc ggatgcccgg agcgcatggc cagctgtcgc tccattgaca agttcgacca 1740 gggatggggt cccatcacct atgctcaacc tgacaactcg gaccagaggc cgtattgctg 1800 gcactacgca cctcgacagt gtggtatcgt acccgcgtcg caggtgtgcg gtccagtgta 1860 ttgcttcacc ccaagccctg ttgtagtggg gacgaccgat cgtttcggcg cccctacgta 1920 taactggggg gacaatgaga cggacgtgct gctcctaaac aacacgcggc cgccgcatgg 1980 caactggttc ggctgtacat ggatgaatag cactgggttc accaagacgt gcggaggccc 2040 cccgtgtaac atcagggggg tcggcaacaa caccttgacc tgccccacgg actgcttccg 2100 gaagcacccc gacgccactt acacaaaatg tggttcgggc ccttggttga cacctaggtg 2160 cttggttgac tacccataca ggctctggca ctacccctgc actgtcaact ttaccatctt 2220 caaggttagg atgtatgtgg ggggcgtgga gcacaggctt gatgctgcat gcaactggac 2280 tcgaggagag cgttgcgact tggaggacag ggatagagca gagctcagcc cgctattgct 2340 gtctacaaca gagtggcaga tactgccctg ttcctacacc accctaccgg ctctgtccac 2400 tggtttaatc cacctccacc agaacatcgt ggacatacaa tacctgtacg gtatagggtc 2460 ggcggtcgtc tccattgcca tcaagtggga gtatgtcgtg ctgctcttcc ttctcctggc 2520 ggacgcgcgc gtctgtgcct gcttgtggat gatgctgctg atagcccagg ccgaggctgc 2580 cttagagaac ttggtggtcc tcaatgcggc gtccgtggtc ggagcgcatg gcatgctccc 2640 cttctttatg ttcttctgtg ccgcctggta catgaagggc aggctggtcc ctggagcggc 2700 atacgctttc tacggtgtat ggccgctgct cctgctcctg ctagcattac caccacgagc 2760 ttacgcctat gacgcacctg tgcacggaca gataggcgtg ggtttgttga tattgatcac 2820 cctcttcaca ctcaccccgg ggtataagac cctcctcggc cagtgtctgt ggtggttgtg 2880 ctatctcctg accctggggg aagccatgat tcaggagtgg gtaccaccca tgcaggtgcg 2940 cggcggccgc gatggcatcg cgtgggccgt cactatattc tgcccgggtg tggtgtttga 3000 cattaccaaa tggcttttgg cgttgcttgg gcctgcttac ctcttaaggg ccgctttgac 3060 acatgtgccg tacttcgtca gagctcacgc tctgataagg gtatgcgctt tggtgaagca 3120 gctcgcgggg ggtaggtatg ttcaggtggc gctattggcc cttggcaggt ggactggcac 3180 ctacatctat gaccacctca cacctatgtc ggactgggcc gctagcggcc tgcgcgactt 3240 agcggtcgcc gtggaaccca tcatcttcag tccgatggag aagaaggtca tcgtctgggg 3300 agcggagacg gctgcatgtg gggacattct acatggactt cccgtgtccg cccgactcgg 3360 ccaggagatc ctcctcggcc cagctgatgg ctacacctcc aaggggtgga agctccttgc 3420 tcccatcact gcttatgccc agcaaacacg aggcctcctg ggcgccatag tggtgagtat 3480 gacggggcgt gacaggacag aacaggccgg ggaagtccaa atcctgtcca cagtctctca 3540 gtccttcctc ggaacaacca tctcgggggt tttgtggact gtttaccacg gagctggcaa 3600 caagactcta gccggcttac ggggtccggt cacgcagatg tactcgagtg ctgaggggga 3660 cttggtaggc tggcccagcc cccctgggac caagtctttg gagccgtgca agtgtggagc 3720 cgtcgaccta tatctggtca cgcggaacgc tgatgtcatc ccggctcgga gacgcgggga 3780 caagcgggga gcattgctct ccccgagacc catttcgacc ttgaaggggt cctcgggggg 3840 gccggtgctc tgccctaggg gccacgtcgt tgggctcttc cgagcagctg tgtgctctcg 3900 gggcgtggcc aaatccatcg atttcatccc cgttgagaca ctcgacgttg ttacaaggtc 3960 tcccactttc agtgacaaca gcacgccacc ggctgtgccc cagacctatc aggtcgggta 4020 cttgcatgct ccaactggca gtggaaagag caccaaggtc cctgtcgcgt atgccgccca 4080 ggggtacaaa gtactagtgc ttaacccctc ggtagctgcc accctggggt ttggggcgta 4140 cctatccaag gcacatggca tcaatcccaa cattaggact ggagtcagga ccgtgatgac 4200 cggggaggcc atcacgtact ccacatatgg caaatttctc gccgatgggg gctgcgctag 4260 cggcgcctat gacatcatca tatgcgatga atgccacgct gtggatgcta cctccattct 4320 cggcatcgga acggtccttg atcaagcaga gacagccggg gtcagactaa ctgtgctggc 4380 tacggccaca ccccccgggt cagtgacaac cccccatccc gatatagaag aggtaggcct 4440 cgggcgggag ggtgagatcc ccttctatgg gagggcgatt cccctatcct gcatcaaggg 4500 agggagacac ctgattttct gccactcaaa gaaaaagtgt gacgagctcg cggcggccct 4560 tcggggcatg ggcttgaatg ccgtggcata ctatagaggg ttggacgtct ccataatacc 4620 agctcaggga gatgtggtgg tcgtcgccac cgacgccctc atgacggggt acactggaga 4680 ctttgactcc gtgatcgact gcaatgtagc ggtcacccaa gctgtcgact tcagcctgga 4740 ccccaccttc actataacca cacagactgt cccacaagac gctgtctcac gcagtcagcg 4800 ccgcgggcgc acaggtagag gaagacaggg cacttatagg tatgtttcca ctggtgaacg 4860 agcctcagga atgtttgaca gtgtagtgct ttgtgagtgc tacgacgcag gggctgcgtg 4920 gtacgatctc acaccagcgg agaccaccgt caggcttaga gcgtatttca acacgcccgg 4980 cctacccgtg tgtcaagacc atcttgaatt ttgggaggca gttttcaccg gcctcacaca 5040 catagacgcc cacttcctct cccaaacaaa gcaagcgggg gagaacttcg cgtacctagt 5100 agcctaccaa gctacggtgt gcgccagagc caaggcccct cccccgtcct gggacgccat 5160 gtggaagtgc ctggcccgac tcaagcctac gcttgcgggc cccacacctc tcctgtaccg 5220 tttgggccct attaccaatg aggtcaccct cacacaccct gggacgaagt acatcgccac 5280 atgcatgcaa gctgaccttg aggtcatgac cagcacgtgg gtcctagctg gaggagtcct 5340 ggcagccgtc gccgcatatt gcctggcgac tggatgcgtt tccatcatcg gccgcttgca 5400 cgtcaaccag cgagtcgtcg ttgcgccgga taaggaggtc ctgtatgagg cttttgatga 5460 gatggaggaa tgcgcctcta gggcggctct catcgaagag gggcagcgga tagccgagat 5520 gttgaagtcc aagatccaag gcttgctgca gcaggcctct aagcaggccc aggacataca 5580 acccgctatg caggcttcat ggcccaaagt ggaacaattt tgggccagac acatgtggaa 5640 cttcattagc ggcatccaat acctcgcagg attgtcaaca ctgccaggga accccgcggt 5700 ggcttccatg atggcattca gtgccgccct caccagtccg ttgtcgacca gtaccaccat 5760 ccttctcaac atcatgggag gctggttagc gtcccagatc gcaccacccg cgggggccac 5820 cggctttgtc gtcagtggcc tggtgggggc tgccgtgggc agcataggcc tgggtaaggt 5880 gctggtggac atcctggcag gatatggtgc gggcatttcg ggggccctcg tcgcattcaa 5940 gatcatgtct ggcgagaagc cctctatgga agatgtcatc aatctactgc ctgggatcct 6000 gtctccggga gccctggtgg tgggggtcat ctgcgcggcc attctgcgcc gccacgtggg 6060 accgggggag ggcgcggtcc aatggatgaa caggcttatt gcctttgctt ccagaggaaa 6120 ccacgtcgcc cctactcact acgtgacgga gtcggatgcg tcgcagcgtg tgacccaact 6180 acttggctct cttactataa ccagcctact cagaagactc cacaattgga taactgagga 6240 ctgccccatc ccatgctccg gatcctggct ccgcgacgtg tgggactggg tttgcaccat 6300 cttgacagac ttcaaaaatt ggctgacctc taaattgttc cccaagctgc ccggcctccc 6360 cttcatctct tgtcaaaagg ggtacaaggg tgtgtgggcc ggcactggca tcatgaccac 6420 gcgctgccct tgcggcgcca acatctctgg caatgtccgc ctgggctcta tgaggatcac 6480 agggcctaaa acctgcatga acacctggca ggggaccttt cctatcaatt gctacacgga 6540 gggccagtgc gcgccgaaac cccccacgaa ctacaagacc gccatctgga gggtggcggc 6600 ctcggagtac gcggaggtga cgcagcatgg gtcgtactcc tatgtaacag gactgaccac 6660 tgacaatctg aaaattcctt gccaactacc ttctccagag tttttctcct gggtggacgg 6720 tgtgcagatc cataggtttg cacccacacc aaagccgttt ttccgggatg aggtctcgtt 6780 ctgcgttggg cttaattcct atgctgtcgg gtcccagctt ccctgtgaac ctgagcccga 6840 cgcagacgta ttgaggtcca tgctaacaga tccgccccac atcacggcgg agactgcggc 6900 gcggcgcttg gcacggggat cacctccatc tgaggcgagc tcctcagtga gccagctatc 6960 agcaccgtcg ctgcgggcca cctgcaccac ccacagcaac acctatgacg tggacatggt 7020 cgatgccaac ctgctcatgg agggcggtgt ggctcagaca gagcctgagt ccagggtgcc 7080 cgttctggac tttctcgagc caatggccga ggaagagagc gaccttgagc cctcaatacc 7140 atcggagtgc atgctcccca ggagcgggtt tccacgggcc ttaccggctt gggcacggcc 7200 tgactacaac ccgccgctcg tggaatcgtg gaggaggcca gattaccaac cgcccaccgt 7260 tgctggttgt gctctccccc cccccaagaa ggccccgacg cctcccccaa ggagacgccg 7320 gacagtgggt ctgagcgaga gcaccatatc agaagccctc cagcaactgg ccatcaagac 7380 ctttggccag cccccctcga gcggtgatgc aggctcgtcc acgggggcgg gcgccgccga 7440 atccggcggt ccgacgtccc ctggtgagcc ggccccctca gagacaggtt ccgcctcctc 7500 tatgcccccc ctcgaggggg agcctggaga tccggacctg gagtctgatc aggtagagct 7560 tcaacctccc ccccaggggg ggggggtagc tcccggttcg ggctcggggt cttggtctac 7620 ttgctccgag gaggacgata ccaccgtgtg ctgctccatg tcatactcct ggaccggggc 7680 tctaataact ccctgtagcc ccgaagagga aaagttgcca atcaaccctt tgagtaactc 7740 gctgttgcga taccataaca aggtgtactg tacaacatca aagagcgcct cacagagggc 7800 taaaaaggta acttttgaca ggacgcaagt gctcgacgcc cattatgact cagtcttaaa 7860 ggacatcaag ctagcggctt ccaaggtcag cgcaaggctc ctcaccttgg aggaggcgtg 7920 ccagttgact ccaccccatt ctgcaagatc caagtatgga ttcggggcca aggaggtccg 7980 cagcttgtcc gggagggccg ttaaccacat caagtccgtg tggaaggacc tcctggaaga 8040 cccacaaaca ccaattccca caaccatcat ggccaaaaat gaggtgttct gcgtggaccc 8100 cgccaagggg ggtaagaaac cagctcgcct catcgtttac cctgacctcg gcgtccgggt 8160 ctgcgagaaa atggccctct atgacattac acaaaagctt cctcaggcgg taatgggagc 8220 ttcctatggc ttccagtact cccctgccca acgggtggag tatctcttga aagcatgggc 8280 ggaaaagaag gaccccatgg gtttttcgta tgatacccga tgcttcgact caaccgtcac 8340 tgagagagac atcaggaccg aggagtccat ataccaggcc tgctccctgc ccgaggaggc 8400 ccgcactgcc atacactcgc tgactgagag actttacgta ggagggccca tgttcaacag 8460 caagggtcaa acctgcggtt acagacgttg ccgcgccagc ggggtgctaa ccactagcat 8520 gggtaacacc atcacatgct atgtgaaagc cctagcggcc tgcaaggctg cggggatagt 8580 tgcgcccaca atgctggtat gcggcgatga cctagtagtc atctcagaaa gccaggggac 8640 tgaggaggac gagcggaacc tgagagcctt cacggaggcc atgaccaggt actctgcccc 8700 tcctggtgat ccccccagac cggaatatga cctggagcta ataacatcct gttcctcaaa 8760 tgtgtctgtg gcgttgggcc cgcggggccg ccgcagatac tacctgacca gagacccaac 8820 cactccactc gcccgggctg cctgggaaac agttagacac tcccctatca attcatggct 8880 gggaaacatc atccagtatg ctccaaccat atgggttcgc atggtcctaa tgacacactt 8940 cttctccatt ctcatggtcc aagacaccct ggaccagaac ctcaactttg agatgtatgg 9000 atcagtatac tccgtgaatc ctttggacct tccagccata attgagaggt tacacgggct 9060 tgacgccttt tctatgcaca catactctca ccacgaactg acgcgggtgg cttcagccct 9120 cagaaaactt ggggcgccac ccctcagggt gtggaagagt cgggctcgcg cagtcagggc 9180 gtccctcatc tcccgtggag ggaaagcggc cgtttgcggc cgatatctct tcaattgggc 9240 ggtgaagacc aagctcaaac tcactccatt gccggaggcg cgcctactgg acttatccag 9300 ttggttcacc gtcggcgccg gcgggggcga catttttcac agcgtgtcgc gcgcccgacc 9360 ccgctcatta ctcttcggcc tactcctact tttcgtaggg gtaggcctct tcctactccc 9420 cgctcggtag agcggcacac actaggtaca ctccatagct aactgttcct tttttttttt 9480 tttttttttt tttttttttt tttttttttt ttcttttttt tttttttccc tctttcttcc 9540 cttctcatct tattctactt tctttcttgg tggctccatc ttagccctag tcacggctag 9600 ctgtgaaagg tccgtgagcc gcatgactgc agagagtgcc gtaactggtc tctctgcaga 9660 tcatgt 9666 <210> 32 <211> 9666 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic DNA <400> 32 acctgcccct aataggggcg acactccgcc atgaatcact cccctgtgag gaactactgt 60 cttcacgcag aaagcgccta gccatggcgt tagtatgagt gtcgtacagc ctccaggccc 120 ccccctcccg ggagagccat agtggtctgc ggaaccggtg agtacaccgg aattgccagg 180 acgaccgggt cctttcttgg atcaacccgc tcaatgcctg gagatttggg cgtgcccccg 240 cgagactgct agccgagtag tgttgggtcg cgaaaggcct tgtggtactg cctgataggg 300 tgcttgcgag tgccccggga ggtctcgtag accgtgcatc atgagcacaa atcctaaacc 360 ccaaagaaaa accaaacgta acaccaaccg tcgcccacag gacgttaagt tcccgggcgg 420 tggtcagatc gtcggtggag tttacttgtt gccgcgcagg ggccccaggt tgggtgtgcg 480 tgcgactagg aagacttccg agcggtcgca acctcgtgga aggcgacaac ctatccccaa 540 ggctcgccgg cccgagggca ggacctgggc tcagcctggg tatccttggc ccctctatgg 600 caatgagggc ttggggtggg caggatggct cctgtcaccc cgcggctctc ggcctagttg 660 gggccctaat gacccccggc gtaggtcgcg taatttgggt aaggtcatcg atacccttac 720 atgcggcttc gccgacctca tggggtacat cccgcttgtc ggcgccccct tagggggcgc 780 tgccagggcc ctggcacatg gtgtccgggt tctggaggac ggcgtgaact atgcaacagg 840 gaatttgccc ggttgctctt tctctatctt cctcttagct ctgctgtcct gtttgaccat 900 cccagcttcc gcttatgaag tgcgcaacgt gtccgggata taccatgtca caaacgactg 960 ctccaactca agcattgtgt atgaggcggc ggacgtgatc atgcatgccc ccgggtgcgt 1020 gccctgcgtt cgggagaaca attcctcccg ttgctgggta gcgctcactc ccacgctcgc 1080 ggccaggaat gccagcgtcc ccactacgac attacgacgc cacgtcgact tgctcgttgg 1140 gacggctgct ttctgctccg ctatgtacgt gggggatctc tgcggatctg ttttcctcat 1200 ctcccagctg ttcaccttct cgcctcgccg gcatgagaca gtacaggact gcaactgctc 1260 aatctatccc ggccacgtat caggccatcg tatggcttgg gatatgatga tgaactggtc 1320 gcccacggca gccttagtgg tgtcgcagtt actccggatc ccacaagctg tcatggacat 1380 ggtggcgggg gcccactggg gagtcctagc gggccttgcc tactattcca tggtggggaa 1440 ctgggctaag gttttgattg tgatgctact ctttgccggc gttgacgggc atacccgcgt 1500 gacggggggg gtgcaaggcc atgtcacctc tacactcacg tccctcttta gacctggggc 1560 gtcccagaaa attcagcttg taaacaccaa tggcagttgg catatcaaca ggactgccct 1620 gaactgcaat gactccctca aaactgggtt tcttgccgcg ctgttctaca cacacaagtt 1680 caacgcgtcc ggatgcccgg agcgcatggc cagctgtcgc tccattgaca agttcgacca 1740 gggatggggt cccatcacct atgctcaacc tgacaactcg gaccagaggc cgtattgctg 1800 gcactacgca cctcgacagt gtggtatcgt acccgcgtcg caggtgtgcg gtccagtgta 1860 ttgcttcacc ccaagccctg ttgtagtggg gacgaccgat cgtttcggcg cccctacgta 1920 taactggggg gacaatgaga cggacgtgct gctcctaaac aacacgcggc cgccgcatgg 1980 caactggttc ggctgtacat ggatgaatag cactgggttc accaagacgt gcggaggccc 2040 cccgtgtaac atcagggggg tcggcaacaa caccttgacc tgccccacgg actgcttccg 2100 gaagcacccc gacgccactt acacaaaatg tggttcgggc ccttggttga cacctaggtg 2160 cttggttgac tacccataca ggctctggca ctacccctgc actgtcaact ttaccatctt 2220 caaggttagg atgtatgtgg ggggcgtgga gcacaggctt gatgctgcat gcaactggac 2280 tcgaggagag cgttgcgact tggaggacag ggatagagca gagctcagcc cgctattgct 2340 gtctacaaca gagtggcaga tactgccctg ttcctacacc accctaccgg ctctgtccac 2400 tggtttaatc cacctccacc agaacatcgt ggacatacaa tacctgtacg gtatagggtc 2460 ggcggtcgtc tccattgcca tcaagtggga gtatgtcgtg ctgctcttcc ttctcctggc 2520 ggacgcgcgc gtctgtgcct gcttgtggat gatgctgctg atagcccagg ccgaggctgc 2580 cttagagaac ttggtggtcc tcaatgcggc gtccgtggtc ggagcgcatg gcatgctccc 2640 cttctttatg ttcttctgtg ccgcctggta catgaagggc aggctggtcc ctggagcggc 2700 atacgctttc tacggtgtat ggccgctgct cctgctcctg ctagcattac caccacgagc 2760 ttacgccatg gaccgggaga tggttgcatc ttgcggaggc ggggtttttg taggtctagc 2820 actcctgacc ttgtcaccat actgtaaagt gttcctcgct aggctcatat ggtggttaca 2880 atattttatc accaaagccg aggcgcattt gcaagtgtcg ctcccccccc tcaacgttcg 2940 aggcggacgc gatgccatca tcctcctcat gtgcgcggtc cacccagagc taatctttga 3000 catcaccaaa cttctgctct ccatactcgg tccgctcatg gtgctccaag ctagtttaat 3060 ccgagtgccg tacttcgtgc gcgctcaagg gctcattcgc gcatgcatgt tggtgcggaa 3120 agctgccggg ggccattatg tccaaatggc cttcgtgaag ctagctgcgc tgacaggcac 3180 gtacgtttat gaccacctca ctccactgca ggattgggcc catgtgggcc tacgagacct 3240 tgcggtggca gtagagcccg ttgtcttttc tgccatggag accaaggtca tcacctgggg 3300 ggcagacacc gcggcgtgtg gggacattat ctcaggtcta cccgtctccg cccgaagggg 3360 gaaggagata cttttgggac cggccgatag ttttgaaggg caggggtggc gactccttgc 3420 tcccatcact gcttatgccc agcaaacacg aggcctcctg ggcgccatag tggtgagtat 3480 gacggggcgt gacaggacag aacaggccgg ggaagtccaa atcctgtcca cagtctctca 3540 gtccttcctc ggaacaacca tctcgggggt tttgtggact gtttaccacg gagctggcaa 3600 caagactcta gccggcttac ggggtccggt cacgcagatg tactcgagtg ctgaggggga 3660 cttggtaggc tggcccagcc cccctgggac caagtctttg gagccgtgca agtgtggagc 3720 cgtcgaccta tatctggtca cgcggaacgc tgatgtcatc ccggctcgga gacgcgggga 3780 caagcgggga gcattgctct ccccgagacc catttcgacc ttgaaggggt cctcgggggg 3840 gccggtgctc tgccctaggg gccacgtcgt tgggctcttc cgagcagctg tgtgctctcg 3900 gggcgtggcc aaatccatcg atttcatccc cgttgagaca ctcgacgttg ttacaaggtc 3960 tcccactttc agtgacaaca gcacgccacc ggctgtgccc cagacctatc aggtcgggta 4020 cttgcatgct ccaactggca gtggaaagag caccaaggtc cctgtcgcgt atgccgccca 4080 ggggtacaaa gtactagtgc ttaacccctc ggtagctgcc accctggggt ttggggcgta 4140 cctatccaag gcacatggca tcaatcccaa cattaggact ggagtcagga ccgtgatgac 4200 cggggaggcc atcacgtact ccacatatgg caaatttctc gccgatgggg gctgcgctag 4260 cggcgcctat gacatcatca tatgcgatga atgccacgct gtggatgcta cctccattct 4320 cggcatcgga acggtccttg atcaagcaga gacagccggg gtcagactaa ctgtgctggc 4380 tacggccaca ccccccgggt cagtgacaac cccccatccc gatatagaag aggtaggcct 4440 cgggcgggag ggtgagatcc ccttctatgg gagggcgatt cccctatcct gcatcaaggg 4500 agggagacac ctgattttct gccactcaaa gaaaaagtgt gacgagctcg cggcggccct 4560 tcggggcatg ggcttgaatg ccgtggcata ctatagaggg ttggacgtct ccataatacc 4620 agctcaggga gatgtggtgg tcgtcgccac cgacgccctc atgacggggt acactggaga 4680 ctttgactcc gtgatcgact gcaatgtagc ggtcacccaa gctgtcgact tcagcctgga 4740 ccccaccttc actataacca cacagactgt cccacaagac gctgtctcac gcagtcagcg 4800 ccgcgggcgc acaggtagag gaagacaggg cacttatagg tatgtttcca ctggtgaacg 4860 agcctcagga atgtttgaca gtgtagtgct ttgtgagtgc tacgacgcag gggctgcgtg 4920 gtacgatctc acaccagcgg agaccaccgt caggcttaga gcgtatttca acacgcccgg 4980 cctacccgtg tgtcaagacc atcttgaatt ttgggaggca gttttcaccg gcctcacaca 5040 catagacgcc cacttcctct cccaaacaaa gcaagcgggg gagaacttcg cgtacctagt 5100 agcctaccaa gctacggtgt gcgccagagc caaggcccct cccccgtcct gggacgccat 5160 gtggaagtgc ctggcccgac tcaagcctac gcttgcgggc cccacacctc tcctgtaccg 5220 tttgggccct attaccaatg aggtcaccct cacacaccct gggacgaagt acatcgccac 5280 atgcatgcaa gctgaccttg aggtcatgac cagcacgtgg gtcctagctg gaggagtcct 5340 ggcagccgtc gccgcatatt gcctggcgac tggatgcgtt tccatcatcg gccgcttgca 5400 cgtcaaccag cgagtcgtcg ttgcgccgga taaggaggtc ctgtatgagg cttttgatga 5460 gatggaggaa tgcgcctcta gggcggctct catcgaagag gggcagcgga tagccgagat 5520 gttgaagtcc aagatccaag gcttgctgca gcaggcctct aagcaggccc aggacataca 5580 acccgctatg caggcttcat ggcccaaagt ggaacaattt tgggccagac acatgtggaa 5640 cttcattagc ggcatccaat acctcgcagg attgtcaaca ctgccaggga accccgcggt 5700 ggcttccatg atggcattca gtgccgccct caccagtccg ttgtcgacca gtaccaccat 5760 ccttctcaac atcatgggag gctggttagc gtcccagatc gcaccacccg cgggggccac 5820 cggctttgtc gtcagtggcc tggtgggggc tgccgtgggc agcataggcc tgggtaaggt 5880 gctggtggac atcctggcag gatatggtgc gggcatttcg ggggccctcg tcgcattcaa 5940 gatcatgtct ggcgagaagc cctctatgga agatgtcatc aatctactgc ctgggatcct 6000 gtctccggga gccctggtgg tgggggtcat ctgcgcggcc attctgcgcc gccacgtggg 6060 accgggggag ggcgcggtcc aatggatgaa caggcttatt gcctttgctt ccagaggaaa 6120 ccacgtcgcc cctactcact acgtgacgga gtcggatgcg tcgcagcgtg tgacccaact 6180 acttggctct cttactataa ccagcctact cagaagactc cacaattgga taactgagga 6240 ctgccccatc ccatgctccg gatcctggct ccgcgacgtg tgggactggg tttgcaccat 6300 cttgacagac ttcaaaaatt ggctgacctc taaattgttc cccaagctgc ccggcctccc 6360 cttcatctct tgtcaaaagg ggtacaaggg tgtgtgggcc ggcactggca tcatgaccac 6420 gcgctgccct tgcggcgcca acatctctgg caatgtccgc ctgggctcta tgaggatcac 6480 agggcctaaa acctgcatga acacctggca ggggaccttt cctatcaatt gctacacgga 6540 gggccagtgc gcgccgaaac cccccacgaa ctacaagacc gccatctgga gggtggcggc 6600 ctcggagtac gcggaggtga cgcagcatgg gtcgtactcc tatgtaacag gactgaccac 6660 tgacaatctg aaaattcctt gccaactacc ttctccagag tttttctcct gggtggacgg 6720 tgtgcagatc cataggtttg cacccacacc aaagccgttt ttccgggatg aggtctcgtt 6780 ctgcgttggg cttaattcct atgctgtcgg gtcccagctt ccctgtgaac ctgagcccga 6840 cgcagacgta ttgaggtcca tgctaacaga tccgccccac atcacggcgg agactgcggc 6900 gcggcgcttg gcacggggat cacctccatc tgaggcgagc tcctcagtga gccagctatc 6960 agcaccgtcg ctgcgggcca cctgcaccac ccacagcaac acctatgacg tggacatggt 7020 cgatgccaac ctgctcatgg agggcggtgt ggctcagaca gagcctgagt ccagggtgcc 7080 cgttctggac tttctcgagc caatggccga ggaagagagc gaccttgagc cctcaatacc 7140 atcggagtgc atgctcccca ggagcgggtt tccacgggcc ttaccggctt gggcacggcc 7200 tgactacaac ccgccgctcg tggaatcgtg gaggaggcca gattaccaac cgcccaccgt 7260 tgctggttgt gctctccccc cccccaagaa ggccccgacg cctcccccaa ggagacgccg 7320 gacagtgggt ctgagcgaga gcaccatatc agaagccctc cagcaactgg ccatcaagac 7380 ctttggccag cccccctcga gcggtgatgc aggctcgtcc acgggggcgg gcgccgccga 7440 atccggcggt ccgacgtccc ctggtgagcc ggccccctca gagacaggtt ccgcctcctc 7500 tatgcccccc ctcgaggggg agcctggaga tccggacctg gagtctgatc aggtagagct 7560 tcaacctccc ccccaggggg ggggggtagc tcccggttcg ggctcggggt cttggtctac 7620 ttgctccgag gaggacgata ccaccgtgtg ctgctccatg tcatactcct ggaccggggc 7680 tctaataact ccctgtagcc ccgaagagga aaagttgcca atcaaccctt tgagtaactc 7740 gctgttgcga taccataaca aggtgtactg tacaacatca aagagcgcct cacagagggc 7800 taaaaaggta acttttgaca ggacgcaagt gctcgacgcc cattatgact cagtcttaaa 7860 ggacatcaag ctagcggctt ccaaggtcag cgcaaggctc ctcaccttgg aggaggcgtg 7920 ccagttgact ccaccccatt ctgcaagatc caagtatgga ttcggggcca aggaggtccg 7980 cagcttgtcc gggagggccg ttaaccacat caagtccgtg tggaaggacc tcctggaaga 8040 cccacaaaca ccaattccca caaccatcat ggccaaaaat gaggtgttct gcgtggaccc 8100 cgccaagggg ggtaagaaac cagctcgcct catcgtttac cctgacctcg gcgtccgggt 8160 ctgcgagaaa atggccctct atgacattac acaaaagctt cctcaggcgg taatgggagc 8220 ttcctatggc ttccagtact cccctgccca acgggtggag tatctcttga aagcatgggc 8280 ggaaaagaag gaccccatgg gtttttcgta tgatacccga tgcttcgact caaccgtcac 8340 tgagagagac atcaggaccg aggagtccat ataccaggcc tgctccctgc ccgaggaggc 8400 ccgcactgcc atacactcgc tgactgagag actttacgta ggagggccca tgttcaacag 8460 caagggtcaa acctgcggtt acagacgttg ccgcgccagc ggggtgctaa ccactagcat 8520 gggtaacacc atcacatgct atgtgaaagc cctagcggcc tgcaaggctg cggggatagt 8580 tgcgcccaca atgctggtat gcggcgatga cctagtagtc atctcagaaa gccaggggac 8640 tgaggaggac gagcggaacc tgagagcctt cacggaggcc atgaccaggt actctgcccc 8700 tcctggtgat ccccccagac cggaatatga cctggagcta ataacatcct gttcctcaaa 8760 tgtgtctgtg gcgttgggcc cgcggggccg ccgcagatac tacctgacca gagacccaac 8820 cactccactc gcccgggctg cctgggaaac agttagacac tcccctatca attcatggct 8880 gggaaacatc atccagtatg ctccaaccat atgggttcgc atggtcctaa tgacacactt 8940 cttctccatt ctcatggtcc aagacaccct ggaccagaac ctcaactttg agatgtatgg 9000 atcagtatac tccgtgaatc ctttggacct tccagccata attgagaggt tacacgggct 9060 tgacgccttt tctatgcaca catactctca ccacgaactg acgcgggtgg cttcagccct 9120 cagaaaactt ggggcgccac ccctcagggt gtggaagagt cgggctcgcg cagtcagggc 9180 gtccctcatc tcccgtggag ggaaagcggc cgtttgcggc cgatatctct tcaattgggc 9240 ggtgaagacc aagctcaaac tcactccatt gccggaggcg cgcctactgg acttatccag 9300 ttggttcacc gtcggcgccg gcgggggcga catttttcac agcgtgtcgc gcgcccgacc 9360 ccgctcatta ctcttcggcc tactcctact tttcgtaggg gtaggcctct tcctactccc 9420 cgctcggtag agcggcacac actaggtaca ctccatagct aactgttcct tttttttttt 9480 tttttttttt tttttttttt tttttttttt ttcttttttt tttttttccc tctttcttcc 9540 cttctcatct tattctactt tctttcttgg tggctccatc ttagccctag tcacggctag 9600 ctgtgaaagg tccgtgagcc gcatgactgc agagagtgcc gtaactggtc tctctgcaga 9660 tcatgt 9666 <210> 33 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> n is A, G, C or T <222> (7) <220> <223> Description of Artificial Sequence: synthetic <400> 33 cgtctcntat tacctgcc 18 <210> 34 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> n is A, G, C or T <222> (12) <220> <223> Description of Artificial Sequence: synthetic <400> 34 gatcatgtcc cngagacg 18 <210> 35 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> n is A, G, C or T <222> (7) <220> <223> Description of Artificial Sequence: synthetic <400> 35 gcagagnata atggacgg 18 <210> 36 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> n is A, G, C or T <222> (12) <220> <223> Description of Artificial Sequence: synthetic <400> 36 ctagtacagg gnctctgc 18 <210> 37 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 37 gggttattgg agacggtacc gtctcctccc ccc 33 <210> 38 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 38 cccaataacc tctgccatgg cagaggaggg ggg 33 <210> 39 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 39 tattacctgc c 11 <210> 40 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 40 ctagtacagg g 11 <210> 41 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 41 gggttattac ctgcc 15 <210> 42 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 42 gatcatgtcc cccc 14 <210> 43 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 43 cccaataatg gacgg 15 <210> 44 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 44 ctagtacagg gggg 14 <210> 45 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: synthetic <400> 45 tgctggcttt gatgaaaacc tgcccctaat ag 32

Claims (4)

  1. 이하의 (i) 또는 (ii)의 발현 벡터를 Huh7, RCYM1RC, 5-15RC, HepG2 및 그들의 세포로부터 파생된 주화 세포로 이루어지는 군에서 선택되는 세포에 도입하는 공정을 포함하는 것을 특징으로 하는 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법.
    [(i) RNA 폴리메라아제 I 프로모터의 하류에, HCV주 유래의 5'비번역 영역, Core단백질, E1단백질, E2단백질, p7단백질, NS2단백질을 코드하는 DNA 서열과, HCV JFH1주 유래의 NS3, NS4A, NS4B, NS5A 및 NS5B단백질, 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터, 또는
    (ii) RNA 폴리메라아제 I 프로모터의 하류에, HCV주 유래의 5'비번역 영역, Core단백질, E1단백질, E2단백질, p7단백질을 코드하는 DNA 서열과, HCV JFH1주 유래의 NS2, NS3, NS4A, NS4B, NS5A 및 NS5B단백질, 및 3'비번역 영역을 코드하는 DNA 서열을 포함하고, 그 하류에 RNA 폴리메라아제 I 터미네이터를 갖는 DNA를 더 포함하는 발현 벡터.]
  2. 제 1 항에 있어서, 상기 HCV주가 유전자형 1 또는 유전자형 2의 HCV주인 것을 특징으로 하는 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법.
  3. 제 2 항에 있어서, 상기 유전자형 1의 HCV주가 H77c주, 1주, H주, HC-J1주, J1주, con1주, TH주, J주, JT주, BK주로 이루어지는 군에서 선택되는 것을 특징으로 하는 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법.
  4. 제 2 항에 있어서, 상기 유전자형 2의 HCV주가 J6CF주, JFH1주, JCH1주, HC-J8주로 이루어지는 군에서 선택되는 것을 특징으로 하는 감염성 C형 간염 바이러스(HCV) 입자를 산생하는 방법.
KR1020087009938A 2005-09-30 2006-09-29 감염성 c형 간염 바이러스 입자 고산생계 KR101355903B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00287646 2005-09-30
JP2005287646 2005-09-30
PCT/JP2006/319572 WO2007037428A1 (ja) 2005-09-30 2006-09-29 感染性c型肝炎ウイルス粒子高産生系

Publications (2)

Publication Number Publication Date
KR20080068817A true KR20080068817A (ko) 2008-07-24
KR101355903B1 KR101355903B1 (ko) 2014-01-28

Family

ID=37899848

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087009938A KR101355903B1 (ko) 2005-09-30 2006-09-29 감염성 c형 간염 바이러스 입자 고산생계

Country Status (10)

Country Link
US (1) US8143022B2 (ko)
EP (1) EP1956087B1 (ko)
JP (1) JP5030065B2 (ko)
KR (1) KR101355903B1 (ko)
CN (1) CN101321865B (ko)
AU (1) AU2006295800B2 (ko)
CA (1) CA2624242A1 (ko)
DE (1) DE602006014586D1 (ko)
ES (1) ES2341800T3 (ko)
WO (1) WO2007037428A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5657251B2 (ja) * 2007-07-13 2015-01-21 国立感染症研究所長 エピトープタグ化c型肝炎ウイルス粒子の作製と利用
CA2722043A1 (en) 2008-04-25 2009-10-29 Toray Industries, Inc. Nucleic acid comprising chimeric gene derived from hepatitis c virus
EP2770055A1 (en) 2008-12-26 2014-08-27 Toray Industries, Inc. Nucleic acid derived from hepatitis C virus, and expression vector, transformed cell and hepatitis C virus particles each prepared by using the same
US8592559B2 (en) 2009-10-30 2013-11-26 Toray Industries, Inc. Antibody having activity of inhibiting hepatitis C virus (HCV) infection and use thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19915178A1 (de) 1999-04-03 2000-10-05 Univ Mainz Johannes Gutenberg Hepatitis C Virus Zellkultursystem
ES2347237T3 (es) 2003-05-26 2010-10-27 Toray Industries, Inc. Constructo de acido nucleico que contiene el virus de la hepatitis c (vhc) del acido nucleico de origen genomico de genotipo 2a y celula que tiene el constructo de acido nucleico transferido a su interior.
US7659103B2 (en) 2004-02-20 2010-02-09 Tokyo Metropolitan Organization For Medical Research Nucleic acid construct containing fulllength genome of human hepatitis C virus, recombinant fulllength virus genome-replicating cells having the nucleic acid construct transferred thereinto and method of producing hepatitis C virus Particle

Also Published As

Publication number Publication date
EP1956087B1 (en) 2010-05-26
US20100035345A1 (en) 2010-02-11
EP1956087A4 (en) 2009-05-27
WO2007037428A1 (ja) 2007-04-05
JPWO2007037428A1 (ja) 2009-04-16
CN101321865A (zh) 2008-12-10
JP5030065B2 (ja) 2012-09-19
CN101321865B (zh) 2011-12-14
EP1956087A1 (en) 2008-08-13
ES2341800T3 (es) 2010-06-28
US8143022B2 (en) 2012-03-27
KR101355903B1 (ko) 2014-01-28
AU2006295800B2 (en) 2011-08-18
AU2006295800A1 (en) 2007-04-05
DE602006014586D1 (de) 2010-07-08
CA2624242A1 (en) 2007-04-05

Similar Documents

Publication Publication Date Title
EP1801209B1 (en) Modified human hepatitis c virus genomic rna having autonomous replicative competence
US8383371B2 (en) Nucleic acid construct containing a nucleic acid derived from the genome of hepatitis C virus (HCV) of genotype 2a, and a cell having such nucleic acid construct introduced therein
Lohmann et al. Viral and cellular determinants of hepatitis C virus RNA replication in cell culture
EP2344647A1 (en) Hepatitis c virus expressing reporter tagged ns5a protein
KR101355903B1 (ko) 감염성 c형 간염 바이러스 입자 고산생계
US8741607B2 (en) HCV/GBV-B chimeric virus
WO2005028652A1 (ja) 新規hcv株由来の核酸、遺伝子、及び該遺伝子を利用したレプリコン複製細胞
EP1499727A1 (en) Hepatitis c virus replicon containing a reporter gene and a selectable marker gene
JP2005528885A (ja) Gbウイルスbレプリコン及びレプリコン強化細胞

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee