KR102309355B1 - 표지된 헤파드나바이러스 e 항원 및 항바이러스 물질 스크리닝에서의 이의 용도 - Google Patents
표지된 헤파드나바이러스 e 항원 및 항바이러스 물질 스크리닝에서의 이의 용도 Download PDFInfo
- Publication number
- KR102309355B1 KR102309355B1 KR1020167035519A KR20167035519A KR102309355B1 KR 102309355 B1 KR102309355 B1 KR 102309355B1 KR 1020167035519 A KR1020167035519 A KR 1020167035519A KR 20167035519 A KR20167035519 A KR 20167035519A KR 102309355 B1 KR102309355 B1 KR 102309355B1
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- hepadnavirus
- acid sequence
- label
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
- G01N33/502—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/576—Immunoassay; Biospecific binding assay; Materials therefor for hepatitis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/42—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a HA(hemagglutinin)-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/005—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB
- C12N2830/006—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination repressible enhancer/promoter combination, e.g. KRAB tet repressible
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/005—Assays involving biological materials from specific organisms or of a specific nature from viruses
- G01N2333/01—DNA viruses
- G01N2333/02—Hepadnaviridae, e.g. hepatitis B virus
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Hematology (AREA)
- Organic Chemistry (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Biotechnology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Food Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Toxicology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Communicable Diseases (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 발명은 항-헤파드나바이러스 물질을 스크리닝하기 위한 방법 및 용도에 관한 것이며, 여기서 상기 물질은 헤파드나바이러스, 예컨대 B 형 간염 바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 능력에 대해 스크리닝된다. 상기 방법 및 용도는 표지된 헤파드나바이러스 e 항원, 예컨대 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 세포를 이용한다. 또한, 본 발명은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열 및 그로써 인코딩된 단백질을 제공한다. 또한 스크리닝 방법에서 사용되는 키트가 제공된다.
Description
본 발명은 미국 국립 보건원 (National Institutes of Health) 에 의해 수여받은 계약 번호 R01AI094474 하에 정부 지원으로 이루어졌다. 미국 정부는 본 발명에서 특정 권리를 갖는다.
본 발명은 항-헤파드나바이러스 물질을 스크리닝하기 위한 방법 및 용도에 관한 것이며, 여기서 상기 물질은 본 발명에서 기재된 세포주에서 대부분 공유결합 폐환형 (covalently closed circular) (ccc) DNA-의존적인 B 형 간염 e 항원 (HBeAg) 의 저해제이며 헤파드나바이러스, 예컨대 B 형 간염 바이러스 (HBV) 의 ccc DNA 를 저해하는 능력에 대해 스크리닝된 cccDNA 에 대한 대리 마커로서 역할할 수 있다. 상기 방법 및 용도는 표지된 헤파드나바이러스 e 항원, 예컨대 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 세포를 이용한다. 또한, 본 발명은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열 및 그로써 인코딩된 단백질을 제공한다. 또한 스크리닝 방법에서 사용되는 키트가 제공된다.
만성 B 형 간염은 전세계에서 대략 3 억 5 천만명 및 미국에서 120 만명 이상에게 발병하는 현재 실질적인 공중 위생 문제점이다. 이들 환자는 간 경화증, 간세포 암종 (HCC) 및 기타 중증 임상 후유증의 증가한 위험성을 갖는다 (1, 2, 12, 14). 연간, 전세계적으로 약 100 만명이 HBV-관련 간 질환으로 인해 사망한다. 따라서 이는 만성 HBV 감염을 치료하고 그의 심각한 결과를 예방하기 위한 세계적 건강 우선순위이다.
B 형 간염 바이러스 (HBV) 는 헤파드비리대 (Hepadnaviridae) 패밀리에 속하는 비세포변성, 간 향성 (liver tropic) DNA 바이러스이다. 헤파드나바이러스는 인간 및 동물에서 간 감염을 일으킬 수 있는 외피형, 이중가닥 바이러스의 패밀리이다. 헤파드나바이러스는 유사한 게놈 조직을 공유한다. 이들은 일부 이중가닥 환형 DNA 의 작은 게놈을 갖는다. 게놈은 DNA 의 2 개 가닥으로 이루어지며, 하나는 음성-가닥 (negative-sense) 배향을 갖고 다른 가닥은 양성-가닥 (positive-sense) 배향을 갖는다. 복제는 프리게놈 RNA 로 불리는 RNA 중간체의 역전사를 포함한다 (15, 19). 3 개의 주요 개방 판독 프레임 (ORF) 이 인코딩되며 바이러스는 5 개의 공지된 mRNA 를 갖는다 (18, 19).
감염시, 바이러스 게놈 이완 환형 (rc) DNA 가 세포 핵에 이송되며 에피솜 공유결합 폐환형 (ccc) DNA 로 변환되는데, 이는 모든 바이러스 mRNA 에 대한 전사 주형으로서 역할한다 (HBeAg 에 대한 전구체인 프리코어 단백질을 인코딩하는 특히 3.5-3.6kb 프리코어 mRNA; 코어 단백질 및 바이러스 중합효소를 인코딩하는 3.5kb 프리게놈 (pg) RNA; 바이러스 외피 단백질 (대 (L), 중 (M) 및 소 (S) 항원) 을 인코딩하는 2.4kb/2.1kb 표면 mRNA; 및 X 단백질에 대한 0.7kb X mRNA (18, 19). HBeAg 는 프리코어 단백질의 C-말단 아르기닌-풍부 서열 및 N-말단 신호 펩티드를 제거하는 2 가지 단백질분해 이벤트에 의해 생성된다 (Wang (1991) J Virol 65(9), 5080 (10, 21). 전사 및 핵 배출 후, 세포질 바이러스 pgRNA 가 HBV 중합효소 및 캡시드 단백질과 어셈블링되어 뉴클레오캡시드를 형성하고, 그의 내부에서 중합효소-촉매화된 역전사가 마이너스-가닥 DNA 를 산출하여, 이후 플러스-가닥 DNA 로 카피되어 자손 rcDNA 게놈을 형성한다. 새로이 합성된 성숙한 뉴클레오캡시드는 바이러스 외피 단백질로 패키징되어 비리온 입자로서 배출되거나, 핵으로 다시 왕복하여 세포내 cccDNA 증폭 경로를 통해 cccDNA 저장소를 증폭시킬 것이다 (19). 따라서, 만성 B 형 간염에 대한 분자적 기초는 감염된 간세포의 핵에서의 바이러스 cccDNA 의 지속성이다.
만성 B 형 간염에 대한 확정적인 치료법은 존재하지 않는다. HBV 치료에 대한 현재 승인 약물은 인터페론-α (IFN-α) 및 5 개 뉴클레오시(티)드 유사체 (라미부딘, 아데포비르, 엔테카비르, 텔비부딘 및 테노포비르) 이다. [Xu (2010) J Virol (84) 9332-9340] 은 마우스 인터페론으로의 마우스 간세포 치료를 개시하고 있다. IFN-α 는 48 주 표준 치료 후, 유의한 역효과와 함께 환자의 소수 군에서 지속된 바이러스학적 반응을 달성한다 (9). 5 개의 뉴클레오시(티)드 유사체 (NA) 는 모두 바이러스 중합효소 저해제로서 역할하지만, 드물게 HBV 감염을 치유하고 (6), 저항성 출현은 그의 장기간 효능을 극적으로 제한한다 (16, 24). 현 치료의 주요한 제한이 이전부터 존재하는 cccDNA 풀 (pool) 을 제거하고/하거나 트레이스-레벨 (trace-level) 야생형 또는 약물 저항성 바이러스로부터의 cccDNA 형성을 방지하는 것의 실패라는 점이 이제 널리 알려져 있다. 따라서 cccDNA 형성 및 유지를 직접적으로 표적화하는 신규한 치료제의 개발에 대한 긴급한 충족되지 않은 필요성이 존재한다.
[Cai (2013) Methods in Mol Biol 1030 (151-161)] 은 세포 배양물로부터의 HBV ccc (공유결합 폐환) DNA 의 검출을 위한 서던 (southern) 블롯 검정을 개시하고 있다. 지금까지, 항-cccDNA 제제에 대한 스크리닝은 효율적 시험관내 (in vitro) HBV 감염 모델의 부족 및 고-처리량 내지 중간-처리량 포맷으로의 cccDNA 측정을 위한 실제적 접근법이 이용 불가하였기 때문에 제한되어왔다. 대안적으로, cccDNA 형성은 HepG2.2.15 및 HepAD38 세포에 의해 나타내는 바와 같이, 구성적 또는 조건적으로 HBV 게놈을 복제하는 안정적-트랜스펙션된 HBV 세포 배양물에서의 세포내 증폭 경로를 통해 달성될 수 있다 (7, 11, 20).
그러나, 서던 블롯 혼성화 또는 실시간 PCR 검정에 의한 HBV 세포주로부터의 직접적 cccDNA 검출은 각각 민감성 및 특이성 논쟁으로 인해 스크리닝될 수 없다. 한편, HepG2.2.15 세포에서 cccDNA 에 대한 적합한 대리 마커가 존재하지 않는데, 이는 대부분의 바이러스 생성물이 통합된 바이러스 이식유전자에서 유래하여, cccDNA 기여와 구별되지 않기 때문이다. 분비된 HBeAg 의 생성이 HepAD38 세포에서 대부분 cccDNA-의존적이며 cccDNA 에 대한 대리 마커로서 역할할 수 있다는 것이 이미 보고된 바 있다 (11, 23). 최근, [Cai, et al.] 은 오직 cccDNA-의존적인 HBeAg 생성 세포주의 업그레이드 버전, 즉 HepDE19 세포 (7) 를 cccDNA 저해제의 스크리닝을 위한 96-웰 포맷 검정에 적용하였으며 cccDNA 형성을 저해하는 2 개의 소분자 화합물을 확인하였다 (3). 따라서 이러한 작업은, cccDNA 생합성이 화학 분자에 의해 직접적으로 표적화될 수 있으며, cccDNA 저해제가 고처리량 스크리닝 캠페인으로부터 확인될 수 있었다는 견고한 "개념 입증 (proof-of-concept)" 설명을 제공하였다. 그러나, 존재하는 HepDE19 검정 시스템의 특정한 불리한 점은 더 큰 라이브러리의 스크리닝이 실행불가하게 만든다는 것이다. 예를 들어, HBeAg 에 대해 현재 사용되는 고전적 ELISA 검정은 여러 조작을 필요로 하고, 아미노산 서열 상동성으로 인한 바이러스 코어 단백질과의 교차 반응의 특정 정도를 나타내며, 더 큰 포맷의 세포 기반 검정에 적합하지 않다.
따라서, 본 발명에 근원적인 기술적 문제점은 헤파드나바이러스 cccDNA 의 저해제를 안정적으로 스크리닝하는 수단 및 방법의 제공이다.
기술적 문제점은 특허청구범위에 특징화된 구현예의 제공에 의해 해결된다.
따라서 본 발명은 하기 단계를 포함하는, 헤파드나바이러스의 ccc (공유결합 폐환) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법에 관한 것이다:
(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보물 분자와 접촉시키는 단계;
(b) 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 단계; 및
(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보물 분자를 선택하는 단계.
상기 방법은 일반적으로 기타 포유류 및 조류 헤파드나바이러스, 예컨대 대표적 마멋 간염 바이러스 (WHV) 및 오리 B 형 간염 바이러스 (DHBV) (B 형 간염 바이러스 (HBV) 와 유사한 유전자 조직 및 복제 계획을 공유함) 에 적용가능하다. 본원에 제공된 B 형 간염 바이러스에 관한 설명 및 실험은 다른 헤파드나바이러스에 대해서도 마찬가지로 적용된다. 그러나, 본원에 제공된 교시는 "B 형 간염 바이러스"/HBV 에 대한 바람직한 구현예에 관한 것이다. 용어 "헤파드나바이러스", "B 형 간염 바이러스", "오리 B 형 간염 바이러스", "마멋 간염 바이러스 (WHV)" 는 당업계에 널리 공지되어 있으며 여기서 그에 따라 사용된다. 약어 "HBV", "DHBV" 또는 "WHV" 는 여기서 각각 전체 명칭 "B 형 간염 바이러스", "오리 B 형 간염 바이러스" 및 "마멋 간염 바이러스" 와 상호교환가능하게 사용된다.
여기서 바람직한 헤파드나바이러스는 바람직하게는 B 형 간염 바이러스 (HBV) 이다. B 형 간염 바이러스 (HBV) 는 헤파드나비리대 패밀리에 속하는 비세포변성, 간 향성 DNA 바이러스이며, 즉 HBV 는 헤파드나바이러스이다. HBV 게놈의 예시적 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다.
여기서 바람직한 헤파드나바이러스 e 항원은 B 형 간염 바이러스 e 항원 (HBeAg) 이다. 용어 "B 형 간염 바이러스 e 항원" 및 "HBeAg" 는 여기서 상호교환가능하게 사용된다. HBeAg 의 예시적 핵산 서열 및 아미노산 서열을 각각 SEQ ID NO: 16 및 18 에서 나타낸다. 본원에서 사용하는 바와 같이 "헤파드나바이러스 e 항원" (및 마찬가지로 "B 형 간염 바이러스 e 항원") 은 주로 단백질/폴리펩티드, 예를 들어 SEQ ID NO: 18 에서 나타낸 바와 같은 아미노산 서열을 갖는 단백질/폴리펩티드를 나타낸다.
HBeAg 는 감염시 하기와 같이 생성될 수 있다: 감염시, HBV 바이러스 게놈 이완 환형 (rc) DNA 가 세포 핵 내로 이송되고 에피솜 cccDNA 로 변환되어, 모든 바이러스 mRNA (HBeAg 에 대한 전구체인 프리코어 단백질을 인코딩하는 3.5-3.6kb 프리코어 mRNA 포함) 에 대한 전사 주형으로서 역할한다. 용어 "ccc DNA" 및 "공유결합 폐환형 DNA" 는 여기서 상호교환가능하게 사용된다.
HBV 프리코어 단백질의 예시적 핵산 서열 및 아미노산 서열은 각각 SEQ ID NO: 15 및 17 에서 나타낸다. HBV 프리코어 단백질은 N-말단 19-아미노산 신호 펩티드, 10-아미노산 링커, 중심 아미노산 스트레치 및 C-말단 34-아미노산 아르기닌-풍부 도메인을 갖는다.
HBV 코어 단백질의 예시적 핵산 서열 및 아미노산 서열은 각각 SEQ ID NO: 23 및 24 에서 나타낸다. 코어 단백질은 이것이 프리코어 단백질의 C-말단 아르기닌-풍부 서열을 포함하지만; 코어 단백질이 프리코어 단백질의 10-아미노산 링커 서열 및 N-말단 신호 펩티드를 포함하지 않는다는 점에서 프리코어 단백질에 상응한다 (SEQ ID NO: 17 참조).
HBeAg 는 프리코어 단백질의 C-말단 아르기닌-풍부 서열 및 N-말단 신호 펩티드를 제거하는 2 가지 단백질분해 이벤트에 의해 생성된다 (Wang (1991) J Virol 65(9), 5080 (21)). 따라서, B 형 간염 바이러스 e 항원 (HBeAg) 은 이것이 프리코어 단백질의 N-말단 10-aa 링커 펩티드를 포함하지만; HBeAg 가 프리코어 단백질의 C-말단 아르기닌-풍부 서열을 포함하지 않는다는 점에서 프리코어 단백질에 상응한다 (SEQ ID NO: 17 참조).
만성 B 형 간염에 대한 분자적 기초는 감염된 간세포의 핵에서의 바이러스 cccDNA 의 지속성이다.
용어 "공유결합 폐환형 DNA (covalently closed circular DNA)" 및 "cccDNA" 는 여기서 상호교환가능하게 사용된다. 용어 "공유결합 폐환형 DNA"/ "cccDNA" 는 당업계에 널리 공지되어 있으며 그에 따라 여기서 사용된다. 일반적으로, 본원에서 사용하는 바와 같은 "공유결합 폐환형 DNA"/ "cccDNA" 는 헤파드나바이러스 mRNA 에 대한 실제 에피솜 전사 주형으로서 역할하는 DNA 를 나타낸다.
B 형 간염 바이러스 e 항원 (HBeAg) 은 만성 헤파드나바이러스 감염을 반영하는 HBV 헤파드나바이러스의 cccDNA 에 대한 허용된 대리 마커이다. 아직까지, HBeAg 를 이용하는 공지된 세포 기반 검정은 바이러스 코어 단백질과의 교차 반응과 같은 불리한 점을 갖는다.
cccDNA 리포터 검출의 특이성 및 민감성을 개선시키기 위해, 여기서 표지 (예컨대 N-말단 포매된 헤마글루티닌 (HA) 에피토프 표지) 를 갖는 재조합체 HBeAg 의 cccDNA-의존적 생성을 지지하는 세포주를 확립하였다. 더욱이, (HA-)표지된 HBeAg 의 검출을 위한 화학발광 ELISA (CLIA) 및 AlphaLISA 검정을 개발하였다. 검정 시스템은 고처리량 스크리닝 포맷 및 완전 자동화에 허용가능하다.
본원에 제공된 방법은 확립된 표지 (예컨대 HA-표지, 또는 His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지 (HA-표지 대신에 또는 이에 추가로 사용할 수 있음) 를 사용한다. 이러한 표지는 표지된 헤파드나바이러스 e 항원의 정제 및 검출에서 사용될 수 있다. 표지에 특이적으로 결합하는 항체를 사용하여 (예를 들어 ELISA 검정, 예컨대 화학발광 ELISA (CLIA) 및 AlphaLISA 를 통해), 표지된 헤파드나바이러스 e 항원의 수준은 안정적이고 신속하게 평가될 수 있으며 코어 단백질과의 교차 반응이 방지될 수 있다.
본원에 제공된 방법은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 이용한다. 핵산 분자는 헤파드나바이러스 프리코어 단백질을 인코딩하는 서열 또는 헤파드나바이러스 게놈을 포함하여, 헤파드나바이러스의 cccDNA 의 형성을 반영하고 가능하게 할 수 있다. 당업계에서는 HBV 게놈이, 오버랩된 ORF 및 다수의 시스 (cis) 요소를 나타내는 고도로 압축된 유전자 구조를 갖는다는 것이 공지되어 있다. 따라서, 유전자 삽입/결실 또는 서열 교체가 바이러스 DNA 감염에 매우 영향을 줄 가능성이 있다고 여겨졌다 (13, 22) (Liu, et al, J Virol. 2004; 78(2):642-9.)(Wang, et al. PLoS One. 2013 2; 8(4):e60306). 이전의 작업이 GFP 에 의해 교체된 HBV 서열, 예컨대 대부분의 경우 pol/외피 코딩 부위를 가짐으로써 재조합체 HBV 게놈을 생성시키지만, 바이러스 복제 및 비리온 어셈블리를 지지하기 위해 바이러스 단백질의 트랜스-보체가 필요하였다 (17)(Protzer, et al, PNAS (1999), 96: 10818-23.). 더욱이 이러한 보고된 재조합체 HBV 게놈은 허용 (permissive) 세포 감염에 사용되는 경우 단지 제 1 라운드 cccDNA 합성을 만들 수 있어, cccDNA 의 세포내 증폭이 결손 바이러스 DNA 복제로 인해 차단된다.
헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 에서의 5' 줄기-루프 구조 (엡실론) 는 바이러스 복제를 위한 필수적 시스 요소이다. 이는 pgRNA 패키징 신호 및 DNA 프라이밍 (priming) 위치로서 역할한다. 엡실론은 프리코어 ORF 의 5' 부분과 오버랩되며 캡시드 (코어) 단백질 ORF 의 시작 코돈을 포함한다. HBV 게놈에 의해 인코딩된 엡실론 구조의 무결성 (integrity) 을 변경하지 않고 프리코어 ORF 에서의 N-말단 신호 펩티드 서열의 표지 다운스트림을 인코딩하는 핵산 서열을 삽입하기 위해, (HA-)표지의 5' 말단에서 3 개 아미노산 링커 서열을 이에 도입하여 (GTG GAC ATC), HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 하부에서 우측 암 (arm) 의 본래 바이러스 서열 (ATG GAC ATC) 을 교체하였다. HBV 게놈에 의해 인코딩된 바와 같은 엡실론의 염기 짝지음이 유지되었고, 코어 ORF 의 시작 코돈이 HBV 게놈에 의해 인코딩된 바와 같은 엡실론의 다운스트림 위치로 이동되었다. 또한, 본래 GGC 서열이 HA-표지 서열과 코어 AUG 사이에 위치하여 코어 시작 코돈의 실제 코작 (Kozak) 모티프가 유지되었다 (도 1). 도 1 은 표지를 인코딩하는 핵산 서열이 본 발명에 따라 삽입되는 엡실론 구조를 인코딩하는 HBV 게놈의 일부를 나타낸다.
상기 변형이 HBV pgRNA-의존적 코어 발현 및 pgRNA 캡시드화 (encapsidation) 에 대한 최소 효과를 초래하는데, 이는 코어 단백질의 번역 개시 위치가 pgRNA 주형에서 39-nt 더 다운스트림으로 이동하였음에도 불구하고 엡실론 및 코어 발현 카세트가 보존되었기 때문인 것으로 구상되었다. 실제로, 재조합체 HBV 게놈은 바이러스 DNA 복제의 야생형 수에 가깝게 지지되었으며, HA-표지된 HBeAg 는 cccDNA 분자에서 프리코어 ORF 의 재구성시 성공적으로 생성되었다.
표지를 인코딩하는 올리고의 삽입은 바이러스 DNA 적용에 영향을 주지 않았으며, 따라서 여기서 제공된 방법은, cccDNA 이 생성되게 하고 결과적으로 대리 마커 "표지된 헤파드나바이러스 e 항원" 의 양을 측정함으로써 cccDNA 형성을 저해하는 물질/후보 분자의 능력이 평가되게 한다. 본원에 제공된 수단 및 방법은 주로, 헤파드나바이러스와 관련된 만성 질환, 예컨대 (만성) 간염 및 특히 만성 B 형 간염 감염의 치료요법에서 사용할 수 있는 후보 문자를 스크리닝하고 확인하는데 유용하다.
표지 (예컨대 HA-표지) 를 인코딩하는 핵산 서열을 헤파드나바이러스 (예컨대 HBV) 프리코어 ORF 에 삽입하는 것은, 개선된 항원 검출 특이성에 유용한 표지된 헤파드나바이러스 e 항원 (예컨대 HBeAg) 의 헤파드나바이러스 (예컨대 HBV) cccDNA-의존적 생성을 초래한다. 본 발명을 지지하여, (HA-)표지 삽입이 프리코어 단백질의 발현 및 그의 후속 번역후 프로세싱 (N-말단 신호 펩티드 절단 및 C-말단 도메인 절단) 및 성숙한 HBeAg 분비에 영향을 주지 않는다는 것이 확인되었다 (도 2). 보다 중요하게, 헤파드나바이러스 (예컨대 HBV) 게놈에서의 이러한 변형이 세포내 증폭 경로를 통한 cccDNA 형성에 필수 조건인 바이러스 pgRNA 캡시드화 및 역전사를 방해하지 않는다는 것이 여기서 나타났다 (도 4, 6-8, 12).
본 발명은 헤파드나바이러스에 대하여 그의 활성에 대한 약리학 제제의 스크리닝 및 평가에 관한 것이다. 특히, 본 발명은 재조합체 B 형 간염 바이러스 (HBV) 게놈 및 HBV cccDNA-의존적 에피토프 (예를 들어 인간 인플루엔자 헤마글루티닌 (HA) 표지)-표지된 HBV e 항원 (HBeAg) 의 유도성 발현을 위한 신규한 세포주의 설계 및 구성을 기재한다. 배양액에 분비된 표지된 HBeAg 는 예를 들어 화학발광 효소 면역검정 (CLIA) 및/또는 AlphaLISA 에 의해 정량적으로 측정될 수 있다. 본 발명은 항-헤파드나바이러스 활성에 대해 화합물, 특히 cccDNA 형성, 유지 및/또는 이의 전사 활성을 저해하는 것들을 스크리닝하기 위한 효과적 세포 기반 HBV 리포터 시스템을 제공한다.
본 발명은 추가로 도 10 에서 설명된다. 여기서, 3TC 가 바이러스 DNA 복제를 차단한 극한 조건이었으며 따라서 cccDNA 가 합성되지 않았음에도 불구하고, 3TC 처리가 HepBHAe13 세포에서 HA-HBeAg 신호를 파괴하였다는 것이 나타났다. 또한, 원리의 증거로서, 2 개의 cccDNA 형성 저해제 (CCC-0975 및 CCC-0346) 를 HepBHAe13 세포에서 시험하였다. 두 화합물 모두 HA-HBeAg 수준을 용량 독립적으로 감소시켰다; 도 11 참조.
예를 들어, 하기의 비제한적 항-헤파드나바이러스 검정을 본 발명에 따라 수행할 수 있다:
1. HepBHAe 세포주를 사용하는 cccDNA 안정성 및/또는 전사 활성을 조절하는 화합물/후보 분자의 스크리닝
본 발명에 따라, 시험관내 검정 방법을 사용하여 핵에서의 cccDNA 안정성 또는 전사 활성을 조절하는 화합물/후보 분자의 효능을 스크리닝/평가할 수 있다. 그로써 화합물/후보 분자는 배양물 상청액에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 수준을 변경시킨다. 검정을 수행하기 위해, 테트라사이클린의 존재 하에 배양 플레이트에 세포를 먼저 시딩할 수 있으며, 세포가 융합성에 도달한 후, 배지를 테트라사이클린-불포함 배지로 교체하여 헤파드나바이러스 (예컨대 HBV) DNA 복제 및 cccDNA 형성을 유도할 것이며, 이는 보통 6-8 일이 걸린다. 그 이후, 테트라사이클린을 다시 첨가하여 통합된 HBV 게놈으로부터 드 노보 (de novo) 바이러스 DNA 복제를 정지시키고, 이와 함께 3TC (또는 기타 HBV 중합효소 저해제) 를 첨가하여 cccDNA 의 세포내 증폭 경로를 차단할 수 있다. 동시에, 시험 화합물을 특정 기간 동안 배양 배지에 첨가할 수 있다. 배양 배지를 이후 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 ELISA 측정에 사용할 수 있다. 시험 화합물을 함유하지 않는 웰로부터의 배지를 대조군으로서 사용할 수 있다. 배양 배지에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 수준을 감소시키는 효과적 화합물은 cccDNA 턴오버 (turnover) 를 촉진하고 cccDNA 전사를 침묵화시키는 활성을 가질 수 있다. 어구 "효과적인 또는 효과적으로" 는 여기서, 특정 시험 농도에서의 화합물이 본 발명의 세포 기반 검정 시스템에서 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 생성을 방지하고, 바람직하게는 50% 이상, 가장 바람직하게는 90% 이상 감소시키기에 충분하다는 것을 나타내는데 사용될 수 있다. qPCR 또는 혼성화에 의한 cccDNA 및 프리코어 mRNA 의 정상 상태 수준의 직접 측정은, 시험 화합물/후보 화합물/후보 분자가 cccDNA 안정성 또는 전사 각각을 감소시킬 수 있는지 여부를 구별하는데 사용될 수 있다.
2. HepBHAe 세포주를 사용하는 헤파드나바이러스 (예컨대 HBV) cccDNA 형성을 저해하는 화합물/후보 분자의 스크리닝
본 발명의 또 다른 양태에 따라서, 시험관내 검정 방법을 사용하여 cccDNA 형성을 억제하는 화합물/후보 분자를 평가할 수 있다. 간략하게는, 세포를 배양 웰에 시딩할 수 있으며 세포 단일층이 융합성이 되는 날에 테트라사이클린을 생략할 수 있다. 유사하게, 시험 화합물을 첨가할 수 있으며 배지 내 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 을 처리 끝에 (대략 6 일) ELISA 에 의해 측정할 수 있다. 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 감소를 초래하는 임의의 화합물은, 이것이 cccDNA 의 형성을 효과적으로 차단할 수 있는 것을 나타낸다. 이러한 시험관내 검정 방법의 확장된 양태로서, 이러한 검정에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 감소가 또한, 화합물이 헤파드나바이러스 (예컨대 HBV) DNA 복제를 저해하는 가능성을 갖는다는 것을 나타낼 수 있다는 것은 주목할 가치가 있다. 이러한 가능성은 서던 블롯 및/또는 qPCR 에 의한 바이러스 코어 DNA 의 직접 측정을 통해 조사될 수 있다. 상기 기재한 검정에서 나타나는 "히트 (hit)" 는 또한 cccDNA 안정성 및/또는 전사에 영향을 주는 화합물을 포함할 수 있다. 유도 기간 동안, 조기 생성된 cccDNA 의 안정성 및/또는 전사 활성은 시험 화합물에 의해 표적화될 수 있다.
3. HepHA-HBe 세포주는 카운터-스크리닝 (counter-screening) 시스템으로서 역할함.
이론적으로, 상술한 검정으로부터의 화합물 "히트" 는 HA-표지된 프리코어 단백질 번역, 또는 번역후 프로세싱, 또는 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 분비를 직접적으로 저해할 수 있다. 이러한 비-cccDNA 저해제를 배제하기 위해, "히트" 는 주형으로서 이식유전자를 사용하여 표지된 헤파드나바이러스 e 항원 (예컨대 HA-표지된 HBeAg) 을 생성하는 HepHA-HBe 세포에서 카운터-스크리닝될 수 있다. 한편, HepHA-HBe 세포는 또한 HBeAg 저해제를 스크리닝하는데 사용될 수 있다.
용어 "공유결합 폐환형 DNA 를 저해함" 및 이의 문법적 형태는 공유결합 폐환형 DNA 의 안정성의 저해 (즉 공유결합 폐환형 DNA 의 감소한 안정성), 공유결합 폐환형 DNA 의 전사 활성의 저해 (즉 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 감소한 전사) 또는 공유결합 폐환형 DNA 의 형성의 저해 (즉 cccDNA 가 형성되지 않거나 적은 cccDNA 가 형성됨) 를 나타낼 수 있다.
용어 "공유결합 폐환형 DNA 를 저해함" 의 이러한 예시적 설명 및 정의는 상호 배타적이 아니다. 예를 들어, 공유결합 폐환형 DNA 의 형성 저해는 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 전사 감소를 초래/연관될 수 있다 (즉 공유결합 폐환형 DNA 의 전사 활성의 저해). 공유결합 폐환형 DNA 의 안정성 저해는 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 전사 감소를 초래/연관될 수 있다.
표지된 헤파드나바이러스 e 항원은 본원에서 헤파드나바이러스의 cccDNA 의 이러한 임의 저해를 위한 대리 마커로서 사용될 수 있다.
상기에 따라서, 본원에 제공된 방법은 헤파드나바이러스의 cccDNA 형성을 저해하는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 이러한 맥락에서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.
본원에 제공된 방법은 헤파드나바이러스의 cccDNA (예를 들어 cccDNA 의 양 또는 수) 의 안정성을 감소시키는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 여기서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.
본원에 제공된 방법은 헤파드나바이러스의 cccDNA 의 전사 (활성) 을 감소시키는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 여기서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.
본 발명에 따라 그의 수준이 평가될, 표지된 헤파드나바이러스 e 항원은 하나 이상의 표지를 포함할 수 있다. 본원에 나타낸 바와 같이, 표지된 헤파드나바이러스 e 항원의 신뢰할만한 평가는 오직 하나의 표지를 사용하여, 예를 들어 표지에 특이적으로 결합하는 항체를 사용하여 이루어질 수 있다. 따라서, 표지된 헤파드나바이러스 e 항원이 오직 하나의 표지를 포함하는 것이 본원에서 예상되며 바람직하다.
하기의 것은 본원에서 사용될 하나 이상의 표지에 관한 것이다.
본원에서 사용하는 바와 같은 용어 "표지" 는 마커로서 유용한 임의의 화학적 구조를 나타낸다. 주로, 용어 "표지" 는 "단백질 표지" 를 나타낸다. 용어 "표지" 및 "단백질 표지" 는 당업계에 공지되어 있으며; 그 중에서도 하기를 참조한다: Fritze CE, Anderson TR. "Epitope tagging: general method for tracking recombinant proteins". Methods Enzymol. 2000; 327: 3-16; Brizzard B, Chubet R. Epitope tagging of recombinant proteins. Curr Protoc Neurosci. 2001 May; Chapter 5: Unit 5.8; 및/또는 Terpe K. Overview of tag protein fusions: from molecular and biochemical fundamentals to commercial systems. Appl Microbiol Biotechnol. 2003 Jan; 60(5):523-33.
통상, 본원에서 사용할 표지는 헤파드나바이러스 e 항원에 융합되는 단백질 표지이다. 예를 들어, 표지를 인코딩하는 핵산은 헤파드나바이러스 e 항원을 인코딩하는 핵산에 융합될 수 있어, 표지와 헤파드나바이러스 e 항원 모두를 포함하는 융합 단백질이 발현된다. 표지(들) 는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5'-말단에 융합, 헤파드나바이러스 e 항원을 인코딩하는 핵산 내에 삽입 및/또는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 3'-말단에 융합될 수 있다. 따라서, 생성된 융합 단백질은 N-말단에서, 내부적으로 (즉 헤파드나바이러스 e 항원 내에서/내부 에피토프로서), 및/또는 C-말단에서 표지(들) 를 포함할 수 있다. 본원에서 나타내는 바와 같이, 내부 에피토프 표지는 표지된 헤파드나바이러스 e 항원 수준의 신뢰할만한 평가에 사용될 수 있으며 따라서 바람직하다.
다양한 표지가 당업계에 공지되어 있으며 본 발명에 따라 사용할 수 있다. 통상, 본원에서 사용할 표지는 약 1-3 kDa, 바람직하게는 약 1 kDa 의 저분자량을 갖는다. 예시적이고 비제한적인 저분자량 표지는 HA-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지이다. HA-표지의 사용이 본원에서 바람직하다. 본원에서 사용할 Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
저분자량은 표지의 길이, 즉 이의 표지로 이루어지는 아미노산 잔기의 수에 반영된다. 예를 들어, His-표지 (6 개 아미노산), HA-표지 (9 개 아미노산), FLAG-표지 (8 개 아미노산) 또는 3XFLAG-표지 (22 개 아미노산) 가 본원에서 사용될 수 있다. 이러한 예시적 표지는 wt-수준에 가까운 HBV DNA 복제를 지지하며 따라서 본 발명을 수행하기에 유용하다.
따라서, 본원에서 사용할 표지는 6 내지 22 개 아미노산, 예를 들어 6 개 아미노산, 7 개 아미노산, 8 개 아미노산, 9 개 아미노산, 10 개 아미노산, 11 개 아미노산, 12 개 아미노산, 13 개 아미노산, 14 개 아미노산, 15 개 아미노산, 16 개 아미노산, 17 개 아미노산, 18 개 아미노산, 19 개 아미노산, 20 개 아미노산, 21 개 아미노산 또는 22 개 아미노산으로 이루어질 수 있다.
본원에서 사용할 표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에서 나타낸 바와 같은 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에서 나타낸 바와 같은 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에서 나타낸 바와 같은 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에서 나타낸 바와 같은 V5-표지를 인코딩하는 핵산 서열, 또는 SEQ ID NO: 6 에서 나타낸 바와 같은 C9-표지를 인코딩하는 핵산 서열이다. 본원에서 SEQ ID NO: 8 에서 나타낸 바와 같은 아미노산 서열로 이루어지거나 SEQ ID NO: 1 에 의해 인코딩된 HA 표지의 사용이 바람직하다.
본원에서 사용할 Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에서 나타낸 바와 같은 1xFlag-표지를 인코딩하는 핵산 서열 또는 SEQ ID NO: 7 에서 나타낸 바와 같은 3xFlag-표지를 인코딩하는 핵산 서열이다.
본원에서 사용할 표지의 예시적 아미노산 서열은 SEQ ID NO: 8 에서 나타낸 바와 같은 HA 표지의 아미노산 서열, SEQ ID NO: 9 에서 나타낸 바와 같은 His-표지의 아미노산 서열, SEQ ID NO: 11 에서 나타낸 바와 같은 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에서 나타낸 바와 같은 V5-표지의 아미노산 서열 또는 SEQ ID NO: 13 에서 나타낸 바와 같은 C9-표지의 아미노산 서열이다.
본원에서 사용할 Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에서 나타낸 바와 같은 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에서 나타낸 바와 같은 3xFlag-표지의 아미노산 서열이다.
에피토프 표지의 사용이 본원에서 주로 예상되며, 예컨대 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지가 있다. 에피토프 표지는 고친화성 항체가 많은 상이한 종에서 안정적으로 생성될 수 있기 때문에 선택되는 짧은 펩티드 서열이다. 이러한 표지는 종종 바이러스 유전자로부터 유래하여, 그의 높은 면역반응성이 설명된다. 이러한 표지는 웨스턴 블롯팅 (western blotting), 면역형광법, 면역조직화학검사, 면역친화성 크로마토그래피 및 면역침전 실험에 특히 유용하다. 이들은 또한 항체 정제에도 사용된다. 이러한 에피토프 표지가 특히 유용한데, 이는 이러한 표지에 특이적으로 결합하는 공지되고 시판되는 항체가 본 발명에 따라 사용될 수 있기 때문이다.
친화성 표지는 단백질에 첨부되어, 친화성 기법을 사용하여 그의 미정제 생물학적 공급원으로부터 정제될 수 있다. 이들은 키틴 결합 단백질 (CBP), 말토오스 결합 단백질 (MBP) 및 글루타티온-S-트랜스퍼라아제 (GST) 를 포함한다. 폴리 (His) 표지는 널리 사용되는 단백질 표지이며; 금속 매트릭스에 결합한다.
크로마토그래피 표지는 단백질의 크로마토그래피 특성을 특정 분리 기법에 걸쳐 상이한 분해능을 부여하도록 변경시키는데 사용된다. 종종, 이들은 다음이온 아미노산, 예컨대 FLAG-표지로 이루어진다.
특히 임의의 표지가 본원에서 사용될 수 있다. 본원에서 사용할 핵산 분자에 포함된 바와 같은 표지를 인코딩하는 핵산은 헤파드나바이러스 DNA 복제, cccDNA 형성, 및 cccDNA-의존적 표지 헤파드나바이러스 항원 e 생성 및 분비를 지지할 수 있어야 한다. 이러한 능력은 본원에서 제공된 검정, 예를 들어 실험에서 제공된 검정을 사용하여 용이하게 검증될 수 있다. 예를 들어, HA-표지 삽입이 야생형 수준 HBV DNA 복제 및 안정적 세포주에서의 cccDNA 로부터의 HA-표지된 HBeAg 의 생성을 초래하였다는 것이 본원에서 입증되어 있다. 이러한 능력은 용이하게 확인되고 다른 표지에 대해 시험될 수 있다. His-표지 및 Flag-표지 삽입은 예를 들어, 일시적 트랜스팩션 검정에서 바이러스 DNA 복제에 영향을 주지 않는다.
추가 표지가 본 발명의 요지를 유예하지 않고 사용될 수 있다.
예를 들어, 리포터 단백질은 본원에서 표지, 예컨대 루시퍼라아제 (예를 들어 반딧불이 루시퍼라아제, 레닐라 루시퍼라아제, 가우시아 루시퍼라아제 등), 녹색 형광 단백질 (GFP) 등으로서 사용될 수 있다. 이들 리포터 단백질은 예를 들어 육안 검사, 형광 측정 등에 의한 표지된 헤파드나바이러스 수준의 용이한 평가를 가능하게 한다. 형광 표지가 사용되어 단백질에 대한 시각적 판독을 부여한다. GFP 및 이의 변형물은 가장 흔하게 사용되는 형광 표지이다.
본 발명의 스크리닝 방법에서 사용할 수 있는 예시적 리포터 단백질은 그 중에서도, 루시퍼라아제, (녹색/적색) 형광 단백질 및 이의 변형물, EGFP (강화된 녹색 형광 단백질 (enhanced green fluorescent protein)), RFP (적색 형광 단백질, 예컨대 DsRed 또는 DsRed2), CFP (시안 형광 단백질), BFP (청녹색 형광 단백질), YFP (황색 형광 단백질), β-갈락토시다아제 또는 클로람페니콜 아세틸트랜스퍼라아제이다.
루시퍼라아제는 널리 공지된 리포터이며; 예를 들어, [Jeffrey (1987) Mol. Cell. Biol. 7(2), 725-737] 를 참조한다. 당업자는 본 발명의 맥락에서 사용할 추가의 루시퍼라아제 핵산 및 아미노산 서열을 상응하는 데이터베이스 및 표준 교과서/논평으로부터 용이하게 추론할 수 있다.
리포터 단백질은 검출가능한 신호의 신호 강도에서의 변화를 유도함으로써 cccDNA 가 저해되도록 후보 분자의 검출/평가를 허용할 수 있다. 상기 검출가능한 신호는 형광 공명 에너지 전이 (FRET) 신호, 형광 편광 (FP) 신호 또는 섬광 근접 (SP) 신호일 수 있다. 검출가능한 신호는 본원에서 상기 정의한 바와 같은 리포터 단백질과 결부될 수 있다. 예를 들어, GFP 는 에쿼리아 빅토리아 (Aequorea victoria) 로부터 유래할 수 있다 (US 5,491,084). 에쿼리아 빅토리아의 GFP 를 인코딩하는 플라스미드는 ATCC 접근 번호 87451 로 입수가능하다. 다른 것들 중에서도 pRSGFP, EGFP, RFP/DsRed, DSRed2, 및 EYFP, BFP, YFP 를 비제한적으로 포함하는 이러한 GFP 의 기타 돌연변이 형태는 Clontech Laboratories, Inc. (Palo Alto, California) 에서 시판된다.
리포터 유전자 (예컨대 루시퍼라아제, GFP 등) 에 융합된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 배양된 세포/조직은 배양 배지 중 시험 화합물/후보 분자의 농도에 따른 리포터 유전자의 전사의 증거에 대해 모니터링될 수 있다. 시험 화합물의 농도에 따른 리포터 유전자의 전사 수준의 변화는 cccDNA 를 저해하는 시험 화합물/후보 분자의 능력을 나타낸다.
리포터 단백질은 통상 본원에 상기 기재된 저분자량 표지, 예컨대 에피토프 표지보다 더 크다. 더 작은 (에피토프) 표지 (예컨대 HA-표지) 를 인코딩하는 핵산 서열에 비해, 예를 들어 루시퍼라아제를 인코딩하는 핵산 서열을 포함하는 핵산 분자의 더 긴 삽입물로 인해, 재조합체 프리게놈 RNA 로부터의 다운스트림 바이러스 코어 및 pol 의 발현이 감소될 수 있어, 이로써 core/pol 의 교차보충 (transcomplement) 이 바이러스 복제를 회복시키는데 필요할 수 있다. 예를 들어, 헤파드나바이러스 코어 단백질 및 헤파드나바이러스 중합효소 (core/pol) 를 구성적으로 발현하는 세포(들)/세포주(들) 가 이러한 맥락에서 특히 본 발명에 따라 사용될 수 있다.
둘 이상의 표지를 포함하는 표지된 헤파드나바이러스 e 항원의 사용이 본원에서 예상된다. 둘 이상의 표지의 사용은, 보다 신뢰할만한, 따라서 유리한, 표지된 헤파드나바이러스 e 항원의 평가를 허용할 수 있다. 예를 들어, 둘 이상의 표지가 상이한 표지인 경우 (예를 들어 한 표지가 HA-표지이고, 제 2 의 표지가 His-표지임), 두 표지 모두에 특이적으로 결합하는 항체를 이용할 수 있다. 따라서 이러한 검정은 예를 들어 ELISA 검출을 위해 예컨대 2 개의 에피토프 항체를 사용함으로써 검정 특이성을 더 증가시킬 수 있다.
22 개 아미노산 3xFLAG 표지 삽입물의 삽입이 효율적인 HBV 복제를 지지한다는 것이 본원에서 발견되었다. 따라서, 예를 들어 탠덤 (tandem) 키메라 에피토프 표지, 예컨대 HA-링커-FLAG 의 사용이 또한 본원에서 쓰여질 수 있다고 여겨진다.
상기에 따라, 둘 이상의 표지가 사용되는 경우 (예를 들어 둘 이상의 상이한 표지), 하나의 표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 본원에서 사용할 표지의 전체 길이 (즉 둘 이상의 표지의 아미노산 잔기의 합) 가 최대 약 22 개 아미노산을 넘지 않는다는 것이 특히 예상되는데, 이는 상기 리포터 단백질 (예컨대 루시퍼라아제) 의 맥락에서 기재한 바와 같이 재조합체 프리게놈 RNA 로부터의 다운스트림 바이러스 코어 및 pol 의 발현이 감소될 수 있기 때문이다. 이러한 다운스트림 바이러스 코어 및 pol 의 발현 감소가 발생하는 경우, 예를 들어 둘 이상의 표지의 전체 길이가 약 22 개 아미노산을 넘는 경우, 바이러스 복제를 회복하는데 코어/po 의 교차보충이 필요할 수 있다. 예를 들어, 헤파드나바이러스 코어 단백질 및 헤파드나바이러스 중합효소 (코어/pol) 를 구성적으로 발현하는 세포(들)/세포주(들) 가 특히 이러한 맥락에서 본 발명에 따라 사용될 수 있다.
단 하나의 표지를 인코딩하는 핵산과 같이, 둘 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5'-말단에 융합, 헤파드나바이러스 e 항원을 인코딩하는 핵산 내에 삽입 및/또는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 3'-말단에 융합될 수 있다. 표지는 링커에 의해 분리될 수 있다 (: 2 개의 표지가 사용되는 경우 표지-링커-표지, 3 개의 표지가 사용되는 경우 표지-링커-표지-링커-표지 등).
따라서, 생성된 융합 단백질은 N-말단에서, 내부적으로 (즉 헤파드나바이러스 e 항원 내에서/내부 에피토프로서), 및/또는 C-말단에서 둘 이상의 표지를 포함할 수 있다. 본원에 나타내는 바와 같이, 내부 에피토프 표지는 표지된 헤파드나바이러스 e 항원 수준의 신뢰할만한 평가에 사용될 수 있으며 따라서 바람직하다. 예를 들어 N-말단에서의 하나의 표지 및 예를 들어 C-말단에서의 두 번째 내부 표지 및/또는 예를 들어 세 번째 표지와의 생성된 융합 단백질의 사용이 본원에서 예상된다. 본 발명의 요지를 유예하지 않고 추가의 조합이 용이하게 분명하며 포함된다.
둘 이상의 표지는 헤마글루티닌 (HA)-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
하기에서, 본 발명에 따라 사용할 핵산 분자를 보다 상세히 기재한다.
핵산 분자는 헤파드나바이러스 프리코어 단백질, 예컨대 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열을 SEQ ID NO: 15 에 나타내며 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 17 에 나타낸다.
핵산 분자는 상기 본원에서 정의하고 설명한 바와 같은 하나 이상의 표지를 인코딩하는 핵산 서열을 포함할 수 있다. 하나 이상의 표지를 인코딩하는 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다.
B 형 간염 바이러스에 관련하여 N-말단 신호 펩티드 및 링커는 예를 들어 SEQ ID NO. 17 에서 나타낸 바와 같은 프리코어 단백질의 N-말단 29 개 아미노산을 구성한다. 따라서, 하나 이상의 표지를 인코딩하는 핵산 서열은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산의 (삽입된) 3' 다운스트림일 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 (예를 들어 SEQ ID NO. 15 에서 나타내는 HBV 프리코어 단백질을 인코딩하는 핵산) 의 5' 말단으로부터의 87 개 핵산 잔기를 구성하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에서 나타냄).
HBeAg 에 관련하여 링커는 예를 들어 SEQ ID NO. 18 에서 나타낸 바와 같은 HBeAg 의 N-말단 10 개 아미노산을 구성한다. HBeAg 에 관하여, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBeAg 의 N-말단 10 개 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV HBeAg 를 인코딩하는 핵산의 5' 말단으로부터의 30 개 핵산 잔기를 구성하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다 (HBeAg 를 인코딩하는 핵산은 예를 들어 SEQ ID NO. 16 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에서 나타냄).
보다 정확하게, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에서 나타냄). 이러한 위치는 헤파드나바이러스의 pgRNA 의 엡실론 구조에서, 또는 헤파드나바이러스 게놈에 의해 인코딩되는 바와 같은 엡실론에서, 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 및 링커의 코딩 서열을 구분한다. HBV 에 관련하여, 위치 87 는 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이며 위치 88 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다.
단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 및 30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에서 나타냄).
마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 및 11 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에서 나타냄).
하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 예컨대 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산을 SEQ ID NO: 23 에서 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 24 에 나타낸다.
하나 이상의 표지를 인코딩하는 핵산 서열의 상기 정의된 삽입 위치는 또한 헤파드나바이러스 게놈에서의 뉴클레오티드 위치에 의해서도 정의될 수 있다. HBV 게놈에 관련하여 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 상기에 따라, HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 이러한 위치는 예를 들어 [Galibert, F., et al (1979), Nature 281:646-650] 에서 기재한 바와 같은 명명법에 따라 결정될 수 있다.
본원에서 이용한 바와 같은 뉴클레오티드 (위치) "C1902" 및 "A1903" 은 각각 프리코어 부위 코딩 서열의 마지막 뉴클레오티드 및 코어 AUG 의 첫 번째 뉴클레오티드를 나타낸다는 것이 분명하다. 이들은 상이한 HBV 유전자형 (A-H) 서열 중에서 보존된다 (또한 본원에서 제공하고 SEQ ID NO: 27-34 에서 나타낸 바와 같음). 따라서 본원에서 사용할 HBV 게놈의 예시적이고 비제한적인 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다. 이제, 코어 AUG 에서 뉴클레오티드 "C" ("A" 는 아님), 또는 그의 위치는 일부 희귀한 (임상적) 단리물에서 상이할 수 있다. 이러한 서열이 또한 본 발명에서 포함된다.
본 발명에 따라, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 게놈 외에 헤파드나바이러스 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 헤파드나바이러스 게놈에서 이러한 상응하는 위치 (즉 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 헤파드나바이러스 게놈에서의 위치) 는 용이하게 결정될 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈 (바람직하게는, HBV 게놈) 에 의해 인코딩된 엡실론 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 사이에 삽입될 수 있다.
예를 들어, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 경우, 하나 이상의 표지를 인코딩하는 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열은 용이하게 결정될 수 있다. 서열은 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈에서 시작하며 (따라서 이를 포함하고) 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 전에 종료된다 (즉 코어 단백질의 코딩 서열이 배제됨). 단백질 수준에서, 하나 이상의 표지는 링커의 C-말단 최종 아미노산에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (링커는 N-말단 신호 펩티드를 뒤따름).
따라서, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 e 항원의 N-말단 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 이러한 N-말단 아미노산은 헤파드나바이러스 프리코어 단백질에서 "링커" 를 구성한다. 단백질 수준에서, 하나 이상의 표지는 링커의 최종 C-말단 아미노산 잔기의 C-말단에 삽입될 수 있다.
보다 정확하게, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 및 30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에 나타냄). 이러한 위치는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조에서, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조에서, 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 및 링커의 코딩 서열을 구분한다. HBV 에 관련하여, 위치 87 은 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이며 위치 88 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다. 헤파드나바이러스 HBV 프리코어 단백질에서의 상응하는 위치 (즉 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 헤파드나바이러스 게놈에서의 위치) 는 용이하게 결정될 수 있다.
마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열 사이에 존재할 수 있다 (삽입될 수 있다).
예를 들어, 핵산 서열은 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타낸다). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 및 11 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에 나타냄). 이러한 위치는 프리코어 단백질에서의 N-말단 헤파드나바이러스 링커의 코딩 서열 (또는 헤파드나바이러스 e 항원에서의 N-말단 헤파드나바이러스 링커의 코딩 서열) 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈을 구분한다. HBV 에 관련하여, 위치 30 은 HBeAg 를 인코딩하는 핵산 서열에서 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이다. 위치 31 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다. 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열에서의 상응하는 위치 (즉 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 헤파드나바이러스 e 항원에서의 위치) 는 용이하게 결정될 수 있다.
하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산을 SEQ ID NO: 23 에 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 24 에 나타낸다. 다시 말해, 하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈 (바람직하게는 HBV 게놈) 에 의해 인코딩되는 바와 같은 엡실론 구조 및 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 사이에 삽입될 수 있다.
상기 언급한 바와 같이, 본원에서 사용할/제공될 핵산 분자는 하나 이상의 표지를 인코딩하는 서열을 포함할 수 있으며, 상기 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조에, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조에 삽입된다. HBV 게놈에 의해 인코딩된 예시적 엡실론 구조를 도 1 에 나타낸다. HBV 에 관련하여, HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조는 HBV 게놈의 위치 T1849 에서 시작하고 (그리고 포함하며) 위치 A1909 에서 종료된다 (그리고 포함한다). HBV 게놈에 의해 인코딩된 엡실론 구조의 예시적 핵산 서열을 SEQ ID NO: 25 에 나타낸다.
상기 본원에서 기재한 바와 같이, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기에 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 예시적 하부 줄기를 도 1 에 나타낸다. 예를 들어 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이 (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에 나타냄), 또는 HBeAg 을 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이 (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타냄), 또는 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 이러한 모든 위치는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의 하부 줄기, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기에 존재한다.
핵산 분자가, 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의 하부 줄기, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 것이 본원에서 예상되며 바람직하다. B 형 간염 바이러스/표지된 B 형 간염 바이러스 e 항원에 관련하여 본원에서 기재하고 제공된 실험 및 교시가 일반적으로 헤파드나바이러스/표지된 헤파드나바이러스 e 항원에 적용가능하다고 여겨진다. HBV 에 사용한 삽입 서열에 대한 유일한 변형은, 각각의 특이적 헤파드나바이러스, 바람직하게는 HBV 에 대한, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 염기 짝지음을 유지하기 위한 (에피토프) 표지를 인코딩하는 핵산 서열의 5' 측면위치 (flanking) 서열의 변형에 관한 것일 수 있다. 본 발명의 교시를 기반으로 하여, 당업자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조와의 염기 짝지음을 유지하기 위해 표지를 인코딩하는 핵산 서열의 핵산 서열 5' 를 용이하게 설계하고 제조할 수 있다. 특히 오리 B 형 간염 바이러스 (DHBV) 에 관하여, 이의 코어 ORF 의 시작 코돈이 엡실론의 다운스트림에 위치하였으므로, 따라서 DHBV 에 대한 엡실론의 염기 짝지음을 유지하기 위해 (에피토프) 표지를 인코딩하는 핵산 서열의 5' 측면위치 서열을 도입할 필요가 없다.
도 1 에서 나타낸 바와 같이, 핵산 서열을 HBV 게놈 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입하였으며, 여기서 상기 핵산 서열은, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 (예를 들어 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와) 염기쌍을 형성한 9 개 뉴클레오티드의 5'-측면위치 부위 (즉 하나 이상의 표지를 인코딩하는 핵산 서열의 5') 를 함유하였다.
본원에 정의된 바와 같고/같거나 상기 본원에 기재한 바와 같이 삽입될 하나 이상의 표지를 인코딩하는 핵산 서열이 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조, 특히 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열을 추가로 포함하는 것이 본 발명의 중요하고 바람직한 양태이다. 엡실론 구조와 염기쌍을 형성할 수 있는 핵산 서열을 사용함으로써, 이는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조를 보존하는 것을 목표로 한다. 엡실론 구조는 복제, cccDNA 의 생성 및 (표지된) 헤파드나바이러스 e 항원, 바람직하게는 HBV e 항원의 발현/생성에 중요한 것으로 여겨진다.
바람직하게는, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은, 바람직하게는 HBV 게놈의 위치 T1849 내지 A1854 에 상응하거나, 임의로는 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 통상, pgRNA 에서의 염기쌍 형성은 매칭 (matching) 리보뉴클레오티드, 예컨대 A-U, G-C, 및 동요 (wobble) 염기쌍 G-U 사이에 발생한다. 엡실론 구조가 유지되는 경우, 복제, cccDNA 의 생성 및/또는 (표지된) 헤파드나바이러스 e 항원의 발현/생성은 본원에서 사용될/제공될 핵산 분자를 저지하지 않는다.
엡실론 구조의 좌측 암이 헤파드나바이러스 e 항원 (예컨대 HBeAg) 의 신호 펩티드를 인코딩하는 핵산 서열의 일부이며, 따라서 불변인 채로 유지되어야 한다는 것에 유의해야 한다. 기재된 바와 같은 엡실론의 우측 암에서의 설계된 삽입이 하부 줄기의 염기 짝지음을 변경시켜서는 안된다. 도 1 에서 나타낸 예시화된 삽입에서, 유일한 뉴클레오티드 변화는 A1903G 에 관련되었다 (즉 A 가 HBV 게놈의 위치 1903 에서 G 에 의해 대체되었음). 위치 1903 에서의 점 돌연변이는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 외부로 코어 ORF 를 이동시켜, 엡실론 구조의 유지 및 코어 AUG 앞의 표지 삽입을 허용한다. 코어 단백질은 프리코어 ORF 의 시작 코돈 이후 전사되는 프리게놈 RNA 로부터 번역되어, 표지가 코어 단백질에 혼입되지 않을 것이다.
헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조 (의 하부 줄기) 와 염기쌍을 형성할 수 있는 에피토프 표지, 헤파드나바이러스 게놈의 5' 측면위치 서열은 3, 6 또는 9 개 이하의 뉴클레오티드, 통상 9 개 뉴클레오티드로 이루어진다.
헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID No. 26 에서 나타낸 서열로 이루어진다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩한다.
본원에서 사용/제공될 핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 핵산 서열을 추가로 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 단 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다.
예를 들어, 링커를 인코딩하는 핵산 서열은 서열 GGC 로 이루어지거나; 핵산 서열은 글리신 잔기를 인코딩한다. GGC 는 코어 ORF 의 AUG 앞 3 개의 본래 뉴클레오티드로부터 카피되며, 이는 AUG 와 함께, 최적 번역 개시를 위한 전형적 코작 모티프를 어셈블리한다. 따라서, 사용/삽입할 수 있는 링커는 코어 시작 코돈의 실제 코작 모티프가 유지되도록 바람직하고 적합하게 선택된다.
예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함할 수 있다. 예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함할 수 있다. SEQ ID NO. 41 에서 나타낸 바와 같은 예시적 핵산 서열은 엡실론 구조의 (하부 줄기) 와 염기쌍을 형성할 수 있는 핵산 서열 (GTGGACATC; 특히 뉴클레오티드 GTGGACAT 는 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성함), HA-표지를 인코딩하는 핵산 서열 및 링커로서 글리신 잔기를 인코딩하는 핵산 서열 (후자의 핵산 서열은 주로 코어 시작 코돈의 실제 코작 모티프를 유지하기에 유용함) 로 이루어진다.
하나 이상의 표지가 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 내에 인 프레임 (in frame) 융합된다는 것이 본원에서 예상된다. 마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열 (엡실론 구조 (의 하부 줄기) 와 염기쌍을 형성할 수 있는 잠재적 5' 측면위치 핵선 서열 및/또는 코어 시작 코돈의 실제 코작 모티프를 유지하거나 링커를 인코딩하는 잠재적 3' 핵산 서열을 가짐) 이 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열에 인 프레임 융합된다는 것이 본원에서 예상된다.
본 발명에서 사용되고 제공될 핵산 분자는 헤파드나바이러스 게놈, 바람직하게는 B 형 간염 바이러스 (HBV) 게놈을 포함할 수 있다. 예를 들어, HBV 게놈은 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈이다. 본원에서 사용할 HBV 게놈의 예시적이고 비제한적인 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다. HBV 게놈은 HBV 유전자형 D 의 게놈, 특히 HBV 하위유전자형 ayw 의 게놈 (예컨대 SEQ ID NO: 27 에서 나타낸 HBV 게놈) 일 수 있다.
본 발명에 따라서 오직 이러한 핵산 분자, 예컨대 헤파드나바이러스 게놈이 (표지된) 헤파드나바이러스 e 항원의 (실질적) 발현/생성이 허용되도록 사용될 것이다. 예를 들어, 일부 임상적 HBV 변이체는 헤파드나바이러스 e 항원의 실질적 발현/생성을 허용하지 않는 것으로 공지되어 있다. 일부 임상적 HBV 변이체에서, HBeAg 음성도는 기저 코어 프로모터 (BCP) 이중 돌연변이 (유전자형 D 에서의 A1764T/G1766A) 또는 프리코어 (pC) 돌연변이 (유전자형 D 에서의 G1898A) 로 인한 것이다. BCP 돌연변이가 프리코어 mRNA 전사의 하향조절을 통해 HBeAg 를 감소시키지만, pC 돌연변이는 프리코어 번역을 멈추기 위해 미성숙 정지 코돈을 도입한다. 이러한 헤파드나바이러스 변이체는 본원에서 제공된 방법에 덜 적합하다.
본 발명의 바람직한 구현예에서, 표지된 HBeAg 는 SEQ ID NO: 22 에서 나타낸 바와 같은 아미노산 서열을 포함하거나 이로 이루어진다. 표지된 HBeAg 를 인코딩하는 상응하는 핵산 서열을 SEQ ID NO: 20 에 나타낸다. 이러한 서열은 본 발명의 맥락에서 특히 유용하나 단지 바람직한 구현예의 예이다.
HA-표지된 프리코어 단백질, 즉 표지된 HBeAg 의 전구체를 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타낸다. 이러한 핵산 서열이 표지된 HBeAg 의 전구체를 인코딩하기 때문에, 이는 표지된 HBeAg 를 인코딩하는 핵산 서열로서 고려될 수 있다. 상응하는 아미노산 서열을 SEQ ID NO: 21 에 나타낸다.
하기는 표지된 헤파드나바이러스 e 항원의 생성 및 헤파드나바이러스의 cccDNA 를 저해하는 후보 분자의 능력 평가에 있어서의 이의 용도에 대해 보다 상세히 관한 것이다.
본원에서 사용/제공될 핵산은 프리게놈 (pg) 헤파드나바이러스 RNA, 특히 프리게놈 (pg) HBV RNA 로 전사될 수 있다.
상기 핵산이 표지된 헤파드나바이러스 e 항원의 전사를 방지하도록 설계될 수 있다는 것이 예상된다. 예를 들어, 핵산은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는다. HBV 에 관련하여, 프리코어 단백질을 인코딩하는 핵산의 시작 코돈은 결실되거나 돌연변이화될 수 있다. 예를 들어, 이러한 시작 코돈 (결실/돌연변이화될) 은 HBV 게놈의 위치 1816 내지 (및 이를 포함) 위치 1818 에서의 (및 이를 포함) 뉴클레오티드에 상응할 수 있다; 예를 들어 도 1 을 참조한다.
표지된 헤파드나바이러스 e 항원의 번역을 방지하는 것은 검정의 시작시 이의 생성/발현을 방지하기에 유리할 수 있다. 표지된 헤파드나바이러스 e 항원을 cccDNA 에 대한 대리 마커로서 사용하는 것은 본 발명의 목표이다. 표지된 헤파드나바이러스 e 항원이 항상 생성되는 경우, 이의 발현/생성이 cccDNA 의 생성과 반드시 상호연관되지는 않는다. 도 5 에서 나타낸 바와 같이, cccDNA 가 형성될 때/형성 이후에 시작 코돈은 검정의 후기 단계에서 회복될 수 있어, 표지된 헤파드나바이러스 e 항원의 발현/생성 (즉 수준) 이 헤파드나바이러스의 cccDNA 의 생성/수준을 진정으로 반영한다. 따라서 cccDNA 를 저해하는 후보 분자 능력의 보다 더 신뢰할만한 평가를 위해, 표지된 헤파드나바이러스 e 항원의 생성/발현이 예를 들어 그를 인코딩하는 상응하는 핵산의 시작 코돈을 제거/돌연변이화함으로써 검정의 시작시 저해되고 표지된 헤파드나바이러스 e 항원의 생성/발현이 이후에 허용되어 헤파드나바이러스의 cccDNA 생성/수준을 반영하는 것이 유리하다.
예를 들어, 본원에 상기 정의되고 기재한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 는 핵산 TG 에 의해 대체될 수 있다. 따라서, 본원에서 사용하고 제공될 핵산 분자는 예를 들어 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역을 방지할 수 있다.
본 발명에 따라 사용할 방법의 단계 (a) 는, 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함할 수 있다:
(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;
(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;
(iii) 제 2 의 양성 가닥 DNA 의 합성 (이로써 상기 음성 가닥 DNA 및 상기 양성 가닥 DNA 가 이중 가닥 이완 환형 DNA 를 형성함)
(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;
(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복;
(vi) 표지된 헤파드나바이러스 e 항원을 인코딩하는 mRNA 의 전사;
(vii) 표지된 헤파드나바이러스 e 항원의 번역.
표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복은 상기 정의하고 설명한 바와 같은 시작 코돈의 회복일 수 있거나 이에 관한 것일 수 있다.
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 벡터, 특히 발현 벡터 내에 포함될 수 있다.
벡터는 예를 들어, SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함할 수 있다.
표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 유도성 프로모터의 제어 하에 있을 수 있다. 본원에서 사용할 예시적이고 비제한적인 유도성 프로모터(들) 는 테트라사이클린-유도성 프로모터(들), 독시클린-유도성 프로모터(들), 항생제-유도성 프로모터(들), 구리-유도성 프로모터(들), 알코올-유도성 프로모터(들), 스테로이드-유도성 프로모터(들) 또는 제초제- 유도성 프로모터(들) 이다. 본원에서 제공한 실험에서 사용되는 테트라사이클린 유도성 프로모터 (예를 들어 Clontech 에서 시판) 는 tet-오프 (off) 방식으로 작용한다. tet-온 (on) 방식으로 작용하는 테트라사이클린 유도성 프로모터가 마찬가지로 본원에서 사용될 수 있다고 여겨진다. tet-온/오프 시스템은 예를 들어, Clontech 및 Invitrogen 으로부터, 플라스미드 또는 바이러스 (레트로-, 아데노) 백본으로 이용가능하다. 상기 기재한 바와 같은 테트라사이클린/독시클린 유도성 프로모터 외에, 예를 들어 다른 화합물 중에서도 항생제, 구리, 알코올, 스테로이드 또는 제초제에 반응하는 기타 유도성 프로모터가 또한 적합하다. 예를 들어, 유도성 프로모터는 CMV 프로모터이다. 유도성 프로모터는 tet-EF-1 알파 프로모터일 수 있다.
또한, 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 바처럼, 하나 이상의 정지 코돈은 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입될 수 있다. 하나 이상의 헤파드나바이러스 (HBV) 외피 단백질은 대 표면 단백질 (L), 중 표면 단백질 (M) 및 소 표면 단백질 (S) 중 하나 이상일 수 있다. 한 구현예에서, HBV 외피 단백질은 소 표면 단백질 (S) 이다. 하나 이상의 HBV 외피 단백질의 예시적 코딩 부위(들) 를 SEQ ID NO: 36 (L), SEQ ID NO: 37 (M) 및/또는 SEQ ID NO: 38 (S) 에서 나타낸다. HBV 에서 SEQ ID NO: 38 (S) 의 뉴클레오티드 217 내지 222 (TTGTTG) 는 외피 단백질의 발현이 방지되도록 예를 들어 TAGTAG 로 돌연변이화될 수 있다.
후보 분자는, cccDNA 의 대리 마커, 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 대조군에 비해 감소하는 경우, 헤파드나바이러스의 cccDNA 를 저해할 수 있는 것으로 결정된다.
표지된 헤파드나바이러스 e 항원의 평가된 (발현) 수준이 표지된 헤파드나바이러스 e 항원의 (발현) 수준의 대조군, 예컨대 표준 또는 참조값과 비교되는 것이 이해될 것이다. 대조군 (표준/참조값) 은 후보 분자와 접촉하지 않는, 본원에서 정의한 바와 같은 세포, 조직 또는 비-인간 동물에서 평가될 수 있다. 대안적으로, 대조군 (표준/참조값) 은 상기 접촉 단계 전에, 본원에서 정의한 바와 같은 세포, 조직 또는 비-인간 동물에서 평가될 수 있다. 후보 분자(들) 와 접촉시 표지된 헤파드나바이러스 e 항원의 (발현) 수준 감소는 또한, cccDNA 를 저해할 수 없는 것으로 공지된 화합물과 같은 일상적으로 사용한 참조 화합물(들) 에 의해 유도된 표지된 헤파드나바이러스 e 항원의 (발현) 수준 감소와 비교될 수 있다. 당업자는 본인의 위치에서 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 감소되는지 여부를 용이하게 결정/평가한다.
반대로, 본 발명의 요지를 유예하지 않고, 양성 대조군, 예를 들어 참조 화합물(들), 예컨대 cccDNA 를 저해할 수 있는 것으로 공지된 화합물을 사용할 수 있다. cccDNA 의 대리 마커, 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 이러한 (양성) 대조군과 비교하여 동등하거나 증가한 경우, 후보 분자는 헤파드나바이러스의 cccDNA 를 저해할 수 있는 것으로 결정된다.
본 발명에 따라, 특히 본원에서 기재한 스크리닝 또는 확인 방법, 후보 분자와 접촉할 세포, 조직 또는 비-인간 동물은 본원에서 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함한다.
예를 들어 상기 세포, 조직 또는 비-인간 동물은 본원에 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 발현할 수 있다. 본원에서 설명한 바와 같이, cccDNA 를 저해/길항하는 후보 분자의 능력은 따라서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열의 이러한 유전자 산물의 발현 수준, 특히 단백질 발현 수준을 측정함으로써 검출될 수 있다. (대조군 (표준 또는 참조값) 에 비해) (단백질) 발현 수준이 낮은 것은 저해제/길항제로서 작용하는 후보 분자의 능력을 나타내는 것이다.
감소된 전사/발현 수준으로 인해, 번역된 유전자 산물 수준 (즉, 단백질 수준) 이 또한 감소할 것이다. 상기 기재된 표지된 헤파드나바이러스 e 항원 단백질의 (단백질) 수준은 통상, 표지된 헤파드나바이러스 e 항원 단백질과 연관된 검출가능 신호의 신호 강도와 상호연관된다. 예시적 표지된 헤파드나바이러스 e 항원 단백질은 상기 기재한 바와 같은 리포터 (예를 들어 루시퍼라아제, (녹색/적색) 형광 단백질 및 이의 변형물, EGFP (강화된 녹색 형광 단백질) 등) 를 포함할 수 있다.
따라서, 세포/조직/비-인간 인간과 후보 분자와의 접촉시 리포터 신호의 감소는 후보 분자가 실제로 cccDNA 저해제/길항제이며, 따라서 cccDNA 를 저해할 수 있다는 것을 나타낼 것이다. 상기 본원에 정의한 바와 같은 표지된 헤파드나바이러스 e 항원의 수준을 감소시키는 후보 분자는 시험한 후보 분자 중에서 선택되는데, 이때 이러한 분자는 바람직하게는, 표지된 헤파드나바이러스 e 항원 수준을 강력하게 감소시키는 것으로 선택된다 (예를 들어, 리포터 신호 감소에서 반영됨).
본 발명의 맥락에서 (특히 본원에서 개시된 스크리닝/확인 방법), 또한 세포 추출물 (예를 들어 본원에 개시되고 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포 추출물) 이 접촉될 수 있다는 것이 예상된다. 예를 들어, 이러한 세포 추출물은 본원에서 사용할, 특히 후보 분자와 접촉할 (트랜스제닉/유전자 조작) 세포(들), 조직(들) 및/또는 비-인간 동물(들) 로부터 수득될 수 있다.
이러한 세포 추출물의 사용은, 시험관내 후보 분자의 활성을 평가할 수 있게 하므로 특히 유리한 것이다. 이러한 (세포) 추출물의 이용하는 평가/스크리닝 방법은 예를 들어, 후보 분자를 사전스크리닝하는데 사용될 수 있으며, 이때 이러한 사전스크리닝에서 선택된 분자는 예를 들어 본원에 개시한 세포-기반 방법으로, 특히 (트랜스제닉) 세포(들), 조직(들) 및/또는 비-인간 동물(들) 이 후보 분자와접촉되는 방법으로 후속 스크리닝된다. 따라서 이러한 맥락에서, 상기 및 하기에서 본원에 기재된 시험관내 사전스크리닝 방법에서 후보 분자가 선택되는 것이 바람직하다.
따라서, 본원에서 사용하는 바와 같은 용어 "세포" 는 (트랜스제닉/유전자 조작) 세포(들), (트랜스제닉/유전자 조작) 조직(들) 및/또는 비-인간 (트랜스제닉/유전자 조작) 동물(들) 및 또한 이로부터 유래한 세포 추출물을 포함한다.
고 처리량 스크리닝에서 일상적으로, 많은 (종종 수천의) 후보 분자가 동시에 스크리닝된다는 것이 이해된다. 따라서, 표지된 헤파드나바이러스 e 항원의 수준을 감소시키는 (제 1) 스크리닝 후보 분자가 선택된다.
본 발명의 스크리닝 방법의 단계 (a), 즉 "접촉 단계" 는 또한 상기 후보 분자 또는 다수의 후보 분자 (즉 각종 상이한 후보 분자) 를 함유하는 (생물학적) 샘플 또는 조성물을 분석할 세포 (표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포(들)/조직(들)/비-인간 동물) 에 첨가함으로써 이루어질 수 있다.
일반적으로, 후보 분자(들) 또는 후보 분자(들) 을 포함/함유하는 조성물은 예를 들어 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 (트랜스펙션된) 세포, 조직 또는 비-인간 동물에 첨가될 수 있다. 본원에서 정의하고 개시한 바와 같이, 용어 "표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는" 은 리포터의 용도를 의미한다. 또한 이의 프로모터 및/또는 인핸서 부위를 포함하는 리포터 구축물이 본원에서 사용될 수 있다.
본 발명에서, 특히 스크리닝/확인 방법의 맥락에서 사용되거나 제공될 세포(들), 조직(들) 및/또는 비-인간 동물은 본원에서 개시된 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로 안정적 또는 일시적으로 트랜스펙션될 수 있다.
cccDNA 를 저해할 수 있는 (표지된 헤파드나바이러스 e 항원의 수준 감소에서 반영된 바와 같음) 화합물/분자는 본원에 개시된 약학적 환경에서의 작용제로서 이롭고, 의학적 용도, 특히 헤파드나바이러스와 관련된 질환, 특히 헤파드나바이러스와 관련된 만성 질환, 예컨대 만성 간염 및 특히 만성 B 형 간염의 치료에서 사용되는 것으로 예상된다.
헤파드나바이러스의 cccDNA 의 특이적 "길항제" 또는 "저해제" 로서 기능할 수 있는 후보 분자/화합물은 소 결합 분자 예컨대 소 (유기) 화합물일 수 있다.
약물 발견의 맥락에서 용어 "소분자" 는 당업계에 공지되어 있으며 2,500 달톤 미만, 바람직하게는 1,000 달톤 미만, 보다 바람직하게는 50 내지 350 달톤의 분자량을 갖는 의학적 화합물과 관련된다. (소) 결합 분자는 천연 및 합성 화합물을 포함한다. 본 발명의 맥락에서 용어 "화합물" (또는 마찬가지로 "분자") 은 단일 물질 또는 다수의 물질을 포함한다. 상기 화합물/분자는 예를 들어 샘플, 예컨대 식물, 동물 또는 미생물로부터의 세포 추출물에 포함될 수 있다. 또한, 상기 화합물(들) 은 당업계에 공지된 것일 수 있으나 지금까지 헤파드나바이러스의 cccDNA 에 (부정적으로) 영향을 줄 수 있는 것으로 알려져 있지는 않다. 다수의 화합물은 예를 들어, 시험관내 샘플, 배양 배지에 첨가될 수 있거나 세포에 주입될 수 있다.
후보제는 또한 단백질과의 구조적 상호작용, 특히 수소 결합에 필요한 관능기를 포함할 수 있으며, 통상 하나 이상의 아민, 카르보닐, 히드록실 또는 카르복실기, 바람직하게는 관능적 화학기 중 둘 이상을 포함한다. 후보제는 종종 카르보시클릭 또는 헤테로시클릭 구조 및/또는 방향족 또는 폴리방향족 구조 (상기 관능기 중 하나 이상으로 치환된) 를 포함한다.
후보제의 예시적 부류는 헤테로사이클, 펩티드, 당류, 스테로이드 등을 포함할 수 있다. 화합물은 효능, 안정성, 약학적 양립성 등이 강화되도록 변형될 수 있다. 작용제의 구조적 확인은 추가 작용제를 확인, 생성 또는 스크리닝하는데 사용될 수 있다. 예를 들어, 펩티드제가 확인되는 경우, 이들은 예컨대 비자연적 아미노산, 예컨대 D-아미노산, 특히 D-알라닌을 사용하여, 아미노 또는 카르복실 말단을 관능화시킴으로써 (예를 들어 아미노기에 대해서는 아실화 또는 알킬화, 및 카르복실기에 대해서는 에스테르화 또는 아미드화 (amidification) 등), 그의 안정성을 강화시키는 다양한 방법으로 변형될 수 있다. 다른 안정화 방법은 예를 들어서 리포솜 등에서의 캡슐화 (encapsulation) 를 포함할 수 있다.
상기 언급한 바와 같이, 후보제는 또한 아미노산, 지방산, 퓨린, 피리미딘, 핵산 및 유도체, 구조적 유사체 또는 이의 조합을 포함하는 기타 생체분자 중에서 발견된다. 후보제는 합성 또는 자연적 화합물의 라이브러리를 포함하는 광범위한 공급원으로부터 수득된다. 예를 들어, 수많은 수단이 무작위화된 올리고뉴클레오티드 및 올리고펩티드의 발현을 포함하는 광범위한 유기 화합물 및 생체분자의 무작위 및 유도 합성에 이용가능하다. 대안적으로, 박테리아, 진균, 식물 및 동물 추출물 형태로의 자연적 화합물의 라이브러리가 이용가능하거나 용이하게 생성된다. 추가적으로, 자연적 또는 합성적으로 생성된 라이브러리 및 화합물은 종래의 화학, 물리 및 생화학적 수단을 통해 용이하게 변형되며, 조합 라이브러리를 생성하는데 사용될 수 있다. 공지된 약리제는 유도 또는 무작위 화학적 변형, 예컨대 아실화, 알킬화, 에스테르화, 아미드화 등을 거쳐 구조적 유사체를 생성할 수 있다.
그 중에서도 펩티드, 단백질, 핵산 (cDNA 발현 라이브러리 포함), 소 유기 화합물, 리간드, PNA 등을 포함하는 화합물/분자를, cccDNA 를 저해하는 능력에 대해 평가할 수 있다는 것이 본 발명에서 또한 예상된다. 상기 화합물은 또한 관능적 유도체 또는 유사체일 수 있다.
화학적 유도체 및 유사체의 제조 방법은 당업자에게 널리 공지되어 있으며, 예를 들어 Beilstein, "Handbook of Organic Chemistry", Springer Edition New York, 또는 "Organic Synthesis", Wiley, New York 에서 기재되어 있다. 또한, 상기 유도체 및 유사체는 본 발명에 따른 cccDNA 에 대한 그의 효과, 즉 그의 길항 효과에 대해 시험될 수 있다.
또한, cccDNA 의 적절한 길항제 또는 저해제의 펩티드유사체 (peptidomimetic) 및/또는 컴퓨터 보조 설계가 사용될 수 있다. 예를 들어 단백질 및 펩티드의 컴퓨터 보조 설계를 위한 적절한 컴퓨터 시스템은 예를 들어, Berry (1994) Biochem. Soc. Trans. 22:1033-1036; Wodak (1987), Ann. N. Y. Acad. Sci. 501:1-13; Pabo (1986), Biochemistry 25:5987-5991 에 기재되어 있다. 상기 기재한 컴퓨터 분석으로부터 수득한 결과는 예를 들어 공지된 화합물, 물질 또는 분자의 최적화를 위해 본 발명의 방법과 조합으로 사용될 수 있다. 적절한 화합물이 또한 연속적인 화학적 변형을 통한 펩티드유사체 조합 라이브러리의 합성 및 생성 화합물의 시험 (예를 들어 본원에 기재한 방법에 따름) 에 의해 확인될 수 있다. 펩티드유사체 조합 라이브러리의 생성 방법 및 용도는 선행 기술, 예를 들어 [Ostresh (1996) Methods in Enzymology 267:220-234] 및 [Dorner (1996) Bioorg. Med. Chem. 4:709-715] 에 기재되어 있다. 또한, cccDNA 의 길항제의 3 차원 및/또는 결정학적 구조가 cccDNA 의 (펩티드유사체) 길항제 설계에 사용될 수 있다 (Rose (1996) Biochemistry 35:12933-12944; Rutenber (1996) Bioorg. Med. Chem. 4:1545-1558).
cccDNA 를 저해할 수 있는 후보 분자의 확인/평가는 그 중에서도, 적절한 숙주를 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로 트랜스펙션하고 상기 숙주를 후보 분자(들) 와 접촉시킴으로써 수행될 수 있다.
본원에서 사용할 세포(들)/숙주(들) 는 바람직하게는 진핵세포(들), 특히 간세포 기원의 진핵세포(들) 이다. 진핵세포(들) 는 바람직하게는 간종양 세포(들) 또는 간 세포(들) 이다. 진핵세포(들) 는 또한 간종양 세포(들) 또는 간 세포(들) 에서 유래할 수 있다. 본원에서 사용할 바람직한 세포는 진핵세포 HepG2 (ATCC #HB-8065) 이다. HepG2 세포는 기능적 HBV cccDNA 형성 및 전사를 지지하는 것으로 알려져 있다. 간세포-유래 세포 (예를 들어 Huh7) 와 같은 다른 세포의 사용이 본원에서 예상된다. 헤파드나바이러스 cccDNA 형성 (또는 광의에서, 헤파드나바이러스 DNA 복제) 을 지지한다면, 비-간 세포(들)/숙주(들) 가 또한 본 발명에 따라 사용될 수 있다. 예를 들어, 이러한 비-간 세포(들)/숙주(들) 은, 바이러스 프리게놈 RNA 가 세포에 도입되거나 외인성 프로모터에 의해 DNA 주형으로부터 전사된다면, 헤파드나바이러스 cccDNA 형성 (또는 헤파드나바이러스 DNA 복제) 을 지지하도록 변형될 수 있다. 간 특이적 전사 인자가 이러한 비-간세포에서 교차보충된다면, cccDNA 전사가 작용할 수 있다. 본 발명의 핵산 분자 또는 이를 포함하는 벡터는 세포(들) 의 게놈에서 안정적으로 통합될 수 있다.
본 발명에 따라 사용할 핵산 분자 (즉 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자) 또는 이를 포함하는 벡터는 바람직하게는 (본질적으로) DNA 로 이루어진다.
"세포" 에 대한 상기 본원에서 주어진 설명은 또한 이러한 세포를 포함하거나 이로부터 유래한 조직/비-인간 동물에 적용되며 이를 포함한다. 본원에서 사용할 세포는 샘플, 예를 들어 생물학적, 의학적 또는 병리학적 샘플에 포함될 수 있다. 예를 들어, 세포, 조직 또는 세포 배양물을 포함하는 유체의 사용이 예상된다. 이러한 유체는 체액 또는 배설물일 수 있으며 또한 배양 샘플일 수 있다. 체액은 혈액, 혈청, 혈장, 소변, 타액, 활액, 척수액, 뇌척수액, 눈물, 대변 등을 포함할 수 있으나 이에 제한되는 것은 아니다.
마찬가지로, 후보 분자(들) 는 (생물학적) 샘플 또는 조성물에 포함될 수 있다. (다수의) 후보 분자(들) 는 종종 제 1 스크리닝 처리된다. 제 1 스크리닝에서 양성으로 시험된 샘플/조성물은 후속 스크리닝 처리되어, 이전 발견을 확인하고 가장 강력한 저해제/길항제를 선택할 수 있다. 다수의 스크리닝 및 선택 라운드 (round) 시, 이러한 후보 분자는 본원에 정의되고 개시된 바와 같은 cccDNA 를 저해/길항하는 표명된 능력을 나타내는 것이 선택될 수 있다. 예를 들어, 많은 후보 분자를 함유하는 배치 (즉, 조성물/샘플) 는 재스크리닝될 것이며 후보 분자의 불충분한 저해 활성을 갖거나 저해 활성을 갖지 않는 배치는 재시험 없이 폐기될 것이다.
예를 들어, 많은 상이한 후보 분자를 갖는 (생물학적) 샘플 또는 조성물이 시험되고 하나의 (생물학적) 샘플 또는 조성물이 양성으로 시험된다면, 제 2 스크리닝에서, 바람직하게는 정제 후에, (생물학적) 샘플 또는 조성물의 개별 분자(들) 를 스크리닝할 수 있다. 후속 스크리닝(들) 에서 제 1 스크리닝의 (생물학적) 샘플 또는 조성물의 하위군을 스크리닝할 수도 있다. 이전 스크리닝 라운드에서 시험한 이들 후보 분자의 하위군을 갖는 조성물의 스크리닝은 따라서 잠재적으로 강력한 cccDNA 저해제(들) 에서 좁아질 것이다. 이는 특히 다수의 분자가 스크리닝되는 경우 스크리닝 과정을 촉진하고 가속화할 수 있다. 따라서, 스크리닝 라운드의 사이클 수는 제 1 (및 후속) 스크리닝(들) 에서의 각자 개별적인 후보 분자 시험 (이것 물론 또한 가능함) 과 비교하여 감소된다. 따라서, 후보 분자의 복잡성 또는 수에 따라, 본원에 기재된 스크리닝 방법의 단계는 스크리닝할 (생물학적) 샘플 또는 조성물이 제한된 수, 바람직하게는 단 하나의 물질 (표지된 헤파드나바이러스 e 항원의 수를 감소시키는 스크리닝된 분자의 능력을 표시함) 을 포함할 때까지 수 회 수행될 수 있다.
본원에서 예상된 것은, 예를 들어 단일 세포 또는 조직의 단일 세포 (예를 들어 준세포 수준에서) 의 수준에 대한 형광의 분해능을 가능하게 하는 광학적 측정 기법의 사용이다. 이러한 기법은 형광, 예를 들어 공초점 현미경, 디지털 영상 기록, 예컨대 CCD 카메라 및 적합한 사진 분석 소프트웨어를 포함할 수 있다. 예를 들어, 단계 (b) 는 대조 실험을 수행하여 표준 반응의 측정 후에 실행된다. 예를 들어, 표지된 헤파드나바이러스 e 항원의 수준은 제 1 스크리닝에서 후보 분자를 접촉시키지 않고, 표지된 헤파드나바이러스 e 항원을 포함하는 세포, 조직 또는 비-인간 동물에서 측정된다. 제 2 스크리닝에서, 후보 분자와 접촉 후에, 표지된 헤파드나바이러스 e 항원의 수준이 측정/평가된다. 수준에서의 차이는, 시험한 후보 분자가 실제로 cccDNA 의 길항제/저해제인지 여부를 나타낸다.
표지된 헤파드나바이러스 e 항원의 수준은 예를 들어, 본원에서 기재한 임의의 방법, 특히 단백질 측정/검출/평가 기법에 의해 유전자 산물의 수준 (특히 표지된 헤파드나바이러스 e 항원의 단백질 수준) 을 측정함으로써 정량될 수 있다.
예를 들어, 발현은 면역응집, 면역침전 (예를 들어 면역확산, 면역전기영동, 면역 고정), 웨스턴 블롯팅 기법 (예를 들어 (in situ) 면역조직화학, (in situ) 면역세포화학, 친화성 크로마토그래피, 효소 면역검정) 등을 이용하여 단백질 수준에서 측정될 수 있다. 용액 중의 정제된 폴리펩티드의 양은 물리적 방법, 예를 들어 광도측정에 의해 측정될 수 있다. 혼합물 중의 특정 폴리펩티드의 정량 방법은 예를 들어 항체의 특정한 결합에 의존한다. 항체의 특이성을 활용하는 특정한 검출 및 정량화 방법은 예를 들어 면역조직화학 (in situ) 을 포함한다. 예를 들어, 세포, 조직 또는 비-인간 동물 내의 표지된 헤파드나바이러스 e 항원 단백질의 수준의 농도/양은 효소 연결-면역흡착 검정 (ELISA) 에 의해 측정될 수 있다.
본원에서 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 것은 ELISA, CLIA 또는 AlphaLISA 에 의해 수행될 수 있다고 예상된다.
본원에 제공된 방법은 확립된 표지 (예컨대 HA-표지, 또는 HA-표지 대신에 또는 그에 더해 사용될 수 있는 His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지) 를 사용한다. 상기 표지는 표지된 헤파드나바이러스 e 항원의 정제 및 검출에 사용될 수 있다. 표지에 특이적으로 결합하는 항체 (예를 들어 ELISA 검정, 예컨대 화학발광 ELISA (CLIA) 및 AlphaLISA 를 통함) 를 사용함으로써, 표지된 헤파드나바이러스 e 항원의 수준을 실현성있고 쉽게 평가할 수 있고, 코어 단백질과의 교차-반응을 피할 수 있다.
본원에 제공된 방법의 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 것은 상기 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원을 특이적으로 인지하는 항체 (예컨대, Anti-HBe 그러나 이에 제한되지 않음: 클론 29, Lot 20110305, Autobio Diagnostics) 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체 (예컨대, Anti-HA 그러나 이에 제한되지 않음: cat# A01244-100, Genscript) 의 사용을 포함할 수 있다.
하기 항체는 B 형 간염 바이러스 e 항원을 특이적으로 인지하며, 본 발명에 따라 사용될 수 있다:
Imai, et al. Demonstration of two distinct antigenic determinants on hepatitis B e antigen by monoclonal antibodies. J Immunol. 1982 Jan; 128(1):69-72.
Ferns and Tedder. Monoclonal antibodies to hepatitis B antigen (HBeAg) derived from hepatitis B core antigen (HBcAg): their use in characterization and detection of HBeAg. J Gen Virol. 1984 May; 65 ( Pt 5):899-908.
Mondelli et al. Differential distribution of hepatitis B core and E antigens in hepatocytes: analysis by monoclonal antibodies. Hepatology. 1986 6(2):199-204.
Stuckmann and Mushahwar. Re-examination and further characterization of a monoclonal antibody to hepatitis B e antigen (anti-HBe). J Virol Methods. 1986 Jul;13(4):351-62.
Korec et al. Monoclonal antibodies against hepatitis B e antigen: production, characterization, and use for diagnosis. J Virol Methods. 1990 May; 28(2):165-9.
Usuda et al. A monoclonal antibody against a hepatitis B e antigen epitope borne by six amino acids encoded by the precore region.J Virol Methods. 1997 Nov; 68(2):207-15.
Sogut et al. Monoclonal antibodies specific for hepatitis B e antigen and hepatitis B core antigen. Hybridoma (Larchmt). 2011 Oct; 30(5):475-9.
대안적으로, 웨스턴 블롯 분석 또는 면역조직화학 염색을 수행할 수 있다. 웨스턴 블롯팅은 전기영동에 의한 단백질의 혼합물의 분리 및 항체로의 특이적 검출을 조합한다. 전기영동은 다차원 예컨대 2D 전기영동일 수 있다. 통상, 폴리펩티드는 하나의 차원을 따라 그들의 겉보기 분자량에 의해 그리고 다른 방향을 따라 이들의 등전점에 의해 2D 전기영동으로 분리된다.
당업자는 검출 신호의 강도 및 예를 들어, 측정하고자 하는 폴리펩티드/단백질의 양 사이의 상관관계, 바람직하게는 선형 상관관계를 이용하여, 상기 본원에 기재된 폴리펩티드/단백질, 특히 유전자 산물의 양을 측정할 수 있다. 따라서, 표지된 헤파드나바이러스 e 항원의 수준은 표지된 헤파드나바이러스 e 항원의 단백질 수준에 대해 정량될 수 있다. 당업자는 샘플 중의 표지된 헤파드나바이러스 e 항원 단백질 발현 산물의 수준의 양/농도를 측정하는데 사용하고자 하는 표준 방법을 알고 있거나 또는 표준 교과서로부터 상응하는 방법을 추론할 수 있다 (예를 들어 Sambrook, 2001).
후보 분자(들) 은 표지된 헤파드나바이러스 e 항원 (또는 상응하는 리포터 신호) 의 수준이 강하게 감소되는 경우, 바람직하게는 매우 낮거나 또는 검출가능하지 않은 경우 선택된다. 예를 들어, 표지된 헤파드나바이러스 e 항원 (또는 상응하는 리포터 신호) 의 수준은 (대조) 표준 값과 비교하여 적어도 50%, 60%, 70%, 80%, 보다 바람직하게는 적어도 90% 감소될 수 있다.
세포 또는 조직의 트랜스펙션 방법은 당업계에 공지되어 있다. 따라서, 칼슘 포스페이트 처리 또는 전기천공이 상기 리포터 구축물을 발현시키기 위해 세포 또는 조직을 트랜스펙션하는데 사용될 수 있다 (참고, Sambrook (2001), loc. cit.). 게다가, 상기 리포터 구축물을 발현하는 핵산 분자는 표적 세포로의 전달을 위해 리포좀 내로 재구성될 수 있다. 추가의 대안으로서, 세포는 유전적으로 조작된 바이러스 벡터를 사용하여 특정 리포터 구축물을 발현하기 위해 형질도입될 수 있다.
또다른 구현예에서, cccDNA 억제를 검출하기 위해 상기 리포터 구축물을 포함하는 비-인간 동물은 트랜스제닉 비-인간 동물이다. 기재된 스크리닝 검정에서 사용하고자 하는 비-인간 유기체는 C. 엘레강스, 효모, 초파리, 제브라피시, 기니아 피그, 래트 및 마우스로 이루어지는 군으로부터 선택될 수 있다. 이러한 트랜스제닉 동물의 생성은 당업자의 기술 내에 있다. 상응하는 기법이 특히 "Current Protocols in Neuroscience" (2001), John Wiley&Sons, Chapter 3.16 에 기재되어 있다.
따라서, 본 발명은 또한 ES-세포 또는 생식 세포 내로 본원에 기재된 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 도입하는 단계를 포함하는 비-인간 트랜스제닉 동물의 생성 방법에 관한 것이다. 본원에 제공되고 기재되는 비-인간 트랜스제닉 동물은 상기 본원에 기재된 스크리닝 방법 및 약리학적 시험에서 특히 유용하다. 본원에 기재된 비-인간 트랜스제닉 동물은 헤파드나바이러스와 연관된 질환의 치료를 위한 cccDNA 의 길항제/저해제가 추적되고, 선택되고 및/또는 단리되는 과학적 및 의료적 연구 뿐 아니라 약물 스크리닝 검정에서 사용될 수 있다.
본 발명의 문맥에서, 특히 스크리닝/식별 방법에서 사용하고자 하는 형질전환/유전자 조작 세포(들), 조직(들), 및/또는 비-인간 동물은, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 본원에 기재되고 정의된 핵산 분자를 포함한다.
본 발명은 헤파드나바이러스의 cccDNA 의 저해제인 것으로 의심되는 화합물의 스크리닝 및/또는 검증을 위한 세포, 조직 또는 비-인간 동물의 용도에 관한 것이다.
본원에서 사용된 바와 같은 용어 "트랜스제닉 비-인간-동물", "트랜스제닉 세포" 또는 "트랜스제닉 조직" 은 상응하는 야생형 동물, 조직 또는 세포의 상이한 유전적 물질을 포함하는 인간이 아닌, 비-인간 동물, 조직 또는 세포를 말한다. 본 문맥에서 용어 "유전적 물질" 은 임의의 종류의 핵산 분자, 또는 이의 유사체, 예를 들어 본원에 정의된 핵산 분자, 또는 이의 유사체일 수 있다. 용어 "상이한" 은 야생형 동물 또는 동물 세포의 게놈과 비교하여 부가적인 또는 더 적은 유전적 물질을 의미한다. 트랜스제닉 세포/동물의 생성을 위해 사용하고자 하는 상이한 발현 시스템의 개관은 예를 들어 문헌 Methods in Enzymology 153 (1987), 385-516, Bitter et al (Methods in Enzymology 153 (1987), 516-544) 및 Sawers et al. (Applied Microbiology and Biotechnology 46 (1996), 1-9), Billman-Jacobe (Current Opinion in Biotechnology 7 (1996), 500-4), Hockney (Trends in Biotechnology 12 (1994), 456-463), Griffiths et al., (Methods in Molecular Biology 75 (1997), 427-440) 을 언급한다.
본 발명은 상기 본원에 정의된 바와 같은 핵산 분자, 즉 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자에 관한 것이다. 상기 본원에 제공된 설명 및 정의는 여기에 필요한 부분만 적용된다. 헤파드나바이러스 e 항원은 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 이다.
표지된 헤파드나바이러스 e 항원은 오직 하나의 표지를 함유할 수 있다. 표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 전형적이고 본원에서 바람직한 (에피토프) 표지는 8, 9, 10 또는 11 개의 아미노산으로 이루어진다. 6xHis 가 본원에서 사용될 수 있는 최소의 에피토프 표지이다. 6 개 미만의 아미노산의 삽입은 인접 HBeAg 아미노산과 함께 새로운 에피토프 내로 어셈블링될 수 있어, 또한 이러한 삽입이 표지된 헤파드나바이러스를 초래하는 것이 가능하다. 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
표지된 헤파드나바이러스 e 항원은 2 개 이상의 표지를 함유할 수 있다. 2 개 이상의 표지는 바람직하게는 상이한 표지이다. 상기 2 개 이상의 표지의 전체 길이는 약 12 내지 약 31 개의 아미노산일 수 있다. 예를 들어, 2 개 이상의 표지의 전체 길이는 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개의 아미노산일 수 있다. 2 개 이상의 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지의 2 개 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
표지(들) 을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에 나타낸 바와 같은 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에 나타낸 바와 같은 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에 나타낸 바와 같은 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에 나타낸 바와 같은 V5-표지를 인코딩하는 핵산 서열, 및/또는 SEQ ID NO: 6 에 나타낸 바와 같은 C9-표지를 인코딩하는 핵산 서열이다.
Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에 나타낸 바와 같은 1xFlag-표지를 인코딩하는 핵산 서열, 또는 SEQ ID NO: 7 에 나타낸 바와 같은 3xFlag-표지를 인코딩하는 핵산 서열이다.
표지(들) 의 예시적 아미노산 서열은 SEQ ID NO: 8 에 나타낸 바와 같은 HA 표지의 아미노산 서열, SEQ ID NO: 9 에 나타낸 바와 같은 His-표지의 아미노산 서열, SEQ ID NO: 11 에 나타낸 바와 같은 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에 나타낸 바와 같은 V5-표지의 아미노산 서열, 및/또는 SEQ ID NO: 13 에 나타낸 바와 같은 C9-표지의 아미노산 서열이다.
Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에 나타낸 바와 같은 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에 나타낸 바와 같은 3xFlag-표지의 아미노산 서열이다.
HBeAg 를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 16 에 나타낸다. HBeAg 의 예시적 아미노산 서열은 SEQ ID NO: 18 에 나타낸다.
핵산 분자는 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 15 에 나타낸다. 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 17 에 나타낸다.
핵산 분자는 하나 이상의 표지를 인코딩하는 핵산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 프리코어 단백질의 N-말단 신호 펩티드 및 링커를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림이다.
하나 이상의 표지를 인코딩하는 핵산 서열은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개의 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다.
핵산 분자는 헤파드나바이러스 게놈을 포함할 수 있다. 바람직하게는, 헤파드나바이러스 게놈은 B 형 간염 바이러스 (HBV) 게놈이다. HBV 게놈은 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈일 수 있다. HBV 게놈은 HBV 유전자형 D 의 게놈일 수 있다. 바람직하게는, HBV 게놈은 HBV 유전자형 D, 서브유전자형 ayw 의 게놈이다.
하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 23 에 나타낸다. 코어 단백질은 HBV 코어 단백질일 수 있다. HBV 코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 24 에 나타낸다.
하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 본원에 정의된 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조 내로 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 예시적 핵산 서열은 SEQ ID NO: 25 에 나타낸다. 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기 내로 삽입될 수 있다.
하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다.
핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함할 수 있다. 헤파드나바이러스 게놈, 바람직하게는 HBV 의 (또는 이에 의해 인코딩되는) 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은, 일차적으로, 바람직하게는 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는, 또는 임의로 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 헤파드나바이러스 게놈의 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은 9 개 (이하의) 뉴클레오티드로 이루어질 수 있다.
헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID No. 26 에 나타내는 서열로 이루어진다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID NO. 40 에 나타내는 폴리펩티드를 인코딩한다.
핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 오직 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다. 링커를 인코딩하는 서열은 서열 GGC 로 이루어질 수 있다. 링커를 인코딩하는 서열은 글리신 잔기를 인코딩할 수 있다. 인코딩하는 서열은 코어 시작 코돈의 진정한 코작 모티프를 유지하기 위해 유용하고 적합하게 선택될 수 있다.
핵산 분자는 SEQ ID NO. 41 에 나타낸 바와 같은 핵산 서열을 포함하는 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함할 수 있다. 핵산 분자는 SEQ ID NO. 42 에 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함할 수 있다.
하나 이상의 표지는 바람직하게는 헤파드나바이러스 e 항원 (또는 헤파드나바이러스 e 프리코어 단백질 내에), 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) (또는 B 형 간염 바이러스 프리코어 단백질 내에) 내에 인 프레임 융합된다.
표지된 HBeAg 를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 20 에 나타낸다. 표지된 HBeAg 의 바람직한 아미노산 서열은 SEQ ID NO: 22 에 나타낸다.
표지된 B 형 간염 바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 19 에 나타낸다. 표지된 B 형 간염 바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 21 에 나타낸다.
HBV 게놈의 예시적 핵산 서열은 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에 나타낸다.
핵산은 프리게놈 (pg) 헤파드나바이러스 RNA 내로 전사될 수 있다. 헤파드나바이러스 RNA 는 바람직하게는 HBV RNA 이다.
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 벡터, 예컨대 발현 벡터 내에 포함될 수 있다. 바람직하게는, 헤파드나바이러스 e 항원은 B 형 간염 바이러스 e 항원 (HBeAg) 이다.
핵산은 일반적으로 표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 의 번역을 허용한다. 핵산은 SEQ ID NO: 39 에 나타낸 서열을 포함하는 벡터 내에 포함될 수 있다.
특정 구현예에서, 핵산은 표지된 헤파드나바이러스 e 항원의 번역을 방지하도록 설계된다. 예를 들어, 핵산은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 함유하지 않는다. 예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 는 핵산 TG 에 의해 대체될 수 있다. 핵산은 표지된 헤파드나바이러스 e 항원의 번역을 방지하기 위해 점 돌연변이에 의해 개질될 수 있다. 벡터는 SEQ ID NO: 35 에 나타낸 서열을 포함할 수 있다.
표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 유도성 프로모터의 제어 하에 있을 수 있다.
유도성 프로모터는 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터, 또는 제초제-유도성 프로모터일 수 있다.
유도성 프로모터는 바람직하게는 CMV 프로모터일 수 있다. 유도성 프로모터는 tet-EF-1 알파 프로모터일 수 있다.
하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질, 바람직하게는 하나 이상의 HBV 외피 단백질의 코딩 부위 내로 도입될 수 있다.
하나 이상의 HBV 외피 단백질은 L, M 및/또는 S 중 하나 이상일 수 있다. HBV 외피 단백질은 S 일 수 있다.
하나 이상의 HBV 외피 단백질의 예시적 코딩 부위 (또는 이를 인코딩하는 예시적 핵산 서열) 를 SEQ ID NO: 36 (L), 37 (M) 또는 38 (S) 에 나타낸다. SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 는 외피 단백질의 발현을 방지하기 위해 TAGTAG 로 돌연변이화될 수 있다.
본 발명은 상기 본원에 정의되고 제공된 핵산 분자에 의해 인코딩되는 단백질에 관한 것이다.
단백질은 표지된 헤파드나바이러스 e 항원, 바람직하게는 표지된 B 형 간염 바이러스 e 항원 (HBeAg) 을 포함한다.
B 형 간염 바이러스 e 항원 (HBeAg) 은 SEQ ID NO: 18 에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다. 바람직하게는, 표지된 헤파드나바이러스 e 항원은 단 하나의 표지를 함유한다.
표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
표지된 헤파드나바이러스 e 항원은 2 개 이상의 표지를 함유할 수 있다. 바람직하게는 2 개 이상의 표지는 상이한 표지이다. 상기 2 개 이상의 표지의 전체 길이는 약 14 내지 약 31 개의 아미노산이다. 2 개 이상의 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.
표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에 나타낸 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에 나타낸 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에 나타낸 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에 나타낸 V5-표지를 인코딩하는 핵산 서열, 및/또는 SEQ ID NO: 6 에 나타낸 C9-표지를 인코딩하는 핵산 서열이다.
Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에 나타낸 1xFlag-표지를 인코딩하는 핵산 서열 또는 SEQ ID NO: 7 에 나타낸 3xFlag-표지를 인코딩하는 핵산 서열이다.
표지의 예시적 아미노산 서열은 SEQ ID NO: 8 에 나타낸 HA 표지의 아미노산 서열, SEQ ID NO: 9 에 나타낸 His-표지의 아미노산 서열, SEQ ID NO: 11 에 나타낸 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에 나타낸 V5-표지의 아미노산 서열; 및/또는 SEQ ID NO: 13 에 나타낸 C9-표지의 아미노산 서열이다.
Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에 나타낸 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에 나타낸 3xFlag-표지의 아미노산 서열이다.
단백질은 헤파드나바이러스 프리코어 단백질을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 15 에 나타낸다. 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 17 에 나타낸다.
단백질은 하나 이상의 표지의 아미노산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 프리코어 단백질의 신호 펩티드 및 링커의 서열의 아미노산 서열의 C-말단이다. 단백질은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개의 아미노산의 아미노산 서열의 하나 이상의 표지 C-말단의 아미노산 서열을 포함할 수 있다.
단백질은 하나 이상의 표지의 아미노산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 코어 단백질의 아미노산 서열의 N-말단, 바람직하게는 HBV 코어 단백질의 아미노산 서열의 N-말단이다. HBV 코어 단백질을 인코딩하는 예시적 핵산은 SEQ ID NO: 23 에 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 24 에 나타낸다.
하나 이상의 표지의 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조에 의해 인코딩되는 아미노산 서열 내로 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 엡실론 구조의 예시적 핵산 서열은 SEQ ID NO: 25 에 나타낸다. 하나 이상의 표지의 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기에 의해 인코딩되는 아미노산 서열 내로, 바람직하게는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기에 의해 인코딩되는 아미노산 서열 내로 삽입될 수 있다.
하나 이상의 표지의 아미노산 서열은 예컨대 SEQ ID NO. 17 에 나타낸 바와 같은, HBV 프리코어 단백질의 위치 G29 및 위치 M30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다.
단백질은 하나 이상의 표지의 아미노산 서열에 대한 N-말단에 3 개 (이하) 의 아미노산의 아미노산 서열을 추가로 포함할 수 있고, 3 개 이하의 아미노산의 상기 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열에 의해 인코딩된다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열은, 주로 바람직하게는 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 또는, 임의로, 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 핵산 서열은 SEQ ID No. 26 에 나타낸 서열로 이루어진다. 3 개 (이하) 의 아미노산의 예시적 아미노산 서열을 SEQ ID NO. 40 에 나타낸다.
단백질은 하나 이상의 표지의 아미노산 서열에 대한 C-말단에 링커를 추가로 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 오로지 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다.
표지된 헤파드나바이러스 e 항원의 아미노산 서열은 SEQ ID NO. 41 에 나타낸 핵산 서열에 의해 인코딩된 아미노산 서열을 포함할 수 있다. 표지된 헤파드나바이러스 e 항원의 아미노산 서열은 SEQ ID NO. 42 에 나타낸 아미노산 서열을 포함할 수 있다.
하나 이상의 표지는 바람직하게는 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 내에 인 프레임 융합된다.
표지된 HBeAg 에 따른 예시적 핵산 서열은 SEQ ID NO: 20 에 나타낸다. 바람직하게는, 표지된 HBeAg 는 SEQ ID NO: 22 에 나타낸 아미노산 서열을 갖는다.
표지된 HBV 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 19 에 나타낸다. 표지된 HBV 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 21 에 나타낸다.
본 발명은 본원에 정의된 및 제공된 핵산 분자를 포함하는 숙주 세포 및/또는 본원에 정의된 및 제공된 단백질을 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 진핵세포일 수 있다. 진핵세포는 간세포 기원의 것일 수 있다. 진핵세포는 간종양 세포일 수 있거나 또는 간종양 세포로부터 유래될 수 있다. 바람직한 구현예에서, 진핵세포는 HepG2 (ATCC #HB-8065) 이다.
본 발명은 상기 본원에 정의된 단백질의 제조 방법에 관한 것으로, 상기 방법은 상기 본원에 정의된 숙주를 단백질의 발현을 허용하게 하는 조건 하에서 배양하고, 배양물로부터 생성된 단백질을 회수하는 것을 포함한다.
본 발명은 본 발명의 방법에서 사용하기 위한 키트에 관한 것이다. 마찬가지로, 본 발명은 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 의심되는 후보 분자를 스크리닝하기 위한 키트의 용도에 관한 것이다. 헤파드나바이러스의 cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하기 위한 방법과 관련하여 상기 본원에 제공된 설명은 여기에 필요한 부분만 적용된다.
키트는 본원에 정의된 헤파드나바이러스 항원 e 를 특이적으로 인지하는 항체 및 본원에 정의된 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체를 포함할 수 있다.
본 발명의 (문맥에서 제조될) 키트 또는 본 발명의 방법 및 용도는 지침 설명서(들) 을 추가로 포함할 수 있거나 이것과 함께 제공될 수 있다. 예를 들어, 상기 지침 설명서(들) 은 당업자가 (어떻게) cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하는지 및/또는 어떻게 본 발명에 따라 표지된 헤파드나바이러스 e 항원의 수준을 평가하는지에 대한 지침을 줄 수 있다. 특히, 상기 지침 설명서(들) 은 사용에 대한 지침을 포함하거나 또는 본원에 제공된 방법 또는 용도에 적용할 수 있다.
본 발명의 (문맥에서 제조될) 키트는 본 발명의 방법 및 용도를 수행하기 위해 적합한/필요한 성분/약품 및/또는 장비를 추가로 포함할 수 있다. 예를 들어, 이러한 성분/약품 및/또는 장비는 본원에 정의된 상기 표지된 헤파드나바이러스 e 항원의 (단백질 (발현)) 수준을 특이적으로 측정하는데 필요한 화합물(들) 을 안정화 및/또는 저장하기 위한 용매, 희석제 및/또는 완충제이다.
본 발명은 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 의심되는 후보 분자를 스크리닝하기 위한, 본원에 정의되고 제공되는 핵산 분자, 본원에 정의되고 제공되는 단백질 및/또는 본원에 정의되고 제공되는 숙주 세포의 용도에 관한 것이다. 헤파드나바이러스의 cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하기 위한 방법과 관련하여 상기 본원에 제공된 설명은 여기에 필요한 부분만 적용된다.
본원에서 사용되는 바와 같은, 용어 "~ 를 포함하는" 및 "~ 가 포함되는" 또는 이의 문법적 변형은 언급된 특징, 정수, 단계 또는 성분을 구체화하는 것으로 간주되나, 하나 이상의 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹의 부가를 불가능하게 하는 것은 아니다. 상기 용어는 용어 "~ 로 이루어지는" 및 "~ 로 본질적으로 이루어지는" 을 포함한다. 따라서, 용어 "~ 를 포함하는""/~ 가 포함되는""/~ 를 갖는" 은 임의의 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등) 이 존재할 수 있다는 것을 의미한다.
용어 "~ 로 이루어지는" 은 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등) 이 존재할 수 없다는 것을 의미한다.
용어 "~ 로 본질적으로 이루어지는" 또는 이의 문법적 변형은 본원에서 사용되는 경우 언급된 특징, 정수, 단계 또는 성분을 구체화하나 하나 이상의 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹의 부가를 불가능하게 하는 것이 아닐 뿐 아니라, 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹이 청구된 조성물, 장치 또는 방법의 기본적이고 신규한 특징을 실질적으로 변경시키지 않는 경우에만 취해진다.
따라서, 용어 "~ 로 본질적으로 이루어지는" 은 특정의 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등), 즉, 조성물, 장치 또는 방법의 본질적인 특징에는 실질적으로 영향을 주지 않는 것들이 존재할 수 있다는 것을 의미한다. 다른 말로는, 용어 "~ 로 본질적으로 이루어지는" (용어 "~ 를 실질적으로 포함하는" 로 본원에서 상호교환적으로 사용될 수 있음) 은, 의무적인 성분 (또는 마찬가지로 특징, 정수, 단계 등) 에 더해 조성물, 장치 또는 방법 중의 다른 성분의 존재를 허용하나, 단, 장치 또는 방법의 본질적인 특징은 다른 성분의 존재에 의해 실질적으로 영향을 받지 않는다.
용어 "방법" 은, 화학적, 생물학적 및 생물물리학적 분야의 당업자에 의해 제한 없이, 공지된, 또는 공지된 방식, 수단, 기법 및 절차로부터 쉽게 개발되는 이들 방식, 수단, 기법 및 절차를 포함하는 제시된 과제를 달성하기 위한 방식, 수단, 기법 및 절차를 말한다.
본원에서 사용되는 바와 같은, 용어 "단리된" 은 이의 생체 내 위치로부터 제거되어진 조성물을 말한다. 바람직하게는 본 발명의 단리된 조성물 또는 화합물에는 이들의 생체 내 위치에 존재하는 (즉 정제된 또는 반-정제된 조성물 또는 화합물) 다른 성분 (예를 들어, 기타 단백질 또는 기타 화합물) 이 실질적으로 없다.
본원에서 사용되는 바와 같은 용어 "약" 은 ±10% 를 말한다.
본 발명은 하기 비-제한적 특징 및 실시예를 참고로 하여 추가로 설명된다.
다르게 나타내지 않는다면, 재조합 유전자 기술의 확립된 방법이, 예를 들어, 문헌 Sambrook, Russell "Molecular Cloning, A Laboratory Manual", Cold Spring Harbor Laboratory, N.Y. (2001)) 에 기재된 바와 같이 사용되었고, 이는 본원에 그 전체가 참조로서 인용된다.
하기 예는 본 발명을 설명한다:
도면은 다음을 나타낸다:
도 1. HBV 프리코어 ORF 내로의 HA-표지 서열의 삽입.
HBV 프리코어 단백질의 ORF (유전자형 D, 하위유형 ayw, nt 1816-2454) 는 뉴클레오티드 서열에서 제시된 5' 부분 (nt 1816-1941) 과 함께 묘사된다. 프리코어 ORF 의 nt 1941 과 정지 코돈 사이의 서열은 생략된다. 프리코어 ORF 의 시작 코돈, 직접 반복 서열 1 (DR1), 및 코어 ORF 의 인-프레임 (in-frame) 시작 코돈에 박스로 테두리가 쳐있다. 5' 말단 프리코어 ORF 의 시작 코돈은 플라스미드 pTREHBV-HAe 에서 돌연변이화되어 있다 (ATG 에서 TG). 진정한 pgRNA 전사 개시 부위 (nt 1820) 는 화살표로 표시된다. HBV 뉴클레오티드 위치는 Galibert 명명법 (5) 에 따른다. 후속 DNA 복제를 위한 HBV pgRNA 중의 필수적인 시스-요소로서 담당하는 중대한 줄기-루프 구조 (엡실론, ε) 가 예측되는 내부 구조 (하부 줄기, 벌지, 상부 줄기, 루프) 와 함께 예시된다. 엡실론의 염기쌍을 변형시키지 않고 인-프레임 융합된 HA-표지 서열을 프리코어 ORF 내에 두기 위해, HA-표지-함유 DNA 서열 (gtggacatcTACCCATACGACGTTCCAGATTACGCTggc; SEQ ID NO: 41) 을 코어 ORF 의 시작 코돈 (삽입 박스 참조) 에 인접한 인-프레임 업스트림 위치 내에 삽입한다. 서열 개질은 프리코어 단백질 내로의 HA-표지 + 링커 서열의 인-프레임 융합을 산출하며, 코어 단백질의 미손상 ORF 는 엡실론의 다운스트림에서 유지된다.
도 2. HA-표지된 HBeAg 의 발현 및 분비
(A) 야생형 및 HA-표지된 프리코어의 세포내 발현. HepG2 세포를 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션시키고, 5 일 후, 전체 세포 용리액을 항-HBc (상부 패널) 및 항-HA (중간 패널) 항체를 사용함으로써 웨스턴 블롯 분석에 적용하였다. β-액틴이 로딩 대조군으로서 담당했다. 야생형 프리코어 및 HA-표지된 프리코어 (HA-프리코어) 가 표지된다.
(B) 배양액 중의 HA-표지된 HBeAg 의 검출. HepG2 세포를 모방물 (mock) 트랜스펙션하거나 또는 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션하고, 상청액 샘플을 지시된 시점에 수집하고, 세포를 트랜스펙션 5 일 후에 수확하였다. 상청액 샘플을 항-HA 항체를 사용하여 면역침전 (IP) 에 적용하고, HA-표지된 HBeAg (HA-HBeAg) 를 HA 에 대항하는 항체로 웨스턴 블롯에 의해 검출하였다. 항체의 경쇄 (LC) 가 표시된다. HA-프리코어의 세포내 발현을 HA 웨스턴 블롯에 의해 밝혀냈다.
도 3. HepHA-HBe 세포주에서의 HA-HBeAg 의 분비.
확립된 HA-표지된 HBeAg 안정한 발현 세포주, 구체적으로 HepHA-HBe4 및 HepHA-HBe47 세포를, 융합성 조건에서 콜라겐-코팅된 12-웰 플레이트 내에 시딩하였다. 세포가 시딩된 날짜를 제 0 일로 설정하고, 배지를 2 일에 한번씩 보충하였다. 상청액 샘플을 지시된 시점에 수집하고, HA-HBeAg 를 재료 및 방법에 기재된 바와 같이 AlphaLISA 분석에 의해 검출하였다. AlphaLISA 신호 (상대적 광 단위) (Y-축) 를 막대그래프로 시점 (X-축) 에 상응하게 플롯팅하였다.
도 4. 일시적으로 트랜스펙션된 세포 중의 HA-재조합 HBV 게놈의 복제.
HepG2 세포를 pTREHBVDES 또는 pTREHBV-HAe 및 플라스미드 pTet-오프로 공동트랜스펙션하였다. 세포를 트랜스펙션 5 일 후 수확하고, HBV RNA, 코어 단백질, 캡시드화된 pgRNA, 및 바이러스 DNA 복제의 플라스미드-기반 생성을 노던 블롯, 웨스턴 블롯, 및 서던 블롯 혼성화 각각으로 분석하였다. pgRNA: 프리게놈 RNA; sRNA: 표면 RNA; RC: 이완 환형 DNA; SS: 단일 가닥 DNA.
도 5. HepBHAe 안정한 세포주 내의 HBV cccDNA-의존적 HA-표지된 HBeAg 발현의 합리적인 설계의 도식적 예시.
pTREHBV-HAe 및 pTet-오프 안정하게 트랜스펙션된 세포에서, 이식유전자는 tet-CMV 프로모터의 제어 하에 1.1 오버길이 (overlength) HBV 게놈을 함유한다. 프리코어의 시작 코돈 (ATG) 은 HBV DNA 의 5' 말단에서 돌연변이화되어 있고, 두 번째 것은 3' 중복 (redundancy) 에서 변화가 없다. HA-표지-함유 단편 (회색으로 제시됨) 을 재료 및 방법에 기재된 바와 같이 프리코어 ORF 내로 삽입하였다. 이식유전자는 또한 바이러스 외피 단백질 발현을 방지하기 위해 소 표면 (S) ORF 중에 2 개의 탠덤 (tandem) 정지 코돈을 함유한다. (B) Tet 의 제거 시, pgRNA 가 전사되고, 코어 및 중합효소가 생성되어, pgRNA 포장 및 (C) pgRNA 에서 rcDNA 로의 역전사를 초래한다. DNA 복구 메커니즘은 (D) rcDNA 를 (E) 환형 cccDNA 주형으로 전환시키고, 여기서 HA-프리코어 ORF 가 회복되어, HA-프리코어 mRNA, 및 (F) 드 노보 (de novo) 바이러스 복제를 위한 pgRNA 를 산출한다. (G) HA-프리코어 mRNA 로부터의 HA-프리코어 번역 및 분비된 HA-HBeAg 내로의 프로세스 (이는 ELISA 에 의해 검출될 수 있음). preC, C, pol, L, M, S 및 X 는 각각 프리코어, 코어에 대한 ORF 시작 코돈, 중합효소, 대, 중 및 소 s 항원, 및 X 단백질을 나타낸다. DR 은 직접 반복 서열을 나타낸다. CTD 는 C-말단 도메인을 나타낸다.
도 6. HepBHAe13 세포 내의 바이러스 DNA 복제, cccDNA 축적, 및 HA-표지된 HBeAg 생성의 동역학.
HepBHAe13 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포 및 상청액 샘플을 지시된 시점에 수확하였다. 세포내 코어 DNA (상부 패널) 및 cccDNA (하부 패널) 를 추출하고, 서던 블롯 혼성화에 의해 분석하였다. DP-rc 는 탈단백질화된 (단백질이 없는) RC DNA 를 나타낸다. 분비된 HA-표지된 HBeAg 는 상기 기재된 바와 같은 HA IP-웨스턴 블롯에 의해 검출되었다.
도 7. HA-재조합 HBV DNA 복제를 지지하는 부가적인 유도성 HepBHAe 세포주.
HepDES19 세포 및 상이한 클론 번호를 가진 새롭게 확립된 HepBHAe 세포를 테트라사이클린의 존재 하에 동일한 밀도로 6-웰-플레이트에 시딩하였다. 세포가 융합성에 도달하였을 때, 하나의 세포 세트는 테트라사이클린의 존재 하에 배양하고, 또다른 세포 세트는 테트라사이클린의 부재 하에 배양하였다. 6 일 후, 세포를 수확하고, 바이러스 코어 DNA 를 서던 블롯에 의해 분석하였다.
도 8. HepBHAe 세포주 중의 cccDNA 의 진위성.
HepDES19 세포 및 표시된 HepBHAe 세포에서 생성된 cccDNA 를 Hirt 추출에 의해 추출하고 겔 전기영동 및 서던 블롯 혼성화 (레인 1, 5, 8, 11, 14) 에 적용하였다. HBV cccDNA 의 진위성을 추가로 입증하기 위해, Hirt DNA 샘플을 DP-rcDNA 가 SS DNA 로 변성되는 조건인 겔 로딩 전 5 분 동안 85℃ 로 가열한 한편, cccDNA 는 비변성으로 머무르고 이의 전기영동 이동성이 변치 않고 남아있다 (레인 2, 6, 9, 12, 15). 열 변성된 DNA 샘플을 EcoRI 으로 추가로 소화시키고, 이 조건에서 cccDNA 는 게놈-길이 이중-가닥 DNA 로 선형화된다 (레인 3, 7, 10, 13, 16).
도 9. HepBHAe 세포주 중의 HA-HBeAg 의 AlphaLISA 검출.
HepBHAe 세포를 테트라사이클린의 존재 하에 플레이트에 시딩하였다. 세포가 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 상청액 샘플을 지시된 시점에 수확하고 HA-HBeAg 검출을 위해 AlphaLISA 에 적용하였다. AlphaLISA 판독값 (상대적 광 단위, RLU) 을 초 당 계수 (CPS) 로서 표현하였다.
도 10. HBV 복제 저해제 (3TC) 는 HepBHAe13 세포에서 HA-HBeAg 발현을 차단함.
HepBHAe13 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 6-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 지시된 시점에서 수확된 상청액 샘플을 HA-표지된 HBeAg 에 대한 화학발광 면역검정 (CLIA) 에 적용하였다.
도 11. HBV cccDNA 형성 저해제는 HepBHAe13 세포 중의 HA-HBeAg 수준을 감소시킴.
세포를 96-웰-플레이트 내에 시딩하고, 세포가 융합성이 되었을 때 바이러스 복제를 유도하기 위해 테트라사이클린을 배지로부터 제거하였다. 동시에, 세포를 미처리된 채로 두거나 지시된 농도에서 화합물로 처리하고, DMSO 농도를 처리된 및 미처리된 그룹에서 0.5% 로 정규화하였다. 처리를 매 4 일마다 반복하였다. 처리 12 일 후에, 배양액을 HA-HBeAg CLIA 에 적용하고, 판독값을 대조군에 대한 백분율 (평균 ± SD) 로서 플롯팅하였다.
도 12. 부가적인 HepBHAe 세포 클론 중의 바이러스 RNA 전사, DNA 복제 및 cccDNA 축적의 동역학.
표시된 HepBHAe 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포를 지시된 시점에 수확하였다. 총 바이러스 RNA (상부 패널), 세포질 코어 DNA (중간 패널) 를 추출하고 노던 및 서던 블롯 혼성화 각각에 의해 분석하였다. 추출된 cccDNA 를 85℃ 에서 5 분 동안 열 변성시키고, 이후 EcoR I 에 의해 선형화한 후, 서던 블롯 분석 (하부 패널) 하였다.
도 13. 부가적인 HepBHAe 세포 클론 중의 HA-HBeAg 의 cccDNA-의존성 발현.
선택된 HepBHAe 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 96-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 처리 9 일 후에 수확된 상청액 샘플을 HA-표지된 HBeAg 검출을 위한 화학발광 면역검정 (CLIA) 에 적용하였다.
도 1. HBV 프리코어 ORF 내로의 HA-표지 서열의 삽입.
HBV 프리코어 단백질의 ORF (유전자형 D, 하위유형 ayw, nt 1816-2454) 는 뉴클레오티드 서열에서 제시된 5' 부분 (nt 1816-1941) 과 함께 묘사된다. 프리코어 ORF 의 nt 1941 과 정지 코돈 사이의 서열은 생략된다. 프리코어 ORF 의 시작 코돈, 직접 반복 서열 1 (DR1), 및 코어 ORF 의 인-프레임 (in-frame) 시작 코돈에 박스로 테두리가 쳐있다. 5' 말단 프리코어 ORF 의 시작 코돈은 플라스미드 pTREHBV-HAe 에서 돌연변이화되어 있다 (ATG 에서 TG). 진정한 pgRNA 전사 개시 부위 (nt 1820) 는 화살표로 표시된다. HBV 뉴클레오티드 위치는 Galibert 명명법 (5) 에 따른다. 후속 DNA 복제를 위한 HBV pgRNA 중의 필수적인 시스-요소로서 담당하는 중대한 줄기-루프 구조 (엡실론, ε) 가 예측되는 내부 구조 (하부 줄기, 벌지, 상부 줄기, 루프) 와 함께 예시된다. 엡실론의 염기쌍을 변형시키지 않고 인-프레임 융합된 HA-표지 서열을 프리코어 ORF 내에 두기 위해, HA-표지-함유 DNA 서열 (gtggacatcTACCCATACGACGTTCCAGATTACGCTggc; SEQ ID NO: 41) 을 코어 ORF 의 시작 코돈 (삽입 박스 참조) 에 인접한 인-프레임 업스트림 위치 내에 삽입한다. 서열 개질은 프리코어 단백질 내로의 HA-표지 + 링커 서열의 인-프레임 융합을 산출하며, 코어 단백질의 미손상 ORF 는 엡실론의 다운스트림에서 유지된다.
도 2. HA-표지된 HBeAg 의 발현 및 분비
(A) 야생형 및 HA-표지된 프리코어의 세포내 발현. HepG2 세포를 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션시키고, 5 일 후, 전체 세포 용리액을 항-HBc (상부 패널) 및 항-HA (중간 패널) 항체를 사용함으로써 웨스턴 블롯 분석에 적용하였다. β-액틴이 로딩 대조군으로서 담당했다. 야생형 프리코어 및 HA-표지된 프리코어 (HA-프리코어) 가 표지된다.
(B) 배양액 중의 HA-표지된 HBeAg 의 검출. HepG2 세포를 모방물 (mock) 트랜스펙션하거나 또는 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션하고, 상청액 샘플을 지시된 시점에 수집하고, 세포를 트랜스펙션 5 일 후에 수확하였다. 상청액 샘플을 항-HA 항체를 사용하여 면역침전 (IP) 에 적용하고, HA-표지된 HBeAg (HA-HBeAg) 를 HA 에 대항하는 항체로 웨스턴 블롯에 의해 검출하였다. 항체의 경쇄 (LC) 가 표시된다. HA-프리코어의 세포내 발현을 HA 웨스턴 블롯에 의해 밝혀냈다.
도 3. HepHA-HBe 세포주에서의 HA-HBeAg 의 분비.
확립된 HA-표지된 HBeAg 안정한 발현 세포주, 구체적으로 HepHA-HBe4 및 HepHA-HBe47 세포를, 융합성 조건에서 콜라겐-코팅된 12-웰 플레이트 내에 시딩하였다. 세포가 시딩된 날짜를 제 0 일로 설정하고, 배지를 2 일에 한번씩 보충하였다. 상청액 샘플을 지시된 시점에 수집하고, HA-HBeAg 를 재료 및 방법에 기재된 바와 같이 AlphaLISA 분석에 의해 검출하였다. AlphaLISA 신호 (상대적 광 단위) (Y-축) 를 막대그래프로 시점 (X-축) 에 상응하게 플롯팅하였다.
도 4. 일시적으로 트랜스펙션된 세포 중의 HA-재조합 HBV 게놈의 복제.
HepG2 세포를 pTREHBVDES 또는 pTREHBV-HAe 및 플라스미드 pTet-오프로 공동트랜스펙션하였다. 세포를 트랜스펙션 5 일 후 수확하고, HBV RNA, 코어 단백질, 캡시드화된 pgRNA, 및 바이러스 DNA 복제의 플라스미드-기반 생성을 노던 블롯, 웨스턴 블롯, 및 서던 블롯 혼성화 각각으로 분석하였다. pgRNA: 프리게놈 RNA; sRNA: 표면 RNA; RC: 이완 환형 DNA; SS: 단일 가닥 DNA.
도 5. HepBHAe 안정한 세포주 내의 HBV cccDNA-의존적 HA-표지된 HBeAg 발현의 합리적인 설계의 도식적 예시.
pTREHBV-HAe 및 pTet-오프 안정하게 트랜스펙션된 세포에서, 이식유전자는 tet-CMV 프로모터의 제어 하에 1.1 오버길이 (overlength) HBV 게놈을 함유한다. 프리코어의 시작 코돈 (ATG) 은 HBV DNA 의 5' 말단에서 돌연변이화되어 있고, 두 번째 것은 3' 중복 (redundancy) 에서 변화가 없다. HA-표지-함유 단편 (회색으로 제시됨) 을 재료 및 방법에 기재된 바와 같이 프리코어 ORF 내로 삽입하였다. 이식유전자는 또한 바이러스 외피 단백질 발현을 방지하기 위해 소 표면 (S) ORF 중에 2 개의 탠덤 (tandem) 정지 코돈을 함유한다. (B) Tet 의 제거 시, pgRNA 가 전사되고, 코어 및 중합효소가 생성되어, pgRNA 포장 및 (C) pgRNA 에서 rcDNA 로의 역전사를 초래한다. DNA 복구 메커니즘은 (D) rcDNA 를 (E) 환형 cccDNA 주형으로 전환시키고, 여기서 HA-프리코어 ORF 가 회복되어, HA-프리코어 mRNA, 및 (F) 드 노보 (de novo) 바이러스 복제를 위한 pgRNA 를 산출한다. (G) HA-프리코어 mRNA 로부터의 HA-프리코어 번역 및 분비된 HA-HBeAg 내로의 프로세스 (이는 ELISA 에 의해 검출될 수 있음). preC, C, pol, L, M, S 및 X 는 각각 프리코어, 코어에 대한 ORF 시작 코돈, 중합효소, 대, 중 및 소 s 항원, 및 X 단백질을 나타낸다. DR 은 직접 반복 서열을 나타낸다. CTD 는 C-말단 도메인을 나타낸다.
도 6. HepBHAe13 세포 내의 바이러스 DNA 복제, cccDNA 축적, 및 HA-표지된 HBeAg 생성의 동역학.
HepBHAe13 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포 및 상청액 샘플을 지시된 시점에 수확하였다. 세포내 코어 DNA (상부 패널) 및 cccDNA (하부 패널) 를 추출하고, 서던 블롯 혼성화에 의해 분석하였다. DP-rc 는 탈단백질화된 (단백질이 없는) RC DNA 를 나타낸다. 분비된 HA-표지된 HBeAg 는 상기 기재된 바와 같은 HA IP-웨스턴 블롯에 의해 검출되었다.
도 7. HA-재조합 HBV DNA 복제를 지지하는 부가적인 유도성 HepBHAe 세포주.
HepDES19 세포 및 상이한 클론 번호를 가진 새롭게 확립된 HepBHAe 세포를 테트라사이클린의 존재 하에 동일한 밀도로 6-웰-플레이트에 시딩하였다. 세포가 융합성에 도달하였을 때, 하나의 세포 세트는 테트라사이클린의 존재 하에 배양하고, 또다른 세포 세트는 테트라사이클린의 부재 하에 배양하였다. 6 일 후, 세포를 수확하고, 바이러스 코어 DNA 를 서던 블롯에 의해 분석하였다.
도 8. HepBHAe 세포주 중의 cccDNA 의 진위성.
HepDES19 세포 및 표시된 HepBHAe 세포에서 생성된 cccDNA 를 Hirt 추출에 의해 추출하고 겔 전기영동 및 서던 블롯 혼성화 (레인 1, 5, 8, 11, 14) 에 적용하였다. HBV cccDNA 의 진위성을 추가로 입증하기 위해, Hirt DNA 샘플을 DP-rcDNA 가 SS DNA 로 변성되는 조건인 겔 로딩 전 5 분 동안 85℃ 로 가열한 한편, cccDNA 는 비변성으로 머무르고 이의 전기영동 이동성이 변치 않고 남아있다 (레인 2, 6, 9, 12, 15). 열 변성된 DNA 샘플을 EcoRI 으로 추가로 소화시키고, 이 조건에서 cccDNA 는 게놈-길이 이중-가닥 DNA 로 선형화된다 (레인 3, 7, 10, 13, 16).
도 9. HepBHAe 세포주 중의 HA-HBeAg 의 AlphaLISA 검출.
HepBHAe 세포를 테트라사이클린의 존재 하에 플레이트에 시딩하였다. 세포가 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 상청액 샘플을 지시된 시점에 수확하고 HA-HBeAg 검출을 위해 AlphaLISA 에 적용하였다. AlphaLISA 판독값 (상대적 광 단위, RLU) 을 초 당 계수 (CPS) 로서 표현하였다.
도 10. HBV 복제 저해제 (3TC) 는 HepBHAe13 세포에서 HA-HBeAg 발현을 차단함.
HepBHAe13 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 6-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 지시된 시점에서 수확된 상청액 샘플을 HA-표지된 HBeAg 에 대한 화학발광 면역검정 (CLIA) 에 적용하였다.
도 11. HBV cccDNA 형성 저해제는 HepBHAe13 세포 중의 HA-HBeAg 수준을 감소시킴.
세포를 96-웰-플레이트 내에 시딩하고, 세포가 융합성이 되었을 때 바이러스 복제를 유도하기 위해 테트라사이클린을 배지로부터 제거하였다. 동시에, 세포를 미처리된 채로 두거나 지시된 농도에서 화합물로 처리하고, DMSO 농도를 처리된 및 미처리된 그룹에서 0.5% 로 정규화하였다. 처리를 매 4 일마다 반복하였다. 처리 12 일 후에, 배양액을 HA-HBeAg CLIA 에 적용하고, 판독값을 대조군에 대한 백분율 (평균 ± SD) 로서 플롯팅하였다.
도 12. 부가적인 HepBHAe 세포 클론 중의 바이러스 RNA 전사, DNA 복제 및 cccDNA 축적의 동역학.
표시된 HepBHAe 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포를 지시된 시점에 수확하였다. 총 바이러스 RNA (상부 패널), 세포질 코어 DNA (중간 패널) 를 추출하고 노던 및 서던 블롯 혼성화 각각에 의해 분석하였다. 추출된 cccDNA 를 85℃ 에서 5 분 동안 열 변성시키고, 이후 EcoR I 에 의해 선형화한 후, 서던 블롯 분석 (하부 패널) 하였다.
도 13. 부가적인 HepBHAe 세포 클론 중의 HA-HBeAg 의 cccDNA-의존성 발현.
선택된 HepBHAe 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 96-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 처리 9 일 후에 수확된 상청액 샘플을 HA-표지된 HBeAg 검출을 위한 화학발광 면역검정 (CLIA) 에 적용하였다.
하기 실시예는 본 발명을 설명한다.
실시예 1: B 형 간염 바이러스 공유결합 폐환형 DNA-의존성 에피토프-표지된 e 항원을 유도적으로 발현하는 배양된 세포주, 및 항바이러스 성분을 스크리닝하기 위한 이의 용도
재료 및 방법
플라스미드
시작 코돈 녹아웃 (knockout) 을 가진 인간 인플루엔자 헤마글루티닌 (HA) 융합 프리코어 개방 판독 프레임을 함유하는 테트라사이클린-유도성 HBV 복제 벡터를 구축하기 위해, 프리코어 ORF 중의 nt 1816(A) 의 결실 및 HA-표지 서열의 삽입이 있는 다운스트림 HBV 단편 (유전자형 D, 하위유형 ayw, nt 1805-2335) 및 CMV-IE 프로모터의 TATA 박스 모티프를 함유하는 DNA 단편을 Genscript Inc 에 의해 화학적으로 합성하였다. 상기 DNA 단편 내에, SacI 제한 효소 부위가 5' 말단에 존재하고, 진정한 BspEI 제한 부위가 3' 말단에 존재한다. 벡터 pTREHBV-HAe 는 합성된 DNA 단편의 플라스미드 pTREHBVDES 중의 SacI/BspEI 제한 부위 내로의 삽입을 통해 구축되었다. pTREHBV-HAe 의 완전한 서열을 SEQ ID NO. 35 에 나타낸다.
HA-융합된 프리코어 발현 벡터를 생성하기 위해, HA 서열 삽입이 있는 HBV nt 1816-2335 를 함유하는 PCR 단편을 프라이머 5'-ATTGGATCCACCATGCAACTTTTTCACCTCTGC-3' 및 5'-ACAGTAGTTTCCGGAAGTGTTGATAGGATAGGGG-3' 를 사용함으로써 pTREHBV-HAe 로부터 증폭시켰다. PCR 단편을 BamHI 및 BspEI 로 제한소화시키고, 프리코어 발현 벡터 (pcHBe) 중의 동일한 제한 부위 내에 삽입하여 플라스미드 pcHA-HBe 를 산출하였다. pcHA-HBe 의 완전한 서열을 SEQ ID NO. 39 에 나타낸다.
세포 배양
HBV 복제를 지지하는 간모세포종 세포주인 HepG2 세포 (ATCC® HB-8065™) 를 ATCC 로부터 입수하였다. HBV DNA 및 cccDNA 를 유도적으로 발현하는 HepG2-유래된 HepDES19 세포주가 이전에 기재되어 있다 (7). 세포주를 10% 우태 혈청, 100 U/ml 페니실린, 및 100 ㎍/ml 스트렙토마이신이 보충된 둘베코 개질된 이글 배지 (DMEM)-F12 배지 (Cellgro) 에 유지시켰다.
HepBHAe 세포주를 확립시키기 위해, HepG2 세포를 Tet-반응성 전사 활성화제 및 플라스미드 pTREHBV-HAe 를 발현하는 플라스미드 pTet-오프 (Clontech) 로 트랜스펙션시키고, 여기서 개질된 HBV pgRNA 의 전사는 테트라사이클린-반응성 요소가 있는 CMV-IE 프로모터에 의해 제어된다. 트랜스펙션된 HepG2 세포를 1 ㎍/ml 테트라사이클린의 존재 하에 500 ㎍/ml G418 로 선별하였다. G418-저항성 콜로니를 고르고, 세포주로 팽창시켰다. 테트라사이클린-불포함 배지에서 세포를 배양함으로써 HBV 복제를 유도시켰고, 바이러스 DNA 복제 중간체의 수준을 서던 블롯 혼성화에 의해 측정하였다. HBV 복제 수준이 높은 세포주를 선택하고, 상이한 클론 번호를 가진 HepBHAe 로서 지정하였다.
HA-표지된 HBeAg 안정한 발현 세포주 HepHA-HBe 를 pcHA-HBe 플라스미드로의 HepG2 세포의 트랜스펙션에 의해 생성시키고, 콜로니를 500 ㎍/ml G418 로 선별하고, 양성 콜로니를 항-HA 웨스턴 블롯 분석에 의해 확인하였다.
HepBHAe 및 HepHA-HBe 안정한 세포주를 500 ㎍/ml 의 G418 을 첨가하는 것을 제외하고는, HepG2 와 동일한 방식으로 배양하였다. HepBHAe 세포의 경우, 테트라사이클린을 HBV pgRNA 전사를 억제하기 위해 유지 동안 1 ㎍/ml 로 정규적으로 첨가하였다.
세포 트랜스펙션
세포 (~1.0x106) 를 항생제-불포함 DMEM/F12 배지 중의 콜라겐 코팅된 35-mm-직경 디쉬에 시딩하였다. 밤새 인큐베이션 후, 각각의 웰을 제조자의 지침에 따라 Lipofectamine 2000 (Life Technologies) 과 함께 총 4 ㎍ 플라스미드로 트랜스펙션하였다. 트랜스펙션된 세포 또는 상청액 샘플을 지시된 시점에 수확하였다.
바이러스 핵산 분석
총 세포 RNA 를 TRIzol 시약 (Life Technologies) 으로 제조자의 프로토콜에 따라 추출하였다. 캡시드화 바이러스 pgRNA 를 하기와 같이 정제하였다: 하나의 12-웰 플레이트 웰로부터의 세포를 10 mM Tris-HCl (pH 8.0), 1 mM EDTA, 1% NP-40, 및 50 mM NaCl 을 함유하는 250 ㎕ 의 용해 완충액 중에서 37℃ 에서 10 분 동안 용해하고, 핵을 원심분리에 의해 제거하였다. 샘플을 6 U 의 마이크로코칼 뉴클레아제 및 15 ㎕ 의 100 mM CaCl2 과 함께 인큐베이션시키고, 15 분 동안 37℃ 에서 인큐베이션시켜, 자유 핵산을 소화시켰다. 캡시드화 바이러스 pgRNA 를 제조자의 프로토콜에 따라 750 ㎕ TRIzol LS 시약 (Invitrogen) 을 첨가함으로써 추출하였다. RNA 샘플을 2.2 M 포름알데히드를 함유하는 1.5% 아가로오스 젤을 통해 전기영동시키고, 20X SSC 완충액 (1X SSC 는 0.15 M NaCl + 0.015 M 나트륨 시트레이트임) 중의 Hybond-XL 멤브레인 (GE Healthcare) 상에 이동시켰다.
세포질 바이러스 코어 DNA 를 하기와 같이 추출하였다: 하나의 35-mm 직경 디쉬로부터의 세포를 10 mM Tris-HCl, pH 8.0, 10 mM EDTA, 1% NP40 및 2% 수크로오스를 함유하는 0.5 ml 의 용해 완충액으로 37℃ 에서 10 분 동안 용해하였다. 세포 잔해 및 핵을 원심분리에 의해 제거하고, 상청액을 3 ㎕ 의 1 M Mg(OAc)2 및 5 ㎕ 의 10 mg/ml DNase I (Calbiochem) 로 30 분 동안 37℃ 에서 인큐베이션하였다. 이후 상청액을 뉴클레오캡시드 침전을 위해 15 ㎕ 의 0.5 M EDTA, 및 1.5 M NaCl 을 함유하는 130 ㎕ 의 35% 폴리에틸렌 글리콜 (PEG) 8000 과 혼합하였다. 빙상에서 1 시간 동안 인큐베이션 후, 바이러스 뉴클레오캡시드를 10,000 rpm 에서 5 분 동안 4℃ 에서 원심분리에 의해 펠렛화한 다음, 37℃ 에서 1 시간 동안 0.5 mg/ml 프로나아제 (Calbiochem), 0.5% 나트륨 도데실 술페이트 (SDS), 100 mM NaCl, 25 mM Tris-HCl (pH 7.4), 및 10 mM EDTA 를 함유하는 400 ㎕ 의 소화 완충액 중에서 소화시켰다. 소화 혼합물을 페놀로 추출하고, DNA 를 에탄올로 침전시키고, TE (10 mM Tris-HCl, pH 8.0, 1 mM EDTA) 완충액에 용해시켰다. 각 플레이트로부터의 코어 DNA 샘플의 1/3 을 전기영동에 의해 1.2% 아가로오스 겔 내로 분해하였다. 이후 겔을 0.2N HCl 을 함유하는 완충액 중의 탈퓨린화, 0.5 M NaOH 및 1.5 M NaCl 을 함유하는 용액 중에서의 변성, 및 1 M Tris-HCl (pH 7.4) 및 1.5 M NaCl 을 함유하는 완충액 중에서의 중화에 적용하였다. DNA 를 이후 20X SSC 완충액 중의 Hybond-XL 멤브레인 상에 블롯팅하였다.
단백질-불포함 바이러스 DNA (cccDNA 및 단백질-불포함 rcDNA) 의 추출을 변형된 Hirt 추출 절차를 사용하여 수행하였다 (4, 8). 간략하게는, 하나의 35-mm 직경 디쉬로부터의 세포를 3 ml 의 10 mM Tris-HCl (pH 7.5), 10 mM EDTA, 및 0.7% SDS 중에 용해하였다. 실온에서의 30 분 인큐베이션 후, 용해액을 15-ml 튜브 내로 이동시키고, 이 단계 후에 0.8 ml 의 5 M NaCl 을 첨가하고 4℃ 에서 밤새 인큐베이션시켰다. 용해액을 이후 30 분 동안 4℃ 에서 10,000 rpm 에서의 원심분리에 의해 정화시키고, 페놀로 2 회 및 페놀:클로로포름:이소아밀 알코올 (25:24:1) 로 1 회 추출하였다. DNA 를 실온에서 밤새 에탄올 중에서 침전시키고, TE 완충액에 용해하였다. 단백질-불포함 DNA 샘플의 1/3 을 이후 1.2% 아가로오스 겔 내에 분해하고 Hybond-XL 멤브레인 상에 이동시켰다.
HBV RNA 및 DNA 의 검출을 위해, 멤브레인을 [α-32P]UTP (800 Ci/mmol; Perkin Elmer)-라벨링된 양성- 또는 음성- 가닥-특이적 전체-길이 HBV 리보탐침으로 탐침하였다. 혼성화를 5 ml 의 EKONO 혼성화 완충액 (Genotech) 에서 수행하였는데, 65℃ 에서 1 시간 동안의 예비혼성화 및 65℃ 에서 밤새 혼성화 후, 0.1X SSC 및 0.1% SDS 중에 65℃ 에서 1 시간 동안 세척하였다. 멤브레인을 인광이미지기 (phosphorimager) 스크린에 노출시키고, 혼성화 신호를 Typhoon FLA-7000 system (GE Healthcare) 에 의해 검출하였다.
웨스턴 블롯 분석
35 mm 디쉬 중의 세포를 PBS 완충액으로 1 회 세척하고, 500 ㎕ 의 1X Laemmli 완충액에 용해하였다. 총 50 ㎕ 의 세포 용해액을 SDS-12% 폴리아크릴아미드 겔 상에 분해하고, 폴리비닐리덴 디플루오라이드 멤브레인 (Millipore) 상에 옮겼다. 멤브레인을 Western Breeze 차단 완충액 (Life Technologies) 으로 차단하고, HBcAg (aa170-183), HA-표지 (Sigma-Aldrich, 클론 M2), β-액틴 (Sigma-Aldrich) 에 대항하는 항체로 탐침하였다. 결합된 항체를 IRDye 이차 항체에 의해 밝혀냈다. 면역블롯 신호는 Li-COR Odyssey 시스템으로 가시화되고 정량화되었다.
면역침전
하나의 35-mm 직경 디쉬로부터의 세포를 10 mM Tris-HCl, pH 8.0, 10 mM EDTA, 1% NP40, 2% 수크로오스 및 1X 프로테아제 저해제 칵테일 (G-biosciences) 을 함유하는 0.5 ml 의 용해 완충액으로 용해하였다. 세포 잔해를 제거하기 위한 원심분리 후, 정화된 세포 용해액을 50 ㎕ 의 Ezview Red Anti-HA (Sigma-Aldrich) 와 함께 4℃ 에서 부드럽게 회전시키면서 밤새 인큐베이션시켰다. 하나의 35-mm 직경 디쉬 (총 1 ml) 로부터의 0.5 ml 의 배지 샘플을 면역침전에 직접 적용하였다. 비드를 TBS 완충액 (0.15 M NaCl, 0.05 M Tris-HCl [pH 7.4]) 으로 3 회 4℃ 에서 세척하였다. 펠렛화된 비드를 Laemmli 완충액으로의 단백질 샘플 제조에 적용하였다. 면역침전된 HA-표지된 단백질을 HA-표지에 대항하는 항체 (Sigma-Aldrich) 를 사용하는 웨스턴 블롯에 의해 검출하였다.
HA-표지된 HBeAg 의 검출을 위한 ELISA
HA-표지된 HBeAg 의 화학발광 효소 면억검정 (CLIA) 검출을 위해, 고 민감성 스트렙타비딘 코팅된 플레이트 (Black, cat#: 15525, Thermo Scientific) 를 PBST (PBS + 0.05% Tween 20) 로 3 회 세척한 다음, 50 ㎕ 의 항-HA-비오틴 (cat#: A00203, Genscript; PBS 중 5 ㎍/ml) 과 함께 RT 에서 30 분 동안 인큐베이션시킨 후, 200 ㎕ PBST 로 3 회 세척하였다. 세척 완충액의 제거 후, 50 ㎕ 의 배양 상청액 샘플을 ELISA 웰에 첨가하고, RT 에서 30 분 동안 인큐베이션한 후, 200 ㎕ PBST 로 3 회 세척하였다. 이후 50 ㎕ 의 호스래디쉬 퍼옥시다아제 (HRP)-접합된 항-HBe 항체 (HBeAg CLIA 키트, cat#: CL0312-2, Autobio Diagnostics) 를 웰에 첨가하고, RT 에서 30 분 동안 인큐베이션하였다. 200 ㎕ PBST 로 5 회 세척 후, CLIA 키트로부터의 25 ㎕ 의 각각의 기질 A 및 B 를 첨가하고, 플레이트를 10 초 동안 부드럽게 교반시켰다. 플레이트를 광도계 (luminometer) 상에서 판독하였다.
HA-표지된 HBeAg 의 AlphaLISA 검출을 위해, 항-HA-비오틴 (cat#: A00203, Genscript) 을 1X 검정 완충액 (25mM HEPES, 0.1M NaCl, 0.1% BSA, pH7.4) 중에서 2 ㎍/ml 로 희석하고, Proxiplate-384 HS (cat#: 6008279, Perkin Elmer) 의 각각의 웰 내에 5 ㎕ 분배하였다. 이후 5 ㎕ 의 배양액 샘플을 웰에 첨가하고 부드럽게 혼합한 후, RT 에서 30 분 동안 인큐베이션하였다. 후속하여, 5 ㎕ 의 0.2 ㎍/ml 항-HBe (클론 29, Lot 20110305, Autobio Diagnostics) 를 첨가하고 부드럽게 혼합한 후, RT 에서 30 분 동안 인큐베이션하였다. 이후, 검정 용액을 5 ㎕ 의 희석된 항-마우스 IgG AlphaLISA 수용체 비드 (cat#: AL105C, Perkin Elmer) (125 ㎍/ml) 와 혼합하고, RT 에서 30 분 동안 인큐베이션한 후, 5 ㎕ 의 AlphaScreen Streptavidin 기증자 비드 (cat#: 6760002S, Perkin Elmer) (125 ㎍/ml) 와 RT 에서 1 시간 동안 인큐베이션하였다. 인큐베이션 후, 플레이트를 Envision 2104 Multilabel 판독기 (Perkin Elmer) 상에서 판독하였다.
결과
본원에 제공되는 것은 이식유전자로부터의 HA-표지된 HBeAg (HA-HBeAg) 및 HBV cccDNA 를 각각 발현하기 위한 신규한 세포주의 2 가지 유형이고, 화학발광 면역검정 및 AlphaLISA 검정에 의해 재조합 HBeAg 를 검출하기 위한 방법이다. 세포주 및 검정은 HBV cccDNA 수준 및/또는 침묵 cccDNA 전사를 감소시키는 화합물의 고 처리량 스크리닝에 적합하다.
작은 컴팩트 HBV DNA 게놈 크기 및 중첩된 게놈 조직은 트랜스펙션된 세포 중의 바이러스 DNA 복제 및 후속 cccDNA 형성에 영향을 주지 않으면서 리포터 유전자의 삽입을 제한한다.
프리코어/HBeAg 는 HepDE19 세포 내에 cccDNA-의존성 방식으로 조작될 수 있다 (3). 당업계에는 HBV 게놈이 중첩된 ORF 및 복합 시스 요소를 나타내는 고도로 컴팩트한 유전자 조직을 갖는다는 것이 알려져 있다. 그러므로, 유전자 삽입/결실 또는 서열 대체가 바이러스 DNA 복제에 매우 영향을 줄 가능성이 있다고 여겨졌다. 이전의 연구에서는 HBV 서열, 예컨대 외피 코딩 부위를 대부분의 경우에서, GFP 에 의해 대체하여 재조합 HBV 게놈을 제조했으나, 바이러스 단백질의 트랜스-보체 (trans-complement) 가 바이러스 복제 및 비리온 어셈블리를 지지하는데 필요했다 (Protzer, et al, PNAS (1999), 96: 10818-23.). 게다가, 이들 보고된 재조합 HBV 게놈은 허용 세포를 감염시키는데 사용된 경우 오직 첫 번째 라운드의 cccDNA 합성만을 만들 수 있고, cccDNA 의 세포내 증폭은 결함 바이러스 DNA 복제로 인해 차단된다.
상기 종래의 지식에도 불구하고, 프리코어 개방 판독 프레임 (ORF) 내의 인-프레임 융합된 짧은 외인성 에피토프 표지가 HBV 게놈에 의해 용인되고 cccDNA 주형으로부터 발현될 수 있어, 표지-특이적 항체 및 HBeAg 항체의 쌍이 ELISA 검출의 특이성을 상당히 개선시킬 것이라는 것이 본원에서 시도되었고 추론되었다.
인간 인플루엔자 헤마글루티닌 (HA) 융합된 프리코어 개방 판독 프레임을 가진 테트라사이클린-유도성 HBV 복제 벡터를 구축하기 위해, HA-표지-함유 DNA 서열 (gtggacatcTACCCATACGACGTTCCAGATTACGCTggc; SED ID NO.: 41) 을 HBV 발현 벡터 pTREHBVDES 중의 코어 ORF 의 시작 코돈에 인접한 인-프레임 업스트림 위치 내로 삽입하고, 여기서 HBV pgRNA 발현은 테트라사이클린 (tet) 조절된 CMV-IE 프로모터에 의해 Tet-오프 방식으로 지배된다. HA-표지 (상부 경우에) 의 측면위치 서열 (하부 경우에) 을 HBV 게놈의 줄기 루프 구조 (엡실론, ε) 및 코어 ORF 시작 코돈의 코작 모티프의 염기 짝지음을 유지하도록 설계하였다 (도 1). 수득된 재조합 플라스미드를 pTREHBV-HAe (SEQ ID NO: 35) 로 지정하였다. HA-표지 삽입 외에, 플라스미드 pTREHBV-HAe 는 프리코어 ORF 의 5' 말단 시작 코돈 중의 점 결실 (ATG 에서 TG) 을 함유하며, 이에 의해 플라스미드 주형 내의 HBV 게놈으로부터의 프리코어의 발현을 방해한다. 부가적으로, HBV 감염성 입자의 생성을 차단하기 위해 2 개의 탠덤 정지 코돈을 소 (S) 외피 단백질 (217TTGTTG222 에서 217TAGTAG222; 돌연변이는 밑줄쳐짐) 의 아미노 말단의 코딩 부위 내로 도입하였다.
에피토프-표지된 HBV 프리코어 단백질 발현 및 HBeAg 분비의 실현가능성을 시험하기 위해, HA-표지-함유 DNA 서열을 프리코어 발현 플라스미드 pcHBe 내의 상기 기재된 바와 같은, 동일한 바이러스 DNA 위치 내로 삽입하였고, 구축물을 pcHA-HBe (SEQ ID NO: 39) 로 지정하였다. HepG2 세포 중의 pcHA-HBe 의 트랜스펙션은 HA-표지된 프리코어 단백질의 세포내 발현 및 HA-표지된 HBeAg 의 세포외 축적을 야기하였고 (도 2), 따라서 프리코어 단백질 내로의 HA 표지의 삽입이 프리코어 발현, 후-번역 프로세싱, 및 HBeAg 분비에 영향을 주지 않는다는 것을 확인시켰다. HA-표지된 HBeAg (HA-HBeAg) 의 검출을 위한 화학발광 ELISA 및 AlphaLISA 가, 재료 및 방법 섹션에서 기재된 바와 같이, 또한 구축되었다.
상기에 따르면, HA-표지된 HBeAg 를 구성적으로 발현하는 세포주를 pcHA-HBe 를 HepG2 세포 내로 안정적으로 트랜스펙션함으로써 확립시켰다. HA-표지된 HBeAg 발현 수준이 높은 2 개의 클론을 AlphaLISA 검정을 통해 선별하고, 각각 HepHA-HBe4 및 HepHA-HBe47 로 지정하였다 (도 3).
재조합 HBV 플라스미드 pTREHBV-HAe 는 pTREHBVDES 가 일시적 트랜스펙션 검정에서 복제했던 것에 필적하는 수준까지 HBV DNA 를 복제할 수 있어 (도 4), HA-표지 삽입이 HBV 게놈 복제에 의해 용인되었다는 것을 제시하였다. 이후, pTREHBV-HAe 를 pTET-오프 (Clontech) 와 함께 HepG2 세포 내로 안정적으로 공동-트랜스펙션하여, 테트라사이클린 유도성 HBV 세포주를 만들었다. 이론적으로는, 이러한 세포주에서, 유도시, 프리코어 단백질 및 이의 유도체 HBeAg 가 프리코어 ORF 시작 코돈의 침묵으로 인해 이식유전자로부터 제조되지 않을 것이다. 전사된 pgRNA 는 바이러스 코어 단백질 및 중합효소를 발현하고 역전사를 개시하여 rcDNA 를 생성시켜, 세포내 증폭 경로를 통해 cccDNA 형성을 초래할 것이다. pgRNA 의 3' 중복에의 불완전한 프리코어 ORF 의 시작 코돈이 바이러스 DNA 서열 내로 카피될 것이고, HA-표지된 프리코어의 미손상 ORF 는 rcDNA 의 cccDNA 로의 전환 동안 재구성될 것이다. 따라서, HA-프리코어 mRNA 는 오로지 cccDNA 로부터 전사되어, 분비된 HA-표지된 HBeAg 를 핵내 cccDNA 에 대한 대리 마커로 만들 수 있다 (도 5).
테트라사이클린-의존적 방식으로 높은 수준의 HBV DNA 복제를 지지하는 5 개의 세포주 (HepBHAe1, HepBHAe13, HepBHAe34, HepBHAe45, HepBHAe82) 를 수득하였다 (도 6 및 7).
대표적인 계통 HepBHAe13 세포에서, 복제형 DNA 중간체 및 cccDNA 를 포함하는 바이러스 생성물의 합성 및 축적의 시간-의존적 동역학을, 테트라사이클린 철회시 관찰하였다. HepBHAe13 세포의 배양액에서, HA-표지된 HBeAg 를 또한 테트라사이클린의 제거 6 일 후에 웨스턴 블롯에 의해 검출하였고, 항원 수준은 그 후에 점차적으로 증가하였다. HA-표지된 HBeAg (HA-HBeAg) 의 수준은 바이러스 코어 DNA 및 cccDNA 의 세포내 수준에 비례하였다 (도 6). HepBHAe 세포주로부터 생성된 cccDNA 의 진위성을 열 변성 및 추가의 제한 효소 소화에 의해 확인하였다 (도 8). 그러므로, 프리코어 중의 HA-표지 삽입이 있는 재조합 HBV 의 DNA 복제 및 cccDNA 형성을 지지하는 유도성 세포주가 성립되었다.
배양된 HepBHAe 세포로부터의 상청액 샘플에 대한 AlphaLISA 검정은 16-일 시간 경과 연구에서 HA-표지된 HBeAg 의 증가된 수준을 입증하였다 (도 9). 추가 입증을 위해 HepHBAe13 세포를 선택하였다. 세포를 다음 3 가지 조건 하에 배양하였다: 1) 이식유전자 발현을 억제하기 위해 테트라사이클린의 존재 하; 2) 바이러스 DNA 복제를 유도하기 위해 테트라사이클린의 부재 하; 3) 바이러스 DNA 복제 및 후속 cccDNA 형성을 차단하기 위해 테트라사이클린의 부재 하, 그러나 3TC 처리 하. 화학발광 면역검정 (CLIA) 은 cccDNA 확립 및 유전자 발현의 결과로서, 배양 배지 중의 HA-표지된 HBeAg 신호가 테트라사이클린 철회 6 일 후에 나타나고, 이후 점차적으로 증가하였다는 것을 보여주었다. 예상되는 바와 같이, HA-HBeAg 는 테트라사이클린의 존재 하 또는 3TC 처리 (tet-) 하의 임의의 시점에서 배양액에서 검출되지 않았다 (도 10). 게다가, 2 개의 이전에 확인된 cccDNA 형성 저해제, 구체적으로 CCC-0975 및 CCC-0346 (3) 은, HepBHAe13 세포로부터 HA-HBeAg 생성의 용량-의존적 저해를 나타냈다 (도 11). 그러므로, HA-표지된 HBeAg 의 생성은 HepBHAe13 세포에서 cccDNA-의존적이다.
추가로, HepBHAe1, HepBHAe45 및 HepBHAe82 를 포함하는 다른 HepBHAe 세포주의 시간 경과 연구는, 테트라사이클린 철회시 HBV mRNA, 세포질 코어 DNA 및 핵 cccDNA 의 시간-의존적 축적을 입증하였다 (도 12). 도 13 에서 나타낸 바와 같이, cccDNA-의존적 HA-표지된 HBeAg 생성은 이러한 3 개 추가적인 HepBHAe 세포주에서 검증되었다.
종합하여, 여기서 본원에서 기재한 HA-HBeAg 검출 방법으로의 항바이러스 화합물 스크리닝에서 HBV cccDNA 에 대한 대리 마커로서 역할할 수 있는, HBV cccDNA-의존적 HA-표지된 HBeAg 를 발현하는 신규한 유도성 세포주가 확립되었다.
본 발명은 하기의 뉴클레오티드 및 아미노산 서열을 나타낸다:
본원에 제공된 서열은 NCBI 데이터베이스에서 이용가능하며 ncbi.nlm.nih.gov/sites/entrez?db=gene 에서의 월드 와이드 웹으로부터 검색될 수 있고; 이들 서열은 또한 주석이 달리고 변형된 서열에 관한 것이다. 본 발명은 또한 상동 서열, 및 본원에 제공된 축약 서열의 변이체가 사용되는 방법 및 기법을 제공한다. 바람직하게는, 이러한 "변이체" 는 유전적 변이체이다.
SEQ ID No. 1:
헤마글루티닌 (HA) 표지를 인코딩하는 뉴클레오티드 서열
TACCCATACGACGTTCCAGATTACGCT
SEQ ID No. 2:
His-표지를 인코딩하는 뉴클레오티드 서열
CATCATCATCATCATCAC
SEQ ID No. 3:
Flag-표지를 인코딩하는 뉴클레오티드 서열
GACTACAAGGACGACGACGACAAG
SEQ ID No. 4:
c-myc-표지를 인코딩하는 뉴클레오티드 서열
ATG GCA TCA ATG CAG AAG CTG ATC TCA GAG GAG GAC CTG
SEQ ID No. 5:
V5-표지를 인코딩하는 뉴클레오티드 서열
GGT AAG CCT ATC CCT AAC CCT CTC CTC GGT CTC GAT TCT ACG
SEQ ID No. 6:
C9-표지를 인코딩하는 뉴클레오티드 서열
ACTGAAACATCTCAAG표지CTCCAGCT
SEQ ID No. 7:
3xFlag-표지를 인코딩하는 뉴클레오티드 서열
GACTACAAAGACCACGACGGTGACTACAAAGACCACGACATCGACTACAAGGACGACGACGACAAG
SEQ ID No. 8:
HA 표지의 아미노산 서열
YPYDVPDYA
SEQ ID No. 9:
His-표지의 아미노산 서열
HHHHHH
SEQ ID No. 10:
Flag-표지의 아미노산 서열
DYKDDDDK
SEQ ID No. 11:
c-myc-표지의 아미노산 서열
EQKLISEEDL
SEQ ID No. 12:
V5-표지의 아미노산 서열
GKPIPNPLLGLDST
SEQ ID No. 13:
C9-표지의 아미노산 서열
TETSQVAPA
SEQ ID No. 14:
3xFlag-표지의 아미노산 서열
DYKDHDGDYKDHDIDYKDDDDK
SEQ ID No. 15:
B 형 간염 바이러스 프리코어 단백질을 인코딩하는 뉴클레오티드 서열
프리코어 ORF 서열:
SEQ ID No. 16:
B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 뉴클레오티드 서열
HBeAg DNA 서열:
SEQ ID No. 17:
B 형 간염 바이러스 프리코어 단백질의 아미노산 서열
프리코어 아미노산 서열:
SEQ ID No. 18:
B 형 간염 바이러스 e 항원 (HBeAg) 의 아미노산 서열
HBeAg 아미노산 서열 (프리코어로부터 N-말단 신호 펩티드 (19 aa) 및 C-말단 아르기닌-풍부 도메인 (34 aa) 을 제거함):
SEQ ID No. 19:
HA-표지된 B 형 간염 바이러스 프리코어 단백질을 인코딩하는 뉴클레오티드 서열
HA-표지된 프리코어 DNA 서열:
SEQ ID No. 20:
HA-표지된 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 뉴클레오티드 서열
HA-표지된 HBeAg DNA 서열:
SEQ ID No. 21:
HA-표지된 B 형 간염 바이러스 프리코어 단백질의 아미노산 서열. HA-표지는 밑줄쳐 있다.
HA-표지된 프리코어 아미노산 서열:
SEQ ID No. 22:
HA-표지된 B 형 간염 바이러스 e 항원 (HBeAg) 의 아미노산 서열. HA-표지는 밑줄쳐 있다.
HA-표지된 HBeAg 아미노산 서열:
SEQ ID No. 23:
HBV 코어 단백질을 인코딩하는 뉴클레오티드 서열
SEQ ID No. 24:
HBV 코어 단백질의 아미노산 서열
SEQ ID No. 25:
HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 뉴클레오티드 서열
SEQ ID No. 26:
헤파드나바이러스 게놈의 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 뉴클레오티드 서열
GTGGACATC
SEQ ID No. 27:
HBV 게놈, HBV 유전자형 D, 하위유형 ayw 의 뉴클레오티드 서열. Genbank 접근 번호 U95551(C1902 및 A1903 은 굵은 글씨체이다. 프리코어의 ORF 는 밑줄쳐 있다)
SEQ ID No. 28:
HBV 게놈, HBV 유전자형 A 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007263)
SEQ ID No. 29:
HBV 게놈, HBV 유전자형 B 의 뉴클레오티드 서열 (Genbank 접근 번호 AB602818)
SEQ ID No. 30:
HBV 게놈, HBV 유전자형 C 의 뉴클레오티드 서열 (Genbank 접근 번호 AB540584)
SEQ ID No. 31:
HBV 게놈, HBV 유전자형 E 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007262)
SEQ ID No. 32:
HBV 게놈, HBV 유전자형 F 의 뉴클레오티드 서열 (Genbank 접근 번호 HE974366)
SEQ ID No. 33:
HBV 게놈, HBV 유전자형 G 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007264)
SEQ ID No. 34:
HBV 게놈, HBV 유전자형 H 의 뉴클레오티드 서열 (Genbank 접근 번호 AB516393)
SEQ ID No. 35:
벡터의 뉴클레오티드 서열: pTREHBV-HAe (5,980nt)
벡터: pTRE2(Clontech)
nt 356-452: HBV nt 1805-1902 (A1816 결실)
nt 453-491: 측면위치 서열을 사용한 HA-표지 삽입
nt 462-488: HA-표지 서열
nt 492-3761: HBV nt 1903-3182/1-1990
SEQ ID No. 36:
HBV 외피 단백질, 대 표면 단백질 (L) 을 인코딩하는 뉴클레오티드 서열
SEQ ID No. 37:
HBV 외피 단백질, 중 표면 단백질 (M) 을 인코딩하는 뉴클레오티드 서열
SEQ ID No. 38:
HBV 외피 단백질, 소 표면 단백질 (S) 을 인코딩하는 뉴클레오티드 서열
SEQ ID No. 39:
발현 벡터 pcHA-HBe (6,682nt) 의 뉴클레오티드 서열
벡터: pcDNA3.1/V5-His-TOPO (Invitrogen)
nt 929-1015: HBV nt1816-1902
nt 1016-1054: 삽입
nt 1025-1051: HA-표지 서열
nt 1055-2112: HBV 1903-2605/1573-1926
SEQ ID No. 40:
표지에 대한 아미노산 서열 N-말단
VDI
SEQ ID No. 41:
5'- 및 3'- 추가적 뉴클레오티드를 포함하는 HA-표지를 인코딩하는 뉴클레오티드 서열. 밑줄친 뉴클레오티드는 HA-표지를 인코딩하는 서열을 나타낸다.
GTGGACATCTACCCATACGACGTTCCAGATTACGCTGGC.
SEQ ID No. 42:
N-말단 및 C-말단 추가적 아미노산을 포함하는 HA-표지의 아미노산 서열. 밑줄친 아미노산 잔기는 HA-표지의 서열을 나타낸다.
VDIYPYDVPDYAG
본원에서 토의한 바와 같은 추가적 참고문헌
1. Arzumanyan, A., H. M. Reis, and M. A. Feitelson. 2013. Pathogenic mechanisms in HBV- and HCV-associated hepatocellular carcinoma. Nature reviews. Cancer 13:123-135.
2. Block, T. M., H. Guo, and J. T. Guo. 2007. Molecular virology of hepatitis B virus for clinicians. Clin Liver Dis 11:685-706, vii.
3. Cai, D., C. Mills, W. Yu, R. Yan, C. E. Aldrich, J. R. Saputelli, W. S. Mason, X. Xu, J. T. Guo, T. M. Block, A. Cuconati, and H. Guo. 2012. Identification of disubstituted sulfonamide compounds as specific inhibitors of hepatitis B virus covalently closed circular DNA formation. Antimicrob Agents Chemother 56:4277-4288.
4. Cai, D., H. Nie, R. Yan, J. T. Guo, T. M. Block, and H. Guo. 2013. A southern blot assay for detection of hepatitis B virus covalently closed circular DNA from cell cultures. Methods Mol Biol 1030:151-161.
5. Galibert, F., E. Mandart, F. Fitoussi, and P. Charnay. 1979. Nucleotide sequence of the hepatitis B virus genome (subtype ayw) cloned in E.coli. Nature 281:646-650.
6. Gish, R. G., A. S. Lok, T. T. Chang, R. A. de Man, A. Gadano, J. Sollano, K. H. Han, Y. C. Chao, S. D. Lee, M. Harris, J. Yang, R. Colonno, and H. Brett-Smith. 2007. Entecavir therapy for up to 96 weeks in patients with HBeAg-positive chronic hepatitis B. Gastroenterology 133:1437-1444.
7. Guo, H., D. Jiang, T. Zhou, A. Cuconati, T. M. Block, and J. T. Guo. 2007. Characterization of the intracellular deproteinized relaxed circular DNA of hepatitis B virus: an intermediate of covalently closed circular DNA formation. J Virol 81:12472-12484.
8. Hirt, B. 1967. Selective extraction of polyoma DNA from infected mouse cell cultures. J Mol Biol 26:365-369.
9. Hoofnagle, J. H., E. Doo, T. J. Liang, R. Fleischer, and A. S. Lok. 2007. Management of hepatitis B: summary of a clinical research workshop. Hepatology 45:1056-1075.
10. Ito, K., K. H. Kim, A. S. Lok, and S. Tong. 2009. Characterization of genotype-specific carboxyl-terminal cleavage sites of hepatitis B virus e antigen precursor and identification of furin as the candidate enzyme. J Virol 83:3507-3517.
11. Ladner, S. K., M. J. Otto, C. S. Barker, K. Zaifert, G. H. Wang, J. T. Guo, C. Seeger, and R. W. King. 1997. Inducible expression of human hepatitis B virus (HBV) in stably transfected hepatoblastoma cells: a novel system for screening potential inhibitors of HBV replication. Antimicrob Agents Chemother 41:1715-1720.
12. Liang, T. J. 2009. Hepatitis B: the virus and disease. Hepatology 49:S13-21.
13. Liu, N., L. Ji, M. L. Maguire, and D. D. Loeb. 2004. cis-Acting sequences that contribute to the synthesis of relaxed-circular DNA of human hepatitis B virus. J Virol 78:642-649.
14. McMahon, B. J. 2014. Chronic hepatitis B virus infection. The Medical clinics of North America 98:39-54.
15. Nassal, M. 2008. Hepatitis B viruses: reverse transcription a different way. Virus Res 134:235-249.
16. Pawlotsky, J. M., G. Dusheiko, A. Hatzakis, D. Lau, G. Lau, T. J. Liang, S. Locarnini, P. Martin, D. D. Richman, and F. Zoulim. 2008. Virologic monitoring of hepatitis B virus therapy in clinical trials and practice: recommendations for a standardized approach. Gastroenterology 134:405-415.
17. Protzer, U., M. Nassal, P. W. Chiang, M. Kirschfink, and H. Schaller. 1999. Interferon gene transfer by a hepatitis B virus vector efficiently suppresses wild-type virus infection. Proc Natl Acad Sci U S A 96:10818-10823.
18. Quasdorff, M., and U. Protzer. 2010. Control of hepatitis B virus at the level of transcription. J Viral Hepat 17:527-536.
19. Seeger, C., and W. S. Mason. 2000. Hepatitis B virus biology. Microbiol Mol Biol Rev 64:51-68.
20. Sells, M. A., M. Chen, and G. Acs. 1987. Production of hepatitis B virus particles in hepG2 cells transfected with cloned hepatitis B virus DNA. Proc. Natl. Acad. Sci. USA 84:1005-1009.
21. Wang, J., A. S. Lee, and J. H. Ou. 1991. Proteolytic conversion of hepatitis B virus e antigen precursor to end product occurs in a postendoplasmic reticulum compartment. J Virol 65:5080-5083.
22. Wang, Z., L. Wu, X. Cheng, S. Liu, B. Li, H. Li, F. Kang, J. Wang, H. Xia, C. Ping, M. Nassal, and D. Sun. 2013. Replication-competent infectious hepatitis B virus vectors carrying substantially sized transgenes by redesigned viral polymerase translation. PLoS One 8:e60306.
23. Zhou, T., H. Guo, J. T. Guo, A. Cuconati, A. Mehta, and T. M. Block. 2006. Hepatitis B virus e antigen production is dependent upon covalently closed circular (ccc) DNA in HepAD38 cell cultures and may serve as a cccDNA surrogate in antiviral screening assays. Antiviral Res 72:116-124.
24. Zoulim, F., and S. Locarnini. 2009. Hepatitis B virus resistance to nucleos(t)ide analogues. Gastroenterology 137:1593-1608 e1591-1592.
본원에 인용된 모든 참고문헌은 전체가 본원에 참조로 포함된다. 이제 발명을 완전히 기재하여, 발명의 취지 또는 범주 또는 이의 임의의 구현예에 영향을 주지 않고 본 발명이 조건, 매개변수 등의 넓고 동등한 범위 내에서 실행될 수 있다는 것이 당업자에 의해 이해될 것이다.
상기에 따르고 첨부된 특허청구범위에서 정해진 바와 같이, 본 발명은 특히 하기의 항목에 관한 것이다:
1. 하기 단계를 포함하는, 헤파드나바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법:
(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보 분자와 접촉시키는 단계;
(b) 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 단계; 및
(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보 분자를 선택하는 단계.
2. 항목 1 에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.
3. 항목 1 또는 2 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 방법.
4. 항목 3 에 있어서, 상기 표지가 6 내지 22 개의 아미노산으로 이루어지는 방법.
5. 항목 3 또는 4 에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 방법.
6. 항목 5 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 방법.
7. 항목 1 또는 2 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 방법.
8. 항목 7 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 방법.
9. 항목 7 또는 8 에 있어서, 상기 표지가 6 내지 22 개의 아미노산으로 이루어지는 방법.
10. 항목 7 내지 9 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA)-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 방법.
11. 항목 10 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 방법.
12. 항목 5 또는 10 에 있어서,
HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;
His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;
c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;
V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는
C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타내는 방법.
13. 항목 6 또는 11 에 있어서, 1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내고; 또는 3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타내는 방법.
14. 항목 5 또는 10 에 있어서,
HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;
His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;
c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;
V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는
C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타내는 방법.
15. 항목 6 또는 11 에 있어서,
1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내고; 또는
3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타내는 방법.
16. 항목 2 내지 15 중 어느 하나에 있어서, HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 16 에 나타내는 방법.
17. 항목 2 내지 15 중 어느 하나에 있어서, HBeAg 의 아미노산 서열을 SEQ ID NO: 18 에 나타내는 방법.
18. 항목 1 내지 17 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 방법.
19. 항목 18 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 방법.
20. 항목 18 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 방법.
21. 항목 1 내지 17 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 핵산 서열을 포함하고, 여기서 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 3' 다운스트림인 방법.
22. 항목 21 에 있어서, 하나 이상의 표지를 인코딩하는 상기 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 방법 .
23. 항목 1 내지 22 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 게놈을 포함하는 방법.
24. 항목 23 에 있어서, 상기 헤파드나바이러스 게놈이 B 형 간염 바이러스 (HBV) 게놈인 방법.
25. 항목 24 에 있어서, 상기 HBV 게놈이 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈인 방법.
26. 항목 24에 있어서, 상기 HBV 게놈이 HBV 유전자형 D 의 게놈인 방법.
27. 항목 26 에 있어서, 상기 HBV 유전자형 D 의 게놈이 HBV 하위유전자형 ayw 의 게놈인 방법.
28. 항목 1 내지 27 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 핵산이 헤파드나바이러스 코어 단백질를 인코딩하는 핵산의 5' 업스트림인 방법.
29. 항목 28 에 있어서, 헤파드나바이러스 코어 단백질이 HBV 코어 단백질인 방법.
30. 항목 29 에 있어서, HBV 코어 단백질을 인코딩하는 핵산을 SEQ ID NO: 23 에 나타내는 방법.
31. 항목 29 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 방법.
32. 항목 1 내지 31 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되는 방법.
33. 항목 32 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 방법.
34. 항목 33 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 방법.
35. 항목 1 내지 34 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 삽입되는 방법.
36. 항목 35 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 방법.
37. 항목 1 내지 36 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입되는 방법.
38. 항목 1 내지 37 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 방법.
39. 항목 38 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 방법.
40. 항목 38 또는 39 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 9 개 이하의 뉴클레오티드로 이루어지는 방법.
41. 항목 40 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 방법.
42. 항목 1 내지 41 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함하는 방법.
43. 항목 42 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 방법.
44. 항목 42 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 방법.
45. 항목 44 에 있어서, 상기 아미노산이 글리신 잔기인 방법.
46. 항목 42 내지 44 중 어느 하나에 있어서, 링커를 인코딩하는 상기 서열이 서열 GGC 로 이루어지거나; 상기 서열이 글리신 잔기를 인코딩하는 방법.
47. 항목 1 내지 46 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나;
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 방법.
48. 항목 1 내지 47 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 방법.
49. 항목 48 에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.
50. 항목 2 내지 49 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 방법.
51. 항목 2 내지 50 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 방법.
52. 항목 2 내지 51 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 방법.
53. 항목 2 내지 52 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미논산 서열을 SEQ ID NO: 21 에 나타내는 방법.
54. 항목 24 내지 53 중 어느 하나에 있어서, HBV 게놈의 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에 나타내는 방법.
55. 항목 23 내지 54 중 어느 하나에 있어서, 핵산이 프리게놈 (pg) 헤파드나바이러스 RNA, 특히 프리게놈 (pg) HBV RNA 로 전사가능한 방법.
56. 항목 1 내지 55 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 방지하는 방법.
57. 항목 56 에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는 방법.
58. 항목 56 또는 57 에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 가 핵산 TG 에 의해 대체되는 방법.
59. 항목 56 내지 58 중 어느 하나에 있어서, 상기 핵산이 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역이 방지되는 방법.
60. 항목 1 내지 59 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 벡터 내에 포함되는 방법.
61. 항목 60 에 있어서, 벡터가 SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함하는 방법.
62. 항목 1 내지 61 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 유도성 프로모터의 제어 하에 있는 방법.
63. 항목 56 내지 62 중 어느 하나에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.
64. 항목 62 또는 63 에 있어서, 유도성 프로모터가 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터 또는 제초제-유도성 프로모터인 방법.
65. 항목 62 내지 64 중 어느 하나에 있어서, 유도성 프로모터가 CMV 프로모터 또는 tet-EF-1 알파 프로모터인 방법.
66. 항목 23 내지 65 중 어느 하나에 있어서, 하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입되는 방법.
67. 항목 66 에 있어서, 상기 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 방법.
68. 항목 67 에 있어서, 하나 이상의 HBV 외피 단백질이 대 표면 단백질 (L), 중 표면 단백질 (M) 및 소 표면 단백질 (S) 중 하나 이상인 방법.
69. 항목 67 에 있어서, HBV 외피 단백질이 소 표면 단백질 (S) 인 방법.
70. 항목 67 내지 69 중 어느 하나에 있어서, 하나 이상의 HBV 외피 단백질의 코딩 부위를 SEQ ID NO: 36 (L), SEQ ID NO: 37 (M) 및/또는 SEQ ID NO: 38 (S) 에 나타내는 방법.
71. 항목 70 에 있어서, SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 가 TAGTAG 로 돌연변이화되어, 외피 단백질의 발현이 방지되는 방법.
72. 항목 1 내지 71 중 어느 하나에 있어서, 세포가 진핵세포인 방법.
73. 항목 72 에 있어서, 진핵세포가 간세포 기원의 것인 방법.
74. 항목 72 또는 73 에 있어서, 진핵세포가 간종양 세포이거나 간종양 세포에서 유래하는 방법.
75. 항목 72 내지 74 중 어느 하나에 있어서, 진핵세포가 HepG2 (ATCC #HB-8065) 인 방법.
76. 항목 1 내지 75 중 어느 하나에 있어서, 핵산 분자 또는 이를 포함하는 벡터가 세포의 게놈에 안정적으로 통합되는 방법.
77. 항목 1 내지 76 중 어느 하나에 있어서, 상기 단계 (a) 가 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함하는 방법:
(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;
(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;
(iii) 제 2 의 양성 가닥 DNA 의 합성 (이로써 상기 음성 가닥 DNA 및 상기 양성 가닥 DNA 가 이중 가닥 이완 환형 DNA 를 형성함)
(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;
(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 임의 회복;
(vi) 표지된 헤파드나바이러스 e 항원을 인코딩하는 mRNA 의 전사;
(vii) 표지된 헤파드나바이러스 e 항원의 번역.
78. 항목 77 에 있어서, 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복이 시작 코돈의 회복인 방법.
79. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 형성을 저해하는 후보 분자의 능력을 평가하기 위한 것인 방법.
80. 항목 79 에 있어서, 세포가 cccDNA 가 형성되기 전에 후보 분자와 접촉되는 방법.
81. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 의 양 또는 수를 감소시키는 후보 분자의 능력을 평가하기 위한 것인 방법.
82. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 의 전사를 감소시키는 후보 분자의 능력을 평가하기 위한 것인 방법.
83. 항목 81 또는 82 에 있어서, 세포가 cccDNA 가 형성된 후에 후보 분자와 접촉되는 방법.
84. 항목 1 내지 83 중 어느 하나에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 ELISA, CLIA 또는 AlphaLISA 에 의해 수행되는 방법.
85. 항목 1 내지 84 중 어느 하나에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 상기 헤파드나바이러스 e 항원을 특이적으로 인지하는 항체 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체의 사용을 포함하는 방법.
86. 항목 77 내지 85 중 어느 하나에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.
87. 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자.
88. 항목 87 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.
89. 항목 87 또는 88 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 핵산 분자.
90. 항목 89 에 있어서, 상기 표지가 6 내지 22 개 아미노산으로 이루어지는 핵산 분자.
91. 항목 89 또는 90 에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 핵산 분자.
92. 항목 91 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 핵산 분자.
93. 항목 87 또는 88 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 핵산 분자.
94. 항목 93 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 핵산 분자.
95. 항목 93 또는 94 에 있어서, 상기 둘 이상의 표지의 전체 길이가 14 내지 31 개 아미노산의 길이인 핵산 분자.
96. 항목 93 내지 95 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 핵산 분자.
97. 항목 96 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 핵산 분자.
98. 항목 91 또는 96 에 있어서, 하기와 같은 핵산 분자:
HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에서 나타내고; His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고; c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고; V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는 C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타냄.
99. 항목 92 또는 97 에 있어서, 하기와 같은 핵산 분자:
1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내거나;
3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타냄.
100. 항목 91 또는 96 에 있어서, 하기와 같은 핵산 분자:
HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;
His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;
c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;
V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는
C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄.
101. 항목 92 또는 97 에 있어서, 하기와 같은 핵산 분자:
1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내거나;
3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타냄.
102. 항목 88 내지 101 중 어느 하나에 있어서, HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 16 에 나타내는 핵산 분자.
103. 항목 88 내지 101 중 어느 하나에 있어서, HBeAg 의 아미노산 서열을 SEQ ID NO: 18 에 나타내는 핵산 분자.
104. 항목 87 내지 103 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 분자.
105. 항목 104 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 핵산 분자.
106. 항목 104 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 핵산 분자.
107. 항목 87 내지 106 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 핵산 서열을 포함하고, 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 ("프리코어" 부위) 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 3' 다운스트림인 핵산 분자.
108. 항목 107 에 있어서, 상기 하나 이상의 표지를 인코딩하는 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 핵산 분자.
109. 항목 87 내지 108 중 어느 하나에 잇어서, 헤파드나바이러스 게놈을 포함하는 핵산 분자.
110. 항목 109 에 있어서, 상기 헤파드나바이러스 게놈이 B 형 간염 바이러스 (HBV) 게놈인 핵산 분자.
111. 항목 110 에 있어서, 상기 HBV 게놈이 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈인 핵산 분자.
112. 항목 110 에 있어서, 상기 HBV 게놈이 HBV 유전자형 D 의 게놈인 핵산 분자.
113. 항목 112 에 있어서, HBV 유전자형 D 의 상기 게놈이 HBV 하위유전자형 ayw 의 게놈인 핵산 분자.
114. 항목 87 내지 113 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 핵산이 헤파드나바이러스 코어 단백질을 인코딩하는 핵산의 5' 업스트림인 핵산 분자.
115. 항목 114 에 있어서, 핵산 서열이 HBV 코어 단백질을 인코딩하는 핵산 분자.
116. 항목 115 에 있어서, HBV 코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 23 에 나타내는 핵산 분자.
117. 항목 114 에 있어서, 코어 단백질이 HBV 코어 단백질인 핵산 분자.
118. 항목 116 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 핵산 분자.
119. 항목 87 내지 118 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되는 핵산 분자.
120. 항목 119 에 있어서, 상기 헤파드나바이러스 게놈이 HBV 게놈인 핵산 분자.
121. 항목 120 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 핵산 분자.
122. 항목 87 내지 121 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 삽입되는 핵산 분자.
123. 항목 122 에 있어서, 상기 헤파드나바이러스 게놈이 HBV 게놈인 핵산 분자.
124. 항목 87 내지 123 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입되는 핵산 분자.
125. 항목 87 내지 124 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 핵산 분자.
126. 항목 125 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 핵산 분자.
127. 항목 125 또는 126 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 9 개 이하의 뉴클레오티드로 이루어지는 핵산 분자.
128. 항목 127 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 핵산 분자.
129. 항목 87 내지 128 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함하는 핵산 분자.
130. 항목 129 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 핵산 분자.
131. 항목 129 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 핵산 분자.
132. 항목 131 에 있어서, 상기 아미노산이 글리신 잔기인 핵산 분자.
133. 항목 129 내지 131 중 어느 하나에 있어서, 링커를 인코딩하는 상기 서열이 서열 GGC 로 이루어지거나; 상기 서열이 글리신 잔기를 인코딩하는 핵산 분자.
134. 항목 87 내지 133 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나; 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는, 핵산 분자.
135. 항목 87 내지 134 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 핵산 분자.
136. 항목 135 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.
137. 항목 88 내지 136 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 핵산 분자.
138. 항목 88 내지 137 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 핵산 분자.
139. 항목 88 내지 138 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 핵산 분자.
140. 항목 88 내지 139 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 핵산 분자.
141. 항목 110 내지 140 중 어느 하나에 있어서, HBV 게놈의 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에 나타내는 핵산 분자.
142. 항목 109 내지 141 중 어느 하나에 있어서, 핵산이 프리게놈 (pg) 헤파드나바이러스 RNA 로 전사가능한 핵산 분자.
143. 항목 142 에 있어서, 상기 헤파드나바이러스 RNA 가 HBV RNA 인 핵산 분자.
144. 항목 87 내지 143 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 벡터에 포함되는 핵산 분자.
145. 항목 144 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.
146. 항목 87 내지 145 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 핵산 분자.
147. 항목 146 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.
148. 항목 147 에 있어서, 핵산이 SEQ ID NO: 39 에서 나타낸 바와 같은 서열을 포함하는 벡터에 포함되는 핵산 분자.
149. 항목 87 내지 148 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 방지하는 핵산 분자.
150. 항목 149 에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는 핵산 분자.
151. 항목 147 또는 150 에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 가 핵산 TG 에 의해 대체되는 핵산 분자.
152. 항목 147 내지 151 중 어느 하나에 있어서, 상기 핵산이 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역이 방지되는 핵산 분자.
153. 항목 144, 145 및 149 내지 152 중 어느 하나에 있어서, 벡터가 SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함하는 핵산 분자.
154. 항목 87 내지 153 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 유도성 프로모터의 제어 하에 있는 핵산 분자.
155. 항목 149 내지 154 중 어느 하나에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.
156. 항목 154 또는 155 에 있어서, 유도성 프로모터가 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터 또는 제초제- 유도성 프로모터인 핵산 분자.
157. 항목 154 내지 156 중 어느 하나에 있어서, 유도성 프로모터가 CMV 프로모터 또는 tet-EF-1 알파 프로모터인 핵산 분자.
158. 항목 110 내지 157 중 어느 하나에 있어서, 하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입되는 핵산 분자.
159. 항목 158 에 있어서, 상기 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 핵산 분자.
160. 항목 159 에 있어서, 하나 이상의 HBV 외피 단백질이 L, M 및/또는 S 중 하나 이상인 핵산 분자.
161. 항목 159 에 있어서, HBV 외피 단백질이 S 인 핵산 분자.
162. 항목 159 내지 161 중 어느 하나에 있어서, 하나 이상의 HBV 외피 단백질의 코딩 부위를 SEQ ID NO: 36 (L), 37 (M) 또는 38 (S) 에 나타내는 핵산 분자.
163. 항목 162 에 있어서, SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 가 TAGTAG 로 돌연변이화되어, 외피 단백질의 발현이 방지되는 핵산 분자.
164. 항목 87 내지 163 중 어느 하나에서 정의한 바와 같은 핵산 분자에 의해 인코딩되는 단백질.
165. 표지된 헤파드나바이러스 e 항원을 포함하는 단백질.
166. 항목 165 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 단백질.
167. 항목 166 에 있어서, B 형 간염 바이러스 e 항원 (HBeAg) 이 SEQ ID NO: 18 에서 나타낸 바와 같은 아미노산 서열을 포함하는 단백질.
168. 항목 165 내지 167 중 어느 하나에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 단백질.
169. 항목 168 에 있어서, 상기 표지가 6 내지 22 개 아미노산으로 이루어지는 단백질.
170. 항목 165 내지 169 중 어느 하나에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 단백질.
171. 항목 170 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 단백질.
172. 항목 165 내지 167 중 어느 하나에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 단백질.
173. 항목 172 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 단백질.
174. 항목 172 또는 173 에 있어서, 상기 둘 이상의 표지의 전체 길이가 14 내지 31 개 아미노산의 길이인 단백질.
175. 항목 172 내지 174 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 단백질.
176. 항목 175 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 단백질.
177. 항목 170 또는 175 에 있어서, 하기와 같은 단백질:
HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;
His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;
c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;
V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는
C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타냄.
178. 항목 171 또는 176 에 있어서, 하기와 같은 단백질:
1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내거나;
3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타냄.
179. 항목 170 또는 175 에 있어서, 하기와 같은 단백질:
HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;
His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;
c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;
V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는
C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄.
180. 항목 171 또는 176 에 있어서, 하기와 같은 단백질:
1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내거나;
3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타냄.
181. 항목 165 내지 180 중 어느 하나에 있어서, 헤파드나바이러스 프리코어 단백질을 포함하는 단백질.
182. 항목 181 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 단백질.
183. 항목 181 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 단백질.
184. 항목 165 내지 183 중 어느 하나에 있어서, 단백질이 하나 이상의 표지의 아미노산 서열을 포함하고, 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 및 신호 펩티드의 서열의 아미노산 서열의 C-말단인 단백질.
185. 항목 184 에 있어서, 상기 하나 이상의 표지의 아미노산 서열을 포함하는 단백질이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산의 아미노산 서열의 C-말단인 단백질.
186. 항목 165 내지 183 중 어느 하나에 있어서, 단백질이 하나 이상의 표지의 아미노산 서열을 포함하고, 상기 서열이 헤파드나바이러스 코어 단백질의 아미노산 서열의 N-말단인 단백질.
187. 항목 186 에 있어서, 헤파드나바이러스 코어 단백질이 HBV 코어 단백질인 단백질인 단백질.
188. 항목 187 에 있어서, HBV 코어 단백질을 인코딩하는 핵산을 SEQ ID NO: 23 에 나타내는 단백질.
189. 항목 187 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 단백질.
190. 항목 165 내지 189 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 의해 인코딩된 아미노산 서열에 삽입되는 단백질.
191. 항목 190 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 단백질.
192. 항목 191 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 단백질.
193. 항목 165 내지 192 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 의해 인코딩된 아미노산 서열에 삽입되는 단백질.
194. 항목 193 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 단백질.
195. 항목 165 내지 194 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 HBV 프리코어 단백질의 위치 G29 및 위치 M30 에 상응하는 아미노산 잔기 (예컨대 SEQ ID NO. 17 에서 나타낸 바와 같은 것) 사이에 삽입되는 단백질.
196. 항목 165 내지 195 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열에 대한 N-말단에 3 개 이하 아미노산의 아미노산 서열을 추가로 포함하며, 여기서 3 개 이하 아미노산의 상기 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열에 의해 인코딩되는 단백질.
197. 항목 196 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 단백질.
198. 항목 198 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지는 단백질.
199. 항목 196 내지 198 중 어느 하나에 있어서, 3 개 이하 아미노산의 상기 아미노산 서열을 SEQ ID NO. 40 에 나타내는 방법.
200. 항목 165 내지 199 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열에 대한 C-말단에 링커를 추가로 포함하는 단백질.
201. 항목 200 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 단백질.
202. 항목 201 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 단백질.
203. 항목 202 에 있어서, 상기 아미노산이 글리신 잔기인 단백질.
204. 항목 1 내지 46 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원의 아미노산 서열이 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열에 의해 인코딩된 아미노산 서열을 포함하거나;
표지된 헤파드나바이러스 e 항원의 아미노산 서열이 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 포함하는 단백질.
205. 항목 165 내지 204 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 단백질.
206. 항목 205 에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 단백질.
207. 항목 166 내지 206 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 단백질.
208. 항목 166 내지 207 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 단백질.
209. 항목 166 내지 208 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 단백질.
210. 항목 166 내지 209 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 단백질.
211. 항목 87 내지 163 중 어느 하나의 핵산 분자 또는 항목 164 내지 210 중 어느 하나의 단백질을 포함하는 숙주 세포.
212. 항목 211 에 있어서, 세포가 진핵세포인 숙주 세포.
213. 항목 212 에 있어서, 진핵세포가 간세포 기원의 것인 숙주 세포.
214. 항목 212 또는 213 에 있어서, 진핵세포가 간종양 세포이거나 간종양 세포에서 유래하는 숙주 세포.
215. 항목 212 내지 214 중 어느 하나에 있어서, 진핵세포가 HepG2 (ATCC #HB-8065) 인 숙주 세포.
216. 항목 164 내지 210 중 어느 하나에서 정의한 바와 같은 단백질의 생성 방법으로서, 항목 211 내지 215 중 어느 하나의 숙주를 단백질의 발현을 허용하고 배양물로부터 생성된 단백질을 회수하는 조건 하에 배양하는 것을 포함하는 방법.
217. 항목 1 내지 86 중 어느 하나의 방법에서 사용하기 위한 키트.
218. 항목 165 내지 167 중 어느 하나에서 정의한 바와 같은 헤파드나바이러스 항원을 특이적으로 인지하는 항체 및 항목 168 내지 180 중 어느 하나에서 정의한 바와 같은 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체를 포함하는 키트.
219. 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 예측되는 후보 분자를 스크리닝하기 위한, 항목 87 내지 163 중 어느 하나의 핵산 분자, 항목 164 내지 210 중 어느 하나의 단백질 및/또는 항목 211 내지 215 중 어느 하나의 숙주 세포의 용도.
SEQUENCE LISTING
<110> F. Hoffmann-La Roche AG
Hoffmann-La Roche Inc.
Drexel University
Baruch S. Blumberg Institute
<120> Tagged hepadnavirus e antigen and its use in screening antiviral substances
<130> W2630 PCT S3
<150> US62/014,996
<151> 2014-06-20
<160> 46
<170> BiSSAP 1.3
<210> 1
<211> 27
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a hemagglutinin (HA) tag
<400> 1
tacccatacg acgttccaga ttacgct 27
<210> 2
<211> 18
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a His-tag
<400> 2
catcatcatc atcatcac 18
<210> 3
<211> 24
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a Flag-tag
<400> 3
gactacaagg acgacgacga caag 24
<210> 4
<211> 39
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding c-myc-tag
<400> 4
atggcatcaa tgcagaagct gatctcagag gaggacctg 39
<210> 5
<211> 42
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding V5-tag
<400> 5
ggtaagccta tccctaaccc tctcctcggt ctcgattcta cg 42
<210> 6
<211> 27
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a C9-tag
<400> 6
actgaaacat ctcaagtagc tccagct 27
<210> 7
<211> 66
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a 3× Flag-tag
<400> 7
gactacaaag accacgacgg tgactacaaa gaccacgaca tcgactacaa ggacgacgac 60
gacaag 66
<210> 8
<211> 9
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a HA tag
<400> 8
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 9
<211> 6
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a His-tag
<400> 9
His His His His His His
1 5
<210> 10
<211> 8
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a Flag-tag
<400> 10
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 11
<211> 10
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a c-myc-tag
<400> 11
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 12
<211> 14
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a V5-tag
<400> 12
Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr
1 5 10
<210> 13
<211> 9
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a C9-tag
<400> 13
Thr Glu Thr Ser Gln Val Ala Pro Ala
1 5
<210> 14
<211> 22
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a 3× Flag-tag
<400> 14
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys
20
<210> 15
<211> 639
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a hepatitis B virus precore protein
<400> 15
atgcaacttt ttcacctctg cctaatcatc tcttgttcat gtcctactgt tcaagcctcc 60
aagctgtgcc ttgggtggct ttggggcatg gacatcgacc cttataaaga atttggagct 120
actgtggagt tactctcgtt tttgccttct gacttctttc cttcagtacg agatcttcta 180
gataccgcct cagctctgta tcgggaagcc ttagagtctc ctgagcattg ttcacctcac 240
catactgcac tcaggcaagc aattctttgc tggggggaac taatgactct agctacctgg 300
gtgggtgtta atttggaaga tccagcatct agagacctag tagtcagtta tgtcaacact 360
aatatgggcc taaagttcag gcaactcttg tggtttcaca tttcttgtct cacttttgga 420
agagaaaccg ttatagagta tttggtgtct ttcggagtgt ggattcgcac tcctccagct 480
tatagaccac caaatgcccc tatcctatca acacttccgg aaactactgt tgttagacga 540
cgaggcaggt cccctagaag aagaactccc tcgcctcgca gacgaaggtc tcaatcgccg 600
cgtcgcagaa gatctcaatc tcgggaacct caatgttag 639
<210> 16
<211> 477
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a hepatitis B virus e antigen
(HBeAg)
<400> 16
tccaagctgt gccttgggtg gctttggggc atggacatcg acccttataa agaatttgga 60
gctactgtgg agttactctc gtttttgcct tctgacttct ttccttcagt acgagatctt 120
ctagataccg cctcagctct gtatcgggaa gccttagagt ctcctgagca ttgttcacct 180
caccatactg cactcaggca agcaattctt tgctgggggg aactaatgac tctagctacc 240
tgggtgggtg ttaatttgga agatccagca tctagagacc tagtagtcag ttatgtcaac 300
actaatatgg gcctaaagtt caggcaactc ttgtggtttc acatttcttg tctcactttt 360
ggaagagaaa ccgttataga gtatttggtg tctttcggag tgtggattcg cactcctcca 420
gcttatagac caccaaatgc ccctatccta tcaacacttc cggaaactac tgttgtt 477
<210> 17
<211> 212
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a hepatitis B virus precore protein
<400> 17
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Met Asp Ile
20 25 30
Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu
35 40 45
Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser
50 55 60
Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His
65 70 75 80
His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr
85 90 95
Leu Ala Thr Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp
100 105 110
Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln
115 120 125
Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val
130 135 140
Ile Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala
145 150 155 160
Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr
165 170 175
Val Val Arg Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro
180 185 190
Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg
195 200 205
Glu Pro Gln Cys
210
<210> 18
<211> 159
<212> PRT
<213> Hepatitis B virus
<220>
<223> HBeAg amino acid sequence (removes N-terminal signal peptide (19
aa) and C-terminal arginine-rich domain (34 aa) from precore)
<400> 18
Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Met Asp Ile Asp Pro Tyr
1 5 10 15
Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp
20 25 30
Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr
35 40 45
Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala
50 55 60
Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr
65 70 75 80
Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val
85 90 95
Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp
100 105 110
Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr
115 120 125
Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro
130 135 140
Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val
145 150 155
<210> 19
<211> 678
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a HA-tagged hepatitis B virus
precore protein
<400> 19
atgcaacttt ttcacctctg cctaatcatc tcttgttcat gtcctactgt tcaagcctcc 60
aagctgtgcc ttgggtggct ttggggcgtg gacatctacc catacgacgt tccagattac 120
gctggcatgg acatcgaccc ttataaagaa tttggagcta ctgtggagtt actctcgttt 180
ttgccttctg acttctttcc ttcagtacga gatcttctag ataccgcctc agctctgtat 240
cgggaagcct tagagtctcc tgagcattgt tcacctcacc atactgcact caggcaagca 300
attctttgct ggggggaact aatgactcta gctacctggg tgggtgttaa tttggaagat 360
ccagcatcta gagacctagt agtcagttat gtcaacacta atatgggcct aaagttcagg 420
caactcttgt ggtttcacat ttcttgtctc acttttggaa gagaaaccgt tatagagtat 480
ttggtgtctt tcggagtgtg gattcgcact cctccagctt atagaccacc aaatgcccct 540
atcctatcaa cacttccgga aactactgtt gttagacgac gaggcaggtc ccctagaaga 600
agaactccct cgcctcgcag acgaaggtct caatcgccgc gtcgcagaag atctcaatct 660
cgggaacctc aatgttag 678
<210> 20
<211> 516
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a HA-tagged hepatitis B virus e
antigen (HBeAg)
<400> 20
tccaagctgt gccttgggtg gctttggggc gtggacatct acccatacga cgttccagat 60
tacgctggca tggacatcga cccttataaa gaatttggag ctactgtgga gttactctcg 120
tttttgcctt ctgacttctt tccttcagta cgagatcttc tagataccgc ctcagctctg 180
tatcgggaag ccttagagtc tcctgagcat tgttcacctc accatactgc actcaggcaa 240
gcaattcttt gctgggggga actaatgact ctagctacct gggtgggtgt taatttggaa 300
gatccagcat ctagagacct agtagtcagt tatgtcaaca ctaatatggg cctaaagttc 360
aggcaactct tgtggtttca catttcttgt ctcacttttg gaagagaaac cgttatagag 420
tatttggtgt ctttcggagt gtggattcgc actcctccag cttatagacc accaaatgcc 480
cctatcctat caacacttcc ggaaactact gttgtt 516
<210> 21
<211> 225
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a HA-tagged hepatitis B virus precore
protein
<400> 21
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Val Asp Ile
20 25 30
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Met Asp Ile Asp Pro Tyr
35 40 45
Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp
50 55 60
Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr
65 70 75 80
Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala
85 90 95
Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr
100 105 110
Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val
115 120 125
Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp
130 135 140
Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr
145 150 155 160
Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro
165 170 175
Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val Arg
180 185 190
Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro Arg Arg Arg
195 200 205
Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg Glu Pro Gln
210 215 220
Cys
225
<210> 22
<211> 172
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of HA-tagged hepatitis B virus e antigen
(HBeAg)
<400> 22
Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Val Asp Ile Tyr Pro Tyr
1 5 10 15
Asp Val Pro Asp Tyr Ala Gly Met Asp Ile Asp Pro Tyr Lys Glu Phe
20 25 30
Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp Phe Phe Pro
35 40 45
Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr Arg Glu Ala
50 55 60
Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala Leu Arg Gln
65 70 75 80
Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr Trp Val Gly
85 90 95
Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val Ser Tyr Val
100 105 110
Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp Phe His Ile
115 120 125
Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr Leu Val Ser
130 135 140
Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro Pro Asn Ala
145 150 155 160
Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val
165 170
<210> 23
<211> 552
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a HBV core protein
<400> 23
atggacatcg acccttataa agaatttgga gctactgtgg agttactctc gtttttgcct 60
tctgacttct ttccttcagt acgagatctt ctagataccg cctcagctct gtatcgggaa 120
gccttagagt ctcctgagca ttgttcacct caccatactg cactcaggca agcaattctt 180
tgctgggggg aactaatgac tctagctacc tgggtgggtg ttaatttgga agatccagca 240
tctagagacc tagtagtcag ttatgtcaac actaatatgg gcctaaagtt caggcaactc 300
ttgtggtttc acatttcttg tctcactttt ggaagagaaa ccgttataga gtatttggtg 360
tctttcggag tgtggattcg cactcctcca gcttatagac caccaaatgc ccctatccta 420
tcaacacttc cggaaactac tgttgttaga cgacgaggca ggtcccctag aagaagaact 480
ccctcgcctc gcagacgaag gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa 540
cctcaatgtt ag 552
<210> 24
<211> 183
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a HBV core protein
<400> 24
Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu
1 5 10 15
Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp
20 25 30
Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys
35 40 45
Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu
50 55 60
Leu Met Thr Leu Ala Thr Trp Val Gly Val Asn Leu Glu Asp Pro Ala
65 70 75 80
Ser Arg Asp Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys
85 90 95
Phe Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg
100 105 110
Glu Thr Val Ile Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr
115 120 125
Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro
130 135 140
Glu Thr Thr Val Val Arg Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr
145 150 155 160
Pro Ser Pro Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser
165 170 175
Gln Ser Arg Glu Pro Gln Cys
180
<210> 25
<211> 61
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of an epsilon structure as encoded by an HBV
genome
<400> 25
tgttcatgtc ctactgttca agcctccaag ctgtgccttg ggtggctttg gggcatggac 60
a 61
<210> 26
<400> 26
000
<210> 27
<211> 3182
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype D, subtype ayw.
Genbank accession# U95551
<400> 27
aattccacaa cctttcacca aactctgcaa gatcccagag tgagaggcct gtatttccct 60
gctggtggct ccagttcagg agcagtaaac cctgttccga ctactgcctc tcccttatcg 120
tcaatcttct cgaggattgg ggaccctgcg ctgaacatgg agaacatcac atcaggattc 180
ctaggacccc ttctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240
ccgcaaagtc tagactcgtg gtggacttct ctcaattttc tagggggaac taccgtgtgt 300
cttggccaaa attcgcagtc cccaacctcc aatcactcac caacctcctg tcctccaact 360
tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480
ctaattccag gatcctcaac caccagcacg ggaccatgcc gaacctgcat gactactgct 540
caaggaacct ctatgtatcc ctcctgttgc tgtaccaaac cttcggacgg aaattgcacc 600
tgtattccca tcccatcatc ctgggctttc ggaaaattcc tatgggagtg ggcctcagcc 660
cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720
actgtttggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacagcatc 780
ttgagtccct ttttaccgct gttaccaatt ttcttttgtc tttgggtata catttaaacc 840
ctaacaaaac aaagagatgg ggttactctc tgaattttat gggttatgtc attggaagtt 900
atgggtcctt gccacaagaa cacatcatac aaaaaatcaa agaatgtttt agaaaacttc 960
ctattaacag gcctattgat tggaaagtat gtcaacgaat tgtgggtctt ttgggttttg 1020
ctgccccatt tacacaatgt ggttatcctg cgttaatgcc cttgtatgca tgtattcaat 1080
ctaagcaggc tttcactttc tcgccaactt acaaggcctt tctgtgtaaa caatacctga 1140
acctttaccc cgttgcccgg caacggccag gtctgtgcca agtgtttgct gacgcaaccc 1200
ccactggctg gggcttggtc atgggccatc agcgcgtgcg tggaaccttt tcggctcctc 1260
tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcaa 1320
acattatcgg gactgataac tctgttgtcc tctcccgcaa atatacatcg tatccatggc 1380
tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440
cgctgaatcc tgcggacgac ccttctcggg gtcgcttggg actctctcgt ccccttctcc 1500
gtctgccgtt ccgaccgacc acggggcgca cctctcttta cgcggactcc ccgtctgtgc 1560
cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620
cgtgaacgcc caccgaatgt tgcccaaggt cttacataag aggactcttg gactctctgc 1680
aatgtcaacg accgaccttg aggcatactt caaagactgt ttgtttaaag actgggagga 1740
gttgggggag gagattagat taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800
ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat cgacccttat 1920
aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttca 1980
gtacgagatc ttctagatac cgcctcagct ctgtatcggg aagccttaga gtctcctgag 2040
cattgttcac ctcaccatac tgcactcagg caagcaattc tttgctgggg ggaactaatg 2100
actctagcta cctgggtggg tgttaatttg gaagatccag catctagaga cctagtagtc 2160
agttatgtca acactaatat gggcctaaag ttcaggcaac tcttgtggtt tcacatttct 2220
tgtctcactt ttggaagaga aaccgttata gagtatttgg tgtctttcgg agtgtggatt 2280
cgcactcctc cagcttatag accaccaaat gcccctatcc tatcaacact tccggaaact 2340
actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400
aggtctcaat cgccgcgtcg cagaagatct caatctcggg aacctcaatg ttagtattcc 2460
ttggactcat aaggtgggga actttactgg tctttattct tctactgtac ctgtctttaa 2520
tcctcattgg aaaacaccat cttttcctaa tatacattta caccaagaca ttatcaaaaa 2580
atgtgaacag tttgtaggcc cacttacagt taatgagaaa agaagattgc aattgattat 2640
gcctgctagg ttttatccaa aggttaccaa atatttacca ttggataagg gtattaaacc 2700
ttattatcca gaacatctag ttaatcatta cttccaaact agacactatt tacacactct 2760
atggaaggcg ggtatattat ataagagaga aacaacacat agcgcctcat tttgtgggtc 2820
accatattct tgggaacaag atctacagca tggggcagaa tctttccacc agcaatcctc 2880
tgggattctt tcccgaccac cagttggatc cagccttcag agcaaacaca gcaaatccag 2940
attgggactt caatcccaac aaggacacct ggccagacgc caacaaggta ggagctggag 3000
cattcgggct gggtttcacc ccaccgcacg gaggcctttt ggggtggagc cctcaggctc 3060
agggcatact acaaactttg ccagcaaatc cgcctcctgc ctccaccaat cgccagacag 3120
gaaggcagcc taccccgctg tctccacctt tgagaaacac tcatcctcag gccatgcagt 3180
gg 3182
<210> 28
<211> 3221
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype A (Genbank
accession# AP007263)
<400> 28
aattccactg ccttccacca agctctgcag gatcccagag tcaggggtct gtattttcct 60
gctggtggct ccagttcagg aacagtaaac cctgctccga atattgcctc tcacatctcg 120
tcaatctccg cgaggactgg ggaccctgtg gcgaacatgg agaacatcac atcaggattc 180
ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240
ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggatc acccgtgtgt 300
cttggccaaa attcgcagtc cccaacctcc aatcactcac caacctcctg tcctccaatt 360
tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420
ctatgcctca tcttcttatt ggttcttctg gattatcaag gtatgttgcc cgtttgtcct 480
ctaattccag gatcaacaac aaccagtacg ggaccatgca aaacctgcac gactcctgct 540
caaggcaact ctatgtttcc ctcatgttgc tgtacaaaac ctacggatgg aaattgcacc 600
tgtattccca tcccatcgtc ctgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660
cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720
actgtttggc tttcagctat atggatgatg tggtattggg ggccaagtct gtacagcatc 780
gtgagtccct ttataccgct gttaccaatt ttcttttgtc tctgggtata catttaaacc 840
ctaacaaaac aaaaagatgg ggttattccc taaacttcat gggttacata attggaagtt 900
ggggaacttt gccacaggat catattgtac aaaagatcaa acactgtttt agaaaacttc 960
ctgttaacag gcctattgat tggaaagtat gtcaaagaat tgtgggtctt ttgggctttg 1020
ctgctccatt tacacaatgt ggatatcctg ccttaatgcc tttgtatgca tgtatacaag 1080
ctaaacaggc tttcactttc tcgccaactt acaaggcctt tctaagtaaa cagtacatga 1140
acctttaccc cgttgctcgg caacggcctg gtctgtgcca agtgtttgct gacgcaaccc 1200
ccactggctg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagccgg tctggagcaa 1320
agctcatcgg aactgacaat tctgtcgtcc tctcgcggaa atatacatcg tttccatggc 1380
tgctaggctg tgctgccaac tggatccttc gcggaacgtc ctttgtctac gtcccgtcgg 1440
cgctgaatcc cgcggacgac ccctctcggg gccgcttggg actctctcgt ccccttctcc 1500
gtctgccgtt ccagccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560
cttctcatct gccggtccgt gtgcacttcg cttcacctct gcacgttgca tggagaccac 1620
cgtgaacgcc catcagatcc tgcccaaggt cttacataag aggactcttg gactcccagc 1680
aatgtcaacg accgaccttg aggcctactt caaagactgt gtgtttaagg actgggagga 1740
gctgggggag gagattaggt taaaggtctt tgtattagga ggctgtaggc ataaattggt 1800
ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg tacatgtccc 1860
actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccttat 1920
aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttcc 1980
gtcagagatc tcctagacac cgcctcagct ctgtatcgag aagccttaga gtctcctgag 2040
cattgctcac ctcaccatac tgcactcagg caagccattc tctgctgggg ggaattgatg 2100
actctagcta cctgggtggg taataatttg gaagatccag catccaggga tctagtagtc 2160
aattatgtta atactaacat gggtttaaag atcaggcaac tattgtggtt tcatatatct 2220
tgccttactt ttggaagaga gactgtactt gaatatttgg tctctttcgg agtgtggatt 2280
cgcactcctc cagcctatag accaccaaat gcccctatct tatcaacaat tccggaaact 2340
actgttgtta gacgacggga ccgaggcagg tcccctagaa gaagaactcc ctcgcctcgc 2400
agacgcagat ctcaatcgcc gcgtcgcaga agatctcaat ctcgggaatc tcaatgttag 2460
tattccttgg actcataagg tgggaaactt tacggggctt tattcctcta cagtacctat 2520
ctttaatcct gaatggcaaa ctccttcctt tcctaagatt catttacaag aggacattat 2580
taataggtgt caacaatttg tgggccctct cactgtaaat gaaaagagaa gattgaaatt 2640
aattatgcct gctagattct atcctaccca cactaaatat ttgcccttag acaaaggaat 2700
taaaccttat tatccagatc aggtagttaa tcattacttc caaaccagac attatttaca 2760
tactctttgg aaggctggta ttctatataa gagggaaacc acacgtagcg catcattttg 2820
cgggtcacca tattcttggg aacaagagct acagcatggg aggttggtca tcaaaacctc 2880
gcaaaggcat ggggacgaat ctttctgttc ccaaccctct gggattcttt cccgatcatc 2940
agttggaccc tgcattcgga gccaactcaa acaatccaga ttgggacttc aaccccatca 3000
aggaccactg gccaacagcc aaccaggtag gagtgggagc attcgggcca gggctcaccc 3060
ctccacacgg cggtattttg ggggggagcc ctcaggctca gggcatattg accacagtgt 3120
caacaattcc tcctcctgcc tccaccaatc ggcagtcagg aaggcagcct actcccatct 3180
ctccacctct aagagacagt catcctcagg ccatgcagtg g 3221
<210> 29
<211> 3215
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype B (Genbank
accession# AB602818)
<400> 29
aactccacca cttttcacca aactcttcaa gatcccagag tccgggctct gtactttcct 60
gctggtggct ccagttcagg aacagtaagc cctgctcaga atactgtctc tgccatatcg 120
tcaatcttat cgaagactgg ggaccctgtg ccgaacatgg agaacatcgc atcaggactc 180
ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaaaaat cctcacaata 240
ccacagagtc tagactcgtg gtggacttct ctcaattttc tagggggaac acccgtgtgt 300
cttggccaaa attcgcagtc ccaaatctcc agtcactcac caacctgttg tcctccaatt 360
tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tcttcctctg catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480
ctaattccag gatcatcaac caccagcacg ggaccatgca agacctgcac aactcctgct 540
caaggaacct ctatgtttcc ctcatgttgc tgtacaaaac ctacggatgg aaactgcacc 600
tgtattccca tcccatcatc ttgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660
cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720
actgtctggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacaacatc 780
ttgagtccct ttatgccgct gttaccaatt ttcttttgtc tttgggtata catttaaacc 840
ctcacaaaac aaaaagatgg ggatattccc ttaacttcat gggatatgta attgggagtt 900
ggggcacatt gccacaggaa catattgtac aaaaaatcaa actatgtttt aggaaacttc 960
ctgtaaacag gcctattgat tggaaagtat gtcaacgaat tgtgggtctt ttggggtttg 1020
ctgccccttt tacgcaatgt ggatatcctg ctttaatgcc tttatatgca tgtatacaag 1080
caaaacaggc ttttactttc tcgccaactt acaaggcctt tctaagtaaa cagtatctag 1140
ccctttaccc cgttgctcgg caacggcctg gtctgtgcca agtgtttgct gacgcaaccc 1200
ccactggttg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtgtctcctc 1260
tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcga 1320
aactcatcgg gactgacaat tctgtcgtgc tctcccgcaa gtatacatcg tttccatggc 1380
tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440
cgctgaatcc cgcggacgac ccctcccggg gccgcttggg gctctaccgc ccgcttctcc 1500
gtctgccgta ccgaccgacc acggggcgca cctctcttta cgcggactcc ccgtctgtgc 1560
cttctcgtct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggaaaccac 1620
cgtgaacgcc caccggaacc tgcccaaggt cttgcacaag aggactcttg gactttcagc 1680
aatgtcaacg accgaccttg aggcatactt caaagactgt gtgtttcatg agtgggagga 1740
gctgggggag gagattaggt taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800
ctgttcacca gcaccatgca actttttcac ctctgcctag tcatctcttg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920
aaagaatttg gagctactgt ggagttactc tcttttttgc cttctgactt ctttccgtcg 1980
gtacgagacc tcctagatac cgctgctgct ctgtatcggg aagccttaga atctcctgaa 2040
cattgctcac ctcaccacac agcactcagg caagctattc tgtgctgggg ggaattaatg 2100
actctagcta cctgggtggg taataattta gaagatccag cgtccaggga tctagtagtc 2160
aattatgtta acactaacat gggcctaaag atcaggcaat tattgtggtt tcacatttcc 2220
tgtcttactt ttggaagaga aactgttctt gaatatttgg tgtcttttgg agtgtggatt 2280
cgcactcctc cggcctacag accaccaaat gcccctatct tatcaacact tccggaaact 2340
actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400
aggtctcaat caccgcgtcg cagaagatct caatctcggg aatcccaatg ttagtattcc 2460
ttggactcat aaggtgggaa actttacggg gctctattct tctacagtac ctgtctttaa 2520
tcctgaatgg caaactcctt cttttccaga cattcatttg caggaggata ttgttgatag 2580
atgtaagcaa tttgtgggac cccttacagt aaatgaaaac aggagactaa aattaataat 2640
gcctgctaga ttttatccta atgttaccaa atatttgccc ttagataaag ggatcaaacc 2700
ttattatcca gagcatgtag ttaatcatta cttccagaca agacattatt tgcatactct 2760
ttggaaggcg ggtatcttat ataagagaga gtcaacacat agcgcctcat tttgcgggtc 2820
accatattct tgggaacaag atctacagca tgggaggttg gtcttccaaa cctcgaaaag 2880
gcatggggac aaatctttct gtccccaatc ccctgggatt cttccccgat catcagttgg 2940
accctgcatt caaagccaac tcagaaaatc cagattggga cctcaaccca cacaaggaca 3000
actggccgga cgcccacaag gtgggagtgg gagcattcgg gccagggttc acccctcccc 3060
acgggggact gttggggtgg agccctcagg ctcagggcat acttacatct gtgccagcag 3120
ctcctcctcc tgcctccacc aatcggcagt caggaaggca gcctactccc ttatctccac 3180
ctctaaggga cactcatcct caggccatgc agtgg 3215
<210> 30
<211> 3215
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype C (Genbank
accession# AB540584)
<400> 30
aactccacaa ctttccacca agctctgcta gatcccagag tgaggggcct atactttcct 60
gctggtggct ccagttccgg aacagtaaac cctgttccga ctactgcctc tcccatatcg 120
tcaatcttca cgaggactgg ggaccctgta ccgaacatgg agaacacaac atcaggattc 180
ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240
ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagc acccacgtgt 300
cctggccaaa attcgcagtc cccaacctcc aatcactcac caacctcttg tcctccaatt 360
tgtcctggct atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480
ctacttccag gaacatcaac tacaagcacg ggaccatgca agacctgcac gattcctgct 540
caaggaamct ctatgtttcc ctcttgttgc tgtacaaaac cttcggacgg aaactgcact 600
tgtattccca tcccatcatc ctgggctttc gcaagattcc tatgggagtg ggcctcagtc 660
cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720
actgtttggc tttcagctat atggatgatg tggtattggg ggccaagtct gtacaacatc 780
ttgagtccct ttttacctct attaccaatt ttcttttgtc tttgggtata catttgaacc 840
ctaataaaac caagcgttgg ggctactccc ttaactttat gggatatgta attggaagtt 900
ggggtacttt accacaggaa catattgttc taaaaatcaa acaatgtttt cggaaactgc 960
ctgtaaatag acctattgat tggaaagtat gtcaacgaat tgtgggtctt ctgggctttg 1020
ctgccccttt tacacaatgt gggtatcctg ccttgatgcc tttgtatgca tgtatacaag 1080
ctaagcaggc tttcactttc tcgccaactt ataaggcctt tctgtgtaaa caatatctga 1140
acctttaccc cgttgctcgg caacggtcag gtctctgcca agtatttgct gacgcaaccc 1200
ccactggatg gggcttggca ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctcttagcag cctgctttgc tcgcagccgg tctggagcra 1320
atcttattgg aaccgacaac tccgttgtcc tctctcggaa atacacctcc tttccatggc 1380
tgctagggtg tgctgcaaac tggatcctgc gcgggacgtc ctttgtctac gtcccgtcgg 1440
cgctgaatcc agcggacgac ccgtctcggg gccgtttggg actctaccgt ccccttcttc 1500
gtctgccgtt ccggccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560
cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620
cgtgaacgcc caccaggtct tgcccaaggt cttacataag aggactcttg gactctcggc 1680
aatgtcaacg accgaccttg aggcatactt caaagactgt gtgtttaaag actgggagga 1740
gttgggggag gagattaggt taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800
ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatctcatg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccgtat 1920
aaagaatttg gagcttctgt ggagttactc tcttttttgc cttctgactt ctttccttcc 1980
attcgagatc tcctcgacac cgcctctgct ctgtatcggg aggccttaga gtctccggaa 2040
cattgttcac ctcaccatac agcactcagg caagctattc tgtgttgggg tgagttgatg 2100
aatctggcca cctgggtggg aagtaatttg gaagacccag catctaggga attagtagtc 2160
agttatgtta atgttaatat gggcctaaag atcagacaac tattgtggtt tcacatttcc 2220
tgtcttactt ttggaagaga aactgttctt gagtatttgg tgtcctttgg agtgtggata 2280
cgcactcctc ccgcttacag accaccaaat gcccctatct tatcaacact tccggaaact 2340
actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400
aggtctcaat cgccgcgtcg cagaagatct caatctcggg aatctcaatg ttagtatccc 2460
ttggactcat aaggtgggaa attttactgg gctttattct tctactgtac ctgtcttcaa 2520
tcctgagtgg caaactccct cctttcctca cattcatttg caggaggaca ttattaatag 2580
atgtcaacaa tatgtgggcc ctcttacagt taatgaaaaa aggagattaa aattaattat 2640
gcctgccagg ttttatccta accgtaccaa atatttgccc ctagataaag gcattaaacc 2700
ttattatcct gaatatacag ttaatcatta cttccaaacc aggcattatt tacatactct 2760
gtggaaggct ggcattctat ataagagaga aactacacgc agcgcctcat tttgtgggtc 2820
accatattct tgggaacaag agctacagca tgggaggttg gtcctccaaa cctcgaaagg 2880
gcatggggac gaatctttct gttcccaatc ctctgggctt ctttcccgat caccagttgg 2940
accctgcatt cggagccaac tcaaacaatc cggattggga cttcaatccc aacaaggatc 3000
actggccagc agcaaaccag gtaggagcgg gagccttcgg gccagggttc accccaccgc 3060
acggcggtct tttggggtgg agccctcagg ctcagggcgt attgacaaca gtgccagcag 3120
cgcctcctcc tgcctccacc aatcggcagt caggcagaca gcctactccc atctctccac 3180
ctctaagaga cagtcatcct caggccatgc agtgg 3215
<210> 31
<211> 3212
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype E (Genbank
accession# AP007262)
<400> 31
aattccacaa cattccacca agctctgcag gatcccagag taagaggcct gtatcttcct 60
gctggtggct ccagttccgg aacagtgaac cctgttccga ctactgcctc actcatctcg 120
tcaatcttct cgaggattgg ggaccctgca ccgaacatgg aaggcatcac atcaggattc 180
ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaaaaat cctcacaata 240
ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagc tcccgtgtgt 300
cttggccaaa attcgcagtc cccaatctcc aatcactcac caacctcttg tcctccaatt 360
tgtcctggct atcgctggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480
ctaattccag gatcatcaac caccagtacg ggaccctgcc gaacctgcac gactcttgct 540
caaggaacct ctatgtttcc ctcatgttgt tgtttaaaac cttcggacgg aaattgcact 600
tgtattccca tcccatcatc atgggctttc ggaaaattcc tatgggagtg ggcctcagcc 660
cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgccgg gctttccccc 720
actgtctggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacaacatc 780
ttgagtccct ttatacctct gttaccaatt ttcttttgtc tttgggtata catttaaatc 840
ccaacaaaac aaaaagatgg ggatattccc taaatttcat gggttatgta attggtagtt 900
gggggtcatt accacaagaa cacatcagac tgaaaatcaa agactgtttt agaaagctcc 960
ctgttaacag gcctattgat tggaaagtat gtcaaagaat tgtgggtctt ttgggctttg 1020
ctgccccttt tacacaatgt ggatatcctg ctttaatgcc tctatatgcg tgtattcaat 1080
ctaagcaggc tttcactttc tcgccaactt acaaggcctt tctgtgtaaa caatatatga 1140
acctttaccc cgttgcccgg caacggccag gtctgtgcca agtgtttgct gatgcaaccc 1200
ccactggctg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcga 1320
aactcatagg gacagataat tctgtcgttc tctcccggaa atatacatca tttccatggc 1380
tgctaggctg tgctgccaac tggatcctgc gagggacgtc ctttgtctac gtcccgtcag 1440
cgctgaatcc tgcggacgac ccctctcggg gccgcttggg ggtctatcgt ccccttctcc 1500
gtctgccgtt ccggccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560
cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620
cgtgaacgcc caccagatct tgcccaaggt cttacataag aggactcttg gactctctgc 1680
aatgtcaacg accgaccttg aggcatactt caaagactgt ttgtttaaag actgggagga 1740
gttgggggag gagactagat taatgatctt tgtactagga ggctgtaggc ataaattggt 1800
ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920
aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttca 1980
gtaagagatc ttctagatac cgcctctgct ctgtatcggg atgccttaga atctcctgag 2040
cattgttcac ctcaccatac tgcactcagg caagccattc tttgctgggg agaattaatg 2100
actctagcta cctgggtggg tgtaaatttg gaagatccag catccaggga cctagtagtc 2160
agttatgtca atactaatat gggcctaaag ttcaggcaat tattgtggtt tcacatttct 2220
tgtctcactt ttggaagaga aaccgtcata gagtatttgg tgtcttttgg agtgtggatt 2280
cgcactcctc cagcttatag accaccaaat gcccctatct tatcaacact tccggagaat 2340
actgttgtta gacgaagagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400
agatctcaat cgccgcgtcg cagaagatct caatctccag cttcccaatg ttagtattcc 2460
ttggactcac aaggtgggaa attttacggg gctttattct tctactatac ctgtctttaa 2520
tcctaactgg aaaactccat cttttcctga tattcatttg caccaggaca ttattaacaa 2580
atgtgaacaa tttgtaggtc ctytaacagt aaatgaaaaa cgaagattaa acttagtcat 2640
gcctgctaga ttttttccca tctccacgaa atatttgccc ctagagaaag gtataaaacc 2700
ttattatcca gataatgtag ttaatcatta cttccaaacc agacactatt tacataccct 2760
atggaaggcg ggcatcttat ataaaagaga aactacccgt agcgcctcat tttgtgggtc 2820
accttattct tgggaacacg agctacatca tggggctttc ttggacggtc cctctcgaat 2880
gggggaagaa tcattccacc accaatcctc tgggattttt tcccgaccac cagttggatc 2940
cagcattcag agcaaacacc agaaatccag attgggacca caatcccaac aaagaccact 3000
ggacagaagc caacaaggta ggagtgggag catttgggcc ggggttcact cccccacacg 3060
gaggcctttt ggggtggagc cctcaggctc aaggcatgct aaaaacattg ccagcaaatc 3120
cgcctcctgc ctccaccaat cggcagtcag gaaggcagcc taccccaatc actccacctt 3180
tgagagacac tcatcctcag gccatgcagt gg 3212
<210> 32
<211> 3215
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype F (Genbank
accession# HE974366)
<400> 32
aactcaaccc agttccatca ggctctgttg gatcccaggg taagggctct gtatcttcct 60
gctggtggct ccagttcagg aacacaaaac cctgctccga ctattgcctc tctcacatcc 120
tcaatcttct cgacgactgg gggccctgct atgaacatgg acaacattac atcaggactc 180
ctaggacccc tgctcgtgtt acaggcggtg tgtttcttgt tgacaaaaat cctcacaata 240
ccacagagtc tagactcgtg gtggacttct ctcaattttc tagggggact acccgggtgt 300
cctggccaaa attcgcagtc cccaacctcc aatcacttac caacctcctg tcctccaact 360
tgtcctggct atcgttggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactaccagg gtatgttgcc cgtttgtcct 480
ctacttccag gatccacgac caccagcacg ggaccctgca aaacctgcac aactcttgca 540
caaggaacct ctatgtttcc ctcctgttgc tgttcaaaac cctcggacgg aaactgcact 600
tgtattccca tcccatcatc ctgggcttta ggaaaatacc tatgggagtg ggcctcagcc 660
cgtttctcat ggctcagttt actagtgcaa tttgttcagt ggtgcgtagg gctttccccc 720
actgtctggc ttttagttat attgatgatc tggtattggg ggccaaatct gtgcagcacc 780
ttgagtccct ttataccgct gttaccaatt ttctgttatc tgtgggtatc catttaaata 840
cttctaaaac taagagatgg ggttacaccc tacattttat gggttatgtc attggtagtt 900
ggggatcatt acctcaagat catattgtac acaaaatcaa agaatgtttt cggaaactgc 960
ctgtaaatcg tccaattgat tggaaagtct gtcaacgcat tgtgggtctt ttgggctttg 1020
ctgccccttt cacacaatgt ggttatcctg ctctcatgcc tctgtatgct tgtattactg 1080
ctaaacaggc ttttgttttt tcgccaactt acaaggcctt tctctgtaaa caatacatga 1140
acctttaccc cgttgccagg caacggccgg gcctgtgcca agtgtttgct gacgcaaccc 1200
ccactggttg gggcttggcc attggccatc agcgcatgcg tggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctccttgcag cttgtttcgc tcgcagcagg tctggagcga 1320
ctctcatcgg cacggacaac tctgttgtcc tctctaggaa gtacacctcc ttcccatggc 1380
tgctcgggtg tgctgcaaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440
cgctgaatcc cgcggacgac ccctcccggg gccgcttggg gctgtaccgc cctcttctcc 1500
gtctgccgtt ccagccgaca acgggtcgca cctctcttta cgcggactcc ccgtctgttc 1560
cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620
cgtgaacgcc ccttggagtt tgccaacagt cttacataag aggactcttg gactttcagg 1680
agggtcaatg acccggattg cagaatacat caaagactgt gtatttaagg actgggagga 1740
gttgggggag gagactaggt taatgatctt tgtactagga ggctgtaggc ataaattggt 1800
ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatcttttg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920
aaagaatttg gcgcttctgt ggagttactc tcttttttgc cttctgattt ctttccatcg 1980
gttcgggacc tactcgacac cgcttcagcc ctttaccggg atgctttaga gtcacctgaa 2040
cattgcactc cccatcacac tgccctcagg caagttattt tgtgctgggg tgagttaatg 2100
actttggctt cctgggtggg caataacttg gaagaccctg ctgccaggga tttagtagtt 2160
aactatgtta acactaacat gggcctaaaa attagacaac tactgtggtt tcacatttcc 2220
tgccttactt ttggaagaga tatagttctt gagtatttgg tgtcctttgg agtgtggatt 2280
cgcactcctc ctgcttacag accacaaaat gcccctatcc tatccacact tccggaaact 2340
actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400
agatctcaat cgccgcgtcg ccgaagatct caatctccag cttcccaatg ttagtattcc 2460
ttggactcat aaggtgggaa attttacggg gctttactct tctactgtgc ctgcttttaa 2520
tcctgactgg ttaactcctt cttttcctaa tattcattta catcaagacc taatttctaa 2580
atgtgaacaa tttgtaggcc cactcactaa aaatgaatta aggaggttaa aattggttat 2640
gccagctaga ttttatccta aggttaccaa atattttcct atggagaaag gaatcaagcc 2700
ttattatcct gagcatgcag ttaatcatta ctttaaaaca agacattatt tgcatacttt 2760
atggaaggcg ggaattttat ataagagaga atccacacgt agcgcatcat tttgtgggtc 2820
accatattcc tgggaacaag agctacagca tgggagcacc tctctcaacg acaagaagag 2880
gcatgggaca gaatctttct gtgcccaatc ctctgggatt ctttccagac catcagctgg 2940
atccgctatt caaagcaaat tccagcagtc ccgactggga cttcaacaca aacaaggaca 3000
gttggccaat ggcaaacaag gtaggagtgg gagcatacgg tccagggttc acacccccac 3060
acggtggcct gctggggtgg agccctcagg cacaaggtat gttaacaacc ttgccagcag 3120
atccgcctcc tgcttccacc aatcggcggt ccgggagaaa gccaacccca gtctctccac 3180
ctctaagaga cactcatcca caggcaatgc agtgg 3215
<210> 33
<211> 3248
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype G (Genbank
accession# AP007264)
<400> 33
aactctacag cattccacca agctctacaa aatcccaaag tcaggggcct gtattttcct 60
gctggtggct ccagttcagg gatagtgaac cctgttccga ctattgcctc tcacatctcg 120
tcaatcttct ccaggattgg ggaccctgca ccgaacatgg agaacatcac atcaggattc 180
ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240
ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagt gcccgtgtgt 300
cctggcctaa attcgcagtc cccaacctcc aatcactcac caatctcctg tcctccaact 360
tgtcctggct atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480
ctgattccag gatcctcgac caccagtacg ggaccctgca aaacctgcac gactcctgct 540
caaggcaact ctatgtatcc ctcatgttgc tgtacaaaac cttcggacgg aaattgcacc 600
tgtattccca tcccatcatc ttgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660
cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720
actgtctggc tttcagctat atggatgatg tggtattggg ggccaaatct gtacaacatc 780
ttgagtccct ttataccgct gttaccaatt ttcttttgtc tttgggtata catctaaacc 840
ctaacaaaac aaaaagatgg ggttattcct taaattttat gggatatgta attggaagtt 900
ggggtacttt gccacaagaa cacatcacac agaaaattaa gcaatgtttt cggaaactcc 960
ctgttaacag gccaattgat tggaaagtct gtcaacgaat aactggtctg ttgggtttcg 1020
ctgctccttt tacccaatgt ggttaccctg ccttaatgcc tttatatgca tgtatacaag 1080
ctaagcaggc ttttactttc tcgccaactt ataaggcctt tctctgtaaa caatacatga 1140
acctttaccc cgttgctagg caacggcccg gtctgtgcca agtgtttgct gacgcaaccc 1200
ccactggttg gggcttggcc atcggccatc agcgcatgcg tggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctcctagctg cttgttttgc tcgcagccgg tctggagcaa 1320
aactcattgg gactgacaat tctgtcgtcc tttctcggaa atatacatcc tttccatggc 1380
tgctaggctg tgctgccaac tggatccttc gcgggacgtc ctttgtttac gtcccgtcag 1440
cgctgaatcc agcggacgac ccctcccggg gccgtttggg gctctgtcgc ccccttctcc 1500
gtctgccgtt cctgccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560
cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgttaca tggaaaccgc 1620
catgaacacc tctcatcatc tgccaaggca gttatataag aggactcttg gactgtttgt 1680
tatgtcaaca accggggtgg agaaatactt caaggactgt gtttttgctg agtgggaaga 1740
attaggcaat gagtccaggt taatgacctt tgtattagga ggctgtaggc ataaattggt 1800
ctgcgcacca gcaccatgta actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860
actgttcaag cctccaagct gtgccttggg tggctttagg gcatggatag aacaactttg 1920
ccatatggcc tttttggctt agacattgac ccttataaag aatttggagc tactgtggag 1980
ttgctctcgt ttttgccttc tgactttttc ccgtctgttc gtgatcttct cgacaccgct 2040
tcagctttgt accgggaatc cttagagtcc tctgatcatt gttcgcctca ccatacagca 2100
ctcaggcaag caatcctgtg ctggggtgag ttgatgactc tagctacctg ggtgggtaat 2160
aatttggaag atccagcatc cagagatttg gtggtcaatt atgttaatac taatatgggt 2220
ttaaaaatca ggcaactatt gtggtttcac atttcctgtc ttacttttgg gagagaaacc 2280
gttcttgagt atttggtgtc ttttggagtg tggattcgca ctcctcctgc ttatagacca 2340
ccaaatgccc ctatcctatc aacacttccg gagactactg ttgttagacg aagaggcagg 2400
tcccctcgaa gaagaactcc ctcgcctcgc agacgaagat ctcaatcgcc gcgtcgcaga 2460
agatctgcat ctccagcttc ccaatgttag tattccttgg actcacaagg tgggaaactt 2520
tacggggctg tattcttcta ctatacctgt ctttaatcct gattggcaaa ctccttcttt 2580
tccaaatatc catttgcatc aagacattat aactaaatgt gaacaatttg tgggccctct 2640
cacagtaaat gagaaacgaa gattaaaact agttatgcct gccagatttt tcccaaactc 2700
tactaaatat ttaccattag acaaaggtat caaaccgtat tatccagaaa atgtagttaa 2760
tcattacttc cagaccagac attatttaca taccctttgg aaggcgggta ttctatataa 2820
gagagaaacg tcccgtagcg cttcattttg tgggtcacca tatacttggg aacaagatct 2880
acagcatggg gctttcttgg acggtccctc tcgagtgggg aaagaacctt tccaccagca 2940
atcctctagg attccttccc gatcaccagt tggacccagc attcagagca aataccaaca 3000
atccagattg ggacttcaat cccaaaaagg acccttggcc agaggccaac aaagtaggag 3060
ttggagccta tggacccggg ttcacccctc cacacggagg ccttttgggg tggagccctc 3120
agtctcaggg cacactaaca actttgccag cagatccgcc tcctgcctcc accaatcgtc 3180
agtcagggag gcagcctact cccatctctc caccactaag agacagtcat cctcaggcca 3240
tgcagtgg 3248
<210> 34
<211> 3215
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of HBV genome, HBV genotype H (Genbank
accession# AB516393)
<400> 34
aactcaacac agttccacca agcactgttg gattcgagag taaggggtct gtattttcct 60
gctggtggct ccagttcaga aacacagaac cctgctccga ctattgcctc tctcacatca 120
tcaatcttct cgaagactgg ggaccctgct atgaacatgg agaacatcac atcaggactc 180
ctaggacccc ttctcgtgtt acaggcggtg tgtttcttgt tgacaaaaat cctcacaata 240
ccacagagtc tagactcgtg gtggacttct ctcaattttc taggggtacc acccgggtgt 300
cctggccaaa attcgcagtc cccaatctcc aatcacttac caacctcctg tcctccaact 360
tgtcctggct atcgttggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420
ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtgtgtcct 480
ctacttccag gatctacaac caccagcacg ggaccctgca aaacctgcac cactcttgct 540
caaggaacct ctatgtttcc ctcctgctgc tgtaccaaac cttcggacgg aaattgcacc 600
tgtattccca tcccatcatc ttgggctttc ggaaaatacc tatgggagtg ggcctcagcc 660
cgtttctctt ggctcagttt actagtgcaa tttgctcagt ggtgcgtagg gctttccccc 720
actgtctggc ttttagttat atggatgatt tggtattggg ggccaaatct gtgcagcatc 780
ttgagtccct ttataccgct gttaccaatt ttttgttatc tgtgggcatc catttgaaca 840
cagctaaaac aaaatggtgg ggttattcct tacactttat gggttatata attgggagtt 900
gggggacctt gcctcaggaa catattgtgc ataaaatcaa agattgcttt cgcaaacttc 960
ccgtgaatag acccattgat tggaaggttt gtcaacgcat tgtgggtctt ttgggctttg 1020
cagccccttt tactcaatgt ggttatcctg ctctcatgcc cttgtatgcc tgtattaccg 1080
ctaagcaggc ttttgttttc tcgccaactt acaaggcctt tctctgtcaa caatacatga 1140
acctttaccc cgttgctcgg caacggccag gcctttgcca agtgtttgct gacgcaaccc 1200
ccactggctg gggcttggcg attggccatc agcgcatgcg cggaaccttt gtggctcctc 1260
tgccgatcca tactgcggaa ctcctagcag cctgtttcgc tcgcagcagg tctggagcgg 1320
acgttatcgg cactgacaac tccgttgtcc tttctcggaa gtacacctcc ttcccatggc 1380
tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtctac gtcccgtcgg 1440
cgctgaatcc tgcggacgac ccctctcgtg gtcgcttggg gctctgccgc cctcttctcc 1500
gcctaccgtt ccggccgacg acgggtcgca cctctcttta cgcggactcc ccgcctgtgc 1560
cttctcatct gccggcccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620
cgtgaacgcc ccttggaact tgccaacaac cttacataag aggactcttg gactttcgcc 1680
ccggtcaacg acctggattg aggaatacat caaagactgt gtatttaagg actgggagga 1740
gtcgggggag gagttgaggt taaaggtctt tgtattagga ggctgtaggc ataaattggt 1800
ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatcttttg ttcatgtccc 1860
actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccttat 1920
aaagaatttg gagcttctgt ggagttactc tcatttttgc cttctgactt cttcccgtct 1980
gtccgggacc tactcgacac cgcttcagcc ctctaccgag atgccttaga atcacccgaa 2040
cattgcaccc ccaaccacac tgctctcagg caagctattt tgtgctgggg tgagttgatg 2100
accttggctt cctgggtggg caataattta gaggatcctg cagcaagaga tctagtagtt 2160
aattatgtca atactaacat gggtctaaaa attagacaat tattatggtt tcacatttcc 2220
tgccttacat ttggaagaga aactgtgctt gagtatttgg tgtcttttgg agtgtggatc 2280
cgcactccac ctgcttacag accaccaaat gcccctatcc tatcaacact tccggagact 2340
actgttgtta gacaacgagg cagggcccct agaagaagaa ctccctcgcc tcgcagacga 2400
agatctcaat caccgcgtcg cagaagatct caatctccag cttcccaatg ttagtattcc 2460
ttggactcat aaggtgggaa actttaccgg tctttactcc tctactgtac ctgttttcaa 2520
tcctgactgg ttaactcctt cttttcctga cattcacttg catcaagatc tgatacaaaa 2580
atgtgaacaa tttgtaggcc cactcactac aaatgaaagg agacgattga aactaattat 2640
gccagctagg ttttatccca aagttactaa atacttccct ttggataaag gtattaagcc 2700
ttactatcca gagaatgtgg ttaatcatta ctttaaaact agacattatt tacatacttt 2760
gtggaaggca ggaattctat ataagagaga atccacacat agcgcctcat tttgtgggtc 2820
accatattcc tgggaacaag agctacagca tgggagcacc tctctcaacg gcgagaaggg 2880
gcatgggaca gaatctttct gtgcccaatc ctctgggatt ctttccagac caccagttgg 2940
atvcactatt cagagcaaat tccagcagtc ccgattggga cttcaacaca aacaaggaca 3000
attggccaat ggcaaacaag gtaggagtgg gaggcttcgg tccagggttc acacccccac 3060
acggtggcct tctggggtgg agccctcagg cacagggcat tctgacaacc tcgccaccag 3120
atccacctcc tgcttccacc aatcggaggt caggaagaaa gccaacccca gtctctccac 3180
ctctaaggga cacacatcca caggccatgc agtgg 3215
<210> 35
<211> 5980
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of Vector: pTREHBV-HAe
<400> 35
ctcgagttta ccactcccta tcagtgatag agaaaagtga aagtcgagtt taccactccc 60
tatcagtgat agagaaaagt gaaagtcgag tttaccactc cctatcagtg atagagaaaa 120
gtgaaagtcg agtttaccac tccctatcag tgatagagaa aagtgaaagt cgagtttacc 180
actccctatc agtgatagag aaaagtgaaa gtcgagttta ccactcccta tcagtgatag 240
agaaaagtga aagtcgagtt taccactccc tatcagtgat agagaaaagt gaaagtcgag 300
ctcggtaccc gggtcgaggt aggcgtgtac ggtgggaggc ctatataagc gtcgagcacc 360
agcacctgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct actgttcaag 420
cctccaagct gtgccttggg tggctttggg gcgtggacat ctacccatac gacgttccag 480
attacgctgg catggacatc gacccttata aagaatttgg agctactgtg gagttactct 540
cgtttttgcc ttctgacttc tttccttcag tacgagatct tctagatacc gcctcagctc 600
tgtatcggga agccttagag tctcctgagc attgttcacc tcaccatact gcactcaggc 660
aagcaattct ttgctggggg gaactaatga ctctagctac ctgggtgggt gttaatttgg 720
aagatccagc atctagagac ctagtagtca gttatgtcaa cactaatatg ggcctaaagt 780
tcaggcaact cttgtggttt cacatttctt gtctcacttt tggaagagaa accgttatag 840
agtatttggt gtctttcgga gtgtggattc gcactcctcc agcttataga ccaccaaatg 900
cccctatcct atcaacactt ccggaaacta ctgttgttag acgacgaggc aggtccccta 960
gaagaagaac tccctcgcct cgcagacgaa ggtctcaatc gccgcgtcgc agaagatctc 1020
aatctcggga acctcaatgt tagtattcct tggactcata aggtggggaa ctttactggt 1080
ctttattctt ctactgtacc tgtctttaat cctcattgga aaacaccatc ttttcctaat 1140
atacatttac accaagacat tatcaaaaaa tgtgaacagt ttgtaggccc acttacagtt 1200
aatgagaaaa gaagattgca attgattatg cctgctaggt tttatccaaa ggttaccaaa 1260
tatttaccat tggataaggg tattaaacct tattatccag aacatctagt taatcattac 1320
ttccaaacta gacactattt acacactcta tggaaggcgg gtatattata taagagagaa 1380
acaacacata gcgcctcatt ttgtgggtca ccatattctt gggaacaaga tctacagcat 1440
ggggcagaat ctttccacca gcaatcctct gggattcttt cccgaccacc agttggatcc 1500
agccttcaga gcaaacacag caaatccaga ttgggacttc aatcccaaca aggacacctg 1560
gccagacgcc aacaaggtag gagctggagc attcgggctg ggtttcaccc caccgcacgg 1620
aggccttttg gggtggagcc ctcaggctca gggcatacta caaactttgc cagcaaatcc 1680
gcctcctgcc tccaccaatc gccagacagg aaggcagcct accccgctgt ctccaccttt 1740
gagaaacact catcctcagg ccatgcagtg gaattccaca acctttcacc aaactctgca 1800
agatcccaga gtgagaggcc tgtatttccc tgctggtggc tccagttcag gagcagtaaa 1860
ccctgttccg actactgcct ctcccttatc gtcaatcttc tcgaggattg gggaccctgc 1920
gctgaacatg gagaacatca catcaggatt cctaggaccc cttctcgtgt tacaggcggg 1980
gtttttctag tagacaagaa tcctcacaat accgcaaagt ctagactcgt ggtggacttc 2040
tctcaatttt ctagggggaa ctaccgtgtg tcttggccaa aattcgcagt ccccaacctc 2100
caatcactca ccaacctcct gtcctccaac ttgtcctggt tatcgctgga tgtgtctgcg 2160
gcgttttatc atcttcctct tcatcctgct gctatgcctc atcttcttgt tggttcttct 2220
ggactatcaa ggtatgttgc ccgtttgtcc tctaattcca ggatcctcaa ccaccagcac 2280
gggaccatgc cgaacctgca tgactactgc tcaaggaacc tctatgtatc cctcctgttg 2340
ctgtaccaaa ccttcggacg gaaattgcac ctgtattccc atcccatcat cctgggcttt 2400
cggaaaattc ctatgggagt gggcctcagc ccgtttctcc tggctcagtt tactagtgcc 2460
atttgttcag tggttcgtag ggctttcccc cactgtttgg ctttcagtta tatggatgat 2520
gtggtattgg gggccaagtc tgtacagcat cttgagtccc tttttaccgc tgttaccaat 2580
tttcttttgt ctttgggtat acatttaaac cctaacaaaa caaagagatg gggttactct 2640
ctgaatttta tgggttatgt cattggaagt tatgggtcct tgccacaaga acacatcata 2700
caaaaaatca aagaatgttt tagaaaactt cctattaaca ggcctattga ttggaaagta 2760
tgtcaacgaa ttgtgggtct tttgggtttt gctgccccat ttacacaatg tggttatcct 2820
gcgttaatgc ccttgtatgc atgtattcaa tctaagcagg ctttcacttt ctcgccaact 2880
tacaaggcct ttctgtgtaa acaatacctg aacctttacc ccgttgcccg gcaacggcca 2940
ggtctgtgcc aagtgtttgc tgacgcaacc cccactggct ggggcttggt catgggccat 3000
cagcgcgtgc gtggaacctt ttcggctcct ctgccgatcc atactgcgga actcctagcc 3060
gcttgttttg ctcgcagcag gtctggagca aacattatcg ggactgataa ctctgttgtc 3120
ctctcccgca aatatacatc gtatccatgg ctgctaggct gtgctgccaa ctggatcctg 3180
cgcgggacgt cctttgttta cgtcccgtcg gcgctgaatc ctgcggacga cccttctcgg 3240
ggtcgcttgg gactctctcg tccccttctc cgtctgccgt tccgaccgac cacggggcgc 3300
acctctcttt acgcggactc cccgtctgtg ccttctcatc tgccggaccg tgtgcacttc 3360
gcttcacctc tgcacgtcgc atggagacca ccgtgaacgc ccaccgaatg ttgcccaagg 3420
tcttacataa gaggactctt ggactctctg caatgtcaac gaccgacctt gaggcatact 3480
tcaaagactg tttgtttaaa gactgggagg agttggggga ggagattaga ttaaaggtct 3540
ttgtactagg aggctgtagg cataaattgg tctgcgcacc agcaccatgc aactttttca 3600
cctctgccta atcatctctt gttcatgtcc tactgttcaa gcctccaagc tgtgccttgg 3660
gtggctttgg ggcatggaca tcgaccctta taaagaattt ggagctactg tggagttact 3720
ctcgtttttg ccttctgact tctttccttc agtacgagat ccactagttc tagagcggcc 3780
ccaaacaatt gctcaaaccg atacaattgt actttgtccc gagcaaatat aatcctgctg 3840
acggcccatc caggcacaaa cctcctgatt ggacggcttt tccatacacc cctctctcga 3900
aagcaatata tattccacat aggctatgtg gaacttaagc ttcctcgctc actgactcgc 3960
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 4020
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 4080
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4140
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4200
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4260
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4320
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4380
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 4440
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4500
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact ataagaacag 4560
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4620
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4680
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 4740
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 4800
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 4860
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 4920
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 4980
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 5040
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 5100
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 5160
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 5220
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 5280
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 5340
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 5400
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 5460
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 5520
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 5580
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 5640
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 5700
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 5760
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 5820
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 5880
ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcact 5940
cgaatatctg caggcgtatc acgaggccct ttcgtcttca 5980
<210> 36
<211> 1170
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding HBV envelope protein, Large Surface
protein (L)
<400> 36
atggggcaga atctttccac cagcaatcct ctgggattct ttcccgacca ccagttggat 60
ccagccttca gagcaaacac agcaaatcca gattgggact tcaatcccaa caaggacacc 120
tggccagacg ccaacaaggt aggagctgga gcattcgggc tgggtttcac cccaccgcac 180
ggaggccttt tggggtggag ccctcaggct cagggcatac tacaaacttt gccagcaaat 240
ccgcctcctg cctccaccaa tcgccagaca ggaaggcagc ctaccccgct gtctccacct 300
ttgagaaaca ctcatcctca ggccatgcag tggaattcca caacctttca ccaaactctg 360
caagatccca gagtgagagg cctgtatttc cctgctggtg gctccagttc aggagcagta 420
aaccctgttc cgactactgc ctctccctta tcgtcaatct tctcgaggat tggggaccct 480
gcgctgaaca tggagaacat cacatcagga ttcctaggac cccttctcgt gttacaggcg 540
gggtttttct tgttgacaag aatcctcaca ataccgcaaa gtctagactc gtggtggact 600
tctctcaatt ttctaggggg aactaccgtg tgtcttggcc aaaattcgca gtccccaacc 660
tccaatcact caccaacctc ctgtcctcca acttgtcctg gttatcgctg gatgtgtctg 720
cggcgtttta tcatcttcct cttcatcctg ctgctatgcc tcatcttctt gttggttctt 780
ctggactatc aaggtatgtt gcccgtttgt cctctaattc caggatcctc aaccaccagc 840
acgggaccat gccgaacctg catgactact gctcaaggaa cctctatgta tccctcctgt 900
tgctgtacca aaccttcgga cggaaattgc acctgtattc ccatcccatc atcctgggct 960
ttcggaaaat tcctatggga gtgggcctca gcccgtttct cctggctcag tttactagtg 1020
ccatttgttc agtggttcgt agggctttcc cccactgttt ggctttcagt tatatggatg 1080
atgtggtatt gggggccaag tctgtacagc atcttgagtc cctttttacc gctgttacca 1140
attttctttt gtctttgggt atacatttaa 1170
<210> 37
<211> 846
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding HBV envelope protein, Middle surface
protein (M)
<400> 37
atgcagtgga attccacaac ctttcaccaa actctgcaag atcccagagt gagaggcctg 60
tatttccctg ctggtggctc cagttcagga gcagtaaacc ctgttccgac tactgcctct 120
cccttatcgt caatcttctc gaggattggg gaccctgcgc tgaacatgga gaacatcaca 180
tcaggattcc taggacccct tctcgtgtta caggcggggt ttttcttgtt gacaagaatc 240
ctcacaatac cgcaaagtct agactcgtgg tggacttctc tcaattttct agggggaact 300
accgtgtgtc ttggccaaaa ttcgcagtcc ccaacctcca atcactcacc aacctcctgt 360
cctccaactt gtcctggtta tcgctggatg tgtctgcggc gttttatcat cttcctcttc 420
atcctgctgc tatgcctcat cttcttgttg gttcttctgg actatcaagg tatgttgccc 480
gtttgtcctc taattccagg atcctcaacc accagcacgg gaccatgccg aacctgcatg 540
actactgctc aaggaacctc tatgtatccc tcctgttgct gtaccaaacc ttcggacgga 600
aattgcacct gtattcccat cccatcatcc tgggctttcg gaaaattcct atgggagtgg 660
gcctcagccc gtttctcctg gctcagttta ctagtgccat ttgttcagtg gttcgtaggg 720
ctttccccca ctgtttggct ttcagttata tggatgatgt ggtattgggg gccaagtctg 780
tacagcatct tgagtccctt tttaccgctg ttaccaattt tcttttgtct ttgggtatac 840
atttaa 846
<210> 38
<211> 681
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding HBV envelope protein, Small surface
protein (S)
<400> 38
atggagaaca tcacatcagg attcctagga ccccttctcg tgttacaggc ggggtttttc 60
ttgttgacaa gaatcctcac aataccgcaa agtctagact cgtggtggac ttctctcaat 120
tttctagggg gaactaccgt gtgtcttggc caaaattcgc agtccccaac ctccaatcac 180
tcaccaacct cctgtcctcc aacttgtcct ggttatcgct ggatgtgtct gcggcgtttt 240
atcatcttcc tcttcatcct gctgctatgc ctcatcttct tgttggttct tctggactat 300
caaggtatgt tgcccgtttg tcctctaatt ccaggatcct caaccaccag cacgggacca 360
tgccgaacct gcatgactac tgctcaagga acctctatgt atccctcctg ttgctgtacc 420
aaaccttcgg acggaaattg cacctgtatt cccatcccat catcctgggc tttcggaaaa 480
ttcctatggg agtgggcctc agcccgtttc tcctggctca gtttactagt gccatttgtt 540
cagtggttcg tagggctttc ccccactgtt tggctttcag ttatatggat gatgtggtat 600
tgggggccaa gtctgtacag catcttgagt ccctttttac cgctgttacc aattttcttt 660
tgtctttggg tatacattta a 681
<210> 39
<211> 6682
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence of expression vector pcHA-HBe
<400> 39
gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900
taagcttggt accgagctcg gatccaccat gcaacttttt cacctctgcc taatcatctc 960
ttgttcatgt cctactgttc aagcctccaa gctgtgcctt gggtggcttt ggggcgtgga 1020
catctaccca tacgacgttc cagattacgc tggcatggac atcgaccctt ataaagaatt 1080
tggagctact gtggagttac tctcgttttt gccttctgac ttctttcctt cagtacgaga 1140
tcttctagat accgcctcag ctctgtatcg ggaagcctta gagtctcctg agcattgttc 1200
acctcaccat actgcactca ggcaagcaat tctttgctgg ggggaactaa tgactctagc 1260
tacctgggtg ggtgttaatt tggaagatcc agcatctaga gacctagtag tcagttatgt 1320
caacactaat atgggcctaa agttcaggca actcttgtgg tttcacattt cttgtctcac 1380
ttttggaaga gaaaccgtta tagagtattt ggtgtctttc ggagtgtgga ttcgcactcc 1440
tccagcttat agaccaccaa atgcccctat cctatcaaca cttccggaaa ctactgttgt 1500
tagacgacga ggcaggtccc ctagaagaag aactccctcg cctcgcagac gaaggtctca 1560
atcgccgcgt cgcagaagat ctcaatctcg ggaacctcaa tgttagtatt ccttggactc 1620
ataaggtggg gaactttact ggtctttatt cttctactgt acctgtcttt aatcctcatt 1680
ggaaaacacc atcttttcct aatatacatt tacaccaaga cattatcaaa aaatgtgaac 1740
agtttgtagg cccacttacg gaccgtgtgc acttcgcttc acctctgcac gtcgcatgga 1800
gaccaccgtg aacgcccacc gaatgttgcc caaggtctta cataagagga ctcttggact 1860
ctctgcaatg tcaacgaccg accttgaggc atacttcaaa gactgtttgt ttaaagactg 1920
ggaggagttg ggggaggaga ttagattaaa ggtctttgta ctaggaggct gtaggcataa 1980
attggtctgc gcaccagcac catgcaactt tttcacctct gcctaatcat ctcttgttca 2040
tgtcctactg ttcaagcctc caagctgtgc cttgggtggc tttggggcat ggacatcgac 2100
ccttataaag aaaagggcaa ttctgcagat atccagcaca gtggcggccg ctcgagtcta 2160
gagggcccgc ggttcgaagg taagcctatc cctaaccctc tcctcggtct cgattctacg 2220
cgtaccggtc atcatcacca tcaccattga gtttaaaccc gctgatcagc ctcgactgtg 2280
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 2340
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 2400
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 2460
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc 2520
agctggggct ctagggggta tccccacgcg ccctgtagcg gcgcattaag cgcggcgggt 2580
gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 2640
gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 2700
ggcatccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 2760
tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 2820
ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 2880
atctcggtct attcttttga tttataaggg attttgggga tttcggccta ttggttaaaa 2940
aatgagctga tttaacaaaa atttaacgcg aattaattct gtggaatgtg tgtcagttag 3000
ggtgtggaaa gtccccaggc tccccaggca ggcagaagta tgcaaagcat gcatctcaat 3060
tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 3120
atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta 3180
actccgccca gttccgccca ttctccgccc catggctgac taattttttt tatttatgca 3240
gaggccgagg ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga 3300
ggcctaggct tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa 3360
gagacaggat gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg 3420
gccgcttggg tggagaggct attcggctat gactgggcac aacagacaat cggctgctct 3480
gatgccgccg tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac 3540
ctgtccggtg ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg 3600
acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg 3660
ctattgggcg aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa 3720
gtatccatca tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca 3780
ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt 3840
gtcgatcagg atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc 3900
aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc 3960
ttgccgaata tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg 4020
ggtgtggcgg accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt 4080
ggcggcgaat gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag 4140
cgcatcgcct tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgcga 4200
aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt 4260
ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg 4320
cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg 4380
ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 4440
tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac cgtcgacctc 4500
tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 4560
cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 4620
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 4680
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 4740
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 4800
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 4860
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 4920
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 4980
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 5040
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 5100
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 5160
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 5220
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 5280
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 5340
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 5400
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 5460
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 5520
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 5580
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 5640
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 5700
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 5760
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 5820
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 5880
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 5940
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 6000
tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 6060
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 6120
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 6180
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 6240
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 6300
aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 6360
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 6420
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 6480
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 6540
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 6600
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 6660
ccgaaaagtg ccacctgacg tc 6682
<210> 40
<400> 40
000
<210> 41
<211> 39
<212> DNA
<213> Hepatitis B virus
<220>
<223> Nucleotide sequence encoding a HA-tag comprising 5’ - and 3’ -
additional nucleotides
<400> 41
gtggacatct acccatacga cgttccagat tacgctggc 39
<210> 42
<211> 13
<212> PRT
<213> Hepatitis B virus
<220>
<223> Amino acid sequence of a HA-tag comprising N-terminal and
C-terminal additional amino acids
<400> 42
Val Asp Ile Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly
1 5 10
<210> 43
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 43
attggatcca ccatgcaact ttttcacctc tgc 33
<210> 44
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 44
acagtagttt ccggaagtgt tgataggata gggg 34
<210> 45
<211> 123
<212> DNA
<213> Hepatitis B virus
<220>
<223> Wildtype HBV epsilon sequence
<400> 45
accatgcaac tttttcacct ctgcctaatc atctcttgtt catgtcctac tgttcaagcc 60
tccaagctgt gccttgggtg gctttggggc atggacatcg acccttataa agaatttgga 120
gct 123
<210> 46
<211> 138
<212> DNA
<213> Hepatitis B virus
<220>
<223> HBV epsilon sequence with HA-tag insertion
<400> 46
accatgcaac tttttcacct ctgcctaatc atctcttgtt catgtcctac tgttcaagcc 60
tccaagctgt gccttgggtg gctttggggc gtggacatct acccatacga cgttccagat 120
tacgctggca tggacatc 138
Claims (22)
- 하기 단계를 포함하는, 헤파드나바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법:
(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보 분자와 접촉시키는 단계;
여기서 핵산 분자는 하나 이상의 표지를 인코딩하는 서열을 포함하고,
서열은 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되고,
하나 이상의 표지를 인코딩하는 서열을 포함하는 상기 핵산 분자는 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입되고,
상기 핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하고, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 상기 하부 줄기와 염기쌍을 형성할 수 있는 서열은 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있음;
(b) 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 단계; 및
(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보 분자를 선택하는 단계. - 제 1 항에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 평가 방법.
- 제 1 항에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하거나; 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 평가 방법.
- 제 3 항에 있어서, 상기 표지가 헤마글루티닌 (HA)-표지, His-표지, Flag- 표지 (예컨대 1xFlag-표지 또는 3xFlag-표지), c-myc-표지, V5-표지 및/또는 C9-표지로 이루어지는 군에서 선택되는 평가 방법.
- 제 4 항에 있어서, 하기와 같은 평가 방법:
HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;
His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;
1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내고;
3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타내고;
c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;
V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는
C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타내거나;
HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;
His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;
1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내고;
3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타내고;
c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;
V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는
C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄. - 제 1 항에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 평가 방법.
- 제 6 항에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열이 SEQ ID NO: 15 에서 나타낸 바와 같은 B 형 간염 바이러스 프리코어 단백질의 핵산 서열이거나;
헤파드나바이러스 프리코어 단백질의 아미노산 서열이 SEQ ID NO: 17 에서 나타낸 바와 같은 B 형 간염 바이러스 프리코어 단백질의 아미노산 서열인 평가 방법. - 제 6 항에 있어서, 하나 이상의 표지를 인코딩하는 상기 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 핵산 분자가 헤파드나바이러스 게놈 또는 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에서 나타낸 바와 같은 B 형 간염 바이러스 (HBV) 게놈을 포함하는 평가 방법.
- 제 9 항에 있어서, 상기 HBV 게놈이 HBV 하위유전자형 ayw 의 게놈인 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조가 SEQ ID NO: 25 에서 나타낸 바와 같은 HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조인 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나;
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 평가 방법. - 제 2 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에서 나타내거나; 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 평가 방법.
- 제 6 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내거나; 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 상기 단계 (a) 가 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함하는 평가 방법:
(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;
(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;
(iii) 제 2 의 양성 가닥 DNA 의 합성 (이로써 상기 음성 가닥 DNA 및 상기 양성 가닥 DNA 가 이중 가닥 이완 환형 DNA 를 형성함)
(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;
(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 임의 회복;
(vi) 표지된 헤파드나바이러스 e 항원을 인코딩하는 mRNA 의 전사;
(vii) 표지된 헤파드나바이러스 e 항원의 번역,
여기서, 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복은 시작 코돈의 회복임. - 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 ELISA, CLIA 또는 AlphaLISA 에 의해 수행되는 평가 방법.
- 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 상기 헤파드나바이러스 e 항원을 특이적으로 인지하는 항체 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체의 사용을 포함하는 평가 방법.
- 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로서, 여기서 핵산 분자가 하나 이상의 표지를 인코딩하는 서열을 포함하고, 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되고, 하나 이상의 표지를 인코딩하는 서열을 포함하는 상기 핵산 분자가 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입되고, 상기 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하고, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 상기 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는, 핵산 분자.
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462014996P | 2014-06-20 | 2014-06-20 | |
US62/014,996 | 2014-06-20 | ||
PCT/EP2015/063838 WO2015193484A1 (en) | 2014-06-20 | 2015-06-19 | Tagged hepadnavirus e antigen and its use in screening antiviral substances |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170068411A KR20170068411A (ko) | 2017-06-19 |
KR102309355B1 true KR102309355B1 (ko) | 2021-10-06 |
Family
ID=53498969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167035519A KR102309355B1 (ko) | 2014-06-20 | 2015-06-19 | 표지된 헤파드나바이러스 e 항원 및 항바이러스 물질 스크리닝에서의 이의 용도 |
Country Status (10)
Country | Link |
---|---|
US (2) | US10072047B2 (ko) |
EP (2) | EP3157944B1 (ko) |
JP (1) | JP6543338B2 (ko) |
KR (1) | KR102309355B1 (ko) |
CN (1) | CN106716128B (ko) |
BR (1) | BR112016024458A2 (ko) |
CA (1) | CA2943047C (ko) |
MX (1) | MX2016014359A (ko) |
RU (1) | RU2711750C2 (ko) |
WO (1) | WO2015193484A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108611395A (zh) * | 2016-12-12 | 2018-10-02 | 中山大学 | 一种抗人乙肝病毒药物的筛选方法 |
CN107022543A (zh) * | 2017-05-25 | 2017-08-08 | 郑州市第六人民医院 | 一种提取乙型肝炎病毒核酸用磁珠、提取试剂、提取方法、定量检测用试剂盒 |
WO2020072207A1 (en) * | 2018-10-04 | 2020-04-09 | The Rockefeller University | Rna-based methods to launch hepatitis b virus infection |
CA3149041A1 (en) * | 2019-08-29 | 2021-03-04 | Serhat GUMRUKCU | Compositions and methods for treating viral infections |
US20230323369A1 (en) * | 2020-06-24 | 2023-10-12 | Xiamen University | Screening model and method for hbv cccdna-targeting drug |
CN113293179A (zh) * | 2021-05-10 | 2021-08-24 | 武汉科技大学 | 一种靶向敲除HBx蛋白的质粒及其构建方法和应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013181584A2 (en) | 2012-06-01 | 2013-12-05 | Guo, Ju-Tao | Modulation of hepatitis b virus cccdna transcription |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5491084A (en) | 1993-09-10 | 1996-02-13 | The Trustees Of Columbia University In The City Of New York | Uses of green-fluorescent protein |
CN101104867A (zh) * | 2006-07-10 | 2008-01-16 | 中国人民解放军第四军医大学 | 检测乙型肝炎病毒cccDNA的巢式-实时定量PCR方法 |
-
2015
- 2015-06-19 MX MX2016014359A patent/MX2016014359A/es active IP Right Grant
- 2015-06-19 CA CA2943047A patent/CA2943047C/en active Active
- 2015-06-19 CN CN201580032914.9A patent/CN106716128B/zh active Active
- 2015-06-19 RU RU2016152429A patent/RU2711750C2/ru active
- 2015-06-19 WO PCT/EP2015/063838 patent/WO2015193484A1/en active Application Filing
- 2015-06-19 JP JP2017518599A patent/JP6543338B2/ja active Active
- 2015-06-19 EP EP15733379.0A patent/EP3157944B1/en active Active
- 2015-06-19 KR KR1020167035519A patent/KR102309355B1/ko active IP Right Grant
- 2015-06-19 US US15/309,680 patent/US10072047B2/en active Active
- 2015-06-19 BR BR112016024458A patent/BR112016024458A2/pt not_active Application Discontinuation
- 2015-06-19 EP EP19158753.4A patent/EP3521303A1/en active Pending
-
2018
- 2018-05-16 US US15/981,316 patent/US10214567B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013181584A2 (en) | 2012-06-01 | 2013-12-05 | Guo, Ju-Tao | Modulation of hepatitis b virus cccdna transcription |
Non-Patent Citations (3)
Title |
---|
C.Y.Yang et al., Journal of Biological Chemistry, Vol. 281, No. 45, 2006, pp. 34525-34536. |
D.Cai et al., Antimicrobial Agents and Chemotherapy, Vol. 56, No. 8, 2012, pp. 4277-4288. |
Haitao Guo et al., Antiviral Research, Vol. 72, No. 2, 2006, pp. 116-124. |
Also Published As
Publication number | Publication date |
---|---|
WO2015193484A1 (en) | 2015-12-23 |
US10214567B2 (en) | 2019-02-26 |
RU2016152429A3 (ko) | 2019-02-27 |
US20170240600A1 (en) | 2017-08-24 |
CN106716128A (zh) | 2017-05-24 |
MX2016014359A (es) | 2017-06-12 |
RU2016152429A (ru) | 2018-07-23 |
JP6543338B2 (ja) | 2019-07-10 |
CN106716128B (zh) | 2020-06-23 |
US10072047B2 (en) | 2018-09-11 |
EP3521303A1 (en) | 2019-08-07 |
KR20170068411A (ko) | 2017-06-19 |
RU2711750C2 (ru) | 2020-01-21 |
EP3157944A1 (en) | 2017-04-26 |
CA2943047C (en) | 2023-03-14 |
JP2017518081A (ja) | 2017-07-06 |
EP3157944B1 (en) | 2019-10-09 |
BR112016024458A2 (pt) | 2017-10-10 |
US20180312546A1 (en) | 2018-11-01 |
CA2943047A1 (en) | 2015-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10214567B2 (en) | Tagged hepadnavirus E antigen and its use in screening antiviral substances | |
CA2443323C (en) | Nucleic acid vaccines for prevention of flavivirus infection | |
Howe et al. | Localization of Epstein-Barr virus-encoded small RNAs by in situ hybridization. | |
Yu et al. | Multiple functions of capsid protein phosphorylation in duck hepatitis B virus replication | |
Sheng et al. | The DnaJ domain of polyomavirus large T antigen is required to regulate Rb family tumor suppressor function | |
Nakanishi et al. | Association with capsid proteins promotes nuclear targeting of simian virus 40 DNA. | |
US20020151680A1 (en) | Materials and methods involving hybrid vascular endothelial growth factor DNAs and proteins | |
WO2010126590A1 (en) | Ptp1b inhibitors | |
JP2002514416A (ja) | IgEの合成、分泌、スィッチ再編成の調節剤をスクリーニングするための方法および組成物 | |
Riley et al. | Tiny T antigen: an autonomous polyomavirus T antigen amino-terminal domain | |
CN113444830A (zh) | 用于检测SARS-CoV-2冠状病毒的试剂盒及其专用引物和探针 | |
CN103773803A (zh) | 表达猪o型口蹄疫病毒vp1蛋白的重组牛副流感病毒载体 | |
Klöcker et al. | Endotoxin stimulates liver macrophages to release mediators that inhibit an early step in hepadnavirus replication | |
CN110656088A (zh) | 一种稳定表达人源CaSR基因的细胞模型及其构建方法 | |
AU782255B2 (en) | Gene transfer vectors for treating autoimmune diseases and diseases with immunopathogenesis by therapy | |
JP5468780B2 (ja) | 産生能を増大させるタンパク質因子、新規な細胞株及びその使用 | |
WO2011145885A2 (ko) | B형 간염 치료활성 물질의 스크리닝용 조성물 및 스크리닝 방법 | |
US20220290161A1 (en) | Rna-regulated fusion proteins and methods of their use | |
CN111041027B (zh) | 一种Atg12基因敲除细胞系构建方法及其应用 | |
CN112646838B (zh) | 一种hspa13基因表达载体及其构建方法和应用 | |
KR100514979B1 (ko) | 갈렉틴-3 관련 질병을 예방 및 치료하기 위한 약학 조성물 | |
KR102596599B1 (ko) | 미토콘드리아 표적화 서열을 포함하는 면역질환의 예방 또는 치료용 조성물 | |
KR20210030414A (ko) | 조작된 수용체 세포로의 핵산 서열의 재조합효소 매개 카세트 교환 통합 동안 세포의 추적 및 조작을 위한 세포 표면 태그 교환(cste) 시스템 | |
KR100321444B1 (ko) | 곤충세포를이용한씨(C)형간염바이러스의핵(Core22)단백질의제조 | |
US5843736A (en) | Prevention of viral infection by the induction of apoptosis and/or the use of an antiviral gene, hem1 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |