KR102309355B1

KR102309355B1 - 표지된 헤파드나바이러스 e 항원 및 항바이러스 물질 스크리닝에서의 이의 용도

Info

Publication number: KR102309355B1
Application number: KR1020167035519A
Authority: KR
Inventors: 하이타오 궈; 다웨이 카이; 앤드리 커코네티; 창화 지
Original assignee: 드렉셀유니버시티; 바루쉬 에스. 블럼버그 인스티튜트; 에프. 호프만-라 로슈 아게
Priority date: 2014-06-20
Filing date: 2015-06-19
Publication date: 2021-10-06
Also published as: WO2015193484A1; US10214567B2; RU2016152429A3; US20170240600A1; CN106716128A; MX2016014359A; RU2016152429A; JP6543338B2; CN106716128B; US10072047B2; EP3521303A1; KR20170068411A; RU2711750C2; EP3157944A1; CA2943047C; JP2017518081A; EP3157944B1; BR112016024458A2; US20180312546A1; CA2943047A1

Abstract

본 발명은 항-헤파드나바이러스 물질을 스크리닝하기 위한 방법 및 용도에 관한 것이며, 여기서 상기 물질은 헤파드나바이러스, 예컨대 B 형 간염 바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 능력에 대해 스크리닝된다. 상기 방법 및 용도는 표지된 헤파드나바이러스 e 항원, 예컨대 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 세포를 이용한다. 또한, 본 발명은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열 및 그로써 인코딩된 단백질을 제공한다. 또한 스크리닝 방법에서 사용되는 키트가 제공된다.

Description

표지된 헤파드나바이러스 E 항원 및 항바이러스 물질 스크리닝에서의 이의 용도 {TAGGED HEPADNAVIRUS E ANTIGEN AND ITS USE IN SCREENING ANTIVIRAL SUBSTANCES}

본 발명은 미국 국립 보건원 (National Institutes of Health) 에 의해 수여받은 계약 번호 R01AI094474 하에 정부 지원으로 이루어졌다. 미국 정부는 본 발명에서 특정 권리를 갖는다.

본 발명은 항-헤파드나바이러스 물질을 스크리닝하기 위한 방법 및 용도에 관한 것이며, 여기서 상기 물질은 본 발명에서 기재된 세포주에서 대부분 공유결합 폐환형 (covalently closed circular) (ccc) DNA-의존적인 B 형 간염 e 항원 (HBeAg) 의 저해제이며 헤파드나바이러스, 예컨대 B 형 간염 바이러스 (HBV) 의 ccc DNA 를 저해하는 능력에 대해 스크리닝된 cccDNA 에 대한 대리 마커로서 역할할 수 있다. 상기 방법 및 용도는 표지된 헤파드나바이러스 e 항원, 예컨대 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 세포를 이용한다. 또한, 본 발명은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열 및 그로써 인코딩된 단백질을 제공한다. 또한 스크리닝 방법에서 사용되는 키트가 제공된다.

만성 B 형 간염은 전세계에서 대략 3 억 5 천만명 및 미국에서 120 만명 이상에게 발병하는 현재 실질적인 공중 위생 문제점이다. 이들 환자는 간 경화증, 간세포 암종 (HCC) 및 기타 중증 임상 후유증의 증가한 위험성을 갖는다 (1, 2, 12, 14). 연간, 전세계적으로 약 100 만명이 HBV-관련 간 질환으로 인해 사망한다. 따라서 이는 만성 HBV 감염을 치료하고 그의 심각한 결과를 예방하기 위한 세계적 건강 우선순위이다.

B 형 간염 바이러스 (HBV) 는 헤파드비리대 (Hepadnaviridae) 패밀리에 속하는 비세포변성, 간 향성 (liver tropic) DNA 바이러스이다. 헤파드나바이러스는 인간 및 동물에서 간 감염을 일으킬 수 있는 외피형, 이중가닥 바이러스의 패밀리이다. 헤파드나바이러스는 유사한 게놈 조직을 공유한다. 이들은 일부 이중가닥 환형 DNA 의 작은 게놈을 갖는다. 게놈은 DNA 의 2 개 가닥으로 이루어지며, 하나는 음성-가닥 (negative-sense) 배향을 갖고 다른 가닥은 양성-가닥 (positive-sense) 배향을 갖는다. 복제는 프리게놈 RNA 로 불리는 RNA 중간체의 역전사를 포함한다 (15, 19). 3 개의 주요 개방 판독 프레임 (ORF) 이 인코딩되며 바이러스는 5 개의 공지된 mRNA 를 갖는다 (18, 19).

감염시, 바이러스 게놈 이완 환형 (rc) DNA 가 세포 핵에 이송되며 에피솜 공유결합 폐환형 (ccc) DNA 로 변환되는데, 이는 모든 바이러스 mRNA 에 대한 전사 주형으로서 역할한다 (HBeAg 에 대한 전구체인 프리코어 단백질을 인코딩하는 특히 3.5-3.6kb 프리코어 mRNA; 코어 단백질 및 바이러스 중합효소를 인코딩하는 3.5kb 프리게놈 (pg) RNA; 바이러스 외피 단백질 (대 (L), 중 (M) 및 소 (S) 항원) 을 인코딩하는 2.4kb/2.1kb 표면 mRNA; 및 X 단백질에 대한 0.7kb X mRNA (18, 19). HBeAg 는 프리코어 단백질의 C-말단 아르기닌-풍부 서열 및 N-말단 신호 펩티드를 제거하는 2 가지 단백질분해 이벤트에 의해 생성된다 (Wang (1991) J Virol 65(9), 5080 (10, 21). 전사 및 핵 배출 후, 세포질 바이러스 pgRNA 가 HBV 중합효소 및 캡시드 단백질과 어셈블링되어 뉴클레오캡시드를 형성하고, 그의 내부에서 중합효소-촉매화된 역전사가 마이너스-가닥 DNA 를 산출하여, 이후 플러스-가닥 DNA 로 카피되어 자손 rcDNA 게놈을 형성한다. 새로이 합성된 성숙한 뉴클레오캡시드는 바이러스 외피 단백질로 패키징되어 비리온 입자로서 배출되거나, 핵으로 다시 왕복하여 세포내 cccDNA 증폭 경로를 통해 cccDNA 저장소를 증폭시킬 것이다 (19). 따라서, 만성 B 형 간염에 대한 분자적 기초는 감염된 간세포의 핵에서의 바이러스 cccDNA 의 지속성이다.

만성 B 형 간염에 대한 확정적인 치료법은 존재하지 않는다. HBV 치료에 대한 현재 승인 약물은 인터페론-α (IFN-α) 및 5 개 뉴클레오시(티)드 유사체 (라미부딘, 아데포비르, 엔테카비르, 텔비부딘 및 테노포비르) 이다. [Xu (2010) J Virol (84) 9332-9340] 은 마우스 인터페론으로의 마우스 간세포 치료를 개시하고 있다. IFN-α 는 48 주 표준 치료 후, 유의한 역효과와 함께 환자의 소수 군에서 지속된 바이러스학적 반응을 달성한다 (9). 5 개의 뉴클레오시(티)드 유사체 (NA) 는 모두 바이러스 중합효소 저해제로서 역할하지만, 드물게 HBV 감염을 치유하고 (6), 저항성 출현은 그의 장기간 효능을 극적으로 제한한다 (16, 24). 현 치료의 주요한 제한이 이전부터 존재하는 cccDNA 풀 (pool) 을 제거하고/하거나 트레이스-레벨 (trace-level) 야생형 또는 약물 저항성 바이러스로부터의 cccDNA 형성을 방지하는 것의 실패라는 점이 이제 널리 알려져 있다. 따라서 cccDNA 형성 및 유지를 직접적으로 표적화하는 신규한 치료제의 개발에 대한 긴급한 충족되지 않은 필요성이 존재한다.

[Cai (2013) Methods in Mol Biol 1030 (151-161)] 은 세포 배양물로부터의 HBV ccc (공유결합 폐환) DNA 의 검출을 위한 서던 (southern) 블롯 검정을 개시하고 있다. 지금까지, 항-cccDNA 제제에 대한 스크리닝은 효율적 시험관내 (in vitro) HBV 감염 모델의 부족 및 고-처리량 내지 중간-처리량 포맷으로의 cccDNA 측정을 위한 실제적 접근법이 이용 불가하였기 때문에 제한되어왔다. 대안적으로, cccDNA 형성은 HepG2.2.15 및 HepAD38 세포에 의해 나타내는 바와 같이, 구성적 또는 조건적으로 HBV 게놈을 복제하는 안정적-트랜스펙션된 HBV 세포 배양물에서의 세포내 증폭 경로를 통해 달성될 수 있다 (7, 11, 20).

그러나, 서던 블롯 혼성화 또는 실시간 PCR 검정에 의한 HBV 세포주로부터의 직접적 cccDNA 검출은 각각 민감성 및 특이성 논쟁으로 인해 스크리닝될 수 없다. 한편, HepG2.2.15 세포에서 cccDNA 에 대한 적합한 대리 마커가 존재하지 않는데, 이는 대부분의 바이러스 생성물이 통합된 바이러스 이식유전자에서 유래하여, cccDNA 기여와 구별되지 않기 때문이다. 분비된 HBeAg 의 생성이 HepAD38 세포에서 대부분 cccDNA-의존적이며 cccDNA 에 대한 대리 마커로서 역할할 수 있다는 것이 이미 보고된 바 있다 (11, 23). 최근, [Cai, et al.] 은 오직 cccDNA-의존적인 HBeAg 생성 세포주의 업그레이드 버전, 즉 HepDE19 세포 (7) 를 cccDNA 저해제의 스크리닝을 위한 96-웰 포맷 검정에 적용하였으며 cccDNA 형성을 저해하는 2 개의 소분자 화합물을 확인하였다 (3). 따라서 이러한 작업은, cccDNA 생합성이 화학 분자에 의해 직접적으로 표적화될 수 있으며, cccDNA 저해제가 고처리량 스크리닝 캠페인으로부터 확인될 수 있었다는 견고한 "개념 입증 (proof-of-concept)" 설명을 제공하였다. 그러나, 존재하는 HepDE19 검정 시스템의 특정한 불리한 점은 더 큰 라이브러리의 스크리닝이 실행불가하게 만든다는 것이다. 예를 들어, HBeAg 에 대해 현재 사용되는 고전적 ELISA 검정은 여러 조작을 필요로 하고, 아미노산 서열 상동성으로 인한 바이러스 코어 단백질과의 교차 반응의 특정 정도를 나타내며, 더 큰 포맷의 세포 기반 검정에 적합하지 않다.

따라서, 본 발명에 근원적인 기술적 문제점은 헤파드나바이러스 cccDNA 의 저해제를 안정적으로 스크리닝하는 수단 및 방법의 제공이다.

기술적 문제점은 특허청구범위에 특징화된 구현예의 제공에 의해 해결된다.

따라서 본 발명은 하기 단계를 포함하는, 헤파드나바이러스의 ccc (공유결합 폐환) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법에 관한 것이다:

(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보물 분자와 접촉시키는 단계;

(b) 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 단계; 및

(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보물 분자를 선택하는 단계.

상기 방법은 일반적으로 기타 포유류 및 조류 헤파드나바이러스, 예컨대 대표적 마멋 간염 바이러스 (WHV) 및 오리 B 형 간염 바이러스 (DHBV) (B 형 간염 바이러스 (HBV) 와 유사한 유전자 조직 및 복제 계획을 공유함) 에 적용가능하다. 본원에 제공된 B 형 간염 바이러스에 관한 설명 및 실험은 다른 헤파드나바이러스에 대해서도 마찬가지로 적용된다. 그러나, 본원에 제공된 교시는 "B 형 간염 바이러스"/HBV 에 대한 바람직한 구현예에 관한 것이다. 용어 "헤파드나바이러스", "B 형 간염 바이러스", "오리 B 형 간염 바이러스", "마멋 간염 바이러스 (WHV)" 는 당업계에 널리 공지되어 있으며 여기서 그에 따라 사용된다. 약어 "HBV", "DHBV" 또는 "WHV" 는 여기서 각각 전체 명칭 "B 형 간염 바이러스", "오리 B 형 간염 바이러스" 및 "마멋 간염 바이러스" 와 상호교환가능하게 사용된다.

여기서 바람직한 헤파드나바이러스는 바람직하게는 B 형 간염 바이러스 (HBV) 이다. B 형 간염 바이러스 (HBV) 는 헤파드나비리대 패밀리에 속하는 비세포변성, 간 향성 DNA 바이러스이며, 즉 HBV 는 헤파드나바이러스이다. HBV 게놈의 예시적 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다.

여기서 바람직한 헤파드나바이러스 e 항원은 B 형 간염 바이러스 e 항원 (HBeAg) 이다. 용어 "B 형 간염 바이러스 e 항원" 및 "HBeAg" 는 여기서 상호교환가능하게 사용된다. HBeAg 의 예시적 핵산 서열 및 아미노산 서열을 각각 SEQ ID NO: 16 및 18 에서 나타낸다. 본원에서 사용하는 바와 같이 "헤파드나바이러스 e 항원" (및 마찬가지로 "B 형 간염 바이러스 e 항원") 은 주로 단백질/폴리펩티드, 예를 들어 SEQ ID NO: 18 에서 나타낸 바와 같은 아미노산 서열을 갖는 단백질/폴리펩티드를 나타낸다.

HBeAg 는 감염시 하기와 같이 생성될 수 있다: 감염시, HBV 바이러스 게놈 이완 환형 (rc) DNA 가 세포 핵 내로 이송되고 에피솜 cccDNA 로 변환되어, 모든 바이러스 mRNA (HBeAg 에 대한 전구체인 프리코어 단백질을 인코딩하는 3.5-3.6kb 프리코어 mRNA 포함) 에 대한 전사 주형으로서 역할한다. 용어 "ccc DNA" 및 "공유결합 폐환형 DNA" 는 여기서 상호교환가능하게 사용된다.

HBV 프리코어 단백질의 예시적 핵산 서열 및 아미노산 서열은 각각 SEQ ID NO: 15 및 17 에서 나타낸다. HBV 프리코어 단백질은 N-말단 19-아미노산 신호 펩티드, 10-아미노산 링커, 중심 아미노산 스트레치 및 C-말단 34-아미노산 아르기닌-풍부 도메인을 갖는다.

HBV 코어 단백질의 예시적 핵산 서열 및 아미노산 서열은 각각 SEQ ID NO: 23 및 24 에서 나타낸다. 코어 단백질은 이것이 프리코어 단백질의 C-말단 아르기닌-풍부 서열을 포함하지만; 코어 단백질이 프리코어 단백질의 10-아미노산 링커 서열 및 N-말단 신호 펩티드를 포함하지 않는다는 점에서 프리코어 단백질에 상응한다 (SEQ ID NO: 17 참조).

HBeAg 는 프리코어 단백질의 C-말단 아르기닌-풍부 서열 및 N-말단 신호 펩티드를 제거하는 2 가지 단백질분해 이벤트에 의해 생성된다 (Wang (1991) J Virol 65(9), 5080 (21)). 따라서, B 형 간염 바이러스 e 항원 (HBeAg) 은 이것이 프리코어 단백질의 N-말단 10-aa 링커 펩티드를 포함하지만; HBeAg 가 프리코어 단백질의 C-말단 아르기닌-풍부 서열을 포함하지 않는다는 점에서 프리코어 단백질에 상응한다 (SEQ ID NO: 17 참조).

만성 B 형 간염에 대한 분자적 기초는 감염된 간세포의 핵에서의 바이러스 cccDNA 의 지속성이다.

용어 "공유결합 폐환형 DNA (covalently closed circular DNA)" 및 "cccDNA" 는 여기서 상호교환가능하게 사용된다. 용어 "공유결합 폐환형 DNA"/ "cccDNA" 는 당업계에 널리 공지되어 있으며 그에 따라 여기서 사용된다. 일반적으로, 본원에서 사용하는 바와 같은 "공유결합 폐환형 DNA"/ "cccDNA" 는 헤파드나바이러스 mRNA 에 대한 실제 에피솜 전사 주형으로서 역할하는 DNA 를 나타낸다.

B 형 간염 바이러스 e 항원 (HBeAg) 은 만성 헤파드나바이러스 감염을 반영하는 HBV 헤파드나바이러스의 cccDNA 에 대한 허용된 대리 마커이다. 아직까지, HBeAg 를 이용하는 공지된 세포 기반 검정은 바이러스 코어 단백질과의 교차 반응과 같은 불리한 점을 갖는다.

cccDNA 리포터 검출의 특이성 및 민감성을 개선시키기 위해, 여기서 표지 (예컨대 N-말단 포매된 헤마글루티닌 (HA) 에피토프 표지) 를 갖는 재조합체 HBeAg 의 cccDNA-의존적 생성을 지지하는 세포주를 확립하였다. 더욱이, (HA-)표지된 HBeAg 의 검출을 위한 화학발광 ELISA (CLIA) 및 AlphaLISA 검정을 개발하였다. 검정 시스템은 고처리량 스크리닝 포맷 및 완전 자동화에 허용가능하다.

본원에 제공된 방법은 확립된 표지 (예컨대 HA-표지, 또는 His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지 (HA-표지 대신에 또는 이에 추가로 사용할 수 있음) 를 사용한다. 이러한 표지는 표지된 헤파드나바이러스 e 항원의 정제 및 검출에서 사용될 수 있다. 표지에 특이적으로 결합하는 항체를 사용하여 (예를 들어 ELISA 검정, 예컨대 화학발광 ELISA (CLIA) 및 AlphaLISA 를 통해), 표지된 헤파드나바이러스 e 항원의 수준은 안정적이고 신속하게 평가될 수 있으며 코어 단백질과의 교차 반응이 방지될 수 있다.

본원에 제공된 방법은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 이용한다. 핵산 분자는 헤파드나바이러스 프리코어 단백질을 인코딩하는 서열 또는 헤파드나바이러스 게놈을 포함하여, 헤파드나바이러스의 cccDNA 의 형성을 반영하고 가능하게 할 수 있다. 당업계에서는 HBV 게놈이, 오버랩된 ORF 및 다수의 시스 (cis) 요소를 나타내는 고도로 압축된 유전자 구조를 갖는다는 것이 공지되어 있다. 따라서, 유전자 삽입/결실 또는 서열 교체가 바이러스 DNA 감염에 매우 영향을 줄 가능성이 있다고 여겨졌다 (13, 22) (Liu, et al, J Virol. 2004; 78(2):642-9.)(Wang, et al. PLoS One. 2013 2; 8(4):e60306). 이전의 작업이 GFP 에 의해 교체된 HBV 서열, 예컨대 대부분의 경우 pol/외피 코딩 부위를 가짐으로써 재조합체 HBV 게놈을 생성시키지만, 바이러스 복제 및 비리온 어셈블리를 지지하기 위해 바이러스 단백질의 트랜스-보체가 필요하였다 (17)(Protzer, et al, PNAS (1999), 96: 10818-23.). 더욱이 이러한 보고된 재조합체 HBV 게놈은 허용 (permissive) 세포 감염에 사용되는 경우 단지 제 1 라운드 cccDNA 합성을 만들 수 있어, cccDNA 의 세포내 증폭이 결손 바이러스 DNA 복제로 인해 차단된다.

헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 에서의 5' 줄기-루프 구조 (엡실론) 는 바이러스 복제를 위한 필수적 시스 요소이다. 이는 pgRNA 패키징 신호 및 DNA 프라이밍 (priming) 위치로서 역할한다. 엡실론은 프리코어 ORF 의 5' 부분과 오버랩되며 캡시드 (코어) 단백질 ORF 의 시작 코돈을 포함한다. HBV 게놈에 의해 인코딩된 엡실론 구조의 무결성 (integrity) 을 변경하지 않고 프리코어 ORF 에서의 N-말단 신호 펩티드 서열의 표지 다운스트림을 인코딩하는 핵산 서열을 삽입하기 위해, (HA-)표지의 5' 말단에서 3 개 아미노산 링커 서열을 이에 도입하여 (GTG GAC ATC), HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 하부에서 우측 암 (arm) 의 본래 바이러스 서열 (ATG GAC ATC) 을 교체하였다. HBV 게놈에 의해 인코딩된 바와 같은 엡실론의 염기 짝지음이 유지되었고, 코어 ORF 의 시작 코돈이 HBV 게놈에 의해 인코딩된 바와 같은 엡실론의 다운스트림 위치로 이동되었다. 또한, 본래 GGC 서열이 HA-표지 서열과 코어 AUG 사이에 위치하여 코어 시작 코돈의 실제 코작 (Kozak) 모티프가 유지되었다 (도 1). 도 1 은 표지를 인코딩하는 핵산 서열이 본 발명에 따라 삽입되는 엡실론 구조를 인코딩하는 HBV 게놈의 일부를 나타낸다.

상기 변형이 HBV pgRNA-의존적 코어 발현 및 pgRNA 캡시드화 (encapsidation) 에 대한 최소 효과를 초래하는데, 이는 코어 단백질의 번역 개시 위치가 pgRNA 주형에서 39-nt 더 다운스트림으로 이동하였음에도 불구하고 엡실론 및 코어 발현 카세트가 보존되었기 때문인 것으로 구상되었다. 실제로, 재조합체 HBV 게놈은 바이러스 DNA 복제의 야생형 수에 가깝게 지지되었으며, HA-표지된 HBeAg 는 cccDNA 분자에서 프리코어 ORF 의 재구성시 성공적으로 생성되었다.

표지를 인코딩하는 올리고의 삽입은 바이러스 DNA 적용에 영향을 주지 않았으며, 따라서 여기서 제공된 방법은, cccDNA 이 생성되게 하고 결과적으로 대리 마커 "표지된 헤파드나바이러스 e 항원" 의 양을 측정함으로써 cccDNA 형성을 저해하는 물질/후보 분자의 능력이 평가되게 한다. 본원에 제공된 수단 및 방법은 주로, 헤파드나바이러스와 관련된 만성 질환, 예컨대 (만성) 간염 및 특히 만성 B 형 간염 감염의 치료요법에서 사용할 수 있는 후보 문자를 스크리닝하고 확인하는데 유용하다.

표지 (예컨대 HA-표지) 를 인코딩하는 핵산 서열을 헤파드나바이러스 (예컨대 HBV) 프리코어 ORF 에 삽입하는 것은, 개선된 항원 검출 특이성에 유용한 표지된 헤파드나바이러스 e 항원 (예컨대 HBeAg) 의 헤파드나바이러스 (예컨대 HBV) cccDNA-의존적 생성을 초래한다. 본 발명을 지지하여, (HA-)표지 삽입이 프리코어 단백질의 발현 및 그의 후속 번역후 프로세싱 (N-말단 신호 펩티드 절단 및 C-말단 도메인 절단) 및 성숙한 HBeAg 분비에 영향을 주지 않는다는 것이 확인되었다 (도 2). 보다 중요하게, 헤파드나바이러스 (예컨대 HBV) 게놈에서의 이러한 변형이 세포내 증폭 경로를 통한 cccDNA 형성에 필수 조건인 바이러스 pgRNA 캡시드화 및 역전사를 방해하지 않는다는 것이 여기서 나타났다 (도 4, 6-8, 12).

본 발명은 헤파드나바이러스에 대하여 그의 활성에 대한 약리학 제제의 스크리닝 및 평가에 관한 것이다. 특히, 본 발명은 재조합체 B 형 간염 바이러스 (HBV) 게놈 및 HBV cccDNA-의존적 에피토프 (예를 들어 인간 인플루엔자 헤마글루티닌 (HA) 표지)-표지된 HBV e 항원 (HBeAg) 의 유도성 발현을 위한 신규한 세포주의 설계 및 구성을 기재한다. 배양액에 분비된 표지된 HBeAg 는 예를 들어 화학발광 효소 면역검정 (CLIA) 및/또는 AlphaLISA 에 의해 정량적으로 측정될 수 있다. 본 발명은 항-헤파드나바이러스 활성에 대해 화합물, 특히 cccDNA 형성, 유지 및/또는 이의 전사 활성을 저해하는 것들을 스크리닝하기 위한 효과적 세포 기반 HBV 리포터 시스템을 제공한다.

본 발명은 추가로 도 10 에서 설명된다. 여기서, 3TC 가 바이러스 DNA 복제를 차단한 극한 조건이었으며 따라서 cccDNA 가 합성되지 않았음에도 불구하고, 3TC 처리가 HepBHAe13 세포에서 HA-HBeAg 신호를 파괴하였다는 것이 나타났다. 또한, 원리의 증거로서, 2 개의 cccDNA 형성 저해제 (CCC-0975 및 CCC-0346) 를 HepBHAe13 세포에서 시험하였다. 두 화합물 모두 HA-HBeAg 수준을 용량 독립적으로 감소시켰다; 도 11 참조.

예를 들어, 하기의 비제한적 항-헤파드나바이러스 검정을 본 발명에 따라 수행할 수 있다:

1. HepBHAe 세포주를 사용하는 cccDNA 안정성 및/또는 전사 활성을 조절하는 화합물/후보 분자의 스크리닝

본 발명에 따라, 시험관내 검정 방법을 사용하여 핵에서의 cccDNA 안정성 또는 전사 활성을 조절하는 화합물/후보 분자의 효능을 스크리닝/평가할 수 있다. 그로써 화합물/후보 분자는 배양물 상청액에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 수준을 변경시킨다. 검정을 수행하기 위해, 테트라사이클린의 존재 하에 배양 플레이트에 세포를 먼저 시딩할 수 있으며, 세포가 융합성에 도달한 후, 배지를 테트라사이클린-불포함 배지로 교체하여 헤파드나바이러스 (예컨대 HBV) DNA 복제 및 cccDNA 형성을 유도할 것이며, 이는 보통 6-8 일이 걸린다. 그 이후, 테트라사이클린을 다시 첨가하여 통합된 HBV 게놈으로부터 드 노보 (de novo) 바이러스 DNA 복제를 정지시키고, 이와 함께 3TC (또는 기타 HBV 중합효소 저해제) 를 첨가하여 cccDNA 의 세포내 증폭 경로를 차단할 수 있다. 동시에, 시험 화합물을 특정 기간 동안 배양 배지에 첨가할 수 있다. 배양 배지를 이후 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 ELISA 측정에 사용할 수 있다. 시험 화합물을 함유하지 않는 웰로부터의 배지를 대조군으로서 사용할 수 있다. 배양 배지에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 수준을 감소시키는 효과적 화합물은 cccDNA 턴오버 (turnover) 를 촉진하고 cccDNA 전사를 침묵화시키는 활성을 가질 수 있다. 어구 "효과적인 또는 효과적으로" 는 여기서, 특정 시험 농도에서의 화합물이 본 발명의 세포 기반 검정 시스템에서 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 생성을 방지하고, 바람직하게는 50% 이상, 가장 바람직하게는 90% 이상 감소시키기에 충분하다는 것을 나타내는데 사용될 수 있다. qPCR 또는 혼성화에 의한 cccDNA 및 프리코어 mRNA 의 정상 상태 수준의 직접 측정은, 시험 화합물/후보 화합물/후보 분자가 cccDNA 안정성 또는 전사 각각을 감소시킬 수 있는지 여부를 구별하는데 사용될 수 있다.

2. HepBHAe 세포주를 사용하는 헤파드나바이러스 (예컨대 HBV) cccDNA 형성을 저해하는 화합물/후보 분자의 스크리닝

본 발명의 또 다른 양태에 따라서, 시험관내 검정 방법을 사용하여 cccDNA 형성을 억제하는 화합물/후보 분자를 평가할 수 있다. 간략하게는, 세포를 배양 웰에 시딩할 수 있으며 세포 단일층이 융합성이 되는 날에 테트라사이클린을 생략할 수 있다. 유사하게, 시험 화합물을 첨가할 수 있으며 배지 내 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 을 처리 끝에 (대략 6 일) ELISA 에 의해 측정할 수 있다. 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 감소를 초래하는 임의의 화합물은, 이것이 cccDNA 의 형성을 효과적으로 차단할 수 있는 것을 나타낸다. 이러한 시험관내 검정 방법의 확장된 양태로서, 이러한 검정에서의 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 의 감소가 또한, 화합물이 헤파드나바이러스 (예컨대 HBV) DNA 복제를 저해하는 가능성을 갖는다는 것을 나타낼 수 있다는 것은 주목할 가치가 있다. 이러한 가능성은 서던 블롯 및/또는 qPCR 에 의한 바이러스 코어 DNA 의 직접 측정을 통해 조사될 수 있다. 상기 기재한 검정에서 나타나는 "히트 (hit)" 는 또한 cccDNA 안정성 및/또는 전사에 영향을 주는 화합물을 포함할 수 있다. 유도 기간 동안, 조기 생성된 cccDNA 의 안정성 및/또는 전사 활성은 시험 화합물에 의해 표적화될 수 있다.

3. HepHA-HBe 세포주는 카운터-스크리닝 (counter-screening) 시스템으로서 역할함.

이론적으로, 상술한 검정으로부터의 화합물 "히트" 는 HA-표지된 프리코어 단백질 번역, 또는 번역후 프로세싱, 또는 표지된 헤파드나바이러스 e 항원 (예컨대 HA-HBeAg) 분비를 직접적으로 저해할 수 있다. 이러한 비-cccDNA 저해제를 배제하기 위해, "히트" 는 주형으로서 이식유전자를 사용하여 표지된 헤파드나바이러스 e 항원 (예컨대 HA-표지된 HBeAg) 을 생성하는 HepHA-HBe 세포에서 카운터-스크리닝될 수 있다. 한편, HepHA-HBe 세포는 또한 HBeAg 저해제를 스크리닝하는데 사용될 수 있다.

용어 "공유결합 폐환형 DNA 를 저해함" 및 이의 문법적 형태는 공유결합 폐환형 DNA 의 안정성의 저해 (즉 공유결합 폐환형 DNA 의 감소한 안정성), 공유결합 폐환형 DNA 의 전사 활성의 저해 (즉 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 감소한 전사) 또는 공유결합 폐환형 DNA 의 형성의 저해 (즉 cccDNA 가 형성되지 않거나 적은 cccDNA 가 형성됨) 를 나타낼 수 있다.

용어 "공유결합 폐환형 DNA 를 저해함" 의 이러한 예시적 설명 및 정의는 상호 배타적이 아니다. 예를 들어, 공유결합 폐환형 DNA 의 형성 저해는 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 전사 감소를 초래/연관될 수 있다 (즉 공유결합 폐환형 DNA 의 전사 활성의 저해). 공유결합 폐환형 DNA 의 안정성 저해는 전사 주형으로서 공유결합 폐환형 DNA 를 사용하는 헤파드나바이러스 mRNA 의 전사 감소를 초래/연관될 수 있다.

표지된 헤파드나바이러스 e 항원은 본원에서 헤파드나바이러스의 cccDNA 의 이러한 임의 저해를 위한 대리 마커로서 사용될 수 있다.

상기에 따라서, 본원에 제공된 방법은 헤파드나바이러스의 cccDNA 형성을 저해하는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 이러한 맥락에서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.

본원에 제공된 방법은 헤파드나바이러스의 cccDNA (예를 들어 cccDNA 의 양 또는 수) 의 안정성을 감소시키는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 여기서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.

본원에 제공된 방법은 헤파드나바이러스의 cccDNA 의 전사 (활성) 을 감소시키는 후보 분자의 능력을 평가 (하는데 사용) 할 수 있다. 여기서, 세포는 cccDNA 가 형성되기 전에 후보 분자와 접촉될 수 있다.

본 발명에 따라 그의 수준이 평가될, 표지된 헤파드나바이러스 e 항원은 하나 이상의 표지를 포함할 수 있다. 본원에 나타낸 바와 같이, 표지된 헤파드나바이러스 e 항원의 신뢰할만한 평가는 오직 하나의 표지를 사용하여, 예를 들어 표지에 특이적으로 결합하는 항체를 사용하여 이루어질 수 있다. 따라서, 표지된 헤파드나바이러스 e 항원이 오직 하나의 표지를 포함하는 것이 본원에서 예상되며 바람직하다.

하기의 것은 본원에서 사용될 하나 이상의 표지에 관한 것이다.

본원에서 사용하는 바와 같은 용어 "표지" 는 마커로서 유용한 임의의 화학적 구조를 나타낸다. 주로, 용어 "표지" 는 "단백질 표지" 를 나타낸다. 용어 "표지" 및 "단백질 표지" 는 당업계에 공지되어 있으며; 그 중에서도 하기를 참조한다: Fritze CE, Anderson TR. "Epitope tagging: general method for tracking recombinant proteins". Methods Enzymol. 2000; 327: 3-16; Brizzard B, Chubet R. Epitope tagging of recombinant proteins. Curr Protoc Neurosci. 2001 May; Chapter 5: Unit 5.8; 및/또는 Terpe K. Overview of tag protein fusions: from molecular and biochemical fundamentals to commercial systems. Appl Microbiol Biotechnol. 2003 Jan; 60(5):523-33.

통상, 본원에서 사용할 표지는 헤파드나바이러스 e 항원에 융합되는 단백질 표지이다. 예를 들어, 표지를 인코딩하는 핵산은 헤파드나바이러스 e 항원을 인코딩하는 핵산에 융합될 수 있어, 표지와 헤파드나바이러스 e 항원 모두를 포함하는 융합 단백질이 발현된다. 표지(들) 는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5'-말단에 융합, 헤파드나바이러스 e 항원을 인코딩하는 핵산 내에 삽입 및/또는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 3'-말단에 융합될 수 있다. 따라서, 생성된 융합 단백질은 N-말단에서, 내부적으로 (즉 헤파드나바이러스 e 항원 내에서/내부 에피토프로서), 및/또는 C-말단에서 표지(들) 를 포함할 수 있다. 본원에서 나타내는 바와 같이, 내부 에피토프 표지는 표지된 헤파드나바이러스 e 항원 수준의 신뢰할만한 평가에 사용될 수 있으며 따라서 바람직하다.

다양한 표지가 당업계에 공지되어 있으며 본 발명에 따라 사용할 수 있다. 통상, 본원에서 사용할 표지는 약 1-3 kDa, 바람직하게는 약 1 kDa 의 저분자량을 갖는다. 예시적이고 비제한적인 저분자량 표지는 HA-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지이다. HA-표지의 사용이 본원에서 바람직하다. 본원에서 사용할 Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

저분자량은 표지의 길이, 즉 이의 표지로 이루어지는 아미노산 잔기의 수에 반영된다. 예를 들어, His-표지 (6 개 아미노산), HA-표지 (9 개 아미노산), FLAG-표지 (8 개 아미노산) 또는 3XFLAG-표지 (22 개 아미노산) 가 본원에서 사용될 수 있다. 이러한 예시적 표지는 wt-수준에 가까운 HBV DNA 복제를 지지하며 따라서 본 발명을 수행하기에 유용하다.

따라서, 본원에서 사용할 표지는 6 내지 22 개 아미노산, 예를 들어 6 개 아미노산, 7 개 아미노산, 8 개 아미노산, 9 개 아미노산, 10 개 아미노산, 11 개 아미노산, 12 개 아미노산, 13 개 아미노산, 14 개 아미노산, 15 개 아미노산, 16 개 아미노산, 17 개 아미노산, 18 개 아미노산, 19 개 아미노산, 20 개 아미노산, 21 개 아미노산 또는 22 개 아미노산으로 이루어질 수 있다.

본원에서 사용할 표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에서 나타낸 바와 같은 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에서 나타낸 바와 같은 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에서 나타낸 바와 같은 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에서 나타낸 바와 같은 V5-표지를 인코딩하는 핵산 서열, 또는 SEQ ID NO: 6 에서 나타낸 바와 같은 C9-표지를 인코딩하는 핵산 서열이다. 본원에서 SEQ ID NO: 8 에서 나타낸 바와 같은 아미노산 서열로 이루어지거나 SEQ ID NO: 1 에 의해 인코딩된 HA 표지의 사용이 바람직하다.

본원에서 사용할 Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에서 나타낸 바와 같은 1xFlag-표지를 인코딩하는 핵산 서열 또는 SEQ ID NO: 7 에서 나타낸 바와 같은 3xFlag-표지를 인코딩하는 핵산 서열이다.

본원에서 사용할 표지의 예시적 아미노산 서열은 SEQ ID NO: 8 에서 나타낸 바와 같은 HA 표지의 아미노산 서열, SEQ ID NO: 9 에서 나타낸 바와 같은 His-표지의 아미노산 서열, SEQ ID NO: 11 에서 나타낸 바와 같은 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에서 나타낸 바와 같은 V5-표지의 아미노산 서열 또는 SEQ ID NO: 13 에서 나타낸 바와 같은 C9-표지의 아미노산 서열이다.

본원에서 사용할 Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에서 나타낸 바와 같은 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에서 나타낸 바와 같은 3xFlag-표지의 아미노산 서열이다.

에피토프 표지의 사용이 본원에서 주로 예상되며, 예컨대 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지가 있다. 에피토프 표지는 고친화성 항체가 많은 상이한 종에서 안정적으로 생성될 수 있기 때문에 선택되는 짧은 펩티드 서열이다. 이러한 표지는 종종 바이러스 유전자로부터 유래하여, 그의 높은 면역반응성이 설명된다. 이러한 표지는 웨스턴 블롯팅 (western blotting), 면역형광법, 면역조직화학검사, 면역친화성 크로마토그래피 및 면역침전 실험에 특히 유용하다. 이들은 또한 항체 정제에도 사용된다. 이러한 에피토프 표지가 특히 유용한데, 이는 이러한 표지에 특이적으로 결합하는 공지되고 시판되는 항체가 본 발명에 따라 사용될 수 있기 때문이다.

친화성 표지는 단백질에 첨부되어, 친화성 기법을 사용하여 그의 미정제 생물학적 공급원으로부터 정제될 수 있다. 이들은 키틴 결합 단백질 (CBP), 말토오스 결합 단백질 (MBP) 및 글루타티온-S-트랜스퍼라아제 (GST) 를 포함한다. 폴리 (His) 표지는 널리 사용되는 단백질 표지이며; 금속 매트릭스에 결합한다.

크로마토그래피 표지는 단백질의 크로마토그래피 특성을 특정 분리 기법에 걸쳐 상이한 분해능을 부여하도록 변경시키는데 사용된다. 종종, 이들은 다음이온 아미노산, 예컨대 FLAG-표지로 이루어진다.

특히 임의의 표지가 본원에서 사용될 수 있다. 본원에서 사용할 핵산 분자에 포함된 바와 같은 표지를 인코딩하는 핵산은 헤파드나바이러스 DNA 복제, cccDNA 형성, 및 cccDNA-의존적 표지 헤파드나바이러스 항원 e 생성 및 분비를 지지할 수 있어야 한다. 이러한 능력은 본원에서 제공된 검정, 예를 들어 실험에서 제공된 검정을 사용하여 용이하게 검증될 수 있다. 예를 들어, HA-표지 삽입이 야생형 수준 HBV DNA 복제 및 안정적 세포주에서의 cccDNA 로부터의 HA-표지된 HBeAg 의 생성을 초래하였다는 것이 본원에서 입증되어 있다. 이러한 능력은 용이하게 확인되고 다른 표지에 대해 시험될 수 있다. His-표지 및 Flag-표지 삽입은 예를 들어, 일시적 트랜스팩션 검정에서 바이러스 DNA 복제에 영향을 주지 않는다.

추가 표지가 본 발명의 요지를 유예하지 않고 사용될 수 있다.

예를 들어, 리포터 단백질은 본원에서 표지, 예컨대 루시퍼라아제 (예를 들어 반딧불이 루시퍼라아제, 레닐라 루시퍼라아제, 가우시아 루시퍼라아제 등), 녹색 형광 단백질 (GFP) 등으로서 사용될 수 있다. 이들 리포터 단백질은 예를 들어 육안 검사, 형광 측정 등에 의한 표지된 헤파드나바이러스 수준의 용이한 평가를 가능하게 한다. 형광 표지가 사용되어 단백질에 대한 시각적 판독을 부여한다. GFP 및 이의 변형물은 가장 흔하게 사용되는 형광 표지이다.

본 발명의 스크리닝 방법에서 사용할 수 있는 예시적 리포터 단백질은 그 중에서도, 루시퍼라아제, (녹색/적색) 형광 단백질 및 이의 변형물, EGFP (강화된 녹색 형광 단백질 (enhanced green fluorescent protein)), RFP (적색 형광 단백질, 예컨대 DsRed 또는 DsRed2), CFP (시안 형광 단백질), BFP (청녹색 형광 단백질), YFP (황색 형광 단백질), β-갈락토시다아제 또는 클로람페니콜 아세틸트랜스퍼라아제이다.

루시퍼라아제는 널리 공지된 리포터이며; 예를 들어, [Jeffrey (1987) Mol. Cell. Biol. 7(2), 725-737] 를 참조한다. 당업자는 본 발명의 맥락에서 사용할 추가의 루시퍼라아제 핵산 및 아미노산 서열을 상응하는 데이터베이스 및 표준 교과서/논평으로부터 용이하게 추론할 수 있다.

리포터 단백질은 검출가능한 신호의 신호 강도에서의 변화를 유도함으로써 cccDNA 가 저해되도록 후보 분자의 검출/평가를 허용할 수 있다. 상기 검출가능한 신호는 형광 공명 에너지 전이 (FRET) 신호, 형광 편광 (FP) 신호 또는 섬광 근접 (SP) 신호일 수 있다. 검출가능한 신호는 본원에서 상기 정의한 바와 같은 리포터 단백질과 결부될 수 있다. 예를 들어, GFP 는 에쿼리아 빅토리아 (Aequorea victoria) 로부터 유래할 수 있다 (US　5,491,084). 에쿼리아 빅토리아의 GFP 를 인코딩하는 플라스미드는 ATCC 접근 번호 87451 로 입수가능하다. 다른 것들 중에서도 pRSGFP, EGFP, RFP/DsRed, DSRed2, 및 EYFP, BFP, YFP 를 비제한적으로 포함하는 이러한 GFP 의 기타 돌연변이 형태는 Clontech Laboratories, Inc. (Palo Alto, California) 에서 시판된다.

리포터 유전자 (예컨대 루시퍼라아제, GFP 등) 에 융합된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 배양된 세포/조직은 배양 배지 중 시험 화합물/후보 분자의 농도에 따른 리포터 유전자의 전사의 증거에 대해 모니터링될 수 있다. 시험 화합물의 농도에 따른 리포터 유전자의 전사 수준의 변화는 cccDNA 를 저해하는 시험 화합물/후보 분자의 능력을 나타낸다.

리포터 단백질은 통상 본원에 상기 기재된 저분자량 표지, 예컨대 에피토프 표지보다 더 크다. 더 작은 (에피토프) 표지 (예컨대 HA-표지) 를 인코딩하는 핵산 서열에 비해, 예를 들어 루시퍼라아제를 인코딩하는 핵산 서열을 포함하는 핵산 분자의 더 긴 삽입물로 인해, 재조합체 프리게놈 RNA 로부터의 다운스트림 바이러스 코어 및 pol 의 발현이 감소될 수 있어, 이로써 core/pol 의 교차보충 (transcomplement) 이 바이러스 복제를 회복시키는데 필요할 수 있다. 예를 들어, 헤파드나바이러스 코어 단백질 및 헤파드나바이러스 중합효소 (core/pol) 를 구성적으로 발현하는 세포(들)/세포주(들) 가 이러한 맥락에서 특히 본 발명에 따라 사용될 수 있다.

둘 이상의 표지를 포함하는 표지된 헤파드나바이러스 e 항원의 사용이 본원에서 예상된다. 둘 이상의 표지의 사용은, 보다 신뢰할만한, 따라서 유리한, 표지된 헤파드나바이러스 e 항원의 평가를 허용할 수 있다. 예를 들어, 둘 이상의 표지가 상이한 표지인 경우 (예를 들어 한 표지가 HA-표지이고, 제 2 의 표지가 His-표지임), 두 표지 모두에 특이적으로 결합하는 항체를 이용할 수 있다. 따라서 이러한 검정은 예를 들어 ELISA 검출을 위해 예컨대 2 개의 에피토프 항체를 사용함으로써 검정 특이성을 더 증가시킬 수 있다.

22 개 아미노산 3xFLAG 표지 삽입물의 삽입이 효율적인 HBV 복제를 지지한다는 것이 본원에서 발견되었다. 따라서, 예를 들어 탠덤 (tandem) 키메라 에피토프 표지, 예컨대 HA-링커-FLAG 의 사용이 또한 본원에서 쓰여질 수 있다고 여겨진다.

상기에 따라, 둘 이상의 표지가 사용되는 경우 (예를 들어 둘 이상의 상이한 표지), 하나의 표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 본원에서 사용할 표지의 전체 길이 (즉 둘 이상의 표지의 아미노산 잔기의 합) 가 최대 약 22 개 아미노산을 넘지 않는다는 것이 특히 예상되는데, 이는 상기 리포터 단백질 (예컨대 루시퍼라아제) 의 맥락에서 기재한 바와 같이 재조합체 프리게놈 RNA 로부터의 다운스트림 바이러스 코어 및 pol 의 발현이 감소될 수 있기 때문이다. 이러한 다운스트림 바이러스 코어 및 pol 의 발현 감소가 발생하는 경우, 예를 들어 둘 이상의 표지의 전체 길이가 약 22 개 아미노산을 넘는 경우, 바이러스 복제를 회복하는데 코어/po 의 교차보충이 필요할 수 있다. 예를 들어, 헤파드나바이러스 코어 단백질 및 헤파드나바이러스 중합효소 (코어/pol) 를 구성적으로 발현하는 세포(들)/세포주(들) 가 특히 이러한 맥락에서 본 발명에 따라 사용될 수 있다.

단 하나의 표지를 인코딩하는 핵산과 같이, 둘 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5'-말단에 융합, 헤파드나바이러스 e 항원을 인코딩하는 핵산 내에 삽입 및/또는 헤파드나바이러스 e 항원을 인코딩하는 핵산의 3'-말단에 융합될 수 있다. 표지는 링커에 의해 분리될 수 있다 (: 2 개의 표지가 사용되는 경우 표지-링커-표지, 3 개의 표지가 사용되는 경우 표지-링커-표지-링커-표지 등).

따라서, 생성된 융합 단백질은 N-말단에서, 내부적으로 (즉 헤파드나바이러스 e 항원 내에서/내부 에피토프로서), 및/또는 C-말단에서 둘 이상의 표지를 포함할 수 있다. 본원에 나타내는 바와 같이, 내부 에피토프 표지는 표지된 헤파드나바이러스 e 항원 수준의 신뢰할만한 평가에 사용될 수 있으며 따라서 바람직하다. 예를 들어 N-말단에서의 하나의 표지 및 예를 들어 C-말단에서의 두 번째 내부 표지 및/또는 예를 들어 세 번째 표지와의 생성된 융합 단백질의 사용이 본원에서 예상된다. 본 발명의 요지를 유예하지 않고 추가의 조합이 용이하게 분명하며 포함된다.

둘 이상의 표지는 헤마글루티닌 (HA)-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

하기에서, 본 발명에 따라 사용할 핵산 분자를 보다 상세히 기재한다.

핵산 분자는 헤파드나바이러스 프리코어 단백질, 예컨대 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열을 SEQ ID NO: 15 에 나타내며 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 17 에 나타낸다.

핵산 분자는 상기 본원에서 정의하고 설명한 바와 같은 하나 이상의 표지를 인코딩하는 핵산 서열을 포함할 수 있다. 하나 이상의 표지를 인코딩하는 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다.

B 형 간염 바이러스에 관련하여 N-말단 신호 펩티드 및 링커는 예를 들어 SEQ ID NO. 17 에서 나타낸 바와 같은 프리코어 단백질의 N-말단 29 개 아미노산을 구성한다. 따라서, 하나 이상의 표지를 인코딩하는 핵산 서열은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산의 (삽입된) 3' 다운스트림일 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 (예를 들어 SEQ ID NO. 15 에서 나타내는 HBV 프리코어 단백질을 인코딩하는 핵산) 의 5' 말단으로부터의 87 개 핵산 잔기를 구성하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에서 나타냄).

HBeAg 에 관련하여 링커는 예를 들어 SEQ ID NO. 18 에서 나타낸 바와 같은 HBeAg 의 N-말단 10 개 아미노산을 구성한다. HBeAg 에 관하여, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBeAg 의 N-말단 10 개 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV HBeAg 를 인코딩하는 핵산의 5' 말단으로부터의 30 개 핵산 잔기를 구성하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다 (HBeAg 를 인코딩하는 핵산은 예를 들어 SEQ ID NO. 16 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에서 나타냄).

보다 정확하게, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에서 나타냄). 이러한 위치는 헤파드나바이러스의 pgRNA 의 엡실론 구조에서, 또는 헤파드나바이러스 게놈에 의해 인코딩되는 바와 같은 엡실론에서, 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 및 링커의 코딩 서열을 구분한다. HBV 에 관련하여, 위치 87 는 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이며 위치 88 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다.

단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 및 30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에서 나타냄).

마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 및 11 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에서 나타냄).

하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 예컨대 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산을 SEQ ID NO: 23 에서 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 24 에 나타낸다.

하나 이상의 표지를 인코딩하는 핵산 서열의 상기 정의된 삽입 위치는 또한 헤파드나바이러스 게놈에서의 뉴클레오티드 위치에 의해서도 정의될 수 있다. HBV 게놈에 관련하여 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 상기에 따라, HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 이러한 위치는 예를 들어 [Galibert, F., et al (1979), Nature 281:646-650] 에서 기재한 바와 같은 명명법에 따라 결정될 수 있다.

본원에서 이용한 바와 같은 뉴클레오티드 (위치) "C1902" 및 "A1903" 은 각각 프리코어 부위 코딩 서열의 마지막 뉴클레오티드 및 코어 AUG 의 첫 번째 뉴클레오티드를 나타낸다는 것이 분명하다. 이들은 상이한 HBV 유전자형 (A-H) 서열 중에서 보존된다 (또한 본원에서 제공하고 SEQ ID NO: 27-34 에서 나타낸 바와 같음). 따라서 본원에서 사용할 HBV 게놈의 예시적이고 비제한적인 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다. 이제, 코어 AUG 에서 뉴클레오티드 "C" ("A" 는 아님), 또는 그의 위치는 일부 희귀한 (임상적) 단리물에서 상이할 수 있다. 이러한 서열이 또한 본 발명에서 포함된다.

본 발명에 따라, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 게놈 외에 헤파드나바이러스 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 헤파드나바이러스 게놈에서 이러한 상응하는 위치 (즉 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 헤파드나바이러스 게놈에서의 위치) 는 용이하게 결정될 수 있다. 즉, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈 (바람직하게는, HBV 게놈) 에 의해 인코딩된 엡실론 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 사이에 삽입될 수 있다.

예를 들어, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 경우, 하나 이상의 표지를 인코딩하는 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열은 용이하게 결정될 수 있다. 서열은 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈에서 시작하며 (따라서 이를 포함하고) 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 전에 종료된다 (즉 코어 단백질의 코딩 서열이 배제됨). 단백질 수준에서, 하나 이상의 표지는 링커의 C-말단 최종 아미노산에 상응하는 아미노산 잔기의 C-말단에 삽입될 수 있다 (링커는 N-말단 신호 펩티드를 뒤따름).

따라서, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 e 항원의 N-말단 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다. 이러한 N-말단 아미노산은 헤파드나바이러스 프리코어 단백질에서 "링커" 를 구성한다. 단백질 수준에서, 하나 이상의 표지는 링커의 최종 C-말단 아미노산 잔기의 C-말단에 삽입될 수 있다.

보다 정확하게, 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에서 나타냄). 단백질 수준에서, 하나 이상의 표지는 B 형 간염 바이러스 프리코어 단백질의 위치 29 및 30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (프리코어 단백질의 아미노산은 예를 들어 SEQ ID NO. 17 에 나타냄). 이러한 위치는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조에서, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조에서, 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 및 링커의 코딩 서열을 구분한다. HBV 에 관련하여, 위치 87 은 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이며 위치 88 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다. 헤파드나바이러스 HBV 프리코어 단백질에서의 상응하는 위치 (즉 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 헤파드나바이러스 게놈에서의 위치) 는 용이하게 결정될 수 있다.

마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열은 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열 사이에 존재할 수 있다 (삽입될 수 있다).

예를 들어, 핵산 서열은 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이에 존재할 수 있다 (삽입될 수 있다) (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타낸다). 단백질 수준에서, 하나 이상의 표지는 HBeAg 의 위치 10 및 11 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다 (HBeAg 의 아미노산은 예를 들어 SEQ ID NO. 18 에 나타냄). 이러한 위치는 프리코어 단백질에서의 N-말단 헤파드나바이러스 링커의 코딩 서열 (또는 헤파드나바이러스 e 항원에서의 N-말단 헤파드나바이러스 링커의 코딩 서열) 및 헤파드나바이러스 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈을 구분한다. HBV 에 관련하여, 위치 30 은 HBeAg 를 인코딩하는 핵산 서열에서 링커를 인코딩하는 서열의 마지막 3' 뉴클레오티드이다. 위치 31 은 코어 단백질을 인코딩하는 서열의 첫 번째 뉴클레오티드이다. 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열에서의 상응하는 위치 (즉 HBeAg 를 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 헤파드나바이러스 e 항원에서의 위치) 는 용이하게 결정될 수 있다.

하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산을 SEQ ID NO: 23 에 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열을 SEQ ID NO: 24 에 나타낸다. 다시 말해, 하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈 (바람직하게는 HBV 게놈) 에 의해 인코딩되는 바와 같은 엡실론 구조 및 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산 서열의 ORF 시작 코돈 사이에 삽입될 수 있다.

상기 언급한 바와 같이, 본원에서 사용할/제공될 핵산 분자는 하나 이상의 표지를 인코딩하는 서열을 포함할 수 있으며, 상기 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조에, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조에 삽입된다. HBV 게놈에 의해 인코딩된 예시적 엡실론 구조를 도 1 에 나타낸다. HBV 에 관련하여, HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조는 HBV 게놈의 위치 T1849 에서 시작하고 (그리고 포함하며) 위치 A1909 에서 종료된다 (그리고 포함한다). HBV 게놈에 의해 인코딩된 엡실론 구조의 예시적 핵산 서열을 SEQ ID NO: 25 에 나타낸다.

상기 본원에서 기재한 바와 같이, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기에 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 예시적 하부 줄기를 도 1 에 나타낸다. 예를 들어 하나 이상의 표지를 인코딩하는 핵산 서열은 HBV 프리코어 단백질을 인코딩하는 핵산 서열의 위치 87 및 88 에 상응하는 뉴클레오티드 사이 (HBV 프리코어 단백질을 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 15 에 나타냄), 또는 HBeAg 을 인코딩하는 핵산 서열의 위치 30 및 31 에 상응하는 뉴클레오티드 사이 (HBeAg 를 인코딩하는 핵산 서열은 예를 들어 SEQ ID NO. 16 에서 나타냄), 또는 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다. 이러한 모든 위치는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의 하부 줄기, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기에 존재한다.

핵산 분자가, 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의 하부 줄기, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 것이 본원에서 예상되며 바람직하다. B 형 간염 바이러스/표지된 B 형 간염 바이러스 e 항원에 관련하여 본원에서 기재하고 제공된 실험 및 교시가 일반적으로 헤파드나바이러스/표지된 헤파드나바이러스 e 항원에 적용가능하다고 여겨진다. HBV 에 사용한 삽입 서열에 대한 유일한 변형은, 각각의 특이적 헤파드나바이러스, 바람직하게는 HBV 에 대한, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 염기 짝지음을 유지하기 위한 (에피토프) 표지를 인코딩하는 핵산 서열의 5' 측면위치 (flanking) 서열의 변형에 관한 것일 수 있다. 본 발명의 교시를 기반으로 하여, 당업자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조와의 염기 짝지음을 유지하기 위해 표지를 인코딩하는 핵산 서열의 핵산 서열 5' 를 용이하게 설계하고 제조할 수 있다. 특히 오리 B 형 간염 바이러스 (DHBV) 에 관하여, 이의 코어 ORF 의 시작 코돈이 엡실론의 다운스트림에 위치하였으므로, 따라서 DHBV 에 대한 엡실론의 염기 짝지음을 유지하기 위해 (에피토프) 표지를 인코딩하는 핵산 서열의 5' 측면위치 서열을 도입할 필요가 없다.

도 1 에서 나타낸 바와 같이, 핵산 서열을 HBV 게놈 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입하였으며, 여기서 상기 핵산 서열은, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 (예를 들어 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와) 염기쌍을 형성한 9 개 뉴클레오티드의 5'-측면위치 부위 (즉 하나 이상의 표지를 인코딩하는 핵산 서열의 5') 를 함유하였다.

본원에 정의된 바와 같고/같거나 상기 본원에 기재한 바와 같이 삽입될 하나 이상의 표지를 인코딩하는 핵산 서열이 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조, 특히 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조의, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열을 추가로 포함하는 것이 본 발명의 중요하고 바람직한 양태이다. 엡실론 구조와 염기쌍을 형성할 수 있는 핵산 서열을 사용함으로써, 이는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조를 보존하는 것을 목표로 한다. 엡실론 구조는 복제, cccDNA 의 생성 및 (표지된) 헤파드나바이러스 e 항원, 바람직하게는 HBV e 항원의 발현/생성에 중요한 것으로 여겨진다.

바람직하게는, 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은, 바람직하게는 HBV 게놈의 위치 T1849 내지 A1854 에 상응하거나, 임의로는 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 통상, pgRNA 에서의 염기쌍 형성은 매칭 (matching) 리보뉴클레오티드, 예컨대 A-U, G-C, 및 동요 (wobble) 염기쌍 G-U 사이에 발생한다. 엡실론 구조가 유지되는 경우, 복제, cccDNA 의 생성 및/또는 (표지된) 헤파드나바이러스 e 항원의 발현/생성은 본원에서 사용될/제공될 핵산 분자를 저지하지 않는다.

엡실론 구조의 좌측 암이 헤파드나바이러스 e 항원 (예컨대 HBeAg) 의 신호 펩티드를 인코딩하는 핵산 서열의 일부이며, 따라서 불변인 채로 유지되어야 한다는 것에 유의해야 한다. 기재된 바와 같은 엡실론의 우측 암에서의 설계된 삽입이 하부 줄기의 염기 짝지음을 변경시켜서는 안된다. 도 1 에서 나타낸 예시화된 삽입에서, 유일한 뉴클레오티드 변화는 A1903G 에 관련되었다 (즉 A 가 HBV 게놈의 위치 1903 에서 G 에 의해 대체되었음). 위치 1903 에서의 점 돌연변이는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론의 외부로 코어 ORF 를 이동시켜, 엡실론 구조의 유지 및 코어 AUG 앞의 표지 삽입을 허용한다. 코어 단백질은 프리코어 ORF 의 시작 코돈 이후 전사되는 프리게놈 RNA 로부터 번역되어, 표지가 코어 단백질에 혼입되지 않을 것이다.

헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조 (의 하부 줄기) 와 염기쌍을 형성할 수 있는 에피토프 표지, 헤파드나바이러스 게놈의 5' 측면위치 서열은 3, 6 또는 9 개 이하의 뉴클레오티드, 통상 9 개 뉴클레오티드로 이루어진다.

헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID No. 26 에서 나타낸 서열로 이루어진다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩한다.

본원에서 사용/제공될 핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 핵산 서열을 추가로 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 단 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다.

예를 들어, 링커를 인코딩하는 핵산 서열은 서열 GGC 로 이루어지거나; 핵산 서열은 글리신 잔기를 인코딩한다. GGC 는 코어 ORF 의 AUG 앞 3 개의 본래 뉴클레오티드로부터 카피되며, 이는 AUG 와 함께, 최적 번역 개시를 위한 전형적 코작 모티프를 어셈블리한다. 따라서, 사용/삽입할 수 있는 링커는 코어 시작 코돈의 실제 코작 모티프가 유지되도록 바람직하고 적합하게 선택된다.

예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함할 수 있다. 예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함할 수 있다. SEQ ID NO. 41 에서 나타낸 바와 같은 예시적 핵산 서열은 엡실론 구조의 (하부 줄기) 와 염기쌍을 형성할 수 있는 핵산 서열 (GTGGACATC; 특히 뉴클레오티드 GTGGACAT 는 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성함), HA-표지를 인코딩하는 핵산 서열 및 링커로서 글리신 잔기를 인코딩하는 핵산 서열 (후자의 핵산 서열은 주로 코어 시작 코돈의 실제 코작 모티프를 유지하기에 유용함) 로 이루어진다.

하나 이상의 표지가 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 내에 인 프레임 (in frame) 융합된다는 것이 본원에서 예상된다. 마찬가지로, 하나 이상의 표지를 인코딩하는 핵산 서열 (엡실론 구조 (의 하부 줄기) 와 염기쌍을 형성할 수 있는 잠재적 5' 측면위치 핵선 서열 및/또는 코어 시작 코돈의 실제 코작 모티프를 유지하거나 링커를 인코딩하는 잠재적 3' 핵산 서열을 가짐) 이 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열에 인 프레임 융합된다는 것이 본원에서 예상된다.

본 발명에서 사용되고 제공될 핵산 분자는 헤파드나바이러스 게놈, 바람직하게는 B 형 간염 바이러스 (HBV) 게놈을 포함할 수 있다. 예를 들어, HBV 게놈은 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈이다. 본원에서 사용할 HBV 게놈의 예시적이고 비제한적인 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에서 나타낸다. HBV 게놈은 HBV 유전자형 D 의 게놈, 특히 HBV 하위유전자형 ayw 의 게놈 (예컨대 SEQ ID NO: 27 에서 나타낸 HBV 게놈) 일 수 있다.

본 발명에 따라서 오직 이러한 핵산 분자, 예컨대 헤파드나바이러스 게놈이 (표지된) 헤파드나바이러스 e 항원의 (실질적) 발현/생성이 허용되도록 사용될 것이다. 예를 들어, 일부 임상적 HBV 변이체는 헤파드나바이러스 e 항원의 실질적 발현/생성을 허용하지 않는 것으로 공지되어 있다. 일부 임상적 HBV 변이체에서, HBeAg 음성도는 기저 코어 프로모터 (BCP) 이중 돌연변이 (유전자형 D 에서의 A1764T/G1766A) 또는 프리코어 (pC) 돌연변이 (유전자형 D 에서의 G1898A) 로 인한 것이다. BCP 돌연변이가 프리코어 mRNA 전사의 하향조절을 통해 HBeAg 를 감소시키지만, pC 돌연변이는 프리코어 번역을 멈추기 위해 미성숙 정지 코돈을 도입한다. 이러한 헤파드나바이러스 변이체는 본원에서 제공된 방법에 덜 적합하다.

본 발명의 바람직한 구현예에서, 표지된 HBeAg 는 SEQ ID NO: 22 에서 나타낸 바와 같은 아미노산 서열을 포함하거나 이로 이루어진다. 표지된 HBeAg 를 인코딩하는 상응하는 핵산 서열을 SEQ ID NO: 20 에 나타낸다. 이러한 서열은 본 발명의 맥락에서 특히 유용하나 단지 바람직한 구현예의 예이다.

HA-표지된 프리코어 단백질, 즉 표지된 HBeAg 의 전구체를 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타낸다. 이러한 핵산 서열이 표지된 HBeAg 의 전구체를 인코딩하기 때문에, 이는 표지된 HBeAg 를 인코딩하는 핵산 서열로서 고려될 수 있다. 상응하는 아미노산 서열을 SEQ ID NO: 21 에 나타낸다.

하기는 표지된 헤파드나바이러스 e 항원의 생성 및 헤파드나바이러스의 cccDNA 를 저해하는 후보 분자의 능력 평가에 있어서의 이의 용도에 대해 보다 상세히 관한 것이다.

본원에서 사용/제공될 핵산은 프리게놈 (pg) 헤파드나바이러스 RNA, 특히 프리게놈 (pg) HBV RNA 로 전사될 수 있다.

상기 핵산이 표지된 헤파드나바이러스 e 항원의 전사를 방지하도록 설계될 수 있다는 것이 예상된다. 예를 들어, 핵산은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는다. HBV 에 관련하여, 프리코어 단백질을 인코딩하는 핵산의 시작 코돈은 결실되거나 돌연변이화될 수 있다. 예를 들어, 이러한 시작 코돈 (결실/돌연변이화될) 은 HBV 게놈의 위치 1816 내지 (및 이를 포함) 위치 1818 에서의 (및 이를 포함) 뉴클레오티드에 상응할 수 있다; 예를 들어 도 1 을 참조한다.

표지된 헤파드나바이러스 e 항원의 번역을 방지하는 것은 검정의 시작시 이의 생성/발현을 방지하기에 유리할 수 있다. 표지된 헤파드나바이러스 e 항원을 cccDNA 에 대한 대리 마커로서 사용하는 것은 본 발명의 목표이다. 표지된 헤파드나바이러스 e 항원이 항상 생성되는 경우, 이의 발현/생성이 cccDNA 의 생성과 반드시 상호연관되지는 않는다. 도 5 에서 나타낸 바와 같이, cccDNA 가 형성될 때/형성 이후에 시작 코돈은 검정의 후기 단계에서 회복될 수 있어, 표지된 헤파드나바이러스 e 항원의 발현/생성 (즉 수준) 이 헤파드나바이러스의 cccDNA 의 생성/수준을 진정으로 반영한다. 따라서 cccDNA 를 저해하는 후보 분자 능력의 보다 더 신뢰할만한 평가를 위해, 표지된 헤파드나바이러스 e 항원의 생성/발현이 예를 들어 그를 인코딩하는 상응하는 핵산의 시작 코돈을 제거/돌연변이화함으로써 검정의 시작시 저해되고 표지된 헤파드나바이러스 e 항원의 생성/발현이 이후에 허용되어 헤파드나바이러스의 cccDNA 생성/수준을 반영하는 것이 유리하다.

예를 들어, 본원에 상기 정의되고 기재한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 는 핵산 TG 에 의해 대체될 수 있다. 따라서, 본원에서 사용하고 제공될 핵산 분자는 예를 들어 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역을 방지할 수 있다.

본 발명에 따라 사용할 방법의 단계 (a) 는, 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함할 수 있다:

(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;

(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;

(iii) 제 2 의 양성 가닥 DNA 의 합성 (이로써 상기 음성 가닥 DNA 및 상기 양성 가닥 DNA 가 이중 가닥 이완 환형 DNA 를 형성함)

(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;

(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복;

(vi) 표지된 헤파드나바이러스 e 항원을 인코딩하는 mRNA 의 전사;

(vii) 표지된 헤파드나바이러스 e 항원의 번역.

표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복은 상기 정의하고 설명한 바와 같은 시작 코돈의 회복일 수 있거나 이에 관한 것일 수 있다.

표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 벡터, 특히 발현 벡터 내에 포함될 수 있다.

벡터는 예를 들어, SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함할 수 있다.

표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 유도성 프로모터의 제어 하에 있을 수 있다. 본원에서 사용할 예시적이고 비제한적인 유도성 프로모터(들) 는 테트라사이클린-유도성 프로모터(들), 독시클린-유도성 프로모터(들), 항생제-유도성 프로모터(들), 구리-유도성 프로모터(들), 알코올-유도성 프로모터(들), 스테로이드-유도성 프로모터(들) 또는 제초제- 유도성 프로모터(들) 이다. 본원에서 제공한 실험에서 사용되는 테트라사이클린 유도성 프로모터 (예를 들어 Clontech 에서 시판) 는 tet-오프 (off) 방식으로 작용한다. tet-온 (on) 방식으로 작용하는 테트라사이클린 유도성 프로모터가 마찬가지로 본원에서 사용될 수 있다고 여겨진다. tet-온/오프 시스템은 예를 들어, Clontech 및 Invitrogen 으로부터, 플라스미드 또는 바이러스 (레트로-, 아데노) 백본으로 이용가능하다. 상기 기재한 바와 같은 테트라사이클린/독시클린 유도성 프로모터 외에, 예를 들어 다른 화합물 중에서도 항생제, 구리, 알코올, 스테로이드 또는 제초제에 반응하는 기타 유도성 프로모터가 또한 적합하다. 예를 들어, 유도성 프로모터는 CMV 프로모터이다. 유도성 프로모터는 tet-EF-1 알파 프로모터일 수 있다.

또한, 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 바처럼, 하나 이상의 정지 코돈은 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입될 수 있다. 하나 이상의 헤파드나바이러스 (HBV) 외피 단백질은 대 표면 단백질 (L), 중 표면 단백질 (M) 및 소 표면 단백질 (S) 중 하나 이상일 수 있다. 한 구현예에서, HBV 외피 단백질은 소 표면 단백질 (S) 이다. 하나 이상의 HBV 외피 단백질의 예시적 코딩 부위(들) 를 SEQ ID NO: 36 (L), SEQ ID NO: 37 (M) 및/또는 SEQ ID NO: 38 (S) 에서 나타낸다. HBV 에서 SEQ ID NO: 38 (S) 의 뉴클레오티드 217 내지 222 (TTGTTG) 는 외피 단백질의 발현이 방지되도록 예를 들어 TAGTAG 로 돌연변이화될 수 있다.

후보 분자는, cccDNA 의 대리 마커, 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 대조군에 비해 감소하는 경우, 헤파드나바이러스의 cccDNA 를 저해할 수 있는 것으로 결정된다.

표지된 헤파드나바이러스 e 항원의 평가된 (발현) 수준이 표지된 헤파드나바이러스 e 항원의 (발현) 수준의 대조군, 예컨대 표준 또는 참조값과 비교되는 것이 이해될 것이다. 대조군 (표준/참조값) 은 후보 분자와 접촉하지 않는, 본원에서 정의한 바와 같은 세포, 조직 또는 비-인간 동물에서 평가될 수 있다. 대안적으로, 대조군 (표준/참조값) 은 상기 접촉 단계 전에, 본원에서 정의한 바와 같은 세포, 조직 또는 비-인간 동물에서 평가될 수 있다. 후보 분자(들) 와 접촉시 표지된 헤파드나바이러스 e 항원의 (발현) 수준 감소는 또한, cccDNA 를 저해할 수 없는 것으로 공지된 화합물과 같은 일상적으로 사용한 참조 화합물(들) 에 의해 유도된 표지된 헤파드나바이러스 e 항원의 (발현) 수준 감소와 비교될 수 있다. 당업자는 본인의 위치에서 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 감소되는지 여부를 용이하게 결정/평가한다.

반대로, 본 발명의 요지를 유예하지 않고, 양성 대조군, 예를 들어 참조 화합물(들), 예컨대 cccDNA 를 저해할 수 있는 것으로 공지된 화합물을 사용할 수 있다. cccDNA 의 대리 마커, 표지된 헤파드나바이러스 e 항원의 (발현) 수준이 이러한 (양성) 대조군과 비교하여 동등하거나 증가한 경우, 후보 분자는 헤파드나바이러스의 cccDNA 를 저해할 수 있는 것으로 결정된다.

본 발명에 따라, 특히 본원에서 기재한 스크리닝 또는 확인 방법, 후보 분자와 접촉할 세포, 조직 또는 비-인간 동물은 본원에서 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함한다.

예를 들어 상기 세포, 조직 또는 비-인간 동물은 본원에 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 발현할 수 있다. 본원에서 설명한 바와 같이, cccDNA 를 저해/길항하는 후보 분자의 능력은 따라서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열의 이러한 유전자 산물의 발현 수준, 특히 단백질 발현 수준을 측정함으로써 검출될 수 있다. (대조군 (표준 또는 참조값) 에 비해) (단백질) 발현 수준이 낮은 것은 저해제/길항제로서 작용하는 후보 분자의 능력을 나타내는 것이다.

감소된 전사/발현 수준으로 인해, 번역된 유전자 산물 수준 (즉, 단백질 수준) 이 또한 감소할 것이다. 상기 기재된 표지된 헤파드나바이러스 e 항원 단백질의 (단백질) 수준은 통상, 표지된 헤파드나바이러스 e 항원 단백질과 연관된 검출가능 신호의 신호 강도와 상호연관된다. 예시적 표지된 헤파드나바이러스 e 항원 단백질은 상기 기재한 바와 같은 리포터 (예를 들어 루시퍼라아제, (녹색/적색) 형광 단백질 및 이의 변형물, EGFP (강화된 녹색 형광 단백질) 등) 를 포함할 수 있다.

따라서, 세포/조직/비-인간 인간과 후보 분자와의 접촉시 리포터 신호의 감소는 후보 분자가 실제로 cccDNA 저해제/길항제이며, 따라서 cccDNA 를 저해할 수 있다는 것을 나타낼 것이다. 상기 본원에 정의한 바와 같은 표지된 헤파드나바이러스 e 항원의 수준을 감소시키는 후보 분자는 시험한 후보 분자 중에서 선택되는데, 이때 이러한 분자는 바람직하게는, 표지된 헤파드나바이러스 e 항원 수준을 강력하게 감소시키는 것으로 선택된다 (예를 들어, 리포터 신호 감소에서 반영됨).

본 발명의 맥락에서 (특히 본원에서 개시된 스크리닝/확인 방법), 또한 세포 추출물 (예를 들어 본원에 개시되고 정의한 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포 추출물) 이 접촉될 수 있다는 것이 예상된다. 예를 들어, 이러한 세포 추출물은 본원에서 사용할, 특히 후보 분자와 접촉할 (트랜스제닉/유전자 조작) 세포(들), 조직(들) 및/또는 비-인간 동물(들) 로부터 수득될 수 있다.

이러한 세포 추출물의 사용은, 시험관내 후보 분자의 활성을 평가할 수 있게 하므로 특히 유리한 것이다. 이러한 (세포) 추출물의 이용하는 평가/스크리닝 방법은 예를 들어, 후보 분자를 사전스크리닝하는데 사용될 수 있으며, 이때 이러한 사전스크리닝에서 선택된 분자는 예를 들어 본원에 개시한 세포-기반 방법으로, 특히 (트랜스제닉) 세포(들), 조직(들) 및/또는 비-인간 동물(들) 이 후보 분자와접촉되는 방법으로 후속 스크리닝된다. 따라서 이러한 맥락에서, 상기 및 하기에서 본원에 기재된 시험관내 사전스크리닝 방법에서 후보 분자가 선택되는 것이 바람직하다.

따라서, 본원에서 사용하는 바와 같은 용어 "세포" 는 (트랜스제닉/유전자 조작) 세포(들), (트랜스제닉/유전자 조작) 조직(들) 및/또는 비-인간 (트랜스제닉/유전자 조작) 동물(들) 및 또한 이로부터 유래한 세포 추출물을 포함한다.

고 처리량 스크리닝에서 일상적으로, 많은 (종종 수천의) 후보 분자가 동시에 스크리닝된다는 것이 이해된다. 따라서, 표지된 헤파드나바이러스 e 항원의 수준을 감소시키는 (제 1) 스크리닝 후보 분자가 선택된다.

본 발명의 스크리닝 방법의 단계 (a), 즉 "접촉 단계" 는 또한 상기 후보 분자 또는 다수의 후보 분자 (즉 각종 상이한 후보 분자) 를 함유하는 (생물학적) 샘플 또는 조성물을 분석할 세포 (표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포(들)/조직(들)/비-인간 동물) 에 첨가함으로써 이루어질 수 있다.

일반적으로, 후보 분자(들) 또는 후보 분자(들) 을 포함/함유하는 조성물은 예를 들어 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 (트랜스펙션된) 세포, 조직 또는 비-인간 동물에 첨가될 수 있다. 본원에서 정의하고 개시한 바와 같이, 용어 "표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는" 은 리포터의 용도를 의미한다. 또한 이의 프로모터 및/또는 인핸서 부위를 포함하는 리포터 구축물이 본원에서 사용될 수 있다.

본 발명에서, 특히 스크리닝/확인 방법의 맥락에서 사용되거나 제공될 세포(들), 조직(들) 및/또는 비-인간 동물은 본원에서 개시된 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로 안정적 또는 일시적으로 트랜스펙션될 수 있다.

cccDNA 를 저해할 수 있는 (표지된 헤파드나바이러스 e 항원의 수준 감소에서 반영된 바와 같음) 화합물/분자는 본원에 개시된 약학적 환경에서의 작용제로서 이롭고, 의학적 용도, 특히 헤파드나바이러스와 관련된 질환, 특히 헤파드나바이러스와 관련된 만성 질환, 예컨대 만성 간염 및 특히 만성 B 형 간염의 치료에서 사용되는 것으로 예상된다.

헤파드나바이러스의 cccDNA 의 특이적 "길항제" 또는 "저해제" 로서 기능할 수 있는 후보 분자/화합물은 소 결합 분자 예컨대 소 (유기) 화합물일 수 있다.

약물 발견의 맥락에서 용어 "소분자" 는 당업계에 공지되어 있으며 2,500 달톤 미만, 바람직하게는 1,000 달톤 미만, 보다 바람직하게는 50 내지 350 달톤의 분자량을 갖는 의학적 화합물과 관련된다. (소) 결합 분자는 천연 및 합성 화합물을 포함한다. 본 발명의 맥락에서 용어 "화합물" (또는 마찬가지로 "분자") 은 단일 물질 또는 다수의 물질을 포함한다. 상기 화합물/분자는 예를 들어 샘플, 예컨대 식물, 동물 또는 미생물로부터의 세포 추출물에 포함될 수 있다. 또한, 상기 화합물(들) 은 당업계에 공지된 것일 수 있으나 지금까지 헤파드나바이러스의 cccDNA 에 (부정적으로) 영향을 줄 수 있는 것으로 알려져 있지는 않다. 다수의 화합물은 예를 들어, 시험관내 샘플, 배양 배지에 첨가될 수 있거나 세포에 주입될 수 있다.

후보제는 또한 단백질과의 구조적 상호작용, 특히 수소 결합에 필요한 관능기를 포함할 수 있으며, 통상 하나 이상의 아민, 카르보닐, 히드록실 또는 카르복실기, 바람직하게는 관능적 화학기 중 둘 이상을 포함한다. 후보제는 종종 카르보시클릭 또는 헤테로시클릭 구조 및/또는 방향족 또는 폴리방향족 구조 (상기 관능기 중 하나 이상으로 치환된) 를 포함한다.

후보제의 예시적 부류는 헤테로사이클, 펩티드, 당류, 스테로이드 등을 포함할 수 있다. 화합물은 효능, 안정성, 약학적 양립성 등이 강화되도록 변형될 수 있다. 작용제의 구조적 확인은 추가 작용제를 확인, 생성 또는 스크리닝하는데 사용될 수 있다. 예를 들어, 펩티드제가 확인되는 경우, 이들은 예컨대 비자연적 아미노산, 예컨대 D-아미노산, 특히 D-알라닌을 사용하여, 아미노 또는 카르복실 말단을 관능화시킴으로써 (예를 들어 아미노기에 대해서는 아실화 또는 알킬화, 및 카르복실기에 대해서는 에스테르화 또는 아미드화 (amidification) 등), 그의 안정성을 강화시키는 다양한 방법으로 변형될 수 있다. 다른 안정화 방법은 예를 들어서 리포솜 등에서의 캡슐화 (encapsulation) 를 포함할 수 있다.

상기 언급한 바와 같이, 후보제는 또한 아미노산, 지방산, 퓨린, 피리미딘, 핵산 및 유도체, 구조적 유사체 또는 이의 조합을 포함하는 기타 생체분자 중에서 발견된다. 후보제는 합성 또는 자연적 화합물의 라이브러리를 포함하는 광범위한 공급원으로부터 수득된다. 예를 들어, 수많은 수단이 무작위화된 올리고뉴클레오티드 및 올리고펩티드의 발현을 포함하는 광범위한 유기 화합물 및 생체분자의 무작위 및 유도 합성에 이용가능하다. 대안적으로, 박테리아, 진균, 식물 및 동물 추출물 형태로의 자연적 화합물의 라이브러리가 이용가능하거나 용이하게 생성된다. 추가적으로, 자연적 또는 합성적으로 생성된 라이브러리 및 화합물은 종래의 화학, 물리 및 생화학적 수단을 통해 용이하게 변형되며, 조합 라이브러리를 생성하는데 사용될 수 있다. 공지된 약리제는 유도 또는 무작위 화학적 변형, 예컨대 아실화, 알킬화, 에스테르화, 아미드화 등을 거쳐 구조적 유사체를 생성할 수 있다.

그 중에서도 펩티드, 단백질, 핵산 (cDNA 발현 라이브러리 포함), 소 유기 화합물, 리간드, PNA 등을 포함하는 화합물/분자를, cccDNA 를 저해하는 능력에 대해 평가할 수 있다는 것이 본 발명에서 또한 예상된다. 상기 화합물은 또한 관능적 유도체 또는 유사체일 수 있다.

화학적 유도체 및 유사체의 제조 방법은 당업자에게 널리 공지되어 있으며, 예를 들어 Beilstein, "Handbook of Organic Chemistry", Springer Edition New York, 또는 "Organic Synthesis", Wiley, New York 에서 기재되어 있다. 또한, 상기 유도체 및 유사체는 본 발명에 따른 cccDNA 에 대한 그의 효과, 즉 그의 길항 효과에 대해 시험될 수 있다.

또한, cccDNA 의 적절한 길항제 또는 저해제의 펩티드유사체 (peptidomimetic) 및/또는 컴퓨터 보조 설계가 사용될 수 있다. 예를 들어 단백질 및 펩티드의 컴퓨터 보조 설계를 위한 적절한 컴퓨터 시스템은 예를 들어, Berry (1994) Biochem. Soc. Trans. 22:1033-1036; Wodak (1987), Ann. N. Y. Acad. Sci. 501:1-13; Pabo (1986), Biochemistry 25:5987-5991 에 기재되어 있다. 상기 기재한 컴퓨터 분석으로부터 수득한 결과는 예를 들어 공지된 화합물, 물질 또는 분자의 최적화를 위해 본 발명의 방법과 조합으로 사용될 수 있다. 적절한 화합물이 또한 연속적인 화학적 변형을 통한 펩티드유사체 조합 라이브러리의 합성 및 생성 화합물의 시험 (예를 들어 본원에 기재한 방법에 따름) 에 의해 확인될 수 있다. 펩티드유사체 조합 라이브러리의 생성 방법 및 용도는 선행 기술, 예를 들어 [Ostresh (1996) Methods in Enzymology 267:220-234] 및 [Dorner (1996) Bioorg. Med. Chem. 4:709-715] 에 기재되어 있다. 또한, cccDNA 의 길항제의 3 차원 및/또는 결정학적 구조가 cccDNA 의 (펩티드유사체) 길항제 설계에 사용될 수 있다 (Rose (1996) Biochemistry 35:12933-12944; Rutenber (1996) Bioorg. Med. Chem. 4:1545-1558).

cccDNA 를 저해할 수 있는 후보 분자의 확인/평가는 그 중에서도, 적절한 숙주를 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로 트랜스펙션하고 상기 숙주를 후보 분자(들) 와 접촉시킴으로써 수행될 수 있다.

본원에서 사용할 세포(들)/숙주(들) 는 바람직하게는 진핵세포(들), 특히 간세포 기원의 진핵세포(들) 이다. 진핵세포(들) 는 바람직하게는 간종양 세포(들) 또는 간 세포(들) 이다. 진핵세포(들) 는 또한 간종양 세포(들) 또는 간 세포(들) 에서 유래할 수 있다. 본원에서 사용할 바람직한 세포는 진핵세포 HepG2 (ATCC　#HB-8065) 이다. HepG2 세포는 기능적 HBV cccDNA 형성 및 전사를 지지하는 것으로 알려져 있다. 간세포-유래 세포 (예를 들어 Huh7) 와 같은 다른 세포의 사용이 본원에서 예상된다. 헤파드나바이러스 cccDNA 형성 (또는 광의에서, 헤파드나바이러스 DNA 복제) 을 지지한다면, 비-간 세포(들)/숙주(들) 가 또한 본 발명에 따라 사용될 수 있다. 예를 들어, 이러한 비-간 세포(들)/숙주(들) 은, 바이러스 프리게놈 RNA 가 세포에 도입되거나 외인성 프로모터에 의해 DNA 주형으로부터 전사된다면, 헤파드나바이러스 cccDNA 형성 (또는 헤파드나바이러스 DNA 복제) 을 지지하도록 변형될 수 있다. 간 특이적 전사 인자가 이러한 비-간세포에서 교차보충된다면, cccDNA 전사가 작용할 수 있다. 본 발명의 핵산 분자 또는 이를 포함하는 벡터는 세포(들) 의 게놈에서 안정적으로 통합될 수 있다.

본 발명에 따라 사용할 핵산 분자 (즉 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자) 또는 이를 포함하는 벡터는 바람직하게는 (본질적으로) DNA 로 이루어진다.

"세포" 에 대한 상기 본원에서 주어진 설명은 또한 이러한 세포를 포함하거나 이로부터 유래한 조직/비-인간 동물에 적용되며 이를 포함한다. 본원에서 사용할 세포는 샘플, 예를 들어 생물학적, 의학적 또는 병리학적 샘플에 포함될 수 있다. 예를 들어, 세포, 조직 또는 세포 배양물을 포함하는 유체의 사용이 예상된다. 이러한 유체는 체액 또는 배설물일 수 있으며 또한 배양 샘플일 수 있다. 체액은 혈액, 혈청, 혈장, 소변, 타액, 활액, 척수액, 뇌척수액, 눈물, 대변 등을 포함할 수 있으나 이에 제한되는 것은 아니다.

마찬가지로, 후보 분자(들) 는 (생물학적) 샘플 또는 조성물에 포함될 수 있다. (다수의) 후보 분자(들) 는 종종 제 1 스크리닝 처리된다. 제 1 스크리닝에서 양성으로 시험된 샘플/조성물은 후속 스크리닝 처리되어, 이전 발견을 확인하고 가장 강력한 저해제/길항제를 선택할 수 있다. 다수의 스크리닝 및 선택 라운드 (round) 시, 이러한 후보 분자는 본원에 정의되고 개시된 바와 같은 cccDNA 를 저해/길항하는 표명된 능력을 나타내는 것이 선택될 수 있다. 예를 들어, 많은 후보 분자를 함유하는 배치 (즉, 조성물/샘플) 는 재스크리닝될 것이며 후보 분자의 불충분한 저해 활성을 갖거나 저해 활성을 갖지 않는 배치는 재시험 없이 폐기될 것이다.

예를 들어, 많은 상이한 후보 분자를 갖는 (생물학적) 샘플 또는 조성물이 시험되고 하나의 (생물학적) 샘플 또는 조성물이 양성으로 시험된다면, 제 2 스크리닝에서, 바람직하게는 정제 후에, (생물학적) 샘플 또는 조성물의 개별 분자(들) 를 스크리닝할 수 있다. 후속 스크리닝(들) 에서 제 1 스크리닝의 (생물학적) 샘플 또는 조성물의 하위군을 스크리닝할 수도 있다. 이전 스크리닝 라운드에서 시험한 이들 후보 분자의 하위군을 갖는 조성물의 스크리닝은 따라서 잠재적으로 강력한 cccDNA 저해제(들) 에서 좁아질 것이다. 이는 특히 다수의 분자가 스크리닝되는 경우 스크리닝 과정을 촉진하고 가속화할 수 있다. 따라서, 스크리닝 라운드의 사이클 수는 제 1 (및 후속) 스크리닝(들) 에서의 각자 개별적인 후보 분자 시험 (이것 물론 또한 가능함) 과 비교하여 감소된다. 따라서, 후보 분자의 복잡성 또는 수에 따라, 본원에 기재된 스크리닝 방법의 단계는 스크리닝할 (생물학적) 샘플 또는 조성물이 제한된 수, 바람직하게는 단 하나의 물질 (표지된 헤파드나바이러스 e 항원의 수를 감소시키는 스크리닝된 분자의 능력을 표시함) 을 포함할 때까지 수 회 수행될 수 있다.

본원에서 예상된 것은, 예를 들어 단일 세포 또는 조직의 단일 세포 (예를 들어 준세포 수준에서) 의 수준에 대한 형광의 분해능을 가능하게 하는 광학적 측정 기법의 사용이다. 이러한 기법은 형광, 예를 들어 공초점 현미경, 디지털 영상 기록, 예컨대 CCD 카메라 및 적합한 사진 분석 소프트웨어를 포함할 수 있다. 예를 들어, 단계 (b) 는 대조 실험을 수행하여 표준 반응의 측정 후에 실행된다. 예를 들어, 표지된 헤파드나바이러스 e 항원의 수준은 제 1 스크리닝에서 후보 분자를 접촉시키지 않고, 표지된 헤파드나바이러스 e 항원을 포함하는 세포, 조직 또는 비-인간 동물에서 측정된다. 제 2 스크리닝에서, 후보 분자와 접촉 후에, 표지된 헤파드나바이러스 e 항원의 수준이 측정/평가된다. 수준에서의 차이는, 시험한 후보 분자가 실제로 cccDNA 의 길항제/저해제인지 여부를 나타낸다.

표지된 헤파드나바이러스 e 항원의 수준은 예를 들어, 본원에서 기재한 임의의 방법, 특히 단백질 측정/검출/평가 기법에 의해 유전자 산물의 수준 (특히 표지된 헤파드나바이러스 e 항원의 단백질 수준) 을 측정함으로써 정량될 수 있다.

예를 들어, 발현은 면역응집, 면역침전 (예를 들어 면역확산, 면역전기영동, 면역 고정), 웨스턴 블롯팅 기법 (예를 들어 (in situ) 면역조직화학, (in situ) 면역세포화학, 친화성 크로마토그래피, 효소 면역검정) 등을 이용하여 단백질 수준에서 측정될 수 있다. 용액 중의 정제된 폴리펩티드의 양은 물리적 방법, 예를 들어 광도측정에 의해 측정될 수 있다. 혼합물 중의 특정 폴리펩티드의 정량 방법은 예를 들어 항체의 특정한 결합에 의존한다. 항체의 특이성을 활용하는 특정한 검출 및 정량화 방법은 예를 들어 면역조직화학 (in situ) 을 포함한다. 예를 들어, 세포, 조직 또는 비-인간 동물 내의 표지된 헤파드나바이러스 e 항원 단백질의 수준의 농도/양은 효소 연결-면역흡착 검정 (ELISA) 에 의해 측정될 수 있다.

본원에서 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 것은 ELISA, CLIA 또는 AlphaLISA 에 의해 수행될 수 있다고 예상된다.

본원에 제공된 방법은 확립된 표지 (예컨대 HA-표지, 또는 HA-표지 대신에 또는 그에 더해 사용될 수 있는 His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지) 를 사용한다. 상기 표지는 표지된 헤파드나바이러스 e 항원의 정제 및 검출에 사용될 수 있다. 표지에 특이적으로 결합하는 항체 (예를 들어 ELISA 검정, 예컨대 화학발광 ELISA (CLIA) 및 AlphaLISA 를 통함) 를 사용함으로써, 표지된 헤파드나바이러스 e 항원의 수준을 실현성있고 쉽게 평가할 수 있고, 코어 단백질과의 교차-반응을 피할 수 있다.

본원에 제공된 방법의 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 것은 상기 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원을 특이적으로 인지하는 항체 (예컨대, Anti-HBe 그러나 이에 제한되지 않음: 클론 29, Lot 20110305, Autobio Diagnostics) 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체 (예컨대, Anti-HA 그러나 이에 제한되지 않음: cat# A01244-100, Genscript) 의 사용을 포함할 수 있다.

하기 항체는 B 형 간염 바이러스 e 항원을 특이적으로 인지하며, 본 발명에 따라 사용될 수 있다:

Imai, et al. Demonstration of two distinct antigenic determinants on hepatitis B e antigen by monoclonal antibodies. J Immunol. 1982 Jan; 128(1):69-72.

Ferns and Tedder. Monoclonal antibodies to hepatitis B antigen (HBeAg) derived from hepatitis B core antigen (HBcAg): their use in characterization and detection of HBeAg. J Gen Virol. 1984 May; 65 ( Pt 5):899-908.

Mondelli et al. Differential distribution of hepatitis B core and E antigens in hepatocytes: analysis by monoclonal antibodies. Hepatology. 1986 6(2):199-204.

Stuckmann and Mushahwar. Re-examination and further characterization of a monoclonal antibody to hepatitis B e antigen (anti-HBe). J Virol Methods. 1986 Jul;13(4):351-62.

Korec et al. Monoclonal antibodies against hepatitis B e antigen: production, characterization, and use for diagnosis. J Virol Methods. 1990 May; 28(2):165-9.

Usuda et al. A monoclonal antibody against a hepatitis B e antigen epitope borne by six amino acids encoded by the precore region.J Virol Methods. 1997 Nov; 68(2):207-15.

Sogut et al. Monoclonal antibodies specific for hepatitis B e antigen and hepatitis B core antigen. Hybridoma (Larchmt). 2011 Oct; 30(5):475-9.

대안적으로, 웨스턴 블롯 분석 또는 면역조직화학 염색을 수행할 수 있다. 웨스턴 블롯팅은 전기영동에 의한 단백질의 혼합물의 분리 및 항체로의 특이적 검출을 조합한다. 전기영동은 다차원 예컨대 2D 전기영동일 수 있다. 통상, 폴리펩티드는 하나의 차원을 따라 그들의 겉보기 분자량에 의해 그리고 다른 방향을 따라 이들의 등전점에 의해 2D 전기영동으로 분리된다.

당업자는 검출 신호의 강도 및 예를 들어, 측정하고자 하는 폴리펩티드/단백질의 양 사이의 상관관계, 바람직하게는 선형 상관관계를 이용하여, 상기 본원에 기재된 폴리펩티드/단백질, 특히 유전자 산물의 양을 측정할 수 있다. 따라서, 표지된 헤파드나바이러스 e 항원의 수준은 표지된 헤파드나바이러스 e 항원의 단백질 수준에 대해 정량될 수 있다. 당업자는 샘플 중의 표지된 헤파드나바이러스 e 항원 단백질 발현 산물의 수준의 양/농도를 측정하는데 사용하고자 하는 표준 방법을 알고 있거나 또는 표준 교과서로부터 상응하는 방법을 추론할 수 있다 (예를 들어 Sambrook, 2001).

후보 분자(들) 은 표지된 헤파드나바이러스 e 항원 (또는 상응하는 리포터 신호) 의 수준이 강하게 감소되는 경우, 바람직하게는 매우 낮거나 또는 검출가능하지 않은 경우 선택된다. 예를 들어, 표지된 헤파드나바이러스 e 항원 (또는 상응하는 리포터 신호) 의 수준은 (대조) 표준 값과 비교하여 적어도 50%, 60%, 70%, 80%, 보다 바람직하게는 적어도 90% 감소될 수 있다.

세포 또는 조직의 트랜스펙션 방법은 당업계에 공지되어 있다. 따라서, 칼슘 포스페이트 처리 또는 전기천공이 상기 리포터 구축물을 발현시키기 위해 세포 또는 조직을 트랜스펙션하는데 사용될 수 있다 (참고, Sambrook (2001), loc. cit.). 게다가, 상기 리포터 구축물을 발현하는 핵산 분자는 표적 세포로의 전달을 위해 리포좀 내로 재구성될 수 있다. 추가의 대안으로서, 세포는 유전적으로 조작된 바이러스 벡터를 사용하여 특정 리포터 구축물을 발현하기 위해 형질도입될 수 있다.

또다른 구현예에서, cccDNA 억제를 검출하기 위해 상기 리포터 구축물을 포함하는 비-인간 동물은 트랜스제닉 비-인간 동물이다. 기재된 스크리닝 검정에서 사용하고자 하는 비-인간 유기체는 C. 엘레강스, 효모, 초파리, 제브라피시, 기니아 피그, 래트 및 마우스로 이루어지는 군으로부터 선택될 수 있다. 이러한 트랜스제닉 동물의 생성은 당업자의 기술 내에 있다. 상응하는 기법이 특히 "Current Protocols in Neuroscience" (2001), John Wiley&Sons, Chapter 3.16 에 기재되어 있다.

따라서, 본 발명은 또한 ES-세포 또는 생식 세포 내로 본원에 기재된 바와 같은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 도입하는 단계를 포함하는 비-인간 트랜스제닉 동물의 생성 방법에 관한 것이다. 본원에 제공되고 기재되는 비-인간 트랜스제닉 동물은 상기 본원에 기재된 스크리닝 방법 및 약리학적 시험에서 특히 유용하다. 본원에 기재된 비-인간 트랜스제닉 동물은 헤파드나바이러스와 연관된 질환의 치료를 위한 cccDNA 의 길항제/저해제가 추적되고, 선택되고 및/또는 단리되는 과학적 및 의료적 연구 뿐 아니라 약물 스크리닝 검정에서 사용될 수 있다.

본 발명의 문맥에서, 특히 스크리닝/식별 방법에서 사용하고자 하는 형질전환/유전자 조작 세포(들), 조직(들), 및/또는 비-인간 동물은, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 본원에 기재되고 정의된 핵산 분자를 포함한다.

본 발명은 헤파드나바이러스의 cccDNA 의 저해제인 것으로 의심되는 화합물의 스크리닝 및/또는 검증을 위한 세포, 조직 또는 비-인간 동물의 용도에 관한 것이다.

본원에서 사용된 바와 같은 용어 "트랜스제닉 비-인간-동물", "트랜스제닉 세포" 또는 "트랜스제닉 조직" 은 상응하는 야생형 동물, 조직 또는 세포의 상이한 유전적 물질을 포함하는 인간이 아닌, 비-인간 동물, 조직 또는 세포를 말한다. 본 문맥에서 용어 "유전적 물질" 은 임의의 종류의 핵산 분자, 또는 이의 유사체, 예를 들어 본원에 정의된 핵산 분자, 또는 이의 유사체일 수 있다. 용어 "상이한" 은 야생형 동물 또는 동물 세포의 게놈과 비교하여 부가적인 또는 더 적은 유전적 물질을 의미한다. 트랜스제닉 세포/동물의 생성을 위해 사용하고자 하는 상이한 발현 시스템의 개관은 예를 들어 문헌 Methods in Enzymology 153 (1987), 385-516, Bitter et al (Methods in Enzymology 153 (1987), 516-544) 및 Sawers et al. (Applied Microbiology and Biotechnology 46 (1996), 1-9), Billman-Jacobe (Current Opinion in Biotechnology 7 (1996), 500-4), Hockney (Trends in Biotechnology 12 (1994), 456-463), Griffiths et al., (Methods in Molecular Biology 75 (1997), 427-440) 을 언급한다.

본 발명은 상기 본원에 정의된 바와 같은 핵산 분자, 즉 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자에 관한 것이다. 상기 본원에 제공된 설명 및 정의는 여기에 필요한 부분만 적용된다. 헤파드나바이러스 e 항원은 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 이다.

표지된 헤파드나바이러스 e 항원은 오직 하나의 표지를 함유할 수 있다. 표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 전형적이고 본원에서 바람직한 (에피토프) 표지는 8, 9, 10 또는 11 개의 아미노산으로 이루어진다. 6xHis 가 본원에서 사용될 수 있는 최소의 에피토프 표지이다. 6 개 미만의 아미노산의 삽입은 인접 HBeAg 아미노산과 함께 새로운 에피토프 내로 어셈블링될 수 있어, 또한 이러한 삽입이 표지된 헤파드나바이러스를 초래하는 것이 가능하다. 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

표지된 헤파드나바이러스 e 항원은 2 개 이상의 표지를 함유할 수 있다. 2 개 이상의 표지는 바람직하게는 상이한 표지이다. 상기 2 개 이상의 표지의 전체 길이는 약 12 내지 약 31 개의 아미노산일 수 있다. 예를 들어, 2 개 이상의 표지의 전체 길이는 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개의 아미노산일 수 있다. 2 개 이상의 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지의 2 개 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

표지(들) 을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에 나타낸 바와 같은 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에 나타낸 바와 같은 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에 나타낸 바와 같은 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에 나타낸 바와 같은 V5-표지를 인코딩하는 핵산 서열, 및/또는 SEQ ID NO: 6 에 나타낸 바와 같은 C9-표지를 인코딩하는 핵산 서열이다.

Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에 나타낸 바와 같은 1xFlag-표지를 인코딩하는 핵산 서열, 또는 SEQ ID NO: 7 에 나타낸 바와 같은 3xFlag-표지를 인코딩하는 핵산 서열이다.

표지(들) 의 예시적 아미노산 서열은 SEQ ID NO: 8 에 나타낸 바와 같은 HA 표지의 아미노산 서열, SEQ ID NO: 9 에 나타낸 바와 같은 His-표지의 아미노산 서열, SEQ ID NO: 11 에 나타낸 바와 같은 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에 나타낸 바와 같은 V5-표지의 아미노산 서열, 및/또는 SEQ ID NO: 13 에 나타낸 바와 같은 C9-표지의 아미노산 서열이다.

Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에 나타낸 바와 같은 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에 나타낸 바와 같은 3xFlag-표지의 아미노산 서열이다.

HBeAg 를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 16 에 나타낸다. HBeAg 의 예시적 아미노산 서열은 SEQ ID NO: 18 에 나타낸다.

핵산 분자는 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 15 에 나타낸다. 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 17 에 나타낸다.

핵산 분자는 하나 이상의 표지를 인코딩하는 핵산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 프리코어 단백질의 N-말단 신호 펩티드 및 링커를 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림이다.

하나 이상의 표지를 인코딩하는 핵산 서열은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개의 아미노산을 인코딩하는 핵산 서열의 (삽입된) 3' 다운스트림일 수 있다.

핵산 분자는 헤파드나바이러스 게놈을 포함할 수 있다. 바람직하게는, 헤파드나바이러스 게놈은 B 형 간염 바이러스 (HBV) 게놈이다. HBV 게놈은 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈일 수 있다. HBV 게놈은 HBV 유전자형 D 의 게놈일 수 있다. 바람직하게는, HBV 게놈은 HBV 유전자형 D, 서브유전자형 ayw 의 게놈이다.

하나 이상의 표지를 인코딩하는 핵산은 헤파드나바이러스 코어 단백질, 바람직하게는 HBV 코어 단백질을 인코딩하는 핵산의 (삽입된) 5' 업스트림일 수 있다. HBV 코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 23 에 나타낸다. 코어 단백질은 HBV 코어 단백질일 수 있다. HBV 코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 24 에 나타낸다.

하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 본원에 정의된 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조 내로 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 예시적 핵산 서열은 SEQ ID NO: 25 에 나타낸다. 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기 내로 삽입될 수 있다.

하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자는 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입될 수 있다.

핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함할 수 있다. 헤파드나바이러스 게놈, 바람직하게는 HBV 의 (또는 이에 의해 인코딩되는) 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은, 일차적으로, 바람직하게는 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는, 또는 임의로 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 헤파드나바이러스 게놈의 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열은 9 개 (이하의) 뉴클레오티드로 이루어질 수 있다.

헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID No. 26 에 나타내는 서열로 이루어진다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 서열은 SEQ ID NO. 40 에 나타내는 폴리펩티드를 인코딩한다.

핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 오직 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다. 링커를 인코딩하는 서열은 서열 GGC 로 이루어질 수 있다. 링커를 인코딩하는 서열은 글리신 잔기를 인코딩할 수 있다. 인코딩하는 서열은 코어 시작 코돈의 진정한 코작 모티프를 유지하기 위해 유용하고 적합하게 선택될 수 있다.

핵산 분자는 SEQ ID NO. 41 에 나타낸 바와 같은 핵산 서열을 포함하는 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함할 수 있다. 핵산 분자는 SEQ ID NO. 42 에 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함할 수 있다.

하나 이상의 표지는 바람직하게는 헤파드나바이러스 e 항원 (또는 헤파드나바이러스 e 프리코어 단백질 내에), 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) (또는 B 형 간염 바이러스 프리코어 단백질 내에) 내에 인 프레임 융합된다.

표지된 HBeAg 를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 20 에 나타낸다. 표지된 HBeAg 의 바람직한 아미노산 서열은 SEQ ID NO: 22 에 나타낸다.

표지된 B 형 간염 바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 19 에 나타낸다. 표지된 B 형 간염 바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 21 에 나타낸다.

HBV 게놈의 예시적 핵산 서열은 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 에 나타낸다.

핵산은 프리게놈 (pg) 헤파드나바이러스 RNA 내로 전사될 수 있다. 헤파드나바이러스 RNA 는 바람직하게는 HBV RNA 이다.

표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 벡터, 예컨대 발현 벡터 내에 포함될 수 있다. 바람직하게는, 헤파드나바이러스 e 항원은 B 형 간염 바이러스 e 항원 (HBeAg) 이다.

핵산은 일반적으로 표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 의 번역을 허용한다. 핵산은 SEQ ID NO: 39 에 나타낸 서열을 포함하는 벡터 내에 포함될 수 있다.

특정 구현예에서, 핵산은 표지된 헤파드나바이러스 e 항원의 번역을 방지하도록 설계된다. 예를 들어, 핵산은 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 함유하지 않는다. 예를 들어, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 는 핵산 TG 에 의해 대체될 수 있다. 핵산은 표지된 헤파드나바이러스 e 항원의 번역을 방지하기 위해 점 돌연변이에 의해 개질될 수 있다. 벡터는 SEQ ID NO: 35 에 나타낸 서열을 포함할 수 있다.

표지된 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 핵산 서열을 포함하는 핵산 분자는 유도성 프로모터의 제어 하에 있을 수 있다.

유도성 프로모터는 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터, 또는 제초제-유도성 프로모터일 수 있다.

유도성 프로모터는 바람직하게는 CMV 프로모터일 수 있다. 유도성 프로모터는 tet-EF-1 알파 프로모터일 수 있다.

하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질, 바람직하게는 하나 이상의 HBV 외피 단백질의 코딩 부위 내로 도입될 수 있다.

하나 이상의 HBV 외피 단백질은 L, M 및/또는 S 중 하나 이상일 수 있다. HBV 외피 단백질은 S 일 수 있다.

하나 이상의 HBV 외피 단백질의 예시적 코딩 부위 (또는 이를 인코딩하는 예시적 핵산 서열) 를 SEQ ID NO: 36 (L), 37 (M) 또는 38 (S) 에 나타낸다. SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 는 외피 단백질의 발현을 방지하기 위해 TAGTAG 로 돌연변이화될 수 있다.

본 발명은 상기 본원에 정의되고 제공된 핵산 분자에 의해 인코딩되는 단백질에 관한 것이다.

단백질은 표지된 헤파드나바이러스 e 항원, 바람직하게는 표지된 B 형 간염 바이러스 e 항원 (HBeAg) 을 포함한다.

B 형 간염 바이러스 e 항원 (HBeAg) 은 SEQ ID NO: 18 에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다. 바람직하게는, 표지된 헤파드나바이러스 e 항원은 단 하나의 표지를 함유한다.

표지는 6 내지 22 개의 아미노산으로 이루어질 수 있다. 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 또는 C9-표지일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

표지된 헤파드나바이러스 e 항원은 2 개 이상의 표지를 함유할 수 있다. 바람직하게는 2 개 이상의 표지는 상이한 표지이다. 상기 2 개 이상의 표지의 전체 길이는 약 14 내지 약 31 개의 아미노산이다. 2 개 이상의 표지는 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상일 수 있다. Flag-표지는 1xFlag-표지 또는 3xFlag-표지일 수 있다.

표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 1 에 나타낸 HA 표지를 인코딩하는 핵산 서열, SEQ ID NO: 2 에 나타낸 His-표지를 인코딩하는 핵산 서열, SEQ ID NO: 4 에 나타낸 c-myc-표지를 인코딩하는 핵산 서열, SEQ ID NO: 5 에 나타낸 V5-표지를 인코딩하는 핵산 서열, 및/또는 SEQ ID NO: 6 에 나타낸 C9-표지를 인코딩하는 핵산 서열이다.

Flag-표지를 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 3 에 나타낸 1xFlag-표지를 인코딩하는 핵산 서열 또는 SEQ ID NO: 7 에 나타낸 3xFlag-표지를 인코딩하는 핵산 서열이다.

표지의 예시적 아미노산 서열은 SEQ ID NO: 8 에 나타낸 HA 표지의 아미노산 서열, SEQ ID NO: 9 에 나타낸 His-표지의 아미노산 서열, SEQ ID NO: 11 에 나타낸 c-myc-표지의 아미노산 서열, SEQ ID NO: 12 에 나타낸 V5-표지의 아미노산 서열; 및/또는 SEQ ID NO: 13 에 나타낸 C9-표지의 아미노산 서열이다.

Flag-표지의 예시적 아미노산 서열은 SEQ ID NO: 10 에 나타낸 1xFlag-표지의 아미노산 서열 또는 SEQ ID NO: 14 에 나타낸 3xFlag-표지의 아미노산 서열이다.

단백질은 헤파드나바이러스 프리코어 단백질을 포함할 수 있다. 헤파드나바이러스 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 15 에 나타낸다. 헤파드나바이러스 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 17 에 나타낸다.

단백질은 하나 이상의 표지의 아미노산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 프리코어 단백질의 신호 펩티드 및 링커의 서열의 아미노산 서열의 C-말단이다. 단백질은 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개의 아미노산의 아미노산 서열의 하나 이상의 표지 C-말단의 아미노산 서열을 포함할 수 있다.

단백질은 하나 이상의 표지의 아미노산 서열을 포함할 수 있고, 상기 서열은 헤파드나바이러스 코어 단백질의 아미노산 서열의 N-말단, 바람직하게는 HBV 코어 단백질의 아미노산 서열의 N-말단이다. HBV 코어 단백질을 인코딩하는 예시적 핵산은 SEQ ID NO: 23 에 나타낸다. HBV 코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 24 에 나타낸다.

하나 이상의 표지의 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조에 의해 인코딩되는 아미노산 서열 내로 삽입될 수 있다. HBV 게놈에 의해 인코딩되는 엡실론 구조의 예시적 핵산 서열은 SEQ ID NO: 25 에 나타낸다. 하나 이상의 표지의 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기에 의해 인코딩되는 아미노산 서열 내로, 바람직하게는 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기에 의해 인코딩되는 아미노산 서열 내로 삽입될 수 있다.

하나 이상의 표지의 아미노산 서열은 예컨대 SEQ ID NO. 17 에 나타낸 바와 같은, HBV 프리코어 단백질의 위치 G29 및 위치 M30 에 상응하는 아미노산 잔기 사이에 삽입될 수 있다.

단백질은 하나 이상의 표지의 아미노산 서열에 대한 N-말단에 3 개 (이하) 의 아미노산의 아미노산 서열을 추가로 포함할 수 있고, 3 개 이하의 아미노산의 상기 아미노산 서열은 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열에 의해 인코딩된다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열은, 주로 바람직하게는 HBV 게놈의 위치 T1849 내지 T1855 에 상응하는 또는, 임의로, 위치 T1849 내지 T1855 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있다. 헤파드나바이러스 pgRNA, 바람직하게는 HBV pgRNA 의 엡실론 구조, 또는 헤파드나바이러스 게놈, 바람직하게는 HBV 게놈에 의해 인코딩되는 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 예시적 핵산 서열은 SEQ ID No. 26 에 나타낸 서열로 이루어진다. 3 개 (이하) 의 아미노산의 예시적 아미노산 서열을 SEQ ID NO. 40 에 나타낸다.

단백질은 하나 이상의 표지의 아미노산 서열에 대한 C-말단에 링커를 추가로 포함할 수 있다. 링커는 하나 이상의 아미노산 잔기로 이루어질 수 있다. 바람직하게는, 링커는 오로지 하나의 아미노산 잔기, 예컨대 글리신 잔기로 이루어진다.

표지된 헤파드나바이러스 e 항원의 아미노산 서열은 SEQ ID NO. 41 에 나타낸 핵산 서열에 의해 인코딩된 아미노산 서열을 포함할 수 있다. 표지된 헤파드나바이러스 e 항원의 아미노산 서열은 SEQ ID NO. 42 에 나타낸 아미노산 서열을 포함할 수 있다.

하나 이상의 표지는 바람직하게는 헤파드나바이러스 e 항원, 바람직하게는 B 형 간염 바이러스 e 항원 (HBeAg) 내에 인 프레임 융합된다.

표지된 HBeAg 에 따른 예시적 핵산 서열은 SEQ ID NO: 20 에 나타낸다. 바람직하게는, 표지된 HBeAg 는 SEQ ID NO: 22 에 나타낸 아미노산 서열을 갖는다.

표지된 HBV 프리코어 단백질을 인코딩하는 예시적 핵산 서열은 SEQ ID NO: 19 에 나타낸다. 표지된 HBV 프리코어 단백질의 예시적 아미노산 서열은 SEQ ID NO: 21 에 나타낸다.

본 발명은 본원에 정의된 및 제공된 핵산 분자를 포함하는 숙주 세포 및/또는 본원에 정의된 및 제공된 단백질을 포함하는 숙주 세포에 관한 것이다. 숙주 세포는 진핵세포일 수 있다. 진핵세포는 간세포 기원의 것일 수 있다. 진핵세포는 간종양 세포일 수 있거나 또는 간종양 세포로부터 유래될 수 있다. 바람직한 구현예에서, 진핵세포는 HepG2 (ATCC　#HB-8065) 이다.

본 발명은 상기 본원에 정의된 단백질의 제조 방법에 관한 것으로, 상기 방법은 상기 본원에 정의된 숙주를 단백질의 발현을 허용하게 하는 조건 하에서 배양하고, 배양물로부터 생성된 단백질을 회수하는 것을 포함한다.

본 발명은 본 발명의 방법에서 사용하기 위한 키트에 관한 것이다. 마찬가지로, 본 발명은 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 의심되는 후보 분자를 스크리닝하기 위한 키트의 용도에 관한 것이다. 헤파드나바이러스의 cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하기 위한 방법과 관련하여 상기 본원에 제공된 설명은 여기에 필요한 부분만 적용된다.

키트는 본원에 정의된 헤파드나바이러스 항원 e 를 특이적으로 인지하는 항체 및 본원에 정의된 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체를 포함할 수 있다.

본 발명의 (문맥에서 제조될) 키트 또는 본 발명의 방법 및 용도는 지침 설명서(들) 을 추가로 포함할 수 있거나 이것과 함께 제공될 수 있다. 예를 들어, 상기 지침 설명서(들) 은 당업자가 (어떻게) cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하는지 및/또는 어떻게 본 발명에 따라 표지된 헤파드나바이러스 e 항원의 수준을 평가하는지에 대한 지침을 줄 수 있다. 특히, 상기 지침 설명서(들) 은 사용에 대한 지침을 포함하거나 또는 본원에 제공된 방법 또는 용도에 적용할 수 있다.

본 발명의 (문맥에서 제조될) 키트는 본 발명의 방법 및 용도를 수행하기 위해 적합한/필요한 성분/약품 및/또는 장비를 추가로 포함할 수 있다. 예를 들어, 이러한 성분/약품 및/또는 장비는 본원에 정의된 상기 표지된 헤파드나바이러스 e 항원의 (단백질 (발현)) 수준을 특이적으로 측정하는데 필요한 화합물(들) 을 안정화 및/또는 저장하기 위한 용매, 희석제 및/또는 완충제이다.

본 발명은 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 의심되는 후보 분자를 스크리닝하기 위한, 본원에 정의되고 제공되는 핵산 분자, 본원에 정의되고 제공되는 단백질 및/또는 본원에 정의되고 제공되는 숙주 세포의 용도에 관한 것이다. 헤파드나바이러스의 cccDNA 를 저해하기 위한 후보 분자의 능력을 평가하기 위한 방법과 관련하여 상기 본원에 제공된 설명은 여기에 필요한 부분만 적용된다.

본원에서 사용되는 바와 같은, 용어 "~ 를 포함하는" 및 "~ 가 포함되는" 또는 이의 문법적 변형은 언급된 특징, 정수, 단계 또는 성분을 구체화하는 것으로 간주되나, 하나 이상의 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹의 부가를 불가능하게 하는 것은 아니다. 상기 용어는 용어 "~ 로 이루어지는" 및 "~ 로 본질적으로 이루어지는" 을 포함한다. 따라서, 용어 "~ 를 포함하는""/~ 가 포함되는""/~ 를 갖는" 은 임의의 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등) 이 존재할 수 있다는 것을 의미한다.

용어 "~ 로 이루어지는" 은 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등) 이 존재할 수 없다는 것을 의미한다.

용어 "~ 로 본질적으로 이루어지는" 또는 이의 문법적 변형은 본원에서 사용되는 경우 언급된 특징, 정수, 단계 또는 성분을 구체화하나 하나 이상의 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹의 부가를 불가능하게 하는 것이 아닐 뿐 아니라, 부가적인 특징, 정수, 단계, 성분 또는 이의 그룹이 청구된 조성물, 장치 또는 방법의 기본적이고 신규한 특징을 실질적으로 변경시키지 않는 경우에만 취해진다.

따라서, 용어 "~ 로 본질적으로 이루어지는" 은 특정의 추가의 성분 (또는 마찬가지로 특징, 정수, 단계 등), 즉, 조성물, 장치 또는 방법의 본질적인 특징에는 실질적으로 영향을 주지 않는 것들이 존재할 수 있다는 것을 의미한다. 다른 말로는, 용어 "~ 로 본질적으로 이루어지는" (용어 "~ 를 실질적으로 포함하는" 로 본원에서 상호교환적으로 사용될 수 있음) 은, 의무적인 성분 (또는 마찬가지로 특징, 정수, 단계 등) 에 더해 조성물, 장치 또는 방법 중의 다른 성분의 존재를 허용하나, 단, 장치 또는 방법의 본질적인 특징은 다른 성분의 존재에 의해 실질적으로 영향을 받지 않는다.

용어 "방법" 은, 화학적, 생물학적 및 생물물리학적 분야의 당업자에 의해 제한 없이, 공지된, 또는 공지된 방식, 수단, 기법 및 절차로부터 쉽게 개발되는 이들 방식, 수단, 기법 및 절차를 포함하는 제시된 과제를 달성하기 위한 방식, 수단, 기법 및 절차를 말한다.

본원에서 사용되는 바와 같은, 용어 "단리된" 은 이의 생체 내 위치로부터 제거되어진 조성물을 말한다. 바람직하게는 본 발명의 단리된 조성물 또는 화합물에는 이들의 생체 내 위치에 존재하는 (즉 정제된 또는 반-정제된 조성물 또는 화합물) 다른 성분 (예를 들어, 기타 단백질 또는 기타 화합물) 이 실질적으로 없다.

본원에서 사용되는 바와 같은 용어 "약" 은 ±10% 를 말한다.

본 발명은 하기 비-제한적 특징 및 실시예를 참고로 하여 추가로 설명된다.

다르게 나타내지 않는다면, 재조합 유전자 기술의 확립된 방법이, 예를 들어, 문헌 Sambrook, Russell "Molecular Cloning, A Laboratory Manual", Cold Spring Harbor Laboratory, N.Y. (2001)) 에 기재된 바와 같이 사용되었고, 이는 본원에 그 전체가 참조로서 인용된다.

하기 예는 본 발명을 설명한다:

도면은 다음을 나타낸다:
도 1. HBV 프리코어 ORF 내로의 HA-표지 서열의 삽입.
HBV 프리코어 단백질의 ORF (유전자형 D, 하위유형 ayw, nt 1816-2454) 는 뉴클레오티드 서열에서 제시된 5' 부분 (nt 1816-1941) 과 함께 묘사된다. 프리코어 ORF 의 nt 1941 과 정지 코돈 사이의 서열은 생략된다. 프리코어 ORF 의 시작 코돈, 직접 반복 서열 1 (DR1), 및 코어 ORF 의 인-프레임 (in-frame) 시작 코돈에 박스로 테두리가 쳐있다. 5' 말단 프리코어 ORF 의 시작 코돈은 플라스미드 pTREHBV-HAe 에서 돌연변이화되어 있다 (ATG 에서 TG). 진정한 pgRNA 전사 개시 부위 (nt 1820) 는 화살표로 표시된다. HBV 뉴클레오티드 위치는 Galibert 명명법 (5) 에 따른다. 후속 DNA 복제를 위한 HBV pgRNA 중의 필수적인 시스-요소로서 담당하는 중대한 줄기-루프 구조 (엡실론, ε) 가 예측되는 내부 구조 (하부 줄기, 벌지, 상부 줄기, 루프) 와 함께 예시된다. 엡실론의 염기쌍을 변형시키지 않고 인-프레임 융합된 HA-표지 서열을 프리코어 ORF 내에 두기 위해, HA-표지-함유 DNA 서열 (gtggacatcTACCCATACGACGTTCCAGATTACGCTggc; SEQ ID NO: 41) 을 코어 ORF 의 시작 코돈 (삽입 박스 참조) 에 인접한 인-프레임 업스트림 위치 내에 삽입한다. 서열 개질은 프리코어 단백질 내로의 HA-표지 + 링커 서열의 인-프레임 융합을 산출하며, 코어 단백질의 미손상 ORF 는 엡실론의 다운스트림에서 유지된다.
도 2. HA-표지된 HBeAg 의 발현 및 분비
(A) 야생형 및 HA-표지된 프리코어의 세포내 발현. HepG2 세포를 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션시키고, 5 일 후, 전체 세포 용리액을 항-HBc (상부 패널) 및 항-HA (중간 패널) 항체를 사용함으로써 웨스턴 블롯 분석에 적용하였다. β-액틴이 로딩 대조군으로서 담당했다. 야생형 프리코어 및 HA-표지된 프리코어 (HA-프리코어) 가 표지된다.
(B) 배양액 중의 HA-표지된 HBeAg 의 검출. HepG2 세포를 모방물 (mock) 트랜스펙션하거나 또는 플라스미드 pcHBe 또는 pcHA-HBe 로 트랜스펙션하고, 상청액 샘플을 지시된 시점에 수집하고, 세포를 트랜스펙션 5 일 후에 수확하였다. 상청액 샘플을 항-HA 항체를 사용하여 면역침전 (IP) 에 적용하고, HA-표지된 HBeAg (HA-HBeAg) 를 HA 에 대항하는 항체로 웨스턴 블롯에 의해 검출하였다. 항체의 경쇄 (LC) 가 표시된다. HA-프리코어의 세포내 발현을 HA 웨스턴 블롯에 의해 밝혀냈다.
도 3. HepHA-HBe 세포주에서의 HA-HBeAg 의 분비.
확립된 HA-표지된 HBeAg 안정한 발현 세포주, 구체적으로 HepHA-HBe4 및 HepHA-HBe47 세포를, 융합성 조건에서 콜라겐-코팅된 12-웰 플레이트 내에 시딩하였다. 세포가 시딩된 날짜를 제 0 일로 설정하고, 배지를 2 일에 한번씩 보충하였다. 상청액 샘플을 지시된 시점에 수집하고, HA-HBeAg 를 재료 및 방법에 기재된 바와 같이 AlphaLISA 분석에 의해 검출하였다. AlphaLISA 신호 (상대적 광 단위) (Y-축) 를 막대그래프로 시점 (X-축) 에 상응하게 플롯팅하였다.
도 4. 일시적으로 트랜스펙션된 세포 중의 HA-재조합 HBV 게놈의 복제.
HepG2 세포를 pTREHBVDES 또는 pTREHBV-HAe 및 플라스미드 pTet-오프로 공동트랜스펙션하였다. 세포를 트랜스펙션 5 일 후 수확하고, HBV RNA, 코어 단백질, 캡시드화된 pgRNA, 및 바이러스 DNA 복제의 플라스미드-기반 생성을 노던 블롯, 웨스턴 블롯, 및 서던 블롯 혼성화 각각으로 분석하였다. pgRNA: 프리게놈 RNA; sRNA: 표면 RNA; RC: 이완 환형 DNA; SS: 단일 가닥 DNA.
도 5. HepBHAe 안정한 세포주 내의 HBV cccDNA-의존적 HA-표지된 HBeAg 발현의 합리적인 설계의 도식적 예시.
pTREHBV-HAe 및 pTet-오프 안정하게 트랜스펙션된 세포에서, 이식유전자는 tet-CMV 프로모터의 제어 하에 1.1 오버길이 (overlength) HBV 게놈을 함유한다. 프리코어의 시작 코돈 (ATG) 은 HBV DNA 의 5' 말단에서 돌연변이화되어 있고, 두 번째 것은 3' 중복 (redundancy) 에서 변화가 없다. HA-표지-함유 단편 (회색으로 제시됨) 을 재료 및 방법에 기재된 바와 같이 프리코어 ORF 내로 삽입하였다. 이식유전자는 또한 바이러스 외피 단백질 발현을 방지하기 위해 소 표면 (S) ORF 중에 2 개의 탠덤 (tandem) 정지 코돈을 함유한다. (B) Tet 의 제거 시, pgRNA 가 전사되고, 코어 및 중합효소가 생성되어, pgRNA 포장 및 (C) pgRNA 에서 rcDNA 로의 역전사를 초래한다. DNA 복구 메커니즘은 (D) rcDNA 를 (E) 환형 cccDNA 주형으로 전환시키고, 여기서 HA-프리코어 ORF 가 회복되어, HA-프리코어 mRNA, 및 (F) 드 노보 (de novo) 바이러스 복제를 위한 pgRNA 를 산출한다. (G) HA-프리코어 mRNA 로부터의 HA-프리코어 번역 및 분비된 HA-HBeAg 내로의 프로세스 (이는 ELISA 에 의해 검출될 수 있음). preC, C, pol, L, M, S 및 X 는 각각 프리코어, 코어에 대한 ORF 시작 코돈, 중합효소, 대, 중 및 소 s 항원, 및 X 단백질을 나타낸다. DR 은 직접 반복 서열을 나타낸다. CTD 는 C-말단 도메인을 나타낸다.
도 6. HepBHAe13 세포 내의 바이러스 DNA 복제, cccDNA 축적, 및 HA-표지된 HBeAg 생성의 동역학.
HepBHAe13 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포 및 상청액 샘플을 지시된 시점에 수확하였다. 세포내 코어 DNA (상부 패널) 및 cccDNA (하부 패널) 를 추출하고, 서던 블롯 혼성화에 의해 분석하였다. DP-rc 는 탈단백질화된 (단백질이 없는) RC DNA 를 나타낸다. 분비된 HA-표지된 HBeAg 는 상기 기재된 바와 같은 HA IP-웨스턴 블롯에 의해 검출되었다.
도 7. HA-재조합 HBV DNA 복제를 지지하는 부가적인 유도성 HepBHAe 세포주.
HepDES19 세포 및 상이한 클론 번호를 가진 새롭게 확립된 HepBHAe 세포를 테트라사이클린의 존재 하에 동일한 밀도로 6-웰-플레이트에 시딩하였다. 세포가 융합성에 도달하였을 때, 하나의 세포 세트는 테트라사이클린의 존재 하에 배양하고, 또다른 세포 세트는 테트라사이클린의 부재 하에 배양하였다. 6 일 후, 세포를 수확하고, 바이러스 코어 DNA 를 서던 블롯에 의해 분석하였다.
도 8. HepBHAe 세포주 중의 cccDNA 의 진위성.
HepDES19 세포 및 표시된 HepBHAe 세포에서 생성된 cccDNA 를 Hirt 추출에 의해 추출하고 겔 전기영동 및 서던 블롯 혼성화 (레인 1, 5, 8, 11, 14) 에 적용하였다. HBV cccDNA 의 진위성을 추가로 입증하기 위해, Hirt DNA 샘플을 DP-rcDNA 가 SS DNA 로 변성되는 조건인 겔 로딩 전 5 분 동안 85℃ 로 가열한 한편, cccDNA 는 비변성으로 머무르고 이의 전기영동 이동성이 변치 않고 남아있다 (레인 2, 6, 9, 12, 15). 열 변성된 DNA 샘플을 EcoRI 으로 추가로 소화시키고, 이 조건에서 cccDNA 는 게놈-길이 이중-가닥 DNA 로 선형화된다 (레인 3, 7, 10, 13, 16).
도 9. HepBHAe 세포주 중의 HA-HBeAg 의 AlphaLISA 검출.
HepBHAe 세포를 테트라사이클린의 존재 하에 플레이트에 시딩하였다. 세포가 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 상청액 샘플을 지시된 시점에 수확하고 HA-HBeAg 검출을 위해 AlphaLISA 에 적용하였다. AlphaLISA 판독값 (상대적 광 단위, RLU) 을 초 당 계수 (CPS) 로서 표현하였다.
도 10. HBV 복제 저해제 (3TC) 는 HepBHAe13 세포에서 HA-HBeAg 발현을 차단함.
HepBHAe13 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 6-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 지시된 시점에서 수확된 상청액 샘플을 HA-표지된 HBeAg 에 대한 화학발광 면역검정 (CLIA) 에 적용하였다.
도 11. HBV cccDNA 형성 저해제는 HepBHAe13 세포 중의 HA-HBeAg 수준을 감소시킴.
세포를 96-웰-플레이트 내에 시딩하고, 세포가 융합성이 되었을 때 바이러스 복제를 유도하기 위해 테트라사이클린을 배지로부터 제거하였다. 동시에, 세포를 미처리된 채로 두거나 지시된 농도에서 화합물로 처리하고, DMSO 농도를 처리된 및 미처리된 그룹에서 0.5% 로 정규화하였다. 처리를 매 4 일마다 반복하였다. 처리 12 일 후에, 배양액을 HA-HBeAg CLIA 에 적용하고, 판독값을 대조군에 대한 백분율 (평균 ± SD) 로서 플롯팅하였다.
도 12. 부가적인 HepBHAe 세포 클론 중의 바이러스 RNA 전사, DNA 복제 및 cccDNA 축적의 동역학.
표시된 HepBHAe 세포를 테트라사이클린의 존재 하에 6-웰-플레이트에 시딩하였다. 세포 단층이 융합성이 되었을 때, 테트라사이클린을 배양 배지로부터 제거하고, 배지를 2 일마다 교체하였다. 세포를 지시된 시점에 수확하였다. 총 바이러스 RNA (상부 패널), 세포질 코어 DNA (중간 패널) 를 추출하고 노던 및 서던 블롯 혼성화 각각에 의해 분석하였다. 추출된 cccDNA 를 85℃ 에서 5 분 동안 열 변성시키고, 이후 EcoR I 에 의해 선형화한 후, 서던 블롯 분석 (하부 패널) 하였다.
도 13. 부가적인 HepBHAe 세포 클론 중의 HA-HBeAg 의 cccDNA-의존성 발현.
선택된 HepBHAe 세포를 융합성이 될 때까지 테트라사이클린의 존재 하에 96-웰-플레이트에서 배양하였다. 하나의 세포 세트를 테트라사이클린의 존재 하에서 지속적으로 유지하였다. 이후 두 번째 세포 세트를 테트라사이클린-불포함 배지로 전환시켰다. 이후 세 번째 세포 세트를 10 μM 3TC 를 함유하는 테트라사이클린-불포함 배지에서 배양하였다. 배양 배지를 2 일 마다 보충하고, 처리 9 일 후에 수확된 상청액 샘플을 HA-표지된 HBeAg 검출을 위한 화학발광 면역검정 (CLIA) 에 적용하였다.

하기 실시예는 본 발명을 설명한다.

실시예 1: B 형 간염 바이러스 공유결합 폐환형 DNA-의존성 에피토프-표지된 e 항원을 유도적으로 발현하는 배양된 세포주, 및 항바이러스 성분을 스크리닝하기 위한 이의 용도

재료 및 방법

플라스미드

시작 코돈 녹아웃 (knockout) 을 가진 인간 인플루엔자 헤마글루티닌　(HA) 융합 프리코어 개방 판독 프레임을 함유하는 테트라사이클린-유도성 HBV 복제 벡터를 구축하기 위해, 프리코어 ORF 중의 nt 1816(A) 의 결실 및 HA-표지 서열의 삽입이 있는 다운스트림 HBV 단편 (유전자형 D, 하위유형 ayw, nt 1805-2335) 및 CMV-IE 프로모터의 TATA 박스 모티프를 함유하는 DNA 단편을 Genscript Inc 에 의해 화학적으로 합성하였다. 상기 DNA 단편 내에, SacI 제한 효소 부위가 5' 말단에 존재하고, 진정한 BspEI 제한 부위가 3' 말단에 존재한다. 벡터 pTREHBV-HAe 는 합성된 DNA 단편의 플라스미드 pTREHBVDES 중의 SacI/BspEI 제한 부위 내로의 삽입을 통해 구축되었다. pTREHBV-HAe 의 완전한 서열을 SEQ ID NO. 35 에 나타낸다.

HA-융합된 프리코어 발현 벡터를 생성하기 위해, HA 서열 삽입이 있는 HBV nt 1816-2335 를 함유하는 PCR 단편을 프라이머 5'-ATTGGATCCACCATGCAACTTTTTCACCTCTGC-3' 및 5'-ACAGTAGTTTCCGGAAGTGTTGATAGGATAGGGG-3' 를 사용함으로써 pTREHBV-HAe 로부터 증폭시켰다. PCR 단편을 BamHI 및 BspEI 로 제한소화시키고, 프리코어 발현 벡터 (pcHBe) 중의 동일한 제한 부위 내에 삽입하여 플라스미드 pcHA-HBe 를 산출하였다. pcHA-HBe 의 완전한 서열을 SEQ ID NO. 39 에 나타낸다.

세포 배양

HBV 복제를 지지하는 간모세포종 세포주인 HepG2 세포 (ATCC® HB-8065™) 를 ATCC 로부터 입수하였다. HBV DNA 및 cccDNA 를 유도적으로 발현하는 HepG2-유래된 HepDES19 세포주가 이전에 기재되어 있다 (7). 세포주를 10% 우태 혈청, 100 U/ml 페니실린, 및 100 ㎍/ml 스트렙토마이신이 보충된 둘베코 개질된 이글 배지 (DMEM)-F12 배지 (Cellgro) 에 유지시켰다.

HepBHAe 세포주를 확립시키기 위해, HepG2 세포를 Tet-반응성 전사 활성화제 및 플라스미드 pTREHBV-HAe 를 발현하는 플라스미드 pTet-오프 (Clontech) 로 트랜스펙션시키고, 여기서 개질된 HBV pgRNA 의 전사는 테트라사이클린-반응성 요소가 있는 CMV-IE 프로모터에 의해 제어된다. 트랜스펙션된 HepG2 세포를 1 ㎍/ml 테트라사이클린의 존재 하에 500 ㎍/ml G418 로 선별하였다. G418-저항성 콜로니를 고르고, 세포주로 팽창시켰다. 테트라사이클린-불포함 배지에서 세포를 배양함으로써 HBV 복제를 유도시켰고, 바이러스 DNA 복제 중간체의 수준을 서던 블롯 혼성화에 의해 측정하였다. HBV 복제 수준이 높은 세포주를 선택하고, 상이한 클론 번호를 가진 HepBHAe 로서 지정하였다.

HA-표지된 HBeAg 안정한 발현 세포주 HepHA-HBe 를 pcHA-HBe 플라스미드로의 HepG2 세포의 트랜스펙션에 의해 생성시키고, 콜로니를 500 ㎍/ml G418 로 선별하고, 양성 콜로니를 항-HA 웨스턴 블롯 분석에 의해 확인하였다.

HepBHAe 및 HepHA-HBe 안정한 세포주를 500 ㎍/ml 의 G418 을 첨가하는 것을 제외하고는, HepG2 와 동일한 방식으로 배양하였다. HepBHAe 세포의 경우, 테트라사이클린을 HBV pgRNA 전사를 억제하기 위해 유지 동안 1 ㎍/ml 로 정규적으로 첨가하였다.

세포 트랜스펙션

세포 (~1.0x10⁶) 를 항생제-불포함 DMEM/F12 배지 중의 콜라겐 코팅된 35-mm-직경 디쉬에 시딩하였다. 밤새 인큐베이션 후, 각각의 웰을 제조자의 지침에 따라 Lipofectamine 2000 (Life Technologies) 과 함께 총 4 ㎍ 플라스미드로 트랜스펙션하였다. 트랜스펙션된 세포 또는 상청액 샘플을 지시된 시점에 수확하였다.

바이러스 핵산 분석

총 세포 RNA 를 TRIzol 시약 (Life Technologies) 으로 제조자의 프로토콜에 따라 추출하였다. 캡시드화 바이러스 pgRNA 를 하기와 같이 정제하였다: 하나의 12-웰 플레이트 웰로부터의 세포를 10 mM Tris-HCl (pH 8.0), 1 mM EDTA, 1% NP-40, 및 50 mM NaCl 을 함유하는 250 ㎕ 의 용해 완충액 중에서 37℃ 에서 10 분 동안 용해하고, 핵을 원심분리에 의해 제거하였다. 샘플을 6 U 의 마이크로코칼 뉴클레아제 및 15 ㎕ 의 100 mM CaCl₂ 과 함께 인큐베이션시키고, 15 분 동안 37℃ 에서 인큐베이션시켜, 자유 핵산을 소화시켰다. 캡시드화 바이러스 pgRNA 를 제조자의 프로토콜에 따라 750 ㎕ TRIzol LS 시약 (Invitrogen) 을 첨가함으로써 추출하였다. RNA 샘플을 2.2 M 포름알데히드를 함유하는 1.5% 아가로오스 젤을 통해 전기영동시키고, 20X SSC 완충액 (1X SSC 는 0.15 M NaCl + 0.015 M 나트륨 시트레이트임) 중의 Hybond-XL 멤브레인 (GE Healthcare) 상에 이동시켰다.

세포질 바이러스 코어 DNA 를 하기와 같이 추출하였다: 하나의 35-mm 직경 디쉬로부터의 세포를 10 mM Tris-HCl, pH 8.0, 10 mM EDTA, 1% NP40 및 2% 수크로오스를 함유하는 0.5 ml 의 용해 완충액으로 37℃ 에서 10 분 동안 용해하였다. 세포 잔해 및 핵을 원심분리에 의해 제거하고, 상청액을 3 ㎕ 의 1 M Mg(OAc)₂ 및 5 ㎕ 의 10 mg/ml DNase I (Calbiochem) 로 30 분 동안 37℃ 에서 인큐베이션하였다. 이후 상청액을 뉴클레오캡시드 침전을 위해 15 ㎕ 의 0.5 M EDTA, 및 1.5 M NaCl 을 함유하는 130 ㎕ 의 35% 폴리에틸렌 글리콜 (PEG) 8000 과 혼합하였다. 빙상에서 1 시간 동안 인큐베이션 후, 바이러스 뉴클레오캡시드를 10,000 rpm 에서 5 분 동안 4℃ 에서 원심분리에 의해 펠렛화한 다음, 37℃ 에서 1 시간 동안 0.5 mg/ml 프로나아제 (Calbiochem), 0.5% 나트륨 도데실 술페이트 (SDS), 100 mM NaCl, 25 mM Tris-HCl (pH 7.4), 및 10 mM EDTA 를 함유하는 400 ㎕ 의 소화 완충액 중에서 소화시켰다. 소화 혼합물을 페놀로 추출하고, DNA 를 에탄올로 침전시키고, TE (10 mM Tris-HCl, pH 8.0, 1 mM EDTA) 완충액에 용해시켰다. 각 플레이트로부터의 코어 DNA 샘플의 1/3 을 전기영동에 의해 1.2% 아가로오스 겔 내로 분해하였다. 이후 겔을 0.2N HCl 을 함유하는 완충액 중의 탈퓨린화, 0.5 M NaOH 및 1.5 M NaCl 을 함유하는 용액 중에서의 변성, 및 1 M Tris-HCl (pH 7.4) 및 1.5 M NaCl 을 함유하는 완충액 중에서의 중화에 적용하였다. DNA 를 이후 20X SSC 완충액 중의 Hybond-XL 멤브레인 상에 블롯팅하였다.

단백질-불포함 바이러스 DNA (cccDNA 및 단백질-불포함 rcDNA) 의 추출을 변형된 Hirt 추출 절차를 사용하여 수행하였다 (4, 8). 간략하게는, 하나의 35-mm 직경 디쉬로부터의 세포를 3 ml 의 10 mM Tris-HCl (pH 7.5), 10 mM EDTA, 및 0.7% SDS 중에 용해하였다. 실온에서의 30 분 인큐베이션 후, 용해액을 15-ml 튜브 내로 이동시키고, 이 단계 후에 0.8 ml 의 5 M NaCl 을 첨가하고 4℃ 에서 밤새 인큐베이션시켰다. 용해액을 이후 30 분 동안 4℃ 에서 10,000 rpm 에서의 원심분리에 의해 정화시키고, 페놀로 2 회 및 페놀:클로로포름:이소아밀 알코올 (25:24:1) 로 1 회 추출하였다. DNA 를 실온에서 밤새 에탄올 중에서 침전시키고, TE 완충액에 용해하였다. 단백질-불포함 DNA 샘플의 1/3 을 이후 1.2% 아가로오스 겔 내에 분해하고 Hybond-XL 멤브레인 상에 이동시켰다.

HBV RNA 및 DNA 의 검출을 위해, 멤브레인을 [α-³²P]UTP (800 Ci/mmol; Perkin Elmer)-라벨링된 양성- 또는 음성- 가닥-특이적 전체-길이 HBV 리보탐침으로 탐침하였다. 혼성화를 5 ml 의 EKONO 혼성화 완충액 (Genotech) 에서 수행하였는데, 65℃ 에서 1 시간 동안의 예비혼성화 및 65℃ 에서 밤새 혼성화 후, 0.1X SSC 및 0.1% SDS 중에 65℃ 에서 1 시간 동안 세척하였다. 멤브레인을 인광이미지기 (phosphorimager) 스크린에 노출시키고, 혼성화 신호를 Typhoon FLA-7000 system (GE Healthcare) 에 의해 검출하였다.

웨스턴 블롯 분석

35 mm 디쉬 중의 세포를 PBS 완충액으로 1 회 세척하고, 500 ㎕ 의 1X Laemmli 완충액에 용해하였다. 총 50 ㎕ 의 세포 용해액을 SDS-12% 폴리아크릴아미드 겔 상에 분해하고, 폴리비닐리덴 디플루오라이드 멤브레인 (Millipore) 상에 옮겼다. 멤브레인을 Western Breeze 차단 완충액 (Life Technologies) 으로 차단하고, HBcAg (aa170-183), HA-표지 (Sigma-Aldrich, 클론 M2), β-액틴 (Sigma-Aldrich) 에 대항하는 항체로 탐침하였다. 결합된 항체를 IRDye 이차 항체에 의해 밝혀냈다. 면역블롯 신호는 Li-COR Odyssey 시스템으로 가시화되고 정량화되었다.

면역침전

하나의 35-mm 직경 디쉬로부터의 세포를 10 mM Tris-HCl, pH 8.0, 10 mM EDTA, 1% NP40, 2% 수크로오스 및 1X 프로테아제 저해제 칵테일 (G-biosciences) 을 함유하는 0.5 ml 의 용해 완충액으로 용해하였다. 세포 잔해를 제거하기 위한 원심분리 후, 정화된 세포 용해액을 50 ㎕ 의 Ezview Red Anti-HA (Sigma-Aldrich) 와 함께 4℃ 에서 부드럽게 회전시키면서 밤새 인큐베이션시켰다. 하나의 35-mm 직경 디쉬 (총 1 ml) 로부터의 0.5 ml 의 배지 샘플을 면역침전에 직접 적용하였다. 비드를 TBS 완충액 (0.15 M NaCl, 0.05 M Tris-HCl [pH 7.4]) 으로 3 회 4℃ 에서 세척하였다. 펠렛화된 비드를 Laemmli 완충액으로의 단백질 샘플 제조에 적용하였다. 면역침전된 HA-표지된 단백질을 HA-표지에 대항하는 항체 (Sigma-Aldrich) 를 사용하는 웨스턴 블롯에 의해 검출하였다.

HA-표지된 HBeAg 의 검출을 위한 ELISA

HA-표지된 HBeAg 의 화학발광 효소 면억검정 (CLIA) 검출을 위해, 고 민감성 스트렙타비딘 코팅된 플레이트 (Black, cat#: 15525, Thermo Scientific) 를 PBST (PBS + 0.05% Tween 20) 로 3 회 세척한 다음, 50 ㎕ 의 항-HA-비오틴 (cat#: A00203, Genscript; PBS 중 5 ㎍/ml) 과 함께 RT 에서 30 분 동안 인큐베이션시킨 후, 200 ㎕ PBST 로 3 회 세척하였다. 세척 완충액의 제거 후, 50 ㎕ 의 배양 상청액 샘플을 ELISA 웰에 첨가하고, RT 에서 30 분 동안 인큐베이션한 후, 200 ㎕ PBST 로 3 회 세척하였다. 이후 50 ㎕ 의 호스래디쉬 퍼옥시다아제 (HRP)-접합된 항-HBe 항체 (HBeAg CLIA 키트, cat#: CL0312-2, Autobio Diagnostics) 를 웰에 첨가하고, RT 에서 30 분 동안 인큐베이션하였다. 200 ㎕ PBST 로 5 회 세척 후, CLIA 키트로부터의 25 ㎕ 의 각각의 기질 A 및 B 를 첨가하고, 플레이트를 10 초 동안 부드럽게 교반시켰다. 플레이트를 광도계 (luminometer) 상에서 판독하였다.

HA-표지된 HBeAg 의 AlphaLISA 검출을 위해, 항-HA-비오틴 (cat#: A00203, Genscript) 을 1X 검정 완충액 (25mM HEPES, 0.1M NaCl, 0.1% BSA, pH7.4) 중에서 2 ㎍/ml 로 희석하고, Proxiplate-384 HS (cat#: 6008279, Perkin Elmer) 의 각각의 웰 내에 5 ㎕ 분배하였다. 이후 5 ㎕ 의 배양액 샘플을 웰에 첨가하고 부드럽게 혼합한 후, RT 에서 30 분 동안 인큐베이션하였다. 후속하여, 5 ㎕ 의 0.2 ㎍/ml 항-HBe (클론 29, Lot 20110305, Autobio Diagnostics) 를 첨가하고 부드럽게 혼합한 후, RT 에서 30 분 동안 인큐베이션하였다. 이후, 검정 용액을 5 ㎕ 의 희석된 항-마우스 IgG AlphaLISA 수용체 비드 (cat#: AL105C, Perkin Elmer) (125 ㎍/ml) 와 혼합하고, RT 에서 30 분 동안 인큐베이션한 후, 5 ㎕ 의 AlphaScreen Streptavidin 기증자 비드 (cat#: 6760002S, Perkin Elmer) (125 ㎍/ml) 와 RT 에서 1 시간 동안 인큐베이션하였다. 인큐베이션 후, 플레이트를 Envision 2104 Multilabel 판독기 (Perkin Elmer) 상에서 판독하였다.

결과

본원에 제공되는 것은 이식유전자로부터의 HA-표지된 HBeAg (HA-HBeAg) 및 HBV cccDNA 를 각각 발현하기 위한 신규한 세포주의 2 가지 유형이고, 화학발광 면역검정 및 AlphaLISA 검정에 의해 재조합 HBeAg 를 검출하기 위한 방법이다. 세포주 및 검정은 HBV cccDNA 수준 및/또는 침묵 cccDNA 전사를 감소시키는 화합물의 고 처리량 스크리닝에 적합하다.

작은 컴팩트 HBV DNA 게놈 크기 및 중첩된 게놈 조직은 트랜스펙션된 세포 중의 바이러스 DNA 복제 및 후속 cccDNA 형성에 영향을 주지 않으면서 리포터 유전자의 삽입을 제한한다.

프리코어/HBeAg 는 HepDE19 세포 내에 cccDNA-의존성 방식으로 조작될 수 있다 (3). 당업계에는 HBV 게놈이 중첩된 ORF 및 복합 시스 요소를 나타내는 고도로 컴팩트한 유전자 조직을 갖는다는 것이 알려져 있다. 그러므로, 유전자 삽입/결실 또는 서열 대체가 바이러스 DNA 복제에 매우 영향을 줄 가능성이 있다고 여겨졌다. 이전의 연구에서는 HBV 서열, 예컨대 외피 코딩 부위를 대부분의 경우에서, GFP 에 의해 대체하여 재조합 HBV 게놈을 제조했으나, 바이러스 단백질의 트랜스-보체 (trans-complement) 가 바이러스 복제 및 비리온 어셈블리를 지지하는데 필요했다 (Protzer, et al, PNAS (1999), 96: 10818-23.). 게다가, 이들 보고된 재조합 HBV 게놈은 허용 세포를 감염시키는데 사용된 경우 오직 첫 번째 라운드의 cccDNA 합성만을 만들 수 있고, cccDNA 의 세포내 증폭은 결함 바이러스 DNA 복제로 인해 차단된다.

상기 종래의 지식에도 불구하고, 프리코어 개방 판독 프레임 (ORF) 내의 인-프레임 융합된 짧은 외인성 에피토프 표지가 HBV 게놈에 의해 용인되고 cccDNA 주형으로부터 발현될 수 있어, 표지-특이적 항체 및 HBeAg 항체의 쌍이 ELISA 검출의 특이성을 상당히 개선시킬 것이라는 것이 본원에서 시도되었고 추론되었다.

인간 인플루엔자 헤마글루티닌　(HA) 융합된 프리코어 개방 판독 프레임을 가진 테트라사이클린-유도성 HBV 복제 벡터를 구축하기 위해, HA-표지-함유 DNA 서열 (gtggacatcTACCCATACGACGTTCCAGATTACGCTggc; SED ID NO.: 41) 을 HBV 발현 벡터 pTREHBVDES 중의 코어 ORF 의 시작 코돈에 인접한 인-프레임 업스트림 위치 내로 삽입하고, 여기서 HBV pgRNA 발현은 테트라사이클린 (tet) 조절된 CMV-IE 프로모터에 의해 Tet-오프 방식으로 지배된다. HA-표지 (상부 경우에) 의 측면위치 서열 (하부 경우에) 을 HBV 게놈의 줄기 루프 구조 (엡실론, ε) 및 코어 ORF 시작 코돈의 코작 모티프의 염기 짝지음을 유지하도록 설계하였다 (도 1). 수득된 재조합 플라스미드를 pTREHBV-HAe (SEQ ID NO: 35) 로 지정하였다. HA-표지 삽입 외에, 플라스미드 pTREHBV-HAe 는 프리코어 ORF 의 5' 말단 시작 코돈 중의 점 결실 (ATG 에서 TG) 을 함유하며, 이에 의해 플라스미드 주형 내의 HBV 게놈으로부터의 프리코어의 발현을 방해한다. 부가적으로, HBV 감염성 입자의 생성을 차단하기 위해 2 개의 탠덤 정지 코돈을 소 (S) 외피 단백질 (217TTGTTG222 에서 217TAGTAG222; 돌연변이는 밑줄쳐짐) 의 아미노 말단의 코딩 부위 내로 도입하였다.

에피토프-표지된 HBV 프리코어 단백질 발현 및 HBeAg 분비의 실현가능성을 시험하기 위해, HA-표지-함유 DNA 서열을 프리코어 발현 플라스미드 pcHBe 내의 상기 기재된 바와 같은, 동일한 바이러스 DNA 위치 내로 삽입하였고, 구축물을 pcHA-HBe (SEQ ID NO: 39) 로 지정하였다. HepG2 세포 중의 pcHA-HBe 의 트랜스펙션은 HA-표지된 프리코어 단백질의 세포내 발현 및 HA-표지된 HBeAg 의 세포외 축적을 야기하였고 (도 2), 따라서 프리코어 단백질 내로의 HA 표지의 삽입이 프리코어 발현, 후-번역 프로세싱, 및 HBeAg 분비에 영향을 주지 않는다는 것을 확인시켰다. HA-표지된 HBeAg (HA-HBeAg) 의 검출을 위한 화학발광 ELISA 및 AlphaLISA 가, 재료 및 방법 섹션에서 기재된 바와 같이, 또한 구축되었다.

상기에 따르면, HA-표지된 HBeAg 를 구성적으로 발현하는 세포주를 pcHA-HBe 를 HepG2 세포 내로 안정적으로 트랜스펙션함으로써 확립시켰다. HA-표지된 HBeAg 발현 수준이 높은 2 개의 클론을 AlphaLISA 검정을 통해 선별하고, 각각 HepHA-HBe4 및 HepHA-HBe47 로 지정하였다 (도 3).

재조합 HBV 플라스미드 pTREHBV-HAe 는 pTREHBVDES 가 일시적 트랜스펙션 검정에서 복제했던 것에 필적하는 수준까지 HBV DNA 를 복제할 수 있어 (도 4), HA-표지 삽입이 HBV 게놈 복제에 의해 용인되었다는 것을 제시하였다. 이후, pTREHBV-HAe 를 pTET-오프 (Clontech) 와 함께 HepG2 세포 내로 안정적으로 공동-트랜스펙션하여, 테트라사이클린 유도성 HBV 세포주를 만들었다. 이론적으로는, 이러한 세포주에서, 유도시, 프리코어 단백질 및 이의 유도체 HBeAg 가 프리코어 ORF 시작 코돈의 침묵으로 인해 이식유전자로부터 제조되지 않을 것이다. 전사된 pgRNA 는 바이러스 코어 단백질 및 중합효소를 발현하고 역전사를 개시하여 rcDNA 를 생성시켜, 세포내 증폭 경로를 통해 cccDNA 형성을 초래할 것이다. pgRNA 의 3' 중복에의 불완전한 프리코어 ORF 의 시작 코돈이 바이러스 DNA 서열 내로 카피될 것이고, HA-표지된 프리코어의 미손상 ORF 는 rcDNA 의 cccDNA 로의 전환 동안 재구성될 것이다. 따라서, HA-프리코어 mRNA 는 오로지 cccDNA 로부터 전사되어, 분비된 HA-표지된 HBeAg 를 핵내 cccDNA 에 대한 대리 마커로 만들 수 있다 (도 5).

테트라사이클린-의존적 방식으로 높은 수준의 HBV DNA 복제를 지지하는 5 개의 세포주 (HepBHAe1, HepBHAe13, HepBHAe34, HepBHAe45, HepBHAe82) 를 수득하였다 (도 6 및 7).

대표적인 계통 HepBHAe13 세포에서, 복제형 DNA 중간체 및 cccDNA 를 포함하는 바이러스 생성물의 합성 및 축적의 시간-의존적 동역학을, 테트라사이클린 철회시 관찰하였다. HepBHAe13 세포의 배양액에서, HA-표지된 HBeAg 를 또한 테트라사이클린의 제거 6 일 후에 웨스턴 블롯에 의해 검출하였고, 항원 수준은 그 후에 점차적으로 증가하였다. HA-표지된 HBeAg (HA-HBeAg) 의 수준은 바이러스 코어 DNA 및 cccDNA 의 세포내 수준에 비례하였다 (도 6). HepBHAe 세포주로부터 생성된 cccDNA 의 진위성을 열 변성 및 추가의 제한 효소 소화에 의해 확인하였다 (도 8). 그러므로, 프리코어 중의 HA-표지 삽입이 있는 재조합 HBV 의 DNA 복제 및 cccDNA 형성을 지지하는 유도성 세포주가 성립되었다.

배양된 HepBHAe 세포로부터의 상청액 샘플에 대한 AlphaLISA 검정은 16-일 시간 경과 연구에서 HA-표지된 HBeAg 의 증가된 수준을 입증하였다 (도 9). 추가 입증을 위해 HepHBAe13 세포를 선택하였다. 세포를 다음 3 가지 조건 하에 배양하였다: 1) 이식유전자 발현을 억제하기 위해 테트라사이클린의 존재 하; 2) 바이러스 DNA 복제를 유도하기 위해 테트라사이클린의 부재 하; 3) 바이러스 DNA 복제 및 후속 cccDNA 형성을 차단하기 위해 테트라사이클린의 부재 하, 그러나 3TC 처리 하. 화학발광 면역검정 (CLIA) 은 cccDNA 확립 및 유전자 발현의 결과로서, 배양 배지 중의 HA-표지된 HBeAg 신호가 테트라사이클린 철회 6 일 후에 나타나고, 이후 점차적으로 증가하였다는 것을 보여주었다. 예상되는 바와 같이, HA-HBeAg 는 테트라사이클린의 존재 하 또는 3TC 처리 (tet-) 하의 임의의 시점에서 배양액에서 검출되지 않았다 (도 10). 게다가, 2 개의 이전에 확인된 cccDNA 형성 저해제, 구체적으로 CCC-0975 및 CCC-0346 (3) 은, HepBHAe13 세포로부터 HA-HBeAg 생성의 용량-의존적 저해를 나타냈다 (도 11). 그러므로, HA-표지된 HBeAg 의 생성은 HepBHAe13 세포에서 cccDNA-의존적이다.

추가로, HepBHAe1, HepBHAe45 및 HepBHAe82 를 포함하는 다른 HepBHAe 세포주의 시간 경과 연구는, 테트라사이클린 철회시 HBV mRNA, 세포질 코어 DNA 및 핵 cccDNA 의 시간-의존적 축적을 입증하였다 (도 12). 도 13 에서 나타낸 바와 같이, cccDNA-의존적 HA-표지된 HBeAg 생성은 이러한 3 개 추가적인 HepBHAe 세포주에서 검증되었다.

종합하여, 여기서 본원에서 기재한 HA-HBeAg 검출 방법으로의 항바이러스 화합물 스크리닝에서 HBV cccDNA 에 대한 대리 마커로서 역할할 수 있는, HBV cccDNA-의존적 HA-표지된 HBeAg 를 발현하는 신규한 유도성 세포주가 확립되었다.

본 발명은 하기의 뉴클레오티드 및 아미노산 서열을 나타낸다:

본원에 제공된 서열은 NCBI 데이터베이스에서 이용가능하며 ncbi.nlm.nih.gov/sites/entrez?db=gene 에서의 월드 와이드 웹으로부터 검색될 수 있고; 이들 서열은 또한 주석이 달리고 변형된 서열에 관한 것이다. 본 발명은 또한 상동 서열, 및 본원에 제공된 축약 서열의 변이체가 사용되는 방법 및 기법을 제공한다. 바람직하게는, 이러한 "변이체" 는 유전적 변이체이다.

SEQ ID No. 1:

헤마글루티닌 (HA) 표지를 인코딩하는 뉴클레오티드 서열

TACCCATACGACGTTCCAGATTACGCT

SEQ ID No. 2:

His-표지를 인코딩하는 뉴클레오티드 서열

CATCATCATCATCATCAC

SEQ ID No. 3:

Flag-표지를 인코딩하는 뉴클레오티드 서열

GACTACAAGGACGACGACGACAAG

SEQ ID No. 4:

c-myc-표지를 인코딩하는 뉴클레오티드 서열

ATG GCA TCA ATG CAG AAG CTG ATC TCA GAG GAG GAC CTG

SEQ ID No. 5:

V5-표지를 인코딩하는 뉴클레오티드 서열

GGT AAG CCT ATC CCT AAC CCT CTC CTC GGT CTC GAT TCT ACG

SEQ ID No. 6:

C9-표지를 인코딩하는 뉴클레오티드 서열

ACTGAAACATCTCAAG표지CTCCAGCT

SEQ ID No. 7:

3xFlag-표지를 인코딩하는 뉴클레오티드 서열

GACTACAAAGACCACGACGGTGACTACAAAGACCACGACATCGACTACAAGGACGACGACGACAAG

SEQ ID No. 8:

HA 표지의 아미노산 서열

YPYDVPDYA

SEQ ID No. 9:

His-표지의 아미노산 서열

HHHHHH

SEQ ID No. 10:

Flag-표지의 아미노산 서열

DYKDDDDK

SEQ ID No. 11:

c-myc-표지의 아미노산 서열

EQKLISEEDL

SEQ ID No. 12:

V5-표지의 아미노산 서열

GKPIPNPLLGLDST

SEQ ID No. 13:

C9-표지의 아미노산 서열

TETSQVAPA

SEQ ID No. 14:

3xFlag-표지의 아미노산 서열

DYKDHDGDYKDHDIDYKDDDDK

SEQ ID No. 15:

B 형 간염 바이러스 프리코어 단백질을 인코딩하는 뉴클레오티드 서열

프리코어 ORF 서열:

SEQ ID No. 16:

B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 뉴클레오티드 서열

HBeAg DNA 서열:

SEQ ID No. 17:

B 형 간염 바이러스 프리코어 단백질의 아미노산 서열

프리코어 아미노산 서열:

SEQ ID No. 18:

B 형 간염 바이러스 e 항원 (HBeAg) 의 아미노산 서열

HBeAg 아미노산 서열 (프리코어로부터 N-말단 신호 펩티드 (19 aa) 및 C-말단 아르기닌-풍부 도메인 (34 aa) 을 제거함):

SEQ ID No. 19:

HA-표지된 B 형 간염 바이러스 프리코어 단백질을 인코딩하는 뉴클레오티드 서열

HA-표지된 프리코어 DNA 서열:

SEQ ID No. 20:

HA-표지된 B 형 간염 바이러스 e 항원 (HBeAg) 을 인코딩하는 뉴클레오티드 서열

HA-표지된 HBeAg DNA 서열:

SEQ ID No. 21:

HA-표지된 B 형 간염 바이러스 프리코어 단백질의 아미노산 서열. HA-표지는 밑줄쳐 있다.

HA-표지된 프리코어 아미노산 서열:

SEQ ID No. 22:

HA-표지된 B 형 간염 바이러스 e 항원 (HBeAg) 의 아미노산 서열. HA-표지는 밑줄쳐 있다.

HA-표지된 HBeAg 아미노산 서열:

SEQ ID No. 23:

HBV 코어 단백질을 인코딩하는 뉴클레오티드 서열

SEQ ID No. 24:

HBV 코어 단백질의 아미노산 서열

SEQ ID No. 25:

HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 뉴클레오티드 서열

SEQ ID No. 26:

헤파드나바이러스 게놈의 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 뉴클레오티드 서열

GTGGACATC

SEQ ID No. 27:

HBV 게놈, HBV 유전자형 D, 하위유형 ayw 의 뉴클레오티드 서열. Genbank 접근 번호 U95551(C1902 및 A1903 은 굵은 글씨체이다. 프리코어의 ORF 는 밑줄쳐 있다)

SEQ ID No. 28:

HBV 게놈, HBV 유전자형 A 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007263)

SEQ ID No. 29:

HBV 게놈, HBV 유전자형 B 의 뉴클레오티드 서열 (Genbank 접근 번호 AB602818)

SEQ ID No. 30:

HBV 게놈, HBV 유전자형 C 의 뉴클레오티드 서열 (Genbank 접근 번호 AB540584)

SEQ ID No. 31:

HBV 게놈, HBV 유전자형 E 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007262)

SEQ ID No. 32:

HBV 게놈, HBV 유전자형 F 의 뉴클레오티드 서열 (Genbank 접근 번호 HE974366)

SEQ ID No. 33:

HBV 게놈, HBV 유전자형 G 의 뉴클레오티드 서열 (Genbank 접근 번호 AP007264)

SEQ ID No. 34:

HBV 게놈, HBV 유전자형 H 의 뉴클레오티드 서열 (Genbank 접근 번호 AB516393)

SEQ ID No. 35:

벡터의 뉴클레오티드 서열: pTREHBV-HAe (5,980nt)

벡터: pTRE2(Clontech)

nt 356-452: HBV nt 1805-1902 (A1816 결실)

nt 453-491: 측면위치 서열을 사용한 HA-표지 삽입

nt 462-488: HA-표지 서열

nt 492-3761: HBV nt 1903-3182/1-1990

SEQ ID No. 36:

HBV 외피 단백질, 대 표면 단백질 (L) 을 인코딩하는 뉴클레오티드 서열

SEQ ID No. 37:

HBV 외피 단백질, 중 표면 단백질 (M) 을 인코딩하는 뉴클레오티드 서열

SEQ ID No. 38:

HBV 외피 단백질, 소 표면 단백질 (S) 을 인코딩하는 뉴클레오티드 서열

SEQ ID No. 39:

발현 벡터 pcHA-HBe (6,682nt) 의 뉴클레오티드 서열

벡터: pcDNA3.1/V5-His-TOPO (Invitrogen)

nt 929-1015: HBV nt1816-1902

nt 1016-1054: 삽입

nt 1025-1051: HA-표지 서열

nt 1055-2112: HBV 1903-2605/1573-1926

SEQ ID No. 40:

표지에 대한 아미노산 서열 N-말단

VDI

SEQ ID No. 41:

5'- 및 3'- 추가적 뉴클레오티드를 포함하는 HA-표지를 인코딩하는 뉴클레오티드 서열. 밑줄친 뉴클레오티드는 HA-표지를 인코딩하는 서열을 나타낸다.

GTGGACATCTACCCATACGACGTTCCAGATTACGCTGGC.

SEQ ID No. 42:

N-말단 및 C-말단 추가적 아미노산을 포함하는 HA-표지의 아미노산 서열. 밑줄친 아미노산 잔기는 HA-표지의 서열을 나타낸다.

VDIYPYDVPDYAG

본원에서 토의한 바와 같은 추가적 참고문헌

1. Arzumanyan, A., H. M. Reis, and M. A. Feitelson. 2013. Pathogenic mechanisms in HBV- and HCV-associated hepatocellular carcinoma. Nature reviews. Cancer 13:123-135.

2. Block, T. M., H. Guo, and J. T. Guo. 2007. Molecular virology of hepatitis B virus for clinicians. Clin Liver Dis 11:685-706, vii.

3. Cai, D., C. Mills, W. Yu, R. Yan, C. E. Aldrich, J. R. Saputelli, W. S. Mason, X. Xu, J. T. Guo, T. M. Block, A. Cuconati, and H. Guo. 2012. Identification of disubstituted sulfonamide compounds as specific inhibitors of hepatitis B virus covalently closed circular DNA formation. Antimicrob Agents Chemother 56:4277-4288.

4. Cai, D., H. Nie, R. Yan, J. T. Guo, T. M. Block, and H. Guo. 2013. A southern blot assay for detection of hepatitis B virus covalently closed circular DNA from cell cultures. Methods Mol Biol 1030:151-161.

5. Galibert, F., E. Mandart, F. Fitoussi, and P. Charnay. 1979. Nucleotide sequence of the hepatitis B virus genome (subtype ayw) cloned in E.coli. Nature 281:646-650.

6. Gish, R. G., A. S. Lok, T. T. Chang, R. A. de Man, A. Gadano, J. Sollano, K. H. Han, Y. C. Chao, S. D. Lee, M. Harris, J. Yang, R. Colonno, and H. Brett-Smith. 2007. Entecavir therapy for up to 96 weeks in patients with HBeAg-positive chronic hepatitis B. Gastroenterology 133:1437-1444.

7. Guo, H., D. Jiang, T. Zhou, A. Cuconati, T. M. Block, and J. T. Guo. 2007. Characterization of the intracellular deproteinized relaxed circular DNA of hepatitis B virus: an intermediate of covalently closed circular DNA formation. J Virol 81:12472-12484.

8. Hirt, B. 1967. Selective extraction of polyoma DNA from infected mouse cell cultures. J Mol Biol 26:365-369.

9. Hoofnagle, J. H., E. Doo, T. J. Liang, R. Fleischer, and A. S. Lok. 2007. Management of hepatitis B: summary of a clinical research workshop. Hepatology 45:1056-1075.

10. Ito, K., K. H. Kim, A. S. Lok, and S. Tong. 2009. Characterization of genotype-specific carboxyl-terminal cleavage sites of hepatitis B virus e antigen precursor and identification of furin as the candidate enzyme. J Virol 83:3507-3517.

11. Ladner, S. K., M. J. Otto, C. S. Barker, K. Zaifert, G. H. Wang, J. T. Guo, C. Seeger, and R. W. King. 1997. Inducible expression of human hepatitis B virus (HBV) in stably transfected hepatoblastoma cells: a novel system for screening potential inhibitors of HBV replication. Antimicrob Agents Chemother 41:1715-1720.

12. Liang, T. J. 2009. Hepatitis B: the virus and disease. Hepatology 49:S13-21.

13. Liu, N., L. Ji, M. L. Maguire, and D. D. Loeb. 2004. cis-Acting sequences that contribute to the synthesis of relaxed-circular DNA of human hepatitis B virus. J Virol 78:642-649.

14. McMahon, B. J. 2014. Chronic hepatitis B virus infection. The Medical clinics of North America 98:39-54.

15. Nassal, M. 2008. Hepatitis B viruses: reverse transcription a different way. Virus Res 134:235-249.

16. Pawlotsky, J. M., G. Dusheiko, A. Hatzakis, D. Lau, G. Lau, T. J. Liang, S. Locarnini, P. Martin, D. D. Richman, and F. Zoulim. 2008. Virologic monitoring of hepatitis B virus therapy in clinical trials and practice: recommendations for a standardized approach. Gastroenterology 134:405-415.

17. Protzer, U., M. Nassal, P. W. Chiang, M. Kirschfink, and H. Schaller. 1999. Interferon gene transfer by a hepatitis B virus vector efficiently suppresses wild-type virus infection. Proc Natl Acad Sci U S A 96:10818-10823.

18. Quasdorff, M., and U. Protzer. 2010. Control of hepatitis B virus at the level of transcription. J Viral Hepat 17:527-536.

19. Seeger, C., and W. S. Mason. 2000. Hepatitis B virus biology. Microbiol Mol Biol Rev 64:51-68.

20. Sells, M. A., M. Chen, and G. Acs. 1987. Production of hepatitis B virus particles in hepG2 cells transfected with cloned hepatitis B virus DNA. Proc. Natl. Acad. Sci. USA 84:1005-1009.

21. Wang, J., A. S. Lee, and J. H. Ou. 1991. Proteolytic conversion of hepatitis B virus e antigen precursor to end product occurs in a postendoplasmic reticulum compartment. J Virol 65:5080-5083.

22. Wang, Z., L. Wu, X. Cheng, S. Liu, B. Li, H. Li, F. Kang, J. Wang, H. Xia, C. Ping, M. Nassal, and D. Sun. 2013. Replication-competent infectious hepatitis B virus vectors carrying substantially sized transgenes by redesigned viral polymerase translation. PLoS One 8:e60306.

23. Zhou, T., H. Guo, J. T. Guo, A. Cuconati, A. Mehta, and T. M. Block. 2006. Hepatitis B virus e antigen production is dependent upon covalently closed circular (ccc) DNA in HepAD38 cell cultures and may serve as a cccDNA surrogate in antiviral screening assays. Antiviral Res 72:116-124.

24. Zoulim, F., and S. Locarnini. 2009. Hepatitis B virus resistance to nucleos(t)ide analogues. Gastroenterology 137:1593-1608 e1591-1592.

본원에 인용된 모든 참고문헌은 전체가 본원에 참조로 포함된다. 이제 발명을 완전히 기재하여, 발명의 취지 또는 범주 또는 이의 임의의 구현예에 영향을 주지 않고 본 발명이 조건, 매개변수 등의 넓고 동등한 범위 내에서 실행될 수 있다는 것이 당업자에 의해 이해될 것이다.

상기에 따르고 첨부된 특허청구범위에서 정해진 바와 같이, 본 발명은 특히 하기의 항목에 관한 것이다:

1. 하기 단계를 포함하는, 헤파드나바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법:

(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보 분자와 접촉시키는 단계;

(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보 분자를 선택하는 단계.

2. 항목 1 에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.

3. 항목 1 또는 2 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 방법.

4. 항목 3 에 있어서, 상기 표지가 6 내지 22 개의 아미노산으로 이루어지는 방법.

5. 항목 3 또는 4 에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 방법.

6. 항목 5 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 방법.

7. 항목 1 또는 2 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 방법.

8. 항목 7 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 방법.

9. 항목 7 또는 8 에 있어서, 상기 표지가 6 내지 22 개의 아미노산으로 이루어지는 방법.

10. 항목 7 내지 9 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA)-표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 방법.

11. 항목 10 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 방법.

12. 항목 5 또는 10 에 있어서,

HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;

His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;

c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;

V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는

C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타내는 방법.

13. 항목 6 또는 11 에 있어서, 1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내고; 또는 3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타내는 방법.

14. 항목 5 또는 10 에 있어서,

HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;

His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;

c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;

V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는

C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타내는 방법.

15. 항목 6 또는 11 에 있어서,

1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내고; 또는

3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타내는 방법.

16. 항목 2 내지 15 중 어느 하나에 있어서, HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 16 에 나타내는 방법.

17. 항목 2 내지 15 중 어느 하나에 있어서, HBeAg 의 아미노산 서열을 SEQ ID NO: 18 에 나타내는 방법.

18. 항목 1 내지 17 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 방법.

19. 항목 18 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 방법.

20. 항목 18 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 방법.

21. 항목 1 내지 17 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 핵산 서열을 포함하고, 여기서 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 3' 다운스트림인 방법.

22. 항목 21 에 있어서, 하나 이상의 표지를 인코딩하는 상기 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 방법 .

23. 항목 1 내지 22 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 게놈을 포함하는 방법.

24. 항목 23 에 있어서, 상기 헤파드나바이러스 게놈이 B 형 간염 바이러스 (HBV) 게놈인 방법.

25. 항목 24 에 있어서, 상기 HBV 게놈이 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈인 방법.

26. 항목 24에 있어서, 상기 HBV 게놈이 HBV 유전자형 D 의 게놈인 방법.

27. 항목 26 에 있어서, 상기 HBV 유전자형 D 의 게놈이 HBV 하위유전자형 ayw 의 게놈인 방법.

28. 항목 1 내지 27 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 핵산이 헤파드나바이러스 코어 단백질를 인코딩하는 핵산의 5' 업스트림인 방법.

29. 항목 28 에 있어서, 헤파드나바이러스 코어 단백질이 HBV 코어 단백질인 방법.

30. 항목 29 에 있어서, HBV 코어 단백질을 인코딩하는 핵산을 SEQ ID NO: 23 에 나타내는 방법.

31. 항목 29 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 방법.

32. 항목 1 내지 31 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되는 방법.

33. 항목 32 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 방법.

34. 항목 33 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 방법.

35. 항목 1 내지 34 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 삽입되는 방법.

36. 항목 35 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 방법.

37. 항목 1 내지 36 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입되는 방법.

38. 항목 1 내지 37 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 방법.

39. 항목 38 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 방법.

40. 항목 38 또는 39 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 9 개 이하의 뉴클레오티드로 이루어지는 방법.

41. 항목 40 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 방법.

42. 항목 1 내지 41 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함하는 방법.

43. 항목 42 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 방법.

44. 항목 42 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 방법.

45. 항목 44 에 있어서, 상기 아미노산이 글리신 잔기인 방법.

46. 항목 42 내지 44 중 어느 하나에 있어서, 링커를 인코딩하는 상기 서열이 서열 GGC 로 이루어지거나; 상기 서열이 글리신 잔기를 인코딩하는 방법.

47. 항목 1 내지 46 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나;

표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 방법.

48. 항목 1 내지 47 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 방법.

49. 항목 48 에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.

50. 항목 2 내지 49 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 방법.

51. 항목 2 내지 50 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 방법.

52. 항목 2 내지 51 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 방법.

53. 항목 2 내지 52 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미논산 서열을 SEQ ID NO: 21 에 나타내는 방법.

54. 항목 24 내지 53 중 어느 하나에 있어서, HBV 게놈의 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에 나타내는 방법.

55. 항목 23 내지 54 중 어느 하나에 있어서, 핵산이 프리게놈 (pg) 헤파드나바이러스 RNA, 특히 프리게놈 (pg) HBV RNA 로 전사가능한 방법.

56. 항목 1 내지 55 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 방지하는 방법.

57. 항목 56 에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는 방법.

58. 항목 56 또는 57 에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 가 핵산 TG 에 의해 대체되는 방법.

59. 항목 56 내지 58 중 어느 하나에 있어서, 상기 핵산이 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역이 방지되는 방법.

60. 항목 1 내지 59 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 벡터 내에 포함되는 방법.

61. 항목 60 에 있어서, 벡터가 SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함하는 방법.

62. 항목 1 내지 61 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 유도성 프로모터의 제어 하에 있는 방법.

63. 항목 56 내지 62 중 어느 하나에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.

64. 항목 62 또는 63 에 있어서, 유도성 프로모터가 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터 또는 제초제-유도성 프로모터인 방법.

65. 항목 62 내지 64 중 어느 하나에 있어서, 유도성 프로모터가 CMV 프로모터 또는 tet-EF-1 알파 프로모터인 방법.

66. 항목 23 내지 65 중 어느 하나에 있어서, 하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입되는 방법.

67. 항목 66 에 있어서, 상기 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 방법.

68. 항목 67 에 있어서, 하나 이상의 HBV 외피 단백질이 대 표면 단백질 (L), 중 표면 단백질 (M) 및 소 표면 단백질 (S) 중 하나 이상인 방법.

69. 항목 67 에 있어서, HBV 외피 단백질이 소 표면 단백질 (S) 인 방법.

70. 항목 67 내지 69 중 어느 하나에 있어서, 하나 이상의 HBV 외피 단백질의 코딩 부위를 SEQ ID NO: 36 (L), SEQ ID NO: 37 (M) 및/또는 SEQ ID NO: 38 (S) 에 나타내는 방법.

71. 항목 70 에 있어서, SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 가 TAGTAG 로 돌연변이화되어, 외피 단백질의 발현이 방지되는 방법.

72. 항목 1 내지 71 중 어느 하나에 있어서, 세포가 진핵세포인 방법.

73. 항목 72 에 있어서, 진핵세포가 간세포 기원의 것인 방법.

74. 항목 72 또는 73 에 있어서, 진핵세포가 간종양 세포이거나 간종양 세포에서 유래하는 방법.

75. 항목 72 내지 74 중 어느 하나에 있어서, 진핵세포가 HepG2 (ATCC　#HB-8065) 인 방법.

76. 항목 1 내지 75 중 어느 하나에 있어서, 핵산 분자 또는 이를 포함하는 벡터가 세포의 게놈에 안정적으로 통합되는 방법.

77. 항목 1 내지 76 중 어느 하나에 있어서, 상기 단계 (a) 가 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함하는 방법:

(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;

(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;

(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;

(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 임의 회복;

(vii) 표지된 헤파드나바이러스 e 항원의 번역.

78. 항목 77 에 있어서, 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복이 시작 코돈의 회복인 방법.

79. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 형성을 저해하는 후보 분자의 능력을 평가하기 위한 것인 방법.

80. 항목 79 에 있어서, 세포가 cccDNA 가 형성되기 전에 후보 분자와 접촉되는 방법.

81. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 의 양 또는 수를 감소시키는 후보 분자의 능력을 평가하기 위한 것인 방법.

82. 항목 1 내지 78 중 어느 하나에 있어서, 상기 방법이 헤파드나바이러스의 cccDNA 의 전사를 감소시키는 후보 분자의 능력을 평가하기 위한 것인 방법.

83. 항목 81 또는 82 에 있어서, 세포가 cccDNA 가 형성된 후에 후보 분자와 접촉되는 방법.

84. 항목 1 내지 83 중 어느 하나에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 ELISA, CLIA 또는 AlphaLISA 에 의해 수행되는 방법.

85. 항목 1 내지 84 중 어느 하나에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 상기 헤파드나바이러스 e 항원을 특이적으로 인지하는 항체 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체의 사용을 포함하는 방법.

86. 항목 77 내지 85 중 어느 하나에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 방법.

87. 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자.

88. 항목 87 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.

89. 항목 87 또는 88 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 핵산 분자.

90. 항목 89 에 있어서, 상기 표지가 6 내지 22 개 아미노산으로 이루어지는 핵산 분자.

91. 항목 89 또는 90 에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 핵산 분자.

92. 항목 91 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 핵산 분자.

93. 항목 87 또는 88 에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 핵산 분자.

94. 항목 93 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 핵산 분자.

95. 항목 93 또는 94 에 있어서, 상기 둘 이상의 표지의 전체 길이가 14 내지 31 개 아미노산의 길이인 핵산 분자.

96. 항목 93 내지 95 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 핵산 분자.

97. 항목 96 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 핵산 분자.

98. 항목 91 또는 96 에 있어서, 하기와 같은 핵산 분자:

HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에서 나타내고; His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고; c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고; V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는 C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타냄.

99. 항목 92 또는 97 에 있어서, 하기와 같은 핵산 분자:

1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내거나;

3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타냄.

100. 항목 91 또는 96 에 있어서, 하기와 같은 핵산 분자:

HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;

His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;

c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;

V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는

C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄.

101. 항목 92 또는 97 에 있어서, 하기와 같은 핵산 분자:

1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내거나;

3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타냄.

102. 항목 88 내지 101 중 어느 하나에 있어서, HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 16 에 나타내는 핵산 분자.

103. 항목 88 내지 101 중 어느 하나에 있어서, HBeAg 의 아미노산 서열을 SEQ ID NO: 18 에 나타내는 핵산 분자.

104. 항목 87 내지 103 중 어느 하나에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 분자.

105. 항목 104 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 핵산 분자.

106. 항목 104 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 핵산 분자.

107. 항목 87 내지 106 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 핵산 서열을 포함하고, 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 ("프리코어" 부위) 및 N-말단 신호 펩티드를 인코딩하는 핵산 서열의 3' 다운스트림인 핵산 분자.

108. 항목 107 에 있어서, 상기 하나 이상의 표지를 인코딩하는 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 핵산 분자.

109. 항목 87 내지 108 중 어느 하나에 잇어서, 헤파드나바이러스 게놈을 포함하는 핵산 분자.

110. 항목 109 에 있어서, 상기 헤파드나바이러스 게놈이 B 형 간염 바이러스 (HBV) 게놈인 핵산 분자.

111. 항목 110 에 있어서, 상기 HBV 게놈이 HBV 유전자형 A, B, C, D, E, F, G 또는 H 의 게놈인 핵산 분자.

112. 항목 110 에 있어서, 상기 HBV 게놈이 HBV 유전자형 D 의 게놈인 핵산 분자.

113. 항목 112 에 있어서, HBV 유전자형 D 의 상기 게놈이 HBV 하위유전자형 ayw 의 게놈인 핵산 분자.

114. 항목 87 내지 113 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 핵산이 헤파드나바이러스 코어 단백질을 인코딩하는 핵산의 5' 업스트림인 핵산 분자.

115. 항목 114 에 있어서, 핵산 서열이 HBV 코어 단백질을 인코딩하는 핵산 분자.

116. 항목 115 에 있어서, HBV 코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 23 에 나타내는 핵산 분자.

117. 항목 114 에 있어서, 코어 단백질이 HBV 코어 단백질인 핵산 분자.

118. 항목 116 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 핵산 분자.

119. 항목 87 내지 118 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되는 핵산 분자.

120. 항목 119 에 있어서, 상기 헤파드나바이러스 게놈이 HBV 게놈인 핵산 분자.

121. 항목 120 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 핵산 분자.

122. 항목 87 내지 121 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 삽입되는 핵산 분자.

123. 항목 122 에 있어서, 상기 헤파드나바이러스 게놈이 HBV 게놈인 핵산 분자.

124. 항목 87 내지 123 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열을 포함하는 핵산 분자가 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입되는 핵산 분자.

125. 항목 87 내지 124 중 어느 하나에 있어서, 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하는 핵산 분자.

126. 항목 125 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 핵산 분자.

127. 항목 125 또는 126 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 9 개 이하의 뉴클레오티드로 이루어지는 핵산 분자.

128. 항목 127 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 핵산 분자.

129. 항목 87 내지 128 중 어느 하나에 있어서, 하나 이상의 표지를 인코딩하는 서열의 3' 에 링커를 인코딩하는 서열을 포함하는 핵산 분자.

130. 항목 129 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 핵산 분자.

131. 항목 129 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 핵산 분자.

132. 항목 131 에 있어서, 상기 아미노산이 글리신 잔기인 핵산 분자.

133. 항목 129 내지 131 중 어느 하나에 있어서, 링커를 인코딩하는 상기 서열이 서열 GGC 로 이루어지거나; 상기 서열이 글리신 잔기를 인코딩하는 핵산 분자.

134. 항목 87 내지 133 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나; 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는, 핵산 분자.

135. 항목 87 내지 134 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 핵산 분자.

136. 항목 135 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.

137. 항목 88 내지 136 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 핵산 분자.

138. 항목 88 내지 137 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 핵산 분자.

139. 항목 88 내지 138 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 핵산 분자.

140. 항목 88 내지 139 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 핵산 분자.

141. 항목 110 내지 140 중 어느 하나에 있어서, HBV 게놈의 핵산 서열을 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에 나타내는 핵산 분자.

142. 항목 109 내지 141 중 어느 하나에 있어서, 핵산이 프리게놈 (pg) 헤파드나바이러스 RNA 로 전사가능한 핵산 분자.

143. 항목 142 에 있어서, 상기 헤파드나바이러스 RNA 가 HBV RNA 인 핵산 분자.

144. 항목 87 내지 143 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 벡터에 포함되는 핵산 분자.

145. 항목 144 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.

146. 항목 87 내지 145 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 핵산 분자.

147. 항목 146 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.

148. 항목 147 에 있어서, 핵산이 SEQ ID NO: 39 에서 나타낸 바와 같은 서열을 포함하는 벡터에 포함되는 핵산 분자.

149. 항목 87 내지 148 중 어느 하나에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원의 번역을 방지하는 핵산 분자.

150. 항목 149 에 있어서, 상기 핵산이 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림에 시작 코돈 ATG 를 포함하지 않는 핵산 분자.

151. 항목 147 또는 150 에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산의 5' 업스트림의 시작 코돈 ATG 가 핵산 TG 에 의해 대체되는 핵산 분자.

152. 항목 147 내지 151 중 어느 하나에 있어서, 상기 핵산이 점 돌연변이에 의해 변형되어, 표지된 헤파드나바이러스 e 항원의 번역이 방지되는 핵산 분자.

153. 항목 144, 145 및 149 내지 152 중 어느 하나에 있어서, 벡터가 SEQ ID NO: 35 에서 나타낸 바와 같은 서열을 포함하는 핵산 분자.

154. 항목 87 내지 153 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 유도성 프로모터의 제어 하에 있는 핵산 분자.

155. 항목 149 내지 154 중 어느 하나에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 핵산 분자.

156. 항목 154 또는 155 에 있어서, 유도성 프로모터가 테트라사이클린-유도성 프로모터, 독시클린-유도성 프로모터, 항생제-유도성 프로모터, 구리-유도성 프로모터, 알코올-유도성 프로모터, 스테로이드-유도성 프로모터 또는 제초제- 유도성 프로모터인 핵산 분자.

157. 항목 154 내지 156 중 어느 하나에 있어서, 유도성 프로모터가 CMV 프로모터 또는 tet-EF-1 알파 프로모터인 핵산 분자.

158. 항목 110 내지 157 중 어느 하나에 있어서, 하나 이상의 정지 코돈이 하나 이상의 헤파드나바이러스 외피 단백질의 코딩 부위에 도입되는 핵산 분자.

159. 항목 158 에 있어서, 상기 하나 이상의 헤파드나바이러스 외피 단백질이 하나 이상의 HBV 외피 단백질인 핵산 분자.

160. 항목 159 에 있어서, 하나 이상의 HBV 외피 단백질이 L, M 및/또는 S 중 하나 이상인 핵산 분자.

161. 항목 159 에 있어서, HBV 외피 단백질이 S 인 핵산 분자.

162. 항목 159 내지 161 중 어느 하나에 있어서, 하나 이상의 HBV 외피 단백질의 코딩 부위를 SEQ ID NO: 36 (L), 37 (M) 또는 38 (S) 에 나타내는 핵산 분자.

163. 항목 162 에 있어서, SEQ ID NO: 38 (S) 의 HBV 뉴클레오티드 217 내지 222 (TTGTTG) 가 TAGTAG 로 돌연변이화되어, 외피 단백질의 발현이 방지되는 핵산 분자.

164. 항목 87 내지 163 중 어느 하나에서 정의한 바와 같은 핵산 분자에 의해 인코딩되는 단백질.

165. 표지된 헤파드나바이러스 e 항원을 포함하는 단백질.

166. 항목 165 에 있어서, 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 단백질.

167. 항목 166 에 있어서, B 형 간염 바이러스 e 항원 (HBeAg) 이 SEQ ID NO: 18 에서 나타낸 바와 같은 아미노산 서열을 포함하는 단백질.

168. 항목 165 내지 167 중 어느 하나에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하는 단백질.

169. 항목 168 에 있어서, 상기 표지가 6 내지 22 개 아미노산으로 이루어지는 단백질.

170. 항목 165 내지 169 중 어느 하나에 있어서, 상기 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및 C9-표지로 이루어지는 군에서 선택되는 단백질.

171. 항목 170 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 단백질.

172. 항목 165 내지 167 중 어느 하나에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 단백질.

173. 항목 172 에 있어서, 상기 둘 이상의 표지가 상이한 표지인 단백질.

174. 항목 172 또는 173 에 있어서, 상기 둘 이상의 표지의 전체 길이가 14 내지 31 개 아미노산의 길이인 단백질.

175. 항목 172 내지 174 중 어느 하나에 있어서, 상기 둘 이상의 표지가 헤마글루티닌 (HA) 표지, His-표지, Flag-표지, c-myc-표지, V5-표지 및/또는 C9-표지 중 둘 이상인 단백질.

176. 항목 175 에 있어서, 상기 Flag-표지가 1xFlag-표지 또는 3xFlag-표지인 단백질.

177. 항목 170 또는 175 에 있어서, 하기와 같은 단백질:

HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;

His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;

c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;

C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타냄.

178. 항목 171 또는 176 에 있어서, 하기와 같은 단백질:

3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타냄.

179. 항목 170 또는 175 에 있어서, 하기와 같은 단백질:

HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;

His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;

c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;

V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는

C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄.

180. 항목 171 또는 176 에 있어서, 하기와 같은 단백질:

1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내거나;

3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타냄.

181. 항목 165 내지 180 중 어느 하나에 있어서, 헤파드나바이러스 프리코어 단백질을 포함하는 단백질.

182. 항목 181 에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 15 에 나타내는 단백질.

183. 항목 181 에 있어서, 헤파드나바이러스 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 17 에 나타내는 단백질.

184. 항목 165 내지 183 중 어느 하나에 있어서, 단백질이 하나 이상의 표지의 아미노산 서열을 포함하고, 상기 서열이 헤파드나바이러스 프리코어 단백질의 링커 및 신호 펩티드의 서열의 아미노산 서열의 C-말단인 단백질.

185. 항목 184 에 있어서, 상기 하나 이상의 표지의 아미노산 서열을 포함하는 단백질이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산의 아미노산 서열의 C-말단인 단백질.

186. 항목 165 내지 183 중 어느 하나에 있어서, 단백질이 하나 이상의 표지의 아미노산 서열을 포함하고, 상기 서열이 헤파드나바이러스 코어 단백질의 아미노산 서열의 N-말단인 단백질.

187. 항목 186 에 있어서, 헤파드나바이러스 코어 단백질이 HBV 코어 단백질인 단백질인 단백질.

188. 항목 187 에 있어서, HBV 코어 단백질을 인코딩하는 핵산을 SEQ ID NO: 23 에 나타내는 단백질.

189. 항목 187 에 있어서, HBV 코어 단백질의 아미노산 서열을 SEQ ID NO: 24 에 나타내는 단백질.

190. 항목 165 내지 189 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 의해 인코딩된 아미노산 서열에 삽입되는 단백질.

191. 항목 190 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 단백질.

192. 항목 191 에 있어서, HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 핵산 서열을 SEQ ID NO: 25 에 나타내는 단백질.

193. 항목 165 내지 192 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기에 의해 인코딩된 아미노산 서열에 삽입되는 단백질.

194. 항목 193 에 있어서, 헤파드나바이러스 게놈이 HBV 게놈인 단백질.

195. 항목 165 내지 194 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열이 HBV 프리코어 단백질의 위치 G29 및 위치 M30 에 상응하는 아미노산 잔기 (예컨대 SEQ ID NO. 17 에서 나타낸 바와 같은 것) 사이에 삽입되는 단백질.

196. 항목 165 내지 195 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열에 대한 N-말단에 3 개 이하 아미노산의 아미노산 서열을 추가로 포함하며, 여기서 3 개 이하 아미노산의 상기 아미노산 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열에 의해 인코딩되는 단백질.

197. 항목 196 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는 단백질.

198. 항목 198 에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 핵산 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지는 단백질.

199. 항목 196 내지 198 중 어느 하나에 있어서, 3 개 이하 아미노산의 상기 아미노산 서열을 SEQ ID NO. 40 에 나타내는 방법.

200. 항목 165 내지 199 중 어느 하나에 있어서, 하나 이상의 표지의 아미노산 서열에 대한 C-말단에 링커를 추가로 포함하는 단백질.

201. 항목 200 에 있어서, 상기 링커가 하나 이상의 아미노산 잔기로 이루어지는 단백질.

202. 항목 201 에 있어서, 상기 링커가 단 하나의 아미노산 잔기로 이루어지는 단백질.

203. 항목 202 에 있어서, 상기 아미노산이 글리신 잔기인 단백질.

204. 항목 1 내지 46 중 어느 하나에 있어서, 표지된 헤파드나바이러스 e 항원의 아미노산 서열이 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열에 의해 인코딩된 아미노산 서열을 포함하거나;

표지된 헤파드나바이러스 e 항원의 아미노산 서열이 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 포함하는 단백질.

205. 항목 165 내지 204 중 어느 하나에 있어서, 상기 하나 이상의 표지가 헤파드나바이러스 e 항원 내에 인 프레임 융합되는 단백질.

206. 항목 205 에 있어서, 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 단백질.

207. 항목 166 내지 206 중 어느 하나에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에 나타내는 단백질.

208. 항목 166 내지 207 중 어느 하나에 있어서, 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 단백질.

209. 항목 166 내지 208 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내는 단백질.

210. 항목 166 내지 209 중 어느 하나에 있어서, 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 단백질.

211. 항목 87 내지 163 중 어느 하나의 핵산 분자 또는 항목 164 내지 210 중 어느 하나의 단백질을 포함하는 숙주 세포.

212. 항목 211 에 있어서, 세포가 진핵세포인 숙주 세포.

213. 항목 212 에 있어서, 진핵세포가 간세포 기원의 것인 숙주 세포.

214. 항목 212 또는 213 에 있어서, 진핵세포가 간종양 세포이거나 간종양 세포에서 유래하는 숙주 세포.

215. 항목 212 내지 214 중 어느 하나에 있어서, 진핵세포가 HepG2 (ATCC　#HB-8065) 인 숙주 세포.

216. 항목 164 내지 210 중 어느 하나에서 정의한 바와 같은 단백질의 생성 방법으로서, 항목 211 내지 215 중 어느 하나의 숙주를 단백질의 발현을 허용하고 배양물로부터 생성된 단백질을 회수하는 조건 하에 배양하는 것을 포함하는 방법.

217. 항목 1 내지 86 중 어느 하나의 방법에서 사용하기 위한 키트.

218. 항목 165 내지 167 중 어느 하나에서 정의한 바와 같은 헤파드나바이러스 항원을 특이적으로 인지하는 항체 및 항목 168 내지 180 중 어느 하나에서 정의한 바와 같은 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체를 포함하는 키트.

219. 헤파드나바이러스의 공유결합 폐환형 DNA 를 저해할 수 있는 것으로 예측되는 후보 분자를 스크리닝하기 위한, 항목 87 내지 163 중 어느 하나의 핵산 분자, 항목 164 내지 210 중 어느 하나의 단백질 및/또는 항목 211 내지 215 중 어느 하나의 숙주 세포의 용도.

SEQUENCE LISTING <110> F. Hoffmann-La Roche AG Hoffmann-La Roche Inc. Drexel University Baruch S. Blumberg Institute <120> Tagged hepadnavirus e antigen and its use in screening antiviral substances <130> W2630 PCT S3 <150> US62/014,996 <151> 2014-06-20 <160> 46 <170> BiSSAP 1.3 <210> 1 <211> 27 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a hemagglutinin (HA) tag <400> 1 tacccatacg acgttccaga ttacgct 27 <210> 2 <211> 18 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a His-tag <400> 2 catcatcatc atcatcac 18 <210> 3 <211> 24 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a Flag-tag <400> 3 gactacaagg acgacgacga caag 24 <210> 4 <211> 39 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding c-myc-tag <400> 4 atggcatcaa tgcagaagct gatctcagag gaggacctg 39 <210> 5 <211> 42 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding V5-tag <400> 5 ggtaagccta tccctaaccc tctcctcggt ctcgattcta cg 42 <210> 6 <211> 27 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a C9-tag <400> 6 actgaaacat ctcaagtagc tccagct 27 <210> 7 <211> 66 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a 3× Flag-tag <400> 7 gactacaaag accacgacgg tgactacaaa gaccacgaca tcgactacaa ggacgacgac 60 gacaag 66 <210> 8 <211> 9 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a HA tag <400> 8 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 9 <211> 6 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a His-tag <400> 9 His His His His His His 1 5 <210> 10 <211> 8 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a Flag-tag <400> 10 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 11 <211> 10 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a c-myc-tag <400> 11 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 12 <211> 14 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a V5-tag <400> 12 Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr 1 5 10 <210> 13 <211> 9 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a C9-tag <400> 13 Thr Glu Thr Ser Gln Val Ala Pro Ala 1 5 <210> 14 <211> 22 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a 3× Flag-tag <400> 14 Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr 1 5 10 15 Lys Asp Asp Asp Asp Lys 20 <210> 15 <211> 639 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a hepatitis B virus precore protein <400> 15 atgcaacttt ttcacctctg cctaatcatc tcttgttcat gtcctactgt tcaagcctcc 60 aagctgtgcc ttgggtggct ttggggcatg gacatcgacc cttataaaga atttggagct 120 actgtggagt tactctcgtt tttgccttct gacttctttc cttcagtacg agatcttcta 180 gataccgcct cagctctgta tcgggaagcc ttagagtctc ctgagcattg ttcacctcac 240 catactgcac tcaggcaagc aattctttgc tggggggaac taatgactct agctacctgg 300 gtgggtgtta atttggaaga tccagcatct agagacctag tagtcagtta tgtcaacact 360 aatatgggcc taaagttcag gcaactcttg tggtttcaca tttcttgtct cacttttgga 420 agagaaaccg ttatagagta tttggtgtct ttcggagtgt ggattcgcac tcctccagct 480 tatagaccac caaatgcccc tatcctatca acacttccgg aaactactgt tgttagacga 540 cgaggcaggt cccctagaag aagaactccc tcgcctcgca gacgaaggtc tcaatcgccg 600 cgtcgcagaa gatctcaatc tcgggaacct caatgttag 639 <210> 16 <211> 477 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a hepatitis B virus e antigen (HBeAg) <400> 16 tccaagctgt gccttgggtg gctttggggc atggacatcg acccttataa agaatttgga 60 gctactgtgg agttactctc gtttttgcct tctgacttct ttccttcagt acgagatctt 120 ctagataccg cctcagctct gtatcgggaa gccttagagt ctcctgagca ttgttcacct 180 caccatactg cactcaggca agcaattctt tgctgggggg aactaatgac tctagctacc 240 tgggtgggtg ttaatttgga agatccagca tctagagacc tagtagtcag ttatgtcaac 300 actaatatgg gcctaaagtt caggcaactc ttgtggtttc acatttcttg tctcactttt 360 ggaagagaaa ccgttataga gtatttggtg tctttcggag tgtggattcg cactcctcca 420 gcttatagac caccaaatgc ccctatccta tcaacacttc cggaaactac tgttgtt 477 <210> 17 <211> 212 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a hepatitis B virus precore protein <400> 17 Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr 1 5 10 15 Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Met Asp Ile 20 25 30 Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu 35 40 45 Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser 50 55 60 Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His 65 70 75 80 His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr 85 90 95 Leu Ala Thr Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp 100 105 110 Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln 115 120 125 Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val 130 135 140 Ile Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala 145 150 155 160 Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr 165 170 175 Val Val Arg Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro 180 185 190 Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg 195 200 205 Glu Pro Gln Cys 210 <210> 18 <211> 159 <212> PRT <213> Hepatitis B virus <220> <223> HBeAg amino acid sequence (removes N-terminal signal peptide (19 aa) and C-terminal arginine-rich domain (34 aa) from precore) <400> 18 Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Met Asp Ile Asp Pro Tyr 1 5 10 15 Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp 20 25 30 Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr 35 40 45 Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala 50 55 60 Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr 65 70 75 80 Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val 85 90 95 Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp 100 105 110 Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr 115 120 125 Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro 130 135 140 Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val 145 150 155 <210> 19 <211> 678 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a HA-tagged hepatitis B virus precore protein <400> 19 atgcaacttt ttcacctctg cctaatcatc tcttgttcat gtcctactgt tcaagcctcc 60 aagctgtgcc ttgggtggct ttggggcgtg gacatctacc catacgacgt tccagattac 120 gctggcatgg acatcgaccc ttataaagaa tttggagcta ctgtggagtt actctcgttt 180 ttgccttctg acttctttcc ttcagtacga gatcttctag ataccgcctc agctctgtat 240 cgggaagcct tagagtctcc tgagcattgt tcacctcacc atactgcact caggcaagca 300 attctttgct ggggggaact aatgactcta gctacctggg tgggtgttaa tttggaagat 360 ccagcatcta gagacctagt agtcagttat gtcaacacta atatgggcct aaagttcagg 420 caactcttgt ggtttcacat ttcttgtctc acttttggaa gagaaaccgt tatagagtat 480 ttggtgtctt tcggagtgtg gattcgcact cctccagctt atagaccacc aaatgcccct 540 atcctatcaa cacttccgga aactactgtt gttagacgac gaggcaggtc ccctagaaga 600 agaactccct cgcctcgcag acgaaggtct caatcgccgc gtcgcagaag atctcaatct 660 cgggaacctc aatgttag 678 <210> 20 <211> 516 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a HA-tagged hepatitis B virus e antigen (HBeAg) <400> 20 tccaagctgt gccttgggtg gctttggggc gtggacatct acccatacga cgttccagat 60 tacgctggca tggacatcga cccttataaa gaatttggag ctactgtgga gttactctcg 120 tttttgcctt ctgacttctt tccttcagta cgagatcttc tagataccgc ctcagctctg 180 tatcgggaag ccttagagtc tcctgagcat tgttcacctc accatactgc actcaggcaa 240 gcaattcttt gctgggggga actaatgact ctagctacct gggtgggtgt taatttggaa 300 gatccagcat ctagagacct agtagtcagt tatgtcaaca ctaatatggg cctaaagttc 360 aggcaactct tgtggtttca catttcttgt ctcacttttg gaagagaaac cgttatagag 420 tatttggtgt ctttcggagt gtggattcgc actcctccag cttatagacc accaaatgcc 480 cctatcctat caacacttcc ggaaactact gttgtt 516 <210> 21 <211> 225 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a HA-tagged hepatitis B virus precore protein <400> 21 Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr 1 5 10 15 Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Val Asp Ile 20 25 30 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Met Asp Ile Asp Pro Tyr 35 40 45 Lys Glu Phe Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp 50 55 60 Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr 65 70 75 80 Arg Glu Ala Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala 85 90 95 Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr 100 105 110 Trp Val Gly Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val 115 120 125 Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp 130 135 140 Phe His Ile Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr 145 150 155 160 Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro 165 170 175 Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val Arg 180 185 190 Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser Pro Arg Arg Arg 195 200 205 Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser Arg Glu Pro Gln 210 215 220 Cys 225 <210> 22 <211> 172 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of HA-tagged hepatitis B virus e antigen (HBeAg) <400> 22 Ser Lys Leu Cys Leu Gly Trp Leu Trp Gly Val Asp Ile Tyr Pro Tyr 1 5 10 15 Asp Val Pro Asp Tyr Ala Gly Met Asp Ile Asp Pro Tyr Lys Glu Phe 20 25 30 Gly Ala Thr Val Glu Leu Leu Ser Phe Leu Pro Ser Asp Phe Phe Pro 35 40 45 Ser Val Arg Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr Arg Glu Ala 50 55 60 Leu Glu Ser Pro Glu His Cys Ser Pro His His Thr Ala Leu Arg Gln 65 70 75 80 Ala Ile Leu Cys Trp Gly Glu Leu Met Thr Leu Ala Thr Trp Val Gly 85 90 95 Val Asn Leu Glu Asp Pro Ala Ser Arg Asp Leu Val Val Ser Tyr Val 100 105 110 Asn Thr Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp Phe His Ile 115 120 125 Ser Cys Leu Thr Phe Gly Arg Glu Thr Val Ile Glu Tyr Leu Val Ser 130 135 140 Phe Gly Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro Pro Asn Ala 145 150 155 160 Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr Val Val 165 170 <210> 23 <211> 552 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a HBV core protein <400> 23 atggacatcg acccttataa agaatttgga gctactgtgg agttactctc gtttttgcct 60 tctgacttct ttccttcagt acgagatctt ctagataccg cctcagctct gtatcgggaa 120 gccttagagt ctcctgagca ttgttcacct caccatactg cactcaggca agcaattctt 180 tgctgggggg aactaatgac tctagctacc tgggtgggtg ttaatttgga agatccagca 240 tctagagacc tagtagtcag ttatgtcaac actaatatgg gcctaaagtt caggcaactc 300 ttgtggtttc acatttcttg tctcactttt ggaagagaaa ccgttataga gtatttggtg 360 tctttcggag tgtggattcg cactcctcca gcttatagac caccaaatgc ccctatccta 420 tcaacacttc cggaaactac tgttgttaga cgacgaggca ggtcccctag aagaagaact 480 ccctcgcctc gcagacgaag gtctcaatcg ccgcgtcgca gaagatctca atctcgggaa 540 cctcaatgtt ag 552 <210> 24 <211> 183 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a HBV core protein <400> 24 Met Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Thr Val Glu Leu Leu 1 5 10 15 Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp 20 25 30 Thr Ala Ser Ala Leu Tyr Arg Glu Ala Leu Glu Ser Pro Glu His Cys 35 40 45 Ser Pro His His Thr Ala Leu Arg Gln Ala Ile Leu Cys Trp Gly Glu 50 55 60 Leu Met Thr Leu Ala Thr Trp Val Gly Val Asn Leu Glu Asp Pro Ala 65 70 75 80 Ser Arg Asp Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys 85 90 95 Phe Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg 100 105 110 Glu Thr Val Ile Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr 115 120 125 Pro Pro Ala Tyr Arg Pro Pro Asn Ala Pro Ile Leu Ser Thr Leu Pro 130 135 140 Glu Thr Thr Val Val Arg Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr 145 150 155 160 Pro Ser Pro Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser 165 170 175 Gln Ser Arg Glu Pro Gln Cys 180 <210> 25 <211> 61 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of an epsilon structure as encoded by an HBV genome <400> 25 tgttcatgtc ctactgttca agcctccaag ctgtgccttg ggtggctttg gggcatggac 60 a 61 <210> 26 <400> 26 000 <210> 27 <211> 3182 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype D, subtype ayw. Genbank accession# U95551 <400> 27 aattccacaa cctttcacca aactctgcaa gatcccagag tgagaggcct gtatttccct 60 gctggtggct ccagttcagg agcagtaaac cctgttccga ctactgcctc tcccttatcg 120 tcaatcttct cgaggattgg ggaccctgcg ctgaacatgg agaacatcac atcaggattc 180 ctaggacccc ttctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240 ccgcaaagtc tagactcgtg gtggacttct ctcaattttc tagggggaac taccgtgtgt 300 cttggccaaa attcgcagtc cccaacctcc aatcactcac caacctcctg tcctccaact 360 tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480 ctaattccag gatcctcaac caccagcacg ggaccatgcc gaacctgcat gactactgct 540 caaggaacct ctatgtatcc ctcctgttgc tgtaccaaac cttcggacgg aaattgcacc 600 tgtattccca tcccatcatc ctgggctttc ggaaaattcc tatgggagtg ggcctcagcc 660 cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720 actgtttggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacagcatc 780 ttgagtccct ttttaccgct gttaccaatt ttcttttgtc tttgggtata catttaaacc 840 ctaacaaaac aaagagatgg ggttactctc tgaattttat gggttatgtc attggaagtt 900 atgggtcctt gccacaagaa cacatcatac aaaaaatcaa agaatgtttt agaaaacttc 960 ctattaacag gcctattgat tggaaagtat gtcaacgaat tgtgggtctt ttgggttttg 1020 ctgccccatt tacacaatgt ggttatcctg cgttaatgcc cttgtatgca tgtattcaat 1080 ctaagcaggc tttcactttc tcgccaactt acaaggcctt tctgtgtaaa caatacctga 1140 acctttaccc cgttgcccgg caacggccag gtctgtgcca agtgtttgct gacgcaaccc 1200 ccactggctg gggcttggtc atgggccatc agcgcgtgcg tggaaccttt tcggctcctc 1260 tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcaa 1320 acattatcgg gactgataac tctgttgtcc tctcccgcaa atatacatcg tatccatggc 1380 tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440 cgctgaatcc tgcggacgac ccttctcggg gtcgcttggg actctctcgt ccccttctcc 1500 gtctgccgtt ccgaccgacc acggggcgca cctctcttta cgcggactcc ccgtctgtgc 1560 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620 cgtgaacgcc caccgaatgt tgcccaaggt cttacataag aggactcttg gactctctgc 1680 aatgtcaacg accgaccttg aggcatactt caaagactgt ttgtttaaag actgggagga 1740 gttgggggag gagattagat taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800 ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat cgacccttat 1920 aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttca 1980 gtacgagatc ttctagatac cgcctcagct ctgtatcggg aagccttaga gtctcctgag 2040 cattgttcac ctcaccatac tgcactcagg caagcaattc tttgctgggg ggaactaatg 2100 actctagcta cctgggtggg tgttaatttg gaagatccag catctagaga cctagtagtc 2160 agttatgtca acactaatat gggcctaaag ttcaggcaac tcttgtggtt tcacatttct 2220 tgtctcactt ttggaagaga aaccgttata gagtatttgg tgtctttcgg agtgtggatt 2280 cgcactcctc cagcttatag accaccaaat gcccctatcc tatcaacact tccggaaact 2340 actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400 aggtctcaat cgccgcgtcg cagaagatct caatctcggg aacctcaatg ttagtattcc 2460 ttggactcat aaggtgggga actttactgg tctttattct tctactgtac ctgtctttaa 2520 tcctcattgg aaaacaccat cttttcctaa tatacattta caccaagaca ttatcaaaaa 2580 atgtgaacag tttgtaggcc cacttacagt taatgagaaa agaagattgc aattgattat 2640 gcctgctagg ttttatccaa aggttaccaa atatttacca ttggataagg gtattaaacc 2700 ttattatcca gaacatctag ttaatcatta cttccaaact agacactatt tacacactct 2760 atggaaggcg ggtatattat ataagagaga aacaacacat agcgcctcat tttgtgggtc 2820 accatattct tgggaacaag atctacagca tggggcagaa tctttccacc agcaatcctc 2880 tgggattctt tcccgaccac cagttggatc cagccttcag agcaaacaca gcaaatccag 2940 attgggactt caatcccaac aaggacacct ggccagacgc caacaaggta ggagctggag 3000 cattcgggct gggtttcacc ccaccgcacg gaggcctttt ggggtggagc cctcaggctc 3060 agggcatact acaaactttg ccagcaaatc cgcctcctgc ctccaccaat cgccagacag 3120 gaaggcagcc taccccgctg tctccacctt tgagaaacac tcatcctcag gccatgcagt 3180 gg 3182 <210> 28 <211> 3221 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype A (Genbank accession# AP007263) <400> 28 aattccactg ccttccacca agctctgcag gatcccagag tcaggggtct gtattttcct 60 gctggtggct ccagttcagg aacagtaaac cctgctccga atattgcctc tcacatctcg 120 tcaatctccg cgaggactgg ggaccctgtg gcgaacatgg agaacatcac atcaggattc 180 ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240 ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggatc acccgtgtgt 300 cttggccaaa attcgcagtc cccaacctcc aatcactcac caacctcctg tcctccaatt 360 tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420 ctatgcctca tcttcttatt ggttcttctg gattatcaag gtatgttgcc cgtttgtcct 480 ctaattccag gatcaacaac aaccagtacg ggaccatgca aaacctgcac gactcctgct 540 caaggcaact ctatgtttcc ctcatgttgc tgtacaaaac ctacggatgg aaattgcacc 600 tgtattccca tcccatcgtc ctgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660 cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720 actgtttggc tttcagctat atggatgatg tggtattggg ggccaagtct gtacagcatc 780 gtgagtccct ttataccgct gttaccaatt ttcttttgtc tctgggtata catttaaacc 840 ctaacaaaac aaaaagatgg ggttattccc taaacttcat gggttacata attggaagtt 900 ggggaacttt gccacaggat catattgtac aaaagatcaa acactgtttt agaaaacttc 960 ctgttaacag gcctattgat tggaaagtat gtcaaagaat tgtgggtctt ttgggctttg 1020 ctgctccatt tacacaatgt ggatatcctg ccttaatgcc tttgtatgca tgtatacaag 1080 ctaaacaggc tttcactttc tcgccaactt acaaggcctt tctaagtaaa cagtacatga 1140 acctttaccc cgttgctcgg caacggcctg gtctgtgcca agtgtttgct gacgcaaccc 1200 ccactggctg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagccgg tctggagcaa 1320 agctcatcgg aactgacaat tctgtcgtcc tctcgcggaa atatacatcg tttccatggc 1380 tgctaggctg tgctgccaac tggatccttc gcggaacgtc ctttgtctac gtcccgtcgg 1440 cgctgaatcc cgcggacgac ccctctcggg gccgcttggg actctctcgt ccccttctcc 1500 gtctgccgtt ccagccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560 cttctcatct gccggtccgt gtgcacttcg cttcacctct gcacgttgca tggagaccac 1620 cgtgaacgcc catcagatcc tgcccaaggt cttacataag aggactcttg gactcccagc 1680 aatgtcaacg accgaccttg aggcctactt caaagactgt gtgtttaagg actgggagga 1740 gctgggggag gagattaggt taaaggtctt tgtattagga ggctgtaggc ataaattggt 1800 ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg tacatgtccc 1860 actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccttat 1920 aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttcc 1980 gtcagagatc tcctagacac cgcctcagct ctgtatcgag aagccttaga gtctcctgag 2040 cattgctcac ctcaccatac tgcactcagg caagccattc tctgctgggg ggaattgatg 2100 actctagcta cctgggtggg taataatttg gaagatccag catccaggga tctagtagtc 2160 aattatgtta atactaacat gggtttaaag atcaggcaac tattgtggtt tcatatatct 2220 tgccttactt ttggaagaga gactgtactt gaatatttgg tctctttcgg agtgtggatt 2280 cgcactcctc cagcctatag accaccaaat gcccctatct tatcaacaat tccggaaact 2340 actgttgtta gacgacggga ccgaggcagg tcccctagaa gaagaactcc ctcgcctcgc 2400 agacgcagat ctcaatcgcc gcgtcgcaga agatctcaat ctcgggaatc tcaatgttag 2460 tattccttgg actcataagg tgggaaactt tacggggctt tattcctcta cagtacctat 2520 ctttaatcct gaatggcaaa ctccttcctt tcctaagatt catttacaag aggacattat 2580 taataggtgt caacaatttg tgggccctct cactgtaaat gaaaagagaa gattgaaatt 2640 aattatgcct gctagattct atcctaccca cactaaatat ttgcccttag acaaaggaat 2700 taaaccttat tatccagatc aggtagttaa tcattacttc caaaccagac attatttaca 2760 tactctttgg aaggctggta ttctatataa gagggaaacc acacgtagcg catcattttg 2820 cgggtcacca tattcttggg aacaagagct acagcatggg aggttggtca tcaaaacctc 2880 gcaaaggcat ggggacgaat ctttctgttc ccaaccctct gggattcttt cccgatcatc 2940 agttggaccc tgcattcgga gccaactcaa acaatccaga ttgggacttc aaccccatca 3000 aggaccactg gccaacagcc aaccaggtag gagtgggagc attcgggcca gggctcaccc 3060 ctccacacgg cggtattttg ggggggagcc ctcaggctca gggcatattg accacagtgt 3120 caacaattcc tcctcctgcc tccaccaatc ggcagtcagg aaggcagcct actcccatct 3180 ctccacctct aagagacagt catcctcagg ccatgcagtg g 3221 <210> 29 <211> 3215 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype B (Genbank accession# AB602818) <400> 29 aactccacca cttttcacca aactcttcaa gatcccagag tccgggctct gtactttcct 60 gctggtggct ccagttcagg aacagtaagc cctgctcaga atactgtctc tgccatatcg 120 tcaatcttat cgaagactgg ggaccctgtg ccgaacatgg agaacatcgc atcaggactc 180 ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaaaaat cctcacaata 240 ccacagagtc tagactcgtg gtggacttct ctcaattttc tagggggaac acccgtgtgt 300 cttggccaaa attcgcagtc ccaaatctcc agtcactcac caacctgttg tcctccaatt 360 tgtcctggtt atcgctggat gtgtctgcgg cgttttatca tcttcctctg catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480 ctaattccag gatcatcaac caccagcacg ggaccatgca agacctgcac aactcctgct 540 caaggaacct ctatgtttcc ctcatgttgc tgtacaaaac ctacggatgg aaactgcacc 600 tgtattccca tcccatcatc ttgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660 cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720 actgtctggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacaacatc 780 ttgagtccct ttatgccgct gttaccaatt ttcttttgtc tttgggtata catttaaacc 840 ctcacaaaac aaaaagatgg ggatattccc ttaacttcat gggatatgta attgggagtt 900 ggggcacatt gccacaggaa catattgtac aaaaaatcaa actatgtttt aggaaacttc 960 ctgtaaacag gcctattgat tggaaagtat gtcaacgaat tgtgggtctt ttggggtttg 1020 ctgccccttt tacgcaatgt ggatatcctg ctttaatgcc tttatatgca tgtatacaag 1080 caaaacaggc ttttactttc tcgccaactt acaaggcctt tctaagtaaa cagtatctag 1140 ccctttaccc cgttgctcgg caacggcctg gtctgtgcca agtgtttgct gacgcaaccc 1200 ccactggttg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtgtctcctc 1260 tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcga 1320 aactcatcgg gactgacaat tctgtcgtgc tctcccgcaa gtatacatcg tttccatggc 1380 tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440 cgctgaatcc cgcggacgac ccctcccggg gccgcttggg gctctaccgc ccgcttctcc 1500 gtctgccgta ccgaccgacc acggggcgca cctctcttta cgcggactcc ccgtctgtgc 1560 cttctcgtct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggaaaccac 1620 cgtgaacgcc caccggaacc tgcccaaggt cttgcacaag aggactcttg gactttcagc 1680 aatgtcaacg accgaccttg aggcatactt caaagactgt gtgtttcatg agtgggagga 1740 gctgggggag gagattaggt taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800 ctgttcacca gcaccatgca actttttcac ctctgcctag tcatctcttg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920 aaagaatttg gagctactgt ggagttactc tcttttttgc cttctgactt ctttccgtcg 1980 gtacgagacc tcctagatac cgctgctgct ctgtatcggg aagccttaga atctcctgaa 2040 cattgctcac ctcaccacac agcactcagg caagctattc tgtgctgggg ggaattaatg 2100 actctagcta cctgggtggg taataattta gaagatccag cgtccaggga tctagtagtc 2160 aattatgtta acactaacat gggcctaaag atcaggcaat tattgtggtt tcacatttcc 2220 tgtcttactt ttggaagaga aactgttctt gaatatttgg tgtcttttgg agtgtggatt 2280 cgcactcctc cggcctacag accaccaaat gcccctatct tatcaacact tccggaaact 2340 actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400 aggtctcaat caccgcgtcg cagaagatct caatctcggg aatcccaatg ttagtattcc 2460 ttggactcat aaggtgggaa actttacggg gctctattct tctacagtac ctgtctttaa 2520 tcctgaatgg caaactcctt cttttccaga cattcatttg caggaggata ttgttgatag 2580 atgtaagcaa tttgtgggac cccttacagt aaatgaaaac aggagactaa aattaataat 2640 gcctgctaga ttttatccta atgttaccaa atatttgccc ttagataaag ggatcaaacc 2700 ttattatcca gagcatgtag ttaatcatta cttccagaca agacattatt tgcatactct 2760 ttggaaggcg ggtatcttat ataagagaga gtcaacacat agcgcctcat tttgcgggtc 2820 accatattct tgggaacaag atctacagca tgggaggttg gtcttccaaa cctcgaaaag 2880 gcatggggac aaatctttct gtccccaatc ccctgggatt cttccccgat catcagttgg 2940 accctgcatt caaagccaac tcagaaaatc cagattggga cctcaaccca cacaaggaca 3000 actggccgga cgcccacaag gtgggagtgg gagcattcgg gccagggttc acccctcccc 3060 acgggggact gttggggtgg agccctcagg ctcagggcat acttacatct gtgccagcag 3120 ctcctcctcc tgcctccacc aatcggcagt caggaaggca gcctactccc ttatctccac 3180 ctctaaggga cactcatcct caggccatgc agtgg 3215 <210> 30 <211> 3215 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype C (Genbank accession# AB540584) <400> 30 aactccacaa ctttccacca agctctgcta gatcccagag tgaggggcct atactttcct 60 gctggtggct ccagttccgg aacagtaaac cctgttccga ctactgcctc tcccatatcg 120 tcaatcttca cgaggactgg ggaccctgta ccgaacatgg agaacacaac atcaggattc 180 ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240 ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagc acccacgtgt 300 cctggccaaa attcgcagtc cccaacctcc aatcactcac caacctcttg tcctccaatt 360 tgtcctggct atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480 ctacttccag gaacatcaac tacaagcacg ggaccatgca agacctgcac gattcctgct 540 caaggaamct ctatgtttcc ctcttgttgc tgtacaaaac cttcggacgg aaactgcact 600 tgtattccca tcccatcatc ctgggctttc gcaagattcc tatgggagtg ggcctcagtc 660 cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720 actgtttggc tttcagctat atggatgatg tggtattggg ggccaagtct gtacaacatc 780 ttgagtccct ttttacctct attaccaatt ttcttttgtc tttgggtata catttgaacc 840 ctaataaaac caagcgttgg ggctactccc ttaactttat gggatatgta attggaagtt 900 ggggtacttt accacaggaa catattgttc taaaaatcaa acaatgtttt cggaaactgc 960 ctgtaaatag acctattgat tggaaagtat gtcaacgaat tgtgggtctt ctgggctttg 1020 ctgccccttt tacacaatgt gggtatcctg ccttgatgcc tttgtatgca tgtatacaag 1080 ctaagcaggc tttcactttc tcgccaactt ataaggcctt tctgtgtaaa caatatctga 1140 acctttaccc cgttgctcgg caacggtcag gtctctgcca agtatttgct gacgcaaccc 1200 ccactggatg gggcttggca ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctcttagcag cctgctttgc tcgcagccgg tctggagcra 1320 atcttattgg aaccgacaac tccgttgtcc tctctcggaa atacacctcc tttccatggc 1380 tgctagggtg tgctgcaaac tggatcctgc gcgggacgtc ctttgtctac gtcccgtcgg 1440 cgctgaatcc agcggacgac ccgtctcggg gccgtttggg actctaccgt ccccttcttc 1500 gtctgccgtt ccggccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620 cgtgaacgcc caccaggtct tgcccaaggt cttacataag aggactcttg gactctcggc 1680 aatgtcaacg accgaccttg aggcatactt caaagactgt gtgtttaaag actgggagga 1740 gttgggggag gagattaggt taaaggtctt tgtactagga ggctgtaggc ataaattggt 1800 ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatctcatg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccgtat 1920 aaagaatttg gagcttctgt ggagttactc tcttttttgc cttctgactt ctttccttcc 1980 attcgagatc tcctcgacac cgcctctgct ctgtatcggg aggccttaga gtctccggaa 2040 cattgttcac ctcaccatac agcactcagg caagctattc tgtgttgggg tgagttgatg 2100 aatctggcca cctgggtggg aagtaatttg gaagacccag catctaggga attagtagtc 2160 agttatgtta atgttaatat gggcctaaag atcagacaac tattgtggtt tcacatttcc 2220 tgtcttactt ttggaagaga aactgttctt gagtatttgg tgtcctttgg agtgtggata 2280 cgcactcctc ccgcttacag accaccaaat gcccctatct tatcaacact tccggaaact 2340 actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400 aggtctcaat cgccgcgtcg cagaagatct caatctcggg aatctcaatg ttagtatccc 2460 ttggactcat aaggtgggaa attttactgg gctttattct tctactgtac ctgtcttcaa 2520 tcctgagtgg caaactccct cctttcctca cattcatttg caggaggaca ttattaatag 2580 atgtcaacaa tatgtgggcc ctcttacagt taatgaaaaa aggagattaa aattaattat 2640 gcctgccagg ttttatccta accgtaccaa atatttgccc ctagataaag gcattaaacc 2700 ttattatcct gaatatacag ttaatcatta cttccaaacc aggcattatt tacatactct 2760 gtggaaggct ggcattctat ataagagaga aactacacgc agcgcctcat tttgtgggtc 2820 accatattct tgggaacaag agctacagca tgggaggttg gtcctccaaa cctcgaaagg 2880 gcatggggac gaatctttct gttcccaatc ctctgggctt ctttcccgat caccagttgg 2940 accctgcatt cggagccaac tcaaacaatc cggattggga cttcaatccc aacaaggatc 3000 actggccagc agcaaaccag gtaggagcgg gagccttcgg gccagggttc accccaccgc 3060 acggcggtct tttggggtgg agccctcagg ctcagggcgt attgacaaca gtgccagcag 3120 cgcctcctcc tgcctccacc aatcggcagt caggcagaca gcctactccc atctctccac 3180 ctctaagaga cagtcatcct caggccatgc agtgg 3215 <210> 31 <211> 3212 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype E (Genbank accession# AP007262) <400> 31 aattccacaa cattccacca agctctgcag gatcccagag taagaggcct gtatcttcct 60 gctggtggct ccagttccgg aacagtgaac cctgttccga ctactgcctc actcatctcg 120 tcaatcttct cgaggattgg ggaccctgca ccgaacatgg aaggcatcac atcaggattc 180 ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaaaaat cctcacaata 240 ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagc tcccgtgtgt 300 cttggccaaa attcgcagtc cccaatctcc aatcactcac caacctcttg tcctccaatt 360 tgtcctggct atcgctggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480 ctaattccag gatcatcaac caccagtacg ggaccctgcc gaacctgcac gactcttgct 540 caaggaacct ctatgtttcc ctcatgttgt tgtttaaaac cttcggacgg aaattgcact 600 tgtattccca tcccatcatc atgggctttc ggaaaattcc tatgggagtg ggcctcagcc 660 cgtttctcct ggctcagttt actagtgcca tttgttcagt ggttcgccgg gctttccccc 720 actgtctggc tttcagttat atggatgatg tggtattggg ggccaagtct gtacaacatc 780 ttgagtccct ttatacctct gttaccaatt ttcttttgtc tttgggtata catttaaatc 840 ccaacaaaac aaaaagatgg ggatattccc taaatttcat gggttatgta attggtagtt 900 gggggtcatt accacaagaa cacatcagac tgaaaatcaa agactgtttt agaaagctcc 960 ctgttaacag gcctattgat tggaaagtat gtcaaagaat tgtgggtctt ttgggctttg 1020 ctgccccttt tacacaatgt ggatatcctg ctttaatgcc tctatatgcg tgtattcaat 1080 ctaagcaggc tttcactttc tcgccaactt acaaggcctt tctgtgtaaa caatatatga 1140 acctttaccc cgttgcccgg caacggccag gtctgtgcca agtgtttgct gatgcaaccc 1200 ccactggctg gggcttggcc ataggccatc agcgcatgcg tggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctcctagccg cttgttttgc tcgcagcagg tctggagcga 1320 aactcatagg gacagataat tctgtcgttc tctcccggaa atatacatca tttccatggc 1380 tgctaggctg tgctgccaac tggatcctgc gagggacgtc ctttgtctac gtcccgtcag 1440 cgctgaatcc tgcggacgac ccctctcggg gccgcttggg ggtctatcgt ccccttctcc 1500 gtctgccgtt ccggccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620 cgtgaacgcc caccagatct tgcccaaggt cttacataag aggactcttg gactctctgc 1680 aatgtcaacg accgaccttg aggcatactt caaagactgt ttgtttaaag actgggagga 1740 gttgggggag gagactagat taatgatctt tgtactagga ggctgtaggc ataaattggt 1800 ctgcgcacca gcaccatgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920 aaagaatttg gagctactgt ggagttactc tcgtttttgc cttctgactt ctttccttca 1980 gtaagagatc ttctagatac cgcctctgct ctgtatcggg atgccttaga atctcctgag 2040 cattgttcac ctcaccatac tgcactcagg caagccattc tttgctgggg agaattaatg 2100 actctagcta cctgggtggg tgtaaatttg gaagatccag catccaggga cctagtagtc 2160 agttatgtca atactaatat gggcctaaag ttcaggcaat tattgtggtt tcacatttct 2220 tgtctcactt ttggaagaga aaccgtcata gagtatttgg tgtcttttgg agtgtggatt 2280 cgcactcctc cagcttatag accaccaaat gcccctatct tatcaacact tccggagaat 2340 actgttgtta gacgaagagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400 agatctcaat cgccgcgtcg cagaagatct caatctccag cttcccaatg ttagtattcc 2460 ttggactcac aaggtgggaa attttacggg gctttattct tctactatac ctgtctttaa 2520 tcctaactgg aaaactccat cttttcctga tattcatttg caccaggaca ttattaacaa 2580 atgtgaacaa tttgtaggtc ctytaacagt aaatgaaaaa cgaagattaa acttagtcat 2640 gcctgctaga ttttttccca tctccacgaa atatttgccc ctagagaaag gtataaaacc 2700 ttattatcca gataatgtag ttaatcatta cttccaaacc agacactatt tacataccct 2760 atggaaggcg ggcatcttat ataaaagaga aactacccgt agcgcctcat tttgtgggtc 2820 accttattct tgggaacacg agctacatca tggggctttc ttggacggtc cctctcgaat 2880 gggggaagaa tcattccacc accaatcctc tgggattttt tcccgaccac cagttggatc 2940 cagcattcag agcaaacacc agaaatccag attgggacca caatcccaac aaagaccact 3000 ggacagaagc caacaaggta ggagtgggag catttgggcc ggggttcact cccccacacg 3060 gaggcctttt ggggtggagc cctcaggctc aaggcatgct aaaaacattg ccagcaaatc 3120 cgcctcctgc ctccaccaat cggcagtcag gaaggcagcc taccccaatc actccacctt 3180 tgagagacac tcatcctcag gccatgcagt gg 3212 <210> 32 <211> 3215 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype F (Genbank accession# HE974366) <400> 32 aactcaaccc agttccatca ggctctgttg gatcccaggg taagggctct gtatcttcct 60 gctggtggct ccagttcagg aacacaaaac cctgctccga ctattgcctc tctcacatcc 120 tcaatcttct cgacgactgg gggccctgct atgaacatgg acaacattac atcaggactc 180 ctaggacccc tgctcgtgtt acaggcggtg tgtttcttgt tgacaaaaat cctcacaata 240 ccacagagtc tagactcgtg gtggacttct ctcaattttc tagggggact acccgggtgt 300 cctggccaaa attcgcagtc cccaacctcc aatcacttac caacctcctg tcctccaact 360 tgtcctggct atcgttggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactaccagg gtatgttgcc cgtttgtcct 480 ctacttccag gatccacgac caccagcacg ggaccctgca aaacctgcac aactcttgca 540 caaggaacct ctatgtttcc ctcctgttgc tgttcaaaac cctcggacgg aaactgcact 600 tgtattccca tcccatcatc ctgggcttta ggaaaatacc tatgggagtg ggcctcagcc 660 cgtttctcat ggctcagttt actagtgcaa tttgttcagt ggtgcgtagg gctttccccc 720 actgtctggc ttttagttat attgatgatc tggtattggg ggccaaatct gtgcagcacc 780 ttgagtccct ttataccgct gttaccaatt ttctgttatc tgtgggtatc catttaaata 840 cttctaaaac taagagatgg ggttacaccc tacattttat gggttatgtc attggtagtt 900 ggggatcatt acctcaagat catattgtac acaaaatcaa agaatgtttt cggaaactgc 960 ctgtaaatcg tccaattgat tggaaagtct gtcaacgcat tgtgggtctt ttgggctttg 1020 ctgccccttt cacacaatgt ggttatcctg ctctcatgcc tctgtatgct tgtattactg 1080 ctaaacaggc ttttgttttt tcgccaactt acaaggcctt tctctgtaaa caatacatga 1140 acctttaccc cgttgccagg caacggccgg gcctgtgcca agtgtttgct gacgcaaccc 1200 ccactggttg gggcttggcc attggccatc agcgcatgcg tggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctccttgcag cttgtttcgc tcgcagcagg tctggagcga 1320 ctctcatcgg cacggacaac tctgttgtcc tctctaggaa gtacacctcc ttcccatggc 1380 tgctcgggtg tgctgcaaac tggatcctgc gcgggacgtc ctttgtttac gtcccgtcgg 1440 cgctgaatcc cgcggacgac ccctcccggg gccgcttggg gctgtaccgc cctcttctcc 1500 gtctgccgtt ccagccgaca acgggtcgca cctctcttta cgcggactcc ccgtctgttc 1560 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620 cgtgaacgcc ccttggagtt tgccaacagt cttacataag aggactcttg gactttcagg 1680 agggtcaatg acccggattg cagaatacat caaagactgt gtatttaagg actgggagga 1740 gttgggggag gagactaggt taatgatctt tgtactagga ggctgtaggc ataaattggt 1800 ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatcttttg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttggg acatggacat tgacccttat 1920 aaagaatttg gcgcttctgt ggagttactc tcttttttgc cttctgattt ctttccatcg 1980 gttcgggacc tactcgacac cgcttcagcc ctttaccggg atgctttaga gtcacctgaa 2040 cattgcactc cccatcacac tgccctcagg caagttattt tgtgctgggg tgagttaatg 2100 actttggctt cctgggtggg caataacttg gaagaccctg ctgccaggga tttagtagtt 2160 aactatgtta acactaacat gggcctaaaa attagacaac tactgtggtt tcacatttcc 2220 tgccttactt ttggaagaga tatagttctt gagtatttgg tgtcctttgg agtgtggatt 2280 cgcactcctc ctgcttacag accacaaaat gcccctatcc tatccacact tccggaaact 2340 actgttgtta gacgacgagg caggtcccct agaagaagaa ctccctcgcc tcgcagacga 2400 agatctcaat cgccgcgtcg ccgaagatct caatctccag cttcccaatg ttagtattcc 2460 ttggactcat aaggtgggaa attttacggg gctttactct tctactgtgc ctgcttttaa 2520 tcctgactgg ttaactcctt cttttcctaa tattcattta catcaagacc taatttctaa 2580 atgtgaacaa tttgtaggcc cactcactaa aaatgaatta aggaggttaa aattggttat 2640 gccagctaga ttttatccta aggttaccaa atattttcct atggagaaag gaatcaagcc 2700 ttattatcct gagcatgcag ttaatcatta ctttaaaaca agacattatt tgcatacttt 2760 atggaaggcg ggaattttat ataagagaga atccacacgt agcgcatcat tttgtgggtc 2820 accatattcc tgggaacaag agctacagca tgggagcacc tctctcaacg acaagaagag 2880 gcatgggaca gaatctttct gtgcccaatc ctctgggatt ctttccagac catcagctgg 2940 atccgctatt caaagcaaat tccagcagtc ccgactggga cttcaacaca aacaaggaca 3000 gttggccaat ggcaaacaag gtaggagtgg gagcatacgg tccagggttc acacccccac 3060 acggtggcct gctggggtgg agccctcagg cacaaggtat gttaacaacc ttgccagcag 3120 atccgcctcc tgcttccacc aatcggcggt ccgggagaaa gccaacccca gtctctccac 3180 ctctaagaga cactcatcca caggcaatgc agtgg 3215 <210> 33 <211> 3248 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype G (Genbank accession# AP007264) <400> 33 aactctacag cattccacca agctctacaa aatcccaaag tcaggggcct gtattttcct 60 gctggtggct ccagttcagg gatagtgaac cctgttccga ctattgcctc tcacatctcg 120 tcaatcttct ccaggattgg ggaccctgca ccgaacatgg agaacatcac atcaggattc 180 ctaggacccc tgctcgtgtt acaggcgggg tttttcttgt tgacaagaat cctcacaata 240 ccgcagagtc tagactcgtg gtggacttct ctcaattttc tagggggagt gcccgtgtgt 300 cctggcctaa attcgcagtc cccaacctcc aatcactcac caatctcctg tcctccaact 360 tgtcctggct atcgctggat gtgtctgcgg cgttttatca tattcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtttgtcct 480 ctgattccag gatcctcgac caccagtacg ggaccctgca aaacctgcac gactcctgct 540 caaggcaact ctatgtatcc ctcatgttgc tgtacaaaac cttcggacgg aaattgcacc 600 tgtattccca tcccatcatc ttgggctttc gcaaaatacc tatgggagtg ggcctcagtc 660 cgtttctctt ggctcagttt actagtgcca tttgttcagt ggttcgtagg gctttccccc 720 actgtctggc tttcagctat atggatgatg tggtattggg ggccaaatct gtacaacatc 780 ttgagtccct ttataccgct gttaccaatt ttcttttgtc tttgggtata catctaaacc 840 ctaacaaaac aaaaagatgg ggttattcct taaattttat gggatatgta attggaagtt 900 ggggtacttt gccacaagaa cacatcacac agaaaattaa gcaatgtttt cggaaactcc 960 ctgttaacag gccaattgat tggaaagtct gtcaacgaat aactggtctg ttgggtttcg 1020 ctgctccttt tacccaatgt ggttaccctg ccttaatgcc tttatatgca tgtatacaag 1080 ctaagcaggc ttttactttc tcgccaactt ataaggcctt tctctgtaaa caatacatga 1140 acctttaccc cgttgctagg caacggcccg gtctgtgcca agtgtttgct gacgcaaccc 1200 ccactggttg gggcttggcc atcggccatc agcgcatgcg tggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctcctagctg cttgttttgc tcgcagccgg tctggagcaa 1320 aactcattgg gactgacaat tctgtcgtcc tttctcggaa atatacatcc tttccatggc 1380 tgctaggctg tgctgccaac tggatccttc gcgggacgtc ctttgtttac gtcccgtcag 1440 cgctgaatcc agcggacgac ccctcccggg gccgtttggg gctctgtcgc ccccttctcc 1500 gtctgccgtt cctgccgacc acggggcgca cctctcttta cgcggtctcc ccgtctgtgc 1560 cttctcatct gccggaccgt gtgcacttcg cttcacctct gcacgttaca tggaaaccgc 1620 catgaacacc tctcatcatc tgccaaggca gttatataag aggactcttg gactgtttgt 1680 tatgtcaaca accggggtgg agaaatactt caaggactgt gtttttgctg agtgggaaga 1740 attaggcaat gagtccaggt taatgacctt tgtattagga ggctgtaggc ataaattggt 1800 ctgcgcacca gcaccatgta actttttcac ctctgcctaa tcatctcttg ttcatgtcct 1860 actgttcaag cctccaagct gtgccttggg tggctttagg gcatggatag aacaactttg 1920 ccatatggcc tttttggctt agacattgac ccttataaag aatttggagc tactgtggag 1980 ttgctctcgt ttttgccttc tgactttttc ccgtctgttc gtgatcttct cgacaccgct 2040 tcagctttgt accgggaatc cttagagtcc tctgatcatt gttcgcctca ccatacagca 2100 ctcaggcaag caatcctgtg ctggggtgag ttgatgactc tagctacctg ggtgggtaat 2160 aatttggaag atccagcatc cagagatttg gtggtcaatt atgttaatac taatatgggt 2220 ttaaaaatca ggcaactatt gtggtttcac atttcctgtc ttacttttgg gagagaaacc 2280 gttcttgagt atttggtgtc ttttggagtg tggattcgca ctcctcctgc ttatagacca 2340 ccaaatgccc ctatcctatc aacacttccg gagactactg ttgttagacg aagaggcagg 2400 tcccctcgaa gaagaactcc ctcgcctcgc agacgaagat ctcaatcgcc gcgtcgcaga 2460 agatctgcat ctccagcttc ccaatgttag tattccttgg actcacaagg tgggaaactt 2520 tacggggctg tattcttcta ctatacctgt ctttaatcct gattggcaaa ctccttcttt 2580 tccaaatatc catttgcatc aagacattat aactaaatgt gaacaatttg tgggccctct 2640 cacagtaaat gagaaacgaa gattaaaact agttatgcct gccagatttt tcccaaactc 2700 tactaaatat ttaccattag acaaaggtat caaaccgtat tatccagaaa atgtagttaa 2760 tcattacttc cagaccagac attatttaca taccctttgg aaggcgggta ttctatataa 2820 gagagaaacg tcccgtagcg cttcattttg tgggtcacca tatacttggg aacaagatct 2880 acagcatggg gctttcttgg acggtccctc tcgagtgggg aaagaacctt tccaccagca 2940 atcctctagg attccttccc gatcaccagt tggacccagc attcagagca aataccaaca 3000 atccagattg ggacttcaat cccaaaaagg acccttggcc agaggccaac aaagtaggag 3060 ttggagccta tggacccggg ttcacccctc cacacggagg ccttttgggg tggagccctc 3120 agtctcaggg cacactaaca actttgccag cagatccgcc tcctgcctcc accaatcgtc 3180 agtcagggag gcagcctact cccatctctc caccactaag agacagtcat cctcaggcca 3240 tgcagtgg 3248 <210> 34 <211> 3215 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of HBV genome, HBV genotype H (Genbank accession# AB516393) <400> 34 aactcaacac agttccacca agcactgttg gattcgagag taaggggtct gtattttcct 60 gctggtggct ccagttcaga aacacagaac cctgctccga ctattgcctc tctcacatca 120 tcaatcttct cgaagactgg ggaccctgct atgaacatgg agaacatcac atcaggactc 180 ctaggacccc ttctcgtgtt acaggcggtg tgtttcttgt tgacaaaaat cctcacaata 240 ccacagagtc tagactcgtg gtggacttct ctcaattttc taggggtacc acccgggtgt 300 cctggccaaa attcgcagtc cccaatctcc aatcacttac caacctcctg tcctccaact 360 tgtcctggct atcgttggat gtgtctgcgg cgttttatca tcttcctctt catcctgctg 420 ctatgcctca tcttcttgtt ggttcttctg gactatcaag gtatgttgcc cgtgtgtcct 480 ctacttccag gatctacaac caccagcacg ggaccctgca aaacctgcac cactcttgct 540 caaggaacct ctatgtttcc ctcctgctgc tgtaccaaac cttcggacgg aaattgcacc 600 tgtattccca tcccatcatc ttgggctttc ggaaaatacc tatgggagtg ggcctcagcc 660 cgtttctctt ggctcagttt actagtgcaa tttgctcagt ggtgcgtagg gctttccccc 720 actgtctggc ttttagttat atggatgatt tggtattggg ggccaaatct gtgcagcatc 780 ttgagtccct ttataccgct gttaccaatt ttttgttatc tgtgggcatc catttgaaca 840 cagctaaaac aaaatggtgg ggttattcct tacactttat gggttatata attgggagtt 900 gggggacctt gcctcaggaa catattgtgc ataaaatcaa agattgcttt cgcaaacttc 960 ccgtgaatag acccattgat tggaaggttt gtcaacgcat tgtgggtctt ttgggctttg 1020 cagccccttt tactcaatgt ggttatcctg ctctcatgcc cttgtatgcc tgtattaccg 1080 ctaagcaggc ttttgttttc tcgccaactt acaaggcctt tctctgtcaa caatacatga 1140 acctttaccc cgttgctcgg caacggccag gcctttgcca agtgtttgct gacgcaaccc 1200 ccactggctg gggcttggcg attggccatc agcgcatgcg cggaaccttt gtggctcctc 1260 tgccgatcca tactgcggaa ctcctagcag cctgtttcgc tcgcagcagg tctggagcgg 1320 acgttatcgg cactgacaac tccgttgtcc tttctcggaa gtacacctcc ttcccatggc 1380 tgctaggctg tgctgccaac tggatcctgc gcgggacgtc ctttgtctac gtcccgtcgg 1440 cgctgaatcc tgcggacgac ccctctcgtg gtcgcttggg gctctgccgc cctcttctcc 1500 gcctaccgtt ccggccgacg acgggtcgca cctctcttta cgcggactcc ccgcctgtgc 1560 cttctcatct gccggcccgt gtgcacttcg cttcacctct gcacgtcgca tggagaccac 1620 cgtgaacgcc ccttggaact tgccaacaac cttacataag aggactcttg gactttcgcc 1680 ccggtcaacg acctggattg aggaatacat caaagactgt gtatttaagg actgggagga 1740 gtcgggggag gagttgaggt taaaggtctt tgtattagga ggctgtaggc ataaattggt 1800 ctgttcacca gcaccatgca actttttcac ctctgcctaa tcatcttttg ttcatgtccc 1860 actgttcaag cctccaagct gtgccttggg tggctttggg gcatggacat tgacccttat 1920 aaagaatttg gagcttctgt ggagttactc tcatttttgc cttctgactt cttcccgtct 1980 gtccgggacc tactcgacac cgcttcagcc ctctaccgag atgccttaga atcacccgaa 2040 cattgcaccc ccaaccacac tgctctcagg caagctattt tgtgctgggg tgagttgatg 2100 accttggctt cctgggtggg caataattta gaggatcctg cagcaagaga tctagtagtt 2160 aattatgtca atactaacat gggtctaaaa attagacaat tattatggtt tcacatttcc 2220 tgccttacat ttggaagaga aactgtgctt gagtatttgg tgtcttttgg agtgtggatc 2280 cgcactccac ctgcttacag accaccaaat gcccctatcc tatcaacact tccggagact 2340 actgttgtta gacaacgagg cagggcccct agaagaagaa ctccctcgcc tcgcagacga 2400 agatctcaat caccgcgtcg cagaagatct caatctccag cttcccaatg ttagtattcc 2460 ttggactcat aaggtgggaa actttaccgg tctttactcc tctactgtac ctgttttcaa 2520 tcctgactgg ttaactcctt cttttcctga cattcacttg catcaagatc tgatacaaaa 2580 atgtgaacaa tttgtaggcc cactcactac aaatgaaagg agacgattga aactaattat 2640 gccagctagg ttttatccca aagttactaa atacttccct ttggataaag gtattaagcc 2700 ttactatcca gagaatgtgg ttaatcatta ctttaaaact agacattatt tacatacttt 2760 gtggaaggca ggaattctat ataagagaga atccacacat agcgcctcat tttgtgggtc 2820 accatattcc tgggaacaag agctacagca tgggagcacc tctctcaacg gcgagaaggg 2880 gcatgggaca gaatctttct gtgcccaatc ctctgggatt ctttccagac caccagttgg 2940 atvcactatt cagagcaaat tccagcagtc ccgattggga cttcaacaca aacaaggaca 3000 attggccaat ggcaaacaag gtaggagtgg gaggcttcgg tccagggttc acacccccac 3060 acggtggcct tctggggtgg agccctcagg cacagggcat tctgacaacc tcgccaccag 3120 atccacctcc tgcttccacc aatcggaggt caggaagaaa gccaacccca gtctctccac 3180 ctctaaggga cacacatcca caggccatgc agtgg 3215 <210> 35 <211> 5980 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of Vector: pTREHBV-HAe <400> 35 ctcgagttta ccactcccta tcagtgatag agaaaagtga aagtcgagtt taccactccc 60 tatcagtgat agagaaaagt gaaagtcgag tttaccactc cctatcagtg atagagaaaa 120 gtgaaagtcg agtttaccac tccctatcag tgatagagaa aagtgaaagt cgagtttacc 180 actccctatc agtgatagag aaaagtgaaa gtcgagttta ccactcccta tcagtgatag 240 agaaaagtga aagtcgagtt taccactccc tatcagtgat agagaaaagt gaaagtcgag 300 ctcggtaccc gggtcgaggt aggcgtgtac ggtgggaggc ctatataagc gtcgagcacc 360 agcacctgca actttttcac ctctgcctaa tcatctcttg ttcatgtcct actgttcaag 420 cctccaagct gtgccttggg tggctttggg gcgtggacat ctacccatac gacgttccag 480 attacgctgg catggacatc gacccttata aagaatttgg agctactgtg gagttactct 540 cgtttttgcc ttctgacttc tttccttcag tacgagatct tctagatacc gcctcagctc 600 tgtatcggga agccttagag tctcctgagc attgttcacc tcaccatact gcactcaggc 660 aagcaattct ttgctggggg gaactaatga ctctagctac ctgggtgggt gttaatttgg 720 aagatccagc atctagagac ctagtagtca gttatgtcaa cactaatatg ggcctaaagt 780 tcaggcaact cttgtggttt cacatttctt gtctcacttt tggaagagaa accgttatag 840 agtatttggt gtctttcgga gtgtggattc gcactcctcc agcttataga ccaccaaatg 900 cccctatcct atcaacactt ccggaaacta ctgttgttag acgacgaggc aggtccccta 960 gaagaagaac tccctcgcct cgcagacgaa ggtctcaatc gccgcgtcgc agaagatctc 1020 aatctcggga acctcaatgt tagtattcct tggactcata aggtggggaa ctttactggt 1080 ctttattctt ctactgtacc tgtctttaat cctcattgga aaacaccatc ttttcctaat 1140 atacatttac accaagacat tatcaaaaaa tgtgaacagt ttgtaggccc acttacagtt 1200 aatgagaaaa gaagattgca attgattatg cctgctaggt tttatccaaa ggttaccaaa 1260 tatttaccat tggataaggg tattaaacct tattatccag aacatctagt taatcattac 1320 ttccaaacta gacactattt acacactcta tggaaggcgg gtatattata taagagagaa 1380 acaacacata gcgcctcatt ttgtgggtca ccatattctt gggaacaaga tctacagcat 1440 ggggcagaat ctttccacca gcaatcctct gggattcttt cccgaccacc agttggatcc 1500 agccttcaga gcaaacacag caaatccaga ttgggacttc aatcccaaca aggacacctg 1560 gccagacgcc aacaaggtag gagctggagc attcgggctg ggtttcaccc caccgcacgg 1620 aggccttttg gggtggagcc ctcaggctca gggcatacta caaactttgc cagcaaatcc 1680 gcctcctgcc tccaccaatc gccagacagg aaggcagcct accccgctgt ctccaccttt 1740 gagaaacact catcctcagg ccatgcagtg gaattccaca acctttcacc aaactctgca 1800 agatcccaga gtgagaggcc tgtatttccc tgctggtggc tccagttcag gagcagtaaa 1860 ccctgttccg actactgcct ctcccttatc gtcaatcttc tcgaggattg gggaccctgc 1920 gctgaacatg gagaacatca catcaggatt cctaggaccc cttctcgtgt tacaggcggg 1980 gtttttctag tagacaagaa tcctcacaat accgcaaagt ctagactcgt ggtggacttc 2040 tctcaatttt ctagggggaa ctaccgtgtg tcttggccaa aattcgcagt ccccaacctc 2100 caatcactca ccaacctcct gtcctccaac ttgtcctggt tatcgctgga tgtgtctgcg 2160 gcgttttatc atcttcctct tcatcctgct gctatgcctc atcttcttgt tggttcttct 2220 ggactatcaa ggtatgttgc ccgtttgtcc tctaattcca ggatcctcaa ccaccagcac 2280 gggaccatgc cgaacctgca tgactactgc tcaaggaacc tctatgtatc cctcctgttg 2340 ctgtaccaaa ccttcggacg gaaattgcac ctgtattccc atcccatcat cctgggcttt 2400 cggaaaattc ctatgggagt gggcctcagc ccgtttctcc tggctcagtt tactagtgcc 2460 atttgttcag tggttcgtag ggctttcccc cactgtttgg ctttcagtta tatggatgat 2520 gtggtattgg gggccaagtc tgtacagcat cttgagtccc tttttaccgc tgttaccaat 2580 tttcttttgt ctttgggtat acatttaaac cctaacaaaa caaagagatg gggttactct 2640 ctgaatttta tgggttatgt cattggaagt tatgggtcct tgccacaaga acacatcata 2700 caaaaaatca aagaatgttt tagaaaactt cctattaaca ggcctattga ttggaaagta 2760 tgtcaacgaa ttgtgggtct tttgggtttt gctgccccat ttacacaatg tggttatcct 2820 gcgttaatgc ccttgtatgc atgtattcaa tctaagcagg ctttcacttt ctcgccaact 2880 tacaaggcct ttctgtgtaa acaatacctg aacctttacc ccgttgcccg gcaacggcca 2940 ggtctgtgcc aagtgtttgc tgacgcaacc cccactggct ggggcttggt catgggccat 3000 cagcgcgtgc gtggaacctt ttcggctcct ctgccgatcc atactgcgga actcctagcc 3060 gcttgttttg ctcgcagcag gtctggagca aacattatcg ggactgataa ctctgttgtc 3120 ctctcccgca aatatacatc gtatccatgg ctgctaggct gtgctgccaa ctggatcctg 3180 cgcgggacgt cctttgttta cgtcccgtcg gcgctgaatc ctgcggacga cccttctcgg 3240 ggtcgcttgg gactctctcg tccccttctc cgtctgccgt tccgaccgac cacggggcgc 3300 acctctcttt acgcggactc cccgtctgtg ccttctcatc tgccggaccg tgtgcacttc 3360 gcttcacctc tgcacgtcgc atggagacca ccgtgaacgc ccaccgaatg ttgcccaagg 3420 tcttacataa gaggactctt ggactctctg caatgtcaac gaccgacctt gaggcatact 3480 tcaaagactg tttgtttaaa gactgggagg agttggggga ggagattaga ttaaaggtct 3540 ttgtactagg aggctgtagg cataaattgg tctgcgcacc agcaccatgc aactttttca 3600 cctctgccta atcatctctt gttcatgtcc tactgttcaa gcctccaagc tgtgccttgg 3660 gtggctttgg ggcatggaca tcgaccctta taaagaattt ggagctactg tggagttact 3720 ctcgtttttg ccttctgact tctttccttc agtacgagat ccactagttc tagagcggcc 3780 ccaaacaatt gctcaaaccg atacaattgt actttgtccc gagcaaatat aatcctgctg 3840 acggcccatc caggcacaaa cctcctgatt ggacggcttt tccatacacc cctctctcga 3900 aagcaatata tattccacat aggctatgtg gaacttaagc ttcctcgctc actgactcgc 3960 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 4020 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 4080 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4140 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4200 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4260 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4320 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4380 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 4440 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4500 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact ataagaacag 4560 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4620 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4680 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 4740 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 4800 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 4860 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 4920 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 4980 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 5040 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 5100 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 5160 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 5220 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 5280 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 5340 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 5400 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 5460 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 5520 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 5580 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 5640 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 5700 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 5760 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 5820 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca 5880 ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcact 5940 cgaatatctg caggcgtatc acgaggccct ttcgtcttca 5980 <210> 36 <211> 1170 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding HBV envelope protein, Large Surface protein (L) <400> 36 atggggcaga atctttccac cagcaatcct ctgggattct ttcccgacca ccagttggat 60 ccagccttca gagcaaacac agcaaatcca gattgggact tcaatcccaa caaggacacc 120 tggccagacg ccaacaaggt aggagctgga gcattcgggc tgggtttcac cccaccgcac 180 ggaggccttt tggggtggag ccctcaggct cagggcatac tacaaacttt gccagcaaat 240 ccgcctcctg cctccaccaa tcgccagaca ggaaggcagc ctaccccgct gtctccacct 300 ttgagaaaca ctcatcctca ggccatgcag tggaattcca caacctttca ccaaactctg 360 caagatccca gagtgagagg cctgtatttc cctgctggtg gctccagttc aggagcagta 420 aaccctgttc cgactactgc ctctccctta tcgtcaatct tctcgaggat tggggaccct 480 gcgctgaaca tggagaacat cacatcagga ttcctaggac cccttctcgt gttacaggcg 540 gggtttttct tgttgacaag aatcctcaca ataccgcaaa gtctagactc gtggtggact 600 tctctcaatt ttctaggggg aactaccgtg tgtcttggcc aaaattcgca gtccccaacc 660 tccaatcact caccaacctc ctgtcctcca acttgtcctg gttatcgctg gatgtgtctg 720 cggcgtttta tcatcttcct cttcatcctg ctgctatgcc tcatcttctt gttggttctt 780 ctggactatc aaggtatgtt gcccgtttgt cctctaattc caggatcctc aaccaccagc 840 acgggaccat gccgaacctg catgactact gctcaaggaa cctctatgta tccctcctgt 900 tgctgtacca aaccttcgga cggaaattgc acctgtattc ccatcccatc atcctgggct 960 ttcggaaaat tcctatggga gtgggcctca gcccgtttct cctggctcag tttactagtg 1020 ccatttgttc agtggttcgt agggctttcc cccactgttt ggctttcagt tatatggatg 1080 atgtggtatt gggggccaag tctgtacagc atcttgagtc cctttttacc gctgttacca 1140 attttctttt gtctttgggt atacatttaa 1170 <210> 37 <211> 846 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding HBV envelope protein, Middle surface protein (M) <400> 37 atgcagtgga attccacaac ctttcaccaa actctgcaag atcccagagt gagaggcctg 60 tatttccctg ctggtggctc cagttcagga gcagtaaacc ctgttccgac tactgcctct 120 cccttatcgt caatcttctc gaggattggg gaccctgcgc tgaacatgga gaacatcaca 180 tcaggattcc taggacccct tctcgtgtta caggcggggt ttttcttgtt gacaagaatc 240 ctcacaatac cgcaaagtct agactcgtgg tggacttctc tcaattttct agggggaact 300 accgtgtgtc ttggccaaaa ttcgcagtcc ccaacctcca atcactcacc aacctcctgt 360 cctccaactt gtcctggtta tcgctggatg tgtctgcggc gttttatcat cttcctcttc 420 atcctgctgc tatgcctcat cttcttgttg gttcttctgg actatcaagg tatgttgccc 480 gtttgtcctc taattccagg atcctcaacc accagcacgg gaccatgccg aacctgcatg 540 actactgctc aaggaacctc tatgtatccc tcctgttgct gtaccaaacc ttcggacgga 600 aattgcacct gtattcccat cccatcatcc tgggctttcg gaaaattcct atgggagtgg 660 gcctcagccc gtttctcctg gctcagttta ctagtgccat ttgttcagtg gttcgtaggg 720 ctttccccca ctgtttggct ttcagttata tggatgatgt ggtattgggg gccaagtctg 780 tacagcatct tgagtccctt tttaccgctg ttaccaattt tcttttgtct ttgggtatac 840 atttaa 846 <210> 38 <211> 681 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding HBV envelope protein, Small surface protein (S) <400> 38 atggagaaca tcacatcagg attcctagga ccccttctcg tgttacaggc ggggtttttc 60 ttgttgacaa gaatcctcac aataccgcaa agtctagact cgtggtggac ttctctcaat 120 tttctagggg gaactaccgt gtgtcttggc caaaattcgc agtccccaac ctccaatcac 180 tcaccaacct cctgtcctcc aacttgtcct ggttatcgct ggatgtgtct gcggcgtttt 240 atcatcttcc tcttcatcct gctgctatgc ctcatcttct tgttggttct tctggactat 300 caaggtatgt tgcccgtttg tcctctaatt ccaggatcct caaccaccag cacgggacca 360 tgccgaacct gcatgactac tgctcaagga acctctatgt atccctcctg ttgctgtacc 420 aaaccttcgg acggaaattg cacctgtatt cccatcccat catcctgggc tttcggaaaa 480 ttcctatggg agtgggcctc agcccgtttc tcctggctca gtttactagt gccatttgtt 540 cagtggttcg tagggctttc ccccactgtt tggctttcag ttatatggat gatgtggtat 600 tgggggccaa gtctgtacag catcttgagt ccctttttac cgctgttacc aattttcttt 660 tgtctttggg tatacattta a 681 <210> 39 <211> 6682 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence of expression vector pcHA-HBe <400> 39 gacggatcgg gagatctccc gatcccctat ggtcgactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagt 900 taagcttggt accgagctcg gatccaccat gcaacttttt cacctctgcc taatcatctc 960 ttgttcatgt cctactgttc aagcctccaa gctgtgcctt gggtggcttt ggggcgtgga 1020 catctaccca tacgacgttc cagattacgc tggcatggac atcgaccctt ataaagaatt 1080 tggagctact gtggagttac tctcgttttt gccttctgac ttctttcctt cagtacgaga 1140 tcttctagat accgcctcag ctctgtatcg ggaagcctta gagtctcctg agcattgttc 1200 acctcaccat actgcactca ggcaagcaat tctttgctgg ggggaactaa tgactctagc 1260 tacctgggtg ggtgttaatt tggaagatcc agcatctaga gacctagtag tcagttatgt 1320 caacactaat atgggcctaa agttcaggca actcttgtgg tttcacattt cttgtctcac 1380 ttttggaaga gaaaccgtta tagagtattt ggtgtctttc ggagtgtgga ttcgcactcc 1440 tccagcttat agaccaccaa atgcccctat cctatcaaca cttccggaaa ctactgttgt 1500 tagacgacga ggcaggtccc ctagaagaag aactccctcg cctcgcagac gaaggtctca 1560 atcgccgcgt cgcagaagat ctcaatctcg ggaacctcaa tgttagtatt ccttggactc 1620 ataaggtggg gaactttact ggtctttatt cttctactgt acctgtcttt aatcctcatt 1680 ggaaaacacc atcttttcct aatatacatt tacaccaaga cattatcaaa aaatgtgaac 1740 agtttgtagg cccacttacg gaccgtgtgc acttcgcttc acctctgcac gtcgcatgga 1800 gaccaccgtg aacgcccacc gaatgttgcc caaggtctta cataagagga ctcttggact 1860 ctctgcaatg tcaacgaccg accttgaggc atacttcaaa gactgtttgt ttaaagactg 1920 ggaggagttg ggggaggaga ttagattaaa ggtctttgta ctaggaggct gtaggcataa 1980 attggtctgc gcaccagcac catgcaactt tttcacctct gcctaatcat ctcttgttca 2040 tgtcctactg ttcaagcctc caagctgtgc cttgggtggc tttggggcat ggacatcgac 2100 ccttataaag aaaagggcaa ttctgcagat atccagcaca gtggcggccg ctcgagtcta 2160 gagggcccgc ggttcgaagg taagcctatc cctaaccctc tcctcggtct cgattctacg 2220 cgtaccggtc atcatcacca tcaccattga gtttaaaccc gctgatcagc ctcgactgtg 2280 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 2340 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 2400 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 2460 gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc 2520 agctggggct ctagggggta tccccacgcg ccctgtagcg gcgcattaag cgcggcgggt 2580 gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 2640 gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 2700 ggcatccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 2760 tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 2820 ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 2880 atctcggtct attcttttga tttataaggg attttgggga tttcggccta ttggttaaaa 2940 aatgagctga tttaacaaaa atttaacgcg aattaattct gtggaatgtg tgtcagttag 3000 ggtgtggaaa gtccccaggc tccccaggca ggcagaagta tgcaaagcat gcatctcaat 3060 tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 3120 atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat cccgccccta 3180 actccgccca gttccgccca ttctccgccc catggctgac taattttttt tatttatgca 3240 gaggccgagg ccgcctctgc ctctgagcta ttccagaagt agtgaggagg cttttttgga 3300 ggcctaggct tttgcaaaaa gctcccggga gcttgtatat ccattttcgg atctgatcaa 3360 gagacaggat gaggatcgtt tcgcatgatt gaacaagatg gattgcacgc aggttctccg 3420 gccgcttggg tggagaggct attcggctat gactgggcac aacagacaat cggctgctct 3480 gatgccgccg tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac 3540 ctgtccggtg ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg 3600 acgggcgttc cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg 3660 ctattgggcg aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa 3720 gtatccatca tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca 3780 ttcgaccacc aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt 3840 gtcgatcagg atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc 3900 aggctcaagg cgcgcatgcc cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc 3960 ttgccgaata tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg 4020 ggtgtggcgg accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt 4080 ggcggcgaat gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag 4140 cgcatcgcct tctatcgcct tcttgacgag ttcttctgag cgggactctg gggttcgcga 4200 aatgaccgac caagcgacgc ccaacctgcc atcacgagat ttcgattcca ccgccgcctt 4260 ctatgaaagg ttgggcttcg gaatcgtttt ccgggacgcc ggctggatga tcctccagcg 4320 cggggatctc atgctggagt tcttcgccca ccccaacttg tttattgcag cttataatgg 4380 ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 4440 tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctgtatac cgtcgacctc 4500 tagctagagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 4560 cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 4620 agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 4680 gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 4740 gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 4800 ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 4860 aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 4920 ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 4980 gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 5040 cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 5100 gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 5160 tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 5220 cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 5280 cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 5340 gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 5400 agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 5460 cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 5520 tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 5580 tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 5640 ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 5700 cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 5760 cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 5820 accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 5880 ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 5940 ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 6000 tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 6060 acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 6120 tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 6180 actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 6240 ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 6300 aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 6360 ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 6420 cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 6480 aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 6540 actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 6600 cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 6660 ccgaaaagtg ccacctgacg tc 6682 <210> 40 <400> 40 000 <210> 41 <211> 39 <212> DNA <213> Hepatitis B virus <220> <223> Nucleotide sequence encoding a HA-tag comprising 5’ - and 3’ - additional nucleotides <400> 41 gtggacatct acccatacga cgttccagat tacgctggc 39 <210> 42 <211> 13 <212> PRT <213> Hepatitis B virus <220> <223> Amino acid sequence of a HA-tag comprising N-terminal and C-terminal additional amino acids <400> 42 Val Asp Ile Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly 1 5 10 <210> 43 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 43 attggatcca ccatgcaact ttttcacctc tgc 33 <210> 44 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 acagtagttt ccggaagtgt tgataggata gggg 34 <210> 45 <211> 123 <212> DNA <213> Hepatitis B virus <220> <223> Wildtype HBV epsilon sequence <400> 45 accatgcaac tttttcacct ctgcctaatc atctcttgtt catgtcctac tgttcaagcc 60 tccaagctgt gccttgggtg gctttggggc atggacatcg acccttataa agaatttgga 120 gct 123 <210> 46 <211> 138 <212> DNA <213> Hepatitis B virus <220> <223> HBV epsilon sequence with HA-tag insertion <400> 46 accatgcaac tttttcacct ctgcctaatc atctcttgtt catgtcctac tgttcaagcc 60 tccaagctgt gccttgggtg gctttggggc gtggacatct acccatacga cgttccagat 120 tacgctggca tggacatc 138

Claims

하기 단계를 포함하는, 헤파드나바이러스의 공유결합 폐환형 (ccc) DNA 를 저해하는 후보 분자의 능력을 평가하는 방법:
(a) 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 상기 후보 분자와 접촉시키는 단계;
여기서 핵산 분자는 하나 이상의 표지를 인코딩하는 서열을 포함하고,
서열은 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되고,
하나 이상의 표지를 인코딩하는 서열을 포함하는 상기 핵산 분자는 HBV 게놈의 위치 C1902 및 위치 A1903 에 상응하는 뉴클레오티드 사이에 삽입되고,
상기 핵산 분자는 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하고, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 상기 하부 줄기와 염기쌍을 형성할 수 있는 서열은 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있음;
(b) 표지된 헤파드나바이러스 e 항원의 수준을 평가하는 단계; 및
(c) 표지된 헤파드나바이러스 e 항원의 수준이 대조군과 비교하여 감소되는 경우, 후보 분자를 선택하는 단계.
제 1 항에 있어서, 상기 헤파드나바이러스가 B 형 간염 바이러스 (HBV) 이고 상기 헤파드나바이러스 e 항원이 B 형 간염 바이러스 e 항원 (HBeAg) 인 평가 방법.
제 1 항에 있어서, 상기 표지된 헤파드나바이러스 e 항원이 단 하나의 표지를 포함하거나; 상기 표지된 헤파드나바이러스 e 항원이 둘 이상의 표지를 포함하는 평가 방법.
제 3 항에 있어서, 상기 표지가 헤마글루티닌 (HA)-표지, His-표지, Flag- 표지 (예컨대 1xFlag-표지 또는 3xFlag-표지), c-myc-표지, V5-표지 및/또는 C9-표지로 이루어지는 군에서 선택되는 평가 방법.
제 4 항에 있어서, 하기와 같은 평가 방법:
HA 표지를 인코딩하는 핵산 서열을 SEQ ID NO: 1 에 나타내고;
His-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 2 에 나타내고;
1xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 3 에 나타내고;
3xFlag-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 7 에 나타내고;
c-myc-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 4 에 나타내고;
V5-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 5 에 나타내고; 및/또는
C9-표지를 인코딩하는 핵산 서열을 SEQ ID NO: 6 에 나타내거나;
HA 표지의 아미노산 서열을 SEQ ID NO: 8 에 나타내고;
His-표지의 아미노산 서열을 SEQ ID NO: 9 에 나타내고;
1xFlag-표지의 아미노산 서열을 SEQ ID NO: 10 에 나타내고;
3xFlag-표지의 아미노산 서열을 SEQ ID NO: 14 에 나타내고;
c-myc-표지의 아미노산 서열을 SEQ ID NO: 11 에 나타내고;
V5-표지의 아미노산 서열을 SEQ ID NO: 12 에 나타내고; 및/또는
C9-표지의 아미노산 서열을 SEQ ID NO: 13 에 나타냄.
제 1 항에 있어서, 핵산 분자가 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열을 포함하는 평가 방법.
제 6 항에 있어서, 헤파드나바이러스 프리코어 단백질을 인코딩하는 핵산 서열이 SEQ ID NO: 15 에서 나타낸 바와 같은 B 형 간염 바이러스 프리코어 단백질의 핵산 서열이거나;
헤파드나바이러스 프리코어 단백질의 아미노산 서열이 SEQ ID NO: 17 에서 나타낸 바와 같은 B 형 간염 바이러스 프리코어 단백질의 아미노산 서열인 평가 방법.
제 6 항에 있어서, 하나 이상의 표지를 인코딩하는 상기 핵산 서열이 B 형 간염 바이러스 프리코어 단백질의 N-말단 29 개 아미노산을 인코딩하는 핵산 서열의 3' 다운스트림인 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 핵산 분자가 헤파드나바이러스 게놈 또는 SEQ ID NO: 27, 28, 29, 30, 31, 32, 33 또는 34 중 어느 하나에서 나타낸 바와 같은 B 형 간염 바이러스 (HBV) 게놈을 포함하는 평가 방법.
제 9 항에 있어서, 상기 HBV 게놈이 HBV 하위유전자형 ayw 의 게놈인 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조가 SEQ ID NO: 25 에서 나타낸 바와 같은 HBV 게놈에 의해 인코딩된 바와 같은 엡실론 구조인 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID No. 26 에서 나타낸 서열로 이루어지거나; 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열이 SEQ ID NO. 40 에서 나타낸 바와 같은 폴리펩티드를 인코딩하는 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 41 에서 나타낸 바와 같은 핵산 서열을 포함하거나;
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자가 SEQ ID NO. 42 에서 나타낸 바와 같은 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 평가 방법.
제 2 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 HBeAg 를 인코딩하는 핵산 서열을 SEQ ID NO: 20 에서 나타내거나; 표지된 HBeAg 의 아미노산 서열을 SEQ ID NO: 22 에 나타내는 평가 방법.
제 6 항 내지 제 8 항 중 어느 한 항에 있어서, 표지된 HBV 프리코어 단백질을 인코딩하는 핵산 서열을 SEQ ID NO: 19 에 나타내거나; 표지된 HBV 프리코어 단백질의 아미노산 서열을 SEQ ID NO: 21 에 나타내는 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 상기 단계 (a) 가 하기를 허용하는 조건 하, 표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자를 포함하는 세포를 배양하는 것을 포함하는 단계 (aa) 를 추가로 포함하는 평가 방법:
(i) 헤파드나바이러스 프리게놈 (pg) RNA 의 합성;
(ii) 상기 합성된 pgRNA 의 음성 가닥 DNA 로의 역전사;
(iii) 제 2 의 양성 가닥 DNA 의 합성 (이로써 상기 음성 가닥 DNA 및 상기 양성 가닥 DNA 가 이중 가닥 이완 환형 DNA 를 형성함)
(iv) 상기 이완 환형 이중 가닥 DNA 로부터의 cccDNA 형성;
(v) 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 임의 회복;
(vi) 표지된 헤파드나바이러스 e 항원을 인코딩하는 mRNA 의 전사;
(vii) 표지된 헤파드나바이러스 e 항원의 번역,
여기서, 표지된 헤파드나바이러스 e 항원의 번역을 허용하는 조건의 회복은 시작 코돈의 회복임.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 ELISA, CLIA 또는 AlphaLISA 에 의해 수행되는 평가 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 단계 (b) 에 따른 표지된 헤파드나바이러스 e 항원의 수준 평가가 상기 헤파드나바이러스 e 항원을 특이적으로 인지하는 항체 및 하나 이상의 표지를 특이적으로 인지하는 하나 이상의 항체의 사용을 포함하는 평가 방법.
표지된 헤파드나바이러스 e 항원을 인코딩하는 핵산 서열을 포함하는 핵산 분자로서, 여기서 핵산 분자가 하나 이상의 표지를 인코딩하는 서열을 포함하고, 서열이 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조에 삽입되고, 하나 이상의 표지를 인코딩하는 서열을 포함하는 상기 핵산 분자가 HBV 게놈의 위치 C1902 및 A1903 에 상응하는 뉴클레오티드 사이에 삽입되고, 상기 핵산 분자가 하나 이상의 표지를 인코딩하는 서열의 5' 에 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 하부 줄기와 염기쌍을 형성할 수 있는 서열을 포함하고, 헤파드나바이러스 게놈에 의해 인코딩된 바와 같은 엡실론 구조의 상기 하부 줄기와 염기쌍을 형성할 수 있는 서열이 HBV 게놈의 위치 T1849 내지 A1854 에 상응하는 뉴클레오티드와 염기쌍을 형성할 수 있는, 핵산 분자.
삭제
삭제
삭제