KR20230041686A

KR20230041686A - 아넬로바이러스를 확인 및 특징화하는 방법 및 이의 용도

Info

Publication number: KR20230041686A
Application number: KR1020237001351A
Authority: KR
Inventors: 아바크 카흐베지안; 에리카 가브리엘 와인스타인; 로저 조셉 하자르; 네이선 로렌스 요즈위악; 사이먼 델라그레이브; 얀 폴 가이 레지스 에첼라드; 시메온 웅거라이더 스프링거; 시저 에이. 아르제; 크리스티안 그라우가드 앤더슨
Original assignee: 플래그쉽 파이어니어링 이노베이션스 브이, 인크.
Priority date: 2020-06-17
Filing date: 2021-06-17
Publication date: 2023-03-24
Also published as: CA3187036A1; AU2021293245A1; US20230227849A1; BR112022025243A2; CN115867678A; EP4168579A1; MX2022016475A; TW202221126A; WO2021257830A9; IL299082A; JP2023530451A; WO2021257830A1

Abstract

본 발명은 일반적으로 진핵세포(예를 들어, 인간 세포 또는 인간 조직)로, 유전 물질을 운반하기 위하여, 이펙터(예를 들어, 페이로드)를 운반하기 위하여, 또는 치료제 또는 치료용 이펙터를 운반하기 위하여, 운반 비히클로서 사용될 수 있는 아넬로벡터(예를 들어, 합성 아넬로벡터)를 투여하기 위한 조성물 및 방법에 관한 것이다. 또한, 아넬로바이러스 서열을 포함하는 환형 핵산을 증폭시키는 방법이 제공된다.

Description

아넬로바이러스를 확인 및 특징화하는 방법 및 이의 용도

관련 출원에 대한 상호 참조

본 출원은 2020년 6월 17일에 출원된 미국 가출원 63/040,371; 2020년 12월 23일에 출원된 미국 가출원 63/130,074; 및 2021년 2월 8일에 출원된 63/147,029의 이익을 주장한다. 전술한 출원의 내용은 본 명세서에 전문이 참조로 포함된다.

환자에게 치료용 이펙터를 전달하기 위해 적합한 벡터를 제조하기 위한 조성물 및 방법을 개발하는 것에 대한 필요성이 계속 존재한다.

본 개시내용은 진핵 세포(예를 들어, 인간 세포 또는 인간 조직)에, 예를 들어, 유전 물질을 운반하기 위한, 이펙터, 예를 들어, 페이로드(payload)를 운반하기 위한, 또는 치료제 또는 치료용 이펙터를 운반하기 위한 운반 비히클로서 사용될 수 있는 아넬로벡터(예를 들어, 합성 아넬로벡터)를 투여하기 위한 조성물 및 방법을 제공한다. 예를 들어, 대상체에게 제1 복수의 아넬로벡터 및 그 다음 제2 복수의 아넬로벡터를 투여하는 단계를 포함하는, 이펙터를 운반하는 방법이 본 명세서에 기재되어 있다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 동일한 단백질성 외부를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부를 포함한다. 이론에 결부시키고자 하지 않고, 유전자 요법을 위한 특정 바이러스 벡터는 바이러스 단백질에 대한 면역 반응(예를 들어, 중화 항체)을 초래하여 이러한 바이러스 벡터가 대상체에게 반복 운반되기에 적합하지 않게 만든다. 예를 들어, 본 명세서의 실시예 1에 나타낸 바와 같이, 아넬로벡터는 중화 면역 반응을 촉발하지 않는 것으로 보이며, 따라서 다중 용량 투여에 적합하다.

본 개시내용은 아넬로바이러스 서열을 포함하는 핵산 분자를 증폭시키는 방법 및 이러한 방법과 관련된 조성물(예를 들어, 이의 반응 혼합물 및 생성물)을 추가로 제공한다. 방법은 일반적으로 핵산 분자(예를 들어, 환형 핵산 분자)를 포함하는 샘플을 제공하는 단계를 포함하며, 이는 프라이머(예를 들어, 축퇴 프라이머 또는, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 서열에 특이적인 프라이머) 및 DNA 중합효소(예를 들어, DNA-의존성 DNA 중합효소)와 접촉된다. 일반적으로, 핵산 분자와 프라이머 및 DNA 중합효소의 상호작용은 핵산 분자가 아넬로바이러스 서열(예를 들어, 프라이머에 의해 인식되는 표적 부위를 포함하는 아넬로바이러스 서열)을 포함하는 경우, 핵산 분자의 회전환 증폭(rolling circle amplification)을 초래한다. 일부 예에서, 프라이머는 복수의 프라이머(예를 들어, 프라이머의 비-축퇴 뉴클레오티드가 대체로 동일한 복수의 축퇴 프라이머; 또는 각각이, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 서열에 결합하는 동일한 서열을 포함하는, 복수의 아넬로바이러스-특이적 프라이머)의 일부이다. 일부 예에서, 프라이머는 표 A에 열거된 서열을 포함한다. 특정 구현예에서, 복수의 프라이머 모두는 표 A의 단일 행에 열거된 서열을 포함한다.

본 개시내용은 본 명세서에 기재된 증폭 방법에 따라 증폭된 핵산 분자의 서열을 결정하는 방법뿐만 아니라, 복수의 이러한 증폭된 핵산 분자에 대해 수득된 서열결정 데이터를 분석하는 방법을 추가로 제공한다. 일부 예에서, 증폭된 핵산 분자의 서열은, 예를 들어, 본 명세서에 기재된 바와 같은 심층 서열결정(deep sequencing) 방법(또한 차세대 서열결정 방법으로도 지칭됨)에 의해 결정된다. 일부 예에서, 서열결정 데이터는, 예를 들어, 본 명세서에 기재된 바와 같이 증폭된 핵산 분자로부터 아넬로바이러스 서열을 확인하기 위해, 예를 들어, 본 명세서에 기재된 바와 같은 컴퓨터를 사용한 방법에 의해 분석된다.

본 개시내용은 추가로 아넬로벡터(예를 들어, 합성 아넬로벡터), 예를 들어, 본 명세서에 기재된 방법에 따라 확인되거나 단리된 아넬로바이러스 서열을 포함하는 유전 요소를 포함하는 아넬로벡터; 및/또는 본 명세서에 기재된 방법에 따라 확인되거나 단리된 아넬로바이러스 서열에 의해 인코딩된 하나 이상의 구성성분(예를 들어, 캡시드 단백질, 예를 들어, ORF1 분자)을 포함하는 아넬로벡터와 관련된 조성물 및 방법을 제공한다.

본 명세서에 기재된 이펙터(예를 들어, 본 명세서에 기재된 바와 같은 조성물 또는 방법을 사용하여 생성됨)를 운반하기 위한 방법에 사용될 수 있는 아넬로벡터 및 이의 구성성분은 일반적으로 유전 요소를 세포(예를 들어, 포유동물 세포, 예를 들어, 인간 세포) 내로 도입할 수 있는 단백질성 외부(예를 들어, 아넬로바이러스 캡시드 단백질, 예를 들어, 아넬로바이러스 ORF1 단백질 또는 아넬로바이러스 ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는 단백질성 외부)에 캡슐화된 유전 요소(예를 들어, 이펙터, 예를 들어, 외인성 또는 내인성 이펙터, 예를 들어, 치료용 이펙터를 포함하거나 인코딩하는 유전 요소)를 포함한다. 일부 구현예에서, 아넬로벡터는 아넬로바이러스 ORF1 핵산(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 알파토르크바이러스(Alphatorquevirus), 베타토르크바이러스(Betatorquevirus) 또는 감마토르크바이러스(Gammatorquevirus)의 ORF1 핵산, 예를 들어, 알파토르크바이러스 클레이드 1, 알파토르크바이러스 클레이드 2, 알파토르크바이러스 클레이드 3, 알파토르크바이러스 클레이드 4, 알파토르크바이러스 클레이드 5, 알파토르크바이러스 클레이드 6 또는 알파토르크바이러스 클레이드 7의 ORF1)에 의해 인코딩된 폴리펩티드를 포함하는 단백질성 외부를 포함하는 입자 또는 감염성 비히클이다. 본 개시내용의 아넬로벡터의 유전 요소는 통상적으로 환형 및/또는 단일-가닥 DNA 분자(예를 들어, 환형 및 단일 가닥)이며, 일반적으로, 이를 둘러싸는 단백질성 외부 또는 이에 부착된 폴리펩티드에 결합하는 단백질 결합 서열을 포함하며, 이는 단백질성 외부 내의 유전 요소의 봉입 및/또는 단백질성 외부 내에서 다른 핵산에 비한 유전 요소의 농축을 용이하게 할 수 있다. 일부 구현예에서, 아넬로벡터의 유전 요소는, 본 명세서에 기재된 바와 같은 조성물 또는 방법을 사용하여 생성된다.

일부 예에서, 본 명세서에 기재된 이펙터의 운반 방법에 사용될 수 있는 아넬로벡터는, 예를 들어, 세포에서 발현될 수 있는, 이펙터(예를 들어, 핵산 이펙터, 예컨대 비-코딩 RNA, 또는 폴리펩티드 이펙터, 예를 들어, 단백질)를 포함하거나 인코딩하는 유전 요소를 포함한다. 일부 구현예에서, 이펙터는, 예를 들어 본 명세서에 기재된 바와 같은, 치료제 또는 치료용 이펙터이다. 일부 구현예에서, 이펙터는, 예를 들어 야생형 아넬로바이러스 또는 표적 세포에 대하여, 내인성 이펙터 또는 외인성 이펙터이다. 일부 구현예에서, 이펙터는 야생형 아넬로바이러스 또는 표적 세포에 대하여 외인성이다. 일부 구현예에서, 아넬로벡터는 세포와 접촉시키고, 이펙터를 인코딩하는 유전 요소를 세포 내로 도입하여, 이펙터가 세포에 의해 제조되거나 발현되게 함으로써 이펙터를 세포 내로 운반할 수 있다. 특정 예에서, 이펙터는 내인성 이펙터이다(예를 들어, 표적 세포에 대하여 내인성이지만, 예를 들어, 아넬로벡터에 의해 증가된 양으로 제공됨). 다른 예에서, 이펙터는 외인성 이펙터이다. 이펙터는 일부 예에서, 세포의 기능을 조절하거나, 세포 내의 표적 분자의 활성 또는 수준을 조절할 수 있다. 예를 들어, 이펙터는 (예를 들어, PCT/US19/65995의 실시예 3 및 4에 기재된 바와 같이) 세포 내의 표적 단백질의 수준을 감소시킬 수 있다. 또 다른 예에서, 아넬로벡터는 (예를 들어, PCT/US19/65995의 실시예 10 및 14에 기재된 바와 같이) 생체 내에서 이펙터, 예를 들어, 외인성 단백질을 운반하고 발현할 수 있다. 아넬로벡터는 예를 들어, 유전 물질을 표적 세포, 조직 또는 대상체에 운반하거나; 이펙터를 표적 세포, 조직 또는 대상체에 운반하거나; 또는 예를 들어, 원하는 세포, 조직 또는 대상체에 대하여 치료제로서 작동할 수 있는 이펙터를 운반함으로써 질환 및 장애를 치료하기 위해 사용될 수 있다.

일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은, 예를 들어, 숙주 세포에서, 본 명세서에 기재된 아넬로벡터를 투여하는 방법에 사용되는 합성 아넬로벡터의 유전 요소를 생성하는 데 사용될 수 있다. 합성 아넬로벡터는 야생형 바이러스(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스)와 비교하여 적어도 하나의 구조적 차이, 예를 들어, 야생형 바이러스에 비하여 결실, 삽입, 치환, 변형(예를 들어, 효소적 변형)을 갖는다. 일반적으로, 합성 아넬로벡터는 단백질성 외부 내에 봉입된 외인성 유전 요소를 포함하며, 이는 유전 요소 또는 그 내에 인코딩된 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)(예를 들어, 폴리펩티드 또는 핵산 이펙터)를 진핵(예를 들어, 인간) 세포 내로 운반하기 위해 사용될 수 있다. 구현예에서, 아넬로벡터는 검출 가능하고/가능하거나 원하지 않는 면역 또는 염증 반응을 야기하지 않으며, 예를 들어, 염증의 분자 마커(들), 예를 들어, TNF-알파, IL-6, IL-12, IFN, 및 B-세포 반응, 예를 들어, 반응성 또는 중화 항체의 1%, 5%, 10%, 15% 초과의 증가를 야기하지 않으며, 예를 들어, 아넬로벡터는 표적 세포, 조직 또는 대상체에 대하여 실질적으로 비-면역원성일 수 있다.

일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은 아넬로벡터, 예를 들어, 본 명세서에 기재된 이펙터의 운반 방법에 사용될 수 있는 아넬로벡터의 유전 요소를 생성하는 데 사용될 수 있으며, 이는 (i) 프로모터 요소, 및 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 인코딩하는 서열, 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소; 및 (ii) 단백질성 외부를 포함하고; 유전 요소는 단백질성 외부(예를 들어, 캡시드) 내에 봉입되고, 아넬로벡터는 유전 요소를 진핵(예를 들어, 포유동물, 예를 들어, 인간) 세포 내로 운반할 수 있다. 일부 구현예에서, 유전 요소는 단일-가닥 및/또는 환형 DNA이다. 대안적으로 또는 조합하여, 유전 요소는 하기의 특성 중 1개, 2개, 3개, 또는 전부를 갖는다: 환형이고/이거나, 단일-가닥이고/이거나, 세포에 유입되는 유전 요소의 약 0.0001%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 세포의 게놈 내로 통합되고/되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30개 카피 미만으로 표적 세포의 게놈 내로 통합됨. 일부 구현예에서, 통합 빈도는, 예를 들어 문헌[Wang et al., 2004, Gene Therapy 11: 711-721](본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 자유 벡터에서 분리된 게놈 DNA의 정량적 겔 정제 분석에 의해 결정된다. 일부 구현예에서, 유전 요소는 단백질성 외부 내에 봉입된다. 일부 구현예에서, 아넬로벡터는 유전 요소를 진핵 세포 내로 운반할 수 있다. 일부 구현예에서, 유전 요소는 야생형 아넬로바이러스의 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열(예를 들어, 300 내지 4000개 뉴클레오티드, 예를 들어, 300 내지 3500개 뉴클레오티드, 300 내지 3000개 뉴클레오티드, 300 내지 2500개 뉴클레오티드, 300 내지 2000개 뉴클레오티드, 300 내지 1500개 뉴클레오티드의 핵산 서열)을 포함한다. 일부 구현예에서, 유전 요소는 야생형 아넬로바이러스의 서열(예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열(예를 들어, 적어도 300개 뉴클레오티드, 500개 뉴클레오티드, 1000개 뉴클레오티드, 1500개 뉴클레오티드, 2000개 뉴클레오티드, 2500개 뉴클레오티드, 3000개 뉴클레오티드 또는 그 이상의 핵산 서열)을 포함한다. 일부 구현예에서, 핵산 서열은 예를 들어, 포유동물(예를 들어, 인간) 세포에서의 발현을 위하여 코돈-최적화된다. 일부 구현예에서, 핵산 서열 내의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 코돈은 예를 들어, 포유동물(예를 들어, 인간) 세포에서의 발현을 위하여 코돈-최적화된다.

일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은 본 명세서에 기재된 아넬로벡터를 투여하는 방법에 사용될 수 있는 치료용 이펙터를 인코딩하는 (아넬로바이러스에 대한) 이종 서열 및 캡시드에 결합하는 단백질 결합 서열을 포함하는 유전 요소를 캡슐화하는 캡시드(예를 들어, 아넬로바이러스 ORF, 예를 들어, ORF1, 폴리펩티드를 포함하는 캡시드)를 포함하는 (예를 들어, 인간 세포에 대한) 감염성 아넬로벡터, 비히클, 또는 입자의 유전 요소를 생성하는 데 사용될 수 있다. 구현예에서, 아넬로벡터는 유전 요소를 포유동물, 예를 들어, 인간, 세포 내로 운반할 수 있다. 일부 구현예에서, 유전 요소는 야생형 아넬로바이러스 게놈 서열에 대하여 약 6% 미만(예를 들어, 10%, 9.5%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5% 미만 또는 그 이하)의 동일성을 갖는다. 일부 구현예에서, 유전 요소는 야생형 아넬로바이러스 게놈 서열에 대하여 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5% 또는 6% 이하의 동일성을 갖는다. 일부 구현예에서, 유전 요소는 야생형 아넬로바이러스에 대하여 적어도 약 2% 내지 적어도 약 5.5%(예를 들어, 2 내지 5%, 3% 내지 5%, 4% 내지 5%)의 동일성을 갖는다. 일부 구현예에서, 유전 요소는 약 2000, 3000, 4000, 4500 또는 5000개 초과의 비-바이러스 서열(예를 들어, 비 아넬로바이러스 게놈 서열)의 뉴클레오티드를 갖는다. 일부 구현예에서, 유전 요소는 약 2000 내지 5000개, 2500 내지 4500개, 3000 내지 4500개, 2500 내지 4500개, 3500 또는 4000개, 4500개(예를 들어, 약 3000 내지 4500개) 초과의 비-바이러스 서열(예를 들어, 비 아넬로바이러스 게놈 서열)의 뉴클레오티드를 갖는다. 일부 구현예에서, 유전 요소는 단일-가닥, 환형 DNA이다. 대안적으로 또는 조합하여, 유전 요소는 하기의 특성 중 1개, 2개 또는 3개를 갖는다: 환형이거나, 단일 가닥이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 세포의 게놈 내로 통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30개 카피 미만으로 표적 세포의 게놈 내로 통합되거나, (예를 들어, 세포 용해물로부터의 유전 요소 서열에 대한 게놈 DNA 내로의 통합 빈도를 비교함으로써) 세포에 유입되는 유전 요소의 약 0.0001%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합됨. 일부 구현예에서, 통합 빈도는, 예를 들어, 문헌[Wang et al., 2004, Gene Therapy 11: 711-721](본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 자유 벡터에서 분리된 게놈 DNA의 정량적 겔 정제 분석에 의해 결정된다.

일부 구현예에서, 본 명세서에 기재된 방법에 따라 투여되는 아넬로바이러스 또는 아넬로벡터는, 본 명세서에 기재된 이펙터와 같은 작용제를 표적 세포, 예를 들어, 치료적 또는 예방적으로 치료될 대상체의 표적 세포에 도입하기 위한 효과적인 운반 비히클로 사용될 수 있다.

일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은 본 명세서에 기재된 투여 방법에 사용될 수 있는 아넬로벡터의 유전 요소를 생성하는 데 사용될 수 있으며, 유전 요소는 하기를 (예를 들어, 연속하여) 포함하는 폴리펩티드(예를 들어, 합성 폴리펩티드, 예를 들어, ORF1 분자)를 포함하는 단백질성 외부를 포함한다:

(i) 아르기닌-풍부 영역, 예를 들어, 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 이의 조합)를 포함하는 적어도 약 40개의 아미노산의 서열을 포함하는 제1 영역,

(ii) 젤리-롤(jelly-roll) 도메인, 예를 들어, 적어도 6개의 베타 가닥을 포함하는 서열을 포함하는 제2 영역,

(iii) 본 명세서에 기재된 N22 도메인 서열을 포함하는 제3 영역,

(iv) 본 명세서에 기재된 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열을 포함하는 제4 영역, 및

(v) 선택적으로 폴리펩티드는, 예를 들어, 본 명세서에 기재된 바와 같은, 야생형 아넬로바이러스 ORF1 단백질에 대하여 100%, 99%, 98%, 95%, 90%, 85%, 80% 미만의 서열 동일성을 갖는 아미노산 서열을 가짐.

일 양태에서, 본 발명은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 아넬로바이러스 서열을 포함하는 환형 핵산 분자 및 아넬로바이러스 서열의 일부에 대하여 상보성인 적어도 7, 8, 또는 9개를 갖는 프라이머를 포함하는 샘플을 제공하는 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 접촉은 핵산 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래한다.

일 양태에서, 본 발명은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 포함하는 샘플을 제공하는 단계; 및 (b) 환형 핵산 분자를 복수의 프라이머와 접촉시키되, 상기 복수의 제1 프라이머는 DNA-의존성 DNA 중합효소 분자의 존재 하에, 아넬로바이러스 서열의 일부와 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 단계를 포함하고; 여기서 접촉은 핵산 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래한다.

일 양태에서, 본 발명은 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 환형 핵산 분자 및 제1 프라이머와 제2 프라이머를 포함하는 샘플을 제공하되, 제1 프라이머는 제2 프라이머에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖고, 제1 프라이머와 제2 프라이머는 동일하지 않은 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 접촉은 핵산 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래한다.

일 양태에서, 본 발명은 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 환형 핵산 분자 및 복수의 별개의 프라이머를 포함하는 샘플을 제공하되, 복수의 프라이머 각각은 핵산 분자에 대해 동일한 배향을 공유하는 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 접촉은 핵산 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래한다.

일 양태에서, 본 발명은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 환형 핵산 분자 및 각각이 아넬로바이러스 서열의 일부에 상보성인 복수의 프라이머를 포함하는 샘플을 제공하는 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 (i) 환형 핵산 분자는 하나 이상의 프라이머에 의해 인식되는 복수의 서열을 포함하고/하거나; (ii) 복수의 프라이머는 모두 양성-가닥 프라이머 또는 모두 음성-가닥 프라이머이고/이거나; (iii) 복수의 프라이머는 모두 동일한-가닥 프라이머이고/이거나; (iv) 복수의 프라이머는 모두 적어도 3, 4, 5, 6, 7, 8, 9, 또는 10개의 인접 뉴클레오티드를 공통으로 포함하고/하거나; (v) 복수의 프라이머는 적어도 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 상이한 프라이머를 포함한다.

일 양태에서, 본 발명은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 아넬로바이러스 서열 및 아넬로바이러스 서열의 일부에 상보성인 하나 이상의 프라이머를 포함하는 환형 핵산 분자를 포함하는 샘플을 제공하는 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 (i) 환형 핵산 분자는 하나 이상의 프라이머에 의해 인식되는 복수의 서열을 포함하고/하거나; (ii) 하나 이상의 프라이머는 모두 양성-가닥 프라이머 또는 모두 음성-가닥 프라이머이고/이거나; (iii) 하나 이상의 프라이머는 모두 동일한-가닥 프라이머이고/이거나; (iv) 하나 이상의 프라이머는 모두 적어도 3, 4, 5, 6, 7, 8, 9, 또는 10개의 인접 뉴클레오티드를 공통으로 포함하고/하거나; (v) 하나 이상의 프라이머는 적어도 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 상이한 프라이머를 포함한다.

일 양태에서, 본 발명은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법을 특징으로 하며, 방법은 (a) 아넬로바이러스 서열 및 아넬로바이러스 서열의 일부에 상보성인 복수의 프라이머를 포함하는 환형 핵산 분자를 포함하는 샘플을 제공하는 단계; 및 (b) 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함하고; 여기서 접촉은 핵산 분자, 또는 이의 일부의 회전환 증폭을 초래하고; 복수의 프라이머의 서열은 서로 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일하다.

일 양태에서, 본 발명은 서열번호 1 내지 24 중 임의의 것, 예를 들어, 서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 것에 따른 핵산 서열을 포함하는 프라이머를 특징으로 한다.

일 양태에서, 본 발명은 복수의 상이한 프라이머를 포함하는 혼합물을 특징으로 하며, 복수의 프라이머 각각은 표 A에 열거된 바와 같은 서열을 갖는 프라이머에 의해 인식되는 하나 이상의 서열을 포함하는 핵산 분자에 결합한다.

일 양태에서, 본 발명은 복수의 상이한 프라이머를 포함하는 키트 또는 혼합물을 특징으로 하며, 복수의 프라이머 각각은 서열번호 1 내지 24 중 임의의 것, 예를 들어, 서열번호 2, 5, 7, 9, 11, 13, 15, 16, 18, 20, 22, 또는 24 중 임의의 것의 서열을 갖는 핵산 분자에 결합한다.

일 양태에서, 본 발명은 서열번호 1 내지 24 중 임의의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개 이상, 예를 들어, 서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 것에 따른 핵산 서열을 포함하는 키트 또는 혼합물을 특징으로 한다.

일 양태에서, 본 발명은 서열번호 13 내지 24 중 임의의 것의 서열을 갖는 단리된 핵산 분자를 특징으로 한다.

일 양태에서, 본 발명은 서열번호 1 내지 12 중 임의의 것에 따른 서열 및 아넬로바이러스 서열의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 또는 4000개의 인접 뉴클레오티드를 포함하는 티오포스페이트-포함 프라이머 서열을 포함하는 단리된 핵산 분자(예를 들어, 환형 핵산 분자, 예를 들어, 환형 DNA 분자)를 특징으로 한다.

일 양태에서, 본 발명은 복수의 아넬로바이러스 서열, 또는 각각 아넬로바이러스 서열의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 또는 4000개의 인접 뉴클레오티드를 포함하는 단편을 포함하는 단리된 핵산 분자(예를 들어, 환형 핵산 분자, 예를 들어, 환형 DNA 분자)를 특징으로 하며; 아넬로바이러스 서열 또는 이의 단편은 각각 서열번호 1 내지 12 중 임의의 것에 따른 서열을 포함하는 티오포스페이트-포함 프라이머 서열을 (예를 들어, 한쪽 말단에) 포함한다.

일 양태에서, 본 발명은 이펙터, 예를 들어, 페이로드를 인코딩하는 서열에 작동 가능하게 연결된 프로모터 요소, 및 외부 단백질 결합 서열을 포함하는 유전 요소의 서열을 포함하는 단리된 핵산 분자(예를 들어, 핵산 작제물)를 특징으로 한다. 일부 구현예에서, 외부 단백질 결합 서열은, 예를 들어, 본 명세서에 개시된 바와 같은, 아넬로바이러스의 5'UTR 서열에 대하여 적어도 75%(적어도 80%, 85%, 90%, 95%, 97%, 100%) 동일한 서열을 포함한다. 구현예에서, 유전 요소는 단일-가닥 DNA이고/이거나, 환형이고/이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되고/되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30개 카피 미만으로 표적 세포의 게놈 내로 통합되거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합된다. 일부 구현예에서, 통합 빈도는, 예를 들어, 문헌[Wang et al., 2004, Gene Therapy 11: 711-721](본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 자유 벡터에서 분리된 게놈 DNA의 정량적 겔 정제 분석에 의해 결정된다. 구현예에서, 이펙터는 TTV로부터 기원하지 않으며, SV40-miR-S1이 아니다. 구현예에서, 핵산 분자는 TTMV-LY2의 폴리뉴클레오티드 서열을 포함하지 않는다. 구현예에서, 프로모터 요소는 진핵(예를 들어, 포유동물, 예를 들어, 인간) 세포에서 이펙터의 발현을 지시할 수 있다.

일부 구현예에서, 핵산 분자는 환형이다. 일부 구현예에서, 핵산 분자는 선형이다. 일부 구현예에서, 본 명세서에 기재된 핵산 분자는 하나 이상의 변형된 뉴클레오티드(예를 들어, 염기 변형, 당 변형 또는 백본 변형)를 포함한다.

일부 구현예에서, 핵산 분자는 ORF1 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질)를 인코딩하는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 ORF2 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF2 단백질)를 인코딩하는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 ORF3 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF3 단백질)를 인코딩하는 서열을 포함한다. 일 양태에서, 본 발명은 (i) 프로모터 요소 및 이펙터, 예를 들어, 외인성 또는 내인성 이펙터를 인코딩하는 서열; (ii) 야생형 아넬로바이러스 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 적어도 72개의 인접 뉴클레오티드(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100 또는 150개 뉴클레오티드); 또는 야생형 아넬로바이러스 서열에 대하여 적어도 72%(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 적어도 100개(예를 들어, 적어도 300, 500, 1000, 1500개)의 인접 뉴클레오티드; 및 (iii) 단백질 결합 서열, 예를 들어, 외부 단백질 결합 서열 중 1개, 2개 또는 3개를 포함하는 유전 요소를 특징으로 하며, 핵산 작제물은 단일-가닥 DNA이며; 핵산 작제물은 환형이고/환형이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되고/통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30개 카피 미만으로 표적 세포의 게놈 내로 통합된다. 일부 구현예에서, 이펙터(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 외인성 또는 내인성 이펙터)를 인코딩하는 유전 요소는 코돈 최적화된다. 일부 구현예에서, 유전 요소는 환형이다. 일부 구현예에서, 유전 요소는 선형이다. 일부 구현예에서, 본 명세서에 기재된 유전 요소는 하나 이상의 변형된 뉴클레오티드(예를 들어, 염기 변형, 당 변형 또는 백본 변형)를 포함한다. 일부 구현예에서, 유전 요소는 ORF1 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질)를 인코딩하는 서열을 포함한다. 일부 구현예에서, 유전 요소는 ORF2 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF2 단백질)를 인코딩하는 서열을 포함한다. 일부 구현예에서, 유전 요소는 ORF3 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF3 단백질)를 인코딩하는 서열을 포함한다.

일 양태에서, 본 발명은 하기를 포함하는 숙주 세포를 특징으로 한다: (a) ORF1 분자, ORF2 분자, 또는 ORF3 분자 중 하나 이상을 인코딩하는 서열(예를 들어, 본 명세서에 기재된 아넬로바이러스 ORF1 폴리펩티드를 인코딩하는 서열)을 포함하되, 플라스미드이거나, 바이러스 핵산이거나, 염색체에 통합되는 핵산 분자; 및 (b) (i) 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소, 및 (ii) (a)의 폴리펩티드에 결합하는 단백질 결합 서열을 포함하되, 선택적으로 ORF1 폴리펩티드(예를 들어, ORF1 단백질)를 인코딩하지 않는 유전 요소. 예를 들어, 숙주 세포는 (a) 및 (b)를 시스(동일한 핵산 분자의 두 부분) 또는 트랜스(상이한 핵산 분자의 각각의 부분)로 포함한다. 구현예에서, (b)의 유전 요소는 환형, 단일-가닥 DNA이다. 일부 구현예에서, 숙주 세포는, 예를 들어 본 명세서에 기재된 바와 같은 제조(manufacturing) 세포주이다. 일부 구현예에서, 숙주 세포는 부착성이거나, 현탁액 중에 존재하거나, 둘 다이다. 일부 구현예에서, 숙주 세포 또는 헬퍼 세포는 마이크로캐리어에서 성장된다. 일부 구현예에서, 숙주 세포 또는 헬퍼 세포는 cGMP 제조 실무와 양립 가능하다. 일부 구현예에서, 숙주 세포 또는 헬퍼 세포는 세포 성장을 촉진하기에 적합한 배지 중에 성장된다. 특정 구현예에서, 일단 숙주 세포 또는 헬퍼 세포가 (예를 들어, 적절한 세포 밀도로) 충분히 성장하면, 배지를 숙주 세포 또는 헬퍼 세포에 의한 아넬로벡터의 생성에 적합한 배지로 교체할 수 있다.

일 양태에서, 본 발명은 아넬로벡터(예를 들어, 합성 아넬로벡터), 예를 들어, 본 명세서에 기재된 방법에 의해 투여될 수 있는 아넬로벡터를 포함하는 약제학적 조성물을 특징으로 한다. 구현예에서, 약제학적 조성물은 약제학적으로 허용 가능한 담체 또는 부형제를 추가로 포함한다. 구현예에서, 약제학적 조성물은 표적 대상체 킬로그램당 약 10⁵내지 10¹⁴개(예를 들어, 약 10⁶ 내지 10¹³, 10⁷ 내지 10¹², 10⁸ 내지 10¹¹, 또는 10⁹ 내지 10¹⁰개)의 게놈 당량의 아넬로벡터를 포함하는 단위 용량을 포함한다. 일부 구현예에서, 제제를 포함하는 약제학적 조성물은 허용 가능한 기간 및 온도에 걸쳐 안정할 것이고/이거나 요망되는 투여 경로 및/또는 투여 경로가 필요로 할 임의의 디바이스, 예를 들어, 니들(needle) 또는 주사기와 병용 가능할 것이다. 일부 구현예에서, 약제학적 조성물은 단회 용량 또는 다회 용량으로서의 투여를 위해 제형화된다. 일부 구현예에서, 약제학적 조성물은 투여 장소에서, 예를 들어, 의료 전문가(healthcare professional)에 의해 제형화된다. 일부 구현예에서, 약제학적 조성물은 (예를 들어, 부피당 게놈의 수에 의해 정의된 바와 같은) 요망되는 농도의 아넬로벡터 게놈 또는 게놈 당량을 포함한다.

일 양태에서, 본 발명은 대상체에서의 질환 또는 장애의 치료 방법을 특징으로 하며, 방법은 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로벡터, 예를 들어, 합성 아넬로벡터를 대상체에게 투여하는 단계를 포함한다.

일 양태에서, 본 발명은 이펙터 또는 페이로드(예를 들어, 내인성 또는 외인성 이펙터)를 세포, 조직 또는 대상체에 운반하는 방법을 특징으로 하며, 방법은 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로벡터, 예를 들어, 합성 아넬로벡터를 대상체에게 투여하는 단계를 포함하며, 아넬로벡터는 이펙터를 인코딩하는 핵산 서열을 포함한다. 구현예에서, 페이로드는 핵산이다. 구현예에서, 페이로드는 폴리펩티드이다.

일 양태에서, 본 발명은 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터, 예를 들어, 합성 아넬로벡터를 예를 들어, 생체 내에서 또는 생체 외에서, 세포, 예를 들어, 진핵 세포, 예를 들어, 포유동물 세포와 접촉시키는 단계를 포함하는 세포로의 아넬로벡터의 운반 방법을 특징으로 한다.

일 양태에서, 본 발명은 아넬로벡터, 예를 들어, 본 명세서에 기재된 아넬로벡터를 투여하는 방법에 사용될 수 있는 합성 아넬로벡터의 제조 방법을 특징으로 한다. 방법은 하기를 포함한다:

(a) (i) 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로벡터의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자; 및

(ii) 아넬로바이러스 ORF1 폴리펩티드, 또는, 예를 들어 본 명세서에 기재된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2로부터 선택되는 아미노산 서열 중 하나 이상, 또는 이에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%) 서열 동일성을 갖는 아미노산 서열을 인코딩하는 제2 핵산 분자

를 포함하는 숙주 세포를 제공하는 단계; 및

(b) 숙주 세포를 유전 요소의 핵산 서열의 복제(예를 들어, 회전환 복제)에 적합한 조건 하에서 인큐베이션하는 단계; 및

선택적으로 (c) 단백질성 외부(예를 들어, 제2 핵산 분자에 의해 인코딩된 폴리펩티드를 포함함)에 유전 요소를 봉입하기에 적합한 조건 하에서 숙주 세포를 인큐베이션하는 단계.

또 다른 양태에서, 본 발명은 아넬로벡터 조성물, 예를 들어, 본 명세서에 기재된 투여 방법에 사용될 수 있는 아넬로벡터 조성물의 제조 방법을 특징으로 하며, 조성물은 (a), (b), 및 (c) 중 하나 이상(예를 들어, 이들 전부)을 포함한다:

a) 아넬로벡터, 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 합성 아넬로벡터 중 하나 이상의 구성성분(예를 들어, 모든 구성성분)을 포함하는, 예를 들어, 발현하는 숙주 세포를 제공하는 단계;

b) 숙주 세포로부터 아넬로벡터의 제제를 생성하기에 적합한 조건 하에서 숙주 세포를 배양하되, 제제의 아넬로벡터는 유전 요소(예를 들어, 본 명세서에 기재된 바와 같음)를 캡슐화하는 단백질성 외부(예를 들어, 아넬로벡터 ORF1 폴리펩티드를 포함함)를 포함하여, 아넬로벡터의 제제를 제조하는 단계; 및

선택적으로, c) 아넬로벡터의 제제를, 예를 들어, 대상체에게 투여하기에 적합한 약제학적 조성물로서 재형화하는 단계.

예를 들어, 이 제조 방법에서 제공되는 숙주 세포는 (a) 본 명세서에 기재된 아넬로바이러스 ORF1 폴리펩티드를 인코딩하는 서열을 포함하되, 핵산은 플라스미드이거나, 바이러스 핵산 또는 게놈이거나, 헬퍼 세포 염색체에 통합되는 핵산; 및 (b) 유전 요소(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 유전 요소 서열 및/또는 유전 요소 영역을 포함함)를 생성할 수 있는 핵산 작제물을 포함하되, 예를 들어, 유전 요소는 (i) 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소, 및 (i) (a)의 폴리펩티드에 결합하는 단백질 결합 서열(예를 들어, 패키징 서열)을 포함하고, 숙주 세포는 (a) 및 (b)를 시스 또는 트랜스로 포함한다. 구현예에서, (b)의 유전 요소는 환형, 단일-가닥 DNA이다. 일부 구현예에서, 숙주 세포는 제조 세포주이다.

일부 구현예에서, 아넬로벡터의 구성성분은 생성 시에 (예를 들어, 일시적 형질감염에 의해) 숙주 세포 내로 도입된다. 일부 구현예에서, 숙주 세포는 아넬로벡터의 구성성분을 안정하게 발현한다(예를 들어, 아넬로벡터의 구성성분을 인코딩하는 하나 이상의 핵산은, 예를 들어, 안정한 형질감염에 의해 숙주 세포 또는 이의 자손 내로 도입됨).

일 양태에서, 본 발명은 a) 본 명세서에 기재된 복수의 아넬로벡터 또는 본 명세서에 기재된 아넬로벡터의 제제를 제공하는 단계; 및 b) 아넬로벡터 또는 이의 제제를, 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 아넬로벡터 조성물의 제조 방법을 특징으로 한다.

일 양태에서, 본 발명은 아넬로벡터를 포함하는 숙주 세포, 예를 들어, 제1 숙주 세포 또는 생성자 세포(예를 들어, PCT/US19/65995의 도 12에 나타낸 바와 같음), 예를 들어, 제1 숙주 세포의 집단의 제조 방법을 특징으로 하며, 방법은 예를 들어, 본 명세서에 기재된 바와 같은 유전 요소를 생성하는 핵산 작제물을 숙주 세포 내로 도입하는 단계, 및 숙주 세포를 아넬로벡터의 생성에 적합한 조건 하에서 배양하는 단계를 포함한다. 구현예에서, 방법은 헬퍼, 예를 들어, 헬퍼 바이러스를, 숙주 세포 내로 도입하는 단계를 추가로 포함한다. 구현예에서, 도입하는 단계는 아넬로벡터를 이용한 숙주 세포의 형질감염(예를 들어, 화학적 형질감염) 또는 전기천공법을 포함한다.

일 양태에서, 본 발명은, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로벡터를 포함하는 숙주 세포, 예를 들어, 제1 숙주 세포 또는 생성자 세포(예를 들어, PCT/US19/65995의 도 12에 나타낸 바와 같음)를 제공하는 단계, 및 숙주 세포로부터 아넬로벡터를 정제하는 단계를 포함하는 아넬로벡터의 제조 방법을 특징으로 한다. 일부 구현예에서, 방법은 상기 제공하는 단계 이전에, 숙주 세포를, 예를 들어, 본 명세서에 기재된 바와 같은, 핵산 작제물 또는 아넬로벡터와 접촉시키는 단계, 및 숙주 세포를 아넬로벡터의 생성에 적합한 조건 하에서 인큐베이션하는 단계를 추가로 포함한다. 구현예에서, 숙주 세포는 상기 숙주 세포의 제조 방법에 기재된 제1 숙주 세포 또는 생성자 세포이다. 구현예에서, 숙주 세포로부터 아넬로벡터를 정제하는 단계는 숙주 세포를 용해시키는 것을 포함한다.

일부 구현예에서, 방법은 제1 숙주 세포 또는 생성자 세포에 의해 생성되는 아넬로벡터를 제2 숙주 세포, 예를 들어, 허용 세포(예를 들어, PCT/US19/65995의 도 12에 나타낸 바와 같음), 예를 들어, 제2 숙주 세포의 집단과 접촉시키는 제2 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제2 숙주 세포를 아넬로벡터의 생성에 적합한 조건 하에서 인큐베이션하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제2 숙주 세포로부터 아넬로벡터를 정제함으로써, 예를 들어, 아넬로벡터 시드 집단을 생성하는 단계를 추가로 포함한다. 구현예에서, 제1 숙주 세포의 집단으로부터보다 제2 숙주 세포의 집단으로부터 적어도 약 2 내지 100배 더 많은 아넬로벡터가 생성된다. 구현예에서, 제2 숙주 세포로부터 아넬로벡터를 정제하는 단계는 제2 숙주 세포를 용해시키는 것을 포함한다. 일부 구현예에서, 방법은 제2 숙주 세포에 의해 생성되는 아넬로벡터를 제3 숙주 세포, 예를 들어, 허용 세포(예를 들어, PCT/US19/65995의 도 12에 나타낸 바와 같음), 예를 들어, 제3 숙주 세포의 집단과 접촉시키는 제2 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제3 숙주 세포를 아넬로벡터의 생성에 적합한 조건 하에서 인큐베이션하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 제3 숙주 세포로부터 아넬로벡터를 정제함으로써, 예를 들어, 아넬로벡터 스톡(stock) 집단을 생성하는 단계를 추가로 포함한다. 구현예에서, 제3 숙주 세포로부터 아넬로벡터를 정제하는 단계는 제3 숙주 세포를 용해시키는 것을 포함한다. 구현예에서, 제2 숙주 세포의 집단으로부터보다 제3 숙주 세포의 집단으로부터 적어도 약 2 내지 100배 더 많은 아넬로벡터가 생성된다.

일부 구현예에서, 숙주 세포는 세포 성장을 촉진하기에 적합한 배지에서 성장된다. 특정 구현예에서, 일단 숙주 세포가 (예를 들어, 적절한 세포 밀도로) 충분하게 성장되면, 배지를 숙주 세포에 의한 아넬로벡터의 생성에 적합한 배지로 교체할 수 있다. 일부 구현예에서, 숙주 세포에 의해 생성되는 아넬로벡터는 제2 숙주 세포와의 접촉 이전에 (예를 들어, 숙주 세포를 용해시킴으로써) 숙주 세포로부터 분리된다. 일부 구현예에서, 숙주 세포에 의해 생성되는 아넬로벡터는 개재되는 정제 단계 없이 제2 숙주 세포와 접촉된다.

일 양태에서, 본 발명은 약제학적 아넬로벡터 제제, 예를 들어, 본 명세서에 기재된 투여 방법에 사용되는 제제를 제조하는 방법을 특징으로 한다. 방법은 (a) 본 명세서에 기재된 바와 같은 아넬로벡터 제제를 제조하는 단계, (b) 제제(예를 들어, 약제학적 아넬로벡터 제제, 아넬로벡터 시드 집단 또는 아넬로벡터 스톡 집단)를 하나 이상의 약제학적 품질 관리 파라미터, 예를 들어, 아이덴티티, 순도, 역가, 효력(예를 들어, 아넬로벡터 입자당 게놈 당량) 및/또는 예를 들어, 아넬로벡터에 포함되는 유전 요소로부터의 핵산 서열에 대하여 평가하는 단계, 및 (c) 평가가 사전결정된 기준을 만족시키는, 예를 들어, 약제학적 규격을 만족시키는 약제학적 이용을 위한 제제를 제형화하는 단계를 포함한다. 일부 구현예에서, 아이덴티티를 평가하는 것은 아넬로벡터의 유전 요소의 서열, 예를 들어, 이펙터를 인코딩하는 서열을 평가하는 것(예를 들어, 확인하는 것)을 포함한다. 일부 구현예에서, 순도를 평가하는 것은 불순물, 예를 들어, 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로벡터(예를 들어, 요망되는 아넬로벡터, 예를 들어, 본 명세서에 기재된 바와 같은 합성 아넬로벡터 이외의 아넬로벡터), 유리 바이러스 캡시드 단백질, 외래성 물질(adventitious agent) 및 응집물의 양을 평가하는 것을 포함한다. 일부 구현예에서, 역가를 평가하는 것은 (예를 들어, HPLC에 의해 평가되는 바와 같은) 제제 내의 기능성 대 비-기능성(예를 들어, 감염성 대 비-감염성) 아넬로벡터의 비를 평가하는 것을 포함한다. 일부 구현예에서, 효력을 평가하는 것은 제제에서 검출 가능한 아넬로벡터 기능(예를 들어, 그 내에 인코딩된 이펙터의 발현 및/또는 기능 또는 게놈 당량)의 수준을 평가하는 것을 포함한다.

구현예에서, 제형화된 제제는 병원체, 숙주 세포 오염물질 또는 불순물이 실질적으로 없거나; 사전결정된 비-감염성 입자의 수준 또는 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 미만, 100:1 미만 또는 50:1 미만)를 갖는다. 일부 구현예에서, 다중 아넬로벡터가 단일의 배치(batch)에서 생성될 수 있다. 구현예에서, 배치에서 생성되는 아넬로벡터의 수준이 (예를 들어, 개별적으로 또는 함께) 평가될 수 있다.

일 양태에서, 본 발명은 하기를 포함하는 숙주 세포를 특징으로 한다:

(i) 본 명세서에 기재된 바와 같은 핵산 작제물을 포함하는 제1 핵산 분자, 및

(ii) 선택적으로, 예를 들어 본 명세서에 기재된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 약 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자.

일 양태에서, 본 발명은 본 명세서에 기재된 아넬로벡터 및 본 명세서에 기재된 투여 방법에 사용될 수 있는 헬퍼 바이러스를 포함하는 반응 혼합물을 특징으로 하며, 헬퍼 바이러스는 외부 단백질(예를 들어, 외부 단백질 결합 서열에 결합할 수 있는 외부 단백질, 및 선택적으로 지질 외피)을 인코딩하는 폴리뉴클레오티드, 복제 단백질(예를 들어, 중합효소)을 인코딩하는 폴리뉴클레오티드, 또는 이들의 임의의 조합을 포함한다.

일부 구현예에서, 아넬로벡터(예를 들어, 합성 아넬로벡터)는 단리되며, 예를 들어, 숙주 세포로부터 단리되고/되거나 용액(예를 들어, 상청액) 중 다른 구성요소로부터 단리된다. 일부 구현예에서, 아넬로벡터(예를 들어, 합성 아넬로벡터)는 예를 들어, 용액(예를 들어, 상청액)으로부터 정제된다. 일부 구현예에서, 아넬로벡터는 용액 중 다른 구성요소에 비하여 용액 중에서 농축된다.

상기 아넬로벡터, 조성물 또는 방법 중 임의의 것의 일부 구현예에서, 아넬로벡터를 제공하는 것은, 예를 들어 본 명세서에 기재된 바와 같은, 아넬로벡터-생성 세포를 포함하는 조성물로부터 아넬로벡터를 분리하는 것(예를 들어, 수확하는 것)을 포함한다. 다른 구현예에서, 아넬로벡터를 제공하는 것은, 예를 들어 제3자로부터 아넬로벡터 또는 이의 제제를 수득하는 것을 포함한다.

상기 아넬로벡터, 조성물 또는 방법 중 임의의 것의 일부 구현예에서, 유전 요소는, 예를 들어, 본 명세서에 기재된 방법에 따라 확인되는 바와 같은, 아넬로벡터 게놈을 포함한다. 구현예에서, 아넬로벡터 게놈은 TTV-tth8 핵산 서열, 예를 들어, TTV-tth8 핵산 서열의 뉴클레오티드 3436 내지 3707의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%의 결실을 갖는, TTV-tth8 핵산 서열을 포함한다. 구현예에서, 아넬로벡터 게놈은 TTMV-LY2 핵산 서열, 예를 들어, TTMV-LY2 핵산 서열의 뉴클레오티드 574 내지 1371, 1432 내지 2210, 574 내지 2210, 및/또는 2610 내지 2809의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%의 결실을 갖는, 예를 들어, TTMV-LY2 핵산 서열을 포함한다. 구현예에서, 유전 요소는 자가-복제할 수 있고/있거나 자가-증폭할 수 있다. 구현예에서, 유전 요소는 자가-복제할 수 없고/없거나 자가-증폭할 수 없다. 구현예에서, 유전 요소는, 예를 들어, 헬퍼, 예를 들어, 헬퍼 바이러스의 존재 하에 트랜스로 복제할 수 있고/있거나 증폭할 수 있다.

상기 아넬로벡터, 조성물 또는 방법 중 임의의 것의 추가의 특징은 하기 열거된 구현예 중 하나 이상을 포함한다.

당업자는 단지 일상적인 실험을 사용하여, 본 명세서에 기재된 본 발명의 특정 구현예의 다수의 등가물을 인식하거나 확인할 수 있을 것이다. 그러한 등가물은 하기 열거된 구현예에 의해 포함되는 것으로 의도된다.

열거된 구현예

1. 이전에 제1 복수의 아넬로벡터를 투여받은 인간 대상체에게 이펙터를 운반하는 방법으로서, 상기 방법은

대상체에게 제2 복수의 아넬로벡터를 투여하는 단계를 포함하며,

(i) 제1 복수의 아넬로벡터는

(a) ORF1 분자를 포함하는 단백질성 외부;

(b) 프로모터 요소, 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소

를 포함하고,

(ii) 제2 복수의 아넬로벡터는

(a) 제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

제1 복수의 단백질성 외부의, 폴리펩티드, 예를 들어, ORF1 분자에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 폴리펩티드, 예를 들어, ORF1 분자를 포함하는 단백질성 외부, 또는

제1 복수의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부, 및

(b) 프로모터 요소, 및 이펙터(예를 들어, (i)(b)의 이펙터 또는 제2 이펙터, 예를 들어, 제2 외인성 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소

를 포함하여, 이에 의해 대상체에게 이펙터를 운반하는 방법.

2. 구현예 1에 있어서, 대상체에게 제1 복수의 아넬로벡터를 투여하는 단계를 포함하는, 방법.

3. 인간 대상체에게 이펙터를 운반하는 방법으로서,

(i) (a) ORF1 분자를 포함하는 단백질성 외부;

를 포함하는 제1 복수의 아넬로벡터를 대상체에게 투여하는 단계, 및

(ii) (a) 제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

를 포함하는 제2 복수의 아넬로벡터를 대상체에게 후속적으로 투여하는 단계

4. 이펙터를 받을 인간 대상체를 선택하는 방법으로서,

대상체는

(a) ORF1 분자를 포함하는 단백질성 외부;

를 포함하는 제1 복수의 아넬로벡터를 이전에 받았거나 받은 것으로 확인되었고,

상기 방법은

제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

제1 복수의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부를 포함하는 제2 복수의 아넬로벡터를 받을 대상체를 선택하는 단계를 포함하는 방법.

5. 제2 복수의 아넬로벡터를 받기에 적합한 인간 대상체를 확인하는 방법으로서,

(a) ORF1 분자를 포함하는 단백질성 외부;

를 포함하는 제1 복수의 아넬로벡터를 받은 것으로 대상체를 확인하는 단계를 포함하고,

제1 복수의 아넬로벡터를 받은 것으로 확인된 대상체는 대상체가 제2 복수의 아넬로벡터를 받기에 적합한지를 나타내고, 제2 복수의 아넬로벡터는

제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

제1 복수의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부를 포함하는 방법.

6. 구현예 4 또는 5에 있어서, 대상체는 제1 복수의 아넬로벡터를 받은 것에 기초하여 선택되는, 방법.

7. 구현예 6에 있어서, 대상체는 수혈에서 제1 복수의 아넬로벡터를 받은 것인, 방법.

8. 구현예 4 또는 5에 있어서, 대상체는 제1 및 제2 복수의 아넬로벡터의 투여 사이에, 예를 들어, 제1 복수의 하나 이상의 아넬로벡터에 대한 면역 반응, 예를 들어, 항체의 존재에 대해 평가되는, 방법.

9. 구현예 8에 있어서, 제2 복수의 아넬로벡터는 면역 반응의 존재가 검출되지 않는 경우에 투여되는, 방법.

10. 구현예 8에 있어서, 제2 복수의 아넬로벡터는 면역 반응의 존재가 검출되는 경우에 투여되는, 방법.

11. 구현예 5 또는 6에 있어서, 대상체는 제1 및 제2 복수의 아넬로벡터의 투여 사이에, 예를 들어, 제1 복수, 또는 이의 자손으로부터의 아넬로벡터의 존재(예를 들어, 지속성)에 대해 평가되는, 방법.

12. 구현예 11에 있어서, 제2 복수의 아넬로벡터는 제1 복수, 또는 이의 자손으로부터의 아넬로벡터의 존재가 검출되지 않는 경우에 투여되는, 방법.

13. 구현예 11에 있어서, 제2 복수의 아넬로벡터는 제1 복수, 또는 이의 자손으로부터의 아넬로벡터의 존재가 검출되는 경우에 투여되는, 방법.

14. 인간 대상체를 치료하기 위한 약제로서 사용하기 위한 조성물로서,

대상체는

(a) ORF1 분자를 포함하는 단백질성 외부;

를 포함하는 제1 복수의 아넬로벡터를 이전에 투여받았고,

상기 사용하기 위한 조성물은

(a) 제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

를 포함하는 제2 복수의 아넬로벡터를 포함하는, 사용하기 위한 조성물.

15. 구현예 1 내지 14 중 어느 하나에 있어서, 제1 및 제2 복수는 거의 동일한 투약량의 아넬로벡터를 포함하고, 예를 들어 제1 복수 및 제2 복수의 아넬로벡터는 거의 동일한 양 및/또는 아넬로벡터의 농도를 포함하는, 방법 또는 사용하기 위한 조성물.

16. 구현예 1 내지 15 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 거의 동일한 수의 아넬로벡터를 포함하고, 예를 들어, 제2 복수는 90 내지 110%, 예를 들어, 95 내지 105%의 수의 제1 복수의 아넬로벡터를 포함하는, 방법 또는 사용하기 위한 조성물.

17. 구현예 1 내지 16 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 투여 시점에 대상체의 체질량으로 정규화될 때 제1 복수의 아넬로벡터와 거의 동일한 수의 아넬로벡터를 포함하고, 예를 들어, 제2 복수는 투여 시점에 대상체의 체질량으로 정규화될 때 90 내지 110%, 예를 들어, 95 내지 105%의 수의 제1 복수의 아넬로벡터를 포함하는, 방법 또는 사용하기 위한 조성물.

18. 구현예 1 내지 17 중 어느 하나에 있어서, 제1 복수는 제2 복수보다 더 많은 투약량의 아넬로벡터를 포함하고, 예를 들어, 제1 복수는 제2 복수에 비해 더 많은 양 및/또는 더 큰 농도의 아넬로벡터를 포함하는, 방법 또는 사용하기 위한 조성물.

19. 구현예 1 내지 18 중 어느 하나에 있어서, 제1 복수는 제2 복수보다 더 적은 투약량의 아넬로벡터를 포함하고, 예를 들어, 제1 복수는 제2 복수에 비해 더 적은 양 및/또는 더 작은 농도의 아넬로벡터를 포함하는, 방법 또는 사용하기 위한 조성물.

20. 구현예 1 내지 19 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 대상체에게 제1 복수의 아넬로벡터의 투여 후 적어도 1, 2, 3, 또는 4주, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 1, 2, 3, 4, 5, 10, 또는 20년 후에 대상체에게 투여되는, 방법 또는 사용하기 위한 조성물.

21. 구현예 1 내지 20 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 대상체에게 제1 복수의 아넬로벡터의 투여 후 1 내지 2주, 2 내지 3주, 3 내지 4주, 1 내지 2개월, 3 내지 4개월, 4 내지 5개월, 5 내지 6개월, 6 내지 7개월, 7 내지 8개월, 8 내지 9개월, 9 내지 10개월, 10 내지 11개월, 11 내지 12개월, 1 내지 2년, 2 내지 3년, 3 내지 4년, 4 내지 5년, 5 내지 10년, 또는 10 내지 20년 후에 대상체에게 투여되는, 방법 또는 사용하기 위한 조성물.

22. 구현예 1 내지 21 중 어느 하나에 있어서,

제1 복수의 아넬로벡터의 투여 후 및 제2 복수의 아넬로벡터의 투여 전,

a) (예를 들어, ELISA에 의해, 예를 들어, 단백질 이펙터의 검출에 의한; 예를 들어, RT-PCR에 의해, 핵산 이펙터의 검출에 의한, 또는 이펙터의 하류 효과, 예를 들어, 이펙터에 의해 영향을 받는 내인성 유전자의 수준의 검출에 의한) 대상체 내 이펙터의 수준 또는 활성;

b) (예를 들어, 아넬로벡터의 ORF1의 수준의 검출에 의한) 대상체 내 제1 복수의 아넬로벡터의 수준 또는 활성;

c) 아넬로벡터가 치료를 위해 투여된 대상체 내에서의 질환의 존재, 중증도, 진행, 또는 징후 또는 증상

중 하나 이상을 평가하는 단계를 추가로 포함하는, 방법 또는 사용하기 위한 조성물.

23. 구현예 1 내지 22 중 어느 하나에 있어서,

(a) 제1 복수의 아넬로벡터와 동일한 단백질성 외부로서,

를 포함하는 제3, 제4, 제5, 및/또는 추가의 복수의 아넬로벡터를 대상체에게 투여하는 것을 추가로 포함하는, 방법 또는 사용하기 위한 조성물.

24. 구현예 1 내지 23 중 어느 하나에 있어서, 적어도 1, 2, 3, 4, 또는 5년의 과정에 걸쳐 아넬로벡터의 반복 용량을 투여하는 것을 포함하는, 방법 또는 사용하기 위한 조성물.

25. 구현예 24에 있어서, 반복 용량은 적어도 약 1, 2, 3, 또는 4주, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월마다 투여되는, 방법 또는 사용하기 위한 조성물.

26. 구현예 1 내지 25 중 어느 하나에 있어서, 제1 복수 및 제2 복수는 동일한 투여 경로를 통해, 예를 들어, 정맥내 투여를 통해 투여되는, 방법 또는 사용하기 위한 조성물.

27. 구현예 1 내지 25 중 어느 하나에 있어서, 제1 복수 및 제2 복수는 상이한 투여 경로를 통해 투여되는, 방법 또는 사용하기 위한 조성물.

28. 구현예 1 내지 27 중 어느 하나에 있어서, 제1 복수 및 제2 복수의 아넬로벡터는 동일한 실체(예를 들어, 동일한 건강 관리 제공자)에 의해 투여되는, 방법 또는 사용하기 위한 조성물.

29. 구현예 1 내지 28 중 어느 하나에 있어서, 제1 및 제2 복수의 아넬로벡터는 상이한 실체(예를 들어, 상이한 건강 관리 제공자)에 의해 투여되는, 방법 또는 사용하기 위한 조성물.

30. 구현예 1 내지 29 중 어느 하나에 있어서, 대상체는 아넬로바이러스에 대해 면역 반응, 예를 들어, 항체의 존재에 대해 평가되고, 예를 들어, 대상체는 제1 복수의 투여 전에, 제2 복수의 투여 전에, 또는 제2 복수의 투여 후에 평가되는, 방법 또는 사용하기 위한 조성물.

31. 구현예 1 내지 30 중 어느 하나에 있어서, 대상체는 제1 및/또는 제2 복수의 아넬로벡터와 함께 면역억제제를 투여받는(예를 들어, 아넬로벡터가 대상체에 존재할 때 면역억제제가 대상체에서 활성이도록 동시에 투여받거나, 전 또는 후에 투여받는), 방법 또는 사용하기 위한 조성물.

32. 구현예 1 내지 30 중 어느 하나에 있어서, 대상체는 면역억제제를 제1 및/또는 제2 복수의 아넬로벡터와 함께 투여받지 않는, 방법 또는 사용하기 위한 조성물.

33. 구현예 1 내지 32 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부를 포함하는, 방법 또는 사용하기 위한 조성물.

34. 구현예 1 내지 33 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 동일한 단백질성 외부를 포함하는, 방법 또는 사용하기 위한 조성물.

35. 구현예 1 내지 34 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 포함되는 ORF1 분자와 동일한 아미노산 서열을 갖는 ORF1 분자를 포함하는, 방법 또는 사용하기 위한 조성물.

36. 구현예 1 내지 35 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 단백질성 외부에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 단백질성 외부를 포함하는, 방법 또는 사용하기 위한 조성물.

37. 구현예 1 내지 36 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 ORF1 분자에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 ORF1 분자를 포함하는, 방법 또는 사용하기 위한 조성물.

38. 구현예 37에 있어서, 제2 복수의 아넬로벡터의 단백질성 외부는 제1 복수의 아넬로벡터의 단백질성 외부와 하나 이상의 아미노산 서열 차이(예를 들어, 보존적 돌연변이)를 포함하는, 방법 또는 사용하기 위한 조성물.

39. 구현예 18에 있어서, 제2 복수의 아넬로벡터의 단백질성 외부는 (예를 들어, 계산된 평균 제곱근 오차(root-mean-square-deviation; RMSD)가 약 0, 예를 들어, 0인) 제1 복수의 아넬로벡터의 단백질성 외부와 동일한 3차 구조를 포함하는, 방법 또는 사용하기 위한 조성물.

40. 구현예 37에 있어서, 제1 복수의 아넬로벡터의 단백질성 외부에 결합하는 항체는 또한 제2 복수의 아넬로벡터의 단백질성 외부에 결합하는, 방법 또는 사용하기 위한 조성물.

41. 구현예 40에 있어서, 항체는 대상체에 포함되는, 방법 또는 사용하기 위한 조성물.

42. 구현예 40 또는 41에 있어서, 항체는 제1 복수의 아넬로벡터의 단백질성 외부에 제2 복수의 아넬로벡터의 단백질성 외부와 거의 동일한 친화도(예를 들어, 약 90 내지 110%, 예를 들어 95 내지 105%의 K_D를 가짐)로 결합하는, 방법 또는 사용하기 위한 조성물.

43. 구현예 1 내지 42 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터보다 더 많은 카피(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 500, 또는 1000배만큼 많은 카피)의 이펙터를 대상체에게 운반하는, 방법 또는 사용하기 위한 조성물.

44. 구현예 1 내지 43 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 거의 동일한 수의 카피의 이펙터를 대상체에게 운반하는, 방법 또는 사용하기 위한 조성물.

45. 구현예 1 내지 44 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 대상체에게 운반되는 이펙터 카피의 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 수준으로 대상체에게 이펙터를 운반하는(예를 들어, 제1 복수에 의해 운반되는 이펙터는 제2 복수에 의해 운반되는 이펙터와 동일하거나 상이할 수 있음), 방법 또는 사용하기 위한 조성물.

46. 구현예 1 내지 45 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 이펙터는 외인성 이펙터인, 방법 또는 사용하기 위한 조성물.

47. 구현예 1 내지 46 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 합성 아넬로벡터인, 방법 또는 사용하기 위한 조성물.

48. 구현예 1 내지 47 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 재조합 아넬로벡터인, 방법 또는 사용하기 위한 조성물.

49. 구현예 1 내지 48 중 어느 하나에 있어서, 제1 복수의 아넬로벡터의 이펙터는 내인성 이펙터이고, 제2 복수의 이펙터는 외인성 이펙터인, 방법 또는 사용하기 위한 조성물.

50. 구현예 1 내지 49 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 이펙터는 성장 호르몬(예를 들어, 인간 성장 호르몬(hGH))을 포함하는, 방법 또는 사용하기 위한 조성물.

51. 구현예 1 내지 50 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 이펙터는 에리트로포이에틴(EPO), 예를 들어, 인간 EPO를 포함하는, 방법 또는 사용하기 위한 조성물.

52. 구현예 1 내지 51 중 어느 하나에 있어서, 제2 복수의 아넬로벡터의 이펙터는 제1 복수의 아넬로벡터의 이펙터와 동일한, 방법 또는 사용하기 위한 조성물.

53. 구현예 1 내지 52 중 어느 하나에 있어서, 제2 복수의 아넬로벡터의 유전 요소는 제1 복수의 아넬로벡터의 유전 요소와 동일하거나, 제1 복수의 아넬로벡터의 유전 요소는 제2 복수의 아넬로벡터의 유전 요소에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 핵산 서열 동일성을 갖는, 방법 또는 사용하기 위한 조성물.

54. 구현예 1 내지 51 중 어느 하나에 있어서, 제2 복수의 아넬로벡터의 이펙터는 제1 복수의 아넬로벡터의 이펙터와 상이한, 방법 또는 사용하기 위한 조성물.

55. 구현예 1 내지 51 및 54 중 어느 하나에 있어서, 제2 복수의 아넬로벡터의 유전 요소는 제1 복수의 아넬로벡터의 유전 요소와 상이한, 방법 또는 사용하기 위한 조성물.

56. 구현예 1 내지 51 및 54 및 55 중 어느 하나에 있어서, 제1 복수의 아넬로벡터의 이펙터는 제1 외인성 이펙터이고, 제2 복수의 아넬로벡터의 외인성 이펙터는 제2 외인성 이펙터인, 방법 또는 사용하기 위한 조성물.

57. 구현예 1 내지 51 및 54 내지 56 중 어느 하나에 있어서,

제1 복수의 아넬로벡터는 대상체에서 제1 질환 또는 병태를 치료하기 위해 투여되고,

제2 복수의 아넬로벡터는 대상체에서 제2 질환 또는 병태를 치료하기 위해 투여되는, 방법 또는 사용하기 위한 조성물.

58. 구현예 1 내지 51 중 어느 하나에 있어서,

제2 복수의 아넬로벡터는 대상체에서 제1 질환 또는 병태를 치료하기 위해 투여되는, 방법 또는 사용하기 위한 조성물.

59. 인간 대상체로 외인성 이펙터를 운반하는 방법으로서,

(i) (a) ORF1 분자를 포함하는 단백질성 외부;

(b) 프로모터 요소, 및 외인성 이펙터를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소

(ii) (a) 제1 복수의 단백질성 외부의 ORF1 분자와 동일한 서열을 갖는 ORF1 분자를 포함하는 단백질성 외부, 및

(b) 제1 복수의 아넬로벡터의 유전 요소와 동일한 핵산 서열을 갖는 유전 요소

를 포함하는 제2 복수의 아넬로벡터를 대상체에게 투여하는 단계

를 포함하여, 이에 의해 외인성 이펙터를 대상체에게 운반하는 방법.

60. 구현예 1 내지 59 중 어느 하나에 있어서, 대상체는 혈우병을 갖는, 방법 또는 사용하기 위한 조성물.

61. 구현예 1 내지 60 중 어느 하나에 있어서, 대상체는 수혈을 받은 적이 있는, 방법 또는 사용하기 위한 조성물.

62. 구현예 1 내지 61 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 이펙터는 내인성 이펙터인, 방법 또는 사용하기 위한 조성물.

63. 구현예 1 내지 62 중 어느 하나에 있어서, 제1 복수의 아넬로벡터는 패키징 결핍 및/또는 복제 결핍인, 방법 또는 사용하기 위한 조성물.

64. 구현예 1 내지 63 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 패키징 결핍 및/또는 복제 결핍인, 방법 또는 사용하기 위한 조성물.

65. 구현예 1 내지 64 중 어느 하나에 있어서, 제1 복수의 아넬로벡터는 활성 및 비활성 입자의 혼합물을 포함하는, 방법 또는 사용하기 위한 조성물.

66. 구현예 1 내지 65 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 활성 및 비활성 입자의 혼합물을 포함하는, 방법 또는 사용하기 위한 조성물.

67. 구현예 1 내지 66 중 어느 하나에 있어서, 제1 복수의 아넬로벡터에 포함된 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150일 후에, 예를 들어, 실시예 1에 기재된 바와 같은, 예를 들어, 고해상도 용융(high-resolution melting; HRM) 분석에 의해, 대상체에서 검출 가능한, 방법 또는 사용하기 위한 조성물.

68. 구현예 1 내지 67 중 어느 하나에 있어서, 제2 복수의 아넬로벡터에 포함된 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150일 후에, 예를 들어, 실시예 1에 기재된 바와 같은, 예를 들어, 고해상도 용융(HRM) 분석에 의해, 대상체에서 검출 가능한, 방법 또는 사용하기 위한 조성물.

69. 구현예 1 내지 68 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 생성자 세포로부터 단리된 것인, 방법 또는 사용하기 위한 조성물.

70. 구현예 1 내지 69 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 대상체로부터 수득된 생물학적 샘플(예를 들어, 혈액)으로부터 수득되지 않은, 방법 또는 사용하기 위한 조성물.

71. 구현예 1 내지 70 중 어느 하나에 있어서, 제1 복수의 아넬로벡터는 제1 약제학적 조성물의 일부로서 대상체에게 투여되는, 방법 또는 사용하기 위한 조성물.

72. 구현예 1 내지 71 중 어느 하나에 있어서, 제2 복수의 아넬로벡터는 제2 약제학적 조성물의 일부로서 대상체에게 투여되는, 방법 또는 사용하기 위한 조성물.

73. 구현예 71 또는 72에 있어서, 제1 약제학적 조성물에서 아넬로벡터의 유전 요소의 적어도 70%, 80%, 90%, 95%, 또는 100%는 서로 동일한, 방법 또는 사용하기 위한 조성물.

74. 구현예 71 또는 72에 있어서, 제1 약제학적 조성물에서 아넬로벡터의 유전 요소의 적어도 70%, 80%, 90%, 95%, 또는 100%는 요망되는 유전 요소 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 서열 동일성을 갖는, 방법 또는 사용하기 위한 조성물.

75. 구현예 71 또는 72에 있어서, 제2 약제학적 조성물에서 아넬로벡터의 유전 요소의 적어도 70%, 80%, 90%, 95%, 또는 100%는 서로 동일한, 방법 또는 사용하기 위한 조성물.

76. 구현예 71 또는 72에 있어서, 제2 약제학적 조성물에서 아넬로벡터의 유전 요소의 적어도 70%, 80%, 90%, 95%, 또는 100%는 요망되는 유전 요소 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100% 서열 동일성을 갖는, 방법 또는 사용하기 위한 조성물.

77. 구현예 71 또는 72에 있어서, 제1 및/또는 제2 약제학적 조성물은 적혈구를 포함하지 않는, 방법 또는 사용하기 위한 조성물.

78. 구현예 71 또는 72에 있어서, 제1 및/또는 제2 약제학적 조성물은 세포를 포함하지 않는, 방법 또는 사용하기 위한 조성물.

79. 구현예 1 내지 78 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 아넬로바이러스 5' UTR, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는, 방법 또는 사용하기 위한 조성물.

80. 구현예 1 내지 79 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 서열번호 41의 뉴클레오티드 323 내지 393의 핵산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는, 방법 또는 사용하기 위한 조성물.

81. 구현예 1 내지 80 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 위치의 적어도 80%가 G 또는 C로 이루어진, 길이가 적어도 100개의 뉴클레오티드인 서열을 포함하는, 방법 또는 사용하기 위한 조성물.

82. 구현예 1 내지 81 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 하기의 GC-풍부 영역 뉴클레오티드 서열을 갖는 서열을 포함하는, 방법 또는 사용하기 위한 조성물:

CGGCGGX₁GGX₂GX₃X₄X₅CGCGCTX₆CGCGCGCX₇X₈X₉X₁₀CX₁₁X₁₂X₁₃X₁₄GGGGX₁₅X₁₆X₁₇X₁₈X₁₉X₂₀X₂₁GCX₂₂X₂₃X₂₄X₂₅CCCCCCCX₂₆CGCGCATX₂₇X₂₈GCX₂₉CGGGX₃₀CCCCCCCCCX₃₁X₃₂X₃₃GGGGGGCTCCGX₃₄CCCCCCGGCCCCCC

여기서,

X₁ = G 또는 C이고

X₂ = G, C, 또는 부재하고

X₃ = C 또는 부재하고

X₄ = G 또는 C이고

X₅ = G 또는 C이고

X₆ = T, G, 또는 A이고

X₇ = G 또는 C이고

X₈ = G 또는 부재하고

X₉ = C 또는 부재하고

X₁₀ = C 또는 부재하고

X₁₁ = G, A, 또는 부재하고

X₁₂ = G 또는 C이고

X₁₃ = C 또는 T이고

X₁₄ = G 또는 A이고

X₁₅ = G 또는 A이고

X₁₆ = A, G, T, 또는 부재하고

X₁₇ = G, C, 또는 부재하고

X₁₈ = G, C, 또는 부재하고

X₁₉ = C, A, 또는 부재하고

X₂₀ = C 또는 A이고

X₂₁ = T 또는 A이고

X₂₂ = G 또는 C이고

X₂₃ = G, T, 또는 부재하고

X₂₄ = C 또는 부재하고

X₂₅ = G, C, 또는 부재하고

X₂₆ = G 또는 C이고

X₂₇ = G 또는 부재하고

X₂₈ = C 또는 부재하고

X₂₉ = G 또는 A이고

X₃₀ = G 또는 T이고

X₃₁ = C, T, 또는 부재하고

X₃₂ = G, C, A, 또는 부재하고

X₃₃ = G 또는 C이고

X₃₄ = C 또는 부재함(서열번호 743).

83. 구현예 1 내지 82 중 어느 하나에 있어서, 아넬로벡터는 서열번호 45의 아미노산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는, 방법 또는 사용하기 위한 조성물.

84. 구현예 1 내지 83 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 아넬로바이러스 ORF2, ORF2/2, ORF2/3, ORF1, ORF1/1, 또는 ORF1/2로부터 선택되는 아미노산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 하나 이상의 폴리펩티드를 포함하는, 방법 또는 사용하기 위한 조성물.

85. 구현예 1 내지 84 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 표 12의 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2로부터 선택되는 아미노산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함하는, 방법 또는 사용하기 위한 조성물.

86. 구현예 1 내지 85 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 아넬로바이러스 ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 폴리펩티드를 포함하지 않는, 방법 또는 사용하기 위한 조성물.

87. 구현예 1 내지 86 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 환형 단일-가닥 DNA인, 방법 또는 사용하기 위한 조성물.

88. 구현예 1 내지 87 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 대상체의 세포에 유입되는 아넬로벡터의 1% 미만의 빈도로 통합되는, 방법 또는 사용하기 위한 조성물.

89. 구현예 1 내지 88 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 복제 인자 및 캡시드 단백질 중 하나 또는 둘 다를 인코딩하는 폴리뉴클레오티드를 포함하지 않는, 방법 또는 사용하기 위한 조성물.

90. 구현예 1 내지 89 중 어느 하나에 있어서, 제1 및/또는 제2 복수의 아넬로벡터는 복제 결함인, 방법 또는 사용하기 위한 조성물.

91. 구현예 1 내지 90 중 어느 하나에 있어서, 이펙터는

(i) 나노-루시퍼라제 이외의 세포내 폴리펩티드;

(ii) 세포내 핵산(예를 들어, miRNA 또는 siRNA);

(iii) 항체 분자, 효소, 호르몬, 사이토카인 분자, 보체 억제제, 성장 인자, 또는 성장 인자 억제제, 또는 상기 임의의 것의 기능적 변이체로부터 선택되는 분비 폴리펩티드; 또는

(iv) 돌연변이되었을 때, 인간 질환을 유발하는 폴리펩티드, 또는 상기 폴리펩티드의 기능적 변이체

를 포함하는, 방법 또는 사용하기 위한 조성물.

92. 구현예 1 내지 91 중 어느 하나에 있어서, 제1 복수, 제2 복수, 또는 제1 복수 및 제2 복수 둘 다의 아넬로벡터는

a) i) 외인성 이펙터를 인코딩하는 서열을 포함하는 제1 아넬로바이러스 유전 요소; 및

ii) 제1 아넬로바이러스 유전 요소와 나란히 배치된, 제2 아넬로바이러스 유전 요소 또는 이의 단편; 및

iii) 선택적으로 (i)과 (ii) 사이에 위치한 스페이서 서열

을 포함하는 핵산 작제물을 제공하는 단계; 및

b) 세포(예를 들어, 포유동물 숙주 세포)를 핵산 작제물의 아넬로바이러스 유전 요소가 복제되거나 증폭될 수 있게 하는 조건 하에서 핵산 작제물과 접촉시키는 단계

를 포함하는 방법에 의해 제조되어, 아넬로벡터 유전 요소를 제조하는, 방법 또는 사용하기 위한 조성물.

93. 구현예 92에 있어서, 제2 아넬로바이러스 유전 요소 또는 이의 단편은 2800, 2700, 2600, 2500, 2000, 1500, 1000, 900, 800, 700, 600, 또는 500개 뉴클레오티드 미만의 길이를 갖는, 방법 또는 사용하기 위한 조성물.

94. 구현예 92 또는 93에 있어서, 제2 아넬로바이러스 유전 요소 또는 이의 단편은 제1 아넬로바이러스 게놈에 대해 3'에 위치하는, 방법 또는 사용하기 위한 조성물.

95. 구현예 92 내지 94 중 어느 하나에 있어서, 제2 아넬로바이러스 유전 요소 또는 이의 단편은 제1 아넬로바이러스 게놈에 대해 5'에 위치하는, 방법 또는 사용하기 위한 조성물.

96. 구현예 92 내지 95 중 어느 하나에 있어서, 핵산 작제물은 스페이서 서열을 포함하며, 선택적으로 스페이서 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 아미노산의 길이, 또는 1 내지 5, 5 내지 10, 10 내지 15, 또는 15 내지 20개 아미노산의 길이를 갖는, 방법 또는 사용하기 위한 조성물.

97. 구현예 92 내지 96 중 어느 하나에 있어서, 핵산 작제물은 스페이서 서열을 포함하지 않는, 방법 또는 사용하기 위한 조성물.

98. 구현예 1 내지 97 중 어느 하나에 있어서, 제1 복수, 제2 복수, 또는 제1 및 제2 복수 둘 다의 아넬로벡터는

(i) a) 외인성 이펙터를 인코딩하는 서열에 작동 가능하게 연결된 프로모터를 포함하는 아넬로바이러스 유전 요소, 및

b) 아넬로바이러스 ORF1 분자

를 포함하는 곤충 세포를 제공하는 단계;

(ii) 아넬로바이러스 ORF1 분자를 포함하는 단백질성 외부의 아넬로바이러스 유전 요소의 봉입에 적합한 조건 하에서 곤충 세포를 인큐베이션하는 단계

를 포함하는 방법에 의해 제조된 것인, 방법 또는 사용하기 위한 조성물.

99. 구현예 98에 있어서, 곤충 세포를 제공하는 단계는 아넬로바이러스 ORF1 분자를 인코딩하는 핵산 작제물을 곤충 세포 내로 도입하는 것을 포함하는, 방법 또는 사용하기 위한 조성물.

100. 구현예 99에 있어서, 핵산은 곤충 세포에서의 핵산 작제물의 복제에 적합한 백본 영역(예를 들어, 바큘로바이러스 백본 영역)으로서, 선택적으로 또한 박테리아 세포에서의 핵산 작제물의 복제에 적합한 백본 영역을 포함하는, 방법 또는 사용하기 위한 조성물.

101. 구현예 98 내지 100 중 어느 하나에 있어서, 곤충 세포를 제공하는 단계는 아넬로바이러스 유전 요소를 곤충 세포 내로 도입하는 것을 포함하는, 방법 또는 사용하기 위한 조성물.

102. 아넬로바이러스 서열을 포함하는 환형 DNA 분자를 증폭시키는 방법으로서,

(a) 아넬로바이러스 서열을 포함하는 환형 DNA 분자 및 아넬로바이러스 서열의 일부에 대하여 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 제1 프라이머를 포함하는 샘플을 제공하는 단계; 및

(b) 환형 DNA 분자를 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)와 접촉시키는 단계

를 포함하며; 여기서 접촉은 DNA 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래하는 방법.

103. 구현예 102에 있어서, (a)는 환형 DNA 분자를 프라이머와 접촉시키는 것을 포함하는, 방법.

104. 아넬로바이러스 서열을 포함하는 환형 DNA 분자를 증폭시키는 방법으로서,

(a) 아넬로바이러스 서열을 포함하는 환형 DNA 분자를 포함하는 샘플을 제공하는 단계; 및

(b) 환형 핵산 분자를 복수의 프라이머와 접촉시키되, 상기 복수의 제1 프라이머는 중합효소(예를 들어, DNA-의존성 DNA 중합효소 분자)의 존재 하에, 아넬로바이러스 서열의 일부와 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 단계

를 포함하고;

여기서 접촉은 DNA 분자, 또는 이의 일부의 회전환 증폭을 초래하는 방법.

105. 구현예 104에 있어서, (b)는 환형 DNA 분자를 중합효소 분자와 접촉시키는 것을 포함하는, 방법.

106. 구현예 102 내지 105 중 어느 하나에 있어서, 샘플은 아넬로바이러스 서열의 일부에 대하여 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 복수의 프라이머를 포함하는, 방법.

107. 구현예 102 내지 106 중 어느 하나에 있어서, 제1 프라이머는 복수의 제2 프라이머에 대하여 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 가지며, 제1 프라이머와 제2 프라이머는 동일하지 않은, 방법.

108. 구현예 102 내지 107 중 어느 하나에 있어서, 복수의 프라이머 각각은 환형 DNA 분자에 대해 동일한 배향을 공유하는, 방법.

109. 구현예 102 내지 108 중 어느 하나에 있어서,

(i) 환형 DNA 분자는 복수의 프라이머에 의해 인식되는 복수의 서열을 포함하고/하거나;

(ii) 복수의 프라이머는 모두 양성-가닥 프라이머 또는 모두 음성-가닥 프라이머이고/이거나;

(iii) 복수의 프라이머는 모두 동일한-가닥 프라이머이고/이거나;

(iv) 복수의 프라이머는 모두 적어도 3, 4, 5, 6, 7, 8, 9, 또는 10개의 인접 뉴클레오티드를 공통으로 포함하고/하거나;

(v) 복수의 프라이머는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 상이한 프라이머를 포함하는, 방법.

110. 구현예 102 내지 109 중 어느 하나에 있어서, 제1 프라이머 및 제2 프라이머는 1, 2, 3, 또는 4개 위치에서 상이하고, 선택적으로 제1 프라이머 및 제2 프라이머는 길이가 각각 9개 뉴클레오티드인, 방법.

111. 구현예 102 내지 110 중 어느 하나에 있어서, 접촉시키는 단계 이전에, 하나 이상의 관심 구성요소에 대하여 샘플을 농축시키는 단계를 추가로 포함하는, 방법.

112. 구현예 111에 있어서, 하나 이상의 관심 구성요소는 핵산 분자를 포함하는, 방법.

113. 구현예 112에 있어서, 하나 이상의 관심 구성요소는 비-염색체 핵산 분자, 예를 들어, 환형 비-염색체 핵산 분자 및/또는 바이러스 핵산 분자(예를 들어, 아넬로바이러스 핵산 분자, 예를 들어, 아넬로바이러스 게놈)를 포함하는, 방법.

114. 구현예 102 내지 113 중 어느 하나에 있어서, 접촉시키는 단계 이전에, 예를 들어, 환형 DNA 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에, 예를 들어, 적어도 약 1, 2, 3, 4, 또는 5분 동안 노출시킴으로써, 환형 DNA 분자를 변성시키는 단계를 추가로 포함하는, 방법.

115. 구현예 114에 있어서, 변성시키는 단계 후에, 환형 DNA 분자를, 예를 들어, 약 2, 3, 4, 5, 5, 또는 7℃까지 냉각시키는 단계를 추가로 포함하는, 방법.

116. 구현예 102 내지 115 중 어느 하나에 있어서, 접촉시키는 단계 후에, 샘플을, 예를 들어, 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃에서, 예를 들어, 적어도 약 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 30시간 동안 인큐베이션하는 단계를 추가로 포함하는, 방법.

117. 구현예 116에 있어서, 인큐베이션하는 단계 후에, 중합효소 분자를 비활성화하기에 적합한 조건 하에서 샘플을 인큐베이션하는 단계(예를 들어, 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃에서, 예를 들어, 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15분 동안 샘플을 인큐베이션하는 단계)를 추가로 포함하는, 방법.

118. 구현예 102 내지 117 중 어느 하나에 있어서, 증폭된 핵산 분자는, 예를 들어, 문헌[Ninomiya et al. 2008, J. Clin. Microbiol. 46: 507-514](범-아넬로바이러스 프라이머 및 이와 관련된 방법에 대하여 본 명세서에 참조로 포함됨)에 기재된 바와 같이, 예를 들어 하나 이상의 범-아넬로바이러스 프라이머를 사용하여, PCR에 의해 검증되는, 방법.

119. 구현예 102 내지 118 중 어느 하나에 있어서, 증폭된 핵산 분자는, 예를 들어, 본 명세서, 예를 들어, 실시예 36에 기재된 바와 같이, 라이브러리 품질 관리(QC) 기법에 의해 평가되는, 방법.

120. 구현예 102 내지 119 중 어느 하나에 있어서, (b)의 접촉은 하기 특성 중 하나 이상을 갖는 혼합물에서 발생하는, 방법:

(i) 프라이머당 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 또는 0.8 μM, 또는 프라이머당 0.1 내지 0.2, 0.2 내지 0.3, 0.3 내지 0.4, 0.4 내지 0.5, 0.5 내지 0.6, 0.6 내지 0.7, 또는 0.7 내지 0.8 μM의 프라이머 또는 프라이머들의 농도;

(ii) DNA를 합성하기 위해 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)에 적합한 중합효소(예를 들어, DNA 중합효소) 완충액(예를 들어, Phi29 DNA 중합효소 완충액);

(iii) 소태아혈청을, 예를 들어, 약 100, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 또는 300 ng/μL, 또는 약 100 내지 150, 150 내지 175, 175 내지 190, 190 내지 200, 200 내지 210, 210 내지 225, 225 내지 250, 또는 250 내지 300 ng/μL의 농도로 포함함;

(iii) dNTP를, 예를 들어, 약 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 또는 2 mM, 또는 약 0.5 내지 0.7, 0.7 내지 0.9, 0.9 내지 1.0, 1.0 내지 1.1, 1.1 내지 1.3, 1.3 내지 1.5, 또는 1.5 내지 2 mM의 농도로 포함함; 및/또는

(iv) 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)는 Phi29 중합효소를, 예를 들어, 약 1, 1.5, 2, 2.5, 또는 3 U/μL, 또는 1 내지 1.5, 1.5 내지 2, 2 내지 2.5, 또는 2.5 내지 3 U/μL의 농도로 포함함.

121. 구현예 102 내지 120 중 어느 하나에 있어서, 방법은 열순환처리를 포함하지 않으며, 예를 들어, 방법은 등온으로 수행되는, 방법.

122. 구현예 102 내지 121 중 어느 하나에 있어서, 증폭은 환형 DNA 분자로부터 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)에 의해 합성된 가닥의 변위(예를 들어, 부분 또는 전체 변위)를 포함하는, 방법.

123. 구현예 102 내지 122 중 어느 하나에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)에 의해 합성된 가닥은 주변 용액으로 방출되는, 방법.

124. 구현예 123에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)는 합성된 가닥에 닉(nick)을 형성하여, 이에 의해 합성된 가닥을 방출하는, 방법.

125. 구현예 102 내지 124 중 어느 하나에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)는 환형 DNA 분자 서열의 복수의 카피를 포함하는 생성물 가닥, 또는 이의 적어도 1000, 2000, 2500, 3000, 3500, 또는 4000개 인접 뉴클레오티드를 포함하는 이의 단편을 합성하는, 방법.

126. 구현예 125에 있어서, 환형 DNA 분자 서열의 복수의 카피, 또는 이의 단편은 생성물 가닥 내에 나란히 배열되어 있는, 방법.

127. 구현예 102 내지 124 중 어느 하나에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)는 환형 DNA 분자 서열의 하나의 카피를 포함하는 생성물 가닥, 또는 이의 적어도 1000, 2000, 2500, 3000, 3500, 또는 4000개 인접 뉴클레오티드를 포함하는 이의 단편을 합성하는, 방법.

128. 구현예 102 내지 127 중 어느 하나에 있어서, 증폭된 환형 DNA 분자를 서열결정하는 단계를 추가로 포함하는, 방법.

129. 구현예 128에 있어서, 서열결정은 차세대 서열결정(예를 들어, 합성에 의한 서열결정(예를 들어, Illumina 서열결정), 파이로시퀀싱, 가역적 종결자 서열결정, 결찰에 의한 서열결정, 또는 나노포어 서열결정, 또는 이들의 임의의 조합)을 포함하는, 방법.

130. 구현예 128에 있어서, 서열결정은 생어(Sanger) 서열결정을 포함하는, 방법.

131. 구현예 128 내지 130 중 어느 하나에 있어서, 서열결정 결과의 컴퓨터를 사용한 분석을 추가로 포함하는, 방법.

132. 구현예 131에 있어서, 컴퓨터를 사용한 분석은 증폭된 핵산 분자의 서열에 나타나는 하나 이상의 아넬로바이러스 서열을 확인하는 것을 포함하는, 방법.

133. 구현예 131 또는 132에 있어서, 컴퓨터를 사용한 분석은 증폭된 핵산 분자의 복수(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 또는 1500개)의 별개의 서열에 포함되고/되거나 거기에서 인코딩된 하나 이상의 요소 또는 게놈 서열의 서열 유사성을 결정하는 것을 포함하는, 방법.

134. 구현예 131 내지 133 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 각각의 샘플, 각각의 대상체, 각각의 조직 또는 세포 유형, 및/또는 각각의 시점에 존재하는 아넬로바이러스 서열을 결정하는 것을 포함하는, 방법.

135. 구현예 131 내지 134 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 각각의 샘플, 각각의 대상체, 각각의 조직 또는 세포 유형, 및/또는 각각의 시점에 존재하는 특유의 아넬로바이러스 계통을 결정하는 것을 포함하는, 방법.

136. 구현예 131 내지 135 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 하나의 샘플에 존재하는 서열을 다른 샘플과 비교하는 것을 포함하는, 방법.

137. 구현예 131 내지 136 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 하나의 대상체에 존재하는 서열을 다른 대상체와 비교하는 것을 포함하는, 방법.

138. 구현예 131 내지 137 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 하나의 조직 또는 세포 유형에 존재하는 서열을 다른 조직 또는 세포 유형과 비교하는 것을 포함하는, 방법.

139. 구현예 131 내지 138 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 하나의 시점에 존재하는 서열을 다른 시점에 존재하는 서열과 비교하는 것을 포함하는, 방법.

140. 구현예 131 내지 139 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 서열, 또는 이의 일부(예를 들어, TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 및/또는 GC-풍부 영역 중 하나 이상을 포함하거나 인코딩하는 부분)의 다차원 척도법(multidimensional scaling; MDS)을 포함하는, 방법.

141. 구현예 131 내지 140 중 어느 하나에 있어서, 컴퓨터를 사용한 분석은 계통발생학적 분석을 포함하는, 방법.

142. 구현예 133에 있어서, 아넬로바이러스의 게놈 서열에 포함되고/되거나 여기에서 인코딩되는 하나 이상 요소는 TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 및/또는 GC-풍부 영역 중 하나 이상을 포함하는, 방법.

143. 구현예 102 내지 142 중 어느 하나에 있어서, 샘플은 대상체(예를 들어, 인간 대상체, 예를 들어 건강하거나 무증상 인간 대상체)로부터 수득되는, 방법.

144. 구현예 143에 있어서, 샘플은 생물학적 샘플인, 방법.

145. 구현예 144에 있어서, 생물학적 샘플은 혈액 또는 혈청을 포함하는, 방법.

146. 구현예 102 내지 145 중 어느 하나에 있어서, 샘플은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 환형 DNA 분자(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 아넬로바이러스 서열을 포함함)를 포함하는, 방법.

147. 구현예 102 내지 146 중 어느 하나에 있어서, 방법은 복수의 샘플(예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 125, 126, 127, 128, 129, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 400, 500, 600, 700, 800, 900, 또는 1000개의 샘플)에 대하여, 예를 들어, 동시에 수행되는, 방법.

148. 구현예 147에 있어서, 복수의 샘플이 복수의 대상체(예를 들어, 인간 대상체), 예를 들어 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 125, 126, 127, 128, 129, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 400, 500, 600, 700, 800, 900, 또는 1000명의 대상체로부터, 예를 들어 연속적으로 또는 동시에 수득되는, 방법.

149. 구현예 147 또는 148에 있어서, 복수의 샘플(예를 들어, 복수의 시점에 동일한 대상체로부터 수득되는 복수의 샘플, 또는 복수의 시점에 복수의 대상체로부터 수득되는 복수의 샘플)이 복수의 시점으로부터 수득되는, 방법.

150. 구현예 147 내지 149 중 어느 하나에 있어서, 복수의 샘플은 복수의 조직 또는 세포 유형, 예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 상이한 조직 또는 세포 유형으로부터 수득되는, 방법.

151. 서열번호 1 내지 24 중 임의의 것, 예를 들어, 서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 것에 따른 핵산 서열을 포함하는 프라이머.

152. 구현예 151에 있어서, 길이가 9, 10, 11, 12, 13, 14, 또는 15개 뉴클레오티드인, 프라이머.

153. 복수의 상이한 프라이머를 포함하는 키트 또는 혼합물로서,

복수의 프라이머 각각은 서열번호 1 내지 24 중 임의의 것, 예를 들어, 서열번호 2, 5, 7, 9, 11, 13, 15, 16, 18, 20, 22, 또는 24 중 임의의 것의 서열을 갖는 핵산 분자에 결합하는 키트 또는 혼합물.

154. 서열번호 1 내지 24 중 임의의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개 이상, 예를 들어, 서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 것에 따른 핵산 서열을 포함하는 복수의 상이한 프라이머를 포함하는 키트 또는 혼합물.

155. 구현예 153 또는 154에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 CGAATGGYW(서열번호 1)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 CGAATGGCA, CGAATGGCT, CGAATGGTA, 또는 CGAATGGTT 중 2, 3개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

156. 구현예 153 내지 155 중 어느 하나에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 YTGYGGBTG(서열번호 3)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 CTGCGGCTG, CTGCGGGTG, CTGCGGTTG, CTGTGGCTG, CTGTGGGTG, CTGTGGTTG, TTGCGGCTG, TTGCGGGTG, TTGCGGTTG, TTGTGGCTG, TTGTGGGTG, 또는 TTGTGGTTG 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

157. 구현예 153 내지 156 중 어느 하나에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 YAGAMACMM(서열번호 4)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 CAGAAACAA, CAGAAACAC, CAGAAACCA, CAGAAACCC, CAGACACAA, CAGACACAC, CAGACACCA, CAGACACCC, TAGAAACAA, TAGAAACAC, TAGAAACCA, TAGAAACCC, TAGACACAA, TAGACACAC, TAGACACCA, 또는 TAGACACCC 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

158. 구현예 153 내지 157 중 어느 하나에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 GTACCAYTTR(서열번호 17)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 GTACCACTTA, GTACCACTTG, GTACCATTTA, GTACCATTTG 중 2, 3개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

159. 구현예 153 내지 158 중 어느 하나에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 SACCACWAAC(서열번호 6)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 GACCACAAAC, GACCACTAAC, CACCACAAAC, 또는 CACCACT 중 2, 3개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

160. 구현예 153 내지 159 중 어느 하나에 있어서, 복수의 프라이머 중 하나 이상의 프라이머는 CACCGACVA(서열번호 19)에 따른 핵산 서열을 포함하며, 예를 들어, 복수의 프라이머는 CACCGACAA, CACCGACCA, 또는 CACCGACGA 중 2개, 또는 전부의 임의의 조합에 따른 핵산 서열을 포함하는, 키트 또는 혼합물.

161. 구현예 153 내지 160 중 어느 하나에 있어서, 선택적으로 각각의 프라이머는 별도의 용기에 있는, 키트.

162. 구현예 153 내지 161 중 어느 하나의 혼합물.

163. 구현예 153 내지 162 중 어느 하나에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA-중합효소 분자) 또는 아넬로바이러스 서열을 포함하는 환형 핵산 분자 중 하나 또는 둘 다를 추가로 포함하는, 혼합물.

164. 서열번호 13 내지 24 중 임의의 것의 서열을 갖는 하나 이상의 서열을 포함하는 단리된 핵산 분자.

165. 환형 핵산 분자를 증폭시키는 방법으로서,

(a) 구현예 63의 환형 핵산 분자 및 구현예 153 내지 163 중 어느 하나의 혼합물 또는 구현예 153 또는 154의 프라이머를 포함하는 샘플을 제공하는 단계;

(b) 환형 핵산 분자를 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)와 접촉시키는 단계

를 포함하며;

여기서 접촉은 핵산 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래하는, 방법.

166. 서열번호 1 내지 12 및 아넬로바이러스 서열의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 또는 4000개의 인접 뉴클레오티드 중 임의의 것에 따른 서열을 포함하는 티오포스페이트-포함 프라이머 서열을 포함하는 환형 DNA 분자.

167. 구현예 166에 있어서, 프라이머 서열은 하나 이상(예를 들어, 1 또는 2개)의 티오포스페이트 연결을 포함하는, 환형 DNA 분자.

168. 구현예 167에 있어서, 1 또는 2개의 티오포스페이트 연결을 포함하며, 선택적으로 환형 DNA 분자의 다른 모든 연결이 포스페이트 연결인, 환형 DNA 분자.

169. 각각이 아넬로바이러스 서열의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 또는 4000개의 인접 뉴클레오티드를 포함하는 복수의 아넬로바이러스 서열, 또는 이의 단편을 포함하는 DNA 분자로서;

아넬로바이러스 서열 또는 이의 단편은 각각이 서열번호 1 내지 12 중 임의의 것에 따른 서열을 포함하는 티오포스페이트-포함 프라이머 서열을 (예를 들어, 한쪽 말단에) 포함하는 DNA 분자.

170. 구현예 169에 있어서, 아넬로바이러스 서열 또는 이의 단편은 나란히 배열되어 있는, DNA 분자.

171. 구현예 169 또는 170에 있어서, 프라이머 서열은 각각이 하나 이상(예를 들어, 1 또는 2개)의 티오포스페이트 연결을 포함하는, DNA 분자.

172. 구현예 169 내지 171 중 어느 하나에 있어서, 각각이 PCT/US2019/065995의 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 또는 17 중 어느 하나에 열거된 바와 같은 아넬로바이러스 요소에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14개) 서열을 포함하는, DNA 분자.

173. 구현예 172에 있어서, 서열은 PCT/US2019/065995의 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 또는 17 중 어느 하나에 열거된 바와 같은 TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 또는 GC-풍부 영역에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는, DNA 분자.

174. 구현예 102 내지 173 중 어느 하나에 있어서, 프라이머는 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는, 프라이머, 방법, 혼합물, 또는 핵산 분자.

175. 구현예 102 내지 174 중 어느 하나에 있어서, 복수의 프라이머 각각은 길이가 9, 10, 11, 12, 13, 14, 또는 15개 뉴클레오티드로부터 독립적으로 선택되는, 방법, 혼합물, 또는 핵산 분자.

176. 구현예 102 내지 175 중 어느 하나에 있어서, 복수의 프라이머 각각은 뉴클레오티드의 길이가 동일한, 방법, 혼합물, 또는 핵산 분자.

177. 구현예 102 내지 176 중 어느 하나에 있어서, 복수의 프라이머 각각은 길이가 9개 뉴클레오티드인, 방법, 혼합물, 또는 핵산 분자.

178. 구현예 102 내지 177 중 어느 하나에 있어서, 중합효소 분자는 DNA-의존성 DNA 중합효소 분자, 예를 들어, Phi29 DNA 중합효소 분자인, 방법 또는 혼합물.

179. 구현예 102 내지 178 중 어느 하나에 있어서, 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)는 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 또는 70 kb의 DNA 생성물을 합성할 수 있는, 방법 또는 혼합물.

180. 구현예 102 내지 179 중 어느 하나에 있어서, 각각의 프라이머는 하나 이상(예를 들어, 1 또는 2개)의 티오포스페이트 연결을 포함하는, 방법, 혼합물, 또는 핵산 분자.

181. 구현예 180에 있어서, 하나 이상의 티오포스페이트 변형은 각각 프라이머에서 3개의 3'-최말단 뉴클레오티드 중 2개 사이에 위치하는, 방법, 혼합물, 또는 핵산 분자.

182. 구현예 181에 있어서, 하나의 포스페이트 변형은 프라이머의 3' 말단에서 제1 및 제2 뉴클레오티드 사이에 위치하는, 방법, 혼합물, 또는 핵산 분자.

183. 구현예 181 또는 182에 있어서, 하나의 티오포스페이트 변형은 프라이머의 3' 말단에서 제2 및 제3 뉴클레오티드 사이에 위치하는, 방법, 혼합물, 또는 핵산 분자.

184. 구현예 102 내지 183 중 어느 하나에 있어서, 환형 DNA 분자는 단일-가닥인, 방법, 혼합물, 또는 핵산 분자.

본 발명의 다른 특징, 목적 및 이점이 설명 및 도면, 및 청구범위로부터 명백해질 것이다.

달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 일반적으로 이해되는 바와 동일한 의미를 갖는다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 다른 참고문헌은 전문이 참조로 포함된다. 추가적으로, 물질, 방법 및 실시예는 단지 예시적인 것일 뿐이며, 제한하려는 것이 아니다.

도 1은 수혈 후 수일에 걸쳐 모든 수용 환자에 대한 각각의 채혈의 상대 시간을 나타내는 그래프이다.
도 2의 A 및 도 2의 B는 수혈 전 공여자 균주 대 수용자 균주에서 아넬로바이러스 캡시드 단백질의 유사성을 도시한다(A). 빨간색 원으로 표시된 균주는 재투약 후보로 분류된 균주이다. 이러한 균주는 수혈 전과 수혈 후 하나 이상의 시점에서 모두 관찰되었다(B).
도 3은 고해상도 용융(HRM) 분석에 의해 결정될 때, 환자에서 재투약된 아넬로바이러스의 지속성을 나타내는 일련의 그래프이다. 수용 환자는 수혈 후 24, 82, 110, 167일 후에 아넬로바이러스 프로파일에 대해 테스트되었으며, 생성된 프로파일을 제0일의 수용 환자의 아넬로바이러스 프로파일 대 공여자의 아넬로바이러스 프로파일과 비교하였다.
도 4는 TTMiniV("아넬로벡터 1")의 LY1 균주를 인코딩하는 카나마이신 벡터의 개략도를 도시한다.
도 5는 TTMiniV("아넬로벡터 2")의 LY2 균주를 인코딩하는 카나마이신 벡터의 개략도를 도시한다.
도 6은 293T 및 A549 세포에서 합성 아넬로벡터의 형질감염 효율을 도시한다.
도 7a 및 7b는 합성 아넬로벡터에 의한 293T 세포의 성공적인 감염을 예시하는 정량적 PCR 결과를 도시한다.
도 8a 및 8b는 합성 아넬로벡터에 의한 A549 세포의 성공적인 감염을 예시하는 정량적 PCR 결과를 도시한다.
도 9a 및 9b는 합성 아넬로벡터에 의한 Raji 세포의 성공적인 감염을 예시하는 정량적 PCR 결과를 도시한다.
도 10a 및 10b는 합성 아넬로벡터에 의한 Jurkat 세포의 성공적인 감염을 예시하는 정량적 PCR 결과를 도시한다.
도 11a 및 11b는 합성 아넬로벡터에 의한 Chang 세포의 성공적인 감염을 예시하는 정량적 PCR 결과를 도시한다.
도 12는 아넬로벡터(예를 들어, 본 명세서에 기재된 바와 같은 복제-적격 또는 복제-결핍 아넬로벡터)의 생성을 위한 예시적인 작업 흐름을 나타내는 개략도이다.
도 13은 지시된 플라스미드로 형질감염된 HEK293T 세포에서 miR-625 발현의 배수 변화를 나타내는 그래프이다.
도 14는 n-myc 상호작용 단백질(NMI)을 표적화하는 miRNA를 인코딩하는 아넬로벡터를 이용한 Raji B 세포의 감염을 나타내는 다이어그램이다. Raji B 세포(화살표) 또는 대조군 세포를 NMI miRNA-인코딩 아넬로벡터로 감염시킨 후 검출된 아넬로벡터의 게놈 등가물의 정량화가 나타나 있다.
도 15는 n-myc 상호작용 단백질(NMI)을 표적화하는 miRNA를 인코딩하는 아넬로벡터를 이용한 Raji B 세포의 감염을 나타내는 다이어그램이다. 웨스턴 블롯은 NMI에 대한 miRNA를 인코딩하는 아넬로벡터가 Raji B 세포에서 NMI 단백질 발현을 감소시키는 반면, miRNA가 결여된 아넬로벡터로 감염된 Raji B 세포는 대조군과 비슷한 NMI 단백질 발현을 나타내었음을 보여준다.
도 16은 내인성 miRNA-인코딩 서열을 포함하는 아넬로벡터 및 내인성 miRNA-인코딩 서열이 결실된 상응하는 아넬로벡터로 감염시킨 후 숙주 세포에서 생성된 아넬로벡터 입자의 정량화를 나타내는 일련의 그래프이다.
도 17a 및 17b는 나노-루시퍼라제를 발현하는 아넬로벡터를 생성하는 데 사용되는 작제물(도 17a) 및 세포를 형질감염시키는 데 사용되는 일련의 아넬로벡터/플라스미드 조합(도 17b)을 나타내는 일련의 다이어그램이다.
도 18a 내지 18c는 아넬로벡터가 주입된 마우스에서 나노-루시퍼라제 발현을 나타내는 일련의 다이어그램이다. (도 18a) 주사 후 제0일 내지 제9일에 마우스에서의 나노-루시퍼라제 발현. (도 18b) 표시된 바와 같이 다양한 아넬로벡터/플라스미드 작제물 조합을 주사한 마우스에서의 나노-루시퍼라제 발현. (도 18c) 주사 후 마우스에서 검출된 나노-루시퍼라제 발광의 정량화. 그룹 A는 TTMV-LY2 벡터 ± 나노-루시퍼라제를 받았다. 그룹 B는 나노 루시퍼라제 단백질과 TTMV-LY2 ORF를 받았다.
도 19a는 TTMV-LY2 플라스미드 pVL46-063 및 pVL46-240의 환화를 나타내는 겔 전기영동 이미지이다.
도 19b는 크기 배제 크로마토그래피(SEC)에 의해 결정된 선형 및 환형 TTMV-LY2 작제물에 대한 카피 수를 나타내는 크로마토그램이다.
도 19c는 아넬로바이러스 ORF1 분자의 도메인 및 상이한 아넬로바이러스로부터의 초가변 도메인으로 대체될 초가변 영역을 나타내는 개략도이다.
도 19d는 비-아넬로바이러스 공급원으로부터의 관심 단백질 또는 펩티드(POI)로 대체될 초가변 영역 및 ORF1의 도메인을 나타내는 개략도이다.
도 20은 인간 에리트로포이에틴(hEpo)을 인코딩하는 서열을 함유하도록 엔지니어링된 tth8 또는 LY2에 기반한 아넬로벡터가 포유동물 세포로 기능성 이식유전자를 운반할 수 있음을 나타내는 그래프이다.
도 21a 및 21b는 마우스에 투여된 엔지니어링된 아넬로벡터가 정맥 주사 7일 후에 검출 가능했음을 나타내는 일련의 그래프이다.
도 22는 hGH를 인코딩하는 엔지니어링된 아넬로벡터의 정맥 투여 7일 후 전혈의 세포 분획에서 hGH mRNA가 검출되었음을 나타내는 그래프이다.
도 23은 HEK293T 세포에서 예상 밀도로 TTV-tth8 게놈 카피를 생성하는 플라스미드에서, TTV-tth8 게놈과 비교하여 시험관 내 환화(IVC) TTV-tth8 게놈(IVC TTV-tth8)의 능력을 나타내는 그래프이다.
도 24는 Jurkat 세포에서 예상 밀도로 LY2 게놈 카피를 생성하는 플라스미드(WT LY2 플라스미드)에서 시험관 내 환화(IVC) LY2 게놈(WT LY2 IVC) 및 야생형 LY2 게놈의 능력을 나타내는 일련의 그래프이다.
도 25는 알파토르크바이러스, 베타토르크바이러스 및 감마토르크바이러스 유래의 아넬로바이러스 ORF1 단백질의 젤리 롤 도메인의 2차 구조 정렬을 나타내는 다이어그램이다(서열번호 950 내지 975). 이러한 2차 구조 요소는 고도로 보존되어 있다.
도 26a 내지 26c는 탠덤 아넬로바이러스 플라스미드가 아넬로바이러스 생성을 증가시킬 수 있음을 나타내는 일련의 다이어그램이다. (도 26a) 예시적인 탠덤 아넬로바이러스 플라스미드에 대한 플라스미드 맵. (도 26b) 탠덤 아넬로바이러스 플라스미드로 MOLT-4 세포를 형질감염시켜 야생형 크기의 아넬로바이러스 게놈을 회수하였다. (도 26c) 탠덤 아넬로바이러스 플라스미드로부터 MOLT-4 세포에서 생성된 아넬로바이러스 게놈은 캡슐화된 바이러스 입자에 대한 예상 밀도로 이동한다. GCR = GC-풍부 영역. 박테리아 SM = 박테리아 선택 마커. 박테리아 ori = 박테리아 복제 원점. ORF = 오픈-리딩 프레임. Prom. = 프로모터. 5CD = 5' 비번역 영역의 보존된 도메인.
도 27a 내지 27e는 Ring2 게놈에 기반한 예시적인 탠덤 작제물을 나타내는 일련의 다이어그램이다. (도 27a) 유전 요소의 제1 카피와 제1 카피에 대해 3'에 위치한 유전 요소의 전체 또는 부분적 제2 카피를 포함하는 탠덤 작제물. 각각의 연속적인 작제물은 제2 카피의 3' 말단의 더 큰 절단을 포함한다. 작제물은, 예를 들어 표시된 바와 같이 5CD(5' UTR 보존된 도메인)를 포함하는, 하류의 복제-촉진 서열(downstream replication-facilitating sequence; dRFS)을 포함할 수 있다. (도 27b) 유전 요소의 제1 카피와 제1 카피에 대해 5'에 위치한 유전 요소의 전체 또는 부분적 제2 카피를 포함하는 탠덤 작제물. 각각의 연속적인 작제물은 제2 카피의 5' 말단의 더 큰 절단을 포함한다. (도 27c) 유전 요소의 부분적인 제1 카피(예를 들어, uRFS를 포함함) 및 제1 카피에 대해 5'에 위치된 유전 요소의 부분적인 제2 카피(예를 들어, dRFS를 포함함)를 포함하는 탠덤 작제물. 각각의 연속적인 작제물은 제1 카피의 5' 말단의 더 큰 절단과 제2 카피의 3' 말단의 더 큰 비율을 포함한다. (도 27d) 도 2a 및 도 2b에 나타낸 작제물로 형질감염된 MOLT-4 세포로부터 수확된 총 DNA에 대한 서던 블롯으로서, 야생형 길이 아넬로바이러스 게놈의 회수를 입증한다. (도 27e) CsCl 밀도 구배로부터의 아넬로바이러스 게놈의 DNase-보호 qPCR로서, 도 2a 및 도 2b에 나타낸 작제물로 MOLT-4 세포에서 생성된 아넬로바이러스 게놈의 봉입을 입증한다.
도 27f는 Ring1 백본의 제1 카피에서, eGFP-ORF1 융합 단백질을 인코딩하는 서열을 인코딩하는 탠덤 Ring1 작제물을 포함하여, 다양한 Ring1 작제물(나타낸 바와 같음)로 형질감염된 Jurkat 세포로부터 전장의 Ring1 ORF1 mRNA에 대한 긴 RNA 판독물을 나타내는 일련의 다이어그램이다.
도 27g는 Ring2 탠덤 작제물이 뉴클레오펙션에 의해 도입된 MOLT-4 세포에서 ORF1 단백질 발현의 검출을 나타내는 일련의 다이어그램이다.
도 27h는 나란히 배열된 2개의 Ring2 게놈을 포함하는 예시적인 바큘로바이러스 작제물을 나타내는 다이어그램이다.
도 27i는 바큘로바이러스를 통한 탠덤 Ring2 게놈의 Sf9 세포로의 운반을 나타내는 일련의 다이어그램이다.
도 28은 곤충 세포에서 C-말단 His 태그를 갖는 Ring2 ORF1의 발현을 도시한다.
도 29는 곤충 세포에서 C-말단 His 태그를 갖는 Ring1 ORF1 및 ORF1/1의 발현을 도시한다.
도 30은 곤충 세포에서 PreScission 절단 서열이 있거나 없는 N-말단 His-태그를 갖는 Ring2 ORF1의 발현을 도시한다.
도 31은 곤충 세포에서 C-말단 His-태깅된 재조합 단백질로서 Ring1 ORF 1/1, 1/2, 2, 2/2, 및 2/3의 발현을 도시한다.
도 32는 곤충 세포에서 개별 Ring2 ORF의 발현을 도시한다. 동일한 블롯의 2개 노출이 중간 및 우측 패널에 나타나 있다. 좌측 패널은 표시된 바와 같이 테스트된 Ring2 작제물의 구조를 나타낸다.
도 33은 곤충 세포에서 Ring2 ORF1 + "FullORF", ORF1 + ORF2, ORF1 + ORF2/2, 및 ORF1 + ORF2/3의 바큘로바이러스-매개 공동-발현을 도시한다.
도 34는 바큘로바이러스를 사용하여 곤충 세포에서 다중 Ring2 단백질의 동시 공동-발현을 도시한다.
도 35는 바큘로바이러스 및 형질감염에 의해 곤충 세포로 운반된 아넬로바이러스 게놈으로부터의 ORF의 발현을 도시한다.
도 36은 Ring1 ORF2의 발현이 Sf9 세포에서 다면체 프로모터(pH로 표지된 화살표)와 관계가 없다는 것을 나타낸다.
도 37은 Ring2 ORF1-His 및 Ring2 게놈 DNA를 Sf9 세포로 동시-운반한 후, CsCl 선형 밀도 구배에서 인큐베이션 및 분획화하는 것을 도시한다. 분획의 항-His 태그 웨스턴 블롯과 각 분획의 qPCR 분석이 도면 상단에 나타나 있다. 하단 패널은 웨스턴 블롯에서 상자로 표시된 바와 같이, 2개의 개별 분획과 분획 풀의 투과 전자 현미경관찰 이미지를 나타낸다. 중간 패널의 삽입은 프로테아좀-유사 구조를 나타내는 확대도이다.
도 38은 면역금 전자 현미경관찰에 의한 Sf9 등밀도 분획의 특성화를 도시한다.
도 39는 추가의 아넬로바이러스 균주로부터의 ORF1의 발현을 도시한다.
도 40은 실시예 36의 대상체에서 아넬로바이러스의 서열 판독값 카운트의 플롯을 도시한다. 총 판독값 수는 공여자 샘플로부터 유래된 판독값 및 수혈 수용자 샘플로부터 유래된 판독값에 대해 제시된다. 파란색 음영 막대는 전체 판독값을 나타내는 한편, 빨간색 음영 막대는 아넬로바이러스 판독으로 식별된 판독값을 나타낸다. 밝은 파란색 막대 = 공여자 총 판독값; 밝은 빨간색 막대 = 공여자 아넬로바이러스 판독값; 진한 파란색 막대 = 수용자 총 판독값; 진한 빨간색 막대 = 수용자 아넬로바이러스 판독값.
도 41은 아넬로바이러스 다양성 범위의 매핑을 예시한다. 도 41의 패널 A는 아넬로바이러스 ORF1 아미노산 서열(n=1575)의 최대-우도 계통발생을 도시한다. 팁은 10개의 임의 클러스터를 생성하기 위해 쌍별 아미노산 거리의 응집 클러스터링을 기반으로 색상이 지정된다. 회색 가지는 이전에 공개된 서열을 뿌리에 연결하고 검은색 가지는 이 연구에서 보고된 서열을 나타낸다. 계통수 우측으로의 검은색 대시는 신규 서열의 위치와 볼륨을 나타낸다. 도 41의 패널 B는 8개의 다른 바이러스 표면 단백질과 비교한 1575개의 아넬로바이러스 ORF1 아미노산 서열(점은 패널 A에서와 같이 색상 지정됨)의 다차원 척도법(MDS) 분석을 도시한다: 2627 인간 유두종 바이러스(HPV) L1, 86 아데노-연관 바이러스(AAV) 캡시드, 3000 인간 면역결핍 바이러스 1(HIV1) env, 3000 뎅기 바이러스 외피, 425 중동-연관 호흡기 증후군 코로나바이러스(MERS-CoV) 스파이크, 3000 인플루엔자 A 바이러스 HA(그룹 2, 하위유형 H3, H4, H7, H10, 및 H14), 172 에볼라바이러스(속 전체) GP, 632 라싸열 바이러스 GPC 단백질 서열. 모든 바이러스에 대한 MDS 플롯은 동일한 축척으로 나타나 있으며; 눈금 막대는 MDS 투영 공간에서 부위당 0.2개의 아미노산 치환과 동일하다.
도 42a는 예시적인 아넬로바이러스 게놈 상의 모티프 위치를 나타내는 개략도이다. 이론적 아넬로바이러스 게놈에서 오픈-리딩 프레임(ORF) 위치의 레이아웃과 이에 상응하는 확인된 모티프가 나타나 있다.
도 42b는 아넬로바이러스 ORF3 서열에서 보존된 모티프를 나타내는 다이어그램이다. TTVS 데이터세트에서 471개 아넬로바이러스 게놈의 3' 말단 부근에서 ORF1 및 ORF2에 더하여 제3의 오픈-리딩 프레임(ORF3)이 예측되었다. 2개의 신규하고 고도로 보존된 모티프가 ORF3의 3' 말단 부근에서 확인되었으며: 모티프 1(a)는 471개의 서열 중 467개(99%)에서 관찰되었고; 모티프 2(b)는 471개의 서열 중 463개(98%)에서 관찰되었다.
도 42c는 아넬로바이러스 계통에 걸친 쌍별 동일성 백분율의 플롯을 도시한다. 서열을 4개 그룹(전체 콘티그, ORF1 캡시드 단백질, ORF2 및 5' UTR)으로 비닝하여 각각의 영역에 걸친 유사성을 평가하였다.
도 43은 바이러스 단백질의 부위 다양성을 예시한다. 도 43의 플롯은 바이러스 단백질 서열의 각각의 부위에서 특유한 아미노산의 수를 도시한다. 알파토르크바이러스(노란색), 베타토르크바이러스(녹색), 및 감마토르크바이러스(빨간색)에 속하는 아넬로바이러스 ORF1 서열은 좌측에, HIV-1 env, 인플루엔자 바이러스 그룹 2 HA, 및 아데노-연관 바이러스 캡시드 서열은 비교를 위해 우측에 나타나 있다. 스무딩된 평균(50개 아미노산 길이 창)을 갖는 각각의 바이러스 단백질 정렬에서 특유한 아미노산의 수는 검은색으로 나타나 있다. 적어도 90%의 간격으로 구성된 정렬 열은 제외되었다. 아넬로바이러스 정렬의 처음 150개 아미노산은 투명한 회색 상자로 강조 표시되어 HHpred에 따라 써코바이러스 캡시드 서열과 상당히 유사한 아넬로바이러스 ORF1 서열의 대략적인 위치를 나타낸다.
도 44는 아넬로바이러스 서열의 5' 비번역 영역의 계통발생학적 분석을 예시한다. 좌측의 계통수는 5' 비번역 영역에 있는 3개의 아넬로바이러스 속(빨간색의 알파토르크바이러스, 파란색의 베타토르크바이러스, 보라색의 감마토르크바이러스) 사이의 관계를 나타낸다. 계통수 우측에는 73개 뉴클레오티드가 정렬되어 있다(빨간색의 아데닌, 파란색의 시티딘, 녹색의 티미딘, 노란색의 구아닌, 회색의 갭 및 모호한 뉴클레오티드). 5개의 감마토르크바이러스 그룹(전체 게놈을 기반으로 분류됨)은 다른 감마토르크바이러스보다 베타토르크바이러스와 더 밀접한 관련이 있는 것으로 보인다.
도 45a 내지 45c는 개인 아넬롬(anellome)(즉, 인간 환자와 같은 단일 대상체에 존재하는 아넬로바이러스 서열 세트, 및 일부 예에서 이들의 상대 빈도)의 특성화를 도시한다. 도 45의 패널 A는 범-아넬로바이러스 PCR 테스트 결과를 제공한다. 15명의 수혈 수용자는 한 명 이상의 헌혈자와 짝을 이루어 수술 후 수혈을 받았다. 280일 동안 수혈 후 수용자 샘플을 수집하였다. 범-아넬로바이러스 PCR 양성 샘플은 빨간색으로 나타나 있다. 도 45의 패널 B는 개인당 확인된 특유의 아넬로바이러스 계통의 수의 플롯을 도시한다. 도 45의 패널 C는 각각의 수혈 수용자에서의 아넬로바이러스 다양성을 도시한다. MDS 분석은 전체 알려진 아넬로바이러스 다양성의 공간에 걸쳐 있는 연구 대상체 내에서의 아넬로바이러스 다양성을 입증하였다. 볼록 껍질은 각각의 대상체 세트에 포함된 다양성 공간의 양을 도시한다. 각각의 면 위에 제시된 숫자는 샘플링된 모든 아넬로바이러스의 볼록 껍질 영역과 비교하여 환자의 아넬로바이러스의 볼록 껍질이 차지하는 영역의 비율을 나타낸다.
도 46은 대상체 내의 평균 아미노산 동일성(AAI)의 플롯을 도시한다. 각각의 수혈-수용 대상체에서 발견된 아넬로바이러스 계통 사이의 평균 아미노산 동일성을 계산하였다. 각각의 패널의 점선 세로선은 각각의 대상체에서의 평균 AAI를 나타낸다.
도 47a 및 47b는 수혈을 통한 아넬로바이러스 계통의 전파를 예시한다. 도 47a는 수혈 후 종방향으로 수혈-수용자에서 아넬로바이러스 계통의 상대적 존재비를 나타내는 스트림 그래프를 도시한다. 빨간색 음영으로 표시된 계통은 공여자(들)로부터 전염된 계통을 나타내는 한편, 파란색 음영은 수용자에게 고유한 아넬로바이러스 계통을 나타낸다. 도 47b는 수혈 대상체로부터 단리된 아넬로바이러스의 상이한 하위세트 사이의 쌍별 거리의 비교를 도시한다. 공여자와 수혈 전 수용자 사이의 아넬로바이러스 유사성은 전염성을 예측하지 못하였다.
도 48은 아넬로바이러스 다양성에 대한 아넬로바이러스 재조합의 영향을 예시한다. 도 48의 패널 A는 아넬로바이러스 ORF1의 500개 뉴클레오티드 단편으로부터 추론된 중심점이 고정된 계통발생의 얽힌 사슬의 플롯을 도시하며, 연속 계통발생에서 각각의 계통의 위치가 첫 번째 계통발생에서 이들의 상대적인 위치에 의해 색칠된 선으로 나타나 있다. 아넬로바이러스 게놈 전체에서 연결되지 않은 진화는 재조합의 증거이다. 도 48의 패널 B는 진화적 상동을 통한 아넬로바이러스에서의 재조합의 증거를 제시한다. 뉴클레오티드 수준에서 서로 80% 동일성 이내의 서열 사이의 조상 서열 재구성은 수많은 반복 돌연변이를 나타내며, 각각의 선은 서로 상이한 가지에서 발생한 동일한 돌연변이를 연결하고, 가지 길이를 따라 있는 소수는 아넬로바이러스 게놈에서 돌연변이의 상대적 위치를 나타낸다. 가지 상의 표시(tick)는 해당 가지에서 고유하게 발생한 돌연변이를 나타낸다. 가지는 흰색으로 강조 표시된 가장 높은 값(모든 돌연변이는 진화적 상동성임/특유의 돌연변이 없음)을 가진 진화적 상동성인 모든 돌연변이의 분율에 의해 색상이 지정된다. 도 48의 패널 C는 다형성 부위 사이의 물리적 거리의 함수로서 붕괴되는 연관 불균형(r²와 동등하지만 또한 2개 초과의 대립유전자를 갖는 부위에도 적용되는

_df로 측정됨)의 플롯을 도시한다. 각각의 점은 두 부위 모두 10% 초과의 간격이 없고 모호하지 않은 문자인 다형성 ORF1 부위의 쌍에 해당한다. 빨간색 선은 100 nt 길이의 창에서 로컬 LD 평균을 나타낸다.
도 49는 알파토르크바이러스의 비-코딩 게놈 영역에서 확인된 긴 재조합 영역을 예시한다. 도시된 재조합 영역은 계통발생수에서 적어도 2회 발생하는 10개 뉴클레오티드 범위 내에서 적어도 3개의 돌연변이를 포함한다. 각각의 추정 재조합 영역은 검은색으로 표시된다. 추정 재조합 영역이 있는 가지에서 유래한 모든 서열의 뉴클레오티드 상태는 뉴클레오티드가 표시된 색상 상자(빨간색의 아데닌, 파란색의 시티딘, 녹색의 티미딘, 노란색의 구아닌)로 나타나 있다. 동일한 영역은 유사성을 강조하기 위해 회색 상자로 연결되어 있다.
도 50은 알파토르크바이러스의 비-코딩 게놈 영역 중에서 확인된 재조합 영역의 계통발생 위치를 예시한다. 재조합 영역은 알파토르크바이러스 다양성 전체에 걸쳐 있으며 심지어 관련성이 먼 게놈 간에도 유전 물질 교환에 최소한의 장벽이 존재함을 시사한다.
본 발명의 구현예의 하기의 상세한 설명은 첨부된 도면과 함께 읽으면 더 잘 이해될 것이다. 본 발명의 예시 목적을 위하여, 본 명세서에 예시된 구현예가 도면에 나타나 있다. 그러나, 본 발명이 도면에 나타낸 구현예의 정확한 배열 및 수단으로 제한되지 않음을 이해해야 한다.

정의

본 발명은 특정 구현예에 대해 그리고 특정 도면을 참조하여 설명될 것이지만 본 발명은 이에 한정되지 않고, 청구범위에 의해서만 한정된다. 이하에 기재된 용어는 일반적으로 다르게 지시되지 않는 한 그의 일반적인 의미로 이해될 것이다.

발명을 실시하기 위한 구체적인 내용 및 청구범위에서 "포함하다"라는 용어가 사용되는 경우, 이는 다른 요소를 배제하지 않는다. 본 발명의 목적을 위하여, "로 이루어지다"라는 용어는 "구성된다"라는 용어의 바람직한 구현예인 것으로 간주된다. 이하에서 그룹이 적어도 특정 개수의 구현예를 포함하는 것으로 정의되는 경우, 이는 또한 바람직하게는 이들 구현예만으로 이루어지는 그룹을 개시하는 것으로 이해될 것이다.

단수 명사를 언급할 때, 부정 관사 또는 정관사, 예를 들어, 하나의("a", "an") 또는 상기("the")가 사용되는 경우, 이는 그 밖의 어떤 것이 특별히 언급되지 않는 한, 그 명사의 복수형을 포함한다.

용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 표기된 치료, 조절 등의 목적에 적합한 화합물, 조성물, 생성물 등 그 자체를 지칭함을 이해할 것이다. 용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 추가로 일 구현예로서, 이러한 화합물, 조성물, 생성물 등이 치료, 조절 등에 사용하기 위한 것임을 개시한다.

용어 "...에 사용하기 위한 화합물, 조성물, 생성물 등", "...를 위한 의약, 약제학적 조성물, 수의학적 조성물, 진단적 조성물 등의 제조에서의 화합물, 조성물, 생성물 등의 용도", 또는 "의약으로서 사용하기 위한 화합물, 조성물, 생성물 등..."은 이러한 화합물, 조성물, 생성물 등이 인간 또는 동물 신체에서 실시될 수 있는 치료적 방법에 사용될 것임을 나타낸다. 그들은 치료 방법 등에 관한 구현예 및 청구범위의 동등한 개시로서 간주된다. 따라서, 구현예 또는 청구범위가 "질환을 앓는 것으로 의심되는 인간 또는 동물을 치료하는 데 사용하기 위한 화합물"을 지칭한다면, 이는 또한 "질환을 앓는 것으로 의심되는 인간 또는 동물을 치료하기 위한 의약의 제조에서의 화합물의 용도" 또는 "질환을 앓는 것으로 의심되는 인간 또는 동물로의 화합물의 투여에 의한 치료 방법"의 개시인 것으로 간주된다. 용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 표기된 치료, 조절 등의 목적에 적합한 화합물, 조성물, 생성물 등 그 자체를 지칭함을 이해할 것이다.

기간, 값, 수 등의 하기의 예가 괄호 안에 제공된다면, 이는 괄호 안에 언급된 예가 구현예를 구성할 수 있다는 표시로서 이해해야 한다. 예를 들어, "구현예에서, 핵산 분자가 표 1의 아넬로바이러스 ORF1-인코딩 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다"고 언급된다면, 일부 구현예는 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 핵산 분자에 관한 것이다.

본 명세서에 사용되는 바와 같이, 용어 "증폭"은 핵산 분자 또는 이의 일부(예를 들어, 유전 요소 또는 유전 요소 영역)의 하나 이상의 추가의 카피를 생성하기 위한 핵산 분자 또는 이의 일부의 복제를 지칭한다. 일부 구현예에서, 증폭은 핵산 서열의 부분 복제를 초래한다. 일부 구현예에서, 증폭은 회전환 복제(rolling circle replication)를 통해 발생한다.

본 명세서에 사용되는 바와 같이, 용어 "아넬로벡터"는 단백질성 외부 내에 봉입된 유전 요소, 예를 들어, 환형 DNA를 포함하는 비히클을 지칭하며, 예를 들어 유전 요소는 단백질성 외부에 의해 DNAse I을 이용한 분해로부터 실질적으로 보호된다. 본 명세서에 사용되는 바와 같이, "합성 아넬로벡터"는 일반적으로, 천연 발생이 아닌, 예를 들어, 야생형 바이러스(예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스)에 비하여 상이한 서열을 갖는 아넬로벡터를 지칭한다. 일부 구현예에서, 합성 아넬로벡터는 엔지니어링되거나 또는 재조합이며, 예를 들어, 야생형 바이러스 게놈(예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스 게놈)에 비하여 차이 또는 변형을 포함하는 유전 요소를 포함한다. 일부 구현예에서, 단백질성 외부 내의 봉입은 단백질성 외부에 의한 100% 커버리지, 및 100% 미만, 예를 들어, 95%, 90%, 85%, 80%, 70%, 60%, 50% 또는 그 미만의 커버리지를 포함한다. 유전 요소가 예를 들어, 숙주 세포로의 유입 이전에 단백질성 외부에 보유되거나 DNAse I을 이용한 분해로부터 보호되는 한, 예를 들어, (예를 들어, 단백질성 외부를 물, 이온, 펩티드 또는 소분자에 대해 투과 가능하게 만드는) 갭 또는 불연속부가 단백질성 외부에 존재할 수 있다. 일부 구현예에서, 아넬로벡터는 정제되며, 예를 들어, 아넬로벡터는 이의 원래의 공급원으로부터 분리되고/분리되거나 다른 성분이 실질적으로 없다(50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과). 일부 구현예에서, 아넬로벡터는 유전 요소를 (예를 들어, 감염을 통해) 표적 세포로 도입할 수 있다. 일부 구현예에서, 아넬로벡터는 감염성 합성 아넬로바이러스 바이러스 입자이다.

본 명세서에 사용되는 바와 같이, 용어 "아넬로바이러스 서열"은 천연 발생 아넬로바이러스 또는 이의 단편의 서열을 지칭한다. 이 용어는 출원일 현재 확인된 아넬로바이러스 서열뿐만 아니라, 아직 확인되거나 서열화되지 않은 다른 아넬로바이러스 서열을 포함한다. 일부 예에서, 핵산 서열과 관련하여 본 명세서에서 사용되는 바와 같은 용어 "아넬로바이러스 서열"은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 2000, 2500, 3000, 3500 또는 4000개의 뉴클레오티드의 핵산 서열을 포함하는 핵산 분자를 지칭하며, 여기서 핵산 서열은, 예를 들어 본 명세서에 기재된 바와 같은, 알려진 아넬로바이러스 게놈에 포함된 동일한 길이의 인접 서열과 적어도 약 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 아넬로바이러스 서열은, 일부 예에서, 완전한 바이러스(예를 들어, 아넬로바이러스) 게놈 서열을 포함할 수 있다. 다른 예에서, 아넬로바이러스 서열은 부분적인 바이러스(예를 들어, 아넬로바이러스) 게놈 서열을 포함할 수 있다. 일부 예에서, 아넬로바이러스 서열은 천연 발생(예를 들어, 야생형) 아넬로바이러스(예를 들어, 본 명세서에 제공된 표 중 임의의 것에 주석이 달리거나, 이에 열거된 서열에 의해 인코딩되는 바와 같은 서열을 갖는 아넬로바이러스)의 TATA 박스, cap 부위, 개시인자 요소, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1-인코딩 서열, ORF1/1-인코딩 서열, ORF1/2-인코딩 서열, ORF2-인코딩 서열, ORF2/2-인코딩 서열, ORF2/3-인코딩 서열, ORF2t/3-인코딩 서열, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, GC-풍부 영역, 또는 이들의 임의의 조합 중 하나 이상의 핵산 서열을 포함한다. 일부 예에서, 아넬로바이러스 서열은, 예를 들어, 본 명세서에 기재된 바와 같은, 알려진 아넬로바이러스 게놈과 적어도 하나의 차이(예를 들어, 이에 대한 점 돌연변이, 치환, 결실, 삽입, 또는 변형)를 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "항체 분자"는 단백질, 예를 들어, 적어도 하나의 면역글로불린 가변 도메인 서열을 포함하는 면역글로불린 쇄 또는 이의 단편을 지칭한다. 용어 "항체 분자"는 전장 항체 및 항체 단편(예를 들어, scFv)을 포함한다. 일부 구현예에서, 항체 분자는 다중특이적 항체 분자이며, 예를 들어, 항체 분자는 복수의 면역글로불린 가변 도메인 서열을 포함하며, 복수의 것들 중 제1 면역글로불린 가변 도메인 서열은 제1 에피토프에 대한 결합 특이성을 가지며, 복수의 것들 중 제2 면역글로불린 가변 도메인 서열은 제2 에피토프에 대한 결합 특이성을 갖는다. 구현예에서, 다중특이적 항체 분자는 이중특이적 항체 분자이다. 이중특이적 항체 분자는 일반적으로 제1 에피토프에 대한 결합 특이성을 갖는 제1 면역글로불린 가변 도메인 서열 및 제2 에피토프에 대한 결합 특이성을 갖는 제2 면역글로불린 가변 도메인 서열에 의해 특성화된다.

본 명세서에 사용되는 바와 같이, 제2 뉴클레오티드 서열과 관련하여 제1 뉴클레오티드 서열을 기재하는 데 사용될 때 용어 "상보성"은 특정 조건 하에서 염기쌍 매칭을 통해 혼성화하고 듀플렉스 구조를 형성하는 제1 및 제2 뉴클레오티드 서열의 능력을 지칭한다. 이러한 조건은, 예를 들어, 1× phi29 DNA 중합효소 완충액(NEB)과 같은 엄격한 혼성화 조건일 수 있다. 유기체 내부에서 발생할 수 있는 생리학적으로 관련된 조건과 같은 다른 조건이 적용될 수 있다. 당업자는 혼성화된 뉴클레오티드의 궁극적인 적용에 따라 2개 서열의 상보성 테스트에 가장 적절한 일련의 조건을 결정할 수 있을 것이다. 상보성인 2개의 서열은 완벽하게 상보성(100% 일치하는 염기쌍)일 수 있거나 하나 이상의 미스매치(예를 들어, 1, 2, 3, 4, 5개 미스매치, 또는 최대 약 1%, 2%, 또는 5% 미스매치)를 함유할 수 있다.

본 명세서에 사용되는 바와 같이, "인코딩"하는 핵산은 아미노산 서열 또는 폴리뉴클레오티드, 예를 들어 mRNA 또는 기능적 폴리뉴클레오티드(예를 들어, 비-코딩 RNA, 예를 들어, siRNA 또는 miRNA)를 인코딩하는 핵산 서열을 지칭한다.

본 명세서에 사용되는 바와 같은 "외인성" 작용제(예를 들어, 이펙터, 핵산(예를 들어, RNA), 유전자, 페이로드, 단백질)는 상응하는 야생형 바이러스, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스에 의해 포함되지 않거나, 그에 의해 인코딩되지 않는 작용제를 지칭한다. 일부 구현예에서, 외인성 작용제, 예컨대, 천연 발생 단백질 또는 핵산에 비하여 (예를 들어, 삽입, 결실 또는 치환에 의해) 변경된 서열을 갖는 단백질 또는 핵산은 자연적으로 존재하지 않는다. 일부 구현예에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지 않는다. 일부 구현예에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지만, 바이러스에 대하여 외인성이다. 일부 구현예에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지만, 요망되는 수준으로 또는 요망되는 시간에 존재하지 않는다.

또 다른 작용제 또는 요소(예를 들어, 이펙터, 핵산 서열, 아미노산 서열)에 관하여 본 명세서에 사용되는 바와 같은, "이종" 작용제 또는 요소(예를 들어, 이펙터, 핵산 서열, 아미노산 서열)는 천연적으로, 예를 들어, 야생형 바이러스, 예를 들어, 아넬로바이러스에서 함께 관찰되지 않는 작용제 또는 요소를 지칭한다. 일부 구현예에서, 이종 핵산 서열은 천연 발생 핵산 서열(예를 들어, 아넬로바이러스에서 천연적으로 발생하는 서열)과 동일한 핵산에 존재할 수 있다. 일부 구현예에서, 이종 작용제 또는 요소는 아넬로벡터의 다른(예를 들어, 나머지) 요소가 기반으로 하는 아넬로바이러스에 비하여 외인성이다.

본 명세서에 사용되는 바와 같이, 용어 "유전 요소"는, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터를 형성하기 위해, 단백질성 외부이거나 단백질성 외부 내에 둘러싸일 수 있는(예를 들어, 단백질성 외부에 의해 DNAse I로부터 보호될 수 있는) 핵산 분자를 지칭한다. 유전 요소가 네이키드 DNA로서 생성되고, 선택적으로 추가로 단백질성 외부 내로 조립될 수 있는 것이 이해된다. 또한, 아넬로벡터는 이의 유전 요소를 세포 내로 삽입하여, 유전 요소가 세포 내에 존재하게 하고, 단백질성 외부가 반드시 세포에 유입되는 것은 아니라는 점이 이해된다.

본 명세서에 사용되는 바와 같이, "유전 요소 작제물"은 적어도 하나(예를 들어, 2개)의 유전 요소 서열(들) 또는 이의 단편을 포함하는 핵산 작제물(예를 들어, 플라스미드, 박미드, 코스미드, 또는 미니서클)을 지칭한다. 일부 구현예에서, 유전 요소 작제물은 적어도 하나의 전장 유전 요소 서열을 포함한다. 일부 구현예에서, 유전 요소는 전장 유전 요소 서열 및 부분 유전 요소 서열을 포함한다. 일부 구현예에서, 유전 요소는 2개 이상의 부분 유전 요소 서열(예를 들어, 5'에서 3' 순서로, 예를 들어, 도 27c에 나타낸 바와 같이. 3'-절단된 유전 요소 서열과 나란히 배열된 5'-절단된 유전 요소 서열)을 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "유전 요소 영역"은 유전 요소의 서열을 포함하는 작제물의 영역을 지칭한다. 일부 구현예에서, 유전 요소 영역은 야생형 아넬로바이러스 서열 또는 이의 단편에 대해 충분한 동일성을 갖는 서열(예를 들어, 야생형 아넬로바이러스 서열 또는 이의 단편에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열)을 포함하여 단백질성 외부로 둘러싸임으로써 아넬로벡터를 형성한다. 구현예에서, 유전 요소 영역은, 예를 들어, 본 명세서에 기재된 바와 같은 단백질 결합 서열(예를 들어, 본 명세서에 기재된 바와 같은 5' UTR, 3' UTR 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열)을 포함한다. 일부 구현예에서, 유전 요소 영역은 회전환 복제를 겪을 수 있다. 일부 구현예에서, 유전 요소는 Rep 단백질 결합 부위를 포함한다. 일부 구현예에서, 유전 요소는 Rep 단백질 변위 부위를 포함한다. 일부 구현예에서, 유전적 요소 영역을 포함하는 작제물은 단백질성 외부로 둘러싸이지 않지만, 작제물로부터 생성된 유전 요소는 단백질성 외부로 둘러싸일 수 있다. 일부 구현예에서, 유전 요소 영역을 포함하는 작제물은 벡터 백본을 추가로 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "돌연변이체"는 게놈(예를 들어, 아넬로바이러스 게놈) 또는 이의 단편과 관련하여 사용될 때 상응하는 야생형 아넬로바이러스 서열에 대해 적어도 하나의 변화를 갖는 서열을 지칭한다. 일부 구현예에서, 돌연변이체 게놈 또는 이의 단편은 상응하는 야생형 아넬로바이러스 서열에 대해 적어도 하나의 단일 뉴클레오티드 다형성, 추가, 결실, 또는 프레임시프트를 포함한다. 일부 구현예에서, 돌연변이체 게놈 또는 이의 단편은 상응하는 야생형 아넬로바이러스 서열에 대해 적어도 하나의 아넬로바이러스 ORF(예를 들어, ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 및/또는 ORF1/2 중 하나 이상)의 결실을 포함한다. 일부 구현예에서, 돌연변이체 게놈 또는 이의 단편은 상응하는 야생형 아넬로바이러스 서열에 대해 모든 아넬로바이러스 ORF(예를 들어, ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 및 ORF1/2 전부)의 결실을 포함한다. 일부 구현예에서, 돌연변이체 게놈 또는 이의 단편은 상응하는 야생형 아넬로바이러스 서열에 대해 적어도 하나의 아넬로바이러스 비코딩 영역(예를 들어, 5' UTR, 3' UTR, 및/또는 GC-풍부 영역 중 하나 이상)의 결실을 포함한다. 일부 구현예에서, 돌연변이체 게놈 또는 이의 단편은 외인성 이펙터를 포함하거나 인코딩한다.

"ORF 분자"는 아넬로바이러스 ORF 단백질(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 및/또는 ORF1/2 단백질), 또는 이의 기능적 단편의 활성 및/또는 구조적 특징을 갖는 폴리펩티드를 지칭한다. 총칭적으로 사용되는 경우(즉, "ORF 분자"), 폴리펩티드는 본 명세서에 기재된 임의의 아넬로바이러스 ORF(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 및/또는 ORF1/2), 또는 이의 기능적 단편의 활성 및/또는 구조적 특징을 포함할 수 있다. 특정 오픈-리딩 프레임을 표시하는 데 수식어와 함께 사용되는 경우(예를 들어, "ORF1 분자", "ORF2 분자", "ORF2/2 분자", "ORF2/3 분자", "ORF1/1 분자", 또는 "ORF1/2 분자"), 이는 일반적으로 폴리펩티드가 상응하는 아넬로바이러스 ORF 단백질 또는 이의 기능적 단편(예를 들어, "ORF1 분자"에 대해 하기 정의된 바와 같음)의 활성 및/또는 구조적 특징을 포함함을 의미한다. 예를 들어, "ORF2 분자"는 아넬로바이러스 ORF2 단백질 또는 이의 기능적 단편의 활성 및/또는 구조적 특징을 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "ORF1 분자"는 아넬로바이러스 ORF1 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질)의 활성 및/또는 구조적 특징을 갖는 폴리펩티드 또는 이의 기능적 단편을 지칭한다. ORF1 분자는 일부 예에서, 하기 중 하나 이상(예를 들어, 이 중 1, 2, 3 또는 4개)을 포함할 수 있다: 적어도 60%의 염기성 잔기(예를 들어, 적어도 60%의 아르기닌 잔기)를 포함하는 제1 영역, 적어도 약 6개의 베타 가닥(예를 들어, 적어도 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 베타 가닥)을 포함하는 제2 영역, 아넬로바이러스 N22 도메인(예를 들어, 본 명세서에 기재된 바와 같음, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 N22 도메인)의 구조 또는 활성을 포함하는 제3 영역, 및/또는 아넬로바이러스 C-말단 도메인(CTD)(예를 들어, 본 명세서에 기재된 바와 같음, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 CTD)의 구조 또는 활성을 포함하는 제4 영역. 일부 예에서, ORF1 분자는 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함한다. 일부 예에서, 아넬로벡터는 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함하는 ORF1 분자를 포함한다. ORF1 분자는 일부 예에서, 아넬로바이러스 ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함할 수 있다. ORF1 분자는 일부 예에서, 이종 서열, 예를 들어, 초가변 영역(HVR), 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 HVR을 추가로 포함할 수 있다. 본 명세서에 사용되는 바와 같이, "아넬로바이러스 ORF1 단백질"은 아넬로바이러스 게놈(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 게놈)에 의해 인코딩된 ORF1 단백질을 지칭한다.

본 명세서에 사용되는 바와 같이, 용어 "ORF2 분자"는 아넬로바이러스 ORF2 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF2 단백질)의 활성 및/또는 구조적 특징을 갖는 폴리펩티드 또는 이의 기능적 단편을 지칭한다. 본 명세서에 사용되는 바와 같이, "아넬로바이러스 ORF2 단백질"은 아넬로바이러스 게놈(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 게놈)에 의해 인코딩된 ORF2 단백질을 지칭한다.

본 명세서에서 사용되는 바와 같이, 용어 "프라이머"는 주형 핵산에 결합할 수 있고 적절한 효소 및 완충 조건의 존재 하에 상보성 가닥의 중합을 가능하게 하는 핵산 서열을 지칭한다. 일부 구현예에서, 프라이머는 DNA를 포함한다. 일부 구현예에서, 프라이머는 8 내지 15개 뉴클레오티드, 예를 들어 9 내지 13개 뉴클레오티드, 예를 들어 4개 초과 30, 25, 20, 15 또는 10개 미만 뉴클레오티드의 길이를 갖는다.

본 명세서에 사용되는 바와 같이, 용어 "단백질성 외부"는 주로(예를 들어, 50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과) 단백질인 외부 구성성분을 지칭한다.

본 명세서에 사용되는 바와 같이, 용어 "조절 핵산"은 발현 생성물을 인코딩하는 DNA 서열의 발현, 예를 들어, 전사 및/또는 번역을 변경시키는 핵산 서열을 지칭한다. 구현예에서, 발현 생성물은 RNA 또는 단백질을 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "조절 서열"은 표적 유전자 생성물의 전사를 변경시키는 핵산 서열을 지칭한다. 일부 구현예에서, 조절 서열은 프로모터 또는 인핸서이다.

본 명세서에 사용되는 바와 같이, 용어 "Rep" 또는 "복제 단백질"은 바이러스 게놈 복제를 촉진하는 단백질, 예를 들어, 바이러스 단백질을 지칭한다. 일부 구현예에서, 복제 단백질은 아넬로바이러스 Rep 단백질이다.

본 명세서에 사용되는 바와 같이, 용어 "Rep 결합 부위"는 Rep 단백질(예를 들어, 아넬로바이러스 Rep 단백질)에 의해 인식되고 결합되는 핵산 분자 내의 핵산 서열을 지칭한다. 일부 구현예에서, Rep 결합 부위는 5' UTR(예를 들어, 헤어핀 루프를 포함함)을 포함한다. 일부 구현예에서, Rep 결합 부위는 복제 원점(ORI)을 포함한다.

본 명세서에 사용되는 바와 같이, 용어 "Rep 변위 부위"는 핵산 분자와 회합된(예를 들어, 이에 결합된) Rep 단백질(예를 들어, 아넬로바이러스 Rep 단백질)을 야기하여 Rep 변위 부위에 도달하면 핵산 분자를 방출할 수 있는 핵산 분자 내의 핵산 서열을 지칭한다. 일부 구현예에서, Rep 변위 부위는 5' UTR(예를 들어, 헤어핀 루프를 포함함)을 포함한다. 일부 구현예에서, Rep 변위 부위는 복제 원점(ORI)을 포함한다.

본 명세서에 사용되는 바와 같이, "실질적으로 비-병원성인" 유기체, 입자 또는 성분은 예를 들어, 숙주 유기체, 예를 들어, 포유동물, 예를 들어, 인간에서 허용 불가능한 질환 또는 병원성 병태를 야기하거나 유도하지 않는 유기체, 입자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로벡터) 또는 이의 성분을 지칭한다. 일부 구현예에서, 대상체로의 아넬로벡터의 투여는 치료 기준의 일부로서 허용 가능한 부차 반응 또는 부작용을 초래할 수 있다.

본 명세서에 사용되는 바와 같이, 용어 "비-병원성"은 숙주 유기체, 예를 들어, 포유동물, 예를 들어, 인간에서 허용 불가능한 질환 또는 병원성 병태를 야기하거나 유도하지 않는 유기체 또는 이의 성분을 지칭한다.

본 명세서에 사용되는 바와 같이, "실질적으로 비-통합성인" 유전 요소는 숙주 세포(예를 들어, 진핵 세포) 또는 유기체(예를 들어, 포유동물, 예를 들어, 인간) 내로 유입되는 유전 요소 중 약 0.01%, 0.05%, 0.1%, 0.5% 또는 1% 미만이 게놈 내로 통합되는 유전 요소, 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로벡터 내의 유전 요소를 지칭한다. 일부 구현예에서, 유전 요소는 예를 들어, 숙주 세포의 게놈 내로 검출 가능하게 통합되지 않는다. 일부 구현예에서, 게놈 내로의 유전 요소의 통합은 본 명세서에 기재된 바와 같은 기법, 예를 들어, 핵산 서열결정, PCR 검출 및/또는 핵산 혼성화를 사용하여 검출될 수 있다. 일부 구현예에서, 통합 빈도는, 예를 들어, 문헌[Wang et al., 2004, Gene Therapy 11: 711-721](본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 자유 벡터에서 분리된 게놈 DNA의 정량적 겔 정제 분석에 의해 결정된다.

본 명세서에 사용되는 바와 같이, "실질적으로 비-면역원성인" 유기체, 입자 또는 성분은 예를 들어, 숙주 조직 또는 유기체(예를 들어, 포유동물, 예를 들어, 인간)에서 요망되지 않는 또는 비표적화된 면역 반응을 야기하거나 유도하지 않는 유기체, 입자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로벡터) 또는 이의 성분을 지칭한다. 구현예에서, 실질적으로 비-면역원성인 유기체, 입자 또는 성분은 임상적으로 유의한 면역 반응을 생성하지 않는다. 구현예에서, 실질적으로 비-면역원성인 아넬로벡터는 아넬로바이러스 또는 아넬로벡터 유전 요소의 아미노산 서열을 포함하거나, 핵산 서열에 의해 인코딩되는 단백질에 대하여 임상적으로 유의한 면역 반응을 생성하지 않는다. 구현예에서, 면역 반응(예를 들어, 요망되지 않는 또는 비표적화된 면역 반응)은 예를 들어, 문헌[Tsuda et al., 1999; J. Virol. Methods 77: 199-206](본 명세서에 참조로 포함됨)에 기재된 항-TTV 항체 검출 방법 및/또는 문헌[Kakkola et al., 2008; Virology 382: 182-189](본 명세서에 참조로 포함됨)에 기재된 항-TTV IgG 수준의 결정 방법에 따라 대상체에서 항체(예를 들어, 중화 항체) 존재 또는 수준(예를 들어, 항-아넬로벡터 항체의 존재 또는 수준, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터에 대한 항체의 존재 또는 수준)을 검정함으로써 검출된다. 아넬로바이러스 또는 그에 기초한 아넬로벡터에 대한 항체(예를 들어, 중화 항체)는 또한 항-바이러스 항체를 검출하기 위한 당업계의 방법, 예를 들어, 문헌[Calcedo et al., 2013; Front. Immunol. 4(341): 1-7](본 명세서에 참조로 포함됨)에 기재된 바와 같은 예를 들어, 항-AAV 항체의 검출 방법에 의해 검출될 수 있다.

본 명세서에 사용되는 바와 같은 "하위서열"은 각각 더 큰 핵산 서열 또는 아미노산 서열에 포함되는 핵산 서열 또는 아미노산 서열을 지칭한다. 일부 예에서, 하위서열은 더 큰 서열의 도메인 또는 기능적 단편을 포함할 수 있다. 일부 예에서, 하위서열은 더 큰 서열로부터 단리되는 경우, 더 큰 서열의 나머지와 함께 존재할 때 하위서열에 의해 형성되는 2차 및/또는 3차 구조와 유사한 2차 및/또는 3차 구조를 형성할 수 있는 더 큰 서열의 단편을 포함할 수 있다. 일부 예에서, 하위서열은 또 다른 서열(예를 들어, 외인성 서열 또는 더 큰 서열의 나머지에 대하여 이종인 서열을 포함하는 하위서열, 예를 들어, 상이한 아넬로바이러스 유래의 상응하는 하위서열)에 의해 대체될 수 있다.

본 명세서에 사용되는 바와 같은, "치료", "치료하는" 및 이의 동족어는 질환, 병리학적 병태, 또는 장애를 개선하거나, 호전시키거나, 안정화시키거나, 예방하거나 치유하기 위한 의도를 갖는 대상체의 의학적 관리를 지칭한다. 이 용어는 적극 치료(질환, 병리학적 병태, 또는 장애를 개선하고자 하는 치료), 원인 치료(연관 질환, 병리학적 병태, 또는 장애의 원인을 대상으로 하는 치료), 완화 치료(증상의 경감을 위해 설계된 치료), 예방적 치료(연관 질환, 병리학적 병태, 또는 장애의 예방, 최소화, 또는 이의 발생을 부분적으로 또는 완전히 억제하고자 하는 치료); 및 지지 치료(또 다른 치료법을 보충하기 위해 이용되는 치료)를 포함한다.

본 발명은 일반적으로 아넬로벡터의 투여 방법, 및 이의 용도에 관한 것이다. 본 개시내용은 아넬로벡터, 아넬로벡터를 포함하는 조성물, 및 아넬로벡터의 제조 또는 이용 방법을 제공한다. 아넬로벡터는 일반적으로 예를 들어, 치료제를 진핵 세포로 운반하기 위한 운반 비히클로서 유용하다. 일반적으로, 아넬로벡터는 단백질성 외부 내에 봉입된 (예를 들어, 이펙터, 예를 들어, 외인성 이펙터 또는 내인성 이펙터를 인코딩하는) 핵산 서열을 포함하는 유전 요소를 포함할 것이다. 아넬로벡터는 (예를 들어, 본 명세서에 기재된 바와 같은) 아넬로바이러스 서열에 비한 서열(예를 들어, 본 명세서에 기재된 바와 같은 영역 또는 도메인)의 하나 이상의 결실을 포함할 수 있다. 아넬로벡터는 예를 들어, 세포를 포함하는 대상체에서 질환 또는 장애를 치료하기 위하여, 유전 요소 또는 그 내에 인코딩된 이펙터(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 폴리펩티드 또는 핵산 이펙터)를 진핵 세포 내로 운반하기 위한 실질적으로 비-면역원성인 비히클로서 사용될 수 있다. 본 발명은 또한 일반적으로 아넬로바이러스 서열을 포함하는 핵산 분자를 증폭시키는 방법, 이러한 증폭된 핵산 분자를 서열결정하는 방법, 이러한 증폭된 핵산 분자에 대해 얻은 서열 데이터를 분석하는 방법, 및 이러한 방법에 사용하기 위한 조성물에 관한 것이다. 본 명세서에 기재된 방법을 사용하여 결정된 아넬로바이러스 서열은 일부 예에서 아넬로벡터, 예를 들어 합성 아넬로벡터를 생성하는데 사용될 수 있고, 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로벡터의 유전 요소에 포함될 수 있다.

I. 아넬로벡터를 제조하기 위한 조성물 및 방법

A. 아넬로벡터의 구성성분 및 조립

i. 아넬로벡터의 조립을 위한 ORF1 분자

ii. 아넬로벡터의 조립을 위한 ORF2 분자

B. 유전 요소 작제물

i. 플라스미드

ii. 환형 핵산 작제물

iii. 시험관 내 환화

iv. 시스/트랜스 작제물

v. 발현 카세트

vi. 유전 요소 작제물의 설계 및 생성

C. 이펙터

D. 숙주 세포

i. 숙주 세포 내로의 유전 요소의 도입

ii. 시스 또는 트랜스로 아넬로바이러스 단백질(들)을 제공하는 방법

iii. 헬퍼

iv. 예시적인 세포 유형

E. 배양 조건

F. 수확

I. 아넬로벡터를 제조하기 위한 조성물 및 방법

A. 아넬로벡터의 구성성분 및 조립

i. 아넬로벡터의 조립을 위한 ORF1 분자

ii. 아넬로벡터의 조립을 위한 ORF2 분자

B. 유전 요소 작제물

i. 플라스미드

ii. 환형 핵산 작제물

iii. 시험관 내 환화

iv. 시스/트랜스 작제물

v. 발현 카세트

vi. 유전 요소 작제물의 설계 및 생성

C. 이펙터

D. 숙주 세포

i. 숙주 세포 내로의 유전 요소의 도입

iii. 헬퍼

iv. 예시적인 세포 유형

E. 배양 조건

F. 수확

G. 농축 및 정제

II. 아넬로벡터

A. 아넬로바이러스

B. ORF1 분자

C. ORF2 분자

D. 유전 요소

E. 단백질 결합 서열

F. 5' UTR 영역

G. GC-풍부 영역

H. 이펙터

I. 조절 서열

J. 복제 단백질

K. 기타 서열

L. 단백질성 외부

III. 핵산 작제물

IV. 조성물

V. 숙주 세포

VI. 사용 방법

VII. 투여/운반

VIII. 아넬로바이러스 서열을 증폭시키는 방법

A. DNA 증폭

a. 회전환 증폭

b. 프라이머

c. 샘플 및 표적 서열

B. 서열결정

C. 컴퓨터를 사용한 분석

I. 아넬로벡터를 제조하기 위한 조성물 및 방법

본 개시내용은, 일부 양태에서, 이펙터를 운반하기 위한 아넬로벡터 및 이의 방법을 제공한다. 일부 구현예에서, 아넬로벡터 또는 이의 구성성분은 하기 기재된 바와 같이 제조될 수 있다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은 유전 요소 또는 유전 요소 작제물을 생성하는 데 사용될 수 있다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은 하나 이상의 아넬로바이러스 ORF 분자(예를 들어, ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2 분자, 또는 이의 기능적 단편 또는 스플라이스 변이체)를 생성하는 데 사용될 수 있다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법은, 예를 들어 숙주 세포에서 단백질성 외부 또는 이의 구성성분(예를 들어, ORF1 분자)을 생성하는 데 사용될 수 있다. 일부 구현예에서, 아넬로벡터 또는 이의 구성성분은, 예를 들어 미국 가출원 63/038,483에 기재된 바와 같이 탠덤 작제물을 사용하여 제조될 수 있으며, 이는 본 명세서에 전문이 참조로 포함된다. 일부 구현예에서, 아넬로벡터 또는 이의 구성성분은, 예를 들어 미국 가출원 63/038,603에 기재된 바와 같이, 박미드/곤충 세포 시스템을 사용하여 제조될 수 있으며, 이는 본 명세서에 전문이 참조로 포함된다.

이론에 결부시키고자 하지 않고, 회전환 증폭은 유전 요소 영역에 대해 5'에(또는 유전 요소 영역의 5' 영역 내에) 위치한 Rep 결합 부위(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 5' UTR을 포함함, 예를 들어, 헤어핀 루프 및/또는 복제 원점을 포함함)에 대한 Rep 단백질 결합을 통해 발생할 수 있다. 그 다음 Rep 단백질은 유전 요소 영역을 통해 진행되어, 유전 요소의 합성을 초래할 수 있다. 그 다음 유전 요소는 환화된 다음, 단백질성 외부 내에 봉입되어 아넬로벡터를 형성할 수 있다.

아넬로벡터의 구성성분 및 조립

본 명세서의 조성물 및 방법은 아넬로벡터를 생성하는 데 사용될 수 있다. 본 명세서에 기재된 바와 같이, 아넬로벡터는 일반적으로 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 폴리펩티드를 포함함) 내에 봉입된 유전 요소(예를 들어, 본 명세서에 기재된 바와 같은 5' UTR 영역을 포함하는, 예를 들어, 단일-가닥 환형 DNA 분자)를 포함한다. ORF1 핵산, 예를 들어 본 명세서에 기재된 바와 같음). 일부 구현예에서, 유전 요소는 아넬로바이러스 ORF(예를 들어, ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2 중 하나 이상)를 인코딩하는 하나 이상의 서열을 포함한다. 본 명세서에 사용된 바와 같이, 아넬로바이러스 ORF 또는 ORF 분자(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2)는, 예를 들어 PCT/US2018/037379 또는 PCT/US19/65995(이들 각각은 본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 상응하는 아넬로바이러스 ORF 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 구현예에서, 유전 요소는 아넬로바이러스 ORF1, 또는 이의 스플라이스 변이체 또는 기능적 단편(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 젤리-롤 영역)을 인코딩하는 서열을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 핵산(예를 들어, 아넬로바이러스 ORF1 분자 또는 이의 스플라이스 변이체 또는 기능적 단편)에 의해 인코딩되는 폴리펩티드를 포함한다.

일부 구현예에서, 아넬로벡터는 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같음) 내에 유전 요소(예를 들어, 본 명세서에 기재된 바와 같음)를 봉입함으로써 조립된다. 일부 구현예에서, 유전 요소는 숙주 세포(예를 들어, 본 명세서에 기재된 바와 같음)에서 단백질성 외부 내에 봉입된다. 일부 구현예에서, 숙주 세포는 단백질성 외부에 포함된 하나 이상의 폴리펩티드(예를 들어, 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 폴리펩티드, 예를 들어 ORF1 분자)를 발현한다. 예를 들어, 일부 구현예에서, 숙주 세포는 아넬로바이러스 ORF1 분자, 예를 들어, 아넬로바이러스 ORF1 폴리펩티드의 스플라이스 변이체 또는 기능적 단편(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 ORF1 단백질 또는 야생형 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 폴리펩티드)을 인코딩하는 핵산 서열을 포함한다. 구현예에서, 아넬로바이러스 ORF1 분자를 인코딩하는 핵산 서열은 숙주 세포에 포함된 핵산 작제물(예를 들어, 플라스미드, 바이러스 벡터, 바이러스, 미니서클, 박미드, 또는 인공 염색체)에 포함된다. 구현예에서, 아넬로바이러스 ORF1 분자를 인코딩하는 핵산 서열은 숙주 세포의 게놈에 통합된다.

일부 구현예에서, 숙주 세포는 유전 요소 및/또는 유전 요소의 서열을 포함하는 핵산 작제물을 포함한다. 일부 구현예에서, 핵산 작제물은 플라스미드, 바이러스 핵산, 미니서클, 박미드, 또는 인공 염색체로부터 선택된다. 일부 구현예에서, 유전 요소는 핵산 작제물로부터 절단되고, 선택적으로, 이중-가닥 형태에서 단일-가닥 형태로 (예를 들어, 변성에 의해) 전환된다. 일부 구현예에서, 유전 요소는 핵산 작제물의 주형 서열에 기반한 중합효소에 의해 생성된다. 일부 구현예에서, 중합효소는 유전 요소 서열의 단일-가닥 카피를 생성하며, 이는 본 명세서에 기재된 바와 같은 유전 요소를 형성하기 위해 선택적으로 환화될 수 있다. 다른 구현예에서, 핵산 작제물은 시험관 내에서 유전 요소의 핵산 서열의 환화에 의해 생성된 이중-가닥 미니서클이다. 구현예에서, 시험관 내-환화(IVC) 미니서클은 숙주 세포 내로 도입되고, 여기서 본 명세서에 기재된 바와 같이 단백질성 외부에 봉입하기에 적합한 단일-가닥 유전 요소로 전환된다.

예를 들어, 아넬로벡터의 조립을 위한 ORF1 분자

아넬로벡터는, 예를 들어, 단백질성 외부 내에 유전 요소를 봉입함으로써 제조될 수 있다. 아넬로벡터의 단백질성 외부는 일반적으로 아넬로바이러스 ORF1 핵산(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 분자 또는 이의 스플라이스 변이체 또는 기능적 단편)에 의해 인코딩되는 폴리펩티드를 포함한다. ORF1 분자는 일부 구현예에서 하기 중 하나 이상을 포함할 수 있다: 아르기닌-풍부 영역, 예를 들어, 적어도 60%의 염기성 잔기(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100%의 염기성 잔기; 예를 들어, 60% 내지 90%, 60% 내지 80%, 70% 내지 90% 또는 70 내지 80%의 염기성 잔기)를 갖는 영역을 포함하는 제1 영역, 및 젤리-롤 도메인, 예를 들어, 적어도 6개의 베타 가닥(예를 들어, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 베타 가닥)을 포함하는 제2 영역. 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 아르기닌-풍부 영역, 젤리-롤 영역, N22 도메인, 초가변 영역, 및/또는 C-말단 도메인 중 하나 이상(예를 들어, 1, 2, 3, 4개, 또는 5개 전부)을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 젤리-롤 영역(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 아르기닌-풍부 영역(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 N22 도메인(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 초가변 영역(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다. 일부 구현예에서, 단백질성 외부는 아넬로바이러스 ORF1 C-말단 도메인(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다.

일부 구현예에서, 아넬로벡터는 ORF1 분자 및/또는 ORF1 분자를 인코딩하는 핵산을 포함한다. 일반적으로, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질)의 구조적 특징 및/또는 활성을 갖는 폴리펩티드 또는 이의 기능적 단편을 포함한다. 일부 구현예에서, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질)에 비해 절단을 포함한다. 일부 구현예에서, ORF1 분자는 아넬로바이러스 ORF1 단백질의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 또는 700개 아미노산만큼 절단된다. 일부 구현예에서, ORF1 분자는, 예를 들어 본 명세서에 기재된 바와 같은, 알파토르크바이러스, 베타토르크바이러스, 또는 감마토르크바이러스 ORF1 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. ORF1 분자는 일반적으로 핵산 분자, 예컨대, DNA(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 유전 요소)에 결합할 수 있다. 일부 구현예에서, ORF1 분자는 세포의 핵에 국소화된다. 특정 구현예에서, ORF1 분자는 세포의 핵소체에 국소화된다.

이론에 결부시키고자 하지 않고, ORF1 분자는 다른 ORF1 분자에 결합하여, 예를 들어, (예를 들어, 본 명세서에 기재된 바와 같은) 단백질성 외부를 형성할 수 있다. 이러한 ORF1 분자는 캡시드를 형성하는 능력을 갖는 것으로서 설명될 수 있다. 일부 구현예에서, 단백질성 외부는 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 조성물 또는 작제물을 사용하여 제조된, 예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 봉입할 수 있다. 일부 구현예에서, 복수의 ORF1 분자는, 예를 들어, 단백질성 외부를 생성하기 위해, 다량체를 형성할 수 있다. 일부 구현예에서, 다량체는 동종다량체일 수 있다. 다른 구현예에서, 다량체는 이종다량체일 수 있다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 ORF1 분자를 포함하는 제1 복수의 아넬로벡터가 대상체에게 투여된다. 일부 구현예에서, 본 명세서에 기재된 ORF1 분자를 포함하는 제2 복수의 아넬로벡터가 제1 복수의 투여 후 대상체에게 후속적으로 투여된다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 포함되는 ORF1 분자와 동일한 아미노산 서열을 갖는 ORF1 분자를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 포함되는 ORF1 분자에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 ORF1 분자를 포함한다.

예를 들어, 아넬로벡터의 조립을 위한 ORF2 분자

본 명세서에 기재된 조성물 또는 방법을 사용하여 아넬로벡터를 생성하는 것은 아넬로바이러스 ORF2 분자(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이의 스플라이스 변이체 또는 기능적 단편의 발현을 수반할 수 있다. 일부 구현예에서, 아넬로벡터는 ORF2 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편, 및/또는 ORF2 분자를 인코딩하는 핵산, 또는 이의 스플라이스 변이체 또는 기능적 단편을 포함한다. 일부 구현예에서, 아넬로벡터는 ORF2 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편, 및/또는 ORF2 분자를 인코딩하는 핵산, 또는 이의 스플라이스 변이체 또는 기능적 단편을 포함하지 않는다. 일부 구현예에서, 아넬로벡터를 생성하는 것은 ORF2 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편의 발현을 포함하지만, ORF2 분자는 아넬로벡터에 포함되지 않는다.

예를 들어, 아넬로벡터의 조립을 위한 유전 요소 작제물

본 명세서에 기재된 바와 같은 아넬로벡터의 유전 요소는 유전 요소 영역 및 선택적으로 벡터 백본과 같은 다른 서열 또는 공여 벡터 백본을 포함하는 유전 요소 작제물로부터 생성될 수 있다. 일반적으로, 유전 요소 작제물은 아넬로바이러스 5' UTR(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다. 유전 요소 작제물은 유전 요소가 단백질성 외부 내에 봉입될 수 있는 숙주 세포로 유전 요소의 서열을 운반하기에 적합한 임의의 핵산 작제물일 수 있다. 일부 구현예에서, 유전 요소 작제물은 프로모터를 포함한다. 일부 구현예에서, 유전 요소 작제물은 선형 핵산 분자이다. 일부 구현예에서, 유전 요소 작제물은 환형 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 플라스미드, 박미드, 또는 미니서클)이다. 유전 요소 작제물은 일부 구현예에서 이중-가닥일 수 있다. 다른 구현예에서, 유전 요소는 단일-가닥이다. 일부 구현예에서, 유전 요소 작제물은 DNA를 포함한다. 일부 구현예에서, 유전 요소 작제물은 RNA를 포함한다. 일부 구현예에서, 유전 요소 작제물은 하나 이상의 변형된 뉴클레오티드를 포함한다.

일부 양태에서, 본 개시내용은 (예를 들어, 세포 배양 시스템에서) 본 명세서에 기재된 바와 같은 아넬로벡터의 복제 및 증식을 위한 방법을 제공하며, 이는 하기의 단계 중 하나 이상을 포함할 수 있다: (a) 유전 요소(예를 들어, 선형화됨)를 아넬로벡터 감염에 감수성인 세포주 내로 도입하는(예를 들어, 형질감염시키는) 단계; (b) 세포를 수확하고, 선택적으로 유전 요소의 존재를 나타내는 세포를 단리하는 단계; (c) 단계 (b)에서 수득되는 세포를 실험 조건 및 유전자 발현에 따라, (예를 들어, 적어도 3일, 예컨대 적어도 1주 이상 동안) 배양하는 단계; 및 (d) 예를 들어, 본 명세서에 기재된 바와 같이, 단계 (c)의 세포를 수확하는 단계.

플라스미드

일부 구현예에서, 유전 요소 작제물은 플라스미드이다. 플라스미드는 일반적으로 본 명세서에 기재된 바와 같은 유전 요소의 서열뿐만 아니라 숙주 세포에서의 복제에 적합한 복제 원점(예를 들어, 박테리아 세포에서의 복제를 위한 박테리아 복제 원점) 및 선택 가능한 마커(예를 들어, 항생제 내성 유전자)를 포함한다. 일부 구현예에서, 유전 요소의 서열은 플라스미드로부터 절제될 수 있다. 일부 구현예에서, 플라스미드는 박테리아 세포에서 복제할 수 있다. 일부 구현예에서, 플라스미드는 포유동물 세포(예를 들어, 인간 세포)에서 복제할 수 있다. 일부 구현예에서, 플라스미드는 길이가 적어도 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000 또는 5000 bp이다. 일부 구현예에서, 플라스미드는 길이가 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 또는 10,000 bp 미만이다. 일부 구현예에서, 플라스미드는 300 내지 400, 400 내지 500, 500 내지 600, 600 내지 700, 700 내지 800, 800 내지 900, 900 내지 1000, 1000 내지 1500, 1500 내지 2000, 2000 내지 2500, 2500 내지 3000, 3000 내지 4000, 또는 4000 내지 5000 bp의 길이를 갖는다. 일부 구현예에서, 유전 요소는, 예를 들어, (예를 들어, 시험관 내 환화에 의해) 플라스미드로부터 절제되어, 예를 들어, 본 명세서에 기재된 바와 같이, 미니서클을 형성할 수 있다. 구현예에서, 유전 요소의 절제는 유전 요소 서열을 플라스미드 백본으로부터 분리한다(예를 들어, 유전 요소를 박테리아 백본으로부터 분리함).

작은 환형 핵산 작제물

일부 구현예에서, 유전 요소 작제물은, 예를 들어 백본이 결여된(예를 들어, 박테리아 복제 원점 및/또는 선택 가능한 마커가 결여된) 환형 핵산 작제물이다. 구현예에서, 유전 요소는 이중-가닥 환형 핵산 작제물이다. 구현예에서, 이중-가닥 환형 핵산 작제물은, 예를 들어, 본 명세서에 기재된 바와 같이, 시험관 내 환화(IVC)에 의해 생성된다. 구현예에서, 이중-가닥 환형 핵산 작제물은 숙주 세포 내로 도입될 수 있으며, 여기서, 예를 들어 본 명세서에 기재된 바와 같이, 단일-가닥 환형 유전 요소를 생성하기 위한 주형으로 전환되거나 주형으로서 사용될 수 있다. 일부 구현예에서, 환형 핵산 작제물은 플라스미드 백본 또는 이의 기능적 단편을 포함하지 않는다. 일부 구현예에서, 환형 핵산 작제물은 길이가 적어도 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 또는 4500 bp이다. 일부 구현예에서, 환형 핵산 작제물은 길이가 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100, 4200, 4300, 4400, 4500, 4600, 4700, 4800, 4900, 5000, 5500, 또는 6000 bp 미만이다. 일부 구현예에서, 환형 핵산 작제물은 길이가 2000 내지 2100, 2100 내지 2200, 2200 내지 2300, 2300 내지 2400, 2400 내지 2500, 2500 내지 2600, 2600 내지 2700, 2700 내지 2800, 2800 내지 2900, 2900 내지 3000, 3000 내지 3100, 3100 내지 3200, 3200 내지 3300, 3300 내지 3400, 3400 내지 3500, 3500 내지 3600, 3600 내지 3700, 3700 내지 3800, 3800 내지 3900, 3900 내지 4000, 4000 내지 4100, 4100 내지 4200, 4200 내지 4300, 4300 내지 4400, 또는 4400 내지 4500 bp이다. 일부 구현예에서, 환형 핵산 작제물은 미니서클이다.

시험관 내 환화

일부 예에서, 단백질성 외부로 패키징되는 유전 요소는 단일 가닥 환형 DNA이다. 유전 요소는 일부 예에서 단일 가닥 환형 DNA 이외의 형태를 갖는 유전 요소 작제물을 통해 숙주 세포로 도입될 수 있다. 예를 들어, 유전 요소 작제물은 이중-가닥 환형 DNA일 수 있다. 그 다음 이중-가닥 환형 DNA는 숙주 세포(예를 들어, 문헌[Wawrzyniak et al. 2017, Front. Microbiol. 8: 2353](열거된 효소와 관련하여 본 명세서에 참조로 포함됨)에 기재된 바와 같은, 예를 들어, 회전환 복제에 적합한 효소, 예를 들어, 아넬로바이러스 Rep 단백질, 예를 들어, Rep68/78, Rep60, RepA, RepB, Pre, MobM, TraX, TrwC, Mob02281, Mob02282, NikB, ORF50240, NikK, TecH, OrfJ, 또는 TraI를 포함하는 숙주 세포)에서 단일-가닥 환형 DNA로 전환될 수 있다. 일부 구현예에서, 이중-가닥 환형 DNA는, 예를 들어, 실시예 15에 기재된 바와 같이, 시험관 내 환화(IVC)에 의해 생성된다.

일반적으로, 시험관 내 환화된 DNA 작제물은 유전 요소 서열이 선형 DNA 분자로서 절제되도록, 패키징될 유전 요소 작제물(예를 들어, 유전 요소의 서열을 포함하는 플라스미드)을 분해함으로써 생성될 수 있다. 그 다음, 생성된 선형 DNA는, 예를 들어, DNA 리가제를 사용하여 결찰되어, 이중-가닥 환형 DNA를 형성할 수 있다. 일부 예에서, 시험관 내 환화에 의해 생성되는 이중-가닥 환형 DNA는, 예를 들어, 본 명세서에 기재된 바와 같이, 회전환 복제를 겪을 수 있다. 이론에 결부시키고자 하지 않고, 시험관 내 환화가 추가의 변형 없이 회전환 복제를 겪을 수 있는 이중-가닥 DNA 작제물을 생성함으로써, 예를 들어, 본 명세서에 기재된 바와 같이, 아넬로벡터 내로 패키징되기에 적합한 크기의 단일-가닥 환형 DNA를 생성할 수 있는 것으로 고려된다. 일부 구현예에서, 이중-가닥 DNA 작제물은 플라스미드(예를 들어, 박테리아 플라스미드)보다 더 작다. 일부 구현예에서, 이중-가닥 DNA 작제물은 플라스미드(예를 들어, 박테리아 플라스미드)로부터 절제된 다음, 예를 들어, 시험관 내 환화에 의해 환화된다.

시스/트랜스 작제물

일부 구현예에서, 본 명세서에 기재된 바와 같은 유전 요소 작제물은 하나 이상의 아넬로바이러스 ORF, 예를 들어, 단백질성 외부 구성성분(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 폴리펩티드)을 인코딩하는 하나 이상의 서열을 포함한다. 예를 들어, 유전 요소 작제물은 아넬로바이러스 ORF1 분자를 인코딩하는 핵산 서열을 포함할 수 있다. 이러한 유전 요소 작제물은 유전 요소 및 아넬로바이러스 ORF(들)를 시스로 숙주 세포로 도입하는 데 적합할 수 있다. 다른 구현예에서, 본 명세서에 기재된 바와 같은 유전 요소 작제물은 하나 이상의 아넬로바이러스 ORF, 예를 들어, 단백질성 외부 구성성분(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 핵산에 의해 인코딩된 폴리펩티드)을 인코딩하는 서열을 포함하지 않는다. 예를 들어, 유전 요소 작제물은 아넬로바이러스 ORF1 분자를 인코딩하는 핵산 서열을 포함하지 않을 수 있다. 이러한 유전 요소 작제물은 (예를 들어, 하나 이상의 아넬로바이러스 ORF를 인코딩하는 제2 핵산 작제물의 도입을 통해, 또는 숙주 세포의 게놈에 통합된 아넬로바이러스 ORF 카세트를 통해) 트랜스로 제공되는 하나 이상의 아넬로바이러스 ORF와 함께, 유전 요소를 숙주 세포로 도입하는 데 적합할 수 있다.

일부 구현예에서, 유전 요소 작제물은 아넬로바이러스 ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 젤리-롤 영역)을 인코딩하는 서열을 포함한다. 일부 구현예에서, 유전 요소의 서열을 포함하지 않는 유전 요소의 부분은 (예를 들어, 프로모터 및 아넬로바이러스 ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편을 인코딩하는 서열을 포함하는 카세트에) 아넬로바이러스 ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편을 인코딩하는 서열을 포함한다. 추가 구현예에서, 유전 요소 서열을 포함하는 작제물의 일부는 아넬로바이러스 ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 젤리-롤 영역)을 인코딩하는 서열을 포함한다. 구현예에서, 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같음)에 이러한 유전 요소의 봉입은 복제-구성성분 아넬로벡터(예를 들어, 세포 감염 시, 예를 들어, 본 명세서에 기재된 바와 같은 하나 이상의 아넬로바이러스 ORF를 인코딩하는, 추가 핵산 작제물을 세포에 도입하지 않고 세포가 아넬로벡터의 추가 카피를 생성할 수 있게 하는 아넬로벡터)를 생성한다.

다른 구현예에서, 유전 요소는 아넬로바이러스 ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 젤리-롤 영역)을 인코딩하는 서열을 포함하지 않는다. 구현예에서, 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같음)에 이러한 유전 요소의 봉입은 복제-부적격 아넬로벡터(예를 들어, 세포 감염 시, 예를 들어, 본 명세서에 기재된 바와 같은 하나 이상의 아넬로바이러스 ORF를 인코딩하는, 하나 이상의 추가 작제물의 부재 시, 감염된 세포가 추가 아넬로벡터를 생성할 수 없게 하는 아넬로벡터)를 생성한다.

발현 카세트

일부 구현예에서, 유전 요소 작제물은 폴리펩티드 또는 비코딩 RNA(예를 들어, miRNA 또는 siRNA)의 발현을 위한 하나 이상의 카세트를 포함한다. 일부 구현예에서, 유전 요소 작제물은 이펙터(예를 들어, 외인성 또는 내인성 이펙터), 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 폴리펩티드 또는 비코딩 RNA의 발현을 위한 카세트를 포함한다. 일부 구현예에서, 유전 요소 작제물은 아넬로바이러스 단백질(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2, 또는 이의 기능적 단편)의 발현을 위한 카세트를 포함한다. 발현 카세트는 일부 구현예에서 유전 요소 서열 내에 위치할 수 있다. 구현예에서, 이펙터에 대한 발현 카세트는 유전 요소 서열 내에 위치한다. 구현예에서, 아넬로바이러스 단백질에 대한 발현 카세트는 유전 요소 서열 내에 위치한다. 다른 구현예에서, 발현 카세트는 유전 요소의 서열 외부에 있는 유전 요소 작제물 내의 위치(예를 들어, 백본 내)에 위치한다. 일부 구현예에서, 아넬로바이러스 단백질에 대한 발현 카세트는 유전 요소의 서열 외부에 있는 유전 요소 작제물 내의 위치(예를 들어, 백본)에 위치한다.

폴리펩티드 발현 카세트는 일반적으로 프로모터 및 폴리펩티드, 예를 들어 이펙터(예를 들어, 본 명세서에 기재된 바와 같은 외인성 또는 내인성 이펙터) 또는 아넬로바이러스 단백질을 인코딩하는 코딩 서열(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2, 또는 이의 기능적 단편을 인코딩하는 서열)을 포함한다. (예를 들어, 폴리펩티드의 발현을 유도하기 위해) 폴리펩티드 발현 카세트에 포함될 수 있는 예시적인 프로모터는 제한 없이, 예를 들어, 본 명세서에 기재된 바와 같은, 구성적 프로모터(예를 들어, CMV, RSV, PGK, EF1a, 또는 SV40), 세포 또는 조직-특이적 프로모터(예를 들어, 골격 α-액틴 프로모터, 미오신 경쇄 2A 프로모터, 디스트로핀 프로모터, 근육 크레아틴 키나제 프로모터, 간 알부민 프로모터, B형 간염 바이러스 코어 프로모터, 오스테오칼신 프로모터, 골 시알로단백질 프로모터, CD2 프로모터, 면역글로불린 중쇄 프로모터, T 세포 수용체 a 쇄 프로모터, 뉴런-특이적 에놀라제(NSE) 프로모터, 또는 신경필라멘트 경쇄 프로모터), 및 유도성 프로모터(예를 들어, 아연-유도성 양 메탈로티오닌(MT) 프로모터; 덱사메타손(Dex)-유도성 마우스 유방 종양 바이러스(MMTV) 프로모터; T7 중합효소 프로모터 시스템, 테트라사이클린-억제성 시스템, 테트라사이클린-유도성 시스템, RU486-유도성 시스템, 라파마이신-유도성 시스템)를 포함한다. 일부 구현예에서, 발현 카세트는, 예를 들어, 본 명세서에 기재된 바와 같은, 인핸서를 추가로 포함한다.

유전 요소 작제물의 설계 및 생성

유전 요소 작제물을 합성하기 위해 다양한 방법이 이용 가능하다. 예를 들어, 유전 요소 작제물 서열은 합성하기에 더 쉬운 더 작은 중첩하는 조각(예를 들어, 약 100 bp 내지 약 10 kb 범위의 세그먼트 또는 개별 ORF)으로 나뉠 수 있다. 이들 DNA 세그먼트는 중첩하는 단일-가닥 올리고뉴클레오티드의 세트로부터 합성된다. 그 다음 생성되는 중첩 신톤(synthon)은 더 큰 조각의 DNA, 예를 들어, 유전 요소 작제물로 조립된다. 세그먼트 또는 ORF는 유전 요소 작제물, 예를 들어, 5' 및 3' 말단에서 시험관 내 재조합 또는 특유한 제한 부위 내로 조립되어, 결찰을 가능하게 할 수 있다.

유전 요소 작제물은 작제물 서열을 올리고-길이 단편으로 분석하는 설계 알고리즘으로 합성하여, 서열 공간의 복잡성을 고려하는 합성을 위한 적합한 설계 조건을 생성할 수 있다. 그 다음 올리고는 반도체-기반의 고밀도 칩 상에서 화학적으로 합성되며, 칩마다 200,000개 초과의 개별 올리고가 합성된다. 올리고를 조립 기법, 예컨대, BioFab^®으로 조립하여, 더 작은 올리고로부터 더 긴 DNA 세그먼트를 구축한다. 이는 병렬 방식으로 행해지며, 따라서 수백 내지 수천개의 합성 DNA 세그먼트가 한번에 구축된다.

각각의 유전 요소 작제물 또는 유전 요소 작제물의 세그먼트는 검증된 서열일 수 있다. 일부 구현예에서, RNA 또는 DNA의 고-처리량 서열결정은 AnyDot.chips(Genovoxx, 독일)를 사용하여 일어날 수 있으며, 이는 생물학적 과정(예를 들어, miRNA 발현 또는 대립형질 가변성(SNP 검출))의 모니터링을 가능하게 한다. 다른 고-처리량 서열결정 시스템은 문헌[Venter, J., et al. Science 16 Feb. 2001]; 문헌[Adams, M. et al, Science 24 Mar. 2000]; 및 문헌[M. J, Levene, et al. Science 299:682-686, January 2003]; 및 미국 공개 출원 20030044781 및 2006/0078937에 개시된 것을 포함한다. 전체적으로 이러한 시스템은 핵산 분자에서 측정되는 중합 반응을 통해 염기를 일시적으로 첨가함으로써 복수의 염기를 갖는 표적 핵산 분자를 서열결정하는 것을 수반하며, 즉, 서열결정될 주형 핵산 분자 상의 핵산 중합 효소의 활성이 실시간으로 추적된다. 일부 구현예에서, 샷건(shotgun) 서열결정이 수행된다.

유전 요소 작제물은 복제 또는 패키징을 위한 인자가 유전 요소에 비하여 시스 또는 트랜스로 공급될 수 있도록 설계될 수 있다. 예를 들어, 시스로 공급되는 경우, 유전 요소는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 또는 ORF2t/3을 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 일부 구현예에서, 복제 및/또는 패키징 신호는, 예를 들어, 증폭 및/또는 캡슐화를 유도하기 위하여 유전 요소 내로 혼입될 수 있다. 일부 구현예에서, 이펙터는 게놈 내의 특정 부위 내로 삽입된다. 일부 구현예에서, 하나 이상의 바이러스 ORF는 이펙터로 대체된다.

또 다른 예에서, 복제 또는 패키징 인자가 트랜스로 공급되는 경우, 유전 요소는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 또는 ORF2t/3 중 하나 이상을 인코딩하는 유전자가 결여될 수 있으며; 이 단백질 또는 단백질들은, 예를 들어, 또 다른 핵산, 예를 들어, 헬퍼 핵산에 의해 공급될 수 있다. 일부 구현예에서, 최소 시스 신호(예를 들어, 5' UTR 및/또는 GC-풍부 영역)가 유전 요소 내에 존재한다. 일부 구현예에서, 유전 요소는 복제 또는 패키징 인자(예를 들어, 복제효소 및/또는 캡시드 단백질)를 인코딩하지 않는다. 이러한 인자는 일부 구현예에서, 하나 이상의 헬퍼 핵산(예를 들어, 숙주 세포 게놈 내로 통합되는 헬퍼 바이러스 핵산, 헬퍼 플라스미드 또는 헬퍼 핵산)에 의해 공급될 수 있다. 일부 구현예에서, 헬퍼 핵산은 증폭 및/또는 패키징을 유도하기에 충분한 단백질 및/또는 RNA를 발현하지만, 이들 자체의 패키징 신호가 결여될 수 있다. 일부 구현예에서, 유전 요소 및 헬퍼 핵산은 (예를 들어, 동시에 또는 개별적으로) 숙주 세포 내로 도입되어, 유전 요소의 증폭 및/또는 패키징을 초래하지만, 헬퍼 핵산의 증폭 및/또는 패키징을 초래하지 않는다.

일부 구현예에서, 유전 요소 작제물은 컴퓨터-지원 설계 도구를 사용하여 설계될 수 있다.

작제물을 제조하는 일반적인 방법은, 예를 들어, 문헌[Khudyakov & Fields, Artificial DNA: Methods and Applications, CRC Press (2002)]; 문헌[Zhao, Synthetic Biology: Tools and Applications, (First Edition), Academic Press (2013)]; 및 문헌[Egli & Herdewijn, Chemistry and Biology of Artificial Nucleic Acids, (First Edition), Wiley-VCH (2012)]에 기재되어 있다.

이펙터

본 명세서에 기재된 조성물 및 방법은, 예를 들어, 본 명세서에 기재된 바와 같은, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 서열을 포함하는 아넬로벡터의 유전 요소를 생성하는 데 사용될 수 있다. 이펙터는 일부 예에서, 내인성 이펙터 또는 외인성 이펙터일 수 있다. 일부 구현예에서, 이펙터는 치료용 이펙터이다. 일부 구현예에서, 이펙터는 폴리펩티드(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 치료용 폴리펩티드 또는 펩티드)를 포함한다. 일부 구현예에서, 이펙터는 비코딩 RNA(예를 들어, miRNA, siRNA, shRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, 또는 gRNA)를 포함한다. 일부 구현예에서, 이펙터는, 예를 들어, 본 명세서에 기재된 바와 같은, 조절 핵산을 포함한다.

일부 구현예에서, 이펙터-인코딩 서열은, TATA 박스 상류의 5' 비코딩 영역, 5' UTR, 폴리-A 신호의 하류, 또는 GC-풍부 영역의 상류의 3' 비코딩 영역에서, 예를 들어, 비코딩 영역, 예를 들어, 오픈-리딩 프레임의 3' 및 유전 요소의 GC-풍부 영역의 5'에 배치된 비코딩 영역에서, 유전 요소에 삽입될 수 있다. 일부 구현예에서, 이펙터-인코딩 서열은, 예를 들어, 코딩 서열(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3을 인코딩하는 서열)에서, 유전 요소에 삽입될 수 있다. 일부 구현예에서, 이펙터-인코딩 서열은 오픈-리딩 프레임의 전부 또는 일부를 대체한다. 일부 구현예에서, 유전 요소는 이펙터-인코딩 서열에 작동 가능하게 연결된 조절 서열(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 프로모터 또는 인핸서)을 포함한다.

숙주 세포

본 명세서에 기재된 아넬로벡터는, 예를 들어, 숙주 세포에서 생성될 수 있다. 일반적으로, 아넬로벡터 유전 요소 및 아넬로벡터 단백질성 외부(예를 들어, 아넬로바이러스 ORF1 핵산 또는 아넬로바이러스 ORF1 분자에 의해 인코딩되는 폴리펩티드)의 구성성분을 포함하는 숙주 세포가 제공된다. 그 다음 숙주 세포는 단백질성 외부 내에 유전 요소를 봉입하기에 적합한 조건(예를 들어, 본 명세서에 기재된 바와 같은 배양 조건) 하에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 아넬로벡터를 숙주 세포로부터, 예를 들어 주변 상청액으로 방출하기에 적합한 조건 하에서 추가로 인큐베이션된다. 일부 구현예에서, 숙주 세포는 세포 용해물로부터 아넬로벡터의 수확을 위해 용해된다. 일부 구현예에서, 아넬로벡터는 높은 세포 밀도로 성장한 숙주 세포주에 도입될 수 있다.

숙주 세포 내로의 유전 요소의 도입

유전 요소, 또는 유전 요소의 서열을 포함하는 핵산 작제물은 숙주 세포 내로 도입될 수 있다. 일부 구현예에서, 유전 요소 자체가 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소(예를 들어, 본 명세서에 기재된 바와 같음)의 서열을 포함하는 유전 요소 작제물이 숙주 세포 내로 도입된다. 유전 요소 또는 유전 요소 작제물은, 예를 들어 당업계에 알려진 방법을 사용하여 숙주 세포 내로 도입될 수 있다. 예를 들어, 유전 요소 또는 유전 요소 작제물은 형질감염(예를 들어, 안정한 형질감염 또는 일시적 형질감염)에 의해 숙주 세포 내로 도입될 수 있다. 구현예에서, 유전 요소 또는 유전 요소 작제물은 lipofectamine 형질감염에 의해 숙주 세포 내로 도입된다. 구현예에서, 유전 요소 또는 유전 요소 작제물은 칼슘 포스페이트 형질감염에 의해 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소 또는 유전 요소 작제물은 전기천공에 의해 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소 또는 유전 요소 작제물은 유전자 총을 사용하여 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소 또는 유전 요소 작제물은 뉴클레오펙션에 의해 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소 또는 유전 요소 작제물은 PEI 형질감염에 의해 숙주 세포 내로 도입된다. 일부 구현예에서, 유전 요소는 숙주 세포를 유전 요소를 포함하는 아넬로벡터와 접촉시킴으로써 숙주 세포 내로 도입된다.

일부 구현예에서, 유전 요소 작제물은 일단 숙주 세포 내로 도입되면 복제할 수 있다. 일부 구현예에서, 유전 요소는 일단 숙주 세포 내로 도입되면 유전 요소 작제물로부터 생성될 수 있다. 일부 구현예에서, 유전 요소는, 예를 들어, 주형으로서 유전 요소 작제물을 사용하여, 중합효소에 의해 숙주 세포에서 생성된다.

일부 구현예에서, 유전 요소 또는 유전 요소를 포함하는 벡터는 아넬로벡터의 발현을 달성하기 위해 바이러스 중합효소 단백질을 발현하는 세포주 내로 도입(예를 들어, 형질감염)된다. 이를 위해, 아넬로벡터 중합효소 단백질을 발현하는 세포주가 적절한 숙주 세포로 이용될 수 있다. 숙주 세포는 다른 바이러스 기능 또는 추가 기능을 제공하도록 유사하게 엔지니어링될 수 있다.

본 명세서에 개시된 아넬로벡터를 제조하기 위해, 유전 요소 작제물이 복제 및 생성에 필요한 아넬로벡터 단백질 및 기능을 제공하는 세포를 형질감염시키는 데 사용될 수 있다. 대안적으로, 세포는 본 명세서에 개시된 유전 요소 또는 유전 요소를 포함하는 벡터에 의한 형질감염 전, 도중 또는 후에 아넬로벡터 단백질 및 기능을 제공하는 제2 작제물(예를 들어, 바이러스)로 형질감염될 수 있다. 일부 구현예에서, 제2 작제물은 불완전한 바이러스 입자의 생성을 보완하는 데 유용할 수 있다. 제2 작제물(예를 들어, 바이러스)은 숙주 범위 제한 또는 온도 민감성과 같은 조건부 성장 결함을 가질 수 있으며, 이는 예를 들어 형질감염 바이러스의 후속 선택을 가능하게 한다. 일부 구현예에서, 제2 작제물은 아넬로벡터의 발현을 달성하기 위해 숙주 세포에 의해 이용되는 하나 이상의 복제 단백질을 제공할 수 있다. 일부 구현예에서, 숙주 세포는 하나 이상의 복제 단백질과 같은 바이러스 단백질을 인코딩하는 벡터로 형질감염될 수 있다. 일부 구현예에서, 제2 작제물은 항바이러스 민감성을 포함한다.

본 명세서에 개시된 유전 요소 또는 유전 요소를 포함하는 벡터는 일부 예에서 당업계에 알려진 기법을 사용하여 아넬로벡터로 복제 및 생성될 수 있다. 예를 들어, 다양한 바이러스 배양 방법이, 예를 들어, 미국 특허 4,650,764; 미국 특허 5,166,057; 미국 특허 5,854,037; 유럽 특허 공개 EP 0702085A1; 미국 특허 출원 일련번호 09/152,845; 국제 특허 공개 PCT WO97/12032; WO96/34625; 유럽 특허 공개 EP-A780475; WO 99/02657; WO 98/53078; WO 98/02530; WO 99/15672; WO 98/13501; WO 97/06270; 및 EPO 780 47SA1에 기재되어 있으며, 이들 각각은 본 명세서에 전문이 참조로 포함된다.

시스 또는 트랜스로 아넬로바이러스 단백질(들)을 제공하는 방법

일부 구현예(예를 들어, 본 명세서에 기재된 시스 구현예)에서, 유전 요소 작제물은 아넬로바이러스 ORF(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2, 또는 이의 기능적 단편)에 대한 코딩 서열을 포함하는 하나 이상의 발현 카세트를 추가로 포함한다. 일부 구현예에서, 유전 요소 작제물은 아넬로바이러스 ORF1, 또는 이의 스플라이스 변이체 또는 기능적 단편에 대한 코딩 서열을 포함하는 발현 카세트를 포함한다. 이펙터뿐만 아니라 하나 이상의 아넬로바이러스 ORF에 대한 발현 카세트를 포함하는 이러한 유전 요소 작제물은, 숙주 세포 내로 도입될 수 있다. 이러한 유전 요소 작제물을 포함하는 숙주 세포는, 일부 예에서, 추가의 핵산 작제물 또는 발현 카세트의 숙주 세포 게놈 내로의 통합을 요구하지 않으면서, 단백질성 외부에 대한, 그리고 단백질성 외부 내의 유전 요소의 봉입을 위한 유전 요소 및 구성성분을 생성할 수 있다. 다시 말하면, 이러한 유전 요소 작제물은, 예를 들어, 본 명세서에 기재된 바와 같이, 숙주 세포에서 시스 아넬로벡터 생성 방법에 사용될 수 있다.

일부 구현예(예를 들어, 본 명세서에 기재된 트랜스 구현예)에서, 유전 요소는 하나 이상의 아넬로바이러스 ORF(예를 들어, 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2, 또는 이의 기능적 단편)에 코딩 서열을 포함하는 발현 카세트를 포함하지 않는다. 일부 구현예에서, 유전 요소 작제물은 아넬로바이러스 ORF1, 또는 이의 스플라이스 변이체 또는 기능적 단편에 대한 코딩 서열을 포함하는 발현 카세트를 포함하지 않는다. 이펙터에 대한 발현 카세트를 포함하지만 하나 이상의 아넬로바이러스 ORF(예를 들어, 아넬로바이러스 ORF1 또는 이의 스플라이스 변이체 또는 기능적 단편)에 대한 발현 카세트가 결여된 이러한 유전 요소 작제물은 숙주 세포 내로 도입될 수 있다. 이러한 유전 요소 작제물을 포함하는 숙주 세포는, 일부 예에서, 아넬로벡터의 하나 이상의 구성성분(예를 들어, 단백질성 외부 단백질)의 생성을 위해 추가의 핵산 작제물 또는 발현 카세트의 숙주 세포 게놈으로의 통합을 필요로 할 수 있다. 일부 구현예에서, 이러한 유전 요소 작제물을 포함하는 숙주 세포는 아넬로바이러스 ORF1 분자를 인코딩하는 추가의 핵산 작제물의 부재시 단백질성 외부 내에 유전 요소를 봉입할 수 없다. 다시 말하면, 이러한 유전 요소 작제물은, 예를 들어, 본 명세서에 기재된 바와 같이, 숙주 세포에서 트랜스 아넬로벡터 생성 방법에 사용될 수 있다.

헬퍼

일부 구현예에서, 헬퍼 작제물은 숙주 세포(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소 작제물 또는 유전 요소를 포함하는 숙주 세포) 내로 도입된다. 일부 구현예에서, 헬퍼 작제물은 유전 요소 작제물의 도입 이전에 숙주 세포 내로 도입된다. 일부 구현예에서, 헬퍼 작제물은 유전 요소 작제물의 도입과 동시에 숙주 세포 내로 도입된다. 일부 구현예에서, 헬퍼 작제물은 유전 요소 작제물의 도입 후에 숙주 세포 내로 도입된다.

예시적인 세포 유형

아넬로벡터의 생성에 적합한 예시적인 숙주 세포는 제한 없이, 포유동물 세포, 예를 들어, 인간 세포 및 곤충 세포를 포함한다. 일부 구현예에서, 숙주 세포는 인간 세포 또는 세포주이다. 일부 구현예에서, 세포는 면역 세포 또는 세포주, 예를 들어, T 세포 또는 세포주, 암 세포주, 간 세포 또는 세포주, 뉴런, 신경아교세포, 피부 세포, 상피 세포, 중간엽 세포, 혈액 세포, 내피 세포, 눈 세포, 위장 세포, 전구 세포, 전구체 세포, 줄기 세포, 폐 세포, 심장 세포, 또는 근육 세포이다. 일부 구현예에서, 숙주 세포는 동물 세포(예를 들어, 마우스 세포, 래트 세포, 토끼 세포, 또는 햄스터 세포, 또는 곤충 세포)이다.

일부 구현예에서, 숙주 세포는 림프 세포이다. 일부 구현예에서, 숙주 세포는 T 세포 또는 무한증식 세포이다. 구현예에서, 숙주 세포는 Jurkat 세포이다. 구현예에서, 숙주 세포는 MOLT 세포(예를 들어, MOLT-4 또는 MOLT-3 세포)이다. 구현예에서, 숙주 세포는 MOLT-4 세포이다. 구현예에서, 숙주 세포는 MOLT-3 세포이다. 일부 구현예에서, 숙주 세포는 급성 림프구성 백혈병(ALL) 세포, 예를 들어 MOLT 세포, 예를 들어 MOLT-4 또는 MOLT-3 세포이다. 일부 구현예에서, 숙주 세포는 B 세포 또는 무한증식 B 세포이다. 일부 구현예에서, 숙주 세포는 유전 요소 작제물(예를 들어, 본 명세서에 기재된 바와 같음)을 포함한다.

일부 구현예에서, 숙주 세포는 MOLT 세포(예를 들어, MOLT-4 또는 MOLT-3 세포)이다.

일부 구현예에서, 숙주 세포는 급성 림프구성 백혈병(ALL) 세포, 예를 들어 MOLT 세포, 예를 들어 MOLT-4 또는 MOLT-3 세포이다.

일 양태에서, 본 개시내용은 단백질성 외부에 봉입되는 유전 요소를 포함하는 아넬로벡터의 제조 방법을 제공하며, 방법은 아넬로벡터 유전 요소를 포함하는 MOLT-4 세포를 제공하는 단계, 및 아넬로벡터 유전 요소가 MOLT-4 세포의 단백질성 외부에 봉입될 수 있도록 하는 조건 하에서 MOLT-4 세포를 인큐베이션하는 단계를 포함한다. 일부 구현예에서, MOLT-4 세포는 단백질성 외부의 일부 또는 전부를 형성하는 하나 이상의 아넬로바이러스 단백질(예를 들어, 아넬로바이러스 ORF1 분자)을 추가로 포함한다. 일부 구현예에서, 아넬로벡터 유전 요소는 MOLT-4 세포에서, 예를 들어 유전 요소 작제물(예를 들어, 본 명세서에 기재된 바와 같음)로부터 생성된다. 일부 구현예에서, 방법은 MOLT-4 세포 내로 아넬로벡터 유전 요소 작제물을 도입하는 단계를 추가로 포함한다.

일 양태에서, 본 개시내용은 단백질성 외부에 봉입되는 유전 요소를 포함하는 아넬로벡터의 제조 방법을 제공하며, 방법은 아넬로벡터 유전 요소를 포함하는 MOLT-3 세포를 제공하는 단계, 및 아넬로벡터 유전 요소가 MOLT-3 세포의 단백질성 외부에 봉입될 수 있도록 하는 조건 하에서 MOLT-3 세포를 인큐베이션하는 단계를 포함한다. 일부 구현예에서, MOLT-3 세포는 단백질성 외부의 일부 또는 전부를 형성하는 하나 이상의 아넬로바이러스 단백질(예를 들어, 아넬로바이러스 ORF1 분자)을 추가로 포함한다. 일부 구현예에서, 아넬로벡터 유전 요소는 MOLT-3 세포에서, 예를 들어 유전 요소 작제물(예를 들어, 본 명세서에 기재된 바와 같음)로부터 생성된다. 일부 구현예에서, 방법은 MOLT-3 세포 내로 아넬로벡터 유전 요소 작제물을 도입하는 단계를 추가로 포함한다.

일부 구현예에서, 숙주 세포는 인간 세포이다. 구현예에서, 숙주 세포는 HEK293T 세포, HEK293F 세포, A549 세포, Jurkat 세포, Raji 세포, Chang 세포, HeLa 세포 Phoenix 세포, MRC-5 세포, NCI-H292 세포 또는 Wi38 세포이다. 일부 구현예에서, 숙주 세포는 비-인간 영장류 세포(예를 들어, Vero 세포, CV-1 세포, 또는 LLCMK2 세포)이다. 일부 구현예에서, 숙주 세포는 뮤린 세포(예를 들어, McCoy 세포)이다. 일부 구현예에서, 숙주 세포는 햄스터 세포(예를 들어, CHO 세포 또는 BHK 21 세포)이다. 일부 구현예에서, 숙주 세포는 MARC-145, MDBK, RK-13, 또는 EEL 세포이다. 일부 구현예에서, 숙주 세포는 상피 세포(예를 들어, 상피 계통의 세포주)이다.

일부 구현예에서, 아넬로벡터는 연속 동물 세포주(예를 들어, 연속 증식될 수 있는 무한증식 세포주)에서 배양된다. 본 발명의 일 구현예에 따르면, 세포주는 돼지 세포주를 포함할 수 있다. 본 발명의 맥락에서 고려되는 세포주는 돼지 신장 상피 세포주 PK-15 및 SK, 단골수성 세포주 3D4/31 및 고환 세포주 ST와 같은 불멸화 돼지 세포주를 포함하지만 이에 제한되지 않는다.

배양 조건

단백질성 외부의 유전 요소 및 구성성분을 포함하는 숙주 세포는 단백질성 외부 내에 유전 요소를 봉입하기에 적합한 조건 하에서 인큐베이션되어, 아넬로벡터를 생성할 수 있다. 적합한 배양 조건은, 예를 들어, 실시예 4, 5, 7, 8, 9, 10, 11, 또는 15 중 임의의 것에 기재된 것을 포함한다. 일부 구현예에서, 숙주 세포는 액체 배지(예를 들어, Grace's Supplemented(TNM-FH), IPL-41, TC-100, Schneider's Drosophila, SF-900 II SFM, 또는 및 EXPRESS-FIVE™ SFM)에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 부착 배양에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 현탁 배양에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 튜브, 병, 마이크로캐리어 또는 플라스크에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 접시 또는 웰(예를 들어, 플레이트 상의 웰)에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 숙주 세포의 증식에 적합한 조건 하에서 인큐베이션된다. 일부 구현예에서, 숙주 세포는 숙주 세포가 내부에서 생성된 아넬로벡터를 주변 상청액으로 방출하기에 적합한 조건 하에서 인큐베이션된다.

본 발명에 따른 아넬로벡터-함유 세포 배양물의 생성은 상이한 규모(예를 들어, 플라스크, 롤러 보틀(roller bottle) 또는 생물반응기)에서 수행될 수 있다. 감염될 세포의 배양을 위해 사용되는 배지는 세포 생존에 필요한 표준 영양물질을 포함하지만, 또한 세포 유형에 따라 추가의 영양물질을 포함할 수 있다. 선택적으로, 배지는 단백질-부재 및/또는 혈청-부재일 수 있다. 세포 유형에 따라, 세포는 현탁액 중에서 또는 기질 상에서 배양될 수 있다. 일부 구현예에서, 숙주 세포의 성장을 위하여, 그리고 아넬로벡터의 생성을 위하여 상이한 배지가 사용된다.

수확

숙주 세포에 의해 생성된 아넬로벡터는, 예를 들어 당업계에 알려진 방법에 따라 수확될 수 있다. 예를 들어, 배양 중인 숙주 세포에 의해 주변 상청액으로 방출된 아넬로벡터는 상청액으로부터 수확될 수 있다(예를 들어, 실시예 4에 기재된 바와 같음). 일부 구현예에서, 상청액은 아넬로벡터를 얻기 위해 숙주 세포로부터 분리된다. 일부 구현예에서, 숙주 세포는 수확 전 또는 수확 동안 용해된다. 일부 구현예에서, 아넬로벡터는 숙주 세포 용해물로부터 수확된다(예를 들어, 실시예 10에 기재된 바와 같음). 일부 구현예에서, 아넬로벡터는 숙주 세포 용해물 및 상청액 둘 다로부터 수확된다. 일부 구현예에서, 아넬로벡터의 정제 및 단리는, 예를 들어, 문헌[Rinaldi, et al., DNA Vaccines: Methods and Protocols (Methods in Molecular Biology),　3rd ed. 2014, Humana Press](본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같이, 바이러스 생성에서 알려진 방법에 따라 수행된다. 일부 구현예에서, 아넬로벡터는 약제학적 부형제를 이용한 제형화 이전에, 생물물리학적 특성에 기반한 용질의 분리, 예를 들어, 이온 교환 크로마토그래피 또는 접선 유동 여과에 의해 수확되고/수확되거나 정제될 수 있다.

농축 및 정제

수확된 아넬로벡터는, 예를 들어 아넬로벡터 제제를 생성하기 위해, 정제 및/또는 농축될 수 있다. 일부 구현예에서, 수확된 아넬로벡터는, 예를 들어, 바이러스 입자를 정제하기 위해 당업계에 알려진 방법(예를 들어, 침강, 크로마토그래피 및/또는 한외여과에 의한 정제)

벡터는 예를 들어 아넬로벡터 제제를 생산하기 위해 정제 및/또는 농축될 수 있다. 일부 구현예에서, 수확된 아넬로벡터는 예를 들어 바이러스 입자를 정제하기 위해 당업계에 알려진 방법(예를 들어 침강, 크로마토그래피 및/또는 한외여과에 의한 정제)을 사용하여, 수확 용액에 존재하는 다른 구성요소 또는 오염물로부터 단리된다. 일부 구현예에서, 정제 단계는 제제로부터 혈청, 숙주 세포 DNA, 숙주 세포 단백질, 유전 요소가 결여된 입자, 및/또는 페놀 레드 중 하나 이상을 제거하는 것을 포함한다. 일부 구현예에서, 수확된 아넬로벡터는, 예를 들어, 바이러스 입자를 농축시키기 위해 당업계에 알려진 방법을 사용하여, 수확 용액에 존재하는 다른 구성요소 또는 오염물에 비해 농축된다.

일부 구현예에서, 생성된 제제 또는 제제를 포함하는 약제학적 조성물은 허용 가능한 기간 및 온도에 걸쳐 안정할 것이고/이거나, 요망되는 투여 경로 및/또는 투여 경로가 필요할 임의의 디바이스, 예를 들어, 니들 또는 주사기와 병용 가능할 것이다.

II. 아넬로벡터

일부 양태에서, 본 명세서에 기재된 발명은 아넬로벡터, 아넬로벡터 제제, 및 치료용 조성물을 사용하고 제조하기 위한 조성물 및 방법을 포함한다. 일부 구현예에서, 아넬로벡터는 본 명세서에 기재된 바와 같은 조성물 및 방법을 사용하여 제조된다. 일부 구현예에서, 아넬로벡터는 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스) 또는 이의 단편 또는 부분, 또는 다른 실질적으로 비-병원성인 바이러스, 예를 들어, 상리공생 바이러스(symbiotic virus), 편리공생 바이러스(commensal virus), 천연 바이러스에 기반한 서열, 구조 및/또는 기능을 포함하는 하나 이상의 핵산 또는 폴리펩티드를 포함한다. 일부 구현예에서, 아넬로바이러스-기반 아넬로벡터는 해당 아넬로바이러스에 대하여 외인성인 적어도 하나의 요소, 예를 들어 외인성 이펙터 또는 아넬로벡터의 유전 요소 내에 배치된 외인성 이펙터를 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 아넬로바이러스-기반 아넬로벡터는 해당 아넬로바이러스 유래의 또 다른 요소에 대하여 이종인 적어도 하나의 요소, 예를 들어, 프로모터 요소와 같은 또 다른 연결된 핵산 서열에 대하여 이종인 이펙터-인코딩 핵산 서열을 포함한다. 일부 구현예에서, 아넬로벡터는 유전 요소의 나머지 및/또는 단백질성 외부에 비하여 이종인 적어도 하나의 요소(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 이펙터를 인코딩하는 외인성 요소)를 포함하는 유전 요소(예를 들어, 환형 DNA, 예를 들어, 단일 가닥 DNA)를 포함한다. 아넬로벡터는 페이로드를 위한 숙주, 예를 들어, 인간 내로의 운반 비히클(예를 들어, 실질적으로 비-병원성 운반 비히클)일 수 있다. 일부 구현예에서, 아넬로벡터는 진핵 세포, 예를 들어, 포유동물 세포, 예를 들어, 인간 세포에서 복제할 수 있다. 일부 구현예에서, 아넬로벡터는 포유동물(예를 들어, 인간) 세포에서 실질적으로 비-병원성 및/또는 실질적으로 비통합성이다. 일부 구현예에서, 아넬로벡터는 포유동물, 예를 들어, 인간에서 실질적으로 비-면역원성이다. 일부 구현예에서, 아넬로벡터는 복제-결핍이다. 일부 구현예에서, 아넬로벡터는 복제-적격이다.

일부 구현예에서, 아넬로벡터는, 예를 들어, PCT 출원 PCT/US2018/037379(이는 본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같은, 큐론 또는 이의 구성성분(예를 들어, 이펙터를 인코딩하는 서열, 및/또는 단백질성 외부를 포함하는, 예를 들어, 유전 요소)을 포함한다. 일부 구현예에서, 아넬로벡터는, 예를 들어, PCT 출원 PCT/US19/65995(이는 본 명세서에 전문이 참조로 포함됨)에 기재된 바와 같은, 아넬로벡터, 또는 이의 구성성분(예를 들어, 이펙터를 인코딩하는 서열, 및/또는 단백질성 외부를 포함하는, 예를 들어, 유전 요소)을 포함한다.

일 양태에서, 본 발명은 (i) 프로모터 요소, 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 페이로드)를 인코딩하는 서열 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소로서, 유전 요소가 단일-가닥 DNA이며, 하기의 특성 중 하나 또는 둘 모두를 갖는 유전 요소: 환형이고/환형이거나 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 진핵 세포의 게놈 내로 통합됨; 및 (ii) 단백질성 외부를 포함하는 아넬로벡터를 포함하며; 유전 요소는 단백질성 외부 내에 봉입되며; 아넬로벡터는 유전 요소를 진핵 세포 내로 운반할 수 있다.

본 명세서에 기재된 아넬로벡터의 일부 구현예에서, 유전 요소는 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합된다. 일부 구현예에서, 대상체에 투여되는 복수의 아넬로벡터로부터 약 0.01%, 0.05%, 0.1%, 0.5%, 1%, 2%, 3%, 4% 또는 5% 미만의 유전 요소는 대상체 내의 하나 이상의 숙주 세포의 게놈 내로 통합될 것이다. 일부 구현예에서, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터의 집단의 유전 요소는 유사한 AAV 바이러스의 집단의 것보다 더 낮은 빈도로, 예를 들어, 유사한 AAV 바이러스의 집단보다 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 또는 그 이상 더 낮은 빈도로 숙주 세포의 게놈 내로 통합된다.

일 양태에서, 본 발명은 (i) 프로모터 요소 및 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 페이로드)를 인코딩하는 서열, 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 포함하는 유전 요소로서, 유전 요소가 야생형 아넬로바이러스 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 유전 요소; 및 (ii) 단백질성 외부를 포함하는 아넬로벡터를 포함하며; 유전 요소는 단백질성 외부 내에 봉입되며; 아넬로벡터는 유전 요소를 진핵 세포 내로 운반할 수 있다.

일 양태에서, 본 발명은

a) (i) 외부 단백질(예를 들어, 비-병원성 외부 단백질)을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 인코딩하는 서열을 포함하는 유전 요소; 및

b) 유전 요소와 회합된, 예를 들어, 이를 둘러싸거나 봉입하는 단백질성 외부를 포함하는 아넬로벡터를 포함한다.

일부 구현예에서, 아넬로벡터는 비-외피, 환형, 단일-가닥 DNA 바이러스로부터의(또는 이와 70% 초과, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 100%의 상동성을 갖는) 서열 또는 발현 생성물을 포함한다. 동물 환형 단일-가닥 DNA 바이러스는 일반적으로 진핵 비-식물 숙주를 감염시키고, 환형 게놈을 갖는 단일 가닥 DNA(ssDNA) 바이러스의 하위군을 지칭한다. 따라서, 동물 환형 ssDNA 바이러스는 원핵생물을 감염시키는 ssDNA 바이러스(즉, 마이크로바이러스과 및 이노바이러스과) 및 식물을 감염시키는 ssDNA 바이러스(즉, 제미니바이러스과 및 나노바이러스과)와 구별 가능하다. 그들은 또한 비-식물 진핵생물을 감염시키는 선형 ssDNA 바이러스(즉, 파보바이러스과)와 구별 가능하다.

일부 구현예에서, 아넬로벡터는 숙주 세포 기능을 예를 들어, 일시적으로 또는 장기간 조절한다. 특정 구현예에서, 세포 기능은 안정하게 변경되며, 예컨대 조절은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 60일 이상 또는 그 사이의 임의의 시간 동안 지속된다. 특정 구현예에서, 세포 기능은 일시적으로 변경되며, 예를 들어, 예컨대 조절은 약 30분 이하 내지 약 7일 또는 약 1시간 이하, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 24시간, 36시간, 48시간, 60시간, 72시간, 4일, 5일, 6일, 7일 또는 그 사이의 임의의 시간 동안 지속된다.

일부 구현예에서, 유전 요소는 프로모터 요소를 포함한다. 구현예에서, 프로모터 요소는 RNA 중합효소 II-의존성 프로모터, RNA 중합효소 III-의존성 프로모터, PGK 프로모터, CMV 프로모터, EF-1α 프로모터, SV40 프로모터, CAGG 프로모터 또는 UBC 프로모터, TTV 바이러스 프로모터, 조직 특이적, U6(pollIII), 활성화 단백질(TetR-VP16, Gal4-VP16, dCas9-VP16 등)에 대한 상류 DNA 결합 부위가 있는 최소 CMV 프로모터로부터 선택된다. 구현예에서, 프로모터 요소는 TATA 박스를 포함한다. 구현예에서, 프로모터 요소는 예를 들어, 본 명세서에 기재된 바와 같은 야생형 아넬로바이러스에 대하여 내인성이다.

일부 구현예에서, 유전 요소는 하기의 특징 중 하나 이상을 포함한다: 단일-가닥, 환형, 음성 가닥 및/또는 DNA. 구현예에서, 유전 요소는 에피솜을 포함한다. 일부 구현예에서, 이펙터를 배제한 유전 요소의 부분은 약 2.5 내지 5 kb(예를 들어, 약 2.8 내지 4kb, 약 2.8 내지 3.2kb, 약 3.6 내지 3.9kb 또는 약 2.8 내지 2.9kb), 약 5kb 미만(예를 들어, 약 2.9kb, 3.2 kb, 3.6kb, 3.9kb 또는 4kb 미만) 또는 적어도 100개의 뉴클레오티드(예를 들어, 적어도 1kb)의 조합된 크기를 갖는다.

본 명세서에 기재된 바와 같은 아넬로벡터, 아넬로벡터를 포함하는 조성물, 이러한 아넬로벡터의 사용 방법 등은 일부 예에서 부분적으로, 상이한 이펙터, 예를 들어, (예를 들어, IFN 또는 miR-625에 대한) miRNA, shRNA 등 및 단백질 결합 서열, 예를 들어, 캡시드 단백질, 예컨대 Q99153에 결합하는 DNA 서열을 단백질성 외부, 예를 들어, 문헌[Arch Virol (2007) 152: 1961-1975]에 개시된 캡시드와 조합하여, 이어서 이펙터를 세포(예를 들어, 동물 세포, 예를 들어, 인간 세포 또는 비-인간 동물 세포, 예컨대 돼지 또는 마우스 세포)로 운반하는 데 사용될 수 있는 아넬로벡터를 생성하는 방법을 예시하는 실시예에 기초한다. 일부 구현예에서, 이펙터는 인터페론과 같은 인자의 발현을 침묵화시킬 수 있다. 실시예에는 이펙터를 예를 들어, 아넬로바이러스로부터 유래된 서열 내로 삽입함으로써 아넬로벡터가 제조될 수 있는 방법이 추가로 기재된다. 이들 실시예에 기초하여 이하의 설명은 실시예에서 고려되는 특정 발견 및 조합의 다양한 변형을 고려한다. 예를 들어, 당업자는 특정 miRNA가 단지 이펙터의 예로서 사용되며, 다른 이펙터가 예를 들어, 다른 조절 핵산 또는 치료적 펩티드일 수 있음을 실시예로부터 이해할 것이다. 유사하게, 실시예에 사용되는 특정 캡시드는 하기 기재되는 실질적으로 비-병원성인 단백질에 의해 대체될 수 있다. 실시예에 기재된 특정 아넬로바이러스 서열은 또한 하기 기재되는 아넬로바이러스 서열에 의해 대체될 수 있다. 이들 고려사항은 단백질 결합 서열, 조절 서열, 예컨대 프로모터 등에 유사하게 적용된다. 그와 독립적으로, 당업자는 특히 실시예와 밀접하게 관련이 있는 구현예를 고려할 것이다.

일부 구현예에서, 아넬로벡터 또는 아넬로벡터에 포함되는 유전 요소는 세포(예를 들어, 인간 세포) 내로 도입된다. 일부 구현예에서, 예를 들어, 일단 아넬로벡터 또는 유전 요소가 세포 내로 도입되면, 예를 들어, 아넬로벡터의 유전 요소에 의해 인코딩되는 이펙터(예를 들어, RNA, 예를 들어, miRNA)는 세포(예를 들어, 인간 세포)에서 발현된다. 일부 구현예에서, 세포 내로의 아넬로벡터 또는 거기에 포함된 유전 요소의 도입은 예를 들어, 세포에 의한 표적 분자의 발현 수준을 변경시킴으로써 세포에서 표적 분자(예를 들어, 표적 핵산, 예를 들어, RNA 또는 표적 폴리펩티드)의 수준을 조절한다(예를 들어, 증가시키거나 감소시킨다). 일부 구현예에서, 아넬로벡터 또는 거기에 포함된 유전 요소의 도입은 세포에 의해 생성되는 인터페론의 수준을 감소시킨다. 일부 구현예에서, 세포 내로의 아넬로벡터 또는 거기에 포함된 유전 요소의 도입은 세포의 기능을 조절한다(예를 들어, 증가시키거나 감소시킨다). 일부 구현예에서, 세포 내로의 아넬로벡터 또는 거기에 포함된 유전 요소의 도입은 세포의 생존력을 조절한다(예를 들어, 증가시키거나 감소시킨다). 일부 구현예에서, 세포 내로의 아넬로벡터 또는 거기에 포함된 유전 요소의 도입은 세포(예를 들어, 암 세포)의 생존력을 감소시킨다.

일부 구현예에서, 본 명세서에 기재된 아넬로벡터(예를 들어, 합성 아넬로벡터)은 70% 미만의 항체 출현율(예를 들어, 약 60%, 50%, 40%, 30%, 20% 또는 10% 미만의 항체 출현율)을 유도한다. 일부 구현예에서, 항체 출현율은 당업계에 알려진 방법에 따라 결정된다. 일부 구현예에서, 항체 출현율은 예를 들어, 문헌[Tsuda et al., 1999; J. Virol. Methods 77: 199-206](본 명세서에 참조로 포함됨)에 기재된 항-TTV 항체 검출 방법 및/또는 문헌[Kakkola et al., 2008; Virology 382: 182-189](본 명세서에 참조로 포함됨)에 기재된 항-TTV IgG 혈청학적 출현율의 결정 방법에 따라 생물학적 샘플에서 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 또는 그에 기초한 아넬로벡터에 대한 항체를 검출함으로써 결정된다. 아넬로바이러스 또는 그에 기초한 아넬로벡터에 대한 항체는 또한 항-바이러스 항체를 검출하기 위한 당업계의 방법, 예를 들어, 문헌[Calcedo et al., 2013; Front. Immunol. 4(341): 1-7](본 명세서에 참조로 포함됨)에 기재된 바와 같은 예를 들어, 항-AAV 항체의 검출 방법에 의해 검출될 수 있다.

일부 구현예에서, 복제 결핍, 복제 결함 또는 복제 비적격 유전 요소는 유전 요소의 복제에 필요한 필수 기구 또는 구성성분의 전부를 인코딩하지 않는다. 일부 구현예에서, 복제 결함 유전 요소는 복제 인자를 인코딩하지 않는다. 일부 구현예에서, 복제 결함 유전 요소는 하나 이상의 ORF(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3)를 인코딩하지 않는다. 일부 구현예에서, 유전 요소에 의해 인코딩되지 않는 기구 또는 구성성분은 (예를 들어, 헬퍼, 예를 들어, 헬퍼 바이러스 또는 헬퍼 플라스미드를 사용하여, 또는 숙주 세포에 의해 포함되는, 예를 들어, 숙주 세포의 게놈 내로 통합되는 핵산에 인코딩되어) 트랜스로 제공되어, 예를 들어, 유전 요소가 트랜스로 제공되는 기구 또는 구성성분의 존재 하에 복제를 겪을 수 있게 할 수 있다.

일부 구현예에서, 패키징 결핍, 패키징 결함 또는 패키징 비적격 유전 요소는 단백질성 외부(예를 들어, 단백질성 외부는 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는, 캡시드 또는 이의 부분을 포함함) 내에 패키징될 수 없다. 일부 구현예에서, 패키징 결핍 유전 요소는 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 10% 미만(예를 들어, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.01% 또는 0.001% 미만)의 효율로 단백질성 외부 내로 패키징된다. 일부 구현예에서, 패키징 결함 유전 요소는 심지어 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서도 단백질성 외부 내에 패키징될 수 없다. 일부 구현예에서, 패키징 결핍 유전 요소는 심지어 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서도, (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 10% 미만(예를 들어, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.01% 또는 0.001% 미만)의 효율로 단백질성 외부 내로 패키징된다.

일부 구현예에서, 패키징 적격 유전 요소는 단백질성 외부(예를 들어, 단백질성 외부는 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는, 캡시드 또는 이의 부분을 포함함) 내로 패키징될 수 있다. 일부 구현예에서, 패키징 적격 유전 요소는 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 적어도 20%(예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 이상)의 효율로 단백질성 외부 내에 패키징된다. 일부 구현예에서, 패키징 적격 유전 요소는 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서, 단백질성 외부 내로 패키징될 수 있다. 일부 구현예에서, 패키징 적격 유전 요소는 (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서, (예를 들어, 본 명세서에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 적어도 20%(예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 이상)의 효율로 단백질성 외부 내로 패키징된다.

아넬로바이러스

일부 구현예에서, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터는 아넬로바이러스로부터 유래된 서열 또는 발현 생성물을 포함한다. 일부 구현예에서, 아넬로벡터는 아넬로바이러스에 비하여 외인성인 하나 이상의 서열 또는 발현 생성물을 포함한다. 일부 구현예에서, 아넬로벡터는 아넬로바이러스에 비하여 내인성인 하나 이상의 서열 또는 발현 생성물을 포함한다. 일부 구현예에서, 아넬로벡터는 아넬로벡터 내의 하나 이상의 다른 서열 또는 발현 생성물에 비하여 이종인 하나 이상의 서열 또는 발현 생성물을 포함한다. 아넬로바이러스는 일반적으로 음의 극성을 갖는 단일-가닥 환형 DNA 게놈을 갖는다. 아넬로바이러스는 일반적으로 임의의 인간 질환과 연관된 바 없다. 그러나, 아넬로바이러스 감염을 인간 질환과 연관시키려는 시도는 대조군 코호트 집단(들)에서의 무증상 아넬로바이러스 바이러스혈증의 높은 유병률, 아넬로바이러스 과 내의 현저한 게놈 다양성, 종래에 시험관 내에서 작용제를 전파할 수 없음, 아넬로바이러스 질환의 동물 모델(들)의 결여에 의해 혼동되었다(문헌[Yzebe et al., Panminerva Med. (2002) 44:167-177]; 문헌[Biagini, P., Vet. Microbiol. (2004) 98:95-101]).

아넬로바이러스는 일반적으로 구비강 또는 배변-구강 감염, 모에서 유아로의 전염 및/또는 자궁 내의 전염에 의해 전염된다(문헌[Gerner et al., Ped. Infect. Dis. J. (2000) 19:1074-1077]). 감염된 사람은 일부 예에서, 장기의(수개월 내지 수년) 아넬로바이러스 바이러스혈증이라는 특징이 나타날 수 있다. 인간은 한가지 초과의 유전자군 또는 바이러스주로 동시-감염될 수 있다(문헌[Saback, et al., Scad. J. Infect. Dis. (2001) 33:121-125]). 이들 유전자군이 감염된 인간 내에서 재조합될 수 있다는 제안이 존재한다(문헌[Rey et al., Infect. (2003) 31:226-233]). 이중 가닥 아이소폼(복제성) 중간체는 몇몇의 조직, 예컨대 간, 말초 혈액 단핵 세포 및 골수에서 관찰된 바 있다(문헌[Kikuchi et al., J. Med. Virol. (2000) 61:165-170]; 문헌[Okamoto et al., Biochem. Biophys. Res. Commun. (2002) 270:657-662]; 문헌[Rodriguez-lnigo et al., Am. J. Pathol. (2000) 156:1227-1234]).

일부 구현예에서, 유전 요소는 아미노산 서열 또는 이의 기능적 단편, 또는 본 명세서에 기재된 아미노산 서열, 예를 들어, 아넬로바이러스 아미노산 서열 중 어느 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 인코딩하는 뉴클레오티드 서열을 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 아넬로벡터는 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 서열 또는 이의 단편에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 아넬로벡터는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스의 TATA 박스, cap 부위, 개시인자 요소, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, GC-풍부 영역 중 하나 이상 또는 이의 임의의 조합에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 포함한다. 일부 구현예에서, 핵산 분자는 캡시드 단백질을 인코딩하는 서열, 예를 들어, 본 명세서에 기재된 아넬로바이러스 중 임의의 것의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 서열을 포함한다. 구현예에서, 핵산 분자는 아넬로바이러스 ORF1 단백질(또는 이의 스플라이스 변이체 또는 기능적 단편) 또는 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 폴리펩티드에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질을 인코딩하는 서열을 포함한다.

일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1 핵산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.

일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1 핵산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.

일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1 핵산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 TAIP 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.

일부 구현예에서, 유전 요소는 아미노산 서열 또는 이의 기능적 단편을 인코딩하는 뉴클레오티드 서열 또는 본 명세서에 기재된 아미노산 서열, 예를 들어, 아넬로바이러스 아미노산 서열 중 임의의 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 아넬로벡터는, 예를 들어 본 명세서에 기재된 바와 같은, 아넬로바이러스 서열, 또는 이의 단편에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 포함한다. 구현예에서, 아넬로벡터는 표 A1 내지 M2 중 임의의 것에 나타낸 바와 같은 서열, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열로부터 선택되는 핵산 서열을 포함한다. 구현예에서, 아넬로벡터는 표 A2 내지 M2 중 임의의 것에 나타낸 바와 같은 서열, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 폴리펩티드를 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 아넬로벡터는 본 명세서에 기재된 아넬로바이러스(예를 들어, 표 A 내지 M 중 어느 하나에 주석이 달리거나, 그에 열거된 서열에 의해 인코딩되는 바와 같은 아넬로바이러스 서열) 중 어느 하나의 TATA 박스, 캡 부위, 개시인자 요소, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, GC-풍부 영역 중 하나 이상 또는 이의 임의의 조합에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 포함한다. 일부 구현예에서, 핵산 분자는 캡시드 단백질을 인코딩하는 서열, 예를 들어, 본 명세서에 기재된 아넬로바이러스(예를 들어, 표 A 내지 M 중 어느 하나에 주석이 달리거나, 그에 열거된 서열에 의해 인코딩되는 바와 같은 아넬로바이러스 서열) 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 서열을 포함한다. 일부 구현예에서, 핵산 분자는 아넬로바이러스 ORF1 또는 ORF2 단백질(예를 들어, 표 A2 내지 M2 중 어느 하나에 나타낸 바와 같은 ORF1 또는 ORF2 아미노산 서열, 또는 표 A1 내지 M1 중 어느 하나에 나타낸 바와 같은 핵산 서열에 의해 인코딩되는 ORF1 또는 ORF2 아미노산 서열)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질을 인코딩하는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 표 A2 내지 M2 중 어느 하나에 나타낸 바와 같은 ORF1 아미노산 서열 또는 표 A1 내지 M1 중 어느 하나에 나타낸 바와 같은 핵산 서열에 의해 인코딩되는 ORF1 아미노산 서열)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질을 인코딩하는 서열을 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 아넬로벡터는 키메라 아넬로벡터이다. 일부 구현예에서, 키메라 아넬로벡터는 아넬로바이러스 이외의 바이러스 유래의 하나 이상의 요소, 폴리펩티드, 또는 핵산을 추가로 포함한다.

일부 구현예에서, 키메라 아넬로벡터는 복수의 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음)로부터의 서열을 포함하는 복수의 폴리펩티드(예를 들어, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3)를 포함한다. 예를 들어, 키메라 아넬로벡터는 하나의 아넬로바이러스 유래의 ORF1 분자(예를 들어, Ring1 ORF1 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또한 99% 아미노산 서열 동일성을 갖는 ORF1 분자) 및 상이한 아넬로바이러스 유래의 ORF2 분자(예를 들어, Ring2 ORF2 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2 분자)를 포함할 수 있다. 또 다른 예에서, 키메라 아넬로벡터는 아넬로바이러스 유래의 제1 ORF1 분자(예를 들어, Ring1 ORF1 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1 분자) 및 상이한 아넬로바이러스 유래의 제2 ORF1 분자(예를 들어, Ring2 ORF1 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산을 갖는 ORF1 분자)를 포함할 수 있다.

일부 구현예에서, 아넬로벡터는, 예를 들어, 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 적어도 하나의 부분 및 상이한 바이러스 유래의 적어도 하나의 부분(예를 들어, 본 명세서에 기재된 바와 같음)을 포함하는, 키메라 폴리펩티드(예를 들어, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3)를 포함한다.

일부 구현예에서, 아넬로벡터는, 예를 들어 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 적어도 하나의 부분 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 적어도 하나의 부분을 포함하는, 키메라 폴리펩티드(예를 들어, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3)를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1 분자의 적어도 하나의 부분, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1 분자, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1 분자의 적어도 하나의 부분을 포함하는 키메라 ORF1 분자를 포함한다. 일부 구현예에서, 키메라 ORF1 분자는 하나의 아넬로바이러스 유래의 ORF1 젤리-롤 도메인, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열, 및 상이한 아넬로바이러스 유래의 ORF1 아미노산 서열(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 키메라 ORF1 분자는 하나의 아넬로바이러스 유래의 ORF1 아르기닌-풍부 영역, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열, 및 상이한 아넬로바이러스 유래의 ORF1 아미노산 서열(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 키메라 ORF1 분자는 하나의 아넬로바이러스 유래의 ORF1 초가변 도메인, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열, 및 상이한 아넬로바이러스 유래의 ORF1 아미노산 서열(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 키메라 ORF1 분자는 하나의 아넬로바이러스 유래의 ORF1 N22 도메인, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열, 및 상이한 아넬로바이러스 유래의 ORF1 아미노산 서열(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 키메라 ORF1 분자는 하나의 아넬로바이러스 유래의 ORF1 C-말단 도메인, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열, 및 상이한 아넬로바이러스 유래의 ORF1 아미노산 서열(예를 들어, 본 명세서에 기재된 바와 같음), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다.

일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1/1 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1/1 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1/1 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1/1 분자를 포함하는 키메라 ORF1/1 분자를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1/2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1/2 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF1/2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF1/2 분자를 포함하는 키메라 ORF1/2 분자를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2 분자를 포함하는 키메라 ORF2 분자를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2/2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2/2 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2/2 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2/2 분자를 포함하는 키메라 ORF2/2 분자를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2/3 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2/3 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2/3 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2/3 분자를 포함하는 키메라 ORF2/3 분자를 포함한다. 일부 구현예에서, 아넬로벡터는 하나의 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2T/3 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2T/3 분자, 및 상이한 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같음) 유래의 ORF2T/3 분자의 적어도 하나의 부분, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 아미노산 서열 동일성을 갖는 ORF2T/3 분자를 포함하는 키메라 ORF2T/3 분자를 포함한다.

본 명세서에 포함된 서열 또는 하위서열이 (예를 들어, 본 명세서에 기재된 바와 같이, 예를 들어, 아넬로벡터의 유전 요소를 형성하기 위해) 본 명세서에 기재된 조성물 및 방법에서 이용될 수 있는 추가의 예시적인 아넬로바이러스 게놈은, 예를 들어, PCT 출원 PCT/US2018/037379 및 PCT/US19/65995(본 명세서에 전문이 참조로 포함됨)에 기재되어 있다. 일부 구현예에서, 예시적인 아넬로바이러스 서열은 PCT/US19/65995(본 명세서에 참조로 포함됨)의 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 또는 17 중 임의의 것에 열거된 바와 같은 핵산 서열을 포함한다. 일부 구현예에서, 예시적인 아넬로바이러스 서열은 PCT/US19/65995(본 명세서에 참조로 포함됨)의 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 또는 18 중 임의의 것에 열거된 바와 같은 아미노산 서열을 포함한다. 일부 구현예에서, 예시적인 아넬로바이러스 서열은, 예를 들어, PCT/US19/65995(본 명세서에 참조로 포함됨)의 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, 또는 37A 내지 37C 중 임의의 것에 열거된 바와 같은, ORF1 분자 서열, 또는 이를 인코딩하는 핵산 서열을 포함한다.

[표 A1] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스, 클레이드 3)

[표 A2] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스, 클레이드 3)

[표 B1] 예시적인 아넬로바이러스 핵산 서열(베타토르크바이러스)

[표 B2] 예시적인 아넬로바이러스 아미노산 서열(베타토르크바이러스)

[표 C1] 예시적인 아넬로바이러스 핵산 서열(감마토르크바이러스)

[표 C2] 예시적인 아넬로바이러스 아미노산 서열(감마토르크바이러스)

일부 구현예에서, 아넬로벡터는 본 명세서에 전문이 참조로 포함된 PCT 출원 PCT/US2018/037379에 열거된 서열을 포함하는 핵산을 포함한다. 일부 구현예에서, 아넬로벡터는 본 명세서에 전문이 참조로 포함된 PCT 출원 PCT/US2018/037379에 열거된 서열을 포함하는 폴리펩티드를 포함한다. 일부 구현예에서, 아넬로벡터는 본 명세서에 전문이 참조로 포함된 PCT 출원 PCT/US19/65995에 열거된 서열을 포함하는 핵산을 포함한다. 일부 구현예에서, 아넬로벡터는 본 명세서에 전문이 참조로 포함된 PCT 출원 PCT/US19/65995에 열거된 서열을 포함하는 폴리펩티드를 포함한다.

ORF1 분자

일부 구현예에서, 아넬로벡터는 ORF1 분자 및/또는 ORF1 분자를 인코딩하는 핵산을 포함한다. 일반적으로, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질)의 구조적 특징 및/또는 활성을 갖는 폴리펩티드를 포함한다. 일부 구현예에서, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질)에 비해 절단을 포함한다. ORF1 분자는, 예를 들어, 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같음), 예를 들어 캡시드를 형성하기 위해, 다른 ORF1 분자에 결합할 수 있다. 일부 구현예에서, 단백질성 외부는 핵산 분자(예를 들어, 본 명세서에 기재된 바와 같은 유전 요소)를 봉입할 수 있다. 일부 구현예에서, 복수의 ORF1 분자는, 예를 들어, 단백질성 외부를 형성하기 위해, 다량체를 형성할 수 있다. 일부 구현예에서, 다량체는 동종다량체일 수 있다. 다른 구현예에서, 다량체는 이종다량체일 수 있다.

ORF1 분자는 일부 구현예에서, 하기 중 하나 이상을 포함할 수 있다: 아르기닌-풍부 영역, 예를 들어, 적어도 60%의 염기성 잔기(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 염기성 잔기; 예를 들어, 60% 내지 90%, 60% 내지 80%, 70% 내지 90% 또는 70 내지 80%의 염기성 잔기)를 갖는 영역을 포함하는 제1 영역, 및 젤리-롤 도메인, 예를 들어, 적어도 6개의 베타 가닥(예를 들어, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 베타 가닥)을 포함하는 제2 영역.

아르기닌-풍부 영역

아르기닌-풍부 영역은 본 명세서에 기재된 아르기닌-풍부 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖거나, 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 이의 조합)를 포함하는 적어도 약 40개 아미노산의 서열을 갖는다.

젤리 롤 도메인

젤리-롤 도메인 또는 영역은 하기의 특징 중 하나 이상(예를 들어, 1, 2 또는 3개)을 포함하는 폴리펩티드(예를 들어, 더 큰 폴리펩티드에 포함된 도메인 또는 영역)를 포함한다(예를 들어, 이로 이루어진다):

(i) 젤리-롤 도메인의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)의 아미노산이 하나 이상의 β-시트의 부분임;

(ii) 젤리-롤 도메인의 2차 구조는 적어도 4개(예를 들어, 적어도 4, 5, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함함; 및/또는

(iii) 젤리-롤 도메인의 3차 구조는 적어도 2개(예를 들어, 적어도 2, 3 또는 4개)의 β-시트를 포함함; 및/또는

(iv) 젤리-롤 도메인은 적어도 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-시트 대 α-나선의 비를 포함함.

특정 구현예에서, 젤리-롤 도메인은 2개의 β-시트를 포함한다.

특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 약 8개(예를 들어, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함한다. 특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 8개의 β-가닥을 포함한다. 특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 7개의 β-가닥을 포함한다. 특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 6개의 β-가닥을 포함한다. 특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 5개의 β-가닥을 포함한다. 특정 구현예에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 4개의 β-가닥을 포함한다.

일부 구현예에서, 젤리-롤 도메인은 제2 β-시트에 대한 역평행 배향의 제1 β-시트를 포함한다. 특정 구현예에서, 제1 β-시트는 약 4개(예를 들어, 3, 4, 5 또는 6개)의 β-가닥을 포함한다. 특정 구현예에서, 제2 β-시트는 약 4개(예를 들어, 3, 4, 5 또는 6개)의 β-가닥을 포함한다. 구현예에서, 제1 및 제2 β-시트는 총 약 8개(예를 들어, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함한다.

특정 구현예에서, 젤리-롤 도메인은 캡시드 단백질(예를 들어, 본 명세서에 기재된 바와 같은 ORF1 분자)의 구성성분이다. 특정 구현예에서, 젤리-롤 도메인은 자가-조립 활성을 갖는다. 일부 구현예에서, 젤리-롤 도메인을 포함하는 폴리펩티드는 젤리-롤 도메인을 포함하는 또 다른 카피의 폴리펩티드에 결합한다. 일부 구현예에서, 제1 폴리펩티드의 젤리-롤 도메인은 제2 카피의 폴리펩티드의 젤리-롤 도메인에 결합한다.

N22 도메인

ORF1 분자는 또한, 아넬로바이러스 N22 도메인(예를 들어, 본 명세서에 기재된 바와 같음, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 N22 도메인)의 구조 또는 활성을 포함하는 제3 영역, 및/또는 아넬로바이러스 C-말단 도메인(CTD)(예를 들어, 본 명세서에 기재된 바와 같음, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 CTD)의 구조 또는 활성을 포함하는 제4 영역을 포함할 수 있다. 일부 구현예에서, ORF1 분자는 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함한다.

초가변 영역(HVR)

ORF1 분자는 일부 구현예에서, 초가변 영역(HVR), 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 HVR을 추가로 포함할 수 있다. 일부 구현예에서, HVR은 제2 영역과 제3 영역 사이에 위치한다. 일부 구현예에서, HVR은 적어도 약 55개(예를 들어, 적어도 약 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60 또는 65개)의 아미노산(예를 들어, 약 45 내지 160, 50 내지 160, 55 내지 160, 60 내지 160, 45 내지 150, 50 내지 150, 55 내지 150, 60 내지 150, 45 내지 140, 50 내지 140, 55 내지 140 또는 60 내지 140개의 아미노산)을 포함한다.

예시적인 ORF1 서열

예시적인 아넬로바이러스 ORF1 아미노산 서열, 및 예시적인 ORF1 도메인의 서열이 하기 표에 제공된다. 일부 구현예에서, 본 명세서에 기재된 폴리펩티드(예를 들어, ORF1 분자)는, 예를 들어, 표 N 내지 Z 중 임의의 것에 기재된 바와 같은, 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 아넬로벡터는, 예를 들어, 표 N 내지 Z 중 임의의 것에 기재된 바와 같은, 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함한다. 일부 구현예에서, 본 명세서에 기재된 아넬로벡터는, 예를 들어, 표 N 내지 Z 중 임의의 것에 기재된 바와 같은, 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 인코딩하는 핵산 분자(예를 들어, 유전 요소)를 포함한다.

일부 구현예에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 아르기는(Arg)-풍부 도메인, 젤리-롤 도메인, 초가변 영역(HVR), N22 도메인, 또는 C-말단 도메인(CTD)(예를 들어, 표 N 내지 Z 중 임의의 것에 열거된 바와 같음), 또는 이에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열 중 하나 이상을 포함한다. 일부 구현예에서, ORF1 분자는 상이한 아넬로바이러스 유래의 복수의 하위서열(예를 들어, 표 N 내지 Z에 열거된 알파토르크바이러스 클레이드 1 내지 7 하위서열로부터 선택되는 ORF1 하위서열의 임의의 조합)을 포함한다. 구현예에서, ORF1 분자는 하나의 아넬로바이러스 유래의 Arg-풍부 도메인, 젤리-롤 도메인, N22 도메인, 및 CTD 중 하나 이상, 및 또 다른 아넬로바이러스 유래의 HVR을 포함한다. 구현예에서, ORF1 분자는 하나의 아넬로바이러스 유래의 젤리-롤 도메인, HVR, N22 도메인, 및 CTD 중 하나 이상, 및 또 다른 아넬로바이러스 유래의 Arg-풍부 도메인을 포함한다. 구현예에서, ORF1 분자는 하나의 아넬로바이러스 유래의 Arg-풍부 도메인, HVR, N22 도메인, 및 CTD 중 하나 이상, 및 또 다른 아넬로바이러스 유래의 젤리-롤 도메인을 포함한다. 구현예에서, ORF1 분자는 하나의 아넬로바이러스 유래의 Arg-풍부 도메인, 젤리-롤 도메인, HVR, 및 CTD 중 하나 이상, 및 또 다른 아넬로바이러스 유래의 N22 도메인을 포함한다. 구현예에서, ORF1 분자는 하나의 아넬로바이러스 유래의 Arg-풍부 도메인, 젤리-롤 도메인, HVR, 및 N22 도메인 중 하나 이상, 및 또 다른 아넬로바이러스로 유래의 CTD를 포함한다.

ORF1 분자, 또는 이의 스플라이스 변이체 또는 기능적 단편이 (예를 들어, 유전 요소를 봉입함으로써, 예를 들어 아넬로벡터의 단백질성 외부를 형성하기 위해) 본 명세서에 기재된 조성물 및 방법에 이용될 수 있는 추가의 예시적인 아넬로바이러스는, 예를 들어 PCT 출원 PCT/US2018/037379 및 PCT/US19/65995(본 명세서에 전문이 참조로 포함됨)에 기재되어 있다.

[표 N] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스, 클레이드 3)

[표 O] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스, 클레이드 3)

[표 P] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(베타토르크바이러스)

[표 Q] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(베타토르크바이러스)

[표 R] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스)

[표 S] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스)

일부 구현예에서, 제1 영역은 핵산 분자(예를 들어, DNA)에 결합할 수 있다. 일부 구현예에서, 염기성 잔기는 아르기닌, 히스티딘 또는 라이신 또는 이의 조합으로부터 선택된다. 일부 구현예에서, 제1 영역은 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아르기닌 잔기(예를 들어, 60% 내지 90%, 60% 내지 80%, 70% 내지 90% 또는 70 내지 80%의 아르기닌 잔기)를 포함한다. 일부 구현예에서, 제1 영역은 약 30 내지 120개의 아미노산(예를 들어, 약 40 내지 120, 40 내지 100, 40 내지 90, 40 내지 80, 40 내지 70, 50 내지 100, 50 내지 90, 50 내지 80, 50 내지 70, 60 내지 100, 60 내지 90 또는 60 내지 80개의 아미노산)을 포함한다. 일부 구현예에서, 제1 영역은 바이러스 ORF1 아르기닌-풍부 영역(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 아르기닌-풍부 영역)의 구조 또는 활성을 포함한다. 일부 구현예에서, 제1 영역은 핵 국소화 신호를 포함한다.

일부 구현예에서, 제2 영역은 젤리-롤 도메인, 예를 들어, 바이러스 ORF1 젤리-롤 도메인(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 젤리-롤 도메인)의 구조 또는 활성을 포함한다. 일부 구현예에서, 제2 영역은 또 다른 ORF1 분자의 제2 영역에 결합하여, 예를 들어, 단백질성 외부(예를 들어, 캡시드) 또는 이의 부분을 형성할 수 있다.

일부 구현예에서, 제4 영역은 단백질성 외부(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1 분자의 다량체를 포함하는 단백질성 외부)의 표면 상에 노출된다.

일부 구현예에서, 제1 영역, 제2 영역, 제3 영역, 제4 영역 및/또는 HVR은 각각 4개 미만(예를 들어, 0, 1, 2 또는 3개)의 베타 시트를 포함한다.

일부 구현예에서, 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및/또는 HVR 중 하나 이상은 이종 아미노산 서열(예를 들어, 이종 ORF1 분자로부터의 상응하는 영역)에 의해 대체될 수 있다. 일부 구현예에서, 이종 아미노산 서열은 예를 들어, 본 명세서에 기재된 바와 같은, 요망되는 작용성을 갖는다.

일부 구현예에서, ORF1 분자는 (예를 들어, PCT/US19/65995의 도 34에 나타낸 바와 같이) 복수의 보존된 모티프(예를 들어, 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 아미노산을 포함하는 모티프)를 포함한다. 일부 구현예에서, 보존된 모티프는 하나 이상의 야생형 아넬로바이러스 클레이드(예를 들어, 알파토르크바이러스, 클레이드 1; 알파토르크바이러스, 클레이드 2; 알파토르크바이러스, 클레이드 3; 알파토르크바이러스, 클레이드 4; 알파토르크바이러스, 클레이드 5; 알파토르크바이러스, 클레이드 6; 알파토르크바이러스, 클레이드 7; 베타토르크바이러스; 및/또는 감마토르크바이러스)의 ORF1 단백질에 대하여 60, 70, 80, 85, 90, 95 또는 100% 서열 동일성을 보일 수 있다. 구현예에서, 보존된 모티프는 각각 1 내지 1000개(예를 들어, 5 내지 10, 5 내지 15, 5 내지 20, 10 내지 15, 10 내지 20, 15 내지 20, 5 내지 50, 5 내지 100, 10 내지 50, 10 내지 100, 10 내지 1000, 50 내지 100, 50 내지 1000 또는 100 내지 1000개)의 아미노산의 길이를 갖는다. 특정 구현예에서, 보존된 모티프는 약 2 내지 4%(예를 들어, 약 1 내지 8%, 1 내지 6%, 1 내지 5%, 1 내지 4%, 2 내지 8%, 2 내지 6%, 2 내지 5% 또는 2 내지 4%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 100% 서열 동일성을 보인다. 특정 구현예에서, 보존된 모티프는 약 5 내지 10%(예를 들어, 약 1 내지 20%, 1 내지 10%, 5 내지 20% 또는 5 내지 10%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 80% 서열 동일성을 보인다. 특정 구현예에서, 보존된 모티프는 약 10 내지 50%(예를 들어, 약 10 내지 20%, 10 내지 30%, 10 내지 40%, 10 내지 50%, 20 내지 40%, 20 내지 50% 또는 30 내지 50%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 60% 서열 동일성을 보인다. 일부 구현예에서, 보존된 모티프는 표 19에 열거된 바와 같은 하나 이상의 아미노산 서열을 포함한다.

일부 구현예에서, ORF1 분자는 예를 들어, 본 명세서에 기재된 바와 같은, 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변화)를 포함한다.

N22 도메인 내의 보존된 ORF1 모티프

일부 구현예에서, 본 명세서에 기재된 폴리펩티드(예를 들어, ORF1 분자)는 아미노산 서열 YNPX²DXGX²N(서열번호 829)을 포함하며, Xⁿ은 임의의 n개의 아미노산의 인접 서열이다. 예를 들어, X²는 임의의 2개의 아미노산의 인접 서열을 나타낸다. 일부 구현예에서, YNPX²DXGX²N(서열번호 829)은 예를 들어, 본 명세서에 기재된 바와 같은, ORF1 분자의 N22 도메인 내에 포함된다. 일부 구현예에서, 본 명세서에 기재된 유전 요소는 아미노산 서열 YNPX²DXGX²N(서열번호 829)을 인코딩하는 핵산 서열(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1 분자를 인코딩하는 핵산 서열)을 포함하며, Xⁿ은 임의의 n개의 아미노산의 인접 서열이다.

일부 구현예에서, 폴리펩티드(예를 들어, ORF1 분자)는 예를 들어, N22 도메인 내의, 예를 들어, YNPX²DXGX²N(서열번호 829) 모티프의 부분을 포함하고/포함하거나 이에 측접하는 보존된 2차 구조를 포함한다. 일부 구현예에서, 보존된 2차 구조는 제1 베타 가닥 및/또는 제2 베타 가닥을 포함한다. 일부 구현예에서, 제1 베타 가닥은 약 5 내지 6개(예를 들어, 3, 4, 5, 6, 7 또는 8개)의 아미노산 길이이다. 일부 구현예에서, 제1 베타 가닥은 YNPX²DXGX²N(서열번호 829) 모티프의 N-종말단에 티로신(Y) 잔기를 포함한다. 일부 구현예에서, YNPX²DXGX²N(서열번호 829) 모티프는 랜덤 코일(예를 들어, 약 8 내지 9개 아미노산의 랜덤 코일)을 포함한다. 일부 구현예에서, 제2 베타 가닥은 약 7 내지 8개(예를 들어, 5, 6, 7, 8, 9 또는 10개) 아미노산 길이이다. 일부 구현예에서, 제2 베타 가닥은 YNPX²DXGX²N(서열번호 829) 모티프의 C-종말단에 아스파라긴(N) 잔기를 포함한다.

예시적인 YNPX²DXGX²N(서열번호 829) 모티프-측접 2차 구조는 PCT/US19/65995(본 명세서에 전문이 참조로 포함됨)의 실시예 47 및 도 48에 기재되어 있다. 일부 구현예에서, ORF1 분자는 PCT/US19/65995의 도 48에 나타낸 2차 구조 요소(예를 들어, 베타 가닥)의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다. 일부 구현예에서, ORF1 분자는 (예를 들어, 본 명세서에 기재된 바와 같은) YNPX²DXGX²N(서열번호 829) 모티프에 측접하는, PCT/US19/65995의 도 48에 나타낸 2차 구조 요소(예를 들어, 베타 가닥) 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다.

ORF1 젤리-롤 도메인 내의 보존된 2차 구조 모티프

일부 구현예에서, 본 명세서에 기재된 폴리펩티드(예를 들어, ORF1 분자)는 (예를 들어, 본 명세서에 기재된 바와 같은) 아넬로바이러스 ORF1 단백질에 의해 포함되는 하나 이상의 2차 구조 요소를 포함한다. 일부 구현예에서, ORF1 분자는 (예를 들어, 본 명세서에 기재된 바와 같은) 아넬로바이러스 ORF1 단백질의 젤리-롤 도메인에 의해 포함되는 하나 이상의 2차 구조 요소를 포함한다. 일반적으로, ORF1 젤리-롤 도메인은 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및 제9 베타 가닥을 포함하는 2차 구조를 포함한다. 일부 구현예에서, ORF1 분자는 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및/또는 제9 베타 가닥을 포함하는 2차 구조를 포함한다.

일부 구현예에서, 보존된 2차 구조 요소(즉, 베타 가닥 및/또는 알파 나선)의 쌍은 예를 들어, 랜덤 코일 서열, 베타 가닥 또는 알파 나선 또는 이의 조합을 포함하는 개재 아미노산 서열에 의해 분리된다. 보존된 2차 구조 요소 사이의 개재 아미노산 서열은 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개, 또는 그 이상의 아미노산을 포함할 수 있다. 일부 구현예에서, ORF1 분자는 하나 이상의 추가의 베타 가닥 및/또는 알파 나선을 (예를 들어, 젤리-롤 도메인 내에) 추가로 포함할 수 있다. 일부 구현예에서, 연속 베타 가닥 또는 연속 알파 나선이 조합될 수 있다. 일부 구현예에서, 제1 베타 가닥 및 제2 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 구현예에서, 제3 베타 가닥 및 제4 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 구현예에서, 제4 베타 가닥 및 제5 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 구현예에서, 제6 베타 가닥 및 제7 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 구현예에서, 제7 베타 가닥 및 제8 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 구현예에서, 제8 베타 가닥 및 제9 베타 가닥은 더 큰 베타 가닥 내에 포함된다.

일부 구현예에서, 제1 베타 가닥은 약 5 내지 7개(예를 들어, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다. 일부 구현예에서, 제2 베타 가닥은 약 15 내지 16개(예를 들어, 13, 14, 15, 16, 17, 18 또는 19개)의 아미노산 길이이다. 일부 구현예에서, 제1 알파 나선은 약 15 내지 17개(예를 들어, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 아미노산 길이이다. 일부 구현예에서, 제3 베타 가닥은 약 3 내지 4개(예를 들어, 1, 2, 3, 4, 5 또는 6개)의 아미노산 길이이다. 일부 구현예에서, 제4 베타 가닥은 약 10 내지 11개(예를 들어, 8, 9, 10, 11, 12 또는 13개)의 아미노산 길이이다. 일부 구현예에서, 제5 베타 가닥은 약 6 내지 7개(예를 들어, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다. 일부 구현예에서, 제2 알파 나선은 약 8 내지 14개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 17개)의 아미노산 길이이다. 일부 구현예에서, 제2 알파 나선은 (예를 들어, 랜덤 코일 서열에 의해 분리된) 2개의 더 작은 알파 나선으로 파단될 수 있다. 일부 구현예에서, 2개의 더 작은 알파 나선의 각각은 약 4 내지 6개(예를 들어, 2, 3, 4, 5, 6, 7 또는 8개)의 아미노산 길이이다. 일부 구현예에서, 제6 베타 가닥은 약 4 내지 5개(예를 들어, 2, 3, 4, 5, 6 또는 7개)의 아미노산 길이이다. 일부 구현예에서, 제7 베타 가닥은 약 5 내지 6개(예를 들어, 3, 4, 5, 6, 7, 8 또는 9개)의 아미노산 길이이다. 일부 구현예에서, 제8 베타 가닥은 약 7 내지 9개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개)의 아미노산 길이이다. 일부 구현예에서, 제9 베타 가닥은 약 5 내지 7개(예를 들어, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다.

예시적인 젤리-롤 도메인 2차 구조는 PCT/US19/65995의 실시예 47 및 본 명세서의 도 25에 기재되어 있다. 일부 구현예에서, ORF1 분자는 본 명세서의 도 25에 나타낸 젤리-롤 도메인 2차 구조 중 임의의 것의 2차 구조 요소(예를 들어, 베타 가닥 및/또는 알파 나선)의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다.

컨센서스 ORF1 도메인 서열

일부 구현예에서, 예를 들어, 본 명세서에 기재된 바와 같은, ORF1 분자는 젤리-롤 도메인, N22 도메인, 및/또는 C-말단 도메인(CTD) 중 하나 이상을 포함한다. 일부 구현예에서, 젤리-롤 도메인은 본 명세서에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) 젤리-롤 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, N22 도메인은 본 명세서에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) N22 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, CTD 도메인은 본 명세서에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) CTD 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 표 37A 내지 37C 중 어느 하나에 형식 "(X_a-b)"로 열거된 아미노산은 인접 아미노산의 연속물을 포함하며, 여기서, 연속물은 적어도 a개 및 최대 b개의 아미노산을 포함한다. 특정 구현예에서, 연속물에서 모든 아미노산은 동일하다. 다른 구현예에서, 연속물은 적어도 2개(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 21개)의 상이한 아미노산을 포함한다.

[표 37A] 알파토르크바이러스 ORF1 도메인 컨센서스 서열

[표 37B] 베타토르크바이러스 ORF1 도메인 컨센서스 서열

[표 37C] 감마토르크바이러스 ORF1 도메인 컨센서스 서열

일부 구현예에서, 젤리-롤 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, 또는 37A 내지 37C 중 임의의 것에 열거된 바와 같은 젤리-롤 도메인 아미노산 서열, 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, N22 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, 또는 37A 내지 37C 중 임의의 것에 열거된 바와 같은 N22 도메인 아미노산 서열, 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, CTD 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, 또는 37A 내지 37C 중 임의의 것에 열거된 바와 같은 CTD 도메인 아미노산 서열, 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.

ORF1 단백질 서열의 확인

일부 구현예에서, 아넬로바이러스 ORF1 단백질 서열, 또는 ORF1 단백질을 인코딩하는 핵산 서열은 아넬로바이러스의 게놈(예를 들어, 핵산 서열결정 기법, 예를 들어, 심층 서열결정 기법에 의해 확인된, 예를 들어 추정의 아넬로바이러스 게놈)으로부터 확인될 수 있다. 일부 구현예에서, ORF1 단백질 서열은 하기 선택 기준 중 하나 이상(예를 들어, 1, 2개, 또는 3개 전부)에 의해 확인된다:

(i) 길이 선택: 단백질 서열(예를 들어, 하기 (ii) 또는 (iii)에 기재된 기준을 통과하는 추정 아넬로바이러스 ORF1 서열)은 추정 아넬로바이러스 ORF1 단백질을 확인하기 위해 약 600개 초과의 아미노산 잔기에 대해 크기-선택될 수 있다. 일부 구현예에서, 아넬로바이러스 ORF1 단백질 서열은 길이가 적어도 약 600, 650, 700, 750, 800, 850, 900, 950, 또는 1000개의 아미노산 잔기이다. 일부 구현예에서, 알파토르크바이러스 ORF1 단백질 서열은 길이가 적어도 약 700, 710, 720, 730, 740, 750, 760, 770, 780, 790, 800, 900, 또는 1000개 아미노산 잔기이다. 일부 구현예에서, 베타토르크바이러스 ORF1 단백질 서열은 길이가 적어도 약 650, 660, 670, 680, 690, 700, 750, 800, 900, 또는 1000개 아미노산 잔기이다. 일부 구현예에서, 감마토르크바이러스 ORF1 단백질 서열은 길이가 적어도 약 650, 660, 670, 680, 690, 700, 750, 800, 900, 또는 1000개의 아미노산 잔기이다. 일부 구현예에서, 아넬로바이러스 ORF1 단백질을 인코딩하는 핵산 서열은 길이가 적어도 약 1800, 1900, 2000, 2100, 2200, 2300, 2400, 또는 2500개 뉴클레오티드이다. 일부 구현예에서, 알파토르크바이러스 ORF1 단백질 서열을 인코딩하는 핵산 서열은 길이가 적어도 약 2100, 2150, 2200, 2250, 2300, 2400, 또는 2500개 뉴클레오티드이다. 일부 구현예에서, 베타토르크바이러스 ORF1 단백질 서열을 인코딩하는 핵산 서열은 길이가 적어도 약 1900, 1950, 2000, 2500, 2100, 2150, 2200, 2250, 2300, 2400, 또는 2500개 또는 1000개 뉴클레오티드이다. 일부 구현예에서, 감마토르크바이러스 ORF1 단백질 서열을 인코딩하는 핵산 서열은 길이가 적어도 약 1900, 1950, 2000, 2500, 2100, 2150, 2200, 2250, 2300, 2400, 또는 2500 또는 1000개 뉴클레오티드이다.

(ii) ORF1 모티프의 존재: 단백질 서열(예를 들어, 상기 (i) 또는 하기 (iii)에 기재된 기준을 통과하는 추정 아넬로바이러스 ORF1 서열)을 필터링하여 상기 기재된 N22 도메인에 보존된 ORF1 모티프를 함유하는 것들을 확인할 수 있다. 일부 구현예에서, 추정 아넬로바이러스 ORF1 서열은 서열 YNPXXDXGXXN을 포함한다. 일부 구현예에서, 추정 아넬로바이러스 ORF1 서열은 서열 Y[NCS]PXXDX[GASKR]XX[NTSVAK]을 포함한다.

(iii) 아르기닌-풍부 영역의 존재: 단백질 서열(예를 들어, 상기 (i) 및/또는 (ii)에 기재된 기준을 통과하는 추정 아넬로바이러스 ORF1 서열)은 아르기닌-풍부 영역(예를 들어, 본 명세서에 기재된 바와 같음)을 포함하는 것에 대해 필터링될 수 있다. 일부 구현예에서, 추정 아넬로바이러스 ORF1 서열은 적어도 30%(예를 들어, 적어도 약 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%) 아르기닌 잔기를 포함하는 적어도 약 30, 35, 40, 45, 50, 55, 60, 65, 또는 70개 아미노산의 인접 서열을 포함한다. 일부 구현예에서, 추정 아넬로바이러스 ORF1 서열은 적어도 30%(예를 들어, 적어도 약 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%) 아르기닌 잔기를 포함하는 약 35 내지 40, 40 내지 45, 45 내지 50, 50 내지 55, 55 내지 60, 60 내지 65, 또는 65 내지 70개 아미노산의 인접 서열을 포함한다. 일부 구현예에서, 아르기닌-풍부 영역은 추정 아넬로바이러스 ORF1 단백질의 시작 코돈의 적어도 약 30, 40, 50, 60, 70 또는 80개 아미노산 하류에 위치한다. 일부 구현예에서, 아르기닌-풍부 영역은 추정 아넬로바이러스 ORF1 단백질의 시작 코돈의 적어도 약 50개 아미노산 하류에 위치한다.

ORF2 분자

일부 구현예에서, 아넬로벡터는 ORF2 분자 및/또는 ORF2 분자를 인코딩하는 핵산을 포함한다. 일반적으로, ORF2 분자는 아넬로바이러스 ORF2 단백질(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF2 단백질)의 구조적 특징 및/또는 활성을 갖는 폴리펩티드 또는 이의 기능적 단편을 포함한다. 일부 구현예에서, ORF2 분자는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 나타낸 바와 같은 아넬로바이러스 ORF2 단백질 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.

일부 구현예에서, ORF2 분자는 알파토르크바이러스, 베타토르크바이러스 또는 감마토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, ORF2 분자(예를 들어, 알파토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 250개 이하의 아미노산(예를 들어, 약 150 내지 200개의 아미노산)의 길이를 갖는다. 일부 구현예에서, ORF2 분자(예를 들어, 베타토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 약 50 내지 150개의 아미노산의 길이를 갖는다. 일부 구현예에서, ORF2 분자(예를 들어, 감마토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 약 100 내지 200개의 아미노산(예를 들어, 약 100 내지 150개의 아미노산)의 길이를 갖는다. 일부 구현예에서, ORF2 분자는 나선-회전-나선 모티프(예를 들어, 회전 영역에 측접하는 2개의 알파 나선을 포함하는 나선-회전-나선 모티프)를 포함한다. 일부 구현예에서, ORF2 분자는 TTV 분리주 TA278 또는 TTV 분리주 SANBAN의 ORF2 단백질의 아미노산 서열을 포함하지 않는다. 일부 구현예에서, ORF2 분자는 단백질 포스파타제 활성을 갖는다. 일부 구현예에서, ORF2 분자는 예를 들어, 본 명세서에 기재된 바와 같은(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 나타낸 바와 같은) 야생형 ORF2 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변화)를 포함한다.

보존된 ORF2 모티프

일부 구현예에서, 본 명세서에 기재된 폴리펩티드(예를 들어, ORF2 분자)는 아미노산 서열 [W/F]X⁷HX³CX¹CX⁵H(서열번호 949)를 포함하며, 여기서, Xⁿ은 임의의 N개의 아미노산의 인접 서열이다. 구현예에서, X⁷은 임의의 7개의 아미노산의 인접 서열을 나타낸다. 구현예에서, X³은 임의의 3개의 아미노산의 인접 서열을 나타낸다. 구현예에서, X¹은 임의의 단일의 아미노산을 나타낸다. 구현예에서, X⁵는 임의의 5개의 아미노산의 인접 서열을 나타낸다. 일부 구현예에서, [W/F]는 트립토판 또는 페닐알라닌 중 어느 하나일 수 있다. 일부 구현예에서, [W/F]X⁷HX³CX¹CX⁵H(서열번호 949)는 예를 들어, 본 명세서에 기재된 바와 같은 ORF2 분자의 N22 도메인 내에 포함된다. 일부 구현예에서, 본 명세서에 기재된 유전 요소는 아미노산 서열 [W/F]X⁷HX³CX¹CX⁵H(서열번호 949)를 인코딩하는 핵산 서열(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF2 분자를 인코딩하는 핵산 서열)을 포함하며, 여기서, Xⁿ은 임의의 n개의 아미노산의 인접 서열이다.

유전 요소

일부 구현예에서, 아넬로벡터는 유전 요소를 포함한다. 일부 구현예에서, 유전 요소는 하기의 특징 중 하나 이상을 갖는다: 숙주 세포의 게놈과 실질적으로 비-통합성임, 에피솜 핵산임, 단일 가닥 DNA임, 환형임, 약 1 내지 10 kb임, 세포의 핵 내에 존재함, 내인성 단백질에 의해 결합될 수 있음, 이펙터, 예컨대 숙주 또는 표적 세포의 유전자, 활성 또는 기능을 표적화하는 폴리펩티드 또는 핵산(예를 들어, RNA, iRNA, 마이크로RNA)를 생성함. 일 구현예에서, 유전 요소는 실질적으로 비-통합성 DNA이다. 일부 구현예에서, 유전 요소는 패키징 신호, 예를 들어, 캡시드 단백질에 결합하는 서열을 포함한다. 일부 구현예에서, 패키징 또는 캡시드-결합 서열의 외측에서, 유전 요소는 야생형 아넬로바이러스 핵산 서열에 대하여 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% 미만의 서열 동일성을 가지며, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 핵산 서열에 대하여 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% 미만의 서열 동일성을 갖는다. 일부 구현예에서, 패키징 또는 캡시드-결합 서열의 외측에서, 유전 요소는 아넬로바이러스 핵산 서열과 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 500 450, 400, 350, 300, 250, 200, 150 또는 100개 미만의 인접 뉴클레오티드를 갖는다. 특정 구현예에서, 유전 요소는 프로모터 서열, 치료적 이펙터 및 캡시드 결합 단백질을 인코딩하는 서열을 포함하는 환형, 단일 가닥 DNA이다.

일부 구현예에서, 유전 요소는 20 kb 미만(예를 들어, 약 19 kb, 18 kb, 17 kb, 16 kb, 15 kb, 14 kb, 13 kb, 12 kb, 11 kb, 10 kb, 9 kb, 8 kb, 7 kb, 6 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb 또는 그 미만)의 길이를 갖는다. 일부 구현예에서, 유전 요소는 독립적으로 또는 부가적으로 1000b 초과(예를 들어, 적어도 약 1.1 kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 1.7 kb, 1.8 kb, 1.9 kb, 2 kb, 2.1 kb, 2.2 kb, 2.3 kb, 2.4 kb, 2.5 kb, 2.6 kb, 2.7 kb, 2.8 kb, 2.9 kb, 3 kb, 3.1 kb, 3.2 kb, 3.3 kb, 3.4 kb, 3.5 kb, 3.6 kb, 3.7 kb, 3.8 kb, 3.9 kb, 4 kb, 4.1 kb, 4.2 kb, 4.3 kb, 4.4 kb, 4.5 kb, 4.6 kb, 4.7 kb, 4.8 kb, 4.9 kb, 5 kb 또는 그 초과)의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 2.5 내지 4.6, 2.8 내지 4.0, 3.0 내지 3.8 또는 3.2 내지 3.7 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 1.5 내지 2.0, 1.5 내지 2.5, 1.5 내지 3.0, 1.5 내지 3.5, 1.5 내지 3.8, 1.5 내지 3.9, 1.5 내지 4.0, 1.5 내지 4.5 또는 1.5 내지 5.0 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 2.0 내지 2.5, 2.0 내지 3.0, 2.0 내지 3.5, 2.0 내지 3.8, 2.0 내지 3.9, 2.0 내지 4.0, 2.0 내지 4.5 또는 2.0 내지 5.0 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 2.5 내지 3.0, 2.5 내지 3.5, 2.5 내지 3.8, 2.5 내지 3.9, 2.5 내지 4.0, 2.5 내지 4.5 또는 2.5 내지 5.0 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 3.0 내지 5.0, 3.5 내지 5.0, 4.0 내지 5.0 또는 4.5 내지 5.0 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 1.5 내지 2.0, 2.0 내지 2.5, 2.5 내지 3.0, 3.0 내지 3.5, 3.1 내지 3.6, 3.2 내지 3.7, 3.3 내지 3.8, 3.4 내지 3.9, 3.5 내지 4.0, 4.0 내지 4.5 또는 4.5 내지 5.0 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 3.6 내지 3.9 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 2.8 내지 2.9 kb의 길이를 갖는다. 일부 구현예에서, 유전 요소는 약 2.0 내지 3.2 kb의 길이를 갖는다.

일부 구현예에서, 유전 요소는 본 명세서에 기재된 특징, 예를 들어, 실질적으로 비-병원성인 단백질을 인코딩하는 서열, 단백질 결합 서열, 조절 핵산을 인코딩하는 하나 이상의 서열, 하나 이상의 조절 서열, 복제 단백질을 인코딩하는 하나 이상의 서열, 및 기타 서열 중 하나 이상을 포함한다.

일부 구현예에서, 유전 요소를 (예를 들어, 시험관 내 환화에 의해 생성되는) 이중-가닥 환형 DNA로부터 생성하였다. 일부 구현예에서, 유전 요소를 이중-가닥 환형 DNA로부터 회전환 복제에 의해 생성하였다. 일부 구현예에서, 회전환 복제는 세포(예를 들어, 숙주 세포, 예를 들어, 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, HEK293T 세포, A549 세포 또는 Jurkat 세포)에서 발생한다. 일부 구현예에서, 유전 요소는 세포에서 회전환 복제에 의해 지수적으로 복제될 수 있다. 일부 구현예에서, 유전 요소는 세포에서 회전환 복제에 의해 선형적으로 복제될 수 있다. 일부 구현예에서, 이중-가닥 환형 DNA 또는 유전 요소는 세포에서 회전환 복제에 의해 원래의 양의 적어도 2, 4, 8, 16, 32, 64, 128, 256, 518, 1024배 이상을 제공할 수 있다. 일부 구현예에서, 이중-가닥 환형 DNA를 예를 들어, 본 명세서에 기재된 바와 같이, 세포 내로 도입하였다.

일부 구현예에서, 이중-가닥 환형 DNA 및/또는 유전 요소는 하나 이상의 박테리아 플라스미드 요소(예를 들어, 박테리아 복제 원점 또는 선택 가능한 마커, 예를 들어, 박테리아 내성 유전자)를 포함하지 않는다. 일부 구현예에서, 이중-가닥 환형 DNA 및/또는 유전 요소는 박테리아 플라스미드 백본을 포함하지 않는다.

일 구현예에서, 본 발명은 (i) 실질적으로 비-병원성인 외부 단백질, (ii) 유전 요소를 실질적으로 비-병원성인 외부 단백질에 결합시키는 외부 단백질 결합 서열 및 (iii) 조절 핵산을 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소를 포함한다. 이러한 구현예에서, 유전 요소는 고유 바이러스 서열(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 고유 아넬로바이러스 서열)에 대한 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 하나 이상의 서열을 포함할 수 있다.

단백질 결합 서열

많은 바이러스에 의해 사용되는 전략은 바이러스 캡시드 단백질이 이의 게놈 내의 특정 단백질 결합 서열을 인식하는 것이다. 예를 들어, 비세그먼트화된 게놈을 갖는 바이러스, 예컨대 효모의 L-A 바이러스에서, 게놈의 5' 말단에 이차 구조(스템-루프) 및 특정 서열이 존재하며, 이는 둘 모두 바이러스 캡시드 단백질에 결합하는 데 사용된다. 그러나, 세그먼트화된 게놈을 갖는 바이러스, 예컨대 레오바이러스과, 오르쏘믹소바이러스과(Orthomyxoviridae)(인플루엔자), 부니아바이러스(Bunyaviruse) 및 아레나바이러스(Arenaviruse)는 게놈 세그먼트의 각각을 패키징할 필요가 있다. 일부 바이러스는 세그먼트의 상보성 영역을 사용하여, 바이러스가 각각의 게놈 분자 중 하나를 포함시키는 것을 보조한다. 다른 바이러스는 상이한 세그먼트의 각각에 대하여 특이적인 결합 부위를 갖는다. 예를 들어, 문헌[Curr Opin Struct Biol. 2010 Feb; 20(1): 114-120]; 및 문헌[Journal of Virology (2003), 77(24), 13036-13041]을 참조한다.

일부 구현예에서, 유전 요소는 실질적으로 비-병원성인 단백질에 결합하는 단백질 결합 서열을 인코딩한다. 일부 구현예에서, 단백질 결합 서열은 단백질성 외부로의 유전 요소의 패키징을 용이하게 한다. 일부 구현예에서, 단백질 결합 서열은 실질적으로 비-병원성인 단백질의 아르기닌-풍부 영역에 특이적으로 결합한다. 일부 구현예에서, 유전 요소는 PCT/US19/65995의 실시예 8에 기재된 바와 같은 단백질 결합 서열을 포함한다.

일부 구현예에서, 유전 요소는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 서열의 5' UTR 보존된 도메인 또는 GC-풍부 도메인에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 단백질 결합 서열을 포함한다.

일부 구현예에서, 단백질 결합 서열은, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다.

5' UTR 영역

일부 구현예에서, 본 명세서에 기재된 바와 같은 핵산 분자(예를 들어, 유전 요소, 유전 요소 작제물, 또는 유전 요소 영역)는 5' UTR 서열, 예를 들어, 본 명세서에 기재된 바와 같은 5' UTR 보존된 도메인 서열(예를 들어, 표 A1, B1, 또는 C1의 임의의 것), 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다.

일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX₁CAGTCT, 또는 이에 대하여 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX₁CAGTCT, 또는 이에 대하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 뉴클레오티드 차이(예를 들어, 치환, 결실, 또는 추가)를 갖는 핵산 서열을 포함한다. 일부 구현예에서, X₁은 A이다. 구현예에서, X₁은 존재하지 않는다.

일부 구현예에서, 5' UTR 서열은 알파토르크바이러스(예를 들어, Ring1)의 5' UTR의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 표 A1에 열거된 5' UTR 보존된 도메인의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 95% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 95.775% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 A1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97.183% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGC, 또는 이에 대하여 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGC, 또는 이에 대하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 뉴클레오티드 차이(예를 들어, 치환, 결실, 또는 추가)를 갖는 핵산 서열을 포함한다.

일부 구현예에서, 5' UTR 서열은 베타토르크바이러스(예를 들어, Ring2)의 5' UTR의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 표 B1에 열거된 5' UTR 보존된 도메인의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 85% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 87% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 87.324% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 88% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 88.732% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 91% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 91.549% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 92% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 92.958% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 94% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 94.366% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 95% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 95.775% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 B1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97.183% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAGTCT, 또는 이에 대하여 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAGTCT, 또는 이에 대하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 뉴클레오티드 차이(예를 들어, 치환, 결실, 또는 추가)를 갖는 핵산 서열을 포함한다.

일부 구현예에서, 5' UTR 서열은 감마토르크바이러스(예를 들어, Ring4)의 5' UTR의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 표 C1에 열거된 5' UTR 보존된 도메인의 핵산 서열, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 핵산 분자는 표 C1에 열거된 5' UTR 보존된 도메인에 대하여 적어도 97.183% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAGTCT, 또는 이에 대하여 적어도 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 5' UTR 서열은 핵산 서열 AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAGTCT, 또는 이에 대하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 뉴클레오티드 차이(예를 들어, 치환, 결실, 또는 추가)를 갖는 핵산 서열을 포함한다.

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 아넬로바이러스 5' UTR 서열, 예를 들어 표 38에 나타낸 핵산 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 컨센서스 5' UTR 서열의 핵산 서열을 포함하며, X₁, X₂, X₃, X₄및 X₅는 각각 독립적으로, 임의의 뉴클레오티드이며, 예를 들어, X₁ = G 또는 T이며, X₂ = C 또는 A이며, X₃ = G 또는 A이며, X₄ = T 또는 C이며, X₅ = A, C 또는 T이다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 컨센서스 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 예시적인 TTV 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-CT30F 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-HD23a 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-JA20 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-TJN02 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-tth8 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 컨센서스 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 1 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 2 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 3 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 4 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 5 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 6 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 7 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.

[표 38] 아넬로바이러스 유래의 예시적인 5' UTR 서열

5' UTR 서열의 확인

일부 구현예에서, 아넬로바이러스 5' UTR 서열은 아넬로바이러스의 게놈(예를 들어, 핵산 서열결정 기법, 예를 들어, 심층 서열결정 기법에 의해 확인된, 예를 들어, 추정의 아넬로바이러스 게놈) 내에서 확인될 수 있다. 일부 구현예에서, 아넬로바이러스 5' UTR 서열은 하기 단계 중 하나 또는 둘 다에 의해 확인된다:

(i) 환화 접합점의 확인: 일부 구현예에서, 5' UTR은 전장의 환화된 아넬로바이러스 게놈의 환화 접합점 근처에 위치할 것이다. 예를 들어, 서열의 중첩 영역을 확인함으로써 환화 접합점을 확인할 수 있다. 일부 구현예에서, 서열의 중첩 영역은 환화된 전장 아넬로바이러스 게놈 서열을 생성하기 위해 서열로부터 트리밍될 수 있다. 일부 구현예에서, 게놈 서열은 소프트웨어를 사용하여 이러한 방식으로 환화된다. 이론에 결부시키고자 하지 않고, 게놈을 컴퓨터로 환화하면 서열의 시작 위치가 비-생물학적으로 배향될 수 있다. 시퀀스 내의 표지점을 사용하여 서열을 올바른 방향으로 재배향할 수 있다. 예를 들어, 표지점 서열은 본 명세서에 기재된 바와 같은 아넬로바이러스 게놈 내의 하나 이상의 요소(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어 아넬로바이러스의 TATA 박스, cap 부위, 개시인자 요소, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 또는 GC-풍부 영역 중 하나 이상)에 실질적인 상동성을 갖는 서열을 포함할 수 있다.

(ii) 5' UTR 서열의 확인: 일단 추정 아넬로바이러스 게놈 서열이 얻어지면, 서열(또는 이의 부분, 예를 들어, 약 40 내지 50, 50 내지 60, 60 내지 70, 70 내지 80, 80 내지 90, 또는 90 내지 100개 뉴클레오티드의 길이를 가짐)을 하나 이상의 아넬로바이러스 5' UTR 서열(예를 들어, 본 명세서에 기재된 바와 같음)과 비교하여 이에 대한 실질적인 상동성을 갖는 서열을 확인할 수 있다. 일부 구현예에서, 추정 아넬로바이러스 5' UTR 영역은 본 명세서에 기재된 바와 같은 아넬로바이러스 5' UTR에 대하여 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다.

GC-풍부 영역

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 핵산 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 GC-풍부 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 바와 같은 36-뉴클레오티드 GC-풍부 서열(예를 들어, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 1, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 2, TTV 클레이드 1 36-뉴클레오티드 영역, TTV 클레이드 3 36-뉴클레오티드 영역, TTV 클레이드 3 분리주 GH1 36-뉴클레오티드 영역, TTV 클레이드 3 sle1932 36-뉴클레오티드 영역, TTV 클레이드 4 ctdc002 36-뉴클레오티드 영역, TTV 클레이드 5 36-뉴클레오티드 영역, TTV 클레이드 6 36-뉴클레오티드 영역 또는 TTV 클레이드 7 36-뉴클레오티드 영역)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 바와 같은 36-뉴클레오티드 GC-풍부 서열(예를 들어, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 1, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 2, TTV 클레이드 1 36-뉴클레오티드 영역, TTV 클레이드 3 36-뉴클레오티드 영역, TTV 클레이드 3 분리주 GH1 36-뉴클레오티드 영역, TTV 클레이드 3 sle1932 36-뉴클레오티드 영역, TTV 클레이드 4 ctdc002 36-뉴클레오티드 영역, TTV 클레이드 5 36-뉴클레오티드 영역, TTV 클레이드 6 36-뉴클레오티드 영역 또는 TTV 클레이드 7 36-뉴클레오티드 영역)의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 인접 뉴클레오티드를 포함하는 핵산 서열을 포함한다.

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 예를 들어, 표 39에 열거된 바와 같은, 예를 들어, TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 또는 TTV-HD16d로부터 선택되는 알파토르크바이러스 GC-풍부 영역 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 예를 들어, 표 39에 열거된 바와 같은, 예를 들어, TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 또는 TTV-HD16d로부터 선택되는 알파토르크바이러스 GC-풍부 영역 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 104, 105, 108, 110, 111, 115, 120, 122, 130, 140, 145, 150, 155 또는 156개의 인접 뉴클레오티드를 포함하는 핵산 서열을 포함한다.

일부 구현예에서, 36-뉴클레오티드 GC-풍부 서열은 하기로부터 선택된다:

(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(서열번호 160),

(ii) GCGCTX₁CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(서열번호 164), 여기서, X₁은 T, G 또는 A로부터 선택됨;

(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(서열번호 165);

(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(서열번호 166);

(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(서열번호 167);

(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(서열번호 168);

(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(서열번호 169);

(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(서열번호 170);

(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(서열번호 171); 또는

(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(서열번호 172).

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 핵산 서열 CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(서열번호 160)를 포함한다.

일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 컨센서스 GC-풍부 서열의 핵산 서열을 포함하며, X₁, X₄, X₅, X₆, X₇, X₁₂, X₁₃, X₁₄, X₁₅, X₂₀, X₂₁, X₂₂, X₂₆, X₂₉, X₃₀및 X₃₃은 각각 독립적으로 임의의 뉴클레오티드이며, X₂, X₃, X₈, X₉, X₁₀, X₁₁, X₁₆, X₁₇, X₁₈, X₁₉, X₂₃, X₂₄, X₂₅, X₂₇, X₂₈, X₃₁, X₃₂및 X₃₄는 각각 독립적으로 부재이거나, 임의의 뉴클레오티드이다. 일부 구현예에서, X₁내지 X₃₄중 하나 이상(예를 들어, 이들 전부)는 각각 독립적으로 표 39에 특정된 뉴클레오티드(또는 부재)이다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 예시적인 TTV GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 3)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-CT30F GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 7)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-HD23a GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 6)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-JA20 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 및 2)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-TJN02 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 8)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-tth8 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8, 단편 9 또는 이의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 6)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 7에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 8에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 구현예에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 9에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.

[표 39] 아넬로바이러스 유래의 예시적인 GC-풍부 서열

이펙터

일부 구현예에서, 유전 요소는 이펙터, 예를 들어 기능적 이펙터, 예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 치료적 폴리펩티드 또는 핵산, 예를 들어, 세포독성 또는 세포용해 RNA 또는 단백질을 인코딩하는 하나 이상의 서열을 포함할 수 있다. 일부 구현예에서, 기능적 핵산은 비-코딩 RNA이다. 일부 구현예에서, 기능적 핵산은 코딩 RNA이다. 이펙터는 생물학적 활성을 조절할 수 있으며, 예를 들어, 효소 활성, 유전자 발현, 세포 신호전달 및 세포 또는 기관 기능을 증가시키거나 감소시킬 수 있다. 이펙터 활성은 또한 조절 단백질에 결합하여, 조절제의 활성, 예컨대 전사 또는 번역을 조절하는 것을 포함할 수 있다. 이펙터 활성은 또한, 활성화제 또는 저해제 기능을 포함할 수 있다. 예를 들어, 이펙터는 효소에서 증가된 기질 친화성을 촉발시킴으로써 효소 활성을 유도할 수 있으며, 예를 들어, 프룩토스 2,6-비스포스페이트는 포스포프룩토키나제 1을 활성화시키고, 인슐린에 반응하여 당분해 속도를 증가시킨다. 또 다른 예에서, 이펙터는 수용체로의 기질 결합을 저해하고, 이의 활성화를 저해할 수 있으며, 예를 들어, 날트렉손(naltrexone) 및 날록손(naloxone)은 오피오이드 수용체를 활성화시키지 않고 결합하며, 수용체가 오피오이드에 결합하지 못하게 한다. 이펙터 활성은 또한, 단백질 안정성/분해 및/또는 전사물 안정성/분해를 조절하는 것을 포함할 수 있다. 예를 들어, 단백질은 분해를 위해 폴리펩티드 보조-인자인 유비퀴틴에 의해 단백질 상에 표적화되어, 분해에 대해 표시된다. 또 다른 예에서, 이펙터는 효소의 활성 부위를 차단함으로써 효소 활성을 저해하며, 예를 들어, 메토트렉세이트는 천연 기질보다 1000배 더 단단하게 다이하이드로폴레이트 환원효소에 결합하고, 뉴클레오티드 염기 합성을 저해하는, 효소 다이하이드로폴레이트 환원효소에 대한 보조효소인 테트라하이드로폴레이트의 구조적 유사체이다.

일부 구현예에서, 이펙터를 인코딩하는 서열은 유전 요소의 부분이며, 예를 들어, 그것은 본 명세서에 기재된 바와 같이 삽입 부위에서 삽입될 수 있다. 일부 구현예에서, 이펙터를 인코딩하는 서열은 비코딩 영역, 예를 들어, 오픈-리딩 프레임의 3'에, 그리고 유전 요소의 GC-풍부 영역의 5'에 배치된 비코딩 영역에서, TATA 박스의 상류의 5' 비코딩 영역 내에서, 5' UTR 내에서, 폴리-A 신호의 하류 또는 GC-풍부 영역의 상류의 3' 비코딩 영역에서 유전 요소 내로 삽입된다. 일부 구현예에서, 이펙터를 인코딩하는 서열은 예를 들어, 본 명세서에 기재된 바와 같이 TTV-tth8 플라스미드의 뉴클레오티드 약 3588에서, 또는 예를 들어, 본 명세서에 기재된 바와 같이 TTMV-LY2 플라스미드의 뉴클레오티드 약 2843에서 유전 요소 내로 삽입된다. 일부 구현예에서, 이펙터를 인코딩하는 서열은 예를 들어, 본 명세서에 기재된 바와 같이 TTV-tth8 플라스미드의 뉴클레오티드 336 내지 3015에 또는 그 내에, 또는 예를 들어, 본 명세서에 기재된 바와 같이 TTV-LY2 플라스미드의 뉴클레오티드 242 내지 2812에 또는 그 내에 유전 요소 내로 삽입된다. 일부 구현예에서, 이펙터를 인코딩하는 서열은 오픈-리딩 프레임(예를 들어, 본 명세서에 기재된 바와 같은 ORF, 예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 및/또는 ORF2t/3)의 부분 또는 전부를 대체한다.

일부 구현예에서, 이펙터를 인코딩하는 서열은 100 내지 2000개, 100 내지 1000개, 100 내지 500개, 100 내지 200개, 200 내지 2000개, 200 내지 1000개, 200 내지 500개, 500 내지 1000, 500 내지 2000 또는 1000 내지 2000개의 뉴클레오티드를 포함한다. 일부 구현예에서, 이펙터는 예를 들어, 본 명세서에 기재된 바와 같이 핵산 또는 단백질 페이로드이다.

조절 핵산

일부 구현예에서, 이펙터는 조절 핵산이다. 조절 핵산은 내인성 유전자 및/또는 외인성 유전자의 발현을 변경시킨다. 일 구현예에서, 조절 핵산은 숙주 유전자를 표적화한다. 조절 핵산은 내인성 유전자(예를 들어, 본 명세서의 다른 곳에 기재된 바와 같은 miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA)에 혼성화되는 핵산, 외인성 핵산, 예컨대 바이러스 DNA 또는 RNA에 혼성화하는 핵산, RNA에 혼성화하는 핵산, 유전자 전사를 간섭하는 핵산, RNA 번역을 간섭하는 핵산, RNA를 안정화시키거나, 예컨대 분해에 대한 표적화를 통하여 RNA를 불안정화시키는 핵산, 및 DNA 또는 RNA 결합 인자를 조절하는 핵산을 포함할 수 있지만, 이에 제한되지 않는다. 일부 구현예에서, 조절 핵산은 miRNA를 인코딩한다. 일부 구현예에서, 조절 핵산은 야생형 아넬로바이러스에 대해 내인성이다. 일부 구현예에서, 조절 핵산은 야생형 아넬로바이러스에 대해 외인성이다.

일부 구현예에서, 조절 핵산은 통상적으로 5 내지 500개의 염기쌍(특정 RNA 구조에 따라, 예를 들어, miRNA 5 내지 30 bp, lncRNA 200 내지 500 bp)을 함유하는 RNA 또는 RNA-유사 구조를 포함하며, 세포 내의 발현된 표적 유전자의 코딩 서열 또는 세포 내의 발현된 표적 유전자를 인코딩하는 서열과 동일하거나(또는 상보성이거나) 거의 동일한(또는 실질적으로 상보성인) 핵염기 서열을 가질 수 있다.

일부 구현예에서, 조절 핵산은 핵산 서열, 예를 들어, 가이드 RNA(gRNA)를 포함한다. 일부 구현예에서, DNA 표적화 모이어티는 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함한다. gRNA 짧은 합성 RNA는 불완전한 이펙터 모이어티로의 결합에 필요한 "스캐폴드" 서열 및 게놈 표적에 대한 사용자-정의된 약 20개 뉴클레오티드 표적화 서열로 구성될 수 있다. 실시에서, 가이드 RNA 서열은 일반적으로 17 내지 24개의 뉴클레오티드(예를 들어, 19, 20 또는 21개의 뉴클레오티드)의 길이를 갖도록 설계되고 표적화된 핵산 서열에 대하여 상보성이다. 커스텀 gRNA 생성자 및 알고리즘은 효율적인 가이드 RNA의 설계에 사용하기 위하여 상업적으로 이용 가능하다. 유전자 편집은 또한, 천연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합) 및 적어도 하나의 crRNA(뉴클레아제를 편집에 대해 표적화된 서열로 가이드함) 둘 모두를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성되었다. 화학적으로 변형된 sgRNA는 또한, 게놈 편집에서 효율적인 것으로 입증되었으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다.

조절 핵산은 특정 DNA 서열(예를 들어, 프로모터, 유전자의 인핸서, 침묵자 또는 억제자에 인접하거나 그 내의 서열)을 인식하는 gRNA를 포함한다.

특정 조절 핵산은 RNA 간섭(RNAi)의 생물학적 과정을 통하여 유전자 발현을 저해할 수 있다. RNAi 분자는 통상적으로 15 내지 50개의 염기쌍(예컨대 약 18 내지 25개의 염기쌍)을 함유하고, 세포 내의 발현된 표적 유전자의 코딩 서열과 동일하거나(상보성이거나) 또는 거의 동일한(실질적으로 상보성인) 핵염기 서열을 갖는 RNA 또는 RNA-유사 구조를 포함한다. RNAi 분자는 짧은 간섭 RNA(siRNA), 이중-가닥 RNA(dsRNA), 마이크로 RNA(miRNA), 짧은 헤어핀 RNA(shRNA), 메로듀플렉스(meroduplex) 및 다이서(dicer) 기질(미국 특허 8,084,599, 8,349,809 및 8,513,207)을 포함하나 이들에 제한되지 않는다.

긴 비-코딩 RNA(lncRNA)는 100개 초과의 뉴클레오티드의 비-단백질 코딩 전사물로서 정의된다. 이러한 다소 임의의 제한은 lncRNA를 소형 조절 RNA, 예컨대 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA) 및 다른 짧은 RNA로부터 구별한다. 일반적으로, 대다수(약 78%)의 lncRNA는 조직-특이적인 것으로 특성화된다. 근처의 단백질-코딩 유전자에 대하여 반대 방향으로 전사되는(포유동물 게놈 내에 총 lncRNA의 유의미한 비율 약 20%를 포함하는) 분지 lncRNA는 아마도 근처의 유전자의 전사를 조절할 수 있다.

유전 요소는 내인성 유전자 또는 유전자 생성물(예를 들어, mRNA)의 전부 또는 이의 단편에 실질적으로 상보성이거나, 완전히 상보성인 서열을 갖는 조절 핵산을 인코딩할 수 있다. 조절 핵산은 인트론과 엑손 사이의 경계에서의 서열에 상보성이어서, 특정 유전자의 새로 생성된 핵 RNA 전사물이 전사를 위해 mRNA로 성숙되는 것을 방지할 수 있다. 특정 유전자에 상보성인 조절 핵산은 유전자에 대한 mRNA와 혼성화하고, 이의 번역을 방지할 수 있다. 안티센스 조절 핵산은 DNA, RNA 또는 이의 유도체 또는 혼성물일 수 있다.

관심 전사물에 혼성화하는 조절 핵산의 길이는 5 내지 30개의 뉴클레오티드, 약 10 내지 30개의 뉴클레오티드 또는 약 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개, 또는 그 이상의 뉴클레오티드일 수 있다. 표적화된 전사물에 대한 조절 핵산의 동일성의 정도는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%여야 한다.

유전 요소는 조절 핵산, 예를 들어, 표적 유전자의 약 5 내지 약 25개의 인접 뉴클레오티드와 동일한 마이크로 RNA(miRNA) 분자를 인코딩할 수 있다. 일부 구현예에서, miRNA 서열은 mRNA를 표적화하며, 다이뉴클레오티드 AA로 시작하며, 약 30 내지 70%(약 30 내지 60%, 약 40 내지 60% 또는 약 45% 내지 55%)의 GC-함량을 포함하며, 예를 들어, 표준 BLAST 검색에 의해 결정시, 그것이 도입될 포유동물의 게놈 내의 표적 이외의 임의의 뉴클레오티드 서열에 대하여 높은 동일성 백분율을 갖지 않는다.

일부 구현예에서, 조절 핵산은 적어도 하나, 예를 들어, 2, 3, 4, 5, 6개, 또는 그 이상의 miRNA이다. 일부 구현예에서, 유전 요소는, 본 명세서, 예를 들어, 표 40에 기재된 서열에 대하여 상동성인 뉴클레오티드 서열들 또는 서열 중 임의의 하나에 대하여 적어도 약 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 서열 동일성의 miRNA를 인코딩하는 서열을 포함한다.

[표 40] 조절 핵산, 예를 들어, miRNA의 예.

siRNA 및 shRNA는 내인성 마이크로RNA(miRNA) 유전자의 가공 경로 내의 중간체와 유사하다(문헌[Bartel, Cell 116:281-297, 2004]). 일부 구현예에서, siRNA는 miRNA로서 기능할 수 있으며, 그 역도 그러하다(문헌[Zeng et al., Mol Cell 9:1327-1333, 2002]; 문헌[Doench et al., Genes Dev 17:438-442, 2003]). siRNA와 같이 마이크로RNA는 RISC를 사용하여, 표적 유전자를 하향조절하지만, siRNA와 달리, 대부분의 동물 miRNA는 mRNA를 절단하지 않는다. 대신에, miRNA는 번역 억제 또는 폴리A 제거 및 mRNA 분해를 통해 단백질 출력물을 감소시킨다(문헌[Wu et al., Proc Natl Acad Sci USA 103:4034-4039, 2006]). 알려진 miRNA 결합 부위는 mRNA 3' UTR 내에 존재하며; miRNA는 miRNA의 5' 말단으로부터 뉴클레오티드 2 내지 8에 대하여 거의 완벽하게 상보성을 갖는 부위를 표적화하는 것으로 보인다(문헌[Rajewsky, Nat Genet 38 Suppl:S8-13, 2006]; 문헌[Lim et al., Nature 433:769-773, 2005]). 이러한 영역은 시드 영역으로 공지되어 있다. siRNA 및 miRNA가 상호 교환 가능하기 때문에, 외인성 siRNA는 siRNA에 대하여 시드 상보성을 갖는 mRNA를 하향조절한다(문헌[Birmingham et al., Nat Methods 3:199-204, 2006]). 3' UTR 내의 다수의 표적 부위는 더 강한 하향조절을 제공한다(문헌[Doench et al., Genes Dev 17:438-442, 2003]).

알려진 miRNA 서열의 목록은 특히 Wellcome Trust Sanger Institute, Penn Center for Bioinformatics, Memorial Sloan Kettering Cancer Center, 및 European Molecule Biology Laboratory와 같은 연구 기관에 의해 유지되는 데이터베이스에서 확인될 수 있다. 또한, 알려진 효과적인 siRNA 서열 및 동족(동족) 결합 부위는 관련 문헌에서 잘 나타나 있다. RNAi 분자는 당업계에 알려진 기술에 의해 쉽게 설계되고 생성된다. 또한, 효과적이고 특이적인 서열 모티프를 찾는 기회를 증가시키는 컴퓨터 기반 도구가 존재한다(문헌[Lagana et al., Methods Mol. Bio., 2015, 1269:393-412]).

조절 핵산은 유전자에 의해 인코딩되는 RNA의 발현을 조절할 수 있다. 다수의 유전자가 서로 어느 정도의 서열 상동성을 공유할 수 있기 때문에, 일부 구현예에서, 조절 핵산은 충분한 서열 상동성을 갖는 유전자의 부류를 표적화하도록 설계될 수 있다. 일부 구현예에서, 조절 핵산은 상이한 유전자 표적 간에 공유되는 또는 특정 유전자 표적에 특유한 서열에 상보성을 갖는 서열을 함유할 수 있다. 일부 구현예에서, 조절 핵산은 몇몇의 유전자 간에 상동성을 갖는 RNA 서열의 보존된 영역을 표적화하여, 그에 의해, 유전자 과 내의 몇몇의 유전자(예를 들어, 상이한 유전자 아이소폼, 슬라이스 변이체, 돌연변이 유전자 등)를 표적화하도록 설계될 수 있다. 일부 구현예에서, 조절 핵산은 단일 유전자의 특정 RNA 서열에 특유한 서열을 표적화하도록 설계될 수 있다.

일부 구현예에서, 유전 요소는 하나 이상의 유전자의 발현을 조절하는 조절 핵산을 인코딩하는 하나 이상의 서열을 포함할 수 있다.

일 구현예에서, 본 명세서의 다른 곳에 기재된 gRNA는 유전자 편집을 위한 CRISPR 시스템의 부분으로서 사용된다. 유전자 편집의 목적을 위하여, 아넬로벡터는 요망되는 표적 DNA 서열에 상응하는 하나의 또는 다수의 가이드 RNA 서열을 포함하도록 설계될 수 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819-823]; 문헌[Ran et al. (2013) Nature Protocols, 8:2281 - 2308]을 참조한다. 적어도 약 16 또는 17개 뉴클레오티드의 gRNA 서열은 일반적으로 Cas9-매개된 DNA 절단이 발생하게 하며; Cpf1에 있어서, 적어도 약 16개 뉴클레오티드의 gRNA 서열이 검출 가능한 DNA 절단을 달성하는 데 필요하다.

치료용 이펙터(예를 들어, 펩티드 또는 폴리펩티드)

일부 구현예에서, 유전 요소는 치료용 발현 서열, 예를 들어 치료용 펩티드 또는 폴리펩티드, 예를 들어 세포내 펩티드 또는 세포내 폴리펩티드, 분비 폴리펩티드, 또는 단백질 대체 치료제를 인코딩하는 서열을 포함한다. 일부 구현예에서, 유전 요소는 단백질, 예를 들어, 치료용 단백질을 인코딩하는 서열을 포함한다. 치료용 단백질의 일부 예는 호르몬, 사이토카인, 효소, 항체(예를 들어, 적어도 중쇄 또는 경쇄를 인코딩하는 하나 또는 복수의 폴리펩티드), 전사 인자, 수용체(예를 들어, 막 수용체), 리간드, 막 수송체, 분비 단백질, 펩티드, 담체 단백질, 구조 단백질, 뉴클레아제, 또는 이의 구성성분을 포함할 수 있지만 이에 제한되지 않는다.

일부 구현예에서, 유전 요소는 펩티드, 예를 들어, 치료용 펩티드를 인코딩하는 서열을 포함한다. 펩티드는 선형 또는 분지형일 수 있다. 펩티드는 약 5 내지 약 500개의 아미노산, 약 15 내지 약 400개의 아미노산, 약 20 내지 약 325개의 아미노산, 약 25 내지 약 250개의 아미노산, 약 50 내지 약 200개의 아미노산, 또는 이들 사이의 임의의 범위의 길이를 갖는다.

일부 구현예에서, 치료용 발현 서열에 의해 인코딩되는 폴리펩티드는 상기 중 임의의 것의 기능적 변이체 또는 이의 단편, 예를 들어, UniProt ID를 참조하여 본 명세서의 표에 개시된 단백질 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 동일성을 갖는 단백질일 수 있다.

일부 구현예에서, 치료용 발현 서열은 상기 중 임의의 것에 결합하는 항체 또는 항체 단편, 예를 들어, UniProt ID를 참조하여 본 명세서의 표에 개시된 단백질 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 동일성을 갖는 단백질에 대한 항체를 인코딩할 수 있다. 본 명세서에서 용어 "항체"는 가장 넓은 의미로 사용되며, 원하는 항원-결합 활성을 나타내는 한 모노클로날 항체, 폴리클로날 항체, 다중특이적 항체(예를 들어, 이중 특이적 항체), 및 항체 단편을 포함하지만 이에 제한되지 않는 다양한 항체 구조를 포함한다. "항체 단편"은 적어도 하나의 중쇄 또는 경쇄를 포함하고 항원에 결합하는 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')₂; 디아바디; 선형 항체; 단쇄 항체 분자(예를 들어, scFv); 및 항체 단편으로부터 형성된 다중특이적 항체를 포함하지만 이에 제한되지 않는다.

예시적인 세포내 폴리펩티드 이펙터

일부 구현예에서, 이펙터는 세포질 폴리펩티드 또는 세포질 펩티드를 포함한다. 일부 구현예에서, 이펙터는 DPP-4 억제제, GLP-1 신호전달의 활성화제, 또는 호중구 엘라스타제의 억제제인 세포질 펩티드를 포함한다. 일부 구현예에서, 이펙터는 성장 인자 또는 이의 수용체(예를 들어, FGF 수용체, 예를 들어, FGFR3)의 수준 또는 활성을 증가시킨다. 일부 구현예에서, 이펙터는 n-myc 상호작용 단백질 활성의 억제제(예를 들어, n-myc 상호작용 단백질 억제제); EGFR 활성의 억제제(예를 들어, EGFR 억제제); IDH1 및/또는 IDH2 활성의 억제제(예를 들어, IDH1 억제제 및/또는 IDH2 억제제); LRP5 및/또는 DKK2 활성의 억제제(예를 들어, LRP5 및/또는 DKK2 억제제); KRAS 활성의 억제제; HTT 활동의 활성화제; 또는 DPP-4 활성의 억제제(예를 들어, DPP-4 억제제)를 포함한다.

일부 구현예에서, 이펙터는 조절 세포내 폴리펩티드를 포함한다. 일부 구현예에서, 조절 세포내 폴리펩티드는 표적 세포에 대해 내인성인 하나 이상의 분자(예를 들어, 단백질 또는 핵산)에 결합한다. 일부 구현예에서, 조절 세포내 폴리펩티드는 표적 세포에 대해 내인성인 하나 이상의 분자(예를 들어, 단백질 또는 핵산)의 수준 또는 활성을 증가시킨다. 일부 구현예에서, 조절 세포내 폴리펩티드는 표적 세포에 대해 내인성인 하나 이상의 분자(예를 들어, 단백질 또는 핵산)의 수준 또는 활성을 감소시킨다.

예시적인 분비 폴리펩티드 이펙터

예시적인 분비 치료제는 본 명세서에, 예를 들어 하기 표에 기재되어 있다.

[표 50] 예시적인 사이토카인 및 사이토카인 수용체

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 50의 사이토카인, 또는 이의 기능적 변이체, 예를 들어 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 50에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 기능적 변이체는 동일한 조건 하에서 동일한 수용체에 대하여 상응하는 야생형 사이토카인의 Kd보다 10%, 20%, 30%, 40%, 또는 50% 이하로 더 높거나 더 낮은 Kd로 상응하는 사이토카인 수용체에 결합한다. 일부 구현예에서, 이펙터는 제1 영역(예를 들어, 표 50의 사이토카인 폴리펩티드 또는 이의 기능적 변이체 또는 단편) 및 제2의 이종 영역을 포함하는 융합 단백질을 포함한다. 일부 구현예에서, 제1 영역은 표 50의 제1 사이토카인 폴리펩티드이다. 일부 구현예에서, 제2 영역은 표 50의 제2 사이토카인 폴리펩티드이며, 여기서 제1 및 제2 사이토카인 폴리펩티드는 야생형 세포에서 서로 사이토카인 이종이량체를 형성한다. 일부 구현예에서, 표 50의 폴리펩티드 또는 이의 기능적 변이체는 신호 서열, 예를 들어, 이펙터에 대해 내인성인 신호 서열, 또는 이종 신호 서열을 포함한다. 일부 구현예에서, 표 50의 사이토카인, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 본 명세서에 기재된 질환 또는 장애의 치료에 사용된다.

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 50의 사이토카인에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 표 50의 사이토카인 수용체에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 항체 분자는 신호 서열을 포함한다.

예시적인 사이토카인 및 사이토카인 수용체는, 예를 들어, 문헌[Akdis et al., "Interleukins (from IL-1 to IL-38), interferons, transforming growth factor β, and TNF-α: Receptors, functions, and roles in diseases" October 2016 Volume 138, Issue 4, Pages 984-1010]에 기재되어 있으며, 이는 본 명세서에 표 I을 포함하여 전문이 참조로 포함된다.

[표 51] 예시적인 폴리펩티드 호르몬 및 수용체

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 51의 호르몬, 또는 이의 기능적 변이체, 예를 들어, 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 51에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 기능적 변이체는 동일한 조건 하에서 동일한 수용체에 대하여 상응하는 야생형 호르몬의 Kd보다 10%, 20%, 30%, 40%, 또는 50% 이하로 더 높은 Kd로 상응하는 수용체에 결합한다. 일부 구현예에서, 표 51의 폴리펩티드 또는 이의 기능적 변이체는 신호 서열, 예를 들어, 이펙터에 대해 내인성인 신호 서열, 또는 이종 신호 서열을 포함한다. 일부 구현예에서, 표 51의 호르몬, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 본 명세서에 기재된 질환 또는 장애의 치료에 사용된다.

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 51의 호르몬에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 표 51의 호르몬 수용체에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 항체 분자는 신호 서열을 포함한다.

[표 52] 예시적인 성장 인자

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 52의 성장 인자, 또는 이의 기능적 변이체, 예를 들어, 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 52에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 기능적 변이체는 동일한 조건 하에서 동일한 수용체에 대하여 상응하는 야생형 성장 인자의 Kd보다 10%, 20%, 30%, 40%, 또는 50% 이하로 더 높은 Kd로 상응하는 수용체에 결합한다. 일부 구현예에서, 표 52의 폴리펩티드 또는 이의 기능적 변이체는 신호 서열, 예를 들어, 이펙터에 대해 내인성인 신호 서열, 또는 이종 신호 서열을 포함한다. 일부 구현예에서, 표 52의 성장 인자, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 본 명세서에 기재된 질환 또는 장애의 치료에 사용된다.

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 52의 성장 인자에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 표 52의 성장 인자 수용체에 결합하는 항체 분자(예를 들어, scFv)를 포함한다. 일부 구현예에서, 항체 분자는 신호 서열을 포함한다.

예시적인 성장 인자 및 성장 인자 수용체는, 예를 들어, 문헌[Bafico et al., "Classification of Growth Factors and Their Receptors" Holland-Frei Cancer Medicine. 6th edition]에 기재되어 있으며, 이는 본 명세서에 전문이 참조로 포함된다.

[표 53] 응고-연관 인자

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 53의 폴리펩티드, 또는 이의 기능적 변이체, 예를 들어, 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 53에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 기능적 변이체는, 예를 들어, 야생형 단백질보다 10%, 20%, 30%, 40%, 또는 50% 이상 더 낮은 속도로, 상응하는 야생형 단백질과 동일한 반응을 촉매한다. 일부 구현예에서, 표 53의 폴리펩티드 또는 이의 기능적 변이체는 신호 서열, 예를 들어, 이펙터에 대해 내인성인 신호 서열, 또는 이종 신호 서열을 포함한다. 일부 구현예에서, 표 53의 폴리펩티드, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 표 53의 질환 또는 장애의 치료에 사용된다.

예시적인 단백질 대체 치료제

예시적인 단백질 대체 치료제는 본 명세서에, 예를 들어 하기 표에 기재되어 있다.

[표 54] 예시적인 효소 이펙터 및 상응하는 적응증

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 54의 효소, 또는 이의 기능적 변이체, 예를 들어, 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 54에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 기능적 변이체는, 예를 들어, 야생형 단백질보다 10%, 20%, 30%, 40%, 또는 50% 이상 더 낮은 속도로, 상응하는 야생형 단백질과 동일한 반응을 촉매한다. 일부 구현예에서, 표 54의 효소, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 표 54의 질환 또는 장애의 치료에 사용된다. 일부 구현예에서, 아넬로벡터는 우리딘 디포스페이트 우리긴 글루쿠로닐-트랜스퍼라제 또는 이의 기능적 변이체를 표적 세포, 예를 들어, 간 세포로 운반하는 데 사용된다. 일부 구현예에서, 아넬로벡터는 OCA1 또는 이의 기능적 변이체를 표적 세포, 예를 들어, 망막 세포로 운반하는 데 사용된다.

[표 55] 예시적인 비-효소 이펙터 및 상응하는 적응증

일부 구현예에서, 본 명세서에 기재된 이펙터는 에리트로포이에틴(EPO), 예를 들어, 인간 에리트로포이에틴(hEPO), 또는 이의 기능적 변이체를 포함한다. 일부 구현예에서, 에리트로포이에틴, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 적혈구형성을 자극하는 데 사용된다. 일부 구현예에서, 에리트로포이에틴, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 질환 또는 장애, 예를 들어, 빈혈의 치료에 사용된다. 일부 구현예에서, 아넬로벡터는 EPO 또는 이의 기능적 변이체를 표적 세포, 예를 들어, 적혈구로 운반하는 데 사용된다.

일부 구현예에서, 본 명세서에 기재된 이펙터는 표 55의 폴리펩티드, 또는 이의 기능적 변이체, 예를 들어, 이의 상동체(예를 들어, 오솔로그 또는 파라로그) 또는 단편을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 UniProt ID를 참조하여 표 55에 열거된 아미노산 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 표 55의 폴리펩티드, 또는 이의 기능적 변이체를 인코딩하는 아넬로벡터는 표 55의 질환 또는 장애의 치료에 사용된다. 일부 구현예에서, 아넬로벡터는 SMN 또는 이의 기능적 변이체를 표적 세포, 예를 들어, 척수 및/또는 운동 뉴런의 세포로 운반하는 데 사용된다. 일부 구현예에서, 아넬로벡터는 마이크로-디스트로핀을 표적 세포, 예를 들어, 근세포로 운반하는 데 사용된다.

예시적인 마이크로-디스트로핀은 문헌[Duan, "Systemic AAV Micro-dystrophin Gene Therapy for Duchenne Muscular Dystrophy." Mol Ther. 2018 Oct 3;26(10):2337-2356. doi: 10.1016/j.ymthe.2018.07.011. Epub 2018 Jul 17]에 기재되어 있다.

일부 구현예에서, 본 명세서에 기재된 이펙터는 응고 인자, 예를 들어, 본 명세서에서 표 54 또는 표 55에 열거된 응고 인자를 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 돌연변이되는 경우 리소좀 축적 장애를 야기하는 단백질, 예를 들어, 본 명세서에서 표 54 또는 표 55에 열거된 단백질을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터는 수송체 단백질, 예를 들어, 본 명세서에서 표 55에 열거된 수송체 단백질을 포함한다.

일부 구현예에서, 야생형 단백질의 기능적 변이체는 야생형 단백질의 하나 이상의 활성을 갖는 단백질을 포함하며, 예를 들어, 기능적 변이체는 예를 들어, 야생형 단백질보다 10%, 20%, 30%, 40% 또는 50% 이상 더 낮은 속도로, 상응하는 야생형 단백질과 동일한 반응을 촉매한다. 일부 구현예에서, 기능적 변이체는 야생형 단백질에 의해 결합되는 동일한 결합 파트너에, 예를 들어, 동일한 조건 하의 동일한 결합 파트너에 대한 상응하는 야생형 단백질의 Kd보다 10%, 20%, 30%, 40% 또는 50% 이하로 더 큰 Kd로 결합한다. 일부 구현예에서, 기능적 변이체는 야생형 폴리펩티드의 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 폴리펩티드 서열을 갖는다. 일부 구현예에서, 기능적 변이체는 상응하는 야생형 단백질의 상동체(예를 들어, 오솔로그(오솔로그) 또는 파라로그(paralog))를 포함한다. 일부 구현예에서, 기능적 변이체는 융합 단백질이다. 일부 구현예에서, 융합물은 상응하는 야생형 단백질에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 제1 영역 및 제2 이종 영역을 포함한다. 일부 구현예에서, 기능적 변이체는 상응하는 야생형 단백질의 단편을 포함하거나, 이로 이루어진다.

재생, 복구, 섬유증 인자

본 명세서에 기재된 치료용 폴리펩티드는 또한, 예를 들어, 표 56에 개시된 바와 같은 성장 인자, 또는 이의 기능적 변이체, 예를 들어, UniProt ID를 참조하여 표 56에 개시된 단백질 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 동일성을 갖는 단백질을 포함한다. 또한 재생 및 복구를 촉진하는 이러한 성장 인자, 또는 miRNA에 대한 항체 또는 이의 단편이 포함된다.

[표 56] 예시적인 재생, 복구, 및 섬유증 인자

형질전환 인자

본 명세서에 기재된 치료용 폴리펩티드는 또한, 예를 들어, 섬유아세포를 분화 세포로 형질전환시키는 단백질 인자, 예를 들어, 표 57에 개시된 인자 또는 이의 기능적 변이체, 예를 들어, UniProt ID를 참조하여 표 57에 개시된 단백질 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 동일성을 갖는 단백질을 포함한다.

[표 57] 예시적인 형질전환 인자

세포 재생을 자극하는 단백질

본 명세서에 기재된 치료용 폴리펩티드는 또한 세포 재생을 자극하는 단백질, 예를 들어 표 58에 개시된 단백질 또는 이의 기능적 변이체, 예를 들어, UniProt ID를 참조하여 표 58에 개시된 단백질 서열에 대하여 적어도 80%, 85%, 90%, 95%, 967%, 98%, 99% 동일성을 갖는 단백질을 포함한다.

[표 58] 세포 재생을 자극하는 예시적인 단백질

STING 조절제 이펙터

일부 구현예에서, 본 명세서에 기재된 분비 이펙터는 STING/cGAS 신호전달을 조절한다. 일부 구현예에서, STING 조절제는 폴리펩티드, 예를 들어, 바이러스 폴리펩티드 또는 이의 기능적 변이체이다. 예를 들어, 이펙터는 문헌[Maringer et al. "Message in a bottle: lessons learned from antagonism of STING signalling during RNA virus infection" Cytokine & Growth Factor Reviews Volume 25, Issue 6, December 2014, Pages 669-679]에 기재된 STING 조절제(예를 들어, 억제제)를 포함할 수 있으며, 이는 본 명세서에 전문이 참조로 포함된다. 추가의 STING 조절제(예를 들어, 활성화제)는, 예를 들어, 문헌[Wang et al. "STING activator c-di-GMP enhances the anti-tumor effects of peptide vaccines in melanoma-bearing mice." Cancer Immunol Immunother. 2015 Aug;64(8):1057-66. doi: 10.1007/s00262-015-1713-5. Epub 2015 May 19]; 문헌[Bose "cGAS/STING Pathway in Cancer: Jekyll and Hyde Story of Cancer Immune Response" Int J Mol Sci. 2017 Nov; 18(11): 2456]; 및 문헌[Fu et al. "STING agonist formulated cancer vaccines can cure established tumors resistant to PD-1 blockade" Sci Transl Med. 2015 Apr 15; 7(283): 283ra52]에 기재되어 있으며, 이들 각각은 본 명세서에 전문이 참조로 포함된다.

펩티드의 일부 예는 형광 태그 또는 마커, 항원, 펩티드 치료제, 천연적인 생물활성 펩티드로부터의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항-미생물 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 및 분해 또는 자가-파괴 펩티드들을 포함하지만, 이에 제한되지 않는다. 본 명세서에 기재된 본 발명에 유용한 펩티드는 또한, 항원-결합 펩티드, 예를 들어, 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 쇄 항체, 나노바디(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조)를 포함한다. 이러한 항원 결합 펩티드는 시토졸 항원, 핵 항원 또는 소기관-내 항원에 결합할 수 있다.

일부 구현예에서, 유전 요소는 작은 펩티드, 펩티드모방체(예를 들어, 펩토이드(peptoid)), 아미노산, 및 아미노산 유사체를 인코딩하는 서열을 포함한다. 이러한 치료제는 일반적으로 몰당 약 5,000 그램 미만의 분자량, 몰당 약 2,000 그램 미만의 분자량, 몰당 약 1,000 그램 미만의 분자량, 몰당 약 500 그램 미만의 분자량, 및 이러한 화합물의 염, 에스테르 및 다른 약제학적으로 허용 가능한 형태를 갖는다. 이러한 치료제는 신경전달물질, 호르몬, 약물, 독소, 바이러스 또는 미생물 입자, 합성 분자, 및 이의 효능제 또는 길항제를 포함할 수 있지만, 이에 제한되지 않는다.

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 특정 위치, 조직, 또는 세포를 표적화할 수 있는 리간드에 연결된 폴리펩티드를 포함한다.

유전자 편집 구성성분

아넬로벡터의 유전 요소는 유전자 편집 시스템의 구성성분을 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 예시적인 유전자 편집 시스템은 클러스터링된 규칙적으로 산재된 짧은 회문 반복부(CRISPR) 시스템, 아연 핑거 뉴클레아제(ZFN), 및 전사 활성화제-유사 이펙터-기반 뉴클레아제(TALEN)를 포함한다. ZFN, TALEN, 및 CRISPR-기반 방법은, 예를 들어, 문헌[Gaj et al. Trends Biotechnol. 31.7(2013):397-405]에 기재되어 있으며; 유전자 편집의 CRISPR 방법은, 예를 들어, 문헌[Guan et al., Application of CRISPR-Cas system in gene therapy: Pre-clinical progress in animal model. DNA Repair 2016 Oct;46:1-8. doi: 10.1016/j.dnarep.2016.07.004]; 문헌[Zheng et al., Precise gene deletion and replacement using the CRISPR/Cas9 system in human cells. BioTechniques, Vol. 57, No. 3, September 2014, pp. 115-124]에 기재되어 있다.

CRISPR 시스템은 원래 박테리아 및 조류에서 발견되는 적응 방어 시스템이다. CRISPR 시스템은 CRISPR-회합 또는 "Cas" 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)로 명명되는 RNA-가이드된 뉴클레아제를 사용하여, 외래 DNA를 절단한다. 통상적인 CRISPR/Cas 시스템에서, 엔도뉴클레아제는 단일- 또는 이중-가닥 DNA 서열을 표적화하는 서열-특이적 비-코딩 "가이드 RNA"에 의해 표적 뉴클레오티드 서열(예를 들어, 서열-편집될 게놈 내의 부위)에 지향된다. CRISPR 시스템의 3가지 부류(I 내지 III)가 확인된 바 있다. 부류 II CRISPR 시스템은 (다수의 Cas 단백질이 아닌) 단일의 Cas 엔도뉴클레아제를 사용한다. 하나의 부류 II CRISPR 시스템은 II형 Cas 엔도뉴클레아제, 예컨대 Cas9, CRISPR RNA("crRNA"), 및 트랜스-활성화 crRNA("tracrRNA")를 포함한다. crRNA는 "가이드 RNA", 통상적으로 표적 DNA 서열에 상응하는 약 20-뉴클레오티드 RNA 서열을 함유한다. crRNA는 또한, tracrRNA에 결합하여, RNase III에 의해 절단되는 부분 이중-가닥 구조를 형성하여, crRNA/tracrRNA 혼성물을 초래하는 영역을 함유한다. 그 다음, crRNA/tracrRNA 혼성물은 Cas9 엔도뉴클레아제가 표적 DNA 서열을 인식하고 절단하게 한다. 표적 DNA 서열은 일반적으로 주어진 Cas 엔도뉴클레아제에 특이적인 "프로토스페이서 인접 모티프"("PAM")에 인접해야 하지만; PAM 서열은 주어진 게놈의 전체에 걸쳐 나타난다.

일부 구현예에서, 아넬로벡터는 CRISPR 엔도뉴클레아제에 대한 유전자를 포함한다. 예를 들어, 다양한 원핵생물 종으로부터 확인되는 일부 CRISPR 엔도뉴클레아제는 독특한 PAM 서열 요건을 가지며; PAM 서열의 예는 5'-NGG(스트렙토코커스 피오게네스(Streptococcus pyogenes)), 5'-NNAGAA(스트렙토코커스 써모필러스(Streptococcus thermophilus) CRISPR1), 5'-NGGNG(스트렙토코커스 써모필러스 CRISPR3), 및 5'-NNNGATT(네이세리아 메닌지디티스(Neisseria meningiditis))를 포함한다. 일부 엔도뉴클레아제, 예를 들어, Cas9 엔도뉴클레아제는 G-풍부 PAM 부위, 예를 들어, 5'-NGG와 회합되며, PAM 부위(이로부터 5')로부터 3개 뉴클레오티드 상류의 위치에서 표적 DNA의 블런트-말단 절단을 수행한다. 또 다른 부류 II CRISPR 시스템은 Cas9보다 더 작은 V형 엔도뉴클레아제 Cpf1을 포함하며; 예는 AsCpf1(아시드아미노코커스(Acidaminococcus) 종 유래) 및 LbCpf1(라크노스피라세아에(Lachnospiraceae) 종 유래)을 포함한다. Cpf1 엔도뉴클레아제는 T-풍부 PAM 부위, 예를 들어, 5'-TTN과 회합된다. 또한, Cpf1은 5'-CTA PAM 모티프를 인식할 수 있다. Cpf1은 4- 또는 5-뉴클레오티드 5' 오버행을 갖는 오프셋 또는 스태거형 이중-가닥 파단부를 도입함으로써, 예를 들어, 코딩 가닥 상의 PAM 부위(이로부터 3')로부터 18개 뉴클레오티드 하류, 및 상보성 가닥 상의 PAM 부위로부터 23개 뉴클레오티드 하류에 위치한 5-뉴클레오티드 오프셋 또는 스태거형 절단으로 표적 DNA를 절단함으로써 표적 DNA를 절단하며; 이러한 오프셋 절단으로부터 초래되는 5-뉴클레오티드 오버행은 상동성 재조합에 의한 DNA 삽입에 의해 블런트-말단 절단된 DNA에서의 삽입에 의한 것보다 더 정밀한 게놈 편집을 가능하게 한다. 예를 들어, 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다.

다양한 CRISPR 회합(Cas) 유전자가 아넬로벡터 내에 포함될 수 있다. 유전자의 구체적인 예는 Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1, 또는 C2C3을 포함하는 부류 II 시스템으로부터의 Cas 단백질을 인코딩하는 것이다. 일부 구현예에서, 아넬로벡터는 Cas 단백질, 예를 들어, 다양한 원핵생물 종 중 임의의 것의 유래일 수 있는 Cas9 단백질을 인코딩하는 유전자를 포함한다. 일부 구현예에서, 아넬로벡터는 특정 Cas 단백질, 예를 들어, 특정 프로토스페이서-인접 모티프(PAM) 서열을 인식하도록 선택되는 특정 Cas9 단백질을 인코딩하는 유전자를 포함한다. 일부 구현예에서, 아넬로벡터는 세포, 접합체, 배아 또는 동물 내로 도입되어, 예를 들어, 동일한, 유사한 또는 상이한 PAM 모티프를 포함하는 부위의 인식 및 변형을 가능하게 할 수 있는 2가지 이상의 상이한 Cas 단백질 또는 2가지 이상의 Cas 단백질을 인코딩하는 핵산을 포함한다. 일부 구현예에서, 아넬로벡터는 비활성화된 뉴클레아제를 갖는 변형된 Cas 단백질, 예를 들어, 뉴클레아제-결핍 Cas9를 인코딩하는 유전자를 포함한다.

야생형 Cas9 단백질이 gRNA에 의해 표적화된 특정 DNA 서열에서 이중-가닥 파단부(DSB)를 생성하는 한편, 변형된 기능을 갖는 수많은 CRISPR 엔도뉴클레아제가 알려져 있으며, 예를 들어, "닉카제" 버전의 Cas엔도뉴클레아제(예를 들어, Cas9)는 오직 단일-가닥 파단만을 생성하며; 촉매적으로 비활성인 Cas 엔도뉴클레아제, 예를 들어, Cas9("dCas9")는 표적 DNA를 절단하지 않는다. dCas9를 인코딩하는 유전자를 이펙터 도메인을 인코딩하는 유전자와 융합시켜, 표적 유전자의 발현을 억제(CRISPRi)하거나 활성화(CRISPRa)시킬 수 있다. 예를 들어, 유전자는 전사 침묵화제(예를 들어, KRAB 도메인) 또는 전사 활성화제(예를 들어, dCas9-VP64 융합물)를 갖는 Cas9 융합물을 인코딩할 수 있다. 2개의 gRNA에 상동성인 표적 서열에 DSB를 생성하기 위하여, FokI 뉴클레아제에 융합된 촉매적 비활성 Cas9(dCas9)("dCas9-FokI")를 인코딩하는 유전자가 포함될 수 있다. 예를 들어, 애드진 레포지터리(Addgene repository)(Addgene, 75 Sidney St., Suite 550A, Cambridge, MA 02139; addgene.org/crispr/)에 개시되고, 이로부터 공개적으로 이용 가능한 수많은 CRISPR/Cas9 플라스미드를 참조한다. 각각 개별 가이드 RNA에 의해 유도되는, 2개의 별개 이중-가닥 파단을 도입하는 "이중 닉카제" Cas9는 더 정확한 게놈 편집을 달성하는 것으로 문헌[Ran et al. (2013) Cell, 154:1380 - 1389]에 기재되어 있다.

진핵생물의 유전자를 편집하기 위한 CRISPR 기술은 미국 특허 출원 공개 2016/0138008A1 및 US2015/0344912A1, 및 미국 특허 8,697,359, 8,771,945, 8,945,839, 8,999,641, 8,993,233, 8,895,308, 8,865,406, 8,889,418, 8,871,445, 8,889,356, 8,932,814, 8,795,965, 및 8,906,616에 개시되어 있다. Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 2016/0208243 A1에 개시되어 있다.

일부 구현예에서, 아넬로벡터는 본 명세서에 기재된 폴리펩티드, 예를 들어, 표적화된 뉴클레아제, 예를 들어, Cas9, 예를 들어, 야생형 Cas9, 닉카제 Cas9(예를 들어, Cas9 D10A), 데드(dead) Cas9(dCas9), eSpCas9, Cpf1, C2C1 또는 C2C3, 및 gRNA를 인코딩하는 유전자를 포함한다. 뉴클레아제 및 gRNA(들)를 인코딩하는 유전자의 선택은 표적화된 돌연변이가 뉴클레오티드의 결실인지, 치환인지 또는 부가인지, 예를 들어, 표적화된 서열에 대한 뉴클레오티드의 결실인지, 치환인지 또는 부가인지에 의해 결정된다. (하나 이상의) 이펙터 도메인(예를 들어, VP64)의 전부 또는 일부(예를 들어, 이의 생물학적 활성 부분)와 테더링된 촉매적 비활성 엔도뉴클레아제, 예를 들어, 데드 Cas9(dCas9, 예를 들어, D10A; H840A)를 인코딩하는 유전자는 하나 이상의 표적 핵산 서열의 활성 및/또는 발현을 조절할 수 있는 키메라 단백질을 생성한다.

일부 구현예에서, 아넬로벡터는 dCas9와 하나 이상의 이펙터 도메인의 전부 또는 일부(예를 들어, 전장 야생형 이펙터 도메인, 또는 이의 단편 또는 변이체, 예를 들어, 이의 생물학적 활성 부분)의 융합물을 인코딩하는 유전자를 포함하여 본 명세서에 기재된 방법에 유용한 키메라 단백질을 생성한다. 따라서, 일부 구현예에서, 아넬로벡터는 dCas9-메틸라제 융합물을 인코딩하는 유전자를 포함한다. 다른 일부 구현예에서, 아넬로벡터는 내인성 유전자를 표적화하기 위해 부위-특이적 gRNA와 함께 dCas9-효소 융합물을 인코딩하는 유전자를 포함한다.

다른 양태에서, 아넬로벡터는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 dCas9와 융합된 이펙터 도메인(전체 또는 생물학적 활성 부분)을 인코딩하는 유전자를 포함한다.

조절 서열

일부 구현예에서, 유전 요소는 이펙터를 인코딩하는 서열에 작동 가능하게 연결된 조절 서열, 예를 들어, 프로모터 또는 인핸서를 포함한다.

일부 구현예에서, 프로모터는 발현 생성물을 인코딩하는 DNA 서열에 인접하여 위치한 DNA 서열을 포함한다. 프로모터는 인접 DNA 서열에 작동 가능하게 연결될 수 있다. 프로모터는 통상적으로 프로모터가 존재하지 않는 경우 발현되는 생성물의 양에 비하여 DNA 서열로부터 발현되는 생성물의 양을 증가시킨다. 하나의 유기체로부터의 프로모터를 사용하여 또 다른 유기체로부터 기원한 DNA 서열로부터의 생성물 발현을 향상시킬 수 있다. 예를 들어, 척추동물 프로모터는 척추동물에서 해파리 GFP의 발현을 위해 사용될 수 있다. 그러므로, 하나의 프로모터 요소는 하나 이상의 생성물의 발현을 향상시킬 수 있다. 다수의 프로모터 요소는 당업자에게 널리 알려져 있다.

일 구현예에서, 높은 수준의 구성적 발현이 요망된다. 이러한 프로모터의 예는 제한 없이, 레트로바이러스 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터/인핸서, 사이토메갈로바이러스(CMV) 즉시 조기 프로모터/인핸서(예를 들어, 문헌[Boshart et al, Cell, 41:521-530 (1985)] 참조), SV40 프로모터, 다이하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터 및 포스포글리세롤 키나제(PGK) 프로모터를 포함한다.

또 다른 구현예에서, 유도성 프로모터가 요망될 수 있다. 유도성 프로모터는 제한 없이, 아연-유도성 양 메탈로티오닌(MT) 프로모터; 덱사메타손(Dex)-유도성 마우스 유방 종양 바이러스(MMTV) 프로모터; T7 중합효소 프로모터 시스템(WO 98/10088호); 테트라사이클린-억제성 시스템(문헌[Gossen et al, Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)]); 테트라사이클린-유도성 시스템(문헌[Gossen et al., Science, 268:1766-1769 (1995)]; 또한, 문헌[Harvey et al., Curr. Opin. Chem. Biol., 2:512-518 (1998)] 참조); RU486-유도성 시스템(문헌[Wang et al., Nat. Biotech., 15:239-243 (1997)] 및 문헌[Wang et al., Gene Ther., 4:432-441 (1997)]); 및 라파마이신-유도성 시스템(문헌[Magari et al., J. Clin. Invest., 100:2865-2872 (1997)]; 문헌[Rivera et al., Nat. Medicine. 2:1028-1032 (1996)])을 포함하여, 예를 들어 시스로 또는 트랜스로 제공되는, 외인적으로 공급되는 화합물에 의해 조절되는 것들이다. 이러한 맥락에서 유용할 수 있는 다른 유형의 유도성 프로모터는 특정 생리학적 상태, 예를 들어, 온도, 급성 단계에 의해 또는 오직 복제하는 세포에서만 조절되는 것들이다.

일부 구현예에서, 관심 유전자 또는 핵산 서열에 대한 고유 프로모터가 사용된다. 유전자 또는 핵산 서열의 발현이 고유 발현을 모방하는 것이 요망되는 경우에 고유 프로모터가 사용될 수 있다. 유전자 또는 다른 핵산 서열의 발현이 일시적으로 또는 발달적으로, 또는 조직-특이적 방식으로 또는 특정 전사 자극에 반응하여 조절되어야 하는 경우에, 고유 프로모터가 사용될 수 있다. 추가의 구현예에서, 다른 고유 발현 제어 요소, 예컨대, 인핸서 요소, 폴리아데닐화 부위 또는 코작(Kozak) 컨센서스 서열도 또한 고유 발현을 모방하기 위해 사용될 수 있다.

일부 구현예에서, 유전 요소는 조직-특이적 프로모터에 작동 가능하게 연결된 유전자를 포함한다. 예를 들어, 골격근에서의 발현이 요망되는 경우, 근육에서 활성인 프로모터가 사용될 수 있다. 이들은 골격 α-액틴, 미오신 경쇄 2A, 디스트로핀, 근육 크레아틴 키나제를 인코딩하는 유전자로부터의 프로모터 및 자연-발생 프로모터보다 더 높은 활성을 갖는 합성 근육 프로모터를 포함한다. 문헌[Li et al., Nat. Biotech., 17:241-245 (1999)]을 참조한다. 특히 간 알부민, 문헌[Miyatake et al. J. Virol., 71:5124-32 (1997)]; B형 간염 바이러스 코어 프로모터, 문헌[Sandig et al., Gene Ther. 3:1002-9 (1996)]; 알파-태아단백질(AFP), 문헌[Arbuthnot et al., Hum. Gene Ther., 7:1503-14 (1996)], 골(오스테오칼신(osteocalcin), 문헌[Stein et al., Mol. Biol. Rep., 24:185-96 (1997)]; 골 시알로단백질(sialoprotein), 문헌[Chen et al., J. Bone Miner. Res. 11:654-64 (1996)]), 림프구(CD2, 문헌[Hansal et al., J. Immunol., 161:1063-8 (1998)]; 면역글로불린 중쇄; T 세포 수용체 a 쇄), 뉴런(뉴런-특이적 에놀라제(NSE) 프로모터, 문헌[Andersen et al. Cell. Mol. Neurobiol., 13:503-15 (1993)]; 신경필라멘트 경쇄 유전자, 문헌[Piccioli et al., Proc. Natl. Acad. Sci. USA, 88:5611-5 (1991)]; 뉴런-특이적 vgf 유전자, 문헌[Piccioli et al., Neuron, 15:373-84 (1995)]을 위한 조직-특이적인 프로모터의 예가 알려져 있다.

유전 요소는 인핸서, 예를 들어, 유전자를 인코딩하는 DNA 서열에 인접하여 위치한 DNA 서열을 포함할 수 있다. 인핸서 요소는 통상적으로 프로모터 요소의 상류에 위치하거나, 코딩 DNA 서열(예를 들어, 생성물 또는 생성물들로 전사 또는 번역되는 DNA 서열)의 하류에 또는 그 내에 위치할 수 있다. 그러므로, 인핸서 요소는 생성물을 인코딩하는 DNA 서열의 100개 염기쌍, 200개 염기쌍 또는 300개 이상의 염기쌍 상류 또는 하류에 위치할 수 있다. 인핸서 요소는 DNA 서열로부터 발현되는 재조합 생성물의 양을 프로모터 요소에 의해 제공되는 증가된 발현을 초과하여 증가시킬 수 있다. 다중의 인핸서 요소는 당업자에게 용이하게 이용 가능하다.

일부 구현예에서, 유전 요소는 본 명세서에 기재된 발현 생성물을 인코딩하는 서열을 측접하는 하나 이상의 역위 말단 반복부(ITR)를 포함한다. 일부 구현예에서, 유전 요소는 본 명세서에 기재된 발현 생성물을 인코딩하는 서열을 측접하는 하나 이상의 긴 말단 반복부(LTR)를 포함한다. 사용될 수 있는 프로모터 서열의 예는 시미안 바이러스 40(SV40) 조기 프로모터, 마우스 유방 종양 바이러스(MMTV), 인간 면역결핍 바이러스(HIV) 긴 말단 반복부(LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스테인-바 바이러스 즉시 조기 프로모터 및 라우스 육종 바이러스 프로모터를 포함하나 이들에 제한되지 않는다.

복제 단백질

일부 구현예에서, 아넬로벡터, 예를 들어, 합성 아넬로벡터의 유전 요소는 하나 이상의 복제 단백질을 인코딩하는 서열을 포함할 수 있다. 일부 구현예에서, 아넬로벡터는 회전환 복제 방법에 의해 복제할 수 있으며, 예를 들어, 선도 가닥 및 지연 가닥의 합성은 분리된다. 이러한 구현예에서, 아넬로벡터는 3가지의 추가의 요소를 포함한다: i) 개시 단백질을 인코딩하는 유전자, ii) 이중 가닥 원점, 및 iii) 단일 가닥 원점. 복제 단백질을 포함하는 회전환 복제(RCR) 단백질 복합체는 선도 가닥에 결합하며, 복제 원점을 불안정화시킨다. RCR 복합체는 게놈을 절단하여, 유리 3'OH 말단을 생성한다. 세포 DNA 중합효소는 유리 3'OH 말단으로부터 바이러스 DNA 복제를 개시한다. 게놈이 복제된 후에, RCR 복합체는 루프를 공유적으로 폐쇄시킨다. 이는 양성 환형 단일-가닥 모 DNA 분자 및 음성 모체 가닥 및 새로 합성된 양성 가닥으로 구성된 환형 이중-가닥 DNA 분자의 방출을 야기한다. 단일-가닥 DNA 분자는 캡시드화되거나 제2차의 복제에 수반될 수 있다. 예를 들어, 문헌[Virology Journal 2009, 6:60 doi:10.1186/1743-422X-6-60]을 참조한다.

유전 요소는 중합효소, 예를 들어, RNA 중합효소 또는 DNA 중합효소를 인코딩하는 서열을 포함할 수 있다.

기타 서열

일부 구현예에서, 유전 요소는 생성물(예를 들어, 리보자임, 단백질을 인코딩하는 치료적 mRNA, 외인성 유전자)을 인코딩하는 핵산을 추가로 포함한다.

일부 구현예에서, 유전 요소는 아넬로벡터의 종 및/또는 조직 및/또는 세포 향성(예를 들어, 캡시드 단백질 서열), 감염성(예를 들어, 캡시드 단백질 서열), 면역억제/활성화(예를 들어, 조절 핵산), 바이러스 게놈 결합 및/또는 패키징, 면역 회피(비-면역원성 및/또는 관용), 약동학, 엔도시토시스 및/또는 세포 부착, 핵 유입, 세포내 조절 및 국소화, 엑소시토시스 조절, 증식 및 숙주 또는 숙주 세포에서의 아넬로벡터의 핵산 보호에 영향을 미치는 하나 이상의 서열을 포함한다.

일부 구현예에서, 유전 요소는 DNA, RNA 또는 인공 핵산을 포함하는 다른 서열을 포함할 수 있다. 다른 서열은 게놈 DNA, cDNA, 또는 tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 다른 RNAi 분자를 인코딩하는 서열을 포함할 수 있지만, 이들에 제한되지 않는다. 일 구현예에서, 유전 요소는 조절 핵산과 동일한 유전자 발현 생성물의 상이한 유전자좌를 표적화하기 위하여 siRNA를 인코딩하는 서열을 포함한다. 일 구현예에서, 유전 요소는 조절 핵산과 상이한 유전자 발현 생성물을 표적화하기 위하여 siRNA를 인코딩하는 서열을 포함한다.

일부 구현예에서, 유전 요소는 하기의 서열 중 하나 이상을 추가로 포함한다: 하나 이상의 miRNA를 인코딩하는 서열, 하나 이상의 복제 단백질을 인코딩하는 서열, 외인성 유전자를 인코딩하는 서열, 치료제를 인코딩하는 서열, 조절 서열(예를 들어, 프로모터, 인핸서), 내인성 유전자를 표적화하는 하나 이상의 조절 서열(siRNA, lncRNA, shRNA)을 인코딩하는 서열, 및 치료적 mRNA 또는 단백질을 인코딩하는 서열.

다른 서열은 약 2 내지 약 5000개의 뉴클레오티드, 약 10 내지 약 100개의 뉴클레오티드, 약 50 내지 약 150개의 뉴클레오티드, 약 100 내지 약 200개의 뉴클레오티드, 약 150 내지 약 250개의 뉴클레오티드, 약 200 내지 약 300개의 뉴클레오티드, 약 250 내지 약 350개의 뉴클레오티드, 약 300 내지 약 500개의 뉴클레오티드, 약 10 내지 약 1000개의 뉴클레오티드, 약 50 내지 약 1000개의 뉴클레오티드, 약 100 내지 약 1000개의 뉴클레오티드, 약 1000 내지 약 2000개의 뉴클레오티드, 약 2000 내지 약 3000개의 뉴클레오티드, 약 3000 내지 약 4000개의 뉴클레오티드, 약 4000 내지 약 5000개의 뉴클레오티드 또는 그 사이의 임의의 범위의 길이를 가질 수 있다.

인코딩된 유전자

예를 들어, 유전 요소는 신호전달 생화학 경로와 연관된 유전자, 예를 들어, 신호전달 생화학 경로-연관 유전자 또는 폴리뉴클레오티드를 포함할 수 있다. 예에는 질환 연관 유전자 또는 폴리뉴클레오티드가 포함된다. "질환-연관" 유전자 또는 폴리뉴클레오티드는 비 질환 대조군의 조직 또는 세포와 비교하여, 질환-이환된 조직으로부터 유래된 세포에서 전사 또는 번역 생성물을 비정상적인 수준 또는 비정상적인 형태로 제공하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서, 변경된 발현은 질환의 발생 및/또는 진행과 상호연관된다. 질환-연관 유전자는 또한, 질환의 병인의 직접적인 원인이 되거나, 질환의 병인을 담당하는 유전자(들)와 연관 불균형인 돌연변이(들) 또는 유전적 변이를 지니는 유전자를 지칭한다.

질환-연관 유전자 및 폴리뉴클레오티드의 예는 맥쿠식-나탄스(McKusick-Nathans) 유전 의학 기관, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 국립 생명과학 정보 센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용 가능하다. 질환-연관 유전자 및 폴리뉴클레오티드의 예는 본 명세서에 전문이 참조로 포함되는 미국 특허 8,697,359의 표 A 및 B에 열거되어 있다. 질환 특이적 정보는 맥쿠식-나탄스 유전 의학 기관, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 국립 생명과학 정보 센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용 가능하다. 신호전달 생화학 경로-연관 유전자 및 폴리뉴클레오티드의 예는 본 명세서에 전문이 참조로 포함되는 미국 특허 8,697,359의 표 A 내지 C에 열거되어 있다.

또한, 유전 요소는 본 명세서의 다른 곳에 기재된 바와 같이 표적화 모이어티를 인코딩할 수 있다. 이는 예를 들어, 당, 당지질 또는 단백질, 예컨대 항체를 인코딩하는 폴리뉴클레오티드를 삽입함으로써 달성될 수 있다. 당업자는 표적화 모이어티의 추가의 생성 방법을 안다.

바이러스 서열

일부 구현예에서, 유전 요소는 적어도 하나의 바이러스 서열을 포함한다. 일부 구현예에서, 서열은 단일 가닥 DNA 바이러스, 예를 들어, 아넬로바이러스, 비드나바이러스, 써코바이러스, 제미니바이러스, 게노모바이러스, 이노바이러스, 마이크로바이러스, 나노바이러스, 파보바이러스 및 스피라바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다. 일부 구현예에서, 서열은 이중 가닥 DNA 바이러스, 예를 들어, 아데노바이러스, 암풀라바이러스, 아스코바이러스, 아스파바이러스, 배큘로바이러스, 푸셀로바이러스, 글로불로바이러스, 구타바이러스, 하이트로사바이러스, 헤르페스바이러스, 이리도바이러스, 리포트릭스바이러스, 니마바이러스 및 폭스바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다. 일부 구현예에서, 서열은 RNA 바이러스, 예를 들어, 알파바이러스, 푸로바이러스, 간염 바이러스, 호르데이바이러스, 토바모바이러스, 토브라바이러스, 트리코르나바이러스, 루비바이러스, 비르나바이러스, 시스토바이러스, 파르티티바이러스 및 레오바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다.

일부 구현예에서, 유전 요소는 비-병원성 바이러스, 예를 들어, 상리공생 바이러스, 예를 들어, 편리공생 바이러스, 예를 들어, 고유 바이러스, 예를 들어, 아넬로바이러스로부터의 하나 이상의 서열을 포함할 수 있다. 명명법의 최근의 변화는 인간 세포를 감염시킬 수 있는 3가지 아넬로바이러스를 알파토르크바이러스(TT), 베타토르크바이러스(TTM) 및 감마토르크바이러스(TTMD) 속의 아넬로바이러스과의 바이러스로 분류하였다. 현재까지, 아넬로바이러스는 임의의 인간 질환과 연관된 바 없다. 일부 구현예에서, 유전 요소는 토르크 테노 바이러스(TT), 환형 음성-센스 게놈을 갖는 비-외피, 단일-가닥 DNA 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. 일부 구현예에서, 유전 요소는 SEN 바이러스, 센티넬(Sentinel) 바이러스, TTV-유사 미니 바이러스 및 TT 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. TT 바이러스 유전형 6, TT 바이러스 군, TTV-유사 바이러스 DXL1 및 TTV-유사 바이러스 DXL2를 포함하는 상이한 유형의 TT 바이러스가 기재된 바 있다. 일부 구현예에서, 유전 요소는 더 작은 바이러스, 토르크 테노-유사 미니 바이러스(TTM) 또는 토르크 테노-유사 미디 바이러스(TTMD)로 지칭되는 TTV와 TTMV 사이의 게놈 크기를 갖는 제3 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. 일부 구현예에서, 유전 요소는 본 명세서에, 예를 들어, 표 19에 기재된 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 비-병원성 바이러스로부터의 하나 이상의 서열 또는 서열의 단편을 포함할 수 있다.

일부 구현예에서, 유전 요소는 본 명세서에, 예를 들어, 표 41에 기재된 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 실질적으로 비-병원성인 바이러스로부터의 하나 이상의 서열 또는 서열의 단편을 포함할 수 있다.

[표 41] 아넬로바이러스 및 이들의 서열의 예. 수탁번호 및 관련 서열 정보는 2018년 12월 11일에 참조한 바와 같이 www.ncbi.nlm.nih.gov/genbank/에서 수득될 수 있다.

일부 구현예에서, 유전 요소는 하나 이상의 비-아넬로바이러스, 예를 들어, 아데노바이러스, 헤르페스 바이러스, 폭스 바이러스, 백시니아 바이러스, SV40, 파필로마 바이러스, RNA 바이러스, 예컨대 레트로바이러스, 예를 들어, 렌티 바이러스, 단일-가닥 RNA 바이러스, 예를 들어, 간염 바이러스, 또는 이중-가닥 RNA 바이러스, 예를 들어, 로타바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는 하나 이상의 서열을 포함한다. 일부 구현예에서, 재조합 레트로바이러스가 결함이 있기 때문에, 감염성 입자를 생성하도록 지원이 제공될 수 있다. 이러한 지원은 예를 들어, LTR 내의 조절 서열의 제어 하에 레트로바이러스의 구조적 유전자의 전부를 인코딩하는 플라스미드를 함유하는 헬퍼 세포주를 사용함으로써 제공될 수 있다. 본 명세서에 기재된 아넬로벡터를 복제하는 데 적합한 세포주는 당업계에 알려진 세포주, 예를 들어, 본 명세서에 기재된 바와 같이 변형될 수 있는 A549 세포를 포함한다. 상기 유전 요소는 선택 가능한 마커를 인코딩하는 유전자를 추가로 함유하여, 요망되는 유전 요소가 확인되게 할 수 있다.

일부 구현예에서, 유전 요소는 서열이 제1 뉴클레오티드 서열에 의해 인코딩되는 폴리펩티드와 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하게 유지되거나, 또는 다르게 본 발명을 실시하는 데 유용하다면, 인코딩된 폴리펩티드에 아미노산 차이를 초래하는 비-침묵 돌연변이, 예를 들어, 염기 치환, 결실 또는 부가를 포함한다. 이와 관련하여, 일반적으로 전체 단백질 기능을 비활성화시키지 않는 것으로 인식되는 특정 보존적 아미노산 치환이 이루어질 수 있다: 예컨대 양으로 하전된 아미노산(및 이의 역)에 관하여, 라이신, 아르기닌 및 히스티딘; 음으로 하전된 아미노산(및 이의 역)에 관하여, 아스파르트산 및 글루탐산; 및 특정 군의 중성으로 하전된 아미노산(및 모든 경우에, 또한 이의 역)에 관하여, (1) 알라닌 및 세린, (2) 아스파라긴, 글루타민 및 히스티딘, (3) 시스테인 및 세린, (4) 글리신 및 프롤린, (5) 이소류신, 류신 및 발린, (6) 메티오닌, 류신 및 이소류신, (7) 페닐알라닌, 메티오닌, 류신 및 티로신, (8) 세린 및 트레오닌, (9) 트립토판 및 티로신, (10) 및 예를 들어, 티로신, 트립토판 및 페닐알라닌. 아미노산은 물리적 특성 및 이차 및 삼차 단백질 구조에 대한 기여에 따라 분류될 수 있다. 보존적 치환은 하나의 아미노산의 유사한 특성을 갖는 또 다른 아미노산으로의 치환으로서 당업계에 인식된다.

동일한 또는 특정 백분율의 동일한 뉴클레오티드 또는 아미노산 잔기를 갖는 2개 이상의 핵산 또는 폴리펩티드 서열의 동일성(예를 들어, 비교 윈도우 또는 표기된 영역에 걸쳐 최대 상응성을 위해 비교되고 정렬되는 경우, 특정 영역에 걸쳐 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 동일성)은 하기 기재된 디폴트 파라미터와 함께 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하여 또는 수동의 정렬 및 육안의 검사(예를 들어, NCBI 웹 사이트 www.ncbi.nlm.nih.gov/BLAST/ 등 참조)에 의해 측정될 수 있다. 동일성은 또한 시험 서열의 상보물을 지칭할 수 있거나 이에 적용될 수 있다. 동일성은 또한 결실 및/또는 부가를 갖는 서열 및 치환을 갖는 서열을 포함한다. 본 명세서에 기재된 바와 같이, 알고리즘은 갭 등을 설명한다. 동일성은 적어도 약 10개 아미노산 또는 뉴클레오티드 길이, 약 15개 아미노산 또는 뉴클레오티드 길이, 약 20개 아미노산 또는 뉴클레오티드 길이, 약 25개 아미노산 또는 뉴클레오티드 길이, 약 30개 아미노산 또는 뉴클레오티드 길이, 약 35개 아미노산 또는 뉴클레오티드 길이, 약 40개 아미노산 또는 뉴클레오티드 길이, 약 45개 아미노산 또는 뉴클레오티드 길이, 약 50개 아미노산 또는 뉴클레오티드 길이 이상인 영역에 걸쳐 존재할 수 있다. 유전 암호가 축퇴성이기 때문에, 상동성 뉴클레오티드 서열은 임의의 수의 침묵 염기 변경, 즉, 그럼에도 불구하고 동일한 아미노산을 인코딩하는 뉴클레오티드 치환을 포함할 수 있다.

단백질성 외부

일부 구현예에서, 아넬로벡터, 예를 들어, 합성 아넬로벡터는 유전 요소를 봉입하는 단백질성 외부를 포함한다. 단백질성 외부는 포유동물에서 원치 않는 면역 반응을 유도하지 못하는 실질적으로 비-병원성인 외부 단백질을 포함할 수 있다. 아넬로벡터의 단백질성 외부는 통상적으로 단백질성 외부를 구성하는 정20면체 형성으로 자가-조립될 수 있는 실질적으로 비-병원성인 단백질을 포함한다.

일부 구현예에서, 단백질성 외부 단백질은 아넬로벡터의 유전 요소의 서열에 의해 인코딩된다(예를 들어, 유전 요소와 시스로 존재함). 다른 구현예에서, 단백질성 외부 단백질은 아넬로벡터의 유전 요소와 별개인 핵산에 의해 인코딩된다(예를 들어, 유전 요소와 트랜스로 존재함).

일부 구현예에서, 단백질, 예를 들어, 실질적으로 비-병원성인 단백질 및/또는 단백질성 외부 단백질은 하나 이상의 글리코실화된 아미노산, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 이상을 포함한다.

일부 구현예에서, 단백질, 예를 들어, 실질적으로 비-병원성인 단백질 및/또는 단백질성 외부 단백질은 적어도 하나의 친수성 DNA-결합 영역, 아르기닌-풍부 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열, 및 하나 이상의 이황화 가교를 포함한다.

일부 구현예에서, 단백질은 캡시드 단백질이며, 예를 들어, 본 명세서에 기재된 캡시드 단백질을 인코딩하는 뉴클레오티드 서열, 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 분자 및/또는 캡시드 단백질 서열 중 어느 하나에 의해 인코딩되는 단백질에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 갖는다. 일부 구현예에서, 단백질 또는 캡시드 단백질의 기능적 단편은, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 ORF1 핵산에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다.

일부 구현예에서, 아넬로벡터는 캡시드 단백질 또는 캡시드 단백질의 기능적 단편을 인코딩하는 뉴클레오티드 서열, 또는 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF1 분자에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는 서열을 포함한다.

일부 구현예에서, 더 낮은 서열 동일성을 갖는 아미노산의 범위는 본 명세서에 기재된 특성 중 하나 이상 및 세포/조직/종 특이성(예를 들어, 향성)의 차이를 제공할 수 있다.

일부 구현예에서, 아넬로벡터는 단백질성 외부 내에 지질이 결여된다. 일부 구현예에서, 아넬로벡터에는 지질 이중층, 예를 들어, 바이러스 외피가 결여된다. 일부 구현예에서, 아넬로벡터의 내부는 단백질성 외부에 의해 완전히 덮인다(예를 들어, 100% 커버리지). 일부 구현예에서, 아넬로벡터의 내부는 단백질성 외부에 의해 100% 미만, 예를 들어, 95%, 90%, 85%, 80%, 70%, 60%, 50% 이하의 커버리지로 덮인다. 일부 구현예에서, 단백질성 외부는 유전 요소가 아넬로벡터에 보유되는 한, 예를 들어, 물, 이온, 펩티드 또는 소분자에 대한 투과 가능성을 허용하는 갭 또는 불연속부를 포함한다.

일부 구현예에서, 단백질성 외부는 숙주 세포 내로의 유전 요소의 유입을 매개하기 위하여 숙주 세포를 특이적으로 인식하고/인식하거나 이에 결합하는 하나 이상의 단백질 또는 폴리펩티드, 예를 들어, 상보성 단백질 또는 폴리펩티드를 포함한다.

일부 구현예에서, 단백질성 외부는 하기 중 하나 이상을 포함한다: 예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, ORF1 분자의 아르기닌-풍부 영역, 젤리-롤 영역, N22 도메인, 초가변 영역, 및/또는 C-말단 도메인. 일부 구현예에서, 단백질성 외부는 하기 중 하나 이상을 포함한다: 하나 이상의 글리코실화된 단백질, 친수성 DNA-결합 영역, 아르기닌-풍부 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열, 및 하나 이상의 이황화 가교. 예를 들어, 단백질성 외부는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 ORF1 핵산에 의해 인코딩된 단백질을 포함한다.

일부 구현예에서, 단백질성 외부는 하기의 특성 중 하나 이상을 포함한다: 정20면체 대칭, 하나 이상의 숙주 세포 분자와 상호작용하는 분자를 인식하고/하거나 이에 결합하여, 숙주 세포로의 유입을 매개함, 지질 분자가 결여됨, 탄수화물이 결여됨, pH 및 온도 안정성임, 세제 저항성임, 및 숙주에서 실질적으로 비-면역원성이거나 비-병원성임.

일부 구현예에서, 복수의 아넬로벡터(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 제1 복수의 아넬로벡터 또는 제2 복수의 아넬로벡터)는 동일한 아넬로벡터의 다수 카피를 포함한다. 일부 구현예에서, 복수의 아넬로벡터(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 제1 복수의 아넬로벡터 또는 제2 복수의 아넬로벡터)는 다수의 상이한 아넬로벡터를 포함한다.

일부 구현예에서, 본 명세서에 기재된 바와 같은 단백질성 외부를 포함하는 제1 복수의 아넬로벡터가 대상체에게 투여된다. 일부 구현예에서, 본 명세서에 기재된 단백질성 외부를 포함하는 제2 복수의 아넬로벡터는 제1 복수의 투여 후 대상체에게 후속적으로 투여된다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 동일한 단백질성 외부를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 단백질성 외부에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 단백질성 외부를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 ORF1 분자에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 가진 ORF1 분자를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 포함된 ORF1 분자와 동일한 아미노산 서열을 갖는 ORF1 분자를 포함한다. 일부 구현예에서, 제1 복수의 아넬로벡터의 단백질성 외부는 제1 복수의 아넬로벡터의 단백질성 외부의 폴리펩티드, 예를 들어, ORF1 분자에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 폴리펩티드, 예를 들어, ORF1 분자를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터의 단백질성 외부는 제1 복수의 아넬로벡터의 단백질성 외부의 폴리펩티드, 예를 들어 캡시드 단백질에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 아미노산 서열 동일성을 갖는 폴리펩티드, 예를 들어, 캡시드 단백질을 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 공통인 적어도 하나의 표면 에피토프를 갖는 단백질성 외부를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 ORF1과 공통인 적어도 하나의 표면 에피토프를 갖는 ORF1 분자를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터의 단백질성 외부와 하나 이상의 아미노산 차이(예를 들어, 보존적 돌연변이)를 갖는 단백질성 외부를 포함한다. 일부 구현예에서, 제1 복수의 아넬로벡터의 단백질성 외부에 결합하는 항체, 예를 들어, 대상체 내의 항체는 또한 제2 복수의 아넬로벡터의 단백질성 외부에 결합한다. 일부 구현예에서, 항체는 제1 복수의 아넬로벡터의 단백질성 외부에 제2 복수의 아넬로벡터의 단백질성 외부와 동일한 친화도(예를 들어, 약 90 내지 110%, 예를 들어 95 내지 105%의 KD를 가짐)로 결합한다.

일부 구현예에서, 제1 복수의 아넬로벡터의 단백질성 외부는 제2 복수의 아넬로벡터의 단백질성 외부와 동일한 3차 구조를 포함한다. 일부 구현예에서, 제1 및 제2 복수의 아넬로벡터의 단백질성 외부의 구조, 예를 들어, 3차 구조는 저온 전자 현미경(cryo-EM), X-선 결정학, 또는 핵자기 공명(NMR)을 사용하여 결정될 수 있다. 일부 구현예에서, 제1 복수의 아넬로벡터의 단백질성 외부의 구조는 구조적 정렬 및 단백질 구조에서 원자의 원자 좌표의 측정, 예를 들어, 평균 제곱근 오차(RMSD)의 측정을 사용하여 제2 복수의 아넬로벡터의 단백질성 외부의 구조와 비교된다. 일부 구현예에서, RMSD는 비교되는 구조의 폴리펩티드 사슬의 백본, 비교되는 구조의 폴리펩티드 사슬의 알파 탄소, 또는 비교되는 구조의 모든 원자, 예를 들어, 제1 복수의 아넬로벡터의 단백질성 외부 및 제2 복수의 아넬로벡터의 단백질성 외부에 대하여 계산될 수 있다. 일부 구현예에서, 더 낮은 값, 예를 들어, 5 옹스트롬 이하의 RMSD는 제1 복수의 아넬로벡터의 단백질성 외부와 제2 복수의 아넬로벡터의 단백질성 외부 사이의 구조적 유사성을 나타낸다. 일부 구현예에서, 더 낮은 값, 예를 들어, 3 옹스트롬 이하의 RMSD는 제1 복수의 아넬로벡터의 단백질성 외부와 제2 복수의 아넬로벡터의 단백질성 외부 사이의 높은 구조적 유사성을 나타낸다. 일부 구현예에서, 0 옹스트롬의 RMSD는 2개 단백질이 동일한 구조를 포함하고, 예를 들어, 제1 복수의 아넬로벡터의 단백질성 외부의 구조가 제2 복수의 아넬로벡터의 단백질성 외부와 동일함을 나타낸다.

III. 핵산 작제물

본 명세서에 기재된 유전 요소는 핵산 작제물(예를 들어, 본 명세서에 기재된 바와 같은 핵산 작제물)에 포함될 수 있다.

일 양태에서, 본 발명은 (i) 비-병원성 외부 단백질(예를 들어, 아넬로바이러스 ORF1 분자 또는 이의 스플라이스 변이체 또는 기능적 단편)을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터를 인코딩하는 서열을 포함하는 유전 요소를 포함하는 핵산 유전 요소 작제물을 포함한다.

유전 요소 또는 유전 요소 내의 임의의 서열은 임의의 적합한 방법을 사용하여 수득될 수 있다. 다양한 재조합 방법, 예를 들어, 바이러스 서열을 갖는 세포로부터 라이브러리의 스크리닝, 이를 포함하는 것으로 알려져 있는 핵산 작제물로부터 서열의 유도, 또는 표준 기법을 사용한 이를 함유하는 세포 및 조직으로부터의 직접적인 단리가 당업계에 알려져 있다. 대안적으로 또는 조합하여, 유전 요소의 일부 또는 전부는 클로닝보다는 합성에 의해 생성될 수 있다.

일부 구현예에서, 핵산 작제물은 조절 요소, 표적 유전자에 상동성인 핵산 서열, 및/또는 생존 가능한 세포 내에서 및/또는 세포내 분자가 표적 세포 내에 존재하는 경우 리포터 분자의 발현을 야기하기 위한 다양한 리포터 작제물을 포함한다.

잠재적으로 형질감염된 세포를 확인하고, 조절 서열의 기능을 평가하기 위한 리포터 유전자가 사용된다. 일반적으로, 리포터 유전자는 수여자 유기체 또는 조직에 존재하거나 그에 의해 발현되지 않고, 발현이 다소 용이하게 검출 가능한 특성, 예를 들어, 효소 활성에 의해 나타나는 폴리펩티드를 인코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수여자 세포 내로 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비 알칼리성 포스파타제 또는 녹색 형광 단백질 유전자를 인코딩하는 유전자를 포함할 수 있다(예를 들어, 문헌[Ui-Tei et al., 2000 FEBS Letters 479: 79-82]). 적합한 발현 시스템은 널리 알려져 있으며, 알려진 기법을 사용하여 제조되거나 상업적으로 수득될 수 있다. 일반적으로, 가장 높은 리포터 유전자의 발현 수준을 보이는 최소 5' 측접 영역을 갖는 작제물은 프로모터로서 확인된다. 이러한 프로모터 영역은 리포터 유전자에 연결되고, 프로모터-유도 전사를 조절하는 능력에 대하여 작용제를 평가하기 위해 사용될 수 있다.

일부 구현예에서, 핵산 작제물은 실질적으로 비-병원성이고/이거나 숙주 세포 내에 실질적으로 비-통합되거나, 숙주에서 실질적으로 비-면역원성이다.

일부 구현예에서, 핵산 작제물은 표현형, 바이러스 수준, 유전자 발현, 다른 바이러스와의 경쟁, 병태 등 중 하나 이상을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상 조절하기에 충분한 양으로 존재한다.

IV. 조성물

본 명세서에 기재된 아넬로벡터는 또한 예를 들어, 본 명세서에 기재된 바와 같이, 약제학적 부형제와 함께 약제학적 조성물에 포함될 수 있다. 일부 구현예에서, 약제학적 조성물은 적어도 10⁵, 10⁶, 10⁷, 10⁸, 10⁹, 10¹⁰, 10¹¹, 10¹², 10¹³, 10¹⁴또는 10¹⁵개의 아넬로벡터를 포함한다. 일부 구현예에서, 약제학적 조성물은 약 10⁵내지 10¹⁵, 10⁵내지 10¹⁰또는 10¹⁰내지 10¹⁵개의 아넬로벡터를 포함한다. 일부 구현예에서, 약제학적 조성물은 약 10⁸개(예를 들어, 약 10⁵, 10⁶, 10⁷, 10⁸, 10⁹또는 10¹⁰개) 게놈 당량/㎖의 아넬로벡터를 포함한다. 일부 구현예에서, 약제학적 조성물은 예를 들어, PCT/US19/65995의 실시예 18의 방법에 따라 결정시, 10⁵내지 10¹⁰, 10⁶내지 10¹⁰, 10⁷내지 10¹⁰, 10⁸내지 10¹⁰, 10⁹내지 10¹⁰, 10⁵내지 10⁶, 10⁵내지 10⁷, 10⁵내지 10⁸, 10⁵내지 10⁹, 10⁵내지 10¹¹, 10⁵내지 10¹², 10⁵내지 10¹³, 10⁵내지 10¹⁴, 10⁵내지 10¹⁵또는 10¹⁰내지 10¹⁵개 게놈 당량/㎖의 아넬로벡터를 포함한다. 일부 구현예에서, 약제학적 조성물은 세포당 아넬로벡터에 포함되는 적어도 1, 2, 5 또는 10, 100, 500, 1000, 2000, 5000, 8,000, 1 × 10⁴, 1 × 10⁵, 1 × 10⁶, 1 × 10⁷개 이상의 카피의 유전 요소를 진핵 세포의 집단에 운반하기에 충분한 아넬로벡터를 포함한다. 일부 구현예에서, 약제학적 조성물은 세포당 아넬로벡터에 포함되는 적어도 약 1 × 10⁴, 1 × 10⁵, 1 × 10⁶, 1 × 또는 10⁷또는 약 1 × 10⁴내지 1 × 10⁵, 1 × 10⁴내지 1 × 10⁶, 1 × 10⁴내지 1 × 10⁷, 1 × 10⁵내지 1 × 10⁶, 1 × 10⁵내지 1 × 10⁷또는 1 × 10⁶내지 1 × 10⁷개 카피의 유전 요소를 진핵 세포의 집단에 운반하기에 충분한 아넬로벡터를 포함한다.

일부 구현예에서, 약제학적 조성물은 하기의 특징 중 하나 이상을 갖는다: 약제학적 조성물이 약제학적 또는 우수 제조 기준(GMP) 표준을 충족하거나; 약제학적 조성물을 우수 제조 기준(GMP)에 따라 제조하거나; 약제학적 조성물이 사전결정된 기준 값 미만의 병원체 수준을 갖거나, 예를 들어, 실질적으로 병원체가 없거나; 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 갖거나, 예를 들어, 실질적으로 오염물질이 없거나; 또는 약제학적 조성물이 낮은 면역원성을 갖거나, 예를 들어, 본 명세서에 기재된 바와 같이 실질적으로 비-면역원성임.

일부 구현예에서, 약제학적 조성물은 임계값 미만의 양의 하나 이상의 오염물질을 포함한다. 약제학적 조성물에서 바람직하게는 배제되거나 최소화되는 예시적인 오염물질은 제한 없이, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 성분(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 바이러스, 비-감염성 입자, 유리 바이러스 캡시드 단백질, 외래 작용제 및 응집물을 포함한다. 구현예에서, 오염물질은 숙주 세포 DNA이다. 구현예에서, 조성물은 용량당 약 10 ng 미만의 숙주 세포 DNA를 포함한다. 구현예에서, 조성물 중 숙주 세포 DNA의 수준은 여과 및/또는 숙주 세포 DNA의 효소적 분해에 의해 감소된다. 구현예에서, 약제학적 조성물은 중량 기준 10% 미만(예를 들어, 약 10%, 5%, 4%, 3%, 2%, 1%, 0.5% 또는 0.1% 미만)의 오염물질로 이루어진다.

일 양태에서, 본 명세서에 기재된 본 발명은 하기를 포함하는 약제학적 조성물을 포함한다:

a) (i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합하는 외부 단백질 결합 서열, 및 (iii) 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소; 및 유전 요소와 회합된, 예를 들어, 이를 봉입하거나 둘러싸는 단백질성 외부를 포함하는 아넬로벡터; 및

b) 약제학적 부형제.

소낭

일부 구현예에서, 조성물은 운반체 성분, 예를 들어, 마이크로입자, 리포좀, 소낭 또는 엑소좀을 추가로 포함한다. 일부 구현예에서, 리포좀은 내부 수성 구획을 둘러싸는 단일- 또는 다중라멜라 지질 이중층 및 상대적으로 불투과성인 외부 친지성 인지질 이중층으로 구성된 구형 소낭 구조를 포함한다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 일반적으로 생체적합성, 비독성이며, 친수성 및 친지성 약물 분자 둘 모두를 운반하고, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호하고, 생물학적 막을 가로질러 그들의 로드를 수송할 수 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).

소낭은 몇몇 상이한 유형의 지질로부터 제조될 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 흔히 사용된다. 소낭은 제한 없이, DOTMA, DOTAP, DOTIM, DDAB를 단독으로 또는 콜레스테롤과 함께 포함하여, DOTMA 및 콜레스테롤, DOTAP 및 콜레스테롤, DOTIM 및 콜레스테롤, 및 DDAB 및 콜레스테롤을 제공할 수 있다. 다중라멜라 소낭 지질의 제조 방법은 당업계에 알려져 있다(예를 들어, 다중라멜라 소낭 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 미국 특허 6,693,086 참조). 지질 필름이 수용액과 혼합되는 경우 소낭 형성은 자발적일 수 있지만, 이는 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용함으로써 진탕 형태로 힘을 가함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 압출된 지질은 압출된 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이 감소하는 크기의 필터를 통해 압출시킴으로써 제조될 수 있다.

본 명세서에 기재된 바와 같이, 첨가제를 소낭에 첨가하여, 그들의 구조 및/또는 특성을 변형시킬 수 있다. 예를 들어, 콜레스테롤 또는 스핑고미엘린을 혼합물에 첨가하여, 구조의 안정화 및 내부 카고의 누출의 방지를 도울 수 있다. 추가로, 소낭은 수소화된 난(egg) 포스파티딜콜린 또는 난 포스파티딜콜린, 콜레스테롤 및 디세틸 포스페이트로부터 제조될 수 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 또한, 소낭은 합성 동안 또는 그 후에 수여자 세포 상의 반응성 기에 상보성인 반응성 기를 포함하도록 표면 변형될 수 있다. 이러한 반응성 기는 제한 없이, 말레이미드 기를 포함한다. 일 예로서, 소낭은 말레이미드 컨쥬게이트된 인지질, 예컨대 제한 없이 DSPE-MaL-PEG2000을 포함하도록 합성될 수 있다.

소낭 형성은 주로 천연 인지질 및 지질, 예컨대 1,2-다이스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 난 포스파티딜콜린 및 모노시알로강글리오시드로 구성될 수 있다. 인지질만으로 제조된 제형은 혈장에서 덜 안정하다. 그러나, 콜레스테롤을 사용한 지질 막의 조작은 캡슐화된 카고의 신속한 방출을 감소시키거나, 1,2-다이올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).

일부 구현예에서, 지질은 지질 마이크로입자를 형성하기 위해 사용될 수 있다. 지질은 DLin-KC2-DMA4, C12-200 및 공지질 디스테로일포스파티딜 콜린을 포함하지만 이들로 제한되지 않으며, 콜레스테롤 및 PEG-DMG는 자발적 소낭 형성 절차를 사용하여 제형화될 수 있다(예를 들어, 문헌[Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3] 참조). 성분 몰비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 테크미라(Tekmira)는 모두가 본 발명에 사용될 수 있고/있거나 조정될 수 있는 지질 마이크로입자 및 지질 마이크로입자 제형의 다양한 양태에 관한, 미국 및 해외에서의 대략 95개의 특허 패밀리의 포트폴리오를 갖는다(예를 들어, 미국 특허 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943 및 7,838,658 및 유럽 특허 1766035; 1519714; 1781593 및 1664316 참조).

일부 구현예에서, 마이크로입자는 무작위 방식으로 배열된 하나 이상의 고형화된 폴리머(들)를 포함한다. 마이크로입자는 생분해성일 수 있다. 생분해성 마이크로입자는 예를 들어, 제한 없이, 용매 증발, 핫 멜트 마이크로캡슐화, 용매 제거 및 분무 건조를 포함하는 당업계에 알려져 있는 방법을 사용하여 합성될 수 있다. 마이크로입자를 합성하기 위한 예시적인 방법은 문헌[Bershteyn et al., Soft Matter 4:1787-1787, 2008] 및 US 2008/0014144 A1에 기재되어 있으며, 마이크로입자 합성에 관한 이의 구체적인 교시는 본 명세서에 참조로 포함된다.

생분해성 마이크로입자를 형성하기 위해 사용될 수 있는 예시적인 합성 폴리머는 제한 없이, 지방족 폴리에스테르, 폴리 (락트산)(PLA), 폴리 (글리콜산)(PGA), 락트산 및 글리콜산의 코폴리머(PLGA), 폴리카프로락톤(PCL), 다가무수물(polyanhydride), 폴리(오르토)에스테르, 폴리우레탄, 폴리(부티르산), 폴리(발레르산) 및 폴리(락티드-코-카프로락톤) 및 천연 폴리머, 예컨대 알부민, 알긴산염 및 덱스트란 및 셀룰로스를 포함하는 기타 다당류, 콜라겐, 예컨대, 예를 들어, 알킬, 알킬렌과 같은 화학 기의 치환, 부가, 하이드록실화, 산화 및 당업자에 의해 일상적으로 이루어지는 기타 변형을 포함하는 이의 화학적 유도체, 알부민 및 기타 친수성 단백질, 제인 및 기타 프롤라민 및 소수성 단백질, 이의 코폴리머 및 혼합물을 포함한다. 일반적으로, 이들 물질은 효소적 가수분해 또는 물로의 노출에 의해, 표면 또는 벌크 침식에 의해 분해된다.

마이크로입자의 직경은 0.1 내지 1000 마이크로미터(㎛) 범위이다. 일부 구현예에서, 그들의 직경은 크기가 1 내지 750 ㎛, 또는 50 내지 500 ㎛, 또는 100 내지 250 ㎛의 범위이다. 일부 구현예에서, 그들의 직경은 크기가 50 내지 1000 ㎛, 50 내지 750 ㎛, 50 내지 500 ㎛, 또는 50 내지 250 ㎛의 범위이다. 일부 구현예에서, 그들의 직경은 크기가 .05 내지 1000 ㎛, 10 내지 1000 ㎛, 100 내지 1000 ㎛, 또는 500 내지 1000 ㎛의 범위이다. 일부 구현예에서, 그들의 직경은 약 0.5 ㎛, 약 10 ㎛, 약 50 ㎛, 약 100 ㎛, 약 200 ㎛, 약 300 ㎛, 약 350 ㎛, 약 400 ㎛, 약 450 ㎛, 약 500 ㎛, 약 550 ㎛, 약 600 ㎛, 약 650 ㎛, 약 700 ㎛, 약 750 ㎛, 약 800 ㎛, 약 850 ㎛, 약 900 ㎛, 약 950 ㎛ 또는 약 1000 ㎛이다. 마이크로입자 직경의 맥락에서 사용되는 바와 같이, 용어 "약"은 언급된 절대값의 +/-5%를 의미한다.

일부 구현예에서, 리간드는 입자의 표면 상에 존재하고, 부착될 리간드 상에 존재하는 작용성 화학 기(카복실산, 알데히드, 아민, 술프하이드릴 및 하이드록실)를 통해 마이크로입자의 표면에 컨쥬게이트된다. 작용성은 예를 들어, 마이크로입자의 에멀젼 제조 동안 작용성 화학 기를 갖는 안정화제의 혼입에 의해 마이크로입자 내로 도입될 수 있다.

작용성 기를 마이크로입자에 도입하는 또 다른 예는 입자 제조 후 동안, 입자 및 리간드를 동종- 또는 이종 이작용성 가교결합제와 직접 가교결합시킴으로써 이루어진다. 이러한 절차는 적합한 화학물질 및 소정의 부류의 가교결합제(하기에 더욱 상세히 논의된 바와 같은 CDI, EDAC, 글루타르알데히드 등) 또는 제조 후에 입자 표면의 화학적 변형을 통해 리간드를 입자 표면에 커플링시키는 임의의 다른 가교결합제를 사용할 수 있다. 이는 또한 양친매성 분자, 예컨대 지방산, 지질 또는 기능적 안정화제가 입자 표면에 수동으로 흡수되고 부착되어, 그에 의해 리간드로의 테더링을 위한 작용성 말단 기를 도입할 수 있는 과정을 포함한다.

일부 구현예에서, 마이크로입자는 그들의 외부 표면 상에 하나 이상의 표적화 기를 포함하도록 합성하여, 특정 세포 또는 조직 유형(예를 들어, 심근세포)을 표적화할 수 있다. 이들 표적화 기는 제한 없이, 수용체, 리간드, 항체 등을 포함한다. 이들 표적화 기는 세포의 표면 상의 그들의 파트너와 결합한다. 일부 구현예에서, 마이크로입자는 세포 표면을 포함하는 지질 이중층 내로 통합될 것이며, 미토콘드리아는 세포로 운반된다.

마이크로입자는 또한, 그들의 최외각 표면 상에 지질 이중층을 포함할 수 있다. 이러한 이중층은 동일하거나 상이한 유형의 하나 이상의 지질로 구성될 수 있다. 예는 인지질, 예컨대 포스포콜린 및 포스포이노시톨을 포함하지만, 이에 제한되지 않는다. 구체적인 예는 제한 없이, DMPC, DOPC, DSPC 및 다양한 다른 지질, 예컨대 리포좀에 대하여 본 명세서에 기재된 것들을 포함한다.

일부 구현예에서, 담체는 예를 들어, 본 명세서에 기재된 바와 같은 나노입자를 포함한다.

일부 구현예에서, 본 명세서에 기재된 소낭 또는 마이크로입자는 진단제로 작용화된다. 진단제의 예는 양전자 방사 단층촬영(PET), 컴퓨터 보조 단층촬영(CAT), 단일 광자 방출 컴퓨터 단층촬영, x-선, 형광투시법 및 자기 공명 영상화(MRI)에 사용되는 구매할 수 있는 영상화제; 및 조영제를 포함하지만, 이에 제한되지 않는다. MRI에서 조영제로서 사용하기에 적합한 물질의 예는 가돌리늄 킬레이트, 및 철, 마그네슘, 망간, 구리 및 크롬을 포함한다.

담체

본 명세서에 기재된 조성물(예를 들어, 약제학적 조성물)은 담체를 포함하고/하거나, 이와 함께 제형화되고/되거나, 이 내에서 운반될 수 있다. 일 양태에서, 본 발명은 본 명세서에 기재된 조성물(예를 들어, 본 명세서에 기재된 아넬로벡터, 아넬로바이러스, 또는 유전 요소)을 포함하는(예를 들어, 캡슐화하는) 담체(예를 들어, 소낭, 리포좀, 지질 나노입자, 엑소좀, 적혈구, 엑소좀(예를 들어, 포유동물 또는 식물 엑소좀), 푸소좀)를 포함하는 조성물, 예를 들어, 약제학적 조성물을 포함한다.

일부 구현예에서, 본 명세서에 기재된 조성물 및 시스템은 리포좀 또는 다른 유사한 소낭 내에 제형화될 수 있다. 일반적으로, 리포좀은 내부 수성 구획을 둘러싸는 단일- 또는 다중라멜라 지질 이중층 및 상대적으로 불투과성인 외부 친지성 인지질 이중층으로 구성된 구형 소낭 구조이다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 일반적으로 하기의 특징 중 하나 이상(예를 들어, 전부)을 갖는다: 생체적합성, 비독성, 친수성 및 친지성 약물 분자 둘 모두를 운반할 수 있음, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호할 수 있음 및 생물학적 막 및 혈액 뇌 장벽(BBB)을 가로질러 그들의 로드를 수송할 수 있음(예를 들어, 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679]; 및 문헌[Zylberberg & Matosevic. 2016. Drug Delivery, 23:9, 3319-3329, doi: 10.1080/10717544.2016.1177136] 참조).

소낭은 몇몇 상이한 유형의 지질로부터 제조될 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 흔히 사용된다. 다중라멜라 소낭 지질의 제조 방법은 공지되어 있다(예를 들어, 미국 특허 6,693,086을 참조하며, 다중라멜라 소낭 지질 제제에 관한 이의 교시는 본 명세서에 참조로 포함됨). 소낭 형성은 지질막을 수성 용액과 혼합하는 경우에 자발적일 수 있지만, 그것은 균질화기, 초음파기 또는 압출 장치를 사용함으로써 진탕 형태의 힘을 인가함으로써 촉진될 수도 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 압출된 지질은 예를 들어, 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이, 감소하는 크기의 필터를 통한 압출에 의해 제조될 수 있다.

지질 나노입자(LNP)는 본 명세서에 기재된 약제학적 조성물을 위한 생체적합성 및 생분해성 운반 시스템을 제공하는 담체의 또 다른 예이다. 예를 들어, 문헌[Gordillo-Galeano et al. European Journal of Pharmaceutics and Biopharmaceutics. Volume 133, December 2018, Pages 285-308]을 참조한다. 나노구조화된 지질 담체(NLC)는 변형된 고체 지질 나노입자(SLN)의 특징을 보유하고, 약물 안정성 및 로딩 능력을 개선시키고, 약물 누출을 방지하는 변형된 고체 지질 나노입자(SLN)이다. 폴리머 나노입자(PNP)는 약물 운반의 중요한 구성성분이다. 이들 나노입자는 특정 표적으로의 약물 운반을 효율적으로 유도하고, 약물 안정성 및 제어된 약물 방출을 개선시킬 수 있다. 리포좀과 폴리머를 조합한 새로운 유형의 담체인, 지질-중합체 나노입자(PLN)도 또한 사용될 수 있다. 이들 나노입자는 PNP와 리포좀의 보완적인 이점을 보유한다. PLN는 코어(core)-쉘(shell) 구조로 구성된다; 폴리머 코어는 안정한 구조를 제공하며, 인지질 쉘(shell)은 우수한 생체적합성을 제공한다. 이와 같이, 2가지 구성성분은 약물 캡슐화 효율을 증가시키고, 표면 변형을 용이하게 하고, 수용성 약물의 누출을 방지한다. 검토를 위하여, 예를 들어, 문헌[Li et al. 2017, Nanomaterials 7, 122; doi:10.3390/nano7060122]을 참조한다.

엑소좀도 또한, 본 명세서에 기재된 조성물 및 시스템을 위한 약물 운반 비히클로서 사용될 수 있다. 검토를 위하여, 문헌[Ha et al. July 2016. Acta Pharmaceutica Sinica B. Volume 6, Issue 4, Pages 287-296; doi.org/10.1016/j.apsb.2016.02.001]을 참조한다.

생체 외 분화된 적혈구도 또한, 본 명세서에 기재된 조성물을 위한 담체로서 사용될 수 있다. 예를 들어, WO2015073587; WO2017123646; WO2017123644; WO2018102740; WO2016183482; WO2015153102; WO2018151829; WO2018009838; 문헌[Shi et al. 2014. Proc Natl Acad Sci USA. 111(28): 10131-10136]; 미국 특허 9,644,180; 문헌[Huang et al. 2017. Nature Communications 8: 423]; 문헌[Shi et al. 2014. Proc Natl Acad Sci USA. 111(28): 10131-10136]을 참조한다.

예를 들어, WO2018208728에 기재된 바와 같은 푸소좀 조성물도 또한 본 명세서에 기재된 조성물을 운반하기 위한 담체로서 사용될 수 있다.

막 투과성 폴리펩티드

일부 구현예에서, 조성물은 세포 내로 또는 막, 예를 들어, 세포 또는 핵 막을 가로질러 성분을 운반하도록 막 투과성 폴리펩티드(MPP)를 추가로 포함한다. 막을 가로질러 물질의 수송을 용이하게 할 수 있는 막 투과성 폴리펩티드는 세포-투과 펩티드(CPP)(예를 들어, 미국 특허 제8,603,966호 참조), 식물 세포내 운반을 위한 융합 펩티드(예를 들어, 문헌[Ng et al., PLoS One, 2016, 11:e0154081] 참조), 단백질 변환 도메인, 트로얀(Trojan) 펩티드, 및 막 전위 신호(MTS)(예를 들어, 문헌[Tung et al., Advanced Drug Delivery Reviews 55:281-294 (2003)] 참조)를 포함하지만, 이에 제한되지 않는다. 일부 MPP는 양으로 하전된 측쇄를 갖는 아미노산, 예컨대 아르기닌이 풍부하다.

막 투과성 폴리펩티드는 전신 투여 시에 생체 내에서 다중의 조직의 세포 내에서, 성분의 막 투과를 유도하고, 거대분자 전위를 가능하게 하는 능력을 갖는다. 막 투과성 폴리펩티드는 또한, 적절한 조건 하에서 세포와 접촉되는 경우, 외부 환경으로부터 세포질, 세포소기관, 예컨대 미토콘드리아 또는 세포의 핵을 포함하는 세포내 환경에, 수동 확산으로 달성될 것보다 유의미하게 더 큰 양으로 통과하는 펩티드를 지칭할 수 있다.

막을 가로질러 수송되는 성분은 막 투과성 폴리펩티드와 가역적으로 또는 비가역적으로 연결될 수 있다. 링커는 화학적 결합, 예를 들어, 하나 이상의 공유 결합 또는 비-공유 결합일 수 있다. 일부 구현예에서, 링커는 펩티드 링커이다. 이러한 링커는 2 내지 30개 아미노산 이상일 수 있다. 링커는 유연성, 강성 또는 절단 가능한 링커를 포함한다.

조합

일 양태에서, 본 명세서에 기재된 아넬로벡터 또는 아넬로벡터를 포함하는 조성물은 또한, 하나 이상의 이종성 모이어티를 포함할 수 있다. 일 양태에서, 본 명세서에 기재된 아넬로벡터 또는 아넬로벡터를 포함하는 조성물은 또한, 융합물 내에 하나 이상의 이종성 모이어티를 포함할 수 있다. 일부 구현예에서, 이종성 모이어티는 유전 요소와 연결될 수 있다. 일부 구현예에서, 이종성 모이어티는 아넬로벡터의 일부로서 단백질성 외부에 봉입될 수 있다. 일부 구현예에서, 이종성 모이어티는 아넬로벡터와 함께 투여될 수 있다.

일 양태에서, 본 발명은 본 명세서에 기재된 아넬로벡터 및 이종성 모이어티 중 어느 하나를 포함하는 세포 또는 조직을 포함한다.

또 다른 양태에서, 본 발명은 본 명세서에 기재된 아넬로벡터 및 이종성 모이어티를 포함하는 약제학적 조성물을 포함한다.

일부 구현예에서, 이종성 모이어티는 바이러스(예를 들어, 이펙터(예를 들어, 약물, 소분자)), 표적화제(예를 들어, DNA 표적화제, 항체, 수용체 리간드), 태그(예를 들어, 형광단, 감광성 작용제, 예컨대 킬러레드(KillerRed)) 또는 본 명세서에 기재된 편집 또는 표적화 모이어티일 수 있다. 일부 구현예에서, 본 명세서에 기재된 막 전위 폴리펩티드는 하나 이상의 이종성 모이어티에 연결된다. 일 구현예에서, 이종성 모이어티는 소분자(예를 들어, 펩티드 모방체 또는 2000 달톤 미만의 분자량을 갖는 작은 유기 분자), 펩티드 또는 폴리펩티드(예를 들어, 항체 또는 이의 항원-결합 단편), 나노입자, 압타머 또는 약리학적 작용제(pharmacoagent)이다.

바이러스

일부 구현예에서, 아넬로벡터 또는 조성물(예를 들어, 본 명세서에 기재된 바와 같음)은, 예를 들어, 이종성 모이어티로서, 아넬로바이러스 이외의 바이러스, 예를 들어, 단일 가닥 DNA 바이러스, 예를 들어, 비드나바이러스, 써코바이러스, 제미니바이러스, 게노모바이러스, 이노바이러스, 마이크로바이러스, 나노바이러스, 파보바이러스 및 스피라바이러스 유래의 하나 이상의 구성성분 또는 요소(예를 들어, 핵산 또는 폴리펩티드)를 추가로 포함할 수 있다. 일부 구현예에서, 조성물은 이중 가닥 DNA 바이러스, 예를 들어, 아데노바이러스, 암풀라바이러스, 아스코바이러스, 아스파바이러스, 배큘로바이러스, 푸셀로바이러스, 글로불로바이러스, 구타바이러스, 하이트로사바이러스, 헤르페스바이러스, 이리도바이러스, 리포트릭스바이러스, 니마바이러스 및 폭스바이러스를 추가로 포함할 수 있다. 일부 구현예에서, 조성물은 RNA 바이러스, 예를 들어, 알파바이러스, 푸로바이러스, 간염 바이러스, 호르데이바이러스, 토바모바이러스, 토브라바이러스, 트리코르나바이러스, 루비바이러스, 비르나바이러스, 시스토바이러스, 파르티티바이러스 및 레오바이러스를 추가로 포함할 수 있다. 일부 구현예에서, 아넬로벡터는 이종성 모이어티로서 바이러스와 함께 투여된다.

일부 구현예에서, 이종성 모이어티는 비-병원성, 예를 들어, 상리공생, 편리공생, 고유 바이러스를 포함할 수 있다. 일부 구현예에서, 비-병원성 바이러스는 하나 이상의 아넬로바이러스, 예를 들어, 알파토르크바이러스(TT), 베타토르크바이러스(TTM) 및 감마토르크바이러스(TTMD)이다. 일부 구현예에서, 아넬로바이러스는 토르크 테노 바이러스(TT), SEN 바이러스, 센티넬 바이러스, TTV-유사 미니 바이러스, TT 바이러스, TT 바이러스 유전형 6, TT 바이러스 군, TTV-유사 바이러스 DXL1, TTV-유사 바이러스 DXL2, 토르크 테노-유사 미니 바이러스(TTM) 또는 토르크 테노-유사 미디 바이러스(TTMD)를 포함할 수 있다. 일부 구현예에서, 비-병원성 바이러스는 본 명세서에 기재된 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 하나 이상의 서열을 포함한다.

일부 구현예에서, 이종성 모이어티는 대상체에서 결여된 것으로 확인된 하나 이상의 바이러스를 포함할 수 있다. 예를 들어, 디스비로시스를 갖는 것으로 확인된 대상체에는 대상체에서 불균형인 아넬로벡터 및 하나 이상의 바이러스 성분 또는 바이러스를 포함하는, 또는 기준 값, 예를 들어, 건강한 대상체와 상이한 비를 갖는 조성물이 투여될 수 있다.

일부 구현예에서, 이종성 모이어티는 하나 이상의 비-아넬로바이러스, 예를 들어, 아데노바이러스, 헤르페스 바이러스, 폭스 바이러스, 백시니아 바이러스, SV40, 파필로마 바이러스, RNA 바이러스, 예컨대 레트로바이러스, 예를 들어, 렌티 바이러스, 단일-가닥 RNA 바이러스, 예를 들어, 간염 바이러스 또는 이중-가닥 RNA 바이러스, 예를 들어, 로타바이러스를 포함할 수 있다. 일부 구현예에서, 아넬로벡터 또는 바이러스는 결함이 있거나, 감염성 입자를 생성하기 위하여 지원을 필요로 한다. 이러한 지원은 예를 들어, LTR 내의 조절 서열의 제어 하에 복제 결함 아넬로벡터 또는 바이러스의 구조적 유전자 중 하나 이상(예를 들어, 이의 전부)를 인코딩하는, 핵산, 예를 들어, 게놈 내로 통합되는 플라스미드 또는 DNA를 함유하는 헬퍼 세포주를 사용함으로써 제공될 수 있다. 본 명세서에 기재된 아넬로벡터를 복제하는 데 적합한 세포주는 해당 분야에 알려진 세포주, 예를 들어, 본 명세서에 기재된 바와 같이 변형될 수 있는 A549 세포를 포함한다.

표적화 모이어티

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 표적화 모이어티, 예를 들어, 표적 세포 상에 존재하는 관심 분자에 특이적으로 결합하는 표적화 모이어티를 추가로 포함할 수 있다. 표적화 모이어티는 관심 분자 또는 세포의 특정 기능을 조절하거나, 특정 분자(예를 들어, 효소, 단백질 또는 핵산), 예를 들어, 경로 내의 관심 분자의 하류의 특정 분자를 조절하거나, 표적에 특이적으로 결합하여, 아넬로벡터 또는 유전 요소를 국소화시킬 수 있다. 예를 들어, 표적화 모이어티는 특정 관심 분자와 상호작용하여 이의 기능을 증가시키거나, 감소시키거나, 또는 다르게 조절하는 치료제를 포함할 수 있다.

태그화 또는 모니터링 모이어티

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 태그를 추가로 포함하여, 본 명세서에 기재된 아넬로벡터 또는 유전 요소를 표지하거나 모니터링할 수 있다. 태그화 또는 모니터링 모이어티는 화학적 작용제 또는 효소적 절단, 예컨대 단백질 분해 또는 인테인 스플라이싱에 의해 제거할 수 있다. 친화성 태그는 친화성 기법을 사용하여 태그화된 폴리펩티드를 정제하는 데 유용할 수 있다. 일부 예에는 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 글루타티온-S-트랜스퍼라제(GST) 및 폴리(His) 태그가 포함된다. 가용화 태그는 샤페론-결함 종, 예컨대 에스케리키아 콜라이(E. coli)에서 발현되는 재조합 단백질이 단백질에서 적절하게 폴딩되는 것을 지원하는 것을 돕고, 그들이 침전하지 못하게 하는 데 유용할 수 있다. 일부 예는 티오레독신(TRX) 및 폴리(NANP)를 포함한다. 태그화 또는 모니터링 모이어티는 감광성 태그, 예를 들어, 형광을 포함할 수 있다. 형광 태그는 시각화에 유용하다. GFP 및 이의 변이체는 형광 태그로서 흔히 사용되는 몇몇의 예이다. 단백질 태그는 특정 효소적 변형(예컨대, 비오틴 리가제에 의한 비오티닐화) 또는 화학적 변형(예컨대 형광 영상화를 위한 FlAsH-EDT2와의 반응)이 일어나게 할 수 있다. 종종 태그화 또는 모니터링 모이어티를 조합하여, 단백질을 다수의 다른 성분과 연결시킨다. 태그화 또는 모니터링 모이어티는 또한 특정 단백질분해 또는 효소적 절단에 의해(예를 들어, TEV 프로테아제, 트롬빈, 인자 Xa 또는 엔테로펩티다제에 의해) 제거될 수 있다.

나노입자

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 나노입자를 추가로 포함할 수 있다. 나노입자는 약 1 내지 약 1000 나노미터, 약 1 내지 약 500 나노미터 크기, 약 1 내지 약 100 nm, 약 50 nm 내지 약 300 nm, 약 75 nm 내지 약 200 nm, 약 100 nm 내지 약 200 nm, 및 그 사이의 임의의 범위의 크기를 갖는 무기 물질을 포함한다. 나노입자는 일반적으로, 나노규모 크기의 복합 구조를 갖는다. 일부 구현예에서, 나노입자는 통상적으로 구형이지만, 나노입자 조성에 따라 상이한 형태가 가능하다. 나노입자의 외부 환경과 접촉하는 나노입자의 부분은 일반적으로 나노입자의 표면으로서 확인된다. 본 명세서에 기재된 나노입자에서, 크기 제한은 2차원으로 제한될 수 있으며, 이에 따라, 나노입자는 약 1 내지 약 1000 nm의 직경을 갖는 복합 구조를 포함하게 되며, 여기서 특정 직경은 나노입자 조성물 및 실험 설계에 따라 의도된 나노입자의 용도에 좌우된다. 예를 들어, 치료적 응용에 사용되는 나노입자는 통상적으로 약 200 nm 이하의 크기를 갖는다.

나노입자의 바람직한 추가의 특성, 예컨대 표면 전하 및 입체적 안정화는 또한, 특정 관심 응용을 고려하여 달라질 수 있다. 임상적 응용, 예컨대 암 치료에 바람직할 수 있는 예시적인 특성은 이의 전문이 각각 본 명세서에 참조로 포함되는 문헌[Davis et al, Nature 2008 vol. 7, pages 771-782]; 문헌[Duncan, Nature 2006 vol. 6, pages 688-701]; 및 문헌[Allen, Nature 2002 vol. 2 pages 750-763]에 기재되어 있다. 추가의 특성은 본 개시내용의 판독 시에 당업자에 의해 확인 가능하다. 나노입자 치수 및 특성은 해당 분야에 알려진 기법에 의해 검출될 수 있다. 입자 치수를 검출하기 위한 예시적인 기법은 동적 광 산란(DLS) 및 다양한 현미경관찰, 예컨대 투과 전자 현미경관찰(TEM) 및 원자력 현미경관찰(AFM)을 포함하지만, 이에 제한되지 않는다. 입자 형태를 검출하기 위한 예시적인 기법은 TEM 및 AFM을 포함하지만 이들에 제한되지 않는다. 나노입자의 표면 전하를 검출하기 위한 예시적인 기법은 제타 전위 방법을 포함하지만, 이에 제한되지 않는다. 다른 화학적 특성을 검출하는 데 적합한 추가의 기법은 ¹H, ¹¹B 및 ¹³C 및 ¹⁹F NMR, UV/Vis 및 적외선/라만 분광학 및 형광 분광학(나노입자가 형광 표지와 조합하여 사용되는 경우) 및 당업자에 의해 확인 가능한 추가의 기법을 포함한다.

소분자

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 소분자를 추가로 포함할 수 있다. 소분자 모이어티는 작은 펩티드, 펩티드 모방체(예를 들어, 펩토이드), 아미노산, 아미노산 유사체, 합성 폴리뉴클레오티드, 폴리뉴클레오티드 유사체, 뉴클레오티드, 뉴클레오티드 유사체, 일반적으로 몰당 약 5,000 그램 미만의 분자량을 갖는 유기 및 무기 화합물(이종유기 및 유기금속 화합물 포함), 예를 들어, 몰당 약 2,000 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 예를 들어, 몰당 약 1,000 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 예를 들어, 몰당 약 500 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 및 이러한 화합물의 염, 에스테르 및 다른 약제학적으로 허용 가능한 형태를 포함하지만, 이에 제한되지 않는다. 소분자는 신경전달물질, 호르몬, 약물, 독소, 바이러스 또는 미생물 입자, 합성 분자, 및 효능제 또는 길항제를 포함할 수 있지만, 이들에 제한되지 않는다.

적합한 소분자의 예는 모두 본 명세서에 참조로 포함되는 문헌["The Pharmacological Basis of Therapeutics," Goodman and Gilman, McGraw-Hill, New York, N.Y., (1996), Ninth edition]의 다음과 같은 섹션에 기재된 것들을 포함한다: 시냅스 및 신경이펙터 연결 부위에서 작용하는 약물; 중추신경계에서 작용하는 약물; 오타코이드: 염증의 약물 요법; 물, 염 및 이온; 신장 기능 및 전해질 대사에 영향을 미치는 약물; 심혈관 약물; 위장 기능에 영향을 미치는 약물; 자궁 운동에 영향을 미치는 약물; 기생충 감염의 화학요법; 미생물 질환의 화학요법; 신생물 질환의 화학요법; 면역억제를 위해 사용되는 약물; 혈액-형성 기관에 작용하는 약물; 호르몬 및 호르몬 길항제; 비타민, 피부과학 및 독성학. 소분자의 일부 예는 프리온 약물, 예컨대 타크롤리무스, 유비퀴틴 리가제 또는 HECT 리가제 저해제, 예컨대 헤클린(heclin), 히스톤 변형 약물, 예컨대 부티르산나트륨, 효소적 저해제, 예컨대 5-아자-시티딘, 안트라사이클린, 예컨대 독소루비신, 베타-락탐, 예컨대 페니실린, 항-박테리아제, 화학요법제, 항-바이러스제, 다른 유기체로부터의 조절제, 예컨대 VP64, 및 불충분한 생체 이용 가능성을 갖는 약물, 예컨대 결함이 있는 약동학을 갖는 화학치료제를 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, 소분자는 후성적 변형제, 예를 들어 문헌[de Groote et al. Nuc. Acids Res. (2012):1-18]에 기재된 것들이다. 예시적인 소분자 후성적 변형제는 예를 들어, 본 명세서에 참조로 포함되는 문헌[Lu et al. J. Biomolecular Screening 17.5(2012):555-71], 예를 들어, 표 1 또는 2에 기재되어 있다. 일부 구현예에서, 후성적 변형제는 보리노스타트(vorinostat) 또는 로미뎁신(romidepsin)을 포함한다. 일부 구현예에서, 후성적 변형제는 부류 I, II, III 및/또는 IV 히스톤 데아세틸라제(HDAC)의 저해제를 포함한다. 일부 구현예에서, 후성적 변형제는 SirTI의 활성화제를 포함한다. 일부 구현예에서, 후성적 변형제는 가르시놀(Garcinol), Lys-CoA, C646, (+)-JQI, I-BET, BICI, MS120, DZNep, UNC0321, EPZ004777, AZ505, AMI-I, 피라졸 아미드 7b, 벤조[d]이미다졸 17b, 아실화된 답손 유도체(예를 들어, PRMTI), 메틸스타트(methylstat), 4,4'-디카복시-2,2'-비피리딘, SID 85736331, 하이드록사메이트 유사체 8, 타닐사이프로미(tanylcypromie), 비스구아니딘 및 비구아니드 폴리아민 유사체, UNC669, 비다자(Vidaza), 데시타빈(decitabine), 소듐 페닐 부티레이트(SDB), 리포산(LA), 케르세틴(quercetin), 발프로산, 하이드랄라진(hydralazine), 박트림(bactrim), 녹차 추출물(예를 들어, 에피갈로카테킨 갈레이트(EGCG)), 커큐민, 술포르판(sulforphane) 및/또는 알리신(allicin)/디알릴 디술피드를 포함한다. 일부 구현예에서, 후성적 변형제는 DNA 메틸화를 저해하며, 예를 들어, DNA 메틸트랜스퍼라제의 저해제이다(예를 들어, 5-아자시티딘이고/이거나 데시타빈이다). 일부 구현예에서, 후성적 변형제는 히스톤 변형, 예를 들어, 히스톤 아세틸화, 히스톤 메틸화, 히스톤 수모화(sumoylation) 및/또는 히스톤 인산화를 변형시킨다. 일부 구현예에서, 후성적 변형제는 히스톤 데아세틸라제의 저해제이다(예를 들어, 보리노스타트 및/또는 트리코스타틴 A이다).

일부 구현예에서, 소분자는 약제학적 활성 작용제이다. 일 구현예에서, 소분자는 대사 활성 또는 성분의 저해제이다. 유용한 부류의 약제학적 활성 작용제는 항생제, 항-염증 약물, 혈관신생 또는 혈관작용제, 성장 인자 및 화학치료제(항-신생물)제(예를 들어, 종양 억제제)를 포함하지만, 이에 제한되지 않는다. 본 명세서에 기재된 범주 및 예로부터의 또는 문헌[(Orme-Johnson 2007, Methods Cell Biol. 2007;80:813-26)]으로부터의 분자 중 하나 또는 조합이 사용될 수 있다. 일 구현예에서, 본 발명은 항생제, 항-염증 약물, 혈관신생 또는 혈관작용제, 성장 인자 또는 화학치료제를 포함하는 조성물을 포함한다.

펩티드 또는 단백질

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 펩티드 또는 단백질을 추가로 포함할 수 있다. 펩티드 모이어티는 펩티드 리간드 또는 항체 단편(예를 들어, 수용체, 예컨대 세포외 수용체에 결합하는 항체 단편), 신경펩티드, 호르몬 펩티드, 펩티드 약물, 독성 펩티드, 바이러스 또는 미생물 펩티드, 합성 펩티드 및 효능제 또는 길항제 펩티드를 포함할 수 있지만, 이들에 제한되지 않는다.

펩티드 모이어티는 선형 또는 분지형일 수 있다. 펩티드는 약 5 내지 약 200개의 아미노산, 약 15 내지 약 150개의 아미노산, 약 20 내지 약 125개의 아미노산, 약 25 내지 약 100개의 아미노산 또는 그 사이의 임의의 범위의 길이를 갖는다.

펩티드의 일부 예는 형광 태그 또는 마커, 항원, 항체, 항체 단편, 예컨대 단일 도메인 항체, 리간드 및 수용체, 예컨대 글루카곤-유사 펩티드-1(GLP-1), GLP-2 수용체 2, 콜레시스토키닌(cholecystokinin) B(CCKB) 및 소마토스타틴 수용체, 펩티드 치료제, 예컨대 특정 세포 표면 수용체, 예컨대 G 단백질-커플링된 수용체(GPCR) 또는 이온 채널에 결합되는 것들, 천연적으로 생물활성인 펩티드로부터의 합성 또는 유사체 펩티드, 항-미생물 펩티드, 포어-형성 펩티드, 종양 표적화 또는 세포독성 펩티드, 및 분해 또는 자가-파괴 펩티드, 예컨대 아폽토시스-유도 펩티드 신호 또는 감광제 펩티드를 포함하지만 이들에 제한되지 않는다.

본 명세서에 기재된 본 발명에서 유용한 펩티드는 또한 작은 항원-결합 펩티드, 예를 들어, 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 쇄 항체, 나노바디를 포함한다(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조). 이러한 작은 항원 결합 펩티드는 사이토졸 항원, 핵 항원, 세포소기관-내 항원에 결합할 수 있다.

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 특정 위치, 조직 또는 세포를 표적화할 수 있는 리간드에 연결된 폴리펩티드를 포함한다.

올리고뉴클레오티드 압타머

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 올리고뉴클레오티드 압타머를 추가로 포함할 수 있다. 압타머 모이어티는 올리고뉴클레오티드 또는 펩티드 압타머이다. 올리고뉴클레오티드 압타머는 단백질 및 펩티드를 포함하는 사전-선택된 표적에 높은 친화성 및 특이성으로 결합할 수 있는 단일-가닥 DNA 또는 RNA(ssDNA 또는 ssRNA) 분자이다.

올리고뉴클레오티드 압타머는 다양한 분자 표적, 예컨대 소분자, 단백질, 핵산 및 심지어 세포, 조직 및 유기체에 결합하도록 반복된 회차의 시험관 내 선택 또는 동등하게, SELEX(지수적 농축에 의한 리간드의 계통 진화)를 통해 엔지니어링될 수 있는 핵산 종이다. 압타머는 차별적인 분자 인식을 제공하며, 화학적 합성에 의해 생성될 수 있다. 또한, 압타머는 바람직한 저장 특성을 갖고, 치료적 응용에서 면역원성을 거의 유도하지 않거나, 전혀 유도하지 않을 수 있다.

DNA 및 RNA 압타머는 둘 모두 다양한 표적에 대하여 강력한 결합 친화성을 보여줄 수 있다. 예를 들어, DNA 및 RNA 압타머는 t 라이소자임, 트롬빈, 인간 면역결핍 바이러스 트랜스-작용 반응성 요소(HIV TAR),(en.wikipedia.org/wiki/Aptamer - cite_note-10 참조), 헤민(hemin), 인터페론 γ, 혈관 내피 성장 인자(VEGF), 전립선 특이적 항원(PSA), 도파민 및 비-정규 종양유전자, 열 충격 인자 1(HSF1)을 위하여 선택된다.

펩티드 압타머

일부 구현예에서, 본 명세서에 기재된 조성물 또는 아넬로벡터는 펩티드 압타머를 추가로 포함할 수 있다. 펩티드 압타머는 낮은 분자량, 12 내지 14 kDa을 갖는 펩티드를 포함하는 하나의(또는 그 이상의) 짧은 가변 펩티드 도메인을 갖는다. 펩티드 압타머는 세포에 특이적으로 결합하고, 세포 내측의 단백질-단백질 상호작용을 간섭하도록 설계될 수 있다.

펩티드 압타머는 특이적 표적 분자에 결합하도록 선택되거나 엔지니어링된 인공 단백질이다. 이들 단백질은 가변 서열의 하나 이상의 펩티드 루프를 포함한다. 이들은 통상적으로 조합 라이브러리로부터 단리되며, 종종 유도된 돌연변이 또는 가변 영역 돌연변이유발 및 선택의 회차에 의해 후속적으로 개선된다. 생체 내에서, 펩티드 압타머는 세포 단백질 표적에 결합할 수 있고, 그들의 표적화된 분자와 다른 단백질의 정상적인 단백질 상호작용의 간섭을 포함하는 생물학적 효과를 발휘할 수 있다. 특히, 전사 인자 결합 도메인에 부착된 가변 펩티드 압타머 루프는 전사 인자 활성화 도메인에 부착된 표적 단백질에 대해 스크리닝한다. 이러한 선택 전략을 통해 펩티드 압타머의 표적으로의 펩티드 압타머의 생체 내 결합은 하류 효모 마커 유전자의 발현으로서 검출된다. 이러한 실험은 표현형을 유발하기 위해 압타머에 의해 결합되는 특정 단백질 및 압타머가 파괴하는 단백질 상호작용을 확인한다. 또한, 적절한 기능적 모이어티로 유도체화된 펩티드 압타머는 그들의 표적 단백질의 특정 번역-후 변형을 유발할 수 있거나, 표적의 하위세포 국소화를 변경시킬 수 있다.

펩티드 압타머는 또한 시험관 내에서 표적을 인식할 수 있다. 그들은 바이오센서에서 항체 대신에 이용되며, 비활성 및 활성 단백질 형태 둘 모두를 함유하는 집단으로부터 단백질의 활성 아이소폼을 검출하기 위해 이용된다. 펩티드 압타머 "헤드"가 독특한 서열의 이중-가닥 DNA "테일(tail)"에 공유적으로 연결된 태드폴(tadpole)로서 알려져 있는 유도체는 (예를 들어, 정량적 실시간 중합효소 연쇄 반응을 사용하여) 그들의 DNA 테일의 PCR에 의해 혼합물 중 드문 표적 분자의 정량화를 가능하게 한다.

펩티드 압타머 선택은 상이한 시스템을 사용하여 이루어질 수 있지만, 현재 효모 2-하이브리드 시스템이 가장 많이 사용된다. 펩티드 압타머는 또한 파지 디스플레이 또는 다른 표면 디스플레이 기술, 예컨대 mRNA 디스플레이, 리보좀 디스플레이, 박테리아 디스플레이 및 효모 디스플레이에 의해 구축된 조합 펩티드 라이브러리로부터 선택될 수 있다. 이들 실험 절차는 또한 바이오패닝(biopanning)으로서 알려져 있다. 바이오패닝으로부터 수득되는 펩티드 중에, 미모토프(mimotope)는 펩티드 압타머의 한 종류로서 간주될 수 있다. 조합 펩티드 라이브러리로부터 패닝된 모든 펩티드는 명칭 MimoDB를 갖는 특수 데이터에 저장되어 있다.

V. 숙주 세포

본 발명은 또한, 예를 들어, 본 명세서에 기재된 아넬로벡터를 포함하는 숙주 또는 숙주 세포에 관한 것이다. 일부 구현예에서, 숙주 또는 숙주 세포는 식물, 곤충, 박테리아, 진균, 척추동물, 포유동물(예를 들어, 인간), 또는 기타 유기체 또는 세포이다. 특정 구현예에서, 본 명세서에서 확인된 바와 같이, 제공된 아넬로벡터는 다양한 상이한 표적 숙주 세포를 감염시킨다. 표적 숙주 세포는 중배엽, 내배엽, 또는 외배엽 기원의 세포를 포함한다. 표적 숙주 세포는, 예를 들어, 상피 세포, 근육 세포, 백혈구 세포(예를 들어, 림프구), 신장 조직 세포, 폐 조직 세포를 포함한다.

일부 구현예에서, 아넬로벡터는 숙주에서 실질적으로 비-면역원성이다. 아넬로벡터 또는 유전 요소는 숙주의 면역계에 의해 요망되지 않는 상당한 반응을 생성하지 않는다. 일부 면역 반응은 체액성 면역 반응(예를 들어, 항원-특이적 항체의 생성) 및 세포-매개의 면역 반응(예를 들어, 림프구 증식)을 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, 숙주 또는 숙주 세포는 아넬로벡터와 접촉된다(예를 들어, 이로 감염됨). 일부 구현예에서, 숙주는 포유동물, 예를 들어, 인간이다. 일부 구현예에서, 숙주는 포유동물 세포, 예를 들어, 인간 세포이다. 숙주 내의 아넬로벡터의 양은 투여 후 임의의 시간에 측정될 수 있다. 특정 구현예에서, 배양물 중 아넬로벡터 성장의 시간 경과가 결정된다.

일부 구현예에서, 아넬로벡터, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터는 유전 가능하다. 일부 구현예에서, 아넬로벡터는 유체 및/또는 세포 중에서, 모체에서 아이에게 연속적으로 전달된다. 일부 구현예에서, 원래의 숙주 세포로부터의 딸 세포는 아넬로벡터를 포함한다. 일부 구현예에서, 모체는 아넬로벡터를 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 또는 99%의 효율로 아이에게, 또는 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 또는 99%의 전달 효율로 숙주 세포로부터 딸 세포로 전달한다. 일부 구현예에서, 숙주 세포 내의 아넬로벡터는 감수분열 동안 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 또는 99%의 전달 효율을 갖는다. 일부 구현예에서, 숙주 세포 내의 아넬로벡터는 유사분열 동안 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 또는 99%의 전달 효율을 갖는다. 일부 구현예에서, 세포 내의 아넬로벡터는 약 10% 내지 20%, 20% 내지 30%, 30% 내지 40%, 40% 내지 50%, 50% 내지 60%, 60% 내지 70%, 70% 내지 75%, 75% 내지 80%, 80% 내지 85%, 85% 내지 90%, 90% 내지 95%, 95% 내지 99% 또는 그 사이의 임의의 백분율의 전달 효율을 갖는다.

일부 구현예에서, 아넬로벡터, 예를 들어, 아넬로벡터는 숙주 세포 내에서 복제한다. 일 구현예에서, 아넬로벡터는 포유동물 세포, 예를 들어, 인간 세포에서 복제할 수 있다. 다른 구현예에서, 아넬로벡터는 복제 결핍 또는 복제 비적격이다.

일부 구현예에서, 아넬로벡터가 숙주 세포에서 복제되지만, 아넬로벡터는 숙주의 게놈 내로, 예를 들어, 숙주의 염색체와 통합되지 않는다. 일부 구현예에서, 아넬로벡터와 숙주의 염색체와의 재조합 빈도는 무시할 수 있는 정도이다. 일부 구현예에서, 아넬로벡터는, 예를 들어, 숙주의 염색체와, 예를 들어, 약 1.0 cM/Mb, 0.9 cM/Mb, 0.8 cM/Mb, 0.7 cM/Mb, 0.6 cM/Mb, 0.5 cM/Mb, 0.4 cM/Mb, 0.3 cM/Mb, 0.2 cM/Mb, 0.1 cM/Mb 미만의 재조합 빈도를 갖는다.

VI. 사용 방법

본 명세서에 기재된 아넬로벡터 및 아넬로벡터를 포함하는 조성물은 예를 들어, 질환, 장애 또는 병태의 치료를 필요로 하는 대상체(예를 들어, 포유동물 대상체, 예를 들어, 인간 대상체)에서의 질환, 장애 또는 병태의 치료 방법에 사용될 수 있다. 본 명세서에 기재된 약제학적 조성물의 투여는 예를 들어, 비경구(정맥내, 종양내, 복강내, 근육내, 강내 및 피하 포함) 투여로 이루어질 수 있다. 아넬로벡터는 단독으로 또는 약제학적 조성물로서 제형화되어 투여될 수 있다. 일부 구현예에서, 아넬로벡터는 단일 용량, 예를 들어 제1 복수로 투여될 수 있다. 일부 구현예에서, 아넬로벡터는 적어도 2개의 용량, 예를 들어, 제1 복수에 이어서 제2 복수로 투여될 수 있다. 일부 구현예에서, 아넬로벡터는 다중 용량, 예를 들어, 제1 복수, 제2 복수, 제3 복수, 선택적으로 제4 복수, 선택적으로 제5 복수, 및/또는 선택적으로 추가 복수의 다중 용량으로 투여될 수 있다.

아넬로벡터는 단위-용량 조성물, 예컨대 단위 용량 비경구 조성물의 형태로 투여될 수 있다. 이러한 조성물은 일반적으로 혼합에 의해 제조되며, 비경구 투여를 위하여 적합하게 조정될 수 있다. 이러한 조성물은 예를 들어, 주사 및 주입 용액 또는 현탁액 또는 좌제 또는 에어로졸의 형태로 존재할 수 있다.

일부 구현예에서, 예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터 또는 이를 포함하는 조성물의 투여는 아넬로벡터에 의해 포함되는 유전 요소가 예를 들어, 대상체 내의 표적 세포로 운반되게 할 수 있다.

예를 들어, 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 포함하는 본 명세서에 기재된 아넬로벡터 또는 이의 조성물을 사용하여 이펙터를 세포, 조직 또는 대상체에 운반할 수 있다. 일부 구현예에서, 아넬로벡터 또는 이의 조성물을 사용하여, 이펙터를 골수, 혈액, 심장, GI 또는 피부에 운반한다. 본 명세서에 기재된 아넬로벡터 조성물의 투여에 의한 이펙터의 운반은 세포, 조직 또는 대상체에서 비코딩 RNA 또는 폴리펩티드의 발현 수준을 조절할 수 있다(예를 들어, 증가 또는 감소시킬 수 있다). 이러한 방식으로의 발현 수준의 조절은 이펙터가 운반되는 세포에서 기능적 활성의 변경을 초래할 수 있다. 일부 구현예에서, 조절된 기능적 활성은 효소적, 구조적 또는 조절적 성질을 가질 수 있다.

일부 구현예에서, 아넬로벡터 또는 이의 카피는 세포로의 운반 후 24시간(예를 들어, 1일, 2일, 3일, 4일, 5일, 6일, 1주, 2주, 3주, 4주, 30일 또는 1개월)에 세포에서 검출 가능하다. 일부 구현예에서, 아넬로벡터 또는 이의 조성물은 표적 세포 상에서 효과를 매개하며, 효과는 적어도 1, 2, 3, 4, 5, 6 또는 7일, 2, 3 또는 4주 또는 1, 2, 3, 6 또는 12개월 동안 지속된다. (예를 들어, 아넬로벡터 또는 이의 조성물이 외인성 단백질을 인코딩하는 유전 요소를 포함하는) 일부 구현예에서, 효과는 1, 2, 3, 4, 5, 6 또는 7일, 2, 3 또는 4주 또는 1, 2, 3, 6 또는 12개월 미만 동안 지속된다.

본 명세서에 기재된 아넬로벡터 또는 아넬로벡터를 포함하는 조성물로 치료될 수 있는 질환, 장애 및 병태의 예는 제한 없이, 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질환, 염증성 장애, 자가면역 병태, 암(예를 들어, 고형 종양, 예를 들어, 폐암, 비-소세포 폐암, 예를 들어, mIR-625, 예를 들어, 카스파제-3에 반응성인 유전자를 발현하는 종양) 및 위장 장애를 포함한다. 일부 구현예에서, 아넬로벡터는 아넬로벡터가 접촉되는 세포 내에서 활성 또는 기능을 조절한다(예를 들어, 증가 또는 감소시킨다). 일부 구현예에서, 아넬로벡터는 아넬로벡터가 접촉되는 세포에서 분자(예를 들어, 핵산 또는 단백질)의 수준 또는 활성을 조절한다(예를 들어, 증가 또는 감소시킨다). 일부 구현예에서, 아넬로벡터는 아넬로벡터가 접촉되는 세포, 예를 들어, 암 세포의 생존력을 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 그 이상 감소시킨다. 일부 구현예에서, 아넬로벡터는 아넬로벡터가 접촉되는 세포, 예를 들어, 암 세포의 생존력을 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 그 이상 감소시키는 이펙터, 예를 들어, miRNA, 예를 들어, miR-625를 포함한다. 일부 구현예에서, 아넬로벡터는 예를 들어, 카스파제-3 활성을 증가시킴으로써 아넬로벡터가 접촉되는 세포, 예를 들어, 암 세포의 아폽토시스를 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 그 이상 증가시킨다. 일부 구현예에서, 아넬로벡터는 예를 들어, 카스파제-3 활성을 증가시킴으로써, 아넬로벡터가 접촉되는 세포, 예를 들어, 암 세포의 아폽토시스를 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 그 이상 증가시키는 이펙터, 예를 들어, miRNA, 예를 들어, miR-625를 포함한다.

VII. 투여/운반

조성물(예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터를 포함하는 약제학적 조성물)은 약제학적으로 허용 가능한 부형제를 포함하도록 제형화될 수 있다. 약제학적 조성물은 선택적으로 하나 이상의 추가의 활성 물질, 예를 들어, 치료적 및/또는 예방적 활성 물질을 포함할 수 있다. 본 발명의 약제학적 조성물은 멸균 및/또는 발열원-부재일 수 있다. 약제의 제형화 및/또는 제조에서의 일반적인 고려사항은 예를 들어, 문헌[Remington: The Science and Practice of Pharmacy 21st ed., Lippincott Williams & Wilkins, 2005](본 명세서에 참조로 포함됨)에서 찾을 수 있다.

본 명세서에 제공되는 약제학적 조성물의 설명이 주로 인간으로의 투여에 적합한 약제학적 조성물에 관한 것이지만, 이러한 조성물이 일반적으로 임의의 다른 동물로의, 예를 들어, 비-인간 동물, 예를 들어, 비-인간 포유동물로의 투여에 적합하다는 것을 당업자라면 이해할 것이다. 조성물이 다양한 동물로의 투여에 적합하게 만들기 위해 인간으로의 투여에 적합한 약제학적 조성물을 변형하는 것이 충분히 이해되며, 숙련된 수의학 약리학자는 존재한다면, 단지 일상적인 실험을 사용하여 이러한 변형을 설계하고/설계하거나 수행할 수 있다. 약제학적 조성물의 투여가 고려되는 대상체는 인간 및/또는 기타 영장류; 포유동물, 예컨대 상업적으로 관련된 포유동물, 예컨대 소, 돼지, 말, 양, 고양이, 개, 마우스 및/또는 랫트; 및/또는 조류, 예컨대 상업적으로 관련된 조류, 예컨대 가금류, 닭, 오리, 거위 및/또는 칠면조를 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, 약제학적 조성물의 투여가 고려되는 대상체는 인간이다. 일부 구현예에서, 대상체는, 예를 들어, 0 내지 4주령의 신생아이다. 일부 구현예에서, 대상체는, 예를 들어, 4주령 내지 1세의 영아이다. 일부 구현예에서, 대상체는, 예를 들어, 1세 내지 12세의 어린이이다. 일부 구현예에서, 대상체는 18세 미만이다. 일부 구현예에서, 대상체는, 예를 들어, 12세 내지 18세의 청소년이다. 일부 구현예에서, 대상체는 18세 초과이다. 일부 구현예에서, 대상체는, 예를 들어, 18세 내지 25세의 청년이다. 일부 구현예에서, 대상체는, 예를 들어, 25세 내지 50세의 성인이다. 일부 구현예에서, 대상체는 노인, 예를 들어, 적어도 50세 이상의 성인이다.

본 명세서에 기재된 약제학적 조성물의 제형은 약리학 분야에 알려져 있거나, 이후에 개발되는 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 활성 성분이 부형제 및/또는 하나 이상의 다른 보조 성분과 회합되게 한 다음, 필요하면 그리고/또는 바람직하면, 생성물을 나누고/나누거나, 성형하고/하거나 패키징하는 단계를 포함한다.

일 양태에서, 본 발명은 대상체로 아넬로벡터를 운반하는 방법을 특징으로 한다. 방법은 본 명세서에 기재된 바와 같은 아넬로벡터를 포함하는 약제학적 조성물을 대상체로 투여하는 단계를 포함한다. 일부 구현예에서, 투여된 아넬로벡터는 대상체에서 복제한다(예를 들어, 대상체의 바이러스체의 일부가 됨).

약제학적 조성물은 야생형 또는 고유 바이러스 요소 및/또는 변형된 바이러스 요소를 포함할 수 있다. 아넬로벡터는 하나 이상의 아넬로바이러스 서열(예를 들어, 핵산 서열 또는 이의 아미노산 서열을 인코딩하는 핵산 서열) 또는 이에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 서열을 포함할 수 있다. 아넬로벡터는 하나 이상의 아넬로바이러스 서열(예를 들어, 아넬로바이러스 ORF1 핵산 서열)에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 핵산 서열을 포함하는 핵산 분자를 포함할 수 있다. 아넬로벡터는 아넬로바이러스 아미노산 서열(예를 들어, 아넬로바이러스 ORF1 분자의 아미노산 서열)에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 분자를 포함할 수 있다. 아넬로벡터는 아넬로바이러스 아미노산 서열(예를 들어, 아넬로바이러스 ORF1 분자의 아미노산 서열)에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함할 수 있다.

일부 구현예에서, 아넬로벡터는 내인성 유전자 및 단백질 발현을 기준, 예를 들어, 건강한 대조군과 비교하여, 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상 증가(자극)시키기에 충분하다. 특정 구현예에서, 아넬로벡터는 내인성 유전자 및 단백질 발현을 기준, 예를 들어, 건강한 대조군과 비교하여, 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상 감소(저해)시키기에 충분하다.

일부 구현예에서, 아넬로벡터는 숙주 또는 숙주 세포에서 하나 이상의 바이러스 특성, 예를 들어, 향성, 감염성, 면역억제/활성화를 기준, 예를 들어, 건강한 대조군에 비하여 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상 저해/향상시킨다.

일 양태에서, 본 발명은 이전에 아넬로벡터, 예를 들어 제1 복수의 아넬로벡터를 투여받은 대상체, 예를 들어, 인간 대상체에게 이펙터를 운반하는 방법을 특징으로 하며, 방법은 제2 복수의 아넬로벡터의 투여를 포함한다. 또 다른 양태에서, 본 발명은 대상체, 예를 들어, 인간 대상체에게 이펙터를 운반하는 방법을 특징으로 하며, 방법은 대상체에게 제1 복수의 아넬로벡터를 투여하는 단계 및 대상체에게 제2 복수의 아넬로벡터를 후속적으로 투여하는 단계를 포함한다. 일부 구현예에서, 본 명세서에 기재된 방법은 제3, 제4, 제5, 및/또는 추가 복수의 아넬로벡터의 투여를 추가로 포함한다. 일부 구현예에서, 제1 및 제2 복수는 동일한 투여 경로, 예를 들어, 정맥내 투여를 통해 투여된다. 일부 구현예에서, 제1 및 제2 복수는 상이한 투여 경로를 통해 투여된다. 일부 구현예에서, 제1 복수의 아넬로벡터는 제1 약제학적 조성물의 일부로서 대상체에게 투여된다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제2 약제학적 조성물의 일부로서 대상체에게 투여된다.

일부 구현예에서, 제1 및 제2 복수는 거의 동일한 투약량의 아넬로벡터를 포함하며, 예를 들어, 제1 복수 및 제2 복수의 아넬로벡터는 거의 동일한 양 및/또는 농도의 아넬로벡터를 포함한다. 일부 구현예에서, 제2 복수는 90 내지 110%, 예를 들어, 95 내지 105%의 수의 제1 복수의 아넬로벡터를 포함한다. 일부 구현예에서, 제1 복수는 제2 복수보다 더 많은 투약량의 아넬로벡터를 포함하며, 예를 들어, 제1 복수는 제2 복수에 비해 더 많은 양 및/또는 더 큰 농도의 아넬로벡터를 포함한다. 일부 구현예에서, 제1 복수는 제2 복수보다 저 적은 투약량의 아넬로벡터를 포함하며, 예를 들어, 제1 복수는 제2 복수에 비해 더 많은 양 및/또는 더 작은 농도의 아넬로벡터를 포함한다. 일부 구현예에서, 대상체는 반복 용량의 아넬로벡터를 받으며, 반복 용량은 약 1, 2, 3, 또는 4주마다, 또는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월마다 투여된다.

일부 구현예에서, 대상체에게 투여된 제1 복수의 아넬로벡터에 포함된 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150일 후에, 예를 들어, 실시예 1에 기재된 바와 같이, 예를 들어, 고해상도 용융(HRM) 분석에 의해, 대상체에서 검출 가능하다. 일부 구현예에서, 대상체에게 투여된 제2 복수의 아넬로벡터에 포함된 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150일 후에, 예를 들어, 실시예 1에 기재된 바와 같이, 예를 들어, 고해상도 용융(HRM) 분석에 의해, 대상체에서 검출 가능하다.

일부 구현예에서, 대상체에게 투여되는 제1 및/또는 제2 복수의 아넬로벡터는 이펙터를 포함한다. 일부 구현예에서, 제1 및/또는 제2 복수는 외인성 이펙터를 포함한다. 일부 구현예에서, 제1 및/또는 제2 복수는 내인성 이펙터를 포함한다. 일부 구현예에서, 제2 복수의 아넬로벡터의 이펙터는 제1 복수의 아넬로벡터의 이펙터와 동일한 이펙터이다. 일부 구현예에서, 제2 복수의 아넬로벡터의 이펙터는 제1 복수의 아넬로벡터의 이펙터와 상이하다. 일부 구현예에서, 제2의 복수의 아넬로벡터는 제1의 복수의 아넬로벡터에 의해 운반되는 이펙터의 수와 거의 동일한 수의 이펙터 카피를 대상체에게 운반한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 대상체에게 운반되는 이펙터 카피의 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 수준으로 이펙터를 대상체에게 전달한다(예를 들어, 제1 복수에 의해 운반되는 이펙터는 제2 복수에 의해 운반되는 이펙터와 동일하거나 상이할 수 있음). 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터보다 더 많은 카피(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 500, 또는 1000배만큼 많은 카피)의 이펙터를 대상체에게 운반한다. 일부 구현예에서, 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터 투여의 생물학적 효과 이상인 대상체에 대한 생물학적 효과(예를 들어 표적 유전자의 녹다운, 또는 바이오마커의 상향조절)를 갖는다.

일부 구현예에서, 복수의 아넬로벡터를 수용한 것에 기초하여 대상체를 확인하거나 선택하는 것은 대상체 유래의 샘플에 대한 분석을 수행하는 것을 포함한다. 일부 구현예에서, 복수의 아넬로벡터를 수용한 것에 기초하여 대상체를 확인하거나 선택하는 것은 제3자(예를 들어, 실험실)로부터 정보를 수득하는 것을 포함하며, 여기서 제3자는 대상체 유래의 샘플에 대하여 분석을 수행하였다. 일부 구현예에서, 복수의 아넬로벡터를 수용한 것에 기초하여 대상체를 확인하거나 선택하는 것은 대상체의 병력을 검토하는 것을 포함한다.

일부 구현예에서, 바이러스 유전 정보에서 표현되지 않는 하나 이상의 바이러스 주를 추가로 포함하는 약제학적 조성물이 대상체에게 투여된다.

일부 구현예에서, 본 명세서에 기재된 아넬로벡터를 포함하는 약제학적 조성물은 바이러스 감염을 조절하기에 충분한 용량 및 시간으로 투여된다. 바이러스 감염의 일부 비제한적인 예는 아데노-연관 바이러스, 아이치(Aichi) 바이러스, 호주 박쥐 리사 바이러스(lyssavirus), BK 폴리오마바이러스(polyomavirus), 반나 바이러스(Banna virus), 바르마 포레스트(Barmah forest) 바이러스, 부니아무에라(Bunyamwera) 바이러스, 부니아바이러스 라 크로세(Bunyavirus La Crosse), 부니아바이러스 스노우슈 하레(Bunyavirus snowshoe hare), 세르코피테신 헤르페스바이러스(Cercopithecine herpesvirus), 찬디푸라 바이러스(Chandipura virus), 치쿤구니아 바이러스(Chikungunya virus), 코사바이러스(Cosavirus) A, 우두 바이러스, 콕사키바이러스(Coxsackievirus), 크리민-콩고 출혈성 열 바이러스(Crimean-Congo hemorrhagic fever virus), 뎅기(Dengue) 바이러스, 도리(Dhori) 바이러스, 더그비(Dugbe) 바이러스, 두벤하게(Duvenhage) 바이러스, 동부 말 뇌염 바이러스, 에볼라바이러스, 에코바이러스(Echovirus), 뇌심근염(Encephalomyocarditis) 바이러스, 엡스테인-바 바이러스, 유럽 박쥐 리사바이러스, GB 바이러스 C/G형 간염 바이러스, 한탄(Hantaan) 바이러스, 헨드라(Hendra) 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 간염 델타 바이러스, 마두 바이러스, 인간 아데노바이러스, 인간 아스트로바이러스, 인간 코로나바이러스, 인간 사이토메갈로바이러스, 인간 엔테로바이러스 68, 인간 엔테로바이러스 70, 인간 헤르페스바이러스 1, 인간 헤르페스바이러스 2, 인간 헤르페스바이러스 6, 인간 헤르페스바이러스 7, 인간 헤르페스바이러스 8, 인간 면역결핍 바이러스, 인간 파필로마바이러스 1, 인간 파필로마바이러스 2, 인간 파필로마바이러스 16, 인간 파필로마바이러스 18, 인간 파라인플루엔자, 인간 파보바이러스 B19, 인간 호흡기 융합 바이러스, 인간 리노바이러스, 인간 SARS 코로나바이러스, 인간 스푸마레트로바이러스(spumaretrovirus), 인간 T-림포트로픽 바이러스, 인간 토로바이러스(torovirus), 인플루엔자 A 바이러스, 인플루엔자 B 바이러스, 인플루엔자 C 바이러스, 이스파한(Isfahan) 바이러스, JC 폴리오마바이러스, 일본 뇌염 바이러스, 주닌 아레나바이러스(Junin arenavirus), KI 폴리오마바이러스, 쿤진(Kunjin) 바이러스, 라고스(Lagos) 박쥐 바이러스, 레이크 빅토리아 마르부르그바이러스(Lake Victoria marburgvirus), 란가트(Langat) 바이러스, 라사(Lassa) 바이러스, 로즈데일(Lordsdale) 바이러스, 라우핑 일(Louping ill) 바이러스, 림프구 맥락수막염 바이러스, 마추포(Machupo) 바이러스, 마이아로(Mayaro) 바이러스, MERS 코로나바이러스, 홍역 바이러스, 멘고(Mengo) 뇌심근염 바이러스, 메르켈 세포 폴리오마바이러스(Merkel cell polyomavirus), 모콜라(Mokola) 바이러스, 전염성 연속종 바이러스, 원두 바이러스, 볼거리 바이러스, 무레이 밸리(Murray valley) 뇌염 바이러스, 뉴욕 바이러스, 니파(Nipah) 바이러스, 노르워크(Norwalk) 바이러스, 오뇽-뇽(O'nyong-nyong) 바이러스, 올프(Orf) 바이러스, 오로퓨스(Oropouche) 바이러스, 피친데(Pichinde) 바이러스, 폴리오바이러스, 푼타 토로 플레보바이러스(Punta toro phlebovirus), 푸말라(Puumala) 바이러스, 광견병 바이러스, 리프트계곡열 바이러스, 로사바이러스(Rosavirus) A, 로스 강(Ross river) 바이러스, 로타바이러스 A, 로타바이러스 B, 로타바이러스 C, 풍진 바이러스, 사기야마(Sagiyama) 바이러스, 살리바이러스(Salivirus) A, 모래파리 열 시실리안(Sandfly fever sicilian) 바이러스, 삿포로(Sapporo) 바이러스, 셈리키 포레스트(Semliki forest) 바이러스, 서울(Seoul) 바이러스, 유인원 포미(Simian foamy) 바이러스, 유인원 바이러스 5, 신드비스(Sindbis) 바이러스, 사우샘프턴(Southampton) 바이러스, 세인트 루이스 뇌염(St. louis encephalitis) 바이러스, 틱-본 포와산(Tick-borne powassan) 바이러스, 토르크 테노 바이러스, 토스카나(Toscana) 바이러스, 우우쿠니에미(Uukuniemi) 바이러스, 백시니아 바이러스, 바리셀라-조스터(Varicella-zoster) 바이러스, 바리올라(Variola) 바이러스, 베네주엘란(Venezuelan) 말 뇌염 바이러스, 수포성 구내염 바이러스, 서부 말 뇌염 바이러스, WU 폴리오마바이러스, 웨스트 나일(West Nile) 바이러스, 야바(Yaba) 원숭이 종양 바이러스, 야바-유사 질병 바이러스, 황열 바이러스 및 지카 바이러스를 포함한다. 특정 구현예에서, 아넬로벡터는 대상체에 이미 존재하는 바이러스를 예를 들어, 기준에 비하여 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상 능가하고/능가하거나 대체하기에 충분하다. 특정 구현예에서, 아넬로벡터는 만성 또는 급성 바이러스 감염과 경쟁하기에 충분하다. 특정 구현예에서, 아넬로벡터는 바이러스 감염으로부터 보호하기 위하여 예방적으로 투여될 수 있다(예를 들어, 바이러스전(provirotic)). 일부 구현예에서, 아넬로벡터는 (예를 들어, 표현형, 바이러스 수준, 유전자 발현, 다른 바이러스와의 경쟁, 질환 상태 등을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 또는 그 이상) 조절하기에 충분한 양으로 존재한다. 일부 구현예에서, "치료", "치료하는" 및 이의 동족어는 (예를 들어, 아넬로벡터, 예를 들어, 본 명세서에 기재된 바와 같이 제조된 아넬로벡터를 투여함으로써) 예를 들어, 질환, 병리학적 병태, 또는 장애를 개선하거나, 호전시키거나, 안정화시키거나, 예방하거나 치유하기 위한 의도를 갖는 대상체의 의학적 관리를 포함한다. 일부 구현예에서, 치료는 적극 치료(질환, 병리학적 병태, 또는 장애를 개선하고자 하는 치료), 원인 치료(연관 질환, 병리학적 병태, 또는 장애의 원인을 대상으로 하는 치료), 완화 치료(증상의 경감을 위해 설계된 치료), 예방적 치료(연관 질환, 병리학적 병태, 또는 장애의 예방, 최소화, 또는 이의 발생을 부분적으로 또는 완전히 억제하고자 하는 치료), 및/또는 지지 치료(또 다른 치료법을 보충하기 위해 이용되는 치료)를 포함한다.

VIII. 아넬로바이러스 서열을 증폭시키는 방법

본 개시내용은 일부 양태에서 아넬로바이러스 서열을 포함하는 핵산 분자를 증폭시키는 방법을 제공한다. 일부 구현예에서, 이러한 방법은 회전환 증폭, 예를 들어, 표적화 회전환 증폭을 포함한다. 일부 구현예에서, 이러한 방법은 샘플로부터 아넬로바이러스 서열을 확인하고 단리하는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용은 대상체의 아넬로바이러스 프로파일(또한 아넬롬으로 지칭됨)을 결정하는 방법을 제공한다. 구현예에서, 대상체의 아넬로바이러스 프로파일은 대상체로부터 수득된 샘플로부터 확인된 아넬로바이러스 서열의 편집을 포함한다. 구현예에서, 대상체의 아넬로바이러스 프로파일은 대상체, 또는 이로부터 수득된 샘플에 존재하는 아넬로바이러스 균주의 집단을 확인하는 데 사용될 수 있다.

DMA 증폭

본 명세서의 방법은 샘플(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 대상체 유래의 샘플)로부터 아넬로바이러스 서열을 확인하고 단리하는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 증폭시키는 방법에 관한 것이다. 일부 구현예에서, 방법은 아넬로바이러스 서열 및 아넬로바이러스 서열의 적어도 일부에 결합하는(예를 들어, 상보성인) 프라이머를 포함하는 환형 핵산 분자를 포함하는 샘플을 제공하는 단계를 포함한다. 일부 구현예에서, 방법은 아넬로바이러스 서열을 포함하는 환형 핵산 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계를 포함한다. 일부 구현예에서, 방법은 핵산 분자 또는 그의 일부의 회전환 증폭을 포함하며, 여기서 핵산 분자는 아넬로바이러스 서열을 포함한다. 본 명세서에 기재된 방법(예를 들어, 회전환을 포함함)이 환형 DNA 증폭에 적합할 수 있지만, 본 명세서에 기재된 방법은 또한 선형 주형을 증폭시키는 데에도 사용될 수 있음이 이해된다. 예를 들어, 선형 주형은 아넬로바이러스 게놈의 단편일 수 있다. 일부 구현예에서, 선형 주형은 다중 가닥 변위 증폭을 사용하여 증폭된다. 일부 구현예에서 증폭은 지수적(예를 들어, PCR 증폭을 사용함) 또는 선형(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭을 사용함)일 수 있다.

회전환 증폭

회전환 증폭은 환형 핵산 분자의 복제 및 증폭을 촉진하는 DNA 및/또는 RNA 복제의 한 형태이다. 일부 예에서, 회전환 증폭은 환형 핵산 주형에 어닐링된 하나 이상의 프라이머를 확장하기 위해 가닥 변위 활성이 있는 DNA 중합효소(예를 들어, DNA-의존성 DNA 중합효소)를 사용하여 수행된다. 일부 구현예에서, 가닥 변위 활성은 새로 합성된 핵산 가닥의 변위를 가능하게 하여 추가 주형을 가능하게 하고 환형 핵산 주형에 상보적인 반복 서열을 포함하는 긴 단일-가닥 DNA 또는 RNA 분자를 생성한다.

일부 구현예에서, 본 명세서에 기재된 회전환 증폭 방법은 환형 핵산 분자 및 환형 핵산 분자의 적어도 일부에 상보성인 하나 이상의 프라이머를 포함하는 샘플을 제공하는 단계 및 환형 핵산 분자 및 하나 이상의 프라이머를 포함하는 샘플을 DNA 중합효소 분자(예를 들어, DNA-의존성 DNA 중합효소 분자)와 접촉시키는 단계를 포함한다.

일부 구현예에서, 회전환 증폭 방법은, 예를 들어, 환형 핵산 분자를 프라이머 및/또는 DNA 중합효소와 접촉시키기 이전에, 하나 이상의 관심 구성요소에 대한 환형 핵산 분자를 포함하는 샘플을 농축하는 단계를 추가로 포함한다. 일부 구현예에서, 하나 이상의 관심 구성요소는 핵산 분자를 포함한다. 예를 들어, 일부 구현예에서, 하나 이상의 관심 구성요소는 비-염색체 핵산 분자, 예를 들어, 환형 비-염색체 핵산 분자 및/또는 바이러스 핵산 분자(예를 들어 아넬로바이러스 게놈의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500 또는 3000개의 뉴클레오티드를 포함하는, 예를 들어, 아넬로바이러스 핵산 분자, 예를 들어, 아넬로바이러스 게놈, 또는 이의 일부)를 포함한다.

일부 구현예에서, 회전환 증폭 방법은 샘플을 DNA-의존성 DNA 중합효소와 접촉시키는 단계 이전에 샘플 내의 환형 핵산 분자를 변성시키는 단계를 추가로 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 일정 시간, 예를 들어, 적어도 약 1, 2, 3, 4, 또는 5분 동안 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 85℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 90℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 91℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 92℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 93℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 94℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 95℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 96℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 97℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 98℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 99℃의 온도에 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 적어도 약 1분 동안 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 적어도 약 2분 동안 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 적어도 약 3분 동안 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 적어도 약 4분 동안 노출시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 변성시키는 단계는 환형 핵산 분자를 적어도 약 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99℃의 온도에 적어도 약 5분 동안 노출시키는 것을 포함한다.

일부 구현예에서, 회전환 증폭은, 예를 들어, 환형 핵산 분자를 변성시키는 단계 후 및 샘플을 DNA-의존성 DNA 중합효소와 접촉시키는 단계 이전에, 환형 핵산 분자를 냉각시키는 단계를 추가로 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 2, 3, 4, 5, 6, 또는 7℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 2℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 3℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 4℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 5℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 6℃의 온도까지 냉각시키는 것을 포함한다. 일부 구현예에서, 환형 핵산 분자를 냉각시키는 단계는 환형 핵산 분자를 약 7℃의 온도까지 냉각시키는 것을 포함한다.

일부 구현예에서, 회전환 증폭 방법은 샘플을 DNA-의존성 DNA 중합효소와 접촉시키는 단계 후 샘플을 인큐베이션하는 하나 이상의 단계를 추가로 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 DNA-의존성 DNA 중합효소의 존재 하에 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서 일정 시간, 예를 들어, 적어도 약 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 또는 30시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 26℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 27℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 28℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 29℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 30℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 31℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 32℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 33℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 34℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 35℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 10시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 15시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 16시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 17시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 18시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 19시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 20시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 21시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 22시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 23시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 24시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 25시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제1 인큐베이션 단계는 약 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35℃의 온도에서, 일정 시간 동안, 예를 들어, 적어도 약 30시간 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 DNA-의존성 DNA 중합효소를 비활성화하기에 적합한 조건 하에서 샘플을 인큐베이션하는 것을 포함한다. 예를 들어, 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 일정 시간 동안, 예를 들어, 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 61℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 62℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 63℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 64℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 65℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 66℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 67℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 68℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 69℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 70℃의 온도에서 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 5분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 6분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 7분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 8분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 9분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 10분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 11분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 12분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 13분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 14분 동안 샘플을 인큐베이션하는 것을 포함한다. 일부 구현예에서, 제2 인큐베이션 단계는 약 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 또는 70℃의 온도에서 적어도 15분 동안 샘플을 인큐베이션하는 것을 포함한다.

일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 또는 0.8 μM, 또는 프라이머당 약 0.1 내지 0.2, 0.2 내지 0.3, 0.3 내지 0.4, 0.4 내지 0.5, 0.5 내지 0.6, 0.6 내지 0.7, 또는 0.7 내지 0.8 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 또는 0.8 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.1 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.2 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.3 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.4 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.5 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.6 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.7 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.8 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.1 내지 0.2, 0.2 내지 0.3, 0.3 내지 0.4, 0.4 내지 0.5, 0.5 내지 0.6, 0.6 내지 0.7, 또는 0.7 내지 0.8 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.1 내지 0.2 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.2 내지 0.3 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.3 내지 0.4 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.4 내지 0.5 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.5 내지 0.6 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.6 내지 0.7 μM인 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 하나 이상의 프라이머의 농도가 프라이머당 약 0.7 내지 0.8 μM인 혼합물에서 발생한다.

일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 DNA를 합성하기 위한 DNA-의존성 DNA 중합효소에 적합한 DNA 중합효소 완충액(예를 들어, Phi29 DNA 중합효소 완충액)을 갖는 혼합물에서 발생한다.

일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 100, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 또는 300 ng/μL, 또는 약 100 내지 150, 150 내지 175, 175 내지 190, 190 내지 200, 200 내지 210, 210 내지 225, 225 내지 250, 또는 250 내지 300 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 100, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 또는 300 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 100 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 150 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 160 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 170 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 180 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 190 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 200 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 210 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 220 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 230 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 240 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 250 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 약 300 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 100 내지 150, 150 내지 175, 175 내지 190, 190 내지 200, 200 내지 210, 210 내지 225, 225 내지 250, 또는 250 내지 300 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 100 내지 150 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 150 내지 175 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 175 내지 190 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 190 내지 200 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 200 내지 210 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 210 내지 225 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 225 내지 250 ng/μL의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 소 혈청 알부민을, 예를 들어, 250 내지 300 ng/μL의 농도로 포함하는 혼합물에서 발생한다.

일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 또는 2 mM, 또는 약 0.5 내지 0.7, 0.7 내지 0.9, 0.9 내지 1.0, 1.0 내지 1.1, 1.1 내지 1.3, 1.3 내지 1.5, 또는 1.5 내지 2 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 또는 2 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.5 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.6 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.7 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.8 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 0.9 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.0 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.1 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.2 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.3 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.4 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 1.5 mM의 농도로 포함하는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계는 dNTP를, 예를 들어, 약 2 mM의 농도로 포함하는 혼합물에서 발생한다.

일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1, 1.5, 2, 2.5, 또는 3 U/μL, 또는 약 1 내지 1.5, 1.5 내지 2, 2 내지 2.5, 또는 2.5 내지 3 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1, 1.5, 2, 2.5, 또는 3 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1.5 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 2 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 2.5 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 3 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1 내지 1.5, 1.5 내지 2, 2 내지 2.5, 또는 2.5 내지 3 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1 내지 1.5 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 1.5 내지 2 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 2 내지 2.5 U/μL의 농도로 갖는 혼합물에서 발생한다. 일부 구현예에서, 회전환 증폭 방법에서, 환형 핵산 분자 및 하나 이상의 프라이머를 DNA 내지 의존성 DNA 중합효소 분자와 접촉시키는 단계는 Phi29 중합효소를, 예를 들어, 약 2.5 내지 3 U/μL의 농도로 갖는 혼합물에서 발생한다.

일부 구현예에서, 회전환 증폭 방법은 열순환처리를 포함하지 않으며, 예를 들어, 방법은 등온으로 수행된다. 일부 구현예에서, 회전환 증폭 방법은 환형 핵산 분자로부터 DNA-의존성 DNA 중합효소에 의해 합성된 가닥의 변위(예를 들어 부분 또는 전체 변위)를 포함한다. 일부 구현예에서, 회전환 증폭 방법에서, DNA-의존성 DNA 중합효소에 의해 합성된 가닥은 주변 용액으로 방출된다. 일부 구현예에서, 회전환 증폭 방법에서, DNA-의존성 DNA 중합효소는 합성된 가닥에 닉을 형성하여, 합성된 가닥을 방출한다.

일부 구현예에서, 회전환 증폭 방법에서, DNA-의존성 DNA 중합효소는 환형 핵산 서열의 복수의 카피, 또는 이의 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2500, 3000, 3500, 또는 4000개 인접 뉴클레오티드를 포함하는 이의 단편의 복수의 카피를 포함하는 생성물 가닥을 합성한다. 일부 구현예에서, 환형 핵산 서열의 복수의 카피, 또는 이의 단편은 생성물 가닥에 나란히 배열된다. 구현예에서, 나란히 배열된 복수의 카피는 각각 0 내지 1, 1 내지 5, 5 내지 10, 10 내지 15, 15 내지 20, 20 내지 25, 25 내지 30, 30 내지 40, 40 내지 50, 50 내지 60, 60 내지 70, 70 내지 80, 80 내지 90, 또는 90 내지 100개 뉴클레오티드(예를 들어, 약 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100개 뉴클레오티드)로 분리된다. 일부 구현예에서, 회전환 증폭 방법에서, DNA-의존성 DNA 중합효소는 환형 핵산의 서열의 하나의 카피, 또는 이의 적어도 1000, 2000, 2500, 3000, 3500, 또는 4000개 인접 뉴클레오티드를 포함하는 이의 단편을 포함하는 생성물 가닥을 합성한다.

일부 구현예에서, 회전환 증폭 방법은, 예를 들어, 문헌[Ninomiya et al. 2008, J. Clin. Microbiol. 46: 507-514](범-아넬로바이러스 프라이머 및 이와 관련된 방법에 대하여 본 명세서에 참조로 포함됨)에 기재된 바와 같은, 예를 들어, 하나 이상의 범-아넬로바이러스 프라이머를 사용하여, PCR에 의해 검증된다. 일부 구현예에서, 예를 들어, 본 명세서에 기재된 바와 같은, 회전환 증폭 방법에 의해 제조된 증폭된 핵산 분자는, 예를 들어, 본 명세서에 기재된 바와 같은, 라이브러리 품질 관리(QC) 기법에 의해 평가된다. 구현예에서, QC 기법은, 예를 들어, 서열결정 이전에, 라이브러리 크기의 평가를 포함한다. 구현예에서, QC 기법은, 예를 들어, 서열결정 이전에, 라이브러리 농도의 평가를 포함한다. 일 구현예에서, (예를 들어, D5000 스크린 테이프가 있는) Agilent Tapestation 4200가 라이브러리 크기 및/또는 농도를 평가하는 데 사용된다. 구현예에서, 증폭된 핵산 분자는 (예를 들어, 예상된 크기에서, 예를 들어, 약 110, 115, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 140, 또는 150 bp에서 밴드의 존재를 확인함으로써) 겔 전기영동에 의해 평가된다. 일 구현예에서, 밴드의 예상된 크기는 128 bp이다.

프라이머

본 명세서가 기재된 증폭 방법은 일반적으로 아넬로바이러스 서열을 포함하는 핵산 분자를 프라이머와 접촉시켜 DNA 중합효소(예를 들어, DNA-의존성 DNA 중합효소)가 프라이머로부터 DNA 합성을 개시하도록 허용하는 것을 포함하다. 일부 구현예에서, 본 명세서에 기재된 방법에 사용되는 복수의 프라이머는 (예를 들어, 복수의 축퇴 프라이머가 하나 이상의 가변 위치에서 복수의 상이한 뉴클레오티드를 포함할 수 있도록) 예를 들어, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개) 가변 위치를 포함하는 축퇴 서열을 기반으로 한다. 일부 구현예에서, 본 명세서에 기재된 방법에 사용되는 프라이머는 복수의 아넬로바이러스 서열에 특이적인 프라이머이거나, 방법은 복수의 아넬로바이러스-특이적 프라이머를 사용한다. 구현예에서, 프라이머는, 예를 들어, 본 명세서에 기재된 바와 같은, 아넬로바이러스 서열에 포함된 핵산 서열에 역상보체인 핵산 서열을 포함한다. 일부 구현예에서, 복수의 프라이머(예를 들어, 본 명세서에 기재된 바와 같음)는 본 명세서에 기재된 방법에 사용된다. 일부 구현예에서, 복수의 프라이머는 (예를 들어, 프라이머 내의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개) 가변 위치에서의 축퇴성으로 인해) 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 상이한 서열을 갖는 프라이머를 포함한다.

일부 구현예에서, 복수의 축퇴성 프라이머가 본 명세서에 기재된 방법에 사용된다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 70% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 75% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 80% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 85% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 90% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 95% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 96% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 97% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 98% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다. 하나 이상의 프라이머가 본 명세서에 기재된 방법에 사용되는 일부 구현예에서, 제1 프라이머는 제2 프라이머에 대해 적어도 99% 서열 동일성을 갖고, 여기서 제1 프라이머와 제2 프라이머는 동일하지 않다.

일부 구현예에서, 본 명세서에 기재된 방법은 복수의 프라이머를 사용한다. 일부 구현예에서, 복수의 프라이머는 본 명세서에 기재된 방법의 환형 핵산 분자에 대해 동일한 배향을 공유한다. 일부 구현예에서, 복수의 프라이머는 모두 양성-가닥 프라이머이다. 일부 구현예에서, 복수의 프라이머는 모두 음성-가닥 프라이머이다. 일부 구현예에서, 복수의 프라이머는 적어도 3, 4, 5, 6, 7, 8, 9, 또는 10개 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 3개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 4개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 5개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 6개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 7개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 8개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 9개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 10개의 인접 뉴클레오티드를 공통으로 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 2개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 3개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 4개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 5개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 10개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 12개의 상이한 프라이머를 포함한다. 일부 구현예에서, 복수의 프라이머는 적어도 15, 20, 25, 30, 35, 40, 45, 또는 50개의 상이한 프라이머를 포함한다.

일부 구현예에서, 본 명세서에 기재된 방법에 사용되는 프라이머는 표 A에 열거된 프라이머로부터 선택되는 핵산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 방법에 사용되는 프라이머는 표 A에 열거된 센스 서열의 핵산 서열을 포함한다. 일부 구현예에서 본 명세서에 기재된 방법에 사용되는 프라이머는 표 A에 열거된 안티센스 서열의 핵산 서열을 포함한다. 일부 구현예에서, 프라이머는 CGAATGGYW, AAGGGGCAA, YTGYGGBTG, YAGAMACMM, YAARTGGTAC, SACCACWAAC, TBGTCGGTG, CACTCCGAG, GAGGAGTGC, CAGACTCCG, GTGAGTGGG, 및 CTTCGCCAT로 이루어진 군으로부터 선택되는 핵산 서열을 포함한다. 일부 구현예에서, 프라이머는 WRCCATTCG, TTGCCCCTT, CAVCCRCAR, KKGTKTCTR, GTACCAYTTR, GTTWGTGGTS, CACCGACVA, CTCGGAGTG, GCACTCCTC, CGGAGTCTG, CCCACTCAC, 및 ATGGCGAAG로 이루어진 군으로부터 선택되는 핵산 서열을 포함한다. 일부 구현예에서, 프라이머는 CGAATGGYW, TTGCCCCTT, YTGYGGBTG, YAGAMACMM, GTACCAYTTR, SACCACWAAC, CACCGACVA, CACTCCGAG, GCACTCCTC, CAGACTCCG, CCCACTCAC, 및 CTTCGCCAT로 이루어진 군으로부터 선택되는 핵산 서열을 포함한다. 일부 구현예에서, 프라이머는 CGAATGGYW이다. 일부 구현예에서, 프라이머는 AAGGGGCAA이다. 일부 구현예에서, 프라이머는 YTGYGGBTG이다. 일부 구현예에서, 프라이머는 YAGAMACMM이다. 일부 구현예에서, 프라이머는 YAARTGGTAC이다. 일부 구현예에서, 프라이머는 SACCACWAAC이다. 일부 구현예에서, 프라이머는 TBGTCGGTG이다. 일부 구현예에서, 프라이머는 CACTCCGAG이다. 일부 구현예에서, 프라이머는 GAGGAGTGC이다. 일부 구현예에서, 프라이머는 CAGACTCCG이다. 일부 구현예에서, 프라이머는 GTGAGTGGG이다. 일부 구현예에서, 프라이머는 CTTCGCCAT이다. 일부 구현예에서, 프라이머는 WRCCATTCG이다. 일부 구현예에서, 프라이머는 TTGCCCCTT이다. 일부 구현예에서, 프라이머는 CAVCCRCAR이다. 일부 구현예에서, 프라이머는 KKGTKTCTR이다. 일부 구현예에서, 프라이머는 GTACCAYTTR이다. 일부 구현예에서, 프라이머는 GTTWGTGGTS이다. 일부 구현예에서, 프라이머는 CACCGACVA이다. 일부 구현예에서, 프라이머는 CTCGGAGTG이다. 일부 구현예에서, 프라이머는 GCACTCCTC이다. 일부 구현예에서, 프라이머는 CGGAGTCTG이다. 일부 구현예에서, 프라이머는 CCCACTCAC이다. 일부 구현예에서, 프라이머는 ATGGCGAAG이다.

[표 A] 프라이머에 대한 예시적인 센스 및 안티센스 서열

[표 B] 달리 명시되지 않는 한, 본 명세서에서 사용되는 UPAC 뉴클레오티드 코드.

일부 구현예에서, 프라이머는 하나 이상의 티오포스페이트 변형을 포함한다(예를 들어, 이에 의해 보호됨). 일부 구현예에서, 프라이머는 1, 2, 3, 또는 4개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 1개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 2개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 3개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 4개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 3' 말단에서 마지막 2개의 뉴클레오티드 사이에 위치한 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 끝에서 두 번째와 세 번째 뉴클레오티드 사이에 위치한 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 3' 말단에서 마지막 3개의 뉴클레오티드 각각의 사이에 2개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 3' 말단에서 마지막 4개의 뉴클레오티드 각각의 사이에 3개의 티오포스페이트 변형을 포함한다. 일부 구현예에서, 프라이머는 3' 말단에서 마지막 5개의 뉴클레오티드 각각의 사이에 4개의 티오포스페이트 변형을 포함한다.

샘플 및 표적 서열

일부 구현예에서, 샘플은 하나 이상의 대상체(예를 들어, 하나 이상의 인간 대상체, 예를 들어, 하나 이상의 건강하거나 무증상 인간 대상체)로부터 수득된다. 일부 구현예에서, 샘플은 생물학적 샘플이다. 일부 구현예에서 샘플은 하나 이상의 대상체(예를 들어, 하나 이상의 인간 대상체, 예를 들어, 하나 이상의 건강하거나 무증상 인간 대상체)로부터 수득된 생물학적 샘플이다. 일부 구현예에서, 생물학적 샘플은 혈액 또는 혈청을 포함한다.

일부 구현예에서, 증폭 방법, 예를 들어, 회전환 증폭은, 예를 들어, 동시에, 복수의 샘플(예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 125, 126, 127, 128, 129, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 400, 500, 600, 700, 800, 900, 또는 1000개의 샘플)에 대해 수행된다. 일부 구현예에서, 복수의 샘플은, 연속적으로 또는 동시에, 복수의 대상체(예를 들어, 인간 대상체), 예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 125, 126, 127, 128, 129, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 400, 500, 600, 700, 800, 900, 또는 1000명의 대상체로부터 수득된다. 일부 구현예에서, 복수의 샘플은 복수의 시점(예를 들어, 다수의 시점에 동일한 대상체로부터 수득된 복수의 샘플, 또는 복수의 시점에 복수의 대상체로부터 수득된 복수의 샘플)으로부터 수득된다. 일부 구현예에서, 복수의 샘플은 복수의 조직 또는 세포 유형, 예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 또는 100개의 상이한 조직 또는 세포 유형으로부터 수득된다.

일부 구현예에서, 샘플은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 환형 핵산 분자(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 아넬로바이러스 서열을 포함함)를 포함한다. 일부 구현예에서, 샘플은 적어도 2개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 3개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 4개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 5개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 6개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 7개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 8개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 9개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 10개의 상이한 환형 핵산 분자를 포함한다. 일부 구현예에서, 샘플은 적어도 2개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 3개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 4개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 5개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 6개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 7개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 8개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 9개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 샘플은 적어도 10개의 상이한 아넬로바이러스 서열을 포함한다. 일부 구현예에서, 환형 핵산 분자는 아넬로바이러스의 게놈 서열 유래의 하나 이상의 요소를 인코딩한다. 일부 이러한 구현예에서, 아닐로바이러스의 게놈 서열에 포함되고/되거나 인코딩된 하나 이상이 요소는 TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 및/또는 GC-풍부 영역 중 하나 이상을 포함한다.

서열결정

아넬로바이러스 서열(예를 들어, 본 명세서에 기재된 방법에 따라 증폭됨)을 포함하는 핵산 분자는 당업계에 알려진 서열결정 방법에 따라 서열결정될 수 있다. 사용될 수 있는 서열결정 방법은 전통적인 생어 서열결정뿐만 아니라 대량의 핵산 분자가 대규모 병렬 방식으로 서열결정되는 차세대 심층 서열결정(next generation deep sequencing) 방법을 포함한다.

일부 구현예에서, 본 명세서에 기재된 방법은 본 명세서에 기재된 방법에 따라 증폭된(예를 들어, 아넬로바이러스 서열을 포함하는 환형 핵산 분자가 농축된) 환형 핵산 분자를 서열결정하는 것을 추가로 포함한다. 일부 구현예에서, 서열결정은 차세대 서열결정(예를 들어, 합성에 의한 서열결정(예를 들어, Illumina 서열결정), 파이로시퀀싱, 가역적 종결자 서열결정, 결찰에 의한 서열결정, 또는 나노포어 서열결정)을 포함한다. 일부 구현예에서, 서열결정은 생어 서열결정을 포함한다. 일부 구현예에서, 서열결정은 벤치탑 서열결정 기구(예를 들어, Illumina iSeq 100 또는 Illumina NextSeq 550)의 사용을 포함한다. 일부 구현예에서, 2개 이상의 상이한 서열결정 방법이 본 명세서에 기재된 방법에 사용된다.

일부 구현예에서, 이러한 방법에 의해 수득된 복수의 서열결정 판독물은 분석되어 공급원 핵산 서열(예를 들어, 본 명세서에 기재된 바와 같은 단일의 환형 핵산 분자)의 더 큰 부분에 해당하는, 더 큰 인접 서열(일반적으로 본 명세서에서 콘티그로 지칭됨)로 조립될 수 있다. 일부 구현예에서, 콘티그는 아넬로바이러스 게놈 서열, 또는, 예를 들어, 이의 적어도 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1500, 1600, 1800, 2000, 2500, 또는 3000개 연속 핵산을 포함하는, 이의 연속 단편을 포함한다. 일부 구현예에서, 콘티그는, 예를 들어, 본 명세서에 기재된 아넬로바이러스의, TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 및/또는 GC-풍부 영역 중 하나 이상을 인코딩하는 아넬로바이러스 서열, 또는 이의 단편(예를 들어, 이의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 300, 400, 500, 600, 700, 800, 900, 또는 1000개 인접 뉴클레오티드를 포함함)을 포함한다. 일부 구현예에서, 콘티그는 아넬로바이러스 ORF1 분자, 또는 이의 단편(예를 들어, 이의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 또는 2000개의 인접 뉴클레오티드를 포함함)을 인코딩하는 핵산 서열을 포함한다. 일부 구현예에서, 콘티그는 아넬로바이러스 5' UTR의 핵산 서열, 또는 이의 단편(예를 들어, 이의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 또는 100개의 인접 뉴클레오티드를 포함함)을 포함한다.

일부 구현예에서, 아넬로바이러스 서열은 알파토르크바이러스 서열(예를 들어, 알파토르크바이러스 5' UTR 서열 또는 알파토르크바이러스 ORF1 분자-인코딩 서열)이다. 일부 구현예에서, 아넬로바이러스 서열은 베타토르크바이러스 서열(예를 들어, 베타토르크바이러스 5' UTR 서열 또는 베타토르크바이러스 ORF1 분자-인코딩 서열)이다. 일부 구현예에서, 아넬로바이러스 서열은 감마토르크바이러스 서열(예를 들어, 감마토르크바이러스 5' UTR 서열 또는 감마토르크바이러스 ORF1 분자-인코딩 서열)이다.

컴퓨터를 사용한 분석

일부 구현예에서, 본 명세서에 기재된 방법은 컴퓨터를 사용한 서열결정 결과의 분석을 포함한다. 이러한 컴퓨터를 사용한 분석은, 일부 구현예에서, 서열결정된 핵산 분자를 포함하는 샘플에 존재하는 하나 이상의 아넬로바이러스 균주를 확인 및/또는 분류(예를 들어, 본 명세서에 기재된 아넬로바이러스 클레이드 내에서)하는 데 사용될 수 있다. 컴퓨터를 사용한 분석은, 일부 구현예에서, 서열결정된 핵산 분자를 포함하는 샘플의 아넬로바이러스 프로파일 또는 아넬롬을 결정하는 데 사용될 수 있다. 일부 예에서, 컴퓨터를 사용한 분석은 복수의 샘플로부터의 아넬로바이러스 프로파일 또는 아넬롬을 비교하기 위해(예를 들어, 하나의 샘플 대 다른 샘플에서 특정 아넬로바이러스 클레이드 또는 균주의 상대적 빈도를 결정하기 위해) 추가로 사용될 수 있다.

일부 구현예에서, 컴퓨터를 사용한 분석은 증폭된 핵산 분자의 서열에 나타내는 하나 이상의 아넬로바이러스 서열을 확인하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 증폭된 핵산 분자의 복수(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 또는 1500개)의 별개의 서열 내에 포함되고/거나 거기에서 인코딩된 하나 이상의 요소 또는 게놈 서열의 서열 유사성을 결정하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 본 명세서에 기재된 방법의 각각의 샘플, 각각의 대상체, 각각의 조직 또는 세포 유형, 및/또는 각각의 시점에 존재하는 아넬로바이러스 서열을 결정하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 본 명세서에 기재된 방법의 각각의 샘플, 각각의 대상체, 각각의 조직 또는 세포 유형, 및/또는 각각의 시점에 존재하는 특유의 아넬로바이러스 계통을 결정하는 것을 포함한다.

일부 구현예에서, 컴퓨터를 사용한 분석은 샘플에 존재하는 서열을, 예를 들어, 데이터베이스(예를 들어, GenBank)로부터의 하나 이상의 기준 서열과 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 샘플에 존재하는 서열을 다른 알려진 아넬로바이러스 유래의 서열과 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 샘플에 존재하는 서열을 아넬로바이러스 이외의 바이러스(예를 들어, 인간 유두종 바이러스 HPV, 아데노-연관 바이러스 AAV. 뎅기 바이러스, 중동 호흡기 증후군-연관 코로나바이러스 MERS-CoV, 에볼라바이러스, 라싸열 바이러스, 및 인플루엔자 A 바이러스, 인간 면역결핍 바이러스-1 HIV-1)의 서열과 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 하나의 샘플에 존재하는 서열을 다른 샘플과 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 하나의 대상체에 존재하는 서열을 다른 대상체와 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 하나의 조직 또는 세포 유형에 존재하는 서열을 (예를 들어, 동일한 대상체 또는 상이한 대상체에서) 다른 조직 또는 세포 유형과 비교하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은 하나의 시점에 존재하는 서열을 다른 시점에 존재하는 서열과 비교하는 것(예를 들어, 하나의 시점에서 대상체 유래의 샘플을 상이한 시점, 예를 들어 이후의 시점에서, 동일한 대상체 유래의 샘플과 비교하는 것)을 포함한다

일부 구현예에서, 컴퓨터를 사용한 분석은 서열 또는 이의 일부(예를 들어, TATA 박스, cap 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, TAIP, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, 및/또는 GC-풍부 영역 중 하나 이상을 포함하거나 인코딩하는 부분)의 다차원 척도법(MDS)을 수행하는 것을 포함한다. 일부 구현예에서, 컴퓨터를 사용한 분석은, (예를 들어, 이의 서열 유사성 및/또는 가능성이 있는 진화 이력에 의해) 예를 들어, 하나 이상의 샘플에 존재하는 복수의 아넬로바이러스 서열을 분류하기 위해, 계통발생학적 분석을 수행하는 것을 포함한다. 일부 구현예에서, 서열은 구성원이 뉴클레오티드 수준에서 적어도 70%, 75%, 80%, 85%, 90%, 또는 95% 동일한 그룹으로 정렬되고 클러스터링된다. 일부 구현예에서, 서열은 구성원이 뉴클레오티드 수준에서 적어도 75% 동일한 그룹으로 정렬되고 클러스터링된다. 일부 구현예에서, 서열은 구성원이 뉴클레오티드 수준에서 적어도 80% 동일한 그룹으로 정렬되고 클러스터링된다. 일부 구현예에서, 서열은 구성원이 뉴클레오티드 수준에서 적어도 85% 동일한 그룹으로 정렬되고 클러스터링된다. 일부 구현예에서, 서열은 구성원이 뉴클레오티드 수준에서 적어도 90% 동일한 그룹으로 정렬되고 클러스터링된다. 일부 구현예에서, 서열의 일부(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, 및/또는 ORF2/3 영역)의 MDS는 최대 우도 계통수를 구축하는 데 사용된다. 일부 구현예에서, 계통발생학적 분석은 재조합 분석을 추가로 포함한다. 일부 구현예에서, 계통수 및 서열 정렬은 돌연변이를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개 뉴클레오티드 내에서 발생한 적어도 2, 3, 4, 5, 또는 6개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 5개 뉴클레오티드 내에서 발생한 적어도 2개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 7개 뉴클레오티드 내에서 발생한 적어도 2개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 10개 뉴클레오티드 내에서 발생한 적어도 2개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 5개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 7개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 9개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 10개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 11개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 12개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 15개 뉴클레오티드 내에서 발생한 적어도 3개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 7개 뉴클레오티드 내에서 발생한 적어도 4개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 10개 뉴클레오티드 내에서 발생한 적어도 4개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 15개 뉴클레오티드 내에서 발생한 적어도 4개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 10개 뉴클레오티드 내에서 발생한 적어도 5개 돌연변이의 클러스터를 확인하는 데 사용된다. 일부 구현예에서, 계통수 및 서열 정렬은 서로의 약 15개 뉴클레오티드 내에서 발생한 적어도 5개 돌연변이의 클러스터를 확인하는 데 사용된다.

본 명세서에 언급된 모든 참고문헌 및 간행물은 본 명세서에 참조로 포함된다.

하기의 실시예는 본 발명의 일부 구현예를 추가로 예시하기 위해 제공되지만, 본 발명의 범주를 제한하고자 하지 않으며; 당업자에게 알려져 있는 다른 절차, 방법, 또는 기법이 대안적으로 사용될 수 있다는 것이 실시예의 예시적인 성질에 의해 이해될 것이다.

실시예

실시예 1: 인간 수혈 환자에서 아넬로바이러스 다중 투약

실시예 2: 인간 수혈 환자에서 반복적인 아넬로바이러스 투약

실시예 3: 합성 아넬로벡터의 제조

실시예 4: 아넬로벡터의 조립 및 감염

실시예 5: 아넬로벡터의 선택성

실시예 6: 복제-결핍 아넬로벡터 및 헬퍼 바이러스

실시예 7: 복제-적격 아넬로벡터의 제조 과정

실시예 8: 복제-결핍 아넬로벡터의 제조 과정

실시예 9: 현탁 세포를 사용한 아넬로벡터의 생성

실시예 10: 마우스에서 외인성 단백질을 발현하기 위한 아넬로벡터의 이용

실시예 11: 외인성 마이크로RNA 서열을 발현하는 아넬로벡터의 기능적 효과

실시예 12: 외인성 비-코딩 RNA 발현을 위한 아넬로벡터의 제조 및 생성

실시예 13: 아넬로벡터로부터 내인성 miRNA의 발현 및 내인성 miRNA의 결실

실시예 14: 생체 내에서의 외인성 단백질의 아넬로벡터 운반

실시예 15: 시험관 내 환화된 아넬로바이러스 게놈

실시예 16: 상이한 토르크 테노 바이러스 주 유래의 초가변 도메인을 갖는 키메라 ORF1을 함유하는 아넬로벡터의 생성

실시예 17: 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1의 생성

실시예 18: tth8 및 LY2에 기반한 아넬로벡터는 각각 EPO 유전자를 폐암 세포 내로 성공적으로 형질도입하였다

실시예 19: 치료용 이식유전자를 갖는 아넬로벡터는 정맥내(i.v.) 투여 후 생체 내에서 검출될 수 있다

실시예 20: 시험관 내에서 아넬로벡터를 생성하기 위한 투입 물질로서 시험관 내 환화된 게놈

실시예 21: 아넬로바이러스 게놈의 탠덤 카피

실시예 22: 텐덤 아넬로벡터 작제물로부터 아넬로벡터의 효율적인 복제

실시예 23: 예시적인 탠덤 아넬로벡터 작제물 설계

실시예 24: 포유동물 세포에서 탠덤 아넬로바이러스 작제물로부터 유전자의 전사

실시예 25: 포유동물 세포에서 탠덤 아넬로바이러스 작제물로부터 생성된 ORF1 및 ORF2 단백질

실시예 26: 탠덤 아넬로벡터의 감염성 평가

실시예 27: 바큘로바이러스를 통한 Sf9 곤충 세포로의 탠덤 아넬로바이러스 게놈의 운반

실시예 28: 바큘로바이러스 발현 시스템에서 아넬로바이러스 단백질의 생성

실시예 29: Sf9 세포에서 Ring1 ORF의 발현

실시예 30: Sf9 세포에서 Ring2 ORF의 발현

실시예 31: Sf9 세포에서 동시에 모든 Ring2 ORF의 발현

실시예 32: Sf9 세포에서 아넬로바이러스 게놈 및 재조합 아넬로바이러스 ORF의 동시-운반 및 독립적 발현

실시예 33: 아넬로바이러스 ORF1은 Sf9 세포에서 DNA와 회합하여 등밀도 원심분리에 의해 단리된 복합체를 형성한다

실시예 34: 바큘로바이러스를 사용한 다양한 아넬로바이러스 어레이로부터의 ORF1 단백질의 발현

실시예 35: 바큘로바이러스 작제물의 시험관 내 조립

실시예 1: 인간 수혈 환자에서 아넬로바이러스 다중 투약

본 실시예에서, 다수의 혈액 수혈을 받은 인간 환자를 공여자로부터 도입된 아넬로바이러스 균주의 지속성과 숙주 아넬로바이러스 균주와 비교한 상대적 지속성에 대해 추적하였다. 각각의 환자의 원래 아넬로바이러스 프로파일을 설정하기 위해, 수혈 날짜, 또는 직전에 혈액 샘플을 채취하였다. 도 1에 나타낸 바와 같이, 이 연구를 위해 총 15명의 인간 수혈 수용자를 모니터링하였다. 수혈 수 시간 경과에 따른 아넬로바이러스 프로파일의 변화를 평가하기 위해, 수혈 후 최대 280일까지 정기적으로 혈액 샘플을 채취하였다. 연구 과정 동안 각각의 환자로부터 5개의 샘플을 채취하였는데, 하나는 수혈 이전에, 4개는 수혈 후 시점에 채취하였다. 일반적으로, 각각의 환자에 대해 몇 주 또는 몇 개월마다 혈액 샘플을 채취하였다. 15명 중 12명의 수용자는 수혈 날짜로부터 6개월 이내에 모든 수혈 후 채혈을 완료하였다.

아넬로바이러스 균주의 존재에 대해 혈액 샘플을 평가하였다. 간략하게, 아넬로바이러스 서열-함유 핵산을 혈액 샘플로부터 단리한 다음, 증폭 및 고-처리량 서열결정을 수행하였다. 그 다음 아넬로바이러스 균주를 각각의 샘플에서 확인하여, 샘플링 각각의 시점에 각각의 환자에 특이적인 아넬로바이러스 프로파일을 구축하였다.

본 실시예의 환자는 상이한 공여자로부터의 단일 수혈 이벤트(즉, 일치하지 않는 공여자 수혈)에서 하나 이상의 수혈을 받았다. 수용자 혈액 샘플을 수혈 후 4회 수집하였으므로, 각각의 공여자에 의해 도입된 아넬로바이러스 균주를 상기 기재된 방법을 사용하여 수혈 수용자에서 시간 경과에 따라 추적할 수 있었다. 시간 경과에 따른 아넬로바이러스 프로파일의 변화를 비교함으로써, 공여자 아넬로바이러스와 수용자 숙주의 원래 아넬로바이러스의 상대적인 지속성을 결정할 수 있었다.

또한, 각각의 공여자로부터 도입된 아넬로바이러스 균주 간의 유사성을 또한 평가할 수 있었다. 수혈 이전에 이미 존재하는 것과 매우 유사한 아넬로바이러스를 받은 환자는 효과적으로 아넬로바이러스의 재투약을 받았다. 그 다음 이들 환자는, 예를 들어, 재투약된 아넬로바이러스가 면역 반응을 유도했는지 여부를 추론하기 위해, 재투약에 대한 프록시로 사용될 수 있었다. 여기서, 5가지의 아넬로바이러스가 수용자 수혈 전에 이미 존재하는 것과 매우 유사한 아넬로바이러스(즉, 아미노산 유사성이 ORF1에서 90% 초과임)를 받은 3명의 환자에서 확인되었다. 도 2의 A 및 도 2의 B에 나타낸 바와 같이, 이들 환자는 3가지 아넬로바이러스 속(즉, 알파토르크바이러스, 베타토르크바이러스, 및 감마토르크바이러스) 모두에서 프록시 재투약을 나타내었다.

또한, 마커 SNP의 분석은 프록시 재투약 균주가 수혈 후 최대 167일까지 장기에 걸쳐 지속됨을 나타내었다. 고해상도 용융(HRM) 분석을 사용하여 수혈 후 시점에서 수혈 수용자에서 매우 유사한 아넬로바이러스 균주를 검출하고 구별하였다. 간략하게, 본 발명자들은 뉴클레오티드 수준에서 쌍별 동일성이 90% 초과인 공여자와 수용자의 수혈 전 균주를 찾았다. 그 다음 두 균주에 어닐링되고 앰플리콘 내에서 적어도 하나의 뉴클레오티드 차이가 있는 프라이머를 설계하였다. 포화 염료를 사용하여, 본 발명자들은 샘플에 존재하는 균주에 기반하여 특유의 프로파일을 생성하는 고해상도 용융 곡선을 수행하였다. 도 3에 나타낸 바와 같이, 수혈 후 제24일에, 프록시 재투약 환자의 아넬로바이러스 프로파일은 주로 환자 자신의 아넬로바이러스로 이루어졌다. 수혈 후 82일까지, 아넬로바이러스 프로파일은 환자와 공여자 균주의 혼합으로 이루어졌다. 수혈 후 제110일 내지 제167일까지, 아넬로바이러스 프로파일은 주로 공여자의 프로파일과 유사하였다. 이러한 데이터는 매우 유사한 재투약 공여자 아넬로바이러스 균주에 의한 상당한 지속성을 입증하였으며, 이는 환자에서 이미 존재하는 균주와 매우 유사한 균주의 수혈을 통한 아넬로바이러스 전염을 시사하였다.

실시예 2: 인간 수혈 환자에서 반복적인 아넬로바이러스 투약

본 실시예에서, 인간 환자는 다수의 반복적인 공여자-일치 수혈을 받을 것이다. 간략하게, 환자는 특정 공여자로부터 초기 수혈을 받을 것이다. 그 다음 모든 환자는 동일한 공여자 또는 공여자들로부터 후속 수혈을 받을 것이다. 이는 본 발명자들이 혈액 내 공여자 아넬로바이러스의 변화뿐만 아니라, 어떤 균주가 수용자를 감염시키고 수용자에서 지속되는지를 추적할 수 있게 하고, 따라서 또한 본 발명자들이 수혈을 통해 아넬로바이러스의 잠재적인 반복적 재투약을 모니터링할 수 있게 할 것이다.

실시예 3: 합성 아넬로벡터의 제조

본 실시예는 합성 아넬로벡터의 시험관 내 생성을 입증한다.

EcoRV 제한 효소 부위 사이의 TTMiniV의 LY1과 LY2 균주 유래의 DNA 서열(Eur Respir J. 2013 Aug;42(2):470-9)을 카나마이신 벡터(Integrated DNA Technologies) 내로 클로닝하였다. TTMiniV의 LY1과 LY2 균주 유래의 DNA 서열에 기반한 생성된 유전 요소 작제물을 실시예 4 및 5에서 각각 아넬로벡터 1(아넬로 1) 및 아넬로벡터 2(아넬로 2)로 지칭한다. 클로닝된 작제물을 10-베타 적격 이.콜라이(New England Biolabs Inc.)로 형질전환한 다음, 제조업체의 프로토콜에 따라 플라스미드 정제(Qiagen)를 수행하였다.

DNA 작제물(도 4 및 도 5)를 37℃에서 6시간 동안 EcoRV 제한 분해(New England Biolabs, Inc.)를 이용하여 선형화하여, TTMiniV 게놈을 함유하고 박테리아 백본 요소(예컨대, 복제 원점 및 선택 가능한 마커)를 배제한 이중-가닥 선형 DNA 단편을 산출하였다. 이어서 아가로스 겔 전기영동, TTMiniV 게놈 단편(2.9 킬로염기쌍)에 대한 올바른 크기 DNA의 절제, 및 제조업체의 프로토콜에 따른 겔 추출 키트(Qiagen)를 사용한 절제된 아가로스 밴드로부터 DNA의 겔 정제를 수행하였다.

일부 구현예에서, 본 실시예에 따른 방법은 본 명세서에 기재된 아넬로벡터의 투여 방법에 사용되는 아넬로벡터의 작제물을 생성하는 데 사용될 수 있다.

실시예 4: 아넬로벡터의 조립 및 감염

본 실시예에서는 실시예 3에 기재된 바와 같은 합성 DNA 서열을 사용한 감염성 아넬로벡터의 성공적인 시험관 내 생성이 입증된다.

이중-가닥 선형화된 겔-정제된 아넬로바이러스 게놈 DNA(실시예 3에서 수득됨)를 지질 형질감염 시약(Thermo Fisher Scientific)을 사용하여, 온전한 플라스미드에서 또는 선형화된 형태에서, HEK293T 세포(인간 배아 신장 세포주) 또는 A549 세포(인간 폐 암종 세포주) 중 어느 하나로 형질감염시켰다. T25 플라스크 내의 70% 컨플루언트 세포의 형질감염을 위하여 6 ㎍의 플라스미드 또는 1.5 ㎍의 선형화된 아넬로바이러스 게놈 DNA를 사용하였다. 아넬로벡터에 포함된 바이러스 서열이 결여된 빈 벡터 백본을 음성 대조군으로서 사용하였다. 형질감염 후 6시간에, 세포를 PBS로 2회 세척하고, 37℃ 및 5% 이산화탄소에서 신선한 성장 배지에서 성장하게 하였다. 인간 Ef1alpha 프로모터에 이어서 YFP 유전자를 인코딩하는 DNA 서열을 IDT로부터 합성하였다. 이러한 DNA 서열을 클로닝 벡터(Thermo Fisher Scientific) 내로 블런트 말단 결찰시켰다. 생성된 벡터를 형질감염 효율을 평가하기 위한 대조군으로서 사용하였다. YFP를 형질감염 72시간 후에 세포 영상화 시스템(Thermo Fisher Scientific)을 사용하여 검출하였다. HEK293T 및 A549 세포의 형질감염 효율은 각각 85% 및 40%로 계산되었다(도 6).

아넬로벡터로 형질감염된 293T 및 A549 세포의 상청액을 형질감염 후 96시간에 수집하였다. 수집된 상청액을 2000 rpm에서 4℃에서 10분 동안 회전 침강시켜, 임의의 세포 데브리스를 제거하였다. 수집된 상청액의 각각을 사용하여 24 웰 플레이트 내의 웰에서 70% 컨플루언트인 새로운 293T 및 A549 세포를 각각 감염시켰다. 37℃ 및 5% 이산화탄소에서의 24시간의 인큐베이션 후에 상청액을 세척해낸 후, 2회의 PBS의 세척 및 신선한 성장 배지로 대체를 행하였다. 이들 세포를 37℃ 및 5% 이산화탄소에서 또 다시 48시간 동안 인큐베이션한 후에, 게놈 DNA 추출을 위하여 세포를 개별적으로 수집하였다. 각각의 샘플로부터의 게놈 DNA를 제조업체의 프로토콜에 따라 게놈 DNA 추출 키트(Thermo Fisher Scientific)를 사용하여 수집하였다.

시험관 내 생성된 아넬로벡터에 의한 293T 및 A549 세포의 성공적인 감염을 확인하기 위하여, 본 명세서에 기재된 바와 같이 수집된 100 ng의 게놈 DNA를 사용하여, LY2 특이적 서열 또는 베타-토르크바이러스에 대하여 특이적인 프라이머를 사용한 정량적 중합효소 연쇄 반응(qPCR)을 수행하였다. 제조업체의 프로토콜에 따라 SYBR 그린 시약(Thermo Fisher Scientific)을 사용하여 qPCR을 수행하였다. GAPDH의 게놈 DNA 서열에 대하여 특이적인 프라이머에 대한 qPCR을 정규화를 위해 사용하였다. 사용되는 모든 프라이머에 대한 서열은 표 42에 열거되어 있다.

[표 42]

도 7a, 7b, 8a, 및 8b에 도시된 qPCR 결과에 나타낸 바와 같이, 시험관 내에서 생성되고 본 실시예에 기재된 바와 같은 아넬로벡터는 감염성이었다.

일부 구현예에서, 본 실시예에 따른 방법은 본 명세서에 기재된 아넬로벡터의 투여 방법에 사용되는 아넬로벡터를 생성하는 데 사용될 수 있다.

실시예 5: 아넬로벡터의 선택성

본 실시예에서는 시험관 내에서 생성된 합성 아넬로벡터가 다양한 조직 기원의 세포주를 감염시키는 능력이 입증된다.

감염성 TTMiniV 아넬로벡터(실시예 3에 기재됨)을 갖는 상청액을 24 웰 플레이트의 웰 내에서 37℃ 및 5% 이산화탄소에서 70% 컨플루언트 293T, A549, Jurkat(급성 T 세포 백혈병 세포주), Raji(버킷 림프종 B 세포주) 및 Chang 세포주와 인큐베이션하였다. 세포를 감염 24시간 후에 PBS로 2회 세척한 후, 신선한 성장 배지로 교체하였다. 그 다음, 세포를 다시 또 다른 48시간 동안 37℃ 및 5% 이산화탄소에서 인큐베이션한 후, 게놈 DNA 추출을 위한 수집을 행하였다. 각각의 샘플로부터의 게놈 DNA를 제조업체의 프로토콜에 따라 게놈 DNA 추출 키트(Thermo Fisher Scientific)를 사용하여 수집하였다.

이전의 실시예에서 생성된 아넬로벡터에 의한 이들 세포주의 성공적인 감염을 확인하기 위하여, 본 명세서에 기재된 바와 같이 수집된 100 ng의 게놈 DNA를 사용하여, LY2 특이적 서열 또는 베타-토르크바이러스에 대하여 특이적인 프라이머를 사용한 정량적 중합효소 연쇄 반응(qPCR)을 수행하였다. 제조업체의 프로토콜에 따라 SYBR 그린 시약(Thermo Fisher Scientific)을 사용하여 qPCR을 수행하였다. GAPDH의 게놈 DNA 서열에 대하여 특이적인 프라이머에 대한 qPCR을 정규화를 위해 사용하였다. 사용되는 모든 프라이머에 대한 서열은 표 42에 열거되어 있다.

도 7a 내지 도 11b에 도시된 qPCR 결과에 나타나 있는 바와 같이, 시험관 내에서 생성되는 아넬로벡터는 감염성일 뿐만 아니라, 그들은 상피 세포, 폐 조직 세포, 간 세포, 암종 세포, 림프구, 림프모구, T 세포, B 세포 및 신장 세포의 예들을 비롯한 다양한 세포주를 감염시킬 수 있었다. 또한, 합성 아넬로벡터가 HepG2 세포(간 세포주)를 감염시켜, 대조군에 비하여 100배 초과의 증가를 초래할 수 있는 것이 관찰되었다.

일부 구현예에서, 본 실시예의 방법은 본 명세서에 기재된 아넬로벡터의 투여 방법에 사용되는 아넬로벡터를 이용하여 수행될 수 있다.

실시예 6: 복제-결핍 아넬로벡터 및 헬퍼 바이러스

아넬로벡터의 복제 및 패키징을 위해, 일부 요소는 트랜스로 제공될 수 있다. 이는 DNA 복제 또는 패키징을 지시하거나 지원하는 단백질 또는 비-코딩 RNA를 포함한다. 일부 예에서, 트랜스 요소는, 헬퍼 바이러스, 플라스미드와 같은 아넬로벡터에 대해 대안적인 공급원, 또는 세포 게놈으로부터 제공될 수 있다.

다른 요소는 통상적으로 시스로 제공된다. 이러한 요소는, 예를 들어, 복제 원점(예를 들어, 아넬로벡터 DNA의 증폭을 가능하게 하기 위함) 또는 패키징 신호(예를 들어, 단백질에 결합하여 게놈을 캡시드 내로 로딩하기 위함)의 역할을 하는 아넬로벡터 DNA의 서열 또는 구조일 수 있다. 일반적으로, 복제 결핍 바이러스 또는 아넬로벡터는 이러한 요소 중 하나 이상이 누락되어, 다른 요소가 트랜스로 제공되더라도 DNA가 감염성 비리온 또는 아넬로벡터로 패키징될 수 없다.

복제 결핍 바이러스는 예를 들어, 동일한 세포에서 아넬로벡터(예를 들어, 복제-결핍 또는 패키징-결핍 아넬로벡터)의 복제를 제어하기 위한 헬퍼 바이러스로서 유용할 수 있다. 일부 예에서, 헬퍼 바이러스는 시스 복제 또는 패키징 요소가 결여되지만, 트랜스 요소, 예컨대 단백질 및 비-코딩 RNA를 발현할 것이다. 일반적으로, 치료용 아넬로벡터는 이들 트랜스 요소의 일부 또는 전부가 결여될 것이며, 이에 따라, 이의 자체가 복제할 수 없을 것이지만, 시스 요소를 보유할 것이다. 세포 내로 동시-형질감염/감염되는 경우, 복제-결핍 헬퍼 바이러스는 아넬로벡터의 증폭 및 패키징을 유도할 것이다. 이에 따라, 수집된, 패키징된 입자는 헬퍼 바이러스 오염 없이, 단지 치료용 아넬로벡터만으로 구성될 것이다.

복제 결핍 아넬로벡터를 개발하기 위하여, 아넬로바이러스의 비-코딩 영역 내의 보존된 요소를 제거할 것이다. 특히, 보존된 5' UTR 도메인 및 GC-풍부 도메인의 결실을 개별적으로, 그리고 함께 시험할 것이다. 두 요소는 모두 바이러스 복제 또는 패키징에 중요한 것으로 고려된다. 또한, 전체 비-코딩 영역에 걸쳐 일련의 결실을 수행하여, 이전에 공지되지 않은 관심 영역을 확인할 것이다.

복제 요소의 성공적인 결실은 예를 들어, qPCR에 의해 측정시, 세포 내에서 아넬로벡터 DNA 증폭의 감소를 초래할 것이지만, 예를 들어, qPCR, 웨스턴 블롯, 형광 검정 또는 발광 검정 중 임의의 것 또는 전부를 포함할 수 있는 감염된 세포에서의 검정에 의해 모니터링시, 일부 감염성 아넬로벡터 생성을 뒷받침할 것이다. 패키징 요소의 성공적인 결실은 아넬로벡터 DNA 증폭을 파괴하지 않을 것이며, 그래서, qPCR에 의해 형질감염된 세포에서 아넬로벡터 DNA의 증가가 관찰될 것이다. 그러나, 아넬로벡터 게놈은 캡슐화되지 않을 것이며, 그래서 감염성 아넬로벡터 생성이 관찰되지 않을 것이다.

실시예 7: 복제-적격 아넬로벡터의 제조 과정

본 실시예는 복제-적격 아넬로벡터의 회수 및 이의 생성 증대 방법을 기재한다. 아넬로벡터는 이의 게놈 내에 세포에서 복제하는 데 필요한, 모든 요구되는 유전 요소 및 ORF를 인코딩하는 경우에 복제 적격이 있다. 이들 아넬로벡터는 이의 복제에 결함이 없기 때문에, 트랜스로 제공되는 보완 활성을 필요로 하지 않는다. 그러나, 이들 아넬로벡터는 헬퍼 활성, 예컨대 전사의 인핸서(예를 들어, 부티르산나트륨) 또는 바이러스 전사 인자(예를 들어, 아데노바이러스 E1, E2 E4, VA; HSV Vp16 및 즉시 조기 단백질)를 필요로 할 것이다.

이러한 실시예에서, 선형 또는 환형 형태로 합성 아넬로벡터의 완전한 서열을 인코딩하는 이중-가닥 DNA는 화학적 형질감염에 의해 T75 플라스크 내의 5E+05개의 부착 포유동물 세포 내로 또는 전기천공법에 의해 현탁액 중 5E+05개의 세포 내로 도입된다. 최적의 기간 후에(예를 들어, 형질감염 3 내지 7일 후에), 세포를 상청액 배지 내로 스크랩핑하여, 세포 및 상청액을 수집한다. 연성 세제, 예를 들어, 담즙염을 0.5%의 최종 농도로 첨가하고, 37℃에서 30분 동안 인큐베이션한다. 칼슘 및 마그네슘 클로라이드를 각각 0.5 mM 및 2.5 mM의 최종 농도로 첨가한다. 엔도뉴클레아제(예를 들어, DNAse I, 벤조나제)를 첨가하고, 25 내지 37℃에서 0.5 내지 4시간 동안 인큐베이션한다. 아넬로벡터 현탁액을 1000 × g에서 4℃에서 10분 동안 원심분리한다. 투명해진 상청액을 새로운 튜브로 옮기고, 동결보호 완충액(안정화 완충액으로도 공지되어 있음)으로 1:1 희석하고, 요망되는 경우 -80℃에 보관한다. 이는 아넬로벡터의 계대 0(P0)을 생성한다. 세제의 농도를 배양된 세포에서 사용될 안전한 한계 미만이 되게 하기 위하여, 이러한 접종물을 아넬로벡터 역가에 따라 무혈청 배지(SFM)에 적어도 100배 이상 희석한다.

T225 플라스크 내의 신선한 단층의 포유동물 세포에 배양물 표면을 덮기에 충분한 최소 부피를 오버레이하고, 부드럽게 로킹(rocking)시키면서 37℃ 및 5% 이산화탄소에서 90분 동안 인큐베이션한다. 이러한 단계를 위해 사용되는 포유동물 세포는 P0 회수를 위해 사용된 것과 동일한 유형의 세포이거나, 그렇지 않을 수 있다. 이러한 인큐베이션 후에, 접종물을 40 ㎖의 무혈청, 동물 기원-부재의 배양 배지로 대체하였다. 세포를 37℃ 및 5% 이산화탄소에서 3 내지 7일 동안 인큐베이션한다. 이전에 사용된 동일한 연성 세제 10X 용액 4 ㎖을 첨가하여, 0.5%의 최종 세제 농도를 달성한 다음, 혼합물을 부드럽게 교반하면서 37℃에서 30분 동안 인큐베이션한다. 엔도뉴클레아제를 첨가하고, 25 내지 37℃에서 0.5 내지 4시간 동안 인큐베이션한다. 그 다음, 배지를 수집하고, 1000 × g에서 4℃에서 10분 동안 원심분리한다. 투명해진 상청액을 40 ㎖의 안정화 완충제와 혼합하고, -80℃에서 보관한다. 이는 시드 스톡을 또는 아넬로벡터의 계대 1(P1)을 생성한다.

스톡의 역가에 따라, 그를 SFM 중에 100배 이상 희석하고, 필요한 크기의 다층 플라스크 상에서 성장한 세포에 첨가한다. 더 작은 규모에서 감염 다중도(MOI) 및 인큐베이션 시간을 최적화시켜, 최대 아넬로벡터 생성을 보장한다. 그 다음, 수집 후에, 아넬로벡터를 필요한 대로 정제하고 농축시킬 수 있다. 예를 들어, 본 실시예에 기재된 바와 같은 작업흐름을 보여주는 개략도는 도 12에 제공되어 있다.

실시예 8: 복제-결핍 아넬로벡터의 제조 과정

본 실시예에는 복제-결핍 아넬로벡터의 회수 및 이의 생성 증대 방법이 기재되어 있다.

아넬로벡터는 복제에 수반되는 하나 이상의 ORF(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 및/또는 ORF2t/3)의 결실에 의해 복제-결핍이 될 수 있다. 복제-결핍 아넬로벡터는 보완하는 세포주에서 성장할 수 있다. 이러한 세포주는 아넬로벡터 성장을 촉진하지만, 아넬로벡터의 게놈에서 소실되거나 비작용성인 구성성분을 구성적으로 발현한다.

일 예에서, 아넬로벡터 증량에 수반되는 임의의 ORF(들)의 서열(들)을, 선택 마커를 인코딩하는 안정한 세포주의 생성에 적합한 렌티바이러스 발현 시스템 내로 클로닝하고, 렌티바이러스 벡터를 본 명세서에 기재된 바와 같이 생성한다. 아넬로벡터 증량을 지원할 수 있는 포유동물 세포주를 이러한 렌티바이러스 벡터로 감염시키고, 클로닝된 ORF가 안정적으로 통합된 세포 집단을 선택하는 선택 마커(예를 들어, 푸로마이신 또는 임의의 다른 항생제)에 의해 선택압으로 처리한다. 이러한 세포주가 특성화되고, 엔지니어링된 아넬로벡터에서 결함을 보완하고, 이에 따라 이러한 아넬로벡터의 성장 및 증식을 지원하는 것으로 증명되면, 그것을 증량시키고, 저온 보관에 저장한다. 이들 세포의 증량 및 유지 동안, 선택 항생제를 배양 배지에 첨가하여 선택압을 유지한다. 아넬로벡터가 이들 세포 내로 도입되면, 선택 항생제를 보류할 수 있다.

일단 이러한 세포주가 확립되면, 복제-결핍 아넬로벡터의 성장 및 생성을 예를 들어, 실시예 7에 기재된 바와 같이 수행한다.

실시예 9: 현탁 세포를 사용한 아넬로벡터의 생성

본 실시예에는 현탁액 중의 세포에서의 아넬로벡터의 생성이 기재되어 있다.

본 실시예에서, 현탁액 조건에서 성장하는 것으로 조정된 A549 또는 293T 생성자 세포주를 웨이브(WAVE) 생물반응기 백에서, 37℃ 및 5% 이산화탄소에서 동물 성분-부재 및 항생제-부재 현탁액 배지(Thermo Fisher Scientific) 중에 성장시킨다. 1 × 10⁶개의 생존 가능한 세포/㎖로 시딩한 이들 세포를 현재의 우수 제조 기준(cGMP) 하에 리포펙타민 2000(Thermo Fisher Scientific)을 사용하여, (예를 들어, 실시예 8에 기재된 바와 같이, 예를 들어, 복제-결핍 아넬로벡터의 경우에) 아넬로벡터를 패키징하는 데 적합하거나 필요한 임의의 보완 플라스미드와 함께 아넬로벡터 서열을 포함하는 플라스미드로 형질감염시킨다. 보완 플라스미드는 일부 예에서 아넬로벡터 게놈(예를 들어, 본 명세서에 기재된 바와 같이, 예를 들어, 바이러스 게놈, 예를 들어, 아넬로바이러스 게놈에 기초한 아넬로벡터 게놈)으로부터 결실되지만, 아넬로벡터의 복제 및 패키징에 유용하거나 필요한 바이러스 단백질을 인코딩할 수 있다. 형질감염된 세포를 웨이브 생물반응기 백에서 성장시키고, 상청액을 하기의 시점에 수집한다: 형질감염 48, 72 및 96시간 후. 상청액을 원심분리를 사용하여 각 샘플에 대한 세포 펠렛으로부터 분리한다. 이어서, 패키징된 아넬로벡터 입자를 이온 교환 크로마토그래피를 사용하여 수집된 상청액 및 용해된 세포 펠렛으로부터 정제한다.

아넬로벡터의 정제된 프렙에서 게놈 등가물은, 예를 들어, PCT/US2018/037379(본 명세서에 참조로 포함됨)의 실시예 18에 기재된 바와 같이, 예를 들어, 바이러스 게놈 추출 키트(Qiagen)를 사용하여 아넬로벡터 게놈을 수확하기 위해 정제된 프렙의 작은 분취량을 사용하고, 이어서 아넬로벡터 DNA 서열에 대해 표적화된 프라이머 및 프로브를 사용하는 qPCR을 수행하여 결정될 수 있다.

정제된 제제의 연속 희석물을 제조하여, 새로운 A549 세포를 감염시킴으로써 정제된 제제 내의 아넬로벡터의 감염성을 정량화할 수 있다. 이들 세포를 형질감염 72시간 후에 수집한 후에, 아넬로벡터 DNA 서열에 특이적인 프라이머 및 프로브를 사용하여 게놈 DNA에서 qPCR 검정을 행하였다.

실시예 10: 마우스에서 외인성 단백질을 발현하기 위한 아넬로벡터의 이용

본 실시예에는 토르크 테노 미니 바이러스(TTMV) 게놈이 마우스에서 반딧불이 루시퍼라제 단백질을 발현하도록 엔지니어링된 아넬로벡터의 이용이 기재된다.

반딧불이-루시퍼라제 유전자를 인코딩하는 엔지니어링된 TTMV의 DNA 서열을 인코딩하는 플라스미드를 화학적 형질감염에 의해 A549 세포(인간 폐 암종 세포주) 내로 도입한다. 18 ㎍의 플라스미드 DNA를 10 cm 조직 배양 플레이트에서 70% 컨플루언트 세포의 형질감염을 위해 사용한다. TTMV 서열이 결여된 빈 벡터 백본을 음성 대조군으로서 사용한다. 형질감염 5시간 후에, 세포를 PBS로 2회 세척하고, 37℃ 및 5% 이산화탄소에서 신선한 성장 배지에서 성장하게 한다.

형질감염된 A549 세포를 그들의 상청액과 함께, 형질감염 96시간 후에 수집한다. 수집된 물질을 37℃에서 1시간 동안 0.5% 데옥시콜레이트(부피 중 중량)로 처리한 후에, 엔도뉴클레아제로 처리한다. 아넬로벡터 입자를 이온 교환 크로마토그래피를 사용하여 이러한 용해물로부터 정제한다. 아넬로벡터 농도를 결정하기 위하여, 아넬로벡터 스톡의 샘플을 바이러스 DNA 정제 키트를 통해 시행하고, ㎖당 게놈 당량을 아넬로벡터 DNA 서열에 대하여 표적화된 프라이머 및 프로브를 사용한 qPCR에 의해 측정한다.

1× 인산염-완충 염수 중 소정의 용량-범위의 게놈 당량의 아넬로벡터를 8 내지 10주령 마우스에서 다양한 주사 경로(예를 들어, 정맥내, 복강내, 피하, 근육내)를 통해 수행한다. 배측 및 등측 생물발광 영상화를 주사 후 3, 7, 10 및 15일에 각 동물에서 수행한다. 제조업체의 프로토콜에 따라, 루시퍼라제 기질(퍼킨-엘머)을 표기된 시점에 각 동물에 복강내로 첨가한 후 생체내 영상화에 의해 영상화를 수행한다.

실시예 11: 외인성 마이크로RNA 서열을 발현하는 아넬로벡터의 기능적 효과

본 실시예는 고유 프로모터를 사용한 아넬로벡터 게놈으로부터의 외인성 miRNA(miR-625)의 성공적인 발현을 보여준다.

500 ng의 하기의 플라스미드 DNA를 24 웰 플레이트 내의 60% 컨플루언트 HEK293T 세포의 웰 내로 형질감염시켰다:

i) 빈 플라스미드 백본

ii) 내인성 miRNA가 녹아웃된(KO) TTV-tth8 게놈을 함유하는 플라스미드

iii) 내인성 miRNA가 비-표적화 스크램블 miRNA로 대체된 TTV-tth8

iv) 내인성 miRNA 서열이 miR-625를 인코딩하는 miRNA로 대체된 TTV-tth8

형질감염 72시간 후에, 전체 miRNA를 Qiagen miRNeasy 키트를 사용하여 형질감염된 세포로부터 수집한 후, miRNA 스크립트(Script) RT II 키트를 사용하여 역전사를 행하였다. 정량적 PCR을 miRNA-625 또는 RNU6 소형 RNA를 특이적으로 검출할 프라이머를 사용하여 역 전사된 DNA 상에서 수행하였다. RNU6 소형 RNA를 하우스키핑(housekeeping) 유전자로서 사용하였으며, 데이터는 빈 벡터에 비한 배수 변화로서 도13에 플롯팅되어 있다. 도 13에 나타낸 바와 같이, miR-625 아넬로벡터는 miR-625 발현의 대략 100-배 증가를 초래한 한편, 빈 벡터, miR-녹아웃(KO) 및 스크램블드 miR에 대하여 신호가 검출되지 않았다.

실시예 12: 외인성 비-코딩 RNA 발현을 위한 아넬로벡터의 제조 및 생성

본 실시예에는 외인성 소형 비-코딩 RNA를 발현하기 위한 아넬로벡터의 합성 및 생성이 기재된다.

TTV의 tth8 주(Jelcic et al, Journal of Virology, 2004)로부터 DNA 서열을 합성하고, 박테리아 복제 원점 및 박테리아 항생제 내성 유전자를 함유하는 벡터 내로 클로닝한다. 이러한 벡터에서, TTV miRNA 헤어핀을 인코딩하는 DNA 서열을 외인성 소형 비-코딩 RNA, 예컨대 miRNA 또는 shRNA를 인코딩하는 DNA 서열로 대체한다. 그 다음, 엔지니어링된 작제물을 전기-적격 박테리아로 형질전환시킨 후, 제조업체의 프로토콜에 따라 플라스미드 정제 키트를 사용하여 플라스미드 단리를 행한다.

외인성 소형 비-코딩 RNA를 인코딩하는 아넬로벡터 DNA를 진핵 생성자 세포주 내로 형질감염시켜, 아넬로벡터 입자를 생성한다. 아넬로벡터 입자를 함유하는 형질감염된 세포의 상청액을 형질감염 후 상이한 시점에 수확한다. 여과된 상청액으로부터의 또는 정제 이후의 아넬로벡터 입자를, 예를 들어, 본 명세서에 기재된 바와 같이, 하류 적용에 사용한다.

실시예 13: 아넬로벡터로부터 내인성 miRNA의 발현 및 내인성 miRNA의 결실

일 구현예에서, PCT/US19/65995(본 명세서에 참조로 포함됨)의 실시예 27에 기재된 바와 같은 GC-풍부 영역에서 36-뉴클레오티드(nt) 서열(CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(서열번호 160)) 결실로 변형된 TTV-tth8 게놈을 포함하는 아넬로벡터를 사용하여 배양물에서 Raji B 세포를 감염시켰다. 이들 아넬로벡터는, n-myc 상호작용 단백질(NMI)을 인코딩하는 mRNA를 표적으로 하는 miRNA인 TTV-tth8 아넬로바이러스의 내인성 페이로드를 인코딩하는 서열을 포함하였고, 아넬로바이러스 게놈을 포함하는 플라스미드를 숙주 세포 내로 도입함으로써 생성되었다. NMI는 JAK/STAT 경로의 하류에서 작동하여, 인터페론-자극된 유전자, 증식 및 성장 유전자, 및 염증 반응의 매개자를 포함하는 다양한 세포내 신호의 전사를 조절한다. 도 14에 나타낸 바와 같이, 바이러스 게놈이 표적 Raji B 세포에서 검출되었다. 대조군 세포에 비하여 표적 Raji B 세포에서 NMI의 성공적인 녹다운이 또한 관찰되었다(도 15). NMI에 대한 miRNA를 포함하는 아넬로벡터는 대조군 세포에 비하여 NMI 단백질 수준의 75% 초과의 감소를 유도하였다. 본 실시예는 고유 아넬로바이러스 miRNA를 갖는 아넬로벡터가 숙주 세포에서 표적 분자를 녹다운시킬 수 있는 것을 보여준다.

또 다른 예에서, 아넬로바이러스-기반의 아넬로벡터의 내인성 miRNA를 결실시켰다. 그 다음, 생성된 아넬로벡터(ΔmiR)을 숙주 세포와 함께 인큐베이션하였다. 그 다음, ΔmiR 아넬로벡터 유전 요소의 게놈 당량을 내인성 miRNA를 보유하는 상응하는 아넬로벡터의 것과 비교하였다. 도 16에 나타낸 바와 같이, 내인성 miRNA가 결실된 아넬로벡터 게놈은 내인성 miRNA가 여전히 존재하는 아넬로벡터 게놈에 대하여 관찰되는 것과 유사한 수준으로 세포에서 검출되었다. 이러한 실시예는 아넬로바이러스-기반의 아넬로벡터의 내인성 miRNA가 완전히 돌연변이되거나 결실될 수 있으며, 아넬로벡터 게놈이 표적 세포에서 여전히 검출될 수 있는 것을 보여준다.

실시예 14: 생체 내에서의 외인성 단백질의 아넬로벡터 운반

본 실시예는 투여 후의 아넬로벡터의 생체 내 이펙터 기능(예를 들어, 단백질의 발현)을 보여준다.

나노-루시퍼라제(nLuc)를 인코딩하는 이식유전자를 포함하는 아넬로벡터(도 17a 및 도 17b)을 제조하였다. 약술하여, TTMV-LY2 비-코딩 영역 및 nLuc 발현 카세트를 갖는 이중-가닥 DNA 플라스미드를 트랜스 복제 및 패키징 인자로서 작용하도록 전장 TTMV-LY2 게놈을 인코딩하는 이중-가닥 DNA 플라스미드와 함께, HEK293T 세포 내로 형질감염시켰다. 형질감염 후에, 세포를 인큐베이션하여, 아넬로벡터 생성을 가능하게 하였으며, 아넬로벡터 물질을 수집하고, 뉴클레아제 처리, 한외여과/정용여과 및 멸균 여과를 통해 농축시켰다. 추가의 HEK293T 세포를 "비-바이러스" 음성 대조군으로서 작용하도록 nLuc 발현 카세트 및 TTMV-LY2 ORF 형질감염 카세트를 갖지만, 복제 및 패키징에 필수적인 비-코딩 도메인이 결여된 비-복제성 DNA 플라스미드로 형질감염시켰다. 비-바이러스 샘플을 아넬로벡터 물질과 동일한 프로토콜에 따라 제조하였다.

아넬로벡터 제제를 3마리 건강한 마우스의 코호트에 근육내로 투여하고, 9일의 경과에 걸쳐 IVIS 루미나(Lumina) 영상화(브루커(Bruker))에 의해 모니터링하였다(도 18a). 비-바이러스 대조군으로서, 비-복제성 제제를 추가 3마리의 마우스에 투여하였다(도 18b). 25 ㎕의 아넬로벡터 또는 비-바이러스 제제의 주사를 제0일에, 왼쪽 뒷다리에 투여하고, 제4일에 오른쪽 뒷다리에 재-투여하였다(도 18a 및 도 18b에서 화살표 참조). 제9일의 IVIS 영상화 후에, 더 많은 nLuc 발광 신호의 발생이 비-바이러스 제제(도 18b)보다 아넬로벡터 제제(도 18a)를 주사한 마우스에서 관찰되었으며, 이는 생체 내 아넬로벡터 형질도입 후의 트랜스 유전자 발현과 일치한다.

실시예 15: 시험관 내 환화된 아넬로바이러스 게놈

본 실시예에는 최소 비-바이러스 DNA와 함께 환형, 이중 가닥 아넬로바이러스 게놈 DNA를 포함하는 작제물이 기재된다. 이들 환형 바이러스 게놈은 야생형 아넬로바이러스 복제 동안 관찰되는 이중-가닥 DNA 중간체와 더욱 근접하게 일치한다. 이러한 환형, 이중 가닥 아넬로바이러스 게놈 DNA가 최소 비-바이러스 DNA와 함께 세포 내로 도입되는 경우, 회전환 복제를 겪어, 예를 들어, 본 명세서에 기재된 바와 같은 유전 요소를 생성할 수 있다.

일 예에서, TTV-tth8 변이체 및 TTMV-LY2를 보유하는 플라스미드를 게놈 DNA에 측접하는 제한 엔도뉴클레아제 인식 부위를 사용하여 분해하였다. 이어서, 생성되는 선형화된 게놈을 결찰시켜, 환형 DNA를 형성하였다. 이들 결찰 반응을 다양한 DNA 농도를 사용하여 행하여, 분자내 결찰을 최적화시켰다. 결찰된 환을 포유동물 세포 내에 바로 형질감염시키거나, 플라스미드 백본을 절단하기 위한 제한 엔도뉴클레아제 및 선형 DNA를 분해하기 위한 엑소뉴클레아제를 사용한 분해에 의해 추가로 처리하여, 비-환형 게놈 DNA를 제거하였다. TTV-tth8에 있어서, XmaI 엔도뉴클레아제를 사용하여, DNA를 선형화시켰으며; 결찰된 환은 GC-풍부 영역과 5' 비-코딩 영역 사이에 53 bp의 비-바이러스 DNA를 함유하였다. TTMV-LY2에 있어서, IIS형 제한 효소 Esp3I을 사용하여, 비-바이러스 DNA를 갖지 않는 바이러스 게놈 DNA 환을 제공하였다. 이 프로토콜을 이전에 공개된 TTV-tth8의 환화로부터 조정하였다(문헌[Kincaid et al., 2013, PLoS Pathogens 9(12): e1003818]). 아넬로바이러스 생성의 개선을 입증하기 위하여, 환화된 TTV-tth8 및 TTMV-LY2를 HEK293T 세포 내로 형질감염시켰다. 7일의 인큐베이션 후에, 세포를 용해시키고, qPCR을 수행하여, 환화된 및 플라스미드-기반의 아넬로바이러스 게놈 간에 아넬로바이러스 게놈의 수준을 비교하였다. 증가된 아넬로바이러스 게놈의 수준은 바이러스 DNA의 환화가 아넬로바이러스 생성을 증가시키기 위한 유용한 전략인 것을 보여준다.

또 다른 예에서, TTMV-LY2 플라스미드(pVL46-240) 및 TTMV-LY2-nLuc를 각각 Esp3I 또는 EcoRV-HF를 사용하여 선형화시켰다. 분해된 플라스미드를 1% 아가로스 겔 상에 정제한 후에, 전기용리 또는 Qiagen 컬럼 정제 및 T4 DNA 리가제를 사용한 결찰을 행하였다. 환화된 DNA를 형질감염 전에 100 kDa UF/DF 멤브레인 상에서 농축시켰다. 환화를 도 19a에 나타낸 바와 같이, 겔 전기영동에 의해 확인하였다. 리포펙타민 2000을 사용한 리포펙션 1일 전에, T-225 플라스크에, 3 x 10⁴개 세포/㎠의 HEK293T를 시딩하였다. 9 마이크로그램의 환화된 TTMV-LY2 DNA 및 50 ㎍의 환화된 TTMV-LY2-nLuc를 플라스크 시딩 1일 후에 동시-형질감염시켰다. 비교로서, 추가의 T-225 플라스크에, 50 ㎍의 선형화된 TTMV-LY2 및 50 ㎍의 선형화된 TTMV-LY2-nLuc를 동시-형질감염시켰다.

아넬로벡터 생성을 트리톤 X-100 수집 완충제 중에서의 세포 수집 이전에 8일 동안 진행하였다. 일반적으로, 아넬로벡터를 예를 들어, 숙주 세포의 용해, 용해물의 정화, 여과 및 크로마토그래피에 의해 농축시킬 수 있다. 본 실시예에서, 수집된 세포를 염화나트륨 조정 및 1.2 ㎛/ 0.45 ㎛ 정상 유동 여과 전에 뉴클레아제 처리하였다. 정화된 수집액을 농축시키고, 750 kDa MWCO mPES 중공사막 상에서 PBS로 완충제 교환하였다. TFF 투석유물을 0.45 ㎛ 필터를 사용하여 여과한 후에, PBS 중에 사전-평형화된 세파크릴(Sephacryl) S-500 HR SEC 컬럼 상에 로딩하였다. 아넬로벡터를 30 cm/hr로 SEC 컬럼에서 처리하였다. 개별 분획을 수집하고, 도 19b에 나타낸 바와 같이, 바이러스 게놈 카피수 및 이식유전자 카피수에 대하여 qPCR에 의해 검정하였다. 바이러스 게놈 및 이식유전자 카피는 SEC 크로마토그램의 공극 부피인 분획 7에서 시작하여 관찰되었다. 잔류 플라스미드 피크는 분획 15에서 관찰되었다. TTMV-LY2 게놈 및 TTMV-LY2-nLuc 이식유전자에 대한 카피수는 분획 7 내지 분획 10에서 nLuc 이식이유전자를 함유하는 팩킹된 아넬로벡터를 나타내는 환화된 투입 DNA를 사용하여 생성된 아넬로벡터에 대하여 우수하게 일치하였다. SEC 분획을 풀링하고, 100 kDa MWCO PVDF 멤브레인을 사용하여 농축시킨 다음, 생체 내 투여 이전에 0.2 ㎛ 여과하였다.

투입 아넬로벡터 DNA의 환화는 선형화된 아넬로벡터 DNA와 비교하는 경우, 정제 과정을 통한 뉴클레아제 보호된 게놈의 회수 백분율의 3배 증가를 초래하였으며, 이는 표 46에 나타낸 바와 같은 환화된 투입 아넬로벡터 DNA를 사용하여 개선된 제조 효율을 나타낸다.

[표 46] 정제 과정 수율

실시예 16: 상이한 토르크 테노 바이러스 주 유래의 초가변 도메인을 갖는 키메라 ORF1을 함유하는 아넬로벡터의 생성

본 실시예에는 하나의 TTV 주의 ORF1 아르기닌-풍부 영역, 젤리-롤 도메인, N22 및 C-말단 도메인 및 상이한 TTV 주의 ORF1 단백질로부터의 초가변 도메인을 함유하는 키메라 아넬로벡터를 생성하기 위한 ORF1의 초가변 영역의 도메인 스와핑이 기재된다.

베타토르크바이러스의 전장 게놈 LY2 주를 포유동물 세포에서의 발현을 위하여 발현 벡터 내에 클로닝하였다. 이 게놈을 돌연변이시켜, LY2의 초가변 도메인을 제거하고, 그것을 먼 관계의 베타토르크바이러스의 초가변 도메인으로 대체하였다(도 19c). 이어서, 스와핑된 초가변 도메인을 갖는 LY2 게놈을 함유하는 플라스미드(pTTMV-LY2-HVRa-z)를 이전에 공개된 방법(문헌[Kincaid et al., PLoS Pathogens 2013])을 사용하여 선형화시키고 환화시킨다. HEK293T 세포를 환화된 게놈으로 형질감염시키고, 5 내지 7일 동안 인큐베이션하여, 아넬로벡터 생성을 가능하게 한다. 인큐베이션 기간 후에, 아넬로벡터를 구배 초원심분리에 의해 형질감염된 세포의 상청액 및 세포 펠렛으로부터 정제한다.

키메라 아넬로벡터가 여전히 감염성인지를 결정하기 위하여, 단리된 바이러스 입자를 비감염된 세포에 첨가한다. 세포를 5 내지 7일 동안 인큐베이션하여, 바이러스 복제를 가능하게 한다. 인큐베이션 후에, 감염을 확립하기 위한 키메라 아넬로벡터의 능력은 면역형광, 웨스턴 블롯 및 qPCR에 의해 모니터링될 것이다. 키메라 바이러스의 구조적 온전성을 음성 염색 및 초저온-전자 현미경법에 의해 평가한다. 키메라 아넬로벡터를 추가로 생체 내에서 세포를 감염시키는 능력에 대하여 시험할 수 있다. 초가변 도메인 스와핑을 통하여 기능적 키메라 아넬로벡터를 생성하는 능력의 확립은 향성을 변경시키고, 면역 검출을 잠재적으로 회피하기 위한 바이러스의 엔지니어링을 가능하게 할 수 있었다.

실시예 17: 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1의 생성

본 실시예에는 하나의 TTV 주의 아르기닌-풍부 영역, 젤리-롤 도메인, N22 및 C-말단 도메인, 및 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1 단백질을 생성하기 위하여, ORF1의 초가변 영역을 다른 관심 단백질 또는 펩티드로 대체하는 것이 기재된다.

실시예 16에 나타낸 바와 같이, LY2의 초가변 도메인을 게놈으로부터 결실시키고, 관심 단백질 또는 펩티드를 이 영역 내로 삽입할 수 있다(도 19d). 이 영역 내로 도입될 수 있는 서열의 유형의 예는 친화성 태그, 항체의 단일 쇄 가변 영역(scFv) 및 항원 펩티드를 포함하지만, 이에 제한되지 않는다. 플라스미드(pTTMV-LY2-ΔHVR-POI) 내의 돌연변이된 게놈을 실시예 16에 기재된 바와 같이 선형화시키고 환화시킨다. 환화된 게놈을 HEK293T 세포 내로 형질감염시키고, 5 내지 7일 동안 인큐베이션한다. 인큐베이션 후에, POI를 함유하는 키메라 아넬로벡터를 적절한 경우 초원심분리 및/또는 친화성 크로마토그래피를 통해 상청액 및 세포 펠렛으로부터 정제한다.

POI를 함유하는 기능적 키메라 아넬로벡터를 생성하기 위한 능력을 다양한 기법을 사용하여 평가한다. 먼저, 정제된 바이러스를 비감염된 세포에 첨가하여, 키메라 아넬로벡터가 페이로드를 복제하고/복제하거나 페이로드를 나이브 세포에 운반할 수 있는지를 결정한다. 추가로, 키메라 아넬로벡터의 구조적 온전성을 전자 현미경법을 사용하여 평가한다. 시험관 내에서 기능성인 키메라 아넬로벡터에 있어서, 생체 내에서의 페이로드의 복제/운반 능력도 또한 평가한다.

실시예 18: tth8 및 LY2에 기반한 아넬로벡터는 각각 EPO 유전자를 폐암 세포 내로 성공적으로 형질도입하였다

본 실시예에서, 비-소세포 폐암 세포주(EKVX)를 에리트로포이에틴 유전자(EPO)를 보유하는 2가지 상이한 아넬로벡터를 사용하여 형질도입시켰다. 아넬로벡터를 본 명세서에 기재된 바와 같이, 시험관 내 환화에 의해 생성하였으며, 이는 LY2 또는 tth8 백본 중 어느 하나에 기반한 2가지 유형의 아넬로벡터를 포함하였다. LY2-EPO 및 tth8-EPO 아넬로벡터 각각은, 예를 들어, PCT/US19/65995(본 명세서에 참조로 포함됨)의 실시예 39에 기재된 바와 같이, 각각 LY2 또는 tth8 게놈의 EPO-인코딩 카세트 및 비-코딩 영역(5' UTR, GC-풍부 영역)을 포함하지만, 아넬로바이러스 ORF를 포함하지 않는 유전 요소를 포함하였다. 세포에 정제된 아넬로벡터 또는 양성 대조군(고 용량 또는 아넬로벡터와 동일한 용량의 AAV2-EPO)을 접종하고, 7일 동안 인큐베이션하였다. 아넬로바이러스 ORF를 개별 시험관 내 환화된 DNA에 트랜스로 제공하였다. 배양 상청액을 접종 후 제3일, 제5.5일 및 제7일에 샘플링하고, 상용의 ELISA 키트를 사용하여 분석하여, EPO를 검출하였다. LY2-EPO 및 tth8-EPO 아넬로벡터 둘 다는 세포를 성공적으로 형질도입시켰으며, 이는 미처리(음성) 대조군 세포와 비교하여 유의하게 더 높은 EPO 역가를 나타내었다(모든 시점에 P < 0.013)(도 20).

실시예 19: 치료용 이식유전자를 갖는 아넬로벡터는 정맥내(i.v.) 투여 후 생체 내에서 검출될 수 있다

본 실시예에서, 인간 성장 호르몬(hGH)을 인코딩하는 아넬로벡터는 정맥내(i.v.) 투여 후에 생체 내에서 검출되었다. LY2 백본에 기반한, 및 외인성 hGH(LY2-hGH)를 인코딩하는 복제-결핍 아넬로벡터를 본 명세서에 기재된 바와 같은 시험관 내 환화에 의해 생성하였다. LY2-hGH 아넬로벡터의 유전 요소는, 예를 들어, PCT/US19/65995(본 명세서에 참조로 포함됨)의 실시예 39에 기재된 바와 같이, LY2 비-코딩 영역(5' UTR, GC-풍부 영역) 및 hGH-인코딩 카세트를 포함하였지만, 아넬로바이러스 ORF를 포함하지 않았다. LY2-hGH 아넬로벡터를 마우스에 정맥내 투여하였다. 아넬로바이러스 ORF를 개별 시험관 내 환화된 DNA에서 트랜스로 제공하였다. 간략하게, 아넬로벡터(LY2-hGH) 또는 PBS를 제0일에 정맥내 주사하였다(n=4 마우스/그룹). 아넬로벡터를 마우스당 4.66E+07개의 아넬로벡터 게놈으로 독립적인 동물 그룹에 투여하였다.

제1의 예에서, 아넬로벡터 바이러스 게놈 DNA 카피를 검출하였다. 제7일에, 혈액 및 혈장을 수집하고, qPCR에 의해 hGH DNA 앰플리콘에 대하여 분석하였다. LY2-hGH 아넬로벡터는 생체 내에서 감염 7일 후에 전혈의 세포 분획에 존재하였다(도 21a). 추가로, 혈장 중 아넬로벡터의 부재는 이들 아넬로벡터가 생체 내에서 복제될 수 없음을 입증하였다(도 21b).

제2의 예에서, hGH mRNA 전사물을 생체 내 형질도입 후에 검출하였다. 제7일에, 혈액을 수집하고, qRT-PCR에 의해 hGH mRNA 전사물 앰플리콘에 대하여 분석하였다. GAPDH를 대조군 하우스키핑 유전자로서 사용하였다. hGH mRNA 전사물을 전혈의 세포 분획에서 측정하였다. 아넬로벡터-인코딩된 이식유전자로부터의 mRNA를 생체 내에서 검출하였다(도 22).

실시예 20: 시험관 내에서 아넬로벡터를 생성하기 위한 투입 물질로서 시험관 내 환화된 게놈

본 실시예는 본 명세서에 기재된 바와 같은 아넬로벡터 유전 요소에 대한 공급원 물질로서, 시험관 내 환화된(IVC) 이중 가닥 아넬로바이러스 DNA가 예상되는 밀도의 패키징된 아넬로벡터 게놈을 제공하는 데 있어 플라스미드 내의 아넬로바이러스 게놈 DNA보다 더욱 강력한 것을 보여준다.

T75 플라스크 내의 1.2E+07개의 HEK293T 세포(인간 배아 신장 세포주)를 11.25 ㎍의 (i) 시험관 내 환화된 이중 가닥 TTV-tth8 게놈(IVC TTV-tth8), (ii) 플라스미드 백본 내의 TTV-tth8 게놈 또는 (iii) TTV-tth8의 ORF1 서열만을 함유하는 플라스미드(비-복제성 TTV-tth8) 중 어느 하나로 형질감염시켰다. 세포를 형질감염 7일 후에 수집하고, 0.1% 트리톤으로 용해시키고, ㎖당 100 유닛의 벤조나제로 처리하였다. 용해물을 염화세슘 밀도 분석을 위해 사용하였으며; 염화세슘 선형 기울기의 각각의 분획에 대하여 밀도를 측정하였으며, TTV-tth8 카피 정량화를 수행하였다. 도 23에 나타낸 바와 같이, IVC TTV-tth8은 예상되는 1.33의 밀도에서, TTV-tth8 플라스미드에 비하여 현저하게 더 많은 바이러스 게놈 카피를 제공하였다.

1E+07개의 Jurkat 세포(인간 T 림프구 세포주)를 플라스미드 내의 시험관 내의 환화된 LY2 게놈(LY2 IVC) 또는 LY2 게놈 중 어느 하나를 사용하여 뉴클레오펙션시켰다. 세포를 형질감염 4일 후에 수집하고, 0.5% 트리톤 및 300 mM 염화나트륨을 함유하는 완충제를 사용하여 용해시킨 후, 2회의 즉각적인 동결-해동을 행하였다. 용해물을 100 유닛/㎖의 벤조나제를 사용하여 처리한 후, 염화세슘 밀도 분석을 행하였다. 밀도 측정 및 LY2 게놈 정량화를 염화세슘 선형 기울기의 각각의 분획 상에서 수행하였다. 도 24에 나타낸 바와 같이, Jurkat 세포 내의 시험관 내 환화된 LY2 게놈의 형질감염은 도 24에서 검출 가능한 피크를 보이지 않았던 LY2 게놈을 함유하는 플라스미드의 형질감염에 비하여, 예상되는 밀도에서 날카로운 피크를 야기하였다.

실시예 21: 아넬로바이러스 게놈의 탠덤 카피

본 실시예는 상류 게놈의 GC-풍부 영역이 하류 게놈의 5' 영역 근처에 있도록 나란히 배열된, 단일 아넬로바이러스 게놈의 2개 카피를 보유하는 플라스미드-기반 발현 벡터를 기재한다(도 26a).

일부 구현예에서, 아넬로바이러스는 회전환을 통해 복제할 수 있으며, 여기에서 복제효소(Rep) 단백질은 아넬로바이러스 Rep 결합 부위(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 5' UTR을 포함함, 예를 들어, 헤어핀 루프 및/또는 복제 원점을 포함함)에서 게놈에 결합하고 환 주위에서 DNA 합성을 개시한다. 플라스미드 백본에 함유된 아넬로바이러스 게놈의 경우, 이는 통상적으로, 천연 바이러스 게놈보다 더 긴 전체 플라스미드 길이의 복제, 또는 최소한의 백본을 가진 게놈을 포함하는 더 작은 환을 생성하는 플라스미드의 재조합을 수반한다. 따라서, 플라스미드를 벗어난 바이러스 복제는 비효율적일 수 있다. 바이러스 게놈 복제 효율을 개선시키기 위해, 플라스미드를 TTMV-LY2의 탠덤 카피로 엔지니어링하였다. 이론에 결부시키고자 하지 않고, 이들 플라스미드는 Rep 단백질이 결합하는 위치에 관계없이 상류 아넬로바이러스 Rep 결합 부위로부터 하류 아넬로바이러스 Rep 변위 부위(예를 들어, 본 명세서에 기재된 바와 같은, 예를 들어, 5' UTR을 포함함, 예를 들어, 헤어핀 루프 및/또는 복제 원점을 포함함)로 바이러스 게놈의 복제를 유도할 수 있도록, 아넬로바이러스 게놈의 환형 순열을 제시했을 수 있다.

탠덤 TTMV-LY2를 Golden-gate 조립을 통해 조립하였고, 동시에 2개의 게놈 카피를 백본에 통합하고, 게놈 사이에 추가 뉴클레오티드를 남기지 않았다. 탠덤 TTMV-LY2 플라스미드는 첫 번째 5' NCR에서 시작하여 첫 번째 GC-풍부 영역까지 이어지고 바로 두 번째 5' NCR부터 두 번째 GC-풍부 영역까지 아넬로바이러스 게놈의 2개의 동일한 카피를 포함하였다(도 26a). 플라스미드는 또한 박테리아 기원 및 선택 가능한 마커를 갖는 박테리아 백본을 포함하였다.

TTMV-LY2의 탠덤 카피를 보유하는 플라스미드를 뉴클레오펙션을 통해 MOLT-4 세포로 형질감염시켰다. TTMV-LY2 게놈의 단일 카피를 갖는 플라스미드를 대조군으로서 유사하게 형질감염시켰다. 세포를 4일 동안 인큐베이션한 다음, 세포 펠렛을 수집하였다. 각각의 세포 펠렛의 일부를 서던 블롯팅에 사용하였다. 총 DNA를 Qiagen DNeasy 혈액 및 조직 키트를 사용하여 세포에서 단리하였다. TTMV-LY2 게놈 및 플라스미드에 대해 서로 다른 효과로 게놈 DNA를 분해하는 제한 엔도뉴클레아제를 사용하여, 각각 총 DNA 샘플의 10 μg에 대해 4가지의 대체 분해를 수행하였다: 한 가지 분해는 게놈 내에서 절단하지 않거나 플라스미드를 절단하지 않고; 두 번째 분해는 박테리아 백본 내의 단일에서 절단하지만, 아넬로바이러스 게놈을 절단하지 않고; 세 번째 분해는 TTMV-LY2 게놈 내의 단일 유전자좌를 절단하지만, 박테리아 백본 내에서 절단하지 않고; 마지막 분해는 TTMV-LY2 게놈 내에서 절단하지만 박테리아 백본 내에서 절단하지 않고, 또한 박테리아에서 생성된 유입 플라스미드 DNA만을 분해하고 포유동물 세포에서 복제된 DNA 내에서 절단하지 않을 메틸화-민감성 DpnI 효소를 포함하였다. 분해를 3시간 동안 0.5 V/cm으로 1×TAE에서 7 mm 두께의 1% 아가로스 겔에서 실행하였다. 그 다음 겔을 처리하여 DNA를 탈퓨린화하고 변성시켰다. 그 다음 DNA를 밤새 모세관 이동을 통해 양전하 나일론 막으로 옮겼다. DNA를 자외선을 통해 막에 가교시켰다. 그 다음 비오틴-dUTP를 프로브에 통합하여 TTMV-LY2 게놈에 대해 무작위-헥사머 생성 단편으로 블롯을 프로브하였다. 프로브를 스트렙타비딘-접합 IRDye-800을 사용하여 검출하고, LiCor Odyssey 이미저에서 영상화하였다.

서던 블롯팅은 탠덤 TTMV-LY2 플라스미드가 야생형 크기의 환형 이중-가닥 아넬로바이러스 게놈을 복제할 수 있음을 입증하였다(도 26b). TTMV-LY2 게놈의 단일 카피를 보유하는 플라스미드의 경우, 4 내지 10 kb 사이의 미절단 수퍼코일 DNA가 관찰되었으며(레인 1), 이는 플라스미드 백본(레인 2) 또는 TTMV- LY2 게놈(레인 3) 내에서 절단될 경우 5.1 kb로 선형화되었다. 환형 또는 선형의 회수된 야생형 길이 TTMV-LY2 게놈과 일치하는 밴드는 TTMV-LY2 게놈의 단일 카피를 가진 플라스미드로부터 관찰되지 않았다. 선형화된 플라스미드의 DpnI-내성 카피 분해에 의해 관찰된 바와 같이(레인 4), 단일 카피를 갖는 전체 플라스미드는 MOLT-4 세포에서 복제하였다. 그러나, 단일-카피 TTMV-LY2 플라스미드로부터 어떠한 야생형 길이 게놈도 회수되지 않았다.

TTMV-LY2 게놈의 탠덤 카피를 보유하는 플라스미드의 경우, 4 kb와 10 kb 사이의 슈퍼코일 플라스미드가 관찰되었으며(레인 5), 이는 플라스미드 백본에서 절단될 경우 8.8 kb로 선형화되었다(레인 6). 중요하게도, 야생형 TTMV-LY2 게놈(레인 5 및 6)의 회복과 일치하는 이중 가닥 DNA TTMV-LY2 게놈의 단일 카피와 일치하는 대략 1.8 kb 밴드가 미절단 및 백본 절단 레인에서 관찰되었다. 이는 TTMV-LY2 게놈 내에서 절단하는 효소로 분해되었을 때 1.8 kb 밴드가 선형화된 TTMV-LY2 게놈 DNA와 일치하는 3.0 kb 밴드로 대체되었다(레인 7). 선형화된 TTMV-LY2 게놈 밴드는 DpnI 내성이었으며, 이는 탠덤 DNA의 재조합(레인 8)을 통해 생성되기보다는 포유동물 세포 내에서 복제되었음을 나타낸다. 함께 이러한 데이터는 야생형 길이의 TTMV-LY2 게놈이 MOLT-4 세포의 탠덤 TTMV-LY2 플라스미드로부터 회수되었음을 입증하였다.

탠덤 TTMV-LY2 플라스미드로 형질감염된 추가 세포 펠렛을 0.5% 트리톤의 존재 하에 동결/해동에 의해 용해시킨 다음, 패키징되지 않은 DNA로부터 바이러스 입자를 분리하기 위해 선형 CsCl 구배에서 실행하였다. 선형 구배로부터 분획을 취하고, TTMV-LY2 게놈 서열에 대해 Taqman 프로브를 사용하여 qPCR을 수행하였다. TTMV-LY2 게놈의 피크는 아넬로바이러스 크기의 입자가 발견될 것으로 예상되는 1.30 내지 1.35 g/cm³의 CsCl 밀도에서 관찰되었다(도 26c). 이는 MOLT-4 세포에서 생성된 TTMV-LY2 게놈이 성공적으로 바이러스 입자로 패키징되었음을 나타내었다. 전반적으로, 이 데이터는 엔지니어링 탠덤 아넬로바이러스 게놈이 바이러스 게놈 복제를 증가시킬 수 있고 아넬로바이러스 생성을 증가시키기 위한 전략으로 사용될 수 있음을 입증하였다.

실시예 22: 텐덤 아넬로벡터 작제물로부터 아넬로벡터의 효율적인 복제

본 실시예에서, 탠덤 아넬로벡터는 HEK293 또는 MOLT-4 세포와 같은 포유동물 숙주 세포에서 성공적으로 증폭되는 것으로 나타났다. 탠덤 아넬로벡터 작제물은 아넬로바이러스 게놈의 2개의 전장 카피(예를 들어, 본 명세서에 기재된 바와 같은, Ring1, Ring2, 또는 Ring4)를 포함하도록 구축되었다. 게놈의 각각의 카피는 5'에서 3' 순서로, 고도로 보존된 도메인을 포함하는 5' 비-코딩 영역, 천연 아넬로바이러스 오픈-리딩 프레임을 대체하는 카고 서열을 포함하는 영역, 및 GC-풍부 영역을 포함하는 3' UTR을 포함하였다. 제1 게놈 카피의 3' 말단과 제2 게놈 카피의 5' 말단을 뉴클레오티드 개입 없이 서로 직접 부착하였다.

간략하게, 작제물을 PEI 형질감염 시약 또는 뉴클레오펙션에 의해 HEK293 또는 MOLT-4 세포 내로 도입한다. 아넬로바이러스 ORF1을 포함한 트랜스 복제 및 패키징 요소를 별도의 플라스미드에서 트랜스로 제공한다. 형질감염된 세포를 37℃에서 4일 동안 인큐베이션한다. 아넬로바이러스 게놈의 복제를 qPCR 및 서던 블롯으로 측정한다. 음성 대조군의 경우, 트랜스 요소 없이 아넬로벡터 및 탠덤 아넬로벡터의 단일 카피를 보유하는 플라스미드를 포함하였다.

실시예 23: 예시적인 탠덤 아넬로벡터 작제물 설계

하기 기재된 실시예에서, 탠덤 아넬로바이러스에 대한 다수의 예시적인 작제물 설계를 MOLT-4 숙주 세포에서 회전환 증폭을 겪는 능력에 대해 테스트하였다. 이론에 결부시키고자 하지 않고, 아넬로바이러스 회전환 증폭은 복제효소-결합 부위(예를 들어, 헤어핀 루프 및/또는 복제 원점을 포함하는, 예를 들어, 5' UTR)에서 시작되고 끝나는 것으로 고려된다. 환화된 단일 아넬로바이러스 게놈에서, 동일한 복제효소-결합 부위는 시작 부위와 중지 부위 둘 다로 작용할 수 있다. 탠덤 아넬로바이러스뿐만 아니라, 본 실시예에 기재된 대안 설계는, 게놈이 환화된 단일-카피 게놈처럼 효과적으로 작동하도록, 복제될 게놈의 양쪽 말단에 이러한 복제효소-결합 부위를 배치한다.

3' 말단에 부분적인 아넬로바이러스 게놈을 갖는 작제물

본 실시예에서, 아넬로바이러스 게놈의 전장 카피가 부분적인 아넬로바이러스 게놈에 비해 5'에 위치하는 예시적인 탠덤 아넬로벡터를 설계하였다. 도 27a에 나타낸 바와 같이, 제1 대안 작제물(pRTx-843)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 바이러스 오픈-리딩 프레임의 전체 세트를 포함하는 영역, 및 GC-풍부 영역이 결여된 3' NCR을 포함하였다. 도 27a에 나타낸 바와 같이, 제2 대안 작제물(pRTx-844)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 2812의 바이러스 오픈-리딩 프레임의 전체 세트를 포함하는 영역을 포함하였다. 도 27a에 나타낸 바와 같이, 제3 대안 작제물(pRTx-845)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 2583의 바이러스 오픈-리딩 프레임의 일부만을 포함하는 영역을 포함하였다. 도 27a에 나타낸 바와 같이, 제4 대안 작제물(pRTx-846)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 2264의 바이러스 오픈-리딩 프레임의 일부만을 포함하는 영역을 포함하였다. 도 27a에 나타낸 바와 같이, 제5 대안 작제물(pRTx-847)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 723의 바이러스 오픈-리딩 프레임의 일부만을 포함하는 영역을 포함하였다. 도 27a에 나타낸 바와 같이, 제6 대안 작제물(pRTx-848)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 423을 포함하였다. 도 27a에 나타낸 바와 같이, 제7 대안 작제물(pRTx-849)은 5'에서 3' 순서로, 전장 카피의 아넬로바이러스 게놈(Ring2), 이어서 5' NCR의 일부로 이루어진 부분적인 아넬로바이러스 게놈, 및 Ring2의 뉴클레오티드 1에서 267을 포함하였다.

간략하게, 각각의 탠덤 작제물을 뉴클레오펙션에 의해 MOLT-4 세포에 도입하였다. 회전환 증폭을 위한 복제효소 단백질을 완전한 바이러스 게놈에 의해 시스로 제공하였다. ORF1 단백질을 완전한 바이러스 게놈에 의해 시스로 제공하였다.

2개의 전체 게놈(pVL46-257)을 포함하는 전장 탠덤 Ring2 작제물을 바이러스 복제 및 패키징을 위한 양성 대조군으로 사용하였다. 음성 대조군의 경우, Ring2 게놈의 단일 카피를 보유하는 플라스미드(pVL46-240)가 사용된다. 형질감염된 세포를 37˚에서 4일 동안 인큐베이션한 다음, 서던 블롯 및 qPCR 분석을 위해 세포를 수확하였다. 서던 블롯의 경우, Qiagen DNeasy 혈액 및 조직 키트를 사용하여 세포에서 전체 DNA를 단리하고, 플라스미드 백본에서 한 번 절단하는 효소와 DpnI로 총 DNA 10 μg을 분해하여 박테리아에서 생성된 임의의 투입 DNA를 분해하였다. 분해를 3시간 동안 0.5 V/cm으로 1×TAE에서 7 mm 두께의 1% 아가로스 겔에서 실행하였다. 그 다음 겔을 처리하여 DNA를 탈퓨린화하고 변성시켰다. 그 다음 DNA를 밤새 모세관 이동을 통해 양전하 나일론 막으로 옮겼다. DNA를 자외선을 통해 막에 가교시켰다. 그 다음 비오틴-dUTP를 프로브에 통합하여 TTMV-LY2 게놈에 대해 무작위-헥사머 생성 단편으로 블롯을 프로브하였다. 프로브를 스트렙타비딘-접합 IRDye-800을 사용하여 검출하고, LiCor Odyssey 이미저에서 영상화하였다. 플라스미드 pRTx-845의 샘플을 서던 블롯으로 테스트하지 않았음에 유의한다. 복제된 환형 이중-가닥 DNA Ring2 게놈의 회수는 pRTx-843 및 844의 경우 관찰되었지만, pRTx-846 내지 849에 대해서는 관찰되지 않았다(도 27d). pRTx-843, 844 및 848의 경우 플라스미드 DNA의 복제가 관찰되었으며, 이는 단일-카피 게놈 플라스미드에서 관찰되는 것과 유사하였다.

추가 세포 펠렛을 동결/해동 및 0.5% 트리톤을 사용하여 용해하였다. 용해물을 염화세슘 단계 구배에 통과시키고 아넬로바이러스-함유 분획을 수집하였다. 아넬로바이러스 게놈의 복제를 DNase-보호 qPCR에 의해 측정하였다. pRTx-843 내지 846은 전체 탠덤 pRTx-257에서 관찰된 바와 같이 세포당 유사한 수준의 Ring2 바이러스 게놈을 생성하였으며, 이는 캡슐화된 바이러스의 성공적인 생성을 나타낸다(도 27e). pRTx-847은 또한 전체 탠덤에서 관찰된 것보다 적지만 보호된 게놈을 생성한 반면, pRTx-848 및 849는 qPCR에 의해 테스트되지 않았다.

5' 말단에 부분적인 아넬로바이러스 게놈을 갖는 작제물

본 실시예에서, 아넬로바이러스 게놈의 전장 카피가 부분적인 아넬로바이러스 게놈에 비해 3'에 위치하는 예시적인 탠덤 아넬로벡터를 설계하였다. 도 27b에 나타낸 바와 같이, 하기와 같은 부분적인 Ring 게놈에 이어 전장 Ring2 게놈을 갖는 일련의 작제물을 테스트하였다: pRTx-836, 고도로 보존된 5' NCR 도메인, 아넬로바이러스 오픈-리딩 프레임의 전체 세트, 및 GC-풍부 영역(Ring2 뉴클레오티드 267 내지 2979)을 포함하는 3' NCR로 이루어진 부분적인 아넬로바이러스 게놈을 포함함; pRTx-837, 아넬로바이러스 오픈-리딩 프레임의 전체 세트 및 GC-풍부 영역(Ring2 뉴클레오티드 423 내지 2979)을 포함하는 3' NCR로 이루어진 부분적인 아넬로바이러스 게놈을 포함함; pRTx-838, 아넬로바이러스 오픈-리딩 프레임의 일부 및 GC-풍부 영역을 포함하는 3' NCR로 이루어진 부분적인 아넬로바이러스 게놈(Ring2 뉴클레오티드 723 내지 2979); pRTx-839, 아넬로바이러스 오픈-리딩 프레임의 일부 및 GC-리치 영역(Ring2 뉴클레오티드 723 내지 2979)을 포함하는 3' NCR로 이루어진 부분적인 아넬로바이러스 게놈을 포함함; pRTx-840, 아넬로바이러스 오픈-리딩 프레임의 일부 및 GC-풍부 영역(Ring2 뉴클레오티드 2812 내지 2979)을 포함하는 3' NCR로 이루어진 부분적인 아넬로바이러스 게놈을 포함함; pRTx-841, GC-풍부 영역(Ring2 뉴클레오티드 2812 내지 2979)을 포함하는 3' NCR로 이루어진 부분 아넬로바이러스 게놈을 포함함; 및 pRTx-842, GC-풍부 영역(Ring2 뉴클레오티드 2867 내지 2979)으로 이루어진 부분적인 아넬로바이러스 게놈을 포함함.

간략하게, 각각의 탠덤 작제물을 뉴클레오펙션에 의해 MOLT-4 세포 내로 도입하였다. 회전환 증폭을 위한 복제효소 단백질을 완전한 바이러스 게놈에 의해 시스로 제공하였다. ORF1 단백질을 완전한 바이러스 게놈에 의해 시스로 제공하였다. 2개의 전체 게놈(pVL46-257)을 포함하는 전장 탠덤 Ring2 작제물을 바이러스 복제 및 패키징을 위한 양성 대조군으로 사용하였다. 음성 대조군의 경우, Ring2 게놈의 단일 카피를 보유하는 플라스미드(pVL46-240)가 사용된다. 형질감염된 세포를 37˚에서 4일 동안 인큐베이션한 다음, 서던 블롯 및 qPCR 분석을 위해 세포를 수확하였다. 서던 블롯의 경우, Qiagen DNeasy 혈액 및 조직 키트를 사용하여 세포에서 전체 DNA를 단리하고, 플라스미드 백본에서 한 번 절단하는 효소와 DpnI로 총 DNA 10 μg을 분해하여 박테리아에서 생성된 임의의 투입 DNA를 분해하였다. 분해를 3시간 동안 0.5 V/cm으로 1×TAE에서 7 mm 두께의 1% 아가로스 겔에서 실행하였다. 그 다음 겔을 처리하여 DNA를 탈퓨린화하고 변성시켰다. 그 다음 DNA를 밤새 모세관 이동을 통해 양전하 나일론 막으로 옮겼다. DNA를 자외선을 통해 막에 가교시켰다. 그 다음 비오틴-dUTP를 프로브에 통합하여 TTMV-LY2 게놈에 대해 무작위-헥사머 생성 단편으로 블롯을 프로브하였다. 프로브를 스트렙타비딘-접합 IRDye-800을 사용하여 검출하고, LiCor Odyssey 이미저에서 영상화하였다. 복제된 환형 이중-가닥 DNA Ring2 게놈의 회수는 pRTx-836 내지 839의 경우 관찰되었지만, pRTx-840 내지 842에 대해서는 관찰되지 않았다(도 27d).

추가 세포 펠렛을 동결/해동 및 0.5% 트리톤을 사용하여 용해하였다. 용해물을 염화세슘 단계 구배에 통과시키고 아넬로바이러스-함유 분획을 수집하였다. 아넬로바이러스 게놈의 복제를 DNase-보호 qPCR에 의해 측정하였다. pRTx-836 내지 840은 전체 탠덤 pRTx-257에서 관찰된 바와 같이 세포당 유사한 수준의 Ring2 바이러스 게놈을 생성하였으며, 이는 캡슐화된 바이러스의 성공적인 생성을 나타낸다(도 27e). pRTx-841 및 842에 대해서는 보호된 바이러스 게놈이 거의 내지 전혀 관찰되지 않았다.

2개의 부분적인 아넬로바이러스 게놈을 갖는 작제물

본 실시예에서, 탠덤 구조의 구조를 충분히 모방하여 효율적인 회전환 증폭을 허용하도록 배열된, 아넬로바이러스 게놈의 2개의 부분적인 카피를 포함하는 예시적인 탠덤 아넬로벡터를 설계하였다. 6개의 이러한 순열이 도 27c에 나타나 있다: 5'에서 3'으로, 전체 Ring2 오픈-리딩 프레임 및 GC-풍부 영역(Ring2 뉴클레오티드 267 내지 2979)을 포함하는 3' NCR을 갖는 5' NCR 보존된 영역에서 시작하는 부분적인 Ring2 게놈, 이어서 5' NCR 및 고도로 보존된 영역(Ring 뉴클레오티드 1 내지 423)을 갖는 부분적인 Ring2 게놈을 포함하는 순열 1; 5'에서 3'으로, 전체 Ring2 오픈-리딩 프레임 및 GC-풍부 영역(Ring2 뉴클레오티드 423 내지 2979)을 포함하는 3' NCR로 시작하는 부분적인 Ring2 게놈, 이어서 고도로 보존된 영역을 갖는 5' NCR 및 오픈-리딩 프레임의 일부(Ring2 뉴클레오티드 1 내지 723)를 갖는 부분적인 Ring2 게놈을 포함하는 순열 2; 5'에서 3'으로, Ring2 오픈-리딩 프레임의 일부 및 GC-풍부 영역(Ring2 뉴클레오티드 723 내지 2979)을 포함하는 3' NCR로 시작하는 부분적인 Ring2 게놈, 이어서 5' NCR 및 아넬로바이러스 오픈-리딩 프레임의 일부(Ring2 뉴클레오티드 1 내지 2273)를 갖는 부분적인 Ring2 게놈을 포함하는 순열 3; 5'에서 3'으로, 부분적인 Ring2 오픈-리딩 프레임 및 GC-풍부 영역(Ring2 뉴클레오티드 2273 내지 2979)을 포함하는 3' NCR로 시작하는 부분적인 Ring2 게놈, 이어서 5' NCR 및 아넬로바이러스 오픈-리딩 프레임의 일부(Ring2 뉴클레오티드 1 내지 2452)를 갖는 부분적인 Ring2 게놈을 포함하는 순열 4; 5'에서 3'으로, 부분적인 Ring2 오픈-리딩 프레임 및 GC-풍부 영역(Ring2 뉴클레오티드 2452 내지 2979)을 포함하는 3' NCR로 시작하는 부분적인 Ring2 게놈, 이어서 5' NCR 및 전체 Ring2 오픈-리딩 프레임(Ring2 뉴클레오티드 1 내지 2812)를 갖는 부분적인 Ring2 게놈을 포함하는 순열 5; 및 5'에서 3'으로, GC-풍부 영역(Ring2 뉴클레오티드 2812 내지 2979)을 포함하는 3' NCR에서 시작하는 부분적인 Ring 2 게놈, 이어서 5' NCR 및 전체 Ring2 오픈-리딩 프레임 및 GC-풍부 영역(Ring2 뉴클레오티드 1 내지 2867)이 없는 3' NCR을 갖는 부분적인 Ring2 게놈을 포함하는 순열 6.

간략하게, 각각의 탠덤 작제물을 뉴클레오펙션에 의해 MOLT-4 세포 내로 도입한다. Rep 인자 및 Ring2 ORF1을 포함하여, 회전환 증폭 및 바이러스 패키징을 위한 단백질을 다른 플라스미드로부터 트랜스로 제공한다. 형질감염된 세포를 37˚에서 4일 동안 인큐베이션한다. 아넬로바이러스 게놈의 복제를 qPCR 및 서던 블롯에 의해 측정한다. 2개의 전체 게놈을 갖는 전장 탠덤 Ring2 작제물(pVL46-257) 을 바이러스 복제 및 패키징을 위한 양성 대조군으로 사용한다. 음성 대조군의 경우, Ring2 게놈의 단일 카피를 보유하는 플라스미드(pVL46-240)가 사용된다.

실시예 24: 포유동물 세포에서 탠덤 아넬로바이러스 작제물로부터 유전자의 전사

본 실시예에서, 백본으로서 Ring1을 기반으로 하여 일련의 아넬로벡터 작제물을 생성하였다(도 27f에 나타낸 바와 같음). 작제물은 eGFP-ORF1 융합 단백질(최적화된 코돈)을 암호화하는 Ring1 서열 및 탠덤 Ring1 서열을 포함하는 탠덤 작제물을 포함하였다. 그 다음 작제물을 Jurkat 세포에 형질감염시켰다. 그 다음 아넬로바이러스(Ring1) ORF1의 전사를 긴 RNA 판독물의 서열을 결정함으로써 평가하였다.

도 27f에 나타낸 바와 같이, 대안 작제물로 형질감염된 Jurkat 세포와 비교하여 Ring1-기반 탠덤 GFP 작제물로 형질감염된 Jurkat 세포에서 더 많은 양의 전장 Ring1 ORF1 전사체를 검출하였다.

실시예 25: 포유동물 세포에서 탠덤 아넬로바이러스 작제물로부터 생성된 ORF1 및 ORF2 단백질

본 실시예에서, 백본으로서 아넬로바이러스 Ring2를 기반으로 하여 일련의 아넬로벡터 작제물을 생성하였다(도 27g에 나타낸 바와 같음). 작제물은 제 Ring2 서열 및 제2 Ring2 서열을 나란히 포함하는 탠덤 작제물을 포함하였다. 작제물을 MOLT4 세포(인간 T 림프아구 세포주)에 형질감염시키고 그 다음 Ring2 ORF1 단백질을 웨스턴 블롯에 의해 검출하였다. 간략하게, 탠덤 Ring2 게놈(Rep)을 함유하는 플라스미드 또는 Ring2 게놈의 149 bp를 함유하는 음성 대조군 플라스미드 중 하나의 25 ug으로 1E07 MOLT4 세포를 뉴클레오펙션시켰다. 각각의 뉴클레오펙션된 샘플을 25 ml 성장 배지(RPMI + 10% FBS + 0.01% Polyaxmer + 1 mM 피루브산나트륨)에 접종하였다. 뉴클레오펙션 후 제1일부터 제3일까지 매일 각각의 샘플에서 배양액 1 ml를 펠렛화하였다. 세포를 50 ul 용해 완충액(0.5% 트리톤, 300 mM NaCl, 50 mM 트리스 pH 8.0)에 재현탁한 후 2회 동결 해동하여 펠렛화된 세포를 용해하였다. 그 다음 용해물을 10,000×g에서 30분 동안 회전시켜 정화하였다. 20 ul의 정화된 용해물을 웨스턴 블롯 분석에 사용하여 Ring2 ORF1에 대해 생성된 2개의 토끼 폴리클로날 항체의 칵테일을 사용하여 Ring2 ORF1 단백질을 검출하였다.

도 27g에 나타낸 바와 같이, 뉴클레오펙션 후 제2일 및 제3일에 Ring2-기반 탠덤 GFP 작제물로 뉴클레오펙션된 MOLT-4 세포에서 Ring2 ORF1 단백질을 검출하였다.

실시예 26: 탠덤 아넬로벡터의 감염성 평가

본 실시예에서는, 탠덤 아넬로벡터를 외인성 유전자를 인코딩하는 유전 요소를 캡슐화하는 단백질성 외부로 생성한다. 실시예 21 내지 24 중 임의의 것에 기재된 바와 같이, 탠덤 아넬로벡터를 생성한다. 간략하게, 숙주 세포를 탠덤 아넬로벡터 DNA로 형질감염시키고 탠덤 아넬로벡터 유전 요소의 복제 및 단백질성 외부 내의 캡슐화에 적합한 조건 하에서 인큐베이션한다. 그 다음 캡슐화된 아넬로벡터를, 예를 들어, 본 명세서에 기재된 바와 같이, 배양물로부터 단리한다. 그 다음 아넬로벡터를 세포의 감염에 적합한 조건 하에서 세포(예를 들어, MOLT-4 또는 Jurkat 세포)와 접촉시킨다.

예를 들어, 감염된 세포에서 아넬로바이러스 핵산을 검출하기 위해 정량적 실시간 PCR(qPCR)을 사용하여 감염성을 평가할 수 있다. 예를 들어, 감염된 세포를 DNA를 위해 수확할 수 있으며, 그 다음 아넬로바이러스-특이적 서열에 특이적인 프라이머를 사용하여 qPCR을 수행한다. 예를 들어, GAPDH의 게놈 DNA 서열에 특이적인 프라이머에 대한 qPCR이 정규화에 사용될 수 있다. qPCR은 검출된 아넬로바이러스 DNA의 게놈 등가물에 따라 감염성을 정량화하는 데 사용될 수 있다.

대안적으로, 외인성 유전자의 발현 또는 외인성 유전자의 하류 활성을 검출함으로써 감염성을 평가할 수 있다. 예를 들어, GFP 또는 나노-루시퍼라제와 같은 외인성 형광 마커는, 예를 들어 형광을 검출하거나 마커를 인식하는 항체를 사용하는 면역분석에 의해 검출될 수 있다.

실시예 27: 바큘로바이러스를 통한 Sf9 곤충 세포로의 탠덤 아넬로바이러스 게놈의 운반

본 실시예에서, Ring2 게놈의 탠덤 카피를 보유하는 바큘로바이러스를 제조하고 Sf9 세포로 운반하였다. 탠덤 Ring2 게놈을 상기 기재한 바와 같이 조립하였다. 유형 IIS 제한 부위를 추가하는 PCR을 통해 전장 Ring2 게놈을 증폭하고 이를 박테리아 복제 원점 및 선택 가능한 마커를 갖는 플라스미드 백본에 골든 게이트 조립을 통해 삽입하였다. 생성된 플라스미드는 5' 비-코딩 영역에서 GC-풍부 영역까지의 제1 게놈과, 이어서 5' 비-코딩 영역에서 GC-영역까지의 제2 게놈으로 배열된 2개의 완전한 Ring2 게놈을 개재 뉴클레오티드 없이 서로 다음에 포함하였다. 플라스미드 백본에서 AsiSI 및 PacI 제한 효소 부위가 게놈 쌍에 측접하였다.

탠덤 Rong2 게놈을 바큘로바이러스에 삽입하기 위해, 먼저 변형된 pFastBac을 조립하였다. 변형된 pFastBac에서 곤충-세포 프로모터를 제거하고, 프로모터 및 표준 다중 클로닝 부위를 AsiSI 및 PacI 부위를 함유하는 맞춤형 다중 클로닝 부위로 대체하였다. 탠덤 Ring2 게놈 작제물을 AsiSI 및 PacI에 의한 분해를 통해 pFastBac 플라스미드에 클로닝한 다음, 결찰을 수행하였다. 최종 pFastBac-TandemRing2 플라스미드는 Tn7L 재조합 서열, 탠덤 Ring2 게놈, 젠타마이신 내성 유전자, 및 Tn7R 재조합 서열을 포함한 다음, 박테리아 복제 원점 및 암피실린-내성 마커를 갖는 플라스미드 백본을 포함하였다(도 27h). 탠덤 Ring2 게놈의 포함을 서열결정 및 PCR 생성물 분석에 의해 확인하였다. pFastBac을 사용하여 탠덤 Ring2 게놈을 보유하는 박미드를 생성한 다음, 상기 기재된 바와 같이 바큘로바이러스를 생성하였다.

탠덤 Ring2 게놈을 보유하는 바큘로바이러스를 사용하여 MOI 1에서 Sf9 세포를 감염시켰다. 또한, 샘플을 Ring2 ORF1-발현 바큘로바이러스 단독으로 감염되거나 Ring2 탠덤 게놈 바큘로바이러스 및 Ring2 ORF1-발현 바큘로바이러스로 동시-감염된 Sf9 세포에 포함하였다. 3일 후, Sf9 세포를 원심분리에 의해 펠렛화하였다. Qiagen DNeasy 혈액 및 조직 키트를 사용하여 세포에서 전체 DNA를 수확하였다. 탠덤 Ring2 게놈에 바로 측접하는 바큘로바이러스 내에서 절단하는 Esp3I 제한 효소로 총 DNA 10 μg을 분해하였다(도 27i 참조). 분해된 DNA를 아가로스 겔에서 실행하였다. 그 다음 DNA를 화학적으로 변성시키고 탈퓨린화한 다음, 모세관 이동에 의해 양전하 나일론 막으로 옮겼다. DNA를 자외선에 의해 막에 가교시킨 다음, Ring2 게놈에 대해 설계된 비오틴-함유 프로브와 혼성화하였다. 프로브를 스트렙타비딘-IRDye800으로 검출하고, LiCor Odyssey 이미저에서 영상화하였다.

탠덤 Ring2 게놈 크기와 일치하는 밴드가 탠덤 Ring2 배큘로바이러스로 감염된 모든 샘플에서 관찰되었으며, 이는 Sf9 세포로 탠덤 Ring2 게놈의 성공적인 운반을 입증한다(도 27i). 또한, 바큘로바이러스로부터 단리된 Ring2 게놈의 단일 카피와 일치하는 밴드가 관찰되었으며, 이는 바큘로바이러스 생성 중에 일부 DNA 재조합이 발생하여 바큘로바이러스 집단의 일부에서 Ring2 게놈의 하나의 카피가 손실되었음을 나타낸다. 바큘로바이러스의 대략 50%는 탠덤 카피가 아닌 단일 카피 Ring2 게놈을 나타내었다. 환형 Ring2 게놈은 바큘로바이러스로부터 검출되지 않았다(MOLT-4 세포 내로 도입된 탠덤 Ring2 작제물과 대조적으로, 여기서 환형 단일-카피 dsDNA 게놈이 검출됨; 도 27i). 그러나, 이 재조합은 탠덤 게놈 카피의 SF9 세포로의 성공적인 운반을 억제하지 않았다.

실시예 28: 바큘로바이러스 발현 시스템에서 아넬로바이러스 단백질의 생성

본 실시예에서는, 아넬로바이러스 단백질의 발현을 위해 Thermofisher Scientific(카탈로그 번호 A38841)의 바큘로바이러스 발현 시스템을 조정하였다. 간략하게, 관심 유전자(예를 들어, 본 명세서에 기재된 바와 같은 아넬로바이러스 ORF를 인코딩하는 유전자)를 pFastBac 플라스미드 내로 클로닝한 다음, 바큘로바이러스 게놈을 보유하는 DH10Bac 이. 콜라이 세포 내로 형질전환시켰다. 제조업체의 지시에 따라 표시기 플레이트에서 형질전환체를 성장시키고 액체 배양 및 박미드 DNA 추출을 위해 백색 콜로니를 선택하였다. 박미드로의 아넬로바이러스 ORF의 재조합을 PCR로 검증하였다.

그 다음 아넬로바이러스 ORF 유전자의 성공적인 재조합을 나타내는 검증된 박미드 작제물을 ExpiSf9 곤충 세포 내로 형질감염시켰다. 125 rpm으로 설정한 오비탈 진탕기 상의 27℃, 비-가습, 비-CO₂ 분위기 인큐베이터에서 세포를 인큐베이션하였다. 형질감염 후 72시간 후, 상청액으로부터 계대 0 스톡(P0) 재조합 바큘로바이러스를 수확하였다.

25 내지 100 μL의 P0 바큘로바이러스 스톡을 사용하여 ExpiSf9 세포를 감염시켜 단백질 생성을 위한 계대 1(P1) 바큘로바이러스를 만들었다. 감염 후 96시간(대략 4일) 후, 상청액을 수집하여 P1 바큘로바이러스를 수득하였다.

총 부피 1200 μL의 신선한 ExpiSf CD 배지에서 테스트 바이러스의 10배 연속 희석액 5개를 제조함으로써 P1 재조합 바큘로바이러스의 역가를 측정하였다. 1.25 × 10⁶개 생존 세포/mL로 800 μL의 Expisf9 세포를 딥 웰 플레이트에 시딩하고 테스트 바이러스의 다양한 희석액 1000 μL를 각각의 웰에 첨가하였다. 하나의 웰을 음성 대조군으로 설정하였다. 그 다음 플레이트를 225 ± 5 rpm으로 진탕 플랫폼 상의 비-가습 인큐베이터에서 27℃에서 밤새 플레이트를 인큐베이션하였다. 대략 14 내지 16시간 인큐베이션 후, 플레이트를 인큐베이터에서 꺼내고, 모든 것을 마이크로원심분리기 튜브로 옮긴 다음 300 × g에서 5분 동안 회전시켰다. 상청액을 흡인하고 각각의 세포 펠렛을 0.15 μg/mL의 최종 농도로 항-바큘로바이러스 외피 gp64 APC 항체를 함유하는 100 μL의 희석 완충액(PBS + 2% 소태아혈청)에 재현탁하였다. 튜브를 실온에서 30분 동안 인큐베이션하였다. 그 다음 샘플을 1 mL PBS로 세척한 후, 300 × g에서 10분 동안 원심분리하였다. 상청액을 흡인하고 세포 펠렛을 1 mL 희석 완충액에 재현탁하였다. 다음 매개변수를 사용하여 유세포 분석기에서 샘플을 분석하였다: 적색 레이저 여기: 633 내지 647 nm; 방출: 660 nm. 양의 백분율로 gp64를 발현하는 상이한 바이러스 희석액을 갖는 샘플을 기록하고 바이러스 역가를 계산하는 데 사용하였다.

본 실시예 및 하기 실시예를 위해, 일련의 재조합 박미드 및 바큘로바이러스 벡터를 상기 기재된 방법을 사용하여 발현용으로 생성하였다. 하기 표 47에 나타낸 바와 같이, LY2, tth8 및 다른 아넬로바이러스 균주로부터의 다양한 ORF를 박미드로 클로닝하였다. ORF를 표시된 바와 같이, 인간 리노바이러스 3C(HRV 3C) 단백질 가수분해 절단 부위, C-말단 His-태그를 포함하거나 포함하지 않는 N-말단 His-태그로 태깅하거나, 태깅하지 않은 상태로 두었다.

[표 47] 생성된 재조합 박미드 작제물. "FullORF"= 비코딩 영역이 제거된 전체 ORF-함유 영역; ORF2/3 태깅됨

감염 전날, 125 ml Nalgene 일회용 PETG 삼각 플라스크[Thermofisher Scientific 카탈로그 번호: 4115-0125]의 25 ml의 실온 ExpiSf9 CD 배지에 5×10⁶개 세포/ml로 ExpiSf9 세포를 시딩하였다. 세포 생존율을 모니터링하여 세포 생존율이 95% 이상으로 유지되는지를 보장하였다. 100 μL의 ExpiSf Enhancer 용액을 적가 방식으로 세포에 첨가하였다. 125 ±5 rpm으로 오비탈 진탕기를 사용하여 27℃, 비-가습, 공기 조절, 비-CO₂ 분위기 인큐베이터에서 밤새 진탕하면서 세포를 인큐베이션하였다. 제1일, ExpiSf Enhancer를 첨가하고 대략 18 내지 24시간 후, 세포를 감염 다중도(MOI) 5에서 표시된 바큘로바이러스로 감염시키고 동일한 조건에서 인큐베이션하였다. 감염 72시간 후 세포를 수확하였고 생존율은 60 내지 80% 범위인 것으로 밝혀졌다. 샘플을 분석하기 위해, 1× Bolt LDS 샘플 버퍼[Invitrogen 카탈로그 번호: B0007] 및 1× Bolt 환원제[Invitrogen 카탈로그 번호: B0009]를 첨가하고 2.5분 동안 초음파 처리하여 세포를 용해시켰다. 도 28에 나타낸 바와 같이, C-His-태깅된 LY2 ORF1은 항-폴리-히스티딘 항체를 사용한 웨스턴 블롯팅에 의해 결정된 바와 같이 감염 후 2일째에 감염된 ExpiSf9 세포에서 성공적으로 발현되었다. 또한 쿠마씨 염색에 의해 바큘로바이러스 단백질을 검출하였으며, 이는 성공적인 감염을 나타내었다.

도 29에 나타낸 바와 같이, C-His-태깅된 tth8 ORF1 및 ORF1/1도 또한 감염 후 2일째에 감염된 ExpiSf9 세포에서 성공적으로 발현되었다.

N-말단 His-태깅된 LY2 ORF1 발현이 또한 감염된 ExpiSf9 세포에서 검출되었다(도 30). 여기서, 작제물은 야생형 ORF1 서열이 바로 뒤따르는 N-말단 His-태그(레인 1, 2, 9, 10 또는 14), 또는 리노바이러스 3C 절단 서열이 뒤따르는 N-말단 His-태그(레인 3, 11)를 포함하였다. 레인 1 내지 7의 샘플은 젤에 직접 로딩된 용해물인 반면, 레인 9 내지 15의 샘플은 초원심분리를 통해 조건화 배지로부터 단백질을 먼저 펠렛화하고 펠렛을 100배 더 작은 부피로 재현탁하여 준비되었다. 레인 1 내지 3 및 9 내지 11에 나타낸 샘플은 소규모(5 mL) 규모로 성장되었다. 레인 6과 14의 샘플은 10 L 배양에서 수득되었다. 따라서, 본 실시예는 N 또는 C 말단 폴리-히스티딘 태그를 갖는 복수의 균주로부터 ORF1의 생성이 5 mL 내지 10 L 범위의 규모에서 성공적으로 수행될 수 있고, ORF1이 Sf9 용해물 또는 배양 상청액(조건화 배지)에서 발견될 수 있음을 나타낸다.

실시예 29: Sf9 세포에서 Ring1 ORF의 발현

본 실시예에서는, 각각 C-말단 폴리-히스티딘이 태깅된 Ring1 ORF의 교대 배열로 일련의 재조합 바큘로바이러스를 생성하였다(도 31). 재조합 바큘로바이러스 설계는 Ring1 ORF 스플라이스 변이체(즉, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, 및 ORF2/3) 각각에 대한 하나의 바큘로바이러스 작제물뿐만 아니라, 바큘로바이러스 다면체 프로모터에 의해 만들어지는 Ring1 유래의 전체 ORF 영역을 함유하는 "FullORF" 작제물을 포함하였다. 이러한 바큘로바이러스를 실시예 28에 기재된 바와 같이 생성하였다.

그 다음 항-폴리-히스티딘 항체를 사용한 웨스턴 블롯에 의해 단백질 발현을 검출하였다. 도 31에 나타낸 바와 같이, His-태깅된 Ring1 ORF인 ORF1/1, ORF1/2, ORF2, ORF2/2 및 ORF2/3을 검출하였다.

실시예 30: Sf9 세포에서 Ring2 ORF의 발현

일 예에서, 각각 C 말단에 폴리-히스티딘이 태깅된 Ring2 ORF의 교대 배열로 일련의 재조합 바큘로바이러스를 생성하였다(도 32). 재조합 바큘로바이러스 설계는, N-말단 아르기닌-풍부 영역(RRR)이 결실된(ORF1△RRR) Ring2 ORF 스플라이스 변이체(즉, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, 및 ORF2/3) 각각에 대한 하나의 바큘로바이러스 작제물뿐만 아니라, 바큘로바이러스 다면체 프로모터에 의해 만들어지는 Ring2 유래의 전체 ORF 영역을 함유하는 "FullORF" 작제물을 포함하였다. 각각의 실험 조건에 대해, ExpiSf9 세포를 MOI 5에서 개별 Ring2 변이체를 발현하는 재조합 바큘로바이러스로 감염시켰다. 이에 대한 실험 조건은 실시예 28 및 29에 기재된 바와 같았다.

그 다음 항-His을 사용한 웨스턴 블롯에 의해 단백질 발현을 검출하였다. 도 32에 나타낸 바와 같이, His-태깅된 Ring2 ORF인 ORF1, ORF1DRRR, ORF1/1, ORF1/2, ORF2, ORF2/2, 및 ORF2/3을 모두 검출하였다.

본 실시예의 일부로서 추가 실험에서, Ring2 ORF1-인코딩 서열 및/또는 Ring2 ORF2 스플라이스 변이체-인코딩 서열을 포함하는 재조합 바큘로바이러스를 사용하여 Sf9 세포를 감염시켰다. 테스트된 발현 조건은 ORF1 단독, 또는 ORF1 + "FullORF", ORF1 + ORF2, ORF1 + ORF2/2, 및 ORF1 + ORF2/3의 동시-감염뿐만 아니라, 'Neg'로 표지된 음성 대조군을 포함하였다. ExpiSf9 세포를 각각의 조건에 대해 MOI 5에서 바큘로바이러스로 동시-감염시켰다. 실험 조건은 실시예 28 및 29에 기재된 바와 같았다. 그 다음 항-His 또는 항-Ring2 N22를 사용한 웨스턴 블롯에 의해 각각의 조건에 대해 ORF1, ORF2, ORF2/2, 및 ORF2/3의 단백질 발현을 평가하였다. 후자는 이. 콜라이에서 생성된 Ring2 ORF1의 N22 단편으로 마우스를 면역화시킨 다음, 하이브리도마를 생성함으로써 수득한 모노클로날 항체이다.

도 33에 나타낸 바와 같이, 두 웨스턴 모두 ORF1-감염 조건 각각에서 약 81 kD에서의 밴드로서 ORF1을 검출하였다. ORF1 밴드는 항-N22 웨스턴에서 파선 상자로 강조 표시되어 있으며 음성 대조군(Neg) 샘플에서는 보이지 않는다. 두 항체에 의해 검출된 저분자량(약 10 kD) 밴드는 ORF1의 C-말단 단편인 것으로 생각된다. ORF2, ORF2/2, 및 ORF2/3도 또한 해당 샘플에서 검출되었다(항-His 블롯). 따라서, 본 실시예는 ORF1 및 ORF2의 개별 스플라이스 변이체 모두가 곤충 세포에서 공동-발현될 수 있음을 예시한다.

실시예 31: Sf9 세포에서 동시에 모든 Ring2 ORF의 발현

일 예에서, 일련의 6개의 재조합 바큘로바이러스를 생성하였으며, 각각은 특정 Ring2 ORF(즉, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, 및 ORF2/3)를 발현하도록 설계되었고, 각각은 실시예 30에 기재된 바와 같은 His 태그로 태깅되었다(도 34). Sf9 세포를 Ring2 ORF 바큘로바이러스의 다양한 조합으로 감염시켰으며, 구체적으로 각각의 조건은 도 34에 나타낸 바와 같이, 하나의 ORF 작제물을 제외한 전부로 세포를 감염시키는 것을 포함하였다. 그 다음 항-His을 사용하여 전체 세포 현탁액의 웨스턴 블롯에 의해 단백질 발현을 검출하였다. 도 34에 나타낸 바와 같이, His-태깅된 Ring2 ORF를 예상된 패턴으로 검출하였다. 모든 ORF, 또는 생략된 하나를 제외한 전부를 검출하였다.

실시예 32: Sf9 세포에서 아넬로바이러스 게놈 및 재조합 아넬로바이러스 ORF의 동시-운반 및 독립적 발현

본 실시예에서, 시험관 내 환화(IVC) 아넬로바이러스 게놈을 형질감염시키고 헥사-히스티딘으로 C-말단에서 태깅된 ORF1을 인코딩하는 바큘로바이러스로 세포를 감염시킴으로써 Sf9 세포에서 아넬로바이러스 ORF 및 게놈을 동시-운반하였다(도 35). 그 다음 N22 단편을 표적화하는 항-His, 항-ORF2, 및 항-ORF1 모노클로날 항체를 사용하여 웨스턴 블롯에 의해 단백질 발현을 검출하였다. 나타낸 바와 같이(도 35, 글머리 기호 1), 바큘로바이러스 벡터로부터의 성공적인 재조합 ORF1 발현을 나타내는 His-태깅된 ORF1을 이 제제에서 검출하였다. 이 결과와 일치하게, 동일한 ORF1 단백질을 항-ORF1 항체를 사용하여 검출하였다(도 35, 하단 패널, 가장 우측 레인).

처리된 세포의 동일한 샘플에서, ORF2 발현이 검출되었고(도 35, 글머리 기호 3) 세포에 형질감염된 IVC 게놈에 의해서만 생성될 수 있었기 때문에, 천연 아넬로바이러스 프로모터는 Sf9 세포에서 전사적으로 활성인 것으로 나타났다.

또한, 시험관 내 환화(IVC) 작제물 및 FullORF 바큘로바이러스를 사용하여 Sf9 세포에서 아넬로바이러스 ORF를 동시-운반 및 발현시켰다. 그 다음 항-His, 항-Ring2 ORF2, 및 항-Ring2 ORF1 N22를 사용한 웨스턴 블롯에 의해 단백질 발현을 검출하였다. ORF1 단백질을 세포에서 검출하였으며(도 35, 글머리 기호 4), 이는 IVC 또는 FullORF 바큘로바이러스 작제물의 산물일 수 있다. 놀랍게도, ORF2 단백질은 쉽게 검출되었으며, 이의 강도는 발현이 FullORF 바큘로바이러스 작제물로부터 유래되었음을 시사한다(도 35, 글머리 기호 2).

곤충 세포에서 유전자를 발현하는 아넬로바이러스 게놈의 능력에 대한 추가 테스트로서, tth8 아넬로바이러스 코딩 영역을 두 방향 모두에서 pFastBac 벡터에 클로닝하였다. 이는 다면체 프로모터가 코딩 영역의 센스 또는 안티센스 방향의 상류에 위치하는 'FullORF' tth8 바큘로바이러스 작제물을 산출하였다. 후자의 구성은 아넬로바이러스 유전자의 전사를 개시할 가능성이 매우 낮다. Ring2에서 본 발명자들의 놀라운 관찰과 일관되게, tth8 ORF2의 발현은 바큘로바이러스 다면체 프로모터에 대한 코딩 영역의 배향과 무관하였으며, 이는 발현이 아넬로바이러스 프로모터에 의해 유도됨을 시사한다(도 36, 약 15 및 20 kDa에서의 밴드).

본 실시예는 IVC 형질감염 및 바큘로바이러스 감염이 기능성 아넬로바이러스 유전자를 Sf9 곤충 세포로 동시-운반할 수 있고 천연 아넬로바이러스 프로모터가 이들 세포에서 활성임을 나타낸다.

실시예 33: 아넬로바이러스 ORF1은 Sf9 세포에서 DNA와 회합하여 등밀도 원심분리에 의해 단리된 복합체를 형성한다

본 실시예에서, Sf9 세포를 IVC 아넬로바이러스 게놈 LY2로 형질감염시키고, C-말단 폴리-히스티딘 태그가 있는 LY2 ORF1을 인코딩하는 바큘로바이러스로 감염시킨 다음, 분획화하여 바큘로바이러스 발현 시스템을 사용하여 발현된 ORF1이 시험관 내에서 단리될 수 있는 단백질-DNA 복합체를 형성하는지 여부를 결정하였다.

SW32.1 Ti 로터용 초원심분리기 튜브(Ultra-Clear 17 ml - Beckman #344061)에 8 ml의 1.2 g/ml CsCl 용액(TN 완충액 중; 20 mM Tris pH 8.0, 140 mM NaCl)을 첨가하여 CsCl 구배를 준비하였다. 튜브의 하단에 8 ml의 40% CsCl(TN 완충액 중)을 넣은 다음, 토퍼로 캡핑하고 13분 동안 Gradient Master 프로그램에서 5 내지 50%로 실행하여 선형 구배를 준비하였다. 캡을 제거하고 구배를 각각의 튜브에 0.5 ml 내지 2 ml의 Sf9 용해물로 덮어씌우고, 0.001% 폴록사머-188을 함유하는 TN 완충액으로 거의 상단까지 채웠다. 22,500 × RPM으로 18.5시간 동안 초원심분리를 하였다. 튜브의 바닥을 뚫고 약 600 ul 분획이 딥 웰 블록의 웰로 흐르도록 하여 구배에서 분획을 수집하였다. 각각의 샘플의 굴절률을 측정하여 밀도를 결정하였다.

그 다음 먼저 분획에서 DNA를 추출한 다음, qPCR을 수행함으로써 분획의 아넬로바이러스 DNA 함량을 결정하였다. Pure Link Viral DNA 추출 키트[Thermofisher Scientific 카탈로그 번호 12280050]를 사용하여 50 uL의 분획에서 바이러스 DNA를 정제하였다. 샘플을 프로테이나제 K로 처리하고 56℃에서 15분 동안 인큐베이션하여 용해 버퍼를 사용하여 용해하고, 99% 에탄올로 세척한 다음, 바이러스 회전 컬럼으로 옮겼다. 샘플을 6800 × g에서 원심분리하고, 키트와 함께 제공된 500 uL 세척 완충액으로 2회 세척한 다음, 다시 원심분리하였다. 100 uL의 RNase-무함유 물을 컬럼에 첨가하여 DNA를 용출시켰다.

qPCR의 경우, 100 uM LY2 프로브(TCTACCTAGGTGCAAAGGGCC)와 함께 2× TaqMan 유전자 발현 마스터 믹스, 100 uM LY2 정방향 프라이머(AGCAACAGGTAATGGAGGAC), 100 uM LY2 역방향 프라이머(TGAAGCTGGGGTCTTTAAC)를 각각의 반응에 대해 5.83 uL 뉴클레아제 무함유 물에 희석하였다. 각각의 qPCR 주기에 다음 조건을 사용하였다: Applied Biosystems Quant Studio 3 실시간 PCR 기계에서 50℃에서 2분 동안 유지하고, 95℃에서 10분 동안 유지한 다음, 95℃에서 15초 및 60℃에서 1분을 40 주기. 각각의 샘플을 3회 실행하고 전체 분석을 3회 반복하여 그래프를 플롯팅하는 데 사용하였다.

도 37에 나타낸 바와 같이, 등밀도 분획은 웨스턴 블롯팅, 정량적 PCR, 및 투과 전자 현미경으로 특징지어졌다. 구배 분획의 항-His 웨스턴 블롯팅은 1.32 g/mL 및 1.21 g/mL의 밀도를 갖는 분획에서 LY2 ORF1에 대한 예상 분자량의 명확한 밴드를 나타내다. 또한 1.25 내지 1.29 g/mL 범위의 분획은 예상보다 분자량이 높거나 낮은 명확한 밴드를 가졌다. 또한, qPCR은 특정 분획에서 대략 1.21 g/mL, 1.29g/mL, 및 1.32g/mL에서 피크가 있는 LY2 게놈 DNA의 존재를 나타낸다.

1.32 g/mL 및 1.21 g/mL 분획뿐만 아니라 1.25 내지 1.29 g/mL 범위의 분획 풀에서 음성 염색 투과 전자 현미경 검사를 수행하였다. 풀은 프로테아좀의 외관을 갖는 여러 입자를 포함하여, 풍부한 입자를 나타낸다. 프로테아좀의 존재는 저분자량 및 고분자량에서 웨스턴 블롯 밴드를 설명할 수 있다. 전자는 단백질 가수분해로 인한 것일 수 있고 후자는 유비퀴틴화된 ORF1, 또는 분해 과정에서 프로테아좀 단백질과 공유 회합된 ORF1 단편으로 인한 것일 수 있다. 1.21 g/mL 분획은 지질-기반 입자와 일치하는 것으로 보이는 여러 입자를 포함하여, 다양한 크기의 입자를 나타낸다. 1.32 g/mL 분획은 네이키드 DNA와 상이하게 염색되는 현저한 DNA-유사 구조를 나타내며, 이는 단백질과 같은 거대분자와의 회합을 시사한다.

LY2 ORF1이 전자 현미경 사진에서 관찰된 구조와 연관되어 있는지 결정하기 위해, 항-폴리-히스티딘 항체를 사용한 면역골드 검출을 수행하였다. 도 38은 1.32 및 1.21 g/mL 분획에서 관찰된 구조 상에 축적되는 골드 라벨을 나타내며, 이는 1.32 g/mL 분획에서 관찰된 DNA와 회합된 ORF1-His, 및 1.21 g/mL 분획에서 관찰된 입자의 존재와 일치한다.

종합하면, 이들 결과는 Sf9 세포에서 발현된 ORF1이 DNA와 회합하여 아넬로바이러스 입자와 일치하는 밀도를 갖는 복합체를 형성할 수 있음을 나타낸다.

실시예 34: 바큘로바이러스를 사용한 다양한 아넬로바이러스 어레이로부터의 ORF1 단백질의 발현

본 실시예에서, 아넬로바이러스 균주 Ring3.1, Ring4, Ring5.2, Ring6뿐만 아니라, Ring1 및 Ring2 유래의 C-말단 His-태깅된 ORF1 단백질을 발현하도록 엔지니어링된 바큘로바이러스로 Sf9 세포를 감염시켰다. 도 39에 나타낸 바와 같이, 각각의 아넬로바이러스 균주로부터 기원한 ORF1 단백질은 Sf9 세포에서 성공적으로 발현되었다. 표 Y에 나타낸 바와 같이, 3개의 모든 속(알파토르크바이러스, 베타토르크바이러스, 및 감마토르크바이러스)를 나타내는 균주 유래의 아넬로바이러스 ORF1을 테스트하였으며, 이들의 발현 수준은 도 28, 29, 30, 및 39에서 볼 수 있다. 대체적으로, 본 발명자들은 이 시스템의 발현 수준이 베타토르크바이러스 유래의 ORF1에 대해 가장 높고, 감마토르크바이러스 유래의 ORF1에 대해 중간이며, 알파토르크바이러스 유래의 ORF1에 대해 가장 낮음을 발견하였다.

[표 Y] 재조합 ORF1 발현이 성공한 균주

실시예 35: 바큘로바이러스 작제물의 시험관 내 조립

본 실시예에서, 아넬로바이러스 단백질(예를 들어, ORF1)의 발현에 적합한 바큘로바이러스 작제물을 시험관 내 조립에 의해 생성한다.

태깅되지 않거나 N-말단, C-말단에 융합된 태그를 함유하거나, ORF1 단백질 자체 내에 돌연변이를 보유하여 면역염색 분석(예컨대, ELISA 또는 웨스턴 블롯(이에 제한되지 않음))을 통한 아이덴티티 결정 및/또는 정제에 도움이 되는 태그를 도입할 수 있는 아넬로바이러스 ORF1(야생형 단백질, 키메라 단백질 또는 이의 단편)을 인코딩하는 DNA를 곤충 세포주(Sf9 및/또는 HighFive)에서 발현시킨다. 아넬로바이러스 ORF1을 단독으로 또는 아넬로바이러스 ORF2 및/또는 ORF3 단백질을 포함하지만 이에 제한되지 않는 임의의 수의 헬퍼 단백질과 함께 발현시킬 수 있다.

잠재적으로 킬레이트 정제, 헤파린 정제, 구배 침강 정제 및/또는 크기 배제 정제를 포함하지만 이에 제한되지 않는 개발된 정제 기법을 사용하여 단백질을 정제한다. ORF1을 캡소머 또는 VLP를 형성하는 능력에 대해 평가하고 핵산 캡슐화를 위한 후속 단계에서 사용한다.

일 예에서, N-말단 HIS₆-태그(HIS-ORF1)에 융합된 Ring2 ORF1을 인코딩하는 DNA를 곤충 발현에 대해 코돈 최적화하고 바큘로바이러스 발현 벡터 pFASTbac 시스템으로 클로닝하여 제조업체의 방법(ThermoFisher Scientific)에 따른 Bac-to-BAC 발현 시스템을 사용하여 Ring2 ORF-HIS 재조합 단백질을 발현하는 바큘로바이러스를 생성하였다. Ring2 HIS-ORF1 바큘로바이러스로 10 리터의 곤충 세포(Sf9)를 감염시키고 감염 후 3일 후에 원심분리에 의해 세포를 수확하였다. 세포를 용해시키고, 현장에서 표준 기술을 사용하는 킬레이트 수지 컬럼을 사용하여 용해물을 정제하였다. HIS-ORF1을 함유하는 용출 분획을 투석하고 DNAse로 처리하여 숙주 세포 DNA를 분해하였다. HIS-ORF1을 함유하는 용출 분획을 투석하고 DNAse로 처리하여 숙주 세포 DNA를 분해시켰다. 생성된 물질을 킬레이트 수지 컬럼을 사용하여 다시 정제하고 ORF1을 함유하는 분획을 핵산 캡슐화 및 바이러스 벡터 정제를 위해 보유하였다.

핵산 캡슐화 및 바이러스 벡터 정제: Ring ORF1(야생형 단백질, 키메라 단백질 또는 이의 단편)을 VLP 또는 바이러스 캡시드를 해리하기에 충분한 조건으로 처리하여 핵산 카고와 재조립할 수 있다. 핵산 카고는 치료제로 운반하기를 원하는 관심 유전자를 인코딩하는 이중 가닥 DNA, 단일 가닥 DNA, 또는 RNA로 정의될 수 있다. VLP 또는 바이러스 캡시드를 분리하기에 충분한 잠재적인 조건은, 상이한 pH의 완충제, 정의된 전도도(염 함량)의 조건, 세제(예컨대, SDS, Tween, Triton)를 함유하는 조건, 카오트로픽제(예컨대, 우레아)를 함유하는 조건 또는 정의된 온도 및 시간(재어닐링 온도)을 포함하는 조건일 수 있지만 이에 제한되지 않는다. 정의된 농도의 핵산 카고를 정의된 농도의 Ring ORF1과 결합시키고 핵산 캡슐화를 허용하기에 충분한 조건으로 처리한다. 바이러스 벡터로 정의된 생성된 입자를, 예를 들어 개발된 표준 바이러스 정제 절차를 사용하여 후속적으로 정제한다.

일 예에서, GFP-발현 플라스미드의 단일 가닥 환형 DNA를 Ring 2 HIS-ORF1의 용액에 첨가하고 생성된 샘플을 37C에서 30분 동안 50 mM Tris pH 8 완충액 중 0.1% SDS로 처리한다. 생성된 용액을 헤파린 컬럼을 사용하여 추가로 정제하고 NaCl 농도를 증가시키는 구배를 사용하여 컬럼으로부터 바이러스 벡터를 용출시킨다. 바이러스 벡터의 무결성은 세포주 EKVX 및 HEK293을 형질도입하고, 형광 현미경으로 세포주 중 적어도 하나에서 GFP 생성을 관찰함으로써 테스트하며, 이는 ORF1 단백질에 의해 핵산 카고를 캡슐화하여 바이러스 벡터를 형성함을 입증한다.

실시예 36: 아넬로바이러스 게놈 데이터세트의 생성

본 연구에서 수혈 공여자-수용자 쌍의 심층 서열결정을 신규 아넬로바이러스 게놈의 대규모 조립을 위한 공개 게놈 자원과 결합하여 시간에 따른 전 세계 및 개인 아넬로바이러스 다양성을 특성화하였다. 인간 샘플에서 직접 아넬로바이러스의 대규모 프로파일링을 가능하게 하는 표적화 아넬로바이러스 서열결정 방법을 개발하였으며, 이를 공여자-수용자 쌍으로 이루어진 수혈 코호트에서 장기 샘플을 연구하는 데 사용하였다. 대규모 서열 데이터 세트를 조립하고 개체 내 및 개체 간 아넬롬의 동역학 및 전염성에 대해 조사하였다. 결과는 아넬롬(대상체 또는 모집단에 존재하는 아넬로바이러스 균주 또는 변이체 세트, 및/또는 이의 이러한 아넬로바이러스 균주 또는 변이체의 상대적 양을 지칭하기 위해 본 명세서에서 사용됨)이 이전에 이해된 것보다 더 많고 개체는 적어도 몇 개월 동안 지속될 수 있는 수많은 특유의 아넬롬을 보유하고 전염시키는 것을 나타내었다. 또한, 아넬로바이러스의 다양성은 광범위한 재조합과 관련이 있는 것으로 나타났다.

간략하게, 국립 심장, 폐 및 혈액 연구소(National Heart, Lung & Blood Institute's; NHLBI)의 장기 수혈-전염 바이러스 연구(Transfusion-transmitted Viruses Study; TTVS)로부터의 혈액 및 혈청 샘플을 스크리닝하여 새로운 아넬로바이러스 서열을 확인하였다. 혈청 샘플을 TTVS(수탁번호 HLB01910909a)로부터 수득하였다. Invitrogen의 퓨어링크(purelink) 바이러스 DNA/RNA 키트를 사용하여 200 μl의 혈청에서 핵산을 추출하였다. 제조업체의 프로토콜에 따라 프로테이나제 K 인큐베이션을 위해 60분으로 증가시켜 샘플을 처리하였다. 뉴클레아제 무함유 물 50 ul에서 샘플을 용출시켰다.

TTVS 코호트의 각각의 대상체에서 확인된 아넬로바이러스 게놈 서열의 수율을 증가시키기 위해 아넬로바이러스 게놈 서열을 특이적으로 표적화하는 증폭 방법을 개발하고 이용하였다. 결과적으로, 방법은 수십 내지 수백의 신규 아넬로바이러스 계통을 찾을 수 있었다. 증폭 방법은 아넬로바이러스 게놈의 보존된 영역을 포괄하는 축퇴 증폭 프라이머를 이용하는 다중-프라이밍 회전환 증폭을 이용하였다. pubmed 및 metagenomic 데이터베이스에 게시된 게놈에서 생성된 아넬로비리대(Anelloviridae) 게놈의 정렬에 기반하여 잘 보존된 영역을 포괄하도록 축퇴 증폭 프라이머를 설계하였다(하기 표 1 참조). 프라이머는 3'에서 마지막 3개의 뉴클레오티드 각각 사이에 2개의 티오포스페이트 변형에 의해 보호되었다. 표적화된 회전환 증폭 방법은 각각 0.4 μM의 최종 농도, 1× phi29 DNA 중합효소 완충액(NEB), 2 μl DNA 샘플, 및 dH₂0에서 표 1에 나타낸 12개의 서열에 따른 아넬로-특이적 프라이머의 프리믹스를 10 μl의 최종 부피로 함유하였다. 그 다음 DNA 혼합물을 95℃에서 3분 동안 변성시키고 4℃까지 냉각시킨 후, 얼음 위에 두었다. 그 다음 변성된 샘플을 최종 농도가 각각 0.4 μM인 아넬로 특이적 프라이머, 1× phi29 DNA 중합효소 완충액(NEB), 200 ng/μl 소 알부민 혈청, 1 mM dNTP, 및 2 U/μl phi29 중합효소, 및 최종 농도 10 μl의 dH₂0를 함유한 10 μl의 증폭 용액에 첨가하였다. 샘플을 30℃에서 20시간 동안 인큐베이션한 다음, 65℃에서 10분 동안 효소를 비활성화시켰다. 그 다음 샘플의 점도를 감소시키기 위해 뉴클레아제 무함유 물을 첨가하여 최종 생성물을 50 μl로 희석하고 Qubit에서 DNA 농도를 평가하였다. Nextera Flex(Illumina ect) 키트를 사용하여 100 내지 500 ng 유입에 대해 제조업체 프로토콜에 따라 서열결정을 위한 샘플을 준비하였다. Agilent Tapestation 4200에서 D5000 스크린 테이프를 사용하여 라이브러리 QC를 수행하였다.

[표 1] 예시적인 아넬로바이러스-특이적 축퇴 프라이머

illumina iSeq 100 또는 NextSeq 550에서 모든 라이브러리의 서열을 결정하였다. 원시 서열결정 판독물에서 아넬로바이러스 함량에 대한 초기 판독물을 맞춤형 사내 구축 아넬로바이러스 데이터베이스에 대한 디폴트 매개변수를 사용하여 크라켄(kraken)(Wood and Salzberg, 2014)을 사용하여 생성하였다. 이러한 결과로 분류된 서열을 디폴트 매개변수를 사용하여 NCBI의 BLASTn(Camacho et al., 2009)을 사용하여 추가로 검증하여 크라켄의 출력이 유효한 아넬로바이러스 서열임을 확인하였다. 각각의 서열결정 실행과 관련하여 다양한 통계를 측정하기 위해 설정된 각각의 쌍형성된 말단 판독물(paired-end read)에서 FastQC(Andrews, n.d.)를 이용하여 원시 시퀀싱 판독물에 대해 품질 관리를 수행하였다. 각각의 FastQC 생성 보고서를 MultiQC를 사용하여 단일 보고서로 집계하였다(Ewels et al., 2016). 이들 보고서로부터의 측정 기준은 분석 중 더 하류인 품질 관리 단계에 대한 매개변수 선택에 영향을 미쳤다.

하기 매개변수와 함께 bbduk(Bushnell, 2014)을 사용하여 낮은 품질의 서열 데이터 및 공통 어댑터를 제거하였다: ktrim=r, k=23, mink=11, tpe=t, tbo=t, qtrim=rl, trimq=20, minlength=50, maxns=2. 제거할 인간 유전 요소뿐만 아니라 여러 박테리아 종을 포괄하는 표적 오염물 서열을 NCBI Genbank로부터 가져와 공급된 오염물 파일을 조립하였다. 특정 서열을 함유하는 취득 목록은 보충 데이터에 제공되어 있다.

다음으로, 인간 기준 게놈의 GRCh37/hg19 구축물에 대해 NextGenMap(Sedlazeck et al., 2013) 및 BWA(Li, 2013) 둘 다를 사용하여 인간 서열을 두 번 통과하여 제거하였다. NextGenMap은 매개변수 --affine, -s 0.7, -p를 이용하여 실행하고 BWA는 디폴트 매개변수를 이용하여 실행하였다. SAM 파일 형식의 맵핑된 판독물 출력을 매개변수 VALIDATION_STRINGENCY="silent"로 구성된 SAMtools(Li et al., 2009) 및 Picard's(Broad Institute, 2018) SamToFastq 유틸리티를 사용하여 쌍형성된 말단 FASTQ 형식으로 전환하였다. rRNA 오염물 및 일반 실험실 박테리아 오염물을 하기 매개변수로 bbmap(Bushnell, 2014)을 사용하여 제거하였다: minid=0.95, bwr=0.16, bw=12, quickmatch=t, fast=t, minhits=2. 스크리닝된 모든 기준 서열에 대한 설명은 제공된 보충 데이터에서 확인할 수 있다. 마지막으로, 본 발명자들은 매개변수 dedupe=t로 구성된 clumpify(Bushnell, 2014)를 사용하여 속도를 높이고 게놈 조립 품질을 지원하기 위해 모든 QC 및 오염제거 단계를 통과하는 짧은 판독 데이터의 중복을 제거하였다.

--only-assembler 매개변수의 사용을 통해 오류 수정 모듈을 건너뛰는 metaSPAdes(Nurk et al., 2017)를 사용하여 트리밍, 오염제거 및 중복제거된 서열결정 데이터를 조립하였다. 매개변수 out_format 1, -lc_method dust 및 lc_threshold 20으로 구성된 PRINSEQ lite(Schmieder and Edwards, 2011)를 사용하여 조립된 콘티그를 필터링하였다. 각각의 샘플로부터 조립된 콘티그를 99.5%의 유사성으로 클러스터링하여 usearch 소프트웨어의 cluster_fast 알고리즘(Edgar, 2010)을 사용하여 임의의 중복 서열을 제거하였다.

ORF 서열은 정지 코돈(-p)을 인쇄하고 ORF를 정지 코돈(-s)과 동일한 프레임에서 ORF를 인쇄하도록 구성된 매개변수와 함께 orfm(Woodcroft et al., 2016)을 사용하여 조립된 콘티그에서 호출되었으며 50개의 아미노산(-m 150)보다 짧지 않은 ORF 서열로 제한되었다. seqkit's seq 및 grep 유틸리티(Shen et al., 2016)를 사용하여 예측된 ORF 서열을 추가로 필터링하여 ORF 서열을 ORF1, ORF2 및 ORF3으로 세분하였다. 600개 아미노산(-m 600)보다 짧지 않은 것에 대해 seqkit grep을 사용하여 ORF 서열을 필터링하고, seqkit grep을 사용하여 단지 서열 데이터(-s)만 검색하고, 정규표현식 패턴 검색(-r)을 가능하게 하며, 보존된 모티프 YNPX ² DXGX ² N(-p "YNP.{2}D.G.{2}")에 대해 질의함으로써 ORF1 서열을 확인하였다. seqkit's grep 유틸리티(-p “{7}H.{3}C.C.{5}H”)를 통해 문헌(Takahashi et al., 2000)에서 이전에 확인된 보존된 모티프 WX ⁷ HX ³ CXCX ⁵ H를 사용하여 ORF2 서열을 확인하였다. ORF1 및 ORF2에 추가로, TTVS 데이터세트의 471개 아넬로바이러스 게놈에서 ORF1의 3' 말단 근처에서 제3 오픈-리딩 프레임(ORF3)을 예측하였다. ORF3은 ORF1에 의해 사용되는 것의 하류에 있는 정지 코돈을 사용하며 이의 리딩 프레임은 ORF1 및 ORF2의 것과 상이하다. ORF2/3으로 표지된 ORF3 리딩 프레임의 단백질은 이전에 인간 아넬로바이러스에서 특성화되었으며(Qiu et al., 2005), 물개, 고양이 및 고릴라와 같은 다른 종을 감염시키는 아넬로바이러스에 대한 연구(Hrazdilova et al., 2016)(Fahsbender et al. 2017; Zhang et al. 2016; Hrazdilova et al. 2016)는 ORF3에 대한 증거를 나타내었다. MEME(Bailey et al. 1994)를 통해 471개의 ORF3 서열(중간 길이: 68aa, 최소 길이: 50aa, 최대 길이: 159aa)을 분석한 결과, ORF3의 3' 말단 근처에 위치한 두 개의 이전에 알려지지 않은 고도로 보존된 모티프가 존재한다는 것이 밝혀졌다. 모티프 1(26aa)은 471개 서열 중 467개(99%)에서 관찰된 반면, 모티프 2(5aa)는 471개 서열 중 463개(98%)에서 관찰되었다(도 42b). ORF1, ORF2 또는 ORF3으로 확인된 ORF 서열은 종종 orfm의 기능성에 따라 표준 시작 코돈의 상류에 펩티드를 함유하였다. 이 서열은 5' 말단에 위치한 첫 번째 메티오닌을 검색하는 내부 작성 파이썬 스크립트를 통해 적절한 시작 및 정지 코돈으로 트리밍되었으며, ORF1의 경우 시작 코돈은 먼저 아르기닌-풍부 영역에 위치하고 상류의 첫 번째 메티오닌에 위치함으로써 예측되었다. 일부 경우에, 아르기닌-풍부 영역의 바로 상류에 있는 아미노산 트레오닌-프롤린-트립토판 또는 트레오닌-알라닌-트립토판을 검색함으로써 ORF1 시작 코돈으로서 비-정규 시작 코돈이 예측되었다.

ORF1 서열을 97.5%의 유사성으로 클러스터링하여 usearch 소프트웨어(Edgar, 2010) 및 cluster_fast 알고리즘을 사용함으로써 각각의 공여자 샘플에 걸쳐 존재하는 특유한 계통 세트를 확인함으로써 공여자-수용자 데이터 세트에 대한 각각의 샘플/장기에 걸친 시점에서 개별 아넬로바이러스 계통의 비율 추정을 추정하였다. 그 다음 하기 매개변수와 함께 Novoalign 소프트웨어(Novocraft, n.d.)를 사용하여 파생된 짧은 판독 서열결정 데이터를 맵핑함으로써 수용자 장기 샘플에서 이러한 특유의 공여자-유래 아넬로바이러스 계통을 검색하였다: -H 15, -l 30, -t 500, -r Random, -g 50, -x 6, -F STDFQ.

생성된 BAM 맵핑 파일을 사용하여 하기 공식을 사용하여 사용자지정 스크립트에 의해 각각의 공여자 계통에 대한 상대적인 아넬로바이러스 비율 추정치를 계산하였다:

각각의 공여자 - 수용자 데이터세트의 모든 공여자 계통의 상대 비율을 추가 하류 분석을 위해 하나의 탭으로 구분된 파일로 함께 수집하였다.

ggplot2(Wickham, 2016, p. 2) 및 ggTimeSeries 패키지를 사용하여 R(R Core Team, 2013)을 이용하여 대상체에서 시간 경과에 따른 아넬로바이러스 비율 변화를 도시하는 스팀 그래프 수치를 생성하였다

10 μl 반응 부피로 MeltDoctor HRM 마스터믹스(Applied Biosystems, Thermo)를 사용하여 QuantStudio 3.0 열 순환기(Applied Biosystems, Thermo)에서 고해상도 곡선 분석을 수행하였다. 모든 시편을 3중으로 테스트하고 고해상도 용융 v3.1 소프트웨어 및 제조업체에 따라 제공된 HRM 알고리즘을 사용하여 용융 프로파일을 분석하였다. 고해상도 용융을 수행하기 전에 수용자 및 공여자(95% 초과의 쌍별 동일성)에서 균주의 ORF1 영역을 클로닝하고 생어 서열결정을 하였다. 샘플에서 상이한 대립유전자의 특성화를 이의 용융 곡선에 기반하여 결정하였다.

새로운 아넬로바이러스 서열 발견 방법을 검증하기 위해, 표준 회전원 증폭(RCA) 방법(Niel et al., 2005)과 본 명세서에 기재된 새로운 발견 방법 사이의 아넬로바이러스 게놈 서열 수율의 차이를 측정하였다. 표준 RCA와 비교하여, 새로운 발견 방법은 본 발명자들의 TTVS 코호트의 혈청 샘플로부터 측정된 아넬로바이러스 커버리지의 1,046 내지 52,812배 증가를 야기하였다(표 2).

[표 2] 신규 발견 방법의 벤치마크

각각의 시점에서 아넬로바이러스 계통의 수를 정량화하고 각각의 대상체에서 발견된 다양성을 측정하기 위해 장기에 걸친 샘플에서 아넬로바이러스 존재를 결정하였다. 새로운 발견 방법은 67명의 개인으로부터의 128개의 샘플에 적용되었다. 17세에서 62세(평균 연령: 34세) 범위의 총 53명의 건강한 자원 공여자(여성 21명, 남성 32명)와 15명의 수용자가 있었고, 이들에 대한 상세 내용은 표 3에 제공되어 있다. 75개의 장기 수용자 샘플도 또한 검사하였다. 샘플 범위는 5개 시점(1개는 수혈 전, 4개는 수혈 후)에 걸쳐 있다. 공여자 및 수용자 둘 다로부터의 서열 판독물이 도 40에 플롯팅되어 있으며, 이는 공여자 및 수용자 샘플 유래의 총 판독물뿐만 아니라 아넬로바이러스 판독물을 나타낸다. 총 300.1 Gbp의 서열 데이터를 회수하였으며, 이 중 159.6 Gbp는 아넬로바이러스로부터 유래되었다. 서열 데이터로부터, 1,656 고품질 아넬로바이러스 콘티그(중간 길이 = 2,916 bp, 최소 길이 = 2,190 bp, 최대 길이 = 4,917 bp)를 확인하였다. 이전에 확인된 아넬로바이러스 게놈을 NCBI GenBank 저장소(Benson et al., 2012; 본 명세서에 전문이 참조로 포함됨)로부터 취하여 비교를 위한 알려진 서열의 기준선을 생성하였다. 저장소로부터의 서열을 크기별로 필터링하고, 비-인간 및 공개된 아넬로바이러스 서열을 제거하여 445개의 선별된 서열 세트를 생성하였다. 추가 하류 분석을 위해 2,101개 아넬로바이러스 서열을 함유하는 결합된 데이터세트를 확립하였다.

[표 3] 수용자 통계 자료

실시예 37: 아넬로바이러스 게놈의 계통발생학적 분석

본 연구에서는 실시예 36에 기재된 아넬로바이러스 서열 데이터세트로부터의 ORF1 서열에 대한 상동성 및 계통발생학적 분석을 통해 인간 아넬로바이러스의 다양성을 평가하였다. 1,177개의 신규 아넬로바이러스 서열 세트로부터, 1,177개의 ORF1 서열을 N22 영역에서 발견된 신규 아미노산 모티프 YNPX ² DXGX ² N의 확인을 통해 단리하였다. 국제 바이러스 분류 위원회(International Committee on Taxonomy of Viruses; ICTV)(Adams et al., 2016)가 제안한 35% 서열 유사성 컷오프는 데이터세트의 아종을 완전히 특성화하기에는 너무 제한적이어서, 1,177개의 ORF1 서열이 적어도 96.5% 유사성이 있는 별개의 아넬로바이러스 계통인 것으로 정의되었다. 이에 따라 813개의 특유한 ORF1 서열이 별개의 아넬로바이러스 계통에 속하는 것으로 분류되었다. 이들 813개 ORF1 서열 중, 767개(94%)가 NCBI RefSeq 비-중복 단백질(nr) 데이터베이스에서 발견되는 모든 아넬로바이러스 서열의 25% 이상인 서열 비유사성을 기반으로 하여 특유한 것으로 분류되었다(O'Leary et al., 2016).

인간 아넬로바이러스는 분류학상으로 3개의 광범위한 속, 즉 알파토르크바이러스, 베타토르크바이러스, 및 감마토르크바이러스로 분류되었다. 공개적으로 이용 가능하고 새롭게 기재된 아넬로바이러스 서열은 689개의 알파토르크바이러스 서열, 619개의 베타토르크바이러스 서열, 및 271개의 감마토르크바이러스 서열이 있는 3개의 속으로 분할되었고 ORF1 영역으로 트리밍되었다. ORF1 서열은 MAFFT(FFT-NS-i×1000 설정)를 사용하여 번역되고 정렬되었으며, 아미노산 서열 사이의 쌍별 거리가 계산되었다. 그 다음 세 가지 정렬(알파, 베타 및 감마) 모두 MAFFT(G-INS-i 설정)를 사용하여 컨센서스-정렬하였다. 모든 2,101개의 아넬로바이러스 캡시드 단백질(TTVS 코호트에서 1,177개 및 NCBI GenBank에서 다운로드한 449개)의 최대 우도 계통발생은 RAxML(CAT 서열 진화 모델, BLOSSUM62 치환 매트릭스)을 사용하여 구축되었으며, TTVS 코호트의 서열이 3개의 속에 속하고, 알파토르크바이러스, 베타토르크바이러스, 및 감마토르크바이러스 속의 서열 수에서 각각 28%, 27% 및 15% 증가를 제공하는 것으로 밝혀졌다(도 41, 패널 A).

계통발생학적 분석은 분석 중인 유기체가 클론 진화 모델을 따른다는 가정하에 작동한다. 그러나 재조합이 관찰된 유전적 변이에서 중요한 역할을 할 수 있기 때문에 클론 모델은 이러한 연구에서 확립된 서열 데이터 세트를 분석하기에 충분하지 않을 수 있다. 아넬로바이러스 다양성의 범위를 추가로 특성화하기 위해, 다차원 척도법(MDS)을 사용하여 아넬로바이러스 ORF1 서열을 분석하였다. 또한, 아넬로바이러스 ORF1 서열의 다양성을 8개의 다른 적합한 후보 표면 단백질에서 발견되는 다양성과 비교하였다: DNA 바이러스(아넬로바이러스, 인간 유두종바이러스(HPV), 아데노-연관 바이러스(AAV)); 재조합하는 것으로 알려지지 않은 음성 신스 단일-가닥 RNA 바이러스(인플루엔자 A 바이러스 그룹 2, 에볼라바이러스, 라싸 바이러스); 및 재조합하는 것으로 알려진 양성 센스 단일-가닥 RNQ 바이러스(HIV1, 뎅기 바이러스, MERS 코로나바이러스). 바이러스는 각각 느리거나 빠른 속도의 진화, 단일 또는 이중 가닥 분자를 나타내고 및 재조합하는 것으로 알려져 있거나 알려지지 않은 3가지 상이한 그룹에 걸쳐 선택되어 광범위한 수준의 다양성을 가지는 바이러스에 대한 비교를 제공한다. 인간 유두종바이러스(HPV, HPV 유형 41을 포함하는 다양성) 후기 단백질(L1), 아데노-연관 바이러스(AAV, 인간에서 발견되는 모든 다양성) 캡시드 단백질, 뎅기열 바이러스(모든 알려진 혈청형) 외피 단백질, 중동 호흡기 증후군-연관 코로나바이러스(MERS-CoV, 모든 알려진 다양성) 스파이크 단백질(S), 에볼라바이러스(속 수준) 당단백질(GP) 단백질, 및 라싸열(모든 알려진 다양성) 바이러스 당단백질 복합체(GPC) 단백질을 GenBank에서 다운로드하였다. 인플루엔자 A 바이러스 그룹 2 헤마글루티닌(HA) 서열에 대한 추가 데이터세트를 인플루엔자 연구 데이터베이스(Influenza Research Database)에서 다운로드했고 인간 면역결핍 바이러스-1(HIV-1) env 서열은 로스 앨러모스 국립 연구소(Los Alamos National Laboratory) 사전 제작 정렬 서열 데이터베이스에서 얻었다. MAFFT(자동 설정)를 사용하여 서열을 번역 및 정렬하고 3000개의 서열로 다운 샘플링하였다. 서열을 4개의 그룹(전체 콘티그, ORF1 캡시드, ORF2 및 5' UTR)으로 비닝하고 계통에 걸친 쌍별 유전적 거리에 대해 분석하였다. 모든 서열에 걸친 쌍별 동일성 백분율의 분포는 도 42에서 그룹으로 도시되어 있다. 바이러스 단백질 서열의 부위 다양성은 각각의 위치에서 특유한 아미노산 수의 분석을 통해 조사되었다. 아미노산 다양성의 이러한 분석은 도 43의 플롯에 예시되어 있다. 예시적인 예로서, 아넬로바이러스의 각각의 범주에 대한 5' UTR 영역의 계통발생이 도 44에 도시되어 있으며, 이는 서열 전반에 걸친 뉴클레오티드 정렬을 강조한다.

아넬로바이러스에서 잠재적인 비클론 진화를 설명하기 위해, 예를 들어 다차원 스케일링(MDS)을 사용하여 아넬로바이러스 다양성을 조사하였다. Scikit-learn을 사용하여 2차원으로 투영하기 위해 모든 바이러스 단백질 서열에 MDS를 적용하였다. 응집 클러스터링은 Scikit-learn을 사용하여 아넬로바이러스의 쌍별 아미노산 거리에 추가로 적용되어 10개(비교하기 쉽도록 임의로 선택됨) 클러스터를 확인하였다. MDS-투여 서열을 matplotlib를 사용하여 시각화하고 아넬로바이러스의 경우 할당된 클러스터별로 색상을 지정하였다.

도 41의 패널 B에 플롯팅된 MDS 분석 결과는, 아넬로바이러스가 많은 양의 투영 공간을 차지함을 나타낸다. 아넬로바이러스 분석과 동일한 규모로 8개의 비교 바이러스에 대한 MDS 결과의 예상은, 아넬로바이러스 다양성이 비교를 위해 선택된 바이러스보다 훨씬 더 높음(3 내지 4배 더 큼)은 나타내었다. 인플루엔자 및 HIV와 같이 돌연변이가 빠르게 발생하는 것으로 알려진 바이러스 및 MERS-CoV와 같이 재결합하는 것으로 알려진 바이러스와 비교하여도, 아넬로바이러스는 MDS의 2D 투영 공간을 더 많이 차지하였다. 모든 표면 단백질의 모든 MDS 좌표(서열)를 포함하는 볼록 껍질의 면적을 측정하여 각각의 바이러스의 바이러스 다양성에 대한 단일 척도를 제공하였다. 본 연구의 아넬로바이러스에 대한 이 측정치는 가장 가까운 값을 가진 바이러스의 두 배 초과이었으며; 높은 수준의 다양성을 가진 것으로 알려진 바이러스와 비교하여, 아넬로바이러스는 3 내지 4배 더 큰 측정치를 나타내었다. 이들 속 각각의 서열에서 관찰된 성장은 15% 내지 28%이었다. 또한 알파토르크바이러스와 비교하여 베타토르크-(서열당 아미노산 부위당 0.114개 치환) 및 감마토르크-(0.148) 속의 새로운 서열당 계통발생 분지 길이 기여도가 결정되었다.

실시예 38. 수혈 공여자 및 수용자의 아넬로바이러스 동시-감염

본 연구에서, 실시예 36에 기재된 샘플을 조사하여 주입 후 다양한 장기에 걸친 시점에 존재하는 아넬로바이러스의 양을 측정하였다. PCR 및 서열결정을 사용하여 각각의 시점에 존재하는 아넬로바이러스 계통을 조사하고 각각의 대상체에서 아넬롬을 특성화하였다. 코호트의 15명의 수혈 수용자 모두 수많은 아넬로바이러스 계통과의 동시-감염을 함유하는 것으로 밝혀졌다.

범-아넬로바이러스 PCR 분석을 사용하여 모든 공여자 및 수용자 샘플에서 아넬로바이러스 DNA의 존재 또는 부재를 신속하게 평가하였다. 혈청 샘플에서 아넬로비리대의 존재를 Ninomiya 2008(본 명세서에 전문이 참조로 포함됨)에 의해 개발된 범-아넬로바이러스 프라이머를 사용하여 PCR에 의해 테스트하였다. 간략하게, 샘플 10 μl를 1× PCR 마스터 믹스(Sigma Aldrich PCR 마스터 키트 #11636103001) 및 4개의 축퇴 프라이머에 25 ul의 최종 부피에서 각각 1 μM의 최종 농도로 첨가하였다. 양성 샘플은 2% 아가로스 겔에서 128 bp 밴드의 존재에 의해 확인되었다. 도 45a는 PCR 분석 결과를 나타내며; 각각의 수용자에 사용된 공여자 샘플의 아넬로바이러스 부재 또는 존재뿐만 아니라, 각각의 수용자에서 아넬로바이러스가 검출된 날짜가 표시되었다.

아넬로바이러스는 공여자 샘플의 53%(33/53)와 수용자 샘플의 86%(65/75)에서 검출되었다. 각각의 공여자-수용자 수혈 세트에서 적어도 하나의 양성 샘플이 검출된 한편; 4개의 공여자 세트(수용자 1, 8, 9 및 14의 헌혈자)에서는 아넬로바이러스가 검출되지 않았지만, 이들 수용자 각각의 적어도 하나의 샘플에서 아넬로바이러스가 후속적으로 검출되었다. 전체적으로, 아넬로바이러스는 이전에 전혈 또는 혈장 샘플에서 관찰된 검출률을 지지하는 검출률로 PCR에 의해 본 발명자들의 샘플의 76%(98/128)에서 발견되었다.

상기 기재한 새로운 증폭 방법과 함께 표적화된 심층 서열결정을 사용하여 본 연구에서 각각의 대상체 및 각각의 시점에서 아넬로바이러스의 수를 측정하였다. 고유한 수의 아넬로바이러스 캡시드 단백질 서열을 분석하였고, 각각은 본 명세서에 기재된 YNPX ² DXGX ² N 아미노산 모티프를 사용하여 식별할 수 있는 특유한 마커 유전자로서 단리되었다. 도 45b는 공여자 및 수용자의 하위 집합에서 아넬로바이러스 균주의 수를 나타내는 플롯을 도시한다. 코호트에 있는 대부분의 대상체는 대상체당 6개의 별개의 아넬로바이러스 계통의 중앙값을 포함하였으며, 개별 수혈 수용자는 27개 계통의 중앙값을 포함하고 3명의 대상체는 기록된 모든 5개 시점에 걸쳐 100개 초과의 특유한 계통을 포함하였다. 복수의 대상체가 각각 20개 초과의 특유한 계통을 포함하는 것으로 확인되었다. 계통 수의 중앙값은 수혈 수용자만 검사하는 경우 4배 초과로 증가하였다. 이러한 발견은 수혈 수용자에서 아넬로바이러스 계통의 풍부도 증가가 헌혈자로부터 계통의 전염에 의해 상승되었음을 나타낸다.

상당한 아넬로바이러스 다양성을 확인한 다음, 본 발명자들은 ORF1 서열에서 발견된 다양성이 특정 영역으로 제한되는지 또는 전체 유전자에 걸쳐 널리 퍼져 있는지 여부를 질문하였다. 본 발명자들은 수혈 코호트(1,861개 서열의 정렬)에서 단리된 서열에 대해 3개의 속으로 설명된 전체 ORF1 서열에 걸쳐 보이는 특유한 아미노산의 수를 플롯팅하였다. 또한, 이러한 발견을 HIV-1 env, 인플루엔자 A 바이러스 그룹 2 HA 및 AAV 캡시드 단백질의 수집물을 조사하여 발견된 것과 비교하다(도 43). 평균적으로 ORF1 서열 전체에 걸쳐 보이는 특유의 아미노산 수는 광범위하게 다양하지만, 많은 경우에 26개 아미노산 모두가 여러 부위에 존재하는 것으로 밝혀졌다. 비교된 3개의 아넬로바이러스 속 중에서, 본 발명자들은 부위당 아미노산 다양성이 알파토르크바이러스 및 베타토르크바이러스에서 더 크고, 특유의 아미노산의 수가 잠재적으로 아르기닌-풍부 영역 및 젤리-롤 도메인 근처 유전자의 5' 말단에서 더 낮다는 점에 주목하였다. 아미노산 다양성의 최대량은 추정된 초가변 영역에서 이러한 2가지 특징을 따랐다. 본 발명자들은 또한 아넬로바이러스의 아미노산 다양성이 비교 포인트로 사용된 HIV, 인플루엔자 및 AAV 바이러스에서 발견된 것보다 높거나 같다는 것을 관찰하였다. 전반적으로, 부위당 특유한 아미노산의 평균이 전체 ORF1 서열에 걸쳐 상승하고 비교를 위해 선택된 3개의 바이러스 중 2개(AAV 및 인플루엔자 A 바이러스)에서 발견된 것보다 더 큰 것으로 밝혀졌다(도 43). 3개의 아넬로바이러스 속의 ORF1 아미노산 다양성은 각각 비교된 3개의 바이러스 중 2개의 현재 기재된 모든 표면 단백질보다 더 큰 것으로 관찰되었으며, HIV-1 env만이 주로 이의 초가변 루프에 의해 유도되는, 동일하거나 더 큰 수준의 다양성을 나타내었다.

실시예 39. 개인 아넬롬의 다양성 분석

본 연구에서는, 실시예 36에 기재된 개체에서 아넬롬을 포함하는 아넬로바이러스의 다양성을 평가하였다. 이 분석은 개체 내의 진화 공간에서 다양성이 제한되는(또는 제한되지 않는) 정도와 각각의 개인의 아넬롬이 특유한 정도를 조사하였다. 각각의 대상체는 대상체 간에 공유되는 계통이 거의 없는 별개의 아넬롬을 갖는 것으로 밝혀졌다. 각각의 개체 내의 전체 다양성의 범위는 전체 데이터 세트 내에서 볼 수 있는 범위에 걸쳐 있었다. 결과는 이전에 더 낮은 민감도 연구에서 보고된 것보다 더 높은 유병률을 나타내며 아넬로바이러스가 거의 모든 건강한 개체에게 서식할 수 있음을 나타낸다.

각각의 ORF1 서열의 평균 아미노산 동일성(AAI)을 사용하여 쌍별 비교를 통해 아넬로바이러스 계통의 유사성을 분석함으로써 각각의 공여자/수용자 대상체 세트 내의 다양성을 조사하였다(도 46). 각각의 공여자-수용자로부터 단리된 아넬로바이러스 계통 간에는 상대적으로 거의 유사성이 관찰되지 않았으며, 모든 공여자-수용자 세트에 걸쳐 평균 쌍별 AAI는 12.1%이었다. 더 많은 수의 아넬로바이러스 계통을 갖는 대상체(예를 들어, 대상체 4, 5 및 15)에서, 더 적은 수의 아넬로바이러스 계통을 갖는 대상체 세트에 비해 더 낮은 평균 쌍별 AAI 값이 관찰되었다. 아넬로바이러스 계통이 더 적은 대상체 세트에서보다 더 낮은 평균 쌍별 AAI 값이 관찰되었다. 본 발명자들은 또한 계통이 더 적은 개체의 경우 다양성의 폭이 그만큼 넓다는 것을 관찰하였으며(수용자 3, 7, 11, 14), 이는 더 작은 아넬롬이 있는 대상체에서도 발견된 계통의 다양성이 여전히 상당히 높을 수 있음을 시사한다. 이러한 관찰을 뒷받침하기 위해, 본 발명자들은 본 발명자들의 글로벌 분석에서 계산된 동일한 단일 요약 통계를 사용하여, MDS 투영 2D 공간의 총 점유 면적을 요약했으며 이러한 값이 본 발명자들의 관찰을 뒷받침한다는 것을 발견하였다. 본 발명자들은 수혈 세트 4, 5 및 15에서 가장 높은 값을 관찰하였으며, 이는 이러한 세트가 TTVS 코호트에서 가장 많은 다양성을 포함한다는 본 발명자들의 평가와 일치한다. 이러한 결과는 ORF 서열 유사성에 의해 측정된 바와 같이, 대상체 내에서 아넬로바이러스 계통의 풍부한 다양성을 가리킨다.

다음으로 본 발명자들은 전체 조립된 콘티그, ORF2 서열 및 5'UTR 서열을 통해 검색하여, 전체 데이터 세트에 걸쳐 동일한 쌍별 서열 유사성 비교를 수행하여 다양성이 ORF1 단백질에서 관찰된 것 이상으로 확장되었는지 여부를 분석하였다(도 42c). 아넬로바이러스 서열의 5'UTR 영역은 높은 보존성을 보였고 다른 아넬로바이러스 특징에서 발견된 것보다 더 높은 유사성 수준을 가졌다. 이러한 결과는 5'UTR이 현재 승인된 ORF1 모델보다 더 높은 특이성으로 아넬로바이러스 계통을 분류하는 데 적합한 식별기 역할을 할 수 있음을 나타낸다.

실시예 37에 기재된 방법에 따른 MDS 분석을 사용하여 수용자 대상체 세트에서 개체의 다양성을 측정, 시각화 및 비교하였다(도 45c). 대상체별 분석은 도 41의 패널 B에 도시된 전체 아넬롬의 데이터 세트에 사용된 동일한 2D 공간에 투영되었다. 본 연구의 결과는 충분히 큰 샘플 크기의 아넬로바이러스 계통(즉, 40개 이상의 계통)이 존재하는 경우, 다양성은 투영된 MDS 공간의 대부분을 포함하고 전체 데이터 세트를 검사할 때 발견된 것과 동일한 구성을 미러링하였다. 유사하게, 더 적은 비율의 계통을 포함하는 대상체에서, 대부분의 경우에 계통이 여러 속을 포함하는 투영된 다양성 공간에 걸쳐 확산이 여전히 관찰되었다. 각각의 대상체 세트에서 발견된 아넬로바이러스 계통이 차지하는 투영 공간의 양을 나타내기 위해 전체 데이터 세트에 대해 동일한 다양성 통계를 계산하였다. 다시 말하면, 아넬로바이러스 계통의 수가 더 많은 대상체가 이 통계에서 가장 높았다. 아넬로바이러스 계통이 가장 많은 대상체 세트(4, 5, 15)는 모두 가장 큰 다양성을 나타내었고, 계통 수가 가장 많은 집단에서 가장 큰 다양성 통계가 관찰되었다. 계통 수가 가장 많은 3개 대상체 집합 간의 통계 차이는 4이었다.

실시예 40: 수혈을 통해 전염되는 아넬로바이러스의 지속성

아넬로바이러스는 여러 생물학적 샘플 유형에서 검출될 수 있으며 타액, 모유, 정액, 구강-대변, 점액 구성원, 피부 또는 혈액과 같은 경로를 통해 전염이 발생할 수 있다. 본 연구에서, 서열 유사성 및 공여자 균주에 매핑된 판독 비율에 의해 추적함으로써 수혈 코호트에서 아넬로바이러스의 전염 역학이 시간 경과에 따라 공여자와 수용자 사이의 균주 전염을 조사하였다.

결과는 아넬로바이러스 전염이 여러 대상체에서 일관되게 발생했음을 나타내었다. 대부분의 수혈 수용자는 한 명 이상의 공여자로부터 전염받은 여러 계통을 가졌다. 공여자와 수용자의 완전히 조립된 추정 아넬로바이러스 게놈을 특성화했으며, 완전히 조립된 추정 아넬로바이러스 게놈의 존재를 비교하고 아넬로바이러스 서열결정 판독물의 맵핑을 통해 존재하는 전염된 계통의 비율을 측정함으로써 수용자에게 존재하는 전염된 계통의 비율을 측정하였다. 데이터는 전염된 계통이 수혈 이벤트 후 최대 적어도 270일까지 존재하였음을 입증하였다.

수혈 수용자의 특유의 아넬로바이러스 계통은 특정 수용자에게 상주하거나 공여자로부터 전염되는 것으로 분류되었다. 각각의 공여자에게 특유한 아넬로바이러스 계통 세트를 생성하기 위해, 95% 유사성 컷오프에서 공여자로부터 단리된 계통의 ORF1 서열과 수혈전 수용자로부터 단리된 계통 사이의 쌍별 비교를 사용하였다. 공여자 수용자를 수혈 후 여러 시점에서 공여자 아넬로바이러스 계통의 특유한 세트의 흔적에 대해 검색했고 ORF1 서열의 중요한 서열 상동성이 전염된 계통을 나타내는 경우 추출하였다. 적어도 하나의 아넬로바이러스 계통의 전염이 15명의 수용체 대상체 중 8명에서 관찰되었고(중간값 = 5, 최소값 = 0, 최대값 = 53), 모든 공여자/수용자 대상체 세트에 걸쳐 총 133개의 전염된 계통을 확인하였다. 또한, 6개의 계통을 수혈 전 수용자 샘플에 존재하는 것으로 확인하였지만, 또한 공여자로부터의 전염을 통해 증가하였으며, 이는 아넬로바이러스 계통의 재투약 가능성과 일치하였다. 도 41a는 시간 경과에 따른 수혈 수용자에서 풍부한 아넬로바이러스의 플롯을 도시하며; 이 플롯은 시간 경과에 따라 전염된 계통과 상주 계통의 변화를 따른다.

샘플당 아넬로바이러스 서열결정 판독물의 비율을 측정하고 각각의 아넬로바이러스 계통에 귀속시켜 장기에 걸친 아넬롬의 이동을 근사화하였다. 이 비율은 오염 제거 및 QC 필터링된 metagenomic 판독물을 각각의 샘플의 각각의 ORF1 단백질의 코딩 서열에 맵핑함으로써 계산하였다. 수용자 시점 샘플을 주로 서열 유사성 상동성에 의해 쌍을 이룬 공여자로부터 전염된 계통의 존재에 대해 수혈 후 질의하였다. 각각의 공여자-수용자 세트에 대한 특유한 공여자 계통 세트를 이용하여, 수혈 후 4개의 시점에서 공여자 계통의 95% 또는 90% 초과의 서열 유사성을 갖는 아넬로바이러스 계통에 대해 검색하였다. 적어도 하나의 아넬로바이러스 계통이 전염된 수용자에서 상주 아넬로바이러스 비율의 현저한 변화가 관찰되었다(도 47a). 수혜자 4, 5, 6, 11 및 15는 모두 수혈 초기 날짜 이후 50일에 걸쳐 전염된 계통의 비율의 꾸준한 증가를 나타내었으며, 일부 공여자 계통은 3가지 대상체 모두에서 샘플링된 최신 시점에 존재하였다. 대부분의 수용자에서, 전염된 아넬로바이러스 계통은 수혈 날짜로부터 100일 초과로 검출된 29개 계통으로 장기에 걸친 연구 동안 지속되었다(중앙값 = 88일).

실시예 41: 아넬로바이러스의 독립적 전염

본 연구에서, 아넬로바이러스가 작거나 큰 영역에 대한 서열 유사성 또는 계통에 걸쳐 공유된 보존된 모티프와 같은 서열 결정 요인과 독립적으로 전염시키는 능력을 조사하였다. 예를 들어, 본 연구는 아넬로바이러스 계통이 수용자의 아넬롬 계통과 매우 유사한(또는 유사하지 않은) 경우 전염 가능성이 더 높은지 여부를 평가하였다. 전염하고, 전염하지 않고 수용자에게 상주하는 아넬로바이러스 계통 세트의 서열을 비교하였으며, 대부분의 경우 상주하는 계통 수용자 아넬롬에 대한 서열 유사성은 계통이 더 전염 가능한지 여부에 영향을 미치지 않았다.

아넬로바이러스 계통은 ORF1 서열 및 공여자와 수용자 샘플에서 확인된 계통과의 유사성/비유사성을 사용하여 이전에 정의된 3개의 범주(즉, 전염됨, 전염되지 않음 및 상주)로 분류되었다. 공여자와 수용자 샘플 사이에 전염된 123개의 아넬로바이러스 계통(실시예 40 참조)에 추가하여, 공여자에게 고유하지만 각각의 수용자 샘플로 전염되지 않은 43개의 아넬로바이러스 계통을 확인하였다.

두 세트의 공여자-유래 아넬로바이러스 계통을 모든 순열에서 쌍별 방식으로 다수의 수용자 상주 계통(수십에서 수백개의 계통 범위)과 비교하여 서열 유사성이 계통의 전염성에 역할을 하는지 여부를 측정하였다(도 47b). 아넬로바이러스의 이들 세 범주의 비교 사이의 아미노산 유사성 백분율은 상대적으로 거의 차이가 없었다. 6개의 모든 비교에서, 아미노산 동일성 백분율 중앙값은 32.44%이었다. 아넬로바이러스 계통의 작은 세트는 상주 계통과 높은 서열 유사성을 공유하고 수용자에게 전염되었으며, 이는 아넬로바이러스가 일반적으로 수용자의 아넬롬과 유사성을 요구하지 않을 수 있지만 경우에 따라 전염에 도움이 될 수 있음을 나타낸다. 예를 들어, 전염된 계통과 상주 계통의 비교에서 전염된 계통 중 79개가 해당 수용자의 상주 혈통과 80% 초과로 유사하였다.

실시예 42: 다양성을 증가시키는 메커니즘으로서의 아넬로바이러스에서의 재조합

본 연구에서는, ORF1 유전자의 재조합을 검색하고 평가하여 ORF1 서열의 다양성을 생성하는 메커니즘을 조사하였다. 동일한 게놈에서 유전자좌의 연결을 끊음으로써, 재조합은 서열 데이터에 수많은 신호를 남기는데, 예를 들어 엄격하게 클론 진화를 가정하는 계통발생학적 방법으로 인한 과도한 반복 돌연변이(진화적 상동), 게놈의 상이한 부분 사이의 일관성 없는 계통발생수 토폴로지, 및 유전자좌 사이의 거리를 증가시키면서 이들 사이의 통계적 연관성의 감소가 있다. 아넬로바이러스 서열을 정렬하는 것이 어렵기 때문에, 이 연구의 재조합 추론은 식별할 수 있는 최상의 가능한 정렬로 제한되었다. 3개의 아넬로바이러스 속의 번역적으로 정렬된 서열은 모든 구성원이 뉴클레오티드 수준에서 다른 구성원과 적어도 80% 동일한 클러스터로 그룹화되어, 10개 초과의 구성원이 있는 28개의 클러스터(알파토르크바이러스 23개 클러스터, 베타토르크바이러스 4개 클러스터 및 감마토르크바이러스 1개 클러스터)가 생성되었다. 23개의 알파토르크바이러스, 11개의 베타토르크바이러스 및 10개의 감마토르크바이러스 서열이 포함된 클러스터를 제공하여 보다 면밀한 분석을 위해 각각의 속의 단일 대표를 선택하였다. 정렬을 개선시키기 위해 MAFFT(더다 정확한 E-INS-i 설정)를 사용하여 각 클러스터 내의 시퀀스를 재정렬하였다. 그 다음 각각의 정렬을 500개의 뉴클레오티드 조각으로 분할하고 PhyML((HKY+Γ₄ 치환 모델)을 사용하여 각각의 단편에서 계통발생을 추론하고 중간점에 뿌리를 두었다. 인접한 단편에서 파생된 계통발생은 각각의 분류군이 연속적인 트리를 통해 추적되는 얽힌 사슬로 표시되었다. ORF1 서열을 따른 500개 뉴클레오티드 단편 트리의 토폴로지의 불일치가 도 48의 패널 A에 도시되어 있다.

분할되지 않은 동일한 클러스터 정렬을 사용하여 PhyML(HKY+Γ₄ 대체 모델)을 사용하여 단일 트리를 추론하였다. 그 다음 각각의 트리와 정렬을 사용하여 카파가 2.0으로 설정된 ClonalFrameML을 사용하여 트리 전체에서 발생한 돌연변이를 재구축하였다. 트리에서 한 번만 발생하도록 재구축된 모든 돌연변이에 대해, 돌연변이가 발생한 분지에 표시를 하고 트리에서 한 번 초과로 발생하는 것으로 추정되는 모든 돌연변이는 돌연변이를 트리에서 다른 곳의 동일한 대응물에 돌연변이를 선으로(즉, 복귀는 별도로 고려됨) 연결하여 표시하였다. 단일 트리에서 돌연변이를 재구축하고 트리에서 한 번만 발생하는 돌연변이(즉, 분지에 표시가 되어 있는 공동파생형질)와 여러 번 발생하는 돌연변이(즉, 동일한 돌연변이가 발생한 지점을 연결하는 선으로 표시되는 진화적 상동)를 강조 표시하여, 상대적으로 낮은 수준의 발산에서도 반복 돌연변이의 풍부함은 재조합을 나타내는 것으로 밝혔다(도 48, 패널 B).

다음으로, 다형성 뉴클레오티드 부위의 물리적 거리와 이들 사이의 연관 불균형 사이의 관계를 각각의 속 내의 번역-정렬된 서열에서 평가하였다. 연관 불균형(LD)의 붕괴는

_df 통계를 사용하여 평가되었으며, 이는 이중대립유전자좌에 대한 더 일반적인 r2 통계와 동일하게 작동한다. 이를 위해, 689개의 알파토르크바이러스, 619개의 베타토르크바이러스 및 271개의 감마토르크바이러스 염기서열로 속 전체 정렬을 사용하였다. 유효 부위(A, C, T 또는 G)가 10% 미만인 정렬 열은 소수 변형이 빈도 5% 미만인 부위와 마찬가지로 무시되었다. 가변 부위 쌍 사이에서 측정된 LD는 100 뉴클레오티드 길이의 창에서 계산된 평균 LD로 부위 사이의 거리에 대해 플롯팅되었다(도 48, 패널 C). 도 48의 패널 C는 다형성 뉴클레오티드 부위의 물리적 거리와 각각의 속 내의 번역-정렬된 서열에서 부위 사이의 연관 불균형의 척도 사이의 관계를 나타낸다. 재조합의 경우, 인접 부위 사이에서 관찰되는 연관 불균형이 가장 높은 부위 사이의 거리가 증가하고 물리적 거리가 증가함에 따라 재조합 발생 확률이 증가한다. 이러한 관계가 예상되지 않는 두 가지 극단이 있는데, 이는 재조합이 전혀 없는 것과 자유로운 재조합의 경우이다. 비-재조합 게놈의 경우, 반복 돌연변이만이 기준선 1.0에서 연관 불균형을 감소시킬 수 있으며, 자유 재조합의 경우 인접한 유전자좌 사이의 연관 불균형은 0.0이다. 3개 속의 연관 불균형의 플롯은 각각의 속이 0에 가까운 연관 불균형을 나타냄을 보여주었으며, 이는 대규모로 아넬로바이러스 유전자좌가 효과적으로 독립적으로 진화했음을 나타낸다.

완전한 환화 게놈이 다수의 아넬로바이러스에 대해 이용가능하기 때문에, 게놈의 비-코딩 부분에서의 망상 진화 정도를 조사하였다. 이를 위해, 각각의 속의 완전한 게놈(22개의 알파토르크바이러스, 467개의 베타토르크바이러스 및 23개의 감마토르크바이러스)을 정렬하고 비-코딩 영역을 추출한 다음, ClonalFrameML을 사용하여 조상 상태 재구성을 수행하였다. 추정되는 재조합 영역을 확인하기 위해, 서로 10개의 뉴클레오티드 내에서 적어도 3개의 돌연변이 클러스터에서 발생하는 반복 돌연변이(진화적 상동)에 대해 서열을 분석하였다. 알파토크바이러스의 비-코딩 게놈 영역 내에서 확인된 이러한 돌연변이 클러스터는 도 49에 도시되어 있다. 도 50은 이러한 재조합 영역의 계통발생 위치를 강조하여, 돌연변이가 알파토르크바이러스 다양성 전체에 걸쳐 있음을 나타낸다. 이러한 결과는 공개 데이터뿐만 아니라 연구 코호트에서도 빈번한 재조합을 나타낸다. 본 명세서에 제공된 실시예는 개체 내에서 발생할 재조합 기회를 제공하는 아넬로바이러스의 다수의 별개 계통과의 빈번한 동시 감염을 나타내었다. 재조합에 대한 증거는 공여자-수용자 쌍의 밀접하게 관련된 ORF1 서열, 환자 내 서열 클러스터, 또는 아넬로바이러스 게놈의 더 보존된 영역 사이의 낮은 수준의 발산에서 가장 분명하였다. 이러한 데이터는 엄격한 클론 진화 모델(예를 들어, 계통발생수)이 아넬로바이러스 서열 사이의 관계 또는 거리를 적절하게 추론할 수 없으며 아넬로바이러스 게놈에는 재조합이 완전히 없는 영역이 소수 있거나 전혀 없을 수 있음을 시사한다.

결론

요약하면, 본 연구는 15명의 수혈 수용자와 이와 일치하는 공여자의 아넬롬을 탐구하고 각각의 개체가 고유한 아넬로바이러스 세트를 보유하고 있음을 시사하는 역동적인 환경을 확인하였다. 이는 112개 샘플에서 특유의 아넬로바이러스 계통을 식별하기 위해 심층 서열결정과 결합된 아넬로바이러스-표적화 증폭 방법을 이용하여 수행되었다. 아넬로바이러스 ORF1 서열을 탐구의 중추로 사용하고 고유한 마커 특징을 사용하여, 완전한 아넬로바이러스 게놈을 분석하여 가능했던 것보다 훨씬 더 깊은 수준에서 각각의 대상체의 다양성을 평가하였다. 완전한 아넬로바이러스 게놈을 복구하는 것은 비-코딩 영역의 높은 GC 함량으로 인해 방해를 받는다. 현재 ICTV 컷오프 값을 사용하여 아넬로바이러스를 분류하면 샘플 내에서 발견되는 대부분의 다양성이 무너지므로 종 경계를 구분하기 위한 실험적 증거로 보완된 아종/계보 정의의 이점을 얻을 수 있다.

200개가 넘는 전염된 아넬로바이러스 계통이 수혈 수용자에서 확인되었고 아넬로바이러스 전염이 수용자의 6/15(40%)에서 관찰되었다(도 47a). 숙주 아넬롬에 대한 공여자 계통의 유사성은 전염 성공에 거의 영향을 미치지 않는 것으로 보였다(도 47b). 실제로, 상주 계통에 대한 높은 서열 유사성(90% 초과)에도 불구하고 성공적으로 전염된 공증자 계통의 사례가 관찰되었으며, 이는 재감염을 나타내며 치료용 아넬로벡터(예를 들어, 본 명세서에 기재된 바와 같음)가 효과적으로 재투약될 수 있음을 나타낸다. 호흡기 및 분변-구강과 같은 다른 비-의원성 경로를 통한 아넬로바이러스 전염도 또한 여기에서 생후 첫해(REF)에 아넬로바이러스의 유비쿼터스 획득을 기반으로 고려된다.

표적 아넬로바이러스 서열을 통해 시간 경과에 따른 수백 가지의 특유한 아넬로바이러스 계통을 구별하고 추적할 수 있다. 다중 아넬로바이러스 계통(16/16 수용자)과 함께 높은 공동-감염 유병률이 확인되었다. 이 연구 기간 동안(수혈 후 최대 270일) 지속되는 상주 및 전염된 아넬로바이러스 혈통이 모두 관찰되었다. 이론에 결부시키고자 하지 않고, 수혈을 통해 새롭게 전염된 계통의 지속성은 정맥으로 운반되는 치료제가 운반을 위한 비히클일 수 있음을 추가로 나타낸다.

본 명세서에 기재된 아넬로바이러스의 특성과 주요 특징은 다양한 상주 계통 환경이 공존하는 공간 안팎에서 새로운 계통이 순환하는 아넬롬의 모델을 제안한다. 서열 유사성 및 결여된 질환 연관성과 독립적으로 감염시키는 이들의 능력은 낮은 면역원성을 시사하고 오래 지속되는 감염을 부여하여 여러 변종과의 공동-감염을 허용하고 빈번한 재조합을 촉진한다. 인간에서의 편재성 및 지속성, 낮은 면역원성 및 병원성과 같은 아넬로바이러스의 특성은 재조합이 아넬로바이러스 다양화를 촉진한다는 관찰과 일치한다.

이론에 결부시키고자 하지 않고, 수혈 코호트에서 대상체의 혈액으로부터의 아넬로바이러스에서 관찰된 다양성은 치료 페이로드를 운반하기 위해 이용될 수 있는 바이러스 주형(예를 들어, 본 명세서에 기재된 바와 같음)을 제공한다. 치료 페이로드를 운반하도록 재구성된 아넬로바이러스(예를 들어, 본 명세서에 기재된 바와 같은 아넬로벡터)는 선행 항체에 대해 내성이 있고 조직 향성을 갖는 장점을 가질 수 있다. 이를 통해 복제-결핍 아넬로바이러스를 재투약하고 독성을 초래할 수 있는 현재 운반 형식에 필요한 고용량을 감소시킬 수 있다.

SEQUENCE LISTING <110> FLAGSHIP PIONEERING INNOVATIONS V, INC. <120> METHODS OF IDENTIFYING AND CHARACTERIZING ANELLOVIRUSES AND USES THEREOF <130> V2057-7012WO <140> PCT/US2021/037828 <141> 2021-06-17 <150> 63/147,029 <151> 2021-02-08 <150> 63/130,074 <151> 2020-12-23 <150> 63/040,371 <151> 2020-06-17 <160> 1013 <170> PatentIn version 3.5 <210> 1 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1 cgaatggyw 9 <210> 2 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 2 aaggggcaa 9 <210> 3 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 3 ytgyggbtg 9 <210> 4 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 4 yagamacmm 9 <210> 5 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 5 yaartggtac 10 <210> 6 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 6 saccacwaac 10 <210> 7 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 7 tbgtcggtg 9 <210> 8 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 8 cactccgag 9 <210> 9 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 9 gaggagtgc 9 <210> 10 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 10 cagactccg 9 <210> 11 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 11 gtgagtggg 9 <210> 12 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 12 cttcgccat 9 <210> 13 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 13 wrccattcg 9 <210> 14 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 14 ttgcccctt 9 <210> 15 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 15 cavccrcar 9 <210> 16 <211> 3753 <212> DNA <213> Alphatorquevirus sp. <400> 16 tgctacgtca ctaacccacg tgtcctctac aggccaatcg cagtctatgt cgtgcacttc 60 ctgggcatgg tctacataat tatataaatg cttgcacttc cgaatggctg agtttttgct 120 gcccgtccgc ggagaggagc cacggcaggg gatccgaacg tcctgagggc gggtgccgga 180 ggtgagttta cacaccgaag tcaaggggca attcgggctc aggactggcc gggctttggg 240 caaggctctt aaaaatgcac ttttctcgaa taagcagaaa gaaaaggaaa gtgctactgc 300 tttgcgtgcc agcagctaag aaaaaaccaa ctgctatgag cttctggaaa cctccggtac 360 acaatgtcac ggggatccaa cgcatgtggt atgagtcctt tcaccgtggc cacgcttctt 420 tttgtggttg tgggaatcct atacttcaca ttactgcact tgctgaaaca tatggccatc 480 caacaggccc gagaccttct gggccaccgg gagtagaccc caacccccac atccgtagag 540 ccaggcctgc cccggccgct ccggagccct cacaggttga ttcgagacca gccctgacat 600 ggcatgggga tggtggaagc gacggaggcg ctggtggttc cggaagcggt ggacccgtgg 660 cagacttcgc agacgatggc ctcgatcagc tcgtcgccgc cctagacgac gaagagtaag 720 gaggcgcaga cggtggagga gggggagacg aaaaacaagg acttacagac gcaggagacg 780 ctttagacgc aggggacgaa aagcaaaact tataataaaa ctgtggcaac ctgcagtaat 840 taaaagatgc agaataaagg gatacatacc actgattata agtgggaacg gtacctttgc 900 cacaaacttt accagtcaca taaatgacag aataatgaaa ggccccttcg ggggaggaca 960 cagcactatg aggttcagcc tctacatttt gtttgaggag cacctcagac acatgaactt 1020 ctggaccaga agcaacgata acctagagct aaccagatac ttgggggctt cagtaaaaat 1080 atacaggcac ccagaccaag actttatagt aatatacaac agaagaaccc ctctaggagg 1140 caacatctac acagcaccct ctctacaccc aggcaatgcc attttagcaa aacacaaaat 1200 attagtacca agtttacaga caagaccaaa gggtagaaaa gcaattagac taagaatagc 1260 accccccaca ctctttacag acaagtggta ctttcaaaag gacatagccg acctcaccct 1320 tttcaacatc atggcagttg aggctgactt gcggtttccg ttctgctcac cacaaactga 1380 caacacttgc atcagcttcc aggtccttag ttccgtttac aacaactacc tcagtattaa 1440 tacctttaat aatgacaact cagactcaaa gttaaaagaa tttttaaata aagcatttcc 1500 aacaacaggc acaaaaggaa caagtttaaa tgcactaaat acatttagaa cagaaggatg 1560 cataagtcac ccacaactaa aaaaaccaaa cccacaaata aacaaaccat tagagtcaca 1620 atactttgca cctttagatg ccctctgggg agaccccata tactataatg atctaaatga 1680 aaacaaaagt ttgaacgata tcattgagaa aatactaata aaaaacatga ttacatacca 1740 tgcaaaacta agagaatttc caaattcata ccaaggaaac aaggcctttt gccacctaac 1800 aggcatatac agcccaccat acctaaacca aggcagaata tctccagaaa tatttggact 1860 gtacacagaa ataatttaca acccttacac agacaaagga actggaaaca aagtatggat 1920 ggacccacta actaaagaga acaacatata taaagaagga cagagcaaat gcctactgac 1980 tgacatgccc ctatggactt tactttttgg atatacagac tggtgtaaaa aggacactaa 2040 taactgggac ttaccactaa actacagact agtactaata tgcccttata cctttccaaa 2100 attgtacaat gaaaaagtaa aagactatgg gtacatcccg tactcctaca aattcggagc 2160 gggtcagatg ccagacggca gcaactacat accctttcag tttagagcaa agtggtaccc 2220 cacagtacta caccagcaac aggtaatgga ggacataagc aggagcgggc cctttgcacc 2280 taaggtagaa aaaccaagca ctcagctggt aatgaagtac tgttttaact ttaactgggg 2340 cggtaaccct atcattgaac agattgttaa agaccccagc ttccagccca cctatgaaat 2400 acccggtacc ggtaacatcc ctagaagaat acaagtcatc gacccgcggg tcctgggacc 2460 gcactactcg ttccggtcat gggacatgcg cagacacaca tttagcagag caagtattaa 2520 gagagtgtca gaacaacaag aaacttctga ccttgtattc tcaggcccaa aaaagcctcg 2580 ggtcgacatc ccaaaacaag aaacccaaga agaaagctca cattcactcc aaagagaatc 2640 gagaccgtgg gagaccgagg aagaaagcga gacagaagcc ctctcgcaag agagccaaga 2700 ggtccccttc caacagcagt tgcagcagca gtaccaagag cagctcaagc tcagacaggg 2760 aatcaaagtc ctcttcgagc agctcataag gacccaacaa ggggtccatg taaacccatg 2820 cctacggtag gtcccaggca gtggctgttt ccagagagaa agccagcccc agctcctagc 2880 agtggagact gggccatgga gtttctcgca gcaaaaatat ttgataggcc agttagaagc 2940 aaccttaaag atacccctta ctacccatat gttaaaaacc aatacaatgt ctactttgac 3000 cttaaatttg aataaacagc agcttcaaac ttgcaaggcc gtgggagttt cactggtcgg 3060 tgtctacctc taaaggtcac taagcactcc gagcgtaagc gaggagtgcg accctccccc 3120 ctggaacaac ttcttcggag tccggcgcta cgccttcggc tgcgccggac acctcagacc 3180 ccccctccac ccgaaacgct tgcgcgtttc ggaccttcgg cgtcgggggg gtcgggagct 3240 ttattaaacg gactccgaag tgctcttgga cactgagggg gtgaacagca acgaaagtga 3300 gtggggccag acttcgccat aaggccttta tcttcttgcc atttgtcagt gtccggggtc 3360 gccataggct tcgggctcgt ttttaggcct tccggactac aaaaatcgcc attttggtga 3420 cgtcacggcc gccatcttaa gtagttgagg cggacggtgg cgtgagttca aaggtcacca 3480 tcagccacac ctactcaaaa tggtggacaa tttcttccgg gtcaaaggtt acagccgcca 3540 tgttaaaaca cgtgacgtat gacgtcacgg ccgccatttt gtgacacaag atggccgact 3600 tccttcctct ttttcaaaaa aaagcggaag tgccgccgcg gcggcggggg gcggcgcgct 3660 gcgcgcgccg cccagtaggg ggagccatgc gccccccccc gcgcatgcgc ggggcccccc 3720 cccgcggggg gctccgcccc ccggcccccc ccg 3753 <210> 17 <211> 127 <212> PRT <213> Alphatorquevirus sp. <400> 17 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu 115 120 125 <210> 18 <211> 268 <212> PRT <213> Alphatorquevirus sp. <400> 18 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Leu 115 120 125 Leu Lys Thr Pro Ala Ser Ser Pro Pro Met Lys Tyr Pro Val Pro Val 130 135 140 Thr Ser Leu Glu Glu Tyr Lys Ser Ser Thr Arg Gly Ser Trp Asp Arg 145 150 155 160 Thr Thr Arg Ser Gly His Gly Thr Cys Ala Asp Thr His Leu Ala Glu 165 170 175 Gln Val Leu Arg Glu Cys Gln Asn Asn Lys Lys Leu Leu Thr Leu Tyr 180 185 190 Ser Gln Ala Gln Lys Ser Leu Gly Ser Thr Ser Gln Asn Lys Lys Pro 195 200 205 Lys Lys Lys Ala His Ile His Ser Lys Glu Asn Arg Asp Arg Gly Arg 210 215 220 Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg Lys Arg Ala Lys Arg 225 230 235 240 Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr Lys Ser Ser Ser Ser 245 250 255 Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser Ser 260 265 <210> 19 <211> 276 <212> PRT <213> Alphatorquevirus sp. <400> 19 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Pro 115 120 125 Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro Arg Arg Lys 130 135 140 Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp Arg Gly Arg 145 150 155 160 Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly Pro Leu Pro 165 170 175 Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala Gln Thr Gly 180 185 190 Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr Arg Gly Pro 195 200 205 Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu Phe Pro Glu 210 215 220 Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala Met Glu Phe 225 230 235 240 Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn Leu Lys Asp 245 250 255 Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val Tyr Phe Asp 260 265 270 Leu Lys Phe Glu 275 <210> 20 <211> 167 <212> PRT <213> Alphatorquevirus sp. <400> 20 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Pro Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro 20 25 30 Arg Arg Lys Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp 35 40 45 Arg Gly Arg Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly 50 55 60 Pro Leu Pro Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala 65 70 75 80 Gln Thr Gly Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr 85 90 95 Arg Gly Pro Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu 100 105 110 Phe Pro Glu Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala 115 120 125 Met Glu Phe Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn 130 135 140 Leu Lys Asp Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val 145 150 155 160 Tyr Phe Asp Leu Lys Phe Glu 165 <210> 21 <211> 743 <212> PRT <213> Alphatorquevirus sp. <400> 21 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val 65 70 75 80 Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly 85 90 95 Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile 100 105 110 Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu 115 120 125 Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg 130 135 140 Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys 145 150 155 160 Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg 165 170 175 Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly 180 185 190 Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr 195 200 205 Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr 210 215 220 Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr 225 230 235 240 Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys 245 250 255 Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 260 265 270 Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser 275 280 285 Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly 290 295 300 Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly 305 310 315 320 Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys 325 330 335 Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp 340 345 350 Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile 355 360 365 Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu 370 375 380 Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu 385 390 395 400 Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro 405 410 415 Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp 420 425 430 Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn 435 440 445 Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro 450 455 460 Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr 465 470 475 480 Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro 485 490 495 Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr 500 505 510 Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser 515 520 525 Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu 530 535 540 His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala 545 550 555 560 Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe 565 570 575 Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp 580 585 590 Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro 595 600 605 Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser 610 615 620 Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile 625 630 635 640 Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly 645 650 655 Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu 660 665 670 Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu 675 680 685 Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe 690 695 700 Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln 705 710 715 720 Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val 725 730 735 His Val Asn Pro Cys Leu Arg 740 <210> 22 <211> 194 <212> PRT <213> Alphatorquevirus sp. <400> 22 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Ile Val Lys Asp Pro Ser Phe Gln Pro 35 40 45 Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile Gln Val 50 55 60 Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser Trp Asp 65 70 75 80 Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val Ser Glu 85 90 95 Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys Pro Arg 100 105 110 Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His Ser Leu 115 120 125 Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu Thr Glu 130 135 140 Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln Leu Gln 145 150 155 160 Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys Val Leu 165 170 175 Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn Pro Cys 180 185 190 Leu Arg <210> 23 <211> 113 <212> PRT <213> Alphatorquevirus sp. <400> 23 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Ala Gln Lys Ser Leu Gly Ser Thr Ser 35 40 45 Gln Asn Lys Lys Pro Lys Lys Lys Ala His Ile His Ser Lys Glu Asn 50 55 60 Arg Asp Arg Gly Arg Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg 65 70 75 80 Lys Arg Ala Lys Arg Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr 85 90 95 Lys Ser Ser Ser Ser Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser 100 105 110 Ser <210> 24 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 24 atggcgaag 9 <210> 25 <400> 25 000 <210> 26 <400> 26 000 <210> 27 <400> 27 000 <210> 28 <400> 28 000 <210> 29 <400> 29 000 <210> 30 <400> 30 000 <210> 31 <400> 31 000 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <400> 34 000 <210> 35 <400> 35 000 <210> 36 <400> 36 000 <210> 37 <400> 37 000 <210> 38 <400> 38 000 <210> 39 <400> 39 000 <210> 40 <400> 40 000 <210> 41 <400> 41 000 <210> 42 <400> 42 000 <210> 43 <400> 43 000 <210> 44 <400> 44 000 <210> 45 <400> 45 000 <210> 46 <400> 46 000 <210> 47 <400> 47 000 <210> 48 <400> 48 000 <210> 49 <400> 49 000 <210> 50 <400> 50 000 <210> 51 <400> 51 000 <210> 52 <400> 52 000 <210> 53 <400> 53 000 <210> 54 <211> 2979 <212> DNA <213> Betatorquevirus sp. <400> 54 taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60 gttccccttt ttgcaacaac ttctgctttt ttccaactgc cggaaaacca cataatttgc 120 atggctaacc acaaactgat atgctaatta acttccacaa aacaacttcc ccttttaaaa 180 ccacacctac aaattaatta ttaaacacag tcacatcctg ggaggtacta ccacactata 240 ataccaagtg cacttccgaa tggctgagtt tatgccgcta gacggagaac gcatcagtta 300 ctgactgcgg actgaacttg ggcgggtgcc gaaggtgagt gaaaccaccg aagtcaaggg 360 gcaattcggg ctagttcagt ctagcggaac gggcaagaaa cttaaaatta ttttattttt 420 cagatgagcg actgctttaa accaacatgc tacaacaaca aaacaaagca aactcactgg 480 attaataacc tgcatttaac ccacgacctg atctgcttct gcccaacacc aactagacac 540 ttattactag ctttagcaga acaacaagaa acaattgaag tgtctaaaca agaaaaagaa 600 aaaataacaa gatgccttat tactacagaa gaagacggta caactacaga cgtcctagat 660 ggtatggacg aggttggatt agacgccctt ttcgcagaag atttcgaaga aaaagaaggg 720 taagacctac ttatactact attcctctaa agcaatggca accgccatat aaaagaacat 780 gctatataaa aggacaagac tgtttaatat actatagcaa cttaagactg ggaatgaata 840 gtacaatgta tgaaaaaagt attgtacctg tacattggcc gggagggggt tctttttctg 900 taagcatgtt aactttagat gccttgtatg atatacataa actttgtaga aactggtgga 960 catccacaaa ccaagactta ccactagtaa gatataaagg atgcaaaata acattttatc 1020 aaagcacatt tacagactac atagtaagaa tacatacaga actaccagct aacagtaaca 1080 aactaacata cccaaacaca catccactaa tgatgatgat gtctaagtac aaacacatta 1140 tacctagtag acaaacaaga agaaaaaaga aaccatacac aaaaatattt gtaaaaccac 1200 ctccgcaatt tgaaaacaaa tggtactttg ctacagacct ctacaaaatt ccattactac 1260 aaatacactg cacagcatgc aacttacaaa acccatttgt aaaaccagac aaattatcaa 1320 acaatgttac attatggtca ctaaacacca taagcataca aaatagaaac atgtcagtgg 1380 atcaaggaca atcatggcca tttaaaatac taggaacaca aagcttttat ttttactttt 1440 acaccggagc aaacctacca ggtgacacaa cacaaatacc agtagcagac ctattaccac 1500 taacaaaccc aagaataaac agaccaggac aatcactaaa tgaggcaaaa attacagacc 1560 atattacttt cacagaatac aaaaacaaat ttacaaatta ttggggtaac ccatttaata 1620 aacacattca agaacaccta gatatgatac tatactcact aaaaagtcca gaagcaataa 1680 aaaacgaatg gacaacagaa aacatgaaat ggaaccaatt aaacaatgca ggaacaatgg 1740 cattaacacc atttaacgag ccaatattca cacaaataca atataaccca gatagagaca 1800 caggagaaga cactcaatta tacctactct ctaacgctac aggaacagga tgggacccac 1860 caggaattcc agaattaata ctagaaggat ttccactatg gttaatatat tggggatttg 1920 cagactttca aaaaaaccta aaaaaagtaa caaacataga cacaaattac atgttagtag 1980 caaaaacaaa atttacacaa aaacctggca cattctactt agtaatacta aatgacacct 2040 ttgtagaagg caatagccca tatgaaaaac aacctttacc tgaagacaac attaaatggt 2100 acccacaagt acaataccaa ttagaagcac aaaacaaact actacaaact gggccattta 2160 caccaaacat acaaggacaa ctatcagaca atatatcaat gttttataaa ttttacttta 2220 aatggggagg aagcccacca aaagcaatta atgttgaaaa tcctgcccac cagattcaat 2280 atcccatacc ccgtaacgag catgaaacaa cttcgttaca gagtccaggg gaagccccag 2340 aatccatctt atactccttc gactatagac acgggaacta cacaacaaca gctttgtcac 2400 gaattagcca agactgggca cttaaagaca ctgtttctaa aattacagag ccagatcgac 2460 agcaactgct caaacaagcc ctcgaatgcc tgcaaatctc ggaagaaacg caggagaaaa 2520 aagaaaaaga agtacagcag ctcatcagca acctcagaca gcagcagcag ctgtacagag 2580 agcgaataat atcattatta aaggaccaat aacttttaac tgtgtaaaaa aggtgaaatt 2640 gtttgatgat aaaccaaaaa accgtagatt tacacctgag gaatttgaaa ctgagttaca 2700 aatagcaaaa tggttaaaga gacccccaag atcctttgta aatgatcctc ccttttaccc 2760 atggttacca cctgaacctg ttgtaaactt taagcttaat tttactgaat aaaggccagc 2820 attaattcac ttaaggagtc tgtttattta agttaaacct taataaacgg tcaccgcctc 2880 cctaatacgc aggcgcagaa agggggctcc gcccccttta acccccaggg ggctccgccc 2940 cctgaaaccc ccaagggggc tacgccccct tacaccccc 2979 <210> 55 <211> 99 <212> PRT <213> Betatorquevirus sp. <400> 55 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly <210> 56 <211> 203 <212> PRT <213> Betatorquevirus sp. <400> 56 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly Phe Asn Ile Pro Tyr Pro Val Thr Ser Met Lys Gln Leu 100 105 110 Arg Tyr Arg Val Gln Gly Lys Pro Gln Asn Pro Ser Tyr Thr Pro Ser 115 120 125 Thr Ile Asp Thr Gly Thr Thr Gln Gln Gln Leu Cys His Glu Leu Ala 130 135 140 Lys Thr Gly His Leu Lys Thr Leu Phe Leu Lys Leu Gln Ser Gln Ile 145 150 155 160 Asp Ser Asn Cys Ser Asn Lys Pro Ser Asn Ala Cys Lys Ser Arg Lys 165 170 175 Lys Arg Arg Arg Lys Lys Lys Lys Lys Tyr Ser Ser Ser Ser Ala Thr 180 185 190 Ser Asp Ser Ser Ser Ser Cys Thr Glu Ser Glu 195 200 <210> 57 <211> 219 <212> PRT <213> Betatorquevirus sp. <400> 57 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly Ala Arg Ser Thr Ala Thr Ala Gln Thr Ser Pro Arg Met 100 105 110 Pro Ala Asn Leu Gly Arg Asn Ala Gly Glu Lys Arg Lys Arg Ser Thr 115 120 125 Ala Ala His Gln Gln Pro Gln Thr Ala Ala Ala Ala Val Gln Arg Ala 130 135 140 Asn Asn Ile Ile Ile Lys Gly Pro Ile Thr Phe Asn Cys Val Lys Lys 145 150 155 160 Val Lys Leu Phe Asp Asp Lys Pro Lys Asn Arg Arg Phe Thr Pro Glu 165 170 175 Glu Phe Glu Thr Glu Leu Gln Ile Ala Lys Trp Leu Lys Arg Pro Pro 180 185 190 Arg Ser Phe Val Asn Asp Pro Pro Phe Tyr Pro Trp Leu Pro Pro Glu 195 200 205 Pro Val Val Asn Phe Lys Leu Asn Phe Thr Glu 210 215 <210> 58 <211> 666 <212> PRT <213> Betatorquevirus sp. <400> 58 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln 35 40 45 Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys 50 55 60 Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr 65 70 75 80 Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser 85 90 95 Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys 100 105 110 Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr 115 120 125 Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile 130 135 140 Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr 145 150 155 160 Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile 165 170 175 Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile 180 185 190 Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr 195 200 205 Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn 210 215 220 Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr 225 230 235 240 Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val 245 250 255 Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe 260 265 270 Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln 275 280 285 Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg 290 295 300 Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe 305 310 315 320 Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn 325 330 335 Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser 340 345 350 Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn 355 360 365 Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro 370 375 380 Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp 385 390 395 400 Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro 405 410 415 Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile 420 425 430 Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn 435 440 445 Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys 450 455 460 Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly 465 470 475 480 Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp 485 490 495 Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln 500 505 510 Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile 515 520 525 Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys 530 535 540 Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro 545 550 555 560 Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro 565 570 575 Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr 580 585 590 Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val 595 600 605 Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu 610 615 620 Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu 625 630 635 640 Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg 645 650 655 Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln 660 665 <210> 59 <211> 148 <212> PRT <213> Betatorquevirus sp. <400> 59 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr 35 40 45 Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser 50 55 60 Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile 65 70 75 80 Ser Gln Asp Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro 85 90 95 Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser 100 105 110 Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser 115 120 125 Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu 130 135 140 Leu Lys Asp Gln 145 <210> 60 <211> 82 <212> PRT <213> Betatorquevirus sp. <400> 60 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Ser Gln Ile Asp Ser Asn Cys Ser Asn Lys Pro Ser 35 40 45 Asn Ala Cys Lys Ser Arg Lys Lys Arg Arg Arg Lys Lys Lys Lys Lys 50 55 60 Tyr Ser Ser Ser Ser Ala Thr Ser Asp Ser Ser Ser Ser Cys Thr Glu 65 70 75 80 Ser Glu <210> 61 <400> 61 000 <210> 62 <400> 62 000 <210> 63 <400> 63 000 <210> 64 <400> 64 000 <210> 65 <400> 65 000 <210> 66 <400> 66 000 <210> 67 <400> 67 000 <210> 68 <400> 68 000 <210> 69 <400> 69 000 <210> 70 <400> 70 000 <210> 71 <400> 71 000 <210> 72 <400> 72 000 <210> 73 <400> 73 000 <210> 74 <400> 74 000 <210> 75 <400> 75 000 <210> 76 <400> 76 000 <210> 77 <400> 77 000 <210> 78 <400> 78 000 <210> 79 <400> 79 000 <210> 80 <400> 80 000 <210> 81 <400> 81 000 <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <400> 85 000 <210> 86 <400> 86 000 <210> 87 <400> 87 000 <210> 88 <400> 88 000 <210> 89 <400> 89 000 <210> 90 <400> 90 000 <210> 91 <400> 91 000 <210> 92 <400> 92 000 <210> 93 <400> 93 000 <210> 94 <400> 94 000 <210> 95 <400> 95 000 <210> 96 <400> 96 000 <210> 97 <400> 97 000 <210> 98 <400> 98 000 <210> 99 <400> 99 000 <210> 100 <400> 100 000 <210> 101 <400> 101 000 <210> 102 <400> 102 000 <210> 103 <400> 103 000 <210> 104 <400> 104 000 <210> 105 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 cgggtgccgk aggtgagttt acacaccgma gtcaaggggc aattcgggct crggactggc 60 cgggcyhtgg g 71 <210> 106 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctwtgg g 71 <210> 107 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 108 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggccctgg g 71 <210> 109 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctttgg g 71 <210> 110 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 111 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60 cgggctttgg g 71 <210> 112 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcyhtgg g 71 <210> 113 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 114 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcccggg 70 <210> 115 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60 cgggctttgg g 71 <210> 116 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60 ggccatggg 69 <210> 117 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 117 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggccccgg g 71 <210> 118 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 118 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 119 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 119 cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 120 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (10)..(10) <223> May or may not be present <220> <221> misc_feature <222> (12)..(12) <223> May or may not be present <220> <221> misc_feature <222> (30)..(32) <223> May or may not be present <220> <221> misc_feature <222> (34)..(34) <223> May or may not be present <220> <221> misc_feature <222> (43)..(46) <223> May or may not be present <220> <221> misc_feature <222> (52)..(54) <223> May or may not be present <220> <221> misc_feature <222> (70)..(71) <223> May or may not be present <220> <221> misc_feature <222> (89)..(90) <223> May or may not be present <220> <221> misc_feature <222> (103)..(103) <223> May or may not be present <400> 120 cggcggsggs gcsscgcgct dcgcgcgcsg cccrsyrggg grdssmmwgc skcscccccc 60 cscgcgcatg cgcrcgggkc ccccccccyv sggggggctc cgcccccccg gcccccc 117 <210> 121 <211> 169 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (22)..(22) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (40)..(42) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (53)..(56) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (62)..(62) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (64)..(64) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (97)..(98) <223> a, c, t, g, unknown or other <400> 121 gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60 sncncccccc cccgcgcatg cgcgggkccc ccccccnncg gggggctccg ccccccggcc 120 cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 169 <210> 122 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (22)..(22) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (40)..(42) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (53)..(56) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (62)..(62) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (64)..(64) <223> a, c, t, g, unknown or other <400> 122 gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60 sncncccccc cccgcgcat 79 <210> 123 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (18)..(19) <223> a, c, t, g, unknown or other <400> 123 gcgcgggkcc cccccccnnc ggggggctcc g 31 <210> 124 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 ccccccggcc cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 59 <210> 125 <211> 156 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 125 gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60 cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120 aacccaccgc gcatgcgcga ccacgccccc gccgcc 156 <210> 126 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 126 gcggcgg 7 <210> 127 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 gggggcg 7 <210> 128 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 gccgcg 6 <210> 129 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 ttcgcgcgcc gcccaccagg gggtg 25 <210> 130 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 ctgcg 5 <210> 131 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 131 cgcccccccc cgcgcat 17 <210> 132 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 132 gcgcggggcc ccccccc 17 <210> 133 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 133 gggggggctc cgcccccccg gccccccccc gtgctaaacc caccgcgcat gcgcgaccac 60 gcccccgccg cc 72 <210> 134 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 134 cggcggcggc ggcgcgcgcg ctgcgcgcgc gcgccggggg ggcgccagcg cccccccccc 60 cgcgcatgca cgggtccccc cccccacggg gggctccgcc ccccggcccc ccccc 115 <210> 135 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 cggcggcggc ggcg 14 <210> 136 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 cgcgcgctgc gcgcgcg 17 <210> 137 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 cgccgggggg gcgccagcg 19 <210> 138 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 cccccccccc cgcgcat 17 <210> 139 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 gcacgggtcc ccccccccac ggggggctcc g 31 <210> 140 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 140 ccccccggcc ccccccc 17 <210> 141 <211> 121 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 141 ccgtcggcgg gggggccgcg cgctgcgcgc gcggcccccg ggggaggcac agcctccccc 60 ccccgcgcgc atgcgcgcgg gtcccccccc ctccgggggg ctccgccccc cggccccccc 120 c 121 <210> 142 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 ccgtcggcgg gggggccgcg cgctgcgcgc gcggccc 37 <210> 143 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 ccgggggagg cacagcctcc cccccccgcg cgcatgcgcg cgggtccccc cccctccggg 60 gggctccgcc ccccggcccc cccc 84 <210> 144 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 144 cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60 gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104 <210> 145 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 cggcggcggc g 11 <210> 146 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 cgcgcgctac gcgcgcg 17 <210> 147 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 cgccgggggg 10 <210> 148 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 ctgccgc 7 <210> 149 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 cccccccccg cgcat 15 <210> 150 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 gcgcggggcc ccccccc 17 <210> 151 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 gcggggggct ccg 13 <210> 152 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 ccccccggcc cccc 14 <210> 153 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 153 gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60 cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120 cg 122 <210> 154 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 gccgccgcgg cggcggggg 19 <210> 155 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 gcggcgcgct gcgcgcgccg cccagtaggg ggagccatgc g 41 <210> 156 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 cccccccccg cgcat 15 <210> 157 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 gcgcggggcc ccccccc 17 <210> 158 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 gcggggggct ccg 13 <210> 159 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 ccccccggcc ccccccg 17 <210> 160 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 cgcgctgcgc gcgccgccca gtagggggag ccatgc 36 <210> 161 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 ccgccatctt aagtagttga ggcggacggt ggcgtgagtt caaaggtcac catcagccac 60 acctactcaa aatggtgg 78 <210> 162 <211> 172 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 162 cttaagtagt tgaggcggac ggtggcgtga gttcaaaggt caccatcagc cacacctact 60 caaaatggtg gacaatttct tccgggtcaa aggttacagc cgccatgtta aaacacgtga 120 cgtatgacgt cacggccgcc attttgtgac acaagatggc cgacttcctt cc 172 <210> 163 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 cgcgctgcgc gcgccgccca gtagggggag ccatgc 36 <210> 164 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 gcgctdcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 165 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36 <210> 166 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36 <210> 167 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 gcgctgcgcg cgcggccccc gggggaggca ttgcct 36 <210> 168 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36 <210> 169 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36 <210> 170 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 171 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 172 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36 <210> 173 <400> 173 000 <210> 174 <400> 174 000 <210> 175 <400> 175 000 <210> 176 <400> 176 000 <210> 177 <400> 177 000 <210> 178 <400> 178 000 <210> 179 <400> 179 000 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <400> 182 000 <210> 183 <400> 183 000 <210> 184 <400> 184 000 <210> 185 <211> 743 <212> PRT <213> Alphatorquevirus sp. <400> 185 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val 65 70 75 80 Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly 85 90 95 Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile 100 105 110 Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu 115 120 125 Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg 130 135 140 Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys 145 150 155 160 Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg 165 170 175 Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly 180 185 190 Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr 195 200 205 Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr 210 215 220 Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr 225 230 235 240 Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys 245 250 255 Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 260 265 270 Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser 275 280 285 Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly 290 295 300 Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly 305 310 315 320 Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys 325 330 335 Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp 340 345 350 Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile 355 360 365 Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu 370 375 380 Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu 385 390 395 400 Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro 405 410 415 Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp 420 425 430 Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn 435 440 445 Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro 450 455 460 Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr 465 470 475 480 Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro 485 490 495 Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr 500 505 510 Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser 515 520 525 Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu 530 535 540 His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala 545 550 555 560 Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe 565 570 575 Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp 580 585 590 Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro 595 600 605 Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser 610 615 620 Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile 625 630 635 640 Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly 645 650 655 Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu 660 665 670 Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu 675 680 685 Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe 690 695 700 Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln 705 710 715 720 Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val 725 730 735 His Val Asn Pro Cys Leu Arg 740 <210> 186 <211> 68 <212> PRT <213> Alphatorquevirus sp. <400> 186 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys 65 <210> 187 <211> 212 <212> PRT <213> Alphatorquevirus sp. <400> 187 Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys 1 5 10 15 Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe 20 25 30 Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro 35 40 45 Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe 50 55 60 Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn 65 70 75 80 Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His 85 90 95 Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly 100 105 110 Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu 115 120 125 Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly 130 135 140 Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp 145 150 155 160 Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile 165 170 175 Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr 180 185 190 Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn 195 200 205 Tyr Leu Ser Ile 210 <210> 188 <211> 133 <212> PRT <213> Alphatorquevirus sp. <400> 188 Asn Thr Phe Asn Asn Asp Asn Ser Asp Ser Lys Leu Lys Glu Phe Leu 1 5 10 15 Asn Lys Ala Phe Pro Thr Thr Gly Thr Lys Gly Thr Ser Leu Asn Ala 20 25 30 Leu Asn Thr Phe Arg Thr Glu Gly Cys Ile Ser His Pro Gln Leu Lys 35 40 45 Lys Pro Asn Pro Gln Ile Asn Lys Pro Leu Glu Ser Gln Tyr Phe Ala 50 55 60 Pro Leu Asp Ala Leu Trp Gly Asp Pro Ile Tyr Tyr Asn Asp Leu Asn 65 70 75 80 Glu Asn Lys Ser Leu Asn Asp Ile Ile Glu Lys Ile Leu Ile Lys Asn 85 90 95 Met Ile Thr Tyr His Ala Lys Leu Arg Glu Phe Pro Asn Ser Tyr Gln 100 105 110 Gly Asn Lys Ala Phe Cys His Leu Thr Gly Ile Tyr Ser Pro Pro Tyr 115 120 125 Leu Asn Gln Gly Arg 130 <210> 189 <211> 166 <212> PRT <213> Alphatorquevirus sp. <400> 189 Ile Ser Pro Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro 1 5 10 15 Tyr Thr Asp Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr 20 25 30 Lys Glu Asn Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr 35 40 45 Asp Met Pro Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys 50 55 60 Lys Asp Thr Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu 65 70 75 80 Ile Cys Pro Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp 85 90 95 Tyr Gly Tyr Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro 100 105 110 Asp Gly Ser Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro 115 120 125 Thr Val Leu His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly 130 135 140 Pro Phe Ala Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys 145 150 155 160 Tyr Cys Phe Asn Phe Asn 165 <210> 190 <211> 164 <212> PRT <213> Alphatorquevirus sp. <400> 190 Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp Pro Ser Phe 1 5 10 15 Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile 20 25 30 Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser 35 40 45 Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val 50 55 60 Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys 65 70 75 80 Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His 85 90 95 Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu 100 105 110 Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln 115 120 125 Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys 130 135 140 Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn 145 150 155 160 Pro Cys Leu Arg <210> 191 <400> 191 000 <210> 192 <400> 192 000 <210> 193 <400> 193 000 <210> 194 <400> 194 000 <210> 195 <400> 195 000 <210> 196 <400> 196 000 <210> 197 <400> 197 000 <210> 198 <400> 198 000 <210> 199 <400> 199 000 <210> 200 <400> 200 000 <210> 201 <400> 201 000 <210> 202 <400> 202 000 <210> 203 <400> 203 000 <210> 204 <400> 204 000 <210> 205 <400> 205 000 <210> 206 <400> 206 000 <210> 207 <400> 207 000 <210> 208 <400> 208 000 <210> 209 <400> 209 000 <210> 210 <400> 210 000 <210> 211 <400> 211 000 <210> 212 <400> 212 000 <210> 213 <400> 213 000 <210> 214 <400> 214 000 <210> 215 <211> 666 <212> PRT <213> Betatorquevirus sp. <400> 215 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln 35 40 45 Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys 50 55 60 Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr 65 70 75 80 Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser 85 90 95 Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys 100 105 110 Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr 115 120 125 Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile 130 135 140 Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr 145 150 155 160 Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile 165 170 175 Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile 180 185 190 Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr 195 200 205 Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn 210 215 220 Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr 225 230 235 240 Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val 245 250 255 Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe 260 265 270 Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln 275 280 285 Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg 290 295 300 Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe 305 310 315 320 Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn 325 330 335 Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser 340 345 350 Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn 355 360 365 Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro 370 375 380 Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp 385 390 395 400 Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro 405 410 415 Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile 420 425 430 Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn 435 440 445 Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys 450 455 460 Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly 465 470 475 480 Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp 485 490 495 Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln 500 505 510 Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile 515 520 525 Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys 530 535 540 Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro 545 550 555 560 Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro 565 570 575 Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr 580 585 590 Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val 595 600 605 Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu 610 615 620 Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu 625 630 635 640 Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg 645 650 655 Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln 660 665 <210> 216 <211> 38 <212> PRT <213> Betatorquevirus sp. <400> 216 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg 35 <210> 217 <211> 208 <212> PRT <213> Betatorquevirus sp. <400> 217 Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys 1 5 10 15 Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn 20 25 30 Leu Arg Leu Gly Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro 35 40 45 Val His Trp Pro Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu 50 55 60 Asp Ala Leu Tyr Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser 65 70 75 80 Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr 85 90 95 Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu 100 105 110 Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu 115 120 125 Met Met Met Met Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr 130 135 140 Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro 145 150 155 160 Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro 165 170 175 Leu Leu Gln Ile His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val 180 185 190 Lys Pro Asp Lys Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr 195 200 205 <210> 218 <211> 128 <212> PRT <213> Betatorquevirus sp. <400> 218 Ile Ser Ile Gln Asn Arg Asn Met Ser Val Asp Gln Gly Gln Ser Trp 1 5 10 15 Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe Tyr Phe Tyr Phe Tyr Thr 20 25 30 Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln Ile Pro Val Ala Asp Leu 35 40 45 Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg Pro Gly Gln Ser Leu Asn 50 55 60 Glu Ala Lys Ile Thr Asp His Ile Thr Phe Thr Glu Tyr Lys Asn Lys 65 70 75 80 Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn Lys His Ile Gln Glu His 85 90 95 Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser Pro Glu Ala Ile Lys Asn 100 105 110 Glu Trp Thr Thr Glu Asn Met Lys Trp Asn Gln Leu Asn Asn Ala Gly 115 120 125 <210> 219 <211> 163 <212> PRT <213> Betatorquevirus sp. <400> 219 Thr Met Ala Leu Thr Pro Phe Asn Glu Pro Ile Phe Thr Gln Ile Gln 1 5 10 15 Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu Tyr Leu Leu 20 25 30 Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro Pro Gly Ile Pro Glu Leu 35 40 45 Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile Tyr Trp Gly Phe Ala Asp 50 55 60 Phe Gln Lys Asn Leu Lys Lys Val Thr Asn Ile Asp Thr Asn Tyr Met 65 70 75 80 Leu Val Ala Lys Thr Lys Phe Thr Gln Lys Pro Gly Thr Phe Tyr Leu 85 90 95 Val Ile Leu Asn Asp Thr Phe Val Glu Gly Asn Ser Pro Tyr Glu Lys 100 105 110 Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp Tyr Pro Gln Val Gln Tyr 115 120 125 Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln Thr Gly Pro Phe Thr Pro 130 135 140 Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile Ser Met Phe Tyr Lys Phe 145 150 155 160 Tyr Phe Lys <210> 220 <211> 129 <212> PRT <213> Betatorquevirus sp. <400> 220 Trp Gly Gly Ser Pro Pro Lys Ala Ile Asn Val Glu Asn Pro Ala His 1 5 10 15 Gln Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr Thr Ser Leu 20 25 30 Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr 35 40 45 Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp 50 55 60 Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro Asp Arg Gln 65 70 75 80 Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr 85 90 95 Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser Asn Leu Arg 100 105 110 Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp 115 120 125 Gln <210> 221 <400> 221 000 <210> 222 <400> 222 000 <210> 223 <400> 223 000 <210> 224 <400> 224 000 <210> 225 <400> 225 000 <210> 226 <400> 226 000 <210> 227 <211> 220 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (29)..(31) <223> Any amino acid <220> <221> SITE <222> (29)..(31) <223> This region may encompass 0-3 residues <220> <221> MOD_RES <222> (100)..(100) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(129) <223> Any amino acid <220> <221> SITE <222> (125)..(129) <223> This region may encompass 1-5 residues <220> <221> MOD_RES <222> (181)..(181) <223> Any amino acid <220> <221> MOD_RES <222> (211)..(211) <223> Any amino acid <400> 227 Leu Val Leu Thr Gln Trp Gln Pro Asn Thr Val Arg Arg Cys Tyr Ile 1 5 10 15 Arg Gly Tyr Leu Pro Leu Ile Ile Cys Gly Glu Asn Xaa Xaa Xaa Thr 20 25 30 Thr Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Ile Gln Lys Gly 35 40 45 Pro Phe Gly Gly Gly Met Ser Thr Thr Thr Phe Ser Leu Arg Val Leu 50 55 60 Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg Trp Thr Tyr Ser Asn Glu 65 70 75 80 Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys Lys Phe Thr Phe Tyr Arg 85 90 95 His Pro Asp Xaa Asp Phe Ile Val Gln Tyr Asn Thr Asn Pro Pro Phe 100 105 110 Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile His Pro Xaa Xaa Xaa Xaa 115 120 125 Xaa Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser Leu 130 135 140 Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly Pro 145 150 155 160 Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys Asp 165 170 175 Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His Pro 180 185 190 Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val Leu 195 200 205 Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro 210 215 220 <210> 228 <211> 172 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (38)..(38) <223> Any amino acid <220> <221> MOD_RES <222> (44)..(46) <223> Any amino acid <220> <221> SITE <222> (44)..(46) <223> This region may encompass 0-3 residues <220> <221> MOD_RES <222> (77)..(77) <223> Any amino acid <220> <221> MOD_RES <222> (79)..(79) <223> Any amino acid <220> <221> MOD_RES <222> (98)..(101) <223> Any amino acid <220> <221> SITE <222> (98)..(101) <223> This region may encompass 0-4 residues <400> 228 Ser Asn Phe Glu Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro 1 5 10 15 Leu Thr Asp Lys Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr 20 25 30 Lys Pro Asp Thr Ile Xaa Asp Lys Thr Gln Ser Xaa Xaa Xaa Lys Cys 35 40 45 Leu Ile Glu Asp Leu Pro Leu Trp Ala Ala Leu Tyr Gly Tyr Val Asp 50 55 60 Phe Cys Glu Lys Glu Thr Gly Asp Ser Ala Ile Ile Xaa Asn Xaa Gly 65 70 75 80 Arg Val Leu Ile Arg Cys Pro Tyr Thr Lys Pro Pro Leu Tyr Asp Lys 85 90 95 Thr Xaa Xaa Xaa Xaa Asn Lys Gly Phe Val Pro Tyr Ser Thr Asn Phe 100 105 110 Gly Asn Gly Lys Met Pro Gly Gly Ser Gly Tyr Val Pro Ile Tyr Trp 115 120 125 Arg Ala Arg Trp Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu 130 135 140 Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr Lys Asp Glu Lys Pro Ser 145 150 155 160 Thr Gln Leu Val Met Lys Tyr Cys Phe Asn Phe Asn 165 170 <210> 229 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (20)..(22) <223> Any amino acid <220> <221> SITE <222> (20)..(22) <223> This region may encompass 0-3 residues <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (78)..(78) <223> Any amino acid <220> <221> MOD_RES <222> (89)..(89) <223> Any amino acid <220> <221> MOD_RES <222> (91)..(91) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(98) <223> Any amino acid <220> <221> SITE <222> (95)..(98) <223> This region may encompass 1-4 residues <220> <221> MOD_RES <222> (107)..(120) <223> Any amino acid <220> <221> SITE <222> (107)..(120) <223> This region may encompass 2-14 residues <220> <221> MOD_RES <222> (129)..(129) <223> Any amino acid <220> <221> MOD_RES <222> (139)..(168) <223> Any amino acid <220> <221> SITE <222> (139)..(168) <223> This region may encompass 0-30 residues <220> <221> MOD_RES <222> (201)..(204) <223> Any amino acid <220> <221> SITE <222> (201)..(204) <223> This region may encompass 0-4 residues <220> <221> MOD_RES <222> (219)..(258) <223> Any amino acid <220> <221> SITE <222> (219)..(258) <223> This region may encompass 0-40 residues <400> 229 Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro Cys Lys 1 5 10 15 Asp Ser Gly Xaa Xaa Xaa Ser Gly Xaa Gly Arg Gln Pro Arg Ser Val 20 25 30 Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser 35 40 45 Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met 50 55 60 Ser Glu Gln Pro Thr Asp Asp Glu Ile Phe Thr Gly Gly Xaa Pro Lys 65 70 75 80 Arg Pro Arg Arg Asp Pro Pro Thr Xaa Gln Xaa Pro Glu Glu Xaa Xaa 85 90 95 Xaa Xaa Gln Lys Glu Ser Ser Ser Phe Arg Xaa Xaa Xaa Xaa Xaa Xaa 100 105 110 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Glu Ser Ser Ser Gln Glu 115 120 125 Xaa Glu Ser Glu Ser Gln Glu Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa 130 135 140 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Gln Thr Val Gln Gln Gln Leu 165 170 175 Arg Gln Gln Leu Arg Glu Gln Arg Arg Leu Arg Val Gln Leu Gln Leu 180 185 190 Leu Phe Gln Gln Leu Leu Lys Thr Xaa Xaa Xaa Xaa Gln Ala Gly Leu 195 200 205 His Ile Asn Pro Leu Leu Leu Ser Gln Ala Xaa Xaa Xaa Xaa Xaa Xaa 210 215 220 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 225 230 235 240 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 245 250 255 Xaa Xaa <210> 230 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (136)..(136) <223> Any amino acid <220> <221> MOD_RES <222> (138)..(141) <223> Any amino acid <220> <221> SITE <222> (138)..(141) <223> This region may encompass 1-4 residues <220> <221> MOD_RES <222> (179)..(179) <223> Any amino acid <400> 230 Leu Lys Gln Trp Gln Pro Ser Thr Ile Arg Lys Cys Lys Ile Lys Gly 1 5 10 15 Tyr Leu Pro Leu Phe Gln Cys Gly Lys Gly Arg Ile Ser Asn Asn Tyr 20 25 30 Thr Gln Tyr Lys Glu Ser Ile Val Pro His His Glu Pro Gly Gly Gly 35 40 45 Gly Trp Ser Ile Gln Gln Phe Thr Leu Gly Ala Leu Tyr Glu Glu His 50 55 60 Leu Lys Leu Arg Asn Trp Trp Thr Lys Ser Asn Asp Gly Leu Pro Leu 65 70 75 80 Val Arg Tyr Leu Gly Cys Thr Ile Lys Leu Tyr Arg Ser Glu Asp Thr 85 90 95 Asp Tyr Ile Val Thr Tyr Gln Arg Cys Tyr Pro Met Thr Ala Thr Lys 100 105 110 Leu Thr Tyr Leu Ser Thr Gln Pro Ser Arg Met Leu Met Asn Lys His 115 120 125 Lys Ile Ile Val Pro Ser Lys Xaa Thr Xaa Xaa Xaa Xaa Asn Lys Lys 130 135 140 Lys Lys Pro Tyr Lys Lys Ile Phe Ile Lys Pro Pro Ser Gln Met Gln 145 150 155 160 Asn Lys Trp Tyr Phe Gln Gln Asp Ile Ala Asn Thr Pro Leu Leu Gln 165 170 175 Leu Thr Xaa Thr Ala Cys Ser Leu Asp Arg Met Tyr Leu Ser Ser Asp 180 185 190 Ser Ile Ser Asn Asn Ile Thr Phe Thr Ser Leu Asn Thr Asn Phe Phe 195 200 205 Gln Asn Pro Asn Phe Gln 210 <210> 231 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (1)..(10) <223> Any amino acid <220> <221> SITE <222> (1)..(10) <223> This region may encompass 4-10 residues <220> <221> MOD_RES <222> (38)..(45) <223> Any amino acid <220> <221> SITE <222> (38)..(45) <223> This region may encompass 1-8 residues <220> <221> MOD_RES <222> (94)..(94) <223> Any amino acid <220> <221> MOD_RES <222> (100)..(102) <223> Any amino acid <220> <221> SITE <222> (100)..(102) <223> This region may encompass 1-3 residues <220> <221> MOD_RES <222> (112)..(112) <223> Any amino acid <220> <221> MOD_RES <222> (114)..(115) <223> Any amino acid <220> <221> SITE <222> (114)..(115) <223> This region may encompass 0-2 residues <220> <221> MOD_RES <222> (124)..(139) <223> Any amino acid <220> <221> SITE <222> (124)..(139) <223> This region may encompass 3-16 residues <220> <221> MOD_RES <222> (154)..(154) <223> Any amino acid <400> 231 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Pro Leu Tyr Phe Glu 1 5 10 15 Cys Arg Tyr Asn Pro Phe Lys Asp Lys Gly Thr Gly Asn Lys Val Tyr 20 25 30 Leu Val Ser Asn Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Gly Trp 35 40 45 Asp Pro Pro Thr Asp Pro Asp Leu Ile Ile Glu Gly Phe Pro Leu Trp 50 55 60 Leu Leu Leu Trp Gly Trp Leu Asp Trp Gln Lys Lys Leu Gly Lys Ile 65 70 75 80 Gln Asn Ile Asp Thr Asp Tyr Ile Leu Val Ile Gln Ser Xaa Tyr Tyr 85 90 95 Ile Pro Pro Xaa Xaa Xaa Lys Leu Pro Tyr Tyr Val Pro Leu Asp Xaa 100 105 110 Asp Xaa Xaa Phe Leu His Gly Arg Ser Pro Tyr Xaa Xaa Xaa Xaa Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Ser Asp Lys Gln 130 135 140 His Trp His Pro Lys Val Arg Phe Gln Xaa Glu Thr Ile Asn Asn Ile 145 150 155 160 Ala Leu Thr Gly Pro Gly Thr Pro Lys Leu Pro Asn Gln Lys Ser Ile 165 170 175 Gln Ala His Met Lys Tyr Lys Phe Tyr Phe Lys 180 185 <210> 232 <211> 163 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (34)..(34) <223> Any amino acid <220> <221> MOD_RES <222> (65)..(65) <223> Any amino acid <220> <221> MOD_RES <222> (77)..(78) <223> Any amino acid <220> <221> MOD_RES <222> (86)..(87) <223> Any amino acid <220> <221> MOD_RES <222> (96)..(96) <223> Any amino acid <220> <221> MOD_RES <222> (102)..(106) <223> Any amino acid <220> <221> SITE <222> (102)..(106) <223> This region may encompass 0-5 residues <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (135)..(135) <223> Any amino acid <220> <221> MOD_RES <222> (138)..(163) <223> Any amino acid <220> <221> SITE <222> (138)..(163) <223> This region may encompass 0-26 residues <400> 232 Trp Gly Gly Cys Pro Ala Pro Met Glu Thr Ile Thr Asp Pro Cys Lys 1 5 10 15 Gln Pro Lys Tyr Pro Ile Pro Asn Asn Leu Leu Gln Thr Thr Ser Leu 20 25 30 Gln Xaa Pro Thr Thr Pro Ile Glu Thr Tyr Leu Tyr Lys Phe Asp Glu 35 40 45 Arg Arg Gly Leu Leu Thr Lys Lys Ala Ala Lys Arg Ile Lys Lys Asp 50 55 60 Xaa Thr Thr Glu Thr Thr Leu Phe Thr Asp Thr Gly Xaa Xaa Thr Ser 65 70 75 80 Thr Thr Leu Pro Thr Xaa Xaa Gln Thr Glu Thr Thr Gln Glu Glu Xaa 85 90 95 Thr Ser Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Glu Thr Leu Leu Gln Gln 100 105 110 Leu Gln Gln Leu Arg Arg Lys Gln Lys Gln Leu Arg Xaa Arg Ile Leu 115 120 125 Gln Leu Leu Gln Leu Leu Xaa Leu Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa 130 135 140 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa Xaa <210> 233 <211> 203 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (79)..(79) <223> Any amino acid <220> <221> MOD_RES <222> (104)..(104) <223> Any amino acid <220> <221> MOD_RES <222> (116)..(116) <223> Any amino acid <220> <221> MOD_RES <222> (120)..(121) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (170)..(170) <223> Any amino acid <400> 233 Thr Ile Pro Leu Lys Gln Trp Gln Pro Glu Ser Ile Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Tyr Gly Thr Leu Val Leu Gly Ala Glu Gly Arg Gln Phe 20 25 30 Tyr Cys Tyr Thr Asn Glu Lys Asp Glu Tyr Thr Pro Pro Lys Ala Pro 35 40 45 Gly Gly Gly Gly Phe Gly Val Glu Leu Phe Ser Leu Glu Tyr Leu Tyr 50 55 60 Glu Gln Trp Lys Ala Arg Asn Asn Ile Trp Thr Lys Ser Asn Xaa Tyr 65 70 75 80 Lys Asp Leu Cys Arg Tyr Thr Gly Cys Lys Ile Thr Phe Tyr Arg His 85 90 95 Pro Thr Thr Asp Phe Ile Val Xaa Tyr Ser Arg Gln Pro Pro Phe Glu 100 105 110 Ile Asp Lys Xaa Thr Tyr Met Xaa Xaa His Pro Gln Xaa Leu Leu Leu 115 120 125 Arg Lys His Lys Lys Ile Ile Leu Ser Lys Ala Thr Asn Pro Lys Gly 130 135 140 Lys Leu Lys Lys Lys Ile Lys Ile Lys Pro Pro Lys Gln Met Leu Asn 145 150 155 160 Lys Trp Phe Phe Gln Lys Gln Phe Ala Xaa Tyr Gly Leu Val Gln Leu 165 170 175 Gln Ala Ala Ala Cys Asx Leu Arg Tyr Pro Arg Leu Gly Cys Cys Asn 180 185 190 Glu Asn Arg Leu Ile Thr Leu Tyr Tyr Leu Asn 195 200 <210> 234 <211> 162 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (12)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (23)..(23) <223> Any amino acid <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> MOD_RES <222> (58)..(58) <223> I or L <220> <221> MOD_RES <222> (84)..(84) <223> Any amino acid <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(95) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(105) <223> Any amino acid <220> <221> MOD_RES <222> (111)..(111) <223> I or L <220> <221> MOD_RES <222> (113)..(113) <223> Any amino acid <220> <221> MOD_RES <222> (154)..(154) <223> Any amino acid <220> <221> MOD_RES <222> (156)..(156) <223> Any amino acid <400> 234 Leu Pro Ile Val Val Ala Arg Tyr Asn Pro Ala Xaa Asp Thr Gly Lys 1 5 10 15 Gly Asn Lys Xaa Trp Leu Xaa Ser Thr Leu Asn Gly Ser Xaa Trp Ala 20 25 30 Pro Pro Thr Thr Asp Lys Asp Leu Ile Ile Glu Gly Leu Pro Leu Trp 35 40 45 Leu Ala Leu Tyr Gly Tyr Trp Ser Tyr Xaa Lys Lys Val Lys Lys Asp 50 55 60 Lys Gly Ile Leu Gln Ser His Met Phe Val Val Lys Ser Pro Ala Ile 65 70 75 80 Gln Pro Leu Xaa Thr Ala Thr Thr Gln Xaa Thr Phe Tyr Pro Xaa Ile 85 90 95 Asp Asn Ser Phe Ile Gln Gly Lys Xaa Pro Tyr Asp Glu Pro Xaa Thr 100 105 110 Xaa Asn Gln Lys Lys Leu Trp Tyr Pro Thr Leu Glu His Gln Gln Glu 115 120 125 Thr Ile Asn Ala Ile Val Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp 130 135 140 Asn Gln Lys Asn Ser Thr Trp Glu Leu Xaa Tyr Xaa Tyr Thr Phe Tyr 145 150 155 160 Phe Lys <210> 235 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (16)..(16) <223> Any amino acid <220> <221> MOD_RES <222> (26)..(26) <223> Any amino acid <220> <221> MOD_RES <222> (33)..(33) <223> Any amino acid <220> <221> MOD_RES <222> (73)..(73) <223> Any amino acid <220> <221> MOD_RES <222> (81)..(82) <223> Any amino acid <220> <221> SITE <222> (81)..(82) <223> This region may encompass 0-2 residues <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (94)..(94) <223> Any amino acid <220> <221> MOD_RES <222> (119)..(124) <223> Any amino acid <220> <221> SITE <222> (119)..(124) <223> This region may encompass 1-6 residues <220> <221> MOD_RES <222> (168)..(177) <223> Any amino acid <220> <221> SITE <222> (168)..(177) <223> This region may encompass 1-10 residues <400> 235 Trp Gly Gly Pro Gln Ile Pro Asp Gln Pro Val Glu Asp Pro Lys Xaa 1 5 10 15 Gln Gly Thr Tyr Pro Val Pro Asp Thr Xaa Gln Gln Thr Ile Gln Ile 20 25 30 Xaa Asn Pro Leu Lys Gln Lys Pro Glu Thr Met Phe His Asp Trp Asp 35 40 45 Tyr Arg Arg Gly Ile Ile Thr Ser Thr Ala Leu Lys Arg Met Gln Glu 50 55 60 Asn Leu Glu Thr Asp Ser Ser Phe Xaa Ser Asp Ser Glu Glu Thr Pro 65 70 75 80 Xaa Xaa Lys Lys Lys Lys Arg Leu Thr Xaa Glu Leu Pro Xaa Pro Gln 85 90 95 Glu Glu Thr Glu Glu Ile Gln Ser Cys Leu Leu Ser Leu Cys Glu Glu 100 105 110 Ser Thr Cys Gln Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa Glu Asn Leu Gln 115 120 125 Gln Leu Ile His Gln Gln Gln Gln Gln Gln Gln Gln Leu Lys His Asn 130 135 140 Ile Leu Lys Leu Leu Ser Asp Leu Lys Glx Lys Gln Arg Leu Leu Gln 145 150 155 160 Leu Gln Thr Gly Ile Leu Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165 170 175 Xaa <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <400> 255 000 <210> 256 <400> 256 000 <210> 257 <400> 257 000 <210> 258 <400> 258 000 <210> 259 <400> 259 000 <210> 260 <400> 260 000 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 300 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 301 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 301 gcguacguca caagucacgu ggaggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 302 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 302 gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggug 77 <210> 303 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 303 gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugauuuguca cgugugua 78 <210> 304 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 304 cuuccggguc auaggucaca ccuacgucac aagucacgug gggaggguug gcguauagcc 60 cggaag 66 <210> 305 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 305 gccggggggc ugccgccccc cccggggaaa ggggggggcc ccccccgggg ggggguuugc 60 cccccggc 68 <210> 306 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 306 auacgucauc agucacgugg gggaaggcgu gccuaaaccc ggaagcaucc ucguccacgu 60 gacugugacg uguguggc 78 <210> 307 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 307 cauuuuaagu aaggcggaag cagcucggcg uacacaaaau ggcggcggag cacuuccggc 60 uugcccaaaa ugg 73 <210> 308 <211> 71 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 308 gucacaaguc acguggggag gguuggcguu uaacccggaa gccaauccuc uuacguggcc 60 ugucacguga c 71 <210> 309 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 309 cgaccgcguc ccgaaggcgg guacccgagg ugaguuuaca caccgagguu aagggccaau 60 ucgggcuugg 70 <210> 310 <211> 59 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 310 cgcgguaucg uagccgacgc ggaccccguu uucggggccc ccgcggggcu cucggcgcg 59 <210> 311 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 311 cgccauuuug ugauacgcgc guccccuccc ggcuuccgua caacgucagg cggggcgugg 60 ccguaucaga aaauggcg 78 <210> 312 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 312 gcuacgucau aagucacgug acugggcagg uacuaaaccc ggaaguaucc ucggucacgu 60 ggccugucac guaguug 77 <210> 313 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 313 ggcusugacg ucaaagucac gugggraggg uggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacagcc 80 <210> 314 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 314 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 gaaggu 66 <210> 315 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 315 gguugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 316 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 316 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 317 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 317 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 318 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 318 ggcugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 319 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 319 agaccacgug guaagucacg ugggggcagc ugcuguaaac ccggaaguag cugacccgcg 60 ugacugguca cgugaccug 79 <210> 320 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 320 cgccauuuua uaauacgcgc guccccuccc ggcuuccgua cuacgucagg cggggcgugg 60 ccguauuaga aaauggug 78 <210> 321 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 321 uaaguaaggc ggaaccaggc ugucacccug ugucaaaggu caagggacag ccuuccggcu 60 ugcacaaaau gg 72 <210> 322 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 322 ugccuacguc auaagucacg uggggacggc ugcuguaaac acggaaguag cugacccgcg 60 ugacuuguca cgugagca 78 <210> 323 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 323 uuguguaagg cggaacaggc ugacaccccg ugucaaaggu caggggucag ccuccgcuuu 60 gcaccaaaug gu 72 <210> 324 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 324 uaccuacguc auaagucacg ugggaagagc ugcugugaac cuggaaguag cugacccgcg 60 uggcuuguca cgugagugc 79 <210> 325 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 325 uuuuccuggc ccguccgcgg cgagagcgcg agcgaagcga gcgaucgggc gucccgaggg 60 cgggugccgg aggug 75 <210> 326 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 326 aaagugagug gggccagacu ucgccauagg gccuuuaacu uccgggugcg ucugggggcc 60 gccauuuu 68 <210> 327 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 327 gugacguuac ucucacguga ugggggcgug cucuaacccg gaagcauccu cgaccacgug 60 acugugacgu cac 73 <210> 328 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 328 agcgucuacu acguacacuu ccuggggugu guccugccac uguauauaaa ccagaggggu 60 gacgaauggu agagu 75 <210> 329 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 329 gugacgucaa agucacgugg ugacggccau uuuaacccgg aaguggcugu ugucacguga 60 cuugacguca cgg 73 <210> 330 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 330 gcuuuagacg ccauuuuagg cccucgcggg cacccguagg cgcguuuuaa ugacgucacg 60 gc 62 <210> 331 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 331 cacccguagg cgcguuuuaa ugacgucacg gcagccauuu ugucgugacg uuugagacac 60 gugauggggg cgu 73 <210> 332 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 332 gucgugacgu uugagacacg ugaugggggc gugccuaaac ccggaagcau cccuggucac 60 gugacucuga cgucacggcg 80 <210> 333 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 333 cgaaagugag uggggccaga cuucgccaua aggccuuuaa cuuccgggug cguguggggg 60 ccgccauuuu agcuucg 77 <210> 334 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 334 cugugacguc aaagucacgu ggggagggcg gcguguaacc cggaagucau ccucgucacg 60 ugaccugacg ucacgg 76 <210> 335 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 335 cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgua 60 gcggcggggg ggc 73 <210> 336 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 336 gguagaguuu uuuccgcccg uccgcagcga ggacgcgagc gcagcgagcg gccgagcgac 60 ccguggg 67 <210> 337 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 337 gcugugacgu uucagucacg uggggaggga acgccuaaac ccggaagcgu cccuggucac 60 gugauuguga cgucacggcc 80 <210> 338 <211> 63 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 338 ccgccauuuu gugacuuccu uccgcuuuuu caaaaaaaaa gaggaagugu gacguagcgg 60 cgg 63 <210> 339 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 339 gacugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacgg 78 <210> 340 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 340 cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgug 60 gcggcggggg ggc 73 <210> 341 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 341 gguugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 342 <211> 65 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 342 cccgccaucu ugugacuucc uuccgcuuuu ucaaaaaaaa agaggaagug ugacguagcg 60 gcggg 65 <210> 343 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 343 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 344 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 344 gacugugacg ucaaagucac guggggagga gggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacgg 78 <210> 345 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 345 ucgcgucuua gugacgucac ggcagccauc uugguccuga cgucacuguc acguggggag 60 gg 62 <210> 346 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 346 ugacgucacu gucacguggg gagggaacac gugaacccgg aagugucccu ggucacguga 60 caugacguca cggccg 76 <210> 347 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 347 cgccauuuua aguaagcaug gcgggcggug augucaaaug uuaaagguca cagccgguca 60 ugcuugcaca aaauggcg 78 <210> 348 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 348 cgccauuuua aguaagcaug gcgggcggug acgugcaaug ucaaagguca cagccuguca 60 ugcuugcaca aaauggcg 78 <210> 349 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 349 ccaucuuaag uaguugaggc ggacgguggc gucgguucaa aggucaccau cagccacacc 60 uacucaaaau gg 72 <210> 350 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 350 gccugucaug cuugcacaaa auggcggacu uccgcuuccg ggucgccgcc auauuugguc 60 acgugac 67 <210> 351 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 351 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 352 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 352 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 353 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 353 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 354 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 354 gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 355 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 355 gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugauuuguca cgugugua 78 <210> 356 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 356 gccauuuuaa gucagcucug gggaggcgug acuuccaguu caaaggucau ccucaccaua 60 acuggcacaa aauggc 76 <210> 357 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 357 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 358 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 358 gcauacguca caagucacgu ggaggggaca cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 359 <211> 79 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 359 gcgccauguu aaguggcugu cgccgaggau ugacgucaca guucaaaggu cauccucgac 60 gguaaccgca aacauggcg 79 <210> 360 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 360 caugcgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 361 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 361 uggcagcacu uccgaauggc ugaguuuucc acgcccgucc gcggagaggg agccacggag 60 gugaucccga acg 73 <210> 362 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 362 gccauuuuaa gucagcgcug gggaggcaug acuguaaguu caaaggucau ccucaccgga 60 acugacacaa aauggccg 78 <210> 363 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 363 gccaucuuaa guggcugucg ccgaggauug acgucacagu ucaaagguca uccucggcgg 60 uaaccgcaaa gauggcgguc 80 <210> 364 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 364 auacgucaua agucacaugu cuaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 365 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 365 ccauuuuaag uaaggcggaa gcagcugucc cuguaacaaa auggcggcga cagccuuccg 60 cuuugcacaa aauggag 77 <210> 366 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 366 gccaucuuaa guggcugucg cugaggauug acgucacagu ucaaagguca uccucggcgg 60 uaaccgcaaa gauggcgguc 80 <210> 367 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 367 cauacgucau aagucacaug acaggagucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 368 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 368 cgccaucuua aguggcuguc gccgaggauu ggcgucacag uucaaagguc auccucggcg 60 guaaccgcaa agauggcggu 80 <210> 369 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 369 cauacgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 370 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 370 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cguggugu 78 <210> 371 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 371 ccgccauuuu aggcuguugc cgggcguuug acuuccgugu uaaaggucaa acacccagcg 60 acaccaaaaa auggccg 77 <210> 372 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 372 cuacgucaua agucacguga cagggagggg cgacaaaccc ggaagucauc cucgcccacg 60 ugacuuacca cguggug 77 <210> 373 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 373 gccauuuuaa guaggugacg uccaggacug acguaaaguu caaaggucau ccucggcgga 60 accuauacaa aauggcg 77 <210> 374 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 374 cuacgucaua agucacgugg ggacggcugu acuuaaacac ggaaguaggc cccgucacgu 60 gauuuaccac guggug 76 <210> 375 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 375 gccauuuuaa guaaggcgga agagcucuag cuauacaaaa uggcggcgga gcacuuccgc 60 uuugcccaaa aug 73 <210> 376 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 376 gccauuuuaa guagcugacg ucaaggauug acguagaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggug 77 <210> 377 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 377 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 378 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 378 ggcgccauuu uaaguaagca uggcgggcgg cgacgucaca ugucaaaggu caccgcacuu 60 ccgugcuugc acaaaauggc 80 <210> 379 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 379 ugcuacguca ucgagacacg uggugccagc agcuguaaac ccggaagucg cugacacacg 60 ugucuuguca cgu 73 <210> 380 <211> 78 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 380 gccauuuuaa guaagcaccg ccuagggaug acguauaagu ucaaagguca uccucagccg 60 gaacuuacac aaaauggu 78 <210> 381 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 381 acgucauaug ucacgugggg aggcccugcu gcgcaaacgc ggaaguaggc cccgucacgu 60 gucauaccac gu 72 <210> 382 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 382 ccauuuuaag uaaggcggaa gcagcuccac uuucucacaa aauggcggcg gggcacuucc 60 ggcuugccca aaauggc 77 <210> 383 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 383 ccauuuuaag uaaggcggaa guuucuccac uauacaaaau ggcggcggag cacuuccggc 60 uugcccaaaa ug 72 <210> 384 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 384 ccaucuuaag uaguugaggc ggacgguggc gugaguucaa aggucaccau cagccacacc 60 uacucaaaau gg 72 <210> 385 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 385 cgccaucuua aguaguugag gcggacggug gcgugaguuc aaaggucacc aucagccaca 60 ccuacucaaa auggug 76 <210> 386 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 386 uuucggaccu ucggcgucgg gggggucggg ggcuuuacua aacagacucc gagaugccau 60 uggacacuga ggg 73 <210> 387 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 387 ccauuuuaag uaggugccgu ccagcacugc uguuccgggu uaaagggcau ccucggcgga 60 accuauacaa aauggc 76 <210> 388 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 388 cuacgucauc gaugacgugg ggaggcguac uaugaaacgc ggaaguaggc cccgcuacgu 60 caucaucacg ugg 73 <210> 389 <211> 73 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 389 ccauuuuaag uaaggcggaa gagcugcucu auauacaaaa uggcggagga gcacuuccgg 60 cuugcccaaa aug 73 <210> 390 <211> 75 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 390 ugccuacgua acaagucacg uggggagggu uggcguauaa cccggaaguc aauccuccca 60 cguggccugu cacgu 75 <210> 391 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 391 uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60 uacacaaaau gg 72 <210> 392 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 392 uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60 uacacaaaau gg 72 <210> 393 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 393 gcagccauuu uaagucagcu ucggggaggg ucacgcaaag uucaaagguc auccucaccg 60 gaacugguac aaaauggccg 80 <210> 394 <211> 74 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 394 ugcuacguca uaagugacgu agcugguguc ugcuguaaac acggaaguag gccccgccac 60 gucacuuguc acgu 74 <210> 395 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 395 aguagcugac gucaaggauu gac 23 <210> 396 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 396 caagucacgu ggaggggacc cg 22 <210> 397 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 397 aaguagcuga cgucaaggau ugacg 25 <210> 398 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 398 auaagucacg ugguggggac ccg 23 <210> 399 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 399 uggggagggu uggcguauag cccgga 26 <210> 400 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 400 ccccccccgg ggggggguuu gccc 24 <210> 401 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 401 aucagucacg ugggggaagg cgugc 25 <210> 402 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 402 aaguaaggcg gaagcagcuc gg 22 <210> 403 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 403 agucacgugg ggaggguugg c 21 <210> 404 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 404 cccgaaggcg gguacccgag gu 22 <210> 405 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 405 uaucguagcc gacgcggacc ccg 23 <210> 406 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 406 auuuugugau acgcgcgucc ccuccc 26 <210> 407 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 407 aagucacgug acugggcagg u 21 <210> 408 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 408 ugacgucaaa gucacguggg ragggu 26 <210> 409 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 409 gaucgagcgu cccgugggcg ggu 23 <210> 410 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 410 ugacgucaaa gucacguggg gagggcgg 28 <210> 411 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 411 gaucgagcgu cccgugggcg ggu 23 <210> 412 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 412 gaucgagcgu cccgugggcg ggu 23 <210> 413 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 413 ugacgucaaa gucacguggg gagggcgg 28 <210> 414 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 414 acgugguaag ucacgugggg gcagcu 26 <210> 415 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 415 auuuuauaau acgcgcgucc ccucc 25 <210> 416 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 416 aagggacagc cuuccggcuu gc 22 <210> 417 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 417 cauaagucac guggggacgg cugcu 25 <210> 418 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 418 uaaggcggaa caggcugaca cccc 24 <210> 419 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 419 uacgucauaa gucacguggg aagagcug 28 <210> 420 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 420 ucgggcgucc cgagggcggg ug 22 <210> 421 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 421 aaagugagug gggccagacu ucgcc 25 <210> 422 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 422 cucucacgug augggggcgu gc 22 <210> 423 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 423 ucuacuacgu acacuuccug gggugugu 28 <210> 424 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 424 uggcuguugu cacgugacuu ga 22 <210> 425 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 425 agacgccauu uuaggcccuc gcgg 24 <210> 426 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 426 ugucgugacg uuugagacac gugau 25 <210> 427 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 427 ugacguuuga gacacgugau gggggcgugc 30 <210> 428 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 428 agugaguggg gccagacuuc gc 22 <210> 429 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 429 ugugacguca aagucacgug gggagggcgg 30 <210> 430 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 430 aaaagaggaa guaugacgua gcggcgg 27 <210> 431 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 431 agcgagcggc cgagcgaccc g 21 <210> 432 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 432 uucagucacg uggggaggga acgc 24 <210> 433 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 433 aaaagaggaa gugugacgua gcgg 24 <210> 434 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 434 ugugacguca aagucacgug gggagggcgg 30 <210> 435 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 435 aaaagaggaa guaugacgug gcgg 24 <210> 436 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 436 ugacgucaaa gucacguggg gagggcgg 28 <210> 437 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 437 aaaaaagagg aagugugacg uagcggcgg 29 <210> 438 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 438 gaucgagcgu cccgugggcg ggu 23 <210> 439 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 439 ugugacguca aagucacgug gggaggaggg 30 <210> 440 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 440 uugguccuga cgucacuguc a 21 <210> 441 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 441 cgucacuguc acguggggag ggaacac 27 <210> 442 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 442 uaaguaagca uggcgggcgg ugau 24 <210> 443 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 443 aaguaagcau ggcgggcggu ga 22 <210> 444 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 444 uaaguaguug aggcggacgg uggc 24 <210> 445 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 445 ucaugcuugc acaaaauggc ggacuuccg 29 <210> 446 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 446 aguagcugac gucaaggauu gac 23 <210> 447 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 447 aguagcugac gucaaggauu gac 23 <210> 448 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 448 acaagucacg ugggggggac ccg 23 <210> 449 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 449 aaguagcuga cgucaaggau ugacg 25 <210> 450 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 450 auaagucacg ugguggggac ccg 23 <210> 451 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 451 aagucagcuc uggggaggcg ugacuu 26 <210> 452 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 452 aguagcugac gucaaggauu gac 23 <210> 453 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 453 caagucacgu ggaggggaca cg 22 <210> 454 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 454 uguuaagugg cugucgccga ggauuga 27 <210> 455 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 455 uaagucacau gacagggguc ca 22 <210> 456 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 456 cggagaggga gccacggagg ug 22 <210> 457 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 457 aagucagcgc uggggaggca uga 23 <210> 458 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 458 ucuuaagugg cugucgccga ggauugac 28 <210> 459 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 459 aagucacaug ucuagggguc cacu 24 <210> 460 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 460 aaguaaggcg gaagcagcug ucc 23 <210> 461 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 461 aucuuaagug gcugucgcug aggauugac 29 <210> 462 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 462 uaagucacau gacaggaguc cacu 24 <210> 463 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 463 aaguggcugu cgccgaggau ug 22 <210> 464 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 464 uaagucacau gacagggguc ca 22 <210> 465 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 465 acaagucacg ugggggggac ccg 23 <210> 466 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 466 auuuuaggcu guugccgggc guuugacu 28 <210> 467 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 467 auaagucacg ugacagggag ggg 23 <210> 468 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 468 aaguagguga cguccaggac u 21 <210> 469 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 469 cauaagucac guggggacgg cugu 24 <210> 470 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 470 uaaguaaggc ggaagagcuc uagcua 26 <210> 471 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 471 aguagcugac gucaaggauu gac 23 <210> 472 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 472 acaagucacg ugggggggac ccg 23 <210> 473 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 473 uaaguaagca uggcgggcgg cgac 24 <210> 474 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 474 aucgagacac guggugccag cagcu 25 <210> 475 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 475 ucauccucag ccggaacuua cacaaaaugg 30 <210> 476 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 476 auaugucacg uggggaggcc cugcug 26 <210> 477 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 477 aaguaaggcg gaagcagcuc cacuuu 26 <210> 478 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 478 aaguaaggcg gaaguuucuc cacu 24 <210> 479 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 479 uaaguaguug aggcggacgg uggc 24 <210> 480 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 480 uaaguaguug aggcggacgg ugg 23 <210> 481 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 481 gaccuucggc gucggggggg ucggggg 27 <210> 482 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 482 auccucggcg gaaccuaua 19 <210> 483 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 483 aucgaugacg uggggaggcg uacuau 26 <210> 484 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 484 uggcggagga gcacuuccgg cuug 24 <210> 485 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 485 aacaagucac guggggaggg uuggc 25 <210> 486 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 486 aggggucagc cuuccgcuuu a 21 <210> 487 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 487 aggggucagc cuuccgcuuu a 21 <210> 488 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 488 uaagucagcu ucggggaggg ucac 24 <210> 489 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 489 ucauaaguga cguagcuggu gucugcu 27 <210> 490 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 490 cauccucggc ggaagcuaca caa 23 <210> 491 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 491 ggccccguca cgugacuuac cac 23 <210> 492 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 492 ucauccucgg cggaagcuac acaa 24 <210> 493 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 493 ggccccguca cgugauuugu cac 23 <210> 494 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 494 ccgggucaua ggucacaccu acgucac 27 <210> 495 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 495 ggcugccgcc ccccccgggg aaaggggg 28 <210> 496 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 496 auccucgucc acgugacugu ga 22 <210> 497 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 497 gagcacuucc ggcuugccca a 21 <210> 498 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 498 caauccucuu acguggccug 20 <210> 499 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 499 cgagguuaag ggccaauucg ggcu 24 <210> 500 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 500 gggcccccgc ggggcucucg gcg 23 <210> 501 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 501 gcggggcgug gccguaucag aaaaugg 27 <210> 502 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 502 ccucggucac guggccugu 19 <210> 503 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 503 ccucgucacg ugaccugacg ucacag 26 <210> 504 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 504 ccguccgcgg cgagagcgcg agcga 25 <210> 505 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 505 auccucguca cgugaccuga cgucacg 27 <210> 506 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 506 ccguccgcgg cgagagcgcg agcga 25 <210> 507 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 507 ccguccgcgg cgagagcgcg agcga 25 <210> 508 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 508 auccucguca cgugaccuga cgucacg 27 <210> 509 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 509 cugacccgcg ugacugguca cguga 25 <210> 510 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 510 cggggcgugg ccguauuaga aaaugg 26 <210> 511 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 511 aguaaggcgg aaccaggcug ucacccugu 29 <210> 512 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 512 uagcugaccc gcgugacuug ucac 24 <210> 513 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 513 ggucagccuc cgcuuugca 19 <210> 514 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 514 gcugacccgc guggcuuguc acgugagu 28 <210> 515 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 515 ggcccguccg cggcgagagc gcgag 25 <210> 516 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 516 uccgggugcg ucugggggcc gccauuu 27 <210> 517 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 517 auccucgacc acgugacugu g 21 <210> 518 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 518 auaaaccaga ggggugacga augguagagu 30 <210> 519 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 519 caaagucacg uggugacggc cau 23 <210> 520 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 520 guaggcgcgu uuuaaugacg ucacgg 26 <210> 521 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 521 uaggcgcguu uuaaugacgu cacggcag 28 <210> 522 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 522 aucccugguc acgugacucu gacgucacg 29 <210> 523 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 523 gcgugugggg gccgccauuu uagcuu 26 <210> 524 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 524 ucauccucgu cacgugaccu gacgucacg 29 <210> 525 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 525 cgccaucuug ugacuuccuu ccgcuuuuu 29 <210> 526 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 526 uagaguuuuu uccgcccguc cg 22 <210> 527 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 527 gucccugguc acgugauugu gac 23 <210> 528 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 528 cauuuuguga cuuccuuccg cuuuuu 26 <210> 529 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 529 ucauccucgu cacgugaccu gacgucacg 29 <210> 530 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 530 ccgccaucuu gugacuuccu uccgcuuuuu 30 <210> 531 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 531 auccucguca cgugaccuga cgucacg 27 <210> 532 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 532 cgccaucuug ugacuuccuu ccgcuuuuuc 30 <210> 533 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 533 ccguccgcgg cgagagcgcg agcga 25 <210> 534 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 534 ucauccucgu cacgugaccu gacgucacg 29 <210> 535 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 535 cuuagugacg ucacggcagc cau 23 <210> 536 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 536 gucccugguc acgugacaug acguc 25 <210> 537 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 537 cacagccggu caugcuugca caaa 24 <210> 538 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 538 acagccuguc augcuugcac aa 22 <210> 539 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 539 caccaucagc cacaccuacu caaa 24 <210> 540 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 540 cgggucgccg ccauauuugg ucacguga 28 <210> 541 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 541 cauccucggc ggaagcuaca caa 23 <210> 542 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 542 cauccucggc ggaagcuaca caa 23 <210> 543 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 543 ggccccguca cgugacuuac cac 23 <210> 544 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 544 ucauccucgg cggaagcuac acaa 24 <210> 545 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 545 ggccccguca cgugauuugu cac 23 <210> 546 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 546 gucauccuca ccauaacugg cacaa 25 <210> 547 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 547 cauccucggc ggaagcuaca caa 23 <210> 548 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 548 ggccccguca cgugacuuac cac 23 <210> 549 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 549 auccucgacg guaaccgcaa acaug 25 <210> 550 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 550 ggccccgaca ugugacucgu c 21 <210> 551 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 551 agcacuuccg aauggcugag uuuucca 27 <210> 552 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 552 auccucaccg gaacugacac aa 22 <210> 553 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 553 cauccucggc gguaaccgca aagaug 26 <210> 554 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 554 uaggccccga caugugacuc gu 22 <210> 555 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 555 acagccuucc gcuuugcaca a 21 <210> 556 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 556 cauccucggc gguaaccgca aagaugg 27 <210> 557 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 557 uaggccccga caugugacuc guc 23 <210> 558 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 558 uccucggcgg uaaccgcaaa 20 <210> 559 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 559 ggccccgaca ugugacucgu c 21 <210> 560 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 560 ggccccguca cgugacuuac cac 23 <210> 561 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 561 ucaaacaccc agcgacacca aaaaaugg 28 <210> 562 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 562 ccucgcccac gugacuuacc ac 22 <210> 563 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 563 ccucggcgga accuauacaa 20 <210> 564 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 564 gccccgucac gugauuuacc ac 22 <210> 565 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 565 gcggcggagc acuuccgcuu ugcccaaa 28 <210> 566 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 566 cauccucggc ggaagcuaca caa 23 <210> 567 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 567 ggccccguca cgugacuuac cac 23 <210> 568 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 568 caccgcacuu ccgugcuugc acaaa 25 <210> 569 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 569 ucgcugacac acgugucuug ucac 24 <210> 570 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 570 cauuuuaagu aagcaccgcc uagggaugac 30 <210> 571 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 571 guaggccccg ucacguguca uaccac 26 <210> 572 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 572 ggcggggcac uuccggcuug cccaa 25 <210> 573 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 573 cggcggagca cuuccggcuu gcccaa 26 <210> 574 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 574 caccaucagc cacaccuacu caaa 24 <210> 575 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 575 accaucagcc acaccuacuc aaa 23 <210> 576 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 576 gacuccgaga ugccauugga cacugagg 28 <210> 577 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 577 aguaggugcc guccagca 18 <210> 578 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 578 aaguaggccc cgcuacguca ucaucac 27 <210> 579 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 579 aaggcggaag agcugcucua uau 23 <210> 580 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 580 caauccuccc acguggccug ucac 24 <210> 581 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 581 aaggcggaac caggcuguca ccccgu 26 <210> 582 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 582 aaggcggaac caggcuguca ccccgu 26 <210> 583 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 583 cauccucacc ggaacuggua caaa 24 <210> 584 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 584 uaggccccgc cacgucacuu gucacg 26 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <400> 600 000 <210> 601 <400> 601 000 <210> 602 <400> 602 000 <210> 603 <400> 603 000 <210> 604 <400> 604 000 <210> 605 <400> 605 000 <210> 606 <400> 606 000 <210> 607 <400> 607 000 <210> 608 <400> 608 000 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <400> 672 000 <210> 673 <400> 673 000 <210> 674 <400> 674 000 <210> 675 <400> 675 000 <210> 676 <400> 676 000 <210> 677 <400> 677 000 <210> 678 <400> 678 000 <210> 679 <400> 679 000 <210> 680 <400> 680 000 <210> 681 <400> 681 000 <210> 682 <400> 682 000 <210> 683 <400> 683 000 <210> 684 <400> 684 000 <210> 685 <400> 685 000 <210> 686 <400> 686 000 <210> 687 <400> 687 000 <210> 688 <400> 688 000 <210> 689 <400> 689 000 <210> 690 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 690 attcgaatgg ctgagtttat gc 22 <210> 691 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 691 cacgaattag ccaagactgg gcac 24 <210> 692 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 692 gctcccactc ctgatttctg 20 <210> 693 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 693 ccttgactac ggtggtttca c 21 <210> 694 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 694 tgcaggcatt cgagggcttg tt 22 <210> 695 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 695 tttaaccccc tagtcccagg 20 <210> 696 <400> 696 000 <210> 697 <400> 697 000 <210> 698 <400> 698 000 <210> 699 <400> 699 000 <210> 700 <400> 700 000 <210> 701 <400> 701 000 <210> 702 <400> 702 000 <210> 703 <400> 703 000 <210> 704 <400> 704 000 <210> 705 <400> 705 000 <210> 706 <400> 706 000 <210> 707 <400> 707 000 <210> 708 <400> 708 000 <210> 709 <400> 709 000 <210> 710 <400> 710 000 <210> 711 <400> 711 000 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (10)..(10) <223> May or may not be present <220> <221> misc_feature <222> (12)..(12) <223> May or may not be present <220> <221> misc_feature <222> (30)..(32) <223> May or may not be present <220> <221> misc_feature <222> (34)..(34) <223> May or may not be present <220> <221> misc_feature <222> (43)..(46) <223> May or may not be present <220> <221> misc_feature <222> (52)..(54) <223> May or may not be present <220> <221> misc_feature <222> (70)..(71) <223> May or may not be present <220> <221> misc_feature <222> (89)..(90) <223> May or may not be present <220> <221> misc_feature <222> (103)..(103) <223> May or may not be present <400> 743 cggcggsggs gcsscgcgct dcgcgcgcsg cccrsyrggg grdssmmwgc skcscccccc 60 cscgcgcatg cgcrcgggkc ccccccccyv sggggggctc cgcccccccg gcccccc 117 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <400> 750 000 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <400> 800 000 <210> 801 <211> 156 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 801 gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60 cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120 aacccaccgc gcatgcgcga ccacgccccc gccgcc 156 <210> 802 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 802 ccgagcgtta gcgaggagtg cgaccctacc ccctgggccc acttcttcgg agccgcgcgc 60 tacgccttcg gctgcgcgcg gcacctcaga cccccgctcg tgctgacacg cttgcgcgtg 120 tcagaccact tcgggctcgc gggggtcggg 150 <210> 803 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 803 gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60 cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120 cg 122 <210> 804 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 804 cggcccagcg gcggcgcgcg cgcttcgcgc gcgcgccggg gggctccgcc cccccccgcg 60 catgcgcggg gccccccccc gcggggggct ccgccccccg gtcccccccc g 111 <210> 805 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 805 cggccgtgcg gcggcgcgcg cgcttcgcgc gcgcgccggg ggctgccgcc cccccccgcg 60 catgcgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc ccccg 115 <210> 806 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 806 cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60 gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104 <210> 807 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 807 ggcggcggcg cgcgcgctac gcgcgcgcgc cggggagctc tgcccccccc cgcgcatgcg 60 cgcgggtccc ccccccgcgg ggggctccgc cccccggtcc cccccccg 108 <210> 808 <400> 808 000 <210> 809 <400> 809 000 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <400> 829 Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn 1 5 10 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <400> 838 000 <210> 839 <400> 839 000 <210> 840 <400> 840 000 <210> 841 <400> 841 000 <210> 842 <400> 842 000 <210> 843 <400> 843 000 <210> 844 <400> 844 000 <210> 845 <400> 845 000 <210> 846 <400> 846 000 <210> 847 <400> 847 000 <210> 848 <400> 848 000 <210> 849 <400> 849 000 <210> 850 <400> 850 000 <210> 851 <400> 851 000 <210> 852 <400> 852 000 <210> 853 <400> 853 000 <210> 854 <400> 854 000 <210> 855 <400> 855 000 <210> 856 <400> 856 000 <210> 857 <400> 857 000 <210> 858 <400> 858 000 <210> 859 <400> 859 000 <210> 860 <400> 860 000 <210> 861 <400> 861 000 <210> 862 <400> 862 000 <210> 863 <400> 863 000 <210> 864 <400> 864 000 <210> 865 <400> 865 000 <210> 866 <400> 866 000 <210> 867 <400> 867 000 <210> 868 <400> 868 000 <210> 869 <400> 869 000 <210> 870 <400> 870 000 <210> 871 <400> 871 000 <210> 872 <400> 872 000 <210> 873 <400> 873 000 <210> 874 <400> 874 000 <210> 875 <400> 875 000 <210> 876 <400> 876 000 <210> 877 <400> 877 000 <210> 878 <400> 878 000 <210> 879 <400> 879 000 <210> 880 <400> 880 000 <210> 881 <400> 881 000 <210> 882 <400> 882 000 <210> 883 <400> 883 000 <210> 884 <400> 884 000 <210> 885 <400> 885 000 <210> 886 <211> 3176 <212> DNA <213> Gammatorquevirus sp. <400> 886 taaaatggcg ggagccaatc attttatact ttcactttcc aattaaaaat ggccacgtca 60 caaacaaggg gtggagccat ttaaactata taactaagtg gggtggcgaa tggctgagtt 120 taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgccca 180 tgggcgggag ccgaggtgag tgaaaccacc gaggtctagg ggcaattcgg gctagggcag 240 tctagcggaa cgggcaagaa acttaaaaca atatttgttt tacagatggt tagtatatcc 300 tcaagtgatt tttttaagaa aacgaaattt aatgaggaga cgcagaacca agtatggatg 360 tctcaaattg ctgactctca tgataatatc tgcagttgct ggcatccatt tgctcacctt 420 cttgcttcca tatttcctcc tggccacaaa gatcgtgatc ttactattaa ccaaattctt 480 ctaagagatt ataaagaaaa atgccattct ggtggagaag aaggagaaaa ttctggacca 540 acaacaggtt taattacacc aaaagaagaa gatatagaaa aagatggccc agaaggcgcc 600 gcagaagaag accatacaga cgccctgttc gccgccgccg tagaaaactt cgaaaggtaa 660 agagaaaaaa aaaatcttta attgttagac aatggcaacc agacagtata agaacttgta 720 aaattatagg acagtcagct atagttgttg gggctgaagg aaagcaaatg tactgttata 780 ctgtcaataa gttaattaat gtgcccccaa aaacaccata tgggggaggc tttggagtag 840 accaatacac actgaaatac ttatatgaag aatacagatt tgcacaaaac atttggacac 900 aatctaatgt actgaaagac ttatgcagat acataaatgt taagctaata ttctacagag 960 acaacaaaac agactttgtc ctttcctatg acagaaaccc accttttcaa ctaacaaaat 1020 ttacataccc aggagcacac ccacaacaaa tcatgcttca aaaacaccac aaattcatac 1080 tatcacaaat gacaaagcct aatggaagac taacaaaaaa actcaaaatt aaacctccta 1140 aacaaatgct ttctaaatgg ttcttttcaa aacaattctg taaataccct ttactatctc 1200 ttaaagcttc tgcactagac cttaggcact cttacctagg ctgctgtaat gaaaatccac 1260 aggtattttt ttattattta aaccatggat actacacaat aacaaactgg ggagcacaat 1320 cctcaacagc atacagacct aactccaagg tgacagacac aacatactac agatacaaaa 1380 atgacagaaa aaatattaac attaaaagcc atgaatacga aaaaagtata tcatatgaaa 1440 acggttattt tcaatctagt ttcttacaaa cacagtgcat atataccagt gagcgtggtg 1500 aagcctgtat agcagaaaaa ccactaggaa tagctattta caatccagta aaagacaatg 1560 gagatggtaa tatgatatac cttgtaagca ctctagcaaa cacttgggac cagcctccaa 1620 aagacagtgc tattttaata caaggagtac ccatatggct aggcttattt ggatatttag 1680 actactgtag acaaattaaa gctgacaaaa catggctaga cagtcatgta ctagtaattc 1740 aaagtcctgc tatttttact tacccaaatc caggagcagg caaatggtat tgtccactat 1800 cacaaagttt tataaatggc aatggtccgt ttaatcaacc acctacactg ctacaaaaag 1860 caaagtggtt tccacaaata caataccaac aagaaattat taatagcttt gtagaatcag 1920 gaccatttgt tcccaaatat gcaaatcaaa ctgaaagcaa ctgggaacta aaatataaat 1980 atgtttttac atttaagtgg ggtggaccac aattccatga accagaaatt gctgacccta 2040 gcaaacaaga gcagtatgat gtccccgata ctttctacca aacaatacaa attgaagatc 2100 cagaaggaca agaccccaga tctctcatcc atgattggga ctacagacga ggctttatta 2160 aagaaagatc tcttaaaaga atgtcaactt acttctcaac tcatacagat cagcaagcaa 2220 cttcagagga agacattccc aaaaagaaaa agagaattgg accccaactc acagtcccac 2280 aacaaaaaga agaggagaca ctgtcatgtc tcctctctct ctgcaaaaaa gataccttcc 2340 aagaaacaga gacacaagaa gacctccagc agctcatcaa gcagcagcag gagcagcagc 2400 tcctcctcaa gagaaacatc ctccagctca tccacaaact aaaagagaat caacaaatgc 2460 ttcagcttca cacaggcatg ttaccttaac cagatttaaa cctggatttg aagagcaaac 2520 agagagagaa ttagcaatta tatttcatag gccccctaga acctacaaag aggaccttcc 2580 attctatccc tggctaccac ctgcacccct tgtacaattt aaccttaact tcaaaggcta 2640 ggccaacaat gtacacttag taaagcatgt ttattaaagc acaaccccca aaataaatgt 2700 aaaaataaaa aaaaaaaaaa aaaaataaaa aattgcaaaa attcggcgct cgcgcgcatg 2760 tgcgcctctg gcgcaaatca cgcaacgctc gcgcgcccgc gtatgtctct ttaccacgca 2820 cctagattgg ggtgcgcgcg ctagcgcgcg caccccaatg cgccccgccc tcgttccgac 2880 ccgcttgcgc gggtcggacc acttcgggct cgggggggcg cgcctgcggc gcttttttac 2940 taaacagact ccgagccgcc atttggcccc ctaagctccg cccccctcat gaatattcat 3000 aaaggaaacc acataattag aattgccgac cacaaactgc catatgctaa ttagttcccc 3060 ttttacaaag taaaagggga agtgaacata gccccacacc cgcaggggca aggccccgca 3120 cccctacgtc actaaccacg cccccgccgc catcttgggt gcggcagggc gggggc 3176 <210> 887 <211> 124 <212> PRT <213> Gammatorquevirus sp. <400> 887 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg 115 120 <210> 888 <211> 271 <212> PRT <213> Gammatorquevirus sp. <400> 888 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Ser Gly Val Asp His 115 120 125 Asn Ser Met Asn Gln Lys Leu Leu Thr Leu Ala Asn Lys Ser Ser Met 130 135 140 Met Ser Pro Ile Leu Ser Thr Lys Gln Tyr Lys Leu Lys Ile Gln Lys 145 150 155 160 Asp Lys Thr Pro Asp Leu Ser Ser Met Ile Gly Thr Thr Asp Glu Ala 165 170 175 Leu Leu Lys Lys Asp Leu Leu Lys Glu Cys Gln Leu Thr Ser Gln Leu 180 185 190 Ile Gln Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys Arg Lys 195 200 205 Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys Arg Arg 210 215 220 His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser Lys Lys 225 230 235 240 Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser Arg Ser 245 250 255 Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr Asn 260 265 270 <210> 889 <211> 267 <212> PRT <213> Gammatorquevirus sp. <400> 889 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg Ser Ala Ser Asn 115 120 125 Phe Arg Gly Arg His Ser Gln Lys Glu Lys Glu Asn Trp Thr Pro Thr 130 135 140 His Ser Pro Thr Thr Lys Arg Arg Gly Asp Thr Val Met Ser Pro Leu 145 150 155 160 Ser Leu Gln Lys Arg Tyr Leu Pro Arg Asn Arg Asp Thr Arg Arg Pro 165 170 175 Pro Ala Ala His Gln Ala Ala Ala Gly Ala Ala Ala Pro Pro Gln Glu 180 185 190 Lys His Pro Pro Ala His Pro Gln Thr Lys Arg Glu Ser Thr Asn Ala 195 200 205 Ser Ala Ser His Arg His Val Thr Leu Thr Arg Phe Lys Pro Gly Phe 210 215 220 Glu Glu Gln Thr Glu Arg Glu Leu Ala Ile Ile Phe His Arg Pro Pro 225 230 235 240 Arg Thr Tyr Lys Glu Asp Leu Pro Phe Tyr Pro Trp Leu Pro Pro Ala 245 250 255 Pro Leu Val Gln Phe Asn Leu Asn Phe Lys Gly 260 265 <210> 890 <211> 50 <212> PRT <213> Gammatorquevirus sp. <400> 890 Met Arg Arg Arg Arg Thr Lys Tyr Gly Cys Leu Lys Leu Leu Thr Leu 1 5 10 15 Met Ile Ile Ser Ala Val Ala Gly Ile His Leu Leu Thr Phe Leu Leu 20 25 30 Pro Tyr Phe Leu Leu Ala Thr Lys Ile Val Ile Leu Leu Leu Thr Lys 35 40 45 Phe Phe 50 <210> 891 <211> 662 <212> PRT <213> Gammatorquevirus sp. <400> 891 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln 50 55 60 Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala 65 70 75 80 Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn 85 90 95 Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly 100 105 110 Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala 115 120 125 Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr 130 135 140 Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val 145 150 155 160 Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr 165 170 175 Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe 180 185 190 Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu 195 200 205 Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys 210 215 220 Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp 225 230 235 240 Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe 245 250 255 Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala 260 265 270 Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr 275 280 285 Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His 290 295 300 Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser 305 310 315 320 Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys 325 330 335 Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp 340 345 350 Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr 355 360 365 Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro 370 375 380 Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys 385 390 395 400 Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro 405 410 415 Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro 420 425 430 Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro 435 440 445 Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln 450 455 460 Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr 465 470 475 480 Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe 485 490 495 Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp 500 505 510 Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr 515 520 525 Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His 530 535 540 Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg 545 550 555 560 Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu 565 570 575 Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val 580 585 590 Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys 595 600 605 Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln 610 615 620 Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile 625 630 635 640 Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu 645 650 655 His Thr Gly Met Leu Pro 660 <210> 892 <211> 215 <212> PRT <213> Gammatorquevirus sp. <400> 892 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala 50 55 60 Asp Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln 65 70 75 80 Thr Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile 85 90 95 His Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys 100 105 110 Arg Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser 115 120 125 Glu Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr 130 135 140 Val Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu 145 150 155 160 Cys Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln 165 170 175 Gln Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn 180 185 190 Ile Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln 195 200 205 Leu His Thr Gly Met Leu Pro 210 215 <210> 893 <211> 129 <212> PRT <213> Gammatorquevirus sp. <400> 893 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys 50 55 60 Arg Lys Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys 65 70 75 80 Arg Arg His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser 85 90 95 Lys Lys Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser 100 105 110 Arg Ser Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr 115 120 125 Asn <210> 894 <400> 894 000 <210> 895 <400> 895 000 <210> 896 <400> 896 000 <210> 897 <400> 897 000 <210> 898 <400> 898 000 <210> 899 <400> 899 000 <210> 900 <400> 900 000 <210> 901 <400> 901 000 <210> 902 <400> 902 000 <210> 903 <400> 903 000 <210> 904 <400> 904 000 <210> 905 <400> 905 000 <210> 906 <400> 906 000 <210> 907 <400> 907 000 <210> 908 <400> 908 000 <210> 909 <400> 909 000 <210> 910 <400> 910 000 <210> 911 <400> 911 000 <210> 912 <400> 912 000 <210> 913 <400> 913 000 <210> 914 <400> 914 000 <210> 915 <400> 915 000 <210> 916 <400> 916 000 <210> 917 <400> 917 000 <210> 918 <400> 918 000 <210> 919 <400> 919 000 <210> 920 <400> 920 000 <210> 921 <400> 921 000 <210> 922 <400> 922 000 <210> 923 <400> 923 000 <210> 924 <400> 924 000 <210> 925 <211> 662 <212> PRT <213> Gammatorquevirus sp. <400> 925 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln 50 55 60 Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala 65 70 75 80 Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn 85 90 95 Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly 100 105 110 Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala 115 120 125 Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr 130 135 140 Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val 145 150 155 160 Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr 165 170 175 Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe 180 185 190 Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu 195 200 205 Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys 210 215 220 Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp 225 230 235 240 Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe 245 250 255 Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala 260 265 270 Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr 275 280 285 Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His 290 295 300 Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser 305 310 315 320 Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys 325 330 335 Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp 340 345 350 Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr 355 360 365 Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro 370 375 380 Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys 385 390 395 400 Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro 405 410 415 Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro 420 425 430 Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro 435 440 445 Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln 450 455 460 Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr 465 470 475 480 Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe 485 490 495 Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp 500 505 510 Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr 515 520 525 Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His 530 535 540 Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg 545 550 555 560 Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu 565 570 575 Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val 580 585 590 Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys 595 600 605 Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln 610 615 620 Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile 625 630 635 640 Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu 645 650 655 His Thr Gly Met Leu Pro 660 <210> 926 <211> 58 <212> PRT <213> Gammatorquevirus sp. <400> 926 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys 50 55 <210> 927 <211> 202 <212> PRT <213> Gammatorquevirus sp. <400> 927 Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys 1 5 10 15 Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met 20 25 30 Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro 35 40 45 Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp 85 90 95 Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln 100 105 110 Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu 115 120 125 Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly 130 135 140 Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu 165 170 175 Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn 180 185 190 Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu 195 200 <210> 928 <211> 79 <212> PRT <213> Gammatorquevirus sp. <400> 928 Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr 1 5 10 15 Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr Tyr Tyr Arg Tyr 20 25 30 Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His Glu Tyr Glu Lys 35 40 45 Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser Phe Leu Gln Thr 50 55 60 Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys Ile Ala Glu 65 70 75 <210> 929 <211> 160 <212> PRT <213> Gammatorquevirus sp. <400> 929 Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp 1 5 10 15 Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr Trp Asp Gln 20 25 30 Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro Ile Trp Leu 35 40 45 Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys Ala Asp Lys 50 55 60 Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro Ala Ile Phe 65 70 75 80 Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro Leu Ser Gln 85 90 95 Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro Thr Leu Leu 100 105 110 Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln Glu Ile Ile 115 120 125 Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr Ala Asn Gln 130 135 140 Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe Thr Phe Lys 145 150 155 160 <210> 930 <211> 163 <212> PRT <213> Gammatorquevirus sp. <400> 930 Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp Pro Ser Lys 1 5 10 15 Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr Ile Gln Ile 20 25 30 Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His Asp Trp Asp 35 40 45 Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg Met Ser Thr 50 55 60 Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu Glu Asp Ile 65 70 75 80 Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val Pro Gln Gln 85 90 95 Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys Lys Lys Asp 100 105 110 Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln Leu Ile Lys 115 120 125 Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile Leu Gln Leu 130 135 140 Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu His Thr Gly 145 150 155 160 Met Leu Pro <210> 931 <400> 931 000 <210> 932 <400> 932 000 <210> 933 <400> 933 000 <210> 934 <400> 934 000 <210> 935 <400> 935 000 <210> 936 <400> 936 000 <210> 937 <400> 937 000 <210> 938 <400> 938 000 <210> 939 <400> 939 000 <210> 940 <400> 940 000 <210> 941 <400> 941 000 <210> 942 <400> 942 000 <210> 943 <400> 943 000 <210> 944 <400> 944 000 <210> 945 <400> 945 000 <210> 946 <400> 946 000 <210> 947 <400> 947 000 <210> 948 <400> 948 000 <210> 949 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> W or F <220> <221> MOD_RES <222> (2)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(20) <223> Any amino acid <400> 949 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa 1 5 10 15 Xaa Xaa Xaa Xaa His 20 <210> 950 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 950 Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Thr Arg Arg Cys Asn 1 5 10 15 Ile Val Gly Tyr Met Pro Leu Leu Ile Cys Gly Glu Asn Thr Val Ala 20 25 30 Thr Asn Tyr Ala Thr His Ser Asp Asp Ser Tyr Tyr Pro Gly Pro Phe 35 40 45 Gly Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ser Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Leu Gly Cys Thr Leu Tyr Cys Phe Arg His Pro 85 90 95 Glu Val Asp Phe Ile Ile Ile Ile Asn Thr Ser Pro Pro Phe Leu Asp 100 105 110 Thr Glu Ile Thr Gly Pro Ser Ile His Pro Gly Met Met Ala Leu Asn 115 120 125 Lys Arg Ser Arg Trp Ile Pro Ser Ile Lys Asn Arg Pro Gly Arg Lys 130 135 140 His Tyr Ile Lys Ile Lys Val Gly Ala Pro Arg Met Phe Thr Asp Lys 145 150 155 160 Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Phe 165 170 175 Ala Ser Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Thr Ile Val Val Ser Phe Gln Val Leu Gln Ser 195 200 <210> 951 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 951 Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Arg Arg Arg Cys Asn 1 5 10 15 Ile Val Gly Tyr Leu Pro Ile Leu Ile Cys Gly Gly Asn Thr Val Ser 20 25 30 Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Asn Tyr Pro Gly Pro Phe 35 40 45 Gly Gly Gly Met Thr Thr Asp Lys Phe Ser Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ala Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Leu Gly Cys Thr Phe Tyr Phe Phe Arg His Pro 85 90 95 Glu Val Asp Phe Ile Ile Lys Ile Asn Thr Met Pro Pro Phe Leu Asp 100 105 110 Thr Thr Ile Thr Ala Pro Ser Ile His Pro Gly Leu Met Ala Leu Asp 115 120 125 Lys Arg Ala Arg Trp Ile Pro Ser Leu Lys Asn Arg Pro Gly Lys Lys 130 135 140 His Tyr Ile Lys Ile Arg Val Gly Ala Pro Lys Met Phe Thr Asp Lys 145 150 155 160 Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Tyr 165 170 175 Ala Thr Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Thr Val Val Val Asn Ser Gln Val Leu Gln Ser 195 200 <210> 952 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 952 Lys Ile Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg Arg Cys Tyr 1 5 10 15 Ile Ile Gly Cys Leu Pro Leu Val Phe Cys Gly Glu Asn Thr Thr Ala 20 25 30 Gln Asn Tyr Ala Thr His Ser Asp Asp Met Ile Ser Lys Gly Pro Tyr 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Phe Thr Arg Phe Met Asn Phe Trp Thr Val Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Val Gly Cys Lys Leu Ile Phe Phe Lys His Pro 85 90 95 Thr Val Asp Phe Met Val Gln Ile Asn Thr Gln Pro Pro Phe Leu Asp 100 105 110 Thr Ser Leu Thr Ala Ala Ser Ile His Pro Gly Ile Met Met Leu Ser 115 120 125 Lys Arg Arg Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Arg Lys 130 135 140 His Arg Val Val Val Arg Val Gly Ala Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Asp Leu Cys Asp Thr Val Leu Leu Ser Ile Phe 165 170 175 Ala Thr Ala Arg Asp Leu Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Asn Pro Cys Val Asn Phe Gln Ile Leu Gly Pro 195 200 <210> 953 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 953 Lys Ile Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg Arg Cys Tyr 1 5 10 15 Ile Ile Gly Tyr Leu Pro Leu Ile Phe Cys Gly Glu Asn Thr Thr Ala 20 25 30 Asn Asn Phe Ala Thr His Ser Asp Asp Met Ile Ala Lys Gly Pro Trp 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Phe Thr Arg Phe Met Asn Phe Trp Thr Val Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Val Ser Cys Lys Leu Ile Phe Phe Lys His Pro 85 90 95 Thr Val Asp Phe Ile Val Arg Ile Asn Thr Glu Pro Pro Phe Leu Asp 100 105 110 Thr Asn Leu Thr Ala Ala Gln Ile His Pro Gly Ile Met Met Leu Ser 115 120 125 Lys Lys His Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Arg Lys 130 135 140 His Arg Val Val Val Arg Val Gly Pro Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Asp Leu Cys Asp Thr Val Leu Leu Ser Val Phe 165 170 175 Ala Thr Ala Cys Asp Leu Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Asn Pro Cys Val Asn Phe Gln Ile Leu Gly His 195 200 <210> 954 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 954 Lys Leu Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg His Cys Tyr 1 5 10 15 Ile Ile Gly Tyr Met Pro Leu Ile Ile Cys Gly Glu Asn Thr Phe Ser 20 25 30 His Asn Tyr Ala Thr His Ser Asp Asp Met Leu Ser Thr Gly Pro Tyr 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Phe Asp 50 55 60 Glu Tyr Gln Arg His Leu Asn Phe Trp Thr Val Ser Asn Gln Asp Leu 65 70 75 80 Asp Leu Ala Arg Tyr Leu Gly Thr Lys Ile Ile Phe Phe Arg His Pro 85 90 95 Thr Val Asp Phe Val Val Gln Ile His Thr Gln Pro Pro Phe Gln Asp 100 105 110 Thr Glu Ile Thr Ala Pro Ser Ile His Pro Gly Met Leu Ile Leu Ser 115 120 125 Lys Lys His Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Lys Lys 130 135 140 His Tyr Val Lys Val Arg Val Gly Ala Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Glu Leu Cys Asp Val Thr Leu Leu Val Ile Tyr 165 170 175 Ala Thr Ala Cys Asp Leu Gln Tyr Pro Phe Gly Ser Pro Gln Thr Asp 180 185 190 Asn Val Cys Val Asn Phe Gln Ile Leu Gly Gln 195 200 <210> 955 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 955 Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg His Cys Lys 1 5 10 15 Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr Gln 20 25 30 Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala Ser 35 40 45 Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile Tyr 50 55 60 Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His Asp 65 70 75 80 Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg His 85 90 95 Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe Glu 100 105 110 Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu Met Leu Leu 115 120 125 Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg Gly 130 135 140 Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn Asn 145 150 155 160 Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln Leu 165 170 175 Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser Thr 180 185 190 Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn 195 200 <210> 956 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 956 Thr Leu Val Leu Arg Gln Trp Gln Pro Asp Val Ile Arg His Cys Lys 1 5 10 15 Ile Thr Gly Arg Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr Gln 20 25 30 Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala Ser 35 40 45 Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile Tyr 50 55 60 Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His Asp 65 70 75 80 Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg His 85 90 95 Pro Asp Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe Glu 100 105 110 Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Leu Leu Met Leu Leu 115 120 125 Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg Gly 130 135 140 Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn Asn 145 150 155 160 Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln Leu 165 170 175 Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser Thr 180 185 190 Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn 195 200 <210> 957 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 957 Lys Leu Val Leu Thr Gln Trp Asn Pro Gln Thr Val Arg Lys Cys Val 1 5 10 15 Ile Arg Gly Phe Leu Pro Leu Phe Phe Cys Gly Gln Gly Ala Tyr His 20 25 30 Arg Asn Phe Thr Asp His Tyr Asp Asp Val Phe Pro Lys Gly Pro Ser 35 40 45 Gly Gly Gly His Gly Ser Met Val Phe Asn Leu Ser Phe Leu Tyr Gln 50 55 60 Glu Phe Lys Lys His His Asn Lys Trp Ser Arg Ser Asn Leu Asp Phe 65 70 75 80 Asp Leu Val Arg Tyr Lys Gly Thr Val Ile Lys Leu Tyr Arg His Gln 85 90 95 Asp Phe Asp Tyr Ile Val Trp Ile Ser Arg Thr Pro Pro Phe Gln Glu 100 105 110 Ser Leu Leu Thr Val Met Thr His Gln Pro Ser Val Met Leu Gln Ala 115 120 125 Lys Lys Cys Ile Ile Val Lys Ser Tyr Arg Thr His Pro Gly Gly Lys 130 135 140 Pro Tyr Val Thr Ala Lys Val Arg Pro Pro Arg Leu Leu Thr Asp Lys 145 150 155 160 Trp Tyr Phe Gln Ser Asp Phe Cys Asn Val Pro Leu Phe Ser Leu Gln 165 170 175 Phe Ala Leu Ala Glu Leu Arg Phe Pro Ile Cys Ser Pro Gln Thr Asp 180 185 190 Thr Asn Cys Ile Asn Phe Leu Val Leu Asp Asp 195 200 <210> 958 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 958 Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys Arg 1 5 10 15 Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe Ala 20 25 30 Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro Phe 35 40 45 Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe Glu 50 55 60 Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn Leu 65 70 75 80 Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His Pro 85 90 95 Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly Gly 100 105 110 Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu Ala 115 120 125 Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly Arg 130 135 140 Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp Lys 145 150 155 160 Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile Met 165 170 175 Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr Asp 180 185 190 Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 195 200 <210> 959 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 959 Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr Val Arg Asn Cys Ser 1 5 10 15 Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly His Thr Lys Ala Gly 20 25 30 Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr Thr Gln Ile Gln Pro 35 40 45 Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser Leu Lys Val Leu Trp 50 55 60 Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser Tyr Pro Asn Thr Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe Trp Phe Tyr Arg Asp 85 90 95 Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg Asn Pro Pro Phe Lys 100 105 110 Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro Gly Met Met Met Gln 115 120 125 Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln Thr Arg Pro Lys Gly 130 135 140 Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro Asn Met Phe Ala Asp 145 150 155 160 Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val Pro Leu Val Gln Ile 165 170 175 Val Val Ser Ala Ala Ser Leu Leu His Pro Phe Cys Pro Pro Gln Thr 180 185 190 Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys Asp 195 200 <210> 960 <211> 205 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 960 Lys Leu Val Leu Thr Gln Trp His Pro Asn Thr Met Arg Arg Cys Leu 1 5 10 15 Ile Lys Gly Ile Val Pro Leu Val Ile Cys Gly His Thr Arg Trp Asn 20 25 30 Tyr Asn Tyr Ala Leu His Ser Lys Asp Tyr Thr Glu Glu Gly Arg Tyr 35 40 45 Pro His Gly Gly Ala Leu Ser Thr Thr Thr Trp Ser Leu Lys Val Leu 50 55 60 Tyr Asp Glu His Leu Lys His His Asp Phe Trp Gly Tyr Pro Asn Asn 65 70 75 80 Gln Leu Asp Leu Ala Arg Tyr Lys Gly Ala Lys Phe Thr Phe Tyr Arg 85 90 95 His Lys Lys Thr Asp Phe Ile Ile Phe Phe Asn Arg Lys Pro Pro Phe 100 105 110 Lys Leu Asn Lys Tyr Ser Cys Ala Ser Tyr His Pro Gly Met Leu Met 115 120 125 Gln Gln Arg His Lys Ile Leu Leu Pro Ser Tyr Glu Thr Lys Pro Lys 130 135 140 Gly Arg Pro Lys Ile Thr Val Arg Ile Lys Pro Pro Thr Leu Leu Glu 145 150 155 160 Asp Lys Trp Tyr Thr Gln Gln Asp Leu Cys Asp Val Asn Leu Leu Gln 165 170 175 Leu Val Val Thr Ala Ala Asp Phe Arg His Pro Leu Cys Ser Pro Gln 180 185 190 Thr Asn Thr Pro Thr Thr Thr Phe Gln Val Leu Lys Asp 195 200 205 <210> 961 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 961 Arg Leu Ile Leu Arg Gln Trp Gln Pro Ala Thr Arg Arg Arg Cys Thr 1 5 10 15 Ile Thr Gly Tyr Leu Pro Ile Val Phe Cys Gly His Thr Arg Gly Asn 20 25 30 Lys Asn Tyr Ala Leu His Ser Asp Asp Tyr Thr Pro Gln Gly Gln Pro 35 40 45 Phe Gly Gly Ala Leu Ser Thr Thr Ser Phe Ser Leu Lys Val Leu Phe 50 55 60 Asp Gln His Gln Arg Gly Leu Asn Lys Trp Ser Phe Pro Asn Asp Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Cys Lys Phe Ile Phe Tyr Arg Thr 85 90 95 Lys Gln Thr Asp Trp Val Gly Gln Tyr Asp Ile Ser Glu Pro Tyr Lys 100 105 110 Leu Asp Lys Tyr Ser Cys Pro Asn Tyr His Pro Gly Asn Met Ile Lys 115 120 125 Ala Lys His Lys Phe Leu Ile Pro Ser Tyr Asp Thr Asn Pro Arg Gly 130 135 140 Arg Gln Lys Ile Ile Val Lys Ile Pro Pro Pro Asp Leu Phe Val Asp 145 150 155 160 Lys Trp Tyr Thr Gln Glu Asp Leu Cys Ser Val Asn Leu Val Ser Leu 165 170 175 Ala Val Ser Ala Ala Ser Phe Leu His Pro Phe Gly Ser Pro Gln Thr 180 185 190 Asp Asn Pro Cys Tyr Thr Phe Gln Val Leu Lys Glu 195 200 <210> 962 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 962 Lys Leu Ile Leu Thr Gln Trp Asn Pro Ala Ile Val Lys Arg Cys Asn 1 5 10 15 Ile Lys Gly Gly Leu Pro Ile Ile Ile Cys Gly Glu Pro Arg Ala Ala 20 25 30 Phe Asn Tyr Gly Tyr His Met Glu Asp Tyr Thr Pro Gln Pro Phe Pro 35 40 45 Phe Gly Gly Gly Met Ser Thr Val Thr Phe Ser Leu Lys Ala Leu Tyr 50 55 60 Asp Gln Tyr Leu Lys His Gln Asn Arg Trp Thr Phe Ser Asn Asp Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Cys Lys Leu Arg Phe Tyr Arg Ser 85 90 95 Pro Val Cys Asp Phe Ile Val His Tyr Asn Leu Ile Pro Pro Leu Lys 100 105 110 Met Asn Gln Phe Thr Ser Pro Asn Thr His Pro Gly Leu Leu Met Leu 115 120 125 Ser Lys His Lys Ile Ile Ile Pro Ser Phe Gln Thr Arg Pro Gly Gly 130 135 140 Arg Arg Phe Val Lys Ile Arg Leu Asn Pro Pro Lys Leu Phe Glu Asp 145 150 155 160 Lys Trp Tyr Thr Gln Gln Asp Leu Cys Lys Val Pro Leu Val Ser Ile 165 170 175 Thr Ala Thr Ala Ala Asp Leu Arg Tyr Pro Phe Cys Ser Pro Gln Thr 180 185 190 Asn Asn Pro Cys Thr Thr Phe Gln Val Leu Arg Lys 195 200 <210> 963 <211> 203 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 963 Lys Ile Val Leu Thr Gln Trp Asn Pro Gln Thr Thr Arg Lys Cys Ile 1 5 10 15 Ile Arg Gly Met Met Pro Val Leu Trp Ala Gly Met Gly Thr Gly Gly 20 25 30 Arg Asn Tyr Ala Val Arg Ser Asp Asp Tyr Val Val Asn Lys Gly Phe 35 40 45 Gly Gly Ser Phe Ala Thr Glu Thr Phe Ser Leu Lys Val Leu Tyr Asp 50 55 60 Gln Phe Gln Arg Gly Phe Asn Arg Trp Ser His Thr Asn Glu Asp Leu 65 70 75 80 Asp Leu Ala Arg Tyr Arg Gly Cys Arg Trp Thr Phe Tyr Arg His Lys 85 90 95 Asp Thr Asp Phe Ile Val Tyr Phe Thr Asn Asn Pro Pro Met Lys Thr 100 105 110 Asn Gln Phe Ser Ala Pro Leu Thr Thr Pro Gly Met Leu Met Arg Ser 115 120 125 Lys Tyr Lys Val Leu Ile Pro Ser Phe Gln Thr Arg Pro Lys Gly Arg 130 135 140 Lys Thr Val Thr Val Lys Ile Arg Pro Pro Lys Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Thr Gln Gln Asp Leu Cys Ser Val Pro Leu Val Gln Leu Asn 165 170 175 Val Thr Ala Ala Asp Phe Thr His Pro Phe Gly Ser Pro Leu Thr Glu 180 185 190 Thr Pro Cys Val Glu Phe Gln Val Leu Gly Asp 195 200 <210> 964 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 964 Lys Leu Asn Ile Lys Glu Trp Gln Pro Ile Thr Ile Arg Lys Thr Lys 1 5 10 15 Val Lys Gly Leu Tyr Pro Ala Phe Leu Cys Asn Asp Gln Arg Ile Gly 20 25 30 Asn Asn Ala Ile Gln Tyr Leu Asp Ser Ile Ala Pro His His Phe Pro 35 40 45 Gly Gly Gly Gly Phe Gly Ile Ile Gln Phe Thr Leu Gln Gly Leu Tyr 50 55 60 Glu Gln Phe Ile Lys Ala Thr Asn Trp Trp Thr Gln Thr Asn Cys Ser 65 70 75 80 Leu Pro Leu Ile Arg Tyr Asn Phe Cys Lys Leu Lys Phe Tyr Arg Thr 85 90 95 Ala Asn Val Asp Tyr Val Val Lys Ile Ile Arg Cys Tyr Pro Leu Lys 100 105 110 Ala Thr His Asp Leu Tyr Met Gln Thr Gln Pro Ser Ile Leu Met Arg 115 120 125 Asp Lys His Ser Ile Leu Ile Pro Cys Met Lys Asn Gly Arg Asn Arg 130 135 140 Lys Thr Tyr Lys Thr Ile Lys Val Arg Pro Pro Thr Gln Met Thr Asn 145 150 155 160 Gly Trp Phe Phe Gln Lys Asp Leu Cys Asn Phe Pro Leu Leu Val Ile 165 170 175 Leu Ala Thr Ala Ala Ser Phe Asp Arg Tyr Tyr Thr Asn Ser Lys Ala 180 185 190 Lys Ser Thr Thr Ile Gly Phe Ile Ser Leu Asn Thr 195 200 <210> 965 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 965 Lys Ile Arg Ile Ser Glu Trp Gln Pro Thr Lys Ile Ile Lys Ser Lys 1 5 10 15 Val Lys Gly Ile Tyr Pro Cys Phe Leu Ser Asn His Lys Arg Leu Ser 20 25 30 Asn Asn Phe Val Gln Trp Ile Asp Ser Thr Thr Ala His Leu Met Pro 35 40 45 Gly Gly Gly Gly Phe Gly Ile Ile Gln Phe Thr Leu Asn Gly Leu Tyr 50 55 60 Glu Leu Phe Cys Lys Ala Gln Asn Trp Trp Thr Lys Ser Asn Cys Asn 65 70 75 80 Leu Pro Leu Val Arg Phe Cys Gly Thr Thr Leu Lys Phe Trp Ala Ala 85 90 95 Glu Asn Tyr Asp Tyr Val Val His Ile Gln Arg Cys Tyr Pro Met Cys 100 105 110 Cys Thr Asp Leu Met Tyr Met Ser Cys Gln Pro Phe Ile Met Met Met 115 120 125 Thr Lys Asn Thr Ile Phe Val Pro Cys Thr Lys Asn Lys Pro Arg Ala 130 135 140 Lys Arg Tyr Lys Lys Ile Phe Val Lys Pro Pro Ala Gln Met Thr Thr 145 150 155 160 Gln Trp Tyr Phe Gln Ser Gln Leu Ala Lys Thr Gly Leu Ile Ile Ile 165 170 175 Arg Thr Ala Ala Cys Ser Leu Asp Arg Ile Tyr Thr Ser Ser Thr Ala 180 185 190 Ser Ser Thr Thr Ile Gly Leu Val Ser Leu His Thr 195 200 <210> 966 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 966 Thr Ile Arg Leu Arg Gln Trp Asn Pro Arg Thr Thr Arg Leu Cys Lys 1 5 10 15 Ile Lys Gly His Ile Pro Leu Ile Ile Cys Gly Arg Asp Arg Gln Ile 20 25 30 Phe Asn Trp Met Gln Tyr Tyr Asp Ser Ile Gly Pro Val Glu Gln Ser 35 40 45 Gly Gly Gly Gly Trp Ser Ser Ile Val Phe Ser Leu Gly Ala Leu Tyr 50 55 60 Gln Gln Phe Lys Arg Leu Met Asn Trp Trp Thr Lys Asp Asn Asp Gly 65 70 75 80 Leu Pro Leu Val Gln Tyr Arg Gly Cys Lys Phe Lys Phe Tyr Lys Ser 85 90 95 Trp Asp Cys Asp Tyr Ile Val Thr Ala Gln Thr Cys Pro Pro Met Thr 100 105 110 Asp Thr Glu Tyr Lys His Leu Asp Ser His Pro Tyr Arg Gln Leu Met 115 120 125 Asn Lys Arg Pro Ile Ile Val Pro Asn Leu Val Arg Lys Pro Ser Lys 130 135 140 Lys Thr Tyr Lys Ile Lys Arg Phe Pro Pro Pro Ser Leu Leu Gln Asn 145 150 155 160 Lys Trp Tyr Phe Gln Gln Asp Phe Cys Ala Thr Asn Leu Leu Met Leu 165 170 175 Thr Thr Ser Ala Ala Ser Phe Asp Gln Phe Trp Leu Pro Asn Asp Glu 180 185 190 Ile Ser Gln Val Ile Thr Phe His Ser Leu Asn Thr 195 200 <210> 967 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 967 Lys Ile Ile Leu Lys Gln Phe Gln Pro Gln Thr Ile Lys Arg Val Lys 1 5 10 15 Ile Lys Arg Leu Glu Cys Leu Phe His Cys Asn Ala Lys Lys Ile Tyr 20 25 30 Phe Asn Leu Gln Met Tyr Glu Thr Ser Thr Val Pro Pro His Leu Pro 35 40 45 Gly Gly Gly Gly Trp Ser Cys Lys Val Phe Thr Leu Asn Ala Leu Tyr 50 55 60 Asp Ala Phe Lys His Cys Arg Asn Val Trp Thr Gly Ser Asn His Asn 65 70 75 80 Leu Pro Leu Val Arg Tyr Met Gly Cys Lys Phe Thr Leu Tyr Gln Ser 85 90 95 Glu Thr Gln Asp Tyr Val Phe Lys Tyr Gln Asn His Tyr Pro Met Val 100 105 110 Ser Thr Ile Glu Ser Tyr Asn Ala Cys Gln Pro Ser Met Leu Met Met 115 120 125 Asp Asn Arg Thr Lys Lys Ile Pro Ser Lys Lys Thr Lys His Lys Arg 130 135 140 Lys Pro Tyr Thr Ile Val Lys Ile Arg Pro Pro Ala Gln Met Gln Asn 145 150 155 160 Lys Trp Tyr Phe Thr His Asp Ile Ala Asn Thr Pro Leu Leu Leu Ile 165 170 175 Tyr Ser Ala Ala Cys Ser Phe Asp Asn Tyr Tyr Ile Ser Thr Asp Ser 180 185 190 Glu Ser Thr Asn Ile Ser Ile Pro Leu Leu Arg Thr 195 200 <210> 968 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 968 Thr Ile Thr Val Lys Gln Phe Gln Pro Pro Asn Val Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Leu Met Asn Leu Ile Tyr Phe Asn Gln Lys Arg Leu Ile 20 25 30 Phe Asn Ser Val Met Tyr Glu Asn Ser Leu Val Pro Glu Glu His Pro 35 40 45 Gly Gly Gly Gly Phe Ser Val Ile Lys Leu Ser Leu Glu Thr Met Tyr 50 55 60 Asp Ser His Leu Arg Cys His Asn Trp Trp Thr Thr Ser Asn Glu Asp 65 70 75 80 Leu Pro Leu Val Arg Tyr Ser Gly Met Thr Val Lys Leu Tyr Gln Ser 85 90 95 Lys Tyr Thr Asp Tyr Val Phe Lys Tyr Gln Asn Tyr Leu Pro Gly Thr 100 105 110 Ser Thr Tyr Leu Thr Tyr Pro Ala Cys Gln Pro Ser Met Met Met Met 115 120 125 Ala Lys Asn Ser Val Ile Val Pro Ser Leu Glu Thr Lys Arg Arg Arg 130 135 140 Lys Pro Tyr Lys Lys Ile His Ile Lys Pro Thr Ser Gln Leu Gln Thr 145 150 155 160 Lys Trp Tyr Phe Gln Thr Asp Leu Asn Lys Thr Pro Leu Ala Ile Phe 165 170 175 Tyr Thr Ala Ala Cys Ser Leu Thr Ser Tyr Tyr Leu Ser Pro Asp Trp 180 185 190 Glu Ser Asn Asn Ile Ser Ile Leu His Leu Asn Thr 195 200 <210> 969 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 969 Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr 1 5 10 15 Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly 20 25 30 Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro 35 40 45 Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr 50 55 60 Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp 65 70 75 80 Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser 85 90 95 Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn 100 105 110 Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu Met Met Met Met 115 120 125 Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys 130 135 140 Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn 145 150 155 160 Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile 165 170 175 His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys 180 185 190 Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr 195 200 <210> 970 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 970 Lys Leu Thr Leu Lys Glu Trp Gln Pro Lys Thr Ile Arg Lys Ser Cys 1 5 10 15 Ile Lys Gly Leu His Cys Leu Phe Ile Val Thr Glu Asp Thr Ile Ser 20 25 30 Arg Asn Tyr Arg Met Tyr Glu His Ser Phe Thr Gly Glu His Trp Pro 35 40 45 Ser Gly Gly Gly Phe Ser Val Thr Lys Tyr Thr Leu Asp Gly Leu Tyr 50 55 60 Glu Gln His Gln Leu Asp Arg Asn Trp Trp Thr Lys Pro Asn Thr Asn 65 70 75 80 Met Pro Leu Val Arg Tyr Leu Gly Cys Lys Ile Thr Phe Tyr Gln Ser 85 90 95 Trp Glu Val Asp Tyr Val Cys Asn Ile Asn Leu Thr Trp Pro Met Val 100 105 110 Ala Thr Asn Leu Leu Tyr Leu Ser Cys His Pro Asn Phe Met Met Met 115 120 125 Asn His Lys Ala Ile Phe Val Pro Ser Lys Ile Thr Lys Arg Leu Arg 130 135 140 Arg Gly Lys Lys Thr Val Arg Leu Arg Pro Pro His Gln Met Ile Asn 145 150 155 160 Lys Trp Tyr Phe Ala Lys Glu Leu Ala Lys Thr Gly Leu Val Met Leu 165 170 175 Thr Ala Ala Ala Ala Ser Phe Asp His Tyr Tyr Ile Gly Ser Asp Lys 180 185 190 Leu Ser Asn Asn Cys Thr Phe Thr Ser Leu Asn Pro 195 200 <210> 971 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 971 Lys Ile Pro Ile Tyr Gln Trp Gln Pro Asp Ser Ile Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Val Gly Thr Leu Val Leu Gly Ala His Gly Lys Gln Phe 20 25 30 Val Cys Tyr Thr Asp Val Glu Thr Arg Ala Pro Pro Pro Lys Ala Pro 35 40 45 Gly Gly Gly Gly Phe Gly Cys Lys Gln Phe Ser Leu Gln Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Arg Asn Asn Ile Trp Thr His Thr Asn Ile Asn 65 70 75 80 Leu Asp Leu Val Arg Tyr Leu Arg Ala Ala Phe Thr Phe Tyr Arg His 85 90 95 Pro Asp Ile Asp Phe Ile Ile Asn Tyr Asp Arg Gln Pro Pro Phe Tyr 100 105 110 Leu Asp Lys Phe Thr Tyr Pro Leu Cys His Pro Gln Asn Leu Leu Leu 115 120 125 Gly Lys His Lys Ile Ile Leu Leu Ser Lys Ala Ser Lys Pro Asn Gly 130 135 140 Lys Val Lys Lys Arg Ile Ile Ile Lys Pro Pro Lys Gln Met Ile Thr 145 150 155 160 Lys Trp Phe Phe Gln Glu Gln Phe Thr Thr Gln Pro Leu Leu Ser Leu 165 170 175 Arg Ala Ala Ala Ala Ser Phe Gln Tyr Pro His Ile Gly Cys Cys Met 180 185 190 Pro Asn Arg Val Val Thr Phe Ser Ala Leu Asn Pro 195 200 <210> 972 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 972 Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys 1 5 10 15 Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met 20 25 30 Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro 35 40 45 Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp 85 90 95 Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln 100 105 110 Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu 115 120 125 Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly 130 135 140 Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu 165 170 175 Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn 180 185 190 Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu Asn His 195 200 <210> 973 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 973 Thr Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Val Leu Cys Lys 1 5 10 15 Ile Lys Gly Tyr Asp Ser Ile Ile Trp Gly Ala Glu Gly Thr Gln Phe 20 25 30 Gln Cys Ser Thr His Glu Met Tyr Glu Tyr Thr Arg Gln Lys Tyr Pro 35 40 45 Gly Gly Gly Gly Phe Gly Val Gln Leu Tyr Ser Leu Glu Tyr Leu Tyr 50 55 60 Asp Gln Trp Lys Leu Arg Asn Asn Ile Trp Thr Lys Thr Asn Gln Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Leu Lys Cys Val Met Thr Phe Tyr Arg His 85 90 95 Gln His Ile Asp Phe Val Ile Val Tyr Glu Arg Gln Pro Pro Phe Glu 100 105 110 Ile Asp Lys Leu Thr Tyr Met Lys Tyr His Pro Tyr Met Leu Leu Gln 115 120 125 Arg Lys His Lys Ile Ile Leu Pro Ser Gln Thr Thr Asn Pro Arg Gly 130 135 140 Lys Leu Lys Lys Lys Lys Thr Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Gln Gln Gln Phe Ala Lys Tyr Asp Leu Leu Leu Ile 165 170 175 Ala Ala Ala Ala Cys Ser Leu Arg Tyr Pro Arg Ile Gly Cys Cys Asn 180 185 190 Glu Asn Arg Met Ile Thr Leu Tyr Cys Leu Asn Thr 195 200 <210> 974 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 974 Lys Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys Lys Cys Lys 1 5 10 15 Ile Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly Lys Gln Tyr 20 25 30 Asn Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro 35 40 45 Gln Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr 50 55 60 Gln Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr 65 70 75 80 Thr Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu Tyr Arg His 85 90 95 Pro Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro Pro Phe Leu 100 105 110 Leu Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu 115 120 125 Ala Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly 130 135 140 Lys Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln Met Ile Thr 145 150 155 160 Lys Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu Phe Lys Leu 165 170 175 Cys Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser His Gly Ala 180 185 190 Gln Ser Thr Ile Phe Ser Ala Tyr Ala Leu Asn Thr 195 200 <210> 975 <211> 204 <212> PRT <213> Unknown <220> <223> Description of Unknown: Anelloviridae family sequence <400> 975 Phe Leu Lys Leu Val Gln Trp Gln Pro Asp Arg Ile Arg Lys Cys Thr 1 5 10 15 Ile Lys Gly Arg Gly Thr Leu Val Met Gly Ala His Gly Arg Gln Met 20 25 30 Ile Cys Phe Thr Asn Val Lys Asp Arg Leu Thr Pro Ser Arg Ala Pro 35 40 45 Ala Gly Gly Gly Phe Gly Val Glu Arg Ile Thr Leu Ala His Leu Tyr 50 55 60 Glu Glu Trp Lys Ala Arg Asn Asn Val Trp Thr Ala Thr Asn Glu Asn 65 70 75 80 Thr Asp Leu Gly Arg Tyr Thr Gly Cys Lys Ile Ser Phe Tyr Arg His 85 90 95 Leu Asp Thr Asp Phe Ile Ile Lys Tyr Ser Arg Asn Pro Pro Phe Asn 100 105 110 Leu Glu Lys Tyr Ser Tyr Met Tyr Met Gln Pro Gln Glu Leu Leu Leu 115 120 125 Gly Lys His Lys Arg Ile Leu Leu Ser Lys Lys Thr Asn Pro Lys Gly 130 135 140 Lys Leu Lys Thr Thr Leu Lys Ile Gly Pro Pro Lys Leu Leu Thr Asn 145 150 155 160 Lys Trp Leu Leu Gln Ser Glu Leu Ala Lys Gln Asp Leu Val Glu Ile 165 170 175 Ser Ala Ala Ala Ala Ser Phe Thr Tyr Pro Thr Ile Gly Cys Cys Asn 180 185 190 Glu Asn Arg Ile Leu Asn Leu Tyr Ser Ile Asn Thr 195 200 <210> 976 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 976 kkgtktctr 9 <210> 977 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 977 gtaccayttr 10 <210> 978 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 978 gttwgtggts 10 <210> 979 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 979 caccgacva 9 <210> 980 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 980 ctcggagtg 9 <210> 981 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 981 gcactcctc 9 <210> 982 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 982 cggagtctg 9 <210> 983 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 983 cccactcac 9 <210> 984 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 984 gtaccactta 10 <210> 985 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 985 gtaccacttg 10 <210> 986 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 986 gtaccattta 10 <210> 987 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 987 gtaccatttg 10 <210> 988 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 988 gaccacaaac 10 <210> 989 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 989 gaccactaac 10 <210> 990 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 990 caccacaaac 10 <210> 991 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 991 caccactaac 10 <210> 992 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(16) <223> Any amino acid <400> 992 Tyr Asn Cys Ser Pro Xaa Xaa Asp Xaa Gly Ala Ser Lys Arg Xaa Xaa 1 5 10 15 Asn Thr Ser Val Ala Lys 20 <210> 993 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (45)..(45) <223> a, c, t, g, unknown or other <220> <223> See specification as filed for detailed description of substitutions and preferred embodiments <400> 993 aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agggncagtc t 51 <210> 994 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 994 aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 50 <210> 995 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 995 aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agatcagtct 50 <210> 996 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 996 aggtgagtga aaccaccgag gtctaggggc aattcgggct agggcagtct 50 <210> 997 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 997 agcaacaggt aatggaggac 20 <210> 998 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 998 tgaagctggg gtctttaac 19 <210> 999 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic probe <400> 999 tctacctagg tgcaaagggc c 21 <210> 1000 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1000 cgaatggyw 9 <210> 1001 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1001 ttgcccctt 9 <210> 1002 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1002 ytgyggbtg 9 <210> 1003 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1003 yagamacmm 9 <210> 1004 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1004 gtaccayttr 10 <210> 1005 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1005 saccacwaac 10 <210> 1006 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1006 caccgacva 9 <210> 1007 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1007 cactccgag 9 <210> 1008 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1008 gcactcctc 9 <210> 1009 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1009 cagactccg 9 <210> 1010 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1010 cccactcac 9 <210> 1011 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 1011 cttcgccat 9 <210> 1012 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(20) <223> Any amino acid <400> 1012 Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa 1 5 10 15 Xaa Xaa Xaa Xaa His 20 <210> 1013 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 1013 His His His His His His 1 5

Claims

이전에 제1 복수의 아넬로벡터를 투여받은 인간 대상체에게 외인성 이펙터를 운반하는 방법으로서, 상기 방법은
대상체에게 제2 복수의 아넬로벡터를 투여하는 단계를 포함하며,
(i) 제1 복수의 아넬로벡터는
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소, 및 외인성 이펙터를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소
를 포함하고,
(ii) 제2 복수의 아넬로벡터는
(a) 제1 복수의 단백질성 외부의 ORF1 분자에 대하여 적어도 90%의 아미노산 서열 동일성을 갖는 ORF1 분자를 포함하는 단백질성 외부; 및
(b) 프로모터 요소, 및 외인성 이펙터를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소
를 포함하여,
대상체에게 이펙터를 운반하는, 방법.
제1항에 있어서, 대상체에게 제1 복수의 아넬로벡터를 투여하는 단계를 포함하는, 방법.
제1항 또는 제2항에 있어서, 상기 제2 복수의 아넬로벡터의 ORF1 분자는 제1 복수의 아넬로벡터의 단백질성 외부의 ORF1 분자에 대하여 적어도 95%, 96%, 97%, 98%, 또는 99%의 아미노산 서열 동일성을 갖는, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제2 복수의 아넬로벡터는 대상체에게 제1 복수의 아넬로벡터의 투여 후 적어도 1, 2, 3, 또는 4주, 또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월 후에 대상체에게 투여되는, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
(a) 제1 복수의 단백질성 외부의 ORF1 분자에 대하여 적어도 90%의 아미노산 서열 동일성을 갖는 ORF1 분자를 포함하는 단백질성 외부, 및
(b) 프로모터 요소, 및 외인성 이펙터를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소
를 포함하는 제3, 제4, 제5, 및/또는 추가의 복수의 아넬로벡터를 대상체에게 투여하는 단계를 추가로 포함하는, 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제2 복수의 아넬로벡터는 90 내지 110%, 예를 들어, 95 내지 105%의 수의 제1 복수의 아넬로벡터를 포함하는, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제1 복수 및 제2 복수는 동일한 투여 경로를 통해, 예를 들어, 정맥내 투여를 통해 투여되는, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 제1 복수 및 제2 복수는 상이한 투여 경로를 통해 투여되는, 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터와 동일한 단백질성 외부를 포함하는, 방법.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 제2 복수의 아넬로벡터는 제1 복수의 아넬로벡터에 의해 포함되는 ORF1 분자와 동일한 아미노산 서열을 갖는 ORF1 분자를 포함하는, 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 제1 복수의 아넬로벡터의 이펙터는 외인성 이펙터인, 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 복수의 아넬로벡터에 포함되는 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150일 후에, 예를 들어, 고해상도 용융(HRM) 분석에 의해, 대상체에서 검출 가능한, 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제2 복수의 아넬로벡터에 포함되는 유전 요소는 이의 투여 후 적어도 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 또는 150일 후에, 예를 들어, 고해상도 용융(HRM) 분석에 의해, 대상체에서 검출 가능한, 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 아넬로바이러스 5' UTR(예를 들어, 서열번호 16의 뉴클레오티드 170 내지 240, 서열번호 54의 뉴클레오티드 323 내지 393, 또는 서열번호 886의 뉴클레오티드 185 내지 254), 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 핵산 서열을 포함하는, 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 서열번호 41의 뉴클레오티드 323 내지 393의 핵산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 핵산 서열을 포함하는, 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터의 유전 요소는 위치의 적어도 80%가 G 또는 C로 이루어진, 길이가 적어도 100개의 뉴클레오티드인 서열을 포함하는, 방법.
제1항 내지 제16항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터는 표 12의 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2로부터 선택되는 아미노산 서열, 또는 이에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함하는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터는 아넬로바이러스 ORF2, ORF2/2, ORF2/3, ORF1/1, 또는 ORF1/2에 대하여 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 서열 동일성을 갖는 폴리펩티드를 포함하지 않는, 방법.
제1항 내지 제18항에 있어서, 상기 제1 및/또는 제2 복수의 아넬로벡터는 복제 결함인, 방법.
제1항 내지 제19항 중 어느 한 항에 있어서, 상기 이펙터는
(i) 세포내 핵산(예를 들어, miRNA 또는 siRNA);
(ii) 항체 분자, 효소, 호르몬, 사이토카인 분자, 보체 억제제, 성장 인자, 또는 성장 인자 억제제, 또는 상기 중 임의의 것의 기능적 변이체로부터 선택되는 분비 폴리펩티드; 또는
(iii) 돌연변이되었을 때, 인간 질환을 유발하는 폴리펩티드, 또는 상기 폴리펩티드의 기능적 변이체
를 포함하는, 방법.
서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 것에 따른 핵산 서열을 포함하는 프라이머.
서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23 중 임의의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11개, 또는 전부에 따른 핵산 서열을 포함하는 복수의 상이한 프라이머를 포함하는 혼합물.
제22항에 있어서, 상기 복수의 각각의 프라이머는 길이가 9개 뉴클레오티드인, 혼합물.
제22항에 있어서, 각각의 프라이머는 하나 이상(예를 들어, 1 또는 2개)의 티오포스페이트 연결을 포함하는, 혼합물.
환형 DNA 분자를 증폭시키는 방법으로서,
(a) 아넬로바이러스 서열, 및 아넬로바이러스 서열의 일부에 대하여 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 제1 프라이머를 포함하는 환형 DNA 분자를 포함하는 샘플을 제공하는 단계; 및
(b) 환형 DNA 분자를 DNA-의존성 DNA 중합효소 분자와 접촉시키는 단계
를 포함하며;
여기서 접촉은 DNA 분자, 또는 이의 일부의 선형 증폭(예를 들어, 회전환 증폭 또는 다중 가닥 변위 증폭)을 초래하는 방법.
제25항에 있어서, 상기 샘플은 아넬로바이러스 서열의 일부에 대하여 상보성인 적어도 7, 8, 또는 9개 뉴클레오티드를 갖는 복수의 프라이머를 포함하는, 방법.
제26항에 있어서, 상기 복수의 프라이머는 서열번호 1, 3, 4, 6, 8, 10, 12, 14, 17, 19, 21, 또는 23에 따른 핵산 서열, 또는 이의 임의의 조합을 포함하는, 방법.
제25항 내지 제27항 중 어느 한 항에 있어서, 상기 DNA-의존성 DNA 중합효소 분자는 Phi29를 포함하는, 방법.