KR20210131310A - 아넬로좀 및 사용 방법 - Google Patents

아넬로좀 및 사용 방법 Download PDF

Info

Publication number
KR20210131310A
KR20210131310A KR1020217021777A KR20217021777A KR20210131310A KR 20210131310 A KR20210131310 A KR 20210131310A KR 1020217021777 A KR1020217021777 A KR 1020217021777A KR 20217021777 A KR20217021777 A KR 20217021777A KR 20210131310 A KR20210131310 A KR 20210131310A
Authority
KR
South Korea
Prior art keywords
acid sequence
nucleic acid
orf1
sequence
anellosome
Prior art date
Application number
KR1020217021777A
Other languages
English (en)
Inventor
에리카 가브리엘 웨인스테인
아바크 카흐베지안
시몬 델라그레이브
네이선 로렌스 요즈비악
케빈 제임스 레보
페르난도 마틴 디아즈
다난제이 마닉랄 나완다르
라이언 디. 테드스톤
제러드 데이비드 피츠
Original Assignee
플래그쉽 파이어니어링 이노베이션스 브이, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 플래그쉽 파이어니어링 이노베이션스 브이, 인크. filed Critical 플래그쉽 파이어니어링 이노베이션스 브이, 인크.
Publication of KR20210131310A publication Critical patent/KR20210131310A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/46Ingredients of undetermined constitution or reaction products thereof, e.g. skin, bone, milk, cotton fibre, eggshell, oxgall or plant extracts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5176Compounds of unknown constitution, e.g. material from plants or animals
    • A61K9/5184Virus capsids or envelopes enclosing drugs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1136Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00023Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00041Use of virus, viral particle or viral elements as a vector
    • C12N2750/00043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00051Methods of production or purification of viral material
    • C12N2750/00052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00071Demonstrated in vivo effect

Abstract

본 발명은 일반적으로 아넬로좀 및 그의 조성물 및 용도에 관한 것이다.

Description

아넬로좀 및 사용 방법
관련 출원에 대한 상호 참조
본 출원은 2018년 12월 12일자 출원된 미국 가출원 제62/778,841호 및 2018년 12월 12일자 출원된 제62/778,866호의 이익을 주장한다. 전술된 출원의 내용은 그들 전체가 본원에 참조로 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자 제출된 서열 목록을 포함하며, 그의 전문이 본원에 참조로 포함된다. 2019년 12월 9일자 생성된 상기 ASCII 카피는 명칭이 V2057-7005WO_SL.txt이며, 825,796 바이트 크기이다.
환자에게 치료적 유전 물질을 운반하기 위한 적합한 벡터를 개발하는 것이 계속 필요하다.
본 개시내용은 예를 들어, 진핵 세포(예를 들어, 인간 세포 또는 인간 조직)에 유전 물질을 운반하기 위한, 이펙터, 예를 들어, 페이로드를 운반하기 위한, 또는 치료제 또는 치료적 이펙터를 운반하기 위한 운반 비히클로서 사용될 수 있는 아넬로좀(anellosome), 예를 들어, 합성 아넬로좀을 제공한다. 일부 실시형태에서, 아넬로좀(예를 들어, 입자, 예를 들어, 바이러스 입자, 예를 들어, 아넬로바이러스 입자)은 유전 요소를 세포(예를 들어, 포유동물 세포, 예를 들어, 인간 세포) 내로 도입할 수 있는 단백질성 외부(예를 들어, 아넬로바이러스 캡시드 단백질, 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질 또는 아넬로바이러스 ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는 단백질성 외부)에 캡슐화된 유전 요소(예를 들어, 치료적 DNA 서열을 포함하는 유전 요소)를 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로바이러스 ORF1 핵산(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 알파토르크바이러스(alphatorquevirus), 베타토르크바이러스(Betatorquevirus) 또는 감마토르크바이러스(Gammatorquevirus)의 ORF1 핵산, 예를 들어, 알파토르크바이러스 클레이드 1, 알파토르크바이러스 클레이드 2, 알파토르크바이러스 클레이드 3, 알파토르크바이러스 클레이드 4, 알파토르크바이러스 클레이드 5, 알파토르크바이러스 클레이드 6 또는 알파토르크바이러스 클레이드 7의 ORF1)에 의해 인코딩된 폴리펩티드를 포함하는 단백질성 외부를 포함하는 입자이다. 본 개시내용의 아넬로좀의 유전 요소는 전형적으로 환형 및/또는 단일-가닥 DNA 분자(예를 들어, 환형 및 단일 가닥)이며, 일반적으로, 이를 둘러싸는 단백질성 외부 또는 이에 부착된 폴리펩티드에 결합하는 단백질 결합 서열을 포함하며, 이는 단백질성 외부 내의 유전 요소의 봉입 및/또는 단백질성 외부 내에서 다른 핵산에 비한 유전 요소의 농축을 용이하게 할 수 있다. 일부 예에서, 유전 요소는 환형 또는 선형이다. 일부 예에서, 유전 요소는 예를 들어, 세포 내에서 발현될 수 있는 이펙터(예를 들어, 핵산 이펙터, 예컨대 비-코딩 RNA 또는 폴리펩티드 이펙터, 예를 들어, 단백질)를 포함하거나, 이를 인코딩한다. 일부 실시형태에서, 이펙터는 예를 들어, 본원에 기재된 바와 같은, 치료제 또는 치료적 이펙터이다. 일부 예에서, 이펙터는 예를 들어, 야생형 아넬로바이러스 또는 표적 세포에 대하여 내인성 이펙터 또는 외인성 이펙터이다. 일부 실시형태에서, 이펙터는 야생형 아넬로바이러스 또는 표적 세포에 대하여 외인성이다. 일부 실시형태에서, 아넬로좀은 세포와 접촉시키고, 이펙터를 인코딩하는 유전 요소를 세포 내로 도입하여, 이펙터가 세포에 의해 제조되거나 발현되게 함으로써 이펙터를 세포 내로 운반할 수 있다. 특정 예에서, 이펙터는 내인성 이펙터이다(예를 들어, 표적 세포에 대하여 내인성이지만, 예를 들어, 아넬로좀에 의해 증가된 양으로 제공된다). 다른 예에서, 이펙터는 외인성 이펙터이다. 이펙터는 일부 예에서, 세포의 기능을 조절하거나, 세포 내의 표적 분자의 활성 또는 수준을 조절할 수 있다. 예를 들어, 이펙터는 (예를 들어, 실시예 3 및 4에 기재된 바와 같이) 세포 내의 표적 단백질의 수준을 감소시킬 수 있다. 또 다른 예에서, 아넬로좀은 (예를 들어, 실시예 19 및 28에 기재된 바와 같이) 생체 내에서 이펙터, 예를 들어, 외인성 단백질을 운반하고 발현할 수 있다. 아넬로좀은 예를 들어, 유전 물질을 표적 세포, 조직 또는 대상체에 운반하거나; 이펙터를 표적 세포, 조직 또는 대상체에 운반하거나; 또는 예를 들어, 원하는 세포, 조직 또는 대상체에 대하여 치료제로서 작동할 수 있는 이펙터를 운반함으로써 질병 및 장애를 치료하기 위해 사용될 수 있다.
본 발명은 추가로 합성 아넬로좀을 제공한다. 합성 아넬로좀은 야생형 바이러스(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스)에 비한 적어도 하나의 구조적 차이, 예를 들어, 야생형 바이러스에 비한 결실, 삽입, 치환, 변형(예를 들어, 효소적 변형)을 갖는다. 일반적으로, 합성 아넬로좀은 단백질성 외부 내에 봉입된 외인성 유전 요소를 포함하며, 이는 유전 요소 또는 그 내에 인코딩된 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)(예를 들어, 폴리펩티드 또는 핵산 이펙터)를 진핵(예를 들어, 인간) 세포 내로 운반하기 위해 사용될 수 있다. 실시형태들에서, 아넬로좀은 검출 가능하고/가능하거나 원하지 않는 면역 또는 염증 반응을 야기하지 않으며, 예를 들어, 염증의 분자 마커(들), 예를 들어, TNF-알파, IL-6, IL-12, IFN, 및 B-세포 반응, 예를 들어, 반응성 또는 중화 항체의 1%, 5%, 10%, 15% 초과의 증가를 야기하지 않으며, 예를 들어, 아넬로좀은 표적 세포, 조직 또는 대상체에 대하여 실질적으로 비-면역원성일 수 있다.
일 양태에서, 본 발명은 (i) 프로모터 요소 및 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 인코딩하는 서열, 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소; 및 (ii) 단백질성 외부를 포함하는 아넬로좀을 특징으로 하며; 유전 요소는 단백질성 외부(예를 들어, 캡시드) 내에 봉입되며; 아넬로좀은 유전 요소를 진핵(예를 들어, 포유동물, 예를 들어, 인간) 세포 내로 운반할 수 있다. 일부 실시형태에서, 유전 요소는 단일-가닥 및/또는 환형 DNA이다. 대안적으로 또는 조합하여, 유전 요소는 하기의 특성 중 1개, 2개, 3개 또는 전부를 갖는다: 환형이고/환형이거나, 단일-가닥이고/단일-가닥이거나, 세포에 유입되는 유전 요소의 약 0.0001%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 세포의 게놈 내로 통합되고/통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30 카피 미만으로 표적 세포의 게놈 내로 통합됨. 일부 실시형태에서, 통합 빈도는 문헌[Wang et al. (2004, Gene Therapy 11: 711-721), 본원에 그의 전체가 참조로 포함됨]에 기재된 바와 같이 결정된다. 일부 실시형태에서, 유전 요소는 단백질성 외부 내에 봉입된다. 일부 실시형태에서, 아넬로좀은 유전 요소를 진핵 세포 내로 운반할 수 있다. 일부 실시형태에서, 유전 요소는 야생형 아넬로바이러스의 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열(예를 들어, 300 내지 4000개 뉴클레오티드, 예를 들어, 300 내지 3500개 뉴클레오티드, 300 내지 3000개 뉴클레오티드, 300 내지 2500개 뉴클레오티드, 300 내지 2000개 뉴클레오티드, 300 내지 1500개 뉴클레오티드의 핵산 서열)을 포함한다. 일부 실시형태에서, 유전 요소는 야생형 아넬로바이러스의 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열(예를 들어, 적어도 300개 뉴클레오티드, 500개 뉴클레오티드, 1000개 뉴클레오티드, 1500개 뉴클레오티드, 2000개 뉴클레오티드, 2500개 뉴클레오티드, 3000개 뉴클레오티드 또는 그 이상의 핵산 서열)을 포함한다. 일부 실시형태에서, 핵산 서열은 예를 들어, 포유동물(예를 들어, 인간) 세포에서의 발현을 위하여 코돈-최적화된다. 일부 실시형태에서, 핵산 서열 내의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 코돈은 예를 들어, 포유동물(예를 들어, 인간) 세포에서의 발현을 위하여 코돈-최적화된다.
일 양태에서, 본 발명은 캡시드에 결합하는 단백질 결합 서열 및 치료적 이펙터를 인코딩하는 (아넬로바이러스에 대한) 이종 서열을 포함하는 유전 요소를 캡슐화하는 아넬로바이러스 캡시드(예를 들어, 아넬로바이러스 ORF, 예를 들어, ORF1, 폴리펩티드를 포함하는 캡시드)를 포함하는 (인간 세포에 대한) 감염성 입자를 특징으로 한다. 실시형태들에서, 입자는 유전 요소를 포유동물, 예를 들어, 인간, 세포 내로 운반할 수 있다. 일부 실시형태에서, 유전 요소는 야생형 아넬로바이러스에 대하여 약 6% 미만(예를 들어, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5% 미만 또는 그 이하)의 동일성을 갖는다. 일부 실시형태에서, 유전 요소는 야생형 아넬로바이러스에 대하여 1.5%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 5.5% 또는 6% 이하의 동일성을 갖는다. 일부 실시형태에서, 유전 요소는 야생형 아넬로바이러스에 대하여 적어도 약 2% 내지 적어도 약 5.5%(예를 들어, 2 내지 5%, 3% 내지 5%, 4% 내지 5%)의 동일성을 갖는다. 일부 실시형태에서, 유전 요소는 약 2000, 3000, 4000, 4500 또는 5000개 초과의 비-바이러스 서열(예를 들어, 비 아넬로바이러스 게놈 서열)의 뉴클레오티드를 갖는다. 일부 실시형태에서, 유전 요소는 약 2000 내지 5000개, 2500 내지 4500개, 3000 내지 4500개, 2500 내지 4500개, 3500 또는 4000개, 4500개(예를 들어, 약 3000 내지 4500개) 초과의 비-바이러스 서열(예를 들어, 비 아넬로바이러스 게놈 서열)의 뉴클레오티드를 갖는다. 일부 실시형태에서, 유전 요소는 단일-가닥, 환형 DNA이다. 대안적으로, 또는 조합하여, 유전 요소는 하기의 특성 중 1개, 2개 또는 3개를 갖는다: 환형이거나, 단일 가닥이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 세포의 게놈 내로 통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30 카피 미만으로 표적 세포의 게놈 내로 통합되거나, 세포에 유입되는 유전 요소의 약 0.0001%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합됨. 일부 실시형태에서, 통합 빈도는 문헌[Wang et al. (2004, Gene Therapy 11: 711-721), 본원에 그의 전체가 참조로 포함됨]에 기재된 바와 같이 결정된다.
또한, 아넬로바이러스에 기초한 바이러스 벡터 및 바이러스 입자가 본원에 기재되며, 이는 제제(예를 들어, 외인성 이펙터 또는 내인성 이펙터, 예를 들어, 치료적 이펙터)를 세포(예를 들어, 치료적으로 처치할 대상체 내의 세포)에 운반하기 위해 사용될 수 있다. 일부 실시형태에서, 아넬로바이러스는 제제, 예컨대 본원에 기재된 이펙터를 표적 세포, 예를 들어, 치료적으로 또는 예방적으로 처치할 대상체 내의 표적 세포로 도입하기 위한 유효한 운반 비히클로서 사용될 수 있다.
일 양태에서, 본 발명은 하기를 (예를 들어, 연속하여) 포함하는 폴리펩티드(예를 들어, 합성 폴리펩티드, 예를 들어, ORF1 분자)를 특징으로 한다:
(i) 아르기닌-풍부 영역, 예를 들어, 본원에 기재된 아르기닌-풍부 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열 또는 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 그의 조합)를 포함하는 적어도 약 40개의 아미노산의 서열을 포함하는 제1 영역,
(ii) 젤리-롤(jelly-roll) 도메인, 예를 들어, 본원에 기재된 젤리-롤 영역 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열 또는 적어도 6개의 베타 가닥을 포함하는 서열을 포함하는 제2 영역,
(iii) 본원에 기재된 N22 도메인 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제3 영역,
(iv) 본원에 기재된 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제4 영역, 및
(v) 선택적으로 폴리펩티드는 본원에 기재된 야생형 아넬로바이러스 ORF1 단백질에 대하여 100%, 99%, 98%, 95%, 90%, 85%, 80% 미만의 서열 동일성을 갖는 아미노산 서열을 가짐.
일부 실시형태에서, 폴리펩티드는 본원에 기재된 바와 같은(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 ORF1 분자에 대하여 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 포함한다. 일부 실시형태에서, 폴리펩티드는 본원에 기재된 바와 같은(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 ORF1 분자의 하위서열(예를 들어, 아르기닌(Arg)-풍부 도메인, 젤리-롤 도메인, 초가변 영역(HVR), N22 도메인 또는 C-말단 도메인(CTD))에 대하여 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 포함한다. 일 실시형태에서, (i), (ii), (iii) 및 (iv) 영역의 아미노산 서열은 그들의 각각의 기준서열에 대하여 적어도 90% 서열 동일성을 가지며, 폴리펩티드는 본원에 기재된 야생형 아넬로바이러스 ORF1 단백질에 대하여 100%, 99%, 98%, 95%, 90%, 85%, 80% 미만의 서열 동일성을 갖는 아미노산 서열을 갖는다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 폴리펩티드(예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 분자), 및 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는 복합체를 특징으로 한다.
본 개시내용은 핵산 분자(예를 들어, 본원에 기재된 바와 같은 유전 요소를 포함하는 핵산 분자 또는 본원에 기재된 바와 같은 단백질성 외부 단백질을 인코딩하는 서열을 포함하는 핵산 분자)를 추가로 제공한다. 본 발명의 핵산 분자는 (a) 본원에 기재된 바와 같은 유전 요소, 및 (b) 본원에 기재된 바와 같은 단백질성 외부 단백질을 인코딩하는 핵산 서열 중 하나 또는 둘 모두를 포함할 수 있다.
일 양태에서, 본 발명은 이펙터, 예를 들어, 페이로드를 인코딩하는 서열에 작동 가능하게 연결된 프로모터 요소, 및 외부 단백질 결합 서열을 포함하는 유전 요소를 포함하는 단리된 핵산 분자를 특징으로 한다. 일부 실시형태에서, 외부 단백질 결합 서열은 본원에 개시된 바와 같은, 아넬로바이러스의 5'UTR 서열에 대하여 적어도 75%(적어도 80%, 85%, 90%, 95%, 97%, 100%) 동일한 서열을 포함한다. 실시형태들에서, 유전 요소는 단일-가닥 DNA이고/단일-가닥 DNA이거나, 환형이고/환형이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되고/통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30 카피 미만으로 표적 세포의 게놈 내로 통합되거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합된다. 일부 실시형태에서, 통합 빈도는 문헌[Wang et al. (2004, Gene Therapy 11: 711-721), 본원에 그의 전체가 참조로 포함됨]에 기재된 바와 같이 결정된다. 실시형태들에서, 이펙터는 TTV로부터 기원하지 않으며, SV40-miR-S1이 아니다. 실시형태들에서, 핵산 분자는 TTMV-LY2의 폴리뉴클레오티드 서열을 포함하지 않는다. 실시형태들에서, 프로모터 요소는 진핵(예를 들어, 포유동물, 예를 들어, 인간) 세포에서 이펙터의 발현을 지시할 수 있다.
일부 실시형태에서, 핵산 분자는 환형이다. 일부 실시형태에서, 핵산 분자는 선형이다. 일부 실시형태에서, 본원에 기재된 핵산 분자는 하나 이상의 변형된 뉴클레오티드(예를 들어, 염기 변형, 당 변형 또는 백본 변형)를 포함한다.
일부 실시형태에서, 핵산 분자는 ORF1 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질)를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 ORF2 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF2 단백질)를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 핵산 분자는 ORF3 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF3 단백질)를 인코딩하는 서열을 포함한다. 일 양태에서, 본 발명은 (i) 프로모터 요소 및 이펙터, 예를 들어, 외인성 또는 내인성 이펙터를 인코딩하는 서열; (ii) 야생형 아넬로바이러스 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 적어도 72개의 인접 뉴클레오티드(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100 또는 150개 뉴클레오티드); 또는 야생형 아넬로바이러스 서열에 대하여 적어도 72%(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 적어도 100개(예를 들어, 적어도 300, 500, 1000, 1500개)의 인접 뉴클레오티드; 및 (iii) 단백질 결합 서열, 예를 들어, 외부 단백질 결합 서열 중 1개, 2개 또는 3개를 포함하는 유전 요소를 특징으로 하며, 핵산 구축물은 단일-가닥 DNA이며; 핵산 구축물은 환형이고/환형이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되고/통합되거나, 게놈당 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30 카피 미만으로 표적 세포의 게놈 내로 통합된다. 일부 실시형태에서, 이펙터(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 외인성 또는 내인성 이펙터)를 인코딩하는 유전 요소는 코돈 최적화된다. 일부 실시형태에서, 유전 요소는 환형이다. 일부 실시형태에서, 유전 요소는 선형이다. 일부 실시형태에서, 유전 요소는 예를 들어, 본원에 기재된 바와 같은 아넬로벡터를 포함한다. 일부 실시형태에서, 본원에 기재된 유전 요소는 하나 이상의 변형된 뉴클레오티드(예를 들어, 염기 변형, 당 변형 또는 백본 변형)를 포함한다. 일부 실시형태에서, 유전 요소는 ORF1 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질)를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 유전 요소는 ORF2 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF2 단백질)를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 유전 요소는 ORF3 분자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF3 단백질)를 인코딩하는 서열을 포함한다.
일 양태에서, 본 발명은 하기를 포함하는 숙주 세포 또는 헬퍼 세포를 특징으로 한다: (a) ORF1 분자, ORF2 분자 또는 ORF3 분자 중 하나 이상을 인코딩하는 서열(예를 들어, 본원에 기재된 아넬로바이러스 ORF1 폴리펩티드를 인코딩하는 서열)을 포함하는 핵산으로서, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 헬퍼 세포 염색체 내로 통합되는 핵산; 및 (b) 유전 요소로서, 유전 요소가 (i) 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소 및 (ii) (a)의 폴리펩티드에 결합하는 단백질 결합 서열을 포함하며, 선택적으로, 유전 요소가 ORF1 폴리펩티드(예를 들어, ORF1 단백질)를 인코딩하지 않는 유전 요소. 예를 들어, 숙주 세포 또는 헬퍼 세포는 (a) 및 (b)를 시스(동일한 핵산 분자의 두 부분) 또는 트랜스(상이한 핵산 분자의 각각의 부분)로 포함한다. 실시형태들에서, (b)의 유전 요소는 환형, 단일-가닥 DNA이다. 일부 실시형태에서, 숙주 세포는 제조(manufacturing) 세포주이다. 일부 실시형태에서, 숙주 세포 또는 헬퍼 세포는 부착성이거나, 현탁액 중에 존재하거나, 둘 모두이다. 일부 실시형태에서, 숙주 세포 또는 헬퍼 세포는 마이크로캐리어에서 성장된다. 일부 실시형태에서, 숙주 세포 또는 헬퍼 세포는 cGMP 제조 실무와 양립 가능하다. 일부 실시형태에서, 숙주 세포 또는 헬퍼 세포는 세포 성장을 촉진시키기에 적합한 배지 중에 성장된다. 특정 실시형태에서, 일단 숙주 세포 또는 헬퍼 세포가 (예를 들어, 적절한 세포 밀도로) 충분히 성장하면, 배지를 숙주 세포 또는 헬퍼 세포에 의한 아넬로좀의 생성에 적합한 배지로 교체할 수 있다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 아넬로좀(예를 들어, 합성 아넬로좀)을 포함하는 약제학적 조성물을 특징으로 한다. 실시형태들에서, 약제학적 조성물은 약제학적으로 허용 가능한 담체 또는 부형제를 추가로 포함한다. 실시형태들에서, 약제학적 조성물은 표적 대상체 킬로그램당 약 105 내지 1014개의 게놈 당량의 아넬로좀을 포함하는 단위 용량을 포함한다. 일부 실시형태에서, 제제를 포함하는 약제학적 조성물은 허용 가능한 기간 및 온도에 걸쳐 안정할 것이고/것이거나 요망되는 투여 경로 및/또는 투여 경로가 필요로 할 임의의 디바이스, 예를 들어, 니들(needle) 또는 주사기와 양립 가능할 것이다. 일부 실시형태에서, 약제학적 조성물은 단회 용량 또는 다회 용량으로서의 투여를 위해 제형화된다. 일부 실시형태에서, 약제학적 조성물은 투여 장소에서, 예를 들어, 의료 전문가(healthcare professional)에 의해 제형화된다. 일부 실시형태에서, 약제학적 조성물은 (예를 들어, 부피당 게놈의 수에 의해 정의된 바와 같은) 요망되는 농도의 아넬로좀 게놈 또는 게놈 당량을 포함한다.
일 양태에서, 본 발명은 대상체에서의 질병 또는 장애의 치료 방법을 특징으로 하며, 당해 방법은 예를 들어, 본원에 기재된 바와 같은, 아넬로좀, 예를 들어, 합성 아넬로좀을 대상체에게 투여하는 단계를 포함한다.
일 양태에서, 본 발명은 이펙터 또는 페이로드(예를 들어, 내인성 또는 외인성 이펙터)를 세포, 조직 또는 대상체에 운반하는 방법을 특징으로 하며, 당해 방법은 예를 들어, 본원에 기재된 바와 같은, 아넬로좀, 예를 들어, 합성 아넬로좀을 대상체에게 투여하는 단계를 포함하며, 아넬로좀은 이펙터를 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 페이로드는 핵산이다. 실시형태들에서, 페이로드는 폴리펩티드이다.
일 양태에서, 본 발명은 예를 들어, 본원에 기재된 바와 같은 아넬로좀, 예를 들어, 합성 아넬로좀을 예를 들어, 생체 내에서 또는 생체 외에서, 세포, 예를 들어, 진핵 세포, 예를 들어, 포유동물 세포와 접촉시키는 단계를 포함하는 세포로의 아넬로좀의 운반 방법을 특징으로 한다.
일 양태에서, 본 발명은 아넬로좀, 예를 들어, 합성 아넬로좀의 제조 방법을 특징으로 한다. 당해 방법은 하기의 단계를 포함한다:
a) 숙주 세포를 제공하는 단계로서:
(i) 본원에 기재된 바와 같은 아넬로좀, 예를 들어, 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
(ii) 제1 핵산, 또는 예를 들어, 표 16의 어느 하나에 열거된 것과 같은, ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자를 포함하는 숙주 세포를 제공하는 단계; 및
b) 숙주 세포를 아넬로좀을 제조하기에 적합한 조건 하에서 인큐베이션시키는 단계.
일부 실시형태에서, 당해 방법은 단계 (a) 이전에, 제1 핵산 분자 및/또는 제2 핵산 분자를 숙주 세포 내로 도입하는 단계를 추가로 포함한다. 일부 실시형태에서, 제2 핵산 분자는 제1 핵산 분자 이전에, 이와 동시에, 또는 이후에 숙주 세포 내로 도입된다. 다른 실시형태에서, 제2 핵산 분자는 숙주 세포의 게놈 내로 통합된다. 일부 실시형태에서, 제2 핵산 분자는 헬퍼(예를 들어, 헬퍼 플라스미드 또는 헬퍼 바이러스의 게놈)이다.
또 다른 양태에서, 본 발명은 하기를 포함하는 아넬로좀 조성물의 제조 방법을 특징으로 한다:
a) 예를 들어, 본원에 기재된 바와 같은 아넬로좀, 예를 들어, 합성 아넬로좀의 하나 이상의 구성성분(예를 들어, 모든 구성성분)을 포함하는, 예를 들어, 발현하는 숙주 세포를 제공하는 단계. 예를 들어, 숙주 세포는 (a) 본원에 기재된 아넬로바이러스 ORF1 폴리펩티드를 인코딩하는 서열을 포함하는 핵산으로서, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 헬퍼 세포 염색체 내로 통합되는 핵산; 및 (b) 유전 요소로서, 유전 요소가 (i) 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소, 및 (i) (a)의 폴리펩티드에 결합하는 단백질 결합 서열(예를 들어, 패키징 서열)을 포함하는 유전 요소를 포함하며, 숙주 세포 또는 헬퍼 세포는 (a) 및 (b)를 시스로 또는 트랜스로 포함한다. 실시형태들에서, (b)의 유전 요소는 환형, 단일-가닥 DNA이다. 일부 실시형태에서, 숙주 세포는 제조 세포주이다;
b) 숙주 세포를 숙주 세포로부터 아넬로좀의 제제를 생성하기에 적합한 조건 하에서 배양함으로써, 아넬로좀의 제제를 제조하는 단계로서, 제제의 아넬로좀이 (예를 들어, 본원에 기재된 바와 같은) 유전 요소를 캡슐화하는 (예를 들어, ORF1 분자를 포함하는) 단백질성 외부를 포함하는 단계; 및
선택적으로, c) 아넬로좀의 제제를 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계.
일부 실시형태에서, 아넬로좀의 구성성분은 생성 시에 (예를 들어, 일시적 트랜스펙션에 의해) 숙주 세포 내로 도입된다. 일부 실시형태에서, 숙주 세포는 아넬로좀의 구성성분을 안정하게 발현한다(예를 들어, 아넬로좀의 구성성분을 인코딩하는 하나 이상의 핵산은 예를 들어, 안정한 트랜스펙션에 의해 숙주 세포 또는 그의 자손 내로 도입된다).
일부 실시형태에서, 당해 방법은 하나 이상의 정제 단계(예를 들어, 침강, 크로마토그래피 및/또는 한외여과에 의한 정제)를 추가로 포함한다. 일부 실시형태에서, 정제 단계는 제제로부터 혈청, 숙주 세포 DNA, 숙주 세포 단백질, 유전 요소가 결여된 입자 및/또는 페놀 레드(phenol red) 중 하나 이상을 제거하는 것을 포함한다. 일부 실시형태에서, 생성된 제제 또는 제제를 포함하는 약제학적 조성물은 허용 가능한 기간 및 온도에 걸쳐 안정할 것이고/것이거나 요망되는 투여 경로 및/또는 투여 경로가 필요로 할 임의의 디바이스, 예를 들어, 니들 또는 주사기와 양립 가능할 것이다.
일 양태에서, 본 발명은 a) 복수의 본원에 기재된 아넬로좀 또는 본원에 기재된 아넬로좀의 제제를 제공하는 단계; 및 b) 아넬로좀 또는 그의 제제를 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는 아넬로좀 조성물의 제조 방법을 특징으로 한다.
일 양태에서, 본 발명은 아넬로좀을 포함하는 숙주 세포, 예를 들어, 제1 숙주 세포 또는 생성자 세포(예를 들어, 도 12에 나타낸 바와 같음), 예를 들어, 제1 숙주 세포의 집단의 제조 방법을 특징으로 하며, 당해 방법은 예를 들어, 본원에 기재된 바와 같은, 유전 요소를 숙주 세포에 도입하는 단계 및 숙주 세포를 아넬로좀의 생성에 적합한 조건 하에서 배양하는 단계를 포함한다. 실시형태들에서, 당해 방법은 헬퍼, 예를 들어, 헬퍼 바이러스를 숙주 세포에 도입하는 단계를 추가로 포함한다. 실시형태들에서, 도입하는 단계는 아넬로좀을 이용한 숙주 세포의 트랜스펙션(예를 들어, 화학적 트랜스펙션) 또는 전기천공법을 포함한다.
일 양태에서, 본 발명은 예를 들어, 본원에 기재된 바와 같은 아넬로좀을 포함하는 숙주 세포, 예를 들어, 제1 숙주 세포 또는 생성자 세포(예를 들어, 도 12에 나타낸 바와 같음)를 제공하는 단계 및 숙주 세포로부터 아넬로좀을 정제하는 단계를 포함하는 아넬로좀의 제조 방법을 특징으로 한다. 일부 실시형태에서, 당해 방법은 제공하는 단계 이전에, 숙주 세포를 예를 들어, 본원에 기재된 바와 같은 아넬로좀과 접촉시키는 단계 및 숙주 세포를 아넬로좀의 생성에 적합한 조건 하에서 인큐베이션시키는 단계를 추가로 포함한다. 실시형태들에서, 숙주 세포는 상기 숙주 세포의 제조 방법에 기재된 제1 숙주 세포 또는 생성자 세포이다. 실시형태들에서, 숙주 세포로부터 아넬로좀을 정제하는 단계는 숙주 세포를 용해시키는 것을 포함한다.
일부 실시형태에서, 당해 방법은 제1 숙주 세포 또는 생성자 세포에 의해 생성되는 아넬로좀을 제2 숙주 세포, 예를 들어, 허용 세포(예를 들어, 도 12에 나타낸 바와 같음), 예를 들어, 제2 숙주 세포의 집단과 접촉시키는 제2 단계를 추가로 포함한다. 일부 실시형태에서, 당해 방법은 제2 숙주 세포를 아넬로좀의 생성에 적합한 조건 하에서 인큐베이션시키는 단계를 추가로 포함한다. 일부 실시형태에서, 당해 방법은 제2 숙주 세포로부터 아넬로좀을 정제함으로써, 예를 들어, 아넬로좀 씨드 집단을 생성하는 단계를 추가로 포함한다. 실시형태들에서, 제1 숙주 세포의 집단으로부터보다 제2 숙주 세포의 집단으로부터 적어도 약 2 내지 100배 더 많은 아넬로좀이 생성된다. 실시형태들에서, 제2 숙주 세포로부터 아넬로좀을 정제하는 단계는 제2 숙주 세포를 용해시키는 것을 포함한다. 일부 실시형태에서, 당해 방법은 제2 숙주 세포에 의해 생성되는 아넬로좀을 제3 숙주 세포, 예를 들어, 허용 세포(예를 들어, 도 12에 나타낸 바와 같음), 예를 들어, 제3 숙주 세포의 집단과 접촉시키는 제2 단계를 추가로 포함한다. 일부 실시형태에서, 당해 방법은 제3 숙주 세포를 아넬로좀의 생성에 적합한 조건 하에서 인큐베이션시키는 단계를 추가로 포함한다. 일부 실시형태에서, 당해 방법은 제3 숙주 세포로부터 아넬로좀을 정제함으로써, 예를 들어, 아넬로좀 스톡(stock) 집단을 생성하는 단계를 추가로 포함한다. 실시형태들에서, 제3 숙주 세포로부터 아넬로좀을 정제하는 단계는 제3 숙주 세포를 용해시키는 것을 포함한다. 실시형태들에서, 제2 숙주 세포의 집단으로부터보다 제3 숙주 세포의 집단으로부터 적어도 약 2 내지 100배 더 많은 아넬로좀이 생성된다.
일부 실시형태에서, 숙주 세포는 세포 성장을 촉진시키기에 적합한 배지에서 성장된다. 특정 실시형태에서, 일단 숙주 세포가 (예를 들어, 적절한 세포 밀도로) 충분하게 성장되면, 배지를 숙주 세포에 의한 아넬로좀의 생성에 적합한 배지로 교체할 수 있다. 일부 실시형태에서, 숙주 세포에 의해 생성되는 아넬로좀은 제2 숙주 세포와의 접촉 이전에 (예를 들어, 숙주 세포를 용해시킴으로써) 숙주 세포로부터 분리된다. 일부 실시형태에서, 숙주 세포에 의해 생성되는 아넬로좀은 사이의 정제 단계 없이 제2 숙주 세포와 접촉된다.
일 양태에서, 본 발명은 약제학적 아넬로좀 제제의 제조 방법을 특징으로 한다. 당해 방법은 (a) 본원에 기재된 바와 같은 아넬로좀 제제를 제조하는 단계, (b) 제제(예를 들어, 약제학적 아넬로좀 제제, 아넬로좀 씨드 집단 또는 아넬로좀 스톡 집단)를 하나 이상의 약제학적 품질 관리 파라미터, 예를 들어, 아이덴티티, 순도, 역가, 효력(예를 들어, 아넬로좀 입자당 게놈 당량) 및/또는 예를 들어, 아넬로좀에 포함되는 유전 요소로부터의 핵산 서열에 대하여 평가하는 단계, 및 (c) 평가가 사전결정된 기준을 만족시키는, 예를 들어, 약제학적 규격을 만족시키는 약제학적 이용을 위한 제제를 제형화하는 단계를 포함한다. 일부 실시형태에서, 아이덴티티를 평가하는 것은 아넬로좀의 유전 요소의 서열, 예를 들어, 이펙터를 인코딩하는 서열을 평가하는 것(예를 들어, 확인하는 것)을 포함한다. 일부 실시형태에서, 순도를 평가하는 것은 불순물, 예를 들어, 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 제제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀(예를 들어, 요망되는 아넬로좀, 예를 들어, 본원에 기재된 바와 같은 합성 아넬로좀 이외의 아넬로좀), 유리 바이러스 캡시드 단백질, 외래성 물질(adventitious agent) 및 응집물의 양을 평가하는 것을 포함한다. 일부 실시형태에서, 역가를 평가하는 것은 (예를 들어, HPLC에 의해 평가되는 바와 같은) 제제 내의 기능성 대 비-기능성(예를 들어, 감염성 대 비-감염성) 아넬로좀의 비를 평가하는 것을 포함한다. 일부 실시형태에서, 효력을 평가하는 것은 제제에서 검출 가능한 아넬로좀 기능(예를 들어, 그 내에 인코딩된 이펙터의 발현 및/또는 기능 또는 게놈 당량)의 수준을 평가하는 것을 포함한다.
실시형태들에서, 제형화된 제제는 병원체, 숙주 세포 오염물질 또는 불순물이 실질적으로 없거나; 사전결정된 비-감염성 입자의 수준 또는 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 미만, 100:1 미만 또는 50:1 미만)를 갖는다. 일부 실시형태에서, 다중 아넬로좀이 단일의 뱃치(batch)에서 생성될 수 있다. 실시형태들에서, 뱃치에서 생성되는 아넬로좀의 수준이 (예를 들어, 개별적으로 또는 함께) 평가될 수 있다.
일 양태에서, 본 발명은 하기를 포함하는 숙주 세포를 특징으로 한다:
(i) 본원에 기재된 바와 같은 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
(ii) 선택적으로, 표 16 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 약 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자.
일 양태에서, 본 발명은 본원에 기재된 아넬로좀 및 헬퍼 바이러스를 포함하는 반응 혼합물을 특징으로 하며, 헬퍼 바이러스는 폴리뉴클레오티드, 예를 들어, 외부 단백질(예를 들어, 외부 단백질 결합 서열에 결합할 수 있는 외부 단백질 및 선택적으로 지질 외피)을 인코딩하는 폴리뉴클레오티드, 복제 단백질(예를 들어, 중합효소)을 인코딩하는 폴리뉴클레오티드 또는 그의 임의의 조합을 포함한다.
일부 실시형태에서, 아넬로좀(예를 들어, 합성 아넬로좀)은 단리되며, 예를 들어, 숙주 세포로부터 단리되고/단리되거나 용액(예를 들어, 상청액) 중 다른 구성요소로부터 단리된다. 일부 실시형태에서, 아넬로좀(예를 들어, 합성 아넬로좀)은 예를 들어, 용액(예를 들어, 상청액)으로부터 정제된다. 일부 실시형태에서, 아넬로좀은 용액 중 다른 구성요소에 비하여 용액 중에서 농축된다.
전술된 아넬로좀, 조성물 또는 방법 중 어느 하나의 일부 실시형태에서, 아넬로좀을 제공하는 것은 아넬로좀을 예를 들어, 본원에 기재된 바와 같이, 아넬로좀-생성 세포를 포함하는 조성물로부터 분리하는 것(예를 들어, 수집하는 것)을 포함한다. 다른 실시형태에서, 아넬로좀을 제공하는 것은 아넬로좀 또는 그의 제제를 예를 들어, 제3자로부터 수득하는 것을 포함한다.
아넬로좀, 아넬로벡터, 조성물 또는 방법 중 어느 하나의 일부 실시형태에서, 유전 요소는 예를 들어, 실시예 9에 기재된 방법에 따라 확인되는 바와 같은, 아넬로좀 게놈을 포함한다. 실시형태들에서, 아넬로좀 게놈은 TTV-tth8 핵산 서열의 뉴클레오티드 3436 내지 3707의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%의 결실을 갖는, TTV-tth8 핵산 서열, 예를 들어, 표 5에 나타낸 TTV-tth8 핵산 서열을 포함한다. 실시형태들에서, 아넬로좀 게놈은 TTMV-LY2 핵산 서열의 뉴클레오티드 574 내지 1371, 1432 내지 2210, 574 내지 2210 및/또는 2610 내지 2809의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%의 결실을 갖는 TTMV-LY2 핵산 서열, 예를 들어, 표 15에 나타낸 TTMV-LY2 핵산 서열을 포함한다. 실시형태들에서, 아넬로좀 게놈은 자가-복제할 수 있고/있거나 자가-증폭할 수 있는 아넬로좀 게놈이다. 실시형태들에서, 아넬로좀 게놈은 자가-복제할 수 없고/없거나 자가-증폭할 수 없다. 실시형태들에서, 아넬로좀 게놈은 예를 들어, 헬퍼, 예를 들어, 헬퍼 바이러스의 존재 하에 트랜스로 복제할 수 있고/있거나 증폭할 수 있다.
아넬로좀, 아넬로벡터, 조성물 또는 방법 중 어느 하나의 추가의 특징은 하기 열거된 실시형태 중 하나 이상을 포함한다.
당업자는 단지 일상적인 실험을 사용하여, 본원에 기재된 본 발명의 특정 실시형태의 다수의 등가물을 인식하거나 확인할 수 있을 것이다. 그러한 등가물은 하기 열거된 실시형태에 의해 포함되는 것으로 의도된다.
열거된 실시형태
1000. 폴리펩티드, 예를 들어, ORF1 분자로서:
(a) 본원에 기재된 아르기닌-풍부 영역 서열(예를 들어, MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR(SEQ ID NO: 216) 또는 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRRRRWRRGRRKTRTYRRRRRFRRRGRK(SEQ ID NO: 186) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열, 또는 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 그의 조합)를 포함하는 적어도 약 40개 아미노산의 서열을 포함하는 제1 영역;
(b) 본원에 기재된 젤리-롤 영역 서열(예를 들어, PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPVHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQTRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPFVKPDKLSNNVTLWSLNT(SEQ ID NO: 217) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열 또는 적어도 6개(예를 들어, 적어도 6, 7, 8, 9, 10, 11 또는 12개) 베타 가닥을 포함하는 서열을 포함하는 제2 영역;
(c) 본원에 기재된 N22 도메인 서열(예를 들어, TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPELILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYLVILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFTPNIQGQLSDNISMFYKFYFK(SEQ ID NO: 219) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제3 영역; 및
(d) 본원에 기재된 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열(예를 들어, WGGSPPKAINVENPAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDYRHGNYTTTALSRISQDWALKDTVSKITEPDRQQLLKQALECLQISEETQEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ(SEQ ID NO: 220) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제4 영역 중 하나 이상을 포함하며;
ORF1 분자가 (예를 들어, 본원에 기재된 바와 같은) 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 화학적 또는 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아르기닌-풍부 영역, 젤리-롤 도메인, HVR, N22 또는 CTD 중 하나 이상)의 결실을 포함하는, 폴리펩티드, 예를 들어, ORF1 분자.
1000A. (a), (b), (c) 및 (d)의 영역의 아미노산 서열이 그들의 각각의 기준서열에 대하여 적어도 90% 서열 동일성을 갖는, 실시형태 1000의 폴리펩티드.
1001. 폴리펩티드가 하기를 포함하는, 실시형태 1000의 폴리펩티드:
(i) 제1 영역 및 제2 영역;
(ii) 제1 영역 및 제3 영역;
(iii) 제1 영역 및 제4 영역;
(iv) 제2 영역 및 제3 영역;
(v) 제2 영역 및 제4 영역;
(vi) 제3 영역 및 제4 영역;
(vii) 제1 영역, 제2 영역 및 제3 영역;
(viii) 제1 영역, 제2 영역 및 제4 영역;
(ix) 제1 영역, 제3 영역 및 제4 영역; 또는
(x) 제2 영역, 제3 영역 및 제4 영역.
1002. 폴리펩티드, 예를 들어, ORF1 분자로서:
(a) 본원에 기재된 아르기닌-풍부 영역 서열(예를 들어, MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR(SEQ ID NO: 216) 또는 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRRRRWRRGRRKTRTYRRRRRFRRRGRK(SEQ ID NO: 186) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열, 또는 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 그의 조합)를 포함하는 적어도 약 40개 아미노산의 서열을 포함하는 제1 영역;
(b) 본원에 기재된 젤리-롤 영역 서열(예를 들어, PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPVHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQTRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPFVKPDKLSNNVTLWSLNT(SEQ ID NO: 217) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열, 또는 적어도 6개의 베타 가닥을 포함하는 서열을 포함하는 제2 영역;
(c) 본원에 기재된 N22 도메인 서열(예를 들어, TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPELILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYLVILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFTPNIQGQLSDNISMFYKFYFK(SEQ ID NO: 219) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제3 영역; 및
(d) 본원에 기재된 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열(예를 들어, WGGSPPKAINVENPAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDYRHGNYTTTALSRISQDWALKDTVSKITEPDRQQLLKQALECLQISEETQEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ(SEQ ID NO: 220) 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같음)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제4 영역 중 하나 이상을 포함하며;
ORF1 분자가 (예를 들어, 본원에 기재된 바와 같은) 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 화학적 또는 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아르기닌-풍부 영역, 젤리-롤 도메인, HVR, N22 또는 CTD 중 하나 이상)의 결실을 포함하는, 폴리펩티드, 예를 들어, ORF1 분자.
1002A. (a), (b), (c) 및 (d) 영역의 아미노산 서열이 그들의 각각의 기준서열에 대하여 적어도 90% 서열 동일성을 갖는, 실시형태 1002에 따른 폴리펩티드.
1003. 상기 실시형태들 중 어느 한 실시형태에 있어서,
제1 영역이 표 16에 열거된 ORF1 서열의 아미노산 1 내지 38에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제2 영역이 표 16에 열거된 ORF1 서열의 아미노산 39 내지 246에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제3 영역이 표 16에 열거된 ORF1 서열의 아미노산 375 내지 537에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제4 영역이 표 16에 열거된 ORF1 서열의 아미노산 538 내지 666에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
1003A. 제1, 제2, 제3 및 제4 영역의 아미노산 서열이 그들의 각각의 기준서열에 대하여 적어도 90% 서열 동일성을 갖는, 실시형태 1003에 따른 폴리펩티드.
1004. 상기 실시형태들 중 어느 한 실시형태에 있어서,
제1 영역이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아르기닌-풍부 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제2 영역이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 젤리-롤 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제3 영역이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 N22 도메인 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하고/포함하거나;
제4 영역이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 CTD 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
1004A. 제1, 제2, 제3 및 제4 영역의 아미노산 서열이 그들의 각각의 기준 서열에 대하여 적어도 90% 서열 동일성을 갖는, 실시형태 1004에 따른 폴리펩티드.
1005. 폴리펩티드가 N-말단에서 C-말단 순서로, 제1 영역, 제2 영역, 제3 영역 및 제4 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1006. 적어도 하나의 차이가 야생형 ORF1 단백질의 아르기닌-풍부 영역에 비한 제1 영역 내의 적어도 하나의 차이를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1007. 제1 영역은 폴리펩티드 또는 제1 영역을 배제한 그의 부분이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스의 ORF1 단백질 유래의 아르기닌-풍부 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1008. 제1 영역은 폴리펩티드가 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 아르기닌-풍부 영역에 대하여 적어도 70% 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1009. 제1 영역이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 또는 제1 영역과 동일한 아미노산 길이를 갖는 그의 부분에 대하여 15% 미만(예를 들어, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1% 미만)의 서열 동일성을 갖는 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1010. 제1 영역이 DNA 결합 활성 및/또는 핵 국소화 활성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1011. 제1 영역이 DNA-결합 영역 및/또는 핵 국소화 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1012. 적어도 하나의 차이가 야생형 ORF1 단백질의 젤리-롤 영역에 비한 제2 영역 내의 적어도 하나의 차이를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1013. 제2 영역은 폴리펩티드 또는 제2 영역을 배제한 그의 부분이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스의 ORF1 단백질 유래의 젤리-롤 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1014. 제2 영역은 폴리펩티드가 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 젤리-롤 영역에 대하여 적어도 70% 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1015. 제2 영역이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 또는 제2 영역과 동일한 아미노산 길이를 갖는 그의 부분에 대하여 15% 미만(예를 들어, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1% 미만)의 서열 동일성을 갖는 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1016. 적어도 하나의 차이가 야생형 ORF1 단백질의 N22 도메인에 비한 제3 영역 내의 적어도 하나의 차이를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1017. 제3 영역은 폴리펩티드 또는 제3 영역을 배제한 그의 부분이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스의 ORF1 단백질 유래의 N22 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1018. 제3 영역은 폴리펩티드가 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 N22 영역에 대하여 적어도 70% 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1019. 제3 영역이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 또는 제3 영역과 동일한 아미노산 길이를 갖는 그의 부분에 대하여 15% 미만(예를 들어, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1% 미만)의 서열 동일성을 갖는 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1020. 적어도 하나의 차이가 야생형 ORF1 단백질의 CTD 도메인에 비한 제4 영역 내의 적어도 하나의 차이를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1021. 제4 영역은 폴리펩티드 또는 제4 영역을 배제한 그의 부분이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스의 ORF1 단백질 유래의 CTD 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1022. 제4 영역은 폴리펩티드가 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 CTD 영역에 대하여 적어도 70% 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1023. 제4 영역이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 또는 제4 영역과 동일한 아미노산 길이를 갖는 그의 부분에 대하여 15% 미만(예를 들어, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1% 미만)의 서열 동일성을 갖는 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1024. 아미노산 서열, 예를 들어, 초가변 영역(HVR) 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 분자의 HVR 서열)을 추가로 포함하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드로서, 아미노산 서열이 적어도 약 55개(예를 들어, 적어도 약 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60 또는 65개)의 아미노산(예를 들어, 약 45 내지 160개, 50 내지 160개, 55 내지 160개, 60 내지 160개, 45 내지 150개, 50 내지 150개, 55 내지 150개, 60 내지 150개, 45 내지 140개, 50 내지 140개, 55 내지 140개 또는 60 내지 140개의 아미노산)을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1025. HVR 서열이 제2 영역과 제3 영역 사이에 위치한, 실시형태 1024의 폴리펩티드.
1026. HVR 서열은 ORF1 단백질이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 HVR에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 1024 또는 1025의 폴리펩티드.
1027. HVR 서열이 제1 영역, 제2 영역, 제3 영역 및/또는 제4 영역 중 하나 이상에 비하여 이종인, 실시형태 1024 내지 1026 중 어느 한 실시형태의 폴리펩티드.
1028. 적어도 하나의 차이가 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 게놈 유래의) 야생형 ORF1 단백질의 HVR의 서열에 비한 HVR 서열 내의 적어도 하나의 차이를 포함하는, 실시형태 1024 내지 1027 중 어느 한 실시형태의 폴리펩티드.
1029. HVR 서열은 폴리펩티드 또는 HVR 서열을 배제한 그의 부분이 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스의 ORF1 단백질 유래의 HVR을 포함하는, 실시형태 1024 내지 1028 중 어느 한 실시형태의 폴리펩티드.
1030. HVR 서열은 폴리펩티드가 가장 큰 서열 동일성을 갖는 야생형 아넬로바이러스 이외의 아넬로바이러스 유래의 HVR에 대하여 적어도 70% 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 1024 내지 1029 중 어느 한 실시형태의 폴리펩티드.
1031. HVR이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 HVR 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 1024 내지 1030 중 어느 한 실시형태의 폴리펩티드.
1032. HVR 서열이 표 16에 열거된 ORF1 서열의 아미노산 247 내지 374에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 포함하는, 실시형태 1024 내지 1031 중 어느 한 실시형태의 폴리펩티드.
1033. 이종 폴리펩티드, 예를 들어, 제1 영역, 제2 영역, 제3 영역 및/또는 제4 영역 중 하나 이상에 비하여 이종이고/이종이거나, 폴리펩티드를 포함하는 아넬로좀에 비하여 외인성인 폴리펩티드를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1034. 폴리펩티드는 아넬로바이러스 HVR 서열이 결여된, 실시형태 1033의 폴리펩티드.
1035. 이종 폴리펩티드가 아넬로좀의 외부에 존재하는, 실시형태 1033의 폴리펩티드.
1036. 이종 폴리펩티드가 아넬로좀의 내부에 존재하는, 실시형태 1033의 폴리펩티드.
1037. 이종 폴리펩티드가 아넬로좀 또는 야생형 아넬로바이러스에 대하여 외인성인 작용기를 갖는, 실시형태 1033 내지 1036 중 어느 한 실시형태의 폴리펩티드.
1038. 이종 폴리펩티드가 약 140개 또는 그 미만의 아미노산(예를 들어, 100, 110, 120, 125, 130, 135, 136, 137, 138, 139, 140, 145, 150, 155 또는 160개 또는 그 미만의 아미노산)으로 이루어진, 실시형태 1033 내지 1037 중 어느 한 실시형태의 폴리펩티드.
1039. 이종 폴리펩티드의 크기가 예를 들어, 본원에 기재된 바와 같은, 아넬로바이러스의 야생형 HVR 영역에 비하여 50 내지 150%인, 실시형태 1033 내지 1038 중 어느 한 실시형태의 폴리펩티드.
1039A. 이종 폴리펩티드가 제2 영역과 제3 영역 사이에 위치한, 실시형태 1033 내지 1039 중 어느 한 실시형태의 폴리펩티드.
1040. 제1 영역과 제2 영역 사이의 하나 이상의 아미노산, 제2 영역과 제3 영역 사이의 하나 이상의 아미노산 및/또는 제3 영역과 제4 영역 사이의 하나 이상의 아미노산을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1041. 제1 영역에 비하여 N-말단에 위치한 하나 이상의 아미노산을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1042. 제4 영역에 비하여 C-말단에 위치한 하나 이상의 아미노산을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1043. 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 ORF1 아미노산 서열의 상응하는 하위서열에 대하여 100% 서열 동일성을 갖는 적어도 4개(예를 들어, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 또는 30개)의 인접 아미노산의 복수의 하위서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1044. 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 ORF1 아미노산 서열의 상응하는 하위서열에 대하여 적어도 80% 서열 동일성을 갖는 적어도 10개(예를 들어, 10, 15, 20, 25, 30, 40 또는 50개)의 인접 아미노산의 복수의 하위서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1045. 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 ORF1 아미노산 서열의 상응하는 하위서열에 대하여 적어도 60% 서열 동일성을 갖는 적어도 20개(예를 들어, 20, 25, 30, 40, 50, 60, 70, 80, 90 또는 100개)의 인접 아미노산의 복수의 하위서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1046. 복수의 하위서열이 제1 영역, 제2 영역, 제3 영역 및/또는 제4 영역 내에 위치한, 실시형태 1043 내지 1045 중 어느 한 실시형태의 폴리펩티드.
1047. 제1 영역이 적어도 약 40개 아미노산(예를 들어, 적어도 약 50, 60, 70, 80, 90 또는 100개 아미노산, 예를 들어, 약 40 내지 100, 40 내지 90, 40 내지 80, 40 내지 70, 50 내지 100, 50 내지 70, 60 내지 100, 60 내지 90, 60 내지 80 또는 60 내지 70개 아미노산)을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1048. 제1 영역이 적어도 약 70%(예를 들어, 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 100%)의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 그의 조합)를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1049. 제1 영역이 적어도 약 70%(예를 들어, 적어도 약 70%, 75%, 80%, 85%, 90%, 95% 또는 100%)의 아르기닌 잔기를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1050. 폴리펩티드가 추가의 카피의 폴리펩티드와 동종다량체를 형성하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1051. 제1 영역이 추가의 카피의 폴리펩티드 상의 상응하는 제1 영역에 결합하는, 실시형태 1050의 폴리펩티드.
1052. 동종다량체가 예를 들어, 핵산, 예를 들어, 유전 요소 또는 아넬로바이러스 게놈 또는 그의 부분을 캡슐화하는 캡시드를 형성하는, 실시형태 1050의 폴리펩티드.
1053. 폴리펩티드가 캡시드 단백질이거나, 캡시드의 부분을 형성할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1054. 폴리펩티드가 복제효소 활성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1055. 폴리펩티드가 핵산(예를 들어, DNA)에 결합하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
1056. 복합체로서:
(a) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 및
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는, 복합체.
1057. 복합체로서:
(a) ORF1 분자, 및
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하며;
ORF1 분자가 유전 요소에 결합되고(예를 들어, 이에 비-공유적으로 결합되고),
ORF1 분자, 유전 요소, 또는 ORF1 분자 및 유전 요소 둘 모두가 각각 (예를 들어, 본원에 기재된 바와 같은) 야생형 ORF1 단백질, 야생형 아넬로바이러스 게놈, 또는 야생형 ORF1 단백질 및 야생형 아넬로바이러스 게놈 둘 모두에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 화학적 또는 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아르기닌-풍부 영역, 젤리-롤 도메인, HVR, N22 또는 CTD 중 하나 이상) 또는 게놈 영역(예를 들어, 본원에 기재된 바와 같은, 예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는, 복합체.
1058. 복합체가 시험관 내에 존재하며, 예를 들어, 복합체가 실질적으로 무세포 조성물 내에 존재하는, 실시형태 1056 또는 1057의 복합체.
1059. 복합체가 세포, 예를 들어, 숙주 세포, 예를 들어, 헬퍼 세포, 예를 들어, 세포의 핵 내에 존재하는, 실시형태 1056 내지 1058 중 어느 한 실시형태의 복합체.
1060. ORF1 분자가 단백질성 외부의 부분인, 실시형태 1056 내지 1059 중 어느 한 실시형태의 복합체.
1061. 유전 요소가 복제를 겪는 중인, 실시형태 1056 내지 1060 중 어느 한 실시형태의 복합체.
1062. 복합체가 아넬로좀 내에 존재하는, 실시형태 1056 내지 1061 중 어느 한 실시형태의 복합체.
1063. 유전 요소가 폴리펩티드를 인코딩하는 핵산 서열을 추가로 포함하는, 실시형태 1056 내지 1062 중 어느 한 실시형태의 복합체.
1064. 유전 요소가 폴리펩티드를 인코딩하는 핵산 서열을 포함하지 않는, 실시형태 1056 내지 1063 중 어느 한 실시형태의 복합체.
1065. 유전 요소가 예를 들어, 본원에 기재된 바와 같은 GC-풍부 영역을 포함하는, 실시형태 1056 내지 1064 중 어느 한 실시형태의 복합체.
1066. GC-풍부 영역이 하기 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는, 실시형태 1065의 복합체:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열.
1067. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드 또는 복합체;
(c) 이펙터(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소를 포함하는 유전 요소를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되는, 아넬로좀.
1068. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 유전 요소로서:
(i) 이펙터(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소, 및
(ii) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 인코딩하는 핵산을 포함하는, 유전 요소를 포함하며,
유전 요소가 단백질성 외부 내에 봉입되는, 아넬로좀.
1069. 아넬로좀으로서:
(a) 단백질성 외부;
(b) ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산;
(c) 이펙터를 인코딩하는 이종 핵산 서열(예를 들어, DNA 서열)에 작동 가능하게 연결된 프로모터 요소를 포함하는 유전 요소를 포함하며,
유전 요소가 단백질성 외부 내에 봉입되는, 아넬로좀.
1070. 아넬로좀으로서:
(a) 단백질성 외부;
(b) ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산;
(c) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 하기의 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역을 포함하는 유전 요소를 포함하며,
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며; 선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1071. 아넬로좀으로서:
(a) 단백질성 외부;
(b) ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산;
(c) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 적어도 70%(예를 들어, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%)의 GC 함량을 갖는 적어도 20개(예를 들어, 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개)의 연속 뉴클레오티드를 포함하는 서열을 포함하는 유전 요소를 포함하며,
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1072. 아넬로좀으로서:
(a) 단백질성 외부;
(b) ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산으로서,
(i) ORF1 분자의 아미노산의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)가 β-가닥의 부분이고;
(ii) ORF1 분자의 2차 구조가 적어도 3개(예를 들어, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 β-가닥을 포함하고;
(iii) ORF1 분자의 2차 구조가 적어도 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-가닥 대 α-나선의 비를 포함하는 ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산; 및
(c) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 단백질 결합 서열을 포함하는 유전 요소를 포함하며,
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1073. 아넬로좀으로서:
(a) 단백질성 외부;
(b) ORF1 분자 또는 ORF1 분자를 인코딩하는 핵산;
(c) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하며;
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1074. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 하기의 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역을 포함하는 유전 요소를 포함하며,
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1075. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 서열을 포함하는 유전 요소를 포함하며,
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 아넬로좀.
1076. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소를 포함하며,
유전 요소가 핵산 서열: CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160)에 대하여 적어도 95%(예를 들어, 적어도 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 영역(예를 들어, 이펙터를 인코딩하는 핵산 서열에 비하여 3'에 위치한, 예를 들어, 패키징 영역)을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되는, 아넬로좀.
1076A. 아넬로좀으로서:
(i) 프로모터 요소 및 치료적 외인성 이펙터를 인코딩하는 핵산 서열을 포함하는 유전 요소로서, 유전 요소가 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 5' UTR 뉴클레오티드 서열에 대하여 적어도 95% 서열 동일성을 갖는 서열을 포함하는 유전 요소; 및/또는
(ii) 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스의 ORF1 유전자에 의해 인코딩된 폴리펩티드에 대하여 적어도 95% 서열 동일성을 갖는 폴리펩티드를 포함하는 단백질성 외부를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며,
선택적으로, 아넬로좀이 유전 요소를 포유동물 세포 내로 운반할 수 있는, 아넬로좀.
1076B. 아넬로좀으로서:
(I) (a) 프로모터 요소 및 (b) 외인성 이펙터(예를 들어, 본원에 기재된 바와 같은 외인성 이펙터)를 인코딩하는 핵산 서열로서, 핵산 서열은 프로모터 요소에 작동 가능하게 연결된 핵산 서열; 및 (c) 하기:
(c)(i) SEQ ID NO: 54의 뉴클레오티드 323 내지 393의 핵산 서열 또는 이에 대하여 적어도 85% 동일한 핵산 서열;
(c)(ii) SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 119 중 어느 하나의 핵산 서열 또는 이에 대하여 적어도 85% 동일한 핵산 서열; 또는
(c)(iii) SEQ ID NO: 61의 뉴클레오티드 117 내지 187의 핵산 서열 또는 이에 대하여 적어도 85% 동일한 핵산 서열 중 하나를 포함하는 5' UTR 도메인을 포함하는 유전 요소;
(II) ORF1 분자를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
합성 아넬로좀이 유전 요소를 포유동물, 예를 들어, 인간 세포 내로 운반할 수 있는, 아넬로좀.
1077. 단백질성 외부가 ORF1 분자를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1078. 단백질성 외부 내의 적어도 60%(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%)의 단백질이 ORF1 분자를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1079. 단백질성 외부 내의 1% 이하(예를 들어, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35% 또는 40% 이하)의 단백질이 ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 분자를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1080. ORF1 분자가 표 A1 내지 A12, B1 내지 B5, C1 내지 C5, 1 내지 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된, 또는 이에 열거된 서열에 의해 인코딩되는 ORF1 단백질에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1081. ORF1 분자가 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1082. 유전 요소가 ORF1 분자를 인코딩하는 핵산 서열을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1083. 유전 요소가 ORF1 분자를 인코딩하는 핵산 서열을 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1084. 유전 요소가 적어도 80%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1085. 유전 요소가 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1086. 유전 요소가 적어도 80%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1087. 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 인코딩하는 핵산을 포함하는(예를 들어, 1개 또는 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서;
선택적으로, 단리된 핵산 조성물이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 추가로 포함하며;
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1088. (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서, 단리된 핵산 조성물이 ORF1 분자를 인코딩하는 유전 요소를 포함하며;
(i) ORF1 분자의 아미노산의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)가 β-시트의 부분이고;
(ii) ORF1 분자의 2차 구조가 적어도 3개(예를 들어, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 β-시트를 포함하고;
(iii) ORF1 분자의 2차 구조가 적어도 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-시트 대 α-나선의 비를 포함하며,
유전 요소가 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열 및 단백질 결합 서열을 포함하며;
유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1089. (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서:
(a) ORF1 분자를 인코딩하는 유전 요소;
(b) 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드; 및
(c) (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1090. (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서, 단리된 핵산 조성물이:
(a) ORF1 분자를 인코딩하는 유전 요소;
(b) 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하며;
단리된 핵산 조성물이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1090A. (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서, 단리된 핵산 조성물이 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 5' UTR 뉴클레오티드 서열을 포함하는 유전 요소를 포함하는, 단리된 핵산 조성물.
1091. (a) 및 (b)가 동일한 핵산의 부분인, 실시형태 1089 내지 1090 중 어느 한 실시형태의 단리된 핵산 조성물.
1092. (a) 및 (b)가 상이한 핵산의 부분인, 실시형태 1089 내지 1091 중 어느 한 실시형태의 단리된 핵산 조성물.
1093. 유전 요소가 하기 중 하나 이상을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물: 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 TATA 박스, 개시인자 요소, 캡 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1-인코딩 서열, ORF1/1-인코딩 서열, ORF1/2-인코딩 서열, ORF2-인코딩 서열, ORF2/2-인코딩 서열, ORF2/3-인코딩 서열, ORF2/3t-인코딩 서열, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열.
1094. 유전 요소가 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 게놈 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1095. 적어도 하나의 추가의 카피의 아넬로바이러스 게놈 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열(예를 들어, 총 1, 2, 3, 4, 5 또는 6개 카피)을 추가로 포함하는, 실시형태 1094의 단리된 핵산 조성물.
1096. 적어도 하나의 추가의 카피의 유전 요소(예를 들어, 총 1, 2, 3, 4, 5 또는 6개 카피)를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1097. 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드; 및
(예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는 (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서,
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1098. (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물로서, 단리된 핵산 조성물이 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하며;
단리된 핵산 조성물이 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
선택적으로, 핵산 분자가
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실; 및/또는
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않는, 단리된 핵산 조성물.
1099. ORF1 분자가 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1100. 적어도 80%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1101. 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1102. 적어도 80%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1103. 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열, 및/또는 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열) 중 하나 이상을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1104. 야생형 아넬로바이러스 게놈 서열의 적어도 약 100, 150, 200, 250, 300, 350, 400, 450 또는 500개의 연속 뉴클레오티드 또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1105. 하기 핵산 서열에 대하여 적어도 95%(예를 들어, 적어도 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열을 포함하는, 단리된 핵산 분자(예를 들어, 발현 벡터):
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172).
1106. 단리된 핵산 분자가 환형인, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 조성물.
1107. 단리된 세포로서:
(a) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 인코딩하는 핵산으로서, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 세포 염색체 내로 통합되는 핵산, 및
(b) 유전 요소로서, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하며, 선택적으로, 유전 요소가 ORF1 폴리펩티드(예를 들어, ORF1 단백질)를 인코딩하지 않는 유전 요소를 포함하는, 단리된 세포.
1108. 단리된 세포, 예를 들어, 숙주 세포로서:
(a) ORF1 분자를 인코딩하는 핵산으로서, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 세포 염색체 내로 통합되는 핵산, 및
(b) 유전 요소로서, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는, 단리된 세포, 예를 들어, 숙주 세포.
1109. 단리된 세포, 예를 들어, 숙주 세포로서:
(a) ORF1 분자를 인코딩하는 핵산(예를 들어, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 세포 염색체 내로 통합됨), 및
(b) ORF1 분자를 인코딩하지 않는 유전 요소로서, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는, 단리된 세포, 예를 들어, 숙주 세포.
1109A. 단리된 세포, 예를 들어, 숙주 세포로서:
(i) 본원에 기재된 바와 같은 아넬로좀의 유전 요소(예를 들어, ORF1 분자를 인코딩하지 않는 유전 요소)의 핵산 서열을 포함하는 핵산 분자(예를 들어, 제1 핵산 분자), 및
(ii) 선택적으로, 예를 들어, 표 16 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 핵산 분자, 예를 들어, 제2 핵산 분자를 포함하는, 단리된 세포, 예를 들어, 숙주 세포.
1110. ORF1 분자를 인코딩하지 않는 유전 요소가 ORF1 분자의 단편, 예를 들어, 캡시드를 형성하지 않는 단편, 예를 들어, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 20 또는 10개 미만의 뉴클레오티드의 단편을 인코딩하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 세포.
1111. ORF1 분자를 인코딩하는 핵산(예를 들어, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 세포 염색체 내로 통합됨)을 포함하는 단리된 세포, 예를 들어, 숙주 세포로서, 단리된 세포가 ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 분자 중 하나 이상을 포함하지 않는, 단리된 세포, 예를 들어, 숙주 세포.
1112. 상기 실시형태들 중 어느 한 실시형태의 핵산 조성물을 포함하는, 단리된 세포, 예를 들어, 숙주 세포.
1113. ORF1 분자를 인코딩하는 헬퍼 핵산(예를 들어, 플라스미드 또는 바이러스 핵산)으로서, 단리된 세포가 ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 분자 중 하나 이상을 포함하지 않는, 헬퍼 핵산.
1114. 조성물로서:
(a) 본원에 기재된 단리된 세포, 및
(b) 본원에 기재된 아넬로좀을 포함하는, 조성물.
1115. 조성물로서:
(a) ORF1 분자를 인코딩하는 핵산(예를 들어, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 세포 염색체 내로 통합됨)을 포함하는 세포, 및
(b) ORF1 분자를 인코딩하지 않는 (예를 들어, 세포 내측 또는 세포 외측의, 예를 들어, 세포 배양 배지 내의) 유전 요소로서, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는, 조성물.
1116. 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀 또는 단리된 핵산 및 약제학적으로 허용 가능한 담체 및/또는 부형제를 포함하는, 약제학적 조성물.
1117. ORF1 분자의 제조 방법으로서, 방법이
(a) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드를 인코딩하는 핵산을 포함하는 숙주 세포(예를 들어, 본원에 기재된 숙주 세포)를 제공하는 단계, 및
(b) 숙주 세포를 세포가 폴리펩티드를 생성하도록 허용하는 조건 하에서 유지하는 단계를 포함하며;
이렇게 함으로써, ORF1 분자를 제조하는, 방법.
1118. ORF1 분자의 제조 방법으로서, 방법이
(a) 상기 실시형태들 중 어느 한 실시형태의 핵산 조성물을 포함하는 숙주 세포(예를 들어, 본원에 기재된 숙주 세포)를 제공하는 단계, 및
(b) 숙주 세포를 세포가 폴리펩티드를 생성하도록 허용하는 조건 하에서 유지하는 단계를 포함하며;
이렇게 함으로써 ORF1 분자를 제조하는, 방법.
1119. 숙주 세포가 헬퍼 세포인, 실시형태 1117 또는 1118의 방법.
1120. 헬퍼 세포가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스의 하나 이상의 추가의 ORF(예를 들어, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 중 하나 이상)를 인코딩하는 하나 이상의 추가의 핵산을 포함하는, 실시형태 1119의 방법.
1121. 핵산이 숙주 세포의 게놈 내로 통합되는, 실시형태 1117 내지 1120 중 어느 한 실시형태의 방법.
1122. 숙주 세포가 숙주 세포 당 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 1000, 10,000, 50,000, 100,000, 500,000 또는 1,000,000개 카피(예를 들어, 적어도 약 60개 카피)의 폴리펩티드를 생성하는, 실시형태 1117 내지 1121 중 어느 한 실시형태의 방법.
1123. 숙주 세포가 숙주 세포에 의해 생성되는 아넬로좀 당 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 1000, 10,000 또는 100,000개 카피(예를 들어, 적어도 약 60개 카피)의 폴리펩티드를 생성하는, 실시형태 1117 내지 1122 중 어느 한 실시형태의 방법.
1124. 방법이 복수의 숙주 세포를 제공하는 단계 및 숙주 세포를 세포당 적어도 1000개 카피의 폴리펩티드의 생성을 가능하게 하는 조건 하에서 유지하는 단계를 포함하는, 실시형태 1117 내지 1123 중 어느 한 실시형태의 방법.
1125. 복수의 숙주 세포가 적어도 약 1x105, 1x106, 1x107, 1x108, 9x108, 1x109, 1x1010, 1x1011 또는 1x1012개 카피의 폴리펩티드를 생성하는, 실시형태 1124의 방법.
1126. 아넬로좀 조성물의 제조 방법으로서, 방법이
(a) 헬퍼 세포, 예를 들어, 본원에 기재된 헬퍼 세포를 제공하는 단계;
(b) 유전 요소를 세포가 아넬로좀을 생성하도록 허용하는 조건 하에서 헬퍼 세포 내로 도입하는 단계, 및
(c) 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하며;
이렇게 함으로써 아넬로좀 조성물을 제조하는, 방법.
1127. 아넬로좀 조성물의 제조 방법으로서, 방법이
(a) 숙주 세포를 제공하는 단계;
(b) 헬퍼 핵산을 숙주 세포 내로 도입하는 단계;
(c) 유전 요소를 세포가 아넬로좀을 생성하도록 허용하는 조건 하에서, (예를 들어, (b) 이전에, 이후에 또는 이와 동시에) 숙주 세포 내로 도입하는 단계; 및
(d) 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하며;
이렇게 함으로써 아넬로좀 조성물을 제조하는, 방법.
1128. 아넬로좀 조성물의 제조 방법으로서, 방법이
(a) ORF1 분자를 인코딩하는 핵산(예를 들어, 핵산이 플라스미드이거나, 바이러스 핵산이거나, 헬퍼 세포 염색체 내로 통합됨)을 포함하는 헬퍼 세포를 제공하는 단계;
(b) 유전 요소를 세포가 아넬로좀을 생성하도록 허용하는 조건 하에서 헬퍼 세포 내로 도입하는 단계로서, 유전 요소가 ORF1 분자를 인코딩하지 않으며, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 단계; 및
(c) 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하며;
이렇게 함으로써 아넬로좀 조성물을 제조하는, 방법.
1129. 아넬로좀 조성물의 제조 방법으로서, 방법이
(a) 숙주 세포를 제공하는 단계;
(b) ORF1 분자를 인코딩하는 헬퍼 핵산(예를 들어, 핵산이 플라스미드이거나, 바이러스 핵산임)을 숙주 세포 내로 도입하는 단계; 및
(c) 유전 요소를 세포가 아넬로좀을 생성하도록 허용하는 조건 하에서, (예를 들어, (b) 이전에, 이후에 또는 이와 동시에) 숙주 세포 내로 도입하는 단계로서, 유전 요소가 ORF1 분자를 인코딩하지 않으며, 유전 요소가 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 단계를 포함하며,
이렇게 함으로써 아넬로좀을 제조하는, 방법.
1130. 아넬로좀을 헬퍼 세포 또는 숙주 세포로부터 분리하는 단계를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
1131. 헬퍼 세포를 제공하는 단계가 헬퍼 핵산을 숙주 세포 내로 도입하는 것을 포함하며, 예를 들어, 헬퍼 핵산이 ORF1 분자를 인코딩하는(예를 들어, 핵산이 플라스미드이거나 바이러스 핵산임), 상기 실시형태들 중 어느 한 실시형태의 방법.
1132. 헬퍼 세포가 ORF1 분자를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
1133. 핵산이 하기 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법: 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 TATA 박스, 개시인자 요소, 캡 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1-인코딩 서열, ORF1/1-인코딩 서열, ORF1/2-인코딩 서열, ORF2-인코딩 서열, ORF2/2-인코딩 서열, ORF2/3-인코딩 서열, ORF2/3t-인코딩 서열, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열.
1134. 핵산이 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 게놈 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
1135. 핵산이 적어도 하나의 추가의 카피의 아넬로바이러스 게놈 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열(예를 들어, 총 1, 2, 3, 4, 5 또는 6개 카피)을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
1136. 숙주 세포 또는 헬퍼 세포가 적어도 하나의 추가의 카피의 핵산(예를 들어, 총 1, 2, 3, 4, 5 또는 6개 카피)을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
1137. 핵산이 환형인, 상기 실시형태들 중 어느 한 실시형태의 방법.
1137A. 아넬로좀, 예를 들어, 합성 아넬로좀의 제조 방법으로서:
a) 숙주 세포를 제공하는 단계로서:
(i) 본원에 기재된 바와 같은, 아넬로좀, 예를 들어, 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 핵산 분자, 예를 들어, 제1 핵산 분자, 및
(ii) 예를 들어, 표 16 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 핵산 분자, 예를 들어, 제2 핵산 분자를 포함하는 숙주 세포를 제공하는 단계; 및
b) 숙주 세포를 아넬로좀을 제조하기에 적합한 조건 하에서 배양하는 단계를 포함하는, 방법.
1137B. 단계 (a) 이전에, 제1 핵산 분자 및/또는 제2 핵산 분자를 숙주 세포 내로 도입하는 단계를 추가로 포함하는, 실시형태 1137A의 방법.
1137C. 제2 핵산 분자가 제1 핵산 분자 이전에, 이와 동시에, 또는 이후에 숙주 세포 내로 도입되는, 실시형태 1137A 또는 1137B의 방법.
1137D. 제2 핵산 분자가 숙주 세포의 게놈 내로 통합되는, 실시형태 1137C의 방법.
1137E. 제2 핵산 분자가 헬퍼(예를 들어, 헬퍼 플라스미드 또는 헬퍼 바이러스의 게놈)인, 실시형태 1137C의 방법.
1137F. 제1 핵산이 하기 중 하나 이상을 포함하는, 실시형태 1137A 내지 1137E 중 어느 한 실시형태의 방법: 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 TATA 박스, 개시인자 요소, 캡 부위, 전사 시작 부위, 5' UTR 보존된 도메인 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열.
1138. 아넬로좀을 대상체에게 투여하는 단계를 포함하는 대상체로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역을 포함하는 유전 요소를 포함하며,
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 대상체에 운반하는, 방법.
1139. 아넬로좀을 대상체에게 투여하는 단계를 포함하는 대상체로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 서열을 포함하는 유전 요소를 포함하는 아넬로좀을 대상체에게 투여함으로써 이펙터를 대상체에 운반하는 단계를 포함하는, 대상체로의 이펙터의 운반 방법으로서,
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 대상체에 운반하는, 방법.
1140. 아넬로좀을 대상체에게 투여하는 단계를 포함하는 대상체로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 대상체에 운반하는, 방법.
1141. 아넬로좀과 표적 세포를 접촉시키는 단계를 포함하는 표적 세포로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 핵산 서열:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역을 포함하는 유전 요소를 포함하며,
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 표적 세포에 운반하는, 방법.
1142. 아넬로좀과 표적 세포를 접촉시키는 단계를 포함하는 표적 세포로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소, 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 서열을 포함하는 유전 요소를 포함하는 아넬로좀을 대상체에게 투여함으로써 이펙터를 대상체에 운반하는 단계를 포함하는, 대상체로의 이펙터의 운반 방법으로서,
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 표적 세포에 운반하는, 방법.
1143. 아넬로좀과 표적 세포를 접촉시키는 단계를 포함하는 표적 세포로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(a) ORF1 분자를 포함하는 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 표적 세포에 운반하는, 방법.
1143A. 아넬로좀과 표적 세포를 접촉시키는 단계를 포함하는 표적 세포로의 이펙터의 운반 방법으로서, 상기 아넬로좀이:
(i) 프로모터 요소 및 치료적 외인성 이펙터를 인코딩하는 핵산 서열을 포함하는 유전 요소로서, 유전 요소가 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 5' UTR 뉴클레오티드 서열에 대하여 적어도 95% 서열 동일성을 갖는 서열을 포함하는 유전 요소; 및/또는
(ii) 본원에 기재된(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스의 ORF1 유전자에 의해 인코딩된 폴리펩티드에 대하여 적어도 95% 서열 동일성을 갖는 폴리펩티드를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
선택적으로, 유전 요소가:
(i) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열에 비하여 뉴클레오티드 3436 내지 3607의 결실을 포함하지 않고/않거나;
(ii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 뉴클레오티드 1432 내지 2210의 결실을 포함하지 않고/않거나;
(iii) 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열에 비하여 적어도 101개 뉴클레오티드의 결실을 포함하지 않고,
이렇게 함으로써 이펙터를 표적 세포에 운반하는, 방법.
1144. 유전 요소가 NCBI 수탁 번호 A7XCE8.1의 아미노산 서열을 인코딩하지 않는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1145. ORF1 분자가 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 ORF1 서열에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1146. ORF1 분자의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)의 아미노산이 β-시트의 부분인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1147. ORF1 분자의 2차 구조가 적어도 3개(예를 들어, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 β-시트를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1148. ORF1 분자의 2차 구조가 적어도 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-시트 대 α-나선의 비를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1149. ORF1 분자가 (예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 아르기닌-풍부 영역 서열에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는) 아르기닌-풍부 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1150. 아르기닌-풍부 영역이 적어도 40%(예를 들어, 적어도 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 90% 또는 95%)의 아르기닌 잔기를 포함하는 적어도 15, 20, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45 또는 50개의 연속 뉴클레오티드를 포함하는, 실시형태 1149의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1151. 아르기닌-풍부 영역이 ORF1 분자의 N-말단 또는 C-말단에 위치하는, 실시형태 1149 또는 1150의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1152. 아르기닌-풍부 영역이 아미노산 서열 TVVRRRGRSPRRRTPSPRRRRSQSPRRRRSQSRESQC(SEQ ID NO: 808), RRRYARPYRRRHIRRYRRRRRHFRRRR(SEQ ID NO: 809), MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR(SEQ ID NO: 216) 또는 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRRRRWRRGRRKTRTYRRRRRFRRRGRK(SEQ ID NO: 186)에 대하여 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는, 실시형태 1149 내지 1151 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1153. 아르기닌-풍부 영역이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 아르기닌-풍부 영역 서열에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는, 실시형태 1149 내지 1152 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1154. ORF1 분자가 예를 들어, 본원에 기재된 ORF1 분자의 젤리-롤 도메인, 예를 들어, 아미노산 서열 PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPVHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQTRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPFVKPDKLSNNVTLWSLNT(SEQ ID NO: 217)를 갖는 젤리-롤 도메인 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 젤리-롤 도메인 서열의 아미노산 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 젤리-롤 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1155. ORF1 분자가 본원에 기재된 ORF1 분자의 N22 도메인, 예를 들어, 아미노산 서열 TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPELILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYLVILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFTPNIQGQLSDNISMFYKFYFK(SEQ ID NO: 219)를 갖는 N22 도메인 또는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 N22 도메인 서열의 아미노산 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 N22 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1156. ORF1 분자가 세포의 핵에 국소화되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1157. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스 게놈 서열의 약 500, 1000, 1100, 1200, 1210 또는 1219개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1158. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 알파토르크바이러스(예를 들어, 클레이드 1, 2 또는 3 알파토르크바이러스) 게놈 서열의 약 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3450, 3460, 3470, 3480, 3490, 3500, 3510, 3520, 3530, 3540, 3550, 3560, 3570 또는 3580개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1159. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 베타토르크바이러스 게놈 서열의 약 500, 1000, 1100, 1200, 1210 또는 1219개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1160. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 감마토르크바이러스 게놈 서열의 약 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3120, 3130, 3140, 3141 또는 3142개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1161. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 알파토르크바이러스(예를 들어, 클레이드 1, 2 또는 3 알파토르크바이러스) 게놈 서열의 적어도 약 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3450, 3460, 3470, 3480, 3490, 3500, 3510, 3520, 3530, 3540, 3550, 3560, 3570 또는 3580개의 연속 뉴클레오티드(예를 들어, 약 500 내지 3580개, 1000 내지 3580개, 1500 내지 3580개, 2000 내지 3580개 또는 3000 내지 3580개의 연속 뉴클레오티드)에 비하여 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1162. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 베타토르크바이러스 게놈 서열의 적어도 약 500, 1000, 1100, 1200, 1210 또는 1219개의 연속 뉴클레오티드(예를 들어, 약 500 내지 1000개, 500 내지 1100개, 500 내지 1200개, 500 내지 1219개, 1000 내지 1100개, 1000 내지 1200개 또는 1000 내지 1219개의 연속 뉴클레오티드)에 비하여 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1163. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 감마토르크바이러스 게놈 서열의 적어도 약 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3120, 3130, 3140, 3141 또는 3142개의 연속 뉴클레오티드(예를 들어, 약 500 내지 3142개, 1000 내지 3142개, 1500 내지 3142개, 2000 내지 3142개 또는 2500 내지 3142개의 연속 뉴클레오티드)에 비하여 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1164. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 TTMV-LY2 게놈 서열의 약 500, 1000, 1100, 1200, 1210 또는 1219개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1165. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 TTV-tth8 게놈 서열의 약 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3550, 3560, 3570, 3580 또는 3581개의 연속 뉴클레오티드에 비하여 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 이하의 서열 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1166. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 1578, 1579, 1580, 1590, 1600, 1650, 1700, 1750 또는 2000개 뉴클레오티드의 결실을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1167. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스 게놈 서열에 비하여 1 내지 99개, 1 내지 90개, 1 내지 80개, 1 내지 70개, 1 내지 60개, 1 내지 50개, 10 내지 99개, 10 내지 90개, 10 내지 80개, 10 내지 70개, 10 내지 60개, 10 내지 50개, 20 내지 99개, 20 내지 90개, 20 내지 80개, 20 내지 70개, 20 내지 60개, 20 내지 50개, 30 내지 99개, 30 내지 90개, 30 내지 80개, 30 내지 70개, 30 내지 60개, 30 내지 50개, 40 내지 99개, 40 내지 90개, 40 내지 80개, 40 내지 70개, 40 내지 60개 또는 40 내지 50개 뉴클레오티드의 결실을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1168. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스 게놈 서열에 비하여 100개의 뉴클레오티드 결실, 172개의 뉴클레오티드 결실 또는 1577개의 뉴클레오티드 결실을 갖지 않는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1169. 유전 요소 또는 단리된 핵산 분자가 예를 들어, 본원에 기재된 바와 같은, 야생형 아넬로바이러스 게놈 서열에 비하여 3개 이상의 결실을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1170. 유전 요소 또는 단리된 핵산 분자가 하기 핵산 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%)의 서열 동일성을 갖는 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172).
1171. 유전 요소 또는 단리된 핵산 분자가 하기 핵산 서열에 대하여 적어도 95%(예를 들어, 적어도 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172).
1172. 유전 요소 또는 단리된 핵산 분자가 핵산 서열 CCGCCATCTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACCATCAGCCACACCTACTCAAAATGGTGG(SEQ ID NO: 161)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1173. 유전 요소 또는 단리된 핵산 분자가 핵산 서열 CTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACCATCAGCCACACCTACTCAAAATGGTGGACAATTTCTTCCGGGTCAAAGGTTACAGCCGCCATGTTAAAACACGTGACGTATGACGTCACGGCCGCCATTTTGTGACACAAGATGGCCGACTTCCTTCC(SEQ ID NO: 162)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1174. 유전 요소 또는 단리된 핵산 분자가 적어도 80%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1175. 유전 요소 또는 단리된 핵산 분자가 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1176. 유전 요소 또는 단리된 핵산 분자가 적어도 80%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1177. 예를 들어, 본원에 기재된 바와 같은, 아넬로바이러스, 예를 들어, 야생형 아넬로바이러스의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3을 인코딩하는 핵산 서열을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1178. 프로모터 요소, 이펙터를 인코딩하는 핵산 서열 또는 단백질 결합 서열이 각각 예를 들어, 본원에 기재된 바와 같은, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 중 어느 하나의 아넬로바이러스의 프로모터 요소, 이펙터를 인코딩하는 핵산 서열 또는 단백질 결합 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1179. 유전 요소 또는 단리된 핵산 분자가 이펙터를 인코딩하는 핵산 서열에 비하여 3'에 위치한 패키징 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1180. 유전 요소 또는 단리된 핵산 분자가 이펙터를 인코딩하는 핵산 서열에 비하여 5'에 위치한 패키징 영역을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1181. 유전 요소 또는 단리된 핵산 분자가 본원에 기재된 아넬로바이러스의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3의 아미노산 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아넬로바이러스 단백질을 인코딩하는 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1182. 유전 요소 또는 단리된 핵산 분자가 단일-가닥 DNA를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1183. 유전 요소 또는 단리된 핵산 분자가 환형이고/환형이거나, 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 진핵 세포의 게놈 내로 통합되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1184. 유전 요소 또는 단리된 핵산이 야생형 아넬로바이러스 서열(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은, 예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 야생형 아넬로바이러스 서열) 또는 이로부터의 약 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900 또는 3000개의 연속 뉴클레오티드로 이루어진 그의 부분에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1185. 단백질 결합 서열이 표 20에 나타낸 컨센서스 5' UTR 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1186. 단백질 결합 서열이 표 21에 나타낸 컨센서스 GC-풍부 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1187. 단백질 결합 서열이 표 38에 나타낸 5' UTR 서열 및 표 39에 나타낸 GC-풍부 서열에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1188. 유전 요소 또는 단리된 핵산 분자가 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나의 핵산 서열의 아넬로바이러스 5' UTR 보존된 도메인에 대하여 적어도 85% 서열 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1189. 유전 요소 또는 단리된 핵산 분자가 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17의 핵산 서열의 아넬로바이러스 GC-풍부 영역에 대하여 적어도 85% 서열 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1190. 프로모터 요소가 RNA 중합효소 II-의존성 프로모터, RNA 중합효소 III-의존성 프로모터, PGK 프로모터, CMV 프로모터, EF-1α 프로모터, SV40 프로모터, CAGG 프로모터 또는 UBC 프로모터, TTV 바이러스 프로모터, 조직 특이적, U6(pollIII), 활성화제 단백질(TetR-VP16, Gal4-VP16, dCas9-VP16 등)에 대한 상류 DNA 결합 부위를 갖는 최소 CMV 프로모터를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1191. 이펙터가 치료제, 예를 들어, 치료적 펩티드 또는 폴리펩티드 또는 치료적 핵산을 인코딩하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1192. 이펙터가 조절 핵산, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA; 형광 태그 또는 마커, 항원, 펩티드, 천연-생물활성 펩티드 유래의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항미생물 펩티드, 포어-형성 펩티드, 바이사이클릭 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 소분자, (예를 들어, 면역 반응/신호에 대한 감수성에 영향을 미치는) 면역 이펙터, 사멸 단백질(예를 들어, 아폽토시스 또는 괴사의 유도제), 종양의 비-용해 저해제(예를 들어, 종양단백질의 저해제), 후성적 변형제, 후성적 효소, 전사 인자, DNA 또는 단백질 변형 효소, DNA-삽입제(intercalating agent), 유출 펌프 저해제, 핵 수용체 활성화제 또는 저해제, 프로테아좀 저해제, 효소에 대한 경쟁적 저해제, 단백질 합성 이펙터 또는 저해제, 뉴클레아제, 단백질 단편 또는 도메인, 리간드, 항체, 수용체, 또는 CRISPR 시스템 또는 성분을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1193. 아넬로좀이 자가 복제 가능한, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
1194. 발현 벡터가 플라스미드, 코스미드, 인공 염색체, 파지 및 바이러스로 이루어진 군으로부터 선택되는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
1195. 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 또는 아넬로좀을 포함하는 단리된 세포.
1196. 예를 들어, 본원에 기재된 바와 같은, 아넬로바이러스, 예를 들어, 야생형 아넬로바이러스의 ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3을 추가로 포함하는, 실시형태 195의 단리된 세포.
1197. 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 단리된 세포 또는 조성물을 대상체에게 투여하는 단계를 포함하는 대상체로의 이펙터의 운반 방법으로서, 유전 요소 또는 단리된 핵산 분자가 이펙터를 인코딩하며, 이펙터가 대상체에서 발현되는, 방법.
1198. 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 단리된 세포 또는 조성물을 대상체에게 투여하는 단계를 포함하는, 질병 또는 장애의 치료를 필요로 하는 대상체에서의 질병 또는 장애의 치료 방법으로서, 유전 요소 또는 단리된 핵산 분자가 치료제를 인코딩하며, 치료제가 대상체에서 발현되는, 방법.
1199. 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 단리된 세포 또는 조성물을 세포 또는 세포의 집단에 도입하는 단계를 포함하는 생체 외의 세포 또는 세포의 집단(예를 들어, 대상체로부터 수득되는 세포 또는 세포의 집단)으로의 이펙터의 운반 방법으로서; 유전 요소 또는 단리된 핵산 분자가 이펙터를 인코딩하며, 이펙터가 세포 또는 세포의 집단에서 발현되는, 방법.
1200. 유전 요소가 단일-가닥 DNA이며, 하기의 특성 중 하나 또는 둘 모두를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀: 환형임 및/또는 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 진핵 세포의 게놈 내로 통합됨.
1201. 유전 요소가 야생형 아넬로바이러스 서열(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은, 예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1202. 단백질 결합 서열이 표 38에 나타낸 컨센서스 5' UTR 서열에 대하여 또는 표 39에 나타낸 컨센서스 GC-풍부 서열, 또는 표 38에 나타낸 컨센서스 5' UTR 서열 및 표 39에 나타낸 컨센서스 GC-풍부 서열 둘 모두에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1203. 프로모터 요소가 RNA 중합효소 II-의존성 프로모터, RNA 중합효소 III-의존성 프로모터, PGK 프로모터, CMV 프로모터, EF-1α 프로모터, SV40 프로모터, CAGG 프로모터 또는 UBC 프로모터, TTV 바이러스 프로모터, 조직 특이적, U6(pollIII), 활성화제 단백질(TetR-VP16, Gal4-VP16, dCas9-VP16 등)에 대한 상류 DNA 결합 부위를 갖는 최소 CMV 프로모터를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1204. 프로모터 요소가 TATA 박스를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1205. 프로모터 요소가 야생형 아넬로바이러스, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 6, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열에 대하여 내인성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1206. 프로모터 요소가 야생형 아넬로바이러스, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 6, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열에 대하여 외인성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1207. 이펙터가 치료제, 예를 들어, 치료적 펩티드 또는 폴리펩티드 또는 치료적 핵산을 인코딩하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1208. 이펙터가 조절 핵산, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA; 형광 태그 또는 마커, 항원, 펩티드, 천연-생물활성 펩티드 유래의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항미생물 펩티드, 포어-형성 펩티드, 바이사이클릭 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 소분자, (예를 들어, 면역 반응/신호에 대한 감수성에 영향을 미치는) 면역 이펙터, 사멸 단백질(예를 들어, 아폽토시스 또는 괴사의 유도제), 종양의 비-용해 저해제(예를 들어, 종양단백질의 저해제), 후성적 변형제, 후성적 효소, 전사 인자, DNA 또는 단백질 변형 효소, DNA-삽입제, 유출 펌프 저해제, 핵 수용체 활성화제 또는 저해제, 프로테아좀 저해제, 효소에 대한 경쟁적 저해제, 단백질 합성 이펙터 또는 저해제, 뉴클레아제, 단백질 단편 또는 도메인, 리간드, 항체, 수용체, 또는 CRISPR 시스템 또는 성분을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1209. 이펙터가 miRNA를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1210. 이펙터, 예를 들어, miRNA가 숙주 유전자를 표적화하고, 예를 들어, 유전자의 발현을 조절하고, 예를 들어, 유전자의 발현을 증가시키거나 감소시키는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1211. 이펙터가 miRNA를 포함하며, 숙주 유전자의 발현을 감소시키는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1212. 이펙터가 약 20 내지 200개, 30 내지 180개, 40 내지 160개, 50 내지 140개 또는 60 내지 120개 뉴클레오티드 길이의 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1213. 이펙터를 인코딩하는 핵산 서열이 약 20 내지 200개, 30 내지 180개, 40 내지 160개, 50 내지 140개 또는 60 내지 120개 뉴클레오티드 길이인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1214. 이펙터를 인코딩하는 서열이 적어도 약 100개 뉴클레오티드의 크기를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1215. 이펙터를 인코딩하는 서열이 약 100 내지 약 5000개 뉴클레오티드의 크기를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1216. 이펙터를 인코딩하는 서열이 약 100 내지 200개, 200 내지 300개, 300 내지 400개, 400 내지 500개, 500 내지 600개, 600 내지 700개, 700 내지 800개, 800 내지 900개, 900 내지 1000개, 1000 내지 1500개 또는 1500 내지 2000개 뉴클레오티드의 크기를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1217. 이펙터를 인코딩하는 서열이 (예를 들어, ORF1 유전자좌의 C-말단에서) ORF1 유전자좌, miRNA 유전자좌, TATA 박스의 상류 5' 비코딩 영역, 5' UTR, 폴리-A 영역의 하류 3' 비코딩 영역, 또는 유전 요소의 GC-풍부 영역의 상류 비코딩 영역 중 하나 이상에, 또는 그 내에 또는 그에 인접하게(예를 들어, 이에 대하여 5' 또는 3'에) 위치하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1218. 이펙터를 인코딩하는 서열이 폴리-A 영역과 유전 요소의 GC-풍부 영역 사이에 위치하는, 실시형태 1217의 아넬로좀.
1219. 단백질 결합 서열이 야생형 아넬로바이러스, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 6, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열의 5' UTR 보존된 도메인 또는 GC-풍부 도메인에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1220. 유전 요소, 예를 들어, 유전 요소의 단백질 결합 서열이 하기에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀:
(i) 표 38에 나타낸 컨센서스 5' UTR 핵산 서열;
(ii) 표 38에 나타낸 예시적인 TTV 5' UTR 핵산 서열;
(iii) 표 38에 나타낸 TTV-CT30F 5' UTR 핵산 서열;
(iv) 표 38에 나타낸 TTV-HD23a 5' UTR 핵산 서열;
(v) 표 38에 나타낸 TTV-JA20 5' UTR 핵산 서열;
(vi) 표 38에 나타낸 TTV-TJN02 5' UTR 핵산 서열;
(vii) 표 38에 나타낸 TTV-tth8 5' UTR 핵산 서열;
(viii) 표 39에 나타낸 컨센서스 GC-풍부 영역;
(ix) 표 39에 나타낸 예시적인 TTV GC-풍부 영역;
(x) 표 39에 나타낸 TTV-CT30F GC-풍부 영역;
(xi) 표 39에 나타낸 TTV-JA20 GC-풍부 영역;
(xii) 표 39에 나타낸 TTV-TJN02 GC-풍부 영역;
(xiii) 표 39에 나타낸 TTV-HD23a GC-풍부 영역; 또는
(xiv) 표 39에 나타낸 TTV-tth8 GC-풍부 영역.
1221. 단백질성 외부가 단백질 결합 서열에 특이적으로 결합할 수 있는 외부 단백질을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1222. 단백질성 외부가 하기 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀: 하나 이상의 글리코실화된 단백질, 친수성 DNA-결합 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열 및 하나 이상의 이황화 가교.
1223. 단백질성 외부가 하기의 특징 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀: 정20면체 대칭, 하나 이상의 숙주 세포 분자와 상호작용하는 분자를 인식하고/인식하거나 이에 결합하여, 숙주 세포로의 유입을 매개함, 지질 분자가 결여됨, 탄수화물이 결여됨, pH 및 온도 안정성임, 세제 저항성임 및 숙주에서 실질적으로 비-면역원성이거나 실질적으로 비-병원성임.
1224. 단백질성 외부가 하나 이상의 기능, 예를 들어, 종 및/또는 조직 및/또는 세포 선택성, 유전 요소 결합 및/또는 패키징, 면역 회피(실질적인 비-면역원성 및/또는 관용), 약동학, 엔도시토시스 및/또는 세포 부착, 핵 유입, 세포내 조절 및 국소화, 엑소시토시스 조절, 증식 및 핵산 보호를 제공하는 적어도 하나의 작용성 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1225. 이펙터를 배제한 유전 요소의 부분이 약 2.5 내지 5 kb(예를 들어, 약 2.8 내지 4kb, 약 2.8 내지 3.2kb, 약 3.6 내지 3.9kb 또는 약 2.8 내지 2.9kb), 약 5kb 미만(예를 들어, 약 2.9kb, 3.2 kb, 3.6kb, 3.9kb 또는 4kb 미만) 또는 적어도 100개 뉴클레오티드(예를 들어, 적어도 1kb)의 조합된 크기를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1226. 유전 요소가 단일-가닥인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1227. 유전 요소가 환형인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1228. 유전 요소가 DNA인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1229. 유전 요소가 음성 가닥 DNA인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1230. 유전 요소가 에피솜을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1231. 아넬로좀이 중량 기준으로 10%, 5%, 2% 또는 1% 미만의 지질 함량을 갖는, 예를 들어, 지질 이중층을 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1232. 아넬로좀이 외부 지질 이중층을 포함하는 바이러스 입자, 예를 들어, 레트로바이러스에 비하여 세제(예를 들어, 연성 세제, 예를 들어, 담즙염, 예를 들어, 데옥시콜산나트륨)에 의한 분해에 대하여 저항성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1233. 아넬로좀의 적어도 약 50%(예를 들어, 적어도 약 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9%)가 37℃에서 30분 동안의 세제(예를 들어, 중량 기준 0.5%의 세제)와의 인큐베이션 후에 분해되지 않는, 실시형태 1232의 아넬로좀.
1234. 유전 요소가 야생형 아넬로바이러스 서열, 예를 들어, 야생형 TTV 서열 또는 야생형 TTMV 서열에 비하여 적어도 하나의 요소, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 요소의 결실을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1235. 유전 요소가 하기에 상응하는 핵산 서열을 포함하는 결실을 포함하는, 실시형태 1234의 아넬로좀:
(i) TTV-tth8 서열, 예를 들어, 표 5에 나타낸 핵산 서열의 뉴클레오티드 3436 내지 3607;
(ii) TTMV-LY2 서열, 예를 들어, 표 15에 나타낸 핵산 서열의 뉴클레오티드 574 내지 1371 및/또는 뉴클레오티드 1432 내지 2210;
(iii) TTMV-LY2 서열, 예를 들어, 표 15에 나타낸 핵산 서열의 뉴클레오티드 1372 내지 1431; 또는
(iv) TTMV-LY2 서열, 예를 들어, 표 15에 나타낸 핵산 서열의 뉴클레오티드 2610 내지 2809.
1236. 유전 요소가 야생형 아넬로바이러스 서열, 예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 것과 같은 서열의 적어도 72개 뉴클레오티드(예를 들어, 적어도 73, 74, 75개 등, 선택적으로 게놈의 전장 미만의 뉴클레오티드)를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1237. 유전 요소가 하기의 서열 중 하나 이상을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀: 하나 이상의 miRNA를 인코딩하는 서열, 하나 이상의 복제 단백질을 인코딩하는 서열, 외인성 유전자를 인코딩하는 서열, 치료제를 인코딩하는 서열, 조절 서열(예를 들어, 프로모터, 인핸서), 내인성 유전자를 표적화하는 하나 이상의 조절 서열(siRNA, lncRNA, shRNA)을 인코딩하는 서열, 치료적 mRNA 또는 단백질을 인코딩하는 서열 및 세포용해/세포독성 RNA 또는 단백질을 인코딩하는 서열.
1238. 아넬로좀이 제2 유전 요소, 예를 들어, 단백질성 외부 내에 봉입된 제2 유전 요소를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1239. 제2 유전 요소가 단백질 결합 서열, 예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호, 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 5' UTR 보존된 도메인 또는 GC-풍부 영역을 포함하는, 실시형태 1238의 아넬로좀.
1240. 아넬로좀이 박테리아 세포를 검출 가능하게 감염시키지 않는, 예를 들어, 1%, 0.5%, 0.1% 또는 0.01% 미만의 박테리아 세포를 감염시키는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1241. 아넬로좀이 예를 들어, 시험관 내에서 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, 면역 세포, 간 세포, 상피 세포를 감염시킬 수 있는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1242. 유전 요소가 세포에 유입되는 아넬로좀의 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0.5%, 0.2%, 0.1% 미만의 빈도로 통합되며, 예를 들어, 아넬로좀이 비-통합성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1243. 유전 요소가 예를 들어, 정량적 PCR 검정에 의해 측정되는 바와 같이, 세포당 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 102, 2 x 102, 5 x 102, 103, 2 x 103, 5 x 103 또는 104 게놈 당량의 유전 요소를 (예를 들어, 회전환 복제에 의해) 복제할 수 있는, 예를 들어, 생성할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1244. 유전 요소가 예를 들어, 정량적 PCR 검정에 의해 측정되는 바와 같이, 세포로의 유전 요소의 운반 이전에 아넬로좀에 존재하였던 것보다, 세포에서 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 102, 2 x 102, 5 x 102, 103, 2 x 103, 5 x 103 또는 104 더 많은 게놈 당량의 유전 요소를 (예를 들어, 회전환 복제에 의해) 복제할 수 있는, 예를 들어, 생성할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1244A. 단백질성 외부가 유전 요소에 비하여 시스로 및/또는 트랜스로 제공되는 실시형태 1243 또는 1244의 아넬로좀.
1244B. 세포 내의 헬퍼 핵산(예를 들어, 헬퍼 바이러스)이 단백질성 외부 또는 그의 부분(예를 들어, ORF1 분자)을 인코딩하는 실시형태 1243 내지 1244A 중 어느 한 실시형태의 아넬로좀.
1244C. 하나 이상의 복제 인자(예를 들어, 복제효소)가 유전 요소에 비하여 시스로 및/또는 트랜스로 제공되는 실시형태 1243 내지 1244B 중 어느 한 실시형태의 아넬로좀.
1244D. 세포 내의 헬퍼 핵산(예를 들어, 헬퍼 바이러스)이 하나 이상의 복제 인자를 인코딩하는 실시형태 1244C의 아넬로좀.
1245. 유전 요소가 복제할 수 없는, 예를 들어, 유전 요소가 복제 원점에서 변경되거나, 복제 원점이 결여된, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1246. 유전 요소가 자가-복제할 수 없는, 예를 들어, 숙주 세포 게놈 내로의 통합 없이 복제될 수 없는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1247. 아넬로좀이 실질적으로 비-병원성이며, 예를 들어, 대상체에서 검출 가능한 유해 증상(예를 들어, 아넬로좀에 노출되지 않은 대상체에 비하여, 예를 들어, 상승된 세포 사멸 또는 독성)을 유도하지 않는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1248. 아넬로좀이 실질적으로 비-면역원성이며, 예를 들어, 실시예 4에 기재된 방법에 따라 검출되는 바와 같이, 예를 들어, 검출 가능하고/가능하거나 원치 않는 면역 반응을 유도하지 않는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1249. 실질적으로 비-면역원성인 아넬로좀이 면역 반응이 결여된 기준 대상체에서의 효능의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%인 효능을 대상체에서 갖는, 실시형태 1248의 아넬로좀.
1250. 면역 반응이 아넬로좀 또는 그의 부분 또는 그의 핵산에 의해 인코딩되는 생성물에 특이적인 항체; 아넬로좀 또는 아넬로좀을 포함하는 세포에 대한 세포 반응(예를 들어, 면역 이펙터 세포(예를 들어, T 세포- 또는 NK 세포) 반응); 또는 아넬로좀 또는 아넬로좀을 포함하는 세포의 대식구 포획(engulfment) 중 하나 이상을 포함하는, 실시형태 1248 또는 1249의 아넬로좀.
1251. 아넬로좀이 AAV보다 면역원성이 더 적거나, 예를 들어, 본원에 기재된 검정에 의해 측정되는 바와 같이, 비슷한 양의 AAV에 대하여 검출되는 것 미만의 면역 반응을 유도하거나, 본원에 기재된 검정에 의해 측정되는 바와 같이 70% 미만의 항체 보유율(예를 들어, 약 60%, 50%, 40%, 30%, 20% 또는 10% 미만의 항체 보유율)을 유도하거나, 실질적으로 비-면역원성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1252. 적어도 1000개의 아넬로좀의 집단이 적어도 약 100개 카피(예를 들어, 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000개 카피)의 유전 요소를 하나 이상의 진핵 세포 내로 운반할 수 있는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1253. 아넬로좀의 집단(예를 들어, 세포당 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 게놈 당량의 유전 요소)이 유전 요소를 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상의 진핵 세포의 집단 내로 운반할 수 있으며, 예를 들어, 실시예 22에 기재된 바와 같이, 예를 들어, 진핵 세포가 HEK293T 세포인 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1254. 아넬로좀의 집단(예를 들어, 세포당 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 게놈 당량의 유전 요소)이 세포당 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 8,000, 1 x 104, 1 x 105, 1 x 106, 1 x 107 이상의 카피의 유전 요소를 진핵 세포의 집단에 운반할 수 있으며, 예를 들어, 실시예 22에 기재된 바와 같이, 예를 들어, 진핵 세포가 HEK293T 세포인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1255. 아넬로좀의 집단(예를 들어, 세포당 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 게놈 당량의 유전 요소)이 세포당 1 내지 3, 1 내지 4, 1 내지 5, 1 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 5 내지 10, 10 내지 20, 20 내지 50, 50 내지 100, 100 내지 1000, 1000 내지 104, 1 x 104 내지 1 x 105, 1 x 104 내지 1 x 106, 1 x 104 내지 1 x 107, 1 x 105 내지 1 x 106, 1 x 105 내지 1 x 107 또는 1 x 106 내지 1 x 107 카피의 유전 요소를 진핵 세포의 집단에 운반할 수 있으며, 예를 들어, 실시예 22에 기재된 바와 같이, 예를 들어, 진핵 세포가 HEK293T 세포인 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1256. 아넬로좀이 적어도 2회의 계대 후에 존재하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1257. 아넬로좀이 적어도 2회의 계대를 포함하는 과정에 의해 생성되는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1258. 아넬로좀이 이펙터를 요망되는 세포 유형, 조직 또는 기관(예를 들어, 골수, 혈액, 심장, GI, 피부, 망막 내의 광수용기, 상피 내벽 또는 췌장)에 선택적으로 운반하는 또는 그 내에 더 높은 수준으로 존재하는(예를 들어, 그 내에 우선적으로 축적되는) 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1259. 진핵 세포가 포유동물 세포, 예를 들어, 인간 세포인 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1260. 아넬로좀 또는 그의 카피가 세포 내로의 운반 24시간(예를 들어, 1일, 2일, 3일, 4일, 5일, 6일, 1주, 2주, 3주, 4주, 30일 또는 1개월) 후에 세포에서 검출 가능한, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1261. 아넬로좀이 예를 들어, 감염성 검정, 예를 들어, 실시예 7에 따른 검정을 사용하여, 감염 3 내지 4일 후에, 예를 들어, 세포를 감염시키기 위해 사용되는 아넬로좀의 양에 비하여, 적어도 약 108배(예를 들어, 약 105배, 106배, 107배, 108배, 109배 또는 1010배)의 게놈 당량/㎖로 세포 펠렛 및 상청액에서 생성되는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
1262. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀을 포함하는 조성물.
1263. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 및 약제학적으로 허용되는 담체 또는 부형제를 포함하는 약제학적 조성물.
1264. 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 아넬로좀, 예를 들어, 합성 아넬로좀을 포함하는, 실시형태 1262 또는 1263의 조성물 또는 약제학적 조성물.
1265. 적어도 103, 104, 105, 106, 107, 108 또는 109개의 합성 아넬로좀을 포함하는, 실시형태 1262 내지 1264 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
1266. 하기의 특징 중 하나 이상을 갖는, 실시형태 1262 내지 1265 중 어느 한 실시형태의 조성물 또는 약제학적 조성물:
a) 약제학적 조성물이 약제학적 또는 우수 제조 기준(GMP) 표준을 충족함;
b) 약제학적 조성물이 우수 제조 기준(GMP)에 따라 제조됨;
c) 약제학적 조성물이 사전결정된 기준 값 미만의 병원체 수준을 가짐, 예를 들어, 실질적으로 병원체가 없음;
d) 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 가짐, 예를 들어, 실질적으로 오염물질이 없음;
e) 약제학적 조성물이 사전결정된 비-감염성 입자의 수준 또는 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 이하, 100:1 이하 또는 50:1 미만)를 가짐, 또는
f) 약제학적 조성물이 예를 들어, 본원에 기재된 바와 같이, 낮은 면역원성을 갖거나, 실질적으로 비-면역원성임.
1267. 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 갖는, 예를 들어, 실질적으로 오염물질이 없는, 실시형태 1262 내지 1266 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
1268. 오염물질이 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀(예를 들어, 요망되는 아넬로좀, 예를 들어, 본원에 기재된 바와 같은 합성 아넬로좀 이외의 아넬로좀), 유리 바이러스 캡시드 단백질, 외래 작용제 및 응집물로 이루어진 군으로부터 선택되는, 실시형태 1267의 조성물 또는 약제학적 조성물.
1269. 오염물질이 숙주 세포 DNA이며, 임계값 양이 약제학적 조성물 용량당 약 10 ng의 숙주 세포 DNA인, 실시형태 1268의 조성물 또는 약제학적 조성물.
1270. 약제학적 조성물이 중량 기준 10% 미만(예를 들어, 약 10%, 5%, 4%, 3%, 2%, 1%, 0.5% 또는 0.1% 미만)의 오염물질을 포함하는, 실시형태 1262 내지 1269 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
1271. 대상체에서 (예를 들어, 본원에 기재된 바와 같은) 질병 또는 장애를 치료하기 위한 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 조성물 또는 약제학적 조성물의 용도.
1272. 대상체에서 (예를 들어, 본원에 기재된 바와 같은) 질병 또는 장애를 치료하는 데 사용하기 위한 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 조성물 또는 약제학적 조성물.
1273. 대상체에서의 (예를 들어, 본원에 기재된 바와 같은) 질병 또는 장애의 치료 방법으로서, 상기 방법이 상기 실시형태들 중 어느 한 실시형태의 아넬로좀(예를 들어, 합성 아넬로좀) 또는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
1274. 대상체에서의 (예를 들어, 본원에 기재된 바와 같은) 생물학적 기능의 조절, 예를 들어, 향상 또는 저해 방법으로서, 상기 방법이 상기 실시형태들 중 어느 한 실시형태의 아넬로좀(예를 들어, 합성 아넬로좀) 또는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는 방법.
1275. 아넬로좀이 외인성 이펙터를 포함하지 않는, 실시형태 1273 내지 1274 중 어느 한 실시형태의 방법.
1276. 아넬로좀이 예를 들어, 본원에 기재된 바와 같은 야생형 아넬로바이러스를 포함하는 실시형태 1273 내지 1275 중 어느 한 실시형태의 방법.
1277. 아넬로좀, 예를 들어, 합성 아넬로좀의 투여가 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상의 대상체 내의 표적 세포의 집단 내로의 유전 요소의 운반을 초래하는, 실시형태 1273 내지 1276 중 어느 한 실시형태의 방법.
1278. 아넬로좀, 예를 들어, 합성 아넬로좀의 투여가 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상의 대상체 내의 표적 세포의 집단 내로의 이펙터의 운반을 초래하는, 실시형태 1273 내지 1277 중 어느 한 실시형태의 방법.
1279. 표적 세포가 예를 들어, 시험관 내의 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, 면역 세포, 간 세포, 폐 상피 세포를 포함하는, 실시형태 1277 또는 1278의 방법.
1280. 표적 세포가 간 또는 폐에 존재하는, 실시형태 1277 내지 1279 중 어느 한 실시형태의 방법.
1281. 유전 요소가 운반되는 표적 세포가 각각 적어도 10, 50, 100, 500, 1000, 10,000, 50,000, 100,000개 이상의 카피의 유전 요소를 제공받는, 실시형태 1277 내지 1280 중 어느 한 실시형태의 방법.
1282. 이펙터가 miRNA를 포함하며, miRNA가 예를 들어, 아넬로좀이 운반되는 세포 또는 세포의 집단 내에서 표적 단백질 또는 RNA의 수준을 예를 들어, 적어도 10%, 20%, 30%, 40% 또는 50% 감소시키는, 실시형태 1273 내지 1281 중 어느 한 실시형태의 방법.
1283. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀을 세포, 예를 들어, 진핵 세포, 예를 들어, 포유동물 세포와 접촉시키는 단계를 포함하는, 세포로의 아넬로좀, 예를 들어, 합성 아넬로좀의 운반 방법.
1284. 헬퍼 바이러스를 세포와 접촉시키는 단계를 추가로 포함하는 실시형태 1283의 방법으로서, 헬퍼 바이러스가 폴리뉴클레오티드, 예를 들어, 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합할 수 있는 외부 단백질 및 선택적으로, 지질 외피를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
1285. 아넬로좀을 세포와 접촉시키는 단계 이전에, 그와 동시에, 또는 그 이후에 헬퍼 바이러스를 세포와 접촉시키는, 실시형태 1284의 방법.
1286. 헬퍼 폴리뉴클레오티드를 세포와 접촉시키는 단계를 추가로 포함하는, 실시형태 1283의 방법.
1287. 헬퍼 폴리뉴클레오티드가 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합할 수 있는 외부 단백질 및 지질 외피를 인코딩하는 폴리뉴클레오티드 서열을 포함하는, 실시형태 1286의 방법.
1288. 헬퍼 폴리뉴클레오티드가 RNA(예를 들어, mRNA), DNA, 플라스미드, 바이러스 폴리뉴클레오티드 또는 그의 임의의 조합인, 실시형태 1286의 방법.
1289. 아넬로좀을 세포와 접촉시키는 단계 이전에, 그와 동시에 또는 그 이후에 헬퍼 폴리뉴클레오티드를 세포와 접촉시키는, 실시형태 1286 내지 1288 중 어느 한 실시형태의 방법.
1290. 헬퍼 단백질(예를 들어, 성장 인자)을 세포와 접촉시키는 단계를 추가로 포함하는, 실시형태 1283 내지 1289 중 어느 한 실시형태의 방법.
1291. 헬퍼 단백질이 바이러스 복제 단백질 또는 캡시드 단백질을 포함하는, 실시형태 1290의 방법.
1292. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀을 포함하는 숙주 세포.
1293. 프로모터 요소, 이펙터(예를 들어, 페이로드)를 인코딩하는 서열 및 외부 단백질 결합 서열을 포함하는 핵산 분자로서,
핵산 분자가 단일-가닥 DNA이며, 핵산 분자가 환형이고/환형이거나 세포에 유입되는 핵산 분자의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되며;
이펙터가 TTV로부터 기원하지 않으며, SV40-miR-S1이 아니며;
핵산 분자가 TTMV-LY의 폴리뉴클레오티드 서열을 포함하지 않으며;
프로모터 요소가 진핵 세포에서 이펙터의 발현을 지시할 수 있는, 핵산 분자.
1294. 유전 요소로서:
(i) 프로모터 요소 및 이펙터, 예를 들어, 페이로드를 인코딩하는 서열로서, 선택적으로 이펙터가 야생형 아넬로바이러스 서열에 비하여 외인성인 서열;
(ii) 야생형 아넬로바이러스 서열에 대하여 적어도 75% 서열 동일성을 갖는 적어도 72개의 인접 뉴클레오티드(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100 또는 150개의 뉴클레오티드); 또는 야생형 아넬로바이러스 서열에 대하여 적어도 72%(예를 들어, 적어도 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 적어도 100개의 인접 뉴클레오티드; 및
(iii) 단백질 결합 서열, 예를 들어, 외부 단백질 결합 서열을 포함하며;
핵산 구축물이 단일-가닥 DNA이며;
핵산 구축물이 환형이고/환형이거나 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합되는, 유전 요소.
1295. 아넬로좀 조성물의 제조 방법으로서:
a) 아넬로좀, 예를 들어, 본원에 기재된 합성 아넬로좀의 구성성분을 인코딩하는 하나 이상의 핵산 분자를 포함하는 숙주 세포를 제공하는 단계로서, 예를 들어, 아넬로좀이 단백질성 외부 및 유전 요소, 예를 들어, 프로모터 요소, 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 인코딩하는 서열 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소를 포함하는 단계;
b) 숙주 세포로부터 아넬로좀을 생성함으로써, 아넬로좀을 제조하는 단계; 및
c) 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 방법.
1296. 합성 아넬로좀 조성물의 제조 방법으로서:
a) 상기 실시형태들 중 어느 한 실시형태에 따른 복수의 아넬로좀, 조성물 또는 약제학적 조성물을 제공하는 단계;
b) 선택적으로, 다음 중 하나 이상에 대하여 복수의 아넬로좀, 조성물 또는 약제학적 조성물을 평가하는 단계: 본원에 기재된 오염물질, 광학 밀도 측정치(예를 들어, OD 260), (예를 들어, HPLC에 의한) 입자 개수, 감염성(예를 들어, 형광 및/또는 ELISA에 의해 결정되는 바와 같은, 예를 들어, 입자:감염성 유닛 비); 및
c) 예를 들어, (b)의 파라미터 중 하나 이상이 특정 임계값을 만족한다면, 복수의 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 방법.
1297. 아넬로좀 조성물이 적어도 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014 또는 1015개의 아넬로좀을 포함하거나, 아넬로좀 조성물이 ㎖당 적어도 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014 또는 1015개의 아넬로좀 게놈을 포함하는, 실시형태 1296의 방법.
1298. 아넬로좀 조성물이 적어도 10 ㎖, 20 ㎖, 50 ㎖, 100 ㎖, 200 ㎖, 500 ㎖, 1 ℓ, 2 ℓ, 5 ℓ, 10 ℓ, 20 ℓ 또는 50 ℓ를 포함하는, 실시형태 1296 또는 1297의 방법.
1299. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 및 헬퍼 바이러스를 포함하는 반응 혼합물로서, 헬퍼 바이러스가 폴리뉴클레오티드, 예를 들어, 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합할 수 있는 외부 단백질 및 선택적으로 지질 외피를 인코딩하는 폴리뉴클레오티드를 포함하는, 반응 혼합물.
1300. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 및 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나의 ORF2, ORF2/2, ORF2/3, ORF2t/3, ORF1, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 75%(예를 들어, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 서열을 포함하는, 반응 혼합물.
1301. 제2 핵산 서열이 유전 요소의 일부인, 실시형태 1300의 반응 혼합물.
1302. 제2 핵산 서열이 유전 요소의 일부가 아니며, 예를 들어, 제2 핵산 서열이 헬퍼 세포 또는 헬퍼 바이러스에 의해 포함되는, 실시형태 1301의 반응 혼합물.
1303. 합성 아넬로좀으로서:
(i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터, 예를 들어, 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소; 및
예를 들어, 유전 요소와 회합된, 예를 들어, 이를 둘러싸거나 봉입하는 단백질성 외부를 포함하는, 합성 아넬로좀.
1304. 약제학적 조성물로서
a) 아넬로좀으로서:
(i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터, 예를 들어, 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소; 및
유전 요소와 회합된, 예를 들어, 이를 둘러싸거나 봉입하는 단백질성 외부를 포함하는 아넬로좀; 및
b) 약제학적 부형제를 포함하는, 약제학적 조성물.
1305. 약제학적 조성물로서
a) 적어도 103, 104, 105, 106, 107, 108 또는 109개의 아넬로좀(예를 들어, 본원에 기재된 합성 아넬로좀)으로서:
(i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터, 예를 들어, 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소; 및
예를 들어, 유전 요소와 회합된, 예를 들어, 이를 둘러싸거나 봉입하는 단백질성 외부를 포함하는 아넬로좀;
b) 약제학적 부형제, 및 선택적으로,
c) 사전-결정된 양보다 더 적은 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀, 유리 바이러스 캡시드 단백질, 외래 작용제, 내인성 작용제 및/또는 응집물을 포함하는, 약제학적 조성물.
1306. 하기의 특징 중 적어도 하나를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물: 유전 요소가 단일-가닥 DNA임; 유전 요소가 환형임; 아넬로좀이 비-통합성임; 아넬로좀이 아넬로바이러스 또는 기타 비-병원성 바이러스에 기초한 서열, 구조 및/또는 기능을 가짐; 및 아넬로좀이 비-병원성임.
1307. 단백질성 외부가 비-병원성 외부 단백질을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1308. 단백질성 외부가 하기 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물: 하나 이상의 글리코실화된 단백질, 친수성 DNA-결합 영역, 아르기닌-풍부 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열 및 하나 이상의 이황화 가교.
1309. 단백질성 외부가 하기의 특징 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물: 정20면체 대칭, 하나 이상의 숙주 세포 분자와 상호작용하는 분자를 인식하고/인식하거나 이에 결합하여, 숙주 세포로의 유입을 매개함, 지질 분자가 결여됨, 탄수화물이 결여됨, 하나 이상의 요망되는 탄수화물(예를 들어, 글리코실화)을 포함함, pH 및 온도 안정성임, 세제 저항성임 및 숙주에서 비-면역원성이거나 비-병원성임.
1310. 비-병원성 외부 단백질을 인코딩하는 서열이 표 19에 열거된 하나 이상의 서열 또는 그의 단편과 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 동일한 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1311. 비-병원성 외부 단백질이 하나 이상의 기능, 예를 들어, 종 및/또는 조직 및/또는 세포 향성, 바이러스 게놈 결합 및/또는 패키징, 면역 회피(비-면역원성 및/또는 관용), 약동학, 엔도시토시스 및/또는 세포 부착, 핵 유입, 세포내 조절 및 국소화, 엑소시토시스 조절, 증식 및 핵산 보호를 제공하는 적어도 하나의 작용성 도메인을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1312. 이펙터가 조절 핵산, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA; 치료제, 예를 들어 형광 태그 또는 마커, 항원, 펩티드 치료제, 천연-생물활성 펩티드로부터의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항-미생물 펩티드, 포어-형성 펩티드, 바이사이클릭 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드 및 분해 또는 자가-파괴 펩티드, 소분자, (예를 들어, 면역 반응/신호에 대한 감수성에 영향을 미치는) 면역 이펙터, 사멸 단백질(예를 들어, 아폽토시스 또는 괴사의 유도제), 종양의 비-용해 저해제(예를 들어, 종양단백질의 저해제), 후성적 변형제, 후성적 효소, 전사 인자, DNA 또는 단백질 변형 효소, DNA-삽입제, 유출 펌프 저해제, 핵 수용체 활성화제 또는 저해제, 프로테아좀 저해제, 효소에 대한 경쟁적 저해제, 단백질 합성 이펙터 또는 저해제, 뉴클레아제, 단백질 단편 또는 도메인, 리간드 또는 수용체, 및 CRISPR 시스템 또는 구성성분을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1313. 이펙터가 표 40에 열거된 miRNA 서열 중 하나 이상에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1314. 이펙터, 예를 들어, miRNA가 숙주 유전자를 표적화하는, 예를 들어, 유전자의 발현을 조절하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1315. miRNA가 표 40에 열거된 miRNA 서열 중 하나 이상에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1316. 유전 요소가 하기의 서열 중 하나 이상을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물: 하나 이상의 miRNA를 인코딩하는 서열, 하나 이상의 복제 단백질을 인코딩하는 서열, 외인성 유전자를 인코딩하는 서열, 치료제를 인코딩하는 서열, 조절 서열(예를 들어, 프로모터, 인핸서), 내인성 유전자를 표적화하는 하나 이상의 조절 서열(siRNA, lncRNA, shRNA)을 인코딩하는 서열, 치료적 mRNA 또는 단백질을 인코딩하는 서열 및 세포용해/세포독성 RNA 또는 단백질을 인코딩하는 서열.
1317. 유전 요소가 하기의 특징 중 하나 이상을 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물: 숙주 세포의 게놈과 비-통합성임, 에피솜 핵산임, 단일 가닥 DNA임, 약 1 내지 10 kb임, 세포의 핵 내에 존재함, 내인성 단백질에 의해 결합될 수 있음, 및 숙주 유전자를 표적화하는 마이크로RNA를 생성함.
1318. 유전 요소가 적어도 하나의 바이러스 서열, 또는 표 23에 열거된 하나 이상의 서열 또는 그의 단편(예를 들어, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 분자를 인코딩하는 단편, 및/또는 TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상을 포함하는 단편)에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1319. 바이러스 서열이 단일 가닥 DNA 바이러스(예를 들어, 아넬로바이러스, 비드나바이러스(Bidnavirus), 써코바이러스, 제미니바이러스(Geminivirus), 게노모바이러스(Genomovirus), 이노바이러스(Inovirus), 마이크로바이러스(Microvirus), 나노바이러스(Nanovirus), 파보바이러스(Parvovirus) 및 스피라바이러스(Spiravirus)), 이중 가닥 DNA 바이러스(예를 들어, 아데노바이러스(Adenovirus), 암풀라바이러스(Ampullavirus), 아스코바이러스(Ascovirus), 아스파바이러스(Asfarvirus), 배큘로바이러스(Baculovirus), 푸셀로바이러스(Fusellovirus), 글로불로바이러스(Globulovirus), 구타바이러스(Guttavirus), 하이트로사바이러스(Hytrosavirus), 헤르페스바이러스(Herpesvirus), 이리도바이러스(Iridovirus), 리포트릭스바이러스(Lipothrixvirus), 니마바이러스(Nimavirus) 및 폭스바이러스(Poxvirus)), RNA 바이러스(예를 들어, 알파바이러스(Alphavirus), 푸로바이러스(Furovirus), 간염 바이러스, 호르데이바이러스(Hordeivirus), 토바모바이러스(Tobamovirus), 토브라바이러스(Tobravirus), 트리코르나바이러스(Tricornavirus), 루비바이러스(Rubivirus), 비르나바이러스(Birnavirus), 시스토바이러스(Cystovirus), 파르티티바이러스(Partitivirus) 및 레오바이러스(Reovirus)) 중 적어도 하나로부터의 것인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1320. 바이러스 서열이 하나 이상의 비-아넬로바이러스, 예를 들어, 아데노바이러스, 헤르페스 바이러스, 폭스 바이러스, 백시니아 바이러스, SV40, 파필로마 바이러스, RNA 바이러스, 예컨대 레트로바이러스, 예를 들어, 렌티 바이러스, 단일-가닥 RNA 바이러스, 예를 들어, 간염 바이러스, 또는 이중-가닥 RNA 바이러스, 예를 들어, 로타바이러스로부터의 것인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1321. 단백질 결합 서열이 단백질성 외부의 아르기닌-풍부 영역과 상호작용하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1322. 아넬로좀이 포유동물 세포, 예를 들어, 인간 세포에서 복제 가능한, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1323. 아넬로좀이 숙주 세포에서 비-병원성이고/이거나 비-통합성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1324. 아넬로좀이 숙주에서 비-면역원성인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1325. 아넬로좀이 숙주 또는 숙주 세포에서 하나 이상의 바이러스 특성, 예를 들어, 선택성, 예를 들어, 감염성, 예를 들어, 면역억제/활성화를 저해/향상시키는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1326. 아넬로좀이 (예를 들어, 표현형, 바이러스 수준, 유전자 발현, 기타 바이러스와의 경쟁, 병태 등을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상) 조절하기에 충분한 양으로 존재하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 조성물.
1327. 적어도 하나의 바이러스 또는 바이러스의 게놈을 포함하는 벡터, 예를 들어, 아넬로좀의 변이체, 예를 들어, 편리공생/고유 바이러스를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 조성물.
1328. 이종 모이어티, 적어도 하나의 소분자, 항체, 폴리펩티드, 핵산, 표적화제, 영상화제, 나노입자 및 그의 조합을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 조성물.
1329. (i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터, 예를 들어, 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소를 포함하는 벡터.
1330. 유전 요소가 숙주 세포의 게놈과 통합되지 못하는 상기 실시형태의 벡터.
1331. 유전 요소가 포유동물 세포, 예를 들어, 인간 세포에서 복제 가능한, 상기 실시형태들 중 어느 한 실시형태의 벡터.
1332. 예를 들어 유전자, 예를 들어, 인간 유전자의 발현을 조절하기 위해 선택되는 외인성 핵산 서열을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 벡터.
1333. 상기 실시형태들 중 어느 한 실시형태의 벡터 및 약제학적 부형제를 포함하는 약제학적 조성물.
1334. 벡터가 숙주 세포에서 비-병원성이고/이거나 비-통합성인, 상기 실시형태의 조성물.
1335. 벡터가 숙주에서 비-면역원성인, 상기 실시형태들 중 어느 한 실시형태의 조성물.
1336. 벡터가 (표현형, 바이러스 수준, 유전자 발현, 기타 바이러스와의 경쟁, 병태 등을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상) 조절하기에 충분한 양으로 존재하는, 상기 실시형태의 조성물.
1337. 적어도 하나의 바이러스 또는 바이러스의 게놈을 포함하는 벡터, 예를 들어, 아넬로좀의 변이체, 편리공생/고유 바이러스, 헬퍼 바이러스, 비-아넬로바이러스를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 조성물.
1338. 이종 모이어티, 적어도 하나의 소분자, 항체, 폴리펩티드, 핵산, 표적화제, 영상화제, 나노입자 및 그의 조합을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 조성물.
1339. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀의 생성, 증량 및 수집 방법.
1340. 상기 실시형태들 중 어느 한 실시형태의 벡터의 설계 및 제조 방법.
1341. 유효량의 상기 실시형태들 중 어느 한 실시형태의 조성물을 대상체에게 투여하는 방법.
1342. 표적 세포, 조직 또는 대상체로의 핵산 또는 단백질 페이로드의 운반 방법으로서, 상기 방법이 표적 세포, 조직 또는 대상체를 (a) 바이러스로부터 유래되는 제1 DNA 서열로서, 표적 세포, 조직 또는 대상체를 감염시킬 수 있는 입자의 생성을 가능하게 하기에 충분한 제1 DNA 서열, 및 (a) 핵산 또는 단백질 페이로드를 인코딩하는 제2 DNA 서열을 포함하는 핵산 조성물과 접촉시키는 단계를 포함하며, 개선이 하기를 포함하는 방법:
제1 DNA 서열이 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 상응하는 서열에 대하여 적어도 80%(적어도 85%, 90%, 95%, 97%, 99%, 100%) 서열 동일성을 갖는 적어도 500(적어도 600, 700, 800, 900, 1000, 1200, 1400, 1500, 1600, 1800, 2000)개의 뉴클레오티드를 포함함, 또는
제1 DNA 서열이 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10에 열거된 ORF에 대하여 적어도 80%(적어도 85%, 90%, 95%, 97%, 99%, 100%) 서열 동일성을 갖는 서열을 인코딩함, 또는
제1 DNA 서열이 표 19에 열거된 컨센서스 서열에 대하여 적어도 90%(적어도 95%, 97%, 99%, 100%) 서열 동일성을 갖는 서열을 포함함.
1343. 표적 세포, 조직 또는 대상체로의 핵산 또는 단백질 이펙터의 운반 방법으로서, 표적 세포, 조직 또는 대상체를 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 (a) 바이러스로부터 유래된 제1 DNA 서열로서, 표적 세포, 조직 또는 대상체를 감염시킬 수 있는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀의 생성을 가능하게 하기에 충분한 제1 DNA 서열 및 (a) 핵산 또는 단백질 이펙터를 인코딩하는 제2 DNA 서열을 포함하는 핵산 조성물과 접촉시키는 단계를 포함하는 방법.
1344. 야생형 아넬로바이러스 ORF1, ORF2 또는 ORF3 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 아미노산 서열을 인코딩하는 코돈-최적화된 핵산 분자.
1345. 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 아미노산 서열을 인코딩하는 실시형태 1344의 코돈-최적화된 핵산 분자.
1346. 약제학적 조성물로서:
(a) 아넬로좀, 예를 들어, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 및
(b) 소낭, 지질 나노입자(LNP), 적혈구, 엑소좀(예를 들어, 포유동물 또는 식물 엑소좀) 또는 푸소좀(fusosome)으로부터 선택되는 담체를 포함하는 약제학적 조성물.
2001. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 포함하는 유전 요소를 포함하며,
유전 요소가 적어도:
(i) 표 A1에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 72.2%(예를 들어, 적어도 72.2, 72.3, 72.4, 72.5, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(ii) 표 A3에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 68.4%(예를 들어, 적어도 68.4, 68.5, 68.6, 68.7, 68.8, 68.9, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(iii) 표 A5에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 81.7%(예를 들어, 적어도 81.7, 81.8, 81.9, 82, 83, 84, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(iv) 표 A7에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 92.6%(예를 들어, 적어도 92.6, 92.7, 92.8, 92.9, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(v) 표 A9에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 65%(예를 들어, 적어도 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성; 또는
(vi) 표 A11에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 65%(예를 들어, 적어도 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 포함하는 유전 요소;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되는, 아넬로좀.
2002. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 포함하는 유전 요소를 포함하며,
유전 요소가:
(i) 표 A1에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016 또는 1017개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(ii) 표 A3에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173 또는 1174개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iii) 표 A5에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671 또는 672개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iv) 표 A7에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279 또는 280개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(v) 표 A9에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실; 또는
(vi) 표 A11에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실을 포함하며;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되는, 아넬로좀.
2002. 아넬로좀으로서:
(a) 단백질성 외부;
(b) 프로모터 요소 및 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 포함하는 유전 요소를 포함하며,
유전 요소가:
(i) 표 B1에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016 또는 1017개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(ii) 표 B2에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173 또는 1174개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iii) 표 B3에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671 또는 672개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iv) 표 B4에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279 또는 280개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실; 또는
(v) 표 B5에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실을 포함하며;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
아넬로좀이 유전 요소를 진핵 세포 내로 운반하도록 구성되는, 아넬로좀.
2003. 유전 요소가 야생형 아넬로바이러스 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 표 B1 내지 B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11 또는 13 중 어느 하나에 열거된 바와 같은, 예를 들어, 야생형 아넬로바이러스 서열)에 비하여 자연 발생 서열이 아닌(예를 들어, 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는), 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
2004. 아넬로바이러스 ORF1 분자의 아미노산 서열(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
2005. 단백질성 외부가 폴리펩티드를 포함하는 실시형태 2004의 아넬로좀.
2006. 단백질성 외부 내의 적어도 60%(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%)의 단백질이 폴리펩티드를 포함하는 실시형태 2005의 아넬로좀.
2007. 단백질성 외부 내의 적어도 60%(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%)의 단백질이 ORF1 분자를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
2008. 아넬로바이러스 ORF1 분자의 아미노산 서열(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 인코딩하는 (예를 들어, 유전 요소 내의) 핵산 분자를 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
2009. 유전 요소가 하기 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역을 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열.
2010. 유전 요소가 본원에 기재된 바와 같은(예를 들어, 각각 표 38 또는 39에 열거된 바와 같은) 5' UTR 영역 및/또는 GC-풍부 영역을 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀.
2011. 하기 유전 요소를 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터)로서,
(i) 표 A1에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 72.2%(예를 들어, 적어도 72.2, 72.3, 72.4, 72.5, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(ii) 표 A3에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 68.4%(예를 들어, 적어도 68.4, 68.5, 68.6, 68.7, 68.8, 68.9, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(iii) 표 A5에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 81.7%(예를 들어, 적어도 81.7, 81.8, 81.9, 82, 83, 84, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(iv) 표 A7에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 92.6%(예를 들어, 적어도 92.6, 92.7, 92.8, 92.9, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성;
(v) 표 A9에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 65%(예를 들어, 적어도 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성; 또는
(vi) 표 A11에 열거된 바와 같은 아넬로바이러스 서열에 대한 적어도 65%(예를 들어, 적어도 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 포함하는 유전 요소;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터).
2012. 하기 유전 요소를 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터)로서,
(i) 표 A1에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016 또는 1017개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(ii) 표 A3에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173 또는 1174개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iii) 표 A5에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671 또는 672개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iv) 표 A7에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279 또는 280개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(v) 표 A9에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실; 또는
(vi) 표 A11에 열거된 바와 같은 아넬로바이러스 서열에 비한 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실을 포함하는 유전 요소;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터).
2012A. 하기 유전 요소를 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터)로서,
(i) 표 B1에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016 또는 1017개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(ii) 표 B2에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173 또는 1174개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iii) 표 B3에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671 또는 672개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실;
(iv) 표 B4에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279 또는 280개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실; 또는
(v) 표 B5에 열거된 바와 같은 아넬로바이러스 서열에 비한, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000개 이하의 뉴클레오티드 차이, 예를 들어, 치환, 삽입 또는 결실을 포함하는 유전 요소;
선택적으로, 유전 요소가 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스 게놈 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는 단리된 핵산 분자(예를 들어, 발현 벡터).
2013. 유전 요소가 야생형 아넬로바이러스 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 표 B1 내지 B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11 또는 13 중 어느 하나에 열거된 바와 같은, 예를 들어, 야생형 아넬로바이러스 서열)에 비하여 자연 발생 서열이 아닌(예를 들어, 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, TATA 박스, 캡 부위, 전사 시작 부위, 5' UTR, 오픈 리딩 프레임(ORF), 폴리(A) 신호 또는 GC-풍부 영역 중 하나 이상)의 결실을 포함하는), 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2014. 단리된 핵산 분자가 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 ORF1 분자 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 폴리펩티드)를 인코딩하는 유전 요소를 포함하며,
(i) ORF1 분자의 아미노산의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)가 β-시트의 부분이고;
(ii) ORF1 분자의 2차 구조가 적어도 3개(예를 들어, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 β-시트를 포함하고;
(iii) ORF1 분자의 2차 구조가 적어도 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-시트 대 α-나선의 비를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2015. 하기 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열.
2016. 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2017. 유전 요소가 하기 중 하나 이상을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자: 본원에 기재된(예를 들어, 표 B1 내지 B5, A1, A3, A5, A7, A9 또는 A11 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 유래의 TATA 박스, 개시인자 요소, 캡 부위, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1-인코딩 서열, ORF1/1-인코딩 서열, ORF1/2-인코딩 서열, ORF2-인코딩 서열, ORF2/2-인코딩 서열, ORF2/3-인코딩 서열, ORF2/3t-인코딩 서열, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열.
2018. 유전 요소가 적어도 1 또는 2개 카피(예를 들어, 1, 2, 3, 4, 5 또는 6개 카피)의 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 B1 내지 B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 게놈 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2019. 적어도 하나의 추가의 카피의 유전 요소(예를 들어, 총 1, 2, 3, 4, 5 또는 6개 카피)를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2020. 단리된 핵산 분자가 환형인, 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2021. 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산을 포함하는 (예를 들어, 1개, 2개 이상의 핵산 분자를 포함하는) 단리된 핵산 조성물.
2022. 유전 요소가 프로모터 요소, 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열) 및/또는 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 추가로 포함하는 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산.
2022A. 유전 요소가 ORF1의 초가변 도메인(HVD) 내의 삽입 또는 치환을 포함하는 상기 실시형태들 중 어느 한 실시형태의 단리된 핵산 분자.
2023. 유전 요소가 예를 들어, 표 B1 내지 B5, A1, A3, A5, A7, A9 또는 A11 중 어느 하나에 나타낸 바와 같은, TATA 박스, 개시인자 부위, 5' UTR 보존된 도메인, ORF1, ORF2, ORF2 하류 서열, ORF2, ORF3, 및/또는 GC-풍부 영역, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열 중 하나 이상을 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산 분자.
2024. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3으로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 하나 이상의 폴리펩티드를 (예를 들어, 단백질성 외부 내에) 포함하거나 또는 인코딩하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2025. 유전 요소가 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 서열을 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2026. 유전 요소가 적어도 80%의 GC 함량을 갖는 적어도 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 실시형태 2025의 아넬로좀 또는 단리된 핵산.
2027. 유전 요소가 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80% 또는 80.6%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는 실시형태 2025의 아넬로좀 또는 단리된 핵산.
2028. 유전 요소가 적어도 80%의 GC 함량을 갖는 적어도 36개의 연속 뉴클레오티드를 포함하는 실시형태 2025의 아넬로좀 또는 단리된 핵산.
2029. 유전 요소가 하기 핵산 서열의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 영역(예를 들어, 패키징 영역)을 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172);
또는 이에 대하여 적어도 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 핵산 서열.
2030. 패키징 영역이 이펙터를 인코딩하는 핵산 서열에 비하여 3'에 위치한 실시형태 2029의 아넬로좀 또는 단리된 핵산.
2031. 폴리펩티드로서:
(a) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 아르기닌-풍부 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제1 영역;
(b) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 젤리-롤 영역 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제2 영역;
(c) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 N22 도메인 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제3 영역; 및/또는
(d) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 제4 영역 중 하나 이상을 포함하며,
ORF1 분자가 (예를 들어, 본원에 기재된 바와 같은) 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 화학적 또는 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아르기닌-풍부 영역, 젤리-롤 도메인, HVR, N22 또는 CTD 중 하나 이상)의 결실을 포함하는, 폴리펩티드.
2031A. 실시형태 2031의 폴리펩티드로서:
(a) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 아르기닌-풍부 영역 서열에 대하여 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 제1 영역;
(b) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 젤리-롤 영역 서열에 대하여 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 제2 영역;
(c) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 N22 도메인 서열에 대하여 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 제3 영역; 및/또는
(d) 본원에 기재된 아넬로바이러스 ORF1 분자(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)의 아넬로바이러스 ORF1 C-말단 도메인(CTD) 서열에 대하여 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 제4 영역 중 하나 이상을 포함하며,
ORF1 분자가 (예를 들어, 본원에 기재된 바와 같은) 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경), 예를 들어, 삽입, 치환, 화학적 또는 효소적 변형 및/또는 결실, 예를 들어, 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아르기닌-풍부 영역, 젤리-롤 도메인, HVR, N22 또는 CTD 중 하나 이상)의 결실을 포함하는, 폴리펩티드.
2032. 폴리펩티드가 하기를 포함하는 실시형태 2031의 폴리펩티드:
(i) 제1 영역 및 제2 영역;
(ii) 제1 영역 및 제3 영역;
(iii) 제1 영역 및 제4 영역;
(iv) 제2 영역 및 제3 영역;
(v) 제2 영역 및 제4 영역;
(vi) 제3 영역 및 제4 영역;
(vii) 제1 영역, 제2 영역 및 제3 영역;
(viii) 제1 영역, 제2 영역 및 제4 영역;
(ix) 제1 영역, 제3 영역 및 제4 영역; 또는
(x) 제2 영역, 제3 영역 및 제4 영역.
2033. 폴리펩티드가 N-말단에서 C-말단 순서로, 제1 영역, 제2 영역, 제3 영역 및 제4 영역을 포함하는, 실시형태 2031 또는 2032의 폴리펩티드.
2034. 아미노산 서열, 예를 들어, 초가변 영역(HVR) 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 분자의 HVR 서열)을 추가로 포함하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드로서, 아미노산 서열이 적어도 약 55개(예를 들어, 적어도 약 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60 또는 65개)의 아미노산(예를 들어, 약 45 내지 160개, 50 내지 160개, 55 내지 160개, 60 내지 160개, 45 내지 150개, 50 내지 150개, 55 내지 150개, 60 내지 150개, 45 내지 140개, 50 내지 140개, 55 내지 140개 또는 60 내지 140개의 아미노산)을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
2035. HVR이 본원에 기재된 아넬로바이러스 ORF1 분자의 아넬로바이러스 ORF1 HVR 서열(예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열)에 대하여 적어도 30%(예를 들어, 적어도 약 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 2034의 폴리펩티드.
2036. HVR 서열이 제2 영역과 제3 영역 사이에 위치한, 실시형태 2034 또는 2035의 폴리펩티드.
2037. HVR이 본원에 기재된 바와 같은 HVR의 하나 이상의 특징을 포함하는, 실시형태 2034 내지 2036 중 어느 한 실시형태의 폴리펩티드.
2038. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3의, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드로서, 폴리펩티드가 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은) 야생형 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 서열에 비한 적어도 하나의 차이(예를 들어, 돌연변이 또는 화학적 변형), 예를 들어, 컨쥬게이션, 부가, 삽입, 치환 및/또는 결실, 예를 들어, 도메인의 결실을 추가로 포함하는, 폴리펩티드.
2039. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3의, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
2040. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF2, ORF2 또는 ORF3으로부터 선택되는 아미노산 서열에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97% 또는 98%이지만, 99% 이하인 서열 동일성을 갖는, 폴리펩티드.
2041. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3으로부터 선택되는 아미노산 서열에 비하여 적어도 1개의, 그러나, 2, 5, 10, 20, 50 또는 100개 이하의 아미노산 차이, 예를 들어, 치환, 삽입 또는 결실을 갖는, 폴리펩티드.
2042. 폴리펩티드가 단리된 폴리펩티드인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드.
2043. 복합체로서:
(a) 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 및
(b) 프로모터 요소 및 이펙터(예를 들어, 외인성 이펙터 또는 내인성 이펙터)를 인코딩하는 핵산 서열(예를 들어, DNA 서열), 및 단백질 결합 서열을 포함하는 유전 요소를 포함하는, 복합체.
2044. 복합체가 본원에 기재된 바와 같은 복합체의 하나 이상의 특징을 포함하는, 실시형태 2043의 복합체.
2045. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 분자로부터 선택되는, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 제1 아미노산 서열 및 이종 모이어티를 포함하는, 융합 단백질.
2046. 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나의 ORF1 분자로부터 선택되는, 또는 이에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 제1 아미노산 서열 및 이종 모이어티를 포함하는, 융합 단백질.
2047. 이종 모이어티가 표적화 모이어티를 포함하는, 상기 실시형태들 중 어느 한 실시형태의 융합 단백질.
2048. 제1 아미노산 서열이 (예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된 바와 같은) 야생형 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 및/또는 ORF3 서열에 비하여 적어도 하나의 차이(예를 들어, 돌연변이 또는 화학적 변형), 예를 들어, 컨쥬게이션, 부가, 삽입, 치환 및/또는 결실, 예를 들어, 도메인의 결실을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 융합 단백질.
2049. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 융합 단백질 또는 폴리펩티드를 포함하는, 숙주 세포.
2050. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 및 헬퍼 바이러스를 포함하는 반응 혼합물로서, 헬퍼 바이러스가 폴리뉴클레오티드, 예를 들어, 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합하는 외부 단백질 및 선택적으로, 지질 외피를 인코딩하는 폴리뉴클레오티드를 포함하는, 반응 혼합물.
2051. 대상체에서의 질병 또는 장애의 치료 방법으로서, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산 분자, 융합 단백질 또는 폴리펩티드, 또는 상기 실시형태들 중 어느 한 실시형태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.
2052. 질병 또는 장애가 면역 장애, 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양) 및 위장 장애로부터 선택되는, 실시형태 2051의 방법.
2053. 대상체에서 질병 또는 장애를 치료하기 위한 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 융합 단백질 또는 폴리펩티드의 용도.
2054. 질병 또는 장애가 면역 장애, 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는, 실시형태 2053의 용도.
2055. 대상체에서 질병 또는 장애를 치료하는 데 사용하기 위한, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 조성물 또는 약제학적 조성물.
2055A. 의약으로서 사용하기 위한, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 조성물 또는 약제학적 조성물.
2056. 대상체에서의 생물학적 기능의 조절, 예를 들어, 저해하거나 또는 향상시키는 방법으로서, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 융합 단백질 또는 폴리펩티드 또는 상기 실시형태들 중 어느 한 실시형태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.
2057. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀, 단리된 핵산, 융합 단백질 또는 폴리펩티드를 세포, 예를 들어, 진핵 세포, 예를 들어, 포유동물 세포와 접촉시키는 단계를 포함하는, 세포로의 아넬로좀의 운반 방법.
2058. 헬퍼 바이러스를 세포와 접촉시키는 단계를 추가로 포함하는 실시형태 2057의 방법으로서, 헬퍼 바이러스가 폴리뉴클레오티드, 예를 들어, 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합하는 외부 단백질 및 선택적으로 지질 외피를 인코딩하는 폴리뉴클레오티드를 포함하는, 방법.
2059. 헬퍼 바이러스를 아넬로좀과 세포의 접촉 이전에, 이와 동시에 또는 이후에, 세포와 접촉시키는, 실시형태 2058의 방법.
2060. 헬퍼 폴리뉴클레오티드를 세포와 접촉시키는 단계를 추가로 포함하는, 실시형태 2057의 방법.
2061. 헬퍼 폴리뉴클레오티드가 외부 단백질, 예를 들어, 외부 단백질 결합 서열에 결합하는 외부 단백질 및 지질 외피를 인코딩하는 폴리뉴클레오티드 서열을 포함하는, 실시형태 2060의 방법.
2062. 헬퍼 폴리뉴클레오티드가 RNA(예를 들어, mRNA), DNA, 플라스미드, 바이러스 폴리뉴클레오티드 또는 그의 임의의 조합인, 실시형태 2060의 방법.
2063. 헬퍼 폴리뉴클레오티드를 아넬로좀과 세포의 접촉 이전에, 이와 동시에 또는 이후에 세포와 접촉시키는, 실시형태 2060 내지 2062 중 어느 한 실시형태의 방법.
2064. 헬퍼 단백질과 세포를 접촉시키는 단계를 추가로 포함하는, 실시형태 2057 내지 2063 중 어느 한 실시형태의 방법.
2065. 헬퍼 단백질이 바이러스 복제 단백질 또는 캡시드 단백질을 포함하는, 실시형태 2064의 방법.
2066. 표적 세포, 조직 또는 대상체로의 핵산 또는 단백질 이펙터의 운반 방법으로서, 방법이 표적 세포, 조직 또는 대상체를 (a) 바이러스로부터 유래된 제1 DNA 서열로서, 표적 세포, 조직 또는 대상체를 감염시킬 수 있는 입자의 생성을 가능하게 하기에 충분한 제1 DNA 서열 및 (a) 핵산 또는 단백질 이펙터를 인코딩하는 제2 DNA 서열을 포함하는 핵산 조성물과 접촉시키는 단계를 포함하며, 개선이 하기를 포함하는, 방법:
제1 DNA 서열이 표 B1 내지 B5, A1, A3, A5, A7, A9 또는 A11 중 어느 하나에 열거된 상응하는 서열에 대하여 적어도 80% (적어도 85%, 90%, 95%, 97%, 99%, 100%) 서열 동일성을 갖는 적어도 500개(적어도 600, 700, 800, 900, 1000, 1200, 1400, 1500, 1600, 1800, 2000개)의 뉴클레오티드를 포함함, 또는
제1 DNA 서열이 (예를 들어, 표 C1 내지 C5, A2, A4, A6, A8, A10 또는 A12 중 어느 하나에 열거된) 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, 및/또는 ORF3 분자에 대하여 적어도 80%(적어도 85%, 90%, 95%, 97%, 99%, 100%) 서열 동일성을 갖는 서열을 인코딩함.
2067. 아넬로좀 조성물의 제조 방법으로서:
a) 상기 실시형태들 중 어느 한 실시형태의 아넬로좀의 구성성분을 인코딩하는 하나 이상의 핵산 분자를 포함하는 숙주 세포를 제공하는 단계로서, 아넬로좀이 단백질성 외부 및 유전 요소, 예를 들어, 프로모터 요소, 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터)를 인코딩하는 서열 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소를 포함하는 단계;
b) 아넬로좀을 숙주 세포로부터 생성함으로써, 아넬로좀을 제조하는 단계; 및
c) 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하며,
선택적으로, 하나 이상의 핵산 분자가 헬퍼 단백질을 인코딩하는, 방법.
2068. 아넬로좀 조성물의 제조 방법으로서:
a) 상기 실시형태들 중 어느 한 실시형태에 따른 복수의 아넬로좀을 제공하는 단계;
b) 선택적으로 복수의 아넬로좀을 본원에 기재된 오염물질, 광학 밀도 측정치(예를 들어, OD 260), (예를 들어, HPLC에 의한) 입자 개수, 감염성(예를 들어, 입자:감염성 유닛 비) 중 하나 이상에 대하여 평가하는 단계; 및
c) 예를 들어, (b)의 파라미터 중 하나 이상이 특정 임계값을 만족하면, 복수의 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 방법.
2069. 아넬로좀 조성물이 적어도 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014 또는 1015개의 아넬로좀을 포함하는, 실시형태 2068의 방법.
2070. 아넬로좀 조성물이 적어도 10 ㎖, 20 ㎖, 50 ㎖, 100 ㎖, 200 ㎖, 500 ㎖, 1 ℓ, 2 ℓ, 5 ℓ, 10 ℓ, 20 ℓ 또는 50 ℓ를 포함하는 실시형태 2068 또는 2069의 방법.
2071. 유전 요소가 포유동물 세포, 예를 들어, 인간 세포에서 복제하도록 구성되는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2072. 유전 요소가 예를 들어, 유전자, 예를 들어, 인간 유전자의 발현을 조절하도록 선택된 외인성 핵산 서열을 추가로 포함하는 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2073. 적어도 60%(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%)의 단백질 결합 서열이 G 또는 C로 이루어진 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2074. 유전 요소가 적어도 70%(예를 들어, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 또는 약 70 내지 100%, 75 내지 95%, 80 내지 95%, 85 내지 95% 또는 85 내지 90%의 위치에서 G 또는 C로 이루어진 적어도 80, 90, 100, 110, 120, 130 또는 140개 뉴클레오티드 길이의 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2075. 단백질 결합 서열이 단백질성 외부의 아르기닌-풍부 영역에 결합하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2076. 단백질성 외부가 단백질 결합 서열에 특이적으로 결합하는 외부 단백질을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2077. 이펙터를 배제한 유전 요소의 부분이 약 2.5 내지 5 kb(예를 들어, 약 2.8 내지 4kb, 약 2.8 내지 3.2kb, 약 3.6 내지 3.9kb 또는 약 2.8 내지 2.9kb), 약 5kb 미만(예를 들어, 약 2.9kb, 3.2 kb, 3.6kb, 3.9kb 또는 4kb 미만) 또는 적어도 100개 뉴클레오티드(예를 들어, 적어도 1kb)의 조합된 크기를 갖는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2078. 유전 요소가 단일-가닥인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2079. 유전 요소가 환형인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2080. 유전 요소가 DNA인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2081. 유전 요소가 음성 가닥 DNA인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2082. 유전 요소가 에피솜을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2083. 아넬로좀이 다른 기관 또는 조직에 비해 요망되는 기관 또는 조직에서 더 높은 수준으로 존재하는(예를 들어, 우선적으로 그 내에 축적되는), 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2084. 진핵 세포가 포유동물 세포, 예를 들어, 인간 세포인, 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산.
2085. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산을 포함하는 조성물.
2086. 상기 실시형태들 중 어느 한 실시형태의 아넬로좀 또는 단리된 핵산, 및 약제학적으로 허용 가능한 담체 또는 부형제를 포함하는 약제학적 조성물.
2087. 약제학적 조성물로서
a) 적어도 103, 104, 105, 106, 107, 108 또는 109개의 상기 실시형태들 중 어느 한 실시형태의 아넬로좀;
b) 약제학적 부형제, 및 선택적으로,
c) 사전결정된 양 미만의 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀, 유리 바이러스 캡시드 단백질, 외래 작용제 및/또는 응집물을 포함하는 약제학적 조성물.
2088. 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 아넬로좀, 예를 들어, 합성 아넬로좀을 포함하는 실시형태 2085 또는 2086의 조성물 또는 약제학적 조성물.
2089. 적어도 103, 104, 105, 106, 107, 108 또는 109개의 아넬로좀을 포함하는 실시형태 2085 내지 2088 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
2090. 약제학적 조성물로서
a) 적어도 103, 104, 105, 106, 107, 108 또는 109개의 상기 실시형태들 중 어느 한 실시형태의 아넬로좀;
b) 약제학적 부형제, 및 선택적으로,
c) 사전결정된 양 미만의 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀, 유리 바이러스 캡시드 단백질, 외래 작용제 및/또는 응집물을 포함하는 약제학적 조성물.
2091. 하기의 특징 중 하나 이상을 갖는 실시형태 2085 내지 2090 중 어느 한 실시형태의 조성물 또는 약제학적 조성물:
a) 약제학적 조성물이 약제학적 또는 우수 제조 기준(GMP) 표준을 충족함;
b) 약제학적 조성물이 우수 제조 기준(GMP)에 따라 제조됨;
c) 약제학적 조성물이 사전결정된 기준 값 미만의 병원체 수준을 가짐, 예를 들어, 실질적으로 병원체가 없음;
d) 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 가짐, 예를 들어, 실질적으로 오염물질이 없음;
e) 약제학적 조성물이 사전결정된 비-감염성 입자의 수준 또는 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 이하, 100:1 이하 또는 50:1 미만)를 가짐, 또는
f) 약제학적 조성물이 예를 들어, 본원에 기재된 바와 같이, 낮은 면역원성을 갖거나, 실질적으로 비-면역원성임.
2092. 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 갖는, 예를 들어, 실질적으로 오염물질이 없는, 실시형태 2085 내지 2091 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
2093. 오염물질이 마이코플라스마, 내독소, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 과정 불순물(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 작용제(RCA), 예를 들어, 복제-적격 바이러스 또는 원치 않는 아넬로좀(예를 들어, 요망되는 아넬로좀, 예를 들어, 본원에 기재된 바와 같은 합성 아넬로좀 이외의 아넬로좀), 유리 바이러스 캡시드 단백질, 외래 작용제 및 응집물로 이루어진 군으로부터 선택되는, 실시형태 92의 조성물 또는 약제학적 조성물.
2094. 오염물질이 숙주 세포 DNA이며, 임계값 양이 약제학적 조성물 용량당 약 500 ng의 숙주 세포 DNA인, 실시형태 2093의 조성물 또는 약제학적 조성물.
2095. 약제학적 조성물이 중량 기준 10% 미만(예를 들어, 약 10%, 5%, 4%, 3%, 2%, 1%, 0.5% 또는 0.1% 미만)의 오염물질을 포함하는, 실시형태 2085 내지 2094 중 어느 한 실시형태의 조성물 또는 약제학적 조성물.
2096. 아넬로좀이 외인성 이펙터를 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 방법.
2097. 아넬로좀, 예를 들어, 합성 아넬로좀의 투여가 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상의 대상체 내의 표적 세포의 집단 내로의 유전 요소의 운반을 초래하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
2098. 아넬로좀, 예를 들어, 합성 아넬로좀의 투여가 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상의 대상체 내의 표적 세포의 집단 내로의 외인성 이펙터의 운반을 초래하는, 상기 실시형태들 중 어느 한 실시형태의 방법.
2099. 표적 세포가 예를 들어, 시험관 내의 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, 면역 세포, 간 세포, 폐 상피 세포를 포함하는, 실시형태 2097 또는 2098의 방법.
2100. 표적 세포가 간 또는 폐에 존재하는, 실시형태 2097 내지 2099 중 어느 한 실시형태의 방법.
2101. 유전 요소가 운반되는 표적 세포가 각각 적어도 10, 50, 100, 500, 1000, 10,000, 50,000, 100,000개 이상의 카피의 유전 요소를 제공받는, 실시형태 2097 내지 2100 중 어느 한 실시형태의 방법.
2102. 이펙터가 miRNA를 포함하며, 선택적으로, miRNA가 예를 들어, 아넬로좀이 운반되는 세포 또는 세포의 집단 내에서 표적 단백질 또는 RNA의 수준을 예를 들어, 적어도 10%, 20%, 30%, 40% 또는 50% 감소시키는, 상기 실시형태들 중 어느 한 실시형태의 방법.
2103. 유전 요소(예를 들어, 유전 요소의 5' UTR)가 단백질성 외부(예를 들어, 단백질성 외부 내의 ORF1 분자)에 물리적으로 회합된(예를 들어, 결합된), 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2104. 단백질성 외부 내에 봉입된 유전 요소가 예를 들어, 문헌[Martin et al. (2013, Hum. Gene Ther. Methods 24(4): 253-269; 그의 전문이 본원에 참조로 포함됨)]에 기재된 방법에 따라 결정되는 바와 같이, 엔도뉴클레아제 분해에 대하여 저항성이며; 선택적으로, 사용되는 DNase의 양이 약 60 U/㎖ 또는 약 300 U인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2105. 유전 요소가 적어도 80%의 위치에서 G 또는 C로 이루어진 적어도 100개 뉴클레오티드 길이의 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2106. 유전 요소가 환형, 단일 가닥 DNA인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2107. 유전 요소가 하나 이상의 박테리아 플라스미드 요소(예를 들어, 박테리아 복제 원점 또는 선택 가능한 마커, 예를 들어, 박테리아 내성 유전자)를 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2108. 유전 요소가 포유동물 세포에 유입되는 아넬로좀의 1% 미만의 빈도로 통합되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2109. 프로모터 요소가 야생형 아넬로바이러스에 대하여 외인성 또는 내인성인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2110. 외인성 이펙터가 치료적 외인성 이펙터, 예를 들어, 치료적 펩티드, 치료적 폴리펩티드 또는 치료적 핵산(예를 들어, miRNA)인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2111. 적어도 1000개(예를 들어, 적어도 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 20,000, 50,000, 75,000, 100,000, 200,000, 500,000, 1,000,000개 이상)의 아넬로좀의 집단이 적어도 100개(예를 들어, 적어도 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 50,000, 100,000개 이상)의 카피의 유전 요소를 하나 이상의 포유동물 세포 내로 운반하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2112. 아넬로좀이 아넬로바이러스 ORF2, ORF2/2, ORF2/3, ORF1, ORF1/1 또는 ORF1/2(예를 들어, 본원에 기재된 바와 같음)로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 95% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 하나 이상의 폴리펩티드를 포함하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2113. 유전 요소가 아넬로바이러스 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2(예를 들어, 본원에 기재된 바와 같음)로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 95% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2114. 아넬로좀이 복제 인자 및 캡시드 단백질 중 하나 또는 둘 모두를 인코딩하는 폴리뉴클레오티드를 포함하지 않거나, 아넬로좀이 복제 결함인, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2115. 아넬로좀이 시험관 내에서 또는 생체 내에서 세포와 접촉되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2116. 아넬로좀이 아넬로바이러스 ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2(예를 들어, 본원에 기재된 바와 같음)에 대하여 적어도 95% 서열 동일성을 갖는 폴리펩티드를 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2117. 유전 요소가 (예를 들어, 세포, 예를 들어, 숙주 세포, 예를 들어, 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, HEK293T 또는 A549 세포에서) 회전환 복제에 의해 증폭되어, 예를 들어, 적어도 2, 4, 8, 16, 32, 64, 128, 256, 518 또는 1024개의 카피를 생성할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2118. 유전 요소가 이중-가닥 환형 DNA 분자로부터 생성되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2119. 이중-가닥 환형 DNA 분자가 시험관 내 환화에 의해 생성되는, 실시형태 2118의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2118. 유전 요소가 유전 요소의 2개 카피의 핵산 서열을 포함하는 DNA 분자로부터 생성되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2119. 유전 요소의 2개 카피의 핵산 서열이 DNA 분자 내에 탠덤으로 배열되는, 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법.
2120. 아넬로좀 유전 요소(예를 들어, 상기 실시형태들 중 어느 한 실시형태의 유전 요소)의 5' UTR을 포함하는 2개 카피의 핵산 서열을 포함하는 핵산 분자.
2121. 프로모터 요소; 외인성 이펙터를 인코딩하는 핵산 서열; 표 B1 내지 B5 중 어느 하나에 열거된 바와 같은 5' UTR 서열 또는 이에 대하여 적어도 85%(예를 들어, 적어도 85%, 90%, 95% 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열; 및 표 B1 내지 B5 중 어느 하나에 열거된 바와 같은 GC-풍부 영역 또는 이에 대하여 적어도 85%(예를 들어, 적어도 85%, 90%, 95% 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함하는 핵산 분자.
2122. 핵산 분자가 단일-가닥 또는 이중 가닥인, 실시형태 2121의 핵산 분자.
2123. 핵산 분자가 환형인, 실시형태 2121의 핵산 분자.
2124. 유전 요소가 하기 핵산 서열을 포함하는 5' UTR을 포함하는 상기 실시형태들 중 어느 한 실시형태의 폴리펩티드, 복합체, 아넬로좀, 단리된 핵산, 세포, 조성물 또는 방법:
CGGGAGCCX1CGAGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAGTCTAGCGGAACGGG, X1 는 C 또는 부재임,
또는 이에 대하여 적어도 95% 동일한 핵산 서열.
3001. 합성 아넬로좀으로서:
(I) 유전 요소로서:
(a) 프로모터 요소,
(b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
(c) SEQ ID NO: 878의 뉴클레오티드 185 내지 255의 핵산 서열 또는 이에 대하여 적어도 85% 동일한 뉴클레오티드 서열을 포함하는 5' UTR을 포함하는 유전 요소; 및
(ii) SEQ ID NO: 921 또는 927의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
상기 합성 아넬로좀이 상기 유전 요소를 인간 세포 내로 운반할 수 있는, 합성 아넬로좀.
3002. 유전 요소가 SEQ ID NO: 878의 뉴클레오티드 185 내지 255의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열 또는 이에 대하여 적어도 95% 동일한 핵산 서열을 포함하는, 실시형태 3001의 합성 아넬로좀.
3003. 유전 요소가 SEQ ID NO: 886의 뉴클레오티드 185 내지 254의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열 또는 이에 대하여 적어도 95% 동일한 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3004. ORF1 분자가 SEQ ID NO: 878의 뉴클레오티드 512 내지 2545에 의해 인코딩되는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3005. ORF1 분자가 SEQ ID NO: 886의 뉴클레오티드 501 내지 2489에 의해 인코딩되는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3006. 유전 요소가 하기의 핵산 서열:
(i) SEQ ID NO: 878의 뉴클레오티드 3141 내지 3264, 또는
(i) SEQ ID NO: 886의 뉴클레오티드 3076 내지 3176;
또는 이에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3007. ORF1 분자가 표 D2 또는 표 D4에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3008. ORF1가 하기 아미노산 서열:
(i) SEQ ID NO: 883, 또는
(ii) SEQ ID NO: 891;
또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3009. 표 C1 또는 표 C2에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3010. 유전 요소가 표 C1 또는 표 C2에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3011. 합성 아넬로좀이 표 C1 또는 표 C2에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함하지 않는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3012. 유전 요소가 표 C1 또는 표 C2에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하지 않는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3013. 합성 아넬로좀으로서:
(I) 유전 요소로서:
(a) 프로모터 요소,
(b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
(c) SEQ ID NO: 894의 뉴클레오티드 178 내지 248의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
(ii) SEQ ID NO: 933의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
3014. 합성 아넬로좀으로서:
(I) 유전 요소로서:
(a) 프로모터 요소,
(b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
(c) SEQ ID NO: 903의 뉴클레오티드 176 내지 246의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
(ii) SEQ ID NO: 939의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
3015. 합성 아넬로좀으로서:
(I) 유전 요소로서:
(a) 프로모터 요소,
(b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
(c) SEQ ID NO: 911의 뉴클레오티드 170 내지 240의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
(ii) SEQ ID NO: 945의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
를 포함하며;
유전 요소가 단백질성 외부 내에 봉입되며;
상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
3016. ORF1 분자가 SEQ ID NO: 894의 뉴클레오티드 572 내지 2758에 의해 인코딩되는, 실시형태 3013의 합성 아넬로좀.
3017. ORF1 분자가 SEQ ID NO: 903의 뉴클레오티드 581 내지 2884에 의해 인코딩되는, 실시형태 3014의 합성 아넬로좀.
3018. ORF1 분자가 SEQ ID NO: 911의 뉴클레오티드 614 내지 2911에 의해 인코딩되는, 클라이스 3015의 합성 아넬로좀.
3019. 유전 요소가 하기 핵산 서열:
(i) SEQ ID NO: 894의 뉴클레오티드 3555 내지 3696,
(ii) SEQ ID NO: 903의 뉴클레오티드 3720 내지 3828; 또는
(iii) SEQ ID NO: 911의 뉴클레오티드 3716 내지 3815;
또는 이에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는, 실시형태 3013 내지 3018 중 어느 한 실시형태의 합성 아넬로좀.
3020. ORF1 분자가 표 D6에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 실시형태 3013의 합성 아넬로좀.
3021. ORF1 분자가 표 D8에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 실시형태 3014의 합성 아넬로좀.
3022. ORF1 분자가 표 D10에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 실시형태 3015의 합성 아넬로좀.
3023. ORF1 분자가 SEQ ID NO: 900의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 3013의 합성 아넬로좀.
3024. ORF1 분자가 SEQ ID NO: 908의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 3014의 합성 아넬로좀.
3025. ORF1 분자가 SEQ ID NO: 916의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 실시형태 3015의 합성 아넬로좀.
3026. 표 C3에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 실시형태 3013의 합성 아넬로좀.
3027. 표 C4에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 실시형태 3014의 합성 아넬로좀.
3028. 표 C5에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 실시형태 3015의 합성 아넬로좀.
3029. 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3013의 합성 아넬로좀.
3030. 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3014의 합성 아넬로좀.
3031. 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3015의 합성 아넬로좀.
3032. 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3013의 합성 아넬로좀.
3033. 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3014의 합성 아넬로좀.
3034. 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3015의 합성 아넬로좀.
3035. 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3013의 합성 아넬로좀.
3036. 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3014의 합성 아넬로좀.
3037. 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 실시형태 3015의 합성 아넬로좀.
3038. 합성 아넬로좀이 표 C3 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함하지 않는, 실시형태 3013 내지 3037 중 어느 한 실시형태의 합성 아넬로좀.
3039. 유전 요소가 표 C3 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하지 않는, 실시형태 3013 내지 3038 중 어느 한 실시형태의 합성 아넬로좀.
3040. ORF1 분자가 아미노산 서열 YNPX2DXGX2N을 포함하며, Xn이 각각 독립적으로 임의의 n개 아미노산의 인접 서열인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3041. ORF1 분자가 아미노산 서열 YNPX2DXGX2N에 측접하는 제1 베타 가닥 및 제2 베타 가닥을 추가로 포함하며, 예를 들어, 상기 제1 베타 가닥이 아미노산 서열 YNPX2DXGX2N의 티로신(Y) 잔기를 포함하고/포함하거나, 상기 제2 베타 가닥이 아미노산 서열 YNPX2DXGX2N의 제2 아스파라긴(N) 잔기(N에서 C로)를 포함하는, 실시형태 3040의 합성 아넬로좀.
3042. ORF1 분자가 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및 제9 베타 가닥을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3043. 유전 요소가 숙주 세포에서 회전환 복제에 의해 증폭되어, 예를 들어, 적어도 8개 카피를 생성할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3044. 유전 요소가 단일-가닥인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3045. 유전 요소가 환형인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3046. 유전 요소가 DNA인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3047. 유전 요소가 음성 가닥 DNA인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3048. 유전 요소가 세포에 유입되는 아넬로좀의 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0.5%, 0.2%, 0.1% 미만의 빈도로 통합되며, 예를 들어, 합성 아넬로좀이 비-통합성인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3049. 유전 요소가 표 16-1에 나타낸 컨센서스 5' UTR 핵산 서열의 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3050. 유전 요소가 표 16-2에 나타낸 컨센서스 GC-풍부 영역의 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3051. 유전 요소가 적어도 70%(예를 들어, 약 70 내지 100%, 75 내지 95%, 80 내지 95%, 85 내지 95% 또는 85 내지 90%)의 위치에서 G 또는 C로 이루어진 적어도 100개 뉴클레오티드 길이의 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3052. 유전 요소가 SEQ ID NO: 120의 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3053. 유전 요소가 표 11의 핵산 서열의 뉴클레오티드 1 내지 393의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열에 대하여 적어도 85% 서열 동일성을 갖는 서열 및 표 11의 핵산 서열의 뉴클레오티드 2868 내지 2929의 아넬로바이러스 GC-풍부 영역에 대하여 적어도 85% 서열 동일성을 갖는 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3054. 유전 요소가 표 11의 뉴클레오티드 서열에 대하여 적어도 75% 동일성을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3055. 프로모터 요소가 야생형 아넬로바이러스에 대하여 외인성인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3056. 프로모터 요소가 야생형 아넬로바이러스에 대하여 내인성인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3057. 외인성 이펙터가 치료제, 예를 들어, 치료적 펩티드 또는 폴리펩티드 또는 치료적 핵산을 인코딩하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3058. 외인성 이펙터가 조절 핵산, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA; 형광 태그 또는 마커, 항원, 펩티드, 천연-생물활성 펩티드 유래의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항미생물 펩티드, 포어-형성 펩티드, 바이사이클릭 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 소분자, (예를 들어, 면역 반응/신호에 대한 감수성에 영향을 미치는) 면역 이펙터, 사멸 단백질(예를 들어, 아폽토시스 또는 괴사의 유도제), 종양의 비-용해 저해제(예를 들어, 종양단백질의 저해제), 후성적 변형제, 후성적 효소, 전사 인자, DNA 또는 단백질 변형 효소, DNA-삽입제, 유출 펌프 저해제, 핵 수용체 활성화제 또는 저해제, 프로테아좀 저해제, 효소에 대한 경쟁적 저해제, 단백질 합성 이펙터 또는 저해제, 뉴클레아제, 단백질 단편 또는 도메인, 리간드, 항체, 수용체, 또는 CRISPR 시스템 또는 성분을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3059. 외인성 이펙터가 miRNA를 포함하며, 숙주 유전자의 발현을 감소시키는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3060. 외인성 이펙터가 약 20 내지 200, 30 내지 180, 40 내지 160, 50 내지 140, 60 내지 120, 200 내지 2000, 200 내지 500, 500 내지 1000, 1000 내지 1500 또는 1500 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3061. 외인성 이펙터를 인코딩하는 핵산 서열이 약 20 내지 200, 30 내지 180, 40 내지 160, 50 내지 140, 60 내지 120, 200 내지 2000, 200 내지 500, 500 내지 1000, 1000 내지 1500 또는 1500 내지 2000개 뉴클레오티드 길이인, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3062. (예를 들어, 단백질성 외부에) 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, ORF1, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이와 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3063. 유전 요소가 약 1.5 내지 2.0, 2.0 내지 2.5, 2.5 내지 3.0, 3.0 내지 3.5, 3.1 내지 3.6, 3.2 내지 3.7, 3.3 내지 3.8, 3.4 내지 3.9, 3.5 내지 4.0, 4.0 내지 4.5 또는 4.5 내지 5.0 kb의 길이를 갖는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3064. 합성 아넬로좀이 인간 세포, 예를 들어, 면역 세포, 간 세포 또는 폐 상피 세포를 감염시킬 수 있는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3065. 예를 들어, 실시예 4에 기재된 방법에 따라 검출되는 바와 같이, 실질적으로 비-면역원성인, 예를 들어, 검출 가능한 및/또는 원치 않는 면역 반응을 유도하지 않는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3066. 실질적으로 비-면역원성인 아넬로좀이 상기 대상체에서, 면역 반응이 결여된 기준 대상체에서의 효능의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%인 효능을 갖는, 실시형태 3065의 합성 아넬로좀.
3067. 적어도 1000개의 아넬로좀의 집단이 적어도 약 100개 카피(예를 들어, 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000개 카피)의 유전 요소를 하나 이상의 인간 세포 내로 운반할 수 있는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3068. (예를 들어, 단백질성 외부에) 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, ORF2t/3, ORF1, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이와 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는, 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀.
3069. 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀 및 약제학적으로 허용 가능한 담체 또는 부형제를 포함하는 약제학적 조성물.
3070. 적어도 103, 104, 105, 106, 107, 108 또는 109개의 합성 아넬로좀을 포함하는 실시형태 3069의 약제학적 조성물.
3071. 약제학적 조성물이 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 미만, 100:1 미만 또는 50:1 미만)를 갖는 실시형태 3069 또는 3070의 약제학적 조성물.
3072. 하기 중 하나 이상(예를 들어, 그 전부)을 인코딩하는 핵산 분자:
(i) ORF1 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF1 영역을 포함하는 것;
(ii) ORF2 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF2 영역을 포함하는 것; 및/또는
(iii) ORF3 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF3 영역을 포함하는 것.
3073. 핵산 분자가 플라스미드, 바이러스 게놈 또는 (예를 들어, 시험관 내 환화에 의해 생성되는) 이중-가닥 환형 DNA인, 실시형태 3072의 핵산 분자.
3074. 반응 혼합물로서:
(i) 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀의 유전 요소의 서열을 포함하는 제1 핵산(예를 들어, 이중-가닥 또는 단일-가닥 환형 DNA), 및
(ii) 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 서열을 포함하는, 반응 혼합물.
3075. 제1 핵산 및 제2 핵산이 동일한 핵산 분자에 존재하는, 실시형태 3074의 반응 혼합물.
3076. 제1 핵산 및 제2 핵산이 상이한 핵산 분자인, 실시형태 3074의 반응 혼합물.
3077. 제1 핵산 및 제2 핵산이 상이한 핵산 분자이며, 제2 핵산이 이중-가닥 환형 DNA로서 제공되는, 실시형태 3074의 반응 혼합물.
3078. 제1 핵산 및 제2 핵산이 상이한 핵산 분자이며, 제1 및 제2 핵산이 이중-가닥 환형 DNA로서 제공되는 실시형태 3074의 반응 혼합물.
3079. 제2 핵산 서열이 헬퍼 세포 또는 헬퍼 바이러스에 의해 포함되는, 실시형태 3076의 반응 혼합물.
3080. 합성 아넬로좀의 제조 방법으로서, 상기 방법이
a) 숙주 세포를 제공하는 단계로서:
(i) 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
(ii) 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자를 포함하는 숙주 세포를 제공하는 단계; 및
b) 숙주 세포를 상기 합성 아넬로좀을 제조하기에 적합한 조건 하에서 인큐베이션시키는 단계를 포함하며,
이렇게 함으로써, 합성 아넬로좀을 제조하는, 방법.
3081. 단계 (a) 이전에, 제1 핵산 분자 및/또는 제2 핵산 분자를 세포 내로 도입하는 단계를 추가로 포함하는, 실시형태 3080의 방법.
3082. 제2 핵산 분자가 제1 핵산 분자 이전에, 이와 동시에, 또는 이후에 숙주 세포 내로 도입되는, 실시형태 3081의 방법.
3083. 제2 핵산 분자가 숙주 세포의 게놈 내로 통합되는, 실시형태 3080 또는 3081 중 어느 한 실시형태의 방법.
3084. 제2 핵산 분자가 헬퍼(예를 들어, 헬퍼 플라스미드 또는 헬퍼 바이러스의 게놈)인, 실시형태 3080 내지 3083 중 어느 한 실시형태의 방법.
3085. 제2 핵산 분자가 아미노산 서열 [W/F]X7HX3CX1CX5H를 포함하는 ORF2 분자를 인코딩하며, Xn이 임의의 n개의 아미노산의 인접 서열인, 실시형태 3080 내지 3084 중 어느 한 실시형태의 방법.
3086. 합성 아넬로좀 제제의 제조 방법으로서, 상기 방법이
a) 실시형태 3001 내지 3068 중 어느 한 실시형태에 따른 복수의 합성 아넬로좀, 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물 또는 실시형태 3074 내지 3079 중 어느 한 실시형태의 반응 혼합물을 제공하는 단계;
b) 선택적으로 상기 복수의 것을 본원에 기재된 오염물질, 광학 밀도 측정치(예를 들어, OD 260), (예를 들어, HPLC에 의한) 입자 개수, 감염성(예를 들어, 입자:감염성 유닛 비) 중 하나 이상에 대하여 평가하는 단계; 및
c) 예를 들어, (b)의 파라미터 중 하나 이상이 특정 임계값을 만족한다면, 복수의 합성 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 방법.
3087. 숙주 세포로서:
(i) 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
(ii) 선택적으로, 표 C1 내지 표 C5중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자를 포함하는, 숙주 세포.
3088. 포유동물 세포로의 외인성 이펙터(예를 들어, 치료적 외인성 이펙터)의 운반 방법으로서:
(a) 상기 실시형태들 중 어느 한 실시형태의 합성 아넬로좀을 제공하는 단계; 및
(b) 포유동물 세포를 합성 아넬로좀과 접촉시키는 단계를 포함하며;
합성 아넬로좀이 유전 요소를 포유동물 세포 내로 운반할 수 있으며;
선택적으로, 숙주 세포에서 유전 요소를 단백질성 외부 내에 봉입하기에 적합한 조건 하에서, 유전 요소를 숙주 세포 내로 도입함으로써 합성 아넬로좀이 생성되며;
이렇게 함으로써 치료적 외인성 이펙터를 포유동물 세포에 운반하는, 방법.
3089. 유전 요소를 숙주 세포에 운반하기 위한, 실시형태 3001 내지 3068 중 어느 한 실시형태의 합성 아넬로좀 또는 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물의 용도.
3090. 대상체에서 질병 또는 장애를 치료하기 위한, 실시형태 3001 내지 3068 중 어느 한 실시형태의 합성 아넬로좀 또는 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물의 용도.
3091. 질병 또는 장애가 면역 장애, 인터페론병증(interferonopathy)(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는, 실시형태 3090의 용도.
3092. 대상체에서 질병 또는 장애를 치료하는 데 사용하기 위한, 실시형태 3001 내지 3068 중 어느 한 실시형태의 합성 아넬로좀 또는 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물.
3093. 대상체에서의 질병 또는 장애의 치료 방법으로서, 상기 방법이 실시형태 3001 내지 3068 중 어느 한 실시형태의 합성 아넬로좀 또는 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하며, 상기 질병 또는 장애가 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는 방법.
3094. 대상체에서 질병 또는 장애를 치료하기 위한 의약의 제조에서의 실시형태 3001 내지 3068 중 어느 한 실시형태의 합성 아넬로좀 또는 실시형태 3069 내지 3071 중 어느 한 실시형태의 약제학적 조성물의 용도로서, 선택적으로, 상기 질병 또는 장애가 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는, 용도.
본 발명의 다른 특징, 목적 및 이점이 설명 및 도면, 및 청구범위로부터 명백해질 것이다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본원에 언급된 모든 간행물, 특허 출원, 특허 및 다른 참고문헌은 그들 전문이 참조로 포함된다. 또한, 물질, 방법 및 실시예는 단지 예시적인 것일 뿐이며, 제한하려는 것이 아니다.
본 발명의 실시형태의 하기의 상세한 설명은 첨부된 도면과 함께 판독하는 경우 더 잘 이해될 것이다. 본 발명의 예시의 목적을 위하여, 본원에 예시된 실시형태가 도면에 나타나 있다. 그러나, 본 발명이 도면에 나타낸 실시형태의 정확한 배열 및 수단으로 제한되지 않음을 이해해야 한다. 특허 또는 출원 파일은 유색으로 작성된 적어도 하나의 도면을 포함한다. 요청 및 필요한 비용의 지불 시에 특허청에 의해 유색 도면(들)을 갖는 본 특허 또는 특허 출원 공보의 카피가 제공될 것이다.
도 1a는 캡시드 단백질 서열의 아미노산 영역의 서열 유사성 백분율을 보여주는 도면이다.
도 1b는 캡시드 단백질 서열의 서열 유사성 백분율을 보여주는 도면이다.
도 2는 아넬로좀의 일 실시형태를 보여주는 도면이다.
도 3은 TTMiniV의 LY1 주("아넬로좀 1")를 인코딩하는 카나마이신 벡터의 개략도를 도시한 것이다.
도 4는 TTMiniV의 LY2 주("아넬로좀 2")를 인코딩하는 카나마이신 벡터의 개략도를 도시한 것이다.
도 5는 293T 및 A549 세포에서의 합성 아넬로좀의 트랜스펙션 효율을 도시한 것이다.
도 6a 및 도 6b는 합성 아넬로좀에 의한 293T 세포의 성공적인 감염을 예시한 정량적 PCR 결과를 도시한 것이다.
도 7a 및 도 7b는 합성 아넬로좀에 의한 A549 세포의 성공적인 감염을 예시한 정량적 PCR 결과를 도시한 것이다.
도 8a 및 도 8b는 합성 아넬로좀에 의한 Raji 세포의 성공적인 감염을 예시한 정량적 PCR 결과를 도시한 것이다.
도 9a 및 도 9b는 합성 아넬로좀에 의한 Jurkat 세포의 성공적인 감염을 예시한 정량적 PCR 결과를 도시한 것이다.
도 10a 및 도 10b는 합성 아넬로좀에 의한 Chang 세포의 성공적인 감염을 예시한 정량적 PCR 결과를 도시한 것이다.
도 11a 및 도 11b는 TTMV-LY2Δ574-1371,Δ1432-2210,2610::nLuc로 트랜스펙션되거나 감염된 세포로부터의 루시퍼라제 발현을 보여주는 일련의 그래프이다. 감염된 세포에서 발광이 관찰되었으며, 이는 성공적인 복제 및 패키징을 나타낸다.
도 11c는 알파토르크바이러스(Alphatorquevirus)(토르크 테노 바이러스; TTV)의 계통수를 도시한 다이어그램이며, 클레이드가 강조표시되어 있다. 적어도 100개의 아넬로바이러스 주가 표시되어 있다. 몇몇의 클레이드로부터의 예시적인 서열은 본원에, 예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5, 및 1 내지 18에 제공되어 있다.
도 12는 아넬로좀(예를 들어, 본원에 기재된 바와 같은 복제-적격 또는 복제-결핍 아넬로좀)의 생성에 대한 예시적인 작업흐름을 보여주는 개략도이다.
도 13은 TTV 및 TTMV 게놈 당량의 정량화를 위해 설계된 프라이머 세트에 대한 프라이머 특이성을 보여주는 그래프이다. SYBR 그린(green) 화학에 기초한 정량적 PCR은 각각의 게놈을 인코딩하는 플라스미드 상에서, 표기된 바와 같은 TTMV 또는 TTV 특이적 프라이머 세트를 사용한 증폭 생성물의 각각에 대한 뚜렷한 하나의 피크를 보여준다.
도 14는 qPCR에 의한 TTV 게놈 당량의 정량화에서 PCR 효율을 보여주는 일련의 그래프이다. 2가지 상이한 상용 qPCR 마스터 믹스와 함께 증가하는 농도의 프라이머 및 고정된 농도의 가수분해 프로브(250 nM)를 사용하였다. 90 내지 110%의 효율이 정량화 동안 최소의 오차 전파를 초래하였다.
도 15는 게놈 당량 농도의 7 log10에 걸친 TTMV(표적 1) 또는 TTV(표적 2)의 선형 증폭에 대한 예시적인 증폭 플롯을 보여주는 그래프이다. 게놈 당량을 높은 PCR 효율 및 직선성(R2 TTMV: 0.996; R2 TTV: 0.997)으로 7개의 10배 희석에 걸쳐 정량화하였다.
도 16a 및 도 16b는 아넬로좀 스톡 내의 TTMV 게놈 당량의 정량화를 보여주는 일련의 그래프이다. (도 16a) 각각 1:10 희석되고, 2벌로 시행된 2개의 스톡의 증폭 플롯. (도 16b) 본원에 직선 범위의 맥락으로 나타난, 도 16a에 나타낸 바와 같은 동일한 2개의 시료. 2가지 대표적인 시료에서 상한 및 하한이 나타나 있다. PCR 효율: 99.58%, R2: 0988.
도 17은 표기된 플라스미드로 트랜스펙션된 HEK293T 세포에서의 miR-625 발현의 배수 변화를 보여주는 그래프이다.
도 18은 각각의 알파토르크바이러스 클레이드로부터의 대표적인 서열의 정렬에 대한 쌍별 동일성을 보여주는 다이어그램이다. TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 및 TTV-HD16d에 대한 DNA 서열을 정렬하였다. 50-bp 슬라이딩 윈도우(sliding window)에 걸친 쌍별 동일성 백분율이 정렬의 길이에 따라 나타나 있다. 위의 괄호는 비-코딩 및 코딩 영역을 나타내며, 쌍별 동일성이 나타나 있다. 괄호 아래는 높은 또는 낮은 서열 보존의 영역을 나타낸다.
도 19는 7가지 알파토르크바이러스 클레이드에 걸친 추정 단백질에 대한 아미노산 정렬에 대한 쌍별 동일성을 보여주는 다이어그램이다. TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 및 TTV-HD16d로부터의 추정 단백질에 대한 아미노산 서열을 정렬하였다. 15-aa 슬라이딩 윈도우에 걸친 쌍별 동일성 백분율은 각각의 정렬의 길이에 따라 나타나 있다. 오픈 리딩 프레임 DNA 서열 및 단백질 아미노산 서열 둘 모두에 대한 쌍별 동일성이 나타나 있다. (*) TTV-CT30F, TTV-tth8, TTV-16 및 TTV-TJN02에 대하여 추정 ORF2t/3 아미노산 서열을 정렬하였다.
도 20은 5' UTR 내의 도메인이 7가지 알파토르크바이러스 클레이드에 걸쳐 고도로 보존되는 것을 보여주는 다이어그램이다(출현 순서로, 각각 SEQ ID NO: 810 내지 817). 각각의 대표적인 알파토르크바이러스에 대한 71-bp 5'UTR 보존된 도메인 서열을 정렬하였다. 서열은 7가지 클레이드 간에 95.2% 쌍별 동일성을 갖는다.
도 21은 7가지 알파토르크바이러스 클레이드로부터의 GC-풍부 도메인의 정렬을 보여주는 다이어그램이다. 각각의 아넬로바이러스는 70% 초과의 GC 함량을 갖는 ORF의 하류 영역을 갖는다. TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 및 TTV-HD16d로부터의 GC-풍부 영역의 정렬이 나타나 있다. 영역은 길이가 다양하지만, 그들이 정렬되는 영역에서, 그들은 75.4%의 쌍별 동일성을 갖는다.
도 22는 n-myc 상호작용 단백질(NMI)을 표적화하는 miRNA를 인코딩하는 아넬로좀을 이용한 Raji B 세포의 감염을 보여주는 다이어그램이다. NMI miRNA-인코딩 아넬로좀을 이용한 Raji B 세포(화살표) 또는 대조군 세포의 감염 후에 검출되는 아넬로좀의 게놈 당량의 정량화가 나타나 있다.
도 23은 n-myc 상호작용 단백질(NMI)을 표적화하는 miRNA를 인코딩하는 아넬로좀을 이용한 Raji B 세포의 감염을 보여주는 다이어그램이다. 웨스턴 블롯은 NMI에 대한 miRNA를 인코딩하는 아넬로좀이 Raji B 세포에서 NMI 단백질 발현을 감소시킨 한편, miRNA가 결여된 아넬로좀으로 감염된 Raji B 세포는 대조군과 유사한 NMI 단백질 발현을 보였음을 나타낸다.
도 24는 내인성 miRNA-인코딩 서열을 포함하는 아넬로좀 및 내인성 miRNA-인코딩 서열이 결실된 상응하는 아넬로좀을 이용한 감염 후에 숙주 세포에서 생성되는 아넬로좀 입자의 정량화를 보여주는 일련의 그래프이다.
도 25a 내지 도 25c는 나노-루시퍼라제에 융합된 TTMV-LY2로부터의 ORF의 세포내 국소화를 보여주는 일련의 다이어그램이다. (도 25a) Vero 세포에서, ORF2(윗줄)는 세포질에 국소화하는 것으로 나타난 한편, ORF1/1(아랫줄)은 핵에 국소화하는 것으로 나타났다. (도 25b) HEK293 세포에서, ORF2(윗줄)는 세포질에 국소화하는 것으로 나타난 한편, ORF1/1(아랫줄)은 핵에 국소화하는 것으로 나타났다. (도 25c) 세포 내의 ORF1/2 및 ORF2/2에 대한 국소화 패턴.
도 26은 TTV-tth8의 3' 비-코딩 영역(NCR) 내의 순차적인 결실 대조군을 보여주는 일련의 다이어그램이다. 윗줄은 야생형 TTV-tth8 아넬로바이러스의 구조를 보여준다. 두번째 줄은 3' NCR의 GC-풍부 영역 내의 36개 뉴클레오티드의 결실을 갖는 TTV-tth8을 보여준다(Δ36nt(GC)). 세번째 줄은 총 78개 뉴클레오티드의 결실을 초래하는, 36개 뉴클레오티드 결실 및 miRNA 서열의 추가의 결실을 갖는 TTV-tth8을 보여준다(Δ36nt(GC) ΔmiR). 네번째 줄은 36개 뉴클레오티드 결실 영역 및 miRNA 서열 둘 모두를 포함하는 3' NCR로부터 171개 뉴클레오티드의 결실을 갖는 TTV-tth8을 보여준다(Δ3' NCR).
도 27a 내지 도 27d는 TTV-tth8의 3' NCR 내의 순차적 결실이 아넬로바이러스 ORF 전사물 수준에 유의미한 영향을 갖는 것을 보여주는 일련의 다이어그램이다. 제2일에서의 ORF1 및 ORF2(도 27a), 제2일에서의 ORF1/1 및 ORF2/2(도 27b), 제2일에서의 ORF1/2 및 ORF2/3(도 27c) 및 제2일에서의 ORF2t3(도 27d)의 발현이 나타나 있다.
도 28a 내지 도 28b는 나노-루시퍼라제를 발현하는 아넬로좀을 생성하기 위해 사용되는 구축물(도 28a) 및 세포를 트랜스펙션시키기 위해 사용되는 일련의 아넬로좀/플라스미드 조합(도 28b)을 보여주는 일련의 다이어그램이다.
도 29a 내지 도 29c는 아넬로좀으로 감염된 마우스에서의 나노-루시퍼라제 발현을 보여주는 일련의 다이어그램이다. (도 29a) 주사 후 제0일 내지 제9일에 마우스에서의 나노-루시퍼라제 발현. (도 29b) 표기된 바와 같은, 다양한 아넬로좀/플라스미드 구축물 조합이 주사된 마우스에서의 나노-루시퍼라제 발현. (도 29c) 주사 후에 마우스에서 검출되는 나노-루시퍼라제 발광의 정량화. 군 A에는 TTMV-LY2 벡터 ± 나노-루시퍼라제를 제공하였다. 군 B에는 나노-루시퍼라제 단백질 및 TTMV-LY2 ORF를 제공하였다.
도 29da 및 도 29db는 7가지 상이한 알파토르크바이러스 클레이드로부터의 대표적인 아넬로의 게놈 조직의 개략도이다. TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 및 TTV-HD16d에 대한 서열을 정렬하였으며, 주요 영역은 주석이 달려있다. 추정 오픈 리딩 프레임(ORF)은 연회색으로 나타나 있으며, TATA 박스는 진회색으로 나타나 있으며, (예를 들어, 표기된 바와 같은) 개시인자 요소, 5'UTR 보존된 도메인 및 GC-풍부 영역을 포함하는 주요한 추정 조절 영역은 중간 회색으로 나타나 있다.
도 30은 아넬로바이러스 pre-miRNA의 내인성 표적을 결정하기 위한 예시적인 작업흐름을 보여주는 개략도이다.
도 31a 및 도 31b는 탠덤 아넬로바이러스 플라스미드가 아넬로바이러스 또는 아넬로좀 생성을 증가시킬 수 있는 것을 보여주는 일련의 다이어그램이다. (도 31a) 예시적인 탠덤 아넬로바이러스 플라스미드에 대한 플라스미드 맵. (도 31b) 탠덤 아넬로바이러스 플라스미드를 이용한 HEK293T 세포의 트랜스펙션은 단일-카피 보유 플라스미드에 비하여 4배의 바이러스 게놈의 수의 생성을 초래하였다.
도 31c는 TTMV-LY2 플라스미드 pVL46-063 및 pVL46-240의 환화를 보여주는 겔 전기영동 이미지이다.
도 31d는 크기 배제 크로마토그래피(SEC)에 의해 결정되는 바와 같은, 선형 및 환형 TTMV-LY2 구축물에 대한 카피 수를 보여주는 크로마토그램이다.
도 32는 9가지 아넬로바이러스 게놈 서열로부터의 36-뉴클레오티드 GC-풍부 영역 및 그에 기초한 컨센서스 서열의 정렬을 보여주는 다이어그램이다(각각 출현 순서로, SEQ ID NO: 818 내지 827).
도 33은 아넬로바이러스 주 LY2 및 CBD203으로부터의 ORF1 구조를 보여주는 일련의 다이어그램이다. 추정 도메인이 표지되어 있다: 표기된 바와 같이, 아르기닌-풍부 영역(arg-rich), 젤리-롤 도메인을 포함하는 코어 영역, 초가변 영역(HVR), N22 영역 및 C-말단 도메인(CTD).
도 34는 베타토르크바이러스 주 CBS203으로부터의 ORF1 구조를 보여주는 다이어그램이다. 110개의 베타토르크바이러스의 세트 간에 높은 유사성을 보이는 잔기가 나타나 있다. 평가되는 모든 주 간에, 60 내지 79.9% 유사성의 잔기; 80 내지 99.9% 유사성의 잔기 및 100% 유사성의 잔기가 나타나 있다.
도 35는 진회색(100%), 중간 회색(80 내지 99.9%), 연회색(60 내지 80%)으로 강조표시된 높은 유사성 점수를 갖는 잔기를 갖는 알파토르크바이러스의 258개의 서열의 정렬로부터의 컨센서스 서열(SEQ ID NO: 828)을 보여주는 다이어그램이다. 추정 도메인이 네모 안에 나타나 있다. 동일성 백분율은 또한, 컨센서스 서열 아래에 박스 그래프에 의해 나타나 있으며, 중간 회색 박스는 100% 동일성을 나타내며, 연회색 박스는 30 내지 99% 동일성을 나타내며, 진회색 박스는 30% 미만의 동일성을 나타낸다.
도 36은 아넬로바이러스 ORF1 분자의 도메인 및 상이한 아넬로바이러스로부터의 초가변 도메인으로 대체될 초가변 영역을 보여주는 개략도이다.
도 37은 ORF1의 도메인 및 비-아넬로바이러스 공급원 유래의 관심 단백질 또는 펩티드(POI)로 대체될 초가변 영역을 보여주는 개략도이다.
도 38은 아넬로바이러스 게놈에 기초한 예시적인 아넬로좀 유전 요소의 설계를 보여주는 일련의 다이어그램이다. 단백질-코딩 영역을 아넬로바이러스 게놈(좌측)으로부터 결실시켜, 바이러스 프로모터, 5'UTR 보존된 도메인(5CD) 및 GC-풍부 영역을 포함하는 아넬로바이러스 비-코딩 영역(NCR)을 남긴다. 페이로드 DNA를 단백질-코딩 유전자좌에서 비-코딩 영역 내에 삽입하였다(우측). 생성된 아넬로좀은 페이로드 DNA(오픈 리딩 프레임, 유전자, 비-코딩 RNA 등 포함) 및 필수 아넬로바이러스 시스 복제 및 패키징 요소를 보유하였지만, 복제 및 패키징에 필수적인 단백질 요소가 결여되었다.
도 39는 외인성 인간 면역어드헤신(immunoadhesin)을 인코딩하는 유전 요소를 포함하는 아넬로좀이 인간 폐-유래 세포주 EKVX를 성공적으로 형질도입시켰음을 보여주는 막대 그래프이다.
도 40은 인간 에리트로포이에틴(hEpo)을 인코딩하는 서열을 함유하도록 조작된, tth8 또는 LY2에 기초한 아넬로좀이 기능적 전이유전자를 포유동물 세포에 운반할 수 있었음을 보여주는 그래프이다.
도 41a 및 도 41b는 마우스에게 투여되는 조작된 아넬로좀이 정맥내 주사 후 제7일에 검출 가능하였음을 보여주는 일련의 그래프이다.
도 42는 hGH mRNA가 hGH를 인코딩하는 조작된 아넬로좀의 정맥내 투여 후 제7일에 전혈의 세포 분획에서 검출되었음을 보여주는 그래프이다.
도 43a 내지 도 43d는 아넬로바이러스 ORF2 내의 고도로 보존된 모티프를 예시한 일련의 다이어그램이다. 도 43은 SEQ ID NO: 949를 개시한다.
도 44a 및 도 44b는 인간 조직 내의 전장 ORF1 mRNA 발현의 증거를 보여주는 일련의 다이어그램이다.
도 45는 플라스미드 내의 TTV-tth8 게놈에 비하여 시험관 내 환화된(IVC) TTV-tth8 게놈(IVC TTV-tth8)이 HEK293T 세포에서 예상되는 밀도로 TTV-tth8 게놈 카피를 제공하는 능력을 보여주는 그래프이다.
도 46은 시험관 내 환화된(IVC) LY2 게놈(WT LY2 IVC) 및 플라스미드 내의 야생형 LY2 게놈(WT LY2 플라스미드)이 Jurkat 세포에서 예상되는 밀도로 LY2 게놈 카피를 제공하는 능력을 보여주는 일련의 그래프이다.
도 47은 알파토르크바이러스, 베타토르크바이러스 및 감마토르크바이러스로부터의 아넬로바이러스 ORF1 단백질의 젤리 롤 도메인의 2차 구조의 정렬을 보여주는 다이어그램이다(SEQ ID NO: 950 내지 975). 이들 2차 구조 요소는 고도로 보존된다.
도 48은 N22 도메인에 위치한 ORF1 모티프의 보존된 서열 및 2차 구조를 보여주는 다이어그램이다(각각 출현 순서로, SEQ ID NO: 976 내지 1000 및 851). 인간 TTV ORF1의 보존된 YNPXXDXGXXN(SEQ ID NO: 829) 모티프는 보존된 2차 구조를 갖는다. 특히, 모티프 내의 티로신은 베타 가닥을 파단하고, 제2 베타 가닥은 모티프의 말단 아스파라긴에서 시작한다.
정의
본 발명은 특정 실시형태에 대해 그리고 특정 도면을 참조하여 설명될 것이지만 본 발명은 이것에 한정되지 않고, 청구범위에 의해서만 한정된다. 이하에 기재된 용어는 일반적으로 다르게 지시되지 않는 한 그들의 일반적인 의미로 이해될 것이다.
발명을 실시하기 위한 구체적인 내용 및 청구범위에서 "포함하다"라는 용어가 사용되는 경우, 이는 다른 요소를 배제하지 않는다. 본 발명의 목적을 위하여, "로 이루어지다"라는 용어는 "구성된다"라는 용어의 바람직한 실시형태인 것으로 간주된다. 이하에서 그룹이 적어도 특정 개수의 실시형태를 포함하는 것으로 정의되는 경우, 이것은 또한 바람직하게는 이들 실시형태만으로 이루어지는 그룹을 개시하는 것으로 이해될 것이다.
단수 명사를 언급할 때, 부정 관사 또는 정관사, 예를 들어, 하나의("a", "an") 또는 상기("the")가 사용되는 경우, 이것은 그 밖의 어떤 것이 특별히 언급되지 않는 한, 그 명사의 복수형을 포함한다.
용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 표기된 치료, 조절 등의 목적에 적합한 화합물, 조성물, 생성물 등 그 자체를 지칭함을 이해할 것이다. 용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 추가로 일 실시형태로서, 이러한 화합물, 조성물, 생성물 등이 치료, 조절 등에 사용하기 위한 것임을 개시한다.
용어 "...에 사용하기 위한 화합물, 조성물, 생성물 등", "...를 위한 의약, 약제학적 조성물, 수의학적 조성물, 진단적 조성물 등의 제조에서의 화합물, 조성물, 생성물 등의 용도", 또는 "의약으로서 사용하기 위한 화합물, 조성물, 생성물 등..."은 이러한 화합물, 조성물, 생성물 등이 인간 또는 동물 신체에서 실시될 수 있는 치료적 방법에 사용될 것임을 나타낸다. 그들은 치료 방법 등에 관한 실시형태 및 청구범위의 동등한 개시로서 간주된다. 따라서, 실시형태 또는 청구범위가 "질병을 앓는 것으로 의심되는 인간 또는 동물을 치료하는 데 사용하기 위한 화합물"을 지칭한다면, 이것은 또한 "질병을 앓는 것으로 의심되는 인간 또는 동물을 치료하기 위한 의약의 제조에서의 화합물의 용도" 또는 "질병을 앓는 것으로 의심되는 인간 또는 동물로의 화합물의 투여에 의한 치료 방법"의 개시인 것으로 간주된다. 용어 "치료, 조절 등을 위한 화합물, 조성물, 생성물 등"은 표기된 치료, 조절 등의 목적에 적합한 화합물, 조성물, 생성물 등 그 자체를 지칭함을 이해할 것이다.
기간, 값, 수 등의 하기의 예가 괄호 안에 제공된다면, 이것은 괄호 안에 언급된 예가 실시형태를 구성할 수 있다는 표시로서 이해해야 한다. 예를 들어, "실시형태들에서, 핵산 분자가 표 1의 아넬로바이러스 ORF1-인코딩 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다"고 언급된다면, 일부 실시형태는 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함하는 핵산 분자에 관한 것이다.
본원에 사용되는 바와 같이, 용어 "아넬로좀"은 단백질성 외부 내에 봉입된 유전 요소, 예를 들어, 에피솜, 예를 들어, 환형 DNA를 포함하는 비히클을 지칭한다. 본원에 사용되는 바와 같이, "합성 아넬로좀"은 일반적으로, 자연 발생이 아닌, 예를 들어, 야생형 바이러스(예를 들어, 본원에 기재된 바와 같은 야생형 아넬로바이러스)에 비하여 상이한 서열을 갖는 아넬로좀을 지칭한다. 일부 실시형태에서, 합성 아넬로좀은 엔지니어링되거나 또는 재조합이며, 예를 들어, 야생형 바이러스 게놈(예를 들어, 본원에 기재된 바와 같은 야생형 아넬로바이러스 게놈)에 비하여 차이 또는 변형을 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 단백질성 외부 내의 봉입은 단백질성 외부에 의한 100% 커버리지, 및 100% 미만, 예를 들어, 95%, 90%, 85%, 80%, 70%, 60%, 50% 또는 그 미만의 커버리지를 포함한다. 유전 요소가 예를 들어, 숙주 세포로의 유입 이전에 단백질성 외부에 보유되는 한, 예를 들어, (예를 들어, 단백질성 외부를 물, 이온, 펩티드 또는 소분자에 대해 투과 가능하게 만드는) 갭 또는 불연속부가 단백질성 외부에 존재할 수 있다. 일부 실시형태에서, 아넬로좀은 정제되며, 예를 들어, 아넬로좀은 그의 원래의 공급원으로부터 분리되고/분리되거나 다른 성분이 실질적으로 없다(50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과).
본원에 사용되는 바와 같이, 용어 "아넬로벡터"는 단백질성 외부(예를 들어, 캡시드) 내로의 패키징을 가능하게 하도록 아넬로바이러스 게놈 서열 또는 그의 인접 부분으로부터 유래되거나 이에 대하여 고도로 유사한(예를 들어, 이와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 충분한 핵산 서열을 포함하며, 이종 서열을 추가로 포함하는 벡터를 지칭한다. 일부 실시형태에서, 아넬로벡터는 바이러스 벡터 또는 네이키드(naked) 핵산이다. 일부 실시형태에서, 아넬로벡터는 고유 아넬로바이러스 서열 또는 이에 대하여 고도로 유사한(예를 들어, 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 서열의 적어도 약 50, 60, 70, 71, 72, 73, 74, 75, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2500, 3000 또는 3500개의 연속 뉴클레오티드를 포함한다. 일부 실시형태에서, 아넬로벡터는 아넬로바이러스 ORF1, ORF2 또는 ORF3 중 하나 이상을 추가로 포함한다. 일부 실시형태에서, 이종 서열은 다중 클로닝 부위를 포함하거나, 이종 프로모터를 포함하거나, 치료적 단백질에 대한 코딩 영역을 포함하거나, 치료적 핵산을 인코딩한다. 일부 실시형태에서, 캡시드는 야생형 아넬로바이러스 캡시드이다. 실시형태들에서, 아넬로벡터는 본원에 기재된 유전 요소를 포함하며, 예를 들어, 프로모터, 치료적 이펙터를 인코딩하는 서열 및 캡시드 결합 서열을 포함하는 유전 요소를 포함한다.
본원에 사용되는 바와 같이, 용어 "항체 분자"는 단백질, 예를 들어, 적어도 하나의 면역글로불린 가변 도메인 서열을 포함하는 면역글로불린 쇄 또는 그의 단편을 지칭한다. 용어 "항체 분자"는 전장 항체 및 항체 단편(예를 들어, scFv)을 포함한다. 일부 실시형태에서, 항체 분자는 다중특이적 항체 분자이며, 예를 들어, 항체 분자는 복수의 면역글로불린 가변 도메인 서열을 포함하며, 복수의 것들 중 제1 면역글로불린 가변 도메인 서열은 제1 에피토프에 대한 결합 특이성을 가지며, 복수의 것들 중 제2 면역글로불린 가변 도메인 서열은 제2 에피토프에 대한 결합 특이성을 갖는다. 실시형태들에서, 다중특이적 항체 분자는 이중특이적 항체 분자이다. 이중특이적 항체 분자는 일반적으로 제1 에피토프에 대한 결합 특이성을 갖는 제1 면역글로불린 가변 도메인 서열 및 제2 에피토프에 대한 결합 특이성을 갖는 제2 면역글로불린 가변 도메인 서열에 의해 특성화된다.
본원에 사용되는 바와 같이, "인코딩"하는 핵산은 아미노산 서열 또는 기능적 폴리뉴클레오티드(예를 들어, 비-코딩 RNA, 예를 들어, siRNA 또는 miRNA)를 인코딩하는 핵산 서열을 지칭한다.
본원에 사용되는 바와 같은 "외인성" 작용제(예를 들어, 이펙터, 핵산(예를 들어, RNA), 유전자, 페이로드, 단백질)는 상응하는 야생형 바이러스, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스에 의해 포함되지 않거나, 그에 의해 인코딩되지 않는 작용제를 지칭한다. 일부 실시형태에서, 외인성 작용제, 예컨대, 자연 발생 단백질 또는 핵산에 비하여 (예를 들어, 삽입, 결실 또는 치환에 의해) 변경된 서열을 갖는 단백질 또는 핵산은 자연적으로 존재하지 않는다. 일부 실시형태에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지 않는다. 일부 실시형태에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지만, 바이러스에 대하여 외인성이다. 일부 실시형태에서, 외인성 작용제는 숙주 세포에서 자연적으로 존재하지만, 요망되는 수준으로 또는 요망되는 시간에 존재하지 않는다.
또 다른 작용제 또는 요소(예를 들어, 이펙터, 핵산 서열, 아미노산 서열)에 관하여 본원에 사용되는 바와 같은, "이종" 작용제 또는 요소(예를 들어, 이펙터, 핵산 서열, 아미노산 서열)는 천연적으로, 예를 들어, 야생형 바이러스, 예를 들어, 아넬로바이러스에서 함께 관찰되지 않는 작용제 또는 요소를 지칭한다. 일부 실시형태에서, 이종 핵산 서열은 천연 발생 핵산 서열(예를 들어, 아넬로바이러스에서 천연적으로 발생하는 서열)과 동일한 핵산에 존재할 수 있다. 일부 실시형태에서, 이종 작용제 또는 요소는 아넬로좀의 다른(예를 들어, 나머지) 요소가 기반으로 하는 아넬로바이러스에 비하여 외인성이다.
본원에 사용되는 바와 같이, 용어 "유전 요소"는 일반적으로 아넬로좀 내의 핵산 서열을 지칭한다. 유전 요소가 네이키드 DNA로서 생성되고, 선택적으로 추가로 단백질성 외부 내로 어셈블될 수 있는 것이 이해된다. 또한, 아넬로좀은 그의 유전 요소를 세포 내로 삽입하여, 유전 요소가 세포 내에 존재하게 하고, 단백질성 외부가 반드시 세포에 유입되는 것은 아니라는 점이 이해된다.
본원에 사용되는 바와 같이, 용어 "ORF1 분자"는 아넬로바이러스 ORF1 단백질(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 단백질) 또는 그의 기능적 단편의 활성 및/또는 구조적 특징을 갖는 폴리펩티드를 지칭한다. ORF1 분자는 일부 예에서, 하기 중 하나 이상(예를 들어, 이 중 1, 2, 3 또는 4개)을 포함할 수 있다: 적어도 60%의 염기성 잔기(예를 들어, 적어도 60%의 아르기닌 잔기)를 포함하는 제1 영역, 적어도 약 6개의 베타 가닥(예를 들어, 적어도 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 베타 가닥)을 포함하는 제2 영역, 아넬로바이러스 N22 도메인(예를 들어, 본원에 기재된 바와 같음, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 N22 도메인)의 구조 또는 활성을 포함하는 제3 영역 및/또는 아넬로바이러스 C-말단 도메인(CTD)(예를 들어, 본원에 기재된 바와 같음, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 CTD)의 구조 또는 활성을 포함하는 제4 영역. 일부 예에서, ORF1 분자는 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함한다. 일부 예에서, 아넬로좀은 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함하는 ORF1 분자를 포함한다. ORF1 분자는 일부 예에서, (예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은) 아넬로바이러스 ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함할 수 있다. ORF1 분자는 일부 예에서, 이종 서열, 예를 들어, 초가변 영역(HVR), 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 HVR을 추가로 포함할 수 있다. 본원에 기재된 바와 같은, "아넬로바이러스 ORF1 단백질"은 아넬로바이러스 게놈(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 게놈)에 의해 인코딩된 ORF1 단백질, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아미노산 서열을 갖는 또는 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 ORF1 유전자에 의해 인코딩되는 ORF1 단백질을 지칭한다.
본원에 사용되는 바와 같이, 용어 "ORF2 분자"는 아넬로바이러스 ORF2 단백질(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF2 단백질)의 활성 및/또는 구조적 특징을 갖는 폴리펩티드 또는 그의 기능적 단편을 지칭한다. 본원에 사용되는 바와 같이, "아넬로바이러스 ORF2 단백질"은 아넬로바이러스 게놈(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 야생형 아넬로바이러스 게놈)에 의해 인코딩된 ORF2 단백질, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아미노산 서열을 갖는 또는 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 ORF2 유전자에 의해 인코딩된 바와 같은 ORF2 단백질을 지칭한다.
본원에 사용되는 바와 같이, 용어 "단백질성 외부"는 주로(예를 들어, 50% 초과, 60% 초과, 70% 초과, 80% 초과, 90% 초과) 단백질인 외부 구성성분을 지칭한다.
본원에 사용되는 바와 같이, 용어 "조절 핵산"은 발현 생성물을 인코딩하는 DNA 서열의 발현, 예를 들어, 전사 및/또는 번역을 변경시키는 핵산 서열을 지칭한다. 실시형태들에서, 발현 생성물은 RNA 또는 단백질을 포함한다.
본원에 사용되는 바와 같이, 용어 "조절 서열"은 표적 유전자 생성물의 전사를 변경시키는 핵산 서열을 지칭한다. 일부 실시형태에서, 조절 서열은 프로모터 또는 인핸서이다.
본원에 사용되는 바와 같이, 용어 "복제 단백질"은 감염, 바이러스 게놈 복제/발현, 바이러스 단백질 합성 및/또는 바이러스 구성성분의 어셈블리 동안 사용되는 단백질, 예를 들어, 바이러스 단백질을 지칭한다.
본원에 사용되는 바와 같이, "실질적으로 비-병원성인" 유기체, 입자 또는 성분은 예를 들어, 숙주 유기체, 예를 들어, 포유동물, 예를 들어, 인간에서 검출 가능한 질병 또는 병원성 질환을 야기하거나 유도하지 않는 유기체, 입자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로좀) 또는 그의 성분을 지칭한다. 일부 실시형태에서, 대상체로의 아넬로좀의 투여는 치료 기준의 일부로서 허용되는 부차 반응 또는 부작용을 초래할 수 있다.
본원에 사용되는 바와 같이, 용어 "비-병원성"은 숙주 유기체, 예를 들어, 포유동물, 예를 들어, 인간에서 검출 가능한 질병 또는 병원성 질환을 야기하거나 유도하지 않는 유기체 또는 그의 성분을 지칭한다.
본원에 사용되는 바와 같이, "실질적으로 비-통합성인" 유전 요소는 숙주 세포(예를 들어, 진핵 세포) 또는 유기체(예를 들어, 포유동물, 예를 들어, 인간) 내로 유입되는 유전 요소 중 약 0.01%, 0.05%, 0.1%, 0.5% 또는 1% 미만이 게놈 내로 통합되는 유전 요소, 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로좀 내의 유전 요소를 지칭한다. 일부 실시형태에서, 유전 요소는 예를 들어, 숙주 세포의 게놈 내로 검출 가능하게 통합되지 않는다. 일부 실시형태에서, 게놈 내로의 유전 요소의 통합은 본원에 기재된 바와 같은 기법, 예를 들어, 핵산 서열결정, PCR 검출 및/또는 핵산 혼성화를 사용하여 검출될 수 있다.
본원에 사용되는 바와 같이, "실질적으로 비-면역원성인" 유기체, 입자 또는 성분은 예를 들어, 숙주 조직 또는 유기체(예를 들어, 포유동물, 예를 들어, 인간)에서 요망되지 않는 또는 비표적화된 면역 반응을 야기하거나 유도하지 않는 유기체, 입자(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 바이러스 또는 아넬로좀) 또는 그의 성분을 지칭한다. 실시형태들에서, 실질적으로 비-면역원성인 유기체, 입자 또는 성분은 검출 가능한 면역 반응을 생성하지 않는다. 실시형태들에서, 실질적으로 비-면역원성인 아넬로좀은 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 나타낸 아미노산 서열을 포함하거나, 핵산 서열에 의해 인코딩되는 단백질에 대하여 검출 가능한 면역 반응을 생성하지 않는다. 실시형태들에서, 면역 반응(예를 들어, 요망되지 않는 또는 비표적화된 면역 반응)은 예를 들어, 문헌[Tsuda et al., 1999; J. Virol. Methods 77: 199-206](본원에 참조로 포함됨)에 기재된 항-TTV 항체 검출 방법 및/또는 문헌[Kakkola et al., 2008; Virology 382: 182-189](본원에 참조로 포함됨)에 기재된 항-TTV IgG 수준의 결정 방법에 따라 대상체에서 항체 존재 또는 수준(예를 들어, 항-아넬로좀 항체의 존재 또는 수준, 예를 들어, 본원에 기재된 바와 같은 아넬로좀에 대한 항체의 존재 또는 수준)을 검정함으로써 검출된다. 아넬로바이러스 또는 그에 기초한 아넬로좀에 대한 항체는 또한 항-바이러스 항체를 검출하기 위한 해당 분야의 방법, 예를 들어, 문헌[Calcedo et al., 2013; Front. Immunol. 4(341): 1-7](본원에 참조로 포함됨)에 기재된 바와 같은 예를 들어, 항-AAV 항체의 검출 방법에 의해 검출될 수 있다.
본원에 사용되는 바와 같은 "하위서열"은 각각 더 큰 핵산 서열 또는 아미노산 서열에 포함되는 핵산 서열 또는 아미노산 서열을 지칭한다. 일부 예에서, 하위서열은 더 큰 서열의 도메인 또는 기능적 단편을 포함할 수 있다. 일부 예에서, 하위서열은 더 큰 서열로부터 단리되는 경우, 더 큰 서열의 나머지와 함께 존재할 때 하위서열에 의해 형성되는 2차 및/또는 3차 구조와 유사한 2차 및/또는 3차 구조를 형성할 수 있는 더 큰 서열의 단편을 포함할 수 있다. 일부 예에서, 하위서열은 또 다른 서열(예를 들어, 외인성 서열 또는 더 큰 서열의 나머지에 대하여 이종인 서열을 포함하는 하위서열, 예를 들어, 상이한 아넬로바이러스 유래의 상응하는 하위서열)에 의해 대체될 수 있다.
본원에 사용되는 바와 같이, "치료", "치료하는" 및 그의 동족어는 질병, 병리학적 질환 또는 장애를 개선하거나, 개량하거나, 안정화시키거나, 예방하거나 치유하기 위한 의도를 갖는 대상체의 의학적 관리를 지칭한다. 이러한 용어는 적극 치료(질병, 병리학적 질환 또는 장애를 개선하고자 하는 치료), 원인 치료(관련 질병, 병리학적 질환 또는 장애의 원인을 대상으로 하는 치료), 완화 치료(증상의 경감을 위해 설계된 치료), 예방적 치료(관련 질병, 병리학적 질환 또는 장애의 예방, 최소화, 또는 이의 발생을 부분적으로 또는 완전히 억제하고자 하는 치료); 및 보완 치료(또 다른 치료법을 보완하기 위해 사용되는 치료)를 포함한다.
본원에 사용되는 바와 같이, 용어 "바이러스체"는 특정 환경, 예를 들어, 신체의 부분 내의, 예를 들어, 유기체 내의, 예를 들어, 세포 내의, 예를 들어, 조직 내의 바이러스를 지칭한다.
본 발명은 일반적으로 아넬로좀, 예를 들어, 합성 아넬로좀 및 그의 용도에 관한 것이다. 본 개시내용은 아넬로좀, 아넬로좀을 포함하는 조성물, 및 아넬로좀의 제조 또는 이용 방법을 제공한다. 아넬로좀은 일반적으로 예를 들어, 치료제를 진핵 세포로 운반하기 위한 운반 비히클로서 유용하다. 일반적으로, 아넬로좀은 단백질성 외부 내에 봉입된 (예를 들어, 이펙터, 예를 들어, 외인성 이펙터 또는 내인성 이펙터를 인코딩하는) 핵산 서열을 포함하는 유전 요소를 포함할 것이다. 아넬로좀은 (예를 들어, 본원에 기재된 바와 같은) 아넬로바이러스 서열에 비한 서열(예를 들어, 본원에 기재된 바와 같은 영역 또는 도메인)의 하나 이상의 결실을 포함할 수 있다. 아넬로좀은 예를 들어, 세포를 포함하는 대상체에서 질병 또는 장애를 치료하기 위하여, 유전 요소 또는 그 내에 인코딩된 이펙터(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 폴리펩티드 또는 핵산 이펙터)를 진핵 세포 내로 운반하기 위한 실질적으로 비-면역원성인 비히클로서 사용될 수 있다.
목차
I. 아넬로좀
A. 아넬로바이러스
B. ORF1 분자
C. ORF2 분자
D. 유전 요소
E. 단백질 결합 서열
F. 5' UTR 영역
G. GC-풍부 영역
H. 이펙터
I. 단백질성 외부
II. 벡터
III. 조성물
IV. 숙주 세포
V. 이용 방법
VI. 생성 방법
VII. 투여/운반
I. 아넬로좀
일부 양태에서, 본원에 기재된 본 발명은 아넬로좀을 이용 및 제조하는 조성물 및 방법, 아넬로좀 제제 및 치료적 조성물을 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로바이러스(예를 들어, 본원에 기재된 바와 같은 아넬로바이러스, 예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5, 1 내지 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은 서열을 포함하는 핵산 또는 폴리펩티드를 포함하는 아넬로바이러스) 또는 그의 단편 또는 부분, 또는 다른 실질적으로 비병원성인 바이러스, 예를 들어, 상리공생 바이러스(symbiotic virus), 편리공생 바이러스(commensal virus), 고유 바이러스에 기초한 서열, 구조 및/또는 기능을 갖는다. 일부 실시형태에서, 아넬로바이러스-기반의 아넬로좀은 아넬로바이러스에 대하여 외인성인 적어도 하나의 요소, 예를 들어, 외인성 이펙터 또는 아넬로좀의 유전 요소 내에 배치된 외인성 이펙터를 인코딩하는 핵산 서열을 포함한다. 일부 실시형태에서, 아넬로바이러스-기반의 아넬로좀은 아넬로바이러스 유래의 또 다른 요소에 대하여 이종인 적어도 하나의 요소, 예를 들어, 또 다른 연결된 핵산 서열, 예컨대 프로모터 요소에 대하여 이종인 이펙터-인코딩 핵산 서열을 포함한다. 일부 실시형태에서, 아넬로좀은 유전 요소의 나머지 및/또는 단백질성 외부에 비하여 이종인 적어도 하나의 요소(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 이펙터를 인코딩하는 외인성 요소)를 포함하는 유전 요소(예를 들어, 환형 DNA, 예를 들어, 단일 가닥 DNA)를 포함한다. 아넬로좀은 페이로드를 위한 숙주, 예를 들어, 인간 내로의 운반 비히클(예를 들어, 실질적으로 비병원성 운반 비히클)일 수 있다. 일부 실시형태에서, 아넬로좀은 진핵 세포, 예를 들어, 포유동물 세포, 예를 들어, 인간 세포에서 복제 가능하다. 일부 실시형태에서, 아넬로좀은 포유동물(예를 들어, 인간) 세포에서 실질적으로 비병원성 및/또는 실질적으로 비통합성이다. 일부 실시형태에서, 아넬로좀은 포유동물, 예를 들어, 인간에서 실질적으로 비-면역원성이다. 일부 실시형태에서, 아넬로좀은 복제-결핍이다. 일부 실시형태에서, 아넬로좀은 복제-적격이다.
일부 실시형태에서, 아넬로좀은 예를 들어, 본원에 그의 전체가 참조로 포함되는 PCT 출원 제PCT/US2018/037379호에 기재된 바와 같은, 큐론 또는 그의 구성성분(예를 들어, 이펙터를 인코딩하는 서열, 및/또는 단백질성 외부를 포함하는, 예를 들어, 유전 요소)을 포함한다.
일 양태에서, 본 발명은 (i) 프로모터 요소, 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 페이로드)를 인코딩하는 서열 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열, 예를 들어, 패키징 신호)을 포함하는 유전 요소로서, 유전 요소가 단일-가닥 DNA이며, 하기의 특성 중 하나 또는 둘 모두를 갖는 유전 요소: 환형이고/환형이거나 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 진핵 세포의 게놈 내로 통합됨; 및 (ii) 단백질성 외부를 포함하는 아넬로좀을 포함하며; 유전 요소는 단백질성 외부 내에 봉입되며; 아넬로좀은 유전 요소를 진핵 세포 내로 운반할 수 있다.
본원에 기재된 아넬로좀의 일부 실시형태에서, 유전 요소는 세포에 유입되는 유전 요소의 약 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 1.5% 또는 2% 미만의 빈도로 통합된다. 일부 실시형태에서, 대상체에 투여되는 복수의 아넬로좀으로부터 약 0.01%, 0.05%, 0.1%, 0.5%, 1%, 2%, 3%, 4% 또는 5% 미만의 유전 요소는 대상체 내의 하나 이상의 숙주 세포의 게놈 내로 통합될 것이다. 일부 실시형태에서, 예를 들어, 본원에 기재된 바와 같은 아넬로좀의 집단의 유전 요소는 유사한 AAV 바이러스의 집단의 것보다 더 낮은 빈도로, 예를 들어, 유사한 AAV 바이러스의 집단보다 약 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 100% 이상 더 낮은 빈도로 숙주 세포의 게놈 내로 통합된다.
일 양태에서, 본 발명은 (i) 프로모터 요소 및 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 페이로드)를 인코딩하는 서열, 및 단백질 결합 서열(예를 들어, 외부 단백질 결합 서열)을 포함하는 유전 요소로서, 유전 요소가 야생형 아넬로바이러스 서열(예를 들어, 야생형 토르크 테노 바이러스(TTV), 토르크 테노 미니 바이러스(TTMV) 또는 TTMDV 서열, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 야생형 아넬로바이러스 서열)에 대하여 적어도 75%(예를 들어, 적어도 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖는 유전 요소; 및 (ii) 단백질성 외부를 포함하는 아넬로좀을 포함하며; 유전 요소는 단백질성 외부 내에 봉입되며; 아넬로좀은 유전 요소를 진핵 세포 내로 운반할 수 있다.
일 양태에서, 본 발명은
a) (i) 외부 단백질(예를 들어, 비-병원성 외부 단백질)을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 인코딩하는 서열을 포함하는 유전 요소; 및
b) 유전 요소와 회합된, 예를 들어, 이를 둘러싸거나 봉입하는 단백질성 외부를 포함하는 아넬로좀을 포함한다.
일부 실시형태에서, 아넬로좀은 비-외피, 환형, 단일-가닥 DNA 바이러스로부터의(또는 이와 70% 초과, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 100%의 상동성을 갖는) 서열 또는 발현 생성물을 포함한다. 동물 환형 단일-가닥 DNA 바이러스는 일반적으로 진핵 비-식물 숙주를 감염시키고, 환형 게놈을 갖는 단일 가닥 DNA(ssDNA) 바이러스의 하위군을 지칭한다. 따라서, 동물 환형 ssDNA 바이러스는 원핵생물을 감염시키는 ssDNA 바이러스(즉, 마이크로바이러스과 및 이노바이러스과) 및 식물을 감염시키는 ssDNA 바이러스(즉, 제미니바이러스과 및 나노바이러스과)와 구별 가능하다. 그들은 또한 비-식물 진핵생물을 감염시키는 선형 ssDNA 바이러스(즉, 파보바이러스과)와 구별 가능하다.
일부 실시형태에서, 아넬로좀은 숙주 세포 기능을 예를 들어, 일시적으로 또는 장기간 조절한다. 특정 실시형태에서, 세포 기능은 안정하게 변경되며, 예컨대 조절은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 60일 이상 또는 그 사이의 임의의 시간 동안 지속된다. 특정 실시형태에서, 세포 기능은 일시적으로 변경되며, 예를 들어, 예컨대 조절은 약 30분 이하 내지 약 7일 또는 약 1시간 이하, 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 11시간, 12시간, 13시간, 14시간, 15시간, 16시간, 17시간, 18시간, 19시간, 20시간, 21시간, 22시간, 24시간, 36시간, 48시간, 60시간, 72시간, 4일, 5일, 6일, 7일 또는 그 사이의 임의의 시간 동안 지속된다.
일부 실시형태에서, 유전 요소는 프로모터 요소를 포함한다. 실시형태들에서, 프로모터 요소는 RNA 중합효소 II-의존성 프로모터, RNA 중합효소 III-의존성 프로모터, PGK 프로모터, CMV 프로모터, EF-1α 프로모터, SV40 프로모터, CAGG 프로모터 또는 UBC 프로모터, TTV 바이러스 프로모터, 조직 특이적, U6(pollIII), 활성화 단백질(TetR-VP16, Gal4-VP16, dCas9-VP16 등)에 대한 상류 DNA 결합 부위가 있는 최소 CMV 프로모터로부터 선택된다. 실시형태들에서, 프로모터 요소는 TATA 박스를 포함한다. 실시형태들에서, 프로모터 요소는 예를 들어, 본원에 기재된 바와 같은 야생형 아넬로바이러스에 대하여 내인성이다.
일부 실시형태에서, 유전 요소는 하기의 특징 중 하나 이상을 포함한다: 단일-가닥, 환형, 음성 가닥 및/또는 DNA. 실시형태들에서, 유전 요소는 에피솜을 포함한다. 일부 실시형태에서, 이펙터를 배제한 유전 요소의 부분은 약 2.5 내지 5 kb(예를 들어, 약 2.8 내지 4kb, 약 2.8 내지 3.2kb, 약 3.6 내지 3.9kb 또는 약 2.8 내지 2.9kb), 약 5kb 미만(예를 들어, 약 2.9kb, 3.2 kb, 3.6kb, 3.9kb 또는 4kb 미만) 또는 적어도 100개의 뉴클레오티드(예를 들어, 적어도 1kb)의 조합된 크기를 갖는다.
본원에 기재된 바와 같은 아넬로좀, 아넬로좀을 포함하는 조성물, 이러한 아넬로좀의 사용 방법 등은 일부 예에서 부분적으로, 상이한 이펙터, 예를 들어, (예를 들어, IFN 또는 miR-625에 대한) miRNA, shRNA 등 및 단백질 결합 서열, 예를 들어, 캡시드 단백질, 예컨대 Q99153에 결합하는 DNA 서열을 단백질성 외부, 예를 들어, 문헌[Arch Virol (2007) 152: 1961-1975]에 개시된 캡시드와 조합하여, 이어서 이펙터를 세포(예를 들어, 동물 세포, 예를 들어, 인간 세포 또는 비-인간 동물 세포, 예컨대 돼지 또는 마우스 세포)로 운반하는 데 사용될 수 있는 아넬로좀을 생성하는 방법을 예시하는 실시예에 기초한다. 실시형태들에서, 이펙터는 인터페론과 같은 인자의 발현을 침묵화시킬 수 있다. 실시예에는 이펙터를 예를 들어, 아넬로바이러스로부터 유래된 서열 내로 삽입함으로써 아넬로좀이 제조될 수 있는 방법이 추가로 기재된다. 이들 실시예에 기초하여 이하의 설명은 실시예에서 고려되는 특정 발견 및 조합의 다양한 변형을 고려한다. 예를 들어, 당업자는 특정 miRNA가 단지 이펙터의 예로서 사용되며, 다른 이펙터가 예를 들어, 다른 조절 핵산 또는 치료적 펩티드일 수 있음을 실시예로부터 이해할 것이다. 유사하게, 실시예에 사용되는 특정 캡시드는 하기 기재되는 실질적으로 비-병원성인 단백질에 의해 대체될 수 있다. 실시예에 기재된 특정 아넬로바이러스 서열은 또한 하기 기재되는 아넬로바이러스 서열에 의해 대체될 수 있다. 이들 고려사항은 단백질 결합 서열, 조절 서열, 예컨대 프로모터 등에 유사하게 적용된다. 그와 독립적으로, 당업자는 특히 실시예와 밀접하게 관련이 있는 실시형태를 고려할 것이다.
일부 실시형태에서, 아넬로좀 또는 아넬로좀에 포함되는 유전 요소는 세포(예를 들어, 인간 세포) 내로 도입된다. 일부 실시형태에서, 예를 들어, 일단 아넬로좀 또는 유전 요소가 세포 내로 도입되면, 예를 들어, 아넬로좀의 유전 요소에 의해 인코딩되는 이펙터(예를 들어, RNA, 예를 들어, miRNA)는 세포(예를 들어, 인간 세포)에서 발현된다. 실시형태들에서, 세포 내로의 아넬로좀 또는 거기에 포함된 유전 요소의 도입은 예를 들어, 세포에 의한 표적 분자의 발현 수준을 변경시킴으로써 세포에서 표적 분자(예를 들어, 표적 핵산, 예를 들어, RNA 또는 표적 폴리펩티드)의 수준을 조절한다(예를 들어, 증가시키거나 감소시킨다). 실시형태들에서, 아넬로좀 또는 거기에 포함된 유전 요소의 도입은 세포에 의해 생성되는 인터페론의 수준을 감소시킨다. 실시형태들에서, 세포 내로의 아넬로좀 또는 거기에 포함된 유전 요소의 도입은 세포의 기능을 조절한다(예를 들어, 증가시키거나 감소시킨다). 실시형태들에서, 세포 내로의 아넬로좀 또는 거기에 포함된 유전 요소의 도입은 세포의 생존력을 조절한다(예를 들어, 증가시키거나 감소시킨다). 실시형태들에서, 세포 내로의 아넬로좀 또는 거기에 포함된 유전 요소의 도입은 세포(예를 들어, 암 세포)의 생존력을 감소시킨다.
일부 실시형태에서, 본원에 기재된 아넬로좀(예를 들어, 합성 아넬로좀)은 70% 미만의 항체 출현율(예를 들어, 약 60%, 50%, 40%, 30%, 20% 또는 10% 미만의 항체 출현율)을 유도한다. 실시형태들에서, 항체 출현율은 해당 분야에 공지된 방법에 따라 결정된다. 실시형태들에서, 항체 출현율은 예를 들어, 문헌[Tsuda et al., 1999; J. Virol. Methods 77: 199-206](본원에 참조로 포함됨)에 기재된 항-TTV 항체 검출 방법 및/또는 문헌[Kakkola et al., 2008; Virology 382: 182-189](본원에 참조로 포함됨)에 기재된 항-TTV IgG 혈청학적 출현율의 결정 방법에 따라 생물학적 시료에서 아넬로바이러스(예를 들어, 본원에 기재된 바와 같음) 또는 그에 기초한 아넬로좀에 대한 항체를 검출함으로써 결정된다. 아넬로바이러스 또는 그에 기초한 아넬로좀에 대한 항체는 또한 항-바이러스 항체를 검출하기 위한 해당 분야의 방법, 예를 들어, 문헌[Calcedo et al., 2013; Front. Immunol. 4(341): 1-7](본원에 참조로 포함됨)에 기재된 바와 같은 예를 들어, 항-AAV 항체의 검출 방법에 의해 검출될 수 있다.
일부 실시형태에서, 복제 결핍, 복제 결함 또는 복제 비적격 유전 요소는 유전 요소의 복제에 필요한 필수 기구 또는 구성성분의 전부를 인코딩하지 않는다. 일부 실시형태에서, 복제 결함 유전 요소는 복제 인자를 인코딩하지 않는다. 일부 실시형태에서, 복제 결함 유전 요소는 하나 이상의 ORF(예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, 및/또는 ORF2t/3)를 인코딩하지 않는다. 일부 실시형태에서, 유전 요소에 의해 인코딩되지 않는 기구 또는 구성성분은 (예를 들어, 헬퍼, 예를 들어, 헬퍼 바이러스 또는 헬퍼 플라스미드를 사용하여, 또는 숙주 세포에 의해 포함되는, 예를 들어, 숙주 세포의 게놈 내로 통합되는 핵산에 인코딩되어) 트랜스로 제공되어, 예를 들어, 유전 요소가 트랜스로 제공되는 기구 또는 구성성분의 존재 하에 복제를 겪을 수 있게 할 수 있다.
일부 실시형태에서, 패키징 결핍, 패키징 결함 또는 패키징 비적격 유전 요소는 단백질성 외부(예를 들어, 단백질성 외부는 예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는, 캡시드 또는 그의 부분을 포함함) 내에 패키징될 수 없다. 일부 실시형태에서, 패키징 결핍 유전 요소는 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 10% 미만(예를 들어, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.01% 또는 0.001% 미만)의 효율로 단백질성 외부 내로 패키징된다. 일부 실시형태에서, 패키징 결함 유전 요소는 심지어 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서도 단백질성 외부 내에 패키징될 수 없다. 일부 실시형태에서, 패키징 결핍 유전 요소는 심지어 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서도, (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 10% 미만(예를 들어, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.01% 또는 0.001% 미만)의 효율로 단백질성 외부 내로 패키징된다.
일부 실시형태에서, 패키징 적격 유전 요소는 단백질성 외부(예를 들어, 단백질성 외부는 예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF1 핵산에 의해 인코딩된 폴리펩티드를 포함하는, 캡시드 또는 그의 부분을 포함함) 내로 패키징될 수 있다. 일부 실시형태에서, 패키징 적격 유전 요소는 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 적어도 20%(예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 이상)의 효율로 단백질성 외부 내에 패키징된다. 일부 실시형태에서, 패키징 적격 유전 요소는 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서, 단백질성 외부 내로 패키징될 수 있다. 일부 실시형태에서, 패키징 적격 유전 요소는 (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스의 유전 요소의 패키징을 허용할 인자(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3)의 존재 하에서, (예를 들어, 본원에 기재된 바와 같은) 야생형 아넬로바이러스에 비하여 적어도 20%(예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 이상)의 효율로 단백질성 외부 내로 패키징된다.
아넬로바이러스
일부 실시형태에서, 예를 들어, 본원에 기재된 바와 같은 아넬로좀은 아넬로바이러스로부터 유래된 서열 또는 발현 생성물을 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로바이러스에 비하여 외인성인 하나 이상의 서열 또는 발현 생성물을 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로바이러스에 비하여 내인성인 하나 이상의 서열 또는 발현 생성물을 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로좀 내의 하나 이상의 다른 서열 또는 발현 생성물에 비하여 이종인 하나 이상의 서열 또는 발현 생성물을 포함한다. 아넬로바이러스는 일반적으로 음의 극성을 갖는 단일-가닥 환형 DNA 게놈을 갖는다. 아넬로바이러스는 일반적으로 임의의 인간 질병과 연관된 바 없다. 그러나, 아넬로바이러스 감염을 인간 질병과 연관시키려는 시도는 대조군 코호트 집단(들)에서의 무증상 아넬로바이러스 바이러스혈증의 높은 유병률, 아넬로바이러스 과 내의 현저한 게놈 다양성, 종래에 시험관 내에서 작용제를 전파할 수 없음, 아넬로바이러스 질병의 동물 모델(들)의 결여에 의해 혼동되었다(문헌[Yzebe et al., Panminerva Med. (2002) 44:167-177]; 문헌[Biagini, P., Vet. Microbiol. (2004) 98:95-101]).
아넬로바이러스는 일반적으로 구비강 또는 배변-구강 감염, 모에서 유아로의 전염 및/또는 자궁 내의 전염에 의해 전염된다(문헌[Gerner et al., Ped. Infect. Dis. J. (2000) 19:1074-1077]). 감염된 사람은 일부 예에서, 장기의(수개월 내지 수년) 아넬로바이러스 바이러스혈증이라는 특징이 나타날 수 있다. 인간은 한가지 초과의 유전자군 또는 바이러스주로 동시-감염될 수 있다(문헌[Saback, et al., Scad. J. Infect. Dis. (2001) 33:121-125]). 이들 유전자군이 감염된 인간 내에서 재조합될 수 있다는 제안이 존재한다(문헌[Rey et al., Infect. (2003) 31:226-233]). 이중 가닥 아이소폼(복제성) 중간체는 몇몇의 조직, 예컨대 간, 말초 혈액 단핵 세포 및 골수에서 관찰된 바 있다(문헌[Kikuchi et al., J. Med. Virol. (2000) 61:165-170]; 문헌[Okamoto et al., Biochem. Biophys. Res. Commun. (2002) 270:657-662]; 문헌[Rodriguez-lnigo et al., Am. J. Pathol. (2000) 156:1227-1234]).
일부 실시형태에서, 유전 요소는 아미노산 서열 또는 그의 기능적 단편, 또는 본원에 기재된 아미노산 서열, 예를 들어, 아넬로바이러스 아미노산 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 인코딩하는 뉴클레오티드 서열을 포함한다.
일부 실시형태에서, 본원에 기재된 바와 같은 아넬로좀은 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 서열 또는 그의 단편에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본원에 기재된 바와 같은 유전 요소)를 포함한다. 실시형태들에서, 아넬로좀은 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 나타낸 바와 같은 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열로부터 선택되는 핵산 서열을 포함한다. 실시형태들에서, 아넬로좀은 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 폴리펩티드를 포함한다.
일부 실시형태에서, 본원에 기재된 바와 같은 아넬로좀은 본원에 기재된 아넬로바이러스(예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 중 어느 하나에 주석이 달리거나, 그에 열거된 서열에 의해 인코딩되는 바와 같은 아넬로바이러스 서열) 중 어느 하나의 TATA 박스, 캡 부위, 개시인자 요소, 전사 시작 부위, 5' UTR 보존된 도메인, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, 3개의 오픈-리딩 프레임 영역, 폴리(A) 신호, GC-풍부 영역 중 하나 이상 또는 그의 임의의 조합에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는 하나 이상의 핵산 분자(예를 들어, 본원에 기재된 바와 같은 유전 요소)를 포함한다. 일부 실시형태에서, 핵산 분자는 캡시드 단백질을 인코딩하는 서열, 예를 들어, 본원에 기재된 아넬로바이러스(예를 들어, 표 A1 내지 A12 또는 1 내지 18 중 어느 하나에 주석이 달리거나, 그에 열거된 서열에 의해 인코딩되는 바와 같은 아넬로바이러스 서열) 중 어느 하나의 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 서열을 포함한다. 실시형태들에서, 핵산 분자는 아넬로바이러스 ORF1 또는 ORF2 단백질(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은 ORF1 또는 ORF2 아미노산 서열, 또는 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 나타낸 바와 같은 핵산 서열에 의해 인코딩되는 ORF1 또는 ORF2 아미노산 서열)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질을 인코딩하는 서열을 포함한다. 실시형태들에서, 핵산 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은 ORF1 아미노산 서열 또는 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 나타낸 바와 같은 핵산 서열에 의해 인코딩되는 ORF1 아미노산 서열)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질을 인코딩하는 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 599 내지 2887)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 599 내지 724 및/또는 2414 내지 2887)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 599 내지 724 및/또는 2643 내지 2849)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 342 내지 728)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 342 내지 724 및/또는 2414 내지 2849)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 342 내지 724 및/또는 2643 내지 3057)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 87 내지 91)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 105 내지 120)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 175 내지 245)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 2626 내지 2846)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A3의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 3052 내지 3058)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 556 내지 2904)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 556 내지 687 및/또는 2422 내지 2904)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 556 내지 687 및/또는 2564 내지 2878)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 305 내지 691)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 305 내지 687 및/또는 2422 내지 2878)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 305 내지 687 및/또는 2564 내지 3317)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 305 내지 360 및/또는 2564 내지 3317)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 50 내지 55)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 68 내지 83)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 78)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 138 내지 208)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 2626 내지 2846)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A5의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 3316 내지 3319)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 589 내지 2889)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 589 내지 711 및/또는 2362 내지 2889)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 589 내지 711 및/또는 2555 내지 2863)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 353 내지 715)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 353 내지 711 및/또는 2362 내지 2863)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 353 내지 711 및/또는 2555 내지 3065)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 353 내지 432 및/또는 2555 내지 3065)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 86 내지 90)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 104 내지 119)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 2555 내지 2863)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 3062 내지 3066)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 3720 내지 3742)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 511 내지 2793)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 511 내지 711 및/또는 2326 내지 2793)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 511 내지 711 및/또는 2525 내지 2767)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 272 내지 637)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 272 내지 633 및/또는 2326 내지 2767)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 272 내지 633 및/또는 2525 내지 2984)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 272 내지 633 및/또는 2525 내지 2984)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 12 내지 17)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 30 내지 45)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 40)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 100 내지 171)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 2525 내지 2767)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A9의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 2981 내지 2985)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 704 내지 3001)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 704 내지 826 및/또는 2534 내지 3001)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 704 내지 826 및/또는 2721 내지 2975)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 465 내지 830)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 465 내지 826 및/또는 2534 내지 2975)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 465 내지 826 및/또는 2721 내지 3192)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 465 내지 595 및/또는 2721 내지 3192)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 206 내지 210)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 224 내지 239)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 234)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 294 내지 364)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 2721 내지 2975)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 3189 내지 3193)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A11의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 3844 내지 3895)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B2의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B4의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 574 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2326 내지 2775)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 574 내지 699 및/또는 2552 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 335 내지 703)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2326 내지 2759)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 335 내지 699 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 335 내지 465 및/또는 2552 내지 2957)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 77 내지 81)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 95 내지 110)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 105)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 2535 내지 2746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 2953 내지 2958)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 B5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 571 내지 587 및/또는 2137 내지 2613)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 571 내지 687 및/또는 2339 내지 2659)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 299 내지 691)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 299 내지 687 및/또는 2137 내지 2659)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 299 내지 687 및/또는 2339 내지 2831)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 299 내지 348 및/또는 2339 내지 2831)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 84 내지 90)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 캡 부위 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 107 내지 114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 177 내지 247)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 2325 내지 2610)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 2813 내지 2818)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 3415 내지 3570)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 729 내지 2972)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 729 내지 908 및/또는 2490 내지 2972)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 729 내지 908 및/또는 2725 내지 3039)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 412 내지 912)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 412 내지 908 및/또는 2490 내지 3039)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 412 내지 908 및/또는 2725 내지 3208)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 112 내지 119)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 128 내지 148)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 148)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 204 내지 273)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 2699 내지 2969)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 3220 내지 3225)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 599 내지 2830)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 599 내지 715 및/또는 2363 내지 2830)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 599 내지 715 및/또는 2565 내지 2789)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 336 내지 719)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 336 내지 715 및/또는 2363 내지 2789)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 336 내지 715 및/또는 2565 내지 3015)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 336 내지 388 및/또는 2565 내지 3015)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 83 내지 88)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 캡 부위 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 104 내지 111)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 111)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 2551 내지 2786)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 3011 내지 3016)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 3632 내지 3753)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 586 내지 2928)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 586 내지 717 및/또는 2446 내지 2928)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 586 내지 717 및/또는 2675 내지 2902)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 335 내지 721)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 335 내지 717 및/또는 2446 내지 2902)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 335 내지 717 및/또는 2675 내지 3109)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 82 내지 87)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 95 내지 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 170 내지 238)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 2640 내지 2899)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 3106 내지 3114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 3768 내지 3878)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 588 내지 2873)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 588 내지 722 및/또는 2412 내지 2873)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 588 내지 722 및/또는 2638 내지 2847)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 331 내지 726)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 331 내지 722 및/또는 2412 내지 2847)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 331 내지 722 및/또는 2638 내지 3058)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 331 내지 380 및/또는 2638 내지 3058)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 82 내지 86)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 100 내지 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 2699 내지 2969)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 3220 내지 3225)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 9의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 599 내지 2839)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 599 내지 727 및/또는 2381 내지 2839)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 599 내지 727 및/또는 2619 내지 2813)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 357 내지 731)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 357 내지 727 및/또는 2381 내지 2813)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 357 내지 727 및/또는 2619 내지 3021)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 ORF2t/3 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 357 내지 406 및/또는 2619 내지 3021)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 89 내지 90)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 캡 부위 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 107 내지 114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 114)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 2596 내지 2810)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 3017 내지 3022)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 11의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 3691 내지 3794)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 599 내지 2896)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 599 내지 724 및/또는 2411 내지 2896)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 599 내지 724 및/또는 2646 내지 2870)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 357 내지 728)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 357 내지 724 및/또는 2411 내지 2870)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 357 내지 724 및/또는 2646 내지 3081)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 82 내지 86)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 개시인자 요소 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 94 내지 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 115)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 2629 내지 2867)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 3076 내지 3086)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 13의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 3759 내지 3866)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 612 내지 2612)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 612 내지 719 및/또는 2274 내지 2612)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 612 내지 719 및/또는 2449 내지 2589)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 424 내지 723)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 424 내지 719 및/또는 2274 내지 2589)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 424 내지 719 및/또는 2449 내지 2812)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 237 내지 243)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 캡 부위 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 260 내지 267)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 267)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 323 내지 393)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 2441 내지 2586)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 2808 내지 2813)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 15의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 2868 내지 2929)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF1 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 432 내지 2453)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF1/1 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 432 내지 584 및/또는 1977 내지 2453)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF1/2 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 432 내지 584 및/또는 2197 내지 2388)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF2 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 283 내지 588)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF2/2 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 283 내지 584 및/또는 1977 내지 2388)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 ORF2/3 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 283 내지 584 및/또는 2197 내지 2614)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 TATA 박스 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 21 내지 25)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 캡 부위 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 42 내지 49)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 전사 시작 부위 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 49)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 117 내지 187)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 3개의 오픈-리딩 프레임 영역 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 2186 내지 2385)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 폴리(A) 신호 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 2676 내지 2681)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 17의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 3054 내지 3172)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A2의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A6의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A8의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A10의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 A12의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C1의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C2의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C3의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C4의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 C5의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 2의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 6의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 8의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 10의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 12의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 14의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 16의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다. 실시형태들에서, 핵산 분자는 표 18의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 서열을 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A2의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A1의 핵산 서열의 뉴클레오티드 574 내지 2775의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A2의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A3의 핵산 서열의 뉴클레오티드 599 내지 2887의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A4의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A6의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A5의 핵산 서열의 뉴클레오티드 556 내지 2904의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A6의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A8의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A7의 핵산 서열의 뉴클레오티드 589 내지 2889의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A8의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A10의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A9의 핵산 서열의 뉴클레오티드 511 내지 2793의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A10의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 A12의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A11의 핵산 서열의 뉴클레오티드 704 내지 3001의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 A12의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C1의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 B1의 핵산 서열의 뉴클레오티드 512 내지 2545의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 C1의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C2의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 B2의 핵산 서열의 뉴클레오티드 501 내지 2489의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 C2의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C3의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 B3의 핵산 서열의 뉴클레오티드 572 내지 2758의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 C3의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C4의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 B4의 핵산 서열의 뉴클레오티드 581 내지 2884의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 C4의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 C5의 아넬로바이러스 TAIP 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 B5의 핵산 서열의 뉴클레오티드 614 내지 2911의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 C5의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 2의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 1의 핵산 서열의 뉴클레오티드 571 내지 2613의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 2의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 4의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 3의 핵산 서열의 뉴클레오티드 729 내지 2972의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 4의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 6의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 5의 핵산 서열의 뉴클레오티드 599 내지 2830의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 6의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 8의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 7의 핵산 서열의 뉴클레오티드 586 내지 2928의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 8의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 10의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 9의 핵산 서열의 뉴클레오티드 588 내지 2873의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 10의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 12의 아넬로바이러스 ORF2t/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 11의 핵산 서열의 뉴클레오티드 599 내지 2839의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 12의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 14의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 13의 핵산 서열의 뉴클레오티드 599 내지 2896의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 14의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 16의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 15의 핵산 서열의 뉴클레오티드 612 내지 2612의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 16의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF1/1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF1/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF2/2 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 실시형태들에서, 본원에 기재된 아넬로좀은 표 18의 아넬로바이러스 ORF2/3 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질을 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 17의 핵산 서열의 뉴클레오티드 432 내지 2453의 아넬로바이러스 ORF1 핵산 서열에 의해 인코딩되는 폴리펩티드를 포함한다. 일부 실시형태에서, (예를 들어, 아넬로좀에 포함되는) ORF1 분자는 표 18의 아넬로바이러스 ORF1 단백질 또는 그의 스플라이스 변이체 또는 번역후 가공된(예를 들어, 단백질 가수분해적으로 가공된) 변이체를 포함한다.
일부 실시형태에서, 본원에 기재된 폴리펩티드는 본원에 기재된 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 14의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 16의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 18의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A6의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A8의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A10의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A12의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 C1의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 C2의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 C3의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 C4의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 C5의 아넬로바이러스 ORF1 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, 본원에 기재된 폴리펩티드는 본원에 기재된 아넬로바이러스 ORF1 핵산에 의해 인코딩되는 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 1에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 3에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 5에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 7에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 9에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 11에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 13에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 15에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 17에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A1에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A3에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A5에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A7에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A9에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 A11에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 B1에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 B2에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 B3에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 B4에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 본원에 기재된 폴리펩티드는 표 B5에 열거된 바와 같은 아넬로바이러스 ORF1 핵산에 의해 인코딩된 ORF1 분자에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, 폴리펩티드는 표 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 나타낸 바와 같은 아미노산 서열(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3 서열) 또는 이에 대하여 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
[표 A1] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00001
Figure pct00002
Figure pct00003
[표 A2] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00004
Figure pct00005
Figure pct00006
[표 A3] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00007
Figure pct00008
Figure pct00009
[표 A4] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00010
Figure pct00011
[표 A5] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00012
Figure pct00013
Figure pct00014
[표 A6] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00015
Figure pct00016
Figure pct00017
[표 A7] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00018
Figure pct00019
Figure pct00020
[표 A8] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00021
Figure pct00022
Figure pct00023
[표 A9] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00024
Figure pct00025
Figure pct00026
[표 A10] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00027
Figure pct00028
[표 A11] 신규한 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ))
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
[표 A12] 신규한 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00033
Figure pct00034
[표 1] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 1)
Figure pct00035
Figure pct00036
Figure pct00037
[표 2] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 1)
Figure pct00038
Figure pct00039
[표 3] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 2)
Figure pct00040
Figure pct00041
Figure pct00042
[표 4] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 2)
Figure pct00043
Figure pct00044
Figure pct00045
[표 5] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 3)
Figure pct00046
Figure pct00047
Figure pct00048
[표 6] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 3)
Figure pct00049
Figure pct00050
[표 7] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00051
Figure pct00052
Figure pct00053
[표 8] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00054
Figure pct00055
Figure pct00056
[표 9] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00057
Figure pct00058
Figure pct00059
[표 10] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00060
Figure pct00061
[표 11] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00062
Figure pct00063
Figure pct00064
[표 12] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00065
Figure pct00066
[표 13] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 7)
Figure pct00067
Figure pct00068
Figure pct00069
[표 14] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 7)
Figure pct00070
Figure pct00071
[표 15] 예시적인 아넬로바이러스 핵산 서열(베타토르크바이러스( Betatorquevirus ))
Figure pct00072
Figure pct00073
[표 16] 예시적인 아넬로바이러스 아미노산 서열(베타토르크바이러스( Betatorquevirus ))
Figure pct00074
[표 17] 예시적인 아넬로바이러스 핵산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00075
Figure pct00076
Figure pct00077
[표 18] 예시적인 아넬로바이러스 아미노산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00078
Figure pct00079
[표 B1] 예시적인 아넬로바이러스 핵산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00080
Figure pct00081
Figure pct00082
[표 C1] 예시적인 아넬로바이러스 아미노산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00083
Figure pct00084
[표 B2] 예시적인 아넬로바이러스 핵산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00085
Figure pct00086
[표 C2] 예시적인 아넬로바이러스 아미노산 서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00087
Figure pct00088
[표 B3] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus ) - 클레이드 1
Figure pct00089
Figure pct00090
Figure pct00091
[표 C3] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ) 클레이드 1
Figure pct00092
Figure pct00093
Figure pct00094
[표 B4] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus )) 클레이드 3
Figure pct00095
Figure pct00096
Figure pct00097
[표 C4] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus ) - 클레이드 3
Figure pct00098
Figure pct00099
[표 B5] 예시적인 아넬로바이러스 핵산 서열(알파토르크바이러스( Alphatorquevirus )) 클레이드 7
Figure pct00100
Figure pct00101
Figure pct00102
[표 C5] 예시적인 아넬로바이러스 아미노산 서열(알파토르크바이러스( Alphatorquevirus )) 클레이드 7
Figure pct00103
Figure pct00104
일부 실시형태에서, 아넬로좀은 본원에 그의 전체가 참조로 포함되는 PCT 출원 제PCT/US2018/037379호에 열거된 서열을 포함하는 핵산을 포함한다. 일부 실시형태에서, 아넬로좀은 본원에 그 전체가 참조로 포함되는 PCR 출원 제PCT/US2018/037379호에 열거된 서열을 포함하는 폴리펩티드를 포함한다.
일부 실시형태에서, 아넬로좀은 예를 들어, 실시예 9에 기재된 방법에 따라 확인된 바와 같은 아넬로바이러스 게놈을 포함한다. 일부 실시형태에서, 아넬로좀은 실시예 13에 기재된 바와 같은 아넬로바이러스 서열 또는 그의 부분을 포함한다.
일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF1 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF1/1 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF1/2 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF2/2 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF2/3 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 표 19에 나타낸 바와 같은 컨센서스 아넬로바이러스 ORF2t/3 모티프를 포함하는 유전 요소를 포함한다. 일부 실시형태에서, 표 19에 나타낸 바와 같은 X는 임의의 아미노산을 나타낸다. 일부 실시형태에서, 표 19에 나타낸 바와 같은 Z는 글루탐산 또는 글루타민을 나타낸다. 일부 실시형태에서, 표 19에 나타낸 바와 같은 B는 아스파르트산 또는 아스파라긴을 나타낸다. 일부 실시형태에서, 표 19에 나타낸 바와 같은 J는 류신 또는 이소류신을 나타낸다.
[표 19] 아넬로바이러스의 오픈 리딩 프레임(ORF) 내의 컨센서스 모티프
Figure pct00105
Figure pct00106
ORF1 분자
일부 실시형태에서, 아넬로좀은 ORF1 분자 및/또는 ORF1 분자를 인코딩하는 핵산을 포함한다. 일반적으로, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 단백질)의 구조적 특징 및/또는 활성을 갖는 폴리펩티드 또는 그의 기능적 단편을 포함한다. 일부 실시형태에서, ORF1 분자는 아넬로바이러스 ORF1 단백질(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 단백질)에 비하여 절단(truncation)을 포함한다. 일부 실시형태에서, ORF1 분자는 아넬로바이러스 ORF1 단백질의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650 또는 700개 아미노산에 의해 절단된다. 일부 실시형태에서, ORF1 분자는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은 아넬로바이러스 ORF1 단백질 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, ORF1 분자는 예를 들어, 본원에 기재된 바와 같은, 알파토르크바이러스, 베타토르크바이러스 또는 감마토르크바이러스 ORF1 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. ORF1 분자는 일반적으로, 핵산 분자, 예컨대 DNA(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 유전 요소)에 결합할 수 있다. 일부 실시형태에서, ORF1 분자는 세포의 핵에 국소화된다. 특정 실시형태에서, ORF1 분자는 세포의 핵소체에 국소화된다.
이론에 결부시키고자 하지 않고, ORF1 분자는 다른 ORF1 분자에 결합하여, 예를 들어, (예를 들어, 본원에 기재된 바와 같은) 단백질성 외부를 형성할 수 있을 수 있다. 이러한 ORF1 분자는 캡시드를 형성하는 능력을 갖는 것으로서 설명될 수 있다. 일부 실시형태에서, 단백질성 외부는 핵산 분자(예를 들어, 본원에 기재된 바와 같은 유전 요소)를 캡슐화할 수 있다. 일부 실시형태에서, 복수의 ORF1 분자는 다량체를 형성하여, 예를 들어, 단백질성 외부를 생성할 수 있다. 일부 실시형태에서, 다량체는 동종다량체일 수 있다. 다른 실시형태에서, 다량체는 (예를 들어, 복수의 별개의 ORF1 분자를 포함하는) 이종다량체일 수 있다. 또한, ORF1 분자가 복제효소 활성을 가질 수 있는 것이 고려된다.
ORF1 분자는 일부 실시형태에서, 하기 중 하나 이상을 포함할 수 있다: 아르기닌 풍부 영역, 예를 들어, 적어도 60%의 염기성 잔기(예를 들어, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 염기성 잔기; 예를 들어, 60% 내지 90%, 60% 내지 80%, 70% 내지 90% 또는 70 내지 80%의 염기성 잔기)를 갖는 영역을 포함하는 제1 영역, 및 젤리-롤 도메인, 예를 들어, 적어도 6개의 베타 가닥(예를 들어, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 베타 가닥)을 포함하는 제2 영역.
아르기닌-풍부 영역
아르기닌 풍부 영역은 본원에 기재된 아르기닌-풍부 영역 서열에 대하여 적어도 70%(예를 들어, 적어도 약 70, 80, 90, 95, 96, 97, 98, 99 또는 100%) 서열 동일성을 갖거나, 적어도 60%, 70% 또는 80%의 염기성 잔기(예를 들어, 아르기닌, 라이신 또는 그의 조합)를 포함하는 적어도 약 40개 아미노산의 서열을 갖는다.
젤리 롤 도메인
젤리-롤 도메인 또는 영역은 하기의 특징 중 하나 이상(예를 들어, 1, 2 또는 3개)을 포함하는 폴리펩티드(예를 들어, 더 큰 폴리펩티드에 포함된 도메인 또는 영역)를 포함한다(예를 들어, 이로 이루어진다):
(i) 젤리-롤 도메인의 적어도 30%(예를 들어, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% 이상)의 아미노산이 하나 이상의 β-시트의 부분임;
(ii) 젤리-롤 도메인의 2차 구조는 적어도 4개(예를 들어, 적어도 4, 5, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함함; 및/또는
(iii) 젤리-롤 도메인의 3차 구조는 적어도 2개(예를 들어, 적어도 2, 3 또는 4개)의 β-시트를 포함함; 및/또는
(iv) 젤리-롤 도메인은 적어도 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1 또는 10:1의 β-시트 대 α-나선의 비를 포함함.
특정 실시형태에서, 젤리-롤 도메인은 2개의 β-시트를 포함한다.
특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 약 8개(예를 들어, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함한다. 특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 8개의 β-가닥을 포함한다. 특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 7개의 β-가닥을 포함한다. 특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 6개의 β-가닥을 포함한다. 특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 5개의 β-가닥을 포함한다. 특정 실시형태에서, 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 β-시트는 4개의 β-가닥을 포함한다.
일부 실시형태에서, 젤리-롤 도메인은 제2 β-시트에 대한 역평행 배향의 제1 β-시트를 포함한다. 특정 실시형태에서, 제1 β-시트는 약 4개(예를 들어, 3, 4, 5 또는 6개)의 β-가닥을 포함한다. 특정 실시형태에서, 제2 β-시트는 약 4개(예를 들어, 3, 4, 5 또는 6개)의 β-가닥을 포함한다. 실시형태들에서, 제1 및 제2 β-시트는 총 약 8개(예를 들어, 6, 7, 8, 9, 10, 11 또는 12개)의 β-가닥을 포함한다.
특정 실시형태에서, 젤리-롤 도메인은 캡시드 단백질(예를 들어, 본원에 기재된 바와 같은 ORF1 분자)의 구성성분이다. 특정 실시형태에서, 젤리-롤 도메인은 자가-어셈블리 활성을 갖는다. 일부 실시형태에서, 젤리-롤 도메인을 포함하는 폴리펩티드는 젤리-롤 도메인을 포함하는 또 다른 카피의 폴리펩티드에 결합한다. 일부 실시형태에서, 제1 폴리펩티드의 젤리-롤 도메인은 제2 카피의 폴리펩티드의 젤리-롤 도메인에 결합한다.
ORF1 분자는 또한, 아넬로바이러스 N22 도메인(예를 들어, 본원에 기재된 바와 같음, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 N22 도메인)의 구조 또는 활성을 포함하는 제3 영역, 및/또는 아넬로바이러스 C-말단 도메인(CTD)(예를 들어, 본원에 기재된 바와 같음, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1 단백질로부터의 CTD)의 구조 또는 활성을 포함하는 제4 영역을 포함할 수 있다. 일부 실시형태에서, ORF1 분자는 N-말단에서 C-말단 순서로, 제1, 제2, 제3 및 제4 영역을 포함한다.
ORF1 분자는 일부 실시형태에서, 초가변 영역(HVR), 예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 HVR을 추가로 포함할 수 있다. 일부 실시형태에서, HVR은 제2 영역과 제3 영역 사이에 위치한다. 일부 실시형태에서, HVR은 적어도 약 55개(예를 들어, 적어도 약 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60 또는 65개)의 아미노산(예를 들어, 약 45 내지 160, 50 내지 160, 55 내지 160, 60 내지 160, 45 내지 150, 50 내지 150, 55 내지 150, 60 내지 150, 45 내지 140, 50 내지 140, 55 내지 140 또는 60 내지 140개의 아미노산)을 포함한다.
일부 실시형태에서, 제1 영역은 핵산 분자(예를 들어, DNA)에 결합할 수 있다. 일부 실시형태에서, 염기성 잔기는 아르기닌, 히스티딘 또는 라이신 또는 그의 조합으로부터 선택된다. 일부 실시형태에서, 제1 영역은 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아르기닌 잔기(예를 들어, 60% 내지 90%, 60% 내지 80%, 70% 내지 90% 또는 70 내지 80%의 아르기닌 잔기)를 포함한다. 일부 실시형태에서, 제1 영역은 약 30 내지 120개의 아미노산(예를 들어, 약 40 내지 120, 40 내지 100, 40 내지 90, 40 내지 80, 40 내지 70, 50 내지 100, 50 내지 90, 50 내지 80, 50 내지 70, 60 내지 100, 60 내지 90 또는 60 내지 80개의 아미노산)을 포함한다. 일부 실시형태에서, 제1 영역은 바이러스 ORF1 아르기닌-풍부 영역(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 아르기닌-풍부 영역)의 구조 또는 활성을 포함한다. 일부 실시형태에서, 제1 영역은 핵 국소화 신호를 포함한다.
일부 실시형태에서, 제2 영역은 젤리-롤 도메인, 예를 들어, 바이러스 ORF1 젤리-롤 도메인(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 아넬로바이러스 ORF1 단백질로부터의 젤리-롤 도메인)의 구조 또는 활성을 포함한다. 일부 실시형태에서, 제2 영역은 또 다른 ORF1 분자의 제2 영역에 결합하여, 예를 들어, 단백질성 외부(예를 들어, 캡시드) 또는 그의 부분을 형성할 수 있다.
일부 실시형태에서, 제4 영역은 단백질성 외부(예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF1 분자의 다량체를 포함하는 단백질성 외부)의 표면 상에 노출된다.
일부 실시형태에서, 제1 영역, 제2 영역, 제3 영역, 제4 영역 및/또는 HVR은 각각 4개 미만(예를 들어, 0, 1, 2 또는 3개)의 베타 시트를 포함한다.
일부 실시형태에서, 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및/또는 HVR 중 하나 이상은 이종 아미노산 서열(예를 들어, 이종 ORF1 분자로부터의 상응하는 영역)에 의해 대체될 수 있다. 일부 실시형태에서, 이종 아미노산 서열은 예를 들어, 본원에 기재된 바와 같은, 요망되는 작용성을 갖는다.
일부 실시형태에서, ORF1 분자는 (예를 들어, 도 34에 나타낸 바와 같이) 복수의 보존된 모티프(예를 들어, 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100개 이상의 아미노산을 포함하는 모티프)를 포함한다. 일부 실시형태에서, 보존된 모티프는 하나 이상의 야생형 아넬로바이러스 클레이드(예를 들어, 알파토르크바이러스, 클레이드 1; 알파토르크바이러스, 클레이드 2; 알파토르크바이러스, 클레이드 3; 알파토르크바이러스, 클레이드 4; 알파토르크바이러스, 클레이드 5; 알파토르크바이러스, 클레이드 6; 알파토르크바이러스, 클레이드 7; 베타토르크바이러스; 및/또는 감마토르크바이러스)의 ORF1 단백질에 대하여 60, 70, 80, 85, 90, 95 또는 100% 서열 동일성을 보일 수 있다. 실시형태들에서, 보존된 모티프는 각각 1 내지 1000개(예를 들어, 5 내지 10, 5 내지 15, 5 내지 20, 10 내지 15, 10 내지 20, 15 내지 20, 5 내지 50, 5 내지 100, 10 내지 50, 10 내지 100, 10 내지 1000, 50 내지 100, 50 내지 1000 또는 100 내지 1000개)의 아미노산의 길이를 갖는다. 특정 실시형태에서, 보존된 모티프는 약 2 내지 4%(예를 들어, 약 1 내지 8%, 1 내지 6%, 1 내지 5%, 1 내지 4%, 2 내지 8%, 2 내지 6%, 2 내지 5% 또는 2 내지 4%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 100% 서열 동일성을 보인다. 특정 실시형태에서, 보존된 모티프는 약 5 내지 10%(예를 들어, 약 1 내지 20%, 1 내지 10%, 5 내지 20% 또는 5 내지 10%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 80% 서열 동일성을 보인다. 특정 실시형태에서, 보존된 모티프는 약 10 내지 50%(예를 들어, 약 10 내지 20%, 10 내지 30%, 10 내지 40%, 10 내지 50%, 20 내지 40%, 20 내지 50% 또는 30 내지 50%)의 ORF1 분자의 서열로 이루어지며, 각각은 야생형 아넬로바이러스 클레이드의 ORF1 단백질 내의 상응하는 모티프에 대하여 60% 서열 동일성을 보인다. 일부 실시형태에서, 보존된 모티프는 표 19에 열거된 바와 같은 하나 이상의 아미노산 서열을 포함한다.
일부 실시형태에서, ORF1 분자는 예를 들어, 본원에 기재된 바와 같은(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 내지 37 또는 D1 내지 D10 중 어느 하나에 나타낸 바와 같은), 야생형 ORF1 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경)를 포함한다.
N22 도메인 내의 보존된 ORF1 모티프
일부 실시형태에서, 본원에 기재된 폴리펩티드(예를 들어, ORF1 분자)는 아미노산 서열 YNPX2DXGX2N(SEQ ID NO: 829)을 포함하며, Xn은 임의의 n개의 아미노산의 인접 서열이다. 예를 들어, X2는 임의의 2개의 아미노산의 인접 서열을 나타낸다. 일부 실시형태에서, YNPX2DXGX2N(SEQ ID NO: 829)은 예를 들어, 본원에 기재된 바와 같은, ORF1 분자의 N22 도메인 내에 포함된다. 일부 실시형태에서, 본원에 기재된 유전 요소는 아미노산 서열 YNPX2DXGX2N(SEQ ID NO: 829)을 인코딩하는 핵산 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF1 분자를 인코딩하는 핵산 서열)을 포함하며, Xn은 임의의 n개의 아미노산의 인접 서열이다.
일부 실시형태에서, 폴리펩티드(예를 들어, ORF1 분자)는 예를 들어, N22 도메인 내의, 예를 들어, YNPX2DXGX2N(SEQ ID NO: 829) 모티프의 부분을 포함하고/포함하거나 이에 측접하는 보존된 2차 구조를 포함한다. 일부 실시형태에서, 보존된 2차 구조는 제1 베타 가닥 및/또는 제2 베타 가닥을 포함한다. 일부 실시형태에서, 제1 베타 가닥은 약 5 내지 6개(예를 들어, 3, 4, 5, 6, 7 또는 8개)의 아미노산 길이이다. 일부 실시형태에서, 제1 베타 가닥은 YNPX2DXGX2N(SEQ ID NO: 829) 모티프의 N-종말단에 티로신(Y) 잔기를 포함한다. 일부 실시형태에서, YNPX2DXGX2N(SEQ ID NO: 829) 모티프는 랜덤 코일(예를 들어, 약 8 내지 9개 아미노산의 랜덤 코일)을 포함한다. 일부 실시형태에서, 제2 베타 가닥은 약 7 내지 8개(예를 들어, 5, 6, 7, 8, 9 또는 10개) 아미노산 길이이다. 일부 실시형태에서, 제2 베타 가닥은 YNPX2DXGX2N(SEQ ID NO: 829) 모티프의 C-종말단에 아스파라긴(N) 잔기를 포함한다.
예시적인 YNPX2DXGX2N(SEQ ID NO: 829) 모티프-측접 2차 구조는 실시예 47 및 도 48에 설명되어 있다. 일부 실시형태에서, ORF1 분자는 도 48에 나타낸 2차 구조 요소(예를 들어, 베타 가닥)의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다. 일부 실시형태에서, ORF1 분자는 (예를 들어, 본원에 기재된 바와 같은) YNPX2DXGX2N(SEQ ID NO: 829) 모티프에 측접하는, 도 48에 나타낸 2차 구조 요소(예를 들어, 베타 가닥) 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다.
ORF1 젤리-롤 도메인 내의 보존된 2차 구조 모티프
일부 실시형태에서, 본원에 기재된 폴리펩티드(예를 들어, ORF1 분자)는 (예를 들어, 본원에 기재된 바와 같은) 아넬로바이러스 ORF1 단백질에 의해 포함되는 하나 이상의 2차 구조 요소를 포함한다. 일부 실시형태에서, ORF1 분자는 (예를 들어, 본원에 기재된 바와 같은) 아넬로바이러스 ORF1 단백질의 젤리-롤 도메인에 의해 포함되는 하나 이상의 2차 구조 요소를 포함한다. 일반적으로, ORF1 젤리-롤 도메인은 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및 제9 베타 가닥을 포함하는 2차 구조를 포함한다. 일부 실시형태에서, ORF1 분자는 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및/또는 제9 베타 가닥을 포함하는 2차 구조를 포함한다.
일부 실시형태에서, 보존된 2차 구조 요소(즉, 베타 가닥 및/또는 알파 나선)의 쌍은 예를 들어, 랜덤 코일 서열, 베타 가닥 또는 알파 나선 또는 그의 조합을 포함하는 개재 아미노산 서열에 의해 분리된다. 보존된 2차 구조 요소 사이의 개재 아미노산 서열은 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 아미노산을 포함할 수 있다. 일부 실시형태에서, ORF1 분자는 하나 이상의 추가의 베타 가닥 및/또는 알파 나선을 (예를 들어, 젤리-롤 도메인 내에) 추가로 포함할 수 있다. 일부 실시형태에서, 연속 베타 가닥 또는 연속 알파 나선이 조합될 수 있다. 일부 실시형태에서, 제1 베타 가닥 및 제2 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 실시형태에서, 제3 베타 가닥 및 제4 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 실시형태에서, 제4 베타 가닥 및 제5 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 실시형태에서, 제6 베타 가닥 및 제7 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 실시형태에서, 제7 베타 가닥 및 제8 베타 가닥은 더 큰 베타 가닥 내에 포함된다. 일부 실시형태에서, 제8 베타 가닥 및 제9 베타 가닥은 더 큰 베타 가닥 내에 포함된다.
일부 실시형태에서, 제1 베타 가닥은 약 5 내지 7개(예를 들어, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다. 일부 실시형태에서, 제2 베타 가닥은 약 15 내지 16개(예를 들어, 13, 14, 15, 16, 17, 18 또는 19개)의 아미노산 길이이다. 일부 실시형태에서, 제1 알파 나선은 약 15 내지 17개(예를 들어, 13, 14, 15, 16, 17, 18, 19 또는 20개)의 아미노산 길이이다. 일부 실시형태에서, 제3 베타 가닥은 약 3 내지 4개(예를 들어, 1, 2, 3, 4, 5 또는 6개)의 아미노산 길이이다. 일부 실시형태에서, 제4 베타 가닥은 약 10 내지 11개(예를 들어, 8, 9, 10, 11, 12 또는 13개)의 아미노산 길이이다. 일부 실시형태에서, 제5 베타 가닥은 약 6 내지 7개(예를 들어, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다. 일부 실시형태에서, 제2 알파 나선은 약 8 내지 14개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 17개)의 아미노산 길이이다. 일부 실시형태에서, 제2 알파 나선은 (예를 들어, 랜덤 코일 서열에 의해 분리된) 2개의 더 작은 알파 나선으로 파단될 수 있다. 일부 실시형태에서, 2개의 더 작은 알파 나선의 각각은 약 4 내지 6개(예를 들어, 2, 3, 4, 5, 6, 7 또는 8개)의 아미노산 길이이다. 일부 실시형태에서, 제6 베타 가닥은 약 4 내지 5개(예를 들어, 2, 3, 4, 5, 6 또는 7개)의 아미노산 길이이다. 일부 실시형태에서, 제7 베타 가닥은 약 5 내지 6개(예를 들어, 3, 4, 5, 6, 7, 8 또는 9개)의 아미노산 길이이다. 일부 실시형태에서, 제8 베타 가닥은 약 7 내지 9개(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개)의 아미노산 길이이다. 일부 실시형태에서, 제9 베타 가닥은 약 5 내지 7개(예를 들어, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 아미노산 길이이다.
예시적인 젤리-롤 도메인 2차 구조는 실시예 47 및 도 47에 기재되어 있다. 일부 실시형태에서, ORF1 분자는 도 47에 나타낸 젤리-롤 도메인 2차 구조 중 임의의 것의 2차 구조 요소(예를 들어, 베타 가닥 및/또는 알파 나선)의 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 전부)을 포함하는 영역을 포함한다.
예시적인 ORF1 서열
일부 실시형태에서, 본원에 기재된 폴리펩티드(예를 들어, ORF1 분자)는 예를 들어, 표 20 내지 37 또는 D1 내지 D10 중 어느 하나에 기재된 바와 같은 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 본원에 기재된 아넬로좀은 예를 들어, 표 20 내지 37 또는 D1 내지 D10 중 어느 하나에 기재된 바와 같은 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함한다. 일부 실시형태에서, 본원에 기재된 아넬로좀은 예를 들어, 표 20 내지 37 또는 D1 내지 D10 중 어느 하나에 기재된 바와 같은 하나 이상의 아넬로바이러스 ORF1 하위서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 인코딩하는 핵산 분자(예를 들어, 유전 요소)를 포함한다.
일부 실시형태에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 (예를 들어, 표 20 내지 37 또는 D1 내지 D10 중 어느 하나에 열거된 바와 같은) 아르기닌(Arg)-풍부 도메인, 젤리-롤 도메인, 초가변 영역(HVR), N22 도메인 또는 C-말단 도메인(CTD) 또는 이에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열 중 하나 이상을 포함한다. 일부 실시형태에서, ORF1 분자는 상이한 아넬로바이러스로부터의 복수의 하위서열(예를 들어, 표 20 내지 37 또는 D1 내지 D10에 열거된 알파토르크바이러스 클레이드 1-7 하위서열로부터 선택되는 ORF1 하위서열의 임의의 조합)을 포함한다. 실시형태들에서, ORF1 분자는 하나의 아넬로바이러스로부터의 Arg-풍부 도메인, 젤리-롤 도메인, N22 도메인 및 CTD, 및 또 다른 아넬로바이러스로부터의 HVR 중 하나 이상을 포함한다. 실시형태들에서, ORF1 분자는 하나의 아넬로바이러스로부터의 젤리-롤 도메인, HVR, N22 도메인 및 CTD 및 또 다른 아넬로바이러스로부터의 Arg-풍부 도메인 중 하나 이상을 포함한다. 실시형태들에서, ORF1 분자는 하나의 아넬로바이러스로부터의 Arg-풍부 도메인, HVR, N22 도메인 및 CTD 및 또 다른 아넬로바이러스로부터의 젤리-롤 도메인 중 하나 이상을 포함한다. 실시형태들에서, ORF1 분자는 하나의 아넬로바이러스로부터의 Arg-풍부 도메인, 젤리-롤 도메인, HVR 및 CTD 및 또 다른 아넬로바이러스로부터의 N22 도메인 중 하나 이상을 포함한다. 실시형태들에서, ORF1 분자는 하나의 아넬로바이러스로부터의 Arg-풍부 도메인, 젤리-롤 도메인, HVR 및 N22 도메인 및 또 다른 아넬로바이러스로부터의 CTD 중 하나 이상을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 20의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 20의 아미노산 1 내지 66)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 21의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 20의 젤리-롤 영역 아미노산 서열(예를 들어, 표 20의 아미노산 67 내지 277)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 21의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 20의 HVR 아미노산 서열(예를 들어, 표 20의 아미노산 278 내지 347)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 21의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 20의 N22 도메인 아미노산 서열(예를 들어, 표 20의 아미노산 348 내지 513)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 21의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 20의 CTD 아미노산 서열(예를 들어, 표 20의 아미노산 513 내지 680)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 21의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 22의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 22의 아미노산 1 내지 69)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 23의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 22의 젤리-롤 영역 아미노산 서열(예를 들어, 표 22의 아미노산 70 내지 279)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 23의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 22의 HVR 아미노산 서열(예를 들어, 표 22의 아미노산 280 내지 411)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 23의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 22의 N22 도메인 아미노산 서열(예를 들어, 표 22의 아미노산 412 내지 578)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 23의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 22의 CTD 아미노산 서열(예를 들어, 표 22의 아미노산 579 내지 747)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 23의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 24의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 24의 아미노산 1 내지 68)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 25의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 24의 젤리-롤 영역 아미노산 서열(예를 들어, 표 24의 아미노산 69 내지 280)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 25의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 24의 HVR 아미노산 서열(예를 들어 표 24의 아미노산 281 내지 413)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 25의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 24의 N22 도메인 아미노산 서열(예를 들어, 표 24의 아미노산 414 내지 479)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 25의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 24의 CTD 아미노산 서열(예를 들어, 표 24의 아미노산 580 내지 743)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 25의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 26의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열(예를 들어, 표 26의 아미노산 1 내지 74)을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 27의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 26의 젤리-롤 영역 아미노산 서열(예를 들어, 표 26의 아미노산 75 내지 284)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 27의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 26의 HVR 아미노산 서열(예를 들어, 표 26의 아미노산 285 내지 445)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 27의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 26의 N22 도메인 아미노산 서열(예를 들어, 표 26의 아미노산 446 내지 611)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 27의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 26의 CTD 아미노산 서열(예를 들어, 표 26의 아미노산 612 내지 780)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 27의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 28의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 28의 아미노산 1 내지 75)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 29의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 28의 젤리-롤 영역 아미노산 서열(예를 들어, 표 28의 아미노산 75 내지 284)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 29의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 28의 HVR 아미노산 서열(예를 들어, 표 28의 아미노산 285 내지 432)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 29의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 28의 N22 도메인 아미노산 서열(예를 들어, 표 28의 아미노산 433 내지 599)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 29의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 28의 CTD 아미노산 서열(예를 들어, 표 28의 아미노산 600 내지 780)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 29의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 30의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 30의 아미노산 1 내지 77)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 31의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 30의 젤리-롤 영역 아미노산 서열(예를 들어, 표 30의 아미노산 78 내지 286)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 31의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 30의 HVR 아미노산 서열(예를 들어, 표 30의 아미노산 287 내지 416)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 31의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 30의 N22 도메인 아미노산 서열(예를 들어, 표 30의 아미노산 417 내지 585)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 31의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 30의 CTD 아미노산 서열(예를 들어, 표 30의 아미노산 586 내지 746)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 31의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 32의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 32의 아미노산 1 내지 74)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 33의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 32의 젤리-롤 영역 아미노산 서열(예를 들어, 표 32의 아미노산 75 내지 286)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 33의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 32의 HVR 아미노산 서열(예를 들어, 표 32의 아미노산 287 내지 428)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 33의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 32의 N22 도메인 아미노산 서열(예를 들어, 표 32의 아미노산 429 내지 595)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 33의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 32의 CTD 아미노산 서열(예를 들어, 표 32의 아미노산 596 내지 765)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 33의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 34의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 34의 아미노산 1 내지 38)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 35의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 34의 젤리-롤 영역 아미노산 서열(예를 들어, 표 34의 아미노산 39 내지 246)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 35의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 34의 HVR 아미노산 서열(예를 들어, 표 34의 아미노산 247 내지 374)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 35의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 34의 N22 도메인 아미노산 서열(예를 들어, 표 34의 아미노산 375 내지 537)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 35의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 34의 CTD 아미노산 서열(예를 들어, 표 34의 아미노산 538 내지 666)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 35의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 36의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 36의 아미노산 1 내지 57)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 37의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 36의 젤리-롤 영역 아미노산 서열(예를 들어, 표 36의 아미노산 58 내지 259)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 37의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 36의 HVR 아미노산 서열(예를 들어, 표 36의 아미노산 260 내지 351)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 37의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 36의 N22 도메인 아미노산 서열(예를 들어, 표 36의 아미노산 352 내지 510)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 37의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 36의 CTD 아미노산 서열(예를 들어, 표 36의 아미노산 511 내지 673)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 37의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D1의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 D1의 아미노산 1 내지 66)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D2의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D1의 젤리-롤 영역 아미노산 서열(예를 들어, 표 D1의 아미노산 67 내지 277)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D2의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D1의 HVR 아미노산 서열(예를 들어, 표 D1의 아미노산 278 내지 347)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D2의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D1의 N22 도메인 아미노산 서열(예를 들어, 표 D1의 아미노산 348 내지 513)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D2의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D1의 CTD 아미노산 서열(예를 들어, 표 D1의 아미노산 513 내지 680)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D2의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D3의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 D3의 아미노산 1 내지 66)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D4의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D3의 젤리-롤 영역 아미노산 서열(예를 들어, 표 D3의 아미노산 67 내지 277)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D4의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D3의 HVR 아미노산 서열(예를 들어, 표 D3의 아미노산 278 내지 347)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D4의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D3의 N22 도메인 아미노산 서열(예를 들어, 표 D3의 아미노산 348 내지 513)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D4의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D3의 CTD 아미노산 서열(예를 들어, 표 D3의 아미노산 513 내지 680)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D4의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D5의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 D5의 아미노산 1 내지 66)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D6의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D5의 젤리-롤 영역 아미노산 서열(예를 들어, 표 D5의 아미노산 67 내지 277)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D6의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D5의 HVR 아미노산 서열(예를 들어, 표 D5의 아미노산 278 내지 347)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D6의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D5의 N22 도메인 아미노산 서열(예를 들어, 표 D5의 아미노산 348 내지 513)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D6의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D5의 CTD 아미노산 서열(예를 들어, 표 D5의 아미노산 513 내지 680)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D6의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D7의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 D7의 아미노산 1 내지 57)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D8의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D7의 젤리-롤 영역 아미노산 서열(예를 들어, 표 D7의 아미노산 58 내지 259)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D8의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D7의 HVR 아미노산 서열(예를 들어, 표 D7의 아미노산 260 내지 351)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D8의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D7의 N22 도메인 아미노산 서열(예를 들어, 표 D7의 아미노산 352 내지 510)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D8의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D7의 CTD 아미노산 서열(예를 들어, 표 D7의 아미노산 511 내지 673)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D8의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D9의 Arg-풍부 영역 아미노산 서열(예를 들어, 표 D9의 아미노산 1 내지 57)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D10의 Arg-풍부 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D9의 젤리-롤 영역 아미노산 서열(예를 들어, 표 D9의 아미노산 58 내지 259)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D10의 젤리-롤 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D9의 HVR 아미노산 서열(예를 들어, 표 D9의 아미노산 260 내지 351)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D10의 HVR 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D9의 N22 도메인 아미노산 서열(예를 들어, 표 D9의 아미노산 352 내지 510)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D10의 N22 도메인 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D9의 CTD 아미노산 서열(예를 들어, 표 D9의 아미노산 511 내지 673)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 실시형태들에서, 하나 이상의 아넬로바이러스 ORF1 하위서열은 표 D10의 CTD 영역 아미노산 서열에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
[표 20] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 1)
Figure pct00107
[표 21] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 1)
Figure pct00108
[표 22] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 2)
Figure pct00109
[표 23] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 2)
Figure pct00110
[표 24] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 3)
Figure pct00111
[표 25] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 3)
Figure pct00112
[표 26] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00113
[표 27] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 4)
Figure pct00114
[표 28] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00115
[표 29] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 5)
Figure pct00116
[표 30] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00117
[표 31] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 6)
Figure pct00118
[표 32] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 7)
Figure pct00119
[표 33] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus ), 클레이드 7)
Figure pct00120
[표 34] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(베타토르크바이러스( Betatorquevirus ))
Figure pct00121
[표 35] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(베타토르크바이러스( Betatorquevirus ))
Figure pct00122
[표 36] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00123
[표 37] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00124
[표 D1] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00125
[표 D2] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00126
[표 D3] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00127
[표 D4] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(감마토르크바이러스( Gammatorquevirus ))
Figure pct00128
[표 D5] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) 클레이드 1
Figure pct00129
[표 D6] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) 클레이드 1
Figure pct00130
[표 D7] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) - 클레이드 3
Figure pct00131
[표 D8] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) - 클레이드 3
Figure pct00132
[표 D9] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) - 클레이드 7
Figure pct00133
[표 D10] 예시적인 아넬로바이러스 ORF1 아미노산 하위서열(알파토르크바이러스( Alphatorquevirus )) - 클레이드 7
Figure pct00134
컨센서스 ORF1 도메인 서열
일부 실시형태에서, 예를 들어, 본원에 기재된 바와 같은, ORF1 분자는 젤리-롤 도메인, N22 도메인, 및/또는 C-말단 도메인(CTD) 중 하나 이상을 포함한다. 일부 실시형태에서, 젤리-롤 도메인은 본원에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) 젤리-롤 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, N22 도메인은 본원에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) N22 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, CTD 도메인은 본원에 기재된 바와 같은(예를 들어, 표 37A 내지 37C 중 어느 하나에 열거된 바와 같은) CTD 도메인 컨센서스 서열을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 표 37A 내지 37C 중 어느 하나에 형식 "(Xa-b)"로 열거된 아미노산은 인접 아미노산의 연속물을 포함하며, 여기서, 연속물은 적어도 a개 및 최대 b개의 아미노산을 포함한다. 특정 실시형태에서, 연속물에서 모든 아미노산은 동일하다. 다른 실시형태에서, 연속물은 적어도 2개(예를 들어, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 21개)의 상이한 아미노산을 포함한다.
[표 37A] 알파토르크바이러스 ORF1 도메인 공통 서열
Figure pct00135
[표 37B] 베타토르크바이러스 ORF1 도메인 공통 서열
Figure pct00136
[표 37C] 감마토르크바이러스 ORF1 도메인 공통 서열
Figure pct00137
일부 실시형태에서, 젤리-롤 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10 또는 37A 내지 37C 중 어느 하나에 열거된 바와 같은 젤리-롤 도메인 아미노산 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, N22 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10 또는 37A 내지 37C 중 어느 하나에 열거된 바와 같은 N22 도메인 아미노산 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, CTD 도메인은 표 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10 또는 37A 내지 37C 중 어느 하나에 열거된 바와 같은 CTD 도메인 아미노산 서열 또는 이에 대하여 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
ORF2 분자
일부 실시형태에서, 아넬로좀은 ORF2 분자 및/또는 ORF2 분자를 인코딩하는 핵산을 포함한다. 일반적으로, ORF2 분자는 아넬로바이러스 ORF2 단백질(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF2 단백질)의 구조적 특징 및/또는 활성을 갖는 폴리펩티드 또는 그의 기능적 단편을 포함한다. 일부 실시형태에서, ORF2 분자는 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 나타낸 바와 같은 아넬로바이러스 ORF2 단백질 서열에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, ORF2 분자는 알파토르크바이러스, 베타토르크바이러스 또는 감마토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, ORF2 분자(예를 들어, 알파토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 250개 이하의 아미노산(예를 들어, 약 150 내지 200개의 아미노산)의 길이를 갖는다. 일부 실시형태에서, ORF2 분자(예를 들어, 베타토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 약 50 내지 150개의 아미노산의 길이를 갖는다. 일부 실시형태에서, ORF2 분자(예를 들어, 감마토르크바이러스 ORF2 단백질에 대하여 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 ORF2 분자)는 약 100 내지 200개의 아미노산(예를 들어, 약 100 내지 150개의 아미노산)의 길이를 갖는다. 일부 실시형태에서, ORF2 분자는 나선-회전-나선 모티프(예를 들어, 회전 영역에 측접하는 2개의 알파 나선을 포함하는 나선-회전-나선 모티프)를 포함한다. 일부 실시형태에서, ORF2 분자는 TTV 분리주 TA278 또는 TTV 분리주 SANBAN의 ORF2 단백질의 아미노산 서열을 포함하지 않는다. 일부 실시형태에서, ORF2 분자는 단백질 포스파타제 활성을 갖는다. 일부 실시형태에서, ORF2 분자는 예를 들어, 본원에 기재된 바와 같은(예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 나타낸 바와 같은) 야생형 ORF2 단백질에 비하여 적어도 하나의 차이(예를 들어, 돌연변이, 화학적 변형 또는 후성적 변경)를 포함한다.
보존된 ORF2 모티프
일부 실시형태에서, 본원에 기재된 폴리펩티드(예를 들어, ORF2 분자)는 아미노산 서열 [W/F]X7HX3CX1CX5H(SEQ ID NO: 949)를 포함하며, 여기서, Xn은 임의의 N개의 아미노산의 인접 서열이다. 실시형태들에서, X7은 임의의 7개의 아미노산의 인접 서열을 나타낸다. 실시형태들에서, X3은 임의의 3개의 아미노산의 인접 서열을 나타낸다. 실시형태들에서, X1은 임의의 단일의 아미노산을 나타낸다. 실시형태들에서, X5는 임의의 5개의 아미노산의 인접 서열을 나타낸다. 일부 실시형태에서, [W/F]는 트립토판 또는 페닐알라닌 중 어느 하나일 수 있다. 일부 실시형태에서, [W/F]X7HX3CX1CX5H(SEQ ID NO: 949)는 예를 들어, 본원에 기재된 바와 같은 ORF2 분자의 N22 도메인 내에 포함된다. 일부 실시형태에서, 본원에 기재된 유전 요소는 아미노산 서열 [W/F]X7HX3CX1CX5H(SEQ ID NO: 949)를 인코딩하는 핵산 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, ORF2 분자를 인코딩하는 핵산 서열)을 포함하며, 여기서, Xn은 임의의 n개의 아미노산의 인접 서열이다.
유전 요소
일부 실시형태에서, 아넬로좀은 유전 요소를 포함한다. 일부 실시형태에서, 유전 요소는 하기의 특징 중 하나 이상을 갖는다: 숙주 세포의 게놈과 실질적으로 비-통합성임, 에피솜 핵산임, 단일 가닥 DNA임, 환형임, 약 1 내지 10 kb임, 세포의 핵 내에 존재함, 내인성 단백질에 의해 결합될 수 있음, 이펙터, 예컨대 숙주 또는 표적 세포의 유전자, 활성 또는 기능을 표적화하는 폴리펩티드 또는 핵산(예를 들어, RNA, iRNA, 마이크로RNA)를 생성함. 일 실시형태에서, 유전 요소는 실질적으로 비-통합성 DNA이다. 일부 실시형태에서, 유전 요소는 패키징 신호, 예를 들어, 캡시드 단백질에 결합하는 서열을 포함한다. 일부 실시형태에서, 패키징 또는 캡시드-결합 서열의 외측에서, 유전 요소는 야생형 아넬로바이러스 핵산 서열에 대하여 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% 미만의 서열 동일성을 가지며, 예를 들어, 본원에 기재된 바와 같은, 아넬로바이러스 핵산 서열에 대하여 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% 미만의 서열 동일성을 갖는다. 일부 실시형태에서, 패키징 또는 캡시드-결합 서열의 외측에서, 유전 요소는 아넬로바이러스 핵산 서열과 적어도 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 500 450, 400, 350, 300, 250, 200, 150 또는 100개 미만의 인접 뉴클레오티드를 갖는다. 특정 실시형태에서, 유전 요소는 프로모터 서열, 치료적 이펙터 및 캡시드 결합 단백질을 인코딩하는 서열을 포함하는 환형, 단일 가닥 DNA이다.
일부 실시형태에서, 유전 요소는 예를 들어, 본원에 기재된 바와 같은(예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 기재된 바와 같은) 아넬로바이러스 핵산 서열 또는 그의 단편에 대하여 적어도 약 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖거나, (예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 기재된 바와 같은) 아넬로바이러스 아미노산 서열 또는 그의 단편에 대하여 적어도 약 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 인코딩한다. 실시형태들에서, 유전 요소는 이펙터(예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 페이로드), 예를 들어, 폴리펩티드 이펙터(예를 들어, 단백질) 또는 핵산 이펙터(예를 들어, 비-코딩 RNA, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA)를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 유전 요소는 20kb 미만(예를 들어, 약 19kb, 18kb, 17kb, 16kb, 15kb, 14kb, 13kb, 12kb, 11kb, 10kb, 9kb, 8kb, 7kb, 6kb, 5kb, 4kb, 3kb, 2kb, 1kb 또는 그 미만)의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 독립적으로 또는 부가적으로 1000b 초과(예를 들어, 적어도 약 1.1kb, 1.2kb, 1.3kb, 1.4kb, 1.5kb, 1.6kb, 1.7kb, 1.8kb, 1.9kb, 2kb, 2.1kb, 2.2kb, 2.3kb, 2.4kb, 2.5kb, 2.6kb, 2.7kb, 2.8kb, 2.9kb, 3kb, 3.1kb, 3.2kb, 3.3kb, 3.4kb, 3.5kb, 3.6kb, 3.7kb, 3.8kb, 3.9kb, 4kb, 4.1kb, 4.2kb, 4.3kb, 4.4kb, 4.5kb, 4.6kb, 4.7kb, 4.8kb, 4.9kb, 5kb 또는 그 초과)의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 2.5 내지 4.6, 2.8 내지 4.0, 3.0 내지 3.8 또는 3.2 내지 3.7 kb의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 1.5 내지 2.0, 1.5 내지 2.5, 1.5 내지 3.0, 1.5 내지 3.5, 1.5 내지 3.8, 1.5 내지 3.9, 1.5 내지 4.0, 1.5 내지 4.5 또는 1.5 내지 5.0 kb의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 2.0 내지 2.5, 2.0 내지 3.0, 2.0 내지 3.5, 2.0 내지 3.8, 2.0 내지 3.9, 2.0 내지 4.0, 2.0 내지 4.5 또는 2.0 내지 5.0 kb의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 2.5 내지 3.0, 2.5 내지 3.5, 2.5 내지 3.8, 2.5 내지 3.9, 2.5 내지 4.0, 2.5 내지 4.5 또는 2.5 내지 5.0 kb의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 3.0 내지 5.0, 3.5 내지 5.0, 4.0 내지 5.0 또는 4.5 내지 5.0 kb의 길이를 갖는다. 일부 실시형태에서, 유전 요소는 약 1.5 내지 2.0, 2.0 내지 2.5, 2.5 내지 3.0, 3.0 내지 3.5, 3.1 내지 3.6, 3.2 내지 3.7, 3.3 내지 3.8, 3.4 내지 3.9, 3.5 내지 4.0, 4.0 내지 4.5 또는 4.5 내지 5.0 kb의 길이를 갖는다.
일부 실시형태에서, 유전 요소는 본원에 기재된 특징, 예를 들어, 실질적으로 비-병원성인 단백질을 인코딩하는 서열, 단백질 결합 서열, 조절 핵산을 인코딩하는 하나 이상의 서열, 하나 이상의 조절 서열, 복제 단백질을 인코딩하는 하나 이상의 서열 및 기타 서열 중 하나 이상을 포함한다. 일부 실시형태에서, 실질적으로 비-병원성인 단백질은 아미노산 서열 또는 그의 기능적 단편, 또는 본원에 기재된 아미노산 서열, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거된 바와 같은 아넬로바이러스 아미노산 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
실시형태들에서, 유전 요소를 (예를 들어, 시험관 내 환화에 의해 생성되는) 이중-가닥 환형 DNA로부터 생성하였다. 일부 실시형태에서, 유전 요소를 이중-가닥 환형 DNA로부터 회전환 복제에 의해 생성하였다. 실시형태들에서, 회전환 복제는 세포(예를 들어, 숙주 세포, 예를 들어, 포유동물 세포, 예를 들어, 인간 세포, 예를 들어, HEK293T 세포, A549 세포 또는 Jurkat 세포)에서 발생한다. 실시형태들에서, 유전 요소는 세포에서 회전환 복제에 의해 지수적으로 복제될 수 있다. 실시형태들에서, 유전 요소는 세포에서 회전환 복제에 의해 선형적으로 복제될 수 있다. 실시형태들에서, 이중-가닥 환형 DNA 또는 유전 요소는 세포에서 회전환 복제에 의해 원래의 양의 적어도 2, 4, 8, 16, 32, 64, 128, 256, 518, 1024배 이상을 제공할 수 있다. 실시형태들에서, 이중-가닥 환형 DNA를 예를 들어, 본원에 기재된 바와 같이, 세포 내로 도입하였다.
일부 실시형태에서, 이중-가닥 환형 DNA 및/또는 유전 요소는 하나 이상의 박테리아 플라스미드 요소(예를 들어, 박테리아 복제 원점 또는 선택 가능한 마커, 예를 들어, 박테리아 내성 유전자)를 포함하지 않는다. 일부 실시형태에서, 이중-가닥 환형 DNA 및/또는 유전 요소는 박테리아 플라스미드 백본을 포함하지 않는다.
일 실시형태에서, 본 발명은 (i) 실질적으로 비-병원성인 외부 단백질, (ii) 유전 요소를 실질적으로 비-병원성인 외부 단백질에 결합시키는 외부 단백질 결합 서열 및 (iii) 조절 핵산을 인코딩하는 핵산 서열(예를 들어, DNA 서열)을 포함하는 유전 요소를 포함한다. 이러한 실시형태에서, 유전 요소는 고유 바이러스 서열(예를 들어, 본원에 기재된 바와 같은, 예를 들어, 고유 아넬로바이러스 서열)에 대한 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 하나 이상의 서열을 포함할 수 있다.
단백질 결합 서열
많은 바이러스에 의해 사용되는 전략은 바이러스 캡시드 단백질이 그의 게놈 내의 특정 단백질 결합 서열을 인식하는 것이다. 예를 들어, 비세그먼트화된 게놈을 갖는 바이러스, 예컨대 효모의 L-A 바이러스에서, 게놈의 5' 말단에 이차 구조(스템-루프) 및 특정 서열이 존재하며, 이는 둘 모두 바이러스 캡시드 단백질에 결합하는 데 사용된다. 그러나, 세그먼트화된 게놈을 갖는 바이러스, 예컨대 레오바이러스과, 오르쏘믹소바이러스과(Orthomyxoviridae)(인플루엔자), 부니아바이러스(Bunyaviruse) 및 아레나바이러스(Arenaviruse)는 게놈 세그먼트의 각각을 패키징할 필요가 있다. 일부 바이러스는 세그먼트의 상보성 영역을 사용하여, 바이러스가 각각의 게놈 분자 중 하나를 포함시키는 것을 보조한다. 다른 바이러스는 상이한 세그먼트의 각각에 대하여 특이적인 결합 부위를 갖는다. 예를 들어, 문헌[Curr Opin Struct Biol. 2010 Feb; 20(1): 114-120]; 및 문헌[Journal of Virology (2003), 77(24), 13036-13041]을 참조한다.
일부 실시형태에서, 유전 요소는 실질적으로 비-병원성인 단백질에 결합하는 단백질 결합 서열을 인코딩한다. 일부 실시형태에서, 단백질 결합 서열은 단백질성 외부로의 유전 요소의 패키징을 용이하게 한다. 일부 실시형태에서, 단백질 결합 서열은 실질적으로 비-병원성인 단백질의 아르기닌-풍부 영역에 특이적으로 결합한다. 일부 실시형태에서, 유전 요소는 실시예 8에 기재된 바와 같은 단백질 결합 서열을 포함한다. 일부 실시형태에서, 유전 요소는 (예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 나타낸 바와 같은) 아넬로바이러스 서열의 5' UTR 보존된 도메인 또는 GC-풍부 도메인에 대하여 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 단백질 결합 서열을 포함한다.
실시형태들에서, 단백질 결합 서열은 표 A1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 175 내지 245)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 138 내지 208)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 3720 내지 3742)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 100 내지 171)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 294 내지 364)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 3844 내지 3895)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.
실시형태들에서, 단백질 결합 서열은 표 1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 177 내지 247)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 3415 내지 3570)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 204 내지 273)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 3632 내지 3753)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 170 내지 238)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 3768 내지 3878)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 9의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 11의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 3691 내지 3794)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 13의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 13의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 3759 내지 3866)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 15의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 323 내지 393)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 15의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 2868 내지 2929)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 17의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 117 내지 187)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 17의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 3054 내지 3172)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.
실시형태들에서, 단백질 결합 서열은 표 B1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 185 내지 255)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 3141 내지 3264)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B2의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 185 내지 254)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B2의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 3076 내지 3176)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 178 내지 248)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 3555 내지 3696)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B4의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 176 내지 246)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B4의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 3720 내지 3828)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 실시형태들에서, 단백질 결합 서열은 표 B5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 3716 내지 3815)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.
5' UTR 영역
일부 실시형태에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38 및/또는 도 20에 나타낸 핵산 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 일부 실시형태에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 컨센서스 5' UTR 서열의 핵산 서열을 포함하며, X1, X2, X3, X4 및 X5는 각각 독립적으로, 임의의 뉴클레오티드이며, 예를 들어, X1 = G 또는 T이며, X2 = C 또는 A이며, X3 = G 또는 A이며, X4 = T 또는 C이며, X5 = A, C 또는 T이다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 컨센서스 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 예시적인 TTV 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-CT30F 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-HD23a 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-JA20 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-TJN02 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 TTV-tth8 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 컨센서스 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 1 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 2 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 3 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 4 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 5 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 6 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 38에 나타낸 알파토르크바이러스 클레이드 7 5' UTR 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소는 표 A1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 165 내지 235)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A3의 핵산 서열의 뉴클레오티드 175 내지 245)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A5의 핵산 서열의 뉴클레오티드 138 내지 208)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A9의 핵산 서열의 뉴클레오티드 100 내지 171)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 294 내지 364)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소는 표 1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 177 내지 247)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 204 내지 273)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 7의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 170 내지 238)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 9의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 11의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 174 내지 244)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 13의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 15의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 323 내지 393)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 17의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 117 내지 187)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소는 표 B1의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 185 내지 255)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B2의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 185 내지 254)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B3의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 178 내지 248)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B4의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 176 내지 246)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B5의 아넬로바이러스 5' UTR 보존된 도메인 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 170 내지 240)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
[표 38] 아넬로바이러스로부터의 예시적인 5’ UTR 서열
Figure pct00138
Figure pct00139
Figure pct00140
GC-풍부 영역
일부 실시형태에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39 및/또는 도 20 및 32 중 어느 하나에 나타낸 핵산 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 GC-풍부 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 바와 같은 36-뉴클레오티드 GC-풍부 서열(예를 들어, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 1, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 2, TTV 클레이드 1 36-뉴클레오티드 영역, TTV 클레이드 3 36-뉴클레오티드 영역, TTV 클레이드 3 분리주 GH1 36-뉴클레오티드 영역, TTV 클레이드 3 sle1932 36-뉴클레오티드 영역, TTV 클레이드 4 ctdc002 36-뉴클레오티드 영역, TTV 클레이드 5 36-뉴클레오티드 영역, TTV 클레이드 6 36-뉴클레오티드 영역 또는 TTV 클레이드 7 36-뉴클레오티드 영역)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 바와 같은 36-뉴클레오티드 GC-풍부 서열(예를 들어, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 1, 36-뉴클레오티드 컨센서스 GC-풍부 영역 서열 2, TTV 클레이드 1 36-뉴클레오티드 영역, TTV 클레이드 3 36-뉴클레오티드 영역, TTV 클레이드 3 분리주 GH1 36-뉴클레오티드 영역, TTV 클레이드 3 sle1932 36-뉴클레오티드 영역, TTV 클레이드 4 ctdc002 36-뉴클레오티드 영역, TTV 클레이드 5 36-뉴클레오티드 영역, TTV 클레이드 6 36-뉴클레오티드 영역 또는 TTV 클레이드 7 36-뉴클레오티드 영역)의 적어도 10, 15, 20, 25, 30, 31, 32, 33, 34, 35 또는 36개의 연속 뉴클레오티드를 포함하는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 예를 들어, 표 39에 열거된 바와 같은, 예를 들어, TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 또는 TTV-HD16d로부터 선택되는 알파토르크바이러스 GC-풍부 영역 서열에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 예를 들어, 표 39에 열거된 바와 같은, 예를 들어, TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 또는 TTV-HD16d로부터 선택되는 알파토르크바이러스 GC-풍부 영역 서열의 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 104, 105, 108, 110, 111, 115, 120, 122, 130, 140, 145, 150, 155 또는 156개의 연속 뉴클레오티드를 포함하는 핵산 서열을 포함한다.
실시형태들에서, 36-뉴클레오티드 GC-풍부 서열은 하기로부터 선택된다:
(i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160),
(ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 164), 여기서, X1은 T, G 또는 A로부터 선택됨;
(iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO: 165);
(iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
(v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO: 167);
(vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO: 168);
(vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO: 169);
(viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 170);
(ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO: 171); 또는
(x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO: 172).
실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 핵산 서열 CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160)를 포함한다.
실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 컨센서스 GC-풍부 서열의 핵산 서열을 포함하며, X1, X4, X5, X6, X7, X12, X13, X14, X15, X20, X21, X22, X26, X29, X30 및 X33은 각각 독립적으로 임의의 뉴클레오티드이며, X2, X3, X8, X9, X10, X11, X16, X17, X18, X19, X23, X24, X25, X27, X28, X31, X32 및 X34는 각각 독립적으로 부재이거나, 임의의 뉴클레오티드이다. 일부 실시형태에서, X1 내지 X34 중 하나 이상(예를 들어, 이들 전부)는 각각 독립적으로 표 39에 특정된 뉴클레오티드(또는 부재)이다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 예시적인 TTV GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 3)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-CT30F GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 7)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-HD23a GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 6)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-JA20 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 및 2)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-TJN02 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 8)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 TTV-tth8 GC-풍부 서열(예를 들어, 전체 서열, 단편 1, 단편 2, 단편 3, 단편 4, 단편 5, 단편 6, 단편 7, 단편 8, 단편 9 또는 그의 임의의 조합, 예를 들어, 순서대로 단편 1 내지 6)에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 7에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 8에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소(예를 들어, 유전 요소의 단백질-결합 서열)는 표 39에 나타낸 단편 9에 대하여 적어도 약 75%(예를 들어, 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%) 동일성을 갖는 핵산 서열을 포함한다.
[표 39] 아넬로바이러스로부터의 예시적인 GC-풍부 서열
Figure pct00141
Figure pct00142
Figure pct00143
Figure pct00144
Figure pct00145
Figure pct00146
Figure pct00147
실시형태들에서, 유전 요소는 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A1의 핵산 서열의 뉴클레오티드 3620 내지 3648)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A7의 핵산 서열의 뉴클레오티드 3720 내지 3742)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 A1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 A11의 핵산 서열의 뉴클레오티드 3844 내지 3895)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소는 표 1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 1의 핵산 서열의 뉴클레오티드 3415 내지 3570)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 3의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 5의 핵산 서열의 뉴클레오티드 3632 내지 3753)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 7의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 7의 핵산 서열의 뉴클레오티드 3768 내지 3878)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 9의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 9의 핵산 서열의 뉴클레오티드 3302 내지 3541)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 11의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 11의 핵산 서열의 뉴클레오티드 3691 내지 3794)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 13의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 13의 핵산 서열의 뉴클레오티드 3759 내지 3866)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 15의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 15의 핵산 서열의 뉴클레오티드 2868 내지 2929)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 17의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 17의 핵산 서열의 뉴클레오티드 3054 내지 3172)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
실시형태들에서, 유전 요소는 표 B1의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B1의 핵산 서열의 뉴클레오티드 3141 내지 3264)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B2의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B2의 핵산 서열의 뉴클레오티드 3076 내지 3176)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B3의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B3의 핵산 서열의 뉴클레오티드 3555 내지 3696)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B4의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B4의 핵산 서열의 뉴클레오티드 3720 내지 3828)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다. 실시형태들에서, 유전 요소는 표 B5의 아넬로바이러스 GC-풍부 뉴클레오티드 서열(예를 들어, 표 B5의 핵산 서열의 뉴클레오티드 3716 내지 3815)에 대하여 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 핵산 서열을 포함한다.
이펙터
일부 실시형태에서, 유전 요소는 기능적 이펙터, 예를 들어, 내인성 이펙터 또는 외인성 이펙터, 예를 들어, 치료적 폴리펩티드 또는 핵산, 예를 들어, 세포독성 또는 세포용해 RNA 또는 단백질을 인코딩하는 하나 이상의 서열을 포함할 수 있다. 일부 실시형태에서, 기능적 핵산은 비-코딩 RNA이다. 일부 실시형태에서, 기능적 핵산은 코딩 RNA이다. 이펙터는 생물학적 활성을 조절할 수 있으며, 예를 들어, 효소 활성, 유전자 발현, 세포 신호전달 및 세포 또는 기관 기능을 증가시키거나 감소시킬 수 있다. 이펙터 활성은 또한 조절 단백질에 결합하여, 조절제의 활성, 예컨대 전사 또는 번역을 조절하는 것을 포함할 수 있다. 이펙터 활성은 또한, 활성화제 또는 저해제 기능을 포함할 수 있다. 예를 들어, 이펙터는 효소에서 증가된 기질 친화성을 촉발시킴으로써 효소 활성을 유도할 수 있으며, 예를 들어, 프룩토스 2,6-비스포스페이트는 포스포프룩토키나제 1을 활성화시키고, 인슐린에 반응하여 당분해 속도를 증가시킨다. 또 다른 예에서, 이펙터는 수용체로의 기질 결합을 저해하고, 그의 활성화를 저해할 수 있으며, 예를 들어, 날트렉손(naltrexone) 및 날록손(naloxone)은 활성화시키지 않고 오피오이드 수용체에 결합하며, 오피오이드에 결합하는 수용체의 능력을 차단한다. 이펙터 활성은 또한, 단백질 안정성/분해 및/또는 전사물 안정성/분해를 조절하는 것을 포함할 수 있다. 예를 들어, 단백질은 분해를 위해 폴리펩티드 보조-인자, 유비퀴틴에 의해 단백질 상에 표적화되어, 분해를 위해 그들을 표시할 수 있다. 또 다른 예에서, 이펙터는 효소의 활성 부위를 차단함으로써 효소 활성을 저해하며, 예를 들어, 메토트렉세이트는 천연 기질보다 1000배 더 단단하게 다이하이드로폴레이트 환원효소에 결합하고, 뉴클레오티드 염기 합성을 저해하는, 효소 다이하이드로폴레이트 환원효소에 대한 보조효소인 테트라하이드로폴레이트의 구조적 유사체이다.
일부 실시형태에서, 이펙터를 인코딩하는 서열은 유전 요소의 부분이며, 예를 들어, 그것은 실시예 10, 12 또는 22에 기재된 바와 같이 삽입 부위에서 삽입될 수 있다. 실시형태들에서, 이펙터를 인코딩하는 서열은 비코딩 영역, 예를 들어, 오픈 리딩 프레임의 3'에, 그리고 유전 요소의 GC-풍부 영역의 5'에 배치된 비코딩 영역에서, TATA 박스의 상류의 5' 비코딩 영역 내에서, 5' UTR 내에서, 폴리-A 신호의 하류 또는 GC-풍부 영역의 상류의 3' 비코딩 영역에서 유전 요소 내로 삽입된다. 실시형태들에서, 이펙터를 인코딩하는 서열은 예를 들어, 본원에 기재된 바와 같이 TTV-tth8 플라스미드의 뉴클레오티드 약 3588에서, 또는 예를 들어, 본원에 기재된 바와 같이 TTMV-LY2 플라스미드의 뉴클레오티드 약 2843에서 유전 요소 내로 삽입된다. 실시형태들에서, 이펙터를 인코딩하는 서열은 예를 들어, 본원에 기재된 바와 같이 TTV-tth8 플라스미드의 뉴클레오티드 336 내지 3015에 또는 그 내에, 또는 예를 들어, 본원에 기재된 바와 같이 TTV-LY2 플라스미드의 뉴클레오티드 242 내지 2812에 또는 그 내에 유전 요소 내로 삽입된다. 일부 실시형태에서, 이펙터를 인코딩하는 서열은 오픈 리딩 프레임(예를 들어, 본원에 기재된 바와 같은 ORF, 예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 중 어느 하나에 나타낸 바와 같은 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 및/또는 ORF2t/3)의 부분 또는 전부를 대체한다.
일부 실시형태에서, 이펙터를 인코딩하는 서열은 100 내지 2000개, 100 내지 1000개, 100 내지 500개, 100 내지 200개, 200 내지 2000개, 200 내지 1000개, 200 내지 500개, 500 내지 1000, 500 내지 2000 또는 1000 내지 2000개의 뉴클레오티드를 포함한다. 일부 실시형태에서, 이펙터는 예를 들어, 실시예 11에 기재된 바와 같이 핵산 또는 단백질 페이로드이다.
조절 핵산
일부 실시형태에서, 이펙터는 조절 핵산이다. 조절 핵산은 내인성 유전자 및/또는 외인성 유전자의 발현을 변경시킨다. 일 실시형태에서, 조절 핵산은 숙주 유전자를 표적화한다. 조절 핵산은 내인성 유전자(예를 들어, 본원의 다른 곳에 기재된 바와 같은 miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA)에 혼성화되는 핵산, 외인성 핵산, 예컨대 바이러스 DNA 또는 RNA에 혼성화하는 핵산, RNA에 혼성화하는 핵산, 유전자 전사를 간섭하는 핵산, RNA 번역을 간섭하는 핵산, RNA를 안정화시키거나, 예컨대 분해에 대한 표적화를 통하여 RNA를 불안정화시키는 핵산, 및 DNA 또는 RNA 결합 인자를 조절하는 핵산을 포함할 수 있지만, 이에 제한되지 않는다. 실시형태들에서, 조절 핵산은 miRNA를 인코딩한다.
일부 실시형태에서, 조절 핵산은 전형적으로 5 내지 500개의 염기쌍(특정 RNA 구조에 따라, 예를 들어, miRNA 5 내지 30 bp, lncRNA 200 내지 500 bp)을 함유하는 RNA 또는 RNA-유사 구조를 포함하며, 세포 내의 발현된 표적 유전자의 코딩 서열 또는 세포 내의 발현된 표적 유전자를 인코딩하는 서열과 동일하거나(또는 상보성이거나) 거의 동일한(또는 실질적으로 상보성인) 핵염기 서열을 가질 수 있다.
일부 실시형태에서, 조절 핵산은 핵산 서열, 예를 들어, 가이드 RNA(gRNA)를 포함한다. 일부 실시형태에서, DNA 표적화 모이어티는 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함한다. gRNA 짧은 합성 RNA는 불완전한 이펙터 모이어티로의 결합에 필요한 "스캐폴드" 서열 및 게놈 표적에 대한 사용자-정의된 약 20개 뉴클레오티드 표적화 서열로 구성될 수 있다. 실시에서, 가이드 RNA 서열은 일반적으로 17 내지 24개의 뉴클레오티드(예를 들어, 19, 20 또는 21개의 뉴클레오티드)의 길이를 갖도록 설계되고 표적화된 핵산 서열에 대하여 상보성이다. 커스텀 gRNA 생성자 및 알고리즘은 효율적인 가이드 RNA의 설계에 사용하기 위하여 상업적으로 이용 가능하다. 유전자 편집은 또한, 자연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합) 및 적어도 하나의 crRNA(뉴클레아제를 편집에 대해 표적화된 서열로 가이드함) 둘 모두를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성되었다. 화학적으로 변형된 sgRNA는 또한, 게놈 편집에서 효율적인 것으로 입증되었으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다.
조절 핵산은 특정 DNA 서열(예를 들어, 프로모터, 유전자의 인핸서, 침묵자 또는 억제자에 인접하거나 그 내의 서열)을 인식하는 gRNA를 포함한다.
특정 조절 핵산은 RNA 간섭(RNAi)의 생물학적 과정을 통하여 유전자 발현을 저해할 수 있다. RNAi 분자는 전형적으로 15 내지 50개의 염기쌍(예컨대 약 18 내지 25개의 염기쌍)을 함유하고, 세포 내의 발현된 표적 유전자의 코딩 서열과 동일하거나(상보성이거나) 또는 거의 동일한(실질적으로 상보성인) 핵염기 서열을 갖는 RNA 또는 RNA-유사 구조를 포함한다. RNAi 분자는 짧은 간섭 RNA(siRNA), 이중-가닥 RNA(dsRNA), 마이크로 RNA(miRNA), 짧은 헤어핀 RNA(shRNA), 메로듀플렉스(meroduplex) 및 다이서(dicer) 기질(미국 특허 제8,084,599호, 제8,349,809호 및 제8,513,207호)을 포함하나 이들에 제한되지 않는다.
긴 비-코딩 RNA(lncRNA)는 100개 초과의 뉴클레오티드의 비-단백질 코딩 전사물로서 정의된다. 이러한 다소 임의의 제한은 lncRNA를 소형 조절 RNA, 예컨대 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA) 및 다른 짧은 RNA로부터 구별한다. 일반적으로, 대다수(약 78%)의 lncRNA는 조직-특이적인 것으로 특성화된다. 근처의 단백질-코딩 유전자에 대하여 반대 방향으로 전사되는(포유동물 게놈 내에 총 lncRNA의 유의미한 비율 약 20%를 포함하는) 분지 lncRNA는 아마도 근처의 유전자의 전사를 조절할 수 있다.
유전 요소는 내인성 유전자 또는 유전자 생성물(예를 들어, mRNA)의 전부 또는 그의 단편에 실질적으로 상보성이거나, 완전히 상보성인 서열을 갖는 조절 핵산을 인코딩할 수 있다. 조절 핵산은 인트론과 엑손 사이의 경계에서의 서열에 상보성이어서, 특정 유전자의 새로 생성된 핵 RNA 전사물이 전사를 위해 mRNA로 성숙되는 것을 방지할 수 있다. 특정 유전자에 상보성인 조절 핵산은 당해 유전자에 대한 mRNA와 혼성화하고, 그의 번역을 방지할 수 있다. 안티센스 조절 핵산은 DNA, RNA 또는 그의 유도체 또는 혼성물일 수 있다.
관심 전사물에 혼성화하는 조절 핵산의 길이는 5 내지 30개의 뉴클레오티드, 약 10 내지 30개의 뉴클레오티드 또는 약 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 뉴클레오티드일 수 있다. 표적화된 전사물에 대한 조절 핵산의 동일성의 정도는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%여야 한다.
유전 요소는 조절 핵산, 예를 들어, 표적 유전자의 약 5 내지 약 25개의 인접 뉴클레오티드와 동일한 마이크로 RNA(miRNA) 분자를 인코딩할 수 있다. 일부 실시형태에서, miRNA 서열은 mRNA를 표적화하며, 다이뉴클레오티드 AA로 시작하며, 약 30 내지 70%(약 30 내지 60%, 약 40 내지 60% 또는 약 45% 내지 55%)의 GC-함량을 포함하며, 예를 들어, 표준 BLAST 검색에 의해 결정시, 그것이 도입될 포유동물의 게놈 내의 표적 이외의 임의의 뉴클레오티드 서열에 대하여 높은 동일성 백분율을 갖지 않는다.
일부 실시형태에서, 조절 핵산은 적어도 하나의 miRNA, 예를 들어, 2, 3, 4, 5, 6개 이상이다. 일부 실시형태에서, 유전 요소는 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 서열 동일성의 miRNA를 인코딩하는 서열 또는 본원에, 예를 들어, 표 40에 기재된 서열에 상보성인 서열을 포함한다.
[표 40] 조절 핵산의 예, 예를 들어, miRNA.
Figure pct00148
Figure pct00149
Figure pct00150
Figure pct00151
Figure pct00152
Figure pct00153
Figure pct00154
Figure pct00155
Figure pct00156
siRNA 및 shRNA는 내인성 마이크로RNA(miRNA) 유전자의 가공 경로 내의 중간체와 유사하다(문헌[Bartel, Cell 116:281-297, 2004]). 일부 실시형태에서, siRNA는 miRNA로서 기능할 수 있으며, 그 역도 그러하다(문헌[Zeng et al., Mol Cell 9:1327-1333, 2002]; 문헌[Doench et al., Genes Dev 17:438-442, 2003]). siRNA와 같이 마이크로RNA는 RISC를 사용하여, 표적 유전자를 하향조절하지만, siRNA와 달리, 대부분의 동물 miRNA는 mRNA를 절단하지 않는다. 대신에, miRNA는 번역 억제 또는 폴리A 제거 및 mRNA 분해를 통해 단백질 출력물을 감소시킨다(문헌[Wu et al., Proc Natl Acad Sci USA 103:4034-4039, 2006]). 공지된 miRNA 결합 부위는 mRNA 3' UTR 내에 존재하며; miRNA는 miRNA의 5' 말단으로부터 뉴클레오티드 2 내지 8에 대하여 거의 완벽하게 상보성을 갖는 부위를 표적화하는 것으로 보인다(문헌[Rajewsky, Nat Genet 38 Suppl:S8-13, 2006]; 문헌[Lim et al., Nature 433:769-773, 2005]). 이러한 영역은 씨드 영역으로 공지되어 있다. siRNA 및 miRNA가 상호 교환 가능하기 때문에, 외인성 siRNA는 siRNA에 대하여 씨드 상보성을 갖는 mRNA를 하향조절한다(문헌[Birmingham et al., Nat Methods 3:199-204, 2006]). 3' UTR 내의 다수의 표적 부위는 더 강한 하향조절을 제공한다(문헌[Doench et al., Genes Dev 17:438-442, 2003]).
공지된 miRNA 서열의 목록은 특히 Wellcome Trust Sanger Institute, Penn Center for Bioinformatics, Memorial Sloan Kettering Cancer Center, 및 European Molecule Biology Laboratory와 같은 연구 기관에 의해 유지되는 데이터베이스에서 확인될 수 있다. 또한, 알려진 효과적인 siRNA 서열 및 동족(cognate) 결합 부위는 관련 문헌에서 잘 나타나 있다. RNAi 분자는 해당 분야에 알려진 기술에 의해 쉽게 설계되고 생성된다. 또한, 효과적이고 특이적인 서열 모티프를 찾는 기회를 증가시키는 컴퓨터 기반 도구가 존재한다(문헌[Lagana et al., Methods Mol. Bio., 2015, 1269:393-412]).
조절 핵산은 유전자에 의해 인코딩되는 RNA의 발현을 조절할 수 있다. 다수의 유전자가 서로 어느 정도의 서열 상동성을 공유할 수 있기 때문에, 일부 실시형태에서, 조절 핵산은 충분한 서열 상동성을 갖는 유전자의 부류를 표적화하도록 설계될 수 있다. 일부 실시형태에서, 조절 핵산은 상이한 유전자 표적 간에 공유되는 또는 특정 유전자 표적에 특유한 서열에 상보성을 갖는 서열을 함유할 수 있다. 일부 실시형태에서, 조절 핵산은 몇몇의 유전자 간에 상동성을 갖는 RNA 서열의 보존된 영역을 표적화하여, 그에 의해, 유전자 과 내의 몇몇의 유전자(예를 들어, 상이한 유전자 아이소폼, 슬라이스 변이체, 돌연변이 유전자 등)를 표적화하도록 설계될 수 있다. 일부 실시형태에서, 조절 핵산은 단일 유전자의 특정 RNA 서열에 특유한 서열을 표적화하도록 설계될 수 있다.
일부 실시형태에서, 유전 요소는 하나 이상의 유전자의 발현을 조절하는 조절 핵산을 인코딩하는 하나 이상의 서열을 포함할 수 있다.
일 실시형태에서, 본원의 다른 곳에 기재된 gRNA는 유전자 편집을 위한 CRISPR 시스템의 부분으로서 사용된다. 유전자 편집의 목적을 위하여, 아넬로좀은 요망되는 표적 DNA 서열에 상응하는 하나의 또는 다수의 가이드 RNA 서열을 포함하도록 설계될 수 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819-823]; 문헌[Ran et al. (2013) Nature Protocols, 8:2281 - 2308]을 참조한다. 적어도 약 16 또는 17개 뉴클레오티드의 gRNA 서열은 일반적으로 Cas9-매개된 DNA 절단이 발생하게 하며; Cpf1에 있어서, 적어도 약 16개 뉴클레오티드의 gRNA 서열이 검출 가능한 DNA 절단을 달성하는 데 필요하다.
치료적 펩티드 또는 폴리펩티드
일부 실시형태에서, 유전 요소는 치료적 펩티드 또는 폴리펩티드를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 유전 요소는 단백질, 예를 들어, 치료적 단백질을 인코딩하는 서열을 포함한다. 치료적 단백질의 일부 예는 호르몬, 사이토카인, 효소, 항체, 전사 인자, 수용체(예를 들어, 막 수용체), 리간드, 막 수송체, 분비된 단백질, 펩티드, 운반 단백질, 구조 단백질, 뉴클레아제 또는 그의 성분을 포함할 수 있지만, 이들에 제한되지 않는다.
일부 실시형태에서, 유전 요소는 펩티드, 예를 들어, 치료적 펩티드를 인코딩하는 서열을 포함한다. 펩티드는 선형 또는 분지형일 수 있다. 펩티드는 약 5 내지 약 500개 아미노산, 약 15 내지 약 400개 아미노산, 약 20 내지 약 325개 아미노산, 약 25 내지 약 250개 아미노산, 약 50 내지 약 200개 아미노산 또는 그 사이의 임의의 범위의 길이를 갖는다. 펩티드의 일부 예는 형광 태그 또는 마커, 항원, 펩티드 치료제, 천연적인 생물활성 펩티드로부터의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항-미생물 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 및 분해 또는 자가-파괴 펩티드들을 포함하지만, 이들에 제한되지 않는다. 본원에 기재된 본 발명에 유용한 펩티드는 또한, 항원-결합 펩티드, 예를 들어, 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 쇄 항체, 나노바디(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조)를 포함한다. 이러한 항원 결합 펩티드는 시토졸 항원, 핵 항원 또는 소기관-내 항원에 결합할 수 있다.
일부 실시형태에서, 유전 요소는 작은 펩티드, 펩티드모방체(예를 들어, 펩토이드(peptoid)), 아미노산 및 아미노산 유사체를 인코딩하는 서열을 포함한다. 이러한 치료제는 일반적으로 몰당 약 5,000 그램 미만의 분자량, 몰당 약 2,000 그램 미만의 분자량, 몰당 약 1,000 그램 미만의 분자량, 몰당 약 500 그램 미만의 분자량, 및 이러한 화합물의 염, 에스테르 및 다른 약제학적으로 허용되는 형태를 갖는다. 이러한 치료제는 신경전달물질, 호르몬, 약물, 독소, 바이러스 또는 미생물 입자, 합성 분자 및 그의 효능제 또는 길항제를 포함할 수 있지만, 이들에 제한되지 않는다.
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 특정 위치, 조직 또는 세포를 표적화할 수 있는 리간드에 연결된 폴리펩티드를 포함한다.
조절 서열
일부 실시형태에서, 유전 요소는 이펙터를 인코딩하는 서열에 작동 가능하게 연결된 조절 서열, 예를 들어, 프로모터 또는 인핸서를 포함한다.
일부 실시형태에서, 프로모터는 발현 생성물을 인코딩하는 DNA 서열에 인접하여 위치한 DNA 서열을 포함한다. 프로모터는 인접 DNA 서열에 작동 가능하게 연결될 수 있다. 프로모터는 전형적으로 프로모터가 존재하지 않는 경우 발현되는 생성물의 양에 비하여 DNA 서열로부터 발현되는 생성물의 양을 증가시킨다. 하나의 유기체로부터의 프로모터를 사용하여 또 다른 유기체로부터 기원한 DNA 서열로부터의 생성물 발현을 향상시킬 수 있다. 예를 들어, 척추동물 프로모터는 척추동물에서 해파리 GFP의 발현을 위해 사용될 수 있다. 또한, 하나의 프로모터 요소는 텐덤으로 부착된 다수의 DNA 서열에 대하여 발현되는 생성물의 양을 증가시킬 수 있다. 그러므로, 하나의 프로모터 요소는 하나 이상의 생성물의 발현을 향상시킬 수 있다. 다수의 프로모터 요소는 당업자에게 널리 알려져 있다.
일 실시형태에서, 높은 수준의 구성적 발현이 요망된다. 이러한 프로모터의 예는 제한 없이, 레트로바이러스 라우스 육종 바이러스(RSV) 긴 말단 반복부(LTR) 프로모터/인핸서, 사이토메갈로바이러스(CMV) 즉시 조기 프로모터/인핸서(예를 들어, 문헌[Boshart et al, Cell, 41:521-530 (1985)] 참조), SV40 프로모터, 다이하이드로폴레이트 환원효소 프로모터, 세포질 β-액틴 프로모터 및 포스포글리세롤 키나제(PGK) 프로모터를 포함한다.
또 다른 실시형태에서, 유도성 프로모터가 요망될 수 있다. 유도성 프로모터는 제한 없이, 아연-유도성 양 메탈로티오닌(MT) 프로모터; 덱사메타손(Dex)-유도성 마우스 유방 종양 바이러스(MMTV) 프로모터; T7 중합효소 프로모터 시스템(WO 98/10088호); 테트라사이클린-억제성 시스템(문헌[Gossen et al, Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)]); 테트라사이클린-유도성 시스템(문헌[Gossen et al., Science, 268:1766-1769 (1995)]; 또한, 문헌[Harvey et al., Curr. Opin. Chem. Biol., 2:512-518 (1998)] 참조); RU486-유도성 시스템(문헌[Wang et al., Nat. Biotech., 15:239-243 (1997)] 및 문헌[Wang et al., Gene Ther., 4:432-441 (1997)]); 및 라파마이신-유도성 시스템(문헌[Magari et al., J. Clin. Invest., 100:2865-2872 (1997)]; 문헌[Rivera et al., Nat. Medicine. 2:1028-1032 (1996)])을 포함하여, 외인적으로 공급되는 화합물에 의해 시스로 또는 트랜스로 조절되는 것들이다. 이러한 맥락에서 유용할 수 있는 다른 유형의 유도성 프로모터는 특정 생리학적 상태, 예를 들어, 온도, 급성 단계에 의해 또는 오직 복제하는 세포에서만 조절되는 것들이다.
일부 실시형태에서, 관심 유전자 또는 핵산 서열에 대한 고유 프로모터가 사용된다. 유전자 또는 핵산 서열의 발현이 고유 발현을 모방하는 것이 요망되는 경우에 고유 프로모터가 사용될 수 있다. 유전자 또는 다른 핵산 서열의 발현이 일시적으로 또는 발달적으로, 또는 조직-특이적 방식으로 또는 특정 전사 자극에 반응하여 조절되어야 하는 경우에, 고유 프로모터가 사용될 수 있다. 추가의 실시형태에서, 다른 고유 발현 제어 요소, 예컨대, 인핸서 요소, 폴리아데닐화 부위 또는 코작(Kozak) 컨센서스 서열도 또한 고유 발현을 모방하기 위해 사용될 수 있다.
일부 실시형태에서, 유전 요소는 조직-특이적 프로모터에 작동 가능하게 연결된 유전자를 포함한다. 예를 들어, 골격근에서의 발현이 요망되는 경우, 근육에서 활성인 프로모터가 사용될 수 있다. 이들은 골격 α-액틴, 미오신 경쇄 2A, 디스트로핀, 근육 크레아틴 키나제를 인코딩하는 유전자로부터의 프로모터 및 자연-발생 프로모터보다 더 높은 활성을 갖는 합성 근육 프로모터를 포함한다. 문헌[Li et al., Nat. Biotech., 17:241-245 (1999)]을 참조한다. 특히 간 알부민, 문헌[Miyatake et al. J. Virol., 71:5124-32 (1997)]; B형 간염 바이러스 코어 프로모터, 문헌[Sandig et al., Gene Ther. 3:1002-9 (1996)]; 알파-태아단백질(AFP), 문헌[Arbuthnot et al., Hum. Gene Ther., 7:1503-14 (1996)], 골(오스테오칼신(osteocalcin), 문헌[Stein et al., Mol. Biol. Rep., 24:185-96 (1997)]; 골 시알로단백질(sialoprotein), 문헌[Chen et al., J. Bone Miner. Res. 11:654-64 (1996)]), 림프구(CD2, 문헌[Hansal et al., J. Immunol., 161:1063-8 (1998)]; 면역글로불린 중쇄; T 세포 수용체 a 쇄), 뉴런(뉴런-특이적 에놀라제(NSE) 프로모터, 문헌[Andersen et al. Cell. Mol. Neurobiol., 13:503-15 (1993)]; 신경필라멘트 경쇄 유전자, 문헌[Piccioli et al., Proc. Natl. Acad. Sci. USA, 88:5611-5 (1991)]; 뉴런-특이적 vgf 유전자, 문헌[Piccioli et al., Neuron, 15:373-84 (1995)]을 위한 조직-특이적인 프로모터의 예가 알려져 있다.
유전 요소는 인핸서, 예를 들어, 유전자를 인코딩하는 DNA 서열에 인접하여 위치한 DNA 서열을 포함할 수 있다. 인핸서 요소는 전형적으로 프로모터 요소의 상류에 위치하거나, 코딩 DNA 서열(예를 들어, 생성물 또는 생성물들로 전사 또는 번역되는 DNA 서열)의 하류에 또는 그 내에 위치할 수 있다. 그러므로, 인핸서 요소는 생성물을 인코딩하는 DNA 서열의 100개 염기쌍, 200개 염기쌍 또는 300개 이상의 염기쌍 상류 또는 하류에 위치할 수 있다. 인핸서 요소는 DNA 서열로부터 발현되는 재조합 생성물의 양을 프로모터 요소에 의해 제공되는 증가된 발현을 초과하여 증가시킬 수 있다. 다중의 인핸서 요소는 당업자에게 용이하게 이용 가능하다.
일부 실시형태에서, 유전 요소는 본원에 기재된 발현 생성물을 인코딩하는 서열을 플랭킹하는 하나 이상의 역위 말단 반복부(ITR)를 포함한다. 일부 실시형태에서, 유전 요소는 본원에 기재된 발현 생성물을 인코딩하는 서열을 플랭킹하는 하나 이상의 긴 말단 반복부(LTR)를 포함한다. 사용될 수 있는 프로모터 서열의 예는 시미안 바이러스 40(SV40) 조기 프로모터, 마우스 유방 종양 바이러스(MMTV), 인간 면역결핍 바이러스(HIV) 긴 말단 반복부(LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스테인-바 바이러스 즉시 조기 프로모터 및 라우스 육종 바이러스 프로모터를 포함하나 이들에 제한되지 않는다.
복제 단백질
일부 실시형태에서, 아넬로좀, 예를 들어, 합성 아넬로좀의 유전 요소는 하나 이상의 복제 단백질을 인코딩하는 서열을 포함할 수 있다. 일부 실시형태에서, 아넬로좀은 회전환 복제 방법에 의해 복제할 수 있으며, 예를 들어, 선도 가닥 및 지연 가닥의 합성은 분리된다. 이러한 실시형태에서, 아넬로좀은 3가지의 추가의 요소를 포함한다: i) 개시 단백질을 인코딩하는 유전자, ii) 이중 가닥 원점, 및 iii) 단일 가닥 원점. 복제 단백질을 포함하는 회전환 복제(RCR) 단백질 복합체는 선도 가닥에 결합하며, 복제 원점을 불안정화시킨다. RCR 복합체는 게놈을 절단하여, 유리 3'OH 말단을 생성한다. 세포 DNA 중합효소는 유리 3'OH 말단으로부터 바이러스 DNA 복제를 개시한다. 게놈이 복제된 후에, RCR 복합체는 루프를 공유적으로 폐쇄시킨다. 이는 양성 환형 단일-가닥 모 DNA 분자 및 음성 모체 가닥 및 새로 합성된 양성 가닥으로 구성된 환형 이중-가닥 DNA 분자의 방출을 야기한다. 단일-가닥 DNA 분자는 캡시드화되거나 제2차의 복제에 수반될 수 있다. 예를 들어, 문헌[Virology Journal 2009, 6:60 doi:10.1186/1743-422X-6-60]을 참조한다.
유전 요소는 중합효소, 예를 들어, RNA 중합효소 또는 DNA 중합효소를 인코딩하는 서열을 포함할 수 있다.
기타 서열
일부 실시형태에서, 유전 요소는 생성물(예를 들어, 리보자임, 단백질을 인코딩하는 치료적 mRNA, 외인성 유전자)을 인코딩하는 핵산을 추가로 포함한다.
일부 실시형태에서, 유전 요소는 아넬로좀의 종 및/또는 조직 및/또는 세포 향성(예를 들어, 캡시드 단백질 서열), 감염성(예를 들어, 캡시드 단백질 서열), 면역억제/활성화(예를 들어, 조절 핵산), 바이러스 게놈 결합 및/또는 패키징, 면역 회피(비-면역원성 및/또는 관용), 약동학, 엔도시토시스 및/또는 세포 부착, 핵 유입, 세포내 조절 및 국소화, 엑소시토시스 조절, 증식 및 숙주 또는 숙주 세포에서의 아넬로좀의 핵산 보호에 영향을 미치는 하나 이상의 서열을 포함한다.
일부 실시형태에서, 유전 요소는 DNA, RNA 또는 인공 핵산을 포함하는 다른 서열을 포함할 수 있다. 다른 서열은 게놈 DNA, cDNA, 또는 tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 다른 RNAi 분자를 인코딩하는 서열을 포함할 수 있지만, 이들에 제한되지 않는다. 일 실시형태에서, 유전 요소는 조절 핵산과 동일한 유전자 발현 생성물의 상이한 유전자좌를 표적화하기 위하여 siRNA를 인코딩하는 서열을 포함한다. 일 실시형태에서, 유전 요소는 조절 핵산과 상이한 유전자 발현 생성물을 표적화하기 위하여 siRNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 유전 요소는 하기의 서열 중 하나 이상을 추가로 포함한다: 하나 이상의 miRNA를 인코딩하는 서열, 하나 이상의 복제 단백질을 인코딩하는 서열, 외인성 유전자를 인코딩하는 서열, 치료제를 인코딩하는 서열, 조절 서열(예를 들어, 프로모터, 인핸서), 내인성 유전자를 표적화하는 하나 이상의 조절 서열(siRNA, lncRNA, shRNA)을 인코딩하는 서열, 및 치료적 mRNA 또는 단백질을 인코딩하는 서열.
다른 서열은 약 2 내지 약 5000개의 뉴클레오티드, 약 10 내지 약 100개의 뉴클레오티드, 약 50 내지 약 150개의 뉴클레오티드, 약 100 내지 약 200개의 뉴클레오티드, 약 150 내지 약 250개의 뉴클레오티드, 약 200 내지 약 300개의 뉴클레오티드, 약 250 내지 약 350개의 뉴클레오티드, 약 300 내지 약 500개의 뉴클레오티드, 약 10 내지 약 1000개의 뉴클레오티드, 약 50 내지 약 1000개의 뉴클레오티드, 약 100 내지 약 1000개의 뉴클레오티드, 약 1000 내지 약 2000개의 뉴클레오티드, 약 2000 내지 약 3000개의 뉴클레오티드, 약 3000 내지 약 4000개의 뉴클레오티드, 약 4000 내지 약 5000개의 뉴클레오티드 또는 그 사이의 임의의 범위의 길이를 가질 수 있다.
인코딩된 유전자
예를 들어, 유전 요소는 신호전달 생화학 경로와 연관된 유전자, 예를 들어, 신호전달 생화학 경로-연관 유전자 또는 폴리뉴클레오티드를 포함할 수 있다. 예에는 질병 연관 유전자 또는 폴리뉴클레오티드가 포함된다. "질병-연관" 유전자 또는 폴리뉴클레오티드는 비 질병 대조군의 조직 또는 세포와 비교하여, 질병-이환된 조직으로부터 유래된 세포에서 전사 또는 번역 생성물을 비정상적인 수준 또는 비정상적인 형태로 제공하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자일 수 있으며; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서, 변경된 발현은 질병의 발생 및/또는 진행과 상호연관된다. 질병-연관 유전자는 또한, 질병의 병인의 직접적인 원인이 되거나, 질병의 병인을 담당하는 유전자(들)와 연관 불균형인 돌연변이(들) 또는 유전적 변이를 지니는 유전자를 지칭한다.
질병-연관 유전자 및 폴리뉴클레오티드의 예는 맥쿠식-나탄스(McKusick-Nathans) 유전 의학 기관, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 국립 생명과학 정보 센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용 가능하다. 질병-연관 유전자 및 폴리뉴클레오티드의 예는 본원에 그들 전문이 참조로 포함되는 미국 특허 제8,697,359호의 표 A 및 B에 열거되어 있다. 질병 특이적 정보는 맥쿠식-나탄스 유전 의학 기관, 존스 홉킨스 대학(미국 메릴랜드주 볼티모어) 및 국립 생명과학 정보 센터, 국립 의학 도서관(미국 메릴랜드주 베데스다)로부터 이용 가능하다. 신호전달 생화학 경로-연관 유전자 및 폴리뉴클레오티드의 예는 본원에 전문이 참조로 포함되는 미국 특허 제8,697,359호의 표 A 내지 C에 열거되어 있다.
또한, 유전 요소는 본원의 다른 곳에 기재된 바와 같이 표적화 모이어티를 인코딩할 수 있다. 이는 예를 들어, 당, 당지질 또는 단백질, 예컨대 항체를 인코딩하는 폴리뉴클레오티드를 삽입함으로써 달성될 수 있다. 당업자는 표적화 모이어티의 추가의 생성 방법을 안다.
바이러스 서열
일부 실시형태에서, 유전 요소는 적어도 하나의 바이러스 서열을 포함한다. 일부 실시형태에서, 서열은 단일 가닥 DNA 바이러스, 예를 들어, 아넬로바이러스, 비드나바이러스, 써코바이러스, 제미니바이러스, 게노모바이러스, 이노바이러스, 마이크로바이러스, 나노바이러스, 파보바이러스 및 스피라바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다. 일부 실시형태에서, 서열은 이중 가닥 DNA 바이러스, 예를 들어, 아데노바이러스, 암풀라바이러스, 아스코바이러스, 아스파바이러스, 배큘로바이러스, 푸셀로바이러스, 글로불로바이러스, 구타바이러스, 하이트로사바이러스, 헤르페스바이러스, 이리도바이러스, 리포트릭스바이러스, 니마바이러스 및 폭스바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다. 일부 실시형태에서, 서열은 RNA 바이러스, 예를 들어, 알파바이러스, 푸로바이러스, 간염 바이러스, 호르데이바이러스, 토바모바이러스, 토브라바이러스, 트리코르나바이러스, 루비바이러스, 비르나바이러스, 시스토바이러스, 파르티티바이러스 및 레오바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는다.
일부 실시형태에서, 유전 요소는 비-병원성 바이러스, 예를 들어, 상리공생 바이러스, 예를 들어, 편리공생 바이러스, 예를 들어, 고유 바이러스, 예를 들어, 아넬로바이러스로부터의 하나 이상의 서열을 포함할 수 있다. 명명법의 최근의 변화는 인간 세포를 감염시킬 수 있는 3가지 아넬로바이러스를 알파토르크바이러스(TT), 베타토르크바이러스(TTM) 및 감마토르크바이러스(TTMD) 속의 아넬로바이러스과의 바이러스로 분류하였다. 현재까지, 아넬로바이러스는 임의의 인간 질병과 연관된 바 없다. 일부 실시형태에서, 유전 요소는 토르크 테노 바이러스(TT), 환형 음성-센스 게놈을 갖는 비-외피, 단일-가닥 DNA 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. 일부 실시형태에서, 유전 요소는 SEN 바이러스, 센티넬(Sentinel) 바이러스, TTV-유사 미니 바이러스 및 TT 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. TT 바이러스 유전형 6, TT 바이러스 군, TTV-유사 바이러스 DXL1 및 TTV-유사 바이러스 DXL2를 포함하는 상이한 유형의 TT 바이러스가 기재된 바 있다. 일부 실시형태에서, 유전 요소는 더 작은 바이러스, 토르크 테노-유사 미니 바이러스(TTM) 또는 토르크 테노-유사 미디 바이러스(TTMD)로 지칭되는 TTV와 TTMV 사이의 게놈 크기를 갖는 제3 바이러스에 대하여 상동성 또는 동일성을 갖는 서열을 포함할 수 있다. 일부 실시형태에서, 유전 요소는 본원에, 예를 들어, 표 19에 기재된 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 비-병원성 바이러스로부터의 하나 이상의 서열 또는 서열의 단편을 포함할 수 있다.
일부 실시형태에서, 유전 요소는 본원에, 예를 들어, 표 41에 기재된 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 실질적으로 비-병원성인 바이러스로부터의 하나 이상의 서열 또는 서열의 단편을 포함할 수 있다.
[표 41] 아넬로바이러스 및 그들의 서열의 예. 수탁 번호 및 관련 서열 정보는 2018년 12월 11일자 언급된 바와 같이 www.ncbi.nlm.nih.gov/genbank/ 에서 수득될 수 있다.
Figure pct00157
Figure pct00158
Figure pct00159
Figure pct00160
Figure pct00161
Figure pct00162
Figure pct00163
일부 실시형태에서, 유전 요소는 하나 이상의 비-아넬로바이러스, 예를 들어, 아데노바이러스, 헤르페스 바이러스, 폭스 바이러스, 백시니아 바이러스, SV40, 파필로마 바이러스, RNA 바이러스, 예컨대 레트로바이러스, 예를 들어, 렌티 바이러스, 단일-가닥 RNA 바이러스, 예를 들어, 간염 바이러스, 또는 이중-가닥 RNA 바이러스, 예를 들어, 로타바이러스로부터의 하나 이상의 서열에 대하여 상동성 또는 동일성을 갖는 하나 이상의 서열을 포함한다. 일부 실시형태에서, 재조합 레트로바이러스가 결함이 있기 때문에, 감염성 입자를 생성하도록 지원이 제공될 수 있다. 이러한 지원은 예를 들어, LTR 내의 조절 서열의 제어 하에 레트로바이러스의 구조적 유전자의 전부를 인코딩하는 플라스미드를 함유하는 헬퍼 세포주를 사용함으로써 제공될 수 있다. 본원에 기재된 아넬로좀을 복제하는 데 적합한 세포주는 해당 분야에 공지된 세포주, 예를 들어, 본원에 기재된 바와 같이 변형될 수 있는 A549 세포를 포함한다. 상기 유전 요소는 선택 가능한 마커를 인코딩하는 유전자를 추가로 함유하여, 요망되는 유전 요소가 확인되게 할 수 있다.
일부 실시형태에서, 유전 요소는 서열이 제1 뉴클레오티드 서열에 의해 인코딩되는 폴리펩티드와 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하게 유지되거나, 또는 다르게 본 발명을 실시하는 데 유용하다면, 인코딩된 폴리펩티드에 아미노산 차이를 초래하는 비-침묵 돌연변이, 예를 들어, 염기 치환, 결실 또는 부가를 포함한다. 이와 관련하여, 일반적으로 전체 단백질 기능을 불활성화시키지 않는 것으로 인식되는 특정 보존적 아미노산 치환이 이루어질 수 있다: 예컨대 양으로 하전된 아미노산(및 그의 역)에 관하여, 라이신, 아르기닌 및 히스티딘; 음으로 하전된 아미노산(및 그의 역)에 관하여, 아스파르트산 및 글루탐산; 및 특정 군의 중성으로 하전된 아미노산(및 모든 경우에, 또한 그의 역)에 관하여, (1) 알라닌 및 세린, (2) 아스파라긴, 글루타민 및 히스티딘, (3) 시스테인 및 세린, (4) 글리신 및 프롤린, (5) 이소류신, 류신 및 발린, (6) 메티오닌, 류신 및 이소류신, (7) 페닐알라닌, 메티오닌, 류신 및 티로신, (8) 세린 및 트레오닌, (9) 트립토판 및 티로신, (10) 및 예를 들어, 티로신, 트립토판 및 페닐알라닌. 아미노산은 물리적 특성 및 이차 및 삼차 단백질 구조에 대한 기여에 따라 분류될 수 있다. 보존적 치환은 하나의 아미노산의 유사한 특성을 갖는 또 다른 아미노산으로의 치환으로서 해당 분야에 인식된다.
동일한 또는 특정 백분율의 동일한 뉴클레오티드 또는 아미노산 잔기를 갖는 2개 이상의 핵산 또는 폴리펩티드 서열의 동일성(예를 들어, 비교 윈도우 또는 표기된 영역에 걸쳐 최대 상응성을 위해 비교되고 정렬되는 경우, 특정 영역에 걸쳐 약 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 동일성)은 하기 기재된 디폴트 파라미터와 함께 BLAST 또는 BLAST 2.0 서열 비교 알고리즘을 사용하여 또는 수동의 정렬 및 육안의 검사(예를 들어, NCBI 웹 사이트 www.ncbi.nlm.nih.gov/BLAST/ 등 참조)에 의해 측정될 수 있다. 동일성은 또한 시험 서열의 상보물을 지칭할 수 있거나 이에 적용될 수 있다. 동일성은 또한 결실 및/또는 부가를 갖는 서열 및 치환을 갖는 서열을 포함한다. 본원에 기재된 바와 같이, 알고리즘은 갭 등을 설명한다. 동일성은 적어도 약 10개 아미노산 또는 뉴클레오티드 길이, 약 15개 아미노산 또는 뉴클레오티드 길이, 약 20개 아미노산 또는 뉴클레오티드 길이, 약 25개 아미노산 또는 뉴클레오티드 길이, 약 30개 아미노산 또는 뉴클레오티드 길이, 약 35개 아미노산 또는 뉴클레오티드 길이, 약 40개 아미노산 또는 뉴클레오티드 길이, 약 45개 아미노산 또는 뉴클레오티드 길이, 약 50개 아미노산 또는 뉴클레오티드 길이 이상인 영역에 걸쳐 존재할 수 있다.
일부 실시형태에서, 유전 요소는 본원에 기재된, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 17 또는 41 중 어느 하나에 열거된 바와 같은 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 75% 뉴클레오티드 서열 동일성, 적어도 약 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 유전 암호가 축퇴성이기 때문에, 상동성 뉴클레오티드 서열은 임의의 수의 침묵 염기 변경, 즉, 그럼에도 불구하고 동일한 아미노산을 인코딩하는 뉴클레오티드 치환을 포함할 수 있다.
유전자 편집 성분
아넬로좀의 유전 요소는 유전자 편집 시스템의 성분을 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 예시적인 유전자 편집 시스템은 클러스터링된 규칙적으로 산재된 짧은 회문 반복부(CRISPR) 시스템, 아연 핑거 뉴클레아제(ZFN) 및 전사 활성화제-유사 이펙터-기반의 뉴클레아제(TALEN)를 포함한다. ZFN, TALEN 및 CRISPR-기반의 방법은 예를 들어, 문헌[Gaj et al. Trends Biotechnol. 31.7(2013):397-405]에 기재되어 있으며; 유전자 편집의 CRISPR 방법은 예를 들어, 문헌[Guan et al., Application of CRISPR-Cas system in gene therapy: Pre-clinical progress in animal model. DNA Repair 2016 Oct;46:1-8. doi: 10.1016/j.dnarep.2016.07.004]; 문헌[Zheng et al., Precise gene deletion and replacement using the CRISPR/Cas9 system in human cells. BioTechniques, Vol. 57, No. 3, September 2014, pp. 115-124]에 기재되어 있다.
CRISPR 시스템은 원래 박테리아 및 조류에서 관찰되는 적응 방어 시스템이다. CRISPR 시스템은 CRISPR-회합 또는 "Cas" 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)로 명명되는 RNA-가이드된 뉴클레아제를 사용하여, 외래 DNA를 절단한다. 전형적인 CRISPR/Cas 시스템에서, 엔도뉴클레아제는 단일- 또는 이중-가닥 DNA 서열을 표적화하는 서열-특이적 비-코딩 "가이드 RNA"에 의해 표적 뉴클레오티드 서열(예를 들어, 서열-편집될 게놈 내의 부위)에 지향된다. CRISPR 시스템의 3가지 부류(I 내지 III)가 확인된 바 있다. 부류 II CRISPR 시스템은 (다수의 Cas 단백질보다는) 단일의 Cas 엔도뉴클레아제를 사용한다. 하나의 부류 II CRISPR 시스템은 II형 Cas 엔도뉴클레아제, 예컨대 Cas9, CRISPR RNA("crRNA") 및 트랜스-활성화 crRNA("tracrRNA")를 포함한다. crRNA는 "가이드 RNA", 전형적으로 표적 DNA 서열에 상응하는 약 20-뉴클레오티드 RNA 서열을 함유한다. crRNA는 또한, tracrRNA에 결합하여, RNase III에 의해 절단되는 부분 이중-가닥 구조를 형성하여, crRNA/tracrRNA 혼성물을 초래하는 영역을 함유한다. 이어서, crRNA/tracrRNA 혼성물은 Cas9 엔도뉴클레아제가 표적 DNA 서열을 인식하고 절단하게 한다. 표적 DNA 서열은 일반적으로 주어진 Cas 엔도뉴클레아제에 특이적인 "프로토스페이서 인접 모티프"("PAM")에 인접해야 하지만; PAM 서열은 주어진 게놈의 도처에서 나타난다.
일부 실시형태에서, 아넬로좀은 CRISPR 엔도뉴클레아제에 대한 유전자를 포함한다. 예를 들어, 다양한 원핵생물 종으로부터 확인되는 일부 CRISPR 엔도뉴클레아제는 독특한 PAM 서열 요건을 가지며; PAM 서열의 예는 5'-NGG(스트렙토코커스 피오게네스(Streptococcus pyogenes)), 5'-NNAGAA(스트렙토코커스 써모필러스(Streptococcus thermophilus) CRISPR1), 5'-NGGNG(스트렙토코커스 써모필러스 CRISPR3) 및 5'-NNNGATT(네이세리아 메닌지디티스(Neisseria meningiditis))를 포함한다. 일부 엔도뉴클레아제, 예를 들어, Cas9 엔도뉴클레아제는 G-풍부 PAM 부위, 예를 들어, 5'-NGG와 회합되며, PAM 부위(이로부터 5')로부터 3개 뉴클레오티드 상류의 위치에서 표적 DNA의 블런트-말단 절단을 수행한다. 또 다른 부류 II CRISPR 시스템은 Cas9보다 더 작은 V형 엔도뉴클레아제 Cpf1을 포함하며; 예에는 AsCpf1(아시드아미노코커스(Acidaminococcus) 종 유래) 및 LbCpf1(라크노스피라세아에(Lachnospiraceae) 종 유래)이 포함된다. Cpf1 엔도뉴클레아제는 T-풍부 PAM 부위, 예를 들어, 5'-TTN과 회합된다. 또한, Cpf1은 5'-CTA PAM 모티프를 인식할 수 있다. Cpf1은 4- 또는 5-뉴클레오티드 5' 오버행을 갖는 오프셋 또는 스태거형 이중-가닥 파단부를 도입함으로써, 예를 들어, 코딩 가닥 상의 PAM 부위(그로부터 3')로부터 18개 뉴클레오티드 하류, 및 상보성 가닥 상의 PAM 부위로부터 23개 뉴클레오티드 하류에 위치한 5-뉴클레오티드 오프셋 또는 스태거형 절단으로 표적 DNA를 절단함으로써 표적 DNA를 절단하며; 이러한 오프셋 절단으로부터 초래되는 5-뉴클레오티드 오버행은 상동성 재조합에 의한 DNA 삽입에 의해 블런트-말단 절단된 DNA에서의 삽입에 의한 것보다 더욱 정밀한 게놈 편집을 가능하게 한다. 예를 들어, 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다.
다양한 CRISPR 회합(Cas) 유전자가 아넬로좀 내에 포함될 수 있다. 유전자의 구체적인 예는 Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1 또는 C2C3을 포함하는 부류 II 시스템으로부터의 Cas 단백질을 인코딩하는 것들이다. 일부 실시형태에서, 아넬로좀은 Cas 단백질, 예를 들어, 다양한 원핵생물 종 중 임의의 것으로부터의 것일 수 있는 Cas9 단백질을 인코딩하는 유전자를 포함한다. 일부 실시형태에서, 아넬로좀은 특정 Cas 단백질, 예를 들어, 특정 프로토스페이서-인접 모티프(PAM) 서열을 인식하도록 선택되는 특정 Cas9 단백질을 인코딩하는 유전자를 포함한다. 일부 실시형태에서, 아넬로좀은 세포, 접합체, 배아 또는 동물 내로 도입되어, 예를 들어, 동일한, 유사한 또는 상이한 PAM 모티프를 포함하는 부위의 인식 및 변형을 가능하게 할 수 있는 2가지 이상의 상이한 Cas 단백질 또는 2가지 이상의 Cas 단백질을 인코딩하는 핵산을 포함한다. 일부 실시형태에서, 아넬로좀은 불활성화된 뉴클레아제를 갖는 변형된 Cas 단백질, 예를 들어, 뉴클레아제-결함 Cas9를 인코딩하는 유전자를 포함한다.
야생형 Cas9 단백질이 gRNA에 의해 표적화된 특정 DNA 서열에서 이중-가닥 파단부(DSB)를 생성하는 한편, 변형된 기능을 갖는 수많은 CRISPR 엔도뉴클레아제가 알려져 있으며, 예를 들어, "닉카제" 버전의 Cas9는 오직 단일-가닥 파단만을 생성하며; 촉매적으로 비활성인 Cas9("dCas9")는 표적 DNA를 절단하지 않는다. dCas9를 인코딩하는 유전자를 이펙터 도메인을 인코딩하는 유전자와 융합시켜, 표적 유전자의 발현을 억제(CRISPRi)하거나 활성화(CRISPRa)시킬 수 있다. 예를 들어, 유전자는 전사 침묵화제(예를 들어, KRAB 도메인) 또는 전사 활성화제(예를 들어, dCas9-VP64 융합물)를 갖는 Cas9 융합물을 인코딩할 수 있다. 2개의 gRNA에 상동성인 표적 서열에 DSB를 생성하기 위하여, FokI 뉴클레아제에 융합된 촉매적 비활성 Cas9(dCas9)("dCas9-FokI")를 인코딩하는 유전자가 포함될 수 있다. 예를 들어, 애드진 레포지터리(Addgene repository)(Addgene, 75 Sidney St., Suite 550A, Cambridge, MA 02139; addgene.org/crispr/)에 개시되고, 그로부터 공개적으로 이용 가능한 수많은 CRISPR/Cas9 플라스미드를 참조한다. 각각 개별 가이드 RNA에 의해 유도되는, 2개의 개별 이중-가닥 파단을 도입하는 "이중 닉카제" Cas9는 더욱 정확한 게놈 편집을 달성하는 것으로 문헌[Ran et al. (2013) Cell, 154:1380 - 1389]에 기재되어 있다.
진핵생물의 유전자를 편집하기 위한 CRISPR 기술은 미국 특허 출원 공개 제2016/0138008A1호 및 제US2015/0344912A1호에, 그리고 미국 특허 제8,697,359호, 제8,771,945호, 제8,945,839호, 제8,999,641호, 제8,993,233호, 제8,895,308호, 제8,865,406호, 제8,889,418호, 제8,871,445호, 제8,889,356호, 제8,932,814호, 제8,795,965호 및 제8,906,616호에 개시되어 있다. Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 제2016/0208243 A1호에 개시되어 있다.
일부 실시형태에서, 아넬로좀은 본원에 기재된 폴리펩티드, 예를 들어, 표적화된 뉴클레아제, 예를 들어, Cas9, 예를 들어, 야생형 Cas9, 닉카제 Cas9(예를 들어, Cas9 D10A), 데드(dead) Cas9(dCas9), eSpCas9, Cpf1, C2C1 또는 C2C3, 및 gRNA를 인코딩하는 유전자를 포함한다. 뉴클레아제 및 gRNA(들)를 인코딩하는 유전자의 선택은 표적화된 돌연변이가 뉴클레오티드의 결실인지, 치환인지 또는 부가인지, 예를 들어, 표적화된 서열에 대한 뉴클레오티드의 결실인지, 치환인지 또는 부가인지에 의해 결정된다. (하나 이상의) 이펙터 도메인(예를 들어, VP64)의 전부 또는 그의 일부(예를 들어, 그의 생물학적 활성 부분)와 테더링된 촉매적 비활성 엔도뉴클레아제, 예를 들어, 데드 Cas9(dCas9, 예를 들어, D10A; H840A)를 인코딩하는 유전자는 하나 이상의 표적 핵산 서열의 활성 및/또는 발현을 조절할 수 있는 키메라 단백질을 생성한다.
본원에 사용되는 바와 같이, "이펙터 도메인의 생물학적 활성 부분"은 이펙터 도메인(예를 들어, "최소" 또는 "코어" 도메인)의 기능을 (예를 들어, 완전하게, 부분적으로 또는 최소로) 유지하는 부분이다. 일부 실시형태에서, 아넬로좀은 본원에 기재된 방법에서 유용한 키메라 단백질을 생성하기 위하여 하나 이상의 이펙터 도메인의 전부 또는 일부와 dCas9의 융합물을 인코딩하는 유전자를 포함한다. 따라서, 일부 실시형태에서, 아넬로좀은 dCas9-메틸라제 융합물을 인코딩하는 유전자를 포함한다. 다른 일부 실시형태에서, 아넬로좀은 내인성 유전자를 표적화하기 위하여 부위-특이적 gRNA와 함께 dCas9-효소 융합물을 인코딩하는 유전자를 포함한다.
다른 양태에서, 아넬로좀은 dCas9와 융합된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 이펙터 도메인(모든 또는 생물학적 활성 부분)을 인코딩하는 유전자를 포함한다.
단백질성 외부
일부 실시형태에서, 아넬로좀, 예를 들어, 합성 아넬로좀은 유전 요소를 봉입하는 단백질성 외부를 포함한다. 단백질성 외부는 포유동물에서 원치 않는 면역 반응을 유도하지 못하는 실질적으로 비-병원성인 외부 단백질을 포함할 수 있다. 아넬로좀의 단백질성 외부는 전형적으로 단백질성 외부를 구성하는 정20면체 형성으로 자가-어셈블될 수 있는 실질적으로 비-병원성인 단백질을 포함한다.
일부 실시형태에서, 단백질성 외부 단백질은 아넬로좀의 유전 요소의 서열에 의해 인코딩된다(예를 들어, 유전 요소와 시스로 존재한다). 다른 실시형태에서, 단백질성 외부 단백질은 아넬로좀의 유전 요소로부터 분리된 핵산에 의해 인코딩된다(예를 들어, 유전 요소와 트랜스로 존재한다).
일부 실시형태에서, 단백질, 예를 들어, 실질적으로 비-병원성인 단백질 및/또는 단백질성 외부 단백질은 하나 이상의 글리코실화된 아미노산, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상을 포함한다.
일부 실시형태에서, 단백질, 예를 들어, 실질적으로 비-병원성인 단백질 및/또는 단백질성 외부 단백질은 적어도 하나의 친수성 DNA-결합 영역, 아르기닌-풍부 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열 및 하나 이상의 이황화 가교를 포함한다.
일부 실시형태에서, 단백질은 캡시드 단백질이며, 예를 들어, 본원에 기재된 캡시드 단백질을 인코딩하는 뉴클레오티드 서열, 예를 들어, 표 1 내지 18, A1 내지 A12, B1 내지 B5, C1 내지 C5, D1 내지 D10 또는 20 내지 37 중 어느 하나에 열거된 바와 같은 아넬로바이러스 ORF1 서열 또는 캡시드 단백질 서열 중 어느 하나에 의해 인코딩되는 단백질에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 갖는다. 일부 실시형태에서, 단백질 또는 캡시드 단백질의 기능적 단편은 본원에 기재된 뉴클레오티드 서열, 예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5, D1 내지 D10 또는 20 내지 37 중 어느 하나에 열거된 바와 같은 아넬로바이러스 캡시드 서열 또는 캡시드 단백질 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 일부 실시형태에서, 단백질은 캡시드 뉴클레오티드 서열, 또는 본원에 기재된 뉴클레오티드 서열, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15 또는 17 중 어느 하나에 열거된 바와 같은 아넬로바이러스 캡시드 서열 또는 캡시드 단백질 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 뉴클레오티드 서열 동일성을 갖는 서열에 의해 인코딩되는 캡시드 단백질 또는 캡시드 단백질의 기능적 단편을 포함한다.
일부 실시형태에서, 아넬로좀은 캡시드 단백질 또는 캡시드 단백질의 기능적 단편, 또는 본원에 기재된 아미노산 서열, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나의 아넬로바이러스 캡시드 서열 또는 캡시드 단백질 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 인코딩하는 뉴클레오티드 서열을 포함한다. 일부 실시형태에서, 아넬로좀은 캡시드 단백질 또는 캡시드 단백질의 기능적 단편, 또는 본원에 기재된 아미노산 서열, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나의 아넬로바이러스 캡시드 서열 또는 캡시드 단백질 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 인코딩하는 뉴클레오티드 서열을 포함한다.
일부 실시형태에서, 아넬로좀은 본원에 기재된 아미노산 서열, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거되거나, 도 1에 나타낸 바와 같은 아넬로바이러스 아미노산 서열의 위치 약 1 내지 위치 약 150(예를 들어, 또는 각각의 범위 내의 아미노산의 임의의 하위집단, 예를 들어, 위치 약 20 내지 위치 약 35, 위치 약 25 내지 위치 약 30, 위치 약 26 내지 약 30), 위치 약 150 내지 위치 약 390(예를 들어, 또는 각각의 범위 내의 아미노산의 임의의 하위집단, 예를 들어, 위치 약 200 내지 위치 약 380, 위치 약 205 내지 위치 약 375, 위치 약 205 내지 약 371), 약 390 내지 위치 약 525, 위치 약 525 내지 위치 약 850(예를 들어, 또는 각각의 범위 내의 아미노산의 임의의 하위집단, 예를 들어, 위치 약 530 내지 위치 약 840, 위치 약 545 내지 위치 약 830, 위치 약 550 내지 약 820), 약 850 내지 위치 약 950(예를 들어, 또는 각각의 범위 내의 아미노산의 임의의 하위집단, 예를 들어, 위치 약 860 내지 위치 약 940, 위치 약 870 내지 위치 약 930, 위치 약 880 내지 약 923)을 갖는 아미노산 서열을 인코딩하는 뉴클레오티드 서열 또는 그의 기능적 단편을 포함한다. 일부 실시형태에서, 단백질은 아미노산 서열 또는 그의 기능적 단편, 또는 본원에 기재된 아미노산 서열, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거되거나, 도 1에 나타낸 바와 같은 아넬로바이러스 아미노산 서열의 위치 약 1 내지 위치 약 150 (예를 들어, 또는 본원에 기재된 바와 같은 각각의 범위 내의 아미노산의 임의의 하위집단), 위치 약 150 내지 위치 약 390, 위치 약 390 내지 위치 약 525, 위치 약 525 내지 위치 약 850, 위치 약 850 내지 위치 약 950에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다.
일부 실시형태에서, 단백질은 아미노산 서열 또는 그의 기능적 단편 또는 본원에 기재된 아미노산 서열 또는 아미노산의 범위 중 어느 하나, 예를 들어, 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나에 열거되거나 도 1에 나타낸 바와 같은 아넬로바이러스 아미노산 서열에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 더 낮은 서열 동일성을 갖는 아미노산의 범위는 본원에 기재된 특성 중 하나 이상 및 세포/조직/종 특이성(예를 들어, 향성)의 차이를 제공할 수 있다.
일부 실시형태에서, 아넬로좀은 단백질성 외부 내에 지질이 결여된다. 일부 실시형태에서, 아넬로좀에는 지질 이중층, 예를 들어, 바이러스 외피가 결여된다. 일부 실시형태에서, 아넬로좀의 내부는 단백질성 외부에 의해 완전히 덮인다(예를 들어, 100% 커버리지). 일부 실시형태에서, 아넬로좀의 내부는 단백질성 외부에 의해 100% 미만, 예를 들어, 95%, 90%, 85%, 80%, 70%, 60%, 50% 이하의 커버리지로 덮인다. 일부 실시형태에서, 단백질성 외부는 유전 요소가 아넬로좀에 보유되는 한, 예를 들어, 물, 이온, 펩티드 또는 소분자에 대한 투과 가능성을 허용하는 갭 또는 불연속부를 포함한다.
일부 실시형태에서, 단백질성 외부는 숙주 세포 내로의 유전 요소의 유입을 매개하기 위하여 숙주 세포를 특이적으로 인식하고/인식하거나 이에 결합하는 하나 이상의 단백질 또는 폴리펩티드, 예를 들어, 상보성 단백질 또는 폴리펩티드를 포함한다.
일부 실시형태에서, 단백질성 외부는 하기 중 하나 이상을 포함한다: 하나 이상의 글리코실화된 단백질, 친수성 DNA-결합 영역, 아르기닌-풍부 영역, 트레오닌-풍부 영역, 글루타민-풍부 영역, N-말단 폴리아르기닌 서열, 가변 영역, C-말단 폴리글루타민/글루탐산염 서열 및 하나 이상의 이황화 가교. 예를 들어, 단백질성 외부는 본원에 기재된 아넬로바이러스 ORF1에 의해 인코딩된 단백질을 포함한다.
일부 실시형태에서, 단백질성 외부는 하기의 특징 중 하나 이상을 포함한다: 정20면체 대칭, 하나 이상의 숙주 세포 분자와 상호작용하는 분자를 인식하고/인식하거나 이에 결합하여, 숙주 세포로의 유입을 매개함, 지질 분자가 결여됨, 탄수화물이 결여됨, pH 및 온도 안정성임, 세제 저항성임 및 숙주에서 실질적으로 비-면역원성이거나 실질적으로 비-병원성임.
II. 벡터
본원에 기재된 유전 요소는 벡터에 포함될 수 있다. 적합한 벡터 및 그들의 제조 및 그들의 이용 방법은 종래 기술에 널리 알려져 있다.
일 양태에서, 본 발명은 (i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합시키는 외부 단백질 결합 서열, 및 (iii) 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소를 포함하는 벡터를 포함한다.
유전 요소 또는 유전 요소 내의 임의의 서열은 임의의 적합한 방법을 사용하여 수득될 수 있다. 다양한 재조합 방법, 예를 들어, 바이러스 서열을 갖는 세포로부터 라이브러리의 스크리닝, 이를 포함하는 것으로 알려져 있는 벡터로부터 서열의 유도, 또는 표준 기법을 사용한 이를 함유하는 세포 및 조직으로부터의 직접적인 단리가 해당 분야에 알려져 있다. 대안적으로 또는 조합하여, 유전 요소의 일부 또는 전부는 클로닝보다는 합성에 의해 생성될 수 있다.
일부 실시형태에서, 벡터는 조절 요소, 표적 유전자에 상동성인 핵산 서열, 및 생존 가능한 세포 내에서 및/또는 세포내 분자가 표적 세포 내에 존재하는 경우 리포터 분자의 발현을 야기하기 위한 다양한 리포터 구축물을 포함한다.
잠재적으로 트랜스펙션된 세포를 확인하고, 조절 서열의 기능을 평가하기 위한 리포터 유전자가 사용된다. 일반적으로, 리포터 유전자는 수여자 유기체 또는 조직에 존재하거나 그에 의해 발현되지 않고, 발현이 다소 용이하게 검출 가능한 특성, 예를 들어, 효소 활성에 의해 나타나는 폴리펩티드를 인코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수여자 세포 내로 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비된 알칼리성 포스파타제 또는 녹색 형광 단백질 유전자를 인코딩하는 유전자를 포함할 수 있다(예를 들어, 문헌[Ui-Tei et al., 2000 FEBS Letters 479: 79-82]). 적합한 발현 시스템은 널리 알려져 있으며, 공지된 기법을 사용하여 제조되거나 상업적으로 수득될 수 있다. 일반적으로, 가장 높은 리포터 유전자의 발현 수준을 보이는 최소 5' 플랭킹 영역을 갖는 구축물은 프로모터로서 확인된다. 이러한 프로모터 영역은 리포터 유전자에 연결되고, 프로모터-유도 전사를 조절하는 능력에 대하여 작용제를 평가하기 위해 사용될 수 있다.
일부 실시형태에서, 벡터는 실질적으로 비-병원성이고/이거나 숙주 세포 내에 실질적으로 비-통합되거나, 숙주에서 실질적으로 비-면역원성이다.
일부 실시형태에서, 벡터는 표현형, 바이러스 수준, 유전자 발현, 다른 바이러스와의 경쟁, 병태 등 중 하나 이상을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상 조절하기에 충분한 양으로 존재한다.
III. 조성물
본원에 기재된 아넬로좀 또는 벡터는 또한 예를 들어, 본원에 기재된 바와 같이, 약제학적 부형제와 함께 약제학적 조성물에 포함될 수 있다. 일부 실시형태에서, 약제학적 조성물은 적어도 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014 또는 1015개의 아넬로좀을 포함한다. 일부 실시형태에서, 약제학적 조성물은 약 105 내지 1015, 105 내지 1010 또는 1010 내지 1015개의 아넬로좀을 포함한다. 일부 실시형태에서, 약제학적 조성물은 약 108(예를 들어, 약 105, 106, 107, 108, 109 또는 1010) 게놈 당량/㎖의 아넬로좀을 포함한다. 일부 실시형태에서, 약제학적 조성물은 예를 들어, 실시예 18의 방법에 따라 결정시, 105 내지 1010, 106 내지 1010, 107 내지 1010, 108 내지 1010, 109 내지 1010, 105 내지 106, 105 내지 107, 105 내지 108, 105 내지 109, 105 내지 1011, 105 내지 1012, 105 내지 1013, 105 내지 1014, 105 내지 1015 또는 1010 내지 1015 게놈 당량/㎖의 아넬로좀을 포함한다. 일부 실시형태에서, 약제학적 조성물은 세포당 아넬로좀에 포함되는 적어도 1, 2, 5 또는 10, 100, 500, 1000, 2000, 5000, 8,000, 1 x 104, 1 x 105, 1 x 106, 1 x 107개 이상의 카피의 유전 요소를 진핵 세포의 집단에 운반하기에 충분한 아넬로좀을 포함한다. 일부 실시형태에서, 약제학적 조성물은 세포당 아넬로좀에 포함되는 적어도 약 1 x 104, 1 x 105, 1 x 106, 1 x 또는 107 또는 약 1 x 104 내지 1 x 105, 1 x 104 내지 1 x 106, 1 x 104 내지 1 x 107, 1 x 105 내지 1 x 106, 1 x 105 내지 1 x 107 또는 1 x 106 내지 1 x 107개 카피의 유전 요소를 진핵 세포의 집단에 운반하기에 충분한 아넬로좀을 포함한다.
일부 실시형태에서, 약제학적 조성물은 하기의 특징 중 하나 이상을 갖는다: 약제학적 조성물이 약제학적 또는 우수 제조 기준(GMP) 표준을 충족하거나; 약제학적 조성물을 우수 제조 기준(GMP)에 따라 제조하거나; 약제학적 조성물이 사전결정된 기준 값 미만의 병원체 수준을 갖거나, 예를 들어, 실질적으로 병원체가 없거나; 약제학적 조성물이 사전결정된 기준 값 미만의 오염물질 수준을 갖거나, 예를 들어, 실질적으로 오염물질이 없거나; 또는 약제학적 조성물이 낮은 면역원성을 갖거나, 예를 들어, 본원에 기재된 바와 같이 실질적으로 비-면역원성임.
일부 실시형태에서, 약제학적 조성물은 임계값 미만의 양의 하나 이상의 오염물질을 포함한다. 약제학적 조성물에서 바람직하게는 배제되거나 최소화되는 예시적인 오염물질은 제한 없이, 숙주 세포 핵산(예를 들어, 숙주 세포 DNA 및/또는 숙주 세포 RNA), 동물-유래 성분(예를 들어, 혈청 알부민 또는 트립신), 복제-적격 바이러스, 비-감염성 입자, 유리 바이러스 캡시드 단백질, 외래 작용제 및 응집물을 포함한다. 실시형태들에서, 오염물질은 숙주 세포 DNA이다. 실시형태들에서, 조성물은 용량당 약 10 ng 미만의 숙주 세포 DNA를 포함한다. 실시형태들에서, 조성물 중 숙주 세포 DNA의 수준은 여과 및/또는 숙주 세포 DNA의 효소적 분해에 의해 감소된다. 실시형태들에서, 약제학적 조성물은 중량 기준 10% 미만(예를 들어, 약 10%, 5%, 4%, 3%, 2%, 1%, 0.5% 또는 0.1% 미만)의 오염물질로 이루어진다.
일 양태에서, 본원에 기재된 본 발명은 하기를 포함하는 약제학적 조성물을 포함한다:
a) (i) 비-병원성 외부 단백질을 인코딩하는 서열, (ii) 유전 요소를 비-병원성 외부 단백질에 결합하는 외부 단백질 결합 서열, 및 (iii) 조절 핵산을 인코딩하는 서열을 포함하는 유전 요소; 및 유전 요소와 회합된, 예를 들어, 이를 봉입하거나 둘러싸는 단백질성 외부를 포함하는 아넬로좀; 및
b) 약제학적 부형제.
소낭
일부 실시형태에서, 조성물은 운반체 성분, 예를 들어, 마이크로입자, 리포좀, 소낭 또는 엑소좀을 추가로 포함한다. 일부 실시형태에서, 리포좀은 내부 수성 구획을 둘러싸는 단일- 또는 다중라멜라 지질 이중층 및 상대적으로 불투과성인 외부 친지성 인지질 이중층으로 구성된 구형 소낭 구조를 포함한다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 일반적으로 생체적합성, 비독성이며, 친수성 및 친지성 약물 분자 둘 모두를 운반하고, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호하고, 생물학적 막을 가로질러 그들의 로드를 수송할 수 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
소낭은 몇몇 상이한 유형의 지질로부터 제조될 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 흔히 사용된다. 소낭은 제한 없이, DOTMA, DOTAP, DOTIM, DDAB를 단독으로 또는 콜레스테롤과 함께 포함하여, DOTMA 및 콜레스테롤, DOTAP 및 콜레스테롤, DOTIM 및 콜레스테롤, 및 DDAB 및 콜레스테롤을 제공할 수 있다. 다중라멜라 소낭 지질의 제조 방법은 해당 분야에 알려져 있다(예를 들어, 다중라멜라 소낭 지질 제제에 관한 교시가 본원에 참조로 포함되는 미국 특허 제6,693,086호 참조). 지질 필름이 수용액과 혼합되는 경우 소낭 형성은 자발적일 수 있지만, 이는 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용함으로써 진탕 형태로 힘을 가함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 압출된 지질은 압출된 지질 제제에 관한 교시가 본원에 참조로 포함되는 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이 감소하는 크기의 필터를 통해 압출시킴으로써 제조될 수 있다.
본원에 기재된 바와 같이, 첨가제를 소낭에 첨가하여, 그들의 구조 및/또는 특성을 변형시킬 수 있다. 예를 들어, 콜레스테롤 또는 스핑고미엘린을 혼합물에 첨가하여, 구조의 안정화 및 내부 카고의 누출의 방지를 도울 수 있다. 추가로, 소낭은 수소화된 난(egg) 포스파티딜콜린 또는 난 포스파티딜콜린, 콜레스테롤 및 디세틸 포스페이트로부터 제조될 수 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 또한, 소낭은 합성 동안 또는 그 후에 수여자 세포 상의 반응성 기에 상보성인 반응성 기를 포함하도록 표면 변형될 수 있다. 이러한 반응성 기는 제한 없이, 말레이미드 기를 포함한다. 일 예로서, 소낭은 말레이미드 컨쥬게이트된 인지질, 예컨대 제한 없이 DSPE-MaL-PEG2000을 포함하도록 합성될 수 있다.
소낭 형성은 주로 천연 인지질 및 지질, 예컨대 1,2-다이스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 난 포스파티딜콜린 및 모노시알로강글리오시드로 구성될 수 있다. 인지질만으로 제조된 제형은 혈장에서 덜 안정하다. 그러나, 콜레스테롤을 사용한 지질 막의 조작은 캡슐화된 카고의 신속한 방출을 감소시키거나, 1,2-다이올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
실시형태들에서, 지질은 지질 마이크로입자를 형성하기 위해 사용될 수 있다. 지질은 DLin-KC2-DMA4, C12-200 및 공지질 디스테로일포스파티딜 콜린을 포함하지만 이들로 제한되지 않으며, 콜레스테롤 및 PEG-DMG는 자발적 소낭 형성 절차를 사용하여 제형화될 수 있다(예를 들어, 문헌[Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3] 참조). 성분 몰비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 테크미라(Tekmira)는 모두가 본 발명에 사용될 수 있고/있거나 조정될 수 있는 지질 마이크로입자 및 지질 마이크로입자 제형의 다양한 양태에 관한, 미국 및 해외에서의 대략 95개의 특허 패밀리의 포트폴리오를 갖는다(예를 들어, 미국 특허 제7,982,027호; 제7,799,565호; 제8,058,069호; 제8,283,333호; 제7,901,708호; 제7,745,651호; 제7,803,397호; 제8,101,741호; 제8,188,263호; 제7,915,399호; 제8,236,943호 및 제7,838,658호 및 유럽 특허 제1766035호; 제1519714호; 제1781593호 및 제1664316호 참조).
일부 실시형태에서, 마이크로입자는 무작위 방식으로 배열된 하나 이상의 고형화된 폴리머(들)를 포함한다. 마이크로입자는 생분해성일 수 있다. 생분해성 마이크로입자는 예를 들어, 제한 없이, 용매 증발, 핫 멜트 마이크로캡슐화, 용매 제거 및 분무 건조를 포함하는 해당 분야에 알려져 있는 방법을 사용하여 합성될 수 있다. 마이크로입자를 합성하기 위한 예시적인 방법은 문헌[Bershteyn et al., Soft Matter 4:1787-1787, 2008] 및 US 2008/0014144 A1호에 기재되어 있으며, 마이크로입자 합성에 관한 그의 구체적인 교시는 본원에 참조로 포함된다.
생분해성 마이크로입자를 형성하기 위해 사용될 수 있는 예시적인 합성 폴리머는 제한 없이, 지방족 폴리에스테르, 폴리 (락트산)(PLA), 폴리 (글리콜산)(PGA), 락트산 및 글리콜산의 코폴리머(PLGA), 폴리카프로락톤(PCL), 다가무수물(polyanhydride), 폴리(오르쏘)에스테르, 폴리우레탄, 폴리(부티르산), 폴리(발레르산) 및 폴리(락티드-코-카프로락톤) 및 천연 폴리머, 예컨대 알부민, 알긴산염 및 덱스트란 및 셀룰로스를 포함하는 기타 다당류, 콜라겐, 예컨대, 예를 들어, 알킬, 알킬렌과 같은 화학 기의 치환, 부가, 하이드록실화, 산화 및 당업자에 의해 일상적으로 이루어지는 기타 변형을 포함하는 그의 화학적 유도체, 알부민 및 기타 친수성 단백질, 제인 및 기타 프롤라민 및 소수성 단백질, 그의 코폴리머 및 혼합물을 포함한다. 일반적으로, 이들 물질은 효소적 가수분해 또는 물로의 노출에 의해, 표면 또는 벌크 침식에 의해 분해된다.
마이크로입자의 직경은 0.1 내지 1000 마이크로미터(㎛) 범위이다. 일부 실시형태에서, 그들의 직경은 크기가 1 내지 750 ㎛, 또는 50 내지 500 ㎛, 또는 100 내지 250 ㎛의 범위이다. 일부 실시형태에서, 그들의 직경은 크기가 50 내지 1000 ㎛, 50 내지 750 ㎛, 50 내지 500 ㎛, 또는 50 내지 250 ㎛의 범위이다. 일부 실시형태에서, 그들의 직경은 크기가 .05 내지 1000 ㎛, 10 내지 1000 ㎛, 100 내지 1000 ㎛, 또는 500 내지 1000 ㎛의 범위이다. 일부 실시형태에서, 그들의 직경은 약 0.5 ㎛, 약 10 ㎛, 약 50 ㎛, 약 100 ㎛, 약 200 ㎛, 약 300 ㎛, 약 350 ㎛, 약 400 ㎛, 약 450 ㎛, 약 500 ㎛, 약 550 ㎛, 약 600 ㎛, 약 650 ㎛, 약 700 ㎛, 약 750 ㎛, 약 800 ㎛, 약 850 ㎛, 약 900 ㎛, 약 950 ㎛ 또는 약 1000 ㎛이다. 마이크로입자 직경의 맥락에서 사용되는 바와 같이, 용어 "약"은 언급된 절대값의 +/-5%를 의미한다.
일부 실시형태에서, 리간드는 입자의 표면 상에 존재하고, 부착될 리간드 상에 존재하는 작용성 화학 기(카복실산, 알데히드, 아민, 술프하이드릴 및 하이드록실)를 통해 마이크로입자의 표면에 컨쥬게이트된다. 작용성은 예를 들어, 마이크로입자의 에멀젼 제조 동안 작용성 화학 기를 갖는 안정화제의 혼입에 의해 마이크로입자 내로 도입될 수 있다.
작용성 기를 마이크로입자에 도입하는 또 다른 예는 입자 제조 후 동안, 입자 및 리간드를 동종- 또는 이종 이작용성 가교결합제와 직접 가교결합시킴으로써 이루어진다. 이러한 절차는 적합한 화학물질 및 소정의 부류의 가교결합제(하기에 더욱 상세히 논의된 바와 같은 CDI, EDAC, 글루타르알데히드 등) 또는 제조 후에 입자 표면의 화학적 변형을 통해 리간드를 입자 표면에 커플링시키는 임의의 다른 가교결합제를 사용할 수 있다. 이는 또한 양친매성 분자, 예컨대 지방산, 지질 또는 기능적 안정화제가 입자 표면에 수동으로 흡수되고 부착되어, 그에 의해 리간드로의 테더링을 위한 작용성 말단 기를 도입할 수 있는 과정을 포함한다.
일부 실시형태에서, 마이크로입자는 그들의 외부 표면 상에 하나 이상의 표적화 기를 포함하도록 합성하여, 특정 세포 또는 조직 유형(예를 들어, 심근세포)을 표적화할 수 있다. 이들 표적화 기는 제한 없이, 수용체, 리간드, 항체 등을 포함한다. 이들 표적화 기는 세포의 표면 상의 그들의 파트너와 결합한다. 일부 실시형태에서, 마이크로입자는 세포 표면을 포함하는 지질 이중층 내로 통합될 것이며, 미토콘드리아는 세포로 운반된다.
마이크로입자는 또한, 그들의 최외각 표면 상에 지질 이중층을 포함할 수 있다. 이러한 이중층은 동일하거나 상이한 유형의 하나 이상의 지질로 구성될 수 있다. 예는 인지질, 예컨대 포스포콜린 및 포스포이노시톨을 포함하지만, 이들에 제한되지 않는다. 구체적인 예는 제한 없이, DMPC, DOPC, DSPC 및 다양한 다른 지질, 예컨대 리포좀에 대하여 본원에 기재된 것들을 포함한다.
일부 실시형태에서, 담체는 예를 들어, 본원에 기재된 바와 같은 나노입자를 포함한다.
일부 실시형태에서, 본원에 기재된 소낭 또는 마이크로입자는 진단제로 작용화된다. 진단제의 예는 양전자 방사 단층촬영(PET), 컴퓨터 보조 단층촬영(CAT), 단일 광자 방출 컴퓨터 단층촬영, x-선, 형광투시법 및 자기 공명 영상화(MRI)에 사용되는 상업적으로 이용 가능한 영상화제; 및 조영제를 포함하지만, 이들에 제한되지 않는다. MRI에서 조영제로서 사용하기에 적합한 물질의 예는 가돌리늄 킬레이트, 및 철, 마그네슘, 망간, 구리 및 크롬을 포함한다.
담체
본원에 기재된 조성물(예를 들어, 약제학적 조성물)은 담체를 포함하고/포함하거나, 이와 함께 제형화되고/제형화되거나, 이 내에서 운반될 수 있다. 일 양태에서, 본 발명은 본원에 기재된 조성물(예를 들어, 본원에 기재된 아넬로좀, 아넬로바이러스, 아넬로벡터 또는 유전 요소)을 포함하는(예를 들어, 캡슐화하는) 담체(예를 들어, 소낭, 리포좀, 지질 나노입자, 엑소좀, 적혈구, 엑소좀(예를 들어, 포유동물 또는 식물 엑소좀), 푸소좀)를 포함하는 조성물, 예를 들어, 약제학적 조성물을 포함한다.
일부 실시형태에서, 본원에 기재된 조성물 및 시스템은 리포좀 또는 다른 유사한 소낭 내에 제형화될 수 있다. 일반적으로, 리포좀은 내부 수성 구획을 둘러싸는 단일- 또는 다중라멜라 지질 이중층 및 상대적으로 불투과성인 외부 친지성 인지질 이중층으로 구성된 구형 소낭 구조이다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 일반적으로 하기의 특징 중 하나 이상(예를 들어, 전부)을 갖는다: 생체적합성, 비독성, 친수성 및 친지성 약물 분자 둘 모두를 운반할 수 있음, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호할 수 있음 및 생물학적 막 및 혈액 뇌 장벽(BBB)을 가로질러 그들의 로드를 수송할 수 있음(예를 들어, 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679]; 및 문헌[Zylberberg & Matosevic. 2016. Drug Delivery, 23:9, 3319-3329, doi: 10.1080/10717544.2016.1177136] 참조).
소낭은 몇몇 상이한 유형의 지질로부터 제조될 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 흔히 사용된다. 다중라멜라 소낭 지질의 제조 방법은 공지되어 있다(예를 들어, 미국 특허 제6,693,086호를 참조하며, 다중라멜라 소낭 지질 제제에 관한 이의 교시는 본원에 참조로 포함된다). 소낭 형성은 지질막을 수성 용액과 혼합하는 경우에 자발적일 수 있지만, 그것은 균질화기, 초음파기 또는 압출 장치를 사용함으로써 진탕 형태의 힘을 인가함으로써 촉진될 수도 있다(예를 들어, 검토를 위하여 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 압출된 지질은 예를 들어, 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이, 감소하는 크기의 필터를 통한 압출에 의해 제조될 수 있다.
지질 나노입자(LNP)는 본원에 기재된 약제학적 조성물을 위한 생체적합성 및 생분해성 운반 시스템을 제공하는 담체의 또 다른 예이다. 예를 들어, 문헌[Gordillo-Galeano et al. European Journal of Pharmaceutics and Biopharmaceutics. Volume 133, December 2018, Pages 285-308]을 참조한다. 나노구조화된 지질 담체(NLC)는 변형된 고체 지질 나노입자(SLN)의 특징을 보유하고, 약물 안정성 및 로딩 능력을 개선시키고, 약물 누출을 방지하는 변형된 고체 지질 나노입자(SLN)이다. 폴리머 나노입자(PNP)는 약물 운반의 중요한 구성성분이다. 이들 나노입자는 특정 표적으로의 약물 운반을 효율적으로 유도하고, 약물 안정성 및 제어된 약물 방출을 개선시킬 수 있다. 리포좀과 폴리머를 조합한 새로운 유형의 담체인, 지질-중합체 나노입자(PLN)도 또한 사용될 수 있다. 이들 나노입자는 PNP와 리포좀의 보완적인 이점을 보유한다. PLN는 코어(core)-쉘(shell) 구조로 구성된다; 폴리머 코어는 안정한 구조를 제공하며, 인지질 쉘(shell)은 우수한 생체적합성을 제공한다. 이와 같이, 2가지 구성성분은 약물 캡슐화 효율을 증가시키고, 표면 변형을 용이하게 하고, 수용성 약물의 누출을 방지한다. 검토를 위하여, 예를 들어, 문헌[Li et al. 2017, Nanomaterials 7, 122; doi:10.3390/nano7060122]을 참조한다.
엑소좀도 또한, 본원에 기재된 조성물 및 시스템을 위한 약물 운반 비히클로서 사용될 수 있다. 검토를 위하여, 문헌[Ha et al. July 2016. Acta Pharmaceutica Sinica B. Volume 6, Issue 4, Pages 287-296; doi.org/10.1016/j.apsb.2016.02.001]을 참조한다.
생체 외 분화된 적혈구도 또한, 본원에 기재된 조성물을 위한 담체로서 사용될 수 있다. 예를 들어, WO2015073587호; WO2017123646호; WO2017123644호; WO2018102740호; WO2016183482호; WO2015153102호; WO2018151829호; WO2018009838호; 문헌[Shi et al. 2014. Proc Natl Acad Sci USA. 111(28): 10131-10136]; 미국 특허 제9,644,180호; 문헌[Huang et al. 2017. Nature Communications 8: 423]; 문헌[Shi et al. 2014. Proc Natl Acad Sci USA. 111(28): 10131-10136]을 참조한다.
예를 들어, WO2018208728호에 기재된 바와 같은 푸소좀 조성물도 또한 본원에 기재된 조성물을 운반하기 위한 담체로서 사용될 수 있다.
막 투과성 폴리펩티드
일부 실시형태에서, 조성물은 세포 내로 또는 막, 예를 들어, 세포 또는 핵 막을 가로질러 성분을 운반하도록 막 투과성 폴리펩티드(MPP)를 추가로 포함한다. 막을 가로질러 물질의 수송을 용이하게 할 수 있는 막 투과성 폴리펩티드는 세포-투과 펩티드(CPP)(예를 들어, 미국 특허 제8,603,966호 참조), 식물 세포내 운반을 위한 융합 펩티드(예를 들어, 문헌[Ng et al., PLoS One, 2016, 11:e0154081] 참조), 단백질 변환 도메인, 트로얀(Trojan) 펩티드, 및 막 전위 신호(MTS)(예를 들어, 문헌[Tung et al., Advanced Drug Delivery Reviews 55:281-294 (2003)] 참조)를 포함하지만, 이들에 제한되지 않는다. 일부 MPP는 양으로 하전된 측쇄를 갖는 아미노산, 예컨대 아르기닌이 풍부하다.
막 투과성 폴리펩티드는 전신 투여 시에 생체 내에서 다중의 조직의 세포 내에서, 성분의 막 투과를 유도하고, 거대분자 전위를 가능하게 하는 능력을 갖는다. 막 투과성 폴리펩티드는 또한, 적절한 조건 하에서 세포와 접촉되는 경우, 외부 환경으로부터 세포질, 세포소기관, 예컨대 미토콘드리아 또는 세포의 핵을 포함하는 세포내 환경에, 수동 확산으로 달성될 것보다 유의미하게 더 큰 양으로 통과하는 펩티드를 지칭할 수 있다.
막을 가로질러 수송되는 성분은 막 투과성 폴리펩티드와 가역적으로 또는 비가역적으로 연결될 수 있다. 링커는 화학적 결합, 예를 들어, 하나 이상의 공유 결합 또는 비-공유 결합일 수 있다. 일부 실시형태에서, 링커는 펩티드 링커이다. 이러한 링커는 2 내지 30개 아미노산 이상일 수 있다. 링커는 유연성, 강성 또는 절단 가능한 링커를 포함한다.
조합
일 양태에서, 본원에 기재된 아넬로좀 또는 아넬로좀을 포함하는 조성물은 또한, 하나 이상의 이종성 모이어티를 포함할 수 있다. 일 양태에서, 본원에 기재된 아넬로좀 또는 아넬로좀을 포함하는 조성물은 또한, 융합물 내에 하나 이상의 이종성 모이어티를 포함할 수 있다. 일부 실시형태에서, 이종성 모이어티는 유전 요소와 연결될 수 있다. 일부 실시형태에서, 이종성 모이어티는 아넬로좀의 일부로서 단백질성 외부에 봉입될 수 있다. 일부 실시형태에서, 이종성 모이어티는 아넬로좀과 함께 투여될 수 있다.
일 양태에서, 본 발명은 본원에 기재된 아넬로좀 및 이종성 모이어티 중 어느 하나를 포함하는 세포 또는 조직을 포함한다.
또 다른 양태에서, 본 발명은 본원에 기재된 아넬로좀 및 이종성 모이어티를 포함하는 약제학적 조성물을 포함한다.
일부 실시형태에서, 이종성 모이어티는 바이러스(예를 들어, 이펙터(예를 들어, 약물, 소분자)), 표적화제(예를 들어, DNA 표적화제, 항체, 수용체 리간드), 태그(예를 들어, 형광단, 감광성 작용제, 예컨대 킬러레드(KillerRed)) 또는 본원에 기재된 편집 또는 표적화 모이어티일 수 있다. 일부 실시형태에서, 본원에 기재된 막 전위 폴리펩티드는 하나 이상의 이종성 모이어티에 연결된다. 일 실시형태에서, 이종성 모이어티는 소분자(예를 들어, 펩티드 모방체 또는 2000 달톤 미만의 분자량을 갖는 작은 유기 분자), 펩티드 또는 폴리펩티드(예를 들어, 항체 또는 그의 항원-결합 단편), 나노입자, 압타머 또는 약리학적 작용제(pharmacoagent)이다.
바이러스
일부 실시형태에서, 조성물은 이종성 모이어티로서 바이러스, 예를 들어, 단일 가닥 DNA 바이러스, 예를 들어, 아넬로바이러스, 비드나바이러스, 써코바이러스, 제미니바이러스, 게노모바이러스, 이노바이러스, 마이크로바이러스, 나노바이러스, 파보바이러스 및 스피라바이러스를 추가로 포함할 수 있다. 일부 실시형태에서, 조성물은 이중 가닥 DNA 바이러스, 예를 들어, 아데노바이러스, 암풀라바이러스, 아스코바이러스, 아스파바이러스, 배큘로바이러스, 푸셀로바이러스, 글로불로바이러스, 구타바이러스, 하이트로사바이러스, 헤르페스바이러스, 이리도바이러스, 리포트릭스바이러스, 니마바이러스 및 폭스바이러스를 추가로 포함할 수 있다. 일부 실시형태에서, 조성물은 RNA 바이러스, 예를 들어, 알파바이러스, 푸로바이러스, 간염 바이러스, 호르데이바이러스, 토바모바이러스, 토브라바이러스, 트리코르나바이러스, 루비바이러스, 비르나바이러스, 시스토바이러스, 파르티티바이러스 및 레오바이러스를 추가로 포함할 수 있다. 일부 실시형태에서, 아넬로좀은 이종성 모이어티로서 바이러스와 함께 투여된다.
일부 실시형태에서, 이종성 모이어티는 비-병원성, 예를 들어, 상리공생, 편리공생, 고유 바이러스를 포함할 수 있다. 일부 실시형태에서, 비-병원성 바이러스는 하나 이상의 아넬로바이러스, 예를 들어, 알파토르크바이러스(TT), 베타토르크바이러스(TTM) 및 감마토르크바이러스(TTMD)이다. 일부 실시형태에서, 아넬로바이러스는 토르크 테노 바이러스(TT), SEN 바이러스, 센티넬 바이러스, TTV-유사 미니 바이러스, TT 바이러스, TT 바이러스 유전형 6, TT 바이러스 군, TTV-유사 바이러스 DXL1, TTV-유사 바이러스 DXL2, 토르크 테노-유사 미니 바이러스(TTM) 또는 토르크 테노-유사 미디 바이러스(TTMD)를 포함할 수 있다. 일부 실시형태에서, 비-병원성 바이러스는 본원에 기재된, 예를 들어, 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 17 또는 41 중 어느 하나에 열거된 바와 같은 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 하나 이상의 서열을 포함한다.
일부 실시형태에서, 이종성 모이어티는 대상체에서 결여된 것으로 확인된 하나 이상의 바이러스를 포함할 수 있다. 예를 들어, 디스비로시스를 갖는 것으로 확인된 대상체에는 대상체에서 불균형인 아넬로좀 및 하나 이상의 바이러스 성분 또는 바이러스를 포함하는, 또는 기준 값, 예를 들어, 건강한 대상체와 상이한 비를 갖는 조성물이 투여될 수 있다.
일부 실시형태에서, 이종성 모이어티는 하나 이상의 비-아넬로바이러스, 예를 들어, 아데노바이러스, 헤르페스 바이러스, 폭스 바이러스, 백시니아 바이러스, SV40, 파필로마 바이러스, RNA 바이러스, 예컨대 레트로바이러스, 예를 들어, 렌티 바이러스, 단일-가닥 RNA 바이러스, 예를 들어, 간염 바이러스 또는 이중-가닥 RNA 바이러스, 예를 들어, 로타바이러스를 포함할 수 있다. 일부 실시형태에서, 아넬로좀 또는 바이러스는 결함이 있거나, 감염성 입자를 생성하기 위하여 지원을 필요로 한다. 이러한 지원은 예를 들어, LTR 내의 조절 서열의 제어 하에 복제 결함 아넬로좀 또는 바이러스의 구조적 유전자 중 하나 이상(예를 들어, 그의 전부)를 인코딩하는, 핵산, 예를 들어, 게놈 내로 통합되는 플라스미드 또는 DNA를 함유하는 헬퍼 세포주를 사용함으로써 제공될 수 있다. 본원에 기재된 아넬로좀을 복제하는 데 적합한 세포주는 해당 분야에 공지된 세포주, 예를 들어, 본원에 기재된 바와 같이 변형될 수 있는 A549 세포를 포함한다.
표적화 모이어티
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 표적화 모이어티, 예를 들어, 표적 세포 상에 존재하는 관심 분자에 특이적으로 결합하는 표적화 모이어티를 추가로 포함할 수 있다. 표적화 모이어티는 관심 분자 또는 세포의 특정 기능을 조절하거나, 특정 분자(예를 들어, 효소, 단백질 또는 핵산), 예를 들어, 경로 내의 관심 분자의 하류의 특정 분자를 조절하거나, 표적에 특이적으로 결합하여, 아넬로좀 또는 유전 요소를 국소화시킬 수 있다. 예를 들어, 표적화 모이어티는 특정 관심 분자와 상호작용하여 그의 기능을 증가시키거나, 감소시키거나, 또는 다르게 조절하는 치료제를 포함할 수 있다.
태그화 또는 모니터링 모이어티
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 태그를 추가로 포함하여, 본원에 기재된 아넬로좀 또는 유전 요소를 표지하거나 모니터링할 수 있다. 태그화 또는 모니터링 모이어티는 화학적 작용제 또는 효소적 절단, 예컨대 단백질 분해 또는 인테인 스플라이싱에 의해 제거할 수 있다. 친화성 태그는 친화성 기법을 사용하여 태그화된 폴리펩티드를 정제하는 데 유용할 수 있다. 일부 예에는 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 글루타티온-S-트랜스퍼라제(GST) 및 폴리(His) 태그가 포함된다. 가용화 태그는 샤페론-결함 종, 예컨대 에스케리키아 콜라이(E. coli)에서 발현되는 재조합 단백질이 단백질에서 적절하게 폴딩되는 것을 지원하는 것을 돕고, 그들이 침전하지 못하게 하는 데 유용할 수 있다. 일부 예는 티오레독신(TRX) 및 폴리(NANP)를 포함한다. 태그화 또는 모니터링 모이어티는 감광성 태그, 예를 들어, 형광을 포함할 수 있다. 형광 태그는 시각화에 유용하다. GFP 및 그의 변이체는 형광 태그로서 흔히 사용되는 몇몇의 예이다. 단백질 태그는 특정 효소적 변형(예컨대, 비오틴 리가제에 의한 비오티닐화) 또는 화학적 변형(예컨대 형광 영상화를 위한 FlAsH-EDT2와의 반응)이 일어나게 할 수 있다. 종종 태그화 또는 모니터링 모이어티를 조합하여, 단백질을 다수의 다른 성분과 연결시킨다. 태그화 또는 모니터링 모이어티는 또한 특정 단백질분해 또는 효소적 절단에 의해(예를 들어, TEV 프로테아제, 트롬빈, 인자 Xa 또는 엔테로펩티다제에 의해) 제거될 수 있다.
나노입자
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 나노입자를 추가로 포함할 수 있다. 나노입자는 약 1 내지 약 1000 나노미터, 약 1 내지 약 500 나노미터 크기, 약 1 내지 약 100 nm, 약 50 nm 내지 약 300 nm, 약 75 nm 내지 약 200 nm, 약 100 nm 내지 약 200 nm, 및 그 사이의 임의의 범위의 크기를 갖는 무기 물질을 포함한다. 나노입자는 일반적으로, 나노규모 크기의 복합 구조를 갖는다. 일부 실시형태에서, 나노입자는 전형적으로 구형이지만, 나노입자 조성에 따라 상이한 형태가 가능하다. 나노입자의 외부 환경과 접촉하는 나노입자의 부분은 일반적으로 나노입자의 표면으로서 확인된다. 본원에 기재된 나노입자에서, 크기 제한은 2차원으로 제한될 수 있으며, 이에 따라, 나노입자는 약 1 내지 약 1000 nm의 직경을 갖는 복합 구조를 포함하게 되며, 여기서 특정 직경은 나노입자 조성물 및 실험 설계에 따라 의도된 나노입자의 용도에 좌우된다. 예를 들어, 치료적 응용에 사용되는 나노입자는 전형적으로 약 200 nm 이하의 크기를 갖는다.
나노입자의 바람직한 추가의 특성, 예컨대 표면 전하 및 입체적 안정화는 또한, 특정 관심 응용을 고려하여 달라질 수 있다. 임상적 응용, 예컨대 암 치료에 바람직할 수 있는 예시적인 특성은 그의 전문이 각각 본원에 참조로 포함되는 문헌[Davis et al, Nature 2008 vol. 7, pages 771-782]; 문헌[Duncan, Nature 2006 vol. 6, pages 688-701]; 및 문헌[Allen, Nature 2002 vol. 2 pages 750-763]에 기재되어 있다. 추가의 특성은 본 개시내용의 판독 시에 당업자에 의해 확인 가능하다. 나노입자 치수 및 특성은 해당 분야에 공지된 기법에 의해 검출될 수 있다. 입자 치수를 검출하기 위한 예시적인 기법은 동적 광 산란(DLS) 및 다양한 현미경관찰, 예컨대 투과 전자 현미경관찰(TEM) 및 원자력 현미경관찰(AFM)을 포함하지만, 이들에 제한되지 않는다. 입자 형태를 검출하기 위한 예시적인 기법은 TEM 및 AFM을 포함하지만 이들에 제한되지 않는다. 나노입자의 표면 전하를 검출하기 위한 예시적인 기법은 제타 전위 방법을 포함하지만, 이들에 제한되지 않는다. 다른 화학적 특성을 검출하는 데 적합한 추가의 기법은 1H, 11B 및 13C 및 19F NMR, UV/Vis 및 적외선/라만 분광학 및 형광 분광학(나노입자가 형광 표지와 조합하여 사용되는 경우) 및 당업자에 의해 확인 가능한 추가의 기법을 포함한다.
소분자
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 소분자를 추가로 포함할 수 있다. 소분자 모이어티는 작은 펩티드, 펩티드 모방체(예를 들어, 펩토이드), 아미노산, 아미노산 유사체, 합성 폴리뉴클레오티드, 폴리뉴클레오티드 유사체, 뉴클레오티드, 뉴클레오티드 유사체, 일반적으로 몰당 약 5,000 그램 미만의 분자량을 갖는 유기 및 무기 화합물(이종유기 및 유기금속 화합물 포함), 예를 들어, 몰당 약 2,000 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 예를 들어, 몰당 약 1,000 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 예를 들어, 몰당 약 500 그램 미만의 분자량을 갖는 유기 또는 무기 화합물, 및 이러한 화합물의 염, 에스테르 및 다른 약제학적으로 허용되는 형태를 포함하지만, 이들에 제한되지 않는다. 소분자는 신경전달물질, 호르몬, 약물, 독소, 바이러스 또는 미생물 입자, 합성 분자, 및 효능제 또는 길항제를 포함할 수 있지만, 이들에 제한되지 않는다.
적합한 소분자의 예는 모두 본원에 참조로 포함되는 문헌["The Pharmacological Basis of Therapeutics," Goodman and Gilman, McGraw-Hill, New York, N.Y., (1996), Ninth edition]의 다음과 같은 섹션에 기재된 것들을 포함한다: 시냅스 및 신경이펙터 연결 부위에서 작용하는 약물; 중추신경계에서 작용하는 약물; 오타코이드: 염증의 약물 요법; 물, 염 및 이온; 신장 기능 및 전해질 대사에 영향을 미치는 약물; 심혈관 약물; 위장 기능에 영향을 미치는 약물; 자궁 운동에 영향을 미치는 약물; 기생충 감염의 화학요법; 미생물 질병의 화학요법; 신생물 질병의 화학요법; 면역억제를 위해 사용되는 약물; 혈액-형성 기관에 작용하는 약물; 호르몬 및 호르몬 길항제; 비타민, 피부과학 및 독성학. 소분자의 일부 예는 프리온 약물, 예컨대 타크롤리무스, 유비퀴틴 리가제 또는 HECT 리가제 저해제, 예컨대 헤클린(heclin), 히스톤 변형 약물, 예컨대 부티르산나트륨, 효소적 저해제, 예컨대 5-아자-시티딘, 안트라사이클린, 예컨대 독소루비신, 베타-락탐, 예컨대 페니실린, 항-박테리아제, 화학요법제, 항-바이러스제, 다른 유기체로부터의 조절제, 예컨대 VP64, 및 불충분한 생체 이용 가능성을 갖는 약물, 예컨대 결함이 있는 약동학을 갖는 화학치료제를 포함하지만, 이들에 제한되지 않는다.
일부 실시형태에서, 소분자는 후성적 변형제, 예를 들어 문헌[de Groote et al. Nuc. Acids Res. (2012):1-18]에 기재된 것들이다. 예시적인 소분자 후성적 변형제는 예를 들어, 본원에 참조로 포함되는 문헌[Lu et al. J. Biomolecular Screening 17.5(2012):555-71], 예를 들어, 표 1 또는 2에 기재되어 있다. 일부 실시형태에서, 후성적 변형제는 보리노스타트(vorinostat) 또는 로미뎁신(romidepsin)을 포함한다. 일부 실시형태에서, 후성적 변형제는 부류 I, II, III 및/또는 IV 히스톤 데아세틸라제(HDAC)의 저해제를 포함한다. 일부 실시형태에서, 후성적 변형제는 SirTI의 활성화제를 포함한다. 일부 실시형태에서, 후성적 변형제는 가르시놀(Garcinol), Lys-CoA, C646, (+)-JQI, I-BET, BICI, MS120, DZNep, UNC0321, EPZ004777, AZ505, AMI-I, 피라졸 아미드 7b, 벤조[d]이미다졸 17b, 아실화된 답손 유도체(예를 들어, PRMTI), 메틸스타트(methylstat), 4,4'-디카복시-2,2'-비피리딘, SID 85736331, 하이드록사메이트 유사체 8, 타닐사이프로미(tanylcypromie), 비스구아니딘 및 비구아니드 폴리아민 유사체, UNC669, 비다자(Vidaza), 데시타빈(decitabine), 소듐 페닐 부티레이트(SDB), 리포산(LA), 케르세틴(quercetin), 발프로산, 하이드랄라진(hydralazine), 박트림(bactrim), 녹차 추출물(예를 들어, 에피갈로카테킨 갈레이트(EGCG)), 커큐민, 술포르판(sulforphane) 및/또는 알리신(allicin)/디알릴 디술피드를 포함한다. 일부 실시형태에서, 후성적 변형제는 DNA 메틸화를 저해하며, 예를 들어, DNA 메틸트랜스퍼라제의 저해제이다(예를 들어, 5-아자시티딘이고/이거나 데시타빈이다). 일부 실시형태에서, 후성적 변형제는 히스톤 변형, 예를 들어, 히스톤 아세틸화, 히스톤 메틸화, 히스톤 수모화(sumoylation) 및/또는 히스톤 인산화를 변형시킨다. 일부 실시형태에서, 후성적 변형제는 히스톤 데아세틸라제의 저해제이다(예를 들어, 보리노스타트 및/또는 트리코스타틴 A이다).
일부 실시형태에서, 소분자는 약제학적 활성 작용제이다. 일 실시형태에서, 소분자는 대사 활성 또는 성분의 저해제이다. 유용한 부류의 약제학적 활성 작용제는 항생제, 항-염증 약물, 혈관신생 또는 혈관작용제, 성장 인자 및 화학치료제(항-신생물)제(예를 들어, 종양 억제제)를 포함하지만, 이들에 제한되지 않는다. 본원에 기재된 범주 및 예로부터의 또는 문헌[(Orme-Johnson 2007, Methods Cell Biol. 2007;80:813-26)]으로부터의 분자 중 하나 또는 조합이 사용될 수 있다. 일 실시형태에서, 본 발명은 항생제, 항-염증 약물, 혈관신생 또는 혈관작용제, 성장 인자 또는 화학치료제를 포함하는 조성물을 포함한다.
펩티드 또는 단백질
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 펩티드 또는 단백질을 추가로 포함할 수 있다. 펩티드 모이어티는 펩티드 리간드 또는 항체 단편(예를 들어, 수용체, 예컨대 세포외 수용체에 결합하는 항체 단편), 신경펩티드, 호르몬 펩티드, 펩티드 약물, 독성 펩티드, 바이러스 또는 미생물 펩티드, 합성 펩티드 및 효능제 또는 길항제 펩티드를 포함할 수 있지만, 이들에 제한되지 않는다.
펩티드 모이어티는 선형 또는 분지형일 수 있다. 펩티드는 약 5 내지 약 200개의 아미노산, 약 15 내지 약 150개의 아미노산, 약 20 내지 약 125개의 아미노산, 약 25 내지 약 100개의 아미노산 또는 그 사이의 임의의 범위의 길이를 갖는다.
펩티드의 일부 예는 형광 태그 또는 마커, 항원, 항체, 항체 단편, 예컨대 단일 도메인 항체, 리간드 및 수용체, 예컨대 글루카곤-유사 펩티드-1(GLP-1), GLP-2 수용체 2, 콜레시스토키닌(cholecystokinin) B(CCKB) 및 소마토스타틴 수용체, 펩티드 치료제, 예컨대 특정 세포 표면 수용체, 예컨대 G 단백질-커플링된 수용체(GPCR) 또는 이온 채널에 결합되는 것들, 천연적으로 생물활성인 펩티드로부터의 합성 또는 유사체 펩티드, 항-미생물 펩티드, 포어-형성 펩티드, 종양 표적화 또는 세포독성 펩티드, 및 분해 또는 자가-파괴 펩티드, 예컨대 아폽토시스-유도 펩티드 신호 또는 감광제 펩티드를 포함하지만 이들에 제한되지 않는다.
본원에 기재된 본 발명에서 유용한 펩티드는 또한 작은 항원-결합 펩티드, 예를 들어, 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 쇄 항체, 나노바디를 포함한다(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조). 이러한 작은 항원 결합 펩티드는 사이토졸 항원, 핵 항원, 세포소기관-내 항원에 결합할 수 있다.
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 특정 위치, 조직 또는 세포를 표적화할 수 있는 리간드에 연결된 폴리펩티드를 포함한다.
올리고뉴클레오티드 압타머
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 올리고뉴클레오티드 압타머를 추가로 포함할 수 있다. 압타머 모이어티는 올리고뉴클레오티드 또는 펩티드 압타머이다. 올리고뉴클레오티드 압타머는 단백질 및 펩티드를 포함하는 사전-선택된 표적에 높은 친화성 및 특이성으로 결합할 수 있는 단일-가닥 DNA 또는 RNA(ssDNA 또는 ssRNA) 분자이다.
올리고뉴클레오티드 압타머는 다양한 분자 표적, 예컨대 소분자, 단백질, 핵산 및 심지어 세포, 조직 및 유기체에 결합하도록 반복된 회차의 시험관 내 선택 또는 동등하게, SELEX(지수적 농축에 의한 리간드의 계통 진화)를 통해 엔지니어링될 수 있는 핵산 종이다. 압타머는 차별적인 분자 인식을 제공하며, 화학적 합성에 의해 생성될 수 있다. 또한, 압타머는 바람직한 저장 특성을 갖고, 치료적 응용에서 면역원성을 거의 유도하지 않거나, 전혀 유도하지 않을 수 있다.
DNA 및 RNA 압타머는 둘 모두 다양한 표적에 대하여 강력한 결합 친화성을 보여줄 수 있다. 예를 들어, DNA 및 RNA 압타머는 t 라이소자임, 트롬빈, 인간 면역결핍 바이러스 트랜스-작용 반응성 요소(HIV TAR),(en.wikipedia.org/wiki/Aptamer - cite_note-10 참조), 헤민(hemin), 인터페론 γ, 혈관 내피 성장 인자(VEGF), 전립선 특이적 항원(PSA), 도파민 및 비-정규 종양유전자, 열 충격 인자 1(HSF1)을 위하여 선택된다.
펩티드 압타머
일부 실시형태에서, 본원에 기재된 조성물 또는 아넬로좀은 펩티드 압타머를 추가로 포함할 수 있다. 펩티드 압타머는 낮은 분자량, 12 내지 14 kDa을 갖는 펩티드를 포함하는 하나의(또는 그 이상의) 짧은 가변 펩티드 도메인을 갖는다. 펩티드 압타머는 세포에 특이적으로 결합하고, 세포 내측의 단백질-단백질 상호작용을 간섭하도록 설계될 수 있다.
펩티드 압타머는 특이적 표적 분자에 결합하도록 선택되거나 엔지니어링된 인공 단백질이다. 이들 단백질은 가변 서열의 하나 이상의 펩티드 루프를 포함한다. 이들은 전형적으로 조합 라이브러리로부터 단리되며, 종종 유도된 돌연변이 또는 가변 영역 돌연변이유발 및 선택의 회차에 의해 후속적으로 개선된다. 생체 내에서, 펩티드 압타머는 세포 단백질 표적에 결합할 수 있고, 그들의 표적화된 분자와 다른 단백질의 정상적인 단백질 상호작용의 간섭을 포함하는 생물학적 효과를 발휘할 수 있다. 특히, 전사 인자 결합 도메인에 부착된 가변 펩티드 압타머 루프는 전사 인자 활성화 도메인에 부착된 표적 단백질에 대해 스크리닝한다. 이러한 선택 전략을 통해 펩티드 압타머의 표적으로의 펩티드 압타머의 생체 내 결합은 하류 효모 마커 유전자의 발현으로서 검출된다. 이러한 실험은 표현형을 유발하기 위해 압타머에 의해 결합되는 특정 단백질 및 압타머가 파괴하는 단백질 상호작용을 확인한다. 또한, 적절한 기능적 모이어티로 유도체화된 펩티드 압타머는 그들의 표적 단백질의 특정 번역-후 변형을 유발할 수 있거나, 표적의 하위세포 국소화를 변경시킬 수 있다.
펩티드 압타머는 또한 시험관 내에서 표적을 인식할 수 있다. 그들은 바이오센서에서 항체 대신에 이용되며, 비활성 및 활성 단백질 형태 둘 모두를 함유하는 집단으로부터 단백질의 활성 아이소폼을 검출하기 위해 이용된다. 펩티드 압타머 "헤드"가 독특한 서열의 이중-가닥 DNA "테일(tail)"에 공유적으로 연결된 태드폴(tadpole)로서 알려져 있는 유도체는 (예를 들어, 정량적 실시간 중합효소 연쇄 반응을 사용하여) 그들의 DNA 테일의 PCR에 의해 혼합물 중 드문 표적 분자의 정량화를 가능하게 한다.
펩티드 압타머 선택은 상이한 시스템을 사용하여 이루어질 수 있지만, 현재 효모 2-하이브리드 시스템이 가장 많이 사용된다. 펩티드 압타머는 또한 파지 디스플레이 또는 다른 표면 디스플레이 기술, 예컨대 mRNA 디스플레이, 리보좀 디스플레이, 박테리아 디스플레이 및 효모 디스플레이에 의해 구축된 조합 펩티드 라이브러리로부터 선택될 수 있다. 이들 실험 절차는 또한 바이오패닝(biopanning)으로서 알려져 있다. 바이오패닝으로부터 수득되는 펩티드 중에, 미모토프(mimotope)는 펩티드 압타머의 한 종류로서 간주될 수 있다. 조합 펩티드 라이브러리로부터 패닝된 모든 펩티드는 명칭 MimoDB를 갖는 특수 데이터에 저장되어 있다.
IV. 숙주
본 발명은 추가로 본원에 기재된 아넬로좀을 포함하는 숙주 또는 숙주 세포에 관한 것이다. 일부 실시형태에서, 숙주 또는 숙주 세포는 식물, 곤충, 박테리아, 진균, 척추동물, 포유동물(예를 들어, 인간) 또는 다른 유기체 또는 세포이다. 특정 실시형태에서, 본원에 확인된 바와 같이, 다양한 상이한 숙주 세포를 감염시키는 아넬로좀이 제공된다. 표적 숙주 세포는 중배엽, 내배엽 또는 외배엽 기원의 세포를 포함한다. 표적 숙주 세포는 예를 들어, 상피 세포, 근육 세포, 백혈구 세포(예를 들어, 림프구), 신장 조직 세포, 폐 조직 세포를 포함한다.
일부 실시형태에서, 아넬로좀은 숙주에서 실질적으로 비-면역원성이다. 아넬로좀 또는 유전 요소는 숙주의 면역계에 의해 요망되지 않는 상당한 반응을 생성하지 않는다. 일부 면역 반응은 체액성 면역 반응(예를 들어, 항원-특이적 항체의 생성) 및 세포-매개의 면역 반응(예를 들어, 림프구 증식)을 포함하지만, 이들에 제한되지 않는다.
일부 실시형태에서, 숙주 또는 숙주 세포는 아넬로좀과 접촉된다(예를 들어, 이로 감염된다). 일부 실시형태에서, 숙주는 포유동물, 예컨대 인간이다. 숙주 내의 아넬로좀의 양은 투여 후 임의의 시간에 측정될 수 있다. 특정 실시형태에서, 배양물 중 아넬로좀 성장의 시간 경과가 결정된다.
일부 실시형태에서, 아넬로좀, 예를 들어, 본원에 기재된 바와 같은 아넬로좀은 유전 가능하다. 일부 실시형태에서, 아넬로좀은 유체 및/또는 세포 중에서, 모체에서 유아에게 연속적으로 전달된다. 일부 실시형태에서, 원래의 숙주 세포로부터의 딸 세포는 아넬로좀을 포함한다. 일부 실시형태에서, 모체는 아넬로좀을 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95% 또는 99%의 효율로 유아에게, 또는 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95% 또는 99%의 전달 효율로 숙주 세포로부터 딸 세포로 전달한다. 일부 실시형태에서, 숙주 세포 내의 아넬로좀은 감수분열 동안 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95% 또는 99%의 전달 효율을 갖는다. 일부 실시형태에서, 숙주 세포 내의 아넬로좀은 유사분열 동안 적어도 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95% 또는 99%의 전달 효율을 갖는다. 일부 실시형태에서, 세포 내의 아넬로좀은 약 10% 내지 20%, 20% 내지 30%, 30% 내지 40%, 40% 내지 50%, 50% 내지 60%, 60% 내지 70%, 70% 내지 75%, 75% 내지 80%, 80% 내지 85%, 85% 내지 90%, 90% 내지 95%, 95% 내지 99% 또는 그 사이의 임의의 백분율의 전달 효율을 갖는다.
일부 실시형태에서, 아넬로좀, 예를 들어, 아넬로좀은 숙주 세포 내에서 복제한다. 일 실시형태에서, 아넬로좀은 포유동물 세포, 예를 들어, 인간 세포에서 복제할 수 있다. 다른 실시형태에서, 아넬로좀은 복제 결핍 또는 복제 비적격이다.
일부 실시형태에서, 아넬로좀이 숙주 세포에서 복제되지만, 아넬로좀은 숙주의 게놈 내로, 예를 들어, 숙주의 염색체와 통합되지 않는다. 일부 실시형태에서, 아넬로좀과 숙주의 염색체와의 재조합 빈도는 무시할 수 있는 정도이다. 일부 실시형태에서, 아넬로좀은 예를 들어, 숙주의 염색체와 예를 들어, 약 1.0 cM/Mb, 0.9 cM/Mb, 0.8 cM/Mb, 0.7 cM/Mb, 0.6 cM/Mb, 0.5 cM/Mb, 0.4 cM/Mb, 0.3 cM/Mb, 0.2 cM/Mb, 0.1 cM/Mb 미만의 재조합 빈도를 갖는다.
V. 이용 방법
본원에 기재된 아넬로좀 및 아넬로좀을 포함하는 조성물은 예를 들어, 질병, 장애 또는 질환의 치료를 필요로 하는 대상체(예를 들어, 포유동물 대상체, 예를 들어, 인간 대상체)에서의 질병, 장애 또는 질환의 치료 방법에 사용될 수 있다. 본원에 기재된 약제학적 조성물의 투여는 예를 들어, 비경구(정맥내, 종양내, 복강내, 근육내, 강내 및 피하 포함) 투여로 이루어질 수 있다. 아넬로좀은 단독으로 또는 약제학적 조성물로서 제형화되어 투여될 수 있다.
아넬로좀은 단위-용량 조성물, 예컨대 단위 용량 비경구 조성물의 형태로 투여될 수 있다. 이러한 조성물은 일반적으로 혼합에 의해 제조되며, 비경구 투여를 위하여 적합하게 조정될 수 있다. 이러한 조성물은 예를 들어, 주사 및 주입 용액 또는 현탁액 또는 좌제 또는 에어로졸의 형태로 존재할 수 있다.
일부 실시형태에서, 예를 들어, 본원에 기재된 바와 같은 아넬로좀 또는 이를 포함하는 조성물의 투여는 아넬로좀에 의해 포함되는 유전 요소가 예를 들어, 대상체 내의 표적 세포로 운반되게 할 수 있다.
예를 들어, 이펙터(예를 들어, 내인성 또는 외인성 이펙터)를 포함하는 본원에 기재된 아넬로좀 또는 그의 조성물을 사용하여 이펙터를 세포, 조직 또는 대상체에 운반할 수 있다. 일부 실시형태에서, 아넬로좀 또는 그의 조성물을 사용하여, 이펙터를 골수, 혈액, 심장, GI 또는 피부에 운반한다. 본원에 기재된 아넬로좀 조성물의 투여에 의한 이펙터의 운반은 세포, 조직 또는 대상체에서 비코딩 RNA 또는 폴리펩티드의 발현 수준을 조절할 수 있다(예를 들어, 증가 또는 감소시킬 수 있다). 이러한 방식으로의 발현 수준의 조절은 이펙터가 운반되는 세포에서 기능적 활성의 변경을 초래할 수 있다. 일부 실시형태에서, 조절된 기능적 활성은 성질이 효소적, 구조적 또는 조절적일 수 있다.
일부 실시형태에서, 아넬로좀 또는 그의 카피는 세포로의 운반 후 24시간(예를 들어, 1일, 2일, 3일, 4일, 5일, 6일, 1주, 2주, 3주, 4주, 30일 또는 1개월)에 세포에서 검출 가능하다. 실시형태들에서, 아넬로좀 또는 그의 조성물은 표적 세포 상에서 효과를 매개하며, 효과는 적어도 1, 2, 3, 4, 5, 6 또는 7일, 2, 3 또는 4주 또는 1, 2, 3, 6 또는 12개월 동안 지속된다. (예를 들어, 아넬로좀 또는 그의 조성물이 외인성 단백질을 인코딩하는 유전 요소를 포함하는) 일부 실시형태에서, 효과는 1, 2, 3, 4, 5, 6 또는 7일, 2, 3 또는 4주 또는 1, 2, 3, 6 또는 12개월 미만 동안 지속된다.
본원에 기재된 아넬로좀 또는 아넬로좀을 포함하는 조성물로 치료될 수 있는 질병, 장애 및 질환의 예는 제한 없이, 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암, 비-소세포 폐암, 예를 들어, mIR-625, 예를 들어, 카스파제-3에 반응성인 유전자를 발현하는 종양) 및 위장 장애를 포함한다. 일부 실시형태에서, 아넬로좀은 아넬로좀이 접촉되는 세포 내에서 활성 또는 기능을 조절한다(예를 들어, 증가 또는 감소시킨다). 일부 실시형태에서, 아넬로좀은 아넬로좀이 접촉되는 세포에서 분자(예를 들어, 핵산 또는 단백질)의 수준 또는 활성을 조절한다(예를 들어, 증가 또는 감소시킨다). 일부 실시형태에서, 아넬로좀은 아넬로좀이 접촉되는 세포, 예를 들어, 암 세포의 생존력을 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상 감소시킨다. 일부 실시형태에서, 아넬로좀은 아넬로좀이 접촉되는 세포, 예를 들어, 암 세포의 생존력을 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상 감소시키는 이펙터, 예를 들어, miRNA, 예를 들어, miR-625를 포함한다. 일부 실시형태에서, 아넬로좀은 예를 들어, 카스파제-3 활성을 증가시킴으로써 아넬로좀이 접촉되는 세포, 예를 들어, 암 세포의 아폽토시스를 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상 증가시킨다. 일부 실시형태에서, 아넬로좀은 예를 들어, 카스파제-3 활성을 증가시킴으로써, 아넬로좀이 접촉되는 세포, 예를 들어, 암 세포의 아폽토시스를 예를 들어, 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% 이상 증가시키는 이펙터, 예를 들어, miRNA, 예를 들어, miR-625를 포함한다.
VI. 생성 방법
유전 요소의 생성
아넬로좀의 유전 요소의 제조 방법은 예를 들어, 문헌[Khudyakov & Fields, Artificial DNA: Methods and Applications, CRC Press (2002)]; 문헌[Zhao, Synthetic Biology: Tools and Applications, (First Edition), Academic Press (2013)]; 및 문헌[Egli & Herdewijn, Chemistry and Biology of Artificial Nucleic Acids, (First Edition), Wiley-VCH (2012)]에 기재되어 있다.
일부 실시형태에서, 유전 요소는 컴퓨터-보조 설계 도구를 사용하여 설계될 수 있다. 아넬로좀은 합성하기에 더욱 용이한 더 작은 중첩하는 조각(예를 들어, 약 100 bp 내지 약 10 kb 범위의 세그먼트, 또는 개별 ORF)으로 나뉠 수 있다. 이들 DNA 세그먼트는 하나의 세트의 중첩하는 단일-가닥 올리고뉴클레오티드로부터 합성된다. 그 후 생성되는 중첩 신톤(synthon)은 더 큰 조각의 DNA, 예를 들어, 아넬로좀으로 어셈블된다. 세그먼트 또는 ORF는 아넬로좀, 예를 들어, 5' 및 3' 말단에서 시험관 내 재조합 또는 특유한 제한 부위 내로 어셈블되어, 라이게이션을 가능하게 할 수 있다.
유전 요소는 대안적으로 아넬로좀을 올리고-길이 단편으로 분석하는 설계 알고리즘으로 합성하여, 서열 공간의 복잡성을 고려하는 합성을 위한 최적의 설계 조건을 생성할 수 있다. 이어서 올리고는 반도체-기반의 고밀도 칩 상에서 화학적으로 합성되며, 칩마다 200,000개 초과의 개별 올리고가 합성된다. 올리고를 어셈블리 기법, 예를 들어, BioFab®으로 어셈블하여, 더 작은 올리고로부터 더 긴 DNA 세그먼트를 구축한다. 이것은 병렬 방식으로 행해지며, 그래서 수백 내지 수천개의 합성 DNA 세그먼트가 한번에 구축된다.
각각의 유전 요소 또는 유전 요소의 세그먼트는 서열이 입증될 수 있다. 일부 실시형태에서, RNA 또는 DNA의 고-처리량 서열결정은 AnyDot.칩(제노복스(Genovoxx), 독일)을 사용하여 일어날 수 있으며, 이는 생물학적 과정(예를 들어, miRNA 발현 또는 대립형질 가변성(SNP 검출))의 모니터링을 가능하게 한다. 특히, AnyDot-칩은 뉴클레오티드 형광 신호 검출의 10x 내지 50x 향상을 가능하게 한다. AnyDot.칩 및 이들의 이용 방법은 부분적으로 국제 공개 출원 WO 02088382호, WO 03020968호, WO 0303 1947호, WO 2005044836호, PCTEP 05105657호, PCMEP 05105655호; 및 독일 특허 출원 DE 101 49 786호, DE 102 14 395호, DE 103 56 837호, DE 10 2004 009 704호, DE 10 2004 025 696호, DE 10 2004 025 746호, DE 10 2004 025 694호, DE 10 2004 025 695호, DE 10 2004 025 744호, DE 10 2004 025 745호 및 DE 10 2005 012 301호에 기재되어 있다.
다른 고-처리량 서열결정 시스템은 문헌[Venter, J., et al. Science 16 Feb. 2001]; 문헌[Adams, M. et al, Science 24 Mar. 2000]; 및 문헌[M. J, Levene, et al. Science 299:682-686, January 2003]; 및 미국 공개 출원 제20030044781호 및 제2006/0078937호에 개시된 것들을 포함한다. 전체적으로 이러한 시스템은 핵산 분자에서 측정되는 중합 반응을 통해 염기를 일시적으로 첨가함으로써 복수의 염기를 갖는 표적 핵산 분자를 서열결정하는 것을 포함하며, 즉, 서열결정될 주형 핵산 분자 상의 핵산 중합 효소의 활성이 실시간으로 추적된다. 이어서, 염기 첨가의 서열에서 각 단계에서 핵산 중합 효소의 촉매 활성에 의해 표적 핵산의 성장하는 상보성 가닥 내로 어떤 염기가 혼입되는 지를 확인함으로써 서열을 추론할 수 있다. 표적 핵산 분자 복합체 상의 중합효소는 표적 핵산 분자를 따라 이동하고 활성 부위에서 올리고뉴클레오티드 프라이머를 연장시키기에 적합한 위치에서 제공된다. 복수의 표지된 유형의 뉴클레오티드 유사체가 활성 부위에 근접하여 제공되며, 각각의 구별 가능한 유형의 뉴클레오티드 유사체는 표적 핵산 서열에서 상이한 뉴클레오티드에 상보성이다. 성장하는 핵산 가닥은 중합효소를 사용하여 활성 부위에서 핵산 가닥에 뉴클레오티드 유사체를 부가함으로써 연장되며, 여기서 첨가되는 뉴클레오티드 유사체는 활성 부위에서의 표적 핵산의 뉴클레오티드에 상보성이다. 중합 단계의 결과로서 올리고뉴클레오티드 프라이머에 부가된 뉴클레오티드 유사체가 확인된다. 표지된 뉴클레오티드 유사체를 제공하고, 성장하는 핵산 가닥을 중합하고, 부가된 뉴클레오티드 유사체를 확인하는 단계를 반복하여, 핵산 가닥이 추가로 연장되고 표적 핵산의 서열이 결정되게 한다.
일부 실시형태에서, 샷건(shotgun) 서열결정이 수행된다. 샷건 서열결정에서, DNA는 수많은 작은 세그먼트로 무작위로 분해되며, 이를 사슬 종결 방법을 사용하여 서열결정하여, 판독물(read)을 수득한다. 표적 DNA에 대한 다수의 중첩 판독물은 수회차의 이러한 단편화 및 서열결정을 수행함으로써 수득된다. 이어서, 컴퓨터 프로그램은 상이한 판독물의 중첩 말단을 이용하여, 그들을 연속 서열로 어셈블시킨다.
일부 실시형태에서, 복제 또는 패키징을 위한 인자는 유전 요소에 비하여 시스로 또는 트랜스로 공급될 수 있다. 예를 들어, 유전 요소는 시스로 공급되는 경우, 예를 들어, 본원에 기재된 바와 같은 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3을 인코딩하는 하나 이상의 유전자를 포함할 수 있다. 일부 실시형태에서, 복제 및/또는 패키징 신호는 예를 들어, 증폭 및/또는 캡슐화를 유도하기 위하여 유전 요소 내로 혼입될 수 있다. 일부 실시형태에서, 이것은 둘 모두 (예를 들어, 이펙터를 게놈 내의 특정 부위 내로 삽입하거나, 바이러스 ORF를 이펙터로 대체하여) 아넬로좀 게놈의 더 큰 영역의 맥락에서 행해진다.
또 다른 예에서, 유전 요소는 트랜스로 공급되는 경우, 예를 들어, 본원에 기재된 바와 같은, 아넬로바이러스 ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 또는 ORF2t/3 중 하나 이상을 인코딩하는 유전자가 결여될 수 있으며; 이 단백질 또는 단백질들은 예를 들어, 또 다른 핵산, 예를 들어, 헬퍼 핵산에 의해 공급될 수 있다. 일부 실시형태에서, 최소 시스 신호(예를 들어, 5' UTR 및/또는 GC-풍부 영역)가 유전 요소 내에 존재한다. 일부 실시형태에서, 유전 요소는 복제 또는 패키징 인자(예를 들어, 복제효소 및/또는 캡시드 단백질)를 인코딩하지 않는다. 이러한 인자는 일부 실시형태에서, 하나 이상의 헬퍼 핵산(예를 들어, 숙주 세포 게놈 내로 통합되는 헬퍼 바이러스 핵산, 헬퍼 플라스미드 또는 헬퍼 핵산)에 의해 공급될 수 있다. 일부 실시형태에서, 헬퍼 핵산은 증폭 및/또는 패키징을 유도하기에 충분한 단백질 및/또는 RNA를 발현하지만, 그들 자체의 패키징 신호가 결여될 수 있다. 일부 실시형태에서, 유전 요소 및 헬퍼 핵산은 (예를 들어, 동시에 또는 개별적으로) 숙주 세포 내로 도입되어, 유전 요소의 증폭 및/또는 패키징을 초래하지만, 헬퍼 핵산의 증폭 및/또는 패키징을 초래하지 않는다.
시험관 내 환화
일부 예에서, 단백질성 외부 내로 패키징될 유전 요소는 단일 가닥 환형 DNA이다. 유전 요소는 일부 예에서, 단일 가닥 환형 DNA 이외의 형태로 숙주 세포 내로 도입될 수 있다. 예를 들어, 유전 요소는 이중-가닥 환형 DNA로서 숙주 세포 내로 도입될 수 있다. 이어서, 이중-가닥 환형 DNA는 숙주 세포(예를 들어, 회전환 복제에 적합한 효소, 예를 들어, 아넬로바이러스 Rep 단백질, 예를 들어, 열거된 효소에 관하여 본원에 참조로 포함되는 문헌[Wawrzyniak et al. 2017, Front. Microbiol. 8: 2353]에 기재된 바와 같은 Rep68/78, Rep60, RepA, RepB, Pre, MobM, TraX, TrwC, Mob02281, Mob02282, NikB, ORF50240, NikK, TecH, OrfJ 또는 TraI을 포함하는 숙주 세포)에서 단일-가닥 환형 DNA로 전환될 수 있다. 일부 실시형태에서, 이중-가닥 환형 DNA는 예를 들어, 실시예 35에 기재된 바와 같이, 시험관 내 환화에 의해 생성된다. 일반적으로, 시험관 내 환화된 DNA 구축물은 패키징될 유전 요소의 서열을 포함하는 플라스미드를 유전 요소 서열이 선형 DNA 분자로서 절개되도록 분해함으로써 생성될 수 있다. 이어서, 생성된 선형 DNA를 예를 들어, DNA 리가제를 사용하여 라이게이션하여, 이중-가닥 환형 DNA를 형성할 수 있다. 일부 예에서, 시험관 내 환화에 의해 생성되는 이중-가닥 환형 DNA는 예를 들어, 본원에 기재된 바와 같이, 회전환 복제를 겪을 수 있다. 이론에 결부시키고자 하지 않고, 시험관 내 환화가 추가의 변형 없이 회전환 복제를 겪을 수 있는 이중-가닥 DNA 구축물을 초래함으로써, 예를 들어, 본원에 기재된 바와 같이, 아넬로좀 내로 패키징되기에 적합한 크기의 단일-가닥 환형 DNA를 생성할 수 있는 것으로 여겨진다. 일부 실시형태에서, 이중-가닥 DNA 구축물은 플라스미드(예를 들어, 박테리아 플라스미드)보다 더 작다. 일부 실시형태에서, 이중-가닥 DNA 구축물은 플라스미드(예를 들어, 박테리아 플라스미드)로부터 절제된 다음, 예를 들어, 시험관 내 환화에 의해 환화된다.
아넬로좀의 생성
본원에 기재된 바와 같이 제조된 유전 요소 및 유전 요소를 포함하는 벡터는 적절한 숙주 세포에서 아넬로좀을 발현시키기 위하여 다양한 방식으로 사용될 수 있다. 일부 실시형태에서, 유전 요소 및 유전 요소를 포함하는 벡터를 적절한 숙주 세포에서 트랜스펙션시키고, 생성되는 RNA는 아넬로좀 유전자 생성물, 예를 들어, 비-병원성 단백질 및 단백질 결합 서열의 발현을 높은 수준으로 유도할 수 있다. 높은 수준의 발현을 제공하는 숙주 세포 시스템은 바이러스 기능을 제공하는 연속 세포주, 예컨대 각각 APV 또는 MPV로 중복감염된 세포주, APV 또는 MPV 기능을 보완하도록 엔지니어링되는 세포주 등을 포함한다.
일부 실시형태에서, 아넬로좀은 실시예 1, 2, 5, 6 또는 15 내지 17 중 어느 하나에 기재된 바와 같이 생성된다.
일부 실시형태에서, 아넬로좀은 시험관 내에서 연속 동물 세포주에서 배양된다. 본 발명의 일 실시형태에 따라, 세포주는 돼지 세포주를 포함할 수 있다. 본 발명의 맥락에서 예상되는 세포주는 불멸화된 돼지 세포주, 예컨대 비제한적으로 돼지 신장 상피 세포주 PK-15 및 SK, 단일골수성(monomyeloid) 세포주 3D4/31 및 정소 세포주 ST를 포함한다. 또한, 다른 포유동물 세포주, 예컨대 CHO 세포(중국 햄스터 난소), MARC-145, MDBK, RK-13, EEL이 포함된다. 추가로 또는 대안적으로, 본 발명의 방법의 특정 실시형태는 상피 세포주, 즉, 상피 계통의 세포의 세포주인 동물 세포주를 이용한다. 아넬로좀을 이용한 감염에 감수성인 세포주는 인간 또는 영장류 기원의 세포주, 예컨대 인간 또는 영장류 신장 암종 세포주를 포함하지만, 이들에 제한되지 않는다.
일부 실시형태에서, 유전 요소 및 유전 요소를 포함하는 벡터를 바이러스 중합효소 단백질을 발현하는 세포주 내로 트랜스펙션시켜, 아넬로좀의 발현을 달성한다. 이를 위하여, 아넬로좀 중합효소 단백질을 발현하는 형질전환된 세포주는 적절한 숙주 세포로서 이용될 수 있다. 숙주 세포는 다른 바이러스 기능 또는 추가의 기능을 제공하도록 유사하게 엔지니어링될 수 있다.
본원에 개시된 아넬로좀을 제조하기 위하여, 본원에 개시된 유전 요소 또는 유전 요소를 포함하는 벡터를 사용하여, 세포를 트랜스펙션시켜, 복제 및 생성에 필요한 아넬로좀 단백질 및 기능을 제공할 수 있다. 대안적으로, 세포를 본원에 개시된 유전 요소 또는 유전 요소를 포함하는 벡터에 의한 트랜스펙션 이전에, 그 동안에 또는 그 이후에 헬퍼 바이러스로 트랜스펙션시킬 수 있다. 일부 실시형태에서, 헬퍼 바이러스는 불완전한 바이러스 입자의 생성을 보완하는 데 유용할 수 있다. 헬퍼 바이러스는 조건적 성장 결함, 예컨대 숙주 범위 제한 또는 온도 민감성을 가질 수 있으며, 이는 트랜스펙션 바이러스의 이후의 선택을 가능하게 한다. 일부 실시형태에서, 헬퍼 바이러스는 아넬로좀의 발현을 달성하기 위하여 숙주 세포에 의해 사용되는 하나 이상의 복제 단백질을 제공할 수 있다. 일부 실시형태에서, 숙주 세포는 바이러스 단백질, 예컨대 하나 이상의 복제 단백질을 인코딩하는 벡터로 트랜스펙션될 수 있다. 일부 실시형태에서, 헬퍼 바이러스는 항바이러스 감수성을 포함한다.
본원에 개시된 유전 요소 또는 유전 요소를 포함하는 벡터는 예를 들어, 각각의 전문이 본원에 참조로 포함되는 미국 특허 제4,650,764호; 미국 특허 제5,166,057호; 미국 특허 제5,854,037호; 유럽 특허 공개 제EP 0702085A1호; 미국 특허 출원 제09/152,845호; 국제 특허 공개 PCT WO97/12032호; WO96/34625호; 유럽 특허 공개 EP-A780475호; WO 99/02657호; WO 98/53078호; WO 98/02530호; WO 99/15672호; WO 98/13501호; WO 97/06270호; 및 EPO 780 47SA1호에 기재된 바와 같이, 해당 분야에 알려져 있는 임의의 수의 기법에 의해 아넬로좀 입자로 복제되고 생성될 수 있다.
본 발명에 따른 아넬로좀-함유 세포 배양물의 생성은 상이한 규모로, 예컨대 플라스크, 롤러 보틀(roller bottle) 또는 생물반응기에서 수행될 수 있다. 감염될 세포의 배양을 위해 사용되는 배지는 당업자에게 알려져 있으며, 일반적으로 세포 생존성에 필요한 표준 영양물질을 포함할 수 있으며, 또한 세포 유형에 따라 추가의 영양물질을 포함할 수 있다. 선택적으로, 배지는 단백질-부재 및/또는 혈청-부재일 수 있다. 세포 유형에 따라, 세포는 현탁액 중에서 또는 기판 상에서 배양될 수 있다. 일부 실시형태에서, 숙주 세포의 성장을 위하여, 그리고 아넬로좀의 생성을 위하여 상이한 배지가 사용된다.
아넬로좀의 정제 및 단리는 바이러스 생성에서 당업자에게 알려져 있는 방법에 따라 수행될 수 있으며, 예를 들어, 문헌[Rinaldi, et al., DNA Vaccines: Methods and Protocols (Methods in Molecular Biology), 3rd ed. 2014, Humana Press]에 기재되어 있다.
일 양태에서, 본 발명은 본원에 기재된 바와 같은 아넬로좀의 시험관 내 복제 및 증식을 위한 방법을 포함하며, 이는 하기의 단계를 포함할 수 있다: (a) 선형화된 유전 요소를 아넬로좀 감염에 감수성인 세포주 내로 트랜스펙션시키는 단계; (b) 세포를 수집하고, 유전 요소의 존재를 나타내는 세포를 단리하는 단계; (c) 단계 (b)에서 수득되는 세포를 실험 조건 및 유전자 발현에 따라, 적어도 3일, 예컨대 적어도 1주 이상 동안 배양하는 단계; 및 (d) 단계 (c)의 세포를 수집하는 단계.
일부 실시형태에서, 아넬로좀은 높은 세포 밀도로 성장된 숙주 세포주로 도입될 수 있다. 일부 실시형태에서, 아넬로좀은 약제학적 부형제를 사용한 제형화 이전에, 생물물리학적 특성에 기초한 용질의 분리, 예를 들어, 이온 교환 크로마토그래피 또는 접선 유동 여과에 의해 수집되고/수집되거나 정제될 수 있다.
VII. 투여/운반
조성물(예를 들어, 본원에 기재된 바와 같은 아넬로좀을 포함하는 약제학적 조성물)은 약제학적으로 허용되는 부형제를 포함하도록 제형화될 수 있다. 약제학적 조성물은 선택적으로 하나 이상의 추가의 활성 물질, 예를 들어, 치료적 및/또는 예방적 활성 물질을 포함할 수 있다. 본 발명의 약제학적 조성물은 멸균 및/또는 발열원-부재일 수 있다. 약제의 제형화 및/또는 제조에서의 일반적인 고려사항은 예를 들어, 문헌[Remington: The Science and Practice of Pharmacy 21st ed., Lippincott Williams & Wilkins, 2005](본원에 참조로 포함됨)에서 찾을 수 있다.
본원에 제공되는 약제학적 조성물의 설명이 주로 인간으로의 투여에 적합한 약제학적 조성물에 관한 것이지만, 이러한 조성물이 일반적으로 임의의 다른 동물로의, 예를 들어, 비-인간 동물, 예를 들어, 비-인간 포유동물로의 투여에 적합하다는 것을 당업자라면 이해할 것이다. 조성물이 다양한 동물로의 투여에 적합하게 만들기 위해 인간으로의 투여에 적합한 약제학적 조성물을 변형하는 것이 충분히 이해되며, 숙련된 수의학 약리학자는 존재한다면, 단지 일상적인 실험을 사용하여 이러한 변형을 설계하고/설계하거나 수행할 수 있다. 약제학적 조성물의 투여가 고려되는 대상체는 인간 및/또는 기타 영장류; 포유동물, 예컨대 상업적으로 관련된 포유동물, 예컨대 소, 돼지, 말, 양, 고양이, 개, 마우스 및/또는 랫트; 및/또는 조류, 예컨대 상업적으로 관련된 조류, 예컨대 가금류, 닭, 오리, 거위 및/또는 칠면조를 포함하지만, 이들에 제한되지 않는다.
본원에 기재된 약제학적 조성물의 제형은 약리학 분야에 알려져 있거나, 이후에 개발되는 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 활성 성분이 부형제 및/또는 하나 이상의 다른 보조 성분과 회합되게 한 다음, 필요하면 그리고/또는 바람직하면, 생성물을 나누고/나누거나, 성형하고/성형하거나 패키징하는 단계를 포함한다.
일 양태에서, 본 발명은 대상체로 아넬로좀을 운반하는 방법을 특징으로 한다. 당해 방법은 본원에 기재된 바와 같은 아넬로좀을 포함하는 약제학적 조성물을 대상체로 투여하는 단계를 포함한다. 일부 실시형태에서, 투여된 아넬로좀은 대상체에서 복제한다(예를 들어, 대상체의 바이러스체의 일부가 된다).
약제학적 조성물은 야생형 또는 고유 바이러스 요소 및/또는 변형된 바이러스 요소를 포함할 수 있다. 아넬로좀은 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 중 어느 하나의 서열(예를 들어, 핵산 서열 또는 그의 아미노산 서열을 인코딩하는 핵산 서열) 또는 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 서열 또는 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 중 어느 하나의 서열에 상보성인 서열 중 하나 이상을 포함할 수 있다. 아넬로좀은 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 17 또는 41 중 어느 하나의 서열의 하나 이상에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 핵산 서열을 포함하는 핵산 분자를 포함할 수 있다. 아넬로좀은 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나의 아미노산 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 아미노산 서열을 인코딩하는 핵산 분자를 포함할 수 있다. 아넬로좀은 표 A2, A4, A6, A8, A10, A12, C1 내지 C5, 2, 4, 6, 8, 10, 12, 14, 16 또는 18 중 어느 하나의 아미노산 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함할 수 있다. 아넬로좀은 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 17 또는 41 중 어느 하나의 서열 또는 뉴클레오티드 서열 중 어느 하나에 대하여 적어도 약 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% 및 99% 뉴클레오티드 서열 동일성을 갖는 서열 또는 표 A1, A3, A5, A7, A9, A11, B1 내지 B5, 1, 3, 5, 7, 9, 11, 13, 15, 17 또는 41 중 어느 하나의 서열에 상보성인 서열 중 하나 이상을 포함할 수 있다.
일부 실시형태에서, 아넬로좀은 내인성 유전자 및 단백질 발현을 기준, 예를 들어, 건강한 대조군에 비하여 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상 증가(자극)시키기에 충분하다. 특정 실시형태에서, 아넬로좀은 내인성 유전자 및 단백질 발현을 기준, 예를 들어, 건강한 대조군에 비하여 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상 감소(저해)시키기에 충분하다.
일부 실시형태에서, 아넬로좀은 숙주 또는 숙주 세포에서 하나 이상의 바이러스 특성, 예를 들어, 향성, 감염성, 면역억제/활성화를 기준, 예를 들어, 건강한 대조군에 비하여 예를 들어, 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상 저해/향상시킨다.
일부 실시형태에서, 바이러스 유전 정보에서 표현되지 않는 하나 이상의 바이러스 주를 추가로 포함하는 약제학적 조성물이 대상체에게 투여된다.
일부 실시형태에서, 본원에 기재된 아넬로좀을 포함하는 약제학적 조성물은 바이러스 감염을 조절하기에 충분한 용량 및 시간으로 투여된다. 바이러스 감염의 일부 비제한적인 예는 아데노-연관 바이러스, 아이치(Aichi) 바이러스, 호주 박쥐 리사 바이러스(lyssavirus), BK 폴리오마바이러스(polyomavirus), 반나 바이러스(Banna virus), 바르마 포레스트(Barmah forest) 바이러스, 부니아무에라(Bunyamwera) 바이러스, 부니아바이러스 라 크로세(Bunyavirus La Crosse), 부니아바이러스 스노우슈 하레(Bunyavirus snowshoe hare), 세르코피테신 헤르페스바이러스(Cercopithecine herpesvirus), 찬디푸라 바이러스(Chandipura virus), 치쿤구니아 바이러스(Chikungunya virus), 코사바이러스(Cosavirus) A, 우두 바이러스, 콕사키바이러스(Coxsackievirus), 크리민-콩고 출혈성 열 바이러스(Crimean-Congo hemorrhagic fever virus), 뎅기(Dengue) 바이러스, 도리(Dhori) 바이러스, 더그비(Dugbe) 바이러스, 두벤하게(Duvenhage) 바이러스, 동부 말 뇌염 바이러스, 에볼라바이러스, 에코바이러스(Echovirus), 뇌심근염(Encephalomyocarditis) 바이러스, 엡스테인-바 바이러스, 유럽 박쥐 리사바이러스, GB 바이러스 C/G형 간염 바이러스, 한탄(Hantaan) 바이러스, 헨드라(Hendra) 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 간염 델타 바이러스, 마두 바이러스, 인간 아데노바이러스, 인간 아스트로바이러스, 인간 코로나바이러스, 인간 사이토메갈로바이러스, 인간 엔테로바이러스 68, 인간 엔테로바이러스 70, 인간 헤르페스바이러스 1, 인간 헤르페스바이러스 2, 인간 헤르페스바이러스 6, 인간 헤르페스바이러스 7, 인간 헤르페스바이러스 8, 인간 면역결핍 바이러스, 인간 파필로마바이러스 1, 인간 파필로마바이러스 2, 인간 파필로마바이러스 16, 인간 파필로마바이러스 18, 인간 파라인플루엔자, 인간 파보바이러스 B19, 인간 호흡기 융합 바이러스, 인간 리노바이러스, 인간 SARS 코로나바이러스, 인간 스푸마레트로바이러스(spumaretrovirus), 인간 T-림포트로픽 바이러스, 인간 토로바이러스(torovirus), 인플루엔자 A 바이러스, 인플루엔자 B 바이러스, 인플루엔자 C 바이러스, 이스파한(Isfahan) 바이러스, JC 폴리오마바이러스, 일본 뇌염 바이러스, 주닌 아레나바이러스(Junin arenavirus), KI 폴리오마바이러스, 쿤진(Kunjin) 바이러스, 라고스(Lagos) 박쥐 바이러스, 레이크 빅토리아 마르부르그바이러스(Lake Victoria marburgvirus), 란가트(Langat) 바이러스, 라사(Lassa) 바이러스, 로즈데일(Lordsdale) 바이러스, 라우핑 일(Louping ill) 바이러스, 림프구 맥락수막염 바이러스, 마추포(Machupo) 바이러스, 마이아로(Mayaro) 바이러스, MERS 코로나바이러스, 홍역 바이러스, 멘고(Mengo) 뇌심근염 바이러스, 메르켈 세포 폴리오마바이러스(Merkel cell polyomavirus), 모콜라(Mokola) 바이러스, 전염성 연속종 바이러스, 원두 바이러스, 볼거리 바이러스, 무레이 밸리(Murray valley) 뇌염 바이러스, 뉴욕 바이러스, 니파(Nipah) 바이러스, 노르워크(Norwalk) 바이러스, 오뇽-뇽(O'nyong-nyong) 바이러스, 올프(Orf) 바이러스, 오로퓨스(Oropouche) 바이러스, 피친데(Pichinde) 바이러스, 폴리오바이러스, 푼타 토로 플레보바이러스(Punta toro phlebovirus), 푸말라(Puumala) 바이러스, 광견병 바이러스, 리프트계곡열 바이러스, 로사바이러스(Rosavirus) A, 로스 강(Ross river) 바이러스, 로타바이러스 A, 로타바이러스 B, 로타바이러스 C, 풍진 바이러스, 사기야마(Sagiyama) 바이러스, 살리바이러스(Salivirus) A, 모래파리 열 시실리안(Sandfly fever sicilian) 바이러스, 삿포로(Sapporo) 바이러스, 셈리키 포레스트(Semliki forest) 바이러스, 서울(Seoul) 바이러스, 유인원 포미(Simian foamy) 바이러스, 유인원 바이러스 5, 신드비스(Sindbis) 바이러스, 사우샘프턴(Southampton) 바이러스, 세인트 루이스 뇌염(St. louis encephalitis) 바이러스, 틱-본 포와산(Tick-borne powassan) 바이러스, 토르크 테노 바이러스, 토스카나(Toscana) 바이러스, 우우쿠니에미(Uukuniemi) 바이러스, 백시니아 바이러스, 바리셀라-조스터(Varicella-zoster) 바이러스, 바리올라(Variola) 바이러스, 베네주엘란(Venezuelan) 말 뇌염 바이러스, 수포성 구내염 바이러스, 서부 말 뇌염 바이러스, WU 폴리오마바이러스, 웨스트 나일(West Nile) 바이러스, 야바(Yaba) 원숭이 종양 바이러스, 야바-유사 질병 바이러스, 황열 바이러스 및 지카 바이러스를 포함한다. 특정 실시형태에서, 아넬로좀은 대상체에 이미 존재하는 바이러스를 예를 들어, 기준에 비하여 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상 능가하고/능가하거나 대체하기에 충분하다. 특정 실시형태에서, 아넬로좀은 만성 또는 급성 바이러스 감염과 경쟁하기에 충분하다. 특정 실시형태에서, 아넬로좀은 바이러스 감염으로부터 보호하기 위하여 예방적으로 투여될 수 있다(예를 들어, 바이러스전(provirotic)). 일부 실시형태에서, 아넬로좀은 (예를 들어, 표현형, 바이러스 수준, 유전자 발현, 다른 바이러스와의 경쟁, 병태 등을 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% 이상) 조절하기에 충분한 양으로 존재한다.
본원에 언급된 모든 참고문헌 및 간행물은 본원에 참조로 포함된다.
하기의 실시예는 본 발명의 일부 실시형태를 추가로 예시하기 위해 제공되지만, 본 발명의 범주를 제한하고자 하지 않으며; 당업자에게 알려져 있는 다른 절차, 방법 또는 기법이 대안적으로 사용될 수 있다는 것이 그들의 예시적인 성질에 의해 이해될 것이다.
실시예
목차
실시예 1: 아넬로좀의 제조: 인터페론(IFN) 발현을 저해하는 합성 아넬로좀의 설계 및 합성
실시예 2: 아넬로좀(아넬로좀 A 및/또는 B)의 대규모 생성: 아넬로좀의 생성 및 증량
실시예 3: 시험관 내에서의 아넬로좀(아넬로좀 A)의 영향: 세포 감염 후의 아넬로좀의 발현 및 이펙터 기능, 예를 들어, miRNA의 발현의 시험관 내 평가
실시예 4: 아넬로좀(아넬로좀 A)의 면역학적 효과: 투여 이후 아넬로좀의 생체 내 이펙터 기능, 예를 들어, miRNA의 발현
실시예 5: 합성 아넬로좀의 제조: 합성 아넬로좀의 시험관 내 생성
실시예 6: 아넬로좀의 어셈블리 및 감염: 실시예 5에 기재된 바와 같은 합성 DNA 서열을 사용한 감염성 아넬로좀의 시험관 내 생성
실시예 7: 아넬로좀의 선택성: 시험관 내에서 생성되는 합성 아넬로좀은 다양한 조직 기원의 세포주를 감염시킨다
실시예 8: 단백질 결합 서열의 확인 및 이용: 아넬로바이러스 게놈 내의 추정 단백질-결합 부위
실시예 9: 아넬로바이러스 게놈
실시예 10: 아넬로바이러스 게놈 내로의 다양한 길이의 뉴클레오티드 삽입: 아넬로바이러스 게놈 내로의 다양한 길이의 DNA 서열의 부가
실시예 11: 운반할 예시적인 카고: 아넬로좀 내의 예시적인 핵산 및 단백질 페이로드의 부류
실시예 12: 예시적인 페이로드 통합 유전자좌
실시예 13: 아넬로바이러스 및 그의 보존된 영역의 정의된 범주
실시예 14: 복제-결핍 아넬로좀 및 헬퍼 바이러스
실시예 15: 복제-적격 아넬로좀의 제조 과정
실시예 16: 복제-결핍 아넬로좀의 제조 과정: 복제-결핍 아넬로좀의 회수 및 생성 규모 확대
실시예 17: 현탁 세포를 사용한 아넬로좀의 생성: 현탁액 중 세포 내의 아넬로좀의 생성
실시예 18: qPCR에 의한 아넬로좀 게놈 당량의 정량화: 아넬로좀을 정량화하기 위한 가수분해 프로브-기반의 정량적 PCR 검정의 개발
실시예 19: 마우스에서 외인성 단백질을 발현하기 위한 아넬로좀의 이용: 생체 내에서 기능적 모델 단백질을 발현하기 위한 아넬로좀의 이용
실시예 20: 아넬로좀 DNA가 숙주 게놈 내에 통합되는지 여부를 결정하기 위한 게놈 정렬
실시예 21: 숙주 게놈 내로의 아넬로좀 통합의 평가
실시예 22: 외인성 마이크로RNA 서열을 발현하는 아넬로좀의 기능적 효과: 기능적 핵산 이펙터를 발현하기 위한 아넬로좀의 이용
실시예 23: 외인성 비-코딩 RNA를 발현하기 위한 아넬로좀의 제조 및 생성: 외인성 소형 비-코딩 RNA를 발현하기 위한 아넬로좀의 이용
실시예 24: 아넬로바이러스 클레이드에서의 보존: 알파토르크바이러스 속 내의 7개의 클레이드의 확인
실시예 25: 아넬로좀으로부터 내인성 miRNA의 발현 및 내인성 miRNA의 결실
실시예 26: 아넬로바이러스 ORF의 국소화
실시예 27: 아넬로좀 개발에 필요한 영역의 특성화
실시예 28: 생체 내에서의 외인성 단백질의 아넬로좀 운반: 본 실시예는 투여 후의 아넬로좀의 생체 내 이펙터 기능(예를 들어, 단백질의 발현)을 보여준다.
실시예 29: 아넬로바이러스에서의 전구체 miRNA(pre-mIR)의 확인: 다양한 아넬로바이러스에 의해 인코딩되는 신규한 전구체 miRNA를 확인하기 위한 컴퓨터 기반 및 실험적 접근법
실시예 30: 아넬로바이러스 pre-miR의 내인성 표적의 결정: 다양한 아넬로바이러스의 주에 의해 인코딩되는 pre-miR의 내인성 표적 및 잠재적으로 치료적으로 관련이 있는 표적 경로를 결정하기 위한 분석
실시예 31: 고유 아넬로바이러스 pre-miR를 인코딩하는 아넬로좀의 제조: 고유 아넬로바이러스 pre-miR를 발현하는 아넬로좀의 복제 또는 비-복제 형태 중 어느 하나를 패키징하기 위한 과정
실시예 32: 시험관 내 세포 배양 모델에서의 아넬로바이러스 pre-miR 종양 억제제의 이용: 예를 들어, 실시예 29에 기재된 바와 같은, 분석으로부터 종양 억제제로서 확인된 후보 pre-miR의 표현형 영향
실시예 33: 생체 내에서 종양 억제제로서의 아넬로바이러스 pre-miR의 이용: 실시예 32에 기재된 바와 같은, 시험관 내 분석으로부터 암 세포주 및 종양 억제성 아넬로바이러스 pre-miR의 종양 억제 효과를 확인하기 위한 생체 내 실험
실시예 34: 아넬로바이러스 게놈의 탠덤 카피
실시예 35: 시험관 내 환화된 아넬로바이러스 게놈: 최소 비-바이러스 DNA와 함께, 환형, 이중 가닥 아넬로바이러스 게놈 DNA를 포함하는 구축물
실시예 36: ORF1의 모델링 및 보존된 잔기 및 도메인의 확인: 베타토르크바이러스의 ORF1 단백질의 모델링 및 추정 도메인 정의
실시예 37: 상이한 토르크 테노 바이러스 주로부터의 초가변 도메인을 갖는 키메라 ORF1을 함유하는 아넬로좀의 생성
실시예 38: 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1의 생성
실시예 39: DNA 페이로드를 갖는 아넬로좀의 설계
실시예 40: 아넬로좀-인코딩 항체 전이유전자의 형질도입
실시예 41: tth8 및 LY2에 기초한 아넬로좀은 각각 EPO 유전자를 폐암 세포 내에 성공적으로 형질도입시켰다
실시예 42: 치료적 전이유전자를 갖는 아넬로좀은 정맥내(i.v.) 투여 후에 생체 내에서 검출될 수 있다
실시예 43: 아넬로바이러스 내의 코딩 서열 크기 분포
실시예 44: ORF2를 특성화하기 위한 고도로 보존된 모티프
실시예 45: 인간 내의 전장 아넬로바이러스 ORF1 mRNA에 대한 증거
실시예 46: 시험관 내에서 아넬로좀을 생성하기 위한 투입 물질로서 시험관 내 환화된 게놈
실시예 47: 아넬로바이러스 ORF1 내의 보존된 2차 구조 모티프의 확인
실시예 1: 아넬로좀의 제조
본 실시예에는 인터페론(IFN) 발현을 저해하는 합성 아넬로좀의 설계 및 합성이 기재되어 있다.
아넬로좀(아넬로좀 A)은 1) 비-병원성 패키징 봉입물을 인코딩하는 캡시드 유전자에 대한 DNA 서열(문헌[Arch Virol (2007) 152: 1961-1975]), 수탁 번호: A7XCE8.1(ORF11_TTW3); 2) 숙주 유전자(예를 들어, IFN)를 표적화하는 마이크로RNA를 코딩하는 DNA 서열(문헌[PLOS Pathogen (2013), 9(12), e1003818]), 수탁 번호: AJ620231.1; 및 3) 캡시드 단백질 내의 특정 영역(예를 들어, 수탁 번호: Q99153.1을 갖는 캡시드의 특정 영역)에 결합하는 DNA 서열(문헌[Journal of Virology (2003), 77(24), 13036-13041])로 시작하여 설계된다.
이러한 서열에, 1 kb의 비-코딩 DNA 서열을 부가한다(아넬로좀 B). 설계된 아넬로좀(도 2)은 3 kb(전체 크기)로 화학적으로 합성되고, 이를 서열 확인한다.
아넬로좀 서열을 제조처에 의해 권고되는 바와 같이 JetPEI 시약(폴리플러스(PolyPlus)-트랜스펙션, 프랑스 일키르히 소재)을 사용하여 인간 배아 신장 293T 세포(12-웰 플레이트 상에서 105개 세포당 1 ㎎) 내로 트랜스펙션시킨다. 단독의 벡터, 또는 JetPEI 단독으로 트랜스펙션된 세포를 사용한 대조군 트랜스펙션을 포함시키고, GFP를 인코딩하는 리포터 플라스미드를 사용하여 트랜스펙션 효율을 최적화시킨다. 대조군 트랜스펙션의 형광을 측정하여, 적절하게 트랜스펙션된 세포를 보장한다. 트랜스펙션된 배양물을 37℃ 및 5% 이산화탄소에서 하룻밤 인큐베이션시킨다.
18시간 후에, 세포를 PBS로 3회 세척한 후, 신선한 배지를 첨가한다. 상청액을 하기와 같은 아넬로좀의 초원심분리 및 수거를 위해 수집한다. 배지를 30분 동안 4,000 x g에 이어서 15분 동안 8,000 x g에서의 원심분리에 의하여 투명하게 하여, 세포 및 세포 데브리스를 제거한다. 그 다음, 상청액을 0.45-㎛-포어-크기 필터를 통해 여과한다. 아넬로좀을 5% 수크로스 쿠션(5 ㎖)을 통해 27,000 rpm에서 1시간 동안 펠렛화시키고, 1x 인산염-완충 염수(PBS) + 0.1% 바시트라신(bacitracin) 중에 원래의 부피의 1/100으로 재현탁화시킨다. 농축된 아넬로좀을 24,000 rpm에서 2시간 동안 20 내지 35% 수크로스 단계 기울기를 통해 원심분리한다. 기울기 연결층에서의 아넬로좀 밴드를 수집한다. 그 다음, 아넬로좀을 1x PBS로 희석하고, 27,000 rpm에서 1시간 동안 펠렛화시킨다. 아넬로좀 펠렛을 1x PBS 중에 재현탁화시키고, 20 내지 35% 연속 수크로스 기울기를 통해 추가로 정제한다.
실시예 2: 아넬로좀(아넬로좀 A 및/또는 B)의 대규모 생성
본 실시예에는 아넬로좀의 생성 및 증식이 기재된다.
실시예 1에 기재된 바와 같은 정제된 아넬로좀을 현탁액 중에 성장하는 생성자 A549 세포가 있는 스피너(spinner) 플라스크에서 대규모 증폭을 위해 제조한다. A549 세포를 F12K 배지, 10% 우태아혈청, 2 mM 글루타민 및 항생제에서 유지한다. A549 세포를 106개의 아넬로좀 로드에서 아넬로좀으로 감염시켜, 37℃ 및 5% 이산화탄소에서 24시간 동안의 인큐베이션 후에 약 1x107개의 아넬로좀 입자를 생성한다. 그 다음, 세포를 PBS로 3회 세척하고, 신선한 배지와 함께 6시간 동안 인큐베이션시킨다.
아넬로좀 정제를 위하여, 염화세슘 기울기에 기초한 2개의 초원심분리 단계에 이어서 하기와 같은 투석을 수행하였다(문헌[Bio-Protocol (2012) Bio101: e201]). 세포를 원심분리(10분 동안 6000 x g)에 의해 제거하고, 상청액을 0.8에 이어서 0.2 ㎛ 필터를 통해 여과한다. 여액을 필터 막(100,000 mw)을 통과시킴으로써 8 ㎖의 부피로 농축시킨다. 잔류물을 황산세슘 용액 내로 로딩하고, 247,000 x g에서 20시간 동안 원심분리한다. 아넬로좀 밴드를 제거하고, 14,000 mw 컷오프 투석 튜빙에 배치하고, 투석한다. 추가의 농축이 요망된다면, 수행될 수 있다.
실시예 3: 시험관 내에서의 아넬로좀(아넬로좀 A)의 영향
본 실시예에는 세포 감염 후의 아넬로좀의 발현 및 이펙터 기능, 예를 들어, miRNA의 발현의 시험관 내 평가가 기재된다.
실시예 1에 기재된 바와 같은 정제된 아넬로좀의 영향은 내인성 유전자 조절(예를 들어, IFN 신호전달)을 통해 시험관 내에서 평가한다. HEK293T 세포를 이중 루시퍼라제 플라스미드(인터페론-자극된 반응 요소(ISRE) 기반의 프로모터를 갖는 반딧불이 루시퍼라제 및 구성적 프로모터를 갖는 트랜스펙션 대조군 레닐라 루시퍼라제): 루시퍼라제 리포터 믹스(1:4 비의 pcDNA3.1dsRluc 대 pISRE-Luc(클론테크(Clonetech)))(문헌[J Virol (2008), 82: 9823-9828])로 동시-트랜스펙션시킨다.
아넬로좀을 6-웰 플레이트에 씨딩된 HEK293T 세포에 대하여 107의 감염 다중도로 투여한다(2개의 세트의 3벌-3개의 대조군 웰 및 아넬로좀 A가 있는 3개의 실험 웰).
48시간 후에, 배지를 100 u/㎖의 범용 I형 인터페론(PBL, 미국 뉴저지주 피스카타웨이 소재)이 존재하거나 부재하는 새로운 배지로 교체한다. IFN 처리 16시간 후에, 이중-루시퍼라제 검정(문헌[J Virol (2008), 82: 9823-9828])을 수행하여, IFN 신호전달을 결정한다. 트랜스펙션 차이에 대하여 관리하기 위하여 반딧불이 루시퍼라제를 레닐라 루시퍼라제 발현에 대하여 정규화시킨다. 비교 가능한 실험 웰을 대조군 웰로 나누어, ISRE ffLuc 리포터의 배수 유도를 계산하고, 각 조건의 유도를 음성 대조군에 비하여 비교한다.
일 실시형태에서, 대조군에 비하여 아넬로좀 처리군에서의 감소된 루시퍼라제 신호는 아넬로좀이 세포에서 IFN 생성을 감소시키는 것을 나타낼 것이다.
실시예 4: 아넬로좀(아넬로좀 A)의 면역학적 효과
본 실시예에는 투여 후의 아넬로좀의 생체 내 이펙터 기능, 예를 들어, miRNA의 발현이 기재되어 있다.
실시예 1 및 2에 기재된 바와 같이 제조된, 정제된 아넬로좀을 킬로그램당 1014의 게놈 당량에서 시작하여, 킬로그램당 0의 게놈 당량까지 100배 희석을 사용하여 다양한 용량으로 건강한 돼지에게 정맥내 투여한다. 면역 관용에 대한 영향을 평가하기 위하여, 돼지에게 상기 특정된 투여량의 아넬로좀 또는 비히클 대조군 PBS를 3일 동안 매일 주사하고, 3일 후에 희생시킨다.
비장, 골수 및 림프절을 수집한다. 단일 세포 현탁액을 각각의 조직으로부터 제조하고, MHC-II, CD11c 및 세포내 IFN에 대한 세포외 마커로 염색한다. MHC+, CD11c+, IFN+ 항원 제시 세포를 각각의 조직으로부터 유세포분석을 통해 분석하며, 예를 들어, 상기 언급된 마커 중 주어진 하나에 대하여 양성인 세포는, 마커의 발현이 결여되지만 다르게는 세포의 검정 집단과 유사한 음성 대조군 집단에서 동일한 조건 하에서 세포의 99%보다 더 높은 형광을 나타내는 세포이다.
일 실시형태에서, 대조군에 비하여 아넬로좀 처리군에서의 감소된 수의 IFN+ 세포는 아넬로좀이 투여 후에 세포에서 IFN 생성을 감소시키는 것을 나타낼 것이다.
실시예 5: 합성 아넬로좀의 제조.
본 실시예에는 합성 아넬로좀의 시험관 내 생성이 입증되어 있다.
EcoRV 제한 효소 부위 사이의 TTMiniV의 LY1 및 LY2 주로부터의 DNA 서열(문헌[Eur Respir J. 2013 Aug;42(2):470-9])을 카나마이신 벡터(인테그레이티드 DNA 테크놀로지즈(Integrated DNA Technologies)) 내로 클로닝하였다. TTMiniV의 LY1 및 LY2 주로부터의 DNA 서열을 포함하는 아넬로좀은 실시예 6 및 7, 및 도 6a 내지 도 10b에 각각 아넬로좀 1(아넬로 1) 및 아넬로좀 2(아넬로 2)로 지칭된다. 클로닝된 구축물을 10-베타 컴피턴트 에스케리키아 콜라이(뉴 잉글랜드 바이오랩스 인코포레이티드(New England Biolabs Inc.)) 내로 형질전환시킨 후, 제조처의 프로토콜에 따라 플라스미드 정제(퀴아젠(Qiagen))하였다.
DNA 구축물(도 3 및 도 4)을 37℃에서 6시간 동안 EcoRV 제한 분해(뉴 잉글랜드 바이오랩스, 인코포레이티드)로 선형화시켜, TTMiniV 게놈을 함유하고, 박테리아 백본 요소(예컨대, 복제 원점 및 선택 가능한 마커)를 배제한 이중-가닥 선형 DNA 단편을 제공하였다. 이에 이어서, 아가로스 겔 전기영동, TTMiniV 게놈 단편(2.9 킬로베이스 쌍)에 대한 정확한 크기의 DNA 밴드의 절제 및 제조업체의 프로토콜에 따른 겔 추출 키트(퀴아젠)를 사용한 절제된 아가로스 밴드로부터의 DNA의 겔 정제를 행하였다.
실시예 6: 아넬로좀의 어셈블리 및 감염
본 실시예에서는 실시예 5에 기재된 바와 같은 합성 DNA 서열을 사용한 감염성 아넬로좀의 성공적인 시험관 내 생성이 입증된다.
이중-가닥 선형화된 겔-정제된 아넬로바이러스 게놈 DNA(실시예 5에서 수득됨)를 지질 트랜스펙션 시약(써모 피셔 사이언티픽(Thermo Fisher Scientific))을 사용하여, 온전한 플라스미드에서 또는 선형화된 형태에서, HEK293T 세포(인간 배아 신장 세포주) 또는 A549 세포(인간 폐 암종 세포주) 중 어느 하나로 트랜스펙션시켰다. T25 플라스크 내의 70% 컨플루언트 세포의 트랜스펙션을 위하여 6 ㎍의 플라스미드 또는 1.5 ㎍의 선형화된 아넬로바이러스 게놈 DNA를 사용하였다. 아넬로좀에 포함된 바이러스 서열이 결여된 빈 벡터 백본을 음성 대조군으로서 사용하였다. 트랜스펙션 후 6시간에, 세포를 PBS로 2회 세척하고, 37℃ 및 5% 이산화탄소에서 신선한 성장 배지에서 성장하게 하였다. 인간 Ef1alpha 프로모터에 이어서 YFP 유전자를 인코딩하는 DNA 서열을 IDT로부터 합성하였다. 이러한 DNA 서열을 클로닝 벡터(써모 피셔 사이언티픽) 내로 블런트 말단 라이게이션시켰다. 생성된 벡터를 트랜스펙션 효율을 평가하기 위한 대조군으로서 사용하였다. YFP를 트랜스펙션 72시간 후에 세포 영상화 시스템(써모 피셔 사이언티픽)을 사용하여 검출하였다. HEK293T 및 A549 세포의 트랜스펙션 효율은 각각 85% 및 40%로 계산되었다(도 5).
아넬로좀으로 트랜스펙션된 293T 및 A549 세포의 상청액을 트랜스펙션 후 96시간에 수집하였다. 수집된 상청액을 2000 rpm에서 4℃에서 10분 동안 회전 침강시켜, 임의의 세포 데브리스를 제거하였다. 수집된 상청액의 각각을 사용하여 24 웰 플레이트 내의 웰에서 70% 컨플루언트인 새로운 293T 및 A549 세포를 각각 감염시켰다. 37℃ 및 5% 이산화탄소에서의 24시간의 인큐베이션 후에 상청액을 세척해낸 후, 2회의 PBS의 세척 및 신선한 성장 배지로 대체를 행하였다. 이들 세포를 37℃ 및 5% 이산화탄소에서 또 다시 48시간 동안 인큐베이션시킨 후에, 게놈 DNA 추출을 위하여 세포를 개별적으로 수집하였다. 각각의 시료로부터의 게놈 DNA를 제조처의 프로토콜에 따라 게놈 DNA 추출 키트(써모 피셔 사이언티픽)를 사용하여 수집하였다.
시험관 내 생성된 아넬로좀에 의한 293T 및 A549 세포의 성공적인 감염을 확인하기 위하여, 본원에 기재된 바와 같이 수집된 100 ng의 게놈 DNA를 사용하여, LY2 특이적 서열 또는 베타-토르크바이러스에 대하여 특이적인 프라이머를 사용한 정량적 중합효소 연쇄 반응(qPCR)을 수행하였다. 제조처의 프로토콜에 따라 SYBR 그린 시약(써모 피셔 사이언티픽)을 사용하여 qPCR을 수행하였다. GAPDH의 게놈 DNA 서열에 대하여 특이적인 프라이머에 대한 qPCR을 정규화를 위해 사용하였다. 사용되는 모든 프라이머에 대한 서열은 표 42에 열거되어 있다.
[표 42]
Figure pct00164
도 6a, 도 6b, 도 7a 및 도 7b에 도시된 qPCR 결과에 나타난 바와 같이, 시험관 내에서 그리고 본 실시예에 기재된 바와 같이 생성된 아넬로좀은 감염성이었다.
실시예 7: 아넬로좀의 선택성
본 실시예에서는 시험관 내에서 생성된 합성 아넬로좀이 다양한 조직 기원의 세포주를 감염시키는 능력이 입증된다.
감염성 TTMiniV 아넬로좀(실시예 5에 기재됨)을 갖는 상청액을 24 웰 플레이트의 웰 내에서 37℃ 및 5% 이산화탄소에서 70% 컨플루언트 293T, A549, Jurkat(급성 T 세포 백혈병 세포주), Raji(버킷 림프종 B 세포주) 및 Chang 세포주와 인큐베이션시켰다. 세포를 감염 24시간 후에 PBS로 2회 세척한 후, 신선한 성장 배지로 교체하였다. 그 다음, 세포를 다시 또 다른 48시간 동안 37℃ 및 5% 이산화탄소에서 인큐베이션시킨 후, 게놈 DNA 추출을 위한 수집을 행하였다. 각각의 시료로부터의 게놈 DNA를 제조처의 프로토콜에 따라 게놈 DNA 추출 키트(써모 피셔 사이언티픽)를 사용하여 수집하였다.
이전의 실시예에서 생성된 아넬로좀에 의한 이들 세포주의 성공적인 감염을 확인하기 위하여, 본원에 기재된 바와 같이 수집된 100 ng의 게놈 DNA를 사용하여, LY2 특이적 서열 또는 베타-토르크바이러스에 대하여 특이적인 프라이머를 사용한 정량적 중합효소 연쇄 반응(qPCR)을 수행하였다. 제조처의 프로토콜에 따라 SYBR 그린 시약(써모 피셔 사이언티픽)을 사용하여 qPCR을 수행하였다. GAPDH의 게놈 DNA 서열에 대하여 특이적인 프라이머에 대한 qPCR을 정규화를 위해 사용하였다. 사용되는 모든 프라이머에 대한 서열은 표 42에 열거되어 있다.
도 6a 내지 도 10b에 도시된 qPCR 결과에 나타나 있는 바와 같이, 시험관 내에서 생성되는 아넬로좀은 감염성일 뿐만 아니라, 그들은 상피 세포, 폐 조직 세포, 간 세포, 암종 세포, 림프구, 림프모구, T 세포, B 세포 및 신장 세포의 예들을 비롯한 다양한 세포주를 감염시킬 수 있었다. 또한, 합성 아넬로좀이 HepG2 세포(간 세포주)를 감염시켜, 대조군에 비하여 100배 초과의 증가를 초래할 수 있는 것이 관찰되었다.
실시예 8: 단백질 결합 서열의 확인 및 이용
본 실시예에는 예를 들어, 본원에 기재된 바와 같이 아넬로좀에서의 이펙터의 증폭 및 패키징에 사용될 수 있는 아넬로바이러스 게놈 내의 추정 단백질-결합 부위가 기재되어 있다. 일부 예에서, 단백질-결합 부위는 외부 단백질, 예컨대 캡시드 단백질에 결합할 수 있다.
아넬로바이러스 게놈 내의 2개의 보존된 도메인은 추정된 복제 원점이다: 5' UTR 보존된 도메인(5CD) 및 GC-풍부 도메인(GCR)(문헌[de Villiers et al., Journal of Virology 2011]; 문헌[Okamoto et al., Virology 1999]). 일 예에서, 이들 서열이 DNA 복제 부위로서 작용하는지, 캡시드 패키징 신호로서 작용하는지를 확인하기 위하여, TTMV-LY2를 지니는 플라스미드에서 각 영역의 결실을 만들었다. A539 세포를 pTTMV-LY2Δ5CD 또는 pTTMV-LY2ΔGCR로 트랜스펙션시킨다. 트랜스펙션된 세포를 4일 동안 인큐베이션시킨 다음, 바이러스를 상청액 및 세포 펠렛으로부터 단리한다. A549 세포를 바이러스로 감염시키고, 4일 후에, 바이러스를 상청액 및 감염된 세포 펠렛으로부터 단리한다. qPCR을 수행하여, 시료로부터 바이러스 게놈을 정량화시킨다. 복제 원점의 파괴는 바이러스 복제효소가 바이러스 DNA를 복제하는 것을 방지하고, 야생형 바이러스에 비하여 트랜스펙션된 세포 펠렛으로부터 단리된 바이러스 게놈을 감소시킨다. 소량의 바이러스가 여전히 패키징되며, 트랜스펙션된 상청액 및 감염된 세포 펠렛에서 관찰될 수 있다. 일부 실시형태에서, 패키징 신호의 파괴는 바이러스 DNA가 캡시드 단백질에 의해 캡슐화되는 것을 방지한다. 따라서, 실시형태들에서, 트랜스펙션된 세포에서 바이러스 게놈의 증폭이 여전히 존재할 것이지만, 상청액 또는 감염된 세포 펠렛에서 바이러스 게놈이 관찰되지 않는다.
추가의 예에서, DNA 내의 추가의 복제 또는 패키징 신호를 특성화하기 위하여, 전체 TTMV-LY2 게놈에 걸쳐 일련의 결실을 사용한다. 서열의 길이를 따라 100bp의 결실을 단계적으로 만들었다. TTMV-LY2 결실을 지니는 플라스미드를 A549 내로 트랜스펙션시키고, 상기 기재된 바와 같이 시험한다. 일부 실시형태에서, 바이러스 증폭 또는 패키징을 파괴시키는 결실은 잠재적인 시스-조절 도메인을 함유할 것이다.
복제 및 패키징 신호를 (예를 들어, 아넬로좀 내의 유전 요소 내의) 이펙터-인코딩 DNA 서열 내로 혼입하여, 증폭 및 캡슐화를 유도할 수 있다. 이것은 더 큰 아넬로좀 게놈의 영역(즉, 게놈 내의 특정 부위 내로 이펙터를 삽입하거나, 바이러스 ORF를 이펙터로 대체하는 등)의 맥락에서 또는 최소 시스 신호를 이펙터 DNA 내로 혼입시킴으로써 행해진다. 아넬로좀이 트랜스 복제 또는 패키징 인자(예를 들어, 복제효소 및 캡시드 단백질 등)가 결여된 경우에, 트랜스 인자는 헬퍼 유전자에 의해 공급된다. 헬퍼 유전자는 증폭 및 패키징을 유도하기에 충분한 단백질 및 RNA의 전부를 발현하지만, 그들 자체의 패키징 신호가 결여되어 있다. 아넬로좀 DNA를 헬퍼 유전자와 동시-트랜스펙션시켜, 이펙터의 증폭 및 패키징을 초래하지만, 헬퍼 유전자의 증폭 및 패키징은 초래하지 않는다.
실시예 9: 아넬로바이러스 게놈
본 실시예에는 아넬로바이러스 게놈 내의 결실이 기재되어 있다.
ORF의 하류, 그러나 GC-풍부 영역의 상류에서, TTV-tth8의 비-코딩 영역(NCR)에 172-뉴클레오티드(nt) 결실을 만들었다(nt 3436 내지 3607). 무작위 56-nt 서열(TTTGTGACACAAGATGGCCGACTTCCTTCCTCTTTAGTCTTCCCCAAAGAAGACAA(SEQ ID NO: 696))을 상기 결실 내로 삽입하였다. pTTV-tth8(3436-3707::56nt), 변경된 TTV-tth8을 갖는 DNA 플라스미드를 생성하였다. 2 ㎍의 이중-가닥 환형 플라스미드 또는 이중-가닥 SmaI 선형화된 DNA(박테리아 백본 요소로부터 분리된 TTV-tth8 게놈 단편 제공)를 2벌로, 리포펙타민 2000을 사용하여 6 cm 플레이트 내에 60% 컨플루언시의 HEK293 또는 A549 세포 내로 트랜스펙션시켰다. 바이러스를 트랜스펙션 96시간 후에 액체 질소와 37℃ 수조 사이를 3회 교대하는 동결 해동에 의해 세포 펠렛 및 상청액으로부터 단리하였다. 상청액으로부터의 바이러스를 사용하여, 세포(HEK293으로부터 단리된 바이러스에 의해 감염되는 HEK293 세포, 및 A549로부터 단리된 바이러스에 의해 감염되는 A549 세포)를 재감염시켰다. 감염 72시간 후에, 바이러스를 동결 해동에 의해 세포 펠렛 및 상청액으로부터 단리하였다. 모든 시료에서 qPCR을 수행하였다. 하기 표 43에 나타낸 바와 같이, TTV-tth8이 감염된 세포의 세포 펠렛 및 상청액 둘 모두에서 관찰되었으며, 이는 pTTV-tth8(3436-3707::56nt)에 의한 성공적인 바이러스 생성을 나타낸다. 따라서, TTV-tth8은 뉴클레오티드 3436 내지 3707의 결실을 용인할 수 있다.
[표 43] HEK293 및 A549에서의 TTV-tth8(3436-3707::56nt) 감염은 바이러스 증폭을 초래한다. 플라스미드 또는 바이러스를 첨가하지 않은 음성 대조군 세포에 비한 2벌 실험으로부터의 평균 게놈 당량.
Figure pct00165
뉴클레오티드 574 내지 1371 및 1432 내지 2210(1577 bp 결실)을 결실시키고, ORF1의 C-말단에(야생형 TTMV-LY2에서 nt 2609 후에) 513 bp NanoLuc(nLuc) 리포터 ORF를 삽입하여, 엔지니어링된 버전의 TTMV-LY2를 어셈블시켰다. 엔지니어링된 TTMV-LY2에 대한 DNA 서열을 지니는 플라스미드(pVL46-015B)를 A549 세포 내로 트랜스펙션시킨 다음, 바이러스를 단리하고, 실시예 17에 기재된 바와 같이 새로운 A549 세포를 감염시키기 위해 사용하였다. nLuc 발광을 감염된 세포의 세포 펠렛 및 상청액에서 검출하였으며, 이는 바이러스 복제를 나타낸다(도 11a 및 도 11b). 이는 TTMV-LY2가 ORF 영역 내의 적어도 1577 bp 결실을 용인할 수 있음을 나타낸다.
바이러스 게놈을 추가로 특성화하기 위하여, TTMV-LY2 DNA 내에 일련의 결실을 만든다. 뉴클레오티드 574 내지 1371 및 1432 내지 2210의 결실을 갖고, nLuc 삽입을 갖지 않는 TTMV-LY2를 만들고, 이전에 기재된 바와 같이 바이러스 복제에 대하여 시험한다. TTMV-LY2Δ574-1371,Δ1432-2210에 대하여 추가의 결실을 만든다. 뉴클레오티드 1372 내지 1431을 결실시켜, TTMV-LY2Δ574-2210을 생성한다. 추가로, ORF1의 하류 ORF3 서열을 결실시킨다(Δ2610-2809). 마지막으로, 비-코딩 영역 내의 결실을 시험하기 위하여, NCR에 걸쳐 순차적으로 일련의 100 bp 결실을 만들었다. 모든 결실 돌연변이체를 이전에 기재된 바와 같이 바이러스 복제에 대하여 시험한다. 성공적인 바이러스 생성을 초래하는 결실(결실된 영역이 바이러스 복제에 필수가 아님을 나타냄)을 조합하여, 더 많이 결실된 뉴클레오티드를 갖는 TTMV-LY2의 변이체를 제조한다. 헬퍼를 사용하여 증폭될 수 있는 바이러스 게놈을 확인하기 위하여, 바이러스 복제가 파괴된 결실 돌연변이체의 각각을 트랜스 복제 및 패키징 요소를 지니는 헬퍼 유전자와 함께 시험한다. 복제 요소의 트랜스 발현에 의해 구제되는 결실은, 헬퍼 유전자가 개별 공급원으로부터 제공되는 경우 바이러스 형성의 차단 없이 결실될 수 있는 바이러스 게놈의 영역을 나타낸다.
실시예 10: 아넬로바이러스 게놈 내로의 다양한 길이의 뉴클레오티드 삽입
본 실시예에는 아넬로바이러스 게놈 내로의 다양한 길이의 DNA 서열의 삽입이 기재되어 있으며, 이는 일부 예에서, 본원에 기재된 바와 같은 아넬로좀을 생성하기 위해 사용될 수 있다.
DNA 서열을 TTV-tth8(유전자은행(GenBank) 수탁 번호 AJ620231.1) 및 TTMV-LY2(유전자은행 수탁 번호 JX134045.1)를 지니는 플라스미드 내로 클로닝한다. 오픈 리딩 프레임의 3' 및 GC-풍부 영역의 5' 비코딩 영역(NCR): TTV-tth8 내의 뉴클레오티드 3588 또는 TTMV-LY2 내의 뉴클레오티드 2843 이후에 삽입을 만든다.
하기의 길이의 무작위화된 DNA 서열을 TTV-tth8 및 TTMV-LY2의 NCR 내로 삽입한다: 100개 염기쌍(bp), 200 bp, 500 bp, 1000 bp 및 2000 bp. 각각의 바이러스 게놈의 상대적 GC-함량과 일치하도록 이들 서열을 설계한다: TTV-tth8 내로의 삽입을 위하여 대략 50% GC 및 TTMV-LY2에 대하여 대략 38% GC. 또한, 몇몇의 트랜스 유전자를 NCR 내로 삽입한다. 이들은 U6 프로모터(351 bp)에 의해 유도되는 miRNA(예를 들어, FF4 miRNA) 및 구성적 hEF1a 프로모터(2509 bp)에 의해 유도되는 EGFP를 포함한다.
다양한 크기의 DNA 삽입물을 지니는 TTV-tth8 및 TTMV-LY2 변이체를 이전에 기재된 바와 같이, HEK293 및 A549를 포함하는 포유동물 세포주 내로 트랜스펙션시킨다. 바이러스를 상청액 또는 세포 펠렛으로부터 단리한다. 단리된 바이러스를 사용하여 추가의 세포를 감염시킨다. 감염된 세포로부터의 바이러스의 생성을 정량적 PCR에 의해 모니터링한다. 일부 실시형태에서, 바이러스의 성공적인 생성은 삽입의 관용성을 나타낼 것이다.
실시예 11: 운반될 예시적인 카고
본 실시예에는, 예를 들어, 본원에 기재된 바와 같이, 아넬로좀, 예를 들어, 아넬로바이러스에 기초한 아넬로좀으로 운반될 수 있는 예시적인 부류의 핵산 및 단백질 페이로드가 기재된다.
페이로드의 일 예는 단백질 발현을 위한 mRNA이다. 관심 코딩 서열은 공급원 바이러스(예를 들어, 아넬로바이러스)에 고유한 바이러스 프로모터로부터 또는 트랜스 유전자의 일부로서 페이로드와 함께 도입된 프로모터로부터 전사된다. 대안적으로, mRNA는 바이러스 mRNA의 오픈 리딩 프레임 내에 인코딩되어, 바이러스 단백질과 관심 단백질 간의 융합을 초래한다. 절단 도메인, 예를 들어, 2A 펩티드 또는 프로테이나제 표적 부위를 사용하여 요망되는 경우 바이러스 단백질로부터 관심 단백질을 분리할 수 있다.
비-코딩 RNA(ncRNA)는 페이로드의 또 다른 예이다. 이들 RNA는 일반적으로 RNA 중합효소 III 프로모터, 예컨대 U6 또는 VA를 사용하여 전사된다. 대안적으로, ncRNA는 RNA 중합효소 II, 예컨대 고유 바이러스 프로모터 또는 조절 가능한 합성 프로모터를 사용하여 전사된다. RNA 중합효소 II 프로모터로부터 발현되는 경우, ncRNA는 mRNA 엑손, 인트론의 부분으로서 또는 폴리-A 신호의 하류에서 전사되는 가외의 RNA로서 인코딩된다. ncRNA는 종종 더 큰 RNA 분자의 부분으로서 인코딩되거나 리보자임 또는 엔도리보뉴클레아제를 사용하여 떨어져 절단된다. 아넬로좀의 게놈에서 카고로서 인코딩될 수 있는 ncRNA는 마이크로-RNA(miRNA), 작은-간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, miRNA 스폰지(sponge), 긴-비코딩 RNA(lncRNA) 및 가이드 RNA(gRNA)를 포함한다.
DNA는 RNA 전사를 필요로 하지 않고, 기능적 요소로서 사용될 수 있다. 예를 들어, DNA는 상동성 재조합을 위한 주형으로서 사용될 수 있다. 또 다른 예에서, 단백질-결합 DNA 서열을 사용하여 (예를 들어, 아넬로좀의 단백질성 외부에서) 캡시드 내로의 관심 단백질의 패키징을 유도할 수 있다. 상동성 재조합을 위하여, 인간 게놈 DNA에 대한 상동성 영역을 상동성 아암으로서 작용하도록 벡터 DNA 내로 인코딩한다. 재조합은 표적화된 엔도뉴클레아제(예컨대 gRNA와 함께 Cas9 또는 아연-핑거 뉴클레아제)에 의해 유도될 수 있으며, 이는 벡터로부터 또는 개별 공급원으로부터 발현될 수 있다. 세포 내측에서, 단일-가닥 DNA 게놈은 이중-가닥 DNA로 전환되며, 이는 이어서 게놈 DNA 파단 부위에서 상동성 재조합을 위한 주형으로서 작용한다. 관심 단백질을 동원하기 위하여, 단백질-결합 서열이 아넬로좀 DNA에 인코딩될 수 있다. 관심 DNA-결합 단백질 또는 DNA-결합 단백질(예컨대 Gal4)에 융합되는 관심 단백질은 아넬로좀 DNA에 결합한다. 아넬로좀 DNA가 캡시드 단백질에 의해 캡슐화되는 경우, DNA-결합 단백질도 또한 캡슐화되며, 아넬로좀과 함께 세포에 운반될 수 있다.
실시예 12: 예시적인 페이로드 통합 유전자좌
본 실시예에는 핵산 페이로드가 삽입될 수 있는 TTV-tth8(유전자은행 수탁 번호 AJ620231.1) 및 TTMV-LY2(유전자은행 수탁 번호 JX134045)의 게놈 내의 예시적인 유전자좌가 기재된다.
TTV-tth8(뉴클레오티드 336 내지 3015) 및 TTMV-LY2(뉴클레오티드 424 내지 2812)의 오픈 리딩 프레임(ORF) 영역 내로의 삽입을 위하여 몇몇의 전략이 사용될 수 있다. 일 예에서, 바이러스 단백질을 태그화시키거나, 융합 단백질을 생성하기 위하여, 페이로드가 특정 관심 ORF 내에 프레임 내 삽입된다. 대안적으로, ORF 영역의 일부 또는 전부가 결실되며, 이는 바이러스 단백질 기능을 파괴하거나, 파괴하지 않을 수 있다. 이어서, 페이로드는 결실된 영역 내로 삽입된다. 추가로, TTV-tth8(뉴클레오티드 716 내지 2362) 또는 TTMV-LY2(뉴클레오티드 724 내지 2273)의 ORF1 내의 초-가변 도메인(HVD)이 삽입 부위로서 사용될 수 있다. 일부 예에서, HVD 내의 삽입 또는 뉴클레오티드 대체는 더욱 용인될 수 있고/있거나 바이러스 기능을 더 낮은 정도로 파괴할 수 있다.
대안적으로, TTV-tth8 또는 TTMV-LY2의 비-코딩 영역(NCR)과 유사한 벡터의 영역 내로 페이로드 삽입을 만든다. 특히, TATA 박스의 상류 5' NCR 내, 5' 비번역 영역(UTR) 내, 폴리-A 신호의 하류 및 GC-풍부 영역의 상류 3' NCR 내에 삽입을 만든다. 추가로, TTV-tth8의 miRNA 영역(뉴클레오티드 3429 내지 3506) 내로 삽입을 만든다. 5' NCR 영역을 위하여, TATA 박스의 상류(TTV-tth8 내의 뉴클레오티드 1 내지 82, 및 TTMV-LY2 내의 뉴클레오티드 1 내지 236)에 삽입을 만든다. 일부 실시형태에서, 트랜스 유전자를 역 배향으로 삽입하여, 프로모터 간섭을 감소시킨다. 5' UTR에 있어서, 전사 시작 부위(TTV-tth8 내의 뉴클레오티드 111, 및 TTMV-LY2 내의 뉴클레오티드 267)의 하류 및 ORF2 시작 코돈(TTV-tth8 내의 뉴클레오티드 336 및 TTMV-LY2 내의 뉴클레오티드 421)의 상류에 삽입을 만든다. 5' UTR 삽입은 5' UTR 내에 뉴클레오티드를 부가하거나 대체한다. 3' NCR 삽입은 실시예 10에 기재된 바와 같이 GC-풍부 영역의 상류에서, 특히, TTV-tth8 내의 뉴클레오티드 3588 또는 TTMV-LY2 내의 뉴클레오티드 2843 이후에서 이루어진다. TTV-tth8의 miRNA는 대안적인 천연 또는 합성 miRNA 헤어핀에 의해 대체된다.
실시예 13: 아넬로바이러스의 정의된 범주 및 그의 보존된 영역
3가지 속의 아넬로바이러스가 인간에 존재한다: 알파토르크바이러스(토르크 테노 바이러스, TTV), 베타토르크바이러스(토르크 테노 미디 바이러스, TTMDV) 및 감마토르크바이러스(토르크 테노 미니 바이러스, TTMV). 알파토르크바이러스는 적어도 5개(예를 들어, 7개)의 널리-뒷받침되는 계통발생 클레이드를 포함한다(도 11c). 이들 아넬로바이러스 중 임의의 것이 본원에 기재된 아넬로좀을 생성하기 위한 공급원 바이러스(예를 들어, 바이러스 DNA 서열의 공급원)로서 사용될 수 있는 것이 고려된다.
이들 서열 중 특히, 5' UTR 도메인(약 75% 보존) 및 GC-풍부 도메인(100개 초과의 염기쌍, 70% 초과의 GC-함량, 약 70% 보존)에서 가장 높은 보존이 관찰된다. 추가로, 서열 내의 초가변 도메인(HVD)은 매우 낮은 보존(약 30% 보존)을 갖는다. 모든 아넬로바이러스는 또한 3개의 리딩 프레임 모두가 개방된 영역을 함유한다. 일부 예에서, 5' UTR 또는 GC-풍부 영역은 복제 원점으로서 기능할 수 있다.
또한, 보존된 영역으로 주석이 달린 TTV 클레이드의, 및 TTMDV 및 TTMV의 각각으로부터의 대표적인 바이러스의 예시적인 서열이 본원에 제공된다(예를 들어, 표 A1 내지 A12, B1 내지 B5, C1 내지 C5 또는 1 내지 18 참조).
실시예 14: 복제-결핍 아넬로좀 및 헬퍼 바이러스
아넬로좀의 복제 및 패키징을 위하여, 일부 요소가 트랜스로 제공될 수 있다. 이들은 DNA 복제 또는 패키징을 유도하거나 지원하는 단백질 또는 비-코딩 RNA를 포함한다. 트랜스 요소는 일부 예에서, 아넬로좀에 대한 대안적인 공급원, 예컨대 헬퍼 바이러스, 플라스미드 또는 세포 게놈으로부터 제공될 수 있다.
다른 요소는 전형적으로 시스로 제공된다. 이들 요소는 예를 들어, 복제 원점(예를 들어, 아넬로좀 DNA의 증폭을 가능하게 함) 또는 패키징 신호(예를 들어, 캡시드 내로 게놈을 로딩하기 위하여 단백질에 결합함)로서 작용하는 아넬로좀 DNA 내의 서열 또는 구조일 수 있다. 일반적으로, 복제 결핍 바이러스 또는 아넬로좀은 이들 요소 중 하나 이상을 소실하여, 심지어 다른 요소가 트랜스로 제공될지라도, DNA가 감염성 비리온 또는 아넬로좀으로 패키징될 수 없게 할 것이다.
복제 결핍 바이러스는 예를 들어, 동일한 세포에서 아넬로좀(예를 들어, 복제-결핍 또는 패키징-결핍 아넬로좀)의 복제를 제어하기 위한 헬퍼 바이러스로서 유용할 수 있다. 일부 예에서, 헬퍼 바이러스는 시스 복제 또는 패키징 요소가 결여되지만, 트랜스 요소, 예컨대 단백질 및 비-코딩 RNA를 발현할 것이다. 일반적으로, 치료적 아넬로좀은 이들 트랜스 요소의 일부 또는 전부가 결여될 것이며, 이에 따라, 그의 자체가 복제할 수 없을 것이지만, 시스 요소를 보유할 것이다. 세포 내로 동시-트랜스펙션/감염되는 경우, 복제-결핍 헬퍼 바이러스는 아넬로좀의 증폭 및 패키징을 유도할 것이다. 이에 따라, 수집된, 패키징된 입자는 헬퍼 바이러스 오염 없이, 단지 치료적 아넬로좀만으로 구성될 것이다.
복제 결핍 아넬로좀을 개발하기 위하여, 아넬로바이러스의 비-코딩 영역 내의 보존된 요소를 제거할 것이다. 특히, 보존된 5' UTR 도메인 및 GC-풍부 도메인의 결실을 개별적으로, 그리고 함께 시험할 것이다. 두 요소는 모두 바이러스 복제 또는 패키징에 중요한 것으로 고려된다. 또한, 전체 비-코딩 영역에 걸쳐 일련의 결실을 수행하여, 이전에 공지되지 않은 관심 영역을 확인할 것이다.
복제 요소의 성공적인 결실은 예를 들어, qPCR에 의해 측정시, 세포 내에서 아넬로좀 DNA 증폭의 감소를 초래할 것이지만, 예를 들어, qPCR, 웨스턴 블롯, 형광 검정 또는 발광 검정 중 임의의 것 또는 전부를 포함할 수 있는 감염된 세포에서의 검정에 의해 모니터링시, 일부 감염성 아넬로좀 생성을 뒷받침할 것이다. 패키징 요소의 성공적인 결실은 아넬로좀 DNA 증폭을 파괴하지 않을 것이며, 그래서, qPCR에 의해 트랜스펙션된 세포에서 아넬로좀 DNA의 증가가 관찰될 것이다. 그러나, 아넬로좀 게놈은 캡슐화되지 않을 것이며, 그래서 감염성 아넬로좀 생성이 관찰되지 않을 것이다.
실시예 15: 복제-적격 아넬로좀의 제조 과정
본 실시예에는 복제-적격 아넬로좀의 회수 및 이의 생성의 대량화 방법이 기재되어 있다. 아넬로좀은 그들의 게놈 내에 세포에서 복제하는 데 필요한, 모든 요구되는 유전 요소 및 ORF를 인코딩하는 경우에 복제 적격하다. 이들 아넬로좀은 그들의 복제에 결함이 없기 때문에, 트랜스로 제공되는 보완 활성을 필요로 하지 않는다. 그러나, 그들은 헬퍼 활성, 예컨대 전사의 인핸서(예를 들어, 부티르산나트륨) 또는 바이러스 전사 인자(예를 들어, 아데노바이러스 E1, E2 E4, VA; HSV Vp16 및 즉시 조기 단백질)를 필요로 할 것이다.
이러한 실시예에서, 선형 또는 환형 형태로 합성 아넬로좀의 완전한 서열을 인코딩하는 이중-가닥 DNA는 화학적 트랜스펙션에 의해 T75 플라스크 내의 5E+05개의 부착 포유동물 세포 내로 또는 전기천공법에 의해 현탁액 중 5E+05개의 세포 내로 도입된다. 최적의 기간 후에(예를 들어, 트랜스펙션 3 내지 7일 후에), 세포를 상청액 배지 내로 스크랩핑하여, 세포 및 상청액을 수집한다. 연성 세제, 예를 들어, 담즙염을 0.5%의 최종 농도로 첨가하고, 37℃에서 30분 동안 인큐베이션시킨다. 칼슘 및 마그네슘 클로라이드를 각각 0.5 mM 및 2.5 mM의 최종 농도로 첨가한다. 엔도뉴클레아제(예를 들어, DNAse I, 벤조나제)를 첨가하고, 25 내지 37℃에서 0.5 내지 4시간 동안 인큐베이션시킨다. 아넬로좀 현탁액을 1000 x g에서 4℃에서 10분 동안 원심분리한다. 투명해진 상청액을 새로운 튜브로 옮기고, 동결보호 완충액(안정화 완충액으로도 공지되어 있음)으로 1:1 희석하고, 요망되는 경우 -80℃에 보관한다. 이는 아넬로좀의 계대 0(P0)을 생성한다. 세제의 농도를 배양된 세포에서 사용될 안전한 한계 미만이 되게 하기 위하여, 이러한 접종물을 아넬로좀 역가에 따라 무혈청 배지(SFM)에 적어도 100배 이상 희석한다.
T225 플라스크 내의 신선한 단층의 포유동물 세포에 배양물 표면을 덮기에 충분한 최소 부피를 오버레이하고, 부드럽게 로킹(rocking)시키면서 37℃ 및 5% 이산화탄소에서 90분 동안 인큐베이션시킨다. 이러한 단계를 위해 사용되는 포유동물 세포는 P0 회수를 위해 사용된 것과 동일한 유형의 세포이거나, 그렇지 않을 수 있다. 이러한 인큐베이션 후에, 접종물을 40 ㎖의 무혈청, 동물 기원-부재의 배양 배지로 대체하였다. 세포를 37℃ 및 5% 이산화탄소에서 3 내지 7일 동안 인큐베이션시킨다. 이전에 사용된 동일한 연성 세제 10X 용액 4 ㎖을 첨가하여, 0.5%의 최종 세제 농도를 달성한 다음, 혼합물을 부드럽게 교반하면서 37℃에서 30분 동안 인큐베이션시킨다. 엔도뉴클레아제를 첨가하고, 25 내지 37℃에서 0.5 내지 4시간 동안 인큐베이션시킨다. 그 다음, 배지를 수집하고, 1000 x g에서 4℃에서 10분 동안 원심분리한다. 투명해진 상청액을 40 ㎖의 안정화 완충제와 혼합하고, -80℃에서 보관한다. 이는 씨드 스톡을 또는 아넬로좀의 계대 1(P1)을 생성한다.
스톡의 역가에 따라, 그를 SFM 중에 100배 이상 희석하고, 필요한 크기의 다층 플라스크 상에서 성장한 세포에 첨가한다. 더 작은 규모에서 감염 다중도(MOI) 및 인큐베이션 시간을 최적화시켜, 최대 아넬로좀 생성을 보장한다. 그 다음, 수집 후에, 아넬로좀을 필요한 대로 정제하고 농축시킬 수 있다. 예를 들어, 본 실시예에 기재된 바와 같은 작업흐름을 보여주는 개략도는 도 12에 제공되어 있다.
실시예 16: 복제-결핍 아넬로좀의 제조 과정
본 실시예에는 복제-결핍 아넬로좀의 회수 및 이의 생성의 대량화 방법이 기재되어 있다.
아넬로좀은 복제에 수반되는 하나 이상의 ORF(예를 들어, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 및/또는 ORF2t/3)의 결실에 의해 복제-결핍이 될 수 있다. 복제-결핍 아넬로좀은 보완하는 세포주에서 성장할 수 있다. 이러한 세포주는 본질적으로 아넬로좀 성장을 촉진시키지만, 아넬로좀의 게놈에서 소실되거나 비작용성인 구성성분을 발현한다.
일 예에서, 아넬로좀 증량에 수반되는 임의의 ORF(들)의 서열(들)을, 선택 마커를 인코딩하는 안정한 세포주의 생성에 적합한 렌티바이러스 발현 시스템 내로 클로닝하고, 렌티바이러스 벡터를 본원에 기재된 바와 같이 생성한다. 아넬로좀 증량을 지원할 수 있는 포유동물 세포주를 이러한 렌티바이러스 벡터로 감염시키고, 클로닝된 ORF가 안정적으로 통합된 세포 집단을 선택하는 선택 마커(예를 들어, 푸로마이신 또는 임의의 다른 항생제)에 의해 선택압으로 처리한다. 이러한 세포주가 특성화되고, 엔지니어링된 아넬로좀에서 결함을 보완하고, 이에 따라 이러한 아넬로좀의 성장 및 증식을 지원하는 것으로 증명되면, 그것을 증량시키고, 저온 보관에 저장한다. 이들 세포의 증량 및 유지 동안, 선택 항생제를 배양 배지에 첨가하여 선택압을 유지한다. 아넬로좀이 이들 세포 내로 도입되면, 선택 항생제를 보류할 수 있다.
일단 이러한 세포주가 확립되면, 복제-결핍 아넬로좀의 성장 및 생성을 예를 들어, 실시예 15에 기재된 바와 같이 수행한다.
실시예 17: 현탁 세포를 사용한 아넬로좀의 생성
본 실시예에는 현탁액 중의 세포에서의 아넬로좀의 생성이 기재되어 있다.
본 실시예에서, 현탁액 조건에서 성장하는 것으로 조정된 A549 또는 293T 생성자 세포주를 웨이브(WAVE) 생물반응기 백에서, 37℃ 및 5% 이산화탄소에서 동물 성분-부재 및 항생제-부재 현탁액 배지(써모 피셔 사이언티픽) 중에 성장시킨다. 1 x 106개의 생존 가능한 세포/㎖로 씨딩한 이들 세포를 현재의 우수 제조 기준(cGMP) 하에 리포펙타민 2000(써모 피셔 사이언티픽)을 사용하여, (예를 들어, 실시예 16에 기재된 바와 같이, 예를 들어, 복제-결핍 아넬로좀의 경우에) 아넬로좀을 패키징하는 데 적합하거나 필요한 임의의 보완 플라스미드와 함께 아넬로좀 서열을 포함하는 플라스미드로 트랜스펙션시킨다. 보완 플라스미드는 일부 예에서 아넬로좀 게놈(예를 들어, 본원에 기재된 바와 같이, 예를 들어, 바이러스 게놈, 예를 들어, 아넬로바이러스 게놈에 기초한 아넬로좀 게놈)으로부터 결실되지만, 아넬로좀의 복제 및 패키징에 유용하거나 필요한 바이러스 단백질을 인코딩할 수 있다. 트랜스펙션된 세포를 웨이브 생물반응기 백에서 성장시키고, 상청액을 하기의 시점에 수집한다: 트랜스펙션 48, 72 및 96시간 후. 상청액을 원심분리를 사용하여 각 시료에 대한 세포 펠렛으로부터 분리한다. 이어서, 패키징된 아넬로좀 입자를 이온 교환 크로마토그래피를 사용하여 수집된 상청액 및 용해된 세포 펠렛으로부터 정제한다.
아넬로좀의 정제된 제제에서 게놈 당량을 예를 들어, 실시예 18에 기재된 바와 같이, 바이러스 게놈 추출 키트(퀴아젠)에 이어서, 아넬로좀 DNA 서열에 대하여 표적화된 프라이머 및 프로브를 사용한 qPCR을 사용하여 아넬로좀 게놈을 수집하기 위하여, 작은 정제된 제제의 분취액을 사용함으로써 결정할 수 있다.
정제된 제제의 연속 희석물을 제조하여, 새로운 A549 세포를 감염시킴으로써 정제된 제제 내의 아넬로좀의 감염성을 정량화할 수 있다. 이들 세포를 트랜스펙션 72시간 후에 수집한 후에, 아넬로좀 DNA 서열에 특이적인 프라이머 및 프로브를 사용하여 게놈 DNA에서 qPCR 검정을 행하였다.
실시예 18: qPCR에 의한 아넬로좀 게놈 당량의 정량화
본 실시예에는 아넬로좀을 정량화하기 위한 가수분해 프로브-기반의 정량적 PCR 검정의 개발이 입증되어 있다. 프라이머 및 프로브의 세트를 최종 사용자 최적화와 함께 소프트웨어 지니어스(Geneious)를 사용하여 TTV(수탁 번호 AJ620231.1) 및 TTMV(수탁 번호 JX134045.1)의 선택된 게놈 서열에 기초하여 설계하였다. 프라이머 서열은 하기 표 44에 나타나 있다.
[표 44] 정량적 PCR에 의해 TTMV 및 TTV 게놈 등가물을 정량화하기 위해 사용되는 정방향 및 역방향 프라이머 및 가수분해 프로브의 서열
Figure pct00166
개발 과정의 제1 단계로서, SYBR-그린 화학물질을 갖는 TTV 및 TTMV 프라이머를 사용하여 qPCR을 시행하여, 프라이머 특이성에 대하여 점검한다. 도 13은 각각의 프라이머 쌍에 대한 하나의 별개의 증폭 피크를 보여준다.
5' 말단에서 형광단 6FAM, 및 3' 말단에서 마이너 홈 결합, 비-형광 소광제(MGBNFQ)로 표지된 가수분해 프로브를 주문하였다. 그 다음, 새로운 프라이머 및 프로브의 PCR 효율을 증가하는 농도의 프라이머 및 표준 곡선의 성분으로서 정제된 플라스미드 DNA를 사용하여 2가지 상이한 상업적 마스터 믹스를 사용하여 평가하였다. 상이한 프라이머-프로브의 세트에 대한 표적 서열을 함유하는 정제된 플라스미드를 사용함으로써 표준 곡선을 설정하였다. 7가지의 10배 단계 희석을 수행하여, 20 ㎕ 반응당 15개 카피의 정량화의 하한 및 7 log에 걸친 선형 범위를 달성하였다. 마스터 믹스 #2는 정량적 PCR을 위하여 허용되는 값인 90 내지 110%의 PCR 효율을 생성할 수 있었다(도 14). qPCR을 위한 모든 프라이머를 IDT로부터 주문하였다. 형광단 6FAM 및 마이너 홈 결합, 비-형광 소광제(MGBNFQ)에 컨쥬게이트되는 가수분해 프로브 및 qPCR 마스터 믹스를 써모 피셔로부터 수득하였다. 예시적인 증폭 플롯은 도 15에 나타나 있다.
이들 프라이머-프로브 세트 및 시약을 사용하여, 아넬로좀 스톡 중 게놈 당량(GEq)/㎖을 정량화하였다. 선형 범위는 20 ㎕ 반응당 1.5E+07 내지 15 GEq였으며, 이어서 이를 사용하여, 도 16a 및 도 16b에 나타낸 바와 같이, GEq/㎖을 계산하였다. 선형 범위보다 더 높은 농도를 갖는 시료는 필요한 대로 희석될 수 있다.
실시예 19: 마우스에서 외인성 단백질을 발현하기 위한 아넬로좀의 이용
본 실시예에는 토르크 테노 미니 바이러스(TTMV) 게놈이 마우스에서 반딧불이 루시퍼라제 단백질을 발현하도록 엔지니어링된 아넬로좀의 이용이 기재된다.
반딧불이-루시퍼라제 유전자를 인코딩하는 엔지니어링된 TTMV의 DNA 서열을 인코딩하는 플라스미드를 화학적 트랜스펙션에 의해 A549 세포(인간 폐 암종 세포주) 내로 도입한다. 18 ㎍의 플라스미드 DNA를 10 cm 조직 배양 플레이트에서 70% 컨플루언트 세포의 트랜스펙션을 위해 사용한다. TTMV 서열이 결여된 빈 벡터 백본을 음성 대조군으로서 사용한다. 트랜스펙션 5시간 후에, 세포를 PBS로 2회 세척하고, 37℃ 및 5% 이산화탄소에서 신선한 성장 배지에서 성장하게 한다.
트랜스펙션된 A549 세포를 그들의 상청액과 함께, 트랜스펙션 96시간 후에 수집한다. 수집된 물질을 37℃에서 1시간 동안 0.5% 데옥시콜레이트(부피 중 중량)로 처리한 후에, 엔도뉴클레아제로 처리한다. 아넬로좀 입자를 이온 교환 크로마토그래피를 사용하여 이러한 용해물로부터 정제한다. 아넬로좀 농도를 결정하기 위하여, 아넬로좀 스톡의 시료를 바이러스 DNA 정제 키트를 통해 시행하고, ㎖당 게놈 당량을 아넬로좀 DNA 서열에 대하여 표적화된 프라이머 및 프로브를 사용한 qPCR에 의해 측정한다.
1x 인산염-완충 염수 중 소정의 용량-범위의 게놈 당량의 아넬로좀을 8 내지 10주령 마우스에서 다양한 주사 경로(예를 들어, 정맥내, 복강내, 피하, 근육내)를 통해 수행한다. 배측 및 등측 생물발광 영상화를 주사 후 3, 7, 10 및 15일에 각 동물에서 수행한다. 제조처의 프로토콜에 따라, 루시퍼라제 기질(퍼킨-엘머)을 표기된 시점에 각 동물에 복강내로 첨가한 후 생체내 영상화에 의해 영상화를 수행한다.
실시예 20: 아넬로좀 DNA가 숙주 게놈 내로 통합되는지 여부를 결정하기 위한 게놈 정렬
본 실시예에는 토르크 테노 바이러스(TTV)가 인간 게놈 내로 통합되는지 여부를 시험함으로써, 아넬로좀 DNA가 숙주 게놈 내로 통합될 수 있는지를 결정하기 위해 수행되는 컴퓨터 분석이 기재된다.
5개의 예시적인 알파토르크바이러스 클레이드의 각각으로부터의 하나의 대표적인 TTV 서열의 완전한 게놈을 서열 간의 국소 유사성의 영역을 찾는 기본 국소 정렬 검색 툴(Basic Local Alignment Search Tool; BLAST)을 사용하여 인간 게놈 서열에 대하여 정렬하였다. 표 45에 나타낸 대표적인 TTV 서열을 분석하였다:
[표 45] 대표적인 TTV 서열
Figure pct00167
정렬된 TTV 중 어느 것으로부터의 서열도 인간 게놈과 임의의 유의미한 유사성을 갖는 것으로 밝혀지지 않았으며, 이는 TTV가 인간 게놈 내로 통합되지 않았음을 나타낸다.
실시예 21: 숙주 게놈 내로의 아넬로좀 통합의 평가
본 실시예에서, A549 세포(인간 폐 암종 세포주) 및 HEK293T 세포(인간 배아 신장 세포주)를 5, 10, 30 또는 50의 MOI에서 아넬로좀 입자 또는 AAV 입자 중 어느 하나로 감염시킨다. 세포를 감염 5일 후에 PBS로 세척하고, 신선한 성장 배지로 교체한다. 그 다음, 세포가 37℃ 및 5% 이산화탄소에서 성장하게 한다. 세포를 감염 5일 후에 수집하고, 그들을 게놈 DNA 추출 키트(퀴아젠)를 사용하여 처리하여 게놈 DNA를 수집한다. 또한, 게놈 DNA를 비감염된 세포(음성 대조군)로부터 수집한다. 전체-게놈 서열결정 라이브러리를 제조처의 프로토콜에 따라 넥스테라 DNA 라이브러리 제조 키트(일루미나)를 사용하여, 이들 수집된 DNA에 대하여 제조한다. DNA 라이브러리를 제조처의 프로토콜에 따라 NextSeq 550 시스템(일루미나)을 사용하여 서열결정한다. 서열결정 데이터를 참조 게놈으로 어셈블시키고, 아넬로좀 또는 AAV 게놈과 숙주 게놈 간의 접합부를 찾기 위해 분석한다. 접합부가 검출되는 경우에, 그들을 원래의 게놈 DNA 시료에서 확인한 후, PCR에 의해 라이브러리를 서열결정한다. 접합부를 함유하는 그 주변의 영역을 증폭시키기 위하여 프라이머를 설계한다. 숙주 게놈 내로의 아넬로좀의 통합의 빈도는 qPCR에 의해 (통합 사전을 나타내는) 접합부의 수 및 시료 내의 총 아넬로좀 카피의 수를 정량화함으로써 결정된다. 이러한 비를 AAV와 비교할 수 있다.
실시예 22: 외인성 마이크로RNA 서열을 발현하는 아넬로좀의 기능적 효과
본 실시예는 고유 프로모터를 사용한 아넬로좀 게놈으로부터의 외인성 miRNA(miR-625)의 성공적인 발현을 보여준다.
500 ng의 하기의 플라스미드 DNA를 24 웰 플레이트 내의 60% 컨플루언트 HEK293T 세포의 웰 내로 트랜스펙션시켰다:
i) 빈 플라스미드 백본
ii) 내인성 miRNA가 낙아웃된(KO) TTV-tth8 게놈을 함유하는 플라스미드
iii) 내인성 miRNA가 비-표적화 스크램블 miRNA로 대체된 TTV-tth8
iv) 내인성 miRNA 서열이 miR-625를 인코딩하는 miRNA로 대체된 TTV-tth8
트랜스펙션 72시간 후에, 전체 miRNA를 퀴아젠 miRNeasy 키트를 사용하여 트랜스펙션된 세포로부터 수집한 후, miRNA 스크립트(Script) RT II 키트를 사용하여 역전사를 행하였다. 정량적 PCR을 miRNA-625 또는 RNU6 소형 RNA를 특이적으로 검출할 프라이머를 사용하여 역 전사된 DNA 상에서 수행하였다. RNU6 소형 RNA를 하우스키핑(housekeeping) 유전자로서 사용하였으며, 데이터는 빈 벡터에 비한 배수 변화로서 도 17에 플롯팅되어 있다. 도 17에 나타낸 바와 같이, miR-625 아넬로좀은 miR-625 발현의 대략 100-배 증가를 초래한 한편, 빈 벡터, miR-낙아웃(KO) 및 스크램블드 miR에 대하여 신호가 검출되지 않았다.
실시예 23: 외인성 비-코딩 RNA를 발현하기 위한 아넬로좀의 제조 및 생성
본 실시예에는 외인성 소형 비-코딩 RNA를 발현하기 위한 아넬로좀의 합성 및 생성이 기재된다.
TTV의 tth8 주로부터 DNA 서열(문헌[Jelcic et al, Journal of Virology, 2004])을 합성하고, 박테리아 복제 원점 및 박테리아 항생제 내성 유전자를 함유하는 벡터 내로 클로닝한다. 이러한 벡터에서, TTV miRNA 헤어핀을 인코딩하는 DNA 서열을 외인성 소형 비-코딩 RNA, 예컨대 miRNA 또는 shRNA를 인코딩하는 DNA 서열로 대체한다. 그 다음, 엔지니어링된 구축물을 전기-적격 박테리아로 형질전환시킨 후, 제조처의 프로토콜에 따라 플라스미드 정제 키트를 사용하여 플라스미드 단리를 행하였다.
외인성 소형 비-코딩 RNA를 인코딩하는 아넬로좀 DNA를 진핵 생성자 세포주 내로 트랜스펙션시켜, 아넬로좀 입자를 생성한다. 아넬로좀 입자를 함유하는 트랜스펙션된 세포의 상청액을 트랜스펙션 후 상이한 시점에 수집한다. 여과된 상청액으로부터의 또는 정제 이후의 아넬로좀 입자를 예를 들어, 본원에 기재된 바와 같이, 하류 응용에 사용한다.
실시예 24: 아넬로바이러스 클레이드에서의 보존
본 실시예에는 알파토르크바이러스 속 내의 7개의 클레이드의 확인이 기재된다. 이들 클레이드 간의 대표적인 서열은 서열에 걸쳐 54.7% 쌍별 동일성을 보였다(도 18). 쌍별 동일성은 오픈 리딩 프레임에서 가장 낮았으며(약 48.8%), 비-코딩 영역에서 더 높았다(5' NCR에서 69.1%, 3' NCR에서 74.6%)(도 18). 이는 비-코딩 영역 내의 DNA 서열 또는 구조가 바이러스 복제에서 중요한 역할을 수행하는 것을 뒷받침한다.
알파토르크바이러스에서 추정 단백질의 아미노산 서열도 또한 비교하였다. DNA 서열은 대략 47 내지 50% 쌍별 동일성을 보이는 한편, 아미노산 서열은 대략 32 내지 38% 쌍별 동일성을 보였다(도 19). 흥미롭게도, 알파토르크바이러스 클레이드로부터의 대표적인 서열은 생체 내에서 성공적으로 복제할 수 있으며, 인간 집단에서 관찰된다. 이는 아넬로바이러스 단백질에 대한 아미노산 서열이 기능성, 예컨대 복제 및 패키징을 유지하면서 광범위하게 달라질 수 있는 것을 뒷받침한다.
아넬로바이러스는 비-코딩 영역 내에 높은 국소 보존 영역을 갖는 것으로 관찰되었다. 프로모터의 하류 영역에서, 71-bp 5' UTR 보존된 도메인은 7개의 알파토르크바이러스 클레이드에 걸쳐 95.2% 쌍별 동일성을 나타내었다(도 20). 알파토르크바이러스의 3' 비-코딩 영역 내의 오픈 리딩 프레임의 하류에서, 대표적인 서열 간에 상당한 쌍별 동일성을 갖는 영역이 존재하였다. 이 3' 보존된 비-코딩 영역의 3' 말단 근처에, 고도로 보존된 서열이 존재한다. 아넬로바이러스는 또한, 70% 초과의 GC 함량을 갖는 GC-풍부 영역을 포함하며, 이는 그들이 정렬되는 영역에서 75.4% 쌍별 동일성을 나타내었다(도 21).
실시예 25: 아넬로좀으로부터 내인성 miRNA의 발현 및 내인성 miRNA의 결실
일 예에서, TTV-tth8 게놈을 실시예 27에 기재된 바와 같은 GC-풍부 영역 내의 결실을 사용하여 변형시킨 변형된 TTV-tth8 게놈을 포함하는 아넬로좀을 사용하여 배양 중 Raji B 세포를 감염시켰다. 이들 아넬로좀은 n-myc 상호작용 단백질(NMI)을 인코딩하는 mRNA를 표적화하는 miRNA인 TTV-tth8 아넬로바이러스의 내인성 페이로드를 인코딩하는 서열을 포함하였으며, 아넬로바이러스 게놈을 포함하는 플라스미드를 숙주 세포 내로 도입함으로써 생성하였다. NMI는 JAK/STAT 경로의 하류에서 작동하여, 인터페론-자극된 유전자, 증식 및 성장 유전자, 및 염증 반응의 매개자를 포함하는 다양한 세포내 신호의 전사를 조절한다. 도 22에 나타낸 바와 같이, 바이러스 게놈이 표적 Raji B 세포에서 검출되었다. 대조군 세포에 비하여 표적 Raji B 세포에서 NMI의 성공적인 낙다운이 또한 관찰되었다(도 23). NMI에 대한 miRNA를 포함하는 아넬로좀은 대조군 세포에 비하여 NMI 단백질 수준의 75% 초과의 감소를 유도하였다. 본 실시예는 고유 아넬로바이러스 miRNA를 갖는 아넬로좀이 숙주 세포에서 표적 분자를 낙 다운시킬 수 있는 것을 보여준다.
또 다른 예에서, 아넬로바이러스-기반의 아넬로좀의 내인성 miRNA를 결실시켰다. 그 다음, 생성된 아넬로좀(Δ miR)을 숙주 세포와 함께 인큐베이션시켰다. 그 다음, Δ miR 아넬로좀 유전 요소의 게놈 당량을 내인성 miRNA를 보유하는 상응하는 아넬로좀의 것과 비교하였다. 도 24에 나타낸 바와 같이, 내인성 miRNA가 결실된 아넬로좀 게놈은 내인성 miRNA가 여전히 존재하는 아넬로좀 게놈에 대하여 관찰되는 것과 유사한 수준으로 세포에서 검출되었다. 이러한 실시예는 아넬로바이러스-기반의 아넬로좀의 내인성 miRNA가 완전히 돌연변이되거나 결실될 수 있으며, 아넬로좀 게놈이 표적 세포에서 여전히 검출될 수 있는 것을 보여준다.
실시예 26: 아넬로바이러스 ORF의 국소화
본 실시예에는 아넬로바이러스의 다양한 추정 ORF의 신규한 기능성이 기재된다. 본 실시예에서, 각각의 ORF의 N-말단에서 태깅된 단백질(즉, 나노루시퍼라제)의 하류에 추정 오픈 리딩 프레임(ORF) 서열을 설계하였다. 각각의 ORF-nLuc 플라스미드를 화학적 트랜스펙션에 의해 12-웰 플레이트 내의 5E+05개의 부착성 세포(Vero 또는 HEK293T) 내로, 또는 전기천공법에 의해 현탁액 중 5E+05개의 세포 내로 도입하였다. 최적의 기간 후(예를 들어, 트랜스펙션 후 제3일 내지 제7일)에, 세포를 PBS 중 4% 파라포름알데히드(써모피셔 cat# 28908)를 사용하여 고정하고, 0.5% 트리톤 X-100을 사용하여 투과화시키고, 토끼 폴리클로널 항 nLuc 항체(프로메가 코포레이션(Promega Corp.)으로부터 무상 제공)에 이어서, 염소 항-토끼 Alexa488(써모피셔 cat# A-11008) 컨쥬게이트된 2차 항체를 사용하여 nLuc에 대하여 염색하였다. 핵을 DAPI(써모피셔 Cat# D3571)를 사용하여 염색하였다. 염색된 세포를 태깅된 단백질 세포 국소화에 대하여 20X 대물렌즈 및 흑백 악시오캠(Axiocam) 506 카메라를 갖는 자이스(Zeiss) 악시오베르트(AxioVert) A1 상에서 가시화시켰다.
도 25a 및 도 25b에 나타낸 바와 같이, ORF2는 세포질에 국소화되는 것으로 관찰되었으며, ORF1/1은 Vero 세포 및 HEK293 세포 둘 모두에서 핵에 국소화되는 것으로 관찰되었다. 도 25c는 ORF1/2 및 ORF2/2에 대한 국소화를 보여준다.
실시예 27: 아넬로좀 개발에 필요한 영역의 특성화
본 실시예에는 바이러스 복제 및 아넬로좀 생성에 충분한 게놈의 부분을 특성화하는 것을 돕기 위한 아넬로바이러스 게놈 내의 결실이 설명된다. ORF의 TTV-tth8 하류의 비-코딩 영역(NCR)(뉴클레오티드 3016 내지 3753) 내에 일련의 결실을 만들었다. 36-뉴클레오티드(nt) 서열(CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160))을 GC 영역으로부터 결실시켰다(Δ36nt(GC)로 표시). 추가로, 78-nt pre-마이크로RNA 서열(CCGCCATCTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACCATCAGCCACACCTACTCAAAATGGTGG(SEQ ID NO: 161))을 3' NCR로부터 결실시켰다(Δ36nt(GC) ΔmiR로 표시). 그리고 마지막으로, Δ36nt(GC)의 3'NCR 내의 추가의 171개 뉴클레오티드를 결실시키고(CTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACCATCAGCCACACCTACTCAAAATGGTGGACAATTTCTTCCGGGTCAAAGGTTACAGCCGCCATGTTAAAACACGTGACGTATGACGTCACGGCCGCCATTTTGTGACACAAGATGGCCGACTTCCTTCC(SEQ ID NO: 162)), Δ3'NCR로 표시하였다(도 26). 각각 상기 기재된 환형 pTTV-tth8(WT), pTTV-tth8(Δ36nt(GC)), pTTV-tth8(Δ36nt(GC) ΔmiR), 변경된 3'NCR TTV-tth8을 갖는 pTTV-tth8(Δ3'NCR) DNA 플라스미드 2 ㎍을 3벌로, 리포펙타민 2000을 사용하여 12-웰 플레이트 내의 60% 컨플루언시의 HEK293 내로 트랜스펙션시켰다. 트랜스펙션 48시간 후에, 세포 펠렛을 수집하고, 용해시켜, mRNA 전사물을 단리하고(RNeasy, 퀴아젠 cat# 74104), cDNA로 전환시켰다(하이-캐퍼서티(High-Capacity) cDNA 역 전사 키트, 써모피셔, cat# 4368814). qPCR을 모든 시료 상에서 수행하여, 각각의 결실을 갖는 바이러스 전사물 발현을 측정하고, GAPDH의 내부 대조군 mRNA에 대하여 정규화시켰다.
도 27a 내지 도 27d에 나타낸 바와 같이, 결실 돌연변이체 3개 모두는 시험관 내에서 바이러스 전사물 발현을 유의미하게 저해하였다. 따라서, TTV-tth8의 3' NCR은 전이유전자의 발현을 위한 아넬로좀 생성에 필요하다.
TTV 주 tth8, 진뱅크 수탁 번호 AJ620231.1을 전장-게놈 서열로서 기탁하였다. 그러나, GC-풍부 영역 내에서, 총칭 N으로서 주석이 달린 36개 뉴클레오티드의 스트레치가 존재한다. 이 영역은 TTV 주 간에 고도로 보존되며, 이에 따라, 이들 바이러스의 생물학에 중요할 수 있다. 수백개의 TTV 주의 DNA 서열을 컴퓨터로 정렬하고, 이를 사용하여 그들 36개 뉴클레오티드에 대한 강력한 컨센서스 서열을 생성하였다(CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO: 160)). 따라서, 본원에서 "야생형" 서열로서 지칭되는 TTV-tth8 게놈 서열은 공개적으로 이용 가능한 TTV-tth8 서열에서 열거된 36개 N의 스트레치 대신에 이 컨센서스 서열을 삽입하였다.
실시예 28: 생체 내에서 외인성 단백질의 아넬로좀 운반
본 실시예는 투여 후의 아넬로좀의 생체 내 이펙터 기능(예를 들어, 단백질의 발현)을 보여준다.
나노-루시퍼라제(nLuc)를 인코딩하는 전이유전자를 포함하는 아넬로좀(도 28a 및 도 28b)을 제조하였다. 약술하여, TTMV-LY2 비-코딩 영역 및 nLuc 발현 카세트를 갖는 이중-가닥 DNA 플라스미드를 트랜스 복제 및 패키징 인자로서 작용하도록 전장 TTMV-LY2 게놈을 인코딩하는 이중-가닥 DNA 플라스미드와 함께, HEK293T 세포 내로 트랜스펙션시켰다. 트랜스펙션 후에, 세포를 인큐베이션시켜, 아넬로좀 생성을 가능하게 하였으며, 아넬로좀 물질을 수집하고, 뉴클레아제 처리, 한외여과/정용여과 및 무균 여과를 통해 농축시켰다. 추가의 HEK293T 세포를 "비-바이러스" 음성 대조군으로서 작용하도록 nLuc 발현 카세트 및 TTMV-LY2 ORF 트랜스펙션 카세트를 갖지만, 복제 및 패키징에 필수적인 비-코딩 도메인이 결여된 비-복제성 DNA 플라스미드로 트랜스펙션시켰다. 비-바이러스 시료를 아넬로좀 물질과 동일한 프로토콜에 따라 제조하였다.
아넬로좀 제제를 3마리 건강한 마우스의 코호트에 근육내로 투여하고, 9일의 경과에 걸쳐 IVIS 루미나(Lumina) 영상화(브루커(Bruker))에 의해 모니터링하였다(도 29a). 비-바이러스 대조군으로서, 비-복제성 제제를 추가 3마리의 마우스에 투여하였다(도 29b). 25 ㎕의 아넬로좀 또는 비-바이러스 제제의 주사를 제0일에, 왼쪽 뒷다리에 투여하고, 제4일에 오른쪽 뒷다리에 재-투여하였다(도 29a 및 도 29b에서 화살표 참조). 제9일의 IVIS 영상화 후에, 더 많은 nLuc 발광 신호의 발생이 비-바이러스 제제(도 29b)보다 아넬로좀 제제(도 29a)를 주사한 마우스에서 관찰되었으며, 이는 생체 내 아넬로좀 형질도입 후의 트랜스 유전자 발현과 일치한다.
실시예 29: 아넬로바이러스 내의 전구체 miRNA(pre-mIR)의 확인
본 실시예에는 다양한 아넬로바이러스에 의해 인코딩되는 신규한 전구체 miRNA를 확인하기 위한 다양한 컴퓨터 기반 및 실험적 접근법이 기재된다.
컴퓨터 기반 방법
아넬로바이러스 주는 뉴클레오티드 서열의 수준에서 서로 매우 다양하다. 그러나, 아넬로바이러스 주, 특히 동일한 클레이트 내의 것은 다양한 구성성분, 예컨대 프로모터, GC 풍부 영역, 비-코딩 영역 및 코딩 영역의 게놈 조직의 면에서 서로 유의미한 유사성을 보일 수 있다(예를 들어, 도 29da 및 도 29db 참조). pre-miR 서열이 이미 실험적으로 입증된 아넬로바이러스 주와 정렬시킴으로써 (pre-miR 서열이 알려져 있지 않은) 다양한 아넬로바이러스 주의 pre-miR 서열을 예측하는 방법이 본원에 기재된다.
요약하여, 세포주 및 다양한 인간 시료 유래의 소형 RNA에 대한 다양한 공개적으로 이용 가능한 소형 RNA 서열결정 데이터 세트를 마이닝하여, 다양한 아넬로바이러스의 주에 의해 인코딩되는 신규한 pre-miR 서열을 발견한다. 구조 예측 또는 기계-학습 분류, 예컨대 mFold 프로그램, miRANDA 알고리즘, miRScan, miRanalyzer, miRDeep(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1559940/, https://www.frontiersin.org/articles/10.3389/fbioe.2015.00007/full)에 기초한 공개적으로 이용 가능한 컴퓨터 툴 및 알고리즘을 사용하여, 다양한 아넬로에 의해 인코딩되는 신규한 miRNA를 예측한다. 이어서, 특정 miRNA 서열에 대하여 설계된 프로브를 사용한 노던 블롯 및/또는 miRNA에 특이적인 프라이머를 사용한 RT-qPCR을 사용하여, 신규한 miRNA의 발현을 확인하고, 입증하고, 정량화한다.
실험적 방법
일 예에서, 고 처리량 소형 RNA 서열결정을 아넬로로 감염시킨 인간 조직 또는 혈액 시료 상에서 수행하여, 신규한 아넬로바이러스-인코딩된 pre-miRNA를 발견한다. 이를 수행하기 위하여, RNA를 균질화된 인간 조직 시료 또는 인간 혈액 시료로부터 수집한다. 소형 RNA 라이브러리를 제조하고, 일루미나(Illumina) 키트 및 서열결정 플랫폼을 사용하여 서열결정한다. 서열결정 판독물을 저장하고, 정렬하고, 베이스스페이스(BaseSpace) 서열 허브(Hub)(일루미나) 상에서 분석한다.
제2의 예에서, 고 처리량 소형 RNA 서열결정을 하기의 조건으로 처리된 다양한 세포주에서 수행하여, 아넬로바이러스에 의해 인코딩되는 신규한 pre-miRNA를 발견한다: (a) 자연 발생 아넬로바이러스로 감염된 세포주, 시험관 내에서 합성된 아넬로바이러스 게놈으로 트랜스펙션된 세포주 및 (c) 합성 게놈을 사용하여 시험관 내에서 패키징된 아넬로바이러스로 감염된 세포주. 특정 miRNA 서열에 대하여 설계된 프로브를 사용한 노던 블롯 및/또는 miRNA에 특이적인 프라이머를 사용한 RT-qPCR을 사용하여, 신규한 miRNA의 발현을 확인하고, 입증하고, 정량화한다.
실시예 30: 아넬로바이러스 pre-miR의 내인성 표적의 결정
본 실시예에는 내인성 표적 및 다양한 아넬로바이러스의 주에 의해 인코딩되는 pre-miR의 치료적으로 관련될 가능성이 있는 표적 경로를 결정하기 위한 분석이 기재된다.
다양한 아넬로바이러스에 의해 인코딩되는 컴퓨터로 예측된 및/또는 실험적으로 입증된 개별 pre-miRNA 서열을 U6 프로모터에 의해 유도되는 렌티바이러스 벡터 내로 클로닝한다. U6 프로모터에 의해 유도되는 비-표적화 스크램블 miRNA 서열을 또한, 유사한 방식으로 클로닝하고, 이를 대조군으로서 사용한다. 패키징되는 경우, 그의 게놈이 (i) U6 프로모터에 의해 유도되는 pre-miRNA 서열, (ii) SV40 프로모터에 의해 유도되는 푸로마이신 내성 유전자 및 (iii) CMV 프로모터에 의해 유도되는 녹색 형광 단백질(GFP) 유전자를 함유하도록, 렌티바이러스 플라스미드를 클로닝한다. 이들 렌티바이러스 플라스미드의 각각을 개별적으로 바이러스를 패키징하기 위하여 렌티바이러스 헬퍼 플라스미드와 함께 HEK-293T 세포 내로 동시-트랜스펙션시킨다. 트랜스펙션 6시간 후에, 트랜스펙션된 세포의 배지를 흡인하고, PBS로 1회 세척하고, 신선한 배지로 교체한다. 렌티바이러스를 함유하는 이 배지를 트랜스펙션 72시간 후에 수집한다. 배지를 0.4 ㎛ 필터를 통해 여과하여 임의의 세포를 제거한 다음, 이를 사용하여, 관심 세포 유형, 예컨대 HeLa, Raji 및 THP1을 3벌로 감염시킨다. 통합된 렌티바이러스 게놈을 함유하는 세포를 푸로마이신을 사용한 처리에 의해 선택하며, 이는 감염 3일 후에 개시한다. RNA를 RNA 추출 키트(퀴아젠)를 사용하여 안정하게 선택된 세포주로부터 수집한 후, 역 전사효소 키트(써모 피셔 사이언티픽)를 사용하여 cDNA로의 역 전사를 행한다. cDNA 시료를 처리하여, 인덱싱된 짧은-판독물 라이브러리를 생성한다. 특유하게 인덱싱된 짧은 판독물 라이브러리를 일루미나 서열결정 플랫폼을 사용하여 서열로 다중화시켜, 시료당 약 2000만개의 판독물을 생성한다. 서열결정 판독물을 저장하고, 정렬하고, 베이스스페이서 서열 허브(일루미나)를 사용하여 분석한다. 스크램블드 pre-miR을 발현하는 세포주에 비하여 후보 pre-miR을 발현하는 세포주에서의 유전자의 발현을 비교함으로써 각각의 개별 후보 pre-miR의 표적을 결정한다. 인제이뉴티 경로(Ingenuity Pathway) 분석을 수행하여, pre-miRNa가 특정 경로, 특히 치료적으로 관련이 있는 경로를 표적화하는지 여부를 시험한다. 본 실시예에 기재된 작업흐름의 개략도는 도 30에 나타나 있다.
실시예 31: 고유 아넬로바이러스 pre-miR을 인코딩하는 아넬로좀의 제조
본 실시예에는 고유 아넬로바이러스 pre-miR를 발현하는 복제성 또는 비-복제성 형태의 아넬로좀을 패키징하는 과정이 기재된다.
하기의 구성성분을 함유하는 비-복제성 형태의 아넬로좀의 게놈을 합성한다: (i) 복제 원점, (ii) 아넬로바이러스 pre-miRNA를 인코딩하는 서열, (iii) pre-miRNA의 발현을 유도하는 RNA 중합효소 III, 예컨대 U6 또는 H1 및 (iv) 패키징 신호. 이 게놈을 바이러스 패키징에 필요한 단백질의 전부를 안정하게 발현하는 헬퍼 세포주 내로 트랜스펙션시킴으로써 패키징한다. 트랜스펙션된 세포를 트랜스펙션 7일 후에 수집하고, 본원에 기재된 바와 같이, 아넬로좀 제제를 제조하기 위하여 처리한다. 아넬로좀 제제의 게놈 당량 역가를 본원에 기재된 바와 같이, qPCR을 수행함으로써 결정한다. 이어서, 적절한 용량의 아넬로좀 제제를 하류 응용을 위하여 사용한다.
복제성 형태의 아넬로좀의 게놈을 예를 들어, pre-miRNA 서열의 발현을 외인성 프로모터, 예컨대 U6 또는 조직 특이적 프로모터를 사용하여 조작한 것을 제외하고, 고유 아넬로바이러스를 생성함으로써 합성할 수 있다. 게놈을 HEK-293T 세포 내로 트랜스펙션시킴으로써 패키징한다. 트랜스펙션된 세포를 트랜스펙션 7일 후에 수집하고, 본원에 기재된 바와 같이, 아넬로좀 제제를 제조하기 위하여 처리한다. 아넬로좀 제제의 게놈 당량 역가를 본원에 기재된 바와 같이, qPCR을 수행함으로써 결정한다. 적절한 용량의 아넬로좀 제제를 하류 응용을 위하여 사용한다.
실시예 32: 시험관 내 세포 배양 모델에서의 아넬로바이러스 pre-miR 종양 억제제의 이용
본 실시예에는 예를 들어, 실시예 29에 기재된 바와 같이, 분석으로부터 종양 억제성인 것으로 확인된 후보 pre-miR의 표현형 효과를 확인하기 위한 연구가 기재된다.
종양 억제 효과를 갖는 후보 pre-miRNA를 실시예 29에 기재된 바와 같은 분석에 기초하여 확인한다. 이들 후보 pre-miRNA 및 스크램블드 pre-miRNA를 인코딩하는 복제성 형태의 아넬로좀의 아넬로좀 제제를 실시예 31에 기재된 바와 같이 제조한다. NCI-60 암 세포주 패널 유래의 암 세포주를 96 웰 플레이트에 플레이팅한다. 30% 컨플루언트 시에, 이들 세포주를 세포당 5 게놈 당량의 투여량으로 후보 pre-miR 또는 스크램블드 pre-miR을 포함하는 아넬로좀으로 처리한다. 아넬로좀-함유 배지를 감염 5시간 후에 흡인한 후, PBS로 2회 세척하고, 신선한 배지로 교체하였다. 알라마 블루(Alamar blue) 검정을 처리 3일 후에 처리된 세포에서 수행하여, pre-miR 중 어떤 것이 암 세포주의 증식을 저해하는지를 결정한다.
실시예 33: 생체 내에서 종양 억제제로서의 아넬로바이러스 pre-miR의 이용
본 실시예에는 실시예 32에 기재된 바와 같은, 시험관 내 분석으로부터 암 세포주 및 최종선발 후보 종양 억제성 아넬로바이러스 pre-miR에 대한 종양 억제 효과를 확인하기 위한 생체 내 실험이 기재된다.
실시예 32에 기재된 분석으로부터 최종선발된 암 세포주를 매트리겔과 함께, 무흉선 마우스의 옆구리 내에 피하 주사함으로써 이종이식편을 생성한다. 일단 이종이식편 종양이 촉진 가능하게 되면, 종양 억제성 pre-miRNA 또는 스크램블 pre-miRNA를 인코딩하는 3 x 106 게놈 당량의 아넬로좀의 국소 종양 주사를 수행한다. 종양 성장에 대한 아넬로좀 주사의 영향을 3주 동안 일상적인 종양 성장 측정에 의해, 실험의 마지막에 이종이식편 종양의 종양 중량 측정에 의해, 그리고 BrdU 혼입 검정에 의해 결정한다.
실시예 34: 아넬로바이러스 게놈의 탠덤 카피
본 실시예에는 상류 게놈의 GC-풍부 영역이 하류 게놈의 5' 영역 근처에 존재하도록 탠덤으로 배열된, 2개 카피의 단일의 아넬로바이러스 게놈을 갖는 플라스미드-기반의 발현 벡터가 기재된다(도 31a).
아넬로바이러스는 회전환을 통해 복제하며, 복제효소(Rep) 단백질은 복제 원점에서 게놈에 결합하고, 환 둘레에서 DNA 합성을 개시한다. 아넬로바이러스 게놈이 플라스미드 백본 내에 함유되기 위하여, 이는 고유 바이러스 게놈보다 더 긴 전장 플라스미드의 복제, 또는 최소 백본과 함께 게놈을 포함하는 더 작은 환을 초래하는 플라스미드의 재조합을 필요로 한다. 따라서, 플라스미드로부터의 바이러스의 복제는 비효율적일 수 있다. 바이러스 게놈 복제 효율을 개선시키기 위하여, 플라스미드를 TTV-tth8 및 TTMV-LY2의 탠덤 카피를 사용하여 엔지니어링하였다. 이들 플라스미드는 아넬로바이러스 게놈의 모든 가능한 환형 순열을 제시하였다: Rep 단백질이 결합하는 곳과 관계없이, 상류 복제 원점으로부터 하류 원점까지 바이러스 게놈의 복제를 유도할 수 있을 것이다. 유사한 전략을 사용하여, 돼지 아넬로바이러스를 생성한 바 있다(문헌[Huang et al., 2012, Journal of Virology 86 (11) 6042-6054]).
게놈의 카피를 플라스미드 백본 내로 순차적으로 클로닝하여, 2개의 서열 사이에 12 bp의 비-바이러스 DNA를 남김으로써 탠덤 TTV-tth8을 어셈블하였다. 야생형, 및 GC-풍부 영역으로부터 36개 염기쌍이 소실된 TTV-tth8(Δ36GC)(즉, 본원에 기재된 36-뉴클레오티드 GC-풍부 서열을 포함하도록 엔지니어링된 TTV-tth8 게놈)을 포함하여, 몇몇의 TTV-tth8 변이체를 탠덤 플라스미드 내에 어셈블하였다. 탠덤 TTMV-LY2를 골든-게이트(Golden-gate) 어셈블리를 통해 어셈블시켜, 2개 카피의 게놈을 백본 내에 동시에 혼입시키고, 게놈 사이에 추가의 뉴클레오티드를 남기지 않았다.
탠덤 카피의 TTV-tth8(Δ36GC)을 갖는 플라스미드를 HEK239T 세포 내로 트랜스펙션시켰다. 세포를 5일 동안 인큐베이션시킨 다음, 0.1% 트리톤 X-100을 사용하여 용해시키고, 뉴클레아제로 처리하여, 바이러스 캡시드에 의해 보호되지 않는 DNA를 분해하였다. 그 다음, qPCR을 TTV-tth8 게놈 서열 및 플라스미드 백본에 대하여 택맨(Taqman) 프로브를 사용하여 수행하였다. TTV-tth8 게놈 카피를 백본 카피로 정규화시켰다. 도 31b에 나타낸 바와 같이, 탠덤 TTV-tth8은 단일-카피 보유 플라스미드보다 4배 더 많은 수의 바이러스 게놈을 생성하였다. 배가된 TTV-tth8 게놈 서열의 수를 고려하는 경우, 탠덤 플라스미드는 트랜스펙션된 카피당 2배 더 많은 새로 합성된 게놈 카피를 생성하였다. 이들 데이터는 탠덤 아넬로바이러스 게놈의 엔지니어링이 바이러스 게놈 복제를 증가시킬 수 있으며, 아넬로바이러스 생성을 증가시키기 위한 전략으로서 사용될 수 있음을 보여주었다.
실시예 35: 시험관 내 환화된 아넬로바이러스 게놈
본 실시예에는 최소 비-바이러스 DNA와 함께 환형, 이중 가닥 아넬로바이러스 게놈 DNA를 포함하는 구축물이 기재된다. 이들 환형 바이러스 게놈은 야생형 아넬로바이러스 복제 동안 관찰되는 이중-가닥 DNA 중간체와 더욱 근접하게 일치한다. 이러한 환형, 이중 가닥 아넬로바이러스 게놈 DNA가 최소 비-바이러스 DNA와 함께 세포 내로 도입되는 경우, 회전환 복제를 겪어, 예를 들어, 본원에 기재된 바와 같은 유전 요소를 생성할 수 있다.
일 예에서, TTV-tth8 변이체 및 TTMV-LY2를 보유하는 플라스미드를 게놈 DNA에 측접하는 제한 엔도뉴클레아제 인식 부위를 사용하여 분해하였다. 이어서, 생성되는 선형화된 게놈을 라이게이션시켜, 환형 DNA를 형성하였다. 이들 라이게이션 반응을 다양한 DNA 농도를 사용하여 행하여, 분자내 라이게이션을 최적화시켰다. 라이게이션된 환을 포유동물 세포 내에 바로 트랜스펙션시키거나, 플라스미드 백본을 절단하기 위한 제한 엔도뉴클레아제 및 선형 DNA를 분해하기 위한 엑소뉴클레아제를 사용한 분해에 의해 추가로 처리하여, 비-환형 게놈 DNA를 제거하였다. TTV-tth8에 있어서, XmaI 엔도뉴클레아제를 사용하여, DNA를 선형화시켰으며; 라이게이션된 환은 GC-풍부 영역과 5' 비-코딩 영역 사이에 53 bp의 비-바이러스 DNA를 함유하였다. TTMV-LY2에 있어서, IIS형 제한 효소 Esp3I을 사용하여, 비-바이러스 DNA를 갖지 않는 바이러스 게놈 DNA 환을 제공하였다. 이 프로토콜을 이전에 공개된 TTV-tth8의 환화로부터 조정하였다(문헌[Kincaid et al., 2013, PLoS Pathogens 9(12): e1003818]). 아넬로바이러스 생성의 개선을 입증하기 위하여, 환화된 TTV-tth8 및 TTMV-LY2를 HEK293T 세포 내로 트랜스펙션시켰다. 7일의 인큐베이션 후에, 세포를 용해시키고, qPCR을 수행하여, 환화된 및 플라스미드-기반의 아넬로바이러스 게놈 간에 아넬로바이러스 게놈의 수준을 비교하였다. 증가된 아넬로바이러스 게놈의 수준은 바이러스 DNA의 환화가 아넬로바이러스 생성을 증가시키기 위한 유용한 전략인 것을 보여준다.
또 다른 예에서, TTMV-LY2 플라스미드(pVL46-240) 및 TTMV-LY2-nLuc를 각각 Esp3I 또는 EcoRV-HF를 사용하여 선형화시켰다. 분해된 플라스미드를 1% 아가로스 겔 상에 정제한 후에, 전기용리 또는 퀴아젠 컬럼 정제 및 T4 DNA 리가제를 사용한 라이게이션을 행하였다. 환화된 DNA를 트랜스펙션 전에 100 kDa UF/DF 멤브레인 상에서 농축시켰다. 환화를 도 31c에 나타낸 바와 같이, 겔 전기영동에 의해 확인하였다. 리포펙타민 2000을 사용한 리포펙션 1일 전에, T-225 플라스크에, 3 x 104개 세포/㎠의 HEK293T를 씨딩하였다. 9 마이크로그램의 환화된 TTMV-LY2 DNA 및 50 ㎍의 환화된 TTMV-LY2-nLuc를 플라스크 씨딩 1일 후에 동시-트랜스펙션시켰다. 비교로서, 추가의 T-225 플라스크에, 50 ㎍의 선형화된 TTMV-LY2 및 50 ㎍의 선형화된 TTMV-LY2-nLuc를 동시-트랜스펙션시켰다.
아넬로좀 생성을 트리톤 X-100 수집 완충제 중에서의 세포 수집 이전에 8일 동안 진행하였다. 일반적으로, 아넬로좀을 예를 들어, 숙주 세포의 용해, 용해물의 정화, 여과 및 크로마토그래피에 의해 농축시킬 수 있다. 본 실시예에서, 수집된 세포를 염화나트륨 조정 및 1.2 ㎛/ 0.45 ㎛ 정상 유동 여과 전에 뉴클레아제 처리하였다. 정화된 수집액을 농축시키고, 750 kDa MWCO mPES 중공사막 상에서 PBS로 완충제 교환하였다. TFF 투석유물을 0.45 ㎛ 필터를 사용하여 여과한 후에, PBS 중에 사전-평형화된 세파크릴(Sephacryl) S-500 HR SEC 컬럼 상에 로딩하였다. 아넬로좀을 30 cm/hr로 SEC 컬럼에서 처리하였다. 개별 분획을 수집하고, 도 31d에 나타낸 바와 같이, 바이러스 게놈 카피수 및 전이유전자 카피수에 대하여 qPCR에 의해 검정하였다. 바이러스 게놈 및 전이유전자 카피는 SEC 크로마토그램의 공극 부피인 분획 7에서 시작하여 관찰되었다. 잔류 플라스미드 피크는 분획 15에서 관찰되었다. TTMV-LY2 게놈 및 TTMV-LY2-nLuc 전이유전자에 대한 카피수는 분획 7 내지 분획 10에서 nLuc 전이유전자를 함유하는 팩킹된 아넬로좀을 나타내는 환화된 투입 DNA를 사용하여 생성된 아넬로좀에 대하여 우수하게 일치하였다. SEC 분획을 풀링하고, 100 kDa MWCO PVDF 멤브레인을 사용하여 농축시킨 다음, 생체 내 투여 이전에 0.2 ㎛ 여과하였다.
투입 아넬로좀 DNA의 환화는 선형화된 아넬로좀 DNA와 비교하는 경우, 정제 과정을 통한 뉴클레아제 보호된 게놈의 회수 백분율의 3배 증가를 초래하였으며, 이는 표 46에 나타낸 바와 같은 환화된 투입 아넬로좀 DNA를 사용하여 개선된 제조 효율을 나타낸다.
[표 46] 정제 과정 수율
Figure pct00168
실시예 36: ORF1의 모델링 및 보존된 잔기 및 도메인의 확인
본 실시예에는 베타토르크바이러스의 ORF1 단백질의 인 실리코 모델링 및 구조적 모티프 및 아미노산 보존/유사성에 기초한 추정 도메인의 정의가 기재된다.
ORF1 단백질은 PSIpred(http://bioinf.cs.ucl.ac.uk/psipred/)를 사용한 2차 구조 예측에서 베타-시트의 높은 존재 및 아르기닌-풍부 영역의 존재에 기초하여 아넬로바이러스의 주요 캡시드 단백질인 것으로 예측된다. RaptorX(http://raptorx.uchicago.edu/)를 8가지 베타토르크바이러스의 서열에 대한 구조 예측 및 접촉 예측을 위해 사용하였다. 베타토르크바이러스 ORF1 서열이 알파토르크바이러스(약 750개 아미노산)보다 더 짧고(약 650개 아미노산), 더 적은 영역이 비구조화되는 것으로 예측되기 때문에, 베타토르크바이러스 ORF1 서열을 사용하였다. 예측된 구조 중 5개가 유사성의 요소를 함유하였으며, 이를 사용하여 ORF1의 추정 도메인을 확인하였다(도 33). ORF1을 5개 영역 - 아르기닌-풍부 영역, 추정 코어(젤리-롤 도메인), 초가변 영역, N22 영역 및 C-말단 도메인으로 나누었다.
베타토르크바이러스 주 CBS203의 구조적 모델을 사용하여 베타토르크바이러스 과 간에 일부 보존을 갖는 잔기/구조적 영역을 나타내었다. 보존된 잔기를 분석하기 위하여, 110개의 베타토르크바이러스 ORF1 서열을 ClustalW 정렬 알고리즘을 사용하여 지니어스(Geneious)에서 정렬하였다. 이어서, 잔기를 1의 임계값과 함께 BLOSUM62 매트릭스를 사용하여 동일성 및 유사성 백분율에 의하여 보존에 대하여 평가하였다. 정렬에서 모든 주의 60% 초과의 유사성을 갖는 잔기를 구조 모델 상에 강조표시하였다(도 34). 총, 26개의 잔기(약 4%)는 정렬된 서열과 100%의 아미노산 유사성을 가졌다. 80% 및 60% 컷-오프는 각각 총 잔기의 23.7% 및 36.7%를 함유하였다.
유사한 정렬 알고리즘 및 유사성 결정을 258개의 알파토르크바이러스의 주 상에서 행하였다. 유사성 및 동일성을 정렬로부터 컨센서스 서열에 나타내었으며, 추정 도메인을 베타토르크바이러스와의 일차 서열 정렬에 기초하여 지정하였다(도 35). 알파토르크바이러스는 100% 유사한 29개의 잔기(3.9%)를 가졌으며, 이는 베타토르크바이러스의 관찰과 매우 일치한다. 흥미로운 점은, 알파토르크바이러스가 베타토르크바이러스와 비교하는 경우, 적어도 80%(잔기의 30.9%) 또는 60%(잔기의 42.9%) 유사성으로, 더 높은 잔기의 백분율을 갖는다는 점이다.
실시예 37: 상이한 토르크 테노 바이러스 주로부터의 초가변 도메인을 갖는 키메라 ORF1을 함유하는 아넬로좀의 생성
본 실시예에는 하나의 TTV 주의 ORF1 아르기닌-풍부 영역, 젤리-롤 도메인, N22 및 C-말단 도메인 및 상이한 TTV 주의 ORF1 단백질로부터의 초가변 도메인을 함유하는 키메라 아넬로좀을 생성하기 위한 ORF1의 초가변 영역의 도메인 스와핑이 기재된다.
베타토르크바이러스의 전장 게놈 LY2 주를 포유동물 세포에서의 발현을 위하여 발현 벡터 내에 클로닝하였다. 이 게놈을 돌연변이시켜, LY2의 초가변 도메인을 제거하고, 그것을 먼 관계의 베타토르크바이러스의 초가변 도메인으로 대체하였다(도 36). 이어서, 스와핑된 초가변 도메인을 갖는 LY2 게놈을 함유하는 플라스미드(pTTMV-LY2-HVRa-z)를 이전에 공개된 방법(문헌[Kincaid et al., PLoS Pathogens 2013])을 사용하여 선형화시키고 환화시킨다. HEK293T 세포를 환화된 게놈으로 트랜스펙션시키고, 5 내지 7일 동안 인큐베이션시켜, 아넬로좀 생성을 가능하게 한다. 인큐베이션 기간 후에, 아넬로좀을 구배 초원심분리에 의해 트랜스펙션된 세포의 상청액 및 세포 펠렛으로부터 정제한다.
키메라 아넬로좀이 여전히 감염성인지를 결정하기 위하여, 단리된 바이러스 입자를 비감염된 세포에 첨가한다. 세포를 5 내지 7일 동안 인큐베이션시켜, 바이러스 복제를 가능하게 한다. 인큐베이션 후에, 감염을 확립하기 위한 키메라 아넬로좀의 능력은 면역형광, 웨스턴 블롯 및 qPCR에 의해 모니터링될 것이다. 키메라 바이러스의 구조적 온전성을 음성 염색 및 초저온-전자 현미경법에 의해 평가한다. 키메라 아넬로좀을 추가로 생체 내에서 세포를 감염시키는 능력에 대하여 시험할 수 있다. 초가변 도메인 스와핑을 통하여 기능적 키메라 아넬로좀을 생성하는 능력의 확립은 향성을 변경시키고, 면역 검출을 잠재적으로 회피하기 위한 바이러스의 엔지니어링을 가능하게 할 수 있었다.
실시예 38: 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1의 생성
본 실시예에는 하나의 TTV 주의 아르기닌-풍부 영역, 젤리-롤 도메인, N22 및 C-말단 도메인, 및 초가변 도메인 대신에 비-TTV 단백질/펩티드를 함유하는 키메라 ORF1 단백질을 생성하기 위하여, ORF1의 초가변 영역을 다른 관심 단백질 또는 펩티드로 대체하는 것이 기재된다.
실시예 B에 나타낸 바와 같이, LY2의 초가변 도메인을 게놈으로부터 결실시키고, 관심 단백질 또는 펩티드를 이 영역 내로 삽입할 수 있다(도 37). 이 영역 내로 도입될 수 있는 서열의 유형의 예는 친화성 태그, 항체의 단일 쇄 가변 영역(scFv) 및 항원 펩티드를 포함하지만, 이에 제한되지 않는다. 플라스미드(pTTMV-LY2-ΔHVR-POI) 내의 돌연변이된 게놈을 실시예 B에 기재된 바와 같이 선형화시키고 환화시킨다. 환화된 게놈을 HEK293T 세포 내로 트랜스펙션시키고, 5 내지 7일 동안 인큐베이션시킨다. 인큐베이션 후에, POI를 함유하는 키메라 아넬로좀을 적절한 경우 초원심분리 및/또는 친화성 크로마토그래피를 통해 상청액 및 세포 펠렛으로부터 정제한다.
POI를 함유하는 기능적 키메라 아넬로좀을 생성하기 위한 능력을 다양한 기법을 사용하여 평가한다. 먼저, 정제된 바이러스를 비감염된 세포에 첨가하여, 키메라 아넬로좀이 페이로드를 복제하고/복제하거나 페이로드를 나이브 세포에 운반할 수 있는지를 결정한다. 추가로, 키메라 아넬로좀의 구조적 온전성을 전자 현미경법을 사용하여 평가한다. 시험관 내에서 기능성인 키메라 아넬로좀에 있어서, 생체 내에서의 페이로드의 복제/운반 능력도 또한 평가한다.
실시예 39: 페이로드를 보유하는 아넬로좀의 설계
본 실시예에는 트랜스 유전자를 보유하는 예시적인 아넬로좀 유전 요소의 설계가 기재된다. 유전 요소는 예를 들어, 단백질 또는 비-코딩 RNA-발현 유전자를 포함할 수 있는 비-아넬로바이러스 페이로드와 함께 아넬로바이러스과의 구성원으로부터의 필수 시스 복제 및 패키징 도메인으로 구성된다. 아넬로좀은 복제 및 패키징에 필수적인 트랜스 단백질 요소가 결여되며, 회전환 복제 및 캡슐화를 위하여 다른 공급원(예를 들어, 헬퍼, 예를 들어, 복제성 바이러스, 발현 플라스미드 또는 게놈 통합물)에 의해 제공되는 단백질을 필요로 한다.
하나의 실시예의 세트에서, 전체 단백질-코딩 DNA 서열을 제1 시작 코돈으로부터 마지막 정지 코돈까지 결실시켰다(도 38). TTV-tth8에 있어서, ORF2 시작 코돈으로부터 ORF3 정지 코돈까지 뉴클레오티드 336 내지 3015를 결실시켰다. TTMV-LY2에 있어서, ORF2 시작 코돈부터 ORF3 정지 코돈까지 424 내지 2813을 결실시켰다. 생성된 DNA는 바이러스 프로모터, 5' UTR 보존된 도메인, 3' UTR(일부 아넬로바이러스 주, 예컨대 TTV-tth8에서 miRNA를 인코딩함) 및 GC-풍부 영역을 포함하는 바이러스 비-코딩 영역(NCR)을 보유하였다. 아넬로좀 NCR은 바이러스 복제 원점 및 캡시드 결합 도메인을 포함하는 필수 시스 도메인을 보유하였다. 그러나, 아넬로바이러스 단백질-코딩 오픈 리딩 프레임이 결여되어, 아넬로좀은 DNA 복제 및 캡슐화에 필요한 필수 단백질 요소를 발현할 수 없었으며, 이에 따라 이들 요소가 트랜스로 제공되지 않는 한, 증폭되거나 패키징되지 않을 것이다.
단백질-인코딩 서열, 전체 트랜스 유전자(비-아넬로바이러스 프로모터 서열 포함) 및 비-코딩 RNA 유전자를 포함하나 이에 제한되지 않는 페이로드 DNA를 결실된 아넬로바이러스 오픈 리딩 프레임의 부위 내로의 삽입에 의해 아넬로좀 유전 요소 내에 혼입시켰다(도 38). 단백질-코딩 서열로부터의 발현은 예를 들어, 고유 바이러스 프로모터 또는 트랜스 유전자로서 혼입된 합성 프로모터에 의해 유도될 수 있다.
(예를 들어, 본원에 기재된 바와 같은) 복제-결핍 또는 비적격 아넬로좀 유전 요소는 바이러스 복제 및/또는 캡시드 인자를 위한 단백질-코딩 서열이 결여될 수 있다. 따라서, 세포를 본 실시예에 기재된 아넬로좀 DNA 및 바이러스-단백질-인코딩 DNA로 동시-트랜스펙션시킴으로써 패키징된 아넬로좀을 생성하였다. 바이러스 단백질을 복제-적격 야생형 바이러스 게놈, 바이러스 프로모터의 제어 하에 바이러스 단백질을 보유하는 비-복제성 플라스미드 또는 강력한 구성성 프로모터의 제어 하에 바이러스 단백질을 보유하는 플라스미드로부터 발현시켰다.
실시예 40: 아넬로좀-인코딩 전이유전자의 형질도입
본 실시예에서, 아넬로좀 LY2-면역어드헤신(IA)을 폐 시료로부터 단리된 아넬로바이러스 LY2를 사용하여 제조한 다음, 인간 면역어드헤신을 운반하도록 조작한다. LY2 비-코딩 영역(5’ UTR, GC-풍부 영역) 및 IA-인코딩 카세트를 포함하지만 아넬로바이러스 ORF를 포함하지 않았던 이중-가닥 환형 LY2-IA 아넬로좀 DNA를 (예를 들어, 실시예 39에 기재된 바와 같이) 설계한 다음, 본원에 기재된 바와 같이, 시험관 내 환화에 의해 생성하였다. 아넬로바이러스 ORF를 개별 시험관 내 환화된 DNA에서 트랜스로 제공하였다. 둘 모두의 DNA를 2개의 생물학적 반복검증에서 HEK293T 세포 내로 동시-트랜스펙션시켰다(도 39에 “A” 및 “B”로 나타냄). 음성 대조군(모의 트랜스펙션) 및 양성 대조군(플라스미드 내의 IA 발현 카세트)의 각각의 2개의 생물학적 반복검증을 또한 시험하였다. 폐-유래된 인간 세포주 EKVX 및 A549 내로의 아넬로좀 제제의 형질도입은, ELISA에 의한 분비된 면역어드헤신의 검출을 초래하였다(도 39; 우측의 막대 그래프 참조). 더욱이, LY2-IA 형질도입된 EKVX 세포의 면역형광 분석에 의해, 면역어드헤신의 발현에 대하여 양성인 세포가 드러났다.
실시예 41: tth8 및 LY2에 기초한 아넬로좀은 각각 EPO 유전자를 폐암 세포 내에 성공적으로 형질도입시켰다
본 실시예에서, 비-소세포 폐암 세포주(EKVX)를 에리트로포이에틴 유전자(EPO)를 보유하는 2가지 상이한 아넬로좀을 사용하여 형질도입시켰다. 아넬로좀을 본원에 기재된 바와 같이, 시험관 내 환화에 의해 생성하였으며, 이는 LY2 또는 tth8 백본 중 어느 하나에 기초한 2가지 유형의 아넬로좀을 포함하였다(예를 들어, 각각 표 15 및 16 또는 표 5 및 6에 기재된 바와 같음). LY2-EPO 및 tth8-EPO 아넬로좀은 각각 예를 들어, 실시예 39에 기재된 바와 같이, 각각 LY2 또는 tth8 게놈의 EPO-인코딩 카세트 및 비-코딩 영역(5' UTR, GC-풍부 영역)을 포함하지만, 아넬로바이러스 ORF를 포함하지 않는 유전 요소를 포함하였다. 세포에 정제된 아넬로좀 또는 양성 대조군(고 용량 또는 아넬로좀과 동일한 용량의 AAV2-EPO)을 접종하고, 7일 동안 인큐베이션시켰다. 아넬로바이러스 ORF를 개별 시험관 내 환화된 DNA에 트랜스로 제공하였다. 배양 상청액을 접종 후 3일, 5.5일 및 7일에 시료 추출하고, 상용의 ELISA 키트를 사용하여 검정하여, EPO를 검출하였다. LY2-EPO 및 tth8-EPO 아넬로좀은 둘 모두 세포를 성공적으로 형질도입시켰으며, 이는 미처리(음성) 대조군 세포에 비하여 유의미하게 더 높은 EPO 역가를 보였다(모든 시점에 P < 0.013)(도 40).
실시예 42: 치료적 전이유전자를 갖는 아넬로좀은 정맥내(i.v.) 투여 후에 생체 내에서 검출될 수 있다
본 실시예에서, 인간 성장 호르몬(hGH)을 인코딩하는 아넬로좀은 정맥내(i.v.) 투여 후에 생체 내에서 검출되었다. LY2 백본에 기초한, 및 외인성 hGH(LY2-hGH)를 인코딩하는 복제-결핍 아넬로좀을 본원에 기재된 바와 같은 시험관 내 환화에 의해 생성하였다. LY2-hGH 아넬로좀의 유전 요소는 예를 들어, 실시예 39에 기재된 바와 같이, LY2 비-코딩 영역(5' UTR, GC-풍부 영역) 및 hGH-인코딩 카세트를 포함하였지만, 아넬로바이러스 ORF를 포함하지 않았다. LY2-hGH 아넬로좀을 마우스에 정맥내 투여하였다. 아넬로바이러스 ORF를 개별 시험관 내 환화된 DNA에서 트랜스로 제공하였다. 요약하여, 아넬로좀(LY2-hGH) 또는 PBS를 제0일에 정맥내 주사하였다(n=4 마우스/그룹). 아넬로좀을 마우스당 4.66E+07개의 아넬로좀 게놈으로 독립적인 동물 그룹에 투여하였다.
제1의 예에서, 아넬로좀 바이러스 게놈 DNA 카피를 검출하였다. 제7일에, 혈액 및 혈장을 수집하고, qPCR에 의해 hGH DNA 앰플리콘에 대하여 분석하였다. LY2-hGH 아넬로좀은 생체 내에서 감염 7일 후에 전혈의 세포 분획에 존재하였다(도 41a). 추가로, 혈장 중 아넬로좀의 부재는 이들 아넬로좀이 생체 내에서 복제될 수 없음을 입증한다(도 41b).
제2의 예에서, hGH mRNA 전사물을 생체 내 형질도입 후에 검출하였다. 제7일에, 혈액을 수집하고, qRT-PCR에 의해 hGH mRNA 전사물 앰플리콘에 대하여 분석하였다. GAPDH를 대조군 하우스키핑 유전자로서 사용하였다. hGH mRNA 전사물을 전혈의 세포 분획에서 측정하였다. 아넬로좀-인코딩된 전이유전자로부터의 mRNA를 생체 내에서 검출하였다(도 42).
실시예 43: 아넬로바이러스 내의 코딩 서열 크기 분포
모든 아넬로바이러스의 코딩 서열(CDS) 길이를 내부적으로 확인된 대규모 야생형 주의 카탈로그를 사용하여 평가하였다. 아넬로바이러스의 CDS 길이를 플롯팅하여, 3가지 인간 아넬로바이러스 속(알파토르크바이러스, 알파; 베타토르크바이러스, 베타; 및 감마토르크바이러스, 감마) 간에 바이러스 주를 비교하고, 공개적으로 이용 가능한 게놈 서열 길이를 본 발명자들에 의해 내부적으로(사내에서) 어셈블된 것들과 비교하였다. 모든 아넬로바이러스의 평균 CDS 길이는 약 2100개 뉴클레오티드이다. 알파토르크바이러스 속의 TTV는 베타토르크바이러스 및 감마토르크바이러스 속(각각 TTV minis 및 TTV midis)으로부터의 아넬로바이러스보다 더 컸다. 구체적으로, 평균 2237개 뉴클레오티드의 CDS가 알파토르크바이러스 TTV에서 관찰되었으며, 1800 내지 2541개 뉴클레오티드의 범위를 가졌다. 평균 2011개 뉴클레오티드의 CDS 길이가 베타토르크바이러스에 대하여 관찰되었으며, 1803 내지 2229개 뉴클레오티드의 범위를 가졌다. 평균 2012개 뉴클레오티드의 CDS 길이가 감마토르크바이러스에 대하여 관찰되었으며, 1812 내지 2379개 뉴클레오티드의 범위를 가졌다.
실시예 44: ORF2를 특성화하기 위한 고도로 보존된 모티프
도 43a에서 예시적인 게놈에 나타낸 바와 같이, 아넬로바이러스 ORF2는 가능한 포스파타제 활성을 갖는 비-구조적 단백질을 인코딩하고, 바이러스 복제 및 숙주 면역성의 조절에서 역할을 수행할 것으로 예상된다. 대규모 바이러스 서열 보관소를 보존된 ORF2 아미노산 모티프의 존재에 대하여 시험하였다(도 43b). 이어서, 이 모티프를 사용하여, 사 내(in-house) 및 공개 서열 간에 1,000개가 넘는 아넬로바이러스 ORF2 서열을 확인하였다. 이 ORF2 모티프는 방대한 인간 아넬로바이러스 주, 및 시험된 모든 비-인간 아넬로바이러스(설치류, 돼지 및 영장류 아넬로바이러스, 및 닭 빈혈 바이러스)의 카탈로그에 걸쳐 보존되어 유지되는 것이 관찰되었으며, 이는 ORF2 모티프가 현재까지 확인된 가장 고도로 보존된 아넬로바이러스 모티프가 되게 한다. ORF2 구조적 모델링도 수행하였으며, 이에 의해, ORF2 모티프 내의 보존된 잔기가 나선-회전-나선 구조에서 유지되는 것이 드러났으며, 배향은 가능한 금속 결합 도메인을 시사한다(도 43c). 흥미롭게도, ORF2에 비하여 ORF1의 계통수(도 43d)는 알파토르크바이러스, 베타토르크바이러스 및 감마토르크바이러스에 의한 유사한 속-수준 파단을 보였으며, 이는 ORF2가 속-특이적인 것을 나타낸다.
실시예 45: 인간 내의 전장 아넬로바이러스 ORF1 mRNA에 대한 증거
아넬로바이러스는 시험관 내에서 적어도 3가지의 대안적으로 스플라이싱된 mRNA를 발현하며, 이 중 가장 긴 것(약 2.2kb)은 전장 ORF1을 인코딩하는 것으로 예측된다. 본 실시예에서, ORF1 mRNA 전사를 생체 내에서 평가하였다.
이를 행하기 위하여, GTEx(유전형-조직 발현) 프로젝트로부터 공개적으로 이용 가능한 RNA Seq 조직 데이터를 시험하였다. 목적은 바이러스 전사물을 범주화하기에 충분한 아넬로바이러스 RNA 판독물을 함유하는 인간 조직 시료를 확인하는 것이었다. 아넬로바이러스 RNA 판독물을 갖는 104개의 조직 시료를 확인하였으며(모든 조직의 2.4%, 혈액 시료의 19%); 이들 시료 중 7개가 20개 초과의 아넬로바이러스 RNA 판독물을 가졌으며, 이는 바이러스 전사체 분석을 가능하게 한다. 이들 7개의 아넬로바이러스-양성 시료 중 3개는 일치되는 WGS 데이터도 또한 가졌으며, 이로부터 정밀한 판독물 맵핑을 위하여 상응하는 아넬로바이러스 DNA 게놈을 어셈블시킬 수 있다(도 44a). 상응하는 바이러스 참조 게놈의 부재 하에, 아넬로바이러스 다양성은 정보를 제공하는 RNA 판독물 맵핑을 막는다. ORF1 영역에 맵핑되는 RNA 판독물이 3명의 공여자에서 검출되었다(2개의 혈액 시료 및 1개의 폐 조직 시료). 1개의 공여자 혈액 시료에서, 전장 ORF1 영역을 포괄하는 아넬로바이러스 RNA 판독물을 확인하였다(도 44b, 회색 막대는 판독물 쌍을 나타낸다). 이것은 RNA Seq 데이터를 사용하여 생체 내에서 전장 아넬로바이러스 전사물을 처음으로 확인한 것이다.
실시예 46: 시험관 내에서 아넬로좀을 생성하기 위한 투입 물질로서 시험관 내 환화된 게놈
본 실시예는 본원에 기재된 바와 같은 아넬로좀 유전 요소에 대한 공급원 물질로서, 시험관 내 환화된(IVC) 이중 가닥 아넬로바이러스 DNA가 예상되는 밀도의 패키징된 아넬로좀 게놈을 제공하는 데 플라스미드 내의 아넬로바이러스 게놈 DNA보다 더욱 강력한 것을 보여준다.
T75 플라스크 내의 1.2E+07개의 HEK293T 세포(인간 배아 신장 세포주)를 11.25 ㎍의 (i) 시험관 내 환화된 이중 가닥 TTV-tth8 게놈(IVC TTV-tth8), (ii) 플라스미드 백본 내의 TTV-tth8 게놈 또는 (iii) TTV-tth8의 ORF1 서열만을 함유하는 플라스미드(비-복제성 TTV-tth8) 중 어느 하나로 트랜스펙션시켰다. 세포를 트랜스펙션 7일 후에 수집하고, 0.1% 트리톤으로 용해시키고, ㎖당 100 유닛의 벤조나제로 처리하였다. 용해물을 염화세슘 밀도 분석을 위해 사용하였으며; 염화세슘 선형 기울기의 각각의 분획에 대하여 밀도를 측정하였으며, TTV-tth8 카피 정량화를 수행하였다. 도 45에 나타낸 바와 같이, IVC TTV-tth8은 예상되는 1.33의 밀도에서, TTV-tth8 플라스미드에 비하여 현저하게 더 많은 바이러스 게놈 카피를 제공하였다.
1E+07개의 Jurkat 세포(인간 T 림프구 세포주)를 플라스미드 내의 시험관 내의 환화된 LY2 게놈(LY2 IVC) 또는 LY2 게놈 중 어느 하나를 사용하여 뉴클레오펙션시켰다. 세포를 트랜스펙션 4일 후에 수집하고, 0.5% 트리톤 및 300 mM 염화나트륨을 함유하는 완충제를 사용하여 용해시킨 후, 2회의 즉각적인 동결-해동을 행하였다. 용해물을 100 유닛/㎖의 벤조나제를 사용하여 처리한 후, 염화세슘 밀도 분석을 행하였다. 밀도 측정 및 LY2 게놈 정량화를 염화세슘 선형 기울기의 각각의 분획 상에서 수행하였다. 도 46에 나타낸 바와 같이, Jurkat 세포 내의 시험관 내 환화된 LY2 게놈의 트랜스펙션은 도 46에서 검출 가능한 피크를 보이지 않았던 LY2 게놈을 함유하는 플라스미드의 트랜스펙션에 비하여, 예상되는 밀도에서 날카로운 피크를 야기하였다.
실시예 47: 아넬로바이러스 ORF1 내의 보존된 2차 구조 모티프의 확인
본 실시예에서, 컴퓨터 모델링을 사용하여, 아넬로바이러스 ORF1 단백질의 2차 구조 내의 보존된 모티프를 확인하였다. 2차 구조 예측을 프로그램 JPred를 사용하여 단일의 주 상에서 행하였다.
일반적으로, 인간 TTV의 젤리-롤 도메인은 대략 200개 아미노산 (AA) ± 3개 AA 길이이다. 예시적인 젤리-롤 도메인의 2차 구조는 5 내지 7개 AA의 베타 가닥으로 시작하여, 3 내지 5개 AA 랜덤 코일, 15 내지 16개 AA 베타 가닥, 26 내지 28개 AA 랜덤 코일, 15 내지 17개 AA 알파 나선, 2개 AA 랜덤 코일, 3 내지 4개 AA 베타 가닥, 8개 AA 랜덤 코일, 10 내지 11개 AA 베타 가닥, 5 내지 6개 AA 랜덤 코일, 6 내지 7개 AA 베타 가닥, 8 내지 14개 AA 랜덤 코일, 8 내지 14개 AA 알파-나선(일부 경우에, 2개의 더 작은 나선으로 파단될 수 있음), 3 내지 4개 AA 랜덤 코일, 4 내지 5개 AA 베타 가닥, 10개 AA 랜덤 코일, 5 내지 6개 AA 베타 가닥, 20 내지 21개 AA 랜덤 코일, 7 내지 9개 AA 베타 가닥, 14 내지 16개 AA 랜덤 코일, 5 내지 7개 AA 베타 가닥으로 이어진다. 알파토르크바이러스, 베타토르크바이러스 및 감마토르크바이러스 클레이드로부터의 예시적인 아넬로바이러스 ORF1 2차 구조의 정렬은 도 47에 나타나 있다.
ORF1의 N22 도메인 내의 YNPX2DXGX2N (SEQ ID NO: 829) 모티프의 2차 구조는 또한, 그 주변에 보존된 2차 구조를 갖는다. 대부분의 모티프는 모티프의 위치 1의 티로신(Y) 뒤에서 파단되는 5 내지 6개 AA 베타 가닥으로 시작하여, 7 내지 8개 AA의 또 다른 베타 가닥이 기원하는 지점인 말단 아스파라긴(N)까지 8 내지 9개 AA 랜덤 코일로 정렬된다. 예시적인 아넬로바이러스 ORF1 N22 모티프 서열의 정렬은 도 48에 나타나 있다. 모티프 내의 티로신은 베타 가닥을 파단시키고, 제2 베타 가닥은 모티프의 말단 아스파라긴에서 시작한다.
SEQUENCE LISTING <110> FLAGSHIP PIONEERING INNOVATIONS V, INC. <120> ANELLOSOMES AND METHODS OF USE <130> V2057-7005WO <140> <141> <150> 62/778,841 <151> 2018-12-12 <150> 62/778,866 <151> 2018-12-12 <160> 1000 <170> PatentIn version 3.5 <210> 1 <211> 3570 <212> DNA <213> Torque teno virus <400> 1 attttgtgca gcccgccaat tctcgttcaa acaggccaat caggaggctc tacgtacact 60 tcctggggtg tgtcttcgaa gagtatataa gcagaggcgg tgacgaatgg tagagttttt 120 cctggcccgt ccgcggcgag agcgcgagcg gagcgagcga tcgagcgtcc cgtgggcggg 180 tgccgtaggt gagtttacac accgcagtca aggggcaatt cgggctcggg actggccggg 240 ctatgggcaa gattcttaaa aaattccccc gatccctctg tcgccaggac ataaaaacat 300 gccgtggaga ccgccggtgc atagtgtcca ggggcgagag gatcagtggt tcgcgagctt 360 ttttcacggc cacgcttcat tttgcggttg cggtgacgct gttggccatc ttaatagcat 420 tgctcctcgc tttcctcgcg ccggtccacc aaggccccct ccggggctag agcagcctaa 480 ccccccgcag cagggcccgg ccgggcccgg agggccgccc gccatcttgg cgctgccggc 540 tccgcccgcg gagcctgacg acccgcagcc acggcgtggt ggtggggacg gtggcgccgc 600 cgctggcgcc gcaggcgacc gtggagaccg agactacgac gaagaagagc tagacgagct 660 tttccgcgcc gccgccgaag acgatttgta agtaggagat ggcgccggcc ttacaggcgc 720 aggaggagac gcgggcgacg cagacgcaga cgcagacgca gacataagcc caccctagta 780 ctcagacagt ggcaacctga cgttatcaga cactgtaaga taacaggacg gatgcccctc 840 attatctgtg gaaaggggtc cacccagttc aactacatca cccacgcgga cgacatcacc 900 cccaggggag cctcctacgg gggcaacttc acaaacatga ctttctccct ggaggcaata 960 tacgaacagt ttctgtacca cagaaacagg tggtcagcct ccaaccacga cctcgaactc 1020 tgcagataca agggtaccac cctaaaactg tacaggcacc cagatgtaga ctacatagtc 1080 acctacagca gaacgggacc ctttgagatc agccacatga cctacctcag cactcacccc 1140 cttctcatgc tgctaaacaa acaccacata gtggtgccca gcctaaagac taagcccagg 1200 ggcagaaagg ccataaaagt cagaataaga ccccccaaac tcatgaacaa caagtggtac 1260 ttcaccagag acttctgtaa cataggcctc ttccagctct gggccacagg cttagaactc 1320 agaaacccct ggctcagaat gagcaccctg agcccctgca taggcttcaa tgtccttaaa 1380 aacagcattt acacaaacct cagcaaccta cctcagcaca gagaagacag acttaacatt 1440 attaacaaca cattacaccc acatgacata acaggaccaa acaataaaaa atggcagtac 1500 acatatacca aactcatggc ccccatttac tattcagcaa acagggccag cacctatgac 1560 ttactacgag agtatggcct ctacagtcca tactacctaa accccacaag gataaacctt 1620 gactggatga ccccctacac acacgtcagg tacaatccac tagtagacaa gggcttcgga 1680 aacagaatat acatacagtg gtgctcagag gcagatgtaa gctacaacag gactaaatcc 1740 aagtgtctct tacaagacat gcccctgttt ttcatgtgct atggctacat agactgggca 1800 attaaaaaca caggggtctc ctcactagcg agagacgcca gaatctgcat caggtgtccc 1860 tacacagagc cacagctggt gggctccaca gaagacatag ggttcgtacc catcacagag 1920 accttcatga ggggcgacat gccggtactt gcaccataca taccgttgag ctggttttgc 1980 aagtggtatc ccaacatagc tcaccagaag gaagtacttg aggcaatcat ttcctgcagc 2040 cccttcatgc cccgtgacca gggcatgaac ggttgggata ttacaatagg ttacaaaatg 2100 gacttcttat ggggcggttc ccctctcccc tcacagccaa tcgacgaccc ctgccagcag 2160 ggaacccacc cgattcccga ccccgataag caccctcgcc tcctacaagt gtcgaacccg 2220 aaactgctcg gaccgaggac agtgttccac aagtgggaca tcagacgtgg gcagtttagc 2280 aaaagaagta ttaaaagagt gtcagaatac tcatcggatg atgaatctct tgcgccaggt 2340 ctcccatcaa agcgaaacaa gctcgactcg gccttcagag gagaaaaccc agagcaaaaa 2400 gaatgctatt ctctcctcaa agcactcgag gaagaagaga ccccagaaga agaagaacca 2460 gcaccccaag aaaaagccca gaaagaggag ctactccacc agctccagct ccagagacgc 2520 caccagcgag tcctcagacg agggctcaag ctcgtcttta cagacatcct ccgactccgc 2580 cagggagtcc actggaaccc cgagctcaca tagagccccc accttacata ccagacctac 2640 tttttcccaa tactggtaaa aaaaaaaaat tctctccctt cgactgggaa acggaggccc 2700 agctagcagg gatattcaag cgtcctatgc gcttctatcc ctcagacacc cctcactacc 2760 cgtggttacc ccccaagcgc gatatcccga aaatatgtaa cataaacttc aaaataaagc 2820 tgcaagagtg agtgattcga ggccctcctc tgttcactta gcggtgtcta cctcttaaag 2880 tcaccaagca ctccgagcgt cagcgaggag tgcgaccctc caccaagggg caacttcctc 2940 ggggtccggc gctacgcgct tcgcgctgcg ccggacgcct cggacccccc cccgacccga 3000 atcgctcgcg cgattcggac ctgcggcctc ggggggggtc gggggcttta ctaaacagac 3060 tccgagttgc cactggactc aggagctgtg aatcagtaac gaaagtgagt ggggccagac 3120 ttcgccatag ggcctttaac ttggggtcgt ctgtcggtgg cttccgggtc cgcctgggcg 3180 ccgccatttt agctttagac gccattttag gccctcgcgg gcacccgtag gcgcgtttta 3240 atgacgtcac ggcagccatt ttgtcgtgac gtttgagaca cgtgatgggg gcgtgcctaa 3300 acccggaagc atccctggtc acgtgactct gacgtcacgg cggccatttt gtgctgtccg 3360 ccatcttgtg acttccttcc gctttttcaa aaaaaaagag gaagtatgac agtagcggcg 3420 ggggggcggc cgcgttcgcg cgccgcccac cagggggtgc tgcgcgcccc cccccgcgca 3480 tgcgcggggc ccccccccgg gggggctccg cccccccggc ccccccccgt gctaaaccca 3540 ccgcgcatgc gcgaccacgc ccccgccgcc 3570 <210> 2 <211> 130 <212> PRT <213> Torque teno virus <400> 2 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Ala Ser Phe Cys Gly Cys Gly 20 25 30 Asp Ala Val Gly His Leu Asn Ser Ile Ala Pro Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Glu Gln Pro Asn Pro Pro Gln 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Gly Asp Arg Gly Asp Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Leu 130 <210> 3 <211> 303 <212> PRT <213> Torque teno virus <400> 3 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Ala Ser Phe Cys Gly Cys Gly 20 25 30 Asp Ala Val Gly His Leu Asn Ser Ile Ala Pro Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Glu Gln Pro Asn Pro Pro Gln 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Gly Asp Arg Gly Asp Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Phe Gln Ser Thr Thr Pro Ala Ser Arg Glu Pro Thr Arg Phe Pro 130 135 140 Thr Pro Ile Ser Thr Leu Ala Ser Tyr Lys Cys Arg Thr Arg Asn Cys 145 150 155 160 Ser Asp Arg Gly Gln Cys Ser Thr Ser Gly Thr Ser Asp Val Gly Ser 165 170 175 Leu Ala Lys Glu Val Leu Lys Glu Cys Gln Asn Thr His Arg Met Met 180 185 190 Asn Leu Leu Arg Gln Val Ser His Gln Ser Glu Thr Ser Ser Thr Arg 195 200 205 Pro Ser Glu Glu Lys Thr Gln Ser Lys Lys Asn Ala Ile Leu Ser Ser 210 215 220 Lys His Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln His Pro 225 230 235 240 Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser Ser Arg 245 250 255 Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser Leu Gln 260 265 270 Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Pro Ser Ser His 275 280 285 Arg Ala Pro Thr Leu His Thr Arg Pro Thr Phe Ser Gln Tyr Trp 290 295 300 <210> 4 <211> 293 <212> PRT <213> Torque teno virus <400> 4 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Ala Ser Phe Cys Gly Cys Gly 20 25 30 Asp Ala Val Gly His Leu Asn Ser Ile Ala Pro Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Glu Gln Pro Asn Pro Pro Gln 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Gly Asp Arg Gly Asp Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Leu Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Leu Gln Arg 130 135 140 Arg Lys Pro Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Thr Arg 145 150 155 160 Gly Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser 165 170 175 Pro Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro 180 185 190 Ala Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro 195 200 205 Thr Pro Pro Gly Ser Pro Leu Glu Pro Arg Ala His Ile Glu Pro Pro 210 215 220 Pro Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys 225 230 235 240 Phe Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Leu Ala Gly Ile Phe 245 250 255 Lys Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp 260 265 270 Leu Pro Pro Lys Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys 275 280 285 Ile Lys Leu Gln Glu 290 <210> 5 <211> 180 <212> PRT <213> Torque teno virus <400> 5 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Leu Gln Arg Arg 20 25 30 Lys Pro Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Thr Arg Gly 35 40 45 Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser Pro 50 55 60 Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro Ala 65 70 75 80 Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro Thr 85 90 95 Pro Pro Gly Ser Pro Leu Glu Pro Arg Ala His Ile Glu Pro Pro Pro 100 105 110 Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys Phe 115 120 125 Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Leu Ala Gly Ile Phe Lys 130 135 140 Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp Leu 145 150 155 160 Pro Pro Lys Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys Ile 165 170 175 Lys Leu Gln Glu 180 <210> 6 <211> 680 <212> PRT <213> Torque teno virus <400> 6 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Trp Arg Pro Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys Pro Thr Leu Val Leu Arg Gln Trp Gln Pro Asp Val Ile Arg 65 70 75 80 His Cys Lys Ile Thr Gly Arg Met Pro Leu Ile Ile Cys Gly Lys Gly 85 90 95 Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg 100 105 110 Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu 115 120 125 Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser 130 135 140 Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu 145 150 155 160 Tyr Arg His Pro Asp Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly 165 170 175 Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Leu Leu 180 185 190 Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys 195 200 205 Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu 210 215 220 Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu 225 230 235 240 Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg 245 250 255 Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser 260 265 270 Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln His Arg Glu Asp Arg Leu 275 280 285 Asn Ile Ile Asn Asn Thr Leu His Pro His Asp Ile Thr Gly Pro Asn 290 295 300 Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr 305 310 315 320 Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Leu Leu Arg Glu Tyr Gly 325 330 335 Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp 340 345 350 Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly 355 360 365 Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser 370 375 380 Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe 385 390 395 400 Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val 405 410 415 Ser Ser Leu Ala Arg Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr 420 425 430 Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile 435 440 445 Thr Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile 450 455 460 Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys 465 470 475 480 Glu Val Leu Glu Ala Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp 485 490 495 Gln Gly Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe 500 505 510 Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys 515 520 525 Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu 530 535 540 Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His 545 550 555 560 Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg 565 570 575 Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro 580 585 590 Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Pro Glu 595 600 605 Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr 610 615 620 Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu 625 630 635 640 Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg 645 650 655 Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly 660 665 670 Val His Trp Asn Pro Glu Leu Thr 675 680 <210> 7 <211> 197 <212> PRT <213> Torque teno virus <400> 7 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Trp Arg Pro Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Pro Ile Asp Asp Pro Cys Gln Gln Gly 35 40 45 Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu Gln Val 50 55 60 Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys Trp Asp 65 70 75 80 Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val Ser Glu 85 90 95 Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser Lys Arg 100 105 110 Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Pro Glu Gln Lys Glu 115 120 125 Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro Glu Glu 130 135 140 Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu Leu His 145 150 155 160 Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg Gly Leu 165 170 175 Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val His Trp 180 185 190 Asn Pro Glu Leu Thr 195 <210> 8 <211> 145 <212> PRT <213> Torque teno virus <400> 8 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Trp Arg Pro Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser His Gln Ser Glu Thr Ser Ser 35 40 45 Thr Arg Pro Ser Glu Glu Lys Thr Gln Ser Lys Lys Asn Ala Ile Leu 50 55 60 Ser Ser Lys His Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln 65 70 75 80 His Pro Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser 85 90 95 Ser Arg Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser 100 105 110 Leu Gln Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Pro Ser 115 120 125 Ser His Arg Ala Pro Thr Leu His Thr Arg Pro Thr Phe Ser Gln Tyr 130 135 140 Trp 145 <210> 9 <211> 3451 <212> DNA <213> Torque teno virus <400> 9 aattttgcta aacagactcc gaggtgctct tggacactga gtgggcgtac agcaacgaaa 60 gtgagtgggg ccagacttcg ccataaggcc tttatcttcg ggtctacatc ataatataaa 120 gatgtgcact tccgaatggc tgagtttttc acgccattcc gcagcggtgg agcagcgcag 180 ccacgacccc cgcgtcccga gggcgggtgc cggaggtgag tttacacacc gcagtcaagg 240 ggcaattcgg gctcgggact ggccgggccc gggcaaggct cttaaagcga aaccatgttc 300 ctcggcaggc cctaccgcca cagaaagcgg caccaggccg gcaagaaagg gccactgcca 360 ctgccaaatc tgcaacctgc acaggagaaa cgggctggtg gtccgtcctt gatggcctcc 420 ggacgcaggg gatggatgcc cccggacctg acggtccagg agagggagga tgcctggtgg 480 accagcttct gcgctagcca ccgcagcttt tgtagctgcg acgatcctgt gggccatatt 540 aatactctcg cccgcgataa tagtcctctg gcccagactc ctactacaac ttcaggccag 600 gggccgccgc cgccgcctac gcctccgcgg acgccggggc cgcgccctgg gtctgctccg 660 gaccaggggg gaaggatcag ggcctcctgg acctaccccc tagcccccgg aggtcccggt 720 agcacgccat ggcctactgg tggggccgga gacgccggtg gcgccgctgg aggaggcgcc 780 ggcgtcctct ccgccgccgc cggcggtggc ggagaaggcg acgctggccc agaaggcgcc 840 ggtggaggcg aaggagacga cgtgcgagac ctgctcgccg ctatcgaagg agacgtgggc 900 gcagacgggt aaggagacgc cgtcgccccc agaaactagt actgactcag tggaatcccc 960 agactgtgag aaagtgtgtt attagggggt ttctgcccct gttcttctgc ggacaggggg 1020 cctaccacag aaactttaca gaccactatg acgatgtgtt ccccaaggga cccagcggag 1080 gtgggcacgg gagcatggtg ttcaacctgt cctttctgta ccaagagttt aagaagcacc 1140 acaataagtg gtcgcgcagc aacctggact ttgacttagt gagatacaag ggcacagtga 1200 taaagctgta cagacaccag gactttgact acatagtgtg gataagcagg acccctccct 1260 tccaggagag cctgctcaca gtaatgaccc accagcccag cgtcatgctg caggcaaaaa 1320 agtgcataat agtaaagagc tacaggaccc acccgggggg caaaccctat gtaactgcaa 1380 aagttaggcc ccccagactc ctaactgaca agtggtactt ccagtcagac ttctgcaacg 1440 ttccgctttt tagcctacag tttgcccttg cggaactgcg gtttccgatc tgctcaccac 1500 aaactgacac caattgcatt aacttcctgg tgttagatga catctactac aagtttctag 1560 ataataagcc taaacagagt tcagacccta atgacgaaaa cagaataaaa ttctggcacg 1620 gcctatggtc cactatgaga tatttaaaca ccacctacat aaacacactg tttccaggca 1680 cagacagtct agtggccgcc aaagatactg acaatagtgt aaataaatac cccagcacag 1740 ccactaaaca gccctacaaa gacagtcagt acatgcaaaa tatatggaat acatcaaaaa 1800 tacatgcctt atatacgtgg gtagcagaga caaactacaa aagactgcag gcctactaca 1860 cacagaccta cggaggctac cagagacaat ttttcacagg aaaacagtac tgggactaca 1920 gagtaggcat gtttagtcca gccttcctga gtcccagcag actaaatccc cagaacccag 1980 gggcatacac agaggtctcc tacaacccct ggacagacga gggcacgggc aacgtagtgt 2040 gcctgcagta tctgactaaa gagacctcag actacaaacc aggtggtggg agcaagttct 2100 gcatagaagg tgtgcctcta tgggcagcgc tggtgggata cgtagacatg tgtaaaaaag 2160 agggcaagga cccgggcatc agactaaact gtctcctgtt agtcaagtgt ccctatacaa 2220 agcctcagct gtatgacaaa aaaaaccccg agaaactgtt tgtaccttac tcctataact 2280 ttgggcacgg caagatgccg gggggagaca aatacatacc catagagttc aaagacaggt 2340 ggtacccctg cctgctccac caagaggagt ggatagagga cattgtcagg tcgggaccct 2400 tcgttccaaa agacatgccc agcagcgtca cctgcatgat gaggtacagc tctcttttta 2460 actggggcgg taatataatc caagaacagg ccgtggaaga cccctgtaag aaaggcacct 2520 tcgtcgttcc cggaaccagt ggcatcgctc gcatactaca agtcagcaac ccggccaagc 2580 agacccccac gacaacctgg cactcgtggg actggagacg atccctcttt acagagacgg 2640 gtcttaaaag aatgcgcgaa caacaaccat atgatgaact gtcttatacg ggccctaaaa 2700 agccaaaact gtcccttccc gcagggcccg ccgtccccgg tgccgccgtc gcctcctcct 2760 ggtgggaaac aaaacaggtc acctcgccag acgtcagcga gacggagacc gaagcagaag 2820 cccaccaaga ggaagagacg gagccggagg agggagtcca gctccagcag ctgtgggagc 2880 agcaactcct gcaaaagcga cagctgggag tcgtgttcca gcaactcctc cgactcagac 2940 agggggcgga gatccacccg ggcctcgtat aattcctggg ccccagaacc cgtacctgct 3000 tttcccggag caggcccctc caaaagtgcc tatttttgac ccctttggtc agaaaacaga 3060 gctagagctg tgcggctgct tcgacaggcc gcccaggaac aacccctacg accacccctt 3120 ctacccctgg ctgcccaaag agcctccctc ctactaccag ggctacaaag tgtctttcaa 3180 actagggttc cacccagaca agcatgtgtg aaccccgcca ataaaccact gctgctacac 3240 tgattcttag gccgtgggag tctcactggt cggtgtctac ctcttaaggt cactaagcac 3300 tccgagcgtt agcgaggagt gcgaccctac cccctgggcc cacttcttcg gagccgcgcg 3360 ctacgccttc ggctgcgcgc ggcacctcag acccccgctc gtgctgacac gcttgcgcgt 3420 gtcagaccac ttcgggctcg cgggggtcgg g 3451 <210> 10 <211> 166 <212> PRT <213> Torque teno virus <400> 10 Met Ala Ser Gly Arg Arg Gly Trp Met Pro Pro Asp Leu Thr Val Gln 1 5 10 15 Glu Arg Glu Asp Ala Trp Trp Thr Ser Phe Cys Ala Ser His Arg Ser 20 25 30 Phe Cys Ser Cys Asp Asp Pro Val Gly His Ile Asn Thr Leu Ala Arg 35 40 45 Asp Asn Ser Pro Leu Ala Gln Thr Pro Thr Thr Thr Ser Gly Gln Gly 50 55 60 Pro Pro Pro Pro Pro Thr Pro Pro Arg Thr Pro Gly Pro Arg Pro Gly 65 70 75 80 Ser Ala Pro Asp Gln Gly Gly Arg Ile Arg Ala Ser Trp Thr Tyr Pro 85 90 95 Leu Ala Pro Gly Gly Pro Gly Ser Thr Pro Trp Pro Thr Gly Gly Ala 100 105 110 Gly Asp Ala Gly Gly Ala Ala Gly Gly Gly Ala Gly Val Leu Ser Ala 115 120 125 Ala Ala Gly Gly Gly Gly Glu Gly Asp Ala Gly Pro Glu Gly Ala Gly 130 135 140 Gly Gly Glu Gly Asp Asp Val Arg Asp Leu Leu Ala Ala Ile Glu Gly 145 150 155 160 Asp Val Gly Ala Asp Gly 165 <210> 11 <211> 348 <212> PRT <213> Torque teno virus <400> 11 Met Ala Ser Gly Arg Arg Gly Trp Met Pro Pro Asp Leu Thr Val Gln 1 5 10 15 Glu Arg Glu Asp Ala Trp Trp Thr Ser Phe Cys Ala Ser His Arg Ser 20 25 30 Phe Cys Ser Cys Asp Asp Pro Val Gly His Ile Asn Thr Leu Ala Arg 35 40 45 Asp Asn Ser Pro Leu Ala Gln Thr Pro Thr Thr Thr Ser Gly Gln Gly 50 55 60 Pro Pro Pro Pro Pro Thr Pro Pro Arg Thr Pro Gly Pro Arg Pro Gly 65 70 75 80 Ser Ala Pro Asp Gln Gly Gly Arg Ile Arg Ala Ser Trp Thr Tyr Pro 85 90 95 Leu Ala Pro Gly Gly Pro Gly Ser Thr Pro Trp Pro Thr Gly Gly Ala 100 105 110 Gly Asp Ala Gly Gly Ala Ala Gly Gly Gly Ala Gly Val Leu Ser Ala 115 120 125 Ala Ala Gly Gly Gly Gly Glu Gly Asp Ala Gly Pro Glu Gly Ala Gly 130 135 140 Gly Gly Glu Gly Asp Asp Val Arg Asp Leu Leu Ala Ala Ile Glu Gly 145 150 155 160 Asp Val Gly Ala Asp Gly Pro Trp Lys Thr Pro Val Arg Lys Ala Pro 165 170 175 Ser Ser Phe Pro Glu Pro Val Ala Ser Leu Ala Tyr Tyr Lys Ser Ala 180 185 190 Thr Arg Pro Ser Arg Pro Pro Arg Gln Pro Gly Thr Arg Gly Thr Gly 195 200 205 Asp Asp Pro Ser Leu Gln Arg Arg Val Leu Lys Glu Cys Ala Asn Asn 210 215 220 Asn His Met Met Asn Cys Leu Ile Arg Ala Leu Lys Ser Gln Asn Cys 225 230 235 240 Pro Phe Pro Gln Gly Pro Pro Ser Pro Val Pro Pro Ser Pro Pro Pro 245 250 255 Gly Gly Lys Gln Asn Arg Ser Pro Arg Gln Thr Ser Ala Arg Arg Arg 260 265 270 Pro Lys Gln Lys Pro Thr Lys Arg Lys Arg Arg Ser Arg Arg Arg Glu 275 280 285 Ser Ser Ser Ser Ser Cys Gly Ser Ser Asn Ser Cys Lys Ser Asp Ser 290 295 300 Trp Glu Ser Cys Ser Ser Asn Ser Ser Asp Ser Asp Arg Gly Arg Arg 305 310 315 320 Ser Thr Arg Ala Ser Tyr Asn Ser Trp Ala Pro Glu Pro Val Pro Ala 325 330 335 Phe Pro Gly Ala Gly Pro Ser Lys Ser Ala Tyr Phe 340 345 <210> 12 <211> 327 <212> PRT <213> Torque teno virus <400> 12 Met Ala Ser Gly Arg Arg Gly Trp Met Pro Pro Asp Leu Thr Val Gln 1 5 10 15 Glu Arg Glu Asp Ala Trp Trp Thr Ser Phe Cys Ala Ser His Arg Ser 20 25 30 Phe Cys Ser Cys Asp Asp Pro Val Gly His Ile Asn Thr Leu Ala Arg 35 40 45 Asp Asn Ser Pro Leu Ala Gln Thr Pro Thr Thr Thr Ser Gly Gln Gly 50 55 60 Pro Pro Pro Pro Pro Thr Pro Pro Arg Thr Pro Gly Pro Arg Pro Gly 65 70 75 80 Ser Ala Pro Asp Gln Gly Gly Arg Ile Arg Ala Ser Trp Thr Tyr Pro 85 90 95 Leu Ala Pro Gly Gly Pro Gly Ser Thr Pro Trp Pro Thr Gly Gly Ala 100 105 110 Gly Asp Ala Gly Gly Ala Ala Gly Gly Gly Ala Gly Val Leu Ser Ala 115 120 125 Ala Ala Gly Gly Gly Gly Glu Gly Asp Ala Gly Pro Glu Gly Ala Gly 130 135 140 Gly Gly Glu Gly Asp Asp Val Arg Asp Leu Leu Ala Ala Ile Glu Gly 145 150 155 160 Asp Val Gly Ala Asp Gly Ala Arg Arg Pro Arg Cys Arg Arg Arg Leu 165 170 175 Leu Leu Val Gly Asn Lys Thr Gly His Leu Ala Arg Arg Gln Arg Asp 180 185 190 Gly Asp Arg Ser Arg Ser Pro Pro Arg Gly Arg Asp Gly Ala Gly Gly 195 200 205 Gly Ser Pro Ala Pro Ala Ala Val Gly Ala Ala Thr Pro Ala Lys Ala 210 215 220 Thr Ala Gly Ser Arg Val Pro Ala Thr Pro Pro Thr Gln Thr Gly Gly 225 230 235 240 Gly Asp Pro Pro Gly Pro Arg Ile Ile Pro Gly Pro Gln Asn Pro Tyr 245 250 255 Leu Leu Phe Pro Glu Gln Ala Pro Pro Lys Val Pro Ile Phe Asp Pro 260 265 270 Phe Gly Gln Lys Thr Glu Leu Glu Leu Cys Gly Cys Phe Asp Arg Pro 275 280 285 Pro Arg Asn Asn Pro Tyr Asp His Pro Phe Tyr Pro Trp Leu Pro Lys 290 295 300 Glu Pro Pro Ser Tyr Tyr Gln Gly Tyr Lys Val Ser Phe Lys Leu Gly 305 310 315 320 Phe His Pro Asp Lys His Val 325 <210> 13 <211> 747 <212> PRT <213> Torque teno virus <400> 13 Met Ala Tyr Trp Trp Gly Arg Arg Arg Arg Trp Arg Arg Trp Arg Arg 1 5 10 15 Arg Arg Arg Pro Leu Arg Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg 20 25 30 Trp Pro Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg Arg Ala Arg Pro 35 40 45 Ala Arg Arg Tyr Arg Arg Arg Arg Gly Arg Arg Arg Val Arg Arg Arg 50 55 60 Arg Arg Pro Gln Lys Leu Val Leu Thr Gln Trp Asn Pro Gln Thr Val 65 70 75 80 Arg Lys Cys Val Ile Arg Gly Phe Leu Pro Leu Phe Phe Cys Gly Gln 85 90 95 Gly Ala Tyr His Arg Asn Phe Thr Asp His Tyr Asp Asp Val Phe Pro 100 105 110 Lys Gly Pro Ser Gly Gly Gly His Gly Ser Met Val Phe Asn Leu Ser 115 120 125 Phe Leu Tyr Gln Glu Phe Lys Lys His His Asn Lys Trp Ser Arg Ser 130 135 140 Asn Leu Asp Phe Asp Leu Val Arg Tyr Lys Gly Thr Val Ile Lys Leu 145 150 155 160 Tyr Arg His Gln Asp Phe Asp Tyr Ile Val Trp Ile Ser Arg Thr Pro 165 170 175 Pro Phe Gln Glu Ser Leu Leu Thr Val Met Thr His Gln Pro Ser Val 180 185 190 Met Leu Gln Ala Lys Lys Cys Ile Ile Val Lys Ser Tyr Arg Thr His 195 200 205 Pro Gly Gly Lys Pro Tyr Val Thr Ala Lys Val Arg Pro Pro Arg Leu 210 215 220 Leu Thr Asp Lys Trp Tyr Phe Gln Ser Asp Phe Cys Asn Val Pro Leu 225 230 235 240 Phe Ser Leu Gln Phe Ala Leu Ala Glu Leu Arg Phe Pro Ile Cys Ser 245 250 255 Pro Gln Thr Asp Thr Asn Cys Ile Asn Phe Leu Val Leu Asp Asp Ile 260 265 270 Tyr Tyr Lys Phe Leu Asp Asn Lys Pro Lys Gln Ser Ser Asp Pro Asn 275 280 285 Asp Glu Asn Arg Ile Lys Phe Trp His Gly Leu Trp Ser Thr Met Arg 290 295 300 Tyr Leu Asn Thr Thr Tyr Ile Asn Thr Leu Phe Pro Gly Thr Asp Ser 305 310 315 320 Leu Val Ala Ala Lys Asp Thr Asp Asn Ser Val Asn Lys Tyr Pro Ser 325 330 335 Thr Ala Thr Lys Gln Pro Tyr Lys Asp Ser Gln Tyr Met Gln Asn Ile 340 345 350 Trp Asn Thr Ser Lys Ile His Ala Leu Tyr Thr Trp Val Ala Glu Thr 355 360 365 Asn Tyr Lys Arg Leu Gln Ala Tyr Tyr Thr Gln Thr Tyr Gly Gly Tyr 370 375 380 Gln Arg Gln Phe Phe Thr Gly Lys Gln Tyr Trp Asp Tyr Arg Val Gly 385 390 395 400 Met Phe Ser Pro Ala Phe Leu Ser Pro Ser Arg Leu Asn Pro Gln Asn 405 410 415 Pro Gly Ala Tyr Thr Glu Val Ser Tyr Asn Pro Trp Thr Asp Glu Gly 420 425 430 Thr Gly Asn Val Val Cys Leu Gln Tyr Leu Thr Lys Glu Thr Ser Asp 435 440 445 Tyr Lys Pro Gly Gly Gly Ser Lys Phe Cys Ile Glu Gly Val Pro Leu 450 455 460 Trp Ala Ala Leu Val Gly Tyr Val Asp Met Cys Lys Lys Glu Gly Lys 465 470 475 480 Asp Pro Gly Ile Arg Leu Asn Cys Leu Leu Leu Val Lys Cys Pro Tyr 485 490 495 Thr Lys Pro Gln Leu Tyr Asp Lys Lys Asn Pro Glu Lys Leu Phe Val 500 505 510 Pro Tyr Ser Tyr Asn Phe Gly His Gly Lys Met Pro Gly Gly Asp Lys 515 520 525 Tyr Ile Pro Ile Glu Phe Lys Asp Arg Trp Tyr Pro Cys Leu Leu His 530 535 540 Gln Glu Glu Trp Ile Glu Asp Ile Val Arg Ser Gly Pro Phe Val Pro 545 550 555 560 Lys Asp Met Pro Ser Ser Val Thr Cys Met Met Arg Tyr Ser Ser Leu 565 570 575 Phe Asn Trp Gly Gly Asn Ile Ile Gln Glu Gln Ala Val Glu Asp Pro 580 585 590 Cys Lys Lys Gly Thr Phe Val Val Pro Gly Thr Ser Gly Ile Ala Arg 595 600 605 Ile Leu Gln Val Ser Asn Pro Ala Lys Gln Thr Pro Thr Thr Thr Trp 610 615 620 His Ser Trp Asp Trp Arg Arg Ser Leu Phe Thr Glu Thr Gly Leu Lys 625 630 635 640 Arg Met Arg Glu Gln Gln Pro Tyr Asp Glu Leu Ser Tyr Thr Gly Pro 645 650 655 Lys Lys Pro Lys Leu Ser Leu Pro Ala Gly Pro Ala Val Pro Gly Ala 660 665 670 Ala Val Ala Ser Ser Trp Trp Glu Thr Lys Gln Val Thr Ser Pro Asp 675 680 685 Val Ser Glu Thr Glu Thr Glu Ala Glu Ala His Gln Glu Glu Glu Thr 690 695 700 Glu Pro Glu Glu Gly Val Gln Leu Gln Gln Leu Trp Glu Gln Gln Leu 705 710 715 720 Leu Gln Lys Arg Gln Leu Gly Val Val Phe Gln Gln Leu Leu Arg Leu 725 730 735 Arg Gln Gly Ala Glu Ile His Pro Gly Leu Val 740 745 <210> 14 <211> 220 <212> PRT <213> Torque teno virus <400> 14 Met Ala Tyr Trp Trp Gly Arg Arg Arg Arg Trp Arg Arg Trp Arg Arg 1 5 10 15 Arg Arg Arg Pro Leu Arg Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg 20 25 30 Trp Pro Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg Arg Ala Arg Pro 35 40 45 Ala Arg Arg Tyr Arg Arg Arg Arg Gly Arg Arg Arg Ala Val Glu Asp 50 55 60 Pro Cys Lys Lys Gly Thr Phe Val Val Pro Gly Thr Ser Gly Ile Ala 65 70 75 80 Arg Ile Leu Gln Val Ser Asn Pro Ala Lys Gln Thr Pro Thr Thr Thr 85 90 95 Trp His Ser Trp Asp Trp Arg Arg Ser Leu Phe Thr Glu Thr Gly Leu 100 105 110 Lys Arg Met Arg Glu Gln Gln Pro Tyr Asp Glu Leu Ser Tyr Thr Gly 115 120 125 Pro Lys Lys Pro Lys Leu Ser Leu Pro Ala Gly Pro Ala Val Pro Gly 130 135 140 Ala Ala Val Ala Ser Ser Trp Trp Glu Thr Lys Gln Val Thr Ser Pro 145 150 155 160 Asp Val Ser Glu Thr Glu Thr Glu Ala Glu Ala His Gln Glu Glu Glu 165 170 175 Thr Glu Pro Glu Glu Gly Val Gln Leu Gln Gln Leu Trp Glu Gln Gln 180 185 190 Leu Leu Gln Lys Arg Gln Leu Gly Val Val Phe Gln Gln Leu Leu Arg 195 200 205 Leu Arg Gln Gly Ala Glu Ile His Pro Gly Leu Val 210 215 220 <210> 15 <211> 164 <212> PRT <213> Torque teno virus <400> 15 Met Ala Tyr Trp Trp Gly Arg Arg Arg Arg Trp Arg Arg Trp Arg Arg 1 5 10 15 Arg Arg Arg Pro Leu Arg Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg 20 25 30 Trp Pro Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg Arg Ala Arg Pro 35 40 45 Ala Arg Arg Tyr Arg Arg Arg Arg Gly Arg Arg Arg Gly Pro Pro Ser 50 55 60 Pro Val Pro Pro Ser Pro Pro Pro Gly Gly Lys Gln Asn Arg Ser Pro 65 70 75 80 Arg Gln Thr Ser Ala Arg Arg Arg Pro Lys Gln Lys Pro Thr Lys Arg 85 90 95 Lys Arg Arg Ser Arg Arg Arg Glu Ser Ser Ser Ser Ser Cys Gly Ser 100 105 110 Ser Asn Ser Cys Lys Ser Asp Ser Trp Glu Ser Cys Ser Ser Asn Ser 115 120 125 Ser Asp Ser Asp Arg Gly Arg Arg Ser Thr Arg Ala Ser Tyr Asn Ser 130 135 140 Trp Ala Pro Glu Pro Val Pro Ala Phe Pro Gly Ala Gly Pro Ser Lys 145 150 155 160 Ser Ala Tyr Phe <210> 16 <211> 3753 <212> DNA <213> Torque teno virus <400> 16 tgctacgtca ctaacccacg tgtcctctac aggccaatcg cagtctatgt cgtgcacttc 60 ctgggcatgg tctacataat tatataaatg cttgcacttc cgaatggctg agtttttgct 120 gcccgtccgc ggagaggagc cacggcaggg gatccgaacg tcctgagggc gggtgccgga 180 ggtgagttta cacaccgaag tcaaggggca attcgggctc aggactggcc gggctttggg 240 caaggctctt aaaaatgcac ttttctcgaa taagcagaaa gaaaaggaaa gtgctactgc 300 tttgcgtgcc agcagctaag aaaaaaccaa ctgctatgag cttctggaaa cctccggtac 360 acaatgtcac ggggatccaa cgcatgtggt atgagtcctt tcaccgtggc cacgcttctt 420 tttgtggttg tgggaatcct atacttcaca ttactgcact tgctgaaaca tatggccatc 480 caacaggccc gagaccttct gggccaccgg gagtagaccc caacccccac atccgtagag 540 ccaggcctgc cccggccgct ccggagccct cacaggttga ttcgagacca gccctgacat 600 ggcatgggga tggtggaagc gacggaggcg ctggtggttc cggaagcggt ggacccgtgg 660 cagacttcgc agacgatggc ctcgatcagc tcgtcgccgc cctagacgac gaagagtaag 720 gaggcgcaga cggtggagga gggggagacg aaaaacaagg acttacagac gcaggagacg 780 ctttagacgc aggggacgaa aagcaaaact tataataaaa ctgtggcaac ctgcagtaat 840 taaaagatgc agaataaagg gatacatacc actgattata agtgggaacg gtacctttgc 900 cacaaacttt accagtcaca taaatgacag aataatgaaa ggccccttcg ggggaggaca 960 cagcactatg aggttcagcc tctacatttt gtttgaggag cacctcagac acatgaactt 1020 ctggaccaga agcaacgata acctagagct aaccagatac ttgggggctt cagtaaaaat 1080 atacaggcac ccagaccaag actttatagt aatatacaac agaagaaccc ctctaggagg 1140 caacatctac acagcaccct ctctacaccc aggcaatgcc attttagcaa aacacaaaat 1200 attagtacca agtttacaga caagaccaaa gggtagaaaa gcaattagac taagaatagc 1260 accccccaca ctctttacag acaagtggta ctttcaaaag gacatagccg acctcaccct 1320 tttcaacatc atggcagttg aggctgactt gcggtttccg ttctgctcac cacaaactga 1380 caacacttgc atcagcttcc aggtccttag ttccgtttac aacaactacc tcagtattaa 1440 tacctttaat aatgacaact cagactcaaa gttaaaagaa tttttaaata aagcatttcc 1500 aacaacaggc acaaaaggaa caagtttaaa tgcactaaat acatttagaa cagaaggatg 1560 cataagtcac ccacaactaa aaaaaccaaa cccacaaata aacaaaccat tagagtcaca 1620 atactttgca cctttagatg ccctctgggg agaccccata tactataatg atctaaatga 1680 aaacaaaagt ttgaacgata tcattgagaa aatactaata aaaaacatga ttacatacca 1740 tgcaaaacta agagaatttc caaattcata ccaaggaaac aaggcctttt gccacctaac 1800 aggcatatac agcccaccat acctaaacca aggcagaata tctccagaaa tatttggact 1860 gtacacagaa ataatttaca acccttacac agacaaagga actggaaaca aagtatggat 1920 ggacccacta actaaagaga acaacatata taaagaagga cagagcaaat gcctactgac 1980 tgacatgccc ctatggactt tactttttgg atatacagac tggtgtaaaa aggacactaa 2040 taactgggac ttaccactaa actacagact agtactaata tgcccttata cctttccaaa 2100 attgtacaat gaaaaagtaa aagactatgg gtacatcccg tactcctaca aattcggagc 2160 gggtcagatg ccagacggca gcaactacat accctttcag tttagagcaa agtggtaccc 2220 cacagtacta caccagcaac aggtaatgga ggacataagc aggagcgggc cctttgcacc 2280 taaggtagaa aaaccaagca ctcagctggt aatgaagtac tgttttaact ttaactgggg 2340 cggtaaccct atcattgaac agattgttaa agaccccagc ttccagccca cctatgaaat 2400 acccggtacc ggtaacatcc ctagaagaat acaagtcatc gacccgcggg tcctgggacc 2460 gcactactcg ttccggtcat gggacatgcg cagacacaca tttagcagag caagtattaa 2520 gagagtgtca gaacaacaag aaacttctga ccttgtattc tcaggcccaa aaaagcctcg 2580 ggtcgacatc ccaaaacaag aaacccaaga agaaagctca cattcactcc aaagagaatc 2640 gagaccgtgg gagaccgagg aagaaagcga gacagaagcc ctctcgcaag agagccaaga 2700 ggtccccttc caacagcagt tgcagcagca gtaccaagag cagctcaagc tcagacaggg 2760 aatcaaagtc ctcttcgagc agctcataag gacccaacaa ggggtccatg taaacccatg 2820 cctacggtag gtcccaggca gtggctgttt ccagagagaa agccagcccc agctcctagc 2880 agtggagact gggccatgga gtttctcgca gcaaaaatat ttgataggcc agttagaagc 2940 aaccttaaag atacccctta ctacccatat gttaaaaacc aatacaatgt ctactttgac 3000 cttaaatttg aataaacagc agcttcaaac ttgcaaggcc gtgggagttt cactggtcgg 3060 tgtctacctc taaaggtcac taagcactcc gagcgtaagc gaggagtgcg accctccccc 3120 ctggaacaac ttcttcggag tccggcgcta cgccttcggc tgcgccggac acctcagacc 3180 ccccctccac ccgaaacgct tgcgcgtttc ggaccttcgg cgtcgggggg gtcgggagct 3240 ttattaaacg gactccgaag tgctcttgga cactgagggg gtgaacagca acgaaagtga 3300 gtggggccag acttcgccat aaggccttta tcttcttgcc atttgtcagt gtccggggtc 3360 gccataggct tcgggctcgt ttttaggcct tccggactac aaaaatcgcc attttggtga 3420 cgtcacggcc gccatcttaa gtagttgagg cggacggtgg cgtgagttca aaggtcacca 3480 tcagccacac ctactcaaaa tggtggacaa tttcttccgg gtcaaaggtt acagccgcca 3540 tgttaaaaca cgtgacgtat gacgtcacgg ccgccatttt gtgacacaag atggccgact 3600 tccttcctct ttttcaaaaa aaagcggaag tgccgccgcg gcggcggggg gcggcgcgct 3660 gcgcgcgccg cccagtaggg ggagccatgc gccccccccc gcgcatgcgc ggggcccccc 3720 cccgcggggg gctccgcccc ccggcccccc ccg 3753 <210> 17 <211> 127 <212> PRT <213> Torque teno virus <400> 17 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu 115 120 125 <210> 18 <211> 268 <212> PRT <213> Torque teno virus <400> 18 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Leu 115 120 125 Leu Lys Thr Pro Ala Ser Ser Pro Pro Met Lys Tyr Pro Val Pro Val 130 135 140 Thr Ser Leu Glu Glu Tyr Lys Ser Ser Thr Arg Gly Ser Trp Asp Arg 145 150 155 160 Thr Thr Arg Ser Gly His Gly Thr Cys Ala Asp Thr His Leu Ala Glu 165 170 175 Gln Val Leu Arg Glu Cys Gln Asn Asn Lys Lys Leu Leu Thr Leu Tyr 180 185 190 Ser Gln Ala Gln Lys Ser Leu Gly Ser Thr Ser Gln Asn Lys Lys Pro 195 200 205 Lys Lys Lys Ala His Ile His Ser Lys Glu Asn Arg Asp Arg Gly Arg 210 215 220 Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg Lys Arg Ala Lys Arg 225 230 235 240 Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr Lys Ser Ser Ser Ser 245 250 255 Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser Ser 260 265 <210> 19 <211> 276 <212> PRT <213> Torque teno virus <400> 19 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys 20 25 30 Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His 35 40 45 Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro 50 55 60 His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln 65 70 75 80 Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp 85 90 95 Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala 100 105 110 Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Pro 115 120 125 Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro Arg Arg Lys 130 135 140 Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp Arg Gly Arg 145 150 155 160 Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly Pro Leu Pro 165 170 175 Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala Gln Thr Gly 180 185 190 Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr Arg Gly Pro 195 200 205 Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu Phe Pro Glu 210 215 220 Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala Met Glu Phe 225 230 235 240 Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn Leu Lys Asp 245 250 255 Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val Tyr Phe Asp 260 265 270 Leu Lys Phe Glu 275 <210> 20 <211> 167 <212> PRT <213> Torque teno virus <400> 20 Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg 1 5 10 15 Met Trp Pro Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro 20 25 30 Arg Arg Lys Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp 35 40 45 Arg Gly Arg Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly 50 55 60 Pro Leu Pro Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala 65 70 75 80 Gln Thr Gly Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr 85 90 95 Arg Gly Pro Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu 100 105 110 Phe Pro Glu Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala 115 120 125 Met Glu Phe Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn 130 135 140 Leu Lys Asp Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val 145 150 155 160 Tyr Phe Asp Leu Lys Phe Glu 165 <210> 21 <211> 743 <212> PRT <213> Torque teno virus <400> 21 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val 65 70 75 80 Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly 85 90 95 Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile 100 105 110 Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu 115 120 125 Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg 130 135 140 Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys 145 150 155 160 Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg 165 170 175 Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly 180 185 190 Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr 195 200 205 Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr 210 215 220 Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr 225 230 235 240 Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys 245 250 255 Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 260 265 270 Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser 275 280 285 Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly 290 295 300 Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly 305 310 315 320 Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys 325 330 335 Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp 340 345 350 Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile 355 360 365 Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu 370 375 380 Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu 385 390 395 400 Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro 405 410 415 Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp 420 425 430 Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn 435 440 445 Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro 450 455 460 Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr 465 470 475 480 Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro 485 490 495 Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr 500 505 510 Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser 515 520 525 Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu 530 535 540 His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala 545 550 555 560 Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe 565 570 575 Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp 580 585 590 Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro 595 600 605 Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser 610 615 620 Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile 625 630 635 640 Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly 645 650 655 Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu 660 665 670 Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu 675 680 685 Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe 690 695 700 Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln 705 710 715 720 Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val 725 730 735 His Val Asn Pro Cys Leu Arg 740 <210> 22 <211> 194 <212> PRT <213> Torque teno virus <400> 22 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Ile Val Lys Asp Pro Ser Phe Gln Pro 35 40 45 Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile Gln Val 50 55 60 Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser Trp Asp 65 70 75 80 Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val Ser Glu 85 90 95 Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys Pro Arg 100 105 110 Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His Ser Leu 115 120 125 Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu Thr Glu 130 135 140 Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln Leu Gln 145 150 155 160 Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys Val Leu 165 170 175 Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn Pro Cys 180 185 190 Leu Arg <210> 23 <211> 113 <212> PRT <213> Torque teno virus <400> 23 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Ala Gln Lys Ser Leu Gly Ser Thr Ser 35 40 45 Gln Asn Lys Lys Pro Lys Lys Lys Ala His Ile His Ser Lys Glu Asn 50 55 60 Arg Asp Arg Gly Arg Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg 65 70 75 80 Lys Arg Ala Lys Arg Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr 85 90 95 Lys Ser Ser Ser Ser Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser 100 105 110 Ser <210> 24 <211> 3878 <212> DNA <213> Torque teno virus <400> 24 aaatacgtca ctaaccacgt gactcccaca ggccaaccac agtctatgtc gtgcacttcc 60 tgggcatggt ctacgtgata atataaagcg gtgcacttcc gaatggctga gttttccacg 120 cccgtccgca gcgagatcgc gacgtaggag cgatcgagcg tcccgagggc gggtgccgga 180 ggtgagttta cacaccgcag tcaaggggca attcgggctc gggaggccgg gccatgggca 240 aggctcttaa aaagctatgt ttctcggtaa aatctacagg aagaaaagga aactgcttct 300 gcaggctgtg cgtgctccgc agacgccatc ttccatgagc cgctgctggt gtccccctcg 360 gggtgatgtc tcctcccgcg agtctcgatg gtacgaggcg gttcgaggaa gccacgatgc 420 tttttgtggc tgtagtgatc ctattcttca tctttctcgt ctggctgcac gttttaacca 480 tcagggacct ccgacgcccc ccacggacga ccgtgcgccg cagaataccc cagtgagacg 540 cctgctgcct ctccccagct accccggcga gggtccccag gctagatggc ctggtgggga 600 tggaggcgcc gctggtggcg accgaagaga aggtggagat ggcggcgcgc gcgccgccga 660 agacgagtac cagcccgaag acctagacga gcttttcggc gctatcgaac aagaacagta 720 aggaggaggc gaagggggag gcggaggggc taccggcgcc gttacagact gagacgctat 780 gccagacgca ggttccgacg caaaaagata gtactgactc agtggaaccc ccagactacc 840 agaaaatgta taataagggg catgatgcca gtactgtggg ccggcatggg tacggggggc 900 agaaactatg cagtgaggtc agatgactat gtggtgaaca aagggttcgg gggctccttc 960 gccacggaga ccttctccct gaaggttctc tatgaccagt ttcaaagggg cttcaacagg 1020 tggtcccaca ctaacgagga cctagacctg gcccgctaca ggggctgcag gtggactttt 1080 tacagacata aagacacaga ctttatagtg tactttacaa acaatcctcc catgaagacc 1140 aaccagttct ccgcgcccct gacgaccccc ggcatgctca tgcgcagtaa atacaaagtc 1200 ctcattccca gcttccagac cagacccaag ggtcgcaaaa cagtaaccgt taaaataaga 1260 ccccccaaac tatttcaaga caagtggtac acccagcagg acctgtgttc agttcctctt 1320 gtccaactga acgtgaccgc agctgatttc acacatccgt tcggctcacc actaactgaa 1380 actccttgcg tagagttcca ggtgctgggt gacttgtaca atacatgtct caatatcgac 1440 cttccgcaat ttagtgaatt aggagaaata actagtgcct actcaaaacc aaactcaaat 1500 aacctaaaag aattatacaa agaattgttc acaaaagcca catcaggaca ctactggcag 1560 acattcataa ccaacagcat ggtcagagca cacatagatg cagacaaagc taaagaagca 1620 caaagagcat ccaccacacc ctcatacaac aatgacccct tccccacaat acctgttaaa 1680 tcagagtttg cacagtggaa aaagaaattc acagacacta gagacagccc ctttcttttt 1740 gccacttacc atcccgaagc tataaaagac acaattatga aaatgagaga gaacaacttt 1800 aagctagaga caggacccaa tgacaagtat ggagactaca cagcacagta ccaaggaaac 1860 acacacatgc tagactacta ccttggcttt tacagcccca tattcctctc agatggaagg 1920 tctaacgtag aattcttcac tgcctacaga gacatagtat acaatccctt cttagacaag 1980 gcccagggca acatggtgtg gtttcagtac cacacaaaga cagacaacaa gtttaaaaaa 2040 ccagagtgcc actgggaaat caaagacatg cccctgtggg ccctcctaaa cggatatgta 2100 gactacttag agactcaaat acagtatggt gacctcagta aagaagggaa agtcctcatc 2160 aggtgtccct acaccaagcc agcactagta gaccccagag acgacactgc aggatatgta 2220 gtctacaaca gaaactttgg cagaggcaag tggatagacg gagggggcta catccccctg 2280 cacgagagga caaaatggta cgtgatgctc agataccaga cggacgtctt ccatgacata 2340 gtgacctgtg ggccctggca gtacagagac gacaacaaaa acagccagct agtggccaaa 2400 taccgcttca gctttatatg gggaggtaac actgtccact ctcaggtcat cagaaacccg 2460 tgcaaagaca accaagtatc cggtccccgt cgacagccta gggatataca agtcgttgac 2520 ccgcaacgca tcacgccgcc gtgggtcctc cacagcttcg accagcgaag aggcctcttt 2580 actgaaacag ctctcaggcg cctgctccag gaaccactac ctggcgagta tgctgttagc 2640 accctcagga cacccctcct ctttctaccc tcagaatacc agcgagaaga cggcgctgca 2700 gaaagcgcct caggttcacc ggccaaaaga ccccgtatct ggtcagaaga gagtcagacg 2760 gagacgatct cctcggagga gaacccggcg gagacgacga gggagctcct ccagcgaaag 2820 ctccgagagc agcgagcact ccagttccaa ctccagcact tcgcggtcca actcgccaag 2880 acccaggcga atctccacgt aaaccccctg ttatctttcc cgcaatgaat aaggtctttc 2940 tgtttccccc agagggtccc aagcccatcc tgggcaaaga ggcctggcag gacgagtacg 3000 agacctgcag ggtctggaac agacctgcca gaacccacca cacagacacc cccttctatc 3060 cctgggcccc ccacaagttc catgtaagct tcaaacttgg cttccaataa aattactagg 3120 ccgtggaact ctcactggtc ggtgtctacc tcttaaggtc actaagcact ccgagcgtca 3180 gcgaggagtg cgaccctcta ccctggtgca acgccctcgg cggccgcgcg ctacgccttc 3240 ggctgcgcgc ggcacctcgg acccccgctc gtgctgacgc gctcgcgcgc gtcagaccac 3300 ttcgggctcg cgggggtcgg gaattttgct aaacagactc cgagttgcca ttggacactg 3360 tagctgtgaa tcagtaacga aagtgagtgg ggccagactt cgccataggg cctttatctt 3420 cttgccattg gtccgtgtag ggggtcgcca taggcttcga cctccctttt aggccttccg 3480 gactacaaaa atggcggatt cagtgacgtc acggccgcca ttttaagtag gtgccgtcca 3540 ggactgcagt tccgggtcag agtgcatcct cggcggaacc tgcacaaaat ggcggtcaat 3600 atcttccggg tcaaaggtca cacctacgtc ataagtcacg tgactgggtc ctgctacgtc 3660 atatgcggaa gtaggccccg ccacgtgact cgtcacgtgg gcgctgcgtc acggcggcca 3720 ttttgtatca caaaatggcg gacttccttc ctctttttta aaaataacgg cccagcggcg 3780 gcgcgcgcgc ttcgcgcgcg cgccgggggg ctccgccccc ccccgcgcat gcgcggggcc 3840 cccccccgcg gggggctccg ccccccggtc cccccccg 3878 <210> 25 <211> 128 <212> PRT <213> Torque teno virus <400> 25 Met Ser Arg Cys Trp Cys Pro Pro Arg Gly Asp Val Ser Ser Arg Glu 1 5 10 15 Ser Arg Trp Tyr Glu Ala Val Arg Gly Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Ser Asp Pro Ile Leu His Leu Ser Arg Leu Ala Ala Arg Phe Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Asp Arg Ala Pro Gln Asn 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Gly Ala Ala Gly Gly Asp 85 90 95 Arg Arg Glu Gly Gly Asp Gly Gly Ala Arg Ala Ala Glu Asp Glu Tyr 100 105 110 Gln Pro Glu Asp Leu Asp Glu Leu Phe Gly Ala Ile Glu Gln Glu Gln 115 120 125 <210> 26 <211> 279 <212> PRT <213> Torque teno virus <400> 26 Met Ser Arg Cys Trp Cys Pro Pro Arg Gly Asp Val Ser Ser Arg Glu 1 5 10 15 Ser Arg Trp Tyr Glu Ala Val Arg Gly Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Ser Asp Pro Ile Leu His Leu Ser Arg Leu Ala Ala Arg Phe Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Asp Arg Ala Pro Gln Asn 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Gly Ala Ala Gly Gly Asp 85 90 95 Arg Arg Glu Gly Gly Asp Gly Gly Ala Arg Ala Ala Glu Asp Glu Tyr 100 105 110 Gln Pro Glu Asp Leu Asp Glu Leu Phe Gly Ala Ile Glu Gln Glu Gln 115 120 125 Ser Ser Glu Thr Arg Ala Lys Thr Thr Lys Tyr Pro Val Pro Val Asp 130 135 140 Ser Leu Gly Ile Tyr Lys Ser Leu Thr Arg Asn Ala Ser Arg Arg Arg 145 150 155 160 Gly Ser Ser Thr Ala Ser Thr Ser Glu Glu Ala Ser Leu Leu Lys Gln 165 170 175 Leu Ser Gly Ala Cys Ser Arg Asn His Tyr Leu Ala Ser Met Leu Leu 180 185 190 Ala Pro Ser Gly His Pro Ser Ser Phe Tyr Pro Gln Asn Thr Ser Glu 195 200 205 Lys Thr Ala Leu Gln Lys Ala Pro Gln Val His Arg Pro Lys Asp Pro 210 215 220 Val Ser Gly Gln Lys Arg Val Arg Arg Arg Arg Ser Pro Arg Arg Arg 225 230 235 240 Thr Arg Arg Arg Arg Arg Gly Ser Ser Ser Ser Glu Ser Ser Glu Ser 245 250 255 Ser Glu His Ser Ser Ser Asn Ser Ser Thr Ser Arg Ser Asn Ser Pro 260 265 270 Arg Pro Arg Arg Ile Ser Thr 275 <210> 27 <211> 272 <212> PRT <213> Torque teno virus <400> 27 Met Ser Arg Cys Trp Cys Pro Pro Arg Gly Asp Val Ser Ser Arg Glu 1 5 10 15 Ser Arg Trp Tyr Glu Ala Val Arg Gly Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Ser Asp Pro Ile Leu His Leu Ser Arg Leu Ala Ala Arg Phe Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Asp Arg Ala Pro Gln Asn 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Gly Ala Ala Gly Gly Asp 85 90 95 Arg Arg Glu Gly Gly Asp Gly Gly Ala Arg Ala Ala Glu Asp Glu Tyr 100 105 110 Gln Pro Glu Asp Leu Asp Glu Leu Phe Gly Ala Ile Glu Gln Glu Gln 115 120 125 Ile Pro Ala Arg Arg Arg Arg Cys Arg Lys Arg Leu Arg Phe Thr Gly 130 135 140 Gln Lys Thr Pro Tyr Leu Val Arg Arg Glu Ser Asp Gly Asp Asp Leu 145 150 155 160 Leu Gly Gly Glu Pro Gly Gly Asp Asp Glu Gly Ala Pro Pro Ala Lys 165 170 175 Ala Pro Arg Ala Ala Ser Thr Pro Val Pro Thr Pro Ala Leu Arg Gly 180 185 190 Pro Thr Arg Gln Asp Pro Gly Glu Ser Pro Arg Lys Pro Pro Val Ile 195 200 205 Phe Pro Ala Met Asn Lys Val Phe Leu Phe Pro Pro Glu Gly Pro Lys 210 215 220 Pro Ile Leu Gly Lys Glu Ala Trp Gln Asp Glu Tyr Glu Thr Cys Arg 225 230 235 240 Val Trp Asn Arg Pro Ala Arg Thr His His Thr Asp Thr Pro Phe Tyr 245 250 255 Pro Trp Ala Pro His Lys Phe His Val Ser Phe Lys Leu Gly Phe Gln 260 265 270 <210> 28 <211> 780 <212> PRT <213> Torque teno virus <400> 28 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Lys Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Ala Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Phe Arg Arg Tyr Arg Thr Arg Thr Val Arg Arg Arg 35 40 45 Arg Arg Gly Arg Arg Arg Gly Tyr Arg Arg Arg Tyr Arg Leu Arg Arg 50 55 60 Tyr Ala Arg Arg Arg Phe Arg Arg Lys Lys Ile Val Leu Thr Gln Trp 65 70 75 80 Asn Pro Gln Thr Thr Arg Lys Cys Ile Ile Arg Gly Met Met Pro Val 85 90 95 Leu Trp Ala Gly Met Gly Thr Gly Gly Arg Asn Tyr Ala Val Arg Ser 100 105 110 Asp Asp Tyr Val Val Asn Lys Gly Phe Gly Gly Ser Phe Ala Thr Glu 115 120 125 Thr Phe Ser Leu Lys Val Leu Tyr Asp Gln Phe Gln Arg Gly Phe Asn 130 135 140 Arg Trp Ser His Thr Asn Glu Asp Leu Asp Leu Ala Arg Tyr Arg Gly 145 150 155 160 Cys Arg Trp Thr Phe Tyr Arg His Lys Asp Thr Asp Phe Ile Val Tyr 165 170 175 Phe Thr Asn Asn Pro Pro Met Lys Thr Asn Gln Phe Ser Ala Pro Leu 180 185 190 Thr Thr Pro Gly Met Leu Met Arg Ser Lys Tyr Lys Val Leu Ile Pro 195 200 205 Ser Phe Gln Thr Arg Pro Lys Gly Arg Lys Thr Val Thr Val Lys Ile 210 215 220 Arg Pro Pro Lys Leu Phe Gln Asp Lys Trp Tyr Thr Gln Gln Asp Leu 225 230 235 240 Cys Ser Val Pro Leu Val Gln Leu Asn Val Thr Ala Ala Asp Phe Thr 245 250 255 His Pro Phe Gly Ser Pro Leu Thr Glu Thr Pro Cys Val Glu Phe Gln 260 265 270 Val Leu Gly Asp Leu Tyr Asn Thr Cys Leu Asn Ile Asp Leu Pro Gln 275 280 285 Phe Ser Glu Leu Gly Glu Ile Thr Ser Ala Tyr Ser Lys Pro Asn Ser 290 295 300 Asn Asn Leu Lys Glu Leu Tyr Lys Glu Leu Phe Thr Lys Ala Thr Ser 305 310 315 320 Gly His Tyr Trp Gln Thr Phe Ile Thr Asn Ser Met Val Arg Ala His 325 330 335 Ile Asp Ala Asp Lys Ala Lys Glu Ala Gln Arg Ala Ser Thr Thr Pro 340 345 350 Ser Tyr Asn Asn Asp Pro Phe Pro Thr Ile Pro Val Lys Ser Glu Phe 355 360 365 Ala Gln Trp Lys Lys Lys Phe Thr Asp Thr Arg Asp Ser Pro Phe Leu 370 375 380 Phe Ala Thr Tyr His Pro Glu Ala Ile Lys Asp Thr Ile Met Lys Met 385 390 395 400 Arg Glu Asn Asn Phe Lys Leu Glu Thr Gly Pro Asn Asp Lys Tyr Gly 405 410 415 Asp Tyr Thr Ala Gln Tyr Gln Gly Asn Thr His Met Leu Asp Tyr Tyr 420 425 430 Leu Gly Phe Tyr Ser Pro Ile Phe Leu Ser Asp Gly Arg Ser Asn Val 435 440 445 Glu Phe Phe Thr Ala Tyr Arg Asp Ile Val Tyr Asn Pro Phe Leu Asp 450 455 460 Lys Ala Gln Gly Asn Met Val Trp Phe Gln Tyr His Thr Lys Thr Asp 465 470 475 480 Asn Lys Phe Lys Lys Pro Glu Cys His Trp Glu Ile Lys Asp Met Pro 485 490 495 Leu Trp Ala Leu Leu Asn Gly Tyr Val Asp Tyr Leu Glu Thr Gln Ile 500 505 510 Gln Tyr Gly Asp Leu Ser Lys Glu Gly Lys Val Leu Ile Arg Cys Pro 515 520 525 Tyr Thr Lys Pro Ala Leu Val Asp Pro Arg Asp Asp Thr Ala Gly Tyr 530 535 540 Val Val Tyr Asn Arg Asn Phe Gly Arg Gly Lys Trp Ile Asp Gly Gly 545 550 555 560 Gly Tyr Ile Pro Leu His Glu Arg Thr Lys Trp Tyr Val Met Leu Arg 565 570 575 Tyr Gln Thr Asp Val Phe His Asp Ile Val Thr Cys Gly Pro Trp Gln 580 585 590 Tyr Arg Asp Asp Asn Lys Asn Ser Gln Leu Val Ala Lys Tyr Arg Phe 595 600 605 Ser Phe Ile Trp Gly Gly Asn Thr Val His Ser Gln Val Ile Arg Asn 610 615 620 Pro Cys Lys Asp Asn Gln Val Ser Gly Pro Arg Arg Gln Pro Arg Asp 625 630 635 640 Ile Gln Val Val Asp Pro Gln Arg Ile Thr Pro Pro Trp Val Leu His 645 650 655 Ser Phe Asp Gln Arg Arg Gly Leu Phe Thr Glu Thr Ala Leu Arg Arg 660 665 670 Leu Leu Gln Glu Pro Leu Pro Gly Glu Tyr Ala Val Ser Thr Leu Arg 675 680 685 Thr Pro Leu Leu Phe Leu Pro Ser Glu Tyr Gln Arg Glu Asp Gly Ala 690 695 700 Ala Glu Ser Ala Ser Gly Ser Pro Ala Lys Arg Pro Arg Ile Trp Ser 705 710 715 720 Glu Glu Ser Gln Thr Glu Thr Ile Ser Ser Glu Glu Asn Pro Ala Glu 725 730 735 Thr Thr Arg Glu Leu Leu Gln Arg Lys Leu Arg Glu Gln Arg Ala Leu 740 745 750 Gln Phe Gln Leu Gln His Phe Ala Val Gln Leu Ala Lys Thr Gln Ala 755 760 765 Asn Leu His Val Asn Pro Leu Leu Ser Phe Pro Gln 770 775 780 <210> 29 <211> 204 <212> PRT <213> Torque teno virus <400> 29 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Lys Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Ala Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Phe Arg Arg Tyr Arg Thr Arg Thr Val Ile Arg Asn 35 40 45 Pro Cys Lys Asp Asn Gln Val Ser Gly Pro Arg Arg Gln Pro Arg Asp 50 55 60 Ile Gln Val Val Asp Pro Gln Arg Ile Thr Pro Pro Trp Val Leu His 65 70 75 80 Ser Phe Asp Gln Arg Arg Gly Leu Phe Thr Glu Thr Ala Leu Arg Arg 85 90 95 Leu Leu Gln Glu Pro Leu Pro Gly Glu Tyr Ala Val Ser Thr Leu Arg 100 105 110 Thr Pro Leu Leu Phe Leu Pro Ser Glu Tyr Gln Arg Glu Asp Gly Ala 115 120 125 Ala Glu Ser Ala Ser Gly Ser Pro Ala Lys Arg Pro Arg Ile Trp Ser 130 135 140 Glu Glu Ser Gln Thr Glu Thr Ile Ser Ser Glu Glu Asn Pro Ala Glu 145 150 155 160 Thr Thr Arg Glu Leu Leu Gln Arg Lys Leu Arg Glu Gln Arg Ala Leu 165 170 175 Gln Phe Gln Leu Gln His Phe Ala Val Gln Leu Ala Lys Thr Gln Ala 180 185 190 Asn Leu His Val Asn Pro Leu Leu Ser Phe Pro Gln 195 200 <210> 30 <211> 119 <212> PRT <213> Torque teno virus <400> 30 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Lys Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Ala Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Phe Arg Arg Tyr Arg Thr Arg Thr Asn Thr Ser Glu 35 40 45 Lys Thr Ala Leu Gln Lys Ala Pro Gln Val His Arg Pro Lys Asp Pro 50 55 60 Val Ser Gly Gln Lys Arg Val Arg Arg Arg Arg Ser Pro Arg Arg Arg 65 70 75 80 Thr Arg Arg Arg Arg Arg Gly Ser Ser Ser Ser Glu Ser Ser Glu Ser 85 90 95 Ser Glu His Ser Ser Ser Asn Ser Ser Thr Ser Arg Ser Asn Ser Pro 100 105 110 Arg Pro Arg Arg Ile Ser Thr 115 <210> 31 <211> 3818 <212> DNA <213> Torque teno virus <400> 31 aagtccgcca ctaaccacgt gactcccgca ggccaaccca gtactatgtc gtccacttcc 60 tgggacgagt ctacgtcctg atataagtaa gtgcacttcc gaatggctga gttttccacg 120 cccgtccgca gcgagaacgc cacggagggg agtccgcgcg tcccgagggc gggtgccgga 180 ggtgagttta cacaccgcag tcaaggggca attcgggctc gggactggcc gggccccggg 240 caaggctctt aaaaaatgca ctttcgcaga gtgcgagcga aaaggaaact gctactgcaa 300 gctgtgcgag ctccaccgaa ggcacctgcc atgagcttca ccacacctac tattaatgcc 360 gggatccgag agcagcaatg gttcgagtcc acccttagat cccaccactc gttctgtggc 420 tgtggtgatc ccgtgcttca ttttactaac cttgctactc gctttaacta tctgcctgct 480 acctcttcgc ctctggaccc tcccggccca gcgccgcgag gccgcccggc gctccgccgc 540 ctcccggcac tcccttcagc ccccgcgacc ccttctagag aactagcatg gcctactggt 600 tcagaaggtg gggctggagg ccgaggcgcc ggtggagaag gtggcgccgc cgtcgaagga 660 gactaccgag aagaagaact agacgagctg ttcgcggcct tggaagaaga cgcaaaccaa 720 gggtaaggag gcgccgcaga actcgcagac gtacctacag acgggggtgg agacgcagga 780 ggtacataag acgggggcga cgcaaaaaga aactcatact gactcagtgg aacccggcaa 840 tagttaagag gtgcaacatt aagggcggac ttccaataat tatatgcgga gagcccaggg 900 cagcctttaa ctatggctac cacatggagg actacactcc tcaacctttc cccttcggag 960 ggggaatgag cacagtgact ttctctctga aagccttgta tgaccagtac ctaaaacacc 1020 aaaacaggtg gactttctca aacgaccagc tagacctcgc cagatacagg ggctgtaaac 1080 taaggttcta cagaagcccc gtctgtgact ttatagtaca ctacaaccta atacctccac 1140 taaaaatgaa ccagttcaca agtcccaaca cgcacccggg actactcatg ctcagcaaac 1200 acaagataat aattcccagc tttcaaacaa gacctggggg cagacgcttt gttaaaataa 1260 gacttaatcc ccccaaacta tttgaagaca agtggtacac tcagcaagac ctgtgcaagg 1320 ttccgctcgt tagtattaca gcaactgcgg ctgacttgcg gtatccgttc tgctcaccac 1380 aaacgaacaa cccttgcacc accttccagg tactgcgcaa gaactacaat acagttatag 1440 gaacttccgt aaaagaccaa gagtccacac aagactttga aaattggctt tataaaacag 1500 actcacacta tcaaacattt gccacagagg ctcaactagg cagaattcct gcatttaatc 1560 ctgatggcac taaaaacact aaacagcagt cgtggcaaga taactggagc aaaaaaaatt 1620 caccatggac aggtaactca ggtacatacc cacaaacaac cagtgaaatg tacaaaattc 1680 catatgacag taacttcggc tttcccacat acagagccca aaaagactac attttagaaa 1740 gaagacagtg caactttaac tatgaagtta ataatccagt tagcaaaaaa gtatggccac 1800 aacctagtac aacaacaccc acagtagact actatgaata ccactgtgga tggttcagca 1860 acatattcat aggccccaac agatacaacc tacagtttca aacagcatat gtagacacca 1920 catacaaccc actaatggac aagggcaaag gcaacaaaat atggtttcaa tatctgtcta 1980 aaaagggcac agactacaat gaaaaacaat gctactgcac cctagaagac atgcccctat 2040 gggcaatatg ctttggatac actgactatg tagagactca actaggaccc aatgtggacc 2100 atgaaacagc aggcttaata attatgatct gtccatacac tcaaccacct atgtatgaca 2160 aaaacagacc taactgggga tacgtagtct atgacacaaa ctttggcaat ggaaaaatgc 2220 cctcaggaag tggccaagtc ccagtatact ggcaatgccg atggaggccc atgctgtggt 2280 tccaacaaca agtactcaat gacatctcaa agactggacc gtacgcctac agagacgaat 2340 ataaaaatgt acaactgact ctctactaca actttatttt taactggggg ggcgacatgt 2400 attacccaca ggtcgttaaa aacccctgtg gagactccgg aatcgttccc ggttccggta 2460 gattcactcg agaagtacaa gtcgttagcc cgctttccat gggaccggcc tacatcttcc 2520 actacttcga ctccagacgc gggttcttta gtgaaaaagc tcttaaaaga atgcaacaac 2580 aacaagaatt tgatgaatct tttacattca aacctaagag acccaaactt tctacagcag 2640 ccgcagaaat cctccagctc gaagaagact cgacttcagg ggaaggaaaa tcgccactac 2700 agcaagaaga gaaagaagtc gaagtcctcc aaacgccgac agtacagctc cagctccagc 2760 gaaacatcca ggagcagctc gcaatcaagc agcagctcca attcctcttg ctccaactcc 2820 tcaaaaccca atccaatttg catttaaacc cacaattttt aagcccttca taaaatatga 2880 catgtttggg gacccccttc ctcacccccc aacagccgaa gagtgggaaa cagagtacca 2940 gtgctgtaag gcctttaaca gaccacctag aaccaaccta aaagacaccc ccttctaccc 3000 ctgggtacct aaacctaaac ctcaattccg tgtatctttt aaacttggtt ttcaataaac 3060 aaggccgtgg gagtttcact tgtcggtgtc aacctcttaa ggtcactaag cactccgagc 3120 gtaagcgagg agtgcgaccc tcccccctgg ggcaactccc tcgaagtccg gcgctacgcg 3180 cttcgcgctg cgccggacat ctcggacccc ccctccaccc gaaacgcttg cgcgtttcgg 3240 accttcggcg tcgggggggt cgggggcttt actaaacaga ctccgaggtg ccattggaca 3300 ctgaggggat gaacagcaac gaaagtgagt ggggccagac ttcgccataa ggcctttatc 3360 ttcttgccat ttgtcagtat agagggtcgc cataggcttc ggcctccatt ttaacctcta 3420 aaaactacca aaatggccgt tccagtgacg tcacagccgc cattttaagt agctgacgtc 3480 aaggattgac gtgaaggtta aaggtcatcc tcggcggaag ctacacaaaa tggtggacaa 3540 catcttccgg gtcaaaggtc gtgcacacgt cataagtcac gtggtgggga cccgctgtaa 3600 cccggaagta ggccccgtca cgtgatttgt cacgtgtgta cacgtcacaa ccgccatttt 3660 gttttacaaa atggctgact tccttcctct tttttaaaaa aaacggccgt gcggcggcgc 3720 gcgcgcttcg cgcgcgcgcc gggggctgcc gccccccccc gcgcatgcgc gcggggcccc 3780 cccccgcggg gggctccgcc ccccggcccc cccccccg 3818 <210> 32 <211> 131 <212> PRT <213> Torque teno virus <400> 32 Met Ser Phe Thr Thr Pro Thr Ile Asn Ala Gly Ile Arg Glu Gln Gln 1 5 10 15 Trp Phe Glu Ser Thr Leu Arg Ser His His Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Val Leu His Phe Thr Asn Leu Ala Thr Arg Phe Asn Tyr Leu 35 40 45 Pro Ala Thr Ser Ser Pro Leu Asp Pro Pro Gly Pro Ala Pro Arg Gly 50 55 60 Arg Pro Ala Leu Arg Arg Leu Pro Ala Leu Pro Ser Ala Pro Ala Thr 65 70 75 80 Pro Ser Arg Glu Leu Ala Trp Pro Thr Gly Ser Glu Gly Gly Ala Gly 85 90 95 Gly Arg Gly Ala Gly Gly Glu Gly Gly Ala Ala Val Glu Gly Asp Tyr 100 105 110 Arg Glu Glu Glu Leu Asp Glu Leu Phe Ala Ala Leu Glu Glu Asp Ala 115 120 125 Asn Gln Gly 130 <210> 33 <211> 275 <212> PRT <213> Torque teno virus <400> 33 Met Ser Phe Thr Thr Pro Thr Ile Asn Ala Gly Ile Arg Glu Gln Gln 1 5 10 15 Trp Phe Glu Ser Thr Leu Arg Ser His His Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Val Leu His Phe Thr Asn Leu Ala Thr Arg Phe Asn Tyr Leu 35 40 45 Pro Ala Thr Ser Ser Pro Leu Asp Pro Pro Gly Pro Ala Pro Arg Gly 50 55 60 Arg Pro Ala Leu Arg Arg Leu Pro Ala Leu Pro Ser Ala Pro Ala Thr 65 70 75 80 Pro Ser Arg Glu Leu Ala Trp Pro Thr Gly Ser Glu Gly Gly Ala Gly 85 90 95 Gly Arg Gly Ala Gly Gly Glu Gly Gly Ala Ala Val Glu Gly Asp Tyr 100 105 110 Arg Glu Glu Glu Leu Asp Glu Leu Phe Ala Ala Leu Glu Glu Asp Ala 115 120 125 Asn Gln Gly Ser Leu Lys Thr Pro Val Glu Thr Pro Glu Ser Phe Pro 130 135 140 Val Pro Val Asp Ser Leu Glu Lys Tyr Lys Ser Leu Ala Arg Phe Pro 145 150 155 160 Trp Asp Arg Pro Thr Ser Ser Thr Thr Ser Thr Pro Asp Ala Gly Ser 165 170 175 Leu Val Lys Lys Leu Leu Lys Glu Cys Asn Asn Asn Lys Asn Leu Met 180 185 190 Asn Leu Leu His Ser Asn Leu Arg Asp Pro Asn Phe Leu Gln Gln Pro 195 200 205 Gln Lys Ser Ser Ser Ser Lys Lys Thr Arg Leu Gln Gly Lys Glu Asn 210 215 220 Arg His Tyr Ser Lys Lys Arg Lys Lys Ser Lys Ser Ser Lys Arg Arg 225 230 235 240 Gln Tyr Ser Ser Ser Ser Ser Glu Thr Ser Arg Ser Ser Ser Gln Ser 245 250 255 Ser Ser Ser Ser Asn Ser Ser Cys Ser Asn Ser Ser Lys Pro Asn Pro 260 265 270 Ile Cys Ile 275 <210> 34 <211> 270 <212> PRT <213> Torque teno virus <400> 34 Met Ser Phe Thr Thr Pro Thr Ile Asn Ala Gly Ile Arg Glu Gln Gln 1 5 10 15 Trp Phe Glu Ser Thr Leu Arg Ser His His Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Val Leu His Phe Thr Asn Leu Ala Thr Arg Phe Asn Tyr Leu 35 40 45 Pro Ala Thr Ser Ser Pro Leu Asp Pro Pro Gly Pro Ala Pro Arg Gly 50 55 60 Arg Pro Ala Leu Arg Arg Leu Pro Ala Leu Pro Ser Ala Pro Ala Thr 65 70 75 80 Pro Ser Arg Glu Leu Ala Trp Pro Thr Gly Ser Glu Gly Gly Ala Gly 85 90 95 Gly Arg Gly Ala Gly Gly Glu Gly Gly Ala Ala Val Glu Gly Asp Tyr 100 105 110 Arg Glu Glu Glu Leu Asp Glu Leu Phe Ala Ala Leu Glu Glu Asp Ala 115 120 125 Asn Gln Gly Ser Arg Arg Asn Pro Pro Ala Arg Arg Arg Leu Asp Phe 130 135 140 Arg Gly Arg Lys Ile Ala Thr Thr Ala Arg Arg Glu Arg Ser Arg Ser 145 150 155 160 Pro Pro Asn Ala Asp Ser Thr Ala Pro Ala Pro Ala Lys His Pro Gly 165 170 175 Ala Ala Arg Asn Gln Ala Ala Ala Pro Ile Pro Leu Ala Pro Thr Pro 180 185 190 Gln Asn Pro Ile Gln Phe Ala Phe Lys Pro Thr Ile Phe Lys Pro Phe 195 200 205 Ile Lys Tyr Asp Met Phe Gly Asp Pro Leu Pro His Pro Pro Thr Ala 210 215 220 Glu Glu Trp Glu Thr Glu Tyr Gln Cys Cys Lys Ala Phe Asn Arg Pro 225 230 235 240 Pro Arg Thr Asn Leu Lys Asp Thr Pro Phe Tyr Pro Trp Val Pro Lys 245 250 255 Pro Lys Pro Gln Phe Arg Val Ser Phe Lys Leu Gly Phe Gln 260 265 270 <210> 35 <211> 156 <212> PRT <213> Torque teno virus <400> 35 Met Ser Phe Thr Thr Pro Thr Ile Asn Ala Gly Ile Arg Glu Gln Gln 1 5 10 15 Cys Ser Arg Arg Asn Pro Pro Ala Arg Arg Arg Leu Asp Phe Arg Gly 20 25 30 Arg Lys Ile Ala Thr Thr Ala Arg Arg Glu Arg Ser Arg Ser Pro Pro 35 40 45 Asn Ala Asp Ser Thr Ala Pro Ala Pro Ala Lys His Pro Gly Ala Ala 50 55 60 Arg Asn Gln Ala Ala Ala Pro Ile Pro Leu Ala Pro Thr Pro Gln Asn 65 70 75 80 Pro Ile Gln Phe Ala Phe Lys Pro Thr Ile Phe Lys Pro Phe Ile Lys 85 90 95 Tyr Asp Met Phe Gly Asp Pro Leu Pro His Pro Pro Thr Ala Glu Glu 100 105 110 Trp Glu Thr Glu Tyr Gln Cys Cys Lys Ala Phe Asn Arg Pro Pro Arg 115 120 125 Thr Asn Leu Lys Asp Thr Pro Phe Tyr Pro Trp Val Pro Lys Pro Lys 130 135 140 Pro Gln Phe Arg Val Ser Phe Lys Leu Gly Phe Gln 145 150 155 <210> 36 <211> 761 <212> PRT <213> Torque teno virus <400> 36 Met Ala Tyr Trp Phe Arg Arg Trp Gly Trp Arg Pro Arg Arg Arg Trp 1 5 10 15 Arg Arg Trp Arg Arg Arg Arg Arg Arg Leu Pro Arg Arg Arg Thr Arg 20 25 30 Arg Ala Val Arg Gly Leu Gly Arg Arg Arg Lys Pro Arg Val Arg Arg 35 40 45 Arg Arg Arg Thr Arg Arg Arg Thr Tyr Arg Arg Gly Trp Arg Arg Arg 50 55 60 Arg Tyr Ile Arg Arg Gly Arg Arg Lys Lys Lys Leu Ile Leu Thr Gln 65 70 75 80 Trp Asn Pro Ala Ile Val Lys Arg Cys Asn Ile Lys Gly Gly Leu Pro 85 90 95 Ile Ile Ile Cys Gly Glu Pro Arg Ala Ala Phe Asn Tyr Gly Tyr His 100 105 110 Met Glu Asp Tyr Thr Pro Gln Pro Phe Pro Phe Gly Gly Gly Met Ser 115 120 125 Thr Val Thr Phe Ser Leu Lys Ala Leu Tyr Asp Gln Tyr Leu Lys His 130 135 140 Gln Asn Arg Trp Thr Phe Ser Asn Asp Gln Leu Asp Leu Ala Arg Tyr 145 150 155 160 Arg Gly Cys Lys Leu Arg Phe Tyr Arg Ser Pro Val Cys Asp Phe Ile 165 170 175 Val His Tyr Asn Leu Ile Pro Pro Leu Lys Met Asn Gln Phe Thr Ser 180 185 190 Pro Asn Thr His Pro Gly Leu Leu Met Leu Ser Lys His Lys Ile Ile 195 200 205 Ile Pro Ser Phe Gln Thr Arg Pro Gly Gly Arg Arg Phe Val Lys Ile 210 215 220 Arg Leu Asn Pro Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Gln 225 230 235 240 Asp Leu Cys Lys Val Pro Leu Val Ser Ile Thr Ala Thr Ala Ala Asp 245 250 255 Leu Arg Tyr Pro Phe Cys Ser Pro Gln Thr Asn Asn Pro Cys Thr Thr 260 265 270 Phe Gln Val Leu Arg Lys Asn Tyr Asn Thr Val Ile Gly Thr Ser Val 275 280 285 Lys Asp Gln Glu Ser Thr Gln Asp Phe Glu Asn Trp Leu Tyr Lys Thr 290 295 300 Asp Ser His Tyr Gln Thr Phe Ala Thr Glu Ala Gln Leu Gly Arg Ile 305 310 315 320 Pro Ala Phe Asn Pro Asp Gly Thr Lys Asn Thr Lys Gln Gln Ser Trp 325 330 335 Gln Asp Asn Trp Ser Lys Lys Asn Ser Pro Trp Thr Gly Asn Ser Gly 340 345 350 Thr Tyr Pro Gln Thr Thr Ser Glu Met Tyr Lys Ile Pro Tyr Asp Ser 355 360 365 Asn Phe Gly Phe Pro Thr Tyr Arg Ala Gln Lys Asp Tyr Ile Leu Glu 370 375 380 Arg Arg Gln Cys Asn Phe Asn Tyr Glu Val Asn Asn Pro Val Ser Lys 385 390 395 400 Lys Val Trp Pro Gln Pro Ser Thr Thr Thr Pro Thr Val Asp Tyr Tyr 405 410 415 Glu Tyr His Cys Gly Trp Phe Ser Asn Ile Phe Ile Gly Pro Asn Arg 420 425 430 Tyr Asn Leu Gln Phe Gln Thr Ala Tyr Val Asp Thr Thr Tyr Asn Pro 435 440 445 Leu Met Asp Lys Gly Lys Gly Asn Lys Ile Trp Phe Gln Tyr Leu Ser 450 455 460 Lys Lys Gly Thr Asp Tyr Asn Glu Lys Gln Cys Tyr Cys Thr Leu Glu 465 470 475 480 Asp Met Pro Leu Trp Ala Ile Cys Phe Gly Tyr Thr Asp Tyr Val Glu 485 490 495 Thr Gln Leu Gly Pro Asn Val Asp His Glu Thr Ala Gly Leu Ile Ile 500 505 510 Met Ile Cys Pro Tyr Thr Gln Pro Pro Met Tyr Asp Lys Asn Arg Pro 515 520 525 Asn Trp Gly Tyr Val Val Tyr Asp Thr Asn Phe Gly Asn Gly Lys Met 530 535 540 Pro Ser Gly Ser Gly Gln Val Pro Val Tyr Trp Gln Cys Arg Trp Arg 545 550 555 560 Pro Met Leu Trp Phe Gln Gln Gln Val Leu Asn Asp Ile Ser Lys Thr 565 570 575 Gly Pro Tyr Ala Tyr Arg Asp Glu Tyr Lys Asn Val Gln Leu Thr Leu 580 585 590 Tyr Tyr Asn Phe Ile Phe Asn Trp Gly Gly Asp Met Tyr Tyr Pro Gln 595 600 605 Val Val Lys Asn Pro Cys Gly Asp Ser Gly Ile Val Pro Gly Ser Gly 610 615 620 Arg Phe Thr Arg Glu Val Gln Val Val Ser Pro Leu Ser Met Gly Pro 625 630 635 640 Ala Tyr Ile Phe His Tyr Phe Asp Ser Arg Arg Gly Phe Phe Ser Glu 645 650 655 Lys Ala Leu Lys Arg Met Gln Gln Gln Gln Glu Phe Asp Glu Ser Phe 660 665 670 Thr Phe Lys Pro Lys Arg Pro Lys Leu Ser Thr Ala Ala Ala Glu Ile 675 680 685 Leu Gln Leu Glu Glu Asp Ser Thr Ser Gly Glu Gly Lys Ser Pro Leu 690 695 700 Gln Gln Glu Glu Lys Glu Val Glu Val Leu Gln Thr Pro Thr Val Gln 705 710 715 720 Leu Gln Leu Gln Arg Asn Ile Gln Glu Gln Leu Ala Ile Lys Gln Gln 725 730 735 Leu Gln Phe Leu Leu Leu Gln Leu Leu Lys Thr Gln Ser Asn Leu His 740 745 750 Leu Asn Pro Gln Phe Leu Ser Pro Ser 755 760 <210> 37 <211> 198 <212> PRT <213> Torque teno virus <400> 37 Met Ala Tyr Trp Phe Arg Arg Trp Gly Trp Arg Pro Arg Arg Arg Trp 1 5 10 15 Arg Arg Trp Arg Arg Arg Arg Arg Arg Leu Pro Arg Arg Arg Thr Arg 20 25 30 Arg Ala Val Arg Gly Leu Gly Arg Arg Arg Lys Pro Arg Val Val Lys 35 40 45 Asn Pro Cys Gly Asp Ser Gly Ile Val Pro Gly Ser Gly Arg Phe Thr 50 55 60 Arg Glu Val Gln Val Val Ser Pro Leu Ser Met Gly Pro Ala Tyr Ile 65 70 75 80 Phe His Tyr Phe Asp Ser Arg Arg Gly Phe Phe Ser Glu Lys Ala Leu 85 90 95 Lys Arg Met Gln Gln Gln Gln Glu Phe Asp Glu Ser Phe Thr Phe Lys 100 105 110 Pro Lys Arg Pro Lys Leu Ser Thr Ala Ala Ala Glu Ile Leu Gln Leu 115 120 125 Glu Glu Asp Ser Thr Ser Gly Glu Gly Lys Ser Pro Leu Gln Gln Glu 130 135 140 Glu Lys Glu Val Glu Val Leu Gln Thr Pro Thr Val Gln Leu Gln Leu 145 150 155 160 Gln Arg Asn Ile Gln Glu Gln Leu Ala Ile Lys Gln Gln Leu Gln Phe 165 170 175 Leu Leu Leu Gln Leu Leu Lys Thr Gln Ser Asn Leu His Leu Asn Pro 180 185 190 Gln Phe Leu Ser Pro Ser 195 <210> 38 <211> 114 <212> PRT <213> Torque teno virus <400> 38 Met Ala Tyr Trp Phe Arg Arg Trp Gly Trp Arg Pro Arg Arg Arg Trp 1 5 10 15 Arg Arg Trp Arg Arg Arg Arg Arg Arg Leu Pro Arg Arg Arg Thr Arg 20 25 30 Arg Ala Val Arg Gly Leu Gly Arg Arg Arg Lys Pro Arg Gln Pro Gln 35 40 45 Lys Ser Ser Ser Ser Lys Lys Thr Arg Leu Gln Gly Lys Glu Asn Arg 50 55 60 His Tyr Ser Lys Lys Arg Lys Lys Ser Lys Ser Ser Lys Arg Arg Gln 65 70 75 80 Tyr Ser Ser Ser Ser Ser Glu Thr Ser Arg Ser Ser Ser Gln Ser Ser 85 90 95 Ser Ser Ser Asn Ser Ser Cys Ser Asn Ser Ser Lys Pro Asn Pro Ile 100 105 110 Cys Ile <210> 39 <211> 3794 <212> DNA <213> Torque teno virus <400> 39 cccgaagtcc gtcactaacc acgtgactcc tgtcgcccaa tcagagtgta tgtcgtgcat 60 ttcctgggca tggtctacat cctgatataa ctaagtgcac ttccgaatgg ctgagttttc 120 cacgcccgtc cgcagcgagg gagcgacgga ggagctcccg agcgtcccga gggcgggtgc 180 cggaggtgag tttacacacc gcagtcaagg ggcaattcgg gctcgggact ggccgggcta 240 tgggcaaggc tcttagggtc ttcattctta atatgtttct tggcagagtt taccgccaca 300 agaaaaggaa agtgctactg tccacactgc gagctccaca ggcgtctcgc agggctatga 360 gttggcgacc cccggtacac gatgcacccg gcatcgagcg caattggtac gaggcctgtt 420 tcagagccca cgctggagct tgtggctgtg gcaattttat tatgcacctt aatcttttgg 480 ctgggcgtta tggttttact ccggggtcag cgccgccagg tggtcctcct ccgggcaccc 540 cgcagataag gagagccagg cctagtcccg ccgcaccaga gcagcccgct gccctaccat 600 ggcatgggga tggtggagat ggcggcgccg ctggcccgcc agacgctgga ggagacgccg 660 tcgccggcgc cccgtacgga gaacaagagc tcgccgacct gctcgacgct atagaagacg 720 acgaacagta agaaccaggc gaaggcggtg ggggcgcaga cggtacagac ggggctggag 780 acgcaggact tatgtgagaa aggggcgaca cagaaaaaag aaaaagagac tgatactgag 840 acagtggcaa ccagccacaa gacgcagatg taccataact gggtacctgc ccatagtgtt 900 ctgcggccac actaggggca ataaaaacta tgcactacac tctgacgact acacccccca 960 aggacaacca tttggagggg ctctaagcac tacctcattc tctttaaaag tactatttga 1020 ccagcatcag agaggactaa acaagtggtc ttttccaaac gaccaactag acctcgccag 1080 atatagaggc tgcaaattta tattttatag aacaaaacaa actgactggg tgggccagta 1140 tgacatatca gaaccctaca agctagacaa atacagctgc cccaactatc accctggaaa 1200 catgattaag gcaaagcaca aatttttaat accaagctat gacactaatc ctagaggcag 1260 acaaaaaatt atagttaaaa ttcccccccc agacctcttt gtagacaagt ggtacactca 1320 agaggatctg tgttccgtta atcttgtgtc acttgcggtt tctgcggctt cctttctcca 1380 cccattcggc tcaccacaaa ctgacaaccc ttgctacacc ttccaggtgt tgaaagagtt 1440 ctactatcag gcaataggct tctctgcaag cacacaagca atgacatcag tattagacac 1500 gctatacaca caaaacagtt attgggaatc taatctaact cagttttatg tacttaatgc 1560 aaaaaaaggc agtgatacaa cacagccttt aactagcaat atgccaactc gtgaagagtt 1620 tatggcaaaa aaaaatacca attacaactg gtatacatac aaggccgcgt cagtaaaaaa 1680 taaactacat caaatgagac aaacctattt tgaggagtta acctctaagg ggccacaaac 1740 aacaaaaagt gaggaaggct acagtcagca ctggaccacc ccctccacaa acgcctacga 1800 atatcactta ggaatgttta gtgcaatatt tctagcccca gacaggccag tacctagatt 1860 tccatgcgcc taccaagatg taacttacaa ccccttaatg gacaaagggg tgggaaacca 1920 catttggttt cagtacaaca caaaggcaga cactcagcta atagtcacag gagggtcctg 1980 caaagcacac atacaagaca taccactgtg ggcggccttc tatggataca gtgactttat 2040 agagtcagaa ctaggcccct ttgtagatgc agagacggta ggcttagtgt gtgtaatatg 2100 cccttataca aaacccccca tgtacaacaa gacaaacccc gccatgggct acgtgttcta 2160 tgacagaaac tttggtgacg gaaaatggac tgacggacgg ggcaaaatag agccctactg 2220 gcaagttagg tggaggcccg aaatgctttt ccaagaaact gtaatggcag acctagttca 2280 gactgggccc tttagctaca aagacgaact taaaaacagc accctagtgt gcaagtacaa 2340 attctatttc acctggggag gtaacatgat gttccaacag acgatcaaaa acccgtgcaa 2400 gacggacgga caacccaccg actccagtag acaccctaga ggaatacaag tggcggaccc 2460 ggaacaaatg ggaccccgct gggtgttcca ctcctttgac tggcgaaggg gctatcttag 2520 cgagaaagct ctcaaacgcc tgcaagaaaa acctcttgac tatgacgaat attttacaca 2580 accaaaaaga cctagaatct ttcctccaac agaatcagca gagggagagt tccgagagcc 2640 cgaaaaaggc tcgtattcag aggaagaaag gtcgcaagcc tctgccgaag agcagacgca 2700 ggaggcgaca gtactcctcc tcaagcgacg actcagagag caacagcagc tccagcagca 2760 gctccaattc ctcacccgag aaatgttcaa aacgcaagcg ggtctccacc taaaccctat 2820 gttattaaac cagcgataaa ccaagtgtac ctgtttccag agagggcccc aaaaccccct 2880 cctagcagcc aagactggca gcaggagtac gaggcctgcg cagcctggga caggccccct 2940 agatacaatc tgtcctctcc tcctttctac cccagctgcc cttcaaaatt ctgtgtaaaa 3000 ttcagccttg gctttaaata aatggcaact ttactgtgca aggccgtggg agtttcactg 3060 gtcggtgtct acctctaaag gtcactaagc actccgagcg ttagcgagga gtgcgaccct 3120 tccccctgac tcaacttctt cggagccgcg cgctacgcct tcggctgcgc gcggcacctc 3180 agacccccgc tcgtgctgac acgctcgcgc gtgtcagacc acttcgggct cgcgggggtc 3240 gggaattttg ctaaacagac tccgagttgc tcttggacac tgagggggca tatcagtaac 3300 gaaagtgagt ggggccagac ttcgccataa ggcctttatc ttcttgccat tggatagtat 3360 cgagggttgc cataggcttc gacctccatt ttaggccttc cggactacaa aaatggccgt 3420 tttagtgacg tcacggccgc cattttaagt aaggcggaag cagctcggcg tacacaaaat 3480 ggcggcggag cacttccggc ttgcccaaaa tggtgggcaa cttcttccgg gtcaaaggtc 3540 acagctacgt cacaagtcac gtggggaggg ttggcgttta acccggaagc caatcctctt 3600 acgtggcctg tcacgtgact tgtacgtcac gaccaccatt ttgttttaca aaatggccga 3660 cttccttcct cttttttaaa aataacggtt cggcggcggc gcgcgcgcta cgcgcgcgcg 3720 ccggggggct gccgcccccc ccccgcgcat gcgcggggcc cccccccgcg gggggctccg 3780 ccccccggcc cccc 3794 <210> 40 <211> 124 <212> PRT <213> Torque teno virus <400> 40 Met Ser Trp Arg Pro Pro Val His Asp Ala Pro Gly Ile Glu Arg Asn 1 5 10 15 Trp Tyr Glu Ala Cys Phe Arg Ala His Ala Gly Ala Cys Gly Cys Gly 20 25 30 Asn Phe Ile Met His Leu Asn Leu Leu Ala Gly Arg Tyr Gly Phe Thr 35 40 45 Pro Gly Ser Ala Pro Pro Gly Gly Pro Pro Pro Gly Thr Pro Gln Ile 50 55 60 Arg Arg Ala Arg Pro Ser Pro Ala Ala Pro Glu Gln Pro Ala Ala Leu 65 70 75 80 Pro Trp His Gly Asp Gly Gly Asp Gly Gly Ala Ala Gly Pro Pro Asp 85 90 95 Ala Gly Gly Asp Ala Val Ala Gly Ala Pro Tyr Gly Glu Gln Glu Leu 100 105 110 Ala Asp Leu Leu Asp Ala Ile Glu Asp Asp Glu Gln 115 120 <210> 41 <211> 267 <212> PRT <213> Torque teno virus <400> 41 Met Ser Trp Arg Pro Pro Val His Asp Ala Pro Gly Ile Glu Arg Asn 1 5 10 15 Trp Tyr Glu Ala Cys Phe Arg Ala His Ala Gly Ala Cys Gly Cys Gly 20 25 30 Asn Phe Ile Met His Leu Asn Leu Leu Ala Gly Arg Tyr Gly Phe Thr 35 40 45 Pro Gly Ser Ala Pro Pro Gly Gly Pro Pro Pro Gly Thr Pro Gln Ile 50 55 60 Arg Arg Ala Arg Pro Ser Pro Ala Ala Pro Glu Gln Pro Ala Ala Leu 65 70 75 80 Pro Trp His Gly Asp Gly Gly Asp Gly Gly Ala Ala Gly Pro Pro Asp 85 90 95 Ala Gly Gly Asp Ala Val Ala Gly Ala Pro Tyr Gly Glu Gln Glu Leu 100 105 110 Ala Asp Leu Leu Asp Ala Ile Glu Asp Asp Glu Gln Arg Ser Lys Thr 115 120 125 Arg Ala Arg Arg Thr Asp Asn Pro Pro Thr Pro Val Asp Thr Leu Glu 130 135 140 Glu Tyr Lys Trp Arg Thr Arg Asn Lys Trp Asp Pro Ala Gly Cys Ser 145 150 155 160 Thr Pro Leu Thr Gly Glu Gly Ala Ile Leu Ala Arg Lys Leu Ser Asn 165 170 175 Ala Cys Lys Lys Asn Leu Leu Thr Met Thr Asn Ile Leu His Asn Gln 180 185 190 Lys Asp Leu Glu Ser Phe Leu Gln Gln Asn Gln Gln Arg Glu Ser Ser 195 200 205 Glu Ser Pro Lys Lys Ala Arg Ile Gln Arg Lys Lys Gly Arg Lys Pro 210 215 220 Leu Pro Lys Ser Arg Arg Arg Arg Arg Gln Tyr Ser Ser Ser Ser Asp 225 230 235 240 Asp Ser Glu Ser Asn Ser Ser Ser Ser Ser Ser Ser Asn Ser Ser Pro 245 250 255 Glu Lys Cys Ser Lys Arg Lys Arg Val Ser Thr 260 265 <210> 42 <211> 257 <212> PRT <213> Torque teno virus <400> 42 Met Ser Trp Arg Pro Pro Val His Asp Ala Pro Gly Ile Glu Arg Asn 1 5 10 15 Trp Tyr Glu Ala Cys Phe Arg Ala His Ala Gly Ala Cys Gly Cys Gly 20 25 30 Asn Phe Ile Met His Leu Asn Leu Leu Ala Gly Arg Tyr Gly Phe Thr 35 40 45 Pro Gly Ser Ala Pro Pro Gly Gly Pro Pro Pro Gly Thr Pro Gln Ile 50 55 60 Arg Arg Ala Arg Pro Ser Pro Ala Ala Pro Glu Gln Pro Ala Ala Leu 65 70 75 80 Pro Trp His Gly Asp Gly Gly Asp Gly Gly Ala Ala Gly Pro Pro Asp 85 90 95 Ala Gly Gly Asp Ala Val Ala Gly Ala Pro Tyr Gly Glu Gln Glu Leu 100 105 110 Ala Asp Leu Leu Asp Ala Ile Glu Asp Asp Glu His Arg Gly Arg Val 115 120 125 Pro Arg Ala Arg Lys Arg Leu Val Phe Arg Gly Arg Lys Val Ala Ser 130 135 140 Leu Cys Arg Arg Ala Asp Ala Gly Gly Asp Ser Thr Pro Pro Gln Ala 145 150 155 160 Thr Thr Gln Arg Ala Thr Ala Ala Pro Ala Ala Ala Pro Ile Pro His 165 170 175 Pro Arg Asn Val Gln Asn Ala Ser Gly Ser Pro Pro Lys Pro Tyr Val 180 185 190 Ile Lys Pro Ala Ile Asn Gln Val Tyr Leu Phe Pro Glu Arg Ala Pro 195 200 205 Lys Pro Pro Pro Ser Ser Gln Asp Trp Gln Gln Glu Tyr Glu Ala Cys 210 215 220 Ala Ala Trp Asp Arg Pro Pro Arg Tyr Asn Leu Ser Ser Pro Pro Phe 225 230 235 240 Tyr Pro Ser Cys Pro Ser Lys Phe Cys Val Lys Phe Ser Leu Gly Phe 245 250 255 Lys <210> 43 <211> 150 <212> PRT <213> Torque teno virus <400> 43 Met Ser Trp Arg Pro Pro Val His Asp Ala Pro Gly Ile Glu Arg Asn 1 5 10 15 Cys Arg Gly Arg Val Pro Arg Ala Arg Lys Arg Leu Val Phe Arg Gly 20 25 30 Arg Lys Val Ala Ser Leu Cys Arg Arg Ala Asp Ala Gly Gly Asp Ser 35 40 45 Thr Pro Pro Gln Ala Thr Thr Gln Arg Ala Thr Ala Ala Pro Ala Ala 50 55 60 Ala Pro Ile Pro His Pro Arg Asn Val Gln Asn Ala Ser Gly Ser Pro 65 70 75 80 Pro Lys Pro Tyr Val Ile Lys Pro Ala Ile Asn Gln Val Tyr Leu Phe 85 90 95 Pro Glu Arg Ala Pro Lys Pro Pro Pro Ser Ser Gln Asp Trp Gln Gln 100 105 110 Glu Tyr Glu Ala Cys Ala Ala Trp Asp Arg Pro Pro Arg Tyr Asn Leu 115 120 125 Ser Ser Pro Pro Phe Tyr Pro Ser Cys Pro Ser Lys Phe Cys Val Lys 130 135 140 Phe Ser Leu Gly Phe Lys 145 150 <210> 44 <211> 746 <212> PRT <213> Torque teno virus <400> 44 Met Ala Trp Gly Trp Trp Arg Trp Arg Arg Arg Trp Pro Ala Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Pro Val Arg Arg Thr Arg Ala Arg 20 25 30 Arg Pro Ala Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Thr Arg Arg 35 40 45 Arg Arg Trp Gly Arg Arg Arg Tyr Arg Arg Gly Trp Arg Arg Arg Thr 50 55 60 Tyr Val Arg Lys Gly Arg His Arg Lys Lys Lys Lys Arg Leu Ile Leu 65 70 75 80 Arg Gln Trp Gln Pro Ala Thr Arg Arg Arg Cys Thr Ile Thr Gly Tyr 85 90 95 Leu Pro Ile Val Phe Cys Gly His Thr Arg Gly Asn Lys Asn Tyr Ala 100 105 110 Leu His Ser Asp Asp Tyr Thr Pro Gln Gly Gln Pro Phe Gly Gly Ala 115 120 125 Leu Ser Thr Thr Ser Phe Ser Leu Lys Val Leu Phe Asp Gln His Gln 130 135 140 Arg Gly Leu Asn Lys Trp Ser Phe Pro Asn Asp Gln Leu Asp Leu Ala 145 150 155 160 Arg Tyr Arg Gly Cys Lys Phe Ile Phe Tyr Arg Thr Lys Gln Thr Asp 165 170 175 Trp Val Gly Gln Tyr Asp Ile Ser Glu Pro Tyr Lys Leu Asp Lys Tyr 180 185 190 Ser Cys Pro Asn Tyr His Pro Gly Asn Met Ile Lys Ala Lys His Lys 195 200 205 Phe Leu Ile Pro Ser Tyr Asp Thr Asn Pro Arg Gly Arg Gln Lys Ile 210 215 220 Ile Val Lys Ile Pro Pro Pro Asp Leu Phe Val Asp Lys Trp Tyr Thr 225 230 235 240 Gln Glu Asp Leu Cys Ser Val Asn Leu Val Ser Leu Ala Val Ser Ala 245 250 255 Ala Ser Phe Leu His Pro Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys 260 265 270 Tyr Thr Phe Gln Val Leu Lys Glu Phe Tyr Tyr Gln Ala Ile Gly Phe 275 280 285 Ser Ala Ser Thr Gln Ala Met Thr Ser Val Leu Asp Thr Leu Tyr Thr 290 295 300 Gln Asn Ser Tyr Trp Glu Ser Asn Leu Thr Gln Phe Tyr Val Leu Asn 305 310 315 320 Ala Lys Lys Gly Ser Asp Thr Thr Gln Pro Leu Thr Ser Asn Met Pro 325 330 335 Thr Arg Glu Glu Phe Met Ala Lys Lys Asn Thr Asn Tyr Asn Trp Tyr 340 345 350 Thr Tyr Lys Ala Ala Ser Val Lys Asn Lys Leu His Gln Met Arg Gln 355 360 365 Thr Tyr Phe Glu Glu Leu Thr Ser Lys Gly Pro Gln Thr Thr Lys Ser 370 375 380 Glu Glu Gly Tyr Ser Gln His Trp Thr Thr Pro Ser Thr Asn Ala Tyr 385 390 395 400 Glu Tyr His Leu Gly Met Phe Ser Ala Ile Phe Leu Ala Pro Asp Arg 405 410 415 Pro Val Pro Arg Phe Pro Cys Ala Tyr Gln Asp Val Thr Tyr Asn Pro 420 425 430 Leu Met Asp Lys Gly Val Gly Asn His Ile Trp Phe Gln Tyr Asn Thr 435 440 445 Lys Ala Asp Thr Gln Leu Ile Val Thr Gly Gly Ser Cys Lys Ala His 450 455 460 Ile Gln Asp Ile Pro Leu Trp Ala Ala Phe Tyr Gly Tyr Ser Asp Phe 465 470 475 480 Ile Glu Ser Glu Leu Gly Pro Phe Val Asp Ala Glu Thr Val Gly Leu 485 490 495 Val Cys Val Ile Cys Pro Tyr Thr Lys Pro Pro Met Tyr Asn Lys Thr 500 505 510 Asn Pro Ala Met Gly Tyr Val Phe Tyr Asp Arg Asn Phe Gly Asp Gly 515 520 525 Lys Trp Thr Asp Gly Arg Gly Lys Ile Glu Pro Tyr Trp Gln Val Arg 530 535 540 Trp Arg Pro Glu Met Leu Phe Gln Glu Thr Val Met Ala Asp Leu Val 545 550 555 560 Gln Thr Gly Pro Phe Ser Tyr Lys Asp Glu Leu Lys Asn Ser Thr Leu 565 570 575 Val Cys Lys Tyr Lys Phe Tyr Phe Thr Trp Gly Gly Asn Met Met Phe 580 585 590 Gln Gln Thr Ile Lys Asn Pro Cys Lys Thr Asp Gly Gln Pro Thr Asp 595 600 605 Ser Ser Arg His Pro Arg Gly Ile Gln Val Ala Asp Pro Glu Gln Met 610 615 620 Gly Pro Arg Trp Val Phe His Ser Phe Asp Trp Arg Arg Gly Tyr Leu 625 630 635 640 Ser Glu Lys Ala Leu Lys Arg Leu Gln Glu Lys Pro Leu Asp Tyr Asp 645 650 655 Glu Tyr Phe Thr Gln Pro Lys Arg Pro Arg Ile Phe Pro Pro Thr Glu 660 665 670 Ser Ala Glu Gly Glu Phe Arg Glu Pro Glu Lys Gly Ser Tyr Ser Glu 675 680 685 Glu Glu Arg Ser Gln Ala Ser Ala Glu Glu Gln Thr Gln Glu Ala Thr 690 695 700 Val Leu Leu Leu Lys Arg Arg Leu Arg Glu Gln Gln Gln Leu Gln Gln 705 710 715 720 Gln Leu Gln Phe Leu Thr Arg Glu Met Phe Lys Thr Gln Ala Gly Leu 725 730 735 His Leu Asn Pro Met Leu Leu Asn Gln Arg 740 745 <210> 45 <211> 195 <212> PRT <213> Torque teno virus <400> 45 Met Ala Trp Gly Trp Trp Arg Trp Arg Arg Arg Trp Pro Ala Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Pro Val Arg Arg Thr Arg Ala Arg 20 25 30 Arg Pro Ala Arg Arg Tyr Arg Arg Arg Arg Thr Thr Ile Lys Asn Pro 35 40 45 Cys Lys Thr Asp Gly Gln Pro Thr Asp Ser Ser Arg His Pro Arg Gly 50 55 60 Ile Gln Val Ala Asp Pro Glu Gln Met Gly Pro Arg Trp Val Phe His 65 70 75 80 Ser Phe Asp Trp Arg Arg Gly Tyr Leu Ser Glu Lys Ala Leu Lys Arg 85 90 95 Leu Gln Glu Lys Pro Leu Asp Tyr Asp Glu Tyr Phe Thr Gln Pro Lys 100 105 110 Arg Pro Arg Ile Phe Pro Pro Thr Glu Ser Ala Glu Gly Glu Phe Arg 115 120 125 Glu Pro Glu Lys Gly Ser Tyr Ser Glu Glu Glu Arg Ser Gln Ala Ser 130 135 140 Ala Glu Glu Gln Thr Gln Glu Ala Thr Val Leu Leu Leu Lys Arg Arg 145 150 155 160 Leu Arg Glu Gln Gln Gln Leu Gln Gln Gln Leu Gln Phe Leu Thr Arg 165 170 175 Glu Met Phe Lys Thr Gln Ala Gly Leu His Leu Asn Pro Met Leu Leu 180 185 190 Asn Gln Arg 195 <210> 46 <211> 107 <212> PRT <213> Torque teno virus <400> 46 Met Ala Trp Gly Trp Trp Arg Trp Arg Arg Arg Trp Pro Ala Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Pro Val Arg Arg Thr Arg Ala Arg 20 25 30 Arg Pro Ala Arg Arg Tyr Arg Arg Arg Arg Thr Gln Arg Glu Ser Ser 35 40 45 Glu Ser Pro Lys Lys Ala Arg Ile Gln Arg Lys Lys Gly Arg Lys Pro 50 55 60 Leu Pro Lys Ser Arg Arg Arg Arg Arg Gln Tyr Ser Ser Ser Ser Asp 65 70 75 80 Asp Ser Glu Ser Asn Ser Ser Ser Ser Ser Ser Ser Asn Ser Ser Pro 85 90 95 Glu Lys Cys Ser Lys Arg Lys Arg Val Ser Thr 100 105 <210> 47 <211> 3866 <212> DNA <213> Torque teno virus <400> 47 aagtccgtca ctaaccacgt gactcccgca ggccaatcag agtctatgtc gtgcacttcc 60 tgggcatggt ctacgttctc atataactaa ctgcacttcc gaatggctga gttttccacg 120 cccgtccgca gcggcagcac cacggagggt gatccccgcg tcccgagggc gggtgccgaa 180 ggtgagttta cacaccgcag tcaaggggca attcgggctc gggactggcc gggctatggg 240 caaggctctt agggctttca ttgttaaaaa tgtttctcgg caggccttac aggagaaaga 300 aaagggcgct gtcactgcct ggcgtgcgag ctgcacaggc gaaacaacct ggtgatatga 360 gctggagccg tccagtacat aatgccgccg ggatcgaaag gcagtggttc gaatccacct 420 ttagatccca cgctagttgc tgtggctgcg gcaattttgt taatcatatt aatgtactgg 480 ctgctcgcta cggctttact ggggggccga cgccgccagg tggtcctggg ccgcgtccac 540 aactgaggcc cgcgcttccc gcgccggacc ccgaccccca ggcgcccaac cgtgagccat 600 ggcgtggagc tggtggtggc aacgatggag aaggcgccgc tggaaaccca ggaggcgccg 660 ctggagacgt ctacgatgga gaagacctag acgcgctgtt cgccgccgtc gtcgaggacg 720 tagagtaagg aggcggaggt gggcgcgtag acgggggcga cgcagacggt acgccaccag 780 acgaaagaga cgttataggg gtcgccgctt taaaaagaaa ctagtactga ctcagtggca 840 ccctaatacc atgagacgct gcttaatcaa gggcatagtc cccctggtaa tatgcggcca 900 caccaggtgg aactacaact acgccctcca tagcaaggac tacacagagg agggtcgcta 960 ccctcacggg ggggccctca gcaccactac gtggtccctt aaggtgctgt atgacgagca 1020 cctcaaacac cacgacttct ggggctatcc caacaaccag ctagacctgg ccaggtacaa 1080 gggggccaag ttcaccttct acagacacaa aaagactgac tttataatat tctttaacag 1140 aaagcctccc tttaagctaa acaagtacag ctgtgcctcc tatcacccag gcatgctgat 1200 gcagcagaga cacaagatcc tgctacccag ctacgaaact aaacccaagg gcaggccaaa 1260 gataacagtt agaataaagc cccccactct gttagaggac aagtggtaca cccagcagga 1320 cctgtgcgac gttaacctgt tgcaacttgt ggtcactgcg gctgactttc gacatccact 1380 ctgctcacca caaacgaaca ctccaaccac aaccttccag gtgttgaaag acatctatta 1440 tgacactatg agcatatctg aacccacaga ctcctacact agtgttaaca ataaaagtac 1500 aacacaaact tttactaact actcaaacac cttagaaaac attctgtaca cacgagcctc 1560 ctactggaac tcgttccacg ccactgaata cctaaacccc aacatcatat acaaaaacgg 1620 tgaaaaacta ttcaaagaac atgaagactt aataacctgg atgacccaaa ctaacaatac 1680 cgggtttcta actaaaaaca acacagcttt tggcaacaac agctacaggc ccaatgcaga 1740 caaaattaaa aaagccagaa agacatactg gaacgcccta ataggcacca acgacctggc 1800 cactaatata ggccaggcca gagcagaaag gttcgagtac cacctaggct ggtactcccc 1860 catatttctc agcagacaca ggagcaacat gaactttgcc agggcctacc aagacgtcac 1920 atacaacccc aactgtgaca ggggagttaa caacagggtg tgggttcagc ctctaactaa 1980 acccaccaca gagttcgacg agaaaaggtg taagtgcgta gtgcagcacc tgcctctgtg 2040 ggcggctctg tactgctacc aagactttgt agaggaggag ctggggtcct cctcagagat 2100 attaaattca tgcctactgg tattacagtg cccttacacc tttcccccaa tgtatgacaa 2160 aaagctacca gacaagggat tcgtgtttta tgactccctt tttggagacg gcaaaatgtc 2220 tgacggacgc ggacaggtgg acattttctg gcaacagcga tggtaccctc gcttagccac 2280 tcagatgcaa gtcatgcacg acatcaccat gacgggcccc ttctcctacc gagacgagct 2340 agttagcacc caactgactg ccaagtacac ctttgacttt atgtggggcg gaaatatgat 2400 ctccacacag atcatcaaga acccctgcaa agacagtgga ctggaacccg cctaccccgg 2460 tagacagcgt cgcgacttac aaattgttga cccatactcc atgggccccc aattctcgtt 2520 ccacaactgg gactacagac atggcctttt tggccaagac gctatcgaca gagtgtctaa 2580 acaaccaaaa gatgatgcag actatcctaa cccatacaaa aggcctagat attttccacc 2640 cacagaccaa gccgcccaag agcaagaaaa agacttcagt ttcctcaaaa cagcaccgtc 2700 gaactcagaa gagagcgatc aagaagtcct ccaagaaacg caagtactcc gattccagcc 2760 agagcagcac aagcaactcc acctgcagct cgcagagcgg cagcgaatcg gagagcaact 2820 ccgataccta ctccaacaga tgttcaaaac tcaggccaat ctccacctaa acccatatac 2880 atttacccag ctgtaaagca ggtgtttatg tttgaccccc cgggccctaa ggctatctcg 2940 ggcgccaagg cctgggagga cgagttcctc accgcaaaag tgtggaaccg cccggtacgc 3000 aagtactact cagacacccc ctactacccc tgggccccca aaccccagta ctctgtcagt 3060 ttcaaactcg gctggaaata aaaaaagcct gctccactgt actaggccgt gggagtttca 3120 ctcgtcggtg tctacctctt aaggtcacca agcactccga gcgtcagcga ggagtgcgac 3180 ccttgggggt gggtgcaacg ccctcggcgg ccgcgcgcta cgccttcggc tgcgcgcggc 3240 acctcggacc cccgctcgtg ctgacgcgct tgcgcgcgtc agaccacttc gggctcgcgg 3300 gggtcggaaa ttttgctaaa cagactccga gttgccattg gacactggag ccgtgaatca 3360 gtaacgaaag tgagtggggc cagacttcgc cataaggcct ttatcttttt gccatttgtc 3420 cgtggggaag ggtcgctgca agcgcggacc ccgttttcac cccttccgga ctacaaaaat 3480 agcgcattag tgacgtcacg gccgccattt taagtaaggc ggaagcaact ccactttctc 3540 acaaaatggc ggcggagcac ttccggcttg cccaaaatgg ccgccaaaaa catccgggtc 3600 aaagttcgcc gctacgtcat aagtcacgtg actggggagg tacttaaaca cggaagtatc 3660 ctcaaccacg taactggtca cgtggtgcgc acgtcacggc aaccattttg ttttacaaaa 3720 tggcgcattt ccttcctctt ttttaaaaat taaccgttgg cggcggcgcg cgcgctacgc 3780 gcgcgcgccg gggagctctg cccccccccg cgcatgcgcg cgggtccccc ccccgcgggg 3840 ggctccgccc cccggtcccc cccccg 3866 <210> 48 <211> 123 <212> PRT <213> Torque teno virus <400> 48 Met Ser Trp Ser Arg Pro Val His Asn Ala Ala Gly Ile Glu Arg Gln 1 5 10 15 Trp Phe Glu Ser Thr Phe Arg Ser His Ala Ser Cys Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Ala Arg Tyr Gly Phe Thr 35 40 45 Gly Gly Pro Thr Pro Pro Gly Gly Pro Gly Pro Arg Pro Gln Leu Arg 50 55 60 Pro Ala Leu Pro Ala Pro Asp Pro Asp Pro Gln Ala Pro Asn Arg Glu 65 70 75 80 Pro Trp Arg Gly Ala Gly Gly Gly Asn Asp Gly Glu Gly Ala Ala Gly 85 90 95 Asn Pro Gly Gly Ala Ala Gly Asp Val Tyr Asp Gly Glu Asp Leu Asp 100 105 110 Ala Leu Phe Ala Ala Val Val Glu Asp Val Glu 115 120 <210> 49 <211> 275 <212> PRT <213> Torque teno virus <400> 49 Met Ser Trp Ser Arg Pro Val His Asn Ala Ala Gly Ile Glu Arg Gln 1 5 10 15 Trp Phe Glu Ser Thr Phe Arg Ser His Ala Ser Cys Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Ala Arg Tyr Gly Phe Thr 35 40 45 Gly Gly Pro Thr Pro Pro Gly Gly Pro Gly Pro Arg Pro Gln Leu Arg 50 55 60 Pro Ala Leu Pro Ala Pro Asp Pro Asp Pro Gln Ala Pro Asn Arg Glu 65 70 75 80 Pro Trp Arg Gly Ala Gly Gly Gly Asn Asp Gly Glu Gly Ala Ala Gly 85 90 95 Asn Pro Gly Gly Ala Ala Gly Asp Val Tyr Asp Gly Glu Asp Leu Asp 100 105 110 Ala Leu Phe Ala Ala Val Val Glu Asp Val Glu Ser Ser Arg Thr Pro 115 120 125 Ala Lys Thr Val Asp Trp Asn Pro Pro Thr Pro Val Asp Ser Val Ala 130 135 140 Thr Tyr Lys Leu Leu Thr His Thr Pro Trp Ala Pro Asn Ser Arg Ser 145 150 155 160 Thr Thr Gly Thr Thr Asp Met Ala Phe Leu Ala Lys Thr Leu Ser Thr 165 170 175 Glu Cys Leu Asn Asn Gln Lys Met Met Gln Thr Ile Leu Thr His Thr 180 185 190 Lys Gly Leu Asp Ile Phe His Pro Gln Thr Lys Pro Pro Lys Ser Lys 195 200 205 Lys Lys Thr Ser Val Ser Ser Lys Gln His Arg Arg Thr Gln Lys Arg 210 215 220 Ala Ile Lys Lys Ser Ser Lys Lys Arg Lys Tyr Ser Asp Ser Ser Gln 225 230 235 240 Ser Ser Thr Ser Asn Ser Thr Cys Ser Ser Gln Ser Gly Ser Glu Ser 245 250 255 Glu Ser Asn Ser Asp Thr Tyr Ser Asn Arg Cys Ser Lys Leu Arg Pro 260 265 270 Ile Ser Thr 275 <210> 50 <211> 267 <212> PRT <213> Torque teno virus <400> 50 Met Ser Trp Ser Arg Pro Val His Asn Ala Ala Gly Ile Glu Arg Gln 1 5 10 15 Trp Phe Glu Ser Thr Phe Arg Ser His Ala Ser Cys Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Ala Arg Tyr Gly Phe Thr 35 40 45 Gly Gly Pro Thr Pro Pro Gly Gly Pro Gly Pro Arg Pro Gln Leu Arg 50 55 60 Pro Ala Leu Pro Ala Pro Asp Pro Asp Pro Gln Ala Pro Asn Arg Glu 65 70 75 80 Pro Trp Arg Gly Ala Gly Gly Gly Asn Asp Gly Glu Gly Ala Ala Gly 85 90 95 Asn Pro Gly Gly Ala Ala Gly Asp Val Tyr Asp Gly Glu Asp Leu Asp 100 105 110 Ala Leu Phe Ala Ala Val Val Glu Asp Val Glu Pro Ser Arg Pro Arg 115 120 125 Ala Arg Lys Arg Leu Gln Phe Pro Gln Asn Ser Thr Val Glu Leu Arg 130 135 140 Arg Glu Arg Ser Arg Ser Pro Pro Arg Asn Ala Ser Thr Pro Ile Pro 145 150 155 160 Ala Arg Ala Ala Gln Ala Thr Pro Pro Ala Ala Arg Arg Ala Ala Ala 165 170 175 Asn Arg Arg Ala Thr Pro Ile Pro Thr Pro Thr Asp Val Gln Asn Ser 180 185 190 Gly Gln Ser Pro Pro Lys Pro Ile Tyr Ile Tyr Pro Ala Val Lys Gln 195 200 205 Val Phe Met Phe Asp Pro Pro Gly Pro Lys Ala Ile Ser Gly Ala Lys 210 215 220 Ala Trp Glu Asp Glu Phe Leu Thr Ala Lys Val Trp Asn Arg Pro Val 225 230 235 240 Arg Lys Tyr Tyr Ser Asp Thr Pro Tyr Tyr Pro Trp Ala Pro Lys Pro 245 250 255 Gln Tyr Ser Val Ser Phe Lys Leu Gly Trp Lys 260 265 <210> 51 <211> 765 <212> PRT <213> Torque teno virus <400> 51 Met Ala Trp Ser Trp Trp Trp Gln Arg Trp Arg Arg Arg Arg Trp Lys 1 5 10 15 Pro Arg Arg Arg Arg Trp Arg Arg Leu Arg Trp Arg Arg Pro Arg Arg 20 25 30 Ala Val Arg Arg Arg Arg Arg Gly Arg Arg Val Arg Arg Arg Arg Trp 35 40 45 Ala Arg Arg Arg Gly Arg Arg Arg Arg Tyr Ala Thr Arg Arg Lys Arg 50 55 60 Arg Tyr Arg Gly Arg Arg Phe Lys Lys Lys Leu Val Leu Thr Gln Trp 65 70 75 80 His Pro Asn Thr Met Arg Arg Cys Leu Ile Lys Gly Ile Val Pro Leu 85 90 95 Val Ile Cys Gly His Thr Arg Trp Asn Tyr Asn Tyr Ala Leu His Ser 100 105 110 Lys Asp Tyr Thr Glu Glu Gly Arg Tyr Pro His Gly Gly Ala Leu Ser 115 120 125 Thr Thr Thr Trp Ser Leu Lys Val Leu Tyr Asp Glu His Leu Lys His 130 135 140 His Asp Phe Trp Gly Tyr Pro Asn Asn Gln Leu Asp Leu Ala Arg Tyr 145 150 155 160 Lys Gly Ala Lys Phe Thr Phe Tyr Arg His Lys Lys Thr Asp Phe Ile 165 170 175 Ile Phe Phe Asn Arg Lys Pro Pro Phe Lys Leu Asn Lys Tyr Ser Cys 180 185 190 Ala Ser Tyr His Pro Gly Met Leu Met Gln Gln Arg His Lys Ile Leu 195 200 205 Leu Pro Ser Tyr Glu Thr Lys Pro Lys Gly Arg Pro Lys Ile Thr Val 210 215 220 Arg Ile Lys Pro Pro Thr Leu Leu Glu Asp Lys Trp Tyr Thr Gln Gln 225 230 235 240 Asp Leu Cys Asp Val Asn Leu Leu Gln Leu Val Val Thr Ala Ala Asp 245 250 255 Phe Arg His Pro Leu Cys Ser Pro Gln Thr Asn Thr Pro Thr Thr Thr 260 265 270 Phe Gln Val Leu Lys Asp Ile Tyr Tyr Asp Thr Met Ser Ile Ser Glu 275 280 285 Pro Thr Asp Ser Tyr Thr Ser Val Asn Asn Lys Ser Thr Thr Gln Thr 290 295 300 Phe Thr Asn Tyr Ser Asn Thr Leu Glu Asn Ile Leu Tyr Thr Arg Ala 305 310 315 320 Ser Tyr Trp Asn Ser Phe His Ala Thr Glu Tyr Leu Asn Pro Asn Ile 325 330 335 Ile Tyr Lys Asn Gly Glu Lys Leu Phe Lys Glu His Glu Asp Leu Ile 340 345 350 Thr Trp Met Thr Gln Thr Asn Asn Thr Gly Phe Leu Thr Lys Asn Asn 355 360 365 Thr Ala Phe Gly Asn Asn Ser Tyr Arg Pro Asn Ala Asp Lys Ile Lys 370 375 380 Lys Ala Arg Lys Thr Tyr Trp Asn Ala Leu Ile Gly Thr Asn Asp Leu 385 390 395 400 Ala Thr Asn Ile Gly Gln Ala Arg Ala Glu Arg Phe Glu Tyr His Leu 405 410 415 Gly Trp Tyr Ser Pro Ile Phe Leu Ser Arg His Arg Ser Asn Met Asn 420 425 430 Phe Ala Arg Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg 435 440 445 Gly Val Asn Asn Arg Val Trp Val Gln Pro Leu Thr Lys Pro Thr Thr 450 455 460 Glu Phe Asp Glu Lys Arg Cys Lys Cys Val Val Gln His Leu Pro Leu 465 470 475 480 Trp Ala Ala Leu Tyr Cys Tyr Gln Asp Phe Val Glu Glu Glu Leu Gly 485 490 495 Ser Ser Ser Glu Ile Leu Asn Ser Cys Leu Leu Val Leu Gln Cys Pro 500 505 510 Tyr Thr Phe Pro Pro Met Tyr Asp Lys Lys Leu Pro Asp Lys Gly Phe 515 520 525 Val Phe Tyr Asp Ser Leu Phe Gly Asp Gly Lys Met Ser Asp Gly Arg 530 535 540 Gly Gln Val Asp Ile Phe Trp Gln Gln Arg Trp Tyr Pro Arg Leu Ala 545 550 555 560 Thr Gln Met Gln Val Met His Asp Ile Thr Met Thr Gly Pro Phe Ser 565 570 575 Tyr Arg Asp Glu Leu Val Ser Thr Gln Leu Thr Ala Lys Tyr Thr Phe 580 585 590 Asp Phe Met Trp Gly Gly Asn Met Ile Ser Thr Gln Ile Ile Lys Asn 595 600 605 Pro Cys Lys Asp Ser Gly Leu Glu Pro Ala Tyr Pro Gly Arg Gln Arg 610 615 620 Arg Asp Leu Gln Ile Val Asp Pro Tyr Ser Met Gly Pro Gln Phe Ser 625 630 635 640 Phe His Asn Trp Asp Tyr Arg His Gly Leu Phe Gly Gln Asp Ala Ile 645 650 655 Asp Arg Val Ser Lys Gln Pro Lys Asp Asp Ala Asp Tyr Pro Asn Pro 660 665 670 Tyr Lys Arg Pro Arg Tyr Phe Pro Pro Thr Asp Gln Ala Ala Gln Glu 675 680 685 Gln Glu Lys Asp Phe Ser Phe Leu Lys Thr Ala Pro Ser Asn Ser Glu 690 695 700 Glu Ser Asp Gln Glu Val Leu Gln Glu Thr Gln Val Leu Arg Phe Gln 705 710 715 720 Pro Glu Gln His Lys Gln Leu His Leu Gln Leu Ala Glu Arg Gln Arg 725 730 735 Ile Gly Glu Gln Leu Arg Tyr Leu Leu Gln Gln Met Phe Lys Thr Gln 740 745 750 Ala Asn Leu His Leu Asn Pro Tyr Thr Phe Thr Gln Leu 755 760 765 <210> 52 <211> 203 <212> PRT <213> Torque teno virus <400> 52 Met Ala Trp Ser Trp Trp Trp Gln Arg Trp Arg Arg Arg Arg Trp Lys 1 5 10 15 Pro Arg Arg Arg Arg Trp Arg Arg Leu Arg Trp Arg Arg Pro Arg Arg 20 25 30 Ala Val Arg Arg Arg Arg Arg Gly Arg Arg Ile Ile Lys Asn Pro Cys 35 40 45 Lys Asp Ser Gly Leu Glu Pro Ala Tyr Pro Gly Arg Gln Arg Arg Asp 50 55 60 Leu Gln Ile Val Asp Pro Tyr Ser Met Gly Pro Gln Phe Ser Phe His 65 70 75 80 Asn Trp Asp Tyr Arg His Gly Leu Phe Gly Gln Asp Ala Ile Asp Arg 85 90 95 Val Ser Lys Gln Pro Lys Asp Asp Ala Asp Tyr Pro Asn Pro Tyr Lys 100 105 110 Arg Pro Arg Tyr Phe Pro Pro Thr Asp Gln Ala Ala Gln Glu Gln Glu 115 120 125 Lys Asp Phe Ser Phe Leu Lys Thr Ala Pro Ser Asn Ser Glu Glu Ser 130 135 140 Asp Gln Glu Val Leu Gln Glu Thr Gln Val Leu Arg Phe Gln Pro Glu 145 150 155 160 Gln His Lys Gln Leu His Leu Gln Leu Ala Glu Arg Gln Arg Ile Gly 165 170 175 Glu Gln Leu Arg Tyr Leu Leu Gln Gln Met Phe Lys Thr Gln Ala Asn 180 185 190 Leu His Leu Asn Pro Tyr Thr Phe Thr Gln Leu 195 200 <210> 53 <211> 116 <212> PRT <213> Torque teno virus <400> 53 Met Ala Trp Ser Trp Trp Trp Gln Arg Trp Arg Arg Arg Arg Trp Lys 1 5 10 15 Pro Arg Arg Arg Arg Trp Arg Arg Leu Arg Trp Arg Arg Pro Arg Arg 20 25 30 Ala Val Arg Arg Arg Arg Arg Gly Arg Arg Thr Lys Pro Pro Lys Ser 35 40 45 Lys Lys Lys Thr Ser Val Ser Ser Lys Gln His Arg Arg Thr Gln Lys 50 55 60 Arg Ala Ile Lys Lys Ser Ser Lys Lys Arg Lys Tyr Ser Asp Ser Ser 65 70 75 80 Gln Ser Ser Thr Ser Asn Ser Thr Cys Ser Ser Gln Ser Gly Ser Glu 85 90 95 Ser Glu Ser Asn Ser Asp Thr Tyr Ser Asn Arg Cys Ser Lys Leu Arg 100 105 110 Pro Ile Ser Thr 115 <210> 54 <211> 2979 <212> DNA <213> TTV-like mini virus <400> 54 taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60 gttccccttt ttgcaacaac ttctgctttt ttccaactgc cggaaaacca cataatttgc 120 atggctaacc acaaactgat atgctaatta acttccacaa aacaacttcc ccttttaaaa 180 ccacacctac aaattaatta ttaaacacag tcacatcctg ggaggtacta ccacactata 240 ataccaagtg cacttccgaa tggctgagtt tatgccgcta gacggagaac gcatcagtta 300 ctgactgcgg actgaacttg ggcgggtgcc gaaggtgagt gaaaccaccg aagtcaaggg 360 gcaattcggg ctagttcagt ctagcggaac gggcaagaaa cttaaaatta ttttattttt 420 cagatgagcg actgctttaa accaacatgc tacaacaaca aaacaaagca aactcactgg 480 attaataacc tgcatttaac ccacgacctg atctgcttct gcccaacacc aactagacac 540 ttattactag ctttagcaga acaacaagaa acaattgaag tgtctaaaca agaaaaagaa 600 aaaataacaa gatgccttat tactacagaa gaagacggta caactacaga cgtcctagat 660 ggtatggacg aggttggatt agacgccctt ttcgcagaag atttcgaaga aaaagaaggg 720 taagacctac ttatactact attcctctaa agcaatggca accgccatat aaaagaacat 780 gctatataaa aggacaagac tgtttaatat actatagcaa cttaagactg ggaatgaata 840 gtacaatgta tgaaaaaagt attgtacctg tacattggcc gggagggggt tctttttctg 900 taagcatgtt aactttagat gccttgtatg atatacataa actttgtaga aactggtgga 960 catccacaaa ccaagactta ccactagtaa gatataaagg atgcaaaata acattttatc 1020 aaagcacatt tacagactac atagtaagaa tacatacaga actaccagct aacagtaaca 1080 aactaacata cccaaacaca catccactaa tgatgatgat gtctaagtac aaacacatta 1140 tacctagtag acaaacaaga agaaaaaaga aaccatacac aaaaatattt gtaaaaccac 1200 ctccgcaatt tgaaaacaaa tggtactttg ctacagacct ctacaaaatt ccattactac 1260 aaatacactg cacagcatgc aacttacaaa acccatttgt aaaaccagac aaattatcaa 1320 acaatgttac attatggtca ctaaacacca taagcataca aaatagaaac atgtcagtgg 1380 atcaaggaca atcatggcca tttaaaatac taggaacaca aagcttttat ttttactttt 1440 acaccggagc aaacctacca ggtgacacaa cacaaatacc agtagcagac ctattaccac 1500 taacaaaccc aagaataaac agaccaggac aatcactaaa tgaggcaaaa attacagacc 1560 atattacttt cacagaatac aaaaacaaat ttacaaatta ttggggtaac ccatttaata 1620 aacacattca agaacaccta gatatgatac tatactcact aaaaagtcca gaagcaataa 1680 aaaacgaatg gacaacagaa aacatgaaat ggaaccaatt aaacaatgca ggaacaatgg 1740 cattaacacc atttaacgag ccaatattca cacaaataca atataaccca gatagagaca 1800 caggagaaga cactcaatta tacctactct ctaacgctac aggaacagga tgggacccac 1860 caggaattcc agaattaata ctagaaggat ttccactatg gttaatatat tggggatttg 1920 cagactttca aaaaaaccta aaaaaagtaa caaacataga cacaaattac atgttagtag 1980 caaaaacaaa atttacacaa aaacctggca cattctactt agtaatacta aatgacacct 2040 ttgtagaagg caatagccca tatgaaaaac aacctttacc tgaagacaac attaaatggt 2100 acccacaagt acaataccaa ttagaagcac aaaacaaact actacaaact gggccattta 2160 caccaaacat acaaggacaa ctatcagaca atatatcaat gttttataaa ttttacttta 2220 aatggggagg aagcccacca aaagcaatta atgttgaaaa tcctgcccac cagattcaat 2280 atcccatacc ccgtaacgag catgaaacaa cttcgttaca gagtccaggg gaagccccag 2340 aatccatctt atactccttc gactatagac acgggaacta cacaacaaca gctttgtcac 2400 gaattagcca agactgggca cttaaagaca ctgtttctaa aattacagag ccagatcgac 2460 agcaactgct caaacaagcc ctcgaatgcc tgcaaatctc ggaagaaacg caggagaaaa 2520 aagaaaaaga agtacagcag ctcatcagca acctcagaca gcagcagcag ctgtacagag 2580 agcgaataat atcattatta aaggaccaat aacttttaac tgtgtaaaaa aggtgaaatt 2640 gtttgatgat aaaccaaaaa accgtagatt tacacctgag gaatttgaaa ctgagttaca 2700 aatagcaaaa tggttaaaga gacccccaag atcctttgta aatgatcctc ccttttaccc 2760 atggttacca cctgaacctg ttgtaaactt taagcttaat tttactgaat aaaggccagc 2820 attaattcac ttaaggagtc tgtttattta agttaaacct taataaacgg tcaccgcctc 2880 cctaatacgc aggcgcagaa agggggctcc gcccccttta acccccaggg ggctccgccc 2940 cctgaaaccc ccaagggggc tacgccccct tacaccccc 2979 <210> 55 <211> 99 <212> PRT <213> TTV-like mini virus <400> 55 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly <210> 56 <211> 203 <212> PRT <213> TTV-like mini virus <400> 56 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly Phe Asn Ile Pro Tyr Pro Val Thr Ser Met Lys Gln Leu 100 105 110 Arg Tyr Arg Val Gln Gly Lys Pro Gln Asn Pro Ser Tyr Thr Pro Ser 115 120 125 Thr Ile Asp Thr Gly Thr Thr Gln Gln Gln Leu Cys His Glu Leu Ala 130 135 140 Lys Thr Gly His Leu Lys Thr Leu Phe Leu Lys Leu Gln Ser Gln Ile 145 150 155 160 Asp Ser Asn Cys Ser Asn Lys Pro Ser Asn Ala Cys Lys Ser Arg Lys 165 170 175 Lys Arg Arg Arg Lys Lys Lys Lys Lys Tyr Ser Ser Ser Ser Ala Thr 180 185 190 Ser Asp Ser Ser Ser Ser Cys Thr Glu Ser Glu 195 200 <210> 57 <211> 219 <212> PRT <213> TTV-like mini virus <400> 57 Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln 1 5 10 15 Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe 20 25 30 Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln 35 40 45 Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys 50 55 60 Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly 65 70 75 80 Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu 85 90 95 Lys Glu Gly Ala Arg Ser Thr Ala Thr Ala Gln Thr Ser Pro Arg Met 100 105 110 Pro Ala Asn Leu Gly Arg Asn Ala Gly Glu Lys Arg Lys Arg Ser Thr 115 120 125 Ala Ala His Gln Gln Pro Gln Thr Ala Ala Ala Ala Val Gln Arg Ala 130 135 140 Asn Asn Ile Ile Ile Lys Gly Pro Ile Thr Phe Asn Cys Val Lys Lys 145 150 155 160 Val Lys Leu Phe Asp Asp Lys Pro Lys Asn Arg Arg Phe Thr Pro Glu 165 170 175 Glu Phe Glu Thr Glu Leu Gln Ile Ala Lys Trp Leu Lys Arg Pro Pro 180 185 190 Arg Ser Phe Val Asn Asp Pro Pro Phe Tyr Pro Trp Leu Pro Pro Glu 195 200 205 Pro Val Val Asn Phe Lys Leu Asn Phe Thr Glu 210 215 <210> 58 <211> 666 <212> PRT <213> TTV-like mini virus <400> 58 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln 35 40 45 Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys 50 55 60 Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr 65 70 75 80 Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser 85 90 95 Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys 100 105 110 Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr 115 120 125 Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile 130 135 140 Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr 145 150 155 160 Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile 165 170 175 Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile 180 185 190 Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr 195 200 205 Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn 210 215 220 Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr 225 230 235 240 Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val 245 250 255 Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe 260 265 270 Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln 275 280 285 Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg 290 295 300 Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe 305 310 315 320 Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn 325 330 335 Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser 340 345 350 Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn 355 360 365 Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro 370 375 380 Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp 385 390 395 400 Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro 405 410 415 Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile 420 425 430 Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn 435 440 445 Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys 450 455 460 Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly 465 470 475 480 Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp 485 490 495 Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln 500 505 510 Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile 515 520 525 Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys 530 535 540 Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro 545 550 555 560 Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro 565 570 575 Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr 580 585 590 Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val 595 600 605 Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu 610 615 620 Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu 625 630 635 640 Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg 645 650 655 Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln 660 665 <210> 59 <211> 148 <212> PRT <213> TTV-like mini virus <400> 59 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr 35 40 45 Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser 50 55 60 Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile 65 70 75 80 Ser Gln Asp Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro 85 90 95 Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser 100 105 110 Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser 115 120 125 Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu 130 135 140 Leu Lys Asp Gln 145 <210> 60 <211> 82 <212> PRT <213> TTV-like mini virus <400> 60 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Ser Gln Ile Asp Ser Asn Cys Ser Asn Lys Pro Ser 35 40 45 Asn Ala Cys Lys Ser Arg Lys Lys Arg Arg Arg Lys Lys Lys Lys Lys 50 55 60 Tyr Ser Ser Ser Ser Ala Thr Ser Asp Ser Ser Ser Ser Cys Thr Glu 65 70 75 80 Ser Glu <210> 61 <211> 3242 <212> DNA <213> Torque teno midi virus 1 <400> 61 aggtggagac tcttaagcta tataaccaag tggggtggcg aatggctgag tttaccccgc 60 tagacggtgc agggaccgga tcgagcgcag cgaggaggtc cccggctgcc cgtgggcggg 120 agcccgaggt gagtgaaacc accgaggtct aggggcaatt cgggctaggg cagtctagcg 180 gaacgggcaa gaaacttaaa aatatttctt ttacagatgc aaaacctatc agccaaagac 240 ttctacaaac catgcagata caactgtgaa actaaaaacc aaatgtggat gtctggcatt 300 gctgactccc atgacagttg gtgtgactgt gatactcctt ttgctcacct cctggctagt 360 atttttcctc ctggtcacac agatcgcaca cgaaccatcc aagaaatact taccagagat 420 tttaggaaaa catgcctttc tggtggggcc gacgcaacaa attctggtat ggccgaaact 480 atagaagaaa aaagagaaga tttccaaaaa gaagaaaaag aagattttac agaagaacaa 540 aatatagaag acctgctcgc cgccgtcgca gacgcagaag gaaggtaaga agaaaaaaaa 600 aaactcttat agtaagacaa tggcagccag actctattgt actctgtaaa attaaagggt 660 atgactctat aatatgggga gctgaaggca cacagtttca atgttctaca catgaaatgt 720 atgaatatac aagacaaaag taccctgggg gaggaggatt tggtgtacaa ctttacagct 780 tagagtattt gtatgaccaa tggaaactta gaaataatat atggactaaa acaaatcaac 840 tcaaagattt gtgtagatac ttaaaatgtg ttatgacctt ttacagacac caacacatag 900 attttgtaat tgtatatgaa agacaacccc catttgaaat agataaacta acatacatga 960 aatatcatcc atatatgtta ttacaaagaa agcataaaat aattttacct agtcaaacaa 1020 ctaatcctag aggtaaatta aaaaaaaaga aaactattaa acctcccaaa caaatgctca 1080 gcaaatggtt ttttcaacaa caatttgcta aatatgatct actacttatt gctgcagcag 1140 catgtagttt aagataccct agaataggct gctgcaatga aaatagaatg ataaccttat 1200 actgtttaaa tactaaattt tatcaagata cagaatgggg aactacaaaa caggcccccc 1260 actactttaa accatatgca acaattaata aatccatgat atttgtctct aactatggag 1320 gtaaaaaaac agaatataac ataggccaat ggatagaaac agatatacct ggagaaggta 1380 atctagcaag atactacaga tcaataagta aagaaggagg ttacttttca cctaaaatac 1440 tgcaagcata tcaaacaaaa gtaaagtctg tagactacaa acctttacca attgttttag 1500 gtagatataa cccagcaata gatgatggaa aaggcaacaa aatttactta caaactataa 1560 tgaatggcca ttggggccta cctcaaaaaa caccagatta tataatagaa gaggtccctc 1620 tttggctagg cttctgggga tactataact acttaaaaca aacaagaact gaagctatat 1680 ttccactaca catgtttgta gtgcaaagca aatacattca aacacaacaa acagaaacac 1740 ctaacaattt ttgggcattt atagacaaca gctttataca gggcaaaaac ccatgggact 1800 cagttattac ttactcagaa caaaagctat ggtttcctac agttgcatgg caactaaaaa 1860 ccataaatgc tatttgtgaa agtggaccat atgtacctaa actagacaat caaacatata 1920 gtacctggga actagcaact cattactcat ttcactttaa atggggtggt ccacagatat 1980 cagaccaacc agttgaagac ccaggaaaca aaaacaaata tgatgtgccc gatacaatca 2040 aagaagcatt acaaattgtt aacccagcaa aaaacattgc tgccacgatg ttccatgact 2100 gggactacag acggggttgc attacatcaa cagctattaa aagaatgcaa caaaacctcc 2160 caactgattc atctctcgaa tctgattcag actcagaacc agcacccaag aaaaaaagac 2220 tactaccagt cctccacgac ccacaaaaga aaacggaaaa gatcaaccaa tgtctcctct 2280 ctctctgcga agaaagtaca tgccaggagc aggaaacgga ggaaaacatc ctcaagctca 2340 tccagcagca gcagcagcag cagcagaaac tcaagcacaa cctcttagta ctaatcaagg 2400 acttaaaagt gaaacaaaga ttattacaac tacaaacggg ggtactagaa taacccttac 2460 cagatttaaa ccaggatttg agcaagaaac tgaaaaagag ttagcacaag catttaacag 2520 accccctaga ctgttcaaag aagataaacc cttttacccc tggctaccca gatttacacc 2580 ccttgtaaac tttcacctta attttaaagg ctaggcctac actgctcact tagtggtgta 2640 tgtttattaa agtttgcacc ccagaaaaat tgtaaaataa aaaaaaaaaa aaaaaataaa 2700 aaattgcaaa aattcggcgc tcgcgcgcgc tgcgcgcgcg agcgccgtca cgcgccggcg 2760 ctcgcgcgcc gcgcgtatgt gctaacacac cacgcaccta gattggggtg cgcgcgtagc 2820 gcgcgcaccc caatgcgccc cgccctcgtt ccgacccgct tgcgcgggtc ggaccacttc 2880 gggctcgggg gggcgcgcct gcggcgctta tttactaaac agactccgag tcgccattgg 2940 gcccccccta agctccgccc ccctcatgaa tattcataaa ggaaaccaca aaattagaat 3000 tgccgaccac aaactgccat atgctaatta gttccccttt tacacagtaa aaaggggaag 3060 tgggggggca gagccccccc acaccccccg cggggggggc agagcccccc ccgcaccccc 3120 cctacgtcac aggccacgcc cccgccgcca tcttgggtgc ggcagggcgg ggactaaaat 3180 ggcgggaccc aatcatttta tactttcact ttccaattaa aacccgccac gtcacacaaa 3240 ag 3242 <210> 62 <211> 101 <212> PRT <213> Torque teno midi virus 1 <400> 62 Met Trp Met Ser Gly Ile Ala Asp Ser His Asp Ser Trp Cys Asp Cys 1 5 10 15 Asp Thr Pro Phe Ala His Leu Leu Ala Ser Ile Phe Pro Pro Gly His 20 25 30 Thr Asp Arg Thr Arg Thr Ile Gln Glu Ile Leu Thr Arg Asp Phe Arg 35 40 45 Lys Thr Cys Leu Ser Gly Gly Ala Asp Ala Thr Asn Ser Gly Met Ala 50 55 60 Glu Thr Ile Glu Glu Lys Arg Glu Asp Phe Gln Lys Glu Glu Lys Glu 65 70 75 80 Asp Phe Thr Glu Glu Gln Asn Ile Glu Asp Leu Leu Ala Ala Val Ala 85 90 95 Asp Ala Glu Gly Arg 100 <210> 63 <211> 237 <212> PRT <213> Torque teno midi virus 1 <400> 63 Met Trp Met Ser Gly Ile Ala Asp Ser His Asp Ser Trp Cys Asp Cys 1 5 10 15 Asp Thr Pro Phe Ala His Leu Leu Ala Ser Ile Phe Pro Pro Gly His 20 25 30 Thr Asp Arg Thr Arg Thr Ile Gln Glu Ile Leu Thr Arg Asp Phe Arg 35 40 45 Lys Thr Cys Leu Ser Gly Gly Ala Asp Ala Thr Asn Ser Gly Met Ala 50 55 60 Glu Thr Ile Glu Glu Lys Arg Glu Asp Phe Gln Lys Glu Glu Lys Glu 65 70 75 80 Asp Phe Thr Glu Glu Gln Asn Ile Glu Asp Leu Leu Ala Ala Val Ala 85 90 95 Asp Ala Glu Gly Arg Tyr Gln Thr Asn Gln Leu Lys Thr Gln Glu Thr 100 105 110 Lys Thr Asn Met Met Cys Pro Ile Gln Ser Lys Lys His Tyr Lys Leu 115 120 125 Leu Thr Gln Gln Lys Thr Leu Leu Pro Arg Cys Ser Met Thr Gly Thr 130 135 140 Thr Asp Gly Val Ala Leu His Gln Gln Leu Leu Lys Glu Cys Asn Lys 145 150 155 160 Thr Ser Gln Leu Ile His Leu Ser Asn Leu Ile Gln Thr Gln Asn Gln 165 170 175 His Pro Arg Lys Lys Asp Tyr Tyr Gln Ser Ser Thr Thr His Lys Arg 180 185 190 Lys Arg Lys Arg Ser Thr Asn Val Ser Ser Leu Ser Ala Lys Lys Val 195 200 205 His Ala Arg Ser Arg Lys Arg Arg Lys Thr Ser Ser Ser Ser Ser Ser 210 215 220 Ser Ser Ser Ser Ser Ser Arg Asn Ser Ser Thr Thr Ser 225 230 235 <210> 64 <211> 239 <212> PRT <213> Torque teno midi virus 1 <400> 64 Met Trp Met Ser Gly Ile Ala Asp Ser His Asp Ser Trp Cys Asp Cys 1 5 10 15 Asp Thr Pro Phe Ala His Leu Leu Ala Ser Ile Phe Pro Pro Gly His 20 25 30 Thr Asp Arg Thr Arg Thr Ile Gln Glu Ile Leu Thr Arg Asp Phe Arg 35 40 45 Lys Thr Cys Leu Ser Gly Gly Ala Asp Ala Thr Asn Ser Gly Met Ala 50 55 60 Glu Thr Ile Glu Glu Lys Arg Glu Asp Phe Gln Lys Glu Glu Lys Glu 65 70 75 80 Asp Phe Thr Glu Glu Gln Asn Ile Glu Asp Leu Leu Ala Ala Val Ala 85 90 95 Asp Ala Glu Gly Arg Thr Ser Thr Gln Glu Lys Lys Thr Thr Thr Ser 100 105 110 Pro Pro Arg Pro Thr Lys Glu Asn Gly Lys Asp Gln Pro Met Ser Pro 115 120 125 Leu Ser Leu Arg Arg Lys Tyr Met Pro Gly Ala Gly Asn Gly Gly Lys 130 135 140 His Pro Gln Ala His Pro Ala Ala Ala Ala Ala Ala Ala Glu Thr Gln 145 150 155 160 Ala Gln Pro Leu Ser Thr Asn Gln Gly Leu Lys Ser Glu Thr Lys Ile 165 170 175 Ile Thr Thr Thr Asn Gly Gly Thr Arg Ile Thr Leu Thr Arg Phe Lys 180 185 190 Pro Gly Phe Glu Gln Glu Thr Glu Lys Glu Leu Ala Gln Ala Phe Asn 195 200 205 Arg Pro Pro Arg Leu Phe Lys Glu Asp Lys Pro Phe Tyr Pro Trp Leu 210 215 220 Pro Arg Phe Thr Pro Leu Val Asn Phe His Leu Asn Phe Lys Gly 225 230 235 <210> 65 <211> 673 <212> PRT <213> Torque teno midi virus 1 <400> 65 Met Pro Phe Trp Trp Gly Arg Arg Asn Lys Phe Trp Tyr Gly Arg Asn 1 5 10 15 Tyr Arg Arg Lys Lys Arg Arg Phe Pro Lys Arg Arg Lys Arg Arg Phe 20 25 30 Tyr Arg Arg Thr Lys Tyr Arg Arg Pro Ala Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg Lys Val Arg Arg Lys Lys Lys Thr Leu Ile Val Arg Gln Trp 50 55 60 Gln Pro Asp Ser Ile Val Leu Cys Lys Ile Lys Gly Tyr Asp Ser Ile 65 70 75 80 Ile Trp Gly Ala Glu Gly Thr Gln Phe Gln Cys Ser Thr His Glu Met 85 90 95 Tyr Glu Tyr Thr Arg Gln Lys Tyr Pro Gly Gly Gly Gly Phe Gly Val 100 105 110 Gln Leu Tyr Ser Leu Glu Tyr Leu Tyr Asp Gln Trp Lys Leu Arg Asn 115 120 125 Asn Ile Trp Thr Lys Thr Asn Gln Leu Lys Asp Leu Cys Arg Tyr Leu 130 135 140 Lys Cys Val Met Thr Phe Tyr Arg His Gln His Ile Asp Phe Val Ile 145 150 155 160 Val Tyr Glu Arg Gln Pro Pro Phe Glu Ile Asp Lys Leu Thr Tyr Met 165 170 175 Lys Tyr His Pro Tyr Met Leu Leu Gln Arg Lys His Lys Ile Ile Leu 180 185 190 Pro Ser Gln Thr Thr Asn Pro Arg Gly Lys Leu Lys Lys Lys Lys Thr 195 200 205 Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Gln Gln Gln 210 215 220 Phe Ala Lys Tyr Asp Leu Leu Leu Ile Ala Ala Ala Ala Cys Ser Leu 225 230 235 240 Arg Tyr Pro Arg Ile Gly Cys Cys Asn Glu Asn Arg Met Ile Thr Leu 245 250 255 Tyr Cys Leu Asn Thr Lys Phe Tyr Gln Asp Thr Glu Trp Gly Thr Thr 260 265 270 Lys Gln Ala Pro His Tyr Phe Lys Pro Tyr Ala Thr Ile Asn Lys Ser 275 280 285 Met Ile Phe Val Ser Asn Tyr Gly Gly Lys Lys Thr Glu Tyr Asn Ile 290 295 300 Gly Gln Trp Ile Glu Thr Asp Ile Pro Gly Glu Gly Asn Leu Ala Arg 305 310 315 320 Tyr Tyr Arg Ser Ile Ser Lys Glu Gly Gly Tyr Phe Ser Pro Lys Ile 325 330 335 Leu Gln Ala Tyr Gln Thr Lys Val Lys Ser Val Asp Tyr Lys Pro Leu 340 345 350 Pro Ile Val Leu Gly Arg Tyr Asn Pro Ala Ile Asp Asp Gly Lys Gly 355 360 365 Asn Lys Ile Tyr Leu Gln Thr Ile Met Asn Gly His Trp Gly Leu Pro 370 375 380 Gln Lys Thr Pro Asp Tyr Ile Ile Glu Glu Val Pro Leu Trp Leu Gly 385 390 395 400 Phe Trp Gly Tyr Tyr Asn Tyr Leu Lys Gln Thr Arg Thr Glu Ala Ile 405 410 415 Phe Pro Leu His Met Phe Val Val Gln Ser Lys Tyr Ile Gln Thr Gln 420 425 430 Gln Thr Glu Thr Pro Asn Asn Phe Trp Ala Phe Ile Asp Asn Ser Phe 435 440 445 Ile Gln Gly Lys Asn Pro Trp Asp Ser Val Ile Thr Tyr Ser Glu Gln 450 455 460 Lys Leu Trp Phe Pro Thr Val Ala Trp Gln Leu Lys Thr Ile Asn Ala 465 470 475 480 Ile Cys Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp Asn Gln Thr Tyr 485 490 495 Ser Thr Trp Glu Leu Ala Thr His Tyr Ser Phe His Phe Lys Trp Gly 500 505 510 Gly Pro Gln Ile Ser Asp Gln Pro Val Glu Asp Pro Gly Asn Lys Asn 515 520 525 Lys Tyr Asp Val Pro Asp Thr Ile Lys Glu Ala Leu Gln Ile Val Asn 530 535 540 Pro Ala Lys Asn Ile Ala Ala Thr Met Phe His Asp Trp Asp Tyr Arg 545 550 555 560 Arg Gly Cys Ile Thr Ser Thr Ala Ile Lys Arg Met Gln Gln Asn Leu 565 570 575 Pro Thr Asp Ser Ser Leu Glu Ser Asp Ser Asp Ser Glu Pro Ala Pro 580 585 590 Lys Lys Lys Arg Leu Leu Pro Val Leu His Asp Pro Gln Lys Lys Thr 595 600 605 Glu Lys Ile Asn Gln Cys Leu Leu Ser Leu Cys Glu Glu Ser Thr Cys 610 615 620 Gln Glu Gln Glu Thr Glu Glu Asn Ile Leu Lys Leu Ile Gln Gln Gln 625 630 635 640 Gln Gln Gln Gln Gln Lys Leu Lys His Asn Leu Leu Val Leu Ile Lys 645 650 655 Asp Leu Lys Val Lys Gln Arg Leu Leu Gln Leu Gln Thr Gly Val Leu 660 665 670 Glu <210> 66 <211> 209 <212> PRT <213> Torque teno midi virus 1 <400> 66 Met Pro Phe Trp Trp Gly Arg Arg Asn Lys Phe Trp Tyr Gly Arg Asn 1 5 10 15 Tyr Arg Arg Lys Lys Arg Arg Phe Pro Lys Arg Arg Lys Arg Arg Phe 20 25 30 Tyr Arg Arg Thr Lys Tyr Arg Arg Pro Ala Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg Lys Ile Ser Asp Gln Pro Val Glu Asp Pro Gly Asn Lys Asn 50 55 60 Lys Tyr Asp Val Pro Asp Thr Ile Lys Glu Ala Leu Gln Ile Val Asn 65 70 75 80 Pro Ala Lys Asn Ile Ala Ala Thr Met Phe His Asp Trp Asp Tyr Arg 85 90 95 Arg Gly Cys Ile Thr Ser Thr Ala Ile Lys Arg Met Gln Gln Asn Leu 100 105 110 Pro Thr Asp Ser Ser Leu Glu Ser Asp Ser Asp Ser Glu Pro Ala Pro 115 120 125 Lys Lys Lys Arg Leu Leu Pro Val Leu His Asp Pro Gln Lys Lys Thr 130 135 140 Glu Lys Ile Asn Gln Cys Leu Leu Ser Leu Cys Glu Glu Ser Thr Cys 145 150 155 160 Gln Glu Gln Glu Thr Glu Glu Asn Ile Leu Lys Leu Ile Gln Gln Gln 165 170 175 Gln Gln Gln Gln Gln Lys Leu Lys His Asn Leu Leu Val Leu Ile Lys 180 185 190 Asp Leu Lys Val Lys Gln Arg Leu Leu Gln Leu Gln Thr Gly Val Leu 195 200 205 Glu <210> 67 <211> 209 <212> PRT <213> Torque teno midi virus 1 <400> 67 Met Pro Phe Trp Trp Gly Arg Arg Asn Lys Phe Trp Tyr Gly Arg Asn 1 5 10 15 Tyr Arg Arg Lys Lys Arg Arg Phe Pro Lys Arg Arg Lys Arg Arg Phe 20 25 30 Tyr Arg Arg Thr Lys Tyr Arg Arg Pro Ala Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg Lys Ile Ser Asp Gln Pro Val Glu Asp Pro Gly Asn Lys Asn 50 55 60 Lys Tyr Asp Val Pro Asp Thr Ile Lys Glu Ala Leu Gln Ile Val Asn 65 70 75 80 Pro Ala Lys Asn Ile Ala Ala Thr Met Phe His Asp Trp Asp Tyr Arg 85 90 95 Arg Gly Cys Ile Thr Ser Thr Ala Ile Lys Arg Met Gln Gln Asn Leu 100 105 110 Pro Thr Asp Ser Ser Leu Glu Ser Asp Ser Asp Ser Glu Pro Ala Pro 115 120 125 Lys Lys Lys Arg Leu Leu Pro Val Leu His Asp Pro Gln Lys Lys Thr 130 135 140 Glu Lys Ile Asn Gln Cys Leu Leu Ser Leu Cys Glu Glu Ser Thr Cys 145 150 155 160 Gln Glu Gln Glu Thr Glu Glu Asn Ile Leu Lys Leu Ile Gln Gln Gln 165 170 175 Gln Gln Gln Gln Gln Lys Leu Lys His Asn Leu Leu Val Leu Ile Lys 180 185 190 Asp Leu Lys Val Lys Gln Arg Leu Leu Gln Leu Gln Thr Gly Val Leu 195 200 205 Glu <210> 68 <211> 25 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (3)..(3) <223> /replace="Ile" <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (24)..(24) <223> Any amino acid <220> <221> SITE <222> (1)..(25) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 68 Leu Ile Leu Arg Gln Trp Gln Pro Xaa Xaa Ile Arg Arg Cys Xaa Ile 1 5 10 15 Xaa Gly Tyr Xaa Pro Leu Ile Xaa Cys 20 25 <210> 69 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 69 Asn Tyr Xaa Xaa His Xaa Asp 1 5 <210> 70 <211> 9 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <400> 70 Phe Ser Leu Xaa Xaa Leu Tyr Asp Glx 1 5 <210> 71 <211> 18 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 71 Asn Xaa Trp Thr Xaa Ser Asn Xaa Asp Leu Asp Leu Cys Arg Tyr Xaa 1 5 10 15 Gly Cys <210> 72 <211> 16 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid <400> 72 Thr Xaa Pro Ser Xaa His Pro Gly Xaa Met Xaa Leu Xaa Lys His Lys 1 5 10 15 <210> 73 <211> 10 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <400> 73 Ile Pro Ser Leu Xaa Thr Arg Pro Xaa Gly 1 5 10 <210> 74 <211> 18 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(16) <223> Any amino acid <400> 74 Arg Ile Xaa Pro Pro Xaa Leu Phe Xaa Asp Lys Trp Tyr Phe Gln Xaa 1 5 10 15 Asp Leu <210> 75 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 75 Leu Leu Xaa Ile Xaa Ala Thr Ala 1 5 <210> 76 <211> 11 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <400> 76 Leu Xaa Xaa Pro Phe Xaa Ser Pro Xaa Thr Asp 1 5 10 <210> 77 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(12) <223> Any amino acid <400> 77 Tyr Asn Pro Xaa Xaa Asp Lys Gly Xaa Gly Asn Xaa Ile Trp 1 5 10 <210> 78 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <400> 78 Cys Pro Tyr Thr Glx Pro Xaa Leu 1 5 <210> 79 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 79 Xaa Phe Gly Xaa Gly Xaa Met Pro 1 5 <210> 80 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <400> 80 His Gln Xaa Glu Val Xaa Glu Xaa 1 5 <210> 81 <211> 12 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <400> 81 Lys Tyr Xaa Phe Xaa Phe Xaa Trp Gly Gly Asn Pro 1 5 10 <210> 82 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 82 His Ser Trp Asp Xaa Arg Arg Gly 1 5 <210> 83 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 83 Ala Ile Lys Arg Xaa Gln Gln 1 5 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(6) <223> Any amino acid <400> 84 Xaa Gln Glx Gln Xaa Xaa Leu Arg 1 5 <210> 85 <211> 9 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> VARIANT <222> (4)..(4) <223> /replace="Ile" <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid <220> <221> SITE <222> (1)..(9) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 85 Pro Arg Xaa Leu Gln Xaa Xaa Asp Pro 1 5 <210> 86 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 86 His Ser Trp Asp Xaa Arg Arg Gly 1 5 <210> 87 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 87 Ala Ile Lys Arg Xaa Gln Gln 1 5 <210> 88 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <400> 88 Gln Glx Gln Xaa Xaa Leu Arg 1 5 <210> 89 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <400> 89 Lys Xaa Lys Arg Arg Arg Arg 1 5 <210> 90 <211> 13 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(11) <223> Any amino acid <400> 90 Pro Ile Xaa Ser Leu Xaa Xaa Tyr Lys Xaa Xaa Thr Arg 1 5 10 <210> 91 <211> 12 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid <400> 91 Leu Ala Xaa Gln Leu Leu Lys Glu Cys Xaa Lys Asn 1 5 10 <210> 92 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid <400> 92 His Leu Asn Xaa Leu Ala 1 5 <210> 93 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 93 Asp Arg Pro Pro Arg 1 5 <210> 94 <211> 9 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <400> 94 Asp Xaa Pro Phe Tyr Pro Trp Xaa Pro 1 5 <210> 95 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 95 Val Xaa Phe Lys Leu Xaa Phe 1 5 <210> 96 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <400> 96 Trp Xaa Pro Pro Val His Asx Val Xaa Gly Ile Glu Arg Xaa Trp 1 5 10 15 <210> 97 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <400> 97 Ala Lys Arg Lys Leu Xaa 1 5 <210> 98 <211> 10 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(8) <223> Any amino acid <400> 98 Pro Ser Ser Xaa Asp Trp Xaa Xaa Glu Tyr 1 5 10 <210> 99 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 99 Asp Arg Pro Pro Arg 1 5 <210> 100 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 100 Pro Phe Tyr Pro Trp 1 5 <210> 101 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <400> 101 Asn Val Xaa Phe Lys Leu Xaa Phe 1 5 <210> 102 <211> 25 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(1) <223> /replace="Ile" <220> <221> MOD_RES <222> (2)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(13) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <220> <221> MOD_RES <222> (19)..(21) <223> Any amino acid <220> <221> VARIANT <222> (22)..(22) <223> /replace="Ile" <220> <221> SITE <222> (1)..(25) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 102 Leu Xaa Xaa Xaa Xaa Trp Gln Pro Xaa Xaa Xaa Xaa Xaa Cys Xaa Ile 1 5 10 15 Xaa Gly Xaa Xaa Xaa Leu Trp Gln Pro 20 25 <210> 103 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid <400> 103 Asn Xaa Trp Xaa Xaa Xaa Asn Xaa Xaa Xaa Xaa Leu Xaa Arg Tyr 1 5 10 15 <210> 104 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <400> 104 Tyr Asn Pro Xaa Xaa Asp Xaa Gly 1 5 <210> 105 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 105 cgggtgccgk aggtgagttt acacaccgma gtcaaggggc aattcgggct crggactggc 60 cgggcyhtgg g 71 <210> 106 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 106 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctwtgg g 71 <210> 107 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 107 cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 108 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 108 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggccctgg g 71 <210> 109 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 109 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctttgg g 71 <210> 110 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 110 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 111 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 111 cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60 cgggctttgg g 71 <210> 112 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 112 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcyhtgg g 71 <210> 113 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 113 cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 114 <211> 70 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 114 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcccggg 70 <210> 115 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 115 cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60 cgggctttgg g 71 <210> 116 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 116 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60 ggccatggg 69 <210> 117 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 117 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggccccgg g 71 <210> 118 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 118 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 119 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 119 cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 120 <211> 117 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> variation <222> (10)..(10) <223> /replace="c" or " " <220> <221> variation <222> (12)..(12) <223> /replace=" " <220> <221> variation <222> (30)..(30) <223> /replace=" " <220> <221> variation <222> (31)..(31) <223> /replace=" " <220> <221> variation <222> (32)..(32) <223> /replace=" " <220> <221> variation <222> (34)..(34) <223> /replace="a" or " " <220> <221> variation <222> (43)..(43) <223> /replace="g" or "t" or " " <220> <221> variation <222> (44)..(44) <223> /replace="c" or " " <220> <221> variation <222> (45)..(45) <223> /replace="c" or " " <220> <221> variation <222> (46)..(46) <223> /replace="a" or " " <220> <221> variation <222> (52)..(52) <223> /replace="t" or " " <220> <221> variation <222> (53)..(53) <223> /replace=" " <220> <221> variation <222> (54)..(54) <223> /replace="c" or " " <220> <221> variation <222> (70)..(70) <223> /replace=" " <220> <221> variation <222> (71)..(71) <223> /replace=" " <220> <221> variation <222> (89)..(89) <223> /replace="t" or " " <220> <221> variation <222> (90)..(90) <223> /replace="c" or "a" or " " <220> <221> variation <222> (103)..(103) <223> /replace=" " <220> <221> misc_feature <222> (1)..(117) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 120 cggcggsggg gcsscgcgct dcgcgcgcsg cccgsyrggg graggcmwgc sgcgcccccc 60 cscgcgcatg cgcrcgggkc cccccccccg sggggggctc cgcccccccg gcccccc 117 <210> 121 <211> 169 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (22)..(22) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (40)..(42) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (53)..(56) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (62)..(62) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (64)..(64) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (97)..(98) <223> a, c, t, g, unknown or other <400> 121 gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60 sncncccccc cccgcgcatg cgcgggkccc ccccccnncg gggggctccg ccccccggcc 120 cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 169 <210> 122 <211> 79 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (22)..(22) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (40)..(42) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (53)..(56) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (62)..(62) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (64)..(64) <223> a, c, t, g, unknown or other <400> 122 gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60 sncncccccc cccgcgcat 79 <210> 123 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (18)..(19) <223> a, c, t, g, unknown or other <400> 123 gcgcgggkcc cccccccnnc ggggggctcc g 31 <210> 124 <211> 59 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 124 ccccccggcc cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 59 <210> 125 <211> 156 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 125 gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60 cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120 aacccaccgc gcatgcgcga ccacgccccc gccgcc 156 <210> 126 <211> 7 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 126 gcggcgg 7 <210> 127 <211> 7 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 127 gggggcg 7 <210> 128 <211> 6 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 128 gccgcg 6 <210> 129 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 129 ttcgcgcgcc gcccaccagg gggtg 25 <210> 130 <211> 5 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 130 ctgcg 5 <210> 131 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 131 cgcccccccc cgcgcat 17 <210> 132 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 132 gcgcggggcc ccccccc 17 <210> 133 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 133 gggggggctc cgcccccccg gccccccccc gtgctaaacc caccgcgcat gcgcgaccac 60 gcccccgccg cc 72 <210> 134 <211> 115 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 134 cggcggcggc ggcgcgcgcg ctgcgcgcgc gcgccggggg ggcgccagcg cccccccccc 60 cgcgcatgca cgggtccccc cccccacggg gggctccgcc ccccggcccc ccccc 115 <210> 135 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 135 cggcggcggc ggcg 14 <210> 136 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 136 cgcgcgctgc gcgcgcg 17 <210> 137 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 137 cgccgggggg gcgccagcg 19 <210> 138 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 138 cccccccccc cgcgcat 17 <210> 139 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 139 gcacgggtcc ccccccccac ggggggctcc g 31 <210> 140 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 140 ccccccggcc ccccccc 17 <210> 141 <211> 121 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 141 ccgtcggcgg gggggccgcg cgctgcgcgc gcggcccccg ggggaggcac agcctccccc 60 ccccgcgcgc atgcgcgcgg gtcccccccc ctccgggggg ctccgccccc cggccccccc 120 c 121 <210> 142 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 142 ccgtcggcgg gggggccgcg cgctgcgcgc gcggccc 37 <210> 143 <211> 84 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 143 ccgggggagg cacagcctcc cccccccgcg cgcatgcgcg cgggtccccc cccctccggg 60 gggctccgcc ccccggcccc cccc 84 <210> 144 <211> 104 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 144 cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60 gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104 <210> 145 <211> 11 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 145 cggcggcggc g 11 <210> 146 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 146 cgcgcgctac gcgcgcg 17 <210> 147 <211> 10 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 147 cgccgggggg 10 <210> 148 <211> 7 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 148 ctgccgc 7 <210> 149 <211> 15 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 149 cccccccccg cgcat 15 <210> 150 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 150 gcgcggggcc ccccccc 17 <210> 151 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 151 gcggggggct ccg 13 <210> 152 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 152 ccccccggcc cccc 14 <210> 153 <211> 122 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 153 gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60 cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120 cg 122 <210> 154 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 154 gccgccgcgg cggcggggg 19 <210> 155 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 155 gcggcgcgct gcgcgcgccg cccagtaggg ggagccatgc g 41 <210> 156 <211> 15 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 156 cccccccccg cgcat 15 <210> 157 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 157 gcgcggggcc ccccccc 17 <210> 158 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 158 gcggggggct ccg 13 <210> 159 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 159 ccccccggcc ccccccg 17 <210> 160 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 160 cgcgctgcgc gcgccgccca gtagggggag ccatgc 36 <210> 161 <211> 78 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 161 ccgccatctt aagtagttga ggcggacggt ggcgtgagtt caaaggtcac catcagccac 60 acctactcaa aatggtgg 78 <210> 162 <211> 172 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 162 cttaagtagt tgaggcggac ggtggcgtga gttcaaaggt caccatcagc cacacctact 60 caaaatggtg gacaatttct tccgggtcaa aggttacagc cgccatgtta aaacacgtga 120 cgtatgacgt cacggccgcc attttgtgac acaagatggc cgacttcctt cc 172 <210> 163 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 163 cgcgctgcgc gcgccgccca gtagggggag ccatgc 36 <210> 164 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 164 gcgctdcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 165 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 165 gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36 <210> 166 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 166 gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36 <210> 167 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 167 gcgctgcgcg cgcggccccc gggggaggca ttgcct 36 <210> 168 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 168 gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36 <210> 169 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 169 gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36 <210> 170 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 170 gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 171 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 171 gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 172 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 172 gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36 <210> 173 <211> 680 <212> PRT <213> Torque teno virus <400> 173 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Trp Arg Pro Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys Pro Thr Leu Val Leu Arg Gln Trp Gln Pro Asp Val Ile Arg 65 70 75 80 His Cys Lys Ile Thr Gly Arg Met Pro Leu Ile Ile Cys Gly Lys Gly 85 90 95 Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg 100 105 110 Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu 115 120 125 Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser 130 135 140 Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu 145 150 155 160 Tyr Arg His Pro Asp Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly 165 170 175 Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Leu Leu 180 185 190 Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys 195 200 205 Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu 210 215 220 Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu 225 230 235 240 Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg 245 250 255 Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser 260 265 270 Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln His Arg Glu Asp Arg Leu 275 280 285 Asn Ile Ile Asn Asn Thr Leu His Pro His Asp Ile Thr Gly Pro Asn 290 295 300 Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr 305 310 315 320 Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Leu Leu Arg Glu Tyr Gly 325 330 335 Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp 340 345 350 Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly 355 360 365 Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser 370 375 380 Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe 385 390 395 400 Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val 405 410 415 Ser Ser Leu Ala Arg Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr 420 425 430 Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile 435 440 445 Thr Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile 450 455 460 Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys 465 470 475 480 Glu Val Leu Glu Ala Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp 485 490 495 Gln Gly Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe 500 505 510 Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys 515 520 525 Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu 530 535 540 Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His 545 550 555 560 Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg 565 570 575 Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro 580 585 590 Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Pro Glu 595 600 605 Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr 610 615 620 Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu 625 630 635 640 Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg 645 650 655 Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly 660 665 670 Val His Trp Asn Pro Glu Leu Thr 675 680 <210> 174 <211> 66 <212> PRT <213> Torque teno virus <400> 174 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Trp Arg Pro Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys 65 <210> 175 <211> 211 <212> PRT <213> Torque teno virus <400> 175 Pro Thr Leu Val Leu Arg Gln Trp Gln Pro Asp Val Ile Arg His Cys 1 5 10 15 Lys Ile Thr Gly Arg Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr 20 25 30 Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala 35 40 45 Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile 50 55 60 Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His 65 70 75 80 Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg 85 90 95 His Pro Asp Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe 100 105 110 Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Leu Leu Met Leu 115 120 125 Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg 130 135 140 Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn 145 150 155 160 Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln 165 170 175 Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser 180 185 190 Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser Ile Tyr 195 200 205 Thr Asn Leu 210 <210> 176 <211> 70 <212> PRT <213> Torque teno virus <400> 176 Ser Asn Leu Pro Gln His Arg Glu Asp Arg Leu Asn Ile Ile Asn Asn 1 5 10 15 Thr Leu His Pro His Asp Ile Thr Gly Pro Asn Asn Lys Lys Trp Gln 20 25 30 Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr Tyr Ser Ala Asn Arg 35 40 45 Ala Ser Thr Tyr Asp Leu Leu Arg Glu Tyr Gly Leu Tyr Ser Pro Tyr 50 55 60 Tyr Leu Asn Pro Thr Arg 65 70 <210> 177 <211> 166 <212> PRT <213> Torque teno virus <400> 177 Ile Asn Leu Asp Trp Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro 1 5 10 15 Leu Val Asp Lys Gly Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser 20 25 30 Glu Ala Asp Val Ser Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln 35 40 45 Asp Met Pro Leu Phe Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile 50 55 60 Lys Asn Thr Gly Val Ser Ser Leu Ala Arg Asp Ala Arg Ile Cys Ile 65 70 75 80 Arg Cys Pro Tyr Thr Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile 85 90 95 Gly Phe Val Pro Ile Thr Glu Thr Phe Met Arg Gly Asp Met Pro Val 100 105 110 Leu Ala Pro Tyr Ile Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn 115 120 125 Ile Ala His Gln Lys Glu Val Leu Glu Ala Ile Ile Ser Cys Ser Pro 130 135 140 Phe Met Pro Arg Asp Gln Gly Met Asn Gly Trp Asp Ile Thr Ile Gly 145 150 155 160 Tyr Lys Met Asp Phe Leu 165 <210> 178 <211> 167 <212> PRT <213> Torque teno virus <400> 178 Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys Gln 1 5 10 15 Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu 20 25 30 Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys 35 40 45 Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val 50 55 60 Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser 65 70 75 80 Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Pro Glu Gln 85 90 95 Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro 100 105 110 Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu 115 120 125 Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg 130 135 140 Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val 145 150 155 160 His Trp Asn Pro Glu Leu Thr 165 <210> 179 <211> 747 <212> PRT <213> Torque teno virus <400> 179 Met Ala Tyr Trp Trp Gly Arg Arg Arg Arg Trp Arg Arg Trp Arg Arg 1 5 10 15 Arg Arg Arg Pro Leu Arg Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg 20 25 30 Trp Pro Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg Arg Ala Arg Pro 35 40 45 Ala Arg Arg Tyr Arg Arg Arg Arg Gly Arg Arg Arg Val Arg Arg Arg 50 55 60 Arg Arg Pro Gln Lys Leu Val Leu Thr Gln Trp Asn Pro Gln Thr Val 65 70 75 80 Arg Lys Cys Val Ile Arg Gly Phe Leu Pro Leu Phe Phe Cys Gly Gln 85 90 95 Gly Ala Tyr His Arg Asn Phe Thr Asp His Tyr Asp Asp Val Phe Pro 100 105 110 Lys Gly Pro Ser Gly Gly Gly His Gly Ser Met Val Phe Asn Leu Ser 115 120 125 Phe Leu Tyr Gln Glu Phe Lys Lys His His Asn Lys Trp Ser Arg Ser 130 135 140 Asn Leu Asp Phe Asp Leu Val Arg Tyr Lys Gly Thr Val Ile Lys Leu 145 150 155 160 Tyr Arg His Gln Asp Phe Asp Tyr Ile Val Trp Ile Ser Arg Thr Pro 165 170 175 Pro Phe Gln Glu Ser Leu Leu Thr Val Met Thr His Gln Pro Ser Val 180 185 190 Met Leu Gln Ala Lys Lys Cys Ile Ile Val Lys Ser Tyr Arg Thr His 195 200 205 Pro Gly Gly Lys Pro Tyr Val Thr Ala Lys Val Arg Pro Pro Arg Leu 210 215 220 Leu Thr Asp Lys Trp Tyr Phe Gln Ser Asp Phe Cys Asn Val Pro Leu 225 230 235 240 Phe Ser Leu Gln Phe Ala Leu Ala Glu Leu Arg Phe Pro Ile Cys Ser 245 250 255 Pro Gln Thr Asp Thr Asn Cys Ile Asn Phe Leu Val Leu Asp Asp Ile 260 265 270 Tyr Tyr Lys Phe Leu Asp Asn Lys Pro Lys Gln Ser Ser Asp Pro Asn 275 280 285 Asp Glu Asn Arg Ile Lys Phe Trp His Gly Leu Trp Ser Thr Met Arg 290 295 300 Tyr Leu Asn Thr Thr Tyr Ile Asn Thr Leu Phe Pro Gly Thr Asp Ser 305 310 315 320 Leu Val Ala Ala Lys Asp Thr Asp Asn Ser Val Asn Lys Tyr Pro Ser 325 330 335 Thr Ala Thr Lys Gln Pro Tyr Lys Asp Ser Gln Tyr Met Gln Asn Ile 340 345 350 Trp Asn Thr Ser Lys Ile His Ala Leu Tyr Thr Trp Val Ala Glu Thr 355 360 365 Asn Tyr Lys Arg Leu Gln Ala Tyr Tyr Thr Gln Thr Tyr Gly Gly Tyr 370 375 380 Gln Arg Gln Phe Phe Thr Gly Lys Gln Tyr Trp Asp Tyr Arg Val Gly 385 390 395 400 Met Phe Ser Pro Ala Phe Leu Ser Pro Ser Arg Leu Asn Pro Gln Asn 405 410 415 Pro Gly Ala Tyr Thr Glu Val Ser Tyr Asn Pro Trp Thr Asp Glu Gly 420 425 430 Thr Gly Asn Val Val Cys Leu Gln Tyr Leu Thr Lys Glu Thr Ser Asp 435 440 445 Tyr Lys Pro Gly Gly Gly Ser Lys Phe Cys Ile Glu Gly Val Pro Leu 450 455 460 Trp Ala Ala Leu Val Gly Tyr Val Asp Met Cys Lys Lys Glu Gly Lys 465 470 475 480 Asp Pro Gly Ile Arg Leu Asn Cys Leu Leu Leu Val Lys Cys Pro Tyr 485 490 495 Thr Lys Pro Gln Leu Tyr Asp Lys Lys Asn Pro Glu Lys Leu Phe Val 500 505 510 Pro Tyr Ser Tyr Asn Phe Gly His Gly Lys Met Pro Gly Gly Asp Lys 515 520 525 Tyr Ile Pro Ile Glu Phe Lys Asp Arg Trp Tyr Pro Cys Leu Leu His 530 535 540 Gln Glu Glu Trp Ile Glu Asp Ile Val Arg Ser Gly Pro Phe Val Pro 545 550 555 560 Lys Asp Met Pro Ser Ser Val Thr Cys Met Met Arg Tyr Ser Ser Leu 565 570 575 Phe Asn Trp Gly Gly Asn Ile Ile Gln Glu Gln Ala Val Glu Asp Pro 580 585 590 Cys Lys Lys Gly Thr Phe Val Val Pro Gly Thr Ser Gly Ile Ala Arg 595 600 605 Ile Leu Gln Val Ser Asn Pro Ala Lys Gln Thr Pro Thr Thr Thr Trp 610 615 620 His Ser Trp Asp Trp Arg Arg Ser Leu Phe Thr Glu Thr Gly Leu Lys 625 630 635 640 Arg Met Arg Glu Gln Gln Pro Tyr Asp Glu Leu Ser Tyr Thr Gly Pro 645 650 655 Lys Lys Pro Lys Leu Ser Leu Pro Ala Gly Pro Ala Val Pro Gly Ala 660 665 670 Ala Val Ala Ser Ser Trp Trp Glu Thr Lys Gln Val Thr Ser Pro Asp 675 680 685 Val Ser Glu Thr Glu Thr Glu Ala Glu Ala His Gln Glu Glu Glu Thr 690 695 700 Glu Pro Glu Glu Gly Val Gln Leu Gln Gln Leu Trp Glu Gln Gln Leu 705 710 715 720 Leu Gln Lys Arg Gln Leu Gly Val Val Phe Gln Gln Leu Leu Arg Leu 725 730 735 Arg Gln Gly Ala Glu Ile His Pro Gly Leu Val 740 745 <210> 180 <211> 69 <212> PRT <213> Torque teno virus <400> 180 Met Ala Tyr Trp Trp Gly Arg Arg Arg Arg Trp Arg Arg Trp Arg Arg 1 5 10 15 Arg Arg Arg Pro Leu Arg Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg 20 25 30 Trp Pro Arg Arg Arg Arg Trp Arg Arg Arg Arg Arg Arg Ala Arg Pro 35 40 45 Ala Arg Arg Tyr Arg Arg Arg Arg Gly Arg Arg Arg Val Arg Arg Arg 50 55 60 Arg Arg Pro Gln Lys 65 <210> 181 <211> 210 <212> PRT <213> Torque teno virus <400> 181 Leu Val Leu Thr Gln Trp Asn Pro Gln Thr Val Arg Lys Cys Val Ile 1 5 10 15 Arg Gly Phe Leu Pro Leu Phe Phe Cys Gly Gln Gly Ala Tyr His Arg 20 25 30 Asn Phe Thr Asp His Tyr Asp Asp Val Phe Pro Lys Gly Pro Ser Gly 35 40 45 Gly Gly His Gly Ser Met Val Phe Asn Leu Ser Phe Leu Tyr Gln Glu 50 55 60 Phe Lys Lys His His Asn Lys Trp Ser Arg Ser Asn Leu Asp Phe Asp 65 70 75 80 Leu Val Arg Tyr Lys Gly Thr Val Ile Lys Leu Tyr Arg His Gln Asp 85 90 95 Phe Asp Tyr Ile Val Trp Ile Ser Arg Thr Pro Pro Phe Gln Glu Ser 100 105 110 Leu Leu Thr Val Met Thr His Gln Pro Ser Val Met Leu Gln Ala Lys 115 120 125 Lys Cys Ile Ile Val Lys Ser Tyr Arg Thr His Pro Gly Gly Lys Pro 130 135 140 Tyr Val Thr Ala Lys Val Arg Pro Pro Arg Leu Leu Thr Asp Lys Trp 145 150 155 160 Tyr Phe Gln Ser Asp Phe Cys Asn Val Pro Leu Phe Ser Leu Gln Phe 165 170 175 Ala Leu Ala Glu Leu Arg Phe Pro Ile Cys Ser Pro Gln Thr Asp Thr 180 185 190 Asn Cys Ile Asn Phe Leu Val Leu Asp Asp Ile Tyr Tyr Lys Phe Leu 195 200 205 Asp Asn 210 <210> 182 <211> 132 <212> PRT <213> Torque teno virus <400> 182 Lys Pro Lys Gln Ser Ser Asp Pro Asn Asp Glu Asn Arg Ile Lys Phe 1 5 10 15 Trp His Gly Leu Trp Ser Thr Met Arg Tyr Leu Asn Thr Thr Tyr Ile 20 25 30 Asn Thr Leu Phe Pro Gly Thr Asp Ser Leu Val Ala Ala Lys Asp Thr 35 40 45 Asp Asn Ser Val Asn Lys Tyr Pro Ser Thr Ala Thr Lys Gln Pro Tyr 50 55 60 Lys Asp Ser Gln Tyr Met Gln Asn Ile Trp Asn Thr Ser Lys Ile His 65 70 75 80 Ala Leu Tyr Thr Trp Val Ala Glu Thr Asn Tyr Lys Arg Leu Gln Ala 85 90 95 Tyr Tyr Thr Gln Thr Tyr Gly Gly Tyr Gln Arg Gln Phe Phe Thr Gly 100 105 110 Lys Gln Tyr Trp Asp Tyr Arg Val Gly Met Phe Ser Pro Ala Phe Leu 115 120 125 Ser Pro Ser Arg 130 <210> 183 <211> 167 <212> PRT <213> Torque teno virus <400> 183 Leu Asn Pro Gln Asn Pro Gly Ala Tyr Thr Glu Val Ser Tyr Asn Pro 1 5 10 15 Trp Thr Asp Glu Gly Thr Gly Asn Val Val Cys Leu Gln Tyr Leu Thr 20 25 30 Lys Glu Thr Ser Asp Tyr Lys Pro Gly Gly Gly Ser Lys Phe Cys Ile 35 40 45 Glu Gly Val Pro Leu Trp Ala Ala Leu Val Gly Tyr Val Asp Met Cys 50 55 60 Lys Lys Glu Gly Lys Asp Pro Gly Ile Arg Leu Asn Cys Leu Leu Leu 65 70 75 80 Val Lys Cys Pro Tyr Thr Lys Pro Gln Leu Tyr Asp Lys Lys Asn Pro 85 90 95 Glu Lys Leu Phe Val Pro Tyr Ser Tyr Asn Phe Gly His Gly Lys Met 100 105 110 Pro Gly Gly Asp Lys Tyr Ile Pro Ile Glu Phe Lys Asp Arg Trp Tyr 115 120 125 Pro Cys Leu Leu His Gln Glu Glu Trp Ile Glu Asp Ile Val Arg Ser 130 135 140 Gly Pro Phe Val Pro Lys Asp Met Pro Ser Ser Val Thr Cys Met Met 145 150 155 160 Arg Tyr Ser Ser Leu Phe Asn 165 <210> 184 <211> 169 <212> PRT <213> Torque teno virus <400> 184 Trp Gly Gly Asn Ile Ile Gln Glu Gln Ala Val Glu Asp Pro Cys Lys 1 5 10 15 Lys Gly Thr Phe Val Val Pro Gly Thr Ser Gly Ile Ala Arg Ile Leu 20 25 30 Gln Val Ser Asn Pro Ala Lys Gln Thr Pro Thr Thr Thr Trp His Ser 35 40 45 Trp Asp Trp Arg Arg Ser Leu Phe Thr Glu Thr Gly Leu Lys Arg Met 50 55 60 Arg Glu Gln Gln Pro Tyr Asp Glu Leu Ser Tyr Thr Gly Pro Lys Lys 65 70 75 80 Pro Lys Leu Ser Leu Pro Ala Gly Pro Ala Val Pro Gly Ala Ala Val 85 90 95 Ala Ser Ser Trp Trp Glu Thr Lys Gln Val Thr Ser Pro Asp Val Ser 100 105 110 Glu Thr Glu Thr Glu Ala Glu Ala His Gln Glu Glu Glu Thr Glu Pro 115 120 125 Glu Glu Gly Val Gln Leu Gln Gln Leu Trp Glu Gln Gln Leu Leu Gln 130 135 140 Lys Arg Gln Leu Gly Val Val Phe Gln Gln Leu Leu Arg Leu Arg Gln 145 150 155 160 Gly Ala Glu Ile His Pro Gly Leu Val 165 <210> 185 <211> 743 <212> PRT <213> Torque teno virus <400> 185 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val 65 70 75 80 Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly 85 90 95 Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile 100 105 110 Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu 115 120 125 Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg 130 135 140 Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys 145 150 155 160 Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg 165 170 175 Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly 180 185 190 Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr 195 200 205 Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr 210 215 220 Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr 225 230 235 240 Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys 245 250 255 Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 260 265 270 Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser 275 280 285 Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly 290 295 300 Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly 305 310 315 320 Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys 325 330 335 Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp 340 345 350 Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile 355 360 365 Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu 370 375 380 Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu 385 390 395 400 Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro 405 410 415 Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp 420 425 430 Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn 435 440 445 Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro 450 455 460 Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr 465 470 475 480 Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro 485 490 495 Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr 500 505 510 Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser 515 520 525 Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu 530 535 540 His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala 545 550 555 560 Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe 565 570 575 Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp 580 585 590 Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro 595 600 605 Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser 610 615 620 Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile 625 630 635 640 Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly 645 650 655 Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu 660 665 670 Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu 675 680 685 Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe 690 695 700 Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln 705 710 715 720 Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val 725 730 735 His Val Asn Pro Cys Leu Arg 740 <210> 186 <211> 68 <212> PRT <213> Torque teno virus <400> 186 Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys 1 5 10 15 Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg 20 25 30 Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg 35 40 45 Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg 50 55 60 Arg Gly Arg Lys 65 <210> 187 <211> 212 <212> PRT <213> Torque teno virus <400> 187 Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys 1 5 10 15 Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe 20 25 30 Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro 35 40 45 Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe 50 55 60 Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn 65 70 75 80 Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His 85 90 95 Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly 100 105 110 Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu 115 120 125 Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly 130 135 140 Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp 145 150 155 160 Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile 165 170 175 Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr 180 185 190 Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn 195 200 205 Tyr Leu Ser Ile 210 <210> 188 <211> 133 <212> PRT <213> Torque teno virus <400> 188 Asn Thr Phe Asn Asn Asp Asn Ser Asp Ser Lys Leu Lys Glu Phe Leu 1 5 10 15 Asn Lys Ala Phe Pro Thr Thr Gly Thr Lys Gly Thr Ser Leu Asn Ala 20 25 30 Leu Asn Thr Phe Arg Thr Glu Gly Cys Ile Ser His Pro Gln Leu Lys 35 40 45 Lys Pro Asn Pro Gln Ile Asn Lys Pro Leu Glu Ser Gln Tyr Phe Ala 50 55 60 Pro Leu Asp Ala Leu Trp Gly Asp Pro Ile Tyr Tyr Asn Asp Leu Asn 65 70 75 80 Glu Asn Lys Ser Leu Asn Asp Ile Ile Glu Lys Ile Leu Ile Lys Asn 85 90 95 Met Ile Thr Tyr His Ala Lys Leu Arg Glu Phe Pro Asn Ser Tyr Gln 100 105 110 Gly Asn Lys Ala Phe Cys His Leu Thr Gly Ile Tyr Ser Pro Pro Tyr 115 120 125 Leu Asn Gln Gly Arg 130 <210> 189 <211> 166 <212> PRT <213> Torque teno virus <400> 189 Ile Ser Pro Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro 1 5 10 15 Tyr Thr Asp Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr 20 25 30 Lys Glu Asn Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr 35 40 45 Asp Met Pro Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys 50 55 60 Lys Asp Thr Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu 65 70 75 80 Ile Cys Pro Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp 85 90 95 Tyr Gly Tyr Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro 100 105 110 Asp Gly Ser Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro 115 120 125 Thr Val Leu His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly 130 135 140 Pro Phe Ala Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys 145 150 155 160 Tyr Cys Phe Asn Phe Asn 165 <210> 190 <211> 164 <212> PRT <213> Torque teno virus <400> 190 Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp Pro Ser Phe 1 5 10 15 Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile 20 25 30 Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser 35 40 45 Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val 50 55 60 Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys 65 70 75 80 Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His 85 90 95 Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu 100 105 110 Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln 115 120 125 Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys 130 135 140 Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn 145 150 155 160 Pro Cys Leu Arg <210> 191 <211> 780 <212> PRT <213> Torque teno virus <400> 191 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Lys Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Ala Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Phe Arg Arg Tyr Arg Thr Arg Thr Val Arg Arg Arg 35 40 45 Arg Arg Gly Arg Arg Arg Gly Tyr Arg Arg Arg Tyr Arg Leu Arg Arg 50 55 60 Tyr Ala Arg Arg Arg Phe Arg Arg Lys Lys Ile Val Leu Thr Gln Trp 65 70 75 80 Asn Pro Gln Thr Thr Arg Lys Cys Ile Ile Arg Gly Met Met Pro Val 85 90 95 Leu Trp Ala Gly Met Gly Thr Gly Gly Arg Asn Tyr Ala Val Arg Ser 100 105 110 Asp Asp Tyr Val Val Asn Lys Gly Phe Gly Gly Ser Phe Ala Thr Glu 115 120 125 Thr Phe Ser Leu Lys Val Leu Tyr Asp Gln Phe Gln Arg Gly Phe Asn 130 135 140 Arg Trp Ser His Thr Asn Glu Asp Leu Asp Leu Ala Arg Tyr Arg Gly 145 150 155 160 Cys Arg Trp Thr Phe Tyr Arg His Lys Asp Thr Asp Phe Ile Val Tyr 165 170 175 Phe Thr Asn Asn Pro Pro Met Lys Thr Asn Gln Phe Ser Ala Pro Leu 180 185 190 Thr Thr Pro Gly Met Leu Met Arg Ser Lys Tyr Lys Val Leu Ile Pro 195 200 205 Ser Phe Gln Thr Arg Pro Lys Gly Arg Lys Thr Val Thr Val Lys Ile 210 215 220 Arg Pro Pro Lys Leu Phe Gln Asp Lys Trp Tyr Thr Gln Gln Asp Leu 225 230 235 240 Cys Ser Val Pro Leu Val Gln Leu Asn Val Thr Ala Ala Asp Phe Thr 245 250 255 His Pro Phe Gly Ser Pro Leu Thr Glu Thr Pro Cys Val Glu Phe Gln 260 265 270 Val Leu Gly Asp Leu Tyr Asn Thr Cys Leu Asn Ile Asp Leu Pro Gln 275 280 285 Phe Ser Glu Leu Gly Glu Ile Thr Ser Ala Tyr Ser Lys Pro Asn Ser 290 295 300 Asn Asn Leu Lys Glu Leu Tyr Lys Glu Leu Phe Thr Lys Ala Thr Ser 305 310 315 320 Gly His Tyr Trp Gln Thr Phe Ile Thr Asn Ser Met Val Arg Ala His 325 330 335 Ile Asp Ala Asp Lys Ala Lys Glu Ala Gln Arg Ala Ser Thr Thr Pro 340 345 350 Ser Tyr Asn Asn Asp Pro Phe Pro Thr Ile Pro Val Lys Ser Glu Phe 355 360 365 Ala Gln Trp Lys Lys Lys Phe Thr Asp Thr Arg Asp Ser Pro Phe Leu 370 375 380 Phe Ala Thr Tyr His Pro Glu Ala Ile Lys Asp Thr Ile Met Lys Met 385 390 395 400 Arg Glu Asn Asn Phe Lys Leu Glu Thr Gly Pro Asn Asp Lys Tyr Gly 405 410 415 Asp Tyr Thr Ala Gln Tyr Gln Gly Asn Thr His Met Leu Asp Tyr Tyr 420 425 430 Leu Gly Phe Tyr Ser Pro Ile Phe Leu Ser Asp Gly Arg Ser Asn Val 435 440 445 Glu Phe Phe Thr Ala Tyr Arg Asp Ile Val Tyr Asn Pro Phe Leu Asp 450 455 460 Lys Ala Gln Gly Asn Met Val Trp Phe Gln Tyr His Thr Lys Thr Asp 465 470 475 480 Asn Lys Phe Lys Lys Pro Glu Cys His Trp Glu Ile Lys Asp Met Pro 485 490 495 Leu Trp Ala Leu Leu Asn Gly Tyr Val Asp Tyr Leu Glu Thr Gln Ile 500 505 510 Gln Tyr Gly Asp Leu Ser Lys Glu Gly Lys Val Leu Ile Arg Cys Pro 515 520 525 Tyr Thr Lys Pro Ala Leu Val Asp Pro Arg Asp Asp Thr Ala Gly Tyr 530 535 540 Val Val Tyr Asn Arg Asn Phe Gly Arg Gly Lys Trp Ile Asp Gly Gly 545 550 555 560 Gly Tyr Ile Pro Leu His Glu Arg Thr Lys Trp Tyr Val Met Leu Arg 565 570 575 Tyr Gln Thr Asp Val Phe His Asp Ile Val Thr Cys Gly Pro Trp Gln 580 585 590 Tyr Arg Asp Asp Asn Lys Asn Ser Gln Leu Val Ala Lys Tyr Arg Phe 595 600 605 Ser Phe Ile Trp Gly Gly Asn Thr Val His Ser Gln Val Ile Arg Asn 610 615 620 Pro Cys Lys Asp Asn Gln Val Ser Gly Pro Arg Arg Gln Pro Arg Asp 625 630 635 640 Ile Gln Val Val Asp Pro Gln Arg Ile Thr Pro Pro Trp Val Leu His 645 650 655 Ser Phe Asp Gln Arg Arg Gly Leu Phe Thr Glu Thr Ala Leu Arg Arg 660 665 670 Leu Leu Gln Glu Pro Leu Pro Gly Glu Tyr Ala Val Ser Thr Leu Arg 675 680 685 Thr Pro Leu Leu Phe Leu Pro Ser Glu Tyr Gln Arg Glu Asp Gly Ala 690 695 700 Ala Glu Ser Ala Ser Gly Ser Pro Ala Lys Arg Pro Arg Ile Trp Ser 705 710 715 720 Glu Glu Ser Gln Thr Glu Thr Ile Ser Ser Glu Glu Asn Pro Ala Glu 725 730 735 Thr Thr Arg Glu Leu Leu Gln Arg Lys Leu Arg Glu Gln Arg Ala Leu 740 745 750 Gln Phe Gln Leu Gln His Phe Ala Val Gln Leu Ala Lys Thr Gln Ala 755 760 765 Asn Leu His Val Asn Pro Leu Leu Ser Phe Pro Gln 770 775 780 <210> 192 <211> 74 <212> PRT <213> Torque teno virus <400> 192 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Lys Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Ala Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Phe Arg Arg Tyr Arg Thr Arg Thr Val Arg Arg Arg 35 40 45 Arg Arg Gly Arg Arg Arg Gly Tyr Arg Arg Arg Tyr Arg Leu Arg Arg 50 55 60 Tyr Ala Arg Arg Arg Phe Arg Arg Lys Lys 65 70 <210> 193 <211> 210 <212> PRT <213> Torque teno virus <400> 193 Ile Val Leu Thr Gln Trp Asn Pro Gln Thr Thr Arg Lys Cys Ile Ile 1 5 10 15 Arg Gly Met Met Pro Val Leu Trp Ala Gly Met Gly Thr Gly Gly Arg 20 25 30 Asn Tyr Ala Val Arg Ser Asp Asp Tyr Val Val Asn Lys Gly Phe Gly 35 40 45 Gly Ser Phe Ala Thr Glu Thr Phe Ser Leu Lys Val Leu Tyr Asp Gln 50 55 60 Phe Gln Arg Gly Phe Asn Arg Trp Ser His Thr Asn Glu Asp Leu Asp 65 70 75 80 Leu Ala Arg Tyr Arg Gly Cys Arg Trp Thr Phe Tyr Arg His Lys Asp 85 90 95 Thr Asp Phe Ile Val Tyr Phe Thr Asn Asn Pro Pro Met Lys Thr Asn 100 105 110 Gln Phe Ser Ala Pro Leu Thr Thr Pro Gly Met Leu Met Arg Ser Lys 115 120 125 Tyr Lys Val Leu Ile Pro Ser Phe Gln Thr Arg Pro Lys Gly Arg Lys 130 135 140 Thr Val Thr Val Lys Ile Arg Pro Pro Lys Leu Phe Gln Asp Lys Trp 145 150 155 160 Tyr Thr Gln Gln Asp Leu Cys Ser Val Pro Leu Val Gln Leu Asn Val 165 170 175 Thr Ala Ala Asp Phe Thr His Pro Phe Gly Ser Pro Leu Thr Glu Thr 180 185 190 Pro Cys Val Glu Phe Gln Val Leu Gly Asp Leu Tyr Asn Thr Cys Leu 195 200 205 Asn Ile 210 <210> 194 <211> 161 <212> PRT <213> Torque teno virus <400> 194 Asp Leu Pro Gln Phe Ser Glu Leu Gly Glu Ile Thr Ser Ala Tyr Ser 1 5 10 15 Lys Pro Asn Ser Asn Asn Leu Lys Glu Leu Tyr Lys Glu Leu Phe Thr 20 25 30 Lys Ala Thr Ser Gly His Tyr Trp Gln Thr Phe Ile Thr Asn Ser Met 35 40 45 Val Arg Ala His Ile Asp Ala Asp Lys Ala Lys Glu Ala Gln Arg Ala 50 55 60 Ser Thr Thr Pro Ser Tyr Asn Asn Asp Pro Phe Pro Thr Ile Pro Val 65 70 75 80 Lys Ser Glu Phe Ala Gln Trp Lys Lys Lys Phe Thr Asp Thr Arg Asp 85 90 95 Ser Pro Phe Leu Phe Ala Thr Tyr His Pro Glu Ala Ile Lys Asp Thr 100 105 110 Ile Met Lys Met Arg Glu Asn Asn Phe Lys Leu Glu Thr Gly Pro Asn 115 120 125 Asp Lys Tyr Gly Asp Tyr Thr Ala Gln Tyr Gln Gly Asn Thr His Met 130 135 140 Leu Asp Tyr Tyr Leu Gly Phe Tyr Ser Pro Ile Phe Leu Ser Asp Gly 145 150 155 160 Arg <210> 195 <211> 166 <212> PRT <213> Torque teno virus <400> 195 Ser Asn Val Glu Phe Phe Thr Ala Tyr Arg Asp Ile Val Tyr Asn Pro 1 5 10 15 Phe Leu Asp Lys Ala Gln Gly Asn Met Val Trp Phe Gln Tyr His Thr 20 25 30 Lys Thr Asp Asn Lys Phe Lys Lys Pro Glu Cys His Trp Glu Ile Lys 35 40 45 Asp Met Pro Leu Trp Ala Leu Leu Asn Gly Tyr Val Asp Tyr Leu Glu 50 55 60 Thr Gln Ile Gln Tyr Gly Asp Leu Ser Lys Glu Gly Lys Val Leu Ile 65 70 75 80 Arg Cys Pro Tyr Thr Lys Pro Ala Leu Val Asp Pro Arg Asp Asp Thr 85 90 95 Ala Gly Tyr Val Val Tyr Asn Arg Asn Phe Gly Arg Gly Lys Trp Ile 100 105 110 Asp Gly Gly Gly Tyr Ile Pro Leu His Glu Arg Thr Lys Trp Tyr Val 115 120 125 Met Leu Arg Tyr Gln Thr Asp Val Phe His Asp Ile Val Thr Cys Gly 130 135 140 Pro Trp Gln Tyr Arg Asp Asp Asn Lys Asn Ser Gln Leu Val Ala Lys 145 150 155 160 Tyr Arg Phe Ser Phe Ile 165 <210> 196 <211> 169 <212> PRT <213> Torque teno virus <400> 196 Trp Gly Gly Asn Thr Val His Ser Gln Val Ile Arg Asn Pro Cys Lys 1 5 10 15 Asp Asn Gln Val Ser Gly Pro Arg Arg Gln Pro Arg Asp Ile Gln Val 20 25 30 Val Asp Pro Gln Arg Ile Thr Pro Pro Trp Val Leu His Ser Phe Asp 35 40 45 Gln Arg Arg Gly Leu Phe Thr Glu Thr Ala Leu Arg Arg Leu Leu Gln 50 55 60 Glu Pro Leu Pro Gly Glu Tyr Ala Val Ser Thr Leu Arg Thr Pro Leu 65 70 75 80 Leu Phe Leu Pro Ser Glu Tyr Gln Arg Glu Asp Gly Ala Ala Glu Ser 85 90 95 Ala Ser Gly Ser Pro Ala Lys Arg Pro Arg Ile Trp Ser Glu Glu Ser 100 105 110 Gln Thr Glu Thr Ile Ser Ser Glu Glu Asn Pro Ala Glu Thr Thr Arg 115 120 125 Glu Leu Leu Gln Arg Lys Leu Arg Glu Gln Arg Ala Leu Gln Phe Gln 130 135 140 Leu Gln His Phe Ala Val Gln Leu Ala Lys Thr Gln Ala Asn Leu His 145 150 155 160 Val Asn Pro Leu Leu Ser Phe Pro Gln 165 <210> 197 <211> 761 <212> PRT <213> Torque teno virus <400> 197 Met Ala Tyr Trp Phe Arg Arg Trp Gly Trp Arg Pro Arg Arg Arg Trp 1 5 10 15 Arg Arg Trp Arg Arg Arg Arg Arg Arg Leu Pro Arg Arg Arg Thr Arg 20 25 30 Arg Ala Val Arg Gly Leu Gly Arg Arg Arg Lys Pro Arg Val Arg Arg 35 40 45 Arg Arg Arg Thr Arg Arg Arg Thr Tyr Arg Arg Gly Trp Arg Arg Arg 50 55 60 Arg Tyr Ile Arg Arg Gly Arg Arg Lys Lys Lys Leu Ile Leu Thr Gln 65 70 75 80 Trp Asn Pro Ala Ile Val Lys Arg Cys Asn Ile Lys Gly Gly Leu Pro 85 90 95 Ile Ile Ile Cys Gly Glu Pro Arg Ala Ala Phe Asn Tyr Gly Tyr His 100 105 110 Met Glu Asp Tyr Thr Pro Gln Pro Phe Pro Phe Gly Gly Gly Met Ser 115 120 125 Thr Val Thr Phe Ser Leu Lys Ala Leu Tyr Asp Gln Tyr Leu Lys His 130 135 140 Gln Asn Arg Trp Thr Phe Ser Asn Asp Gln Leu Asp Leu Ala Arg Tyr 145 150 155 160 Arg Gly Cys Lys Leu Arg Phe Tyr Arg Ser Pro Val Cys Asp Phe Ile 165 170 175 Val His Tyr Asn Leu Ile Pro Pro Leu Lys Met Asn Gln Phe Thr Ser 180 185 190 Pro Asn Thr His Pro Gly Leu Leu Met Leu Ser Lys His Lys Ile Ile 195 200 205 Ile Pro Ser Phe Gln Thr Arg Pro Gly Gly Arg Arg Phe Val Lys Ile 210 215 220 Arg Leu Asn Pro Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Gln 225 230 235 240 Asp Leu Cys Lys Val Pro Leu Val Ser Ile Thr Ala Thr Ala Ala Asp 245 250 255 Leu Arg Tyr Pro Phe Cys Ser Pro Gln Thr Asn Asn Pro Cys Thr Thr 260 265 270 Phe Gln Val Leu Arg Lys Asn Tyr Asn Thr Val Ile Gly Thr Ser Val 275 280 285 Lys Asp Gln Glu Ser Thr Gln Asp Phe Glu Asn Trp Leu Tyr Lys Thr 290 295 300 Asp Ser His Tyr Gln Thr Phe Ala Thr Glu Ala Gln Leu Gly Arg Ile 305 310 315 320 Pro Ala Phe Asn Pro Asp Gly Thr Lys Asn Thr Lys Gln Gln Ser Trp 325 330 335 Gln Asp Asn Trp Ser Lys Lys Asn Ser Pro Trp Thr Gly Asn Ser Gly 340 345 350 Thr Tyr Pro Gln Thr Thr Ser Glu Met Tyr Lys Ile Pro Tyr Asp Ser 355 360 365 Asn Phe Gly Phe Pro Thr Tyr Arg Ala Gln Lys Asp Tyr Ile Leu Glu 370 375 380 Arg Arg Gln Cys Asn Phe Asn Tyr Glu Val Asn Asn Pro Val Ser Lys 385 390 395 400 Lys Val Trp Pro Gln Pro Ser Thr Thr Thr Pro Thr Val Asp Tyr Tyr 405 410 415 Glu Tyr His Cys Gly Trp Phe Ser Asn Ile Phe Ile Gly Pro Asn Arg 420 425 430 Tyr Asn Leu Gln Phe Gln Thr Ala Tyr Val Asp Thr Thr Tyr Asn Pro 435 440 445 Leu Met Asp Lys Gly Lys Gly Asn Lys Ile Trp Phe Gln Tyr Leu Ser 450 455 460 Lys Lys Gly Thr Asp Tyr Asn Glu Lys Gln Cys Tyr Cys Thr Leu Glu 465 470 475 480 Asp Met Pro Leu Trp Ala Ile Cys Phe Gly Tyr Thr Asp Tyr Val Glu 485 490 495 Thr Gln Leu Gly Pro Asn Val Asp His Glu Thr Ala Gly Leu Ile Ile 500 505 510 Met Ile Cys Pro Tyr Thr Gln Pro Pro Met Tyr Asp Lys Asn Arg Pro 515 520 525 Asn Trp Gly Tyr Val Val Tyr Asp Thr Asn Phe Gly Asn Gly Lys Met 530 535 540 Pro Ser Gly Ser Gly Gln Val Pro Val Tyr Trp Gln Cys Arg Trp Arg 545 550 555 560 Pro Met Leu Trp Phe Gln Gln Gln Val Leu Asn Asp Ile Ser Lys Thr 565 570 575 Gly Pro Tyr Ala Tyr Arg Asp Glu Tyr Lys Asn Val Gln Leu Thr Leu 580 585 590 Tyr Tyr Asn Phe Ile Phe Asn Trp Gly Gly Asp Met Tyr Tyr Pro Gln 595 600 605 Val Val Lys Asn Pro Cys Gly Asp Ser Gly Ile Val Pro Gly Ser Gly 610 615 620 Arg Phe Thr Arg Glu Val Gln Val Val Ser Pro Leu Ser Met Gly Pro 625 630 635 640 Ala Tyr Ile Phe His Tyr Phe Asp Ser Arg Arg Gly Phe Phe Ser Glu 645 650 655 Lys Ala Leu Lys Arg Met Gln Gln Gln Gln Glu Phe Asp Glu Ser Phe 660 665 670 Thr Phe Lys Pro Lys Arg Pro Lys Leu Ser Thr Ala Ala Ala Glu Ile 675 680 685 Leu Gln Leu Glu Glu Asp Ser Thr Ser Gly Glu Gly Lys Ser Pro Leu 690 695 700 Gln Gln Glu Glu Lys Glu Val Glu Val Leu Gln Thr Pro Thr Val Gln 705 710 715 720 Leu Gln Leu Gln Arg Asn Ile Gln Glu Gln Leu Ala Ile Lys Gln Gln 725 730 735 Leu Gln Phe Leu Leu Leu Gln Leu Leu Lys Thr Gln Ser Asn Leu His 740 745 750 Leu Asn Pro Gln Phe Leu Ser Pro Ser 755 760 <210> 198 <211> 75 <212> PRT <213> Torque teno virus <400> 198 Met Ala Tyr Trp Phe Arg Arg Trp Gly Trp Arg Pro Arg Arg Arg Trp 1 5 10 15 Arg Arg Trp Arg Arg Arg Arg Arg Arg Leu Pro Arg Arg Arg Thr Arg 20 25 30 Arg Ala Val Arg Gly Leu Gly Arg Arg Arg Lys Pro Arg Val Arg Arg 35 40 45 Arg Arg Arg Thr Arg Arg Arg Thr Tyr Arg Arg Gly Trp Arg Arg Arg 50 55 60 Arg Tyr Ile Arg Arg Gly Arg Arg Lys Lys Lys 65 70 75 <210> 199 <211> 209 <212> PRT <213> Torque teno virus <400> 199 Leu Ile Leu Thr Gln Trp Asn Pro Ala Ile Val Lys Arg Cys Asn Ile 1 5 10 15 Lys Gly Gly Leu Pro Ile Ile Ile Cys Gly Glu Pro Arg Ala Ala Phe 20 25 30 Asn Tyr Gly Tyr His Met Glu Asp Tyr Thr Pro Gln Pro Phe Pro Phe 35 40 45 Gly Gly Gly Met Ser Thr Val Thr Phe Ser Leu Lys Ala Leu Tyr Asp 50 55 60 Gln Tyr Leu Lys His Gln Asn Arg Trp Thr Phe Ser Asn Asp Gln Leu 65 70 75 80 Asp Leu Ala Arg Tyr Arg Gly Cys Lys Leu Arg Phe Tyr Arg Ser Pro 85 90 95 Val Cys Asp Phe Ile Val His Tyr Asn Leu Ile Pro Pro Leu Lys Met 100 105 110 Asn Gln Phe Thr Ser Pro Asn Thr His Pro Gly Leu Leu Met Leu Ser 115 120 125 Lys His Lys Ile Ile Ile Pro Ser Phe Gln Thr Arg Pro Gly Gly Arg 130 135 140 Arg Phe Val Lys Ile Arg Leu Asn Pro Pro Lys Leu Phe Glu Asp Lys 145 150 155 160 Trp Tyr Thr Gln Gln Asp Leu Cys Lys Val Pro Leu Val Ser Ile Thr 165 170 175 Ala Thr Ala Ala Asp Leu Arg Tyr Pro Phe Cys Ser Pro Gln Thr Asn 180 185 190 Asn Pro Cys Thr Thr Phe Gln Val Leu Arg Lys Asn Tyr Asn Thr Val 195 200 205 Ile <210> 200 <211> 148 <212> PRT <213> Torque teno virus <400> 200 Gly Thr Ser Val Lys Asp Gln Glu Ser Thr Gln Asp Phe Glu Asn Trp 1 5 10 15 Leu Tyr Lys Thr Asp Ser His Tyr Gln Thr Phe Ala Thr Glu Ala Gln 20 25 30 Leu Gly Arg Ile Pro Ala Phe Asn Pro Asp Gly Thr Lys Asn Thr Lys 35 40 45 Gln Gln Ser Trp Gln Asp Asn Trp Ser Lys Lys Asn Ser Pro Trp Thr 50 55 60 Gly Asn Ser Gly Thr Tyr Pro Gln Thr Thr Ser Glu Met Tyr Lys Ile 65 70 75 80 Pro Tyr Asp Ser Asn Phe Gly Phe Pro Thr Tyr Arg Ala Gln Lys Asp 85 90 95 Tyr Ile Leu Glu Arg Arg Gln Cys Asn Phe Asn Tyr Glu Val Asn Asn 100 105 110 Pro Val Ser Lys Lys Val Trp Pro Gln Pro Ser Thr Thr Thr Pro Thr 115 120 125 Val Asp Tyr Tyr Glu Tyr His Cys Gly Trp Phe Ser Asn Ile Phe Ile 130 135 140 Gly Pro Asn Arg 145 <210> 201 <211> 167 <212> PRT <213> Torque teno virus <400> 201 Tyr Asn Leu Gln Phe Gln Thr Ala Tyr Val Asp Thr Thr Tyr Asn Pro 1 5 10 15 Leu Met Asp Lys Gly Lys Gly Asn Lys Ile Trp Phe Gln Tyr Leu Ser 20 25 30 Lys Lys Gly Thr Asp Tyr Asn Glu Lys Gln Cys Tyr Cys Thr Leu Glu 35 40 45 Asp Met Pro Leu Trp Ala Ile Cys Phe Gly Tyr Thr Asp Tyr Val Glu 50 55 60 Thr Gln Leu Gly Pro Asn Val Asp His Glu Thr Ala Gly Leu Ile Ile 65 70 75 80 Met Ile Cys Pro Tyr Thr Gln Pro Pro Met Tyr Asp Lys Asn Arg Pro 85 90 95 Asn Trp Gly Tyr Val Val Tyr Asp Thr Asn Phe Gly Asn Gly Lys Met 100 105 110 Pro Ser Gly Ser Gly Gln Val Pro Val Tyr Trp Gln Cys Arg Trp Arg 115 120 125 Pro Met Leu Trp Phe Gln Gln Gln Val Leu Asn Asp Ile Ser Lys Thr 130 135 140 Gly Pro Tyr Ala Tyr Arg Asp Glu Tyr Lys Asn Val Gln Leu Thr Leu 145 150 155 160 Tyr Tyr Asn Phe Ile Phe Asn 165 <210> 202 <211> 162 <212> PRT <213> Torque teno virus <400> 202 Trp Gly Gly Asp Met Tyr Tyr Pro Gln Val Val Lys Asn Pro Cys Gly 1 5 10 15 Asp Ser Gly Ile Val Pro Gly Ser Gly Arg Phe Thr Arg Glu Val Gln 20 25 30 Val Val Ser Pro Leu Ser Met Gly Pro Ala Tyr Ile Phe His Tyr Phe 35 40 45 Asp Ser Arg Arg Gly Phe Phe Ser Glu Lys Ala Leu Lys Arg Met Gln 50 55 60 Gln Gln Gln Glu Phe Asp Glu Ser Phe Thr Phe Lys Pro Lys Arg Pro 65 70 75 80 Lys Leu Ser Thr Ala Ala Ala Glu Ile Leu Gln Leu Glu Glu Asp Ser 85 90 95 Thr Ser Gly Glu Gly Lys Ser Pro Leu Gln Gln Glu Glu Lys Glu Val 100 105 110 Glu Val Leu Gln Thr Pro Thr Val Gln Leu Gln Leu Gln Arg Asn Ile 115 120 125 Gln Glu Gln Leu Ala Ile Lys Gln Gln Leu Gln Phe Leu Leu Leu Gln 130 135 140 Leu Leu Lys Thr Gln Ser Asn Leu His Leu Asn Pro Gln Phe Leu Ser 145 150 155 160 Pro Ser <210> 203 <211> 746 <212> PRT <213> Torque teno virus <400> 203 Met Ala Trp Gly Trp Trp Arg Trp Arg Arg Arg Trp Pro Ala Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Pro Val Arg Arg Thr Arg Ala Arg 20 25 30 Arg Pro Ala Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Thr Arg Arg 35 40 45 Arg Arg Trp Gly Arg Arg Arg Tyr Arg Arg Gly Trp Arg Arg Arg Thr 50 55 60 Tyr Val Arg Lys Gly Arg His Arg Lys Lys Lys Lys Arg Leu Ile Leu 65 70 75 80 Arg Gln Trp Gln Pro Ala Thr Arg Arg Arg Cys Thr Ile Thr Gly Tyr 85 90 95 Leu Pro Ile Val Phe Cys Gly His Thr Arg Gly Asn Lys Asn Tyr Ala 100 105 110 Leu His Ser Asp Asp Tyr Thr Pro Gln Gly Gln Pro Phe Gly Gly Ala 115 120 125 Leu Ser Thr Thr Ser Phe Ser Leu Lys Val Leu Phe Asp Gln His Gln 130 135 140 Arg Gly Leu Asn Lys Trp Ser Phe Pro Asn Asp Gln Leu Asp Leu Ala 145 150 155 160 Arg Tyr Arg Gly Cys Lys Phe Ile Phe Tyr Arg Thr Lys Gln Thr Asp 165 170 175 Trp Val Gly Gln Tyr Asp Ile Ser Glu Pro Tyr Lys Leu Asp Lys Tyr 180 185 190 Ser Cys Pro Asn Tyr His Pro Gly Asn Met Ile Lys Ala Lys His Lys 195 200 205 Phe Leu Ile Pro Ser Tyr Asp Thr Asn Pro Arg Gly Arg Gln Lys Ile 210 215 220 Ile Val Lys Ile Pro Pro Pro Asp Leu Phe Val Asp Lys Trp Tyr Thr 225 230 235 240 Gln Glu Asp Leu Cys Ser Val Asn Leu Val Ser Leu Ala Val Ser Ala 245 250 255 Ala Ser Phe Leu His Pro Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys 260 265 270 Tyr Thr Phe Gln Val Leu Lys Glu Phe Tyr Tyr Gln Ala Ile Gly Phe 275 280 285 Ser Ala Ser Thr Gln Ala Met Thr Ser Val Leu Asp Thr Leu Tyr Thr 290 295 300 Gln Asn Ser Tyr Trp Glu Ser Asn Leu Thr Gln Phe Tyr Val Leu Asn 305 310 315 320 Ala Lys Lys Gly Ser Asp Thr Thr Gln Pro Leu Thr Ser Asn Met Pro 325 330 335 Thr Arg Glu Glu Phe Met Ala Lys Lys Asn Thr Asn Tyr Asn Trp Tyr 340 345 350 Thr Tyr Lys Ala Ala Ser Val Lys Asn Lys Leu His Gln Met Arg Gln 355 360 365 Thr Tyr Phe Glu Glu Leu Thr Ser Lys Gly Pro Gln Thr Thr Lys Ser 370 375 380 Glu Glu Gly Tyr Ser Gln His Trp Thr Thr Pro Ser Thr Asn Ala Tyr 385 390 395 400 Glu Tyr His Leu Gly Met Phe Ser Ala Ile Phe Leu Ala Pro Asp Arg 405 410 415 Pro Val Pro Arg Phe Pro Cys Ala Tyr Gln Asp Val Thr Tyr Asn Pro 420 425 430 Leu Met Asp Lys Gly Val Gly Asn His Ile Trp Phe Gln Tyr Asn Thr 435 440 445 Lys Ala Asp Thr Gln Leu Ile Val Thr Gly Gly Ser Cys Lys Ala His 450 455 460 Ile Gln Asp Ile Pro Leu Trp Ala Ala Phe Tyr Gly Tyr Ser Asp Phe 465 470 475 480 Ile Glu Ser Glu Leu Gly Pro Phe Val Asp Ala Glu Thr Val Gly Leu 485 490 495 Val Cys Val Ile Cys Pro Tyr Thr Lys Pro Pro Met Tyr Asn Lys Thr 500 505 510 Asn Pro Ala Met Gly Tyr Val Phe Tyr Asp Arg Asn Phe Gly Asp Gly 515 520 525 Lys Trp Thr Asp Gly Arg Gly Lys Ile Glu Pro Tyr Trp Gln Val Arg 530 535 540 Trp Arg Pro Glu Met Leu Phe Gln Glu Thr Val Met Ala Asp Leu Val 545 550 555 560 Gln Thr Gly Pro Phe Ser Tyr Lys Asp Glu Leu Lys Asn Ser Thr Leu 565 570 575 Val Cys Lys Tyr Lys Phe Tyr Phe Thr Trp Gly Gly Asn Met Met Phe 580 585 590 Gln Gln Thr Ile Lys Asn Pro Cys Lys Thr Asp Gly Gln Pro Thr Asp 595 600 605 Ser Ser Arg His Pro Arg Gly Ile Gln Val Ala Asp Pro Glu Gln Met 610 615 620 Gly Pro Arg Trp Val Phe His Ser Phe Asp Trp Arg Arg Gly Tyr Leu 625 630 635 640 Ser Glu Lys Ala Leu Lys Arg Leu Gln Glu Lys Pro Leu Asp Tyr Asp 645 650 655 Glu Tyr Phe Thr Gln Pro Lys Arg Pro Arg Ile Phe Pro Pro Thr Glu 660 665 670 Ser Ala Glu Gly Glu Phe Arg Glu Pro Glu Lys Gly Ser Tyr Ser Glu 675 680 685 Glu Glu Arg Ser Gln Ala Ser Ala Glu Glu Gln Thr Gln Glu Ala Thr 690 695 700 Val Leu Leu Leu Lys Arg Arg Leu Arg Glu Gln Gln Gln Leu Gln Gln 705 710 715 720 Gln Leu Gln Phe Leu Thr Arg Glu Met Phe Lys Thr Gln Ala Gly Leu 725 730 735 His Leu Asn Pro Met Leu Leu Asn Gln Arg 740 745 <210> 204 <211> 77 <212> PRT <213> Torque teno virus <400> 204 Met Ala Trp Gly Trp Trp Arg Trp Arg Arg Arg Trp Pro Ala Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Pro Val Arg Arg Thr Arg Ala Arg 20 25 30 Arg Pro Ala Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Thr Arg Arg 35 40 45 Arg Arg Trp Gly Arg Arg Arg Tyr Arg Arg Gly Trp Arg Arg Arg Thr 50 55 60 Tyr Val Arg Lys Gly Arg His Arg Lys Lys Lys Lys Arg 65 70 75 <210> 205 <211> 209 <212> PRT <213> Torque teno virus <400> 205 Leu Ile Leu Arg Gln Trp Gln Pro Ala Thr Arg Arg Arg Cys Thr Ile 1 5 10 15 Thr Gly Tyr Leu Pro Ile Val Phe Cys Gly His Thr Arg Gly Asn Lys 20 25 30 Asn Tyr Ala Leu His Ser Asp Asp Tyr Thr Pro Gln Gly Gln Pro Phe 35 40 45 Gly Gly Ala Leu Ser Thr Thr Ser Phe Ser Leu Lys Val Leu Phe Asp 50 55 60 Gln His Gln Arg Gly Leu Asn Lys Trp Ser Phe Pro Asn Asp Gln Leu 65 70 75 80 Asp Leu Ala Arg Tyr Arg Gly Cys Lys Phe Ile Phe Tyr Arg Thr Lys 85 90 95 Gln Thr Asp Trp Val Gly Gln Tyr Asp Ile Ser Glu Pro Tyr Lys Leu 100 105 110 Asp Lys Tyr Ser Cys Pro Asn Tyr His Pro Gly Asn Met Ile Lys Ala 115 120 125 Lys His Lys Phe Leu Ile Pro Ser Tyr Asp Thr Asn Pro Arg Gly Arg 130 135 140 Gln Lys Ile Ile Val Lys Ile Pro Pro Pro Asp Leu Phe Val Asp Lys 145 150 155 160 Trp Tyr Thr Gln Glu Asp Leu Cys Ser Val Asn Leu Val Ser Leu Ala 165 170 175 Val Ser Ala Ala Ser Phe Leu His Pro Phe Gly Ser Pro Gln Thr Asp 180 185 190 Asn Pro Cys Tyr Thr Phe Gln Val Leu Lys Glu Phe Tyr Tyr Gln Ala 195 200 205 Ile <210> 206 <211> 130 <212> PRT <213> Torque teno virus <400> 206 Gly Phe Ser Ala Ser Thr Gln Ala Met Thr Ser Val Leu Asp Thr Leu 1 5 10 15 Tyr Thr Gln Asn Ser Tyr Trp Glu Ser Asn Leu Thr Gln Phe Tyr Val 20 25 30 Leu Asn Ala Lys Lys Gly Ser Asp Thr Thr Gln Pro Leu Thr Ser Asn 35 40 45 Met Pro Thr Arg Glu Glu Phe Met Ala Lys Lys Asn Thr Asn Tyr Asn 50 55 60 Trp Tyr Thr Tyr Lys Ala Ala Ser Val Lys Asn Lys Leu His Gln Met 65 70 75 80 Arg Gln Thr Tyr Phe Glu Glu Leu Thr Ser Lys Gly Pro Gln Thr Thr 85 90 95 Lys Ser Glu Glu Gly Tyr Ser Gln His Trp Thr Thr Pro Ser Thr Asn 100 105 110 Ala Tyr Glu Tyr His Leu Gly Met Phe Ser Ala Ile Phe Leu Ala Pro 115 120 125 Asp Arg 130 <210> 207 <211> 169 <212> PRT <213> Torque teno virus <400> 207 Pro Val Pro Arg Phe Pro Cys Ala Tyr Gln Asp Val Thr Tyr Asn Pro 1 5 10 15 Leu Met Asp Lys Gly Val Gly Asn His Ile Trp Phe Gln Tyr Asn Thr 20 25 30 Lys Ala Asp Thr Gln Leu Ile Val Thr Gly Gly Ser Cys Lys Ala His 35 40 45 Ile Gln Asp Ile Pro Leu Trp Ala Ala Phe Tyr Gly Tyr Ser Asp Phe 50 55 60 Ile Glu Ser Glu Leu Gly Pro Phe Val Asp Ala Glu Thr Val Gly Leu 65 70 75 80 Val Cys Val Ile Cys Pro Tyr Thr Lys Pro Pro Met Tyr Asn Lys Thr 85 90 95 Asn Pro Ala Met Gly Tyr Val Phe Tyr Asp Arg Asn Phe Gly Asp Gly 100 105 110 Lys Trp Thr Asp Gly Arg Gly Lys Ile Glu Pro Tyr Trp Gln Val Arg 115 120 125 Trp Arg Pro Glu Met Leu Phe Gln Glu Thr Val Met Ala Asp Leu Val 130 135 140 Gln Thr Gly Pro Phe Ser Tyr Lys Asp Glu Leu Lys Asn Ser Thr Leu 145 150 155 160 Val Cys Lys Tyr Lys Phe Tyr Phe Thr 165 <210> 208 <211> 161 <212> PRT <213> Torque teno virus <400> 208 Trp Gly Gly Asn Met Met Phe Gln Gln Thr Ile Lys Asn Pro Cys Lys 1 5 10 15 Thr Asp Gly Gln Pro Thr Asp Ser Ser Arg His Pro Arg Gly Ile Gln 20 25 30 Val Ala Asp Pro Glu Gln Met Gly Pro Arg Trp Val Phe His Ser Phe 35 40 45 Asp Trp Arg Arg Gly Tyr Leu Ser Glu Lys Ala Leu Lys Arg Leu Gln 50 55 60 Glu Lys Pro Leu Asp Tyr Asp Glu Tyr Phe Thr Gln Pro Lys Arg Pro 65 70 75 80 Arg Ile Phe Pro Pro Thr Glu Ser Ala Glu Gly Glu Phe Arg Glu Pro 85 90 95 Glu Lys Gly Ser Tyr Ser Glu Glu Glu Arg Ser Gln Ala Ser Ala Glu 100 105 110 Glu Gln Thr Gln Glu Ala Thr Val Leu Leu Leu Lys Arg Arg Leu Arg 115 120 125 Glu Gln Gln Gln Leu Gln Gln Gln Leu Gln Phe Leu Thr Arg Glu Met 130 135 140 Phe Lys Thr Gln Ala Gly Leu His Leu Asn Pro Met Leu Leu Asn Gln 145 150 155 160 Arg <210> 209 <211> 765 <212> PRT <213> Torque teno virus <400> 209 Met Ala Trp Ser Trp Trp Trp Gln Arg Trp Arg Arg Arg Arg Trp Lys 1 5 10 15 Pro Arg Arg Arg Arg Trp Arg Arg Leu Arg Trp Arg Arg Pro Arg Arg 20 25 30 Ala Val Arg Arg Arg Arg Arg Gly Arg Arg Val Arg Arg Arg Arg Trp 35 40 45 Ala Arg Arg Arg Gly Arg Arg Arg Arg Tyr Ala Thr Arg Arg Lys Arg 50 55 60 Arg Tyr Arg Gly Arg Arg Phe Lys Lys Lys Leu Val Leu Thr Gln Trp 65 70 75 80 His Pro Asn Thr Met Arg Arg Cys Leu Ile Lys Gly Ile Val Pro Leu 85 90 95 Val Ile Cys Gly His Thr Arg Trp Asn Tyr Asn Tyr Ala Leu His Ser 100 105 110 Lys Asp Tyr Thr Glu Glu Gly Arg Tyr Pro His Gly Gly Ala Leu Ser 115 120 125 Thr Thr Thr Trp Ser Leu Lys Val Leu Tyr Asp Glu His Leu Lys His 130 135 140 His Asp Phe Trp Gly Tyr Pro Asn Asn Gln Leu Asp Leu Ala Arg Tyr 145 150 155 160 Lys Gly Ala Lys Phe Thr Phe Tyr Arg His Lys Lys Thr Asp Phe Ile 165 170 175 Ile Phe Phe Asn Arg Lys Pro Pro Phe Lys Leu Asn Lys Tyr Ser Cys 180 185 190 Ala Ser Tyr His Pro Gly Met Leu Met Gln Gln Arg His Lys Ile Leu 195 200 205 Leu Pro Ser Tyr Glu Thr Lys Pro Lys Gly Arg Pro Lys Ile Thr Val 210 215 220 Arg Ile Lys Pro Pro Thr Leu Leu Glu Asp Lys Trp Tyr Thr Gln Gln 225 230 235 240 Asp Leu Cys Asp Val Asn Leu Leu Gln Leu Val Val Thr Ala Ala Asp 245 250 255 Phe Arg His Pro Leu Cys Ser Pro Gln Thr Asn Thr Pro Thr Thr Thr 260 265 270 Phe Gln Val Leu Lys Asp Ile Tyr Tyr Asp Thr Met Ser Ile Ser Glu 275 280 285 Pro Thr Asp Ser Tyr Thr Ser Val Asn Asn Lys Ser Thr Thr Gln Thr 290 295 300 Phe Thr Asn Tyr Ser Asn Thr Leu Glu Asn Ile Leu Tyr Thr Arg Ala 305 310 315 320 Ser Tyr Trp Asn Ser Phe His Ala Thr Glu Tyr Leu Asn Pro Asn Ile 325 330 335 Ile Tyr Lys Asn Gly Glu Lys Leu Phe Lys Glu His Glu Asp Leu Ile 340 345 350 Thr Trp Met Thr Gln Thr Asn Asn Thr Gly Phe Leu Thr Lys Asn Asn 355 360 365 Thr Ala Phe Gly Asn Asn Ser Tyr Arg Pro Asn Ala Asp Lys Ile Lys 370 375 380 Lys Ala Arg Lys Thr Tyr Trp Asn Ala Leu Ile Gly Thr Asn Asp Leu 385 390 395 400 Ala Thr Asn Ile Gly Gln Ala Arg Ala Glu Arg Phe Glu Tyr His Leu 405 410 415 Gly Trp Tyr Ser Pro Ile Phe Leu Ser Arg His Arg Ser Asn Met Asn 420 425 430 Phe Ala Arg Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg 435 440 445 Gly Val Asn Asn Arg Val Trp Val Gln Pro Leu Thr Lys Pro Thr Thr 450 455 460 Glu Phe Asp Glu Lys Arg Cys Lys Cys Val Val Gln His Leu Pro Leu 465 470 475 480 Trp Ala Ala Leu Tyr Cys Tyr Gln Asp Phe Val Glu Glu Glu Leu Gly 485 490 495 Ser Ser Ser Glu Ile Leu Asn Ser Cys Leu Leu Val Leu Gln Cys Pro 500 505 510 Tyr Thr Phe Pro Pro Met Tyr Asp Lys Lys Leu Pro Asp Lys Gly Phe 515 520 525 Val Phe Tyr Asp Ser Leu Phe Gly Asp Gly Lys Met Ser Asp Gly Arg 530 535 540 Gly Gln Val Asp Ile Phe Trp Gln Gln Arg Trp Tyr Pro Arg Leu Ala 545 550 555 560 Thr Gln Met Gln Val Met His Asp Ile Thr Met Thr Gly Pro Phe Ser 565 570 575 Tyr Arg Asp Glu Leu Val Ser Thr Gln Leu Thr Ala Lys Tyr Thr Phe 580 585 590 Asp Phe Met Trp Gly Gly Asn Met Ile Ser Thr Gln Ile Ile Lys Asn 595 600 605 Pro Cys Lys Asp Ser Gly Leu Glu Pro Ala Tyr Pro Gly Arg Gln Arg 610 615 620 Arg Asp Leu Gln Ile Val Asp Pro Tyr Ser Met Gly Pro Gln Phe Ser 625 630 635 640 Phe His Asn Trp Asp Tyr Arg His Gly Leu Phe Gly Gln Asp Ala Ile 645 650 655 Asp Arg Val Ser Lys Gln Pro Lys Asp Asp Ala Asp Tyr Pro Asn Pro 660 665 670 Tyr Lys Arg Pro Arg Tyr Phe Pro Pro Thr Asp Gln Ala Ala Gln Glu 675 680 685 Gln Glu Lys Asp Phe Ser Phe Leu Lys Thr Ala Pro Ser Asn Ser Glu 690 695 700 Glu Ser Asp Gln Glu Val Leu Gln Glu Thr Gln Val Leu Arg Phe Gln 705 710 715 720 Pro Glu Gln His Lys Gln Leu His Leu Gln Leu Ala Glu Arg Gln Arg 725 730 735 Ile Gly Glu Gln Leu Arg Tyr Leu Leu Gln Gln Met Phe Lys Thr Gln 740 745 750 Ala Asn Leu His Leu Asn Pro Tyr Thr Phe Thr Gln Leu 755 760 765 <210> 210 <211> 74 <212> PRT <213> Torque teno virus <400> 210 Met Ala Trp Ser Trp Trp Trp Gln Arg Trp Arg Arg Arg Arg Trp Lys 1 5 10 15 Pro Arg Arg Arg Arg Trp Arg Arg Leu Arg Trp Arg Arg Pro Arg Arg 20 25 30 Ala Val Arg Arg Arg Arg Arg Gly Arg Arg Val Arg Arg Arg Arg Trp 35 40 45 Ala Arg Arg Arg Gly Arg Arg Arg Arg Tyr Ala Thr Arg Arg Lys Arg 50 55 60 Arg Tyr Arg Gly Arg Arg Phe Lys Lys Lys 65 70 <210> 211 <211> 212 <212> PRT <213> Torque teno virus <400> 211 Leu Val Leu Thr Gln Trp His Pro Asn Thr Met Arg Arg Cys Leu Ile 1 5 10 15 Lys Gly Ile Val Pro Leu Val Ile Cys Gly His Thr Arg Trp Asn Tyr 20 25 30 Asn Tyr Ala Leu His Ser Lys Asp Tyr Thr Glu Glu Gly Arg Tyr Pro 35 40 45 His Gly Gly Ala Leu Ser Thr Thr Thr Trp Ser Leu Lys Val Leu Tyr 50 55 60 Asp Glu His Leu Lys His His Asp Phe Trp Gly Tyr Pro Asn Asn Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Lys Gly Ala Lys Phe Thr Phe Tyr Arg His 85 90 95 Lys Lys Thr Asp Phe Ile Ile Phe Phe Asn Arg Lys Pro Pro Phe Lys 100 105 110 Leu Asn Lys Tyr Ser Cys Ala Ser Tyr His Pro Gly Met Leu Met Gln 115 120 125 Gln Arg His Lys Ile Leu Leu Pro Ser Tyr Glu Thr Lys Pro Lys Gly 130 135 140 Arg Pro Lys Ile Thr Val Arg Ile Lys Pro Pro Thr Leu Leu Glu Asp 145 150 155 160 Lys Trp Tyr Thr Gln Gln Asp Leu Cys Asp Val Asn Leu Leu Gln Leu 165 170 175 Val Val Thr Ala Ala Asp Phe Arg His Pro Leu Cys Ser Pro Gln Thr 180 185 190 Asn Thr Pro Thr Thr Thr Phe Gln Val Leu Lys Asp Ile Tyr Tyr Asp 195 200 205 Thr Met Ser Ile 210 <210> 212 <211> 142 <212> PRT <213> Torque teno virus <400> 212 Ser Glu Pro Thr Asp Ser Tyr Thr Ser Val Asn Asn Lys Ser Thr Thr 1 5 10 15 Gln Thr Phe Thr Asn Tyr Ser Asn Thr Leu Glu Asn Ile Leu Tyr Thr 20 25 30 Arg Ala Ser Tyr Trp Asn Ser Phe His Ala Thr Glu Tyr Leu Asn Pro 35 40 45 Asn Ile Ile Tyr Lys Asn Gly Glu Lys Leu Phe Lys Glu His Glu Asp 50 55 60 Leu Ile Thr Trp Met Thr Gln Thr Asn Asn Thr Gly Phe Leu Thr Lys 65 70 75 80 Asn Asn Thr Ala Phe Gly Asn Asn Ser Tyr Arg Pro Asn Ala Asp Lys 85 90 95 Ile Lys Lys Ala Arg Lys Thr Tyr Trp Asn Ala Leu Ile Gly Thr Asn 100 105 110 Asp Leu Ala Thr Asn Ile Gly Gln Ala Arg Ala Glu Arg Phe Glu Tyr 115 120 125 His Leu Gly Trp Tyr Ser Pro Ile Phe Leu Ser Arg His Arg 130 135 140 <210> 213 <211> 167 <212> PRT <213> Torque teno virus <400> 213 Ser Asn Met Asn Phe Ala Arg Ala Tyr Gln Asp Val Thr Tyr Asn Pro 1 5 10 15 Asn Cys Asp Arg Gly Val Asn Asn Arg Val Trp Val Gln Pro Leu Thr 20 25 30 Lys Pro Thr Thr Glu Phe Asp Glu Lys Arg Cys Lys Cys Val Val Gln 35 40 45 His Leu Pro Leu Trp Ala Ala Leu Tyr Cys Tyr Gln Asp Phe Val Glu 50 55 60 Glu Glu Leu Gly Ser Ser Ser Glu Ile Leu Asn Ser Cys Leu Leu Val 65 70 75 80 Leu Gln Cys Pro Tyr Thr Phe Pro Pro Met Tyr Asp Lys Lys Leu Pro 85 90 95 Asp Lys Gly Phe Val Phe Tyr Asp Ser Leu Phe Gly Asp Gly Lys Met 100 105 110 Ser Asp Gly Arg Gly Gln Val Asp Ile Phe Trp Gln Gln Arg Trp Tyr 115 120 125 Pro Arg Leu Ala Thr Gln Met Gln Val Met His Asp Ile Thr Met Thr 130 135 140 Gly Pro Phe Ser Tyr Arg Asp Glu Leu Val Ser Thr Gln Leu Thr Ala 145 150 155 160 Lys Tyr Thr Phe Asp Phe Met 165 <210> 214 <211> 170 <212> PRT <213> Torque teno virus <400> 214 Trp Gly Gly Asn Met Ile Ser Thr Gln Ile Ile Lys Asn Pro Cys Lys 1 5 10 15 Asp Ser Gly Leu Glu Pro Ala Tyr Pro Gly Arg Gln Arg Arg Asp Leu 20 25 30 Gln Ile Val Asp Pro Tyr Ser Met Gly Pro Gln Phe Ser Phe His Asn 35 40 45 Trp Asp Tyr Arg His Gly Leu Phe Gly Gln Asp Ala Ile Asp Arg Val 50 55 60 Ser Lys Gln Pro Lys Asp Asp Ala Asp Tyr Pro Asn Pro Tyr Lys Arg 65 70 75 80 Pro Arg Tyr Phe Pro Pro Thr Asp Gln Ala Ala Gln Glu Gln Glu Lys 85 90 95 Asp Phe Ser Phe Leu Lys Thr Ala Pro Ser Asn Ser Glu Glu Ser Asp 100 105 110 Gln Glu Val Leu Gln Glu Thr Gln Val Leu Arg Phe Gln Pro Glu Gln 115 120 125 His Lys Gln Leu His Leu Gln Leu Ala Glu Arg Gln Arg Ile Gly Glu 130 135 140 Gln Leu Arg Tyr Leu Leu Gln Gln Met Phe Lys Thr Gln Ala Asn Leu 145 150 155 160 His Leu Asn Pro Tyr Thr Phe Thr Gln Leu 165 170 <210> 215 <211> 666 <212> PRT <213> TTV-like mini virus <400> 215 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln 35 40 45 Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys 50 55 60 Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr 65 70 75 80 Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser 85 90 95 Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys 100 105 110 Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr 115 120 125 Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile 130 135 140 Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr 145 150 155 160 Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile 165 170 175 Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile 180 185 190 Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr 195 200 205 Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn 210 215 220 Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr 225 230 235 240 Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val 245 250 255 Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe 260 265 270 Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln 275 280 285 Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg 290 295 300 Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe 305 310 315 320 Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn 325 330 335 Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser 340 345 350 Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn 355 360 365 Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro 370 375 380 Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp 385 390 395 400 Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro 405 410 415 Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile 420 425 430 Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn 435 440 445 Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys 450 455 460 Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly 465 470 475 480 Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp 485 490 495 Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln 500 505 510 Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile 515 520 525 Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys 530 535 540 Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro 545 550 555 560 Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro 565 570 575 Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr 580 585 590 Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val 595 600 605 Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu 610 615 620 Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu 625 630 635 640 Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg 645 650 655 Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln 660 665 <210> 216 <211> 38 <212> PRT <213> TTV-like mini virus <400> 216 Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg 1 5 10 15 Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg 20 25 30 Arg Lys Arg Arg Val Arg 35 <210> 217 <211> 208 <212> PRT <213> TTV-like mini virus <400> 217 Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys 1 5 10 15 Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn 20 25 30 Leu Arg Leu Gly Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro 35 40 45 Val His Trp Pro Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu 50 55 60 Asp Ala Leu Tyr Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser 65 70 75 80 Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr 85 90 95 Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu 100 105 110 Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu 115 120 125 Met Met Met Met Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr 130 135 140 Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro 145 150 155 160 Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro 165 170 175 Leu Leu Gln Ile His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val 180 185 190 Lys Pro Asp Lys Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr 195 200 205 <210> 218 <211> 128 <212> PRT <213> TTV-like mini virus <400> 218 Ile Ser Ile Gln Asn Arg Asn Met Ser Val Asp Gln Gly Gln Ser Trp 1 5 10 15 Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe Tyr Phe Tyr Phe Tyr Thr 20 25 30 Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln Ile Pro Val Ala Asp Leu 35 40 45 Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg Pro Gly Gln Ser Leu Asn 50 55 60 Glu Ala Lys Ile Thr Asp His Ile Thr Phe Thr Glu Tyr Lys Asn Lys 65 70 75 80 Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn Lys His Ile Gln Glu His 85 90 95 Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser Pro Glu Ala Ile Lys Asn 100 105 110 Glu Trp Thr Thr Glu Asn Met Lys Trp Asn Gln Leu Asn Asn Ala Gly 115 120 125 <210> 219 <211> 163 <212> PRT <213> TTV-like mini virus <400> 219 Thr Met Ala Leu Thr Pro Phe Asn Glu Pro Ile Phe Thr Gln Ile Gln 1 5 10 15 Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu Tyr Leu Leu 20 25 30 Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro Pro Gly Ile Pro Glu Leu 35 40 45 Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile Tyr Trp Gly Phe Ala Asp 50 55 60 Phe Gln Lys Asn Leu Lys Lys Val Thr Asn Ile Asp Thr Asn Tyr Met 65 70 75 80 Leu Val Ala Lys Thr Lys Phe Thr Gln Lys Pro Gly Thr Phe Tyr Leu 85 90 95 Val Ile Leu Asn Asp Thr Phe Val Glu Gly Asn Ser Pro Tyr Glu Lys 100 105 110 Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp Tyr Pro Gln Val Gln Tyr 115 120 125 Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln Thr Gly Pro Phe Thr Pro 130 135 140 Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile Ser Met Phe Tyr Lys Phe 145 150 155 160 Tyr Phe Lys <210> 220 <211> 129 <212> PRT <213> TTV-like mini virus <400> 220 Trp Gly Gly Ser Pro Pro Lys Ala Ile Asn Val Glu Asn Pro Ala His 1 5 10 15 Gln Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr Thr Ser Leu 20 25 30 Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr 35 40 45 Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp 50 55 60 Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro Asp Arg Gln 65 70 75 80 Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr 85 90 95 Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser Asn Leu Arg 100 105 110 Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp 115 120 125 Gln <210> 221 <211> 673 <212> PRT <213> Torque teno midi virus 1 <400> 221 Met Pro Phe Trp Trp Gly Arg Arg Asn Lys Phe Trp Tyr Gly Arg Asn 1 5 10 15 Tyr Arg Arg Lys Lys Arg Arg Phe Pro Lys Arg Arg Lys Arg Arg Phe 20 25 30 Tyr Arg Arg Thr Lys Tyr Arg Arg Pro Ala Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg Lys Val Arg Arg Lys Lys Lys Thr Leu Ile Val Arg Gln Trp 50 55 60 Gln Pro Asp Ser Ile Val Leu Cys Lys Ile Lys Gly Tyr Asp Ser Ile 65 70 75 80 Ile Trp Gly Ala Glu Gly Thr Gln Phe Gln Cys Ser Thr His Glu Met 85 90 95 Tyr Glu Tyr Thr Arg Gln Lys Tyr Pro Gly Gly Gly Gly Phe Gly Val 100 105 110 Gln Leu Tyr Ser Leu Glu Tyr Leu Tyr Asp Gln Trp Lys Leu Arg Asn 115 120 125 Asn Ile Trp Thr Lys Thr Asn Gln Leu Lys Asp Leu Cys Arg Tyr Leu 130 135 140 Lys Cys Val Met Thr Phe Tyr Arg His Gln His Ile Asp Phe Val Ile 145 150 155 160 Val Tyr Glu Arg Gln Pro Pro Phe Glu Ile Asp Lys Leu Thr Tyr Met 165 170 175 Lys Tyr His Pro Tyr Met Leu Leu Gln Arg Lys His Lys Ile Ile Leu 180 185 190 Pro Ser Gln Thr Thr Asn Pro Arg Gly Lys Leu Lys Lys Lys Lys Thr 195 200 205 Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Gln Gln Gln 210 215 220 Phe Ala Lys Tyr Asp Leu Leu Leu Ile Ala Ala Ala Ala Cys Ser Leu 225 230 235 240 Arg Tyr Pro Arg Ile Gly Cys Cys Asn Glu Asn Arg Met Ile Thr Leu 245 250 255 Tyr Cys Leu Asn Thr Lys Phe Tyr Gln Asp Thr Glu Trp Gly Thr Thr 260 265 270 Lys Gln Ala Pro His Tyr Phe Lys Pro Tyr Ala Thr Ile Asn Lys Ser 275 280 285 Met Ile Phe Val Ser Asn Tyr Gly Gly Lys Lys Thr Glu Tyr Asn Ile 290 295 300 Gly Gln Trp Ile Glu Thr Asp Ile Pro Gly Glu Gly Asn Leu Ala Arg 305 310 315 320 Tyr Tyr Arg Ser Ile Ser Lys Glu Gly Gly Tyr Phe Ser Pro Lys Ile 325 330 335 Leu Gln Ala Tyr Gln Thr Lys Val Lys Ser Val Asp Tyr Lys Pro Leu 340 345 350 Pro Ile Val Leu Gly Arg Tyr Asn Pro Ala Ile Asp Asp Gly Lys Gly 355 360 365 Asn Lys Ile Tyr Leu Gln Thr Ile Met Asn Gly His Trp Gly Leu Pro 370 375 380 Gln Lys Thr Pro Asp Tyr Ile Ile Glu Glu Val Pro Leu Trp Leu Gly 385 390 395 400 Phe Trp Gly Tyr Tyr Asn Tyr Leu Lys Gln Thr Arg Thr Glu Ala Ile 405 410 415 Phe Pro Leu His Met Phe Val Val Gln Ser Lys Tyr Ile Gln Thr Gln 420 425 430 Gln Thr Glu Thr Pro Asn Asn Phe Trp Ala Phe Ile Asp Asn Ser Phe 435 440 445 Ile Gln Gly Lys Asn Pro Trp Asp Ser Val Ile Thr Tyr Ser Glu Gln 450 455 460 Lys Leu Trp Phe Pro Thr Val Ala Trp Gln Leu Lys Thr Ile Asn Ala 465 470 475 480 Ile Cys Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp Asn Gln Thr Tyr 485 490 495 Ser Thr Trp Glu Leu Ala Thr His Tyr Ser Phe His Phe Lys Trp Gly 500 505 510 Gly Pro Gln Ile Ser Asp Gln Pro Val Glu Asp Pro Gly Asn Lys Asn 515 520 525 Lys Tyr Asp Val Pro Asp Thr Ile Lys Glu Ala Leu Gln Ile Val Asn 530 535 540 Pro Ala Lys Asn Ile Ala Ala Thr Met Phe His Asp Trp Asp Tyr Arg 545 550 555 560 Arg Gly Cys Ile Thr Ser Thr Ala Ile Lys Arg Met Gln Gln Asn Leu 565 570 575 Pro Thr Asp Ser Ser Leu Glu Ser Asp Ser Asp Ser Glu Pro Ala Pro 580 585 590 Lys Lys Lys Arg Leu Leu Pro Val Leu His Asp Pro Gln Lys Lys Thr 595 600 605 Glu Lys Ile Asn Gln Cys Leu Leu Ser Leu Cys Glu Glu Ser Thr Cys 610 615 620 Gln Glu Gln Glu Thr Glu Glu Asn Ile Leu Lys Leu Ile Gln Gln Gln 625 630 635 640 Gln Gln Gln Gln Gln Lys Leu Lys His Asn Leu Leu Val Leu Ile Lys 645 650 655 Asp Leu Lys Val Lys Gln Arg Leu Leu Gln Leu Gln Thr Gly Val Leu 660 665 670 Glu <210> 222 <211> 57 <212> PRT <213> Torque teno midi virus 1 <400> 222 Met Pro Phe Trp Trp Gly Arg Arg Asn Lys Phe Trp Tyr Gly Arg Asn 1 5 10 15 Tyr Arg Arg Lys Lys Arg Arg Phe Pro Lys Arg Arg Lys Arg Arg Phe 20 25 30 Tyr Arg Arg Thr Lys Tyr Arg Arg Pro Ala Arg Arg Arg Arg Arg Arg 35 40 45 Arg Arg Lys Val Arg Arg Lys Lys Lys 50 55 <210> 223 <211> 202 <212> PRT <213> Torque teno midi virus 1 <400> 223 Thr Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Val Leu Cys Lys 1 5 10 15 Ile Lys Gly Tyr Asp Ser Ile Ile Trp Gly Ala Glu Gly Thr Gln Phe 20 25 30 Gln Cys Ser Thr His Glu Met Tyr Glu Tyr Thr Arg Gln Lys Tyr Pro 35 40 45 Gly Gly Gly Gly Phe Gly Val Gln Leu Tyr Ser Leu Glu Tyr Leu Tyr 50 55 60 Asp Gln Trp Lys Leu Arg Asn Asn Ile Trp Thr Lys Thr Asn Gln Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Leu Lys Cys Val Met Thr Phe Tyr Arg His 85 90 95 Gln His Ile Asp Phe Val Ile Val Tyr Glu Arg Gln Pro Pro Phe Glu 100 105 110 Ile Asp Lys Leu Thr Tyr Met Lys Tyr His Pro Tyr Met Leu Leu Gln 115 120 125 Arg Lys His Lys Ile Ile Leu Pro Ser Gln Thr Thr Asn Pro Arg Gly 130 135 140 Lys Leu Lys Lys Lys Lys Thr Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Gln Gln Gln Phe Ala Lys Tyr Asp Leu Leu Leu Ile 165 170 175 Ala Ala Ala Ala Cys Ser Leu Arg Tyr Pro Arg Ile Gly Cys Cys Asn 180 185 190 Glu Asn Arg Met Ile Thr Leu Tyr Cys Leu 195 200 <210> 224 <211> 92 <212> PRT <213> Torque teno midi virus 1 <400> 224 Asn Thr Lys Phe Tyr Gln Asp Thr Glu Trp Gly Thr Thr Lys Gln Ala 1 5 10 15 Pro His Tyr Phe Lys Pro Tyr Ala Thr Ile Asn Lys Ser Met Ile Phe 20 25 30 Val Ser Asn Tyr Gly Gly Lys Lys Thr Glu Tyr Asn Ile Gly Gln Trp 35 40 45 Ile Glu Thr Asp Ile Pro Gly Glu Gly Asn Leu Ala Arg Tyr Tyr Arg 50 55 60 Ser Ile Ser Lys Glu Gly Gly Tyr Phe Ser Pro Lys Ile Leu Gln Ala 65 70 75 80 Tyr Gln Thr Lys Val Lys Ser Val Asp Tyr Lys Pro 85 90 <210> 225 <211> 159 <212> PRT <213> Torque teno midi virus 1 <400> 225 Leu Pro Ile Val Leu Gly Arg Tyr Asn Pro Ala Ile Asp Asp Gly Lys 1 5 10 15 Gly Asn Lys Ile Tyr Leu Gln Thr Ile Met Asn Gly His Trp Gly Leu 20 25 30 Pro Gln Lys Thr Pro Asp Tyr Ile Ile Glu Glu Val Pro Leu Trp Leu 35 40 45 Gly Phe Trp Gly Tyr Tyr Asn Tyr Leu Lys Gln Thr Arg Thr Glu Ala 50 55 60 Ile Phe Pro Leu His Met Phe Val Val Gln Ser Lys Tyr Ile Gln Thr 65 70 75 80 Gln Gln Thr Glu Thr Pro Asn Asn Phe Trp Ala Phe Ile Asp Asn Ser 85 90 95 Phe Ile Gln Gly Lys Asn Pro Trp Asp Ser Val Ile Thr Tyr Ser Glu 100 105 110 Gln Lys Leu Trp Phe Pro Thr Val Ala Trp Gln Leu Lys Thr Ile Asn 115 120 125 Ala Ile Cys Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp Asn Gln Thr 130 135 140 Tyr Ser Thr Trp Glu Leu Ala Thr His Tyr Ser Phe His Phe Lys 145 150 155 <210> 226 <211> 163 <212> PRT <213> Torque teno midi virus 1 <400> 226 Trp Gly Gly Pro Gln Ile Ser Asp Gln Pro Val Glu Asp Pro Gly Asn 1 5 10 15 Lys Asn Lys Tyr Asp Val Pro Asp Thr Ile Lys Glu Ala Leu Gln Ile 20 25 30 Val Asn Pro Ala Lys Asn Ile Ala Ala Thr Met Phe His Asp Trp Asp 35 40 45 Tyr Arg Arg Gly Cys Ile Thr Ser Thr Ala Ile Lys Arg Met Gln Gln 50 55 60 Asn Leu Pro Thr Asp Ser Ser Leu Glu Ser Asp Ser Asp Ser Glu Pro 65 70 75 80 Ala Pro Lys Lys Lys Arg Leu Leu Pro Val Leu His Asp Pro Gln Lys 85 90 95 Lys Thr Glu Lys Ile Asn Gln Cys Leu Leu Ser Leu Cys Glu Glu Ser 100 105 110 Thr Cys Gln Glu Gln Glu Thr Glu Glu Asn Ile Leu Lys Leu Ile Gln 115 120 125 Gln Gln Gln Gln Gln Gln Gln Lys Leu Lys His Asn Leu Leu Val Leu 130 135 140 Ile Lys Asp Leu Lys Val Lys Gln Arg Leu Leu Gln Leu Gln Thr Gly 145 150 155 160 Val Leu Glu <210> 227 <211> 220 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (29)..(31) <223> Any amino acid <220> <221> SITE <222> (29)..(31) <223> /note="This region may encompass 0-3 residues" <220> <221> MOD_RES <222> (100)..(100) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(129) <223> Any amino acid <220> <221> SITE <222> (125)..(129) <223> /note="This region may encompass 1-5 residues" <220> <221> MOD_RES <222> (181)..(181) <223> Any amino acid <220> <221> MOD_RES <222> (211)..(211) <223> Any amino acid <400> 227 Leu Val Leu Thr Gln Trp Gln Pro Asn Thr Val Arg Arg Cys Tyr Ile 1 5 10 15 Arg Gly Tyr Leu Pro Leu Ile Ile Cys Gly Glu Asn Xaa Xaa Xaa Thr 20 25 30 Thr Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Ile Gln Lys Gly 35 40 45 Pro Phe Gly Gly Gly Met Ser Thr Thr Thr Phe Ser Leu Arg Val Leu 50 55 60 Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg Trp Thr Tyr Ser Asn Glu 65 70 75 80 Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys Lys Phe Thr Phe Tyr Arg 85 90 95 His Pro Asp Xaa Asp Phe Ile Val Gln Tyr Asn Thr Asn Pro Pro Phe 100 105 110 Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile His Pro Xaa Xaa Xaa Xaa 115 120 125 Xaa Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser Leu 130 135 140 Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly Pro 145 150 155 160 Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys Asp 165 170 175 Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His Pro 180 185 190 Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val Leu 195 200 205 Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro 210 215 220 <210> 228 <211> 172 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (38)..(38) <223> Any amino acid <220> <221> MOD_RES <222> (44)..(46) <223> Any amino acid <220> <221> SITE <222> (44)..(46) <223> /note="This region may encompass 0-3 residues" <220> <221> MOD_RES <222> (77)..(77) <223> Any amino acid <220> <221> MOD_RES <222> (79)..(79) <223> Any amino acid <220> <221> MOD_RES <222> (98)..(101) <223> Any amino acid <220> <221> SITE <222> (98)..(101) <223> /note="This region may encompass 0-4 residues" <400> 228 Ser Asn Phe Glu Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro 1 5 10 15 Leu Thr Asp Lys Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr 20 25 30 Lys Pro Asp Thr Ile Xaa Asp Lys Thr Gln Ser Xaa Xaa Xaa Lys Cys 35 40 45 Leu Ile Glu Asp Leu Pro Leu Trp Ala Ala Leu Tyr Gly Tyr Val Asp 50 55 60 Phe Cys Glu Lys Glu Thr Gly Asp Ser Ala Ile Ile Xaa Asn Xaa Gly 65 70 75 80 Arg Val Leu Ile Arg Cys Pro Tyr Thr Lys Pro Pro Leu Tyr Asp Lys 85 90 95 Thr Xaa Xaa Xaa Xaa Asn Lys Gly Phe Val Pro Tyr Ser Thr Asn Phe 100 105 110 Gly Asn Gly Lys Met Pro Gly Gly Ser Gly Tyr Val Pro Ile Tyr Trp 115 120 125 Arg Ala Arg Trp Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu 130 135 140 Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr Lys Asp Glu Lys Pro Ser 145 150 155 160 Thr Gln Leu Val Met Lys Tyr Cys Phe Asn Phe Asn 165 170 <210> 229 <211> 258 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (20)..(22) <223> Any amino acid <220> <221> SITE <222> (20)..(22) <223> /note="This region may encompass 0-3 residues" <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (78)..(78) <223> Any amino acid <220> <221> MOD_RES <222> (89)..(89) <223> Any amino acid <220> <221> MOD_RES <222> (91)..(91) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(98) <223> Any amino acid <220> <221> SITE <222> (95)..(98) <223> /note="This region may encompass 1-4 residues" <220> <221> MOD_RES <222> (107)..(120) <223> Any amino acid <220> <221> SITE <222> (107)..(120) <223> /note="This region may encompass 2-14 residues" <220> <221> MOD_RES <222> (129)..(129) <223> Any amino acid <220> <221> MOD_RES <222> (139)..(168) <223> Any amino acid <220> <221> SITE <222> (139)..(168) <223> /note="This region may encompass 0-30 residues" <220> <221> MOD_RES <222> (201)..(204) <223> Any amino acid <220> <221> SITE <222> (201)..(204) <223> /note="This region may encompass 0-4 residues" <220> <221> MOD_RES <222> (219)..(258) <223> Any amino acid <220> <221> SITE <222> (219)..(258) <223> /note="This region may encompass 0-40 residues" <400> 229 Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro Cys Lys 1 5 10 15 Asp Ser Gly Xaa Xaa Xaa Ser Gly Xaa Gly Arg Gln Pro Arg Ser Val 20 25 30 Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser 35 40 45 Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met 50 55 60 Ser Glu Gln Pro Thr Asp Asp Glu Ile Phe Thr Gly Gly Xaa Pro Lys 65 70 75 80 Arg Pro Arg Arg Asp Pro Pro Thr Xaa Gln Xaa Pro Glu Glu Xaa Xaa 85 90 95 Xaa Xaa Gln Lys Glu Ser Ser Ser Phe Arg Xaa Xaa Xaa Xaa Xaa Xaa 100 105 110 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Glu Ser Ser Ser Gln Glu 115 120 125 Xaa Glu Ser Glu Ser Gln Glu Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa 130 135 140 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Gln Thr Val Gln Gln Gln Leu 165 170 175 Arg Gln Gln Leu Arg Glu Gln Arg Arg Leu Arg Val Gln Leu Gln Leu 180 185 190 Leu Phe Gln Gln Leu Leu Lys Thr Xaa Xaa Xaa Xaa Gln Ala Gly Leu 195 200 205 His Ile Asn Pro Leu Leu Leu Ser Gln Ala Xaa Xaa Xaa Xaa Xaa Xaa 210 215 220 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 225 230 235 240 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 245 250 255 Xaa Xaa <210> 230 <211> 214 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (136)..(136) <223> Any amino acid <220> <221> MOD_RES <222> (138)..(141) <223> Any amino acid <220> <221> SITE <222> (138)..(141) <223> /note="This region may encompass 1-4 residues" <220> <221> MOD_RES <222> (179)..(179) <223> Any amino acid <400> 230 Leu Lys Gln Trp Gln Pro Ser Thr Ile Arg Lys Cys Lys Ile Lys Gly 1 5 10 15 Tyr Leu Pro Leu Phe Gln Cys Gly Lys Gly Arg Ile Ser Asn Asn Tyr 20 25 30 Thr Gln Tyr Lys Glu Ser Ile Val Pro His His Glu Pro Gly Gly Gly 35 40 45 Gly Trp Ser Ile Gln Gln Phe Thr Leu Gly Ala Leu Tyr Glu Glu His 50 55 60 Leu Lys Leu Arg Asn Trp Trp Thr Lys Ser Asn Asp Gly Leu Pro Leu 65 70 75 80 Val Arg Tyr Leu Gly Cys Thr Ile Lys Leu Tyr Arg Ser Glu Asp Thr 85 90 95 Asp Tyr Ile Val Thr Tyr Gln Arg Cys Tyr Pro Met Thr Ala Thr Lys 100 105 110 Leu Thr Tyr Leu Ser Thr Gln Pro Ser Arg Met Leu Met Asn Lys His 115 120 125 Lys Ile Ile Val Pro Ser Lys Xaa Thr Xaa Xaa Xaa Xaa Asn Lys Lys 130 135 140 Lys Lys Pro Tyr Lys Lys Ile Phe Ile Lys Pro Pro Ser Gln Met Gln 145 150 155 160 Asn Lys Trp Tyr Phe Gln Gln Asp Ile Ala Asn Thr Pro Leu Leu Gln 165 170 175 Leu Thr Xaa Thr Ala Cys Ser Leu Asp Arg Met Tyr Leu Ser Ser Asp 180 185 190 Ser Ile Ser Asn Asn Ile Thr Phe Thr Ser Leu Asn Thr Asn Phe Phe 195 200 205 Gln Asn Pro Asn Phe Gln 210 <210> 231 <211> 187 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (1)..(10) <223> Any amino acid <220> <221> SITE <222> (1)..(10) <223> /note="This region may encompass 4-10 residues" <220> <221> MOD_RES <222> (38)..(45) <223> Any amino acid <220> <221> SITE <222> (38)..(45) <223> /note="This region may encompass 1-8 residues" <220> <221> MOD_RES <222> (94)..(94) <223> Any amino acid <220> <221> MOD_RES <222> (100)..(102) <223> Any amino acid <220> <221> SITE <222> (100)..(102) <223> /note="This region may encompass 1-3 residues" <220> <221> MOD_RES <222> (112)..(112) <223> Any amino acid <220> <221> MOD_RES <222> (114)..(115) <223> Any amino acid <220> <221> SITE <222> (114)..(115) <223> /note="This region may encompass 0-2 residues" <220> <221> MOD_RES <222> (124)..(139) <223> Any amino acid <220> <221> SITE <222> (124)..(139) <223> /note="This region may encompass 3-16 residues" <220> <221> MOD_RES <222> (154)..(154) <223> Any amino acid <400> 231 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Pro Leu Tyr Phe Glu 1 5 10 15 Cys Arg Tyr Asn Pro Phe Lys Asp Lys Gly Thr Gly Asn Lys Val Tyr 20 25 30 Leu Val Ser Asn Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Gly Trp 35 40 45 Asp Pro Pro Thr Asp Pro Asp Leu Ile Ile Glu Gly Phe Pro Leu Trp 50 55 60 Leu Leu Leu Trp Gly Trp Leu Asp Trp Gln Lys Lys Leu Gly Lys Ile 65 70 75 80 Gln Asn Ile Asp Thr Asp Tyr Ile Leu Val Ile Gln Ser Xaa Tyr Tyr 85 90 95 Ile Pro Pro Xaa Xaa Xaa Lys Leu Pro Tyr Tyr Val Pro Leu Asp Xaa 100 105 110 Asp Xaa Xaa Phe Leu His Gly Arg Ser Pro Tyr Xaa Xaa Xaa Xaa Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Ser Asp Lys Gln 130 135 140 His Trp His Pro Lys Val Arg Phe Gln Xaa Glu Thr Ile Asn Asn Ile 145 150 155 160 Ala Leu Thr Gly Pro Gly Thr Pro Lys Leu Pro Asn Gln Lys Ser Ile 165 170 175 Gln Ala His Met Lys Tyr Lys Phe Tyr Phe Lys 180 185 <210> 232 <211> 163 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (34)..(34) <223> Any amino acid <220> <221> MOD_RES <222> (65)..(65) <223> Any amino acid <220> <221> MOD_RES <222> (77)..(78) <223> Any amino acid <220> <221> MOD_RES <222> (86)..(87) <223> Any amino acid <220> <221> MOD_RES <222> (96)..(96) <223> Any amino acid <220> <221> MOD_RES <222> (102)..(106) <223> Any amino acid <220> <221> SITE <222> (102)..(106) <223> /note="This region may encompass 0-5 residues" <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (135)..(135) <223> Any amino acid <220> <221> MOD_RES <222> (138)..(163) <223> Any amino acid <220> <221> SITE <222> (138)..(163) <223> /note="This region may encompass 0-26 residues" <400> 232 Trp Gly Gly Cys Pro Ala Pro Met Glu Thr Ile Thr Asp Pro Cys Lys 1 5 10 15 Gln Pro Lys Tyr Pro Ile Pro Asn Asn Leu Leu Gln Thr Thr Ser Leu 20 25 30 Gln Xaa Pro Thr Thr Pro Ile Glu Thr Tyr Leu Tyr Lys Phe Asp Glu 35 40 45 Arg Arg Gly Leu Leu Thr Lys Lys Ala Ala Lys Arg Ile Lys Lys Asp 50 55 60 Xaa Thr Thr Glu Thr Thr Leu Phe Thr Asp Thr Gly Xaa Xaa Thr Ser 65 70 75 80 Thr Thr Leu Pro Thr Xaa Xaa Gln Thr Glu Thr Thr Gln Glu Glu Xaa 85 90 95 Thr Ser Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Glu Thr Leu Leu Gln Gln 100 105 110 Leu Gln Gln Leu Arg Arg Lys Gln Lys Gln Leu Arg Xaa Arg Ile Leu 115 120 125 Gln Leu Leu Gln Leu Leu Xaa Leu Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa 130 135 140 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa Xaa <210> 233 <211> 203 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (79)..(79) <223> Any amino acid <220> <221> MOD_RES <222> (104)..(104) <223> Any amino acid <220> <221> MOD_RES <222> (116)..(116) <223> Any amino acid <220> <221> MOD_RES <222> (120)..(121) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (170)..(170) <223> Any amino acid <400> 233 Thr Ile Pro Leu Lys Gln Trp Gln Pro Glu Ser Ile Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Tyr Gly Thr Leu Val Leu Gly Ala Glu Gly Arg Gln Phe 20 25 30 Tyr Cys Tyr Thr Asn Glu Lys Asp Glu Tyr Thr Pro Pro Lys Ala Pro 35 40 45 Gly Gly Gly Gly Phe Gly Val Glu Leu Phe Ser Leu Glu Tyr Leu Tyr 50 55 60 Glu Gln Trp Lys Ala Arg Asn Asn Ile Trp Thr Lys Ser Asn Xaa Tyr 65 70 75 80 Lys Asp Leu Cys Arg Tyr Thr Gly Cys Lys Ile Thr Phe Tyr Arg His 85 90 95 Pro Thr Thr Asp Phe Ile Val Xaa Tyr Ser Arg Gln Pro Pro Phe Glu 100 105 110 Ile Asp Lys Xaa Thr Tyr Met Xaa Xaa His Pro Gln Xaa Leu Leu Leu 115 120 125 Arg Lys His Lys Lys Ile Ile Leu Ser Lys Ala Thr Asn Pro Lys Gly 130 135 140 Lys Leu Lys Lys Lys Ile Lys Ile Lys Pro Pro Lys Gln Met Leu Asn 145 150 155 160 Lys Trp Phe Phe Gln Lys Gln Phe Ala Xaa Tyr Gly Leu Val Gln Leu 165 170 175 Gln Ala Ala Ala Cys Asx Leu Arg Tyr Pro Arg Leu Gly Cys Cys Asn 180 185 190 Glu Asn Arg Leu Ile Thr Leu Tyr Tyr Leu Asn 195 200 <210> 234 <211> 162 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (12)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (23)..(23) <223> Any amino acid <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> VARIANT <222> (58)..(58) <223> /replace="Ile" <220> <221> MOD_RES <222> (84)..(84) <223> Any amino acid <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(95) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(105) <223> Any amino acid <220> <221> VARIANT <222> (111)..(111) <223> /replace="Ile" <220> <221> MOD_RES <222> (113)..(113) <223> Any amino acid <220> <221> MOD_RES <222> (154)..(154) <223> Any amino acid <220> <221> MOD_RES <222> (156)..(156) <223> Any amino acid <220> <221> SITE <222> (1)..(162) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 234 Leu Pro Ile Val Val Ala Arg Tyr Asn Pro Ala Xaa Asp Thr Gly Lys 1 5 10 15 Gly Asn Lys Xaa Trp Leu Xaa Ser Thr Leu Asn Gly Ser Xaa Trp Ala 20 25 30 Pro Pro Thr Thr Asp Lys Asp Leu Ile Ile Glu Gly Leu Pro Leu Trp 35 40 45 Leu Ala Leu Tyr Gly Tyr Trp Ser Tyr Leu Lys Lys Val Lys Lys Asp 50 55 60 Lys Gly Ile Leu Gln Ser His Met Phe Val Val Lys Ser Pro Ala Ile 65 70 75 80 Gln Pro Leu Xaa Thr Ala Thr Thr Gln Xaa Thr Phe Tyr Pro Xaa Ile 85 90 95 Asp Asn Ser Phe Ile Gln Gly Lys Xaa Pro Tyr Asp Glu Pro Leu Thr 100 105 110 Xaa Asn Gln Lys Lys Leu Trp Tyr Pro Thr Leu Glu His Gln Gln Glu 115 120 125 Thr Ile Asn Ala Ile Val Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp 130 135 140 Asn Gln Lys Asn Ser Thr Trp Glu Leu Xaa Tyr Xaa Tyr Thr Phe Tyr 145 150 155 160 Phe Lys <210> 235 <211> 177 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (16)..(16) <223> Any amino acid <220> <221> MOD_RES <222> (26)..(26) <223> Any amino acid <220> <221> MOD_RES <222> (33)..(33) <223> Any amino acid <220> <221> MOD_RES <222> (73)..(73) <223> Any amino acid <220> <221> MOD_RES <222> (81)..(82) <223> Any amino acid <220> <221> SITE <222> (81)..(82) <223> /note="This region may encompass 0-2 residues" <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (94)..(94) <223> Any amino acid <220> <221> MOD_RES <222> (119)..(124) <223> Any amino acid <220> <221> SITE <222> (119)..(124) <223> /note="This region may encompass 1-6 residues" <220> <221> MOD_RES <222> (168)..(177) <223> Any amino acid <220> <221> SITE <222> (168)..(177) <223> /note="This region may encompass 1-10 residues" <400> 235 Trp Gly Gly Pro Gln Ile Pro Asp Gln Pro Val Glu Asp Pro Lys Xaa 1 5 10 15 Gln Gly Thr Tyr Pro Val Pro Asp Thr Xaa Gln Gln Thr Ile Gln Ile 20 25 30 Xaa Asn Pro Leu Lys Gln Lys Pro Glu Thr Met Phe His Asp Trp Asp 35 40 45 Tyr Arg Arg Gly Ile Ile Thr Ser Thr Ala Leu Lys Arg Met Gln Glu 50 55 60 Asn Leu Glu Thr Asp Ser Ser Phe Xaa Ser Asp Ser Glu Glu Thr Pro 65 70 75 80 Xaa Xaa Lys Lys Lys Lys Arg Leu Thr Xaa Glu Leu Pro Xaa Pro Gln 85 90 95 Glu Glu Thr Glu Glu Ile Gln Ser Cys Leu Leu Ser Leu Cys Glu Glu 100 105 110 Ser Thr Cys Gln Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa Glu Asn Leu Gln 115 120 125 Gln Leu Ile His Gln Gln Gln Gln Gln Gln Gln Gln Leu Lys His Asn 130 135 140 Ile Leu Lys Leu Leu Ser Asp Leu Lys Glx Lys Gln Arg Leu Leu Gln 145 150 155 160 Leu Gln Thr Gly Ile Leu Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 165 170 175 Xaa <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <400> 255 000 <210> 256 <400> 256 000 <210> 257 <400> 257 000 <210> 258 <400> 258 000 <210> 259 <400> 259 000 <210> 260 <400> 260 000 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 300 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 301 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 301 gcguacguca caagucacgu ggaggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 302 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 302 gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggug 77 <210> 303 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 303 gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugauuuguca cgugugua 78 <210> 304 <211> 66 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 304 cuuccggguc auaggucaca ccuacgucac aagucacgug gggaggguug gcguauagcc 60 cggaag 66 <210> 305 <211> 68 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 305 gccggggggc ugccgccccc cccggggaaa ggggggggcc ccccccgggg ggggguuugc 60 cccccggc 68 <210> 306 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 306 auacgucauc agucacgugg gggaaggcgu gccuaaaccc ggaagcaucc ucguccacgu 60 gacugugacg uguguggc 78 <210> 307 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 307 cauuuuaagu aaggcggaag cagcucggcg uacacaaaau ggcggcggag cacuuccggc 60 uugcccaaaa ugg 73 <210> 308 <211> 71 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 308 gucacaaguc acguggggag gguuggcguu uaacccggaa gccaauccuc uuacguggcc 60 ugucacguga c 71 <210> 309 <211> 70 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 309 cgaccgcguc ccgaaggcgg guacccgagg ugaguuuaca caccgagguu aagggccaau 60 ucgggcuugg 70 <210> 310 <211> 59 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 310 cgcgguaucg uagccgacgc ggaccccguu uucggggccc ccgcggggcu cucggcgcg 59 <210> 311 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 311 cgccauuuug ugauacgcgc guccccuccc ggcuuccgua caacgucagg cggggcgugg 60 ccguaucaga aaauggcg 78 <210> 312 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 312 gcuacgucau aagucacgug acugggcagg uacuaaaccc ggaaguaucc ucggucacgu 60 ggccugucac guaguug 77 <210> 313 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 313 ggcusugacg ucaaagucac gugggraggg uggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacagcc 80 <210> 314 <211> 66 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 314 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 gaaggu 66 <210> 315 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 315 gguugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 316 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 316 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 317 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 317 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 318 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 318 ggcugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 319 <211> 79 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 319 agaccacgug guaagucacg ugggggcagc ugcuguaaac ccggaaguag cugacccgcg 60 ugacugguca cgugaccug 79 <210> 320 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 320 cgccauuuua uaauacgcgc guccccuccc ggcuuccgua cuacgucagg cggggcgugg 60 ccguauuaga aaauggug 78 <210> 321 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 321 uaaguaaggc ggaaccaggc ugucacccug ugucaaaggu caagggacag ccuuccggcu 60 ugcacaaaau gg 72 <210> 322 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 322 ugccuacguc auaagucacg uggggacggc ugcuguaaac acggaaguag cugacccgcg 60 ugacuuguca cgugagca 78 <210> 323 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 323 uuguguaagg cggaacaggc ugacaccccg ugucaaaggu caggggucag ccuccgcuuu 60 gcaccaaaug gu 72 <210> 324 <211> 79 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 324 uaccuacguc auaagucacg ugggaagagc ugcugugaac cuggaaguag cugacccgcg 60 uggcuuguca cgugagugc 79 <210> 325 <211> 75 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 325 uuuuccuggc ccguccgcgg cgagagcgcg agcgaagcga gcgaucgggc gucccgaggg 60 cgggugccgg aggug 75 <210> 326 <211> 68 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 326 aaagugagug gggccagacu ucgccauagg gccuuuaacu uccgggugcg ucugggggcc 60 gccauuuu 68 <210> 327 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 327 gugacguuac ucucacguga ugggggcgug cucuaacccg gaagcauccu cgaccacgug 60 acugugacgu cac 73 <210> 328 <211> 75 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 328 agcgucuacu acguacacuu ccuggggugu guccugccac uguauauaaa ccagaggggu 60 gacgaauggu agagu 75 <210> 329 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 329 gugacgucaa agucacgugg ugacggccau uuuaacccgg aaguggcugu ugucacguga 60 cuugacguca cgg 73 <210> 330 <211> 62 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 330 gcuuuagacg ccauuuuagg cccucgcggg cacccguagg cgcguuuuaa ugacgucacg 60 gc 62 <210> 331 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 331 cacccguagg cgcguuuuaa ugacgucacg gcagccauuu ugucgugacg uuugagacac 60 gugauggggg cgu 73 <210> 332 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 332 gucgugacgu uugagacacg ugaugggggc gugccuaaac ccggaagcau cccuggucac 60 gugacucuga cgucacggcg 80 <210> 333 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 333 cgaaagugag uggggccaga cuucgccaua aggccuuuaa cuuccgggug cguguggggg 60 ccgccauuuu agcuucg 77 <210> 334 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 334 cugugacguc aaagucacgu ggggagggcg gcguguaacc cggaagucau ccucgucacg 60 ugaccugacg ucacgg 76 <210> 335 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 335 cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgua 60 gcggcggggg ggc 73 <210> 336 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 336 gguagaguuu uuuccgcccg uccgcagcga ggacgcgagc gcagcgagcg gccgagcgac 60 ccguggg 67 <210> 337 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 337 gcugugacgu uucagucacg uggggaggga acgccuaaac ccggaagcgu cccuggucac 60 gugauuguga cgucacggcc 80 <210> 338 <211> 63 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 338 ccgccauuuu gugacuuccu uccgcuuuuu caaaaaaaaa gaggaagugu gacguagcgg 60 cgg 63 <210> 339 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 339 gacugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacgg 78 <210> 340 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 340 cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgug 60 gcggcggggg ggc 73 <210> 341 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 341 gguugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacggcc 80 <210> 342 <211> 65 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 342 cccgccaucu ugugacuucc uuccgcuuuu ucaaaaaaaa agaggaagug ugacguagcg 60 gcggg 65 <210> 343 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 343 gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60 guaggug 67 <210> 344 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 344 gacugugacg ucaaagucac guggggagga gggcguguaa cccggaaguc auccucguca 60 cgugaccuga cgucacgg 78 <210> 345 <211> 62 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 345 ucgcgucuua gugacgucac ggcagccauc uugguccuga cgucacuguc acguggggag 60 gg 62 <210> 346 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 346 ugacgucacu gucacguggg gagggaacac gugaacccgg aagugucccu ggucacguga 60 caugacguca cggccg 76 <210> 347 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 347 cgccauuuua aguaagcaug gcgggcggug augucaaaug uuaaagguca cagccgguca 60 ugcuugcaca aaauggcg 78 <210> 348 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 348 cgccauuuua aguaagcaug gcgggcggug acgugcaaug ucaaagguca cagccuguca 60 ugcuugcaca aaauggcg 78 <210> 349 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 349 ccaucuuaag uaguugaggc ggacgguggc gucgguucaa aggucaccau cagccacacc 60 uacucaaaau gg 72 <210> 350 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 350 gccugucaug cuugcacaaa auggcggacu uccgcuuccg ggucgccgcc auauuugguc 60 acgugac 67 <210> 351 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 351 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 352 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 352 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 353 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 353 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 354 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 354 gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 355 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 355 gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugauuuguca cgugugua 78 <210> 356 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 356 gccauuuuaa gucagcucug gggaggcgug acuuccaguu caaaggucau ccucaccaua 60 acuggcacaa aauggc 76 <210> 357 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 357 gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggu 76 <210> 358 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 358 gcauacguca caagucacgu ggaggggaca cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 359 <211> 79 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 359 gcgccauguu aaguggcugu cgccgaggau ugacgucaca guucaaaggu cauccucgac 60 gguaaccgca aacauggcg 79 <210> 360 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 360 caugcgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 361 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 361 uggcagcacu uccgaauggc ugaguuuucc acgcccgucc gcggagaggg agccacggag 60 gugaucccga acg 73 <210> 362 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 362 gccauuuuaa gucagcgcug gggaggcaug acuguaaguu caaaggucau ccucaccgga 60 acugacacaa aauggccg 78 <210> 363 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 363 gccaucuuaa guggcugucg ccgaggauug acgucacagu ucaaagguca uccucggcgg 60 uaaccgcaaa gauggcgguc 80 <210> 364 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 364 auacgucaua agucacaugu cuaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 365 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 365 ccauuuuaag uaaggcggaa gcagcugucc cuguaacaaa auggcggcga cagccuuccg 60 cuuugcacaa aauggag 77 <210> 366 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 366 gccaucuuaa guggcugucg cugaggauug acgucacagu ucaaagguca uccucggcgg 60 uaaccgcaaa gauggcgguc 80 <210> 367 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 367 cauacgucau aagucacaug acaggagucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 368 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 368 cgccaucuua aguggcuguc gccgaggauu ggcgucacag uucaaagguc auccucggcg 60 guaaccgcaa agauggcggu 80 <210> 369 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 369 cauacgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60 gacucgucac gugugu 76 <210> 370 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 370 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cguggugu 78 <210> 371 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 371 ccgccauuuu aggcuguugc cgggcguuug acuuccgugu uaaaggucaa acacccagcg 60 acaccaaaaa auggccg 77 <210> 372 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 372 cuacgucaua agucacguga cagggagggg cgacaaaccc ggaagucauc cucgcccacg 60 ugacuuacca cguggug 77 <210> 373 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 373 gccauuuuaa guaggugacg uccaggacug acguaaaguu caaaggucau ccucggcgga 60 accuauacaa aauggcg 77 <210> 374 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 374 cuacgucaua agucacgugg ggacggcugu acuuaaacac ggaaguaggc cccgucacgu 60 gauuuaccac guggug 76 <210> 375 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 375 gccauuuuaa guaaggcgga agagcucuag cuauacaaaa uggcggcgga gcacuuccgc 60 uuugcccaaa aug 73 <210> 376 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 376 gccauuuuaa guagcugacg ucaaggauug acguagaggu uaaaggucau ccucggcgga 60 agcuacacaa aauggug 77 <210> 377 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 377 gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60 ugacuuacca cgugugua 78 <210> 378 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 378 ggcgccauuu uaaguaagca uggcgggcgg cgacgucaca ugucaaaggu caccgcacuu 60 ccgugcuugc acaaaauggc 80 <210> 379 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 379 ugcuacguca ucgagacacg uggugccagc agcuguaaac ccggaagucg cugacacacg 60 ugucuuguca cgu 73 <210> 380 <211> 78 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 380 gccauuuuaa guaagcaccg ccuagggaug acguauaagu ucaaagguca uccucagccg 60 gaacuuacac aaaauggu 78 <210> 381 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 381 acgucauaug ucacgugggg aggcccugcu gcgcaaacgc ggaaguaggc cccgucacgu 60 gucauaccac gu 72 <210> 382 <211> 77 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 382 ccauuuuaag uaaggcggaa gcagcuccac uuucucacaa aauggcggcg gggcacuucc 60 ggcuugccca aaauggc 77 <210> 383 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 383 ccauuuuaag uaaggcggaa guuucuccac uauacaaaau ggcggcggag cacuuccggc 60 uugcccaaaa ug 72 <210> 384 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 384 ccaucuuaag uaguugaggc ggacgguggc gugaguucaa aggucaccau cagccacacc 60 uacucaaaau gg 72 <210> 385 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 385 cgccaucuua aguaguugag gcggacggug gcgugaguuc aaaggucacc aucagccaca 60 ccuacucaaa auggug 76 <210> 386 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 386 uuucggaccu ucggcgucgg gggggucggg ggcuuuacua aacagacucc gagaugccau 60 uggacacuga ggg 73 <210> 387 <211> 76 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 387 ccauuuuaag uaggugccgu ccagcacugc uguuccgggu uaaagggcau ccucggcgga 60 accuauacaa aauggc 76 <210> 388 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 388 cuacgucauc gaugacgugg ggaggcguac uaugaaacgc ggaaguaggc cccgcuacgu 60 caucaucacg ugg 73 <210> 389 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 389 ccauuuuaag uaaggcggaa gagcugcucu auauacaaaa uggcggagga gcacuuccgg 60 cuugcccaaa aug 73 <210> 390 <211> 75 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 390 ugccuacgua acaagucacg uggggagggu uggcguauaa cccggaaguc aauccuccca 60 cguggccugu cacgu 75 <210> 391 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 391 uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60 uacacaaaau gg 72 <210> 392 <211> 72 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 392 uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60 uacacaaaau gg 72 <210> 393 <211> 80 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 393 gcagccauuu uaagucagcu ucggggaggg ucacgcaaag uucaaagguc auccucaccg 60 gaacugguac aaaauggccg 80 <210> 394 <211> 74 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 394 ugcuacguca uaagugacgu agcugguguc ugcuguaaac acggaaguag gccccgccac 60 gucacuuguc acgu 74 <210> 395 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 395 aguagcugac gucaaggauu gac 23 <210> 396 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 396 caagucacgu ggaggggacc cg 22 <210> 397 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 397 aaguagcuga cgucaaggau ugacg 25 <210> 398 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 398 auaagucacg ugguggggac ccg 23 <210> 399 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 399 uggggagggu uggcguauag cccgga 26 <210> 400 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 400 ccccccccgg ggggggguuu gccc 24 <210> 401 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 401 aucagucacg ugggggaagg cgugc 25 <210> 402 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 402 aaguaaggcg gaagcagcuc gg 22 <210> 403 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 403 agucacgugg ggaggguugg c 21 <210> 404 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 404 cccgaaggcg gguacccgag gu 22 <210> 405 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 405 uaucguagcc gacgcggacc ccg 23 <210> 406 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 406 auuuugugau acgcgcgucc ccuccc 26 <210> 407 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 407 aagucacgug acugggcagg u 21 <210> 408 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 408 ugacgucaaa gucacguggg ragggu 26 <210> 409 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 409 gaucgagcgu cccgugggcg ggu 23 <210> 410 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 410 ugacgucaaa gucacguggg gagggcgg 28 <210> 411 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 411 gaucgagcgu cccgugggcg ggu 23 <210> 412 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 412 gaucgagcgu cccgugggcg ggu 23 <210> 413 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 413 ugacgucaaa gucacguggg gagggcgg 28 <210> 414 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 414 acgugguaag ucacgugggg gcagcu 26 <210> 415 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 415 auuuuauaau acgcgcgucc ccucc 25 <210> 416 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 416 aagggacagc cuuccggcuu gc 22 <210> 417 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 417 cauaagucac guggggacgg cugcu 25 <210> 418 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 418 uaaggcggaa caggcugaca cccc 24 <210> 419 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 419 uacgucauaa gucacguggg aagagcug 28 <210> 420 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 420 ucgggcgucc cgagggcggg ug 22 <210> 421 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 421 aaagugagug gggccagacu ucgcc 25 <210> 422 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 422 cucucacgug augggggcgu gc 22 <210> 423 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 423 ucuacuacgu acacuuccug gggugugu 28 <210> 424 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 424 uggcuguugu cacgugacuu ga 22 <210> 425 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 425 agacgccauu uuaggcccuc gcgg 24 <210> 426 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 426 ugucgugacg uuugagacac gugau 25 <210> 427 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 427 ugacguuuga gacacgugau gggggcgugc 30 <210> 428 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 428 agugaguggg gccagacuuc gc 22 <210> 429 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 429 ugugacguca aagucacgug gggagggcgg 30 <210> 430 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 430 aaaagaggaa guaugacgua gcggcgg 27 <210> 431 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 431 agcgagcggc cgagcgaccc g 21 <210> 432 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 432 uucagucacg uggggaggga acgc 24 <210> 433 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 433 aaaagaggaa gugugacgua gcgg 24 <210> 434 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 434 ugugacguca aagucacgug gggagggcgg 30 <210> 435 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 435 aaaagaggaa guaugacgug gcgg 24 <210> 436 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 436 ugacgucaaa gucacguggg gagggcgg 28 <210> 437 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 437 aaaaaagagg aagugugacg uagcggcgg 29 <210> 438 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 438 gaucgagcgu cccgugggcg ggu 23 <210> 439 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 439 ugugacguca aagucacgug gggaggaggg 30 <210> 440 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 440 uugguccuga cgucacuguc a 21 <210> 441 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 441 cgucacuguc acguggggag ggaacac 27 <210> 442 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 442 uaaguaagca uggcgggcgg ugau 24 <210> 443 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 443 aaguaagcau ggcgggcggu ga 22 <210> 444 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 444 uaaguaguug aggcggacgg uggc 24 <210> 445 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 445 ucaugcuugc acaaaauggc ggacuuccg 29 <210> 446 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 446 aguagcugac gucaaggauu gac 23 <210> 447 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 447 aguagcugac gucaaggauu gac 23 <210> 448 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 448 acaagucacg ugggggggac ccg 23 <210> 449 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 449 aaguagcuga cgucaaggau ugacg 25 <210> 450 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 450 auaagucacg ugguggggac ccg 23 <210> 451 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 451 aagucagcuc uggggaggcg ugacuu 26 <210> 452 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 452 aguagcugac gucaaggauu gac 23 <210> 453 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 453 caagucacgu ggaggggaca cg 22 <210> 454 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 454 uguuaagugg cugucgccga ggauuga 27 <210> 455 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 455 uaagucacau gacagggguc ca 22 <210> 456 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 456 cggagaggga gccacggagg ug 22 <210> 457 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 457 aagucagcgc uggggaggca uga 23 <210> 458 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 458 ucuuaagugg cugucgccga ggauugac 28 <210> 459 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 459 aagucacaug ucuagggguc cacu 24 <210> 460 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 460 aaguaaggcg gaagcagcug ucc 23 <210> 461 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 461 aucuuaagug gcugucgcug aggauugac 29 <210> 462 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 462 uaagucacau gacaggaguc cacu 24 <210> 463 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 463 aaguggcugu cgccgaggau ug 22 <210> 464 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 464 uaagucacau gacagggguc ca 22 <210> 465 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 465 acaagucacg ugggggggac ccg 23 <210> 466 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 466 auuuuaggcu guugccgggc guuugacu 28 <210> 467 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 467 auaagucacg ugacagggag ggg 23 <210> 468 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 468 aaguagguga cguccaggac u 21 <210> 469 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 469 cauaagucac guggggacgg cugu 24 <210> 470 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 470 uaaguaaggc ggaagagcuc uagcua 26 <210> 471 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 471 aguagcugac gucaaggauu gac 23 <210> 472 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 472 acaagucacg ugggggggac ccg 23 <210> 473 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 473 uaaguaagca uggcgggcgg cgac 24 <210> 474 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 474 aucgagacac guggugccag cagcu 25 <210> 475 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 475 ucauccucag ccggaacuua cacaaaaugg 30 <210> 476 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 476 auaugucacg uggggaggcc cugcug 26 <210> 477 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 477 aaguaaggcg gaagcagcuc cacuuu 26 <210> 478 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 478 aaguaaggcg gaaguuucuc cacu 24 <210> 479 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 479 uaaguaguug aggcggacgg uggc 24 <210> 480 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 480 uaaguaguug aggcggacgg ugg 23 <210> 481 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 481 gaccuucggc gucggggggg ucggggg 27 <210> 482 <211> 19 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 482 auccucggcg gaaccuaua 19 <210> 483 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 483 aucgaugacg uggggaggcg uacuau 26 <210> 484 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 484 uggcggagga gcacuuccgg cuug 24 <210> 485 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 485 aacaagucac guggggaggg uuggc 25 <210> 486 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 486 aggggucagc cuuccgcuuu a 21 <210> 487 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 487 aggggucagc cuuccgcuuu a 21 <210> 488 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 488 uaagucagcu ucggggaggg ucac 24 <210> 489 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 489 ucauaaguga cguagcuggu gucugcu 27 <210> 490 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 490 cauccucggc ggaagcuaca caa 23 <210> 491 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 491 ggccccguca cgugacuuac cac 23 <210> 492 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 492 ucauccucgg cggaagcuac acaa 24 <210> 493 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 493 ggccccguca cgugauuugu cac 23 <210> 494 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 494 ccgggucaua ggucacaccu acgucac 27 <210> 495 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 495 ggcugccgcc ccccccgggg aaaggggg 28 <210> 496 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 496 auccucgucc acgugacugu ga 22 <210> 497 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 497 gagcacuucc ggcuugccca a 21 <210> 498 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 498 caauccucuu acguggccug 20 <210> 499 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 499 cgagguuaag ggccaauucg ggcu 24 <210> 500 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 500 gggcccccgc ggggcucucg gcg 23 <210> 501 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 501 gcggggcgug gccguaucag aaaaugg 27 <210> 502 <211> 19 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 502 ccucggucac guggccugu 19 <210> 503 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 503 ccucgucacg ugaccugacg ucacag 26 <210> 504 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 504 ccguccgcgg cgagagcgcg agcga 25 <210> 505 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 505 auccucguca cgugaccuga cgucacg 27 <210> 506 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 506 ccguccgcgg cgagagcgcg agcga 25 <210> 507 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 507 ccguccgcgg cgagagcgcg agcga 25 <210> 508 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 508 auccucguca cgugaccuga cgucacg 27 <210> 509 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 509 cugacccgcg ugacugguca cguga 25 <210> 510 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 510 cggggcgugg ccguauuaga aaaugg 26 <210> 511 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 511 aguaaggcgg aaccaggcug ucacccugu 29 <210> 512 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 512 uagcugaccc gcgugacuug ucac 24 <210> 513 <211> 19 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 513 ggucagccuc cgcuuugca 19 <210> 514 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 514 gcugacccgc guggcuuguc acgugagu 28 <210> 515 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 515 ggcccguccg cggcgagagc gcgag 25 <210> 516 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 516 uccgggugcg ucugggggcc gccauuu 27 <210> 517 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 517 auccucgacc acgugacugu g 21 <210> 518 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 518 auaaaccaga ggggugacga augguagagu 30 <210> 519 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 519 caaagucacg uggugacggc cau 23 <210> 520 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 520 guaggcgcgu uuuaaugacg ucacgg 26 <210> 521 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 521 uaggcgcguu uuaaugacgu cacggcag 28 <210> 522 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 522 aucccugguc acgugacucu gacgucacg 29 <210> 523 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 523 gcgugugggg gccgccauuu uagcuu 26 <210> 524 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 524 ucauccucgu cacgugaccu gacgucacg 29 <210> 525 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 525 cgccaucuug ugacuuccuu ccgcuuuuu 29 <210> 526 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 526 uagaguuuuu uccgcccguc cg 22 <210> 527 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 527 gucccugguc acgugauugu gac 23 <210> 528 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 528 cauuuuguga cuuccuuccg cuuuuu 26 <210> 529 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 529 ucauccucgu cacgugaccu gacgucacg 29 <210> 530 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 530 ccgccaucuu gugacuuccu uccgcuuuuu 30 <210> 531 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 531 auccucguca cgugaccuga cgucacg 27 <210> 532 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 532 cgccaucuug ugacuuccuu ccgcuuuuuc 30 <210> 533 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 533 ccguccgcgg cgagagcgcg agcga 25 <210> 534 <211> 29 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 534 ucauccucgu cacgugaccu gacgucacg 29 <210> 535 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 535 cuuagugacg ucacggcagc cau 23 <210> 536 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 536 gucccugguc acgugacaug acguc 25 <210> 537 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 537 cacagccggu caugcuugca caaa 24 <210> 538 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 538 acagccuguc augcuugcac aa 22 <210> 539 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 539 caccaucagc cacaccuacu caaa 24 <210> 540 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 540 cgggucgccg ccauauuugg ucacguga 28 <210> 541 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 541 cauccucggc ggaagcuaca caa 23 <210> 542 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 542 cauccucggc ggaagcuaca caa 23 <210> 543 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 543 ggccccguca cgugacuuac cac 23 <210> 544 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 544 ucauccucgg cggaagcuac acaa 24 <210> 545 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 545 ggccccguca cgugauuugu cac 23 <210> 546 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 546 gucauccuca ccauaacugg cacaa 25 <210> 547 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 547 cauccucggc ggaagcuaca caa 23 <210> 548 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 548 ggccccguca cgugacuuac cac 23 <210> 549 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 549 auccucgacg guaaccgcaa acaug 25 <210> 550 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 550 ggccccgaca ugugacucgu c 21 <210> 551 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 551 agcacuuccg aauggcugag uuuucca 27 <210> 552 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 552 auccucaccg gaacugacac aa 22 <210> 553 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 553 cauccucggc gguaaccgca aagaug 26 <210> 554 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 554 uaggccccga caugugacuc gu 22 <210> 555 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 555 acagccuucc gcuuugcaca a 21 <210> 556 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 556 cauccucggc gguaaccgca aagaugg 27 <210> 557 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 557 uaggccccga caugugacuc guc 23 <210> 558 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 558 uccucggcgg uaaccgcaaa 20 <210> 559 <211> 21 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 559 ggccccgaca ugugacucgu c 21 <210> 560 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 560 ggccccguca cgugacuuac cac 23 <210> 561 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 561 ucaaacaccc agcgacacca aaaaaugg 28 <210> 562 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 562 ccucgcccac gugacuuacc ac 22 <210> 563 <211> 20 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 563 ccucggcgga accuauacaa 20 <210> 564 <211> 22 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 564 gccccgucac gugauuuacc ac 22 <210> 565 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 565 gcggcggagc acuuccgcuu ugcccaaa 28 <210> 566 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 566 cauccucggc ggaagcuaca caa 23 <210> 567 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 567 ggccccguca cgugacuuac cac 23 <210> 568 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 568 caccgcacuu ccgugcuugc acaaa 25 <210> 569 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 569 ucgcugacac acgugucuug ucac 24 <210> 570 <211> 30 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 570 cauuuuaagu aagcaccgcc uagggaugac 30 <210> 571 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 571 guaggccccg ucacguguca uaccac 26 <210> 572 <211> 25 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 572 ggcggggcac uuccggcuug cccaa 25 <210> 573 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 573 cggcggagca cuuccggcuu gcccaa 26 <210> 574 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 574 caccaucagc cacaccuacu caaa 24 <210> 575 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 575 accaucagcc acaccuacuc aaa 23 <210> 576 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 576 gacuccgaga ugccauugga cacugagg 28 <210> 577 <211> 18 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 577 aguaggugcc guccagca 18 <210> 578 <211> 27 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 578 aaguaggccc cgcuacguca ucaucac 27 <210> 579 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 579 aaggcggaag agcugcucua uau 23 <210> 580 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 580 caauccuccc acguggccug ucac 24 <210> 581 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 581 aaggcggaac caggcuguca ccccgu 26 <210> 582 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 582 aaggcggaac caggcuguca ccccgu 26 <210> 583 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 583 cauccucacc ggaacuggua caaa 24 <210> 584 <211> 26 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 584 uaggccccgc cacgucacuu gucacg 26 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <400> 600 000 <210> 601 <400> 601 000 <210> 602 <400> 602 000 <210> 603 <400> 603 000 <210> 604 <400> 604 000 <210> 605 <400> 605 000 <210> 606 <400> 606 000 <210> 607 <400> 607 000 <210> 608 <400> 608 000 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <400> 672 000 <210> 673 <400> 673 000 <210> 674 <400> 674 000 <210> 675 <400> 675 000 <210> 676 <400> 676 000 <210> 677 <400> 677 000 <210> 678 <400> 678 000 <210> 679 <400> 679 000 <210> 680 <400> 680 000 <210> 681 <400> 681 000 <210> 682 <400> 682 000 <210> 683 <400> 683 000 <210> 684 <400> 684 000 <210> 685 <400> 685 000 <210> 686 <400> 686 000 <210> 687 <400> 687 000 <210> 688 <400> 688 000 <210> 689 <400> 689 000 <210> 690 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 690 attcgaatgg ctgagtttat gc 22 <210> 691 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 691 cacgaattag ccaagactgg gcac 24 <210> 692 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 692 gctcccactc ctgatttctg 20 <210> 693 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 693 ccttgactac ggtggtttca c 21 <210> 694 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 694 tgcaggcatt cgagggcttg tt 22 <210> 695 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 695 tttaaccccc tagtcccagg 20 <210> 696 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 696 tttgtgacac aagatggccg acttccttcc tctttagtct tccccaaaga agacaa 56 <210> 697 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 697 gaagcccacc aaaagcaatt 20 <210> 698 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 698 agttcccgtg tctatagtcg a 21 <210> 699 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic probe" <400> 699 acttcgttac agagtccagg gg 22 <210> 700 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 700 agcaacaggt aatggaggac 20 <210> 701 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 701 tggaagctgg ggtctttaac 20 <210> 702 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic probe" <400> 702 tctaccttag gtgcaaaggg cc 22 <210> 703 <400> 703 000 <210> 704 <400> 704 000 <210> 705 <400> 705 000 <210> 706 <400> 706 000 <210> 707 <400> 707 000 <210> 708 <400> 708 000 <210> 709 <400> 709 000 <210> 710 <400> 710 000 <210> 711 <400> 711 000 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <400> 750 000 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <400> 800 000 <210> 801 <211> 156 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 801 gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60 cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120 aacccaccgc gcatgcgcga ccacgccccc gccgcc 156 <210> 802 <211> 150 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 802 ccgagcgtta gcgaggagtg cgaccctacc ccctgggccc acttcttcgg agccgcgcgc 60 tacgccttcg gctgcgcgcg gcacctcaga cccccgctcg tgctgacacg cttgcgcgtg 120 tcagaccact tcgggctcgc gggggtcggg 150 <210> 803 <211> 122 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 803 gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60 cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120 cg 122 <210> 804 <211> 111 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 804 cggcccagcg gcggcgcgcg cgcttcgcgc gcgcgccggg gggctccgcc cccccccgcg 60 catgcgcggg gccccccccc gcggggggct ccgccccccg gtcccccccc g 111 <210> 805 <211> 115 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 805 cggccgtgcg gcggcgcgcg cgcttcgcgc gcgcgccggg ggctgccgcc cccccccgcg 60 catgcgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc ccccg 115 <210> 806 <211> 104 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 806 cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60 gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104 <210> 807 <211> 108 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 807 ggcggcggcg cgcgcgctac gcgcgcgcgc cggggagctc tgcccccccc cgcgcatgcg 60 cgcgggtccc ccccccgcgg ggggctccgc cccccggtcc cccccccg 108 <210> 808 <211> 37 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Arginine-rich region" <400> 808 Thr Val Val Arg Arg Arg Gly Arg Ser Pro Arg Arg Arg Thr Pro Ser 1 5 10 15 Pro Arg Arg Arg Arg Ser Gln Ser Pro Arg Arg Arg Arg Ser Gln Ser 20 25 30 Arg Glu Ser Gln Cys 35 <210> 809 <211> 27 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Arginine-rich region" <400> 809 Arg Arg Arg Tyr Ala Arg Pro Tyr Arg Arg Arg His Ile Arg Arg Tyr 1 5 10 15 Arg Arg Arg Arg Arg His Phe Arg Arg Arg Arg 20 25 <210> 810 <211> 71 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 810 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcymtgg g 71 <210> 811 <211> 71 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 811 cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 812 <211> 70 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 812 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggcccggg 70 <210> 813 <211> 71 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 813 cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60 cgggctttgg g 71 <210> 814 <211> 69 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 814 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60 ggccatggg 69 <210> 815 <211> 71 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 815 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggccccgg g 71 <210> 816 <211> 71 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 816 cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 817 <211> 71 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Alphatorquevirus clade sequence " <400> 817 cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60 cgggctatgg g 71 <210> 818 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 818 gcgctkcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 819 <211> 36 <212> DNA <213> Torque teno virus <400> 819 gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36 <210> 820 <211> 36 <212> DNA <213> Torque teno virus <400> 820 gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36 <210> 821 <211> 36 <212> DNA <213> Torque teno virus <400> 821 gcgctgcgcg cgcggccccc gggggaggca ttgcct 36 <210> 822 <211> 36 <212> DNA <213> Torque teno virus <400> 822 gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36 <210> 823 <211> 36 <212> DNA <213> Torque teno virus <400> 823 gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36 <210> 824 <211> 36 <212> DNA <213> Anelloviridae sp. <400> 824 gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36 <210> 825 <211> 36 <212> DNA <213> Torque teno virus <400> 825 gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 826 <211> 36 <212> DNA <213> Torque teno virus <400> 826 gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36 <210> 827 <211> 36 <212> DNA <213> Torque teno virus <400> 827 gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36 <210> 828 <211> 724 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (36)..(36) <223> Any amino acid <220> <221> MOD_RES <222> (170)..(170) <223> Any amino acid <220> <221> MOD_RES <222> (246)..(246) <223> Any amino acid <220> <221> MOD_RES <222> (276)..(276) <223> Any amino acid <220> <221> MOD_RES <222> (360)..(360) <223> Any amino acid <220> <221> MOD_RES <222> (370)..(370) <223> Any amino acid <220> <221> MOD_RES <222> (434)..(434) <223> Any amino acid <220> <221> MOD_RES <222> (682)..(682) <223> Any amino acid <400> 828 Met Ala Trp Gly Trp Trp Arg Arg Arg Arg Met Ala Trp Arg Arg Trp 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg 20 25 30 Arg Arg Pro Xaa Arg Arg Arg Arg Arg Arg Arg Arg Val Arg Arg Arg 35 40 45 Arg Arg Gly Arg Trp Arg Arg Arg Arg Tyr Arg Arg Arg Trp Arg Arg 50 55 60 Arg Arg Arg Arg Arg Arg Arg Lys Lys Leu Val Leu Thr Gln Trp Gln 65 70 75 80 Pro Asn Thr Val Arg Arg Cys Tyr Ile Arg Arg Gly Tyr Leu Pro Leu 85 90 95 Ile Ile Cys Gly Glu Asn Thr Thr Ser Arg Asn Tyr Ala Thr His Ser 100 105 110 Asp Asp Thr Pro Gln Gly Pro Phe Gly Gly Gly Met Ser Thr Thr Thr 115 120 125 Phe Ser Leu Arg Val Leu Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg 130 135 140 Trp Thr Tyr Ser Asn Glu Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys 145 150 155 160 Lys Phe Thr Phe Tyr Arg His Pro Asp Xaa Asp Phe Ile Val Gln Tyr 165 170 175 Asn Thr Asn Pro Pro Phe Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile 180 185 190 His Pro Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser 195 200 205 Leu Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly 210 215 220 Pro Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys 225 230 235 240 Asp Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His 245 250 255 Pro Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val 260 265 270 Leu Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro Thr Asn Asp 275 280 285 Asn Leu Lys His Leu Leu Asn Asn Leu Tyr Thr Ser Gly Tyr Asn Thr 290 295 300 Phe Gln Thr Ile Ala Gln Leu Lys Pro Thr Ile Asp Ala Lys Asn Gly 305 310 315 320 Thr Thr Asn Thr Thr Asn Thr Thr Thr Thr Gly Thr Thr Phe Thr Thr 325 330 335 Thr Lys Asn Asp Ser Trp Tyr Gly Gly Asn Thr Tyr Asn Pro Asn Ile 340 345 350 Lys Lys Leu Lys Lys Ile Arg Xaa Tyr Phe Lys Lys Leu Thr Lys Lys 355 360 365 Leu Xaa Pro Thr Tyr Thr Thr Pro Thr Asp Tyr Leu Glu Tyr His Leu 370 375 380 Gly Ile Tyr Ser Pro Ile Phe Ile Ser Pro Gly Arg Ser Asn Phe Glu 385 390 395 400 Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro Leu Thr Asp Lys 405 410 415 Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr Lys Pro Asp Thr 420 425 430 Ile Xaa Asp Lys Thr Gln Ser Lys Cys Leu Ile Glu Asp Leu Pro Leu 435 440 445 Met Ala Ala Leu Tyr Gly Tyr Val Asp Phe Cys Glu Lys Glu Thr Gly 450 455 460 Asp Gln Asp Ile Glu Thr Asn Gly Arg Val Leu Ile Arg Cys Pro Tyr 465 470 475 480 Thr Lys Pro Pro Leu Tyr Asp Lys Thr Asp Pro Asn Lys Gly Phe Val 485 490 495 Pro Tyr Ser Thr Asn Ile Gly Asn Gly Lys Met Pro Gly Gly Ser Gly 500 505 510 Tyr Val Pro Ile Tyr Trp Arg Ala Arg Met Tyr Pro Thr Leu Phe His 515 520 525 Gln Lys Glu Val Leu Glu Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr 530 535 540 Lys Asp Asp Leu Lys Ser Ala Thr Leu Thr Ala Lys Tyr Lys Phe Lys 545 550 555 560 Phe Lys Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro 565 570 575 Cys Lys Asp Ser Gly Ser Ser Pro Pro Gly Arg Gly Pro Arg Ser Val 580 585 590 Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser 595 600 605 Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met 610 615 620 Ser Glu Gln Pro Thr Asp Asp Glu Leu Phe Pro Ala Gly Pro Lys Arg 625 630 635 640 Pro Arg Arg Asp Pro Pro Glu Glu Gln Glu Glu Ser Ser Leu Phe Leu 645 650 655 Arg Arg Arg Pro Pro Trp Glu Glu Ser Ser Gln Glu Glu Ser Ser Ser 660 665 670 Glu Glu Glu Glu Gln Glu Glu Gln Thr Xaa Gln Gln Gln Leu Arg Gln 675 680 685 Gln Leu Arg Glu Gln Arg Gln Leu Arg Val Gln Leu Gln Leu Leu Phe 690 695 700 Gln Gln Leu Leu Lys Thr Gln Ala Gly Leu His Ile Asn Pro Leu Leu 705 710 715 720 Leu Ser Gln Ala <210> 829 <211> 11 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (4)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <400> 829 Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn 1 5 10 <210> 830 <211> 3648 <212> DNA <213> Torque teno virus <400> 830 cgtcactaac cacgtgactc ccacaggcca accacagtgt acgtgattca cttcctggga 60 gtggtttaca ttataatata agcaactgca cttccgaatg gctgagtttt ccacgcccgt 120 ccgcagcgag aacaccacgg aggggagtcc gcgcgtcccg tgggcgggtg ccgaaggtga 180 gtttacacac cgcagtcaag gggcaattcg ggcacgggac tggccgggct atgggcaagg 240 ctcttaaaaa gctatgtttc ttggtaggcc gtaccgaaag aaaaggaaac tgctactgct 300 accactgcat tctacaccga aaactagccg ggttatgagc tggtctaggc ctgtacataa 360 tgccacaggc attgaaagaa actggtggga gtcctgtctt agatcccacg caagttcttg 420 tggctgcggt aattttgtta atcatattaa tgtactggct aatcggtatg gctttgctgg 480 ttccacggag acgccgggta atcctcggcc gaggcccccg gtactgagct ccaccaccag 540 cactcctacc gatcaatcca gaccagctct accatggcat ggggatactg gtggagaagg 600 cgcttctgga gaccccgcag gagatggaga acgtggcgcc gcagaaggag actacggccc 660 agaagatcta gacgcacttt tcgacgcact cgacgaagag taaggaggcg acggtggggg 720 aggcgtgcac gcaggcgggg atggcgacgc aggacttata ttagagccag gcgacgcagg 780 agacgaaaaa gacttgtact gactcagtgg catcccgcag ttagaagaaa atgtaaaatt 840 acaggctaca tgcctatagt atactgtgga catggcagag ctagttttaa ctatgcctgg 900 cactctgatg actgtataaa acaaccacta ccctttggag gctcactatc tacagtgtcc 960 ttcaacctaa aagtactatt tgacgaaaac caaagaggac taaacaaatg gagctaccca 1020 aatgaccaac tagacctcgc cagatacaaa ggctgtagac taacatttta cagaaaaaaa 1080 aacacagact acatagctca atatgacata tcagaacctt atcaactaga caaatatagc 1140 tgtgcaaact atcacccctc aaaaatgatg tttgcaaaaa acaaaatttt aattcctagc 1200 tatgatacaa aacctagagg cagacaaaga gttagagtta gaatagggcc ccctaaacta 1260 tttacagaca agtggtacag tcaatcagac ttatgcaagg taaaccttgt gtcacttgcg 1320 gtttctgcgg cttcctttct ccacccattc ggctcaccac aaactgccaa cttttgtgca 1380 accttccagg tgctgcaacc gttctactac caggctatag gcattagttc tacaaaacac 1440 tcagaagtta tagacatttt atataagaaa aatacatact ggcaaagcaa cattacctct 1500 tggtttttaa ctaatgttaa aaacccaaaa aatatgtcca caaaaatgtt tgaggacatt 1560 aatgttaaat caaacaaaga cagtaattat gactggtttc catttacccc atacactaca 1620 gaaaactatt caaaaattca aaatgcagct caagaatact ggaaatattt aactagtgac 1680 cacccacaag ctactaatag caatgaaggc ctagtacaac catggactaa tgccactata 1740 aaacaatatg aataccacct cggtatgttt agtcctatat ttataggacc taccagagct 1800 aaaactaaat ttaaaacagc atactttgac tgcacttata acccactact agacaaagga 1860 atgggaaaca gaatatggta tcaatacgca accaaagctg acacacaaat atcaaaaaca 1920 gggtgctact gcatgttaga agacattcca atatatgcag cattttatgg atacgtagac 1980 tttatagaaa tggaaatagg taaaggacaa gacattaaag agaacggact tatttgctgc 2040 atatgtagat acacagaccc cccaatgtac aatgaacaac atccagacat gggatttgta 2100 ttttataaca ctaactttgg aaatggaaaa tggatagatg gacggggcga catacctact 2160 tactggatgc aaagatggag acctgttgta ttatttcaaa ctgatgttat tagagactta 2220 gtagaaactg gaccttttag ttacaaagat gacctagcaa atacctcact gactatgaaa 2280 tatgaattct attttacctg gggcggaaac caggcgtacc accagacaat caaaaaccct 2340 tgtaaagacg aaggtaccgg accccataga cagcctagag acgtacaagt tacggacccg 2400 acaaccgtgg gacctgaata tgtgttccac gcgtgggact ggagacgggg cttccttagc 2460 gagcgagctc tcagacgcat gttcgaaaaa cctctcaact atgatgagta ttctaaaaaa 2520 ccaaaaagac ctagaatatt tcctccaaca gaaacagagt cccgaaacca agagctcgaa 2580 gaaagctcgc tttcagagga agaaaagtcg ctactctcca cagaagagat ccagaaagag 2640 gagatacagc gacagttcaa gcgacagctc aagcgacagc tgcgcctcgg gcagcagctc 2700 aaactcctcc aacaacaact cctcaagacg caagcgggcc tgcacctaaa ccccctttca 2760 tatttcccgc aataaataaa gtgtacctgt tcccagacag agctccaaaa cctaaaccca 2820 cctctggaga ctgggaaaca gagtatgcag cttgcagtgc ctttgacaga cccgctagaa 2880 ccaaccttag ctcaccccct tactacccag gagtacctac tccctggcaa gtaaaattca 2940 gccttaaatt tcaataaagt gcatttttac tacagctggg ccgtgggagt ttcacttgtc 3000 ggtgtctacc tcttaaggtc actaagcact ccgagcgcag cgaggagtgc gacccttaac 3060 cctgggtcaa cgccttcgga gccgcgcgct acgccttcgg ctgcgcgcgg cacctcagac 3120 ccccgctcgt gctgacgcgc ttgcgcgcgt cagaccactt cgggctcgcg ggggtcggga 3180 actttgctaa cagactccga ggtgccattg gacacagagt gggcgttcag caacgaaagt 3240 gagtggggcc agacttcgcc ataaggcctt tatcttcttg ccatttgtca gtataagggg 3300 ttgccatagg cttcggcctc aattttaggc cttccggact accaaaatgg ccgatttagt 3360 gacgtcacgg cggccatttt aagtaaggcg gaagtaactc cactatttac aaaatggcgg 3420 cggagcactt ccggcttgcc caaaatggcg gcaaaaaaca tccgggtcaa aggtcgttac 3480 cacgtcacaa gtcacgtggg agggtggtgc tgtaaacccg gaagcaatcc tctcacgtgg 3540 ctagtcacgt gactaacacg tcacacccgc cattttgttt tacaaaatgg ccgacttcct 3600 tccgcttttt taaaaataac ggctcagcgg cggcgcgcgc gctacgcg 3648 <210> 831 <211> 122 <212> PRT <213> Torque teno virus <400> 831 Met Ser Trp Ser Arg Pro Val His Asn Ala Thr Gly Ile Glu Arg Asn 1 5 10 15 Trp Trp Glu Ser Cys Leu Arg Ser His Ala Ser Ser Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Asn Arg Tyr Gly Phe Ala 35 40 45 Gly Ser Thr Glu Thr Pro Gly Asn Pro Arg Pro Arg Pro Pro Val Leu 50 55 60 Ser Ser Thr Thr Ser Thr Pro Thr Asp Gln Ser Arg Pro Ala Leu Pro 65 70 75 80 Trp His Gly Asp Thr Gly Gly Glu Gly Ala Ser Gly Asp Pro Ala Gly 85 90 95 Asp Gly Glu Arg Gly Ala Ala Glu Gly Asp Tyr Gly Pro Glu Asp Leu 100 105 110 Asp Ala Leu Phe Asp Ala Leu Asp Glu Glu 115 120 <210> 832 <211> 262 <212> PRT <213> Torque teno virus <400> 832 Met Ser Trp Ser Arg Pro Val His Asn Ala Thr Gly Ile Glu Arg Asn 1 5 10 15 Trp Trp Glu Ser Cys Leu Arg Ser His Ala Ser Ser Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Asn Arg Tyr Gly Phe Ala 35 40 45 Gly Ser Thr Glu Thr Pro Gly Asn Pro Arg Pro Arg Pro Pro Val Leu 50 55 60 Ser Ser Thr Thr Ser Thr Pro Thr Asp Gln Ser Arg Pro Ala Leu Pro 65 70 75 80 Trp His Gly Asp Thr Gly Gly Glu Gly Ala Ser Gly Asp Pro Ala Gly 85 90 95 Asp Gly Glu Arg Gly Ala Ala Glu Gly Asp Tyr Gly Pro Glu Asp Leu 100 105 110 Asp Ala Leu Phe Asp Ala Leu Asp Glu Glu Gln Ser Lys Thr Leu Val 115 120 125 Lys Thr Lys Val Pro Asp Pro Ile Asp Ser Leu Glu Thr Tyr Lys Leu 130 135 140 Arg Thr Arg Gln Pro Trp Asp Leu Asn Met Cys Ser Thr Arg Gly Thr 145 150 155 160 Gly Asp Gly Ala Ser Leu Ala Ser Glu Leu Ser Asp Ala Cys Ser Lys 165 170 175 Asn Leu Ser Thr Met Met Ser Ile Leu Lys Asn Gln Lys Asp Leu Glu 180 185 190 Tyr Phe Leu Gln Gln Lys Gln Ser Pro Glu Thr Lys Ser Ser Lys Lys 195 200 205 Ala Arg Phe Gln Arg Lys Lys Ser Arg Tyr Ser Pro Gln Lys Arg Ser 210 215 220 Arg Lys Arg Arg Tyr Ser Asp Ser Ser Ser Asp Ser Ser Ser Asp Ser 225 230 235 240 Cys Ala Ser Gly Ser Ser Ser Asn Ser Ser Asn Asn Asn Ser Ser Arg 245 250 255 Arg Lys Arg Ala Cys Thr 260 <210> 833 <211> 256 <212> PRT <213> Torque teno virus <400> 833 Met Ser Trp Ser Arg Pro Val His Asn Ala Thr Gly Ile Glu Arg Asn 1 5 10 15 Trp Trp Glu Ser Cys Leu Arg Ser His Ala Ser Ser Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Asn Arg Tyr Gly Phe Ala 35 40 45 Gly Ser Thr Glu Thr Pro Gly Asn Pro Arg Pro Arg Pro Pro Val Leu 50 55 60 Ser Ser Thr Thr Ser Thr Pro Thr Asp Gln Ser Arg Pro Ala Leu Pro 65 70 75 80 Trp His Gly Asp Thr Gly Gly Glu Gly Ala Ser Gly Asp Pro Ala Gly 85 90 95 Asp Gly Glu Arg Gly Ala Ala Glu Gly Asp Tyr Gly Pro Glu Asp Leu 100 105 110 Asp Ala Leu Phe Asp Ala Leu Asp Glu Glu Asn Arg Val Pro Lys Pro 115 120 125 Arg Ala Arg Arg Lys Leu Ala Phe Arg Gly Arg Lys Val Ala Thr Leu 130 135 140 His Arg Arg Asp Pro Glu Arg Gly Asp Thr Ala Thr Val Gln Ala Thr 145 150 155 160 Ala Gln Ala Thr Ala Ala Pro Arg Ala Ala Ala Gln Thr Pro Pro Thr 165 170 175 Thr Thr Pro Gln Asp Ala Ser Gly Pro Ala Pro Lys Pro Pro Phe Ile 180 185 190 Phe Pro Ala Ile Asn Lys Val Tyr Leu Phe Pro Asp Arg Ala Pro Lys 195 200 205 Pro Lys Pro Thr Ser Gly Asp Trp Glu Thr Glu Tyr Ala Ala Cys Ser 210 215 220 Ala Phe Asp Arg Pro Ala Arg Thr Asn Leu Ser Ser Pro Pro Tyr Tyr 225 230 235 240 Pro Gly Val Pro Thr Pro Trp Gln Val Lys Phe Ser Leu Lys Phe Gln 245 250 255 <210> 834 <211> 178 <212> PRT <213> Torque teno virus <400> 834 Met Ser Trp Ser Arg Pro Val His Asn Ala Thr Gly Ile Glu Arg Asn 1 5 10 15 Trp Trp Glu Ser Cys Leu Arg Ser His Ala Ser Ser Cys Gly Cys Gly 20 25 30 Asn Phe Val Asn His Ile Asn Val Leu Ala Asn Arg Asn Arg Val Pro 35 40 45 Lys Pro Arg Ala Arg Arg Lys Leu Ala Phe Arg Gly Arg Lys Val Ala 50 55 60 Thr Leu His Arg Arg Asp Pro Glu Arg Gly Asp Thr Ala Thr Val Gln 65 70 75 80 Ala Thr Ala Gln Ala Thr Ala Ala Pro Arg Ala Ala Ala Gln Thr Pro 85 90 95 Pro Thr Thr Thr Pro Gln Asp Ala Ser Gly Pro Ala Pro Lys Pro Pro 100 105 110 Phe Ile Phe Pro Ala Ile Asn Lys Val Tyr Leu Phe Pro Asp Arg Ala 115 120 125 Pro Lys Pro Lys Pro Thr Ser Gly Asp Trp Glu Thr Glu Tyr Ala Ala 130 135 140 Cys Ser Ala Phe Asp Arg Pro Ala Arg Thr Asn Leu Ser Ser Pro Pro 145 150 155 160 Tyr Tyr Pro Gly Val Pro Thr Pro Trp Gln Val Lys Phe Ser Leu Lys 165 170 175 Phe Gln <210> 835 <211> 733 <212> PRT <213> Torque teno virus <400> 835 Met Ala Trp Gly Tyr Trp Trp Arg Arg Arg Phe Trp Arg Pro Arg Arg 1 5 10 15 Arg Trp Arg Thr Trp Arg Arg Arg Arg Arg Leu Arg Pro Arg Arg Ser 20 25 30 Arg Arg Thr Phe Arg Arg Thr Arg Arg Arg Val Arg Arg Arg Arg Trp 35 40 45 Gly Arg Arg Ala Arg Arg Arg Gly Trp Arg Arg Arg Thr Tyr Ile Arg 50 55 60 Ala Arg Arg Arg Arg Arg Arg Lys Arg Leu Val Leu Thr Gln Trp His 65 70 75 80 Pro Ala Val Arg Arg Lys Cys Lys Ile Thr Gly Tyr Met Pro Ile Val 85 90 95 Tyr Cys Gly His Gly Arg Ala Ser Phe Asn Tyr Ala Trp His Ser Asp 100 105 110 Asp Cys Ile Lys Gln Pro Leu Pro Phe Gly Gly Ser Leu Ser Thr Val 115 120 125 Ser Phe Asn Leu Lys Val Leu Phe Asp Glu Asn Gln Arg Gly Leu Asn 130 135 140 Lys Trp Ser Tyr Pro Asn Asp Gln Leu Asp Leu Ala Arg Tyr Lys Gly 145 150 155 160 Cys Arg Leu Thr Phe Tyr Arg Lys Lys Asn Thr Asp Tyr Ile Ala Gln 165 170 175 Tyr Asp Ile Ser Glu Pro Tyr Gln Leu Asp Lys Tyr Ser Cys Ala Asn 180 185 190 Tyr His Pro Ser Lys Met Met Phe Ala Lys Asn Lys Ile Leu Ile Pro 195 200 205 Ser Tyr Asp Thr Lys Pro Arg Gly Arg Gln Arg Val Arg Val Arg Ile 210 215 220 Gly Pro Pro Lys Leu Phe Thr Asp Lys Trp Tyr Ser Gln Ser Asp Leu 225 230 235 240 Cys Lys Val Asn Leu Val Ser Leu Ala Val Ser Ala Ala Ser Phe Leu 245 250 255 His Pro Phe Gly Ser Pro Gln Thr Ala Asn Phe Cys Ala Thr Phe Gln 260 265 270 Val Leu Gln Pro Phe Tyr Tyr Gln Ala Ile Gly Ile Ser Ser Thr Lys 275 280 285 His Ser Glu Val Ile Asp Ile Leu Tyr Lys Lys Asn Thr Tyr Trp Gln 290 295 300 Ser Asn Ile Thr Ser Trp Phe Leu Thr Asn Val Lys Asn Pro Lys Asn 305 310 315 320 Met Ser Thr Lys Met Phe Glu Asp Ile Asn Val Lys Ser Asn Lys Asp 325 330 335 Ser Asn Tyr Asp Trp Phe Pro Phe Thr Pro Tyr Thr Thr Glu Asn Tyr 340 345 350 Ser Lys Ile Gln Asn Ala Ala Gln Glu Tyr Trp Lys Tyr Leu Thr Ser 355 360 365 Asp His Pro Gln Ala Thr Asn Ser Asn Glu Gly Leu Val Gln Pro Trp 370 375 380 Thr Asn Ala Thr Ile Lys Gln Tyr Glu Tyr His Leu Gly Met Phe Ser 385 390 395 400 Pro Ile Phe Ile Gly Pro Thr Arg Ala Lys Thr Lys Phe Lys Thr Ala 405 410 415 Tyr Phe Asp Cys Thr Tyr Asn Pro Leu Leu Asp Lys Gly Met Gly Asn 420 425 430 Arg Ile Trp Tyr Gln Tyr Ala Thr Lys Ala Asp Thr Gln Ile Ser Lys 435 440 445 Thr Gly Cys Tyr Cys Met Leu Glu Asp Ile Pro Ile Tyr Ala Ala Phe 450 455 460 Tyr Gly Tyr Val Asp Phe Ile Glu Met Glu Ile Gly Lys Gly Gln Asp 465 470 475 480 Ile Lys Glu Asn Gly Leu Ile Cys Cys Ile Cys Arg Tyr Thr Asp Pro 485 490 495 Pro Met Tyr Asn Glu Gln His Pro Asp Met Gly Phe Val Phe Tyr Asn 500 505 510 Thr Asn Phe Gly Asn Gly Lys Trp Ile Asp Gly Arg Gly Asp Ile Pro 515 520 525 Thr Tyr Trp Met Gln Arg Trp Arg Pro Val Val Leu Phe Gln Thr Asp 530 535 540 Val Ile Arg Asp Leu Val Glu Thr Gly Pro Phe Ser Tyr Lys Asp Asp 545 550 555 560 Leu Ala Asn Thr Ser Leu Thr Met Lys Tyr Glu Phe Tyr Phe Thr Trp 565 570 575 Gly Gly Asn Gln Ala Tyr His Gln Thr Ile Lys Asn Pro Cys Lys Asp 580 585 590 Glu Gly Thr Gly Pro His Arg Gln Pro Arg Asp Val Gln Val Thr Asp 595 600 605 Pro Thr Thr Val Gly Pro Glu Tyr Val Phe His Ala Trp Asp Trp Arg 610 615 620 Arg Gly Phe Leu Ser Glu Arg Ala Leu Arg Arg Met Phe Glu Lys Pro 625 630 635 640 Leu Asn Tyr Asp Glu Tyr Ser Lys Lys Pro Lys Arg Pro Arg Ile Phe 645 650 655 Pro Pro Thr Glu Thr Glu Ser Arg Asn Gln Glu Leu Glu Glu Ser Ser 660 665 670 Leu Ser Glu Glu Glu Lys Ser Leu Leu Ser Thr Glu Glu Ile Gln Lys 675 680 685 Glu Glu Ile Gln Arg Gln Phe Lys Arg Gln Leu Lys Arg Gln Leu Arg 690 695 700 Leu Gly Gln Gln Leu Lys Leu Leu Gln Gln Gln Leu Leu Lys Thr Gln 705 710 715 720 Ala Gly Leu His Leu Asn Pro Leu Ser Tyr Phe Pro Gln 725 730 <210> 836 <211> 191 <212> PRT <213> Torque teno virus <400> 836 Met Ala Trp Gly Tyr Trp Trp Arg Arg Arg Phe Trp Arg Pro Arg Arg 1 5 10 15 Arg Trp Arg Thr Trp Arg Arg Arg Arg Arg Leu Arg Pro Arg Arg Ser 20 25 30 Arg Arg Thr Phe Arg Arg Thr Arg Arg Arg Thr Ile Lys Asn Pro Cys 35 40 45 Lys Asp Glu Gly Thr Gly Pro His Arg Gln Pro Arg Asp Val Gln Val 50 55 60 Thr Asp Pro Thr Thr Val Gly Pro Glu Tyr Val Phe His Ala Trp Asp 65 70 75 80 Trp Arg Arg Gly Phe Leu Ser Glu Arg Ala Leu Arg Arg Met Phe Glu 85 90 95 Lys Pro Leu Asn Tyr Asp Glu Tyr Ser Lys Lys Pro Lys Arg Pro Arg 100 105 110 Ile Phe Pro Pro Thr Glu Thr Glu Ser Arg Asn Gln Glu Leu Glu Glu 115 120 125 Ser Ser Leu Ser Glu Glu Glu Lys Ser Leu Leu Ser Thr Glu Glu Ile 130 135 140 Gln Lys Glu Glu Ile Gln Arg Gln Phe Lys Arg Gln Leu Lys Arg Gln 145 150 155 160 Leu Arg Leu Gly Gln Gln Leu Lys Leu Leu Gln Gln Gln Leu Leu Lys 165 170 175 Thr Gln Ala Gly Leu His Leu Asn Pro Leu Ser Tyr Phe Pro Gln 180 185 190 <210> 837 <211> 107 <212> PRT <213> Torque teno virus <400> 837 Met Ala Trp Gly Tyr Trp Trp Arg Arg Arg Phe Trp Arg Pro Arg Arg 1 5 10 15 Arg Trp Arg Thr Trp Arg Arg Arg Arg Arg Leu Arg Pro Arg Arg Ser 20 25 30 Arg Arg Thr Phe Arg Arg Thr Arg Arg Arg Lys Gln Ser Pro Glu Thr 35 40 45 Lys Ser Ser Lys Lys Ala Arg Phe Gln Arg Lys Lys Ser Arg Tyr Ser 50 55 60 Pro Gln Lys Arg Ser Arg Lys Arg Arg Tyr Ser Asp Ser Ser Ser Asp 65 70 75 80 Ser Ser Ser Asp Ser Cys Ala Ser Gly Ser Ser Ser Asn Ser Ser Asn 85 90 95 Asn Asn Ser Ser Arg Arg Lys Arg Ala Cys Thr 100 105 <210> 838 <211> 3704 <212> DNA <213> Torque teno virus <400> 838 ccccgaagtc cgtcactaac cacgtgactc ccacaggcca atcagatgct atgtcgtgca 60 cttcctgggc tgtgtctacg tcctcatata agtaactgca cttccgaatg gctgagtttt 120 ccacgcccgt ccgcagcggc agcaccacgg agggtgatcc ccgcgtcccg tgggcgggtg 180 ccggaggtga gtttacacac cgcagtcaag gggcaattcg ggcacgggac tggccgggct 240 atgggcaagg ctcttaaaaa gctatgttct tcggtaggtg ctggagaaag aaaaggaaag 300 tgcttctgca agatctgtca actccaccga aaaaacctgc tatgagtgtg tggcttcctc 360 ccatagacaa tgttaccgag cgtgagagga gctggctctc tagcattctt cagtctcaca 420 gagctttttg tgggtgccat gatgctatct atcatcttag cagtctggct gctcgcttta 480 atatgcaacc agggccgtcg ccgggtggtg attctaggcc gccgcgaccg ccactaagac 540 gcctgcccgc gctcccgggt cccagagacc cccctagcga caccaacaac cgcaggtcat 600 ggcctactgg ggatggtgga gacggaggcg ctggccaagg cgcaggtgga ggcgctaccg 660 ctaccgaaga agactaccgc gccgaagacc tagacgagct gtacgccgcc ctcgaaggag 720 acgagtaagg aggcgccgcg gtagggggtg gtacagaggg cgacgctact cccgcagacg 780 gtacagacgt agatatgtga ggcgaaagag aaagactcta gtttggagac agtggcagcc 840 tcaaaatatc agaaaatgca ggatcagggg cataattccc atcctgatat gcggacacgg 900 gaggggggcc agaaactatg cgctccacag cgacgacata accccccaga acaccccctt 960 cgggggagga ctgagcacca cctcctggag cctaaaagtg ctatatgacc agcacaccag 1020 gggactcaac aggtggtctg ccagtaacga gagcctagac cttgccagat acaatggctg 1080 tagtttcact ttctacagag acaaaaagac tgactttata gtgacctatg acacctctgc 1140 tccctacaaa ctagacaaat acagctcccc cagctaccac ccagggtcca tgatgctcat 1200 gacaaaacac aaaatcctga tccccagttt tgacacaaaa cccaaaggtc ctgccaaaat 1260 tagagtcaga atcaagcccc ccaaaatgtt cttagataaa tggtacactc aagacgacct 1320 ctgttccgtt aatcttgtgt cacttgcggt tagcgcagct tcctttacac atccgttctg 1380 cccaccacta actgacactc cttgtgtaac gctgcaggtg ttgaaagact tctactacac 1440 aaccataggc tactcctcta atgcagacaa agtagagtct gtattcacta acactctcta 1500 caaacactgc tgctactatc agtcctttct caccactcaa tttatagcca aaatcactcg 1560 cacaccagat ggacaaccag tagccacatt ctctcctcct acctctttcc ctggcacaac 1620 tgtaacaaaa agttccatag aatcatttaa ccaatgggta acttccacag gtacaagtgg 1680 ctggctaaca aatgcaaacc aacactttca tttctgtaac tataaaccag atgccacaaa 1740 gctaaaatgg ctcagacagt actactttga ctgggaaaca tacaaattag cagatgtaaa 1800 gccagacggc cttacaccct cagtaaactg gtatgagtac agaataggcc tctttagtcc 1860 tattttcctg agccccttca gatctagcag tctagacttt cccagagcct accaggatgt 1920 gaactacaac cccctggtag acaaaggagt gggcaacatc atatggttcc aatacaacac 1980 aaaaccagac acacagctgt cagtacccag ctgcaagtgt gtcatagaag acaaacccct 2040 atgggcagcc ttctatggct acagtgactt tgtacaacaa gagataggag actacacaga 2100 cgcagaggcc gtgggcttcg tctgtgtcat ctgtccatac accaaacccc ctctaaaaaa 2160 cccagacaac cccatgcaag ggttcatatt ctatgacagc ctttttggca atggcaagtg 2220 gatagatggc acggggcacg tcccccttta ctggcagagc aggtggaggc cagagatgct 2280 cttccaagaa aacaccatga gagacatcac actatctggg cccttcagct acaaggacga 2340 ctataagaac tgtgtactga cttgcaaata caaatttaac tttcgattcg ggggcaatct 2400 tctccacgaa cagacgatca gaaacccatg ccccacggac ggacatccca gtaccggtag 2460 acagcctaga gacgtacaag tggttgaccc gatcaaagtg ggcccccggt tcgtgttcca 2520 ctcctgggac tggcgcagag gctaccttag cccagcagct ctcaaaagaa ttggagagca 2580 accgctcgat tatgaagctt attcgtaccg cccaaagaga cctagaatct ttcctcccac 2640 agaaggagac cagctcgccc gaagtcgaga agaagactca ttttcagagg aagaaagtcc 2700 ccatatctcg ttcgaagagg ggcaggaacc gaaagcccag gcggtacagc agcacctcct 2760 ccgacacctc agaaagcagc gagaactccg aaagcgactc cgagccctgt tccaaagcct 2820 ccaaaagacg caggcgggtc tccacgtaaa tccattatta ttcaaccagc ctgcaatcag 2880 gttctgatgt tcccagagat ggggcctaag ccagctccca ctgcccaaga ctggcagtgc 2940 gaatacgaga catgtaagca ctgggataga ccccccagaa agtttctcac agacccccct 3000 ttctatccct gggcccctac tacttacaat gtatctttca agctaaactt caaataaact 3060 aggccgtggg agtctcactt gtcggtgtct acctcttaag gtcactaagc actccgagcg 3120 tcagcgagga gtgcgaccct tccccctggt gcaacgccct cggcggccgc gcgctacgcc 3180 ttcggctgcg cgcggcacct cggacccccg ctcgtgctga cgcgctcgcg cgcgtcagac 3240 cacttcgggc tcgcgggggt cgggaaattt gctaaacaga ctccgagttg ccattggaca 3300 caggagctgt gaatcagtaa cgaaagtgag tggggccaga cttcgccata aggcctttat 3360 cttcttgcca tttgtccgtg aggaggggtc gccaagacgc ggaccccgtt ttcggacctt 3420 ccgaactacc aaaatggccg attcagtgac gtcacggcag ccattttgtg taagcaccgc 3480 ccaggacaga cgtcacagtt caaaggtcat cctcgagcgg aacttacaga aaatggcggt 3540 caattgcttc cgggtcaaag gtcacgccta cgtcataagt cacgtggtgg aggctactgc 3600 gcatacacgg aagtaggccc cgccacgtga ccgaccacgt gggtgctgcg tcacggccgc 3660 cattttgtat cacaaaatgg ccgacttcct tcctcttttt caaa 3704 <210> 839 <211> 128 <212> PRT <213> Torque teno virus <400> 839 Met Ser Val Trp Leu Pro Pro Ile Asp Asn Val Thr Glu Arg Glu Arg 1 5 10 15 Ser Trp Leu Ser Ser Ile Leu Gln Ser His Arg Ala Phe Cys Gly Cys 20 25 30 His Asp Ala Ile Tyr His Leu Ser Ser Leu Ala Ala Arg Phe Asn Met 35 40 45 Gln Pro Gly Pro Ser Pro Gly Gly Asp Ser Arg Pro Pro Arg Pro Pro 50 55 60 Leu Arg Arg Leu Pro Ala Leu Pro Gly Pro Arg Asp Pro Pro Ser Asp 65 70 75 80 Thr Asn Asn Arg Arg Ser Trp Pro Thr Gly Asp Gly Gly Asp Gly Gly 85 90 95 Ala Gly Gln Gly Ala Gly Gly Gly Ala Thr Ala Thr Glu Glu Asp Tyr 100 105 110 Arg Ala Glu Asp Leu Asp Glu Leu Tyr Ala Ala Leu Glu Gly Asp Glu 115 120 125 <210> 840 <211> 272 <212> PRT <213> Torque teno virus <400> 840 Met Ser Val Trp Leu Pro Pro Ile Asp Asn Val Thr Glu Arg Glu Arg 1 5 10 15 Ser Trp Leu Ser Ser Ile Leu Gln Ser His Arg Ala Phe Cys Gly Cys 20 25 30 His Asp Ala Ile Tyr His Leu Ser Ser Leu Ala Ala Arg Phe Asn Met 35 40 45 Gln Pro Gly Pro Ser Pro Gly Gly Asp Ser Arg Pro Pro Arg Pro Pro 50 55 60 Leu Arg Arg Leu Pro Ala Leu Pro Gly Pro Arg Asp Pro Pro Ser Asp 65 70 75 80 Thr Asn Asn Arg Arg Ser Trp Pro Thr Gly Asp Gly Gly Asp Gly Gly 85 90 95 Ala Gly Gln Gly Ala Gly Gly Gly Ala Thr Ala Thr Glu Glu Asp Tyr 100 105 110 Arg Ala Glu Asp Leu Asp Glu Leu Tyr Ala Ala Leu Glu Gly Asp Glu 115 120 125 Arg Ser Glu Thr His Ala Pro Arg Thr Asp Ile Pro Val Pro Val Asp 130 135 140 Ser Leu Glu Thr Tyr Lys Trp Leu Thr Arg Ser Lys Trp Ala Pro Gly 145 150 155 160 Ser Cys Ser Thr Pro Gly Thr Gly Ala Glu Ala Thr Leu Ala Gln Gln 165 170 175 Leu Ser Lys Glu Leu Glu Ser Asn Arg Ser Ile Met Lys Leu Ile Arg 180 185 190 Thr Ala Gln Arg Asp Leu Glu Ser Phe Leu Pro Gln Lys Glu Thr Ser 195 200 205 Ser Pro Glu Val Glu Lys Lys Thr His Phe Gln Arg Lys Lys Val Pro 210 215 220 Ile Ser Arg Ser Lys Arg Gly Arg Asn Arg Lys Pro Arg Arg Tyr Ser 225 230 235 240 Ser Thr Ser Ser Asp Thr Ser Glu Ser Ser Glu Asn Ser Glu Ser Asp 245 250 255 Ser Glu Pro Cys Ser Lys Ala Ser Lys Arg Arg Arg Arg Val Ser Thr 260 265 270 <210> 841 <211> 265 <212> PRT <213> Torque teno virus <400> 841 Met Ser Val Trp Leu Pro Pro Ile Asp Asn Val Thr Glu Arg Glu Arg 1 5 10 15 Ser Trp Leu Ser Ser Ile Leu Gln Ser His Arg Ala Phe Cys Gly Cys 20 25 30 His Asp Ala Ile Tyr His Leu Ser Ser Leu Ala Ala Arg Phe Asn Met 35 40 45 Gln Pro Gly Pro Ser Pro Gly Gly Asp Ser Arg Pro Pro Arg Pro Pro 50 55 60 Leu Arg Arg Leu Pro Ala Leu Pro Gly Pro Arg Asp Pro Pro Ser Asp 65 70 75 80 Thr Asn Asn Arg Arg Ser Trp Pro Thr Gly Asp Gly Gly Asp Gly Gly 85 90 95 Ala Gly Gln Gly Ala Gly Gly Gly Ala Thr Ala Thr Glu Glu Asp Tyr 100 105 110 Arg Ala Glu Asp Leu Asp Glu Leu Tyr Ala Ala Leu Glu Gly Asp Glu 115 120 125 Arg Arg Pro Ala Arg Pro Lys Ser Arg Arg Arg Leu Ile Phe Arg Gly 130 135 140 Arg Lys Ser Pro Tyr Leu Val Arg Arg Gly Ala Gly Thr Glu Ser Pro 145 150 155 160 Gly Gly Thr Ala Ala Pro Pro Pro Thr Pro Gln Lys Ala Ala Arg Thr 165 170 175 Pro Lys Ala Thr Pro Ser Pro Val Pro Lys Pro Pro Lys Asp Ala Gly 180 185 190 Gly Ser Pro Arg Lys Ser Ile Ile Ile Gln Pro Ala Cys Asn Gln Val 195 200 205 Leu Met Phe Pro Glu Met Gly Pro Lys Pro Ala Pro Thr Ala Gln Asp 210 215 220 Trp Gln Cys Glu Tyr Glu Thr Cys Lys His Trp Asp Arg Pro Pro Arg 225 230 235 240 Lys Phe Leu Thr Asp Pro Pro Phe Tyr Pro Trp Ala Pro Thr Thr Tyr 245 250 255 Asn Val Ser Phe Lys Leu Asn Phe Lys 260 265 <210> 842 <211> 762 <212> PRT <213> Torque teno virus <400> 842 Met Ala Tyr Trp Gly Trp Trp Arg Arg Arg Arg Trp Pro Arg Arg Arg 1 5 10 15 Trp Arg Arg Tyr Arg Tyr Arg Arg Arg Leu Pro Arg Arg Arg Pro Arg 20 25 30 Arg Ala Val Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Gly 35 40 45 Arg Gly Trp Tyr Arg Gly Arg Arg Tyr Ser Arg Arg Arg Tyr Arg Arg 50 55 60 Arg Tyr Val Arg Arg Lys Arg Lys Thr Leu Val Trp Arg Gln Trp Gln 65 70 75 80 Pro Gln Asn Ile Arg Lys Cys Arg Ile Arg Gly Ile Ile Pro Ile Leu 85 90 95 Ile Cys Gly His Gly Arg Gly Ala Arg Asn Tyr Ala Leu His Ser Asp 100 105 110 Asp Ile Thr Pro Gln Asn Thr Pro Phe Gly Gly Gly Leu Ser Thr Thr 115 120 125 Ser Trp Ser Leu Lys Val Leu Tyr Asp Gln His Thr Arg Gly Leu Asn 130 135 140 Arg Trp Ser Ala Ser Asn Glu Ser Leu Asp Leu Ala Arg Tyr Asn Gly 145 150 155 160 Cys Ser Phe Thr Phe Tyr Arg Asp Lys Lys Thr Asp Phe Ile Val Thr 165 170 175 Tyr Asp Thr Ser Ala Pro Tyr Lys Leu Asp Lys Tyr Ser Ser Pro Ser 180 185 190 Tyr His Pro Gly Ser Met Met Leu Met Thr Lys His Lys Ile Leu Ile 195 200 205 Pro Ser Phe Asp Thr Lys Pro Lys Gly Pro Ala Lys Ile Arg Val Arg 210 215 220 Ile Lys Pro Pro Lys Met Phe Leu Asp Lys Trp Tyr Thr Gln Asp Asp 225 230 235 240 Leu Cys Ser Val Asn Leu Val Ser Leu Ala Val Ser Ala Ala Ser Phe 245 250 255 Thr His Pro Phe Cys Pro Pro Leu Thr Asp Thr Pro Cys Val Thr Leu 260 265 270 Gln Val Leu Lys Asp Phe Tyr Tyr Thr Thr Ile Gly Tyr Ser Ser Asn 275 280 285 Ala Asp Lys Val Glu Ser Val Phe Thr Asn Thr Leu Tyr Lys His Cys 290 295 300 Cys Tyr Tyr Gln Ser Phe Leu Thr Thr Gln Phe Ile Ala Lys Ile Thr 305 310 315 320 Arg Thr Pro Asp Gly Gln Pro Val Ala Thr Phe Ser Pro Pro Thr Ser 325 330 335 Phe Pro Gly Thr Thr Val Thr Lys Ser Ser Ile Glu Ser Phe Asn Gln 340 345 350 Trp Val Thr Ser Thr Gly Thr Ser Gly Trp Leu Thr Asn Ala Asn Gln 355 360 365 His Phe His Phe Cys Asn Tyr Lys Pro Asp Ala Thr Lys Leu Lys Trp 370 375 380 Leu Arg Gln Tyr Tyr Phe Asp Trp Glu Thr Tyr Lys Leu Ala Asp Val 385 390 395 400 Lys Pro Asp Gly Leu Thr Pro Ser Val Asn Trp Tyr Glu Tyr Arg Ile 405 410 415 Gly Leu Phe Ser Pro Ile Phe Leu Ser Pro Phe Arg Ser Ser Ser Leu 420 425 430 Asp Phe Pro Arg Ala Tyr Gln Asp Val Asn Tyr Asn Pro Leu Val Asp 435 440 445 Lys Gly Val Gly Asn Ile Ile Trp Phe Gln Tyr Asn Thr Lys Pro Asp 450 455 460 Thr Gln Leu Ser Val Pro Ser Cys Lys Cys Val Ile Glu Asp Lys Pro 465 470 475 480 Leu Trp Ala Ala Phe Tyr Gly Tyr Ser Asp Phe Val Gln Gln Glu Ile 485 490 495 Gly Asp Tyr Thr Asp Ala Glu Ala Val Gly Phe Val Cys Val Ile Cys 500 505 510 Pro Tyr Thr Lys Pro Pro Leu Lys Asn Pro Asp Asn Pro Met Gln Gly 515 520 525 Phe Ile Phe Tyr Asp Ser Leu Phe Gly Asn Gly Lys Trp Ile Asp Gly 530 535 540 Thr Gly His Val Pro Leu Tyr Trp Gln Ser Arg Trp Arg Pro Glu Met 545 550 555 560 Leu Phe Gln Glu Asn Thr Met Arg Asp Ile Thr Leu Ser Gly Pro Phe 565 570 575 Ser Tyr Lys Asp Asp Tyr Lys Asn Cys Val Leu Thr Cys Lys Tyr Lys 580 585 590 Phe Asn Phe Arg Phe Gly Gly Asn Leu Leu His Glu Gln Thr Ile Arg 595 600 605 Asn Pro Cys Pro Thr Asp Gly His Pro Ser Thr Gly Arg Gln Pro Arg 610 615 620 Asp Val Gln Val Val Asp Pro Ile Lys Val Gly Pro Arg Phe Val Phe 625 630 635 640 His Ser Trp Asp Trp Arg Arg Gly Tyr Leu Ser Pro Ala Ala Leu Lys 645 650 655 Arg Ile Gly Glu Gln Pro Leu Asp Tyr Glu Ala Tyr Ser Tyr Arg Pro 660 665 670 Lys Arg Pro Arg Ile Phe Pro Pro Thr Glu Gly Asp Gln Leu Ala Arg 675 680 685 Ser Arg Glu Glu Asp Ser Phe Ser Glu Glu Glu Ser Pro His Ile Ser 690 695 700 Phe Glu Glu Gly Gln Glu Pro Lys Ala Gln Ala Val Gln Gln His Leu 705 710 715 720 Leu Arg His Leu Arg Lys Gln Arg Glu Leu Arg Lys Arg Leu Arg Ala 725 730 735 Leu Phe Gln Ser Leu Gln Lys Thr Gln Ala Gly Leu His Val Asn Pro 740 745 750 Leu Leu Phe Asn Gln Pro Ala Ile Arg Phe 755 760 <210> 843 <211> 199 <212> PRT <213> Torque teno virus <400> 843 Met Ala Tyr Trp Gly Trp Trp Arg Arg Arg Arg Trp Pro Arg Arg Arg 1 5 10 15 Trp Arg Arg Tyr Arg Tyr Arg Arg Arg Leu Pro Arg Arg Arg Pro Arg 20 25 30 Arg Ala Val Arg Arg Pro Arg Arg Arg Arg Thr Ile Arg Asn Pro Cys 35 40 45 Pro Thr Asp Gly His Pro Ser Thr Gly Arg Gln Pro Arg Asp Val Gln 50 55 60 Val Val Asp Pro Ile Lys Val Gly Pro Arg Phe Val Phe His Ser Trp 65 70 75 80 Asp Trp Arg Arg Gly Tyr Leu Ser Pro Ala Ala Leu Lys Arg Ile Gly 85 90 95 Glu Gln Pro Leu Asp Tyr Glu Ala Tyr Ser Tyr Arg Pro Lys Arg Pro 100 105 110 Arg Ile Phe Pro Pro Thr Glu Gly Asp Gln Leu Ala Arg Ser Arg Glu 115 120 125 Glu Asp Ser Phe Ser Glu Glu Glu Ser Pro His Ile Ser Phe Glu Glu 130 135 140 Gly Gln Glu Pro Lys Ala Gln Ala Val Gln Gln His Leu Leu Arg His 145 150 155 160 Leu Arg Lys Gln Arg Glu Leu Arg Lys Arg Leu Arg Ala Leu Phe Gln 165 170 175 Ser Leu Gln Lys Thr Gln Ala Gly Leu His Val Asn Pro Leu Leu Phe 180 185 190 Asn Gln Pro Ala Ile Arg Phe 195 <210> 844 <211> 110 <212> PRT <213> Torque teno virus <400> 844 Met Ala Tyr Trp Gly Trp Trp Arg Arg Arg Arg Trp Pro Arg Arg Arg 1 5 10 15 Trp Arg Arg Tyr Arg Tyr Arg Arg Arg Leu Pro Arg Arg Arg Pro Arg 20 25 30 Arg Ala Val Arg Arg Pro Arg Arg Arg Arg Lys Glu Thr Ser Ser Pro 35 40 45 Glu Val Glu Lys Lys Thr His Phe Gln Arg Lys Lys Val Pro Ile Ser 50 55 60 Arg Ser Lys Arg Gly Arg Asn Arg Lys Pro Arg Arg Tyr Ser Ser Thr 65 70 75 80 Ser Ser Asp Thr Ser Glu Ser Ser Glu Asn Ser Glu Ser Asp Ser Glu 85 90 95 Pro Cys Ser Lys Ala Ser Lys Arg Arg Arg Arg Val Ser Thr 100 105 110 <210> 845 <211> 3653 <212> DNA <213> Torque teno virus <220> <221> modified_base <222> (2949)..(2966) <223> a, c, t, g, unknown or other <400> 845 ccaaccagag tctatgtcgt gcacttcctg ggcatggtct acgtaataat ataaagcggt 60 gcacttccga atggctgagt tttccacgcc cgtccgcagc gagatcgcga cggaggagcg 120 atcgagcgtc ccgagggcgg gtgccggagg tgagtttaca caccgcagtc aaggggcaat 180 tcgggctcgg gactggccgg gctatgggca aggctcttaa aaagccatgt ttctcggtaa 240 actttacagg cagaaaagga aactgctact gcagcctgtg cgtgctccac agacgccatc 300 ttccatgagc tctacctggc gagtgccccg cggcgatgtc tccgcccgcg agctatgttg 360 gtaccgctca gttcgagaga gccacgatgc tttttgtggc tgtcgtgatc ctgtttttca 420 tctttctcgt ctggctgcac gttctaacca tcagggacct ccgacgcccc ccacggacga 480 gcgcccgtcg gcgtctaccc cagtgaggcg cctgctgccg ctgccctcct accccggcga 540 gggtccccag gctagatggc ctggtgggga tggagaaggc gctggtggcg cccgcggagg 600 cgctggagat ggcggcgccc gcgcaggcga agaagagtac cggcccgaag acctcgacga 660 gctgttcgac gctatcgaac aagaacagta aggagacgga ggcgagggtg gcggaggggc 720 tacaggcgcc gttacagact gagacgctac cgtagaaggg gcaggcgacg caaaaaaata 780 gtactgactc agtggaaccc ccagactgtc agaaagtgct ttatcagagg actgatgcca 840 gtactatggg cgggcatggg cacggggggc cacaactacg ccgtccgctc agatgacttt 900 gtggtagaca gaggcttcgg gggctccttc gccacagaaa ctttctccct gagggtcctc 960 tttgaccagt accagagagg atttaatagg tggtctcaca ccaacgaaga cctagacctg 1020 gcccgctaca cgggctgcaa atggacattt tacagacacc aagacacaga ctttatagtg 1080 tactttacaa acaatccccc catgaaaacc aaccagcaca cagcccctct cacaactcca 1140 ggcatgctca tgaggagcaa gtataaaata ctagtgccca gttttaaaac aagaccaaag 1200 ggcagaaaaa cagtgtcagt gagagttaga ccccccaaac tgtttcagga caaatggtat 1260 actcaacagg acctctgtcc agtacccctc gtccaactga acgtgaccgc agcggatttc 1320 acacatccgt tcggctcacc actaactgac acgccttgca taagattcca agttttaggg 1380 aacttataca acaagtgcct aaatatagat cttccgcaat ttgatgagga cggtgagata 1440 ctcacttcaa caccttataa cagagaaaac aaagaagatc ttaaaaagct ttataaaact 1500 ctatttgtag atgaacacgc aggcaattat tggcagacat tcttaaccaa cacaatggta 1560 aagtcacaca tagatgcaaa ccaagcaaag acatacgatc aagaaaaaac tgctgcagaa 1620 caaggtaaag accccttccc aacaaaccca ccaaaagacc aattcactac ctggaacaag 1680 aaactagtag accctagaga cagcaacttt ctctttgcca catatcaccc aaaaaacatt 1740 aaaaaagcta taaaaaccat gagagacaac aactttgctc tcaccacagg caaaaatgac 1800 atatatggag actacaccgc ggcctacacc agaaacaccc acatgctaga ctactaccta 1860 ggcttttata gccccatatt tctttccagc ggtaggtcca acacagagtt ctggaccgcc 1920 tacagagaca tagtatataa tcccctctta gacaaaggca caggcaacat gatctggttc 1980 caatatcaca caaaaacaga caatatatac aaaaaaccag agtgccactg ggagatacta 2040 gacatgcccc tgtgggccct ctgcaacggg tatgtagagt acctagagag ccaaataaag 2100 tacggggaca tcctagtaga gggcaaagtc ctcatcagat gcccctacac caaacccgca 2160 ctggtagacc ccaataacag cctagctggt tacgtggtat tcaacaccac cttcggccag 2220 ggaaaatgga tagatggcaa aggctacatc cccctacacg agaggagcaa gtggtacgtc 2280 atgctcagat accagaccga cgtactccat gacatagtga cttgtggacc ctggcagtac 2340 agagacgata acaaaaactc tcagctaata gccaagtaca gattcaagtt ctactgggga 2400 ggtaacatgg tacattctca ggtcatcaga aacccgtgca aagacaccca agtatccgga 2460 ccccgtcgac agcctcgcga agtacaagtc gttgacccgc aactcattac gccgccgtgg 2520 gtcctccact cgttcgacca gagacgagga atgtttactg caggagctat caaacgtctg 2580 ctcaagcaac caatacctgg cgagtatgct cctacaccac tcagggtccc gctcctcttt 2640 ccctcctcag agttccagcg agagggagaa gatgcagaaa gcggctcagg ttcaccaccc 2700 aagagaccgc gactctggca ggaagaggcc aaccagacgc aaacggagtc ctcggagggg 2760 ccggcggaga cgacgaggga gctcctcgag cgaaagctca gagagcagcg agtcctcaac 2820 ctccaactcc agcatgtcgc agtacaactc gccaaaaccc aagcgaacct ccacataaac 2880 cccctattat actcccagcc ttaaacaaag tgtatctatt cccccctgac aagcccactc 2940 ccatacagnn nnnnnnnnnn nnnnnnaaca cagagttcga agcctgccag gccttcgaca 3000 gaccacctag aaaatacctc tcagacacac ctacctaccc ttggctcccc gtccccaatc 3060 ctgaaataaa ggtcagcttt aagctcggtt tcaaatctta caaggccgtg ggagtttcac 3120 tggtcggtgt ctacctctta aggtcactaa gcactccgag cgtcagcgag gagtgcgacc 3180 cttccccctg gtgcaacgcc ctcggcggcc gcgcgctacg ccttcggctg cgcgcggcac 3240 ctcggacccc cgctcgtgct gacgcgctcg cgcgcgtcag accacttcgg gctcgcgggg 3300 gtcgggaatt ttgctaaaca gactccgagt tgccattgga cactgtagct gtgaatcagt 3360 aacgaaagtg agtggggcca gacttcgcca taaggccttt atcttcttgc cattggtccg 3420 tgtagggggt cgccataggc ttcgggttcg gttttaggcc ttccggacta caaaaatggc 3480 ggatttagtg acgtcacggc cgccatttta agtaggtgcc gtccaggact gctgttccgg 3540 gtcacagggc atcctcggcg gaacttacac aaaatggcgg tcaaaaacat ccgggtcaaa 3600 ggtcgcagct acgtcataag tcacgtgcag gggtcctgct gcgtcatatg cgg 3653 <210> 846 <211> 128 <212> PRT <213> Torque teno virus <400> 846 Met Ser Ser Thr Trp Arg Val Pro Arg Gly Asp Val Ser Ala Arg Glu 1 5 10 15 Leu Cys Trp Tyr Arg Ser Val Arg Glu Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Arg Asp Pro Val Phe His Leu Ser Arg Leu Ala Ala Arg Ser Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Glu Arg Pro Ser Ala Ser 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Glu Gly Ala Gly Gly Ala 85 90 95 Arg Gly Gly Ala Gly Asp Gly Gly Ala Arg Ala Gly Glu Glu Glu Tyr 100 105 110 Arg Pro Glu Asp Leu Asp Glu Leu Phe Asp Ala Ile Glu Gln Glu Gln 115 120 125 <210> 847 <211> 279 <212> PRT <213> Torque teno virus <400> 847 Met Ser Ser Thr Trp Arg Val Pro Arg Gly Asp Val Ser Ala Arg Glu 1 5 10 15 Leu Cys Trp Tyr Arg Ser Val Arg Glu Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Arg Asp Pro Val Phe His Leu Ser Arg Leu Ala Ala Arg Ser Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Glu Arg Pro Ser Ala Ser 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Glu Gly Ala Gly Gly Ala 85 90 95 Arg Gly Gly Ala Gly Asp Gly Gly Ala Arg Ala Gly Glu Glu Glu Tyr 100 105 110 Arg Pro Glu Asp Leu Asp Glu Leu Phe Asp Ala Ile Glu Gln Glu Gln 115 120 125 Ser Ser Glu Thr Arg Ala Lys Thr Pro Lys Tyr Pro Asp Pro Val Asp 130 135 140 Ser Leu Ala Lys Tyr Lys Ser Leu Thr Arg Asn Ser Leu Arg Arg Arg 145 150 155 160 Gly Ser Ser Thr Arg Ser Thr Arg Asp Glu Glu Cys Leu Leu Gln Glu 165 170 175 Leu Ser Asn Val Cys Ser Ser Asn Gln Tyr Leu Ala Ser Met Leu Leu 180 185 190 His His Ser Gly Ser Arg Ser Ser Phe Pro Pro Gln Ser Ser Ser Glu 195 200 205 Arg Glu Lys Met Gln Lys Ala Ala Gln Val His His Pro Arg Asp Arg 210 215 220 Asp Ser Gly Arg Lys Arg Pro Thr Arg Arg Lys Arg Ser Pro Arg Arg 225 230 235 240 Gly Arg Arg Arg Arg Arg Gly Ser Ser Ser Ser Glu Ser Ser Glu Ser 245 250 255 Ser Glu Ser Ser Thr Ser Asn Ser Ser Met Ser Gln Tyr Asn Ser Pro 260 265 270 Lys Pro Lys Arg Thr Ser Thr 275 <210> 848 <211> 378 <212> PRT <213> Torque teno virus <220> <221> MOD_RES <222> (257)..(262) <223> Any amino acid <400> 848 Met Ser Ser Thr Trp Arg Val Pro Arg Gly Asp Val Ser Ala Arg Glu 1 5 10 15 Leu Cys Trp Tyr Arg Ser Val Arg Glu Ser His Asp Ala Phe Cys Gly 20 25 30 Cys Arg Asp Pro Val Phe His Leu Ser Arg Leu Ala Ala Arg Ser Asn 35 40 45 His Gln Gly Pro Pro Thr Pro Pro Thr Asp Glu Arg Pro Ser Ala Ser 50 55 60 Thr Pro Val Arg Arg Leu Leu Pro Leu Pro Ser Tyr Pro Gly Glu Gly 65 70 75 80 Pro Gln Ala Arg Trp Pro Gly Gly Asp Gly Glu Gly Ala Gly Gly Ala 85 90 95 Arg Gly Gly Ala Gly Asp Gly Gly Ala Arg Ala Gly Glu Glu Glu Tyr 100 105 110 Arg Pro Glu Asp Leu Asp Glu Leu Phe Asp Ala Ile Glu Gln Glu Gln 115 120 125 Ser Tyr Gln Thr Ser Ala Gln Ala Thr Asn Thr Trp Arg Val Cys Ser 130 135 140 Tyr Thr Thr Gln Gly Pro Ala Pro Leu Ser Leu Leu Arg Val Pro Ala 145 150 155 160 Arg Gly Arg Arg Cys Arg Lys Arg Leu Arg Phe Thr Thr Gln Glu Thr 165 170 175 Ala Thr Leu Ala Gly Arg Gly Gln Pro Asp Ala Asn Gly Val Leu Gly 180 185 190 Gly Ala Gly Gly Asp Asp Glu Gly Ala Pro Arg Ala Lys Ala Gln Arg 195 200 205 Ala Ala Ser Pro Gln Pro Pro Thr Pro Ala Cys Arg Ser Thr Thr Arg 210 215 220 Gln Asn Pro Ser Glu Pro Pro His Lys Pro Pro Ile Ile Leu Pro Ala 225 230 235 240 Leu Asn Lys Val Tyr Leu Phe Pro Pro Asp Lys Pro Thr Pro Ile Gln 245 250 255 Xaa Xaa Xaa Xaa Xaa Xaa Asn Thr Glu Phe Glu Ala Cys Gln Ala Phe 260 265 270 Asp Arg Pro Pro Arg Lys Tyr Leu Ser Asp Thr Pro Thr Tyr Pro Trp 275 280 285 Leu Pro Val Pro Asn Pro Glu Ile Lys Val Ser Phe Lys Leu Gly Phe 290 295 300 Lys Ser Tyr Lys Ala Val Gly Val Ser Leu Val Gly Val Tyr Leu Leu 305 310 315 320 Arg Ser Leu Ser Thr Pro Ser Val Ser Glu Glu Cys Asp Pro Ser Pro 325 330 335 Trp Cys Asn Ala Leu Gly Gly Arg Ala Leu Arg Leu Arg Leu Arg Ala 340 345 350 Ala Pro Arg Thr Pro Ala Arg Ala Asp Ala Leu Ala Arg Val Arg Pro 355 360 365 Leu Arg Ala Arg Gly Gly Arg Glu Phe Cys 370 375 <210> 849 <211> 269 <212> PRT <213> Torque teno virus <220> <221> MOD_RES <222> (148)..(153) <223> Any amino acid <400> 849 Met Ser Ser Thr Trp Arg Val Pro Arg Gly Asp Val Ser Ala Arg Glu 1 5 10 15 Leu Cys Trp Ser Tyr Gln Thr Ser Ala Gln Ala Thr Asn Thr Trp Arg 20 25 30 Val Cys Ser Tyr Thr Thr Gln Gly Pro Ala Pro Leu Ser Leu Leu Arg 35 40 45 Val Pro Ala Arg Gly Arg Arg Cys Arg Lys Arg Leu Arg Phe Thr Thr 50 55 60 Gln Glu Thr Ala Thr Leu Ala Gly Arg Gly Gln Pro Asp Ala Asn Gly 65 70 75 80 Val Leu Gly Gly Ala Gly Gly Asp Asp Glu Gly Ala Pro Arg Ala Lys 85 90 95 Ala Gln Arg Ala Ala Ser Pro Gln Pro Pro Thr Pro Ala Cys Arg Ser 100 105 110 Thr Thr Arg Gln Asn Pro Ser Glu Pro Pro His Lys Pro Pro Ile Ile 115 120 125 Leu Pro Ala Leu Asn Lys Val Tyr Leu Phe Pro Pro Asp Lys Pro Thr 130 135 140 Pro Ile Gln Xaa Xaa Xaa Xaa Xaa Xaa Asn Thr Glu Phe Glu Ala Cys 145 150 155 160 Gln Ala Phe Asp Arg Pro Pro Arg Lys Tyr Leu Ser Asp Thr Pro Thr 165 170 175 Tyr Pro Trp Leu Pro Val Pro Asn Pro Glu Ile Lys Val Ser Phe Lys 180 185 190 Leu Gly Phe Lys Ser Tyr Lys Ala Val Gly Val Ser Leu Val Gly Val 195 200 205 Tyr Leu Leu Arg Ser Leu Ser Thr Pro Ser Val Ser Glu Glu Cys Asp 210 215 220 Pro Ser Pro Trp Cys Asn Ala Leu Gly Gly Arg Ala Leu Arg Leu Arg 225 230 235 240 Leu Arg Ala Ala Pro Arg Thr Pro Ala Arg Ala Asp Ala Leu Ala Arg 245 250 255 Val Arg Pro Leu Arg Ala Arg Gly Gly Arg Glu Phe Cys 260 265 <210> 850 <211> 782 <212> PRT <213> Torque teno virus <400> 850 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Arg Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Pro Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Val Arg Arg Tyr Arg Thr Arg Thr Val Arg Arg Arg 35 40 45 Arg Arg Gly Trp Arg Arg Gly Tyr Arg Arg Arg Tyr Arg Leu Arg Arg 50 55 60 Tyr Arg Arg Arg Gly Arg Arg Arg Lys Lys Ile Val Leu Thr Gln Trp 65 70 75 80 Asn Pro Gln Thr Val Arg Lys Cys Phe Ile Arg Gly Leu Met Pro Val 85 90 95 Leu Trp Ala Gly Met Gly Thr Gly Gly His Asn Tyr Ala Val Arg Ser 100 105 110 Asp Asp Phe Val Val Asp Arg Gly Phe Gly Gly Ser Phe Ala Thr Glu 115 120 125 Thr Phe Ser Leu Arg Val Leu Phe Asp Gln Tyr Gln Arg Gly Phe Asn 130 135 140 Arg Trp Ser His Thr Asn Glu Asp Leu Asp Leu Ala Arg Tyr Thr Gly 145 150 155 160 Cys Lys Trp Thr Phe Tyr Arg His Gln Asp Thr Asp Phe Ile Val Tyr 165 170 175 Phe Thr Asn Asn Pro Pro Met Lys Thr Asn Gln His Thr Ala Pro Leu 180 185 190 Thr Thr Pro Gly Met Leu Met Arg Ser Lys Tyr Lys Ile Leu Val Pro 195 200 205 Ser Phe Lys Thr Arg Pro Lys Gly Arg Lys Thr Val Ser Val Arg Val 210 215 220 Arg Pro Pro Lys Leu Phe Gln Asp Lys Trp Tyr Thr Gln Gln Asp Leu 225 230 235 240 Cys Pro Val Pro Leu Val Gln Leu Asn Val Thr Ala Ala Asp Phe Thr 245 250 255 His Pro Phe Gly Ser Pro Leu Thr Asp Thr Pro Cys Ile Arg Phe Gln 260 265 270 Val Leu Gly Asn Leu Tyr Asn Lys Cys Leu Asn Ile Asp Leu Pro Gln 275 280 285 Phe Asp Glu Asp Gly Glu Ile Leu Thr Ser Thr Pro Tyr Asn Arg Glu 290 295 300 Asn Lys Glu Asp Leu Lys Lys Leu Tyr Lys Thr Leu Phe Val Asp Glu 305 310 315 320 His Ala Gly Asn Tyr Trp Gln Thr Phe Leu Thr Asn Thr Met Val Lys 325 330 335 Ser His Ile Asp Ala Asn Gln Ala Lys Thr Tyr Asp Gln Glu Lys Thr 340 345 350 Ala Ala Glu Gln Gly Lys Asp Pro Phe Pro Thr Asn Pro Pro Lys Asp 355 360 365 Gln Phe Thr Thr Trp Asn Lys Lys Leu Val Asp Pro Arg Asp Ser Asn 370 375 380 Phe Leu Phe Ala Thr Tyr His Pro Lys Asn Ile Lys Lys Ala Ile Lys 385 390 395 400 Thr Met Arg Asp Asn Asn Phe Ala Leu Thr Thr Gly Lys Asn Asp Ile 405 410 415 Tyr Gly Asp Tyr Thr Ala Ala Tyr Thr Arg Asn Thr His Met Leu Asp 420 425 430 Tyr Tyr Leu Gly Phe Tyr Ser Pro Ile Phe Leu Ser Ser Gly Arg Ser 435 440 445 Asn Thr Glu Phe Trp Thr Ala Tyr Arg Asp Ile Val Tyr Asn Pro Leu 450 455 460 Leu Asp Lys Gly Thr Gly Asn Met Ile Trp Phe Gln Tyr His Thr Lys 465 470 475 480 Thr Asp Asn Ile Tyr Lys Lys Pro Glu Cys His Trp Glu Ile Leu Asp 485 490 495 Met Pro Leu Trp Ala Leu Cys Asn Gly Tyr Val Glu Tyr Leu Glu Ser 500 505 510 Gln Ile Lys Tyr Gly Asp Ile Leu Val Glu Gly Lys Val Leu Ile Arg 515 520 525 Cys Pro Tyr Thr Lys Pro Ala Leu Val Asp Pro Asn Asn Ser Leu Ala 530 535 540 Gly Tyr Val Val Phe Asn Thr Thr Phe Gly Gln Gly Lys Trp Ile Asp 545 550 555 560 Gly Lys Gly Tyr Ile Pro Leu His Glu Arg Ser Lys Trp Tyr Val Met 565 570 575 Leu Arg Tyr Gln Thr Asp Val Leu His Asp Ile Val Thr Cys Gly Pro 580 585 590 Trp Gln Tyr Arg Asp Asp Asn Lys Asn Ser Gln Leu Ile Ala Lys Tyr 595 600 605 Arg Phe Lys Phe Tyr Trp Gly Gly Asn Met Val His Ser Gln Val Ile 610 615 620 Arg Asn Pro Cys Lys Asp Thr Gln Val Ser Gly Pro Arg Arg Gln Pro 625 630 635 640 Arg Glu Val Gln Val Val Asp Pro Gln Leu Ile Thr Pro Pro Trp Val 645 650 655 Leu His Ser Phe Asp Gln Arg Arg Gly Met Phe Thr Ala Gly Ala Ile 660 665 670 Lys Arg Leu Leu Lys Gln Pro Ile Pro Gly Glu Tyr Ala Pro Thr Pro 675 680 685 Leu Arg Val Pro Leu Leu Phe Pro Ser Ser Glu Phe Gln Arg Glu Gly 690 695 700 Glu Asp Ala Glu Ser Gly Ser Gly Ser Pro Pro Lys Arg Pro Arg Leu 705 710 715 720 Trp Gln Glu Glu Ala Asn Gln Thr Gln Thr Glu Ser Ser Glu Gly Pro 725 730 735 Ala Glu Thr Thr Arg Glu Leu Leu Glu Arg Lys Leu Arg Glu Gln Arg 740 745 750 Val Leu Asn Leu Gln Leu Gln His Val Ala Val Gln Leu Ala Lys Thr 755 760 765 Gln Ala Asn Leu His Ile Asn Pro Leu Leu Tyr Ser Gln Pro 770 775 780 <210> 851 <211> 20 <212> PRT <213> Torque teno midi virus <400> 851 Leu Arg Tyr Asn Pro Ala Ala Asp Gln Gly Pro Gly Asn Ile Val Thr 1 5 10 15 Ile Ile Asp Leu 20 <210> 852 <211> 204 <212> PRT <213> Torque teno virus <400> 852 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Arg Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Pro Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Val Arg Arg Tyr Arg Thr Arg Thr Val Ile Arg Asn 35 40 45 Pro Cys Lys Asp Thr Gln Val Ser Gly Pro Arg Arg Gln Pro Arg Glu 50 55 60 Val Gln Val Val Asp Pro Gln Leu Ile Thr Pro Pro Trp Val Leu His 65 70 75 80 Ser Phe Asp Gln Arg Arg Gly Met Phe Thr Ala Gly Ala Ile Lys Arg 85 90 95 Leu Leu Lys Gln Pro Ile Pro Gly Glu Tyr Ala Pro Thr Pro Leu Arg 100 105 110 Val Pro Leu Leu Phe Pro Ser Ser Glu Phe Gln Arg Glu Gly Glu Asp 115 120 125 Ala Glu Ser Gly Ser Gly Ser Pro Pro Lys Arg Pro Arg Leu Trp Gln 130 135 140 Glu Glu Ala Asn Gln Thr Gln Thr Glu Ser Ser Glu Gly Pro Ala Glu 145 150 155 160 Thr Thr Arg Glu Leu Leu Glu Arg Lys Leu Arg Glu Gln Arg Val Leu 165 170 175 Asn Leu Gln Leu Gln His Val Ala Val Gln Leu Ala Lys Thr Gln Ala 180 185 190 Asn Leu His Ile Asn Pro Leu Leu Tyr Ser Gln Pro 195 200 <210> 853 <211> 148 <212> PRT <213> Torque teno virus <400> 853 Met Ala Trp Trp Gly Trp Arg Arg Arg Trp Trp Arg Pro Arg Arg Arg 1 5 10 15 Trp Arg Trp Arg Arg Pro Arg Arg Arg Arg Arg Val Pro Ala Arg Arg 20 25 30 Pro Arg Arg Ala Val Arg Arg Tyr Arg Thr Arg Thr Glu Leu Ser Asn 35 40 45 Val Cys Ser Ser Asn Gln Tyr Leu Ala Ser Met Leu Leu His His Ser 50 55 60 Gly Ser Arg Ser Ser Phe Pro Pro Gln Ser Ser Ser Glu Arg Glu Lys 65 70 75 80 Met Gln Lys Ala Ala Gln Val His His Pro Arg Asp Arg Asp Ser Gly 85 90 95 Arg Lys Arg Pro Thr Arg Arg Lys Arg Ser Pro Arg Arg Gly Arg Arg 100 105 110 Arg Arg Arg Gly Ser Ser Ser Ser Glu Ser Ser Glu Ser Ser Glu Ser 115 120 125 Ser Thr Ser Asn Ser Ser Met Ser Gln Tyr Asn Ser Pro Lys Pro Lys 130 135 140 Arg Thr Ser Thr 145 <210> 854 <211> 3742 <212> DNA <213> Torque teno virus <400> 854 aaagtgctac gtcactaacc acgtgacacc cacaggccaa ccgaatgcta tgtcgtgcac 60 ttcctgggcc gggtctacgt cctcatataa ctacctgcac ttccgaatgg ctgagttttc 120 cacgcccgtc cgcagcggtg aagccacgga gggagatcag cgcgtcccga gggcgggtgc 180 cgaaggtgag tttacacacc gaagtcaagg ggcaattcgg gctcgggact ggccgggcta 240 tgggcaaggc tctgaaaaaa gcatgtttat tggcaggcat tacagaaaga aaagggcgct 300 gccactgtgt gctgtgcgat caacaaagaa ggcttgcaaa ctactaatag taatgtggac 360 cccacctcgc aatgaccaac agtaccttaa ctggcaatgg tactcaagta tacttagctc 420 ccacgctgct atgtgcgggt gtcccgacgt tgttgctcat tttaatcatc ttgcttctgt 480 gcttcgcgcc ccgcaaaatc cacccccacc cggtccccag cgaaacctgc ccctccgacg 540 gctgccggct ctcccggctg cgccagaggc gcccggagat agagcaccat ggcctatggc 600 tggtggcgcc ggaggagaag acggtggcgc aggtggagac gcagaccatg gaggcgccgc 660 tggaggacca gaagacgcag acctgttaga cgccgtggcc gccgcagaaa cgtaaggaga 720 cgccgcagag gagggaggtg gaggaggagg tacaggagat ggaaaagaaa gggcagacgc 780 agaaaaaaag ctaaaataat aataagacaa tggcaaccta actacagaag gagatgtaac 840 atagtaggct atattcctgt actgatatgt ggcgaaaata ctgtcagcag aaactatgcc 900 acacactcag acgatactaa ctacccagga ccctttgggg ggggtatgac tacagacaaa 960 tttaccttaa gaattctgta tgacgagtac aaaaggttta tgaactattg gacagcatct 1020 aatgaagacc tagacctctg tagatatcta ggagtaaacc tgtacttttt tagacaccca 1080 gaagtagact ttattataaa aataaatacc atgccccctt ttctagacac agaactaaca 1140 gctcctagca tacacccagg aatgctagcc ttagacaaaa gagcaagatg gatacctagc 1200 ttaaaatcta gaccaggaaa aaaacactat attaaaataa gagtaggggc gcctaaaatg 1260 ttcacagata aatggtaccc ccaaacagat ctttgtgaca tggtgctgct aactgtctat 1320 gcaaccgcag cggatatgca atatccgttc ggctcaccac taactgactc tgtggttgtg 1380 aacttccagg ttctgcaatc catgtatgat gaaaccatta gcatattacc agatcaaaag 1440 gagaaaagaa taacgctgct cactagtata gccttttata acaccacaca aactatagcc 1500 caattaaagc catttataga tgcaggcaat atgacttcaa ctacaacagc aacaacatgg 1560 ggatcataca taaacacaac caaatttaat acagcagcca ctacaacata cacataccca 1620 ggcagtacta caactacagt aactatgtta acttgtaatg actcctggta cagaggaaca 1680 gtatataacg accaaattaa aaatttacca aaggaagcag ctcaattata cttaaaagca 1740 acaaaaacct tactaggaaa caccttcaca aatgacgacc acacactaga ataccatgga 1800 ggactgtaca gctcaatttg gctgtccccc ggcagatctt actttgaaac accaggagca 1860 tacacagaca taaaatacaa cccatttaca gacagaggag aaggaaacat gctatggata 1920 gactggctaa gcaaaaaaaa tatgaactat gacaaactac aaagtaaatg tttaatatca 1980 gacctacctt tatgggcagc agcatatgga tatttagaat tttgtgcaaa aagtacagga 2040 gaccaaaata tacacatgaa tgccagacta ctaataagaa gtccctttac agacccccaa 2100 ctactagtac acacaaaccc cacaaaaggc tttgttccct actctttaaa ctttggaaat 2160 ggtaaaatgc caggaggtag tagtaatgtt cctattagaa tgagagctaa atggtatcca 2220 acattgtttc accagcaaga agtactagag gccttagcac agtcaggccc ctttgcatac 2280 cactcagaca ttaaaaaagt atctctgggt atgaaatacc gttttaagtg gatctggggt 2340 ggaaaccccg ttcgccaaca ggttgttaga aatccctgca aagactccca ctcctcggtc 2400 aatagagtcc ctagaagctt acaaatcgtt gacccgaaat acaactcacc ggaactcaca 2460 ttccatacgt gggacttcag acgtggcctc tttggccaga aagctattga gagaatgcaa 2520 caacaaccaa caactactga cattttttca gcaggccgca agagacccag gagggacacc 2580 gaggtgtacc actccagcca agaaggggag caaaaagaaa gcttactttt ccccccagtc 2640 aagctcctca gacgagtccc cccgtgggaa gactcgcagc aggaggaaag cgggtcgcaa 2700 agctcagagg aagagacgca gaccgtctcc cagcagctca agcagcagct gcagcaacag 2760 cgaatcctgg gagtcaaact catactcctg ttcaaccaag tccaaaaaat ccaacaaaat 2820 caagatatca accctacctt gttaccaagg gggggggatc tagcatcctt atttcaaata 2880 gcaccataaa catgtttgga gaccccaaac cttacaaccc ttccagtaat gactggaaag 2940 aggagtatga ggcctgtaga atatgggaca gacccccaag aggcaatcta agagacaccc 3000 ccttttaccc ctgggccccc aaagaaaacc agtaccgtgt aaactttaaa cttggatttc 3060 aataaagcta ggccgtggga ctttcacttg tcggtgtctg cttataaaag taaccaagca 3120 ctccgagcga agcgaggagt gcgacccttg ggggctcaac gacttcggag ccgcgcgtta 3180 agccttcggc tgcgcgcggc acctcagacc cccgctcgtg ctgacacgct tgcgcgtgtc 3240 agaccacttc gggctcgcgg gggtcgggaa atttattaaa cagactccga gttgccattg 3300 gacacagtag tctatgaaca gcaacgaaag tgagtggggc cagacttcgc cataaggcct 3360 ttatcttctt gccatttgtc agtatagagg gtcgccatag gcttcggtct ccattttaac 3420 ctgtaaaaac taccaaaatg gccgttccag tgacgtgaca gccgccattt taagtagctg 3480 acgtcaagga ttgacgtaaa ggttaaaggt catcctcggc ggaagctaca caaaatggtg 3540 gacaacatct tccgggtcaa aggtcgtgca cacgtcaaaa gtcacgtggt ggggacccgc 3600 tgtaacccgg aagtaggccc cgtcacgtga tttgtcacgt gtgtacacgt cacagccgcc 3660 attttgtttt acaaaatggc tgacttcctt cctctttttt gaaaaaaggc gccaaaaaag 3720 gctccgcccc ccggcccccc cc 3742 <210> 855 <211> 120 <212> PRT <213> Torque teno virus <400> 855 Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp 1 5 10 15 Tyr Ser Ser Ile Leu Ser Ser His Ala Ala Met Cys Gly Cys Pro Asp 20 25 30 Val Val Ala His Phe Asn His Leu Ala Ser Val Leu Arg Ala Pro Gln 35 40 45 Asn Pro Pro Pro Pro Gly Pro Gln Arg Asn Leu Pro Leu Arg Arg Leu 50 55 60 Pro Ala Leu Pro Ala Ala Pro Glu Ala Pro Gly Asp Arg Ala Pro Trp 65 70 75 80 Pro Met Ala Gly Gly Ala Gly Gly Glu Asp Gly Gly Ala Gly Gly Asp 85 90 95 Ala Asp His Gly Gly Ala Ala Gly Gly Pro Glu Asp Ala Asp Leu Leu 100 105 110 Asp Ala Val Ala Ala Ala Glu Thr 115 120 <210> 856 <211> 286 <212> PRT <213> Torque teno virus <400> 856 Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp 1 5 10 15 Tyr Ser Ser Ile Leu Ser Ser His Ala Ala Met Cys Gly Cys Pro Asp 20 25 30 Val Val Ala His Phe Asn His Leu Ala Ser Val Leu Arg Ala Pro Gln 35 40 45 Asn Pro Pro Pro Pro Gly Pro Gln Arg Asn Leu Pro Leu Arg Arg Leu 50 55 60 Pro Ala Leu Pro Ala Ala Pro Glu Ala Pro Gly Asp Arg Ala Pro Trp 65 70 75 80 Pro Met Ala Gly Gly Ala Gly Gly Glu Asp Gly Gly Ala Gly Gly Asp 85 90 95 Ala Asp His Gly Gly Ala Ala Gly Gly Pro Glu Asp Ala Asp Leu Leu 100 105 110 Asp Ala Val Ala Ala Ala Glu Thr Leu Leu Glu Ile Pro Ala Lys Thr 115 120 125 Pro Thr Pro Arg Ser Ile Glu Ser Leu Glu Ala Tyr Lys Ser Leu Thr 130 135 140 Arg Asn Thr Thr His Arg Asn Ser His Ser Ile Arg Gly Thr Ser Asp 145 150 155 160 Val Ala Ser Leu Ala Arg Lys Leu Leu Arg Glu Cys Asn Asn Asn Gln 165 170 175 Gln Leu Leu Thr Phe Phe Gln Gln Ala Ala Arg Asp Pro Gly Gly Thr 180 185 190 Pro Arg Cys Thr Thr Pro Ala Lys Lys Gly Ser Lys Lys Lys Ala Tyr 195 200 205 Phe Ser Pro Gln Ser Ser Ser Ser Asp Glu Ser Pro Arg Gly Lys Thr 210 215 220 Arg Ser Arg Arg Lys Ala Gly Arg Lys Ala Gln Arg Lys Arg Arg Arg 225 230 235 240 Pro Ser Pro Ser Ser Ser Ser Ser Ser Cys Ser Asn Ser Glu Ser Trp 245 250 255 Glu Ser Asn Ser Tyr Ser Cys Ser Thr Lys Ser Lys Lys Ser Asn Lys 260 265 270 Ile Lys Ile Ser Thr Leu Pro Cys Tyr Gln Gly Gly Gly Ile 275 280 285 <210> 857 <211> 289 <212> PRT <213> Torque teno virus <400> 857 Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp 1 5 10 15 Tyr Ser Ser Ile Leu Ser Ser His Ala Ala Met Cys Gly Cys Pro Asp 20 25 30 Val Val Ala His Phe Asn His Leu Ala Ser Val Leu Arg Ala Pro Gln 35 40 45 Asn Pro Pro Pro Pro Gly Pro Gln Arg Asn Leu Pro Leu Arg Arg Leu 50 55 60 Pro Ala Leu Pro Ala Ala Pro Glu Ala Pro Gly Asp Arg Ala Pro Trp 65 70 75 80 Pro Met Ala Gly Gly Ala Gly Gly Glu Asp Gly Gly Ala Gly Gly Asp 85 90 95 Ala Asp His Gly Gly Ala Ala Gly Gly Pro Glu Asp Ala Asp Leu Leu 100 105 110 Asp Ala Val Ala Ala Ala Glu Thr Pro Gln Glu Thr Gln Glu Gly His 115 120 125 Arg Gly Val Pro Leu Gln Pro Arg Arg Gly Ala Lys Arg Lys Leu Thr 130 135 140 Phe Pro Pro Ser Gln Ala Pro Gln Thr Ser Pro Pro Val Gly Arg Leu 145 150 155 160 Ala Ala Gly Gly Lys Arg Val Ala Lys Leu Arg Gly Arg Asp Ala Asp 165 170 175 Arg Leu Pro Ala Ala Gln Ala Ala Ala Ala Ala Thr Ala Asn Pro Gly 180 185 190 Ser Gln Thr His Thr Pro Val Gln Pro Ser Pro Lys Asn Pro Thr Lys 195 200 205 Ser Arg Tyr Gln Pro Tyr Leu Val Thr Lys Gly Gly Gly Ser Ser Ile 210 215 220 Leu Ile Ser Asn Ser Thr Ile Asn Met Phe Gly Asp Pro Lys Pro Tyr 225 230 235 240 Asn Pro Ser Ser Asn Asp Trp Lys Glu Glu Tyr Glu Ala Cys Arg Ile 245 250 255 Trp Asp Arg Pro Pro Arg Gly Asn Leu Arg Asp Thr Pro Phe Tyr Pro 260 265 270 Trp Ala Pro Lys Glu Asn Gln Tyr Arg Val Asn Phe Lys Leu Gly Phe 275 280 285 Gln <210> 858 <211> 196 <212> PRT <213> Torque teno virus <400> 858 Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp 1 5 10 15 Tyr Ser Ser Ile Leu Ser Ser His Ala Ala Met Pro Gln Glu Thr Gln 20 25 30 Glu Gly His Arg Gly Val Pro Leu Gln Pro Arg Arg Gly Ala Lys Arg 35 40 45 Lys Leu Thr Phe Pro Pro Ser Gln Ala Pro Gln Thr Ser Pro Pro Val 50 55 60 Gly Arg Leu Ala Ala Gly Gly Lys Arg Val Ala Lys Leu Arg Gly Arg 65 70 75 80 Asp Ala Asp Arg Leu Pro Ala Ala Gln Ala Ala Ala Ala Ala Thr Ala 85 90 95 Asn Pro Gly Ser Gln Thr His Thr Pro Val Gln Pro Ser Pro Lys Asn 100 105 110 Pro Thr Lys Ser Arg Tyr Gln Pro Tyr Leu Val Thr Lys Gly Gly Gly 115 120 125 Ser Ser Ile Leu Ile Ser Asn Ser Thr Ile Asn Met Phe Gly Asp Pro 130 135 140 Lys Pro Tyr Asn Pro Ser Ser Asn Asp Trp Lys Glu Glu Tyr Glu Ala 145 150 155 160 Cys Arg Ile Trp Asp Arg Pro Pro Arg Gly Asn Leu Arg Asp Thr Pro 165 170 175 Phe Tyr Pro Trp Ala Pro Lys Glu Asn Gln Tyr Arg Val Asn Phe Lys 180 185 190 Leu Gly Phe Gln 195 <210> 859 <211> 766 <212> PRT <213> Torque teno virus <400> 859 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp 1 5 10 15 Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro 20 25 30 Val Arg Arg Arg Gly Arg Arg Arg Asn Val Arg Arg Arg Arg Arg Gly 35 40 45 Gly Arg Trp Arg Arg Arg Tyr Arg Arg Trp Lys Arg Lys Gly Arg Arg 50 55 60 Arg Lys Lys Ala Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Arg 65 70 75 80 Arg Arg Cys Asn Ile Val Gly Tyr Ile Pro Val Leu Ile Cys Gly Glu 85 90 95 Asn Thr Val Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Asn Tyr 100 105 110 Pro Gly Pro Phe Gly Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg 115 120 125 Ile Leu Tyr Asp Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ala Ser 130 135 140 Asn Glu Asp Leu Asp Leu Cys Arg Tyr Leu Gly Val Asn Leu Tyr Phe 145 150 155 160 Phe Arg His Pro Glu Val Asp Phe Ile Ile Lys Ile Asn Thr Met Pro 165 170 175 Pro Phe Leu Asp Thr Glu Leu Thr Ala Pro Ser Ile His Pro Gly Met 180 185 190 Leu Ala Leu Asp Lys Arg Ala Arg Trp Ile Pro Ser Leu Lys Ser Arg 195 200 205 Pro Gly Lys Lys His Tyr Ile Lys Ile Arg Val Gly Ala Pro Lys Met 210 215 220 Phe Thr Asp Lys Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Val Leu 225 230 235 240 Leu Thr Val Tyr Ala Thr Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser 245 250 255 Pro Leu Thr Asp Ser Val Val Val Asn Phe Gln Val Leu Gln Ser Met 260 265 270 Tyr Asp Glu Thr Ile Ser Ile Leu Pro Asp Gln Lys Glu Lys Arg Ile 275 280 285 Thr Leu Leu Thr Ser Ile Ala Phe Tyr Asn Thr Thr Gln Thr Ile Ala 290 295 300 Gln Leu Lys Pro Phe Ile Asp Ala Gly Asn Met Thr Ser Thr Thr Thr 305 310 315 320 Ala Thr Thr Trp Gly Ser Tyr Ile Asn Thr Thr Lys Phe Asn Thr Ala 325 330 335 Ala Thr Thr Thr Tyr Thr Tyr Pro Gly Ser Thr Thr Thr Thr Val Thr 340 345 350 Met Leu Thr Cys Asn Asp Ser Trp Tyr Arg Gly Thr Val Tyr Asn Asp 355 360 365 Gln Ile Lys Asn Leu Pro Lys Glu Ala Ala Gln Leu Tyr Leu Lys Ala 370 375 380 Thr Lys Thr Leu Leu Gly Asn Thr Phe Thr Asn Asp Asp His Thr Leu 385 390 395 400 Glu Tyr His Gly Gly Leu Tyr Ser Ser Ile Trp Leu Ser Pro Gly Arg 405 410 415 Ser Tyr Phe Glu Thr Pro Gly Ala Tyr Thr Asp Ile Lys Tyr Asn Pro 420 425 430 Phe Thr Asp Arg Gly Glu Gly Asn Met Leu Trp Ile Asp Trp Leu Ser 435 440 445 Lys Lys Asn Met Asn Tyr Asp Lys Leu Gln Ser Lys Cys Leu Ile Ser 450 455 460 Asp Leu Pro Leu Trp Ala Ala Ala Tyr Gly Tyr Leu Glu Phe Cys Ala 465 470 475 480 Lys Ser Thr Gly Asp Gln Asn Ile His Met Asn Ala Arg Leu Leu Ile 485 490 495 Arg Ser Pro Phe Thr Asp Pro Gln Leu Leu Val His Thr Asn Pro Thr 500 505 510 Lys Gly Phe Val Pro Tyr Ser Leu Asn Phe Gly Asn Gly Lys Met Pro 515 520 525 Gly Gly Ser Ser Asn Val Pro Ile Arg Met Arg Ala Lys Trp Tyr Pro 530 535 540 Thr Leu Phe His Gln Gln Glu Val Leu Glu Ala Leu Ala Gln Ser Gly 545 550 555 560 Pro Phe Ala Tyr His Ser Asp Ile Lys Lys Val Ser Leu Gly Met Lys 565 570 575 Tyr Arg Phe Lys Trp Ile Trp Gly Gly Asn Pro Val Arg Gln Gln Val 580 585 590 Val Arg Asn Pro Cys Lys Asp Ser His Ser Ser Val Asn Arg Val Pro 595 600 605 Arg Ser Leu Gln Ile Val Asp Pro Lys Tyr Asn Ser Pro Glu Leu Thr 610 615 620 Phe His Thr Trp Asp Phe Arg Arg Gly Leu Phe Gly Gln Lys Ala Ile 625 630 635 640 Glu Arg Met Gln Gln Gln Pro Thr Thr Thr Asp Ile Phe Ser Ala Gly 645 650 655 Arg Lys Arg Pro Arg Arg Asp Thr Glu Val Tyr His Ser Ser Gln Glu 660 665 670 Gly Glu Gln Lys Glu Ser Leu Leu Phe Pro Pro Val Lys Leu Leu Arg 675 680 685 Arg Val Pro Pro Trp Glu Asp Ser Gln Gln Glu Glu Ser Gly Ser Gln 690 695 700 Ser Ser Glu Glu Glu Thr Gln Thr Val Ser Gln Gln Leu Lys Gln Gln 705 710 715 720 Leu Gln Gln Gln Arg Ile Leu Gly Val Lys Leu Ile Leu Leu Phe Asn 725 730 735 Gln Val Gln Lys Ile Gln Gln Asn Gln Asp Ile Asn Pro Thr Leu Leu 740 745 750 Pro Arg Gly Gly Asp Leu Ala Ser Leu Phe Gln Ile Ala Pro 755 760 765 <210> 860 <211> 216 <212> PRT <213> Torque teno virus <400> 860 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp 1 5 10 15 Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro 20 25 30 Val Arg Arg Arg Gly Arg Arg Arg Asn Val Val Arg Asn Pro Cys Lys 35 40 45 Asp Ser His Ser Ser Val Asn Arg Val Pro Arg Ser Leu Gln Ile Val 50 55 60 Asp Pro Lys Tyr Asn Ser Pro Glu Leu Thr Phe His Thr Trp Asp Phe 65 70 75 80 Arg Arg Gly Leu Phe Gly Gln Lys Ala Ile Glu Arg Met Gln Gln Gln 85 90 95 Pro Thr Thr Thr Asp Ile Phe Ser Ala Gly Arg Lys Arg Pro Arg Arg 100 105 110 Asp Thr Glu Val Tyr His Ser Ser Gln Glu Gly Glu Gln Lys Glu Ser 115 120 125 Leu Leu Phe Pro Pro Val Lys Leu Leu Arg Arg Val Pro Pro Trp Glu 130 135 140 Asp Ser Gln Gln Glu Glu Ser Gly Ser Gln Ser Ser Glu Glu Glu Thr 145 150 155 160 Gln Thr Val Ser Gln Gln Leu Lys Gln Gln Leu Gln Gln Gln Arg Ile 165 170 175 Leu Gly Val Lys Leu Ile Leu Leu Phe Asn Gln Val Gln Lys Ile Gln 180 185 190 Gln Asn Gln Asp Ile Asn Pro Thr Leu Leu Pro Arg Gly Gly Asp Leu 195 200 205 Ala Ser Leu Phe Gln Ile Ala Pro 210 215 <210> 861 <211> 143 <212> PRT <213> Torque teno virus <400> 861 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp 1 5 10 15 Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro 20 25 30 Val Arg Arg Arg Gly Arg Arg Arg Asn Ala Ala Arg Asp Pro Gly Gly 35 40 45 Thr Pro Arg Cys Thr Thr Pro Ala Lys Lys Gly Ser Lys Lys Lys Ala 50 55 60 Tyr Phe Ser Pro Gln Ser Ser Ser Ser Asp Glu Ser Pro Arg Gly Lys 65 70 75 80 Thr Arg Ser Arg Arg Lys Ala Gly Arg Lys Ala Gln Arg Lys Arg Arg 85 90 95 Arg Pro Ser Pro Ser Ser Ser Ser Ser Ser Cys Ser Asn Ser Glu Ser 100 105 110 Trp Glu Ser Asn Ser Tyr Ser Cys Ser Thr Lys Ser Lys Lys Ser Asn 115 120 125 Lys Ile Lys Ile Ser Thr Leu Pro Cys Tyr Gln Gly Gly Gly Ile 130 135 140 <210> 862 <211> 3553 <212> DNA <213> Torque teno virus <220> <221> modified_base <222> (1842)..(1842) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3125)..(3176) <223> a, c, t, g, unknown or other <400> 862 atacctcatc atataaagcg gcgcacttcc gaatggctga gttttccacg cccgtccgca 60 gcgagatcgc gacggaggag cgatcgagcg tcccgagggc gggtgccgga ggtgagttta 120 cacaccgcag tcaaggggca attcgggctc gggactggcc gggctatggg gcaagactct 180 taaaaaagcc atgtttctcg gtaaacttta cagaaagaaa agggcactgt cactgctacg 240 cgtgcgagct ccagaggcga aaccacctgc tatgagttgg agacccccgg tgcacaaccc 300 caatgggatc gagagaaacc tgtgggaggc attctttcgc atgcatgctt cagcttgtgg 360 ttgtggcgat cttgttggcc atcttactgt actggctggt cggtatggtg ctcctcctcg 420 tcccccggcc cccggcgctc ccagaccacc gctgatacgc cagctggccc ttccggcgcc 480 ccccgccgat cctcaacagg ctaacccaca atggcctggt ggggacggtg gagaagatgg 540 cgctggaggc cccgccgctg gcggcgccgt cgcagacgcc gagtaccaag aagacgagct 600 caacgccctg ttcgacgccg tcgagcaaga agagtaagga ggaggcgatg ggggaggcgg 660 aggtggagac gggggtacag acgcagactg agactaagac gcagacgcag acgaaagcga 720 aagatagtac taactcagtg gaatcccgcc aaagtgcgga ggtgtactat taagggagtt 780 ctgcccatga tcctgtgcgg ggccgggcgc tcggggttta actacggact gcacagcgac 840 gactacactg tacagaagcc ccttggccag aacccccacg ggggcggcat gagtacagtg 900 acttttagcc tacaggtgct ctatgaccag taccagaggt ttatgaacaa gtggtcgtac 960 tccaacgacc agctagacct cgccaggtac tttggctgca ccttctggtt ctacagacac 1020 ccagaggtgg actttgtagc tcagtttgac aacgttcccc ccatgaaaat ggacgagaac 1080 acagccccaa acactcatcc ctctttctta ctacagaaca aacacaaggt taaaattccc 1140 agctttaaaa caaagccttt tggtaaaaaa agagttagag ttacagtagg gccccccaaa 1200 ctgtttgaag ataagtggta cagccaacat gacttgtgta aggtgcccct agtcagttgg 1260 cggttaaccg cagctgactt caggtttccg ttctgctcac cacaaactga caacccttgc 1320 tacaccttcc aggtattgca tgaagagtat tacccagtaa taggcacttc tgctttagaa 1380 aacggcagta actacaatag ctcagctata acagccttag aaaaattctt atatgaaaaa 1440 tgcacacact atcaaacatt tgccacagac accagactta atcctcagcg accagtgtca 1500 tctacaaatg caaacaaaac atacaccccc tcaggctccc aagaaacaat agtgtggggg 1560 cagtcagatt ttaatttatt taaaaagcac acagacagca actatggcta ctgcacctac 1620 tgtcctacca atgacttagc tacaaaaatt aaaaagtaca gagacaaaag attcgactgg 1680 ctaacaaaca tgccagtaac aaacacctgc cacataaatg ccaccttcgc ccgaggcaaa 1740 attaaagaat gggagtacca cctagggtgg ttctcaaaca tctttatagg caacctgaga 1800 cacaacctag cattccgggc cgcatacata gacatcacct anacagacaa gggagaaggc 1860 aacattatct ggttccagta cctcactaaa cccaccacag agtacataga agcccaagca 1920 aagtgctcca tcacaaacat acccctgtat gctgcttttt atggctacga agactacctc 1980 cagagaacac taggccccta ccaagatgta gaaaccctag gtataatctg tgttaaatgt 2040 ccctacacag atccccctct agttcacaag tctacagata aaaagaactg gggctacgtg 2100 ttctacgacg tgcactttgg caacggaaag accccagagg gactgggcca ggtgcaccct 2160 tactggatgc agaggtggag accctacgta cagtttcaga aagacactat gaacaaaata 2220 gccaggacgg gaccgttcag ctacagagac gagacgcctt ccatcaccct gaccgccggg 2280 tacaagtttc attttaactg ggggggcgac tctatatttc cacagattat taaaaacccc 2340 tgcccagaca gcggggtacg accttcatcc agtagagagc gtcgctcagt acaagtcgtt 2400 agcccgctca caatggggcc agagtacata ttccaccggt gggactggcg acgggggttc 2460 tttaatcaaa aagctctcaa aagaatgctt gaaaaatcaa ttaatgatgg agagtatcca 2520 acaggcccaa aggtccctcg atggtttccc ccactcgaca accaagagca agaaggcgcc 2580 tcaggttcag aggagacaag gtcgcagtcc tcgcaagaag aagccgctca agaagccctc 2640 caagaagtcc aagaggcgtc gctacagcag cacctcctcc agcagtaccg agagcagcga 2700 cggatcggaa agcaactcca actcgtcatg ctgcagctca ccaagacgca gagcaacctg 2760 cacataaacc cccgtgttct tggccatgca taaataaagt ctacatgttt ccccccgaca 2820 agcccatgcc catacacggg taccacgggt gggagacgga gtaccaggcc tgcaaggcct 2880 tcaacaggcc ccccagaaac tacctttcag acaaacccat ctacccttgg ctccctcgcc 2940 ccgaacccga aataatagtg agctttaggt tcggtttcaa ataaacaagg ccgcaaataa 3000 acaaggccgt gggagtttca ctggtcggtg tctacctctt aaggtcacta agcactccga 3060 gcgttagcga ggagtgcgac ccttccccct ggtgccacgc cctcggcggc cgcgcgctac 3120 gcctnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnntgaa 3180 tcagtaacga aagtgagtgg ggccagactt cgccataagg cctttatctt cttgccattg 3240 gtccgtgtgg ggagtcgcca taggcttcgg gctcggtttt aggccttccg gactacaaaa 3300 accgccattt tagtgacgtc acggcggcca ttttaagtaa gcatggcggg cggtgacgta 3360 caagttgaaa ggtcaccgcg cttccgtgtt tactcaaaat ggtggccaac tgcttccggg 3420 tcaaaggtcg gcggccacgt cataagtcac gtgggagggc tgcgtcacaa acacggaagt 3480 ggctgtccca cgtgacttgt cacgtgattg ctacgtcacg gccgccattt tagttcacaa 3540 aatggcggac ttc 3553 <210> 863 <211> 121 <212> PRT <213> Torque teno virus <400> 863 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Glu Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ser Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Leu Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu 115 120 <210> 864 <211> 267 <212> PRT <213> Torque teno virus <400> 864 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Glu Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ser Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Leu Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu Leu Leu Lys Thr Pro Ala Gln 115 120 125 Thr Ala Gly Tyr Asp Leu His Pro Val Glu Ser Val Ala Gln Tyr Lys 130 135 140 Ser Leu Ala Arg Ser Gln Trp Gly Gln Ser Thr Tyr Ser Thr Gly Gly 145 150 155 160 Thr Gly Asp Gly Gly Ser Leu Ile Lys Lys Leu Ser Lys Glu Cys Leu 165 170 175 Lys Asn Gln Leu Met Met Glu Ser Ile Gln Gln Ala Gln Arg Ser Leu 180 185 190 Asp Gly Phe Pro His Ser Thr Thr Lys Ser Lys Lys Ala Pro Gln Val 195 200 205 Gln Arg Arg Gln Gly Arg Ser Pro Arg Lys Lys Lys Pro Leu Lys Lys 210 215 220 Pro Ser Lys Lys Ser Lys Arg Arg Arg Tyr Ser Ser Thr Ser Ser Ser 225 230 235 240 Ser Thr Glu Ser Ser Asp Gly Ser Glu Ser Asn Ser Asn Ser Ser Cys 245 250 255 Cys Ser Ser Pro Arg Arg Arg Ala Thr Cys Thr 260 265 <210> 865 <211> 273 <212> PRT <213> Torque teno virus <400> 865 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Glu Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ser Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Leu Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu Pro Lys Gly Pro Ser Met Val 115 120 125 Ser Pro Thr Arg Gln Pro Arg Ala Arg Arg Arg Leu Arg Phe Arg Gly 130 135 140 Asp Lys Val Ala Val Leu Ala Arg Arg Ser Arg Ser Arg Ser Pro Pro 145 150 155 160 Arg Ser Pro Arg Gly Val Ala Thr Ala Ala Pro Pro Pro Ala Val Pro 165 170 175 Arg Ala Ala Thr Asp Arg Lys Ala Thr Pro Thr Arg His Ala Ala Ala 180 185 190 His Gln Asp Ala Glu Gln Pro Ala His Lys Pro Pro Cys Ser Trp Pro 195 200 205 Cys Ile Asn Lys Val Tyr Met Phe Pro Pro Asp Lys Pro Met Pro Ile 210 215 220 His Gly Tyr His Gly Trp Glu Thr Glu Tyr Gln Ala Cys Lys Ala Phe 225 230 235 240 Asn Arg Pro Pro Arg Asn Tyr Leu Ser Asp Lys Pro Ile Tyr Pro Trp 245 250 255 Leu Pro Arg Pro Glu Pro Glu Ile Ile Val Ser Phe Arg Phe Gly Phe 260 265 270 Lys <210> 866 <211> 196 <212> PRT <213> Torque teno virus <400> 866 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Glu Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ser Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Leu Thr Val Leu Ala Gly Arg Pro Lys Gly Pro 35 40 45 Ser Met Val Ser Pro Thr Arg Gln Pro Arg Ala Arg Arg Arg Leu Arg 50 55 60 Phe Arg Gly Asp Lys Val Ala Val Leu Ala Arg Arg Ser Arg Ser Arg 65 70 75 80 Ser Pro Pro Arg Ser Pro Arg Gly Val Ala Thr Ala Ala Pro Pro Pro 85 90 95 Ala Val Pro Arg Ala Ala Thr Asp Arg Lys Ala Thr Pro Thr Arg His 100 105 110 Ala Ala Ala His Gln Asp Ala Glu Gln Pro Ala His Lys Pro Pro Cys 115 120 125 Ser Trp Pro Cys Ile Asn Lys Val Tyr Met Phe Pro Pro Asp Lys Pro 130 135 140 Met Pro Ile His Gly Tyr His Gly Trp Glu Thr Glu Tyr Gln Ala Cys 145 150 155 160 Lys Ala Phe Asn Arg Pro Pro Arg Asn Tyr Leu Ser Asp Lys Pro Ile 165 170 175 Tyr Pro Trp Leu Pro Arg Pro Glu Pro Glu Ile Ile Val Ser Phe Arg 180 185 190 Phe Gly Phe Lys 195 <210> 867 <211> 760 <212> PRT <213> Torque teno virus <220> <221> MOD_RES <222> (444)..(444) <223> Any amino acid <400> 867 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Val Arg Arg Arg Arg Trp Gly 35 40 45 Arg Arg Arg Trp Arg Arg Gly Tyr Arg Arg Arg Leu Arg Leu Arg Arg 50 55 60 Arg Arg Arg Arg Lys Arg Lys Ile Val Leu Thr Gln Trp Asn Pro Ala 65 70 75 80 Lys Val Arg Arg Cys Thr Ile Lys Gly Val Leu Pro Met Ile Leu Cys 85 90 95 Gly Ala Gly Arg Ser Gly Phe Asn Tyr Gly Leu His Ser Asp Asp Tyr 100 105 110 Thr Val Gln Lys Pro Leu Gly Gln Asn Pro His Gly Gly Gly Met Ser 115 120 125 Thr Val Thr Phe Ser Leu Gln Val Leu Tyr Asp Gln Tyr Gln Arg Phe 130 135 140 Met Asn Lys Trp Ser Tyr Ser Asn Asp Gln Leu Asp Leu Ala Arg Tyr 145 150 155 160 Phe Gly Cys Thr Phe Trp Phe Tyr Arg His Pro Glu Val Asp Phe Val 165 170 175 Ala Gln Phe Asp Asn Val Pro Pro Met Lys Met Asp Glu Asn Thr Ala 180 185 190 Pro Asn Thr His Pro Ser Phe Leu Leu Gln Asn Lys His Lys Val Lys 195 200 205 Ile Pro Ser Phe Lys Thr Lys Pro Phe Gly Lys Lys Arg Val Arg Val 210 215 220 Thr Val Gly Pro Pro Lys Leu Phe Glu Asp Lys Trp Tyr Ser Gln His 225 230 235 240 Asp Leu Cys Lys Val Pro Leu Val Ser Trp Arg Leu Thr Ala Ala Asp 245 250 255 Phe Arg Phe Pro Phe Cys Ser Pro Gln Thr Asp Asn Pro Cys Tyr Thr 260 265 270 Phe Gln Val Leu His Glu Glu Tyr Tyr Pro Val Ile Gly Thr Ser Ala 275 280 285 Leu Glu Asn Gly Ser Asn Tyr Asn Ser Ser Ala Ile Thr Ala Leu Glu 290 295 300 Lys Phe Leu Tyr Glu Lys Cys Thr His Tyr Gln Thr Phe Ala Thr Asp 305 310 315 320 Thr Arg Leu Asn Pro Gln Arg Pro Val Ser Ser Thr Asn Ala Asn Lys 325 330 335 Thr Tyr Thr Pro Ser Gly Ser Gln Glu Thr Ile Val Trp Gly Gln Ser 340 345 350 Asp Phe Asn Leu Phe Lys Lys His Thr Asp Ser Asn Tyr Gly Tyr Cys 355 360 365 Thr Tyr Cys Pro Thr Asn Asp Leu Ala Thr Lys Ile Lys Lys Tyr Arg 370 375 380 Asp Lys Arg Phe Asp Trp Leu Thr Asn Met Pro Val Thr Asn Thr Cys 385 390 395 400 His Ile Asn Ala Thr Phe Ala Arg Gly Lys Ile Lys Glu Trp Glu Tyr 405 410 415 His Leu Gly Trp Phe Ser Asn Ile Phe Ile Gly Asn Leu Arg His Asn 420 425 430 Leu Ala Phe Arg Ala Ala Tyr Ile Asp Ile Thr Xaa Thr Asp Lys Gly 435 440 445 Glu Gly Asn Ile Ile Trp Phe Gln Tyr Leu Thr Lys Pro Thr Thr Glu 450 455 460 Tyr Ile Glu Ala Gln Ala Lys Cys Ser Ile Thr Asn Ile Pro Leu Tyr 465 470 475 480 Ala Ala Phe Tyr Gly Tyr Glu Asp Tyr Leu Gln Arg Thr Leu Gly Pro 485 490 495 Tyr Gln Asp Val Glu Thr Leu Gly Ile Ile Cys Val Lys Cys Pro Tyr 500 505 510 Thr Asp Pro Pro Leu Val His Lys Ser Thr Asp Lys Lys Asn Trp Gly 515 520 525 Tyr Val Phe Tyr Asp Val His Phe Gly Asn Gly Lys Thr Pro Glu Gly 530 535 540 Leu Gly Gln Val His Pro Tyr Trp Met Gln Arg Trp Arg Pro Tyr Val 545 550 555 560 Gln Phe Gln Lys Asp Thr Met Asn Lys Ile Ala Arg Thr Gly Pro Phe 565 570 575 Ser Tyr Arg Asp Glu Thr Pro Ser Ile Thr Leu Thr Ala Gly Tyr Lys 580 585 590 Phe His Phe Asn Trp Gly Gly Asp Ser Ile Phe Pro Gln Ile Ile Lys 595 600 605 Asn Pro Cys Pro Asp Ser Gly Val Arg Pro Ser Ser Ser Arg Glu Arg 610 615 620 Arg Ser Val Gln Val Val Ser Pro Leu Thr Met Gly Pro Glu Tyr Ile 625 630 635 640 Phe His Arg Trp Asp Trp Arg Arg Gly Phe Phe Asn Gln Lys Ala Leu 645 650 655 Lys Arg Met Leu Glu Lys Ser Ile Asn Asp Gly Glu Tyr Pro Thr Gly 660 665 670 Pro Lys Val Pro Arg Trp Phe Pro Pro Leu Asp Asn Gln Glu Gln Glu 675 680 685 Gly Ala Ser Gly Ser Glu Glu Thr Arg Ser Gln Ser Ser Gln Glu Glu 690 695 700 Ala Ala Gln Glu Ala Leu Gln Glu Val Gln Glu Ala Ser Leu Gln Gln 705 710 715 720 His Leu Leu Gln Gln Tyr Arg Glu Gln Arg Arg Ile Gly Lys Gln Leu 725 730 735 Gln Leu Val Met Leu Gln Leu Thr Lys Thr Gln Ser Asn Leu His Ile 740 745 750 Asn Pro Arg Val Leu Gly His Ala 755 760 <210> 868 <211> 196 <212> PRT <213> Torque teno virus <400> 868 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Ile Ile Lys Asn Pro Cys Pro 35 40 45 Asp Ser Gly Val Arg Pro Ser Ser Ser Arg Glu Arg Arg Ser Val Gln 50 55 60 Val Val Ser Pro Leu Thr Met Gly Pro Glu Tyr Ile Phe His Arg Trp 65 70 75 80 Asp Trp Arg Arg Gly Phe Phe Asn Gln Lys Ala Leu Lys Arg Met Leu 85 90 95 Glu Lys Ser Ile Asn Asp Gly Glu Tyr Pro Thr Gly Pro Lys Val Pro 100 105 110 Arg Trp Phe Pro Pro Leu Asp Asn Gln Glu Gln Glu Gly Ala Ser Gly 115 120 125 Ser Glu Glu Thr Arg Ser Gln Ser Ser Gln Glu Glu Ala Ala Gln Glu 130 135 140 Ala Leu Gln Glu Val Gln Glu Ala Ser Leu Gln Gln His Leu Leu Gln 145 150 155 160 Gln Tyr Arg Glu Gln Arg Arg Ile Gly Lys Gln Leu Gln Leu Val Met 165 170 175 Leu Gln Leu Thr Lys Thr Gln Ser Asn Leu His Ile Asn Pro Arg Val 180 185 190 Leu Gly His Ala 195 <210> 869 <211> 121 <212> PRT <213> Torque teno virus <400> 869 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Ala Gln Arg Ser Leu Asp Gly 35 40 45 Phe Pro His Ser Thr Thr Lys Ser Lys Lys Ala Pro Gln Val Gln Arg 50 55 60 Arg Gln Gly Arg Ser Pro Arg Lys Lys Lys Pro Leu Lys Lys Pro Ser 65 70 75 80 Lys Lys Ser Lys Arg Arg Arg Tyr Ser Ser Thr Ser Ser Ser Ser Thr 85 90 95 Glu Ser Ser Asp Gly Ser Glu Ser Asn Ser Asn Ser Ser Cys Cys Ser 100 105 110 Ser Pro Arg Arg Arg Ala Thr Cys Thr 115 120 <210> 870 <211> 3896 <212> DNA <213> Torque teno virus <220> <221> modified_base <222> (1276)..(1276) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3198)..(3655) <223> a, c, t, g, unknown or other <400> 870 taaacttcct cttttaatag gaaaccacaa aatttgcatt gccgaccaca aacgcatatg 60 caaatttact tccccaaaaa ctcaaccaca aaatttgcat tgccgcccac aaacgtctac 120 tttaaccaca tcctctaaca tgttagaaac tccacccaac tacttcatta gtatacagca 180 tcacaaggga ggagccaaac aactatataa ccaagtgtac ttccgaatgg ctgagtttat 240 gccgccagac ggagacggga tcgcgacgga ggagcgatcg agcgtcccga gggcgggtgc 300 cggaggtgag tttacacacc gcagtcaagg ggcaattcgg gctcgggact ggccgggcta 360 tgggcaaggc tcttaaaaaa gccatgtttc tcggtcgacc ttacagaaag aaaagggcac 420 tgtcactgct acgcgtgcga gctccagagg cgaaaccacc tgctatgagc tggaggcccc 480 cggtgcacaa ccctaatggg atccagagaa acctgtggga ggcattcttt cgcatgcatg 540 ctgcagcttg tggttgtggc gatcttgttg gccatattac tgtactggct ggtcggtatg 600 gtgctcctcc tcgtcccccg gcccccgggg ctcccagacc accgctgata cgccagctgg 660 cccttccggc gccccccgcc gatcctcaac aggctaaccc acaatggcct ggtggggacg 720 gtggagaaga tggcgctgga ggccccgccg ctggcggcgc cgtcgcagac gccgagtacc 780 aagaagacga gctcaacgcc ctgttcgacg ccgtcgagca agaagagtaa ggaggaggcg 840 atgggggagg cggaggtgga gacgggggta cagacgcaga ctaagactga gacgcagacg 900 cagacgaaag aaaataagac tgactcagtg gaacccagcc aaagtcagga gatgtactat 960 taagggggtg ctacccatga tcttatgcgg cgccggccgc tcggggttta actatggact 1020 gcacagcgac gactacacgg tgcagaaacc cctggggcag aacccccacg ggggcggcat 1080 gagcacagta acttttagcc tacaagtact atttgaccag taccagaggt ttatgaaccg 1140 gtggtcgtac tccaacgacc agctagacct cgccaggtac tttggctgca ccttctactt 1200 ttacagacac cctgaaattg actttgtagc tcagtatgac aatgtacccc caatgaaaat 1260 ggacgagaac acggcnccta acactcaccc ctcttttcta ctacaaaaca aacgcaaaat 1320 taaaatcccc agctttaaaa ccaagccatt tggcagaaaa agagtaaaag taacagtggg 1380 gccccccaaa ctgtttgaag ataaatggta cagccagcat gacttgtgta aggtgcccct 1440 agtcagttgg cggttaaccg catgtgactt caggtttccg ttctgctcac cactaactga 1500 caacccttgc tacaccttcc aggtattgca tgaaaactat tacccagtca taggcacttc 1560 ctctttagaa aacggtacaa actacaataa cactgctata actacccttg agacatggct 1620 atatggaaaa tgcacacact atcaaacatt tgccacagac accagactta atccacagag 1680 acctgtatct tcaagtaatg caaatgaaac ttatactcct agtggttcta aagaatcaat 1740 aatatgggga cagtctgact gggcaaactt taaaaagaac acagacagca actatggcta 1800 ctgttcctac tgcccctcaa atggcactaa cggaacagta gataaaatta aaaaatacag 1860 agaccaaaga tttagatggc ttacagaaat gccagtacct aacacctgtc acatacatgc 1920 caccttcgcc cgaggcacta ttaaatactg ggagtaccac ctaggctggt actcaaacat 1980 atttattggc aacctcagac acaacttagc cttcagacca gcctacatag acattaccta 2040 caatcccatc actgacaaag gagagggcaa cattatctgg ttccagtacc tcactaagcc 2100 caccacagaa tacatagaaa cccaggcaaa atgcaccatt actaacattc ccctttatgc 2160 tgctttctat ggctacgaag actacctcca gagaacacta ggcccctacc aagatgtaga 2220 aaccctaggc ataatctgtg ttaaatgtcc ctacacagat ccccctctag ttcacaaaga 2280 caaaagtaaa accaactggg gctacgtatt ctacgacgcc cactttggca acggaaagac 2340 cccagaggga ctaggccaag tacaccctta ctggatgcag agatggagac cctatgtaca 2400 gtttcaaaaa gacaccatgc acaaaatatc cagaacggga cccttcagct acagagacga 2460 cacgccttcc atcaccctca ctgccgaata caagtttcgt tttaactggg ggggcgactc 2520 tatatttcca cagattatta aaaacccctg cccagacacc ggggttcgac cttcaaccgg 2580 tagagaccgt cgctcagtac aagtcgttag cccgctcaca atgggacccc agtttatatt 2640 ccactcatgg gactggagac gggggttctt taatcaaaaa actctcaaaa gaatgcttga 2700 aaaaccagtt aatgatggag aatatccaac aggcccaaag gtgcctcgat ggtttccccc 2760 actcgacaac caagagcaag aaggcgtctc agatacagag acgacaacct cgcagtcctc 2820 gcaagaagaa gccgctcaag aagccctcca agaagtccaa gaggcgtcgc tacagcagca 2880 cctcctccag cagtaccgag agcagcgaag aatcggaaag caactccaac tcgtcatgct 2940 ccaactcacc aagacgcaga gcaacctgca cataaatccc cgtgtccttg gccatgcata 3000 aataaagtgt acatgtttcc ccccgaaaag ccaatgccca tacacggcta ccacgggtgg 3060 gagacagagt atcaggcctg caaggccttt gacaggcccc ctagaaacta cctatcagac 3120 aaacccatct acccctggct tccccgctcc caaccagaat ttaaagtgag ttttaagctt 3180 ggctgtcaat aaacaagnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnngttta 3660 cacaaaatgg tggccaagtc cttccgggtg aaaggtcggc gcctacgtca taagtcacgt 3720 ggggagggct gcgtcacaac caggaagcaa tcctcaccac gtgatttgtc acgtgatcgc 3780 tacgtcacgg ccgccatttt agtttacaaa atggcggact tccttcctct ttttcaaaaa 3840 taacggccct gcggcggcgc gcgcgctgcg cgcgcgcgcc gggggctgcc gcccca 3896 <210> 871 <211> 121 <212> PRT <213> Torque teno virus <400> 871 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Gln Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ala Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Ile Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu 115 120 <210> 872 <211> 267 <212> PRT <213> Torque teno virus <400> 872 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Gln Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ala Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Ile Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu Leu Leu Lys Thr Pro Ala Gln 115 120 125 Thr Pro Gly Phe Asp Leu Gln Pro Val Glu Thr Val Ala Gln Tyr Lys 130 135 140 Ser Leu Ala Arg Ser Gln Trp Asp Pro Ser Leu Tyr Ser Thr His Gly 145 150 155 160 Thr Gly Asp Gly Gly Ser Leu Ile Lys Lys Leu Ser Lys Glu Cys Leu 165 170 175 Lys Asn Gln Leu Met Met Glu Asn Ile Gln Gln Ala Gln Arg Cys Leu 180 185 190 Asp Gly Phe Pro His Ser Thr Thr Lys Ser Lys Lys Ala Ser Gln Ile 195 200 205 Gln Arg Arg Gln Pro Arg Ser Pro Arg Lys Lys Lys Pro Leu Lys Lys 210 215 220 Pro Ser Lys Lys Ser Lys Arg Arg Arg Tyr Ser Ser Thr Ser Ser Ser 225 230 235 240 Ser Thr Glu Ser Ser Glu Glu Ser Glu Ser Asn Ser Asn Ser Ser Cys 245 250 255 Ser Asn Ser Pro Arg Arg Arg Ala Thr Cys Thr 260 265 <210> 873 <211> 277 <212> PRT <213> Torque teno virus <400> 873 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Gln Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ala Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Ile Thr Val Leu Ala Gly Arg Tyr Gly Ala Pro 35 40 45 Pro Arg Pro Pro Ala Pro Gly Ala Pro Arg Pro Pro Leu Ile Arg Gln 50 55 60 Leu Ala Leu Pro Ala Pro Pro Ala Asp Pro Gln Gln Ala Asn Pro Gln 65 70 75 80 Trp Pro Gly Gly Asp Gly Gly Glu Asp Gly Ala Gly Gly Pro Ala Ala 85 90 95 Gly Gly Ala Val Ala Asp Ala Glu Tyr Gln Glu Asp Glu Leu Asn Ala 100 105 110 Leu Phe Asp Ala Val Glu Gln Glu Glu Ile Ser Asn Arg Pro Lys Gly 115 120 125 Ala Ser Met Val Ser Pro Thr Arg Gln Pro Arg Ala Arg Arg Arg Leu 130 135 140 Arg Tyr Arg Asp Asp Asn Leu Ala Val Leu Ala Arg Arg Ser Arg Ser 145 150 155 160 Arg Ser Pro Pro Arg Ser Pro Arg Gly Val Ala Thr Ala Ala Pro Pro 165 170 175 Pro Ala Val Pro Arg Ala Ala Lys Asn Arg Lys Ala Thr Pro Thr Arg 180 185 190 His Ala Pro Thr His Gln Asp Ala Glu Gln Pro Ala His Lys Ser Pro 195 200 205 Cys Pro Trp Pro Cys Ile Asn Lys Val Tyr Met Phe Pro Pro Glu Lys 210 215 220 Pro Met Pro Ile His Gly Tyr His Gly Trp Glu Thr Glu Tyr Gln Ala 225 230 235 240 Cys Lys Ala Phe Asp Arg Pro Pro Arg Asn Tyr Leu Ser Asp Lys Pro 245 250 255 Ile Tyr Pro Trp Leu Pro Arg Ser Gln Pro Glu Phe Lys Val Ser Phe 260 265 270 Lys Leu Gly Cys Gln 275 <210> 874 <211> 200 <212> PRT <213> Torque teno virus <400> 874 Met Ser Trp Arg Pro Pro Val His Asn Pro Asn Gly Ile Gln Arg Asn 1 5 10 15 Leu Trp Glu Ala Phe Phe Arg Met His Ala Ala Ala Cys Gly Cys Gly 20 25 30 Asp Leu Val Gly His Ile Thr Val Leu Ala Gly Arg Ile Ser Asn Arg 35 40 45 Pro Lys Gly Ala Ser Met Val Ser Pro Thr Arg Gln Pro Arg Ala Arg 50 55 60 Arg Arg Leu Arg Tyr Arg Asp Asp Asn Leu Ala Val Leu Ala Arg Arg 65 70 75 80 Ser Arg Ser Arg Ser Pro Pro Arg Ser Pro Arg Gly Val Ala Thr Ala 85 90 95 Ala Pro Pro Pro Ala Val Pro Arg Ala Ala Lys Asn Arg Lys Ala Thr 100 105 110 Pro Thr Arg His Ala Pro Thr His Gln Asp Ala Glu Gln Pro Ala His 115 120 125 Lys Ser Pro Cys Pro Trp Pro Cys Ile Asn Lys Val Tyr Met Phe Pro 130 135 140 Pro Glu Lys Pro Met Pro Ile His Gly Tyr His Gly Trp Glu Thr Glu 145 150 155 160 Tyr Gln Ala Cys Lys Ala Phe Asp Arg Pro Pro Arg Asn Tyr Leu Ser 165 170 175 Asp Lys Pro Ile Tyr Pro Trp Leu Pro Arg Ser Gln Pro Glu Phe Lys 180 185 190 Val Ser Phe Lys Leu Gly Cys Gln 195 200 <210> 875 <211> 765 <212> PRT <213> Torque teno virus <400> 875 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Val Arg Arg Arg Arg Trp Gly 35 40 45 Arg Arg Arg Trp Arg Arg Gly Tyr Arg Arg Arg Leu Arg Leu Arg Arg 50 55 60 Arg Arg Arg Arg Lys Lys Ile Arg Leu Thr Gln Trp Asn Pro Ala Lys 65 70 75 80 Val Arg Arg Cys Thr Ile Lys Gly Val Leu Pro Met Ile Leu Cys Gly 85 90 95 Ala Gly Arg Ser Gly Phe Asn Tyr Gly Leu His Ser Asp Asp Tyr Thr 100 105 110 Val Gln Lys Pro Leu Gly Gln Asn Pro His Gly Gly Gly Met Ser Thr 115 120 125 Val Thr Phe Ser Leu Gln Val Leu Phe Asp Gln Tyr Gln Arg Phe Met 130 135 140 Asn Arg Trp Ser Tyr Ser Asn Asp Gln Leu Asp Leu Ala Arg Tyr Phe 145 150 155 160 Gly Cys Thr Phe Tyr Phe Tyr Arg His Pro Glu Ile Asp Phe Val Ala 165 170 175 Gln Tyr Asp Asn Val Pro Pro Met Lys Met Asp Glu Asn Thr Ala Pro 180 185 190 Asn Thr His Pro Ser Phe Leu Leu Gln Asn Lys Arg Lys Ile Lys Ile 195 200 205 Pro Ser Phe Lys Thr Lys Pro Phe Gly Arg Lys Arg Val Lys Val Thr 210 215 220 Val Gly Pro Pro Lys Leu Phe Glu Asp Lys Trp Tyr Ser Gln His Asp 225 230 235 240 Leu Cys Lys Val Pro Leu Val Ser Trp Arg Leu Thr Ala Cys Asp Phe 245 250 255 Arg Phe Pro Phe Cys Ser Pro Leu Thr Asp Asn Pro Cys Tyr Thr Phe 260 265 270 Gln Val Leu His Glu Asn Tyr Tyr Pro Val Ile Gly Thr Ser Ser Leu 275 280 285 Glu Asn Gly Thr Asn Tyr Asn Asn Thr Ala Ile Thr Thr Leu Glu Thr 290 295 300 Trp Leu Tyr Gly Lys Cys Thr His Tyr Gln Thr Phe Ala Thr Asp Thr 305 310 315 320 Arg Leu Asn Pro Gln Arg Pro Val Ser Ser Ser Asn Ala Asn Glu Thr 325 330 335 Tyr Thr Pro Ser Gly Ser Lys Glu Ser Ile Ile Trp Gly Gln Ser Asp 340 345 350 Trp Ala Asn Phe Lys Lys Asn Thr Asp Ser Asn Tyr Gly Tyr Cys Ser 355 360 365 Tyr Cys Pro Ser Asn Gly Thr Asn Gly Thr Val Asp Lys Ile Lys Lys 370 375 380 Tyr Arg Asp Gln Arg Phe Arg Trp Leu Thr Glu Met Pro Val Pro Asn 385 390 395 400 Thr Cys His Ile His Ala Thr Phe Ala Arg Gly Thr Ile Lys Tyr Trp 405 410 415 Glu Tyr His Leu Gly Trp Tyr Ser Asn Ile Phe Ile Gly Asn Leu Arg 420 425 430 His Asn Leu Ala Phe Arg Pro Ala Tyr Ile Asp Ile Thr Tyr Asn Pro 435 440 445 Ile Thr Asp Lys Gly Glu Gly Asn Ile Ile Trp Phe Gln Tyr Leu Thr 450 455 460 Lys Pro Thr Thr Glu Tyr Ile Glu Thr Gln Ala Lys Cys Thr Ile Thr 465 470 475 480 Asn Ile Pro Leu Tyr Ala Ala Phe Tyr Gly Tyr Glu Asp Tyr Leu Gln 485 490 495 Arg Thr Leu Gly Pro Tyr Gln Asp Val Glu Thr Leu Gly Ile Ile Cys 500 505 510 Val Lys Cys Pro Tyr Thr Asp Pro Pro Leu Val His Lys Asp Lys Ser 515 520 525 Lys Thr Asn Trp Gly Tyr Val Phe Tyr Asp Ala His Phe Gly Asn Gly 530 535 540 Lys Thr Pro Glu Gly Leu Gly Gln Val His Pro Tyr Trp Met Gln Arg 545 550 555 560 Trp Arg Pro Tyr Val Gln Phe Gln Lys Asp Thr Met His Lys Ile Ser 565 570 575 Arg Thr Gly Pro Phe Ser Tyr Arg Asp Asp Thr Pro Ser Ile Thr Leu 580 585 590 Thr Ala Glu Tyr Lys Phe Arg Phe Asn Trp Gly Gly Asp Ser Ile Phe 595 600 605 Pro Gln Ile Ile Lys Asn Pro Cys Pro Asp Thr Gly Val Arg Pro Ser 610 615 620 Thr Gly Arg Asp Arg Arg Ser Val Gln Val Val Ser Pro Leu Thr Met 625 630 635 640 Gly Pro Gln Phe Ile Phe His Ser Trp Asp Trp Arg Arg Gly Phe Phe 645 650 655 Asn Gln Lys Thr Leu Lys Arg Met Leu Glu Lys Pro Val Asn Asp Gly 660 665 670 Glu Tyr Pro Thr Gly Pro Lys Val Pro Arg Trp Phe Pro Pro Leu Asp 675 680 685 Asn Gln Glu Gln Glu Gly Val Ser Asp Thr Glu Thr Thr Thr Ser Gln 690 695 700 Ser Ser Gln Glu Glu Ala Ala Gln Glu Ala Leu Gln Glu Val Gln Glu 705 710 715 720 Ala Ser Leu Gln Gln His Leu Leu Gln Gln Tyr Arg Glu Gln Arg Arg 725 730 735 Ile Gly Lys Gln Leu Gln Leu Val Met Leu Gln Leu Thr Lys Thr Gln 740 745 750 Ser Asn Leu His Ile Asn Pro Arg Val Leu Gly His Ala 755 760 765 <210> 876 <211> 196 <212> PRT <213> Torque teno virus <400> 876 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Ile Ile Lys Asn Pro Cys Pro 35 40 45 Asp Thr Gly Val Arg Pro Ser Thr Gly Arg Asp Arg Arg Ser Val Gln 50 55 60 Val Val Ser Pro Leu Thr Met Gly Pro Gln Phe Ile Phe His Ser Trp 65 70 75 80 Asp Trp Arg Arg Gly Phe Phe Asn Gln Lys Thr Leu Lys Arg Met Leu 85 90 95 Glu Lys Pro Val Asn Asp Gly Glu Tyr Pro Thr Gly Pro Lys Val Pro 100 105 110 Arg Trp Phe Pro Pro Leu Asp Asn Gln Glu Gln Glu Gly Val Ser Asp 115 120 125 Thr Glu Thr Thr Thr Ser Gln Ser Ser Gln Glu Glu Ala Ala Gln Glu 130 135 140 Ala Leu Gln Glu Val Gln Glu Ala Ser Leu Gln Gln His Leu Leu Gln 145 150 155 160 Gln Tyr Arg Glu Gln Arg Arg Ile Gly Lys Gln Leu Gln Leu Val Met 165 170 175 Leu Gln Leu Thr Lys Thr Gln Ser Asn Leu His Ile Asn Pro Arg Val 180 185 190 Leu Gly His Ala 195 <210> 877 <211> 125 <212> PRT <213> Torque teno virus <400> 877 Met Ala Trp Trp Gly Arg Trp Arg Arg Trp Arg Trp Arg Pro Arg Arg 1 5 10 15 Trp Arg Arg Arg Arg Arg Arg Arg Val Pro Arg Arg Arg Ala Gln Arg 20 25 30 Pro Val Arg Arg Arg Arg Ala Arg Arg Asn Ile Gln Gln Ala Gln Arg 35 40 45 Cys Leu Asp Gly Phe Pro His Ser Thr Thr Lys Ser Lys Lys Ala Ser 50 55 60 Gln Ile Gln Arg Arg Gln Pro Arg Ser Pro Arg Lys Lys Lys Pro Leu 65 70 75 80 Lys Lys Pro Ser Lys Lys Ser Lys Arg Arg Arg Tyr Ser Ser Thr Ser 85 90 95 Ser Ser Ser Thr Glu Ser Ser Glu Glu Ser Glu Ser Asn Ser Asn Ser 100 105 110 Ser Cys Ser Asn Ser Pro Arg Arg Arg Ala Thr Cys Thr 115 120 125 <210> 878 <211> 3264 <212> DNA <213> Torque teno midi virus <400> 878 taaaatggcg gcaaccaatc attttatact ttcactttcc aattacaagc cgccacgtca 60 cagaacaggg gtggagactt taaaactata taaccaagtg atgtgacgaa tggctgagtt 120 taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgcccg 180 tgggcgggag cccgaggtga gtgaaaccac cgaggtctag gggcaattcg ggctagggca 240 gtctagcgga acgggcaaga aacttaaaat atgttttgtt tcagatgcag acacctgctt 300 cacagataag ctcagacgac ttctttgtac acactccatt taatgcagta actaaacagc 360 aaatatggat gtctcaaatt gctgatggac atgacaacat ttgtcactgc caccgtcctt 420 ttgctcacct gcttgctaat atttttcctc ctggtcataa agacagggat cttaccatta 480 atcaaatact tgctagagat cttacagaaa catgccattc tggtggagac gaaggaacaa 540 gcggtggtgg ggtcgccgct tccgctaccg ccgctacaac aaatataaaa ccagaaggag 600 acgcagaata cccagaagac gaaatagaag atttactaag acacgcagga gaagaaaaag 660 aaagaaggta agaagaaaac ttaaaaaaat tactattaaa caatggcagc cagattcagt 720 gaaaaaatgt aaaattaaag gatatagtac tttagttatg ggtgcacaag gaaaacaata 780 caactgttac acaaaccaag caagtgacta tgttcagcct aaagcaccac aaggtggggg 840 ctttggctgt gaagtattta atttaaaatg gctataccaa gaatatactg cacacagaaa 900 tatttggaca aaaacaaatg aatatacaga cctttgtaga tacactggag ctcaaataat 960 tttatacagg cacccagatg ttgattttat agtcagctgg gacaatcagc cacctttttt 1020 acttaacaaa tatacatatc cagaactgca accacaaaac cttttactag ctagaaggaa 1080 aagaattatt cttagtcaaa aatcaaaccc caaaggaaaa ctaagaatta aactaagaat 1140 accaccacca aaacaaatga taacaaaatg gttttttcaa agagactttt gtgatgtgaa 1200 tctgtttaaa ctatgtgctt ctgctgcttc tttccgctac ccaggtatca gtcatggagc 1260 tcaaagtact attttttctg catatgcttt aaacactgac ttttatcaat gcagtgactg 1320 gtgccaaact aacacagaaa ctggctacct aaacattaaa acacaacaaa tgccactatg 1380 gtttcattac agagagggtg gcaaagagaa atggtataaa tacaccaaca aagaacacag 1440 accatataca aatacatatc ttaaaagtat tagctataat gatggattgt tttctcctaa 1500 agccatgttt gcatttgaag taaaagcggg gggtgaagga acaacagaac caccacaagg 1560 cgcccaatta attgctaacc ttccactcat tgcactaaga tataatccac atgaagacac 1620 aggccatggc aatgaaattt accttacatc aacttttaaa ggtacatatg acaaacctaa 1680 agttactgat gctctatact ttaacaatgt acccctgtgg atgggatttt atggctactg 1740 ggactttata ttacaagaaa caaaaaacaa aggtgtcttt gatcaacata tgtttgttgt 1800 taaatgtcct gccttaaggc ccatatcaca agtcacaaaa caagtatact acccacttgt 1860 agacatggac ttttgttcag ggagactgcc atttgatgaa tatttatcca aagacattaa 1920 aagtcattgg tatcccactg cagaaagaca aacagttaca ataaataatt ttgttacagc 1980 aggtccatac atgcctaaat ttgaacccac agacaaagac agtacatggc aattaaacta 2040 tcactataaa ttttttttta agtggggtgg tccacaagtc acagacccaa ctgttgaaga 2100 cccatgcagc agaaacaaat atcctgtccc cgatacaatg caacaaacaa tacaaattaa 2160 aaaccctgaa aagctgcacc cagcaaccct cttccatgac tgggacctta gaaggggctt 2220 cattacacaa gcagctatta aaagaatgtc agaaaacctc caaattgatt catctttcga 2280 atctgatggc acagaatcac ccaaaaaaaa gaaaagatgc accaaagaaa tcccaacaca 2340 aaaccaaaag caagaagaga tccaagaatg tctcctctca ctctgcgaag agcctacatg 2400 ccaagaagaa acagaggacc tccagctctt catccagcag cagcagcagc agcagtacaa 2460 gctcagaaaa aacctcttca aactcctcac tcacctgaaa aaaggacaga gaataagtca 2520 actacaaacg ggacttttag agtaatacca tttaaaccag gttttgaaca agaaacagaa 2580 aaagaacttg ccatagcttt ctgcagacca cctagaaaat ataaaaatga tccccctttt 2640 tatccctggt taccatggac accccttgta cactttaacc ttaattacaa aggctaggcc 2700 aacactgttc acttagtggt gtatgtttaa taaagtttca cccccaaaaa aaaaaaaaaa 2760 aaaaaaaaaa aaaaaaaaaa taaaaaattg caaaaattcg gcgctcgcgc gcgctgcgcg 2820 cgcgcgagcg ccgtcacgcg ccggcgctcg cgcgccgcgc gtatgtgcta acacaccacg 2880 cacctagatt ggggtgcgcg cgctagcgcg cgcaccccaa tgcgccccgc cctcgttccg 2940 acccgcttgc gcgggtcgga ccacttcggg ctcggggggg cgcgcctgcg gcgctttttt 3000 actaaacaga ctccgagccg ccatttggcc ccccctaagc tccgcccccc tcatgaatat 3060 tcataaagga aaccacataa ttagaattgc cgaccacaaa ctgccatatg ctaattagtt 3120 ccccttttac acagtaaaaa ggggaagtgg gggggcatag cccccccaca ccccccgcgg 3180 ggggggcaga gccccccccc gcaccccccc cctacgtcac aatccacgcc cccgccgcca 3240 tcttgggtgc ggcagggcgg gggc 3264 <210> 879 <211> 128 <212> PRT <213> Torque teno midi virus <400> 879 Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His 1 5 10 15 Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile 20 25 30 Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His 35 40 45 Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr 50 55 60 Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly 65 70 75 80 Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala 85 90 95 Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp 100 105 110 Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Arg 115 120 125 <210> 880 <211> 272 <212> PRT <213> Torque teno midi virus <400> 880 Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His 1 5 10 15 Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile 20 25 30 Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His 35 40 45 Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr 50 55 60 Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly 65 70 75 80 Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala 85 90 95 Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp 100 105 110 Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Ser 115 120 125 Gly Val Val His Lys Ser Gln Thr Gln Leu Leu Lys Thr His Ala Ala 130 135 140 Glu Thr Asn Ile Leu Ser Pro Ile Gln Cys Asn Lys Gln Tyr Lys Leu 145 150 155 160 Lys Thr Leu Lys Ser Cys Thr Gln Gln Pro Ser Ser Met Thr Gly Thr 165 170 175 Leu Glu Gly Ala Ser Leu His Lys Gln Leu Leu Lys Glu Cys Gln Lys 180 185 190 Thr Ser Lys Leu Ile His Leu Ser Asn Leu Met Ala Gln Asn His Pro 195 200 205 Lys Lys Arg Lys Asp Ala Pro Lys Lys Ser Gln His Lys Thr Lys Ser 210 215 220 Lys Lys Arg Ser Lys Asn Val Ser Ser His Ser Ala Lys Ser Leu His 225 230 235 240 Ala Lys Lys Lys Gln Arg Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser 245 250 255 Ser Ser Ser Thr Ser Ser Glu Lys Thr Ser Ser Asn Ser Ser Leu Thr 260 265 270 <210> 881 <211> 261 <212> PRT <213> Torque teno midi virus <400> 881 Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His 1 5 10 15 Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile 20 25 30 Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His 35 40 45 Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr 50 55 60 Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly 65 70 75 80 Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala 85 90 95 Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp 100 105 110 Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Arg 115 120 125 Ile Thr Gln Lys Lys Glu Lys Met His Gln Arg Asn Pro Asn Thr Lys 130 135 140 Pro Lys Ala Arg Arg Asp Pro Arg Met Ser Pro Leu Thr Leu Arg Arg 145 150 155 160 Ala Tyr Met Pro Arg Arg Asn Arg Gly Pro Pro Ala Leu His Pro Ala 165 170 175 Ala Ala Ala Ala Ala Val Gln Ala Gln Lys Lys Pro Leu Gln Thr Pro 180 185 190 His Ser Pro Glu Lys Arg Thr Glu Asn Lys Ser Thr Thr Asn Gly Thr 195 200 205 Phe Arg Val Ile Pro Phe Lys Pro Gly Phe Glu Gln Glu Thr Glu Lys 210 215 220 Glu Leu Ala Ile Ala Phe Cys Arg Pro Pro Arg Lys Tyr Lys Asn Asp 225 230 235 240 Pro Pro Phe Tyr Pro Trp Leu Pro Trp Thr Pro Leu Val His Phe Asn 245 250 255 Leu Asn Tyr Lys Gly 260 <210> 882 <211> 67 <212> PRT <213> Torque teno midi virus <400> 882 Met Asp Met Thr Thr Phe Val Thr Ala Thr Val Leu Leu Leu Thr Cys 1 5 10 15 Leu Leu Ile Phe Phe Leu Leu Val Ile Lys Thr Gly Ile Leu Pro Leu 20 25 30 Ile Lys Tyr Leu Leu Glu Ile Leu Gln Lys His Ala Ile Leu Val Glu 35 40 45 Thr Lys Glu Gln Ala Val Val Gly Ser Pro Leu Pro Leu Pro Pro Leu 50 55 60 Gln Gln Ile 65 <210> 883 <211> 677 <212> PRT <213> Torque teno midi virus <400> 883 Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg 1 5 10 15 Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg 20 25 30 Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg 35 40 45 Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys Ile Thr Ile Lys Gln 50 55 60 Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile Lys Gly Tyr Ser Thr 65 70 75 80 Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn Cys Tyr Thr Asn Gln 85 90 95 Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln Gly Gly Gly Phe Gly 100 105 110 Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln Glu Tyr Thr Ala His 115 120 125 Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr Asp Leu Cys Arg Tyr 130 135 140 Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro Asp Val Asp Phe Ile 145 150 155 160 Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu Asn Lys Tyr Thr Tyr 165 170 175 Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala Arg Arg Lys Arg Ile 180 185 190 Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys Leu Arg Ile Lys Leu 195 200 205 Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys Trp Phe Phe Gln Arg 210 215 220 Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys Ala Ser Ala Ala Ser 225 230 235 240 Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln Ser Thr Ile Phe Ser 245 250 255 Ala Tyr Ala Leu Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln 260 265 270 Thr Asn Thr Glu Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro 275 280 285 Leu Trp Phe His Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr 290 295 300 Thr Asn Lys Glu His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile 305 310 315 320 Ser Tyr Asn Asp Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu 325 330 335 Val Lys Ala Gly Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln 340 345 350 Leu Ile Ala Asn Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu 355 360 365 Asp Thr Gly His Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly 370 375 380 Thr Tyr Asp Lys Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val 385 390 395 400 Pro Leu Trp Met Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu 405 410 415 Thr Lys Asn Lys Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys 420 425 430 Pro Ala Leu Arg Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro 435 440 445 Leu Val Asp Met Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr 450 455 460 Leu Ser Lys Asp Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln 465 470 475 480 Thr Val Thr Ile Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys 485 490 495 Phe Glu Pro Thr Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr 500 505 510 Lys Phe Phe Phe Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val 515 520 525 Glu Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln 530 535 540 Gln Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu 545 550 555 560 Phe His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile 565 570 575 Lys Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp 580 585 590 Gly Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro 595 600 605 Thr Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu 610 615 620 Cys Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe 625 630 635 640 Ile Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe 645 650 655 Lys Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln 660 665 670 Thr Gly Leu Leu Glu 675 <210> 884 <211> 212 <212> PRT <213> Torque teno midi virus <400> 884 Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg 1 5 10 15 Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg 20 25 30 Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg 35 40 45 Lys Arg Lys Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val Glu 50 55 60 Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln Gln 65 70 75 80 Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu Phe 85 90 95 His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile Lys 100 105 110 Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp Gly 115 120 125 Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro Thr 130 135 140 Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu Cys 145 150 155 160 Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe Ile 165 170 175 Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe Lys 180 185 190 Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln Thr 195 200 205 Gly Leu Leu Glu 210 <210> 885 <211> 119 <212> PRT <213> Torque teno midi virus <400> 885 Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg 1 5 10 15 Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg 20 25 30 Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg 35 40 45 Lys Arg Lys Lys Asn His Pro Lys Lys Arg Lys Asp Ala Pro Lys Lys 50 55 60 Ser Gln His Lys Thr Lys Ser Lys Lys Arg Ser Lys Asn Val Ser Ser 65 70 75 80 His Ser Ala Lys Ser Leu His Ala Lys Lys Lys Gln Arg Thr Ser Ser 85 90 95 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser Ser Glu Lys Thr 100 105 110 Ser Ser Asn Ser Ser Leu Thr 115 <210> 886 <211> 3176 <212> DNA <213> Torque teno midi virus <400> 886 taaaatggcg ggagccaatc attttatact ttcactttcc aattaaaaat ggccacgtca 60 caaacaaggg gtggagccat ttaaactata taactaagtg gggtggcgaa tggctgagtt 120 taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgccca 180 tgggcgggag ccgaggtgag tgaaaccacc gaggtctagg ggcaattcgg gctagggcag 240 tctagcggaa cgggcaagaa acttaaaaca atatttgttt tacagatggt tagtatatcc 300 tcaagtgatt tttttaagaa aacgaaattt aatgaggaga cgcagaacca agtatggatg 360 tctcaaattg ctgactctca tgataatatc tgcagttgct ggcatccatt tgctcacctt 420 cttgcttcca tatttcctcc tggccacaaa gatcgtgatc ttactattaa ccaaattctt 480 ctaagagatt ataaagaaaa atgccattct ggtggagaag aaggagaaaa ttctggacca 540 acaacaggtt taattacacc aaaagaagaa gatatagaaa aagatggccc agaaggcgcc 600 gcagaagaag accatacaga cgccctgttc gccgccgccg tagaaaactt cgaaaggtaa 660 agagaaaaaa aaaatcttta attgttagac aatggcaacc agacagtata agaacttgta 720 aaattatagg acagtcagct atagttgttg gggctgaagg aaagcaaatg tactgttata 780 ctgtcaataa gttaattaat gtgcccccaa aaacaccata tgggggaggc tttggagtag 840 accaatacac actgaaatac ttatatgaag aatacagatt tgcacaaaac atttggacac 900 aatctaatgt actgaaagac ttatgcagat acataaatgt taagctaata ttctacagag 960 acaacaaaac agactttgtc ctttcctatg acagaaaccc accttttcaa ctaacaaaat 1020 ttacataccc aggagcacac ccacaacaaa tcatgcttca aaaacaccac aaattcatac 1080 tatcacaaat gacaaagcct aatggaagac taacaaaaaa actcaaaatt aaacctccta 1140 aacaaatgct ttctaaatgg ttcttttcaa aacaattctg taaataccct ttactatctc 1200 ttaaagcttc tgcactagac cttaggcact cttacctagg ctgctgtaat gaaaatccac 1260 aggtattttt ttattattta aaccatggat actacacaat aacaaactgg ggagcacaat 1320 cctcaacagc atacagacct aactccaagg tgacagacac aacatactac agatacaaaa 1380 atgacagaaa aaatattaac attaaaagcc atgaatacga aaaaagtata tcatatgaaa 1440 acggttattt tcaatctagt ttcttacaaa cacagtgcat atataccagt gagcgtggtg 1500 aagcctgtat agcagaaaaa ccactaggaa tagctattta caatccagta aaagacaatg 1560 gagatggtaa tatgatatac cttgtaagca ctctagcaaa cacttgggac cagcctccaa 1620 aagacagtgc tattttaata caaggagtac ccatatggct aggcttattt ggatatttag 1680 actactgtag acaaattaaa gctgacaaaa catggctaga cagtcatgta ctagtaattc 1740 aaagtcctgc tatttttact tacccaaatc caggagcagg caaatggtat tgtccactat 1800 cacaaagttt tataaatggc aatggtccgt ttaatcaacc acctacactg ctacaaaaag 1860 caaagtggtt tccacaaata caataccaac aagaaattat taatagcttt gtagaatcag 1920 gaccatttgt tcccaaatat gcaaatcaaa ctgaaagcaa ctgggaacta aaatataaat 1980 atgtttttac atttaagtgg ggtggaccac aattccatga accagaaatt gctgacccta 2040 gcaaacaaga gcagtatgat gtccccgata ctttctacca aacaatacaa attgaagatc 2100 cagaaggaca agaccccaga tctctcatcc atgattggga ctacagacga ggctttatta 2160 aagaaagatc tcttaaaaga atgtcaactt acttctcaac tcatacagat cagcaagcaa 2220 cttcagagga agacattccc aaaaagaaaa agagaattgg accccaactc acagtcccac 2280 aacaaaaaga agaggagaca ctgtcatgtc tcctctctct ctgcaaaaaa gataccttcc 2340 aagaaacaga gacacaagaa gacctccagc agctcatcaa gcagcagcag gagcagcagc 2400 tcctcctcaa gagaaacatc ctccagctca tccacaaact aaaagagaat caacaaatgc 2460 ttcagcttca cacaggcatg ttaccttaac cagatttaaa cctggatttg aagagcaaac 2520 agagagagaa ttagcaatta tatttcatag gccccctaga acctacaaag aggaccttcc 2580 attctatccc tggctaccac ctgcacccct tgtacaattt aaccttaact tcaaaggcta 2640 ggccaacaat gtacacttag taaagcatgt ttattaaagc acaaccccca aaataaatgt 2700 aaaaataaaa aaaaaaaaaa aaaaataaaa aattgcaaaa attcggcgct cgcgcgcatg 2760 tgcgcctctg gcgcaaatca cgcaacgctc gcgcgcccgc gtatgtctct ttaccacgca 2820 cctagattgg ggtgcgcgcg ctagcgcgcg caccccaatg cgccccgccc tcgttccgac 2880 ccgcttgcgc gggtcggacc acttcgggct cgggggggcg cgcctgcggc gcttttttac 2940 taaacagact ccgagccgcc atttggcccc ctaagctccg cccccctcat gaatattcat 3000 aaaggaaacc acataattag aattgccgac cacaaactgc catatgctaa ttagttcccc 3060 ttttacaaag taaaagggga agtgaacata gccccacacc cgcaggggca aggccccgca 3120 cccctacgtc actaaccacg cccccgccgc catcttgggt gcggcagggc gggggc 3176 <210> 887 <211> 124 <212> PRT <213> Torque teno midi virus <400> 887 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg 115 120 <210> 888 <211> 271 <212> PRT <213> Torque teno midi virus <400> 888 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Ser Gly Val Asp His 115 120 125 Asn Ser Met Asn Gln Lys Leu Leu Thr Leu Ala Asn Lys Ser Ser Met 130 135 140 Met Ser Pro Ile Leu Ser Thr Lys Gln Tyr Lys Leu Lys Ile Gln Lys 145 150 155 160 Asp Lys Thr Pro Asp Leu Ser Ser Met Ile Gly Thr Thr Asp Glu Ala 165 170 175 Leu Leu Lys Lys Asp Leu Leu Lys Glu Cys Gln Leu Thr Ser Gln Leu 180 185 190 Ile Gln Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys Arg Lys 195 200 205 Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys Arg Arg 210 215 220 His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser Lys Lys 225 230 235 240 Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser Arg Ser 245 250 255 Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr Asn 260 265 270 <210> 889 <211> 267 <212> PRT <213> Torque teno midi virus <400> 889 Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn 1 5 10 15 Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His 20 25 30 Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser 35 40 45 Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile 50 55 60 Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly 65 70 75 80 Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp 85 90 95 Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp 100 105 110 Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg Ser Ala Ser Asn 115 120 125 Phe Arg Gly Arg His Ser Gln Lys Glu Lys Glu Asn Trp Thr Pro Thr 130 135 140 His Ser Pro Thr Thr Lys Arg Arg Gly Asp Thr Val Met Ser Pro Leu 145 150 155 160 Ser Leu Gln Lys Arg Tyr Leu Pro Arg Asn Arg Asp Thr Arg Arg Pro 165 170 175 Pro Ala Ala His Gln Ala Ala Ala Gly Ala Ala Ala Pro Pro Gln Glu 180 185 190 Lys His Pro Pro Ala His Pro Gln Thr Lys Arg Glu Ser Thr Asn Ala 195 200 205 Ser Ala Ser His Arg His Val Thr Leu Thr Arg Phe Lys Pro Gly Phe 210 215 220 Glu Glu Gln Thr Glu Arg Glu Leu Ala Ile Ile Phe His Arg Pro Pro 225 230 235 240 Arg Thr Tyr Lys Glu Asp Leu Pro Phe Tyr Pro Trp Leu Pro Pro Ala 245 250 255 Pro Leu Val Gln Phe Asn Leu Asn Phe Lys Gly 260 265 <210> 890 <211> 50 <212> PRT <213> Torque teno midi virus <400> 890 Met Arg Arg Arg Arg Thr Lys Tyr Gly Cys Leu Lys Leu Leu Thr Leu 1 5 10 15 Met Ile Ile Ser Ala Val Ala Gly Ile His Leu Leu Thr Phe Leu Leu 20 25 30 Pro Tyr Phe Leu Leu Ala Thr Lys Ile Val Ile Leu Leu Leu Thr Lys 35 40 45 Phe Phe 50 <210> 891 <211> 662 <212> PRT <213> Torque teno midi virus <400> 891 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln 50 55 60 Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala 65 70 75 80 Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn 85 90 95 Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly 100 105 110 Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala 115 120 125 Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr 130 135 140 Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val 145 150 155 160 Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr 165 170 175 Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe 180 185 190 Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu 195 200 205 Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys 210 215 220 Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp 225 230 235 240 Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe 245 250 255 Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala 260 265 270 Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr 275 280 285 Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His 290 295 300 Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser 305 310 315 320 Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys 325 330 335 Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp 340 345 350 Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr 355 360 365 Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro 370 375 380 Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys 385 390 395 400 Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro 405 410 415 Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro 420 425 430 Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro 435 440 445 Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln 450 455 460 Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr 465 470 475 480 Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe 485 490 495 Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp 500 505 510 Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr 515 520 525 Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His 530 535 540 Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg 545 550 555 560 Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu 565 570 575 Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val 580 585 590 Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys 595 600 605 Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln 610 615 620 Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile 625 630 635 640 Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu 645 650 655 His Thr Gly Met Leu Pro 660 <210> 892 <211> 215 <212> PRT <213> Torque teno midi virus <400> 892 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala 50 55 60 Asp Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln 65 70 75 80 Thr Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile 85 90 95 His Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys 100 105 110 Arg Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser 115 120 125 Glu Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr 130 135 140 Val Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu 145 150 155 160 Cys Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln 165 170 175 Gln Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn 180 185 190 Ile Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln 195 200 205 Leu His Thr Gly Met Leu Pro 210 215 <210> 893 <211> 129 <212> PRT <213> Torque teno midi virus <400> 893 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys 50 55 60 Arg Lys Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys 65 70 75 80 Arg Arg His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser 85 90 95 Lys Lys Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser 100 105 110 Arg Ser Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr 115 120 125 Asn <210> 894 <211> 3696 <212> DNA <213> Torque teno virus <400> 894 attttgttca gcccgccaat ttctctttca aacaggccaa tcagctacta cttcgtgcac 60 ttcctggggc gtgtcctgcc gctctatata agcagaggcg gtgacgaatg gtagagtttt 120 tcttggcccg tccgcggcga gagcgcgagc gaagcgagcg atcgagcgtc ccgagggcgg 180 gtgccggagg tgagtttaca caccgcagtc aaggggcaat tcgggctcgg gactggccgg 240 gctatgggca agattcttaa aaaattcccc cgatcccttt gccgccagga cataaaaaca 300 tgccgtggag accgccggtc catagtgtcc aggggcgaga ggatcagtgg ttcgcaagct 360 tttttcacgg ccacgattcg ttttgcggct gcggtgaccc tcttggccat attaatagca 420 ttgctcatcg ctttcctcgc gccggtccac caaggccccc tccggggcta gatcagccta 480 acccccggga gcagggcccg gccggacccg gagggccgcc cgccatcttg gccctgccgg 540 ctccgcccgc ggagcctgac gacccgcagc cacggcgtgg tggtggggac ggtggcgccg 600 ccgctggcgc cgcagacgac catacacaac gagactacga cgaagaagag ctagacgagc 660 ttttccgcgc cgccgccgaa gacgatttgt aagtaggaga tggcgccggc cttacaggcg 720 caggaggaga cgcgggcgac gcagacgcag acgcagacgc agacataagc ccaccctaat 780 actcagacag tggcaacctg actgtatcag acactgtaaa ataacaggat ggatgcccct 840 cattatctgt ggaaaggggt ccacccagtt caactacatc acccacgcgg acgatatcac 900 ccccagggga gcctcctacg gaggcaattt cacaaacatg actttctccc tggaggccat 960 atatgaacag ttcctatacc acagaaacag gtggtcggcc tctaaccacg acctagaact 1020 gtgcagatac aaggggacca ccttaaaact ctacagacac ccagaagtag actacatagt 1080 tacctacagc agaacaggac cctttgaaat cagccacatg acctacctca gcactcaccc 1140 catgctaatg ctgctaaaca agcaccacat tgtggtgccc agcttaaaga ctaagcccag 1200 aggcagaaag gccataaaag tcaggataag gcccccaaaa ctcatgaaca acaagtggta 1260 cttcaccaga gacttctgta acataggcct cttccagctc tgggccacag gcttagaact 1320 cagaaacccc tggctcagaa tgagcaccct gagcccctgc ataggcttta atgtcctcaa 1380 aaacagcatt tacacaaacc tcagcaacct gccacaatac aaaaacgaaa gactaaacat 1440 cattaacaac atacttcacc cacaagaaat tacaggtaca aacaacaaaa agtggcagta 1500 cacatacacc aaactcatgg cccctattta ctattcagca aacagggcca gcacctatga 1560 ctgggaaaat tacagcaaag aaacaaacta caataataca tatgttaaat ttacccagaa 1620 aagacaggaa aaactaacta aaattagaaa agagtggcag atgctttatc cacaacaacc 1680 cacagcactg ccagactcct atgacctcct acaagagtat ggcctctaca gtccatacta 1740 cctaaacccc acaagaataa acctagactg gatgacccca tacacacacg tcagatacaa 1800 tcccctagta gacaagggct ttggaaacag aatatacatc cagtggtgct cagaagcaga 1860 tgttagctac aacaggacaa aatccaagtg tctgctacaa gacatgcccc tgtttttcat 1920 gtgctatggc tacatagact gggcaataaa aaacactgga gtgtcatctc tagtgaagga 1980 cgccagaatc tgcatcaggt gtccctacac agagccacaa ctagttggct ccacagaaga 2040 cataggcttt gtacccatct cagaaacctt catgaggggc gacatgccgg tacttgcacc 2100 atacataccg ttaagctggt tttgcaagtg gtatcccaac atagctcacc aaaaggaagt 2160 ccttgagtca atcatttcct gcagcccctt catgccccgt gaccaagaca tgaacggttg 2220 ggatatcaca atcggttaca aaatggactt cttatggggc ggttcccctc tcccctcaca 2280 gccaatcgac gacccctgcc agcagggaac ccacccgatt cccgaccccg ataaacaccc 2340 tcgcctccta caagtctcga acccgaaact actcggaccg aggacagtgt tccacaagtg 2400 ggacatcaga cgtgggcagt ttagcaaaag aagtattaag agagtgtcag aatactcaag 2460 cgatgatgaa tctcttgcgc caggtctccc atcaaagcga aacaagctcg actcggcgtt 2520 ccgaggagaa aatcgagagc aaaaagaatg ctattctctc ctcaaagcgc tcgaggaaga 2580 agagacccca gaagaagaag aaccagcacc ccaagaaaaa gcccagaaag aggagctact 2640 ccaccagctc cagctccaga gacgccacca gcgagtcctc agacgagggc tcaagctcgt 2700 ctttacagac atcctccgac tccgccaggg agtccactgg aacccggagc tcacatagcg 2760 cccccacctt acataccaga cctgcttttt cccaatactg gtaaaaaaaa aaaattctct 2820 cccttcgatt gggagacaga ggcgcaaata gcggggtgga tgcggcggcc catgcgcttc 2880 tatccctcag acacccctca ctacccgtgg ctaccccccg agcgagatat cccgaaaata 2940 tgtaacataa acttcaaaat aaagcttcaa gagtgagtga ttcgaggccc tcctctgttc 3000 acttagcggt gtctacctct taaggtcact aagcactccg agcgtaagcg aggagtgcga 3060 ccctctacca aggggcaact tcctcggggt ccggcgctac gcgcttcgcg ctgcgccgga 3120 catctcggac ccctcgaccc gaatcgcttg cgcgattcgg acctgcggcc tcgggggggt 3180 cgggggcttt actaaacaga ctccgaggtg ccattggaca ctgtaggggg tgaacagcaa 3240 cgaaagtgag tggggccaga cttcgccata aggcctttat cttcttgcca ttggatagtg 3300 acttccgggt ccgcctgggg gccgccattt tagcttcggc cgccatttta ggccctcgcg 3360 ggcctccgta ggcgcgcttt agtgacgtca cggcagccat tttgtcgtga cgtttgagac 3420 acgtgatggg ggcgtgccta aacccggaag catccctggt cacgtgactc tgacgtcacg 3480 gcggccatct tgtgctgtcc gccatcttgt aacttccttc cgctttttca aaaaaaaaga 3540 ggaagtgtga cgtagcggcg ggggggcggc gcgcttcgcg cgccgcccac cagggggcgc 3600 tgcgcgcccc ccgcgcatgc gcaggggcct ctcgaggggc tccgcccccc ccccgtgcta 3660 aatttaccgc gcatgcgcga ccacgccccc gccgcc 3696 <210> 895 <211> 130 <212> PRT <213> Torque teno virus <400> 895 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Leu 130 <210> 896 <211> 303 <212> PRT <213> Torque teno virus <400> 896 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Phe Gln Ser Thr Thr Pro Ala Ser Arg Glu Pro Thr Arg Phe Pro 130 135 140 Thr Pro Ile Asn Thr Leu Ala Ser Tyr Lys Ser Arg Thr Arg Asn Tyr 145 150 155 160 Ser Asp Arg Gly Gln Cys Ser Thr Ser Gly Thr Ser Asp Val Gly Ser 165 170 175 Leu Ala Lys Glu Val Leu Arg Glu Cys Gln Asn Thr Gln Ala Met Met 180 185 190 Asn Leu Leu Arg Gln Val Ser His Gln Ser Glu Thr Ser Ser Thr Arg 195 200 205 Arg Ser Glu Glu Lys Ile Glu Ser Lys Lys Asn Ala Ile Leu Ser Ser 210 215 220 Lys Arg Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln His Pro 225 230 235 240 Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser Ser Arg 245 250 255 Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser Leu Gln 260 265 270 Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Arg Ser Ser His 275 280 285 Ser Ala Pro Thr Leu His Thr Arg Pro Ala Phe Ser Gln Tyr Trp 290 295 300 <210> 897 <211> 292 <212> PRT <213> Torque teno virus <400> 897 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly 20 25 30 Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala 35 40 45 Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu 50 55 60 Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro 65 70 75 80 Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly 85 90 95 Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp 100 105 110 Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp 115 120 125 Asp Leu Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Val Pro Arg 130 135 140 Arg Lys Ser Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Ala Arg 145 150 155 160 Gly Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser 165 170 175 Pro Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro 180 185 190 Ala Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro 195 200 205 Thr Pro Pro Gly Ser Pro Leu Glu Pro Gly Ala His Ile Ala Pro Pro 210 215 220 Pro Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys 225 230 235 240 Phe Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Ile Ala Gly Trp Met 245 250 255 Arg Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp 260 265 270 Leu Pro Pro Glu Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys 275 280 285 Ile Lys Leu Gln 290 <210> 898 <211> 180 <212> PRT <213> Torque teno virus <400> 898 Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln 1 5 10 15 Trp Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Val Pro Arg Arg 20 25 30 Lys Ser Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Ala Arg Gly 35 40 45 Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser Pro 50 55 60 Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro Ala 65 70 75 80 Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro Thr 85 90 95 Pro Pro Gly Ser Pro Leu Glu Pro Gly Ala His Ile Ala Pro Pro Pro 100 105 110 Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys Phe 115 120 125 Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Ile Ala Gly Trp Met Arg 130 135 140 Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp Leu 145 150 155 160 Pro Pro Glu Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys Ile 165 170 175 Lys Leu Gln Glu 180 <210> 899 <211> 49 <212> PRT <213> Torque teno virus <400> 899 Ile Val Ser Arg Gly Glu Arg Ile Ser Gly Ser Gln Ala Phe Phe Thr 1 5 10 15 Ala Thr Ile Arg Phe Ala Ala Ala Val Thr Leu Leu Ala Ile Leu Ile 20 25 30 Ala Leu Leu Ile Ala Phe Leu Ala Pro Val His Gln Gly Pro Leu Arg 35 40 45 Gly <210> 900 <211> 728 <212> PRT <213> Torque teno virus <400> 900 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg 65 70 75 80 His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly 85 90 95 Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg 100 105 110 Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu 115 120 125 Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser 130 135 140 Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu 145 150 155 160 Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly 165 170 175 Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu 180 185 190 Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys 195 200 205 Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu 210 215 220 Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu 225 230 235 240 Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg 245 250 255 Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser 260 265 270 Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu 275 280 285 Asn Ile Ile Asn Asn Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn 290 295 300 Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr 305 310 315 320 Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys 325 330 335 Glu Thr Asn Tyr Asn Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln 340 345 350 Glu Lys Leu Thr Lys Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln 355 360 365 Gln Pro Thr Ala Leu Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly 370 375 380 Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp 385 390 395 400 Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly 405 410 415 Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser 420 425 430 Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe 435 440 445 Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val 450 455 460 Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr 465 470 475 480 Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile 485 490 495 Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile 500 505 510 Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys 515 520 525 Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp 530 535 540 Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe 545 550 555 560 Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys 565 570 575 Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu 580 585 590 Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His 595 600 605 Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg 610 615 620 Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro 625 630 635 640 Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu 645 650 655 Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr 660 665 670 Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu 675 680 685 Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg 690 695 700 Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly 705 710 715 720 Val His Trp Asn Pro Glu Leu Thr 725 <210> 901 <211> 197 <212> PRT <213> Torque teno virus <400> 901 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Pro Ile Asp Asp Pro Cys Gln Gln Gly 35 40 45 Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu Gln Val 50 55 60 Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys Trp Asp 65 70 75 80 Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val Ser Glu 85 90 95 Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser Lys Arg 100 105 110 Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu Gln Lys Glu 115 120 125 Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro Glu Glu 130 135 140 Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu Leu His 145 150 155 160 Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg Gly Leu 165 170 175 Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val His Trp 180 185 190 Asn Pro Glu Leu Thr 195 <210> 902 <211> 145 <212> PRT <213> Torque teno virus <400> 902 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser His Gln Ser Glu Thr Ser Ser 35 40 45 Thr Arg Arg Ser Glu Glu Lys Ile Glu Ser Lys Lys Asn Ala Ile Leu 50 55 60 Ser Ser Lys Arg Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln 65 70 75 80 His Pro Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser 85 90 95 Ser Arg Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser 100 105 110 Leu Gln Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Arg Ser 115 120 125 Ser His Ser Ala Pro Thr Leu His Thr Arg Pro Ala Phe Ser Gln Tyr 130 135 140 Trp 145 <210> 903 <211> 3828 <212> DNA <213> Torque teno virus <400> 903 gtgctacgtc actaacctac gtgtccgtct cccataggcc ggacaccgta tacgtcatac 60 acttcctggg catggtctac gtgataatat aagtggctgc acttccgaat ggctgagttt 120 tccacgcccg tccgcagcga ggacgccacg gagggggatc cgcgcgtccc gagggcgggt 180 gccggaggtg agtttacaca ccgcagtcaa ggggcaattc gggctcggga ctggccgggc 240 tatgggcaag gctcttaaaa atgcactttt ctaggtgcag tagaaagaaa aggacattgt 300 cactgctacc actgtaccat tcacagaaag ctaggccatc tgtgacaggt atgtggagac 360 ccccgactcg aaatgcgttc aatattcaac gtgactggtt ctacagttgc tttcactccc 420 acgcttctat gtgcggctgt gctgatttta ttggtcattt caatcatatc gctgctatgc 480 tcggccgtcc ggaagaccag aaccctcctc cgccacccgg ggctctgaga cccctacccg 540 ctctcccggc ctcttccgag gcacccggtg atcgagcgcc atggcctatg ggtggtggcg 600 gaggcgacgg aggcgcccgt ggtggaggag gagatggcgc cgctggagac gccgtcggag 660 accccgcaga cgccgacctc gtcgccgcta tcgacgccgc agaacagtaa ggaggcgcgg 720 cagggggagg tggactagag cacacaggag atggcgccgc aagggaaaac gcagtcgcaa 780 aaaaaagatt attataagac aatggcagcc caactacact cgcagatgca acatagtggg 840 ctacatgcct ctactaatat gtggggaaaa tactgttgct acaaactatg ccacccactc 900 agacgacagc tactaccccg gaccctttgg ggggggaatg actacagaca aatttactct 960 aagaatactg tatgatgagt acaaaaggtt catgaactac tggacctctt caaacgagga 1020 cctagaccta tgtagatacc tgggatgcac tctatatgtg tttagacacc cagaagtaga 1080 ctttataatc attataaata cctctcctcc attcctagac acagaaataa cagggcctag 1140 catacaccca ggtatgatgg cccttaacaa aagaagcaga tggataccta gcataaaaaa 1200 cagaccaggc agaaagcact atataaagat taaagtagga gccccccgaa tgttcacaga 1260 taagtggtac ccccaaacag acctctgtga catgacactc ctaacgatct ttgccagtgc 1320 ggcggatatg caatatccgt tcggctcacc actaactgac accatagttg tgtcattcca 1380 agttctgcaa tccatgtaca acgactgcct gagtgtactt cctgataatt ttgcagagac 1440 atcaggcaaa ggcacccaac tacatgagaa cataatacaa catctgccct actacaacac 1500 cacacaaaca caagcacaat ttaaaagatt tatagaaaac atgaatgcaa caaatggaga 1560 caatatatgg gcaagctaca taaacacaac caagttctca tccgcaaaca ctccaaagaa 1620 tgacacaggc ataggaggcc cttacactac atattcagac tcatggtaca aaggcacagt 1680 atacaatgac aaaattaaaa ccataccaat aaaagcaagc aagttatact acgagcaaac 1740 caaaaacctc attggcatta cattcactgg atccacacac agactccatt actgtggagg 1800 cctatactcc tccgtatggc tatcagcagg tagatcctac tttgaaacca aaggcccata 1860 cacagacata acttacaacc ccttttcaga cagaggagag ggtaacatgc tatggataga 1920 ctggctaact aaaaatgact cagtgtactc aaaaacaagt agcaagtgtc ttatagaaaa 1980 cctgcccctg tgggcctcag tatacggata taaagaatac tgcagcaagg taacaggaga 2040 cacaaacata gaacacaact gtagatgtgt tatcagaagc ccctacacag taccacaact 2100 gttagaccac aacaatccct tcagaggata cgtgccttat agcttcaact ttggaaatgg 2160 taaaatgcca ggcggtagca gcctagtgcc cattagaatg agagccaagt ggtaccccac 2220 tctgttccac caaaaagaag ttctagaagc catagcacag gcgggcccct tcgcatacca 2280 ctcagatatt aaaaaagtgt ccctgggcat aaagtacaga tttaagtggg tgtggggtgg 2340 caaccccgtg tcccaacagg ttgttagaaa cccctgcaag accacccaag gttcctcggg 2400 caatagagtg cctcgatcaa tacaagtcgt tgacccgcgg tacaacacgc cagaactcac 2460 catacacgcg tgggacttca gacatgggtt ctttggcaga aaagctatta agagaatgca 2520 agaacaacca atacctcatg acactttttc agcagggttc aagcgcagtc gccgagatac 2580 agaagcactc caatgcagcc aagaagagca acaaaaagaa aacttacttt tcccagtcca 2640 gcagctcaag cgagtccccc cgtgggagac ctcgcaagag agccaaagcg aggaagaaaa 2700 ctcgcaaaaa caggagaccc tctcccagca actcagagac cagctgcaca agcagcggct 2760 catgggagag caactccgat cgctcctcta ccaaatgcag agggtccaac aaaatcaaca 2820 cataaaccct atgttattgc caaagggtct ggcattaact tctatttctc acaatgtaat 2880 atagatatgt ttggtgaccc caaaccctac aagccctcct ccaatgactg gaaggaggag 2940 tacgaggccg caaagtactg ggacagaccc cccagacgcg acctgaggag cacccccttc 3000 tacccctggg cccccacccc caaaccatac aatgtcaact ttgccctcaa ctacaaataa 3060 acggtggccg tgggagtttc acttgtcggt gtctacctct taaggtcact aagcactccg 3120 agcgtaagcg aggagtgcga cccttcacca agggcaactc cctcgaagtc cggcgctacg 3180 cgcttcgcgc tgcgccggac atctcggacc ccccctcgac ccgaatcgct tgcgcgattc 3240 ggacctgcgg cctcgggggg gtcgggggct ttactaaaca gactccgagg tgccattgga 3300 cactgagggg gtgaacagca acgaaagtga gtggggccag acttcgccat aaggccttta 3360 tcttcttgcc atttgtccgc gaccgggggt cgctcctagg cgcggacccc gtttcggggt 3420 ccttccgggt tcatcggcgc cgttccagtg acgtcacggg cgccatgtta agtggctgtc 3480 gccgaggatt gacgtcacag ttcaaaggtc atcctcggcg gtaaccgcaa acatggcggt 3540 caatctcttc cgggtcaaag gtcgtgcata cgtcataagt cacatgacag gggtccactt 3600 aaacacggaa gtaggccccg acatgtgact cgtcacgtgt gtacacgtca cggccgccat 3660 tttgttttac aaaatggccg acttccttcc tgttttttaa aaaaaggcgc gaaaaaaccg 3720 tcggcggggg ccgcgcgctg cgcgcgcggg aggcaatgcc tccccccccc cgcgcgcatg 3780 cgcgcgggtc cccccccctc cggggggctc cgccccccgg cccccccc 3828 <210> 904 <211> 119 <212> PRT <213> Torque teno virus <400> 904 Met Trp Arg Pro Pro Thr Arg Asn Ala Phe Asn Ile Gln Arg Asp Trp 1 5 10 15 Phe Tyr Ser Cys Phe His Ser His Ala Ser Met Cys Gly Cys Ala Asp 20 25 30 Phe Ile Gly His Phe Asn His Ile Ala Ala Met Leu Gly Arg Pro Glu 35 40 45 Asp Gln Asn Pro Pro Pro Pro Pro Gly Ala Leu Arg Pro Leu Pro Ala 50 55 60 Leu Pro Ala Ser Ser Glu Ala Pro Gly Asp Arg Ala Pro Trp Pro Met 65 70 75 80 Gly Gly Gly Gly Gly Asp Gly Gly Ala Arg Gly Gly Gly Gly Asp Gly 85 90 95 Ala Ala Gly Asp Ala Val Gly Asp Pro Ala Asp Ala Asp Leu Val Ala 100 105 110 Ala Ile Asp Ala Ala Glu Gln 115 <210> 905 <211> 273 <212> PRT <213> Torque teno virus <400> 905 Met Trp Arg Pro Pro Thr Arg Asn Ala Phe Asn Ile Gln Arg Asp Trp 1 5 10 15 Phe Tyr Ser Cys Phe His Ser His Ala Ser Met Cys Gly Cys Ala Asp 20 25 30 Phe Ile Gly His Phe Asn His Ile Ala Ala Met Leu Gly Arg Pro Glu 35 40 45 Asp Gln Asn Pro Pro Pro Pro Pro Gly Ala Leu Arg Pro Leu Pro Ala 50 55 60 Leu Pro Ala Ser Ser Glu Ala Pro Gly Asp Arg Ala Pro Trp Pro Met 65 70 75 80 Gly Gly Gly Gly Gly Asp Gly Gly Ala Arg Gly Gly Gly Gly Asp Gly 85 90 95 Ala Ala Gly Asp Ala Val Gly Asp Pro Ala Asp Ala Asp Leu Val Ala 100 105 110 Ala Ile Asp Ala Ala Glu Gln Leu Leu Glu Thr Pro Ala Arg Pro Pro 115 120 125 Lys Val Pro Arg Ala Ile Glu Cys Leu Asp Gln Tyr Lys Ser Leu Thr 130 135 140 Arg Gly Thr Thr Arg Gln Asn Ser Pro Tyr Thr Arg Gly Thr Ser Asp 145 150 155 160 Met Gly Ser Leu Ala Glu Lys Leu Leu Arg Glu Cys Lys Asn Asn Gln 165 170 175 Tyr Leu Met Thr Leu Phe Gln Gln Gly Ser Ser Ala Val Ala Glu Ile 180 185 190 Gln Lys His Ser Asn Ala Ala Lys Lys Ser Asn Lys Lys Lys Thr Tyr 195 200 205 Phe Ser Gln Ser Ser Ser Ser Ser Glu Ser Pro Arg Gly Arg Pro Arg 210 215 220 Lys Arg Ala Lys Ala Arg Lys Lys Thr Arg Lys Asn Arg Arg Pro Ser 225 230 235 240 Pro Ser Asn Ser Glu Thr Ser Cys Thr Ser Ser Gly Ser Trp Glu Ser 245 250 255 Asn Ser Asp Arg Ser Ser Thr Lys Cys Arg Gly Ser Asn Lys Ile Asn 260 265 270 Thr <210> 906 <211> 286 <212> PRT <213> Torque teno virus <400> 906 Met Trp Arg Pro Pro Thr Arg Asn Ala Phe Asn Ile Gln Arg Asp Trp 1 5 10 15 Phe Tyr Ser Cys Phe His Ser His Ala Ser Met Cys Gly Cys Ala Asp 20 25 30 Phe Ile Gly His Phe Asn His Ile Ala Ala Met Leu Gly Arg Pro Glu 35 40 45 Asp Gln Asn Pro Pro Pro Pro Pro Gly Ala Leu Arg Pro Leu Pro Ala 50 55 60 Leu Pro Ala Ser Ser Glu Ala Pro Gly Asp Arg Ala Pro Trp Pro Met 65 70 75 80 Gly Gly Gly Gly Gly Asp Gly Gly Ala Arg Gly Gly Gly Gly Asp Gly 85 90 95 Ala Ala Gly Asp Ala Val Gly Asp Pro Ala Asp Ala Asp Leu Val Ala 100 105 110 Ala Ile Asp Ala Ala Glu Gln Val Gln Ala Gln Ser Pro Arg Tyr Arg 115 120 125 Ser Thr Pro Met Gln Pro Arg Arg Ala Thr Lys Arg Lys Leu Thr Phe 130 135 140 Pro Ser Pro Ala Ala Gln Ala Ser Pro Pro Val Gly Asp Leu Ala Arg 145 150 155 160 Glu Pro Lys Arg Gly Arg Lys Leu Ala Lys Thr Gly Asp Pro Leu Pro 165 170 175 Ala Thr Gln Arg Pro Ala Ala Gln Ala Ala Ala His Gly Arg Ala Thr 180 185 190 Pro Ile Ala Pro Leu Pro Asn Ala Glu Gly Pro Thr Lys Ser Thr His 195 200 205 Lys Pro Tyr Val Ile Ala Lys Gly Ser Gly Ile Asn Phe Tyr Phe Ser 210 215 220 Gln Cys Asn Ile Asp Met Phe Gly Asp Pro Lys Pro Tyr Lys Pro Ser 225 230 235 240 Ser Asn Asp Trp Lys Glu Glu Tyr Glu Ala Ala Lys Tyr Trp Asp Arg 245 250 255 Pro Pro Arg Arg Asp Leu Arg Ser Thr Pro Phe Tyr Pro Trp Ala Pro 260 265 270 Thr Pro Lys Pro Tyr Asn Val Asn Phe Ala Leu Asn Tyr Lys 275 280 285 <210> 907 <211> 51 <212> PRT <213> Torque teno virus <400> 907 Met Arg Ser Ile Phe Asn Val Thr Gly Ser Thr Val Ala Phe Thr Pro 1 5 10 15 Thr Leu Leu Cys Ala Ala Val Leu Ile Leu Leu Val Ile Ser Ile Ile 20 25 30 Ser Leu Leu Cys Ser Ala Val Arg Lys Thr Arg Thr Leu Leu Arg His 35 40 45 Pro Gly Leu 50 <210> 908 <211> 767 <212> PRT <213> Torque teno virus <400> 908 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Pro Trp Trp Arg 1 5 10 15 Arg Arg Trp Arg Arg Trp Arg Arg Arg Arg Arg Pro Arg Arg Arg Arg 20 25 30 Pro Arg Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Arg Arg Gly Arg 35 40 45 Gly Arg Trp Thr Arg Ala His Arg Arg Trp Arg Arg Lys Gly Lys Arg 50 55 60 Ser Arg Lys Lys Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Thr 65 70 75 80 Arg Arg Cys Asn Ile Val Gly Tyr Met Pro Leu Leu Ile Cys Gly Glu 85 90 95 Asn Thr Val Ala Thr Asn Tyr Ala Thr His Ser Asp Asp Ser Tyr Tyr 100 105 110 Pro Gly Pro Phe Gly Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg 115 120 125 Ile Leu Tyr Asp Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ser Ser 130 135 140 Asn Glu Asp Leu Asp Leu Cys Arg Tyr Leu Gly Cys Thr Leu Tyr Val 145 150 155 160 Phe Arg His Pro Glu Val Asp Phe Ile Ile Ile Ile Asn Thr Ser Pro 165 170 175 Pro Phe Leu Asp Thr Glu Ile Thr Gly Pro Ser Ile His Pro Gly Met 180 185 190 Met Ala Leu Asn Lys Arg Ser Arg Trp Ile Pro Ser Ile Lys Asn Arg 195 200 205 Pro Gly Arg Lys His Tyr Ile Lys Ile Lys Val Gly Ala Pro Arg Met 210 215 220 Phe Thr Asp Lys Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu 225 230 235 240 Leu Thr Ile Phe Ala Ser Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser 245 250 255 Pro Leu Thr Asp Thr Ile Val Val Ser Phe Gln Val Leu Gln Ser Met 260 265 270 Tyr Asn Asp Cys Leu Ser Val Leu Pro Asp Asn Phe Ala Glu Thr Ser 275 280 285 Gly Lys Gly Thr Gln Leu His Glu Asn Ile Ile Gln His Leu Pro Tyr 290 295 300 Tyr Asn Thr Thr Gln Thr Gln Ala Gln Phe Lys Arg Phe Ile Glu Asn 305 310 315 320 Met Asn Ala Thr Asn Gly Asp Asn Ile Trp Ala Ser Tyr Ile Asn Thr 325 330 335 Thr Lys Phe Ser Ser Ala Asn Thr Pro Lys Asn Asp Thr Gly Ile Gly 340 345 350 Gly Pro Tyr Thr Thr Tyr Ser Asp Ser Trp Tyr Lys Gly Thr Val Tyr 355 360 365 Asn Asp Lys Ile Lys Thr Ile Pro Ile Lys Ala Ser Lys Leu Tyr Tyr 370 375 380 Glu Gln Thr Lys Asn Leu Ile Gly Ile Thr Phe Thr Gly Ser Thr His 385 390 395 400 Arg Leu His Tyr Cys Gly Gly Leu Tyr Ser Ser Val Trp Leu Ser Ala 405 410 415 Gly Arg Ser Tyr Phe Glu Thr Lys Gly Pro Tyr Thr Asp Ile Thr Tyr 420 425 430 Asn Pro Phe Ser Asp Arg Gly Glu Gly Asn Met Leu Trp Ile Asp Trp 435 440 445 Leu Thr Lys Asn Asp Ser Val Tyr Ser Lys Thr Ser Ser Lys Cys Leu 450 455 460 Ile Glu Asn Leu Pro Leu Trp Ala Ser Val Tyr Gly Tyr Lys Glu Tyr 465 470 475 480 Cys Ser Lys Val Thr Gly Asp Thr Asn Ile Glu His Asn Cys Arg Cys 485 490 495 Val Ile Arg Ser Pro Tyr Thr Val Pro Gln Leu Leu Asp His Asn Asn 500 505 510 Pro Phe Arg Gly Tyr Val Pro Tyr Ser Phe Asn Phe Gly Asn Gly Lys 515 520 525 Met Pro Gly Gly Ser Ser Leu Val Pro Ile Arg Met Arg Ala Lys Trp 530 535 540 Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu Ala Ile Ala Gln 545 550 555 560 Ala Gly Pro Phe Ala Tyr His Ser Asp Ile Lys Lys Val Ser Leu Gly 565 570 575 Ile Lys Tyr Arg Phe Lys Trp Val Trp Gly Gly Asn Pro Val Ser Gln 580 585 590 Gln Val Val Arg Asn Pro Cys Lys Thr Thr Gln Gly Ser Ser Gly Asn 595 600 605 Arg Val Pro Arg Ser Ile Gln Val Val Asp Pro Arg Tyr Asn Thr Pro 610 615 620 Glu Leu Thr Ile His Ala Trp Asp Phe Arg His Gly Phe Phe Gly Arg 625 630 635 640 Lys Ala Ile Lys Arg Met Gln Glu Gln Pro Ile Pro His Asp Thr Phe 645 650 655 Ser Ala Gly Phe Lys Arg Ser Arg Arg Asp Thr Glu Ala Leu Gln Cys 660 665 670 Ser Gln Glu Glu Gln Gln Lys Glu Asn Leu Leu Phe Pro Val Gln Gln 675 680 685 Leu Lys Arg Val Pro Pro Trp Glu Thr Ser Gln Glu Ser Gln Ser Glu 690 695 700 Glu Glu Asn Ser Gln Lys Gln Glu Thr Leu Ser Gln Gln Leu Arg Asp 705 710 715 720 Gln Leu His Lys Gln Arg Leu Met Gly Glu Gln Leu Arg Ser Leu Leu 725 730 735 Tyr Gln Met Gln Arg Val Gln Gln Asn Gln His Ile Asn Pro Met Leu 740 745 750 Leu Pro Lys Gly Leu Ala Leu Thr Ser Ile Ser His Asn Val Ile 755 760 765 <210> 909 <211> 216 <212> PRT <213> Torque teno virus <400> 909 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Pro Trp Trp Arg 1 5 10 15 Arg Arg Trp Arg Arg Trp Arg Arg Arg Arg Arg Pro Arg Arg Arg Arg 20 25 30 Pro Arg Arg Arg Tyr Arg Arg Arg Arg Thr Val Val Arg Asn Pro Cys 35 40 45 Lys Thr Thr Gln Gly Ser Ser Gly Asn Arg Val Pro Arg Ser Ile Gln 50 55 60 Val Val Asp Pro Arg Tyr Asn Thr Pro Glu Leu Thr Ile His Ala Trp 65 70 75 80 Asp Phe Arg His Gly Phe Phe Gly Arg Lys Ala Ile Lys Arg Met Gln 85 90 95 Glu Gln Pro Ile Pro His Asp Thr Phe Ser Ala Gly Phe Lys Arg Ser 100 105 110 Arg Arg Asp Thr Glu Ala Leu Gln Cys Ser Gln Glu Glu Gln Gln Lys 115 120 125 Glu Asn Leu Leu Phe Pro Val Gln Gln Leu Lys Arg Val Pro Pro Trp 130 135 140 Glu Thr Ser Gln Glu Ser Gln Ser Glu Glu Glu Asn Ser Gln Lys Gln 145 150 155 160 Glu Thr Leu Ser Gln Gln Leu Arg Asp Gln Leu His Lys Gln Arg Leu 165 170 175 Met Gly Glu Gln Leu Arg Ser Leu Leu Tyr Gln Met Gln Arg Val Gln 180 185 190 Gln Asn Gln His Ile Asn Pro Met Leu Leu Pro Lys Gly Leu Ala Leu 195 200 205 Thr Ser Ile Ser His Asn Val Ile 210 215 <210> 910 <211> 131 <212> PRT <213> Torque teno virus <400> 910 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Pro Trp Trp Arg 1 5 10 15 Arg Arg Trp Arg Arg Trp Arg Arg Arg Arg Arg Pro Arg Arg Arg Arg 20 25 30 Pro Arg Arg Arg Tyr Arg Arg Arg Arg Thr Gly Ser Ser Ala Val Ala 35 40 45 Glu Ile Gln Lys His Ser Asn Ala Ala Lys Lys Ser Asn Lys Lys Lys 50 55 60 Thr Tyr Phe Ser Gln Ser Ser Ser Ser Ser Glu Ser Pro Arg Gly Arg 65 70 75 80 Pro Arg Lys Arg Ala Lys Ala Arg Lys Lys Thr Arg Lys Asn Arg Arg 85 90 95 Pro Ser Pro Ser Asn Ser Glu Thr Ser Cys Thr Ser Ser Gly Ser Trp 100 105 110 Glu Ser Asn Ser Asp Arg Ser Ser Thr Lys Cys Arg Gly Ser Asn Lys 115 120 125 Ile Asn Thr 130 <210> 911 <211> 3815 <212> DNA <213> Torque teno virus <400> 911 aagatcgtca ctaaccacgt gactcctctc gcccaatcag tgtctacgtc gtccatttcc 60 tgggcatggt ctacatcctg atataaagcg atgcacttcc gaatggctga gttttccacg 120 cccgtccgcg gcgagatcgc gacggaggag cgatcgagcg tcccgagggc gggtgccgga 180 ggtgagttta cacaccgcag tcaaggggca attcgggctc gggactggcc gggctatggg 240 caaggctctt aaagcgtacg tcccccgcta tgtttctcgg cagggtgtgg aggaaacaga 300 aaaggaaagt gcttctgctg gctgtgcgag ctacacagaa aacatcttcc atgagtatct 360 ggcgtccccc ccttgggaat gtctcctaca gggagagaaa ttggcttcag gccgtcgaaa 420 catcccacag ttctttttgt ggctgtggtg attttattct tcatcttact aatttggctg 480 cacgctttgc tctccagggg cccccgccag agggtggtcc acctcggccg aggccgccgc 540 tcctgagagc gctgccggcc cccgaggtcc gcagggagac gcgcacagag aaccggggcg 600 cctccggtga gccatggcct ggcgatggtg gtggcagaga cgatggcgcc gccgccggtg 660 gccccgcaga cggtggagac gcctacgacg ccggagacct agacgacctg ttcgccgccg 720 tcgaagaaga acaacagtaa ggaggcggag gtggaggggc agacgtgggc gacgcacata 780 cacccgacgc gcggtcagac gcagacgcag acccagaaag agacttgtac tgactcagtg 840 gagcccccag acagtcagaa actgctcaat aaggggcata gtgcccatgg taatatgcgg 900 acacacaaaa gcaggtagaa actatgctat tcatagcgag gacttcacca cacagataca 960 acccttcggg ggcagtttca gcacgaccac ctggtcccta aaagtgctgt gggacgagca 1020 ccagaaattc cagaacagat ggtcctaccc aaacacacaa ctagacctgg ccagatacag 1080 aggggtcacc ttctggttct acagagacca gaaaacagac tatatagtac agtggagtag 1140 gaatccccct tttaaactca ataaatacag cagtgccatg taccacccgg gcatgatgat 1200 gcaggccaaa aggaaactag ttgtacctag tttccagacc agacccaaag gcaagaagag 1260 atacagagtc acaataaaac cccctaacat gtttgctgac aagtggtaca ctcaagagga 1320 cctgtgtccg gtacctcttg tgcaaattgt ggtttctgcg gcgagcctgc tacatccgtt 1380 ctgcccacca caaacgaaca acccttgcat caccttccag gttttgaaag acatatatga 1440 tgaatgcata ggagttaacg aaactatgaa agataagtat aagaaattac aaacaacact 1500 atacaccact tgcacatact atcaaacaac acaagtactg gcacagctat ctcctgcctt 1560 tcaacctgct atgaaaccta ctactacaca atcagcagct acagcgacaa cactaggaaa 1620 ctatgtacca gagttaaagt acaacaatgg ctcttttcac acaggacaaa acgcagtatt 1680 cggcatgtgc tcatacaaac caacagacag cataatgaca aaagctaatg gctggttttg 1740 gcaaaaccta atggtagaca acaacctaca tagttcttat ggcaaggcaa cattagaatg 1800 catggagtat cacacaggca tatacagctc tatatttcta agtccacaaa gatctttaga 1860 attcccagca gcataccaag acgttacata caaccctaac tgtgatagag cagttggaaa 1920 cgtagtttgg tttcagtaca gcactaaaat ggatacaaat tttgatgaaa caaaatgtaa 1980 atgtgtcctt aaaaacattc cactgtgggc ggccttcaat ggctactcag actttataat 2040 gcaagaactc agcataagta cagaaatcca caactttggc atagtgtgct ttcagtgccc 2100 gtacactttt cccccctgtt tcaataaaaa caaaccccta aaggggtacg tgttctatga 2160 caccaccttt ggtaatggaa aaatgccaga cggatcgggg cacgtaccca tctactggca 2220 gcagagatgg tggatcagac tagccttcca ggtccaggtc atgcatgact ttgtactaac 2280 aggccccttt agctacaaag atgacctagc aaacaccaca ctcacagcca gatacaaatt 2340 taaattcaaa tggggcggca atatcatccc tgaacagatt atcaagaacc cgtgtcacag 2400 agagcagtcc ctcgcttcct atcccgatag acaacgtcgc gacctacaag ttgttgaccc 2460 atcaaccatg ggcccgatct acaccttcca cacatgggac tggcgacggg ggctttttgg 2520 tgcagatgct atccagagag tgtcacaaaa accgggagat gctctccgct ttacaaaccc 2580 tttcaagaga cccagatatc ttcccccgac agacagagaa gactaccgac aagaagaaga 2640 cttcgcttta caggaaaaaa gacggcgcac atccacagaa gaagcccagg acgaggagag 2700 ccccccggaa agcgcgccgc tcctacagca gcagcagcag cagcggcagc tctcagtcca 2760 cctcgcggag cagcagcgac tcggagtcca actccgatac atcctccaag aagtcctcaa 2820 aacgcaagcg ggtctccacc taaaccccct attattaggc ccgccacaaa caaggtctat 2880 ctctttgagc cctccaaagg cctactcccc atagtaggaa aagaggcctg ggaggacgag 2940 tactgcacct gcaagtactg ggatcgccct cccagaacca accacctaga catccccact 3000 tatccctgga tgcccacaaa cttcaaagtc agcttcaaac ttggatttaa accctaaata 3060 aaaatacaag gccgtacact gttcacttgt cggtgtctac ctctataagt cactaagcac 3120 tccgagcgca gcgaggagtg cgaccctcag cggtgggtgc aacgccctcg gcggccgcgc 3180 gctacgcctt cggctgcgcg cggcacctcg gacccccgct cgtgctgaca cgctcgcgcg 3240 tgtcagacca cttcgggctc gcgggggtcg ggaattttgc taaacagact ccgagttgct 3300 cttggacact gtagctgtga atcagtaacg aaagtgagtg gggccagact tcgccataag 3360 gcctttatct tcttgccatt ggtccgtctc gggggtcgcc ataggcttcg ggctcggttt 3420 taggccttcc ggactaccaa aatggcggat tccgtgacgt catggccgcc attttaagta 3480 aggcggaaca ggctgtcacc ccgtgtcaaa gttcaggggt cagccttccg ctttacacaa 3540 aatggaggtc aatatcttcc gggtcaaagg tcgctaccgc gtcataagtc acgtggggaa 3600 ggctgctgtg aatccggaag tagctgaccc acgtgacttg tcacgtgact agcacgtcac 3660 ggcagccatt ttgaatcaca aaatggccga cttccttcct cttttttaaa aataacggcc 3720 cggcggcggc gcgcgcgctt cgcgccgctc cgcccccccc gcgcatgcgc gggacccccc 3780 cccgcggggg gctccgcccc ccggtccccc ccccg 3815 <210> 912 <211> 129 <212> PRT <213> Torque teno virus <400> 912 Met Ser Ile Trp Arg Pro Pro Leu Gly Asn Val Ser Tyr Arg Glu Arg 1 5 10 15 Asn Trp Leu Gln Ala Val Glu Thr Ser His Ser Ser Phe Cys Gly Cys 20 25 30 Gly Asp Phe Ile Leu His Leu Thr Asn Leu Ala Ala Arg Phe Ala Leu 35 40 45 Gln Gly Pro Pro Pro Glu Gly Gly Pro Pro Arg Pro Arg Pro Pro Leu 50 55 60 Leu Arg Ala Leu Pro Ala Pro Glu Val Arg Arg Glu Thr Arg Thr Glu 65 70 75 80 Asn Arg Gly Ala Ser Gly Glu Pro Trp Pro Gly Asp Gly Gly Gly Arg 85 90 95 Asp Asp Gly Ala Ala Ala Gly Gly Pro Ala Asp Gly Gly Asp Ala Tyr 100 105 110 Asp Ala Gly Asp Leu Asp Asp Leu Phe Ala Ala Val Glu Glu Glu Gln 115 120 125 Gln <210> 913 <211> 283 <212> PRT <213> Torque teno virus <400> 913 Met Ser Ile Trp Arg Pro Pro Leu Gly Asn Val Ser Tyr Arg Glu Arg 1 5 10 15 Asn Trp Leu Gln Ala Val Glu Thr Ser His Ser Ser Phe Cys Gly Cys 20 25 30 Gly Asp Phe Ile Leu His Leu Thr Asn Leu Ala Ala Arg Phe Ala Leu 35 40 45 Gln Gly Pro Pro Pro Glu Gly Gly Pro Pro Arg Pro Arg Pro Pro Leu 50 55 60 Leu Arg Ala Leu Pro Ala Pro Glu Val Arg Arg Glu Thr Arg Thr Glu 65 70 75 80 Asn Arg Gly Ala Ser Gly Glu Pro Trp Pro Gly Asp Gly Gly Gly Arg 85 90 95 Asp Asp Gly Ala Ala Ala Gly Gly Pro Ala Asp Gly Gly Asp Ala Tyr 100 105 110 Asp Ala Gly Asp Leu Asp Asp Leu Phe Ala Ala Val Glu Glu Glu Gln 115 120 125 Gln Leu Ser Arg Thr Arg Val Thr Glu Ser Ser Pro Ser Leu Pro Ile 130 135 140 Pro Ile Asp Asn Val Ala Thr Tyr Lys Leu Leu Thr His Gln Pro Trp 145 150 155 160 Ala Arg Ser Thr Pro Ser Thr His Gly Thr Gly Asp Gly Gly Phe Leu 165 170 175 Val Gln Met Leu Ser Arg Glu Cys His Lys Asn Arg Glu Met Leu Ser 180 185 190 Ala Leu Gln Thr Leu Ser Arg Asp Pro Asp Ile Phe Pro Arg Gln Thr 195 200 205 Glu Lys Thr Thr Asp Lys Lys Lys Thr Ser Leu Tyr Arg Lys Lys Asp 210 215 220 Gly Ala His Pro Gln Lys Lys Pro Arg Thr Arg Arg Ala Pro Arg Lys 225 230 235 240 Ala Arg Arg Ser Tyr Ser Ser Ser Ser Ser Ser Gly Ser Ser Gln Ser 245 250 255 Thr Ser Arg Ser Ser Ser Asp Ser Glu Ser Asn Ser Asp Thr Ser Ser 260 265 270 Lys Lys Ser Ser Lys Arg Lys Arg Val Ser Thr 275 280 <210> 914 <211> 305 <212> PRT <213> Torque teno virus <400> 914 Met Ser Ile Trp Arg Pro Pro Leu Gly Asn Val Ser Tyr Arg Glu Arg 1 5 10 15 Asn Trp Leu Gln Ala Val Glu Thr Ser His Ser Ser Phe Cys Gly Cys 20 25 30 Gly Asp Phe Ile Leu His Leu Thr Asn Leu Ala Ala Arg Phe Ala Leu 35 40 45 Gln Gly Pro Pro Pro Glu Gly Gly Pro Pro Arg Pro Arg Pro Pro Leu 50 55 60 Leu Arg Ala Leu Pro Ala Pro Glu Val Arg Arg Glu Thr Arg Thr Glu 65 70 75 80 Asn Arg Gly Ala Ser Gly Glu Pro Trp Pro Gly Asp Gly Gly Gly Arg 85 90 95 Asp Asp Gly Ala Ala Ala Gly Gly Pro Ala Asp Gly Gly Asp Ala Tyr 100 105 110 Asp Ala Gly Asp Leu Asp Asp Leu Phe Ala Ala Val Glu Glu Glu Gln 115 120 125 Gln Cys Tyr Pro Glu Ser Val Thr Lys Thr Gly Arg Cys Ser Pro Leu 130 135 140 Tyr Lys Pro Phe Gln Glu Thr Gln Ile Ser Ser Pro Asp Arg Gln Arg 145 150 155 160 Arg Leu Pro Thr Arg Arg Arg Leu Arg Phe Thr Gly Lys Lys Thr Ala 165 170 175 His Ile His Arg Arg Ser Pro Gly Arg Gly Glu Pro Pro Gly Lys Arg 180 185 190 Ala Ala Pro Thr Ala Ala Ala Ala Ala Ala Ala Ala Leu Ser Pro Pro 195 200 205 Arg Gly Ala Ala Ala Thr Arg Ser Pro Thr Pro Ile His Pro Pro Arg 210 215 220 Ser Pro Gln Asn Ala Ser Gly Ser Pro Pro Lys Pro Pro Ile Ile Arg 225 230 235 240 Pro Ala Thr Asn Lys Val Tyr Leu Phe Glu Pro Ser Lys Gly Leu Leu 245 250 255 Pro Ile Val Gly Lys Glu Ala Trp Glu Asp Glu Tyr Cys Thr Cys Lys 260 265 270 Tyr Trp Asp Arg Pro Pro Arg Thr Asn His Leu Asp Ile Pro Thr Tyr 275 280 285 Pro Trp Met Pro Thr Asn Phe Lys Val Ser Phe Lys Leu Gly Phe Lys 290 295 300 Pro 305 <210> 915 <211> 55 <212> PRT <213> Torque teno virus <400> 915 Met Ser Pro Thr Gly Arg Glu Ile Gly Phe Arg Pro Ser Lys His Pro 1 5 10 15 Thr Val Leu Phe Val Ala Val Val Ile Leu Phe Phe Ile Leu Leu Ile 20 25 30 Trp Leu His Ala Leu Leu Ser Arg Gly Pro Arg Gln Arg Val Val His 35 40 45 Leu Gly Arg Gly Arg Arg Ser 50 55 <210> 916 <211> 766 <212> PRT <213> Torque teno virus <400> 916 Met Ala Trp Arg Trp Trp Trp Gln Arg Arg Trp Arg Arg Arg Arg Trp 1 5 10 15 Pro Arg Arg Arg Trp Arg Arg Leu Arg Arg Arg Arg Pro Arg Arg Pro 20 25 30 Val Arg Arg Arg Arg Arg Arg Thr Thr Val Arg Arg Arg Arg Trp Arg 35 40 45 Gly Arg Arg Gly Arg Arg Thr Tyr Thr Arg Arg Ala Val Arg Arg Arg 50 55 60 Arg Arg Pro Arg Lys Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr 65 70 75 80 Val Arg Asn Cys Ser Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly 85 90 95 His Thr Lys Ala Gly Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr 100 105 110 Thr Gln Ile Gln Pro Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser 115 120 125 Leu Lys Val Leu Trp Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser 130 135 140 Tyr Pro Asn Thr Gln Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe 145 150 155 160 Trp Phe Tyr Arg Asp Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg 165 170 175 Asn Pro Pro Phe Lys Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro 180 185 190 Gly Met Met Met Gln Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln 195 200 205 Thr Arg Pro Lys Gly Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro 210 215 220 Asn Met Phe Ala Asp Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val 225 230 235 240 Pro Leu Val Gln Ile Val Val Ser Ala Ala Ser Leu Leu His Pro Phe 245 250 255 Cys Pro Pro Gln Thr Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys 260 265 270 Asp Ile Tyr Asp Glu Cys Ile Gly Val Asn Glu Thr Met Lys Asp Lys 275 280 285 Tyr Lys Lys Leu Gln Thr Thr Leu Tyr Thr Thr Cys Thr Tyr Tyr Gln 290 295 300 Thr Thr Gln Val Leu Ala Gln Leu Ser Pro Ala Phe Gln Pro Ala Met 305 310 315 320 Lys Pro Thr Thr Thr Gln Ser Ala Ala Thr Ala Thr Thr Leu Gly Asn 325 330 335 Tyr Val Pro Glu Leu Lys Tyr Asn Asn Gly Ser Phe His Thr Gly Gln 340 345 350 Asn Ala Val Phe Gly Met Cys Ser Tyr Lys Pro Thr Asp Ser Ile Met 355 360 365 Thr Lys Ala Asn Gly Trp Phe Trp Gln Asn Leu Met Val Asp Asn Asn 370 375 380 Leu His Ser Ser Tyr Gly Lys Ala Thr Leu Glu Cys Met Glu Tyr His 385 390 395 400 Thr Gly Ile Tyr Ser Ser Ile Phe Leu Ser Pro Gln Arg Ser Leu Glu 405 410 415 Phe Pro Ala Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg 420 425 430 Ala Val Gly Asn Val Val Trp Phe Gln Tyr Ser Thr Lys Met Asp Thr 435 440 445 Asn Phe Asp Glu Thr Lys Cys Lys Cys Val Leu Lys Asn Ile Pro Leu 450 455 460 Trp Ala Ala Phe Asn Gly Tyr Ser Asp Phe Ile Met Gln Glu Leu Ser 465 470 475 480 Ile Ser Thr Glu Ile His Asn Phe Gly Ile Val Cys Phe Gln Cys Pro 485 490 495 Tyr Thr Phe Pro Pro Cys Phe Asn Lys Asn Lys Pro Leu Lys Gly Tyr 500 505 510 Val Phe Tyr Asp Thr Thr Phe Gly Asn Gly Lys Met Pro Asp Gly Ser 515 520 525 Gly His Val Pro Ile Tyr Trp Gln Gln Arg Trp Trp Ile Arg Leu Ala 530 535 540 Phe Gln Val Gln Val Met His Asp Phe Val Leu Thr Gly Pro Phe Ser 545 550 555 560 Tyr Lys Asp Asp Leu Ala Asn Thr Thr Leu Thr Ala Arg Tyr Lys Phe 565 570 575 Lys Phe Lys Trp Gly Gly Asn Ile Ile Pro Glu Gln Ile Ile Lys Asn 580 585 590 Pro Cys His Arg Glu Gln Ser Leu Ala Ser Tyr Pro Asp Arg Gln Arg 595 600 605 Arg Asp Leu Gln Val Val Asp Pro Ser Thr Met Gly Pro Ile Tyr Thr 610 615 620 Phe His Thr Trp Asp Trp Arg Arg Gly Leu Phe Gly Ala Asp Ala Ile 625 630 635 640 Gln Arg Val Ser Gln Lys Pro Gly Asp Ala Leu Arg Phe Thr Asn Pro 645 650 655 Phe Lys Arg Pro Arg Tyr Leu Pro Pro Thr Asp Arg Glu Asp Tyr Arg 660 665 670 Gln Glu Glu Asp Phe Ala Leu Gln Glu Lys Arg Arg Arg Thr Ser Thr 675 680 685 Glu Glu Ala Gln Asp Glu Glu Ser Pro Pro Glu Ser Ala Pro Leu Leu 690 695 700 Gln Gln Gln Gln Gln Gln Arg Gln Leu Ser Val His Leu Ala Glu Gln 705 710 715 720 Gln Arg Leu Gly Val Gln Leu Arg Tyr Ile Leu Gln Glu Val Leu Lys 725 730 735 Thr Gln Ala Gly Leu His Leu Asn Pro Leu Leu Leu Gly Pro Pro Gln 740 745 750 Thr Arg Ser Ile Ser Leu Ser Pro Pro Lys Ala Tyr Ser Pro 755 760 765 <210> 917 <211> 219 <212> PRT <213> Torque teno virus <400> 917 Met Ala Trp Arg Trp Trp Trp Gln Arg Arg Trp Arg Arg Arg Arg Trp 1 5 10 15 Pro Arg Arg Arg Trp Arg Arg Leu Arg Arg Arg Arg Pro Arg Arg Pro 20 25 30 Val Arg Arg Arg Arg Arg Arg Thr Thr Ile Ile Lys Asn Pro Cys His 35 40 45 Arg Glu Gln Ser Leu Ala Ser Tyr Pro Asp Arg Gln Arg Arg Asp Leu 50 55 60 Gln Val Val Asp Pro Ser Thr Met Gly Pro Ile Tyr Thr Phe His Thr 65 70 75 80 Trp Asp Trp Arg Arg Gly Leu Phe Gly Ala Asp Ala Ile Gln Arg Val 85 90 95 Ser Gln Lys Pro Gly Asp Ala Leu Arg Phe Thr Asn Pro Phe Lys Arg 100 105 110 Pro Arg Tyr Leu Pro Pro Thr Asp Arg Glu Asp Tyr Arg Gln Glu Glu 115 120 125 Asp Phe Ala Leu Gln Glu Lys Arg Arg Arg Thr Ser Thr Glu Glu Ala 130 135 140 Gln Asp Glu Glu Ser Pro Pro Glu Ser Ala Pro Leu Leu Gln Gln Gln 145 150 155 160 Gln Gln Gln Arg Gln Leu Ser Val His Leu Ala Glu Gln Gln Arg Leu 165 170 175 Gly Val Gln Leu Arg Tyr Ile Leu Gln Glu Val Leu Lys Thr Gln Ala 180 185 190 Gly Leu His Leu Asn Pro Leu Leu Leu Gly Pro Pro Gln Thr Arg Ser 195 200 205 Ile Ser Leu Ser Pro Pro Lys Ala Tyr Ser Pro 210 215 <210> 918 <211> 146 <212> PRT <213> Torque teno virus <400> 918 Met Ala Trp Arg Trp Trp Trp Gln Arg Arg Trp Arg Arg Arg Arg Trp 1 5 10 15 Pro Arg Arg Arg Trp Arg Arg Leu Arg Arg Arg Arg Pro Arg Arg Pro 20 25 30 Val Arg Arg Arg Arg Arg Arg Thr Thr Met Leu Ser Arg Glu Cys His 35 40 45 Lys Asn Arg Glu Met Leu Ser Ala Leu Gln Thr Leu Ser Arg Asp Pro 50 55 60 Asp Ile Phe Pro Arg Gln Thr Glu Lys Thr Thr Asp Lys Lys Lys Thr 65 70 75 80 Ser Leu Tyr Arg Lys Lys Asp Gly Ala His Pro Gln Lys Lys Pro Arg 85 90 95 Thr Arg Arg Ala Pro Arg Lys Ala Arg Arg Ser Tyr Ser Ser Ser Ser 100 105 110 Ser Ser Gly Ser Ser Gln Ser Thr Ser Arg Ser Ser Ser Asp Ser Glu 115 120 125 Ser Asn Ser Asp Thr Ser Ser Lys Lys Ser Ser Lys Arg Lys Arg Val 130 135 140 Ser Thr 145 <210> 919 <211> 677 <212> PRT <213> Torque teno midi virus <400> 919 Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg 1 5 10 15 Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg 20 25 30 Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg 35 40 45 Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys Ile Thr Ile Lys Gln 50 55 60 Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile Lys Gly Tyr Ser Thr 65 70 75 80 Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn Cys Tyr Thr Asn Gln 85 90 95 Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln Gly Gly Gly Phe Gly 100 105 110 Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln Glu Tyr Thr Ala His 115 120 125 Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr Asp Leu Cys Arg Tyr 130 135 140 Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro Asp Val Asp Phe Ile 145 150 155 160 Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu Asn Lys Tyr Thr Tyr 165 170 175 Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala Arg Arg Lys Arg Ile 180 185 190 Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys Leu Arg Ile Lys Leu 195 200 205 Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys Trp Phe Phe Gln Arg 210 215 220 Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys Ala Ser Ala Ala Ser 225 230 235 240 Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln Ser Thr Ile Phe Ser 245 250 255 Ala Tyr Ala Leu Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln 260 265 270 Thr Asn Thr Glu Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro 275 280 285 Leu Trp Phe His Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr 290 295 300 Thr Asn Lys Glu His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile 305 310 315 320 Ser Tyr Asn Asp Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu 325 330 335 Val Lys Ala Gly Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln 340 345 350 Leu Ile Ala Asn Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu 355 360 365 Asp Thr Gly His Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly 370 375 380 Thr Tyr Asp Lys Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val 385 390 395 400 Pro Leu Trp Met Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu 405 410 415 Thr Lys Asn Lys Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys 420 425 430 Pro Ala Leu Arg Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro 435 440 445 Leu Val Asp Met Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr 450 455 460 Leu Ser Lys Asp Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln 465 470 475 480 Thr Val Thr Ile Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys 485 490 495 Phe Glu Pro Thr Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr 500 505 510 Lys Phe Phe Phe Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val 515 520 525 Glu Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln 530 535 540 Gln Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu 545 550 555 560 Phe His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile 565 570 575 Lys Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp 580 585 590 Gly Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro 595 600 605 Thr Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu 610 615 620 Cys Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe 625 630 635 640 Ile Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe 645 650 655 Lys Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln 660 665 670 Thr Gly Leu Leu Glu 675 <210> 920 <211> 59 <212> PRT <213> Torque teno midi virus <400> 920 Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg 1 5 10 15 Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg 20 25 30 Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg 35 40 45 Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys 50 55 <210> 921 <211> 201 <212> PRT <213> Torque teno midi virus <400> 921 Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile 1 5 10 15 Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn 20 25 30 Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln 35 40 45 Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln 50 55 60 Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr 65 70 75 80 Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro 85 90 95 Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu 100 105 110 Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala 115 120 125 Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys 130 135 140 Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys 145 150 155 160 Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys 165 170 175 Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln 180 185 190 Ser Thr Ile Phe Ser Ala Tyr Ala Leu 195 200 <210> 922 <211> 96 <212> PRT <213> Torque teno midi virus <400> 922 Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln Thr Asn Thr Glu 1 5 10 15 Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro Leu Trp Phe His 20 25 30 Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr Thr Asn Lys Glu 35 40 45 His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile Ser Tyr Asn Asp 50 55 60 Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu Val Lys Ala Gly 65 70 75 80 Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln Leu Ile Ala Asn 85 90 95 <210> 923 <211> 161 <212> PRT <213> Torque teno midi virus <400> 923 Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu Asp Thr Gly His 1 5 10 15 Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly Thr Tyr Asp Lys 20 25 30 Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val Pro Leu Trp Met 35 40 45 Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu Thr Lys Asn Lys 50 55 60 Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys Pro Ala Leu Arg 65 70 75 80 Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro Leu Val Asp Met 85 90 95 Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr Leu Ser Lys Asp 100 105 110 Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln Thr Val Thr Ile 115 120 125 Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys Phe Glu Pro Thr 130 135 140 Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr Lys Phe Phe Phe 145 150 155 160 Lys <210> 924 <211> 160 <212> PRT <213> Torque teno midi virus <400> 924 Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val Glu Asp Pro Cys Ser 1 5 10 15 Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln Gln Thr Ile Gln Ile 20 25 30 Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu Phe His Asp Trp Asp 35 40 45 Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile Lys Arg Met Ser Glu 50 55 60 Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp Gly Thr Glu Ser Pro 65 70 75 80 Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro Thr Gln Asn Gln Lys 85 90 95 Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu Cys Glu Glu Pro Thr 100 105 110 Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe Ile Gln Gln Gln Gln 115 120 125 Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe Lys Leu Leu Thr His 130 135 140 Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln Thr Gly Leu Leu Glu 145 150 155 160 <210> 925 <211> 662 <212> PRT <213> Torque teno midi virus <400> 925 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln 50 55 60 Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala 65 70 75 80 Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn 85 90 95 Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly 100 105 110 Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala 115 120 125 Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr 130 135 140 Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val 145 150 155 160 Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr 165 170 175 Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe 180 185 190 Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu 195 200 205 Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys 210 215 220 Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp 225 230 235 240 Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe 245 250 255 Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala 260 265 270 Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr 275 280 285 Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His 290 295 300 Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser 305 310 315 320 Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys 325 330 335 Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp 340 345 350 Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr 355 360 365 Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro 370 375 380 Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys 385 390 395 400 Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro 405 410 415 Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro 420 425 430 Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro 435 440 445 Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln 450 455 460 Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr 465 470 475 480 Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe 485 490 495 Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp 500 505 510 Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr 515 520 525 Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His 530 535 540 Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg 545 550 555 560 Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu 565 570 575 Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val 580 585 590 Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys 595 600 605 Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln 610 615 620 Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile 625 630 635 640 Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu 645 650 655 His Thr Gly Met Leu Pro 660 <210> 926 <211> 58 <212> PRT <213> Torque teno midi virus <400> 926 Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg 1 5 10 15 Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg 20 25 30 Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg 35 40 45 Lys Leu Arg Lys Val Lys Arg Lys Lys Lys 50 55 <210> 927 <211> 202 <212> PRT <213> Torque teno midi virus <400> 927 Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys 1 5 10 15 Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met 20 25 30 Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro 35 40 45 Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp 85 90 95 Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln 100 105 110 Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu 115 120 125 Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly 130 135 140 Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu 165 170 175 Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn 180 185 190 Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu 195 200 <210> 928 <211> 79 <212> PRT <213> Torque teno midi virus <400> 928 Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr 1 5 10 15 Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr Tyr Tyr Arg Tyr 20 25 30 Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His Glu Tyr Glu Lys 35 40 45 Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser Phe Leu Gln Thr 50 55 60 Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys Ile Ala Glu 65 70 75 <210> 929 <211> 160 <212> PRT <213> Torque teno midi virus <400> 929 Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp 1 5 10 15 Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr Trp Asp Gln 20 25 30 Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro Ile Trp Leu 35 40 45 Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys Ala Asp Lys 50 55 60 Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro Ala Ile Phe 65 70 75 80 Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro Leu Ser Gln 85 90 95 Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro Thr Leu Leu 100 105 110 Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln Glu Ile Ile 115 120 125 Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr Ala Asn Gln 130 135 140 Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe Thr Phe Lys 145 150 155 160 <210> 930 <211> 163 <212> PRT <213> Torque teno midi virus <400> 930 Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp Pro Ser Lys 1 5 10 15 Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr Ile Gln Ile 20 25 30 Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His Asp Trp Asp 35 40 45 Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg Met Ser Thr 50 55 60 Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu Glu Asp Ile 65 70 75 80 Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val Pro Gln Gln 85 90 95 Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys Lys Lys Asp 100 105 110 Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln Leu Ile Lys 115 120 125 Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile Leu Gln Leu 130 135 140 Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu His Thr Gly 145 150 155 160 Met Leu Pro <210> 931 <211> 728 <212> PRT <213> Torque teno virus <400> 931 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg 65 70 75 80 His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly 85 90 95 Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg 100 105 110 Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu 115 120 125 Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser 130 135 140 Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu 145 150 155 160 Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly 165 170 175 Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu 180 185 190 Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys 195 200 205 Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu 210 215 220 Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu 225 230 235 240 Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg 245 250 255 Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser 260 265 270 Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu 275 280 285 Asn Ile Ile Asn Asn Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn 290 295 300 Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr 305 310 315 320 Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys 325 330 335 Glu Thr Asn Tyr Asn Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln 340 345 350 Glu Lys Leu Thr Lys Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln 355 360 365 Gln Pro Thr Ala Leu Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly 370 375 380 Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp 385 390 395 400 Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly 405 410 415 Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser 420 425 430 Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe 435 440 445 Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val 450 455 460 Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr 465 470 475 480 Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile 485 490 495 Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile 500 505 510 Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys 515 520 525 Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp 530 535 540 Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe 545 550 555 560 Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys 565 570 575 Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu 580 585 590 Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His 595 600 605 Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg 610 615 620 Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro 625 630 635 640 Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu 645 650 655 Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr 660 665 670 Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu 675 680 685 Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg 690 695 700 Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly 705 710 715 720 Val His Trp Asn Pro Glu Leu Thr 725 <210> 932 <211> 66 <212> PRT <213> Torque teno virus <400> 932 Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg 1 5 10 15 Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro 20 25 30 Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr 35 40 45 Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg 50 55 60 His Lys 65 <210> 933 <211> 211 <212> PRT <213> Torque teno virus <400> 933 Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg His Cys 1 5 10 15 Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr 20 25 30 Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala 35 40 45 Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile 50 55 60 Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His 65 70 75 80 Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg 85 90 95 His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe 100 105 110 Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu Met Leu 115 120 125 Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg 130 135 140 Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn 145 150 155 160 Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln 165 170 175 Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser 180 185 190 Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser Ile Tyr 195 200 205 Thr Asn Leu 210 <210> 934 <211> 118 <212> PRT <213> Torque teno virus <400> 934 Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu Asn Ile Ile Asn Asn 1 5 10 15 Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn Asn Lys Lys Trp Gln 20 25 30 Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr Tyr Ser Ala Asn Arg 35 40 45 Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys Glu Thr Asn Tyr Asn 50 55 60 Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln Glu Lys Leu Thr Lys 65 70 75 80 Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln Gln Pro Thr Ala Leu 85 90 95 Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly Leu Tyr Ser Pro Tyr 100 105 110 Tyr Leu Asn Pro Thr Arg 115 <210> 935 <211> 166 <212> PRT <213> Torque teno virus <400> 935 Ile Asn Leu Asp Trp Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro 1 5 10 15 Leu Val Asp Lys Gly Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser 20 25 30 Glu Ala Asp Val Ser Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln 35 40 45 Asp Met Pro Leu Phe Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile 50 55 60 Lys Asn Thr Gly Val Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile 65 70 75 80 Arg Cys Pro Tyr Thr Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile 85 90 95 Gly Phe Val Pro Ile Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val 100 105 110 Leu Ala Pro Tyr Ile Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn 115 120 125 Ile Ala His Gln Lys Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro 130 135 140 Phe Met Pro Arg Asp Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly 145 150 155 160 Tyr Lys Met Asp Phe Leu 165 <210> 936 <211> 167 <212> PRT <213> Torque teno virus <400> 936 Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys Gln 1 5 10 15 Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu 20 25 30 Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys 35 40 45 Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val 50 55 60 Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser 65 70 75 80 Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu Gln 85 90 95 Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro 100 105 110 Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu 115 120 125 Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg 130 135 140 Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val 145 150 155 160 His Trp Asn Pro Glu Leu Thr 165 <210> 937 <211> 767 <212> PRT <213> Torque teno virus <400> 937 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Pro Trp Trp Arg 1 5 10 15 Arg Arg Trp Arg Arg Trp Arg Arg Arg Arg Arg Pro Arg Arg Arg Arg 20 25 30 Pro Arg Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Arg Arg Gly Arg 35 40 45 Gly Arg Trp Thr Arg Ala His Arg Arg Trp Arg Arg Lys Gly Lys Arg 50 55 60 Ser Arg Lys Lys Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Thr 65 70 75 80 Arg Arg Cys Asn Ile Val Gly Tyr Met Pro Leu Leu Ile Cys Gly Glu 85 90 95 Asn Thr Val Ala Thr Asn Tyr Ala Thr His Ser Asp Asp Ser Tyr Tyr 100 105 110 Pro Gly Pro Phe Gly Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg 115 120 125 Ile Leu Tyr Asp Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ser Ser 130 135 140 Asn Glu Asp Leu Asp Leu Cys Arg Tyr Leu Gly Cys Thr Leu Tyr Val 145 150 155 160 Phe Arg His Pro Glu Val Asp Phe Ile Ile Ile Ile Asn Thr Ser Pro 165 170 175 Pro Phe Leu Asp Thr Glu Ile Thr Gly Pro Ser Ile His Pro Gly Met 180 185 190 Met Ala Leu Asn Lys Arg Ser Arg Trp Ile Pro Ser Ile Lys Asn Arg 195 200 205 Pro Gly Arg Lys His Tyr Ile Lys Ile Lys Val Gly Ala Pro Arg Met 210 215 220 Phe Thr Asp Lys Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu 225 230 235 240 Leu Thr Ile Phe Ala Ser Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser 245 250 255 Pro Leu Thr Asp Thr Ile Val Val Ser Phe Gln Val Leu Gln Ser Met 260 265 270 Tyr Asn Asp Cys Leu Ser Val Leu Pro Asp Asn Phe Ala Glu Thr Ser 275 280 285 Gly Lys Gly Thr Gln Leu His Glu Asn Ile Ile Gln His Leu Pro Tyr 290 295 300 Tyr Asn Thr Thr Gln Thr Gln Ala Gln Phe Lys Arg Phe Ile Glu Asn 305 310 315 320 Met Asn Ala Thr Asn Gly Asp Asn Ile Trp Ala Ser Tyr Ile Asn Thr 325 330 335 Thr Lys Phe Ser Ser Ala Asn Thr Pro Lys Asn Asp Thr Gly Ile Gly 340 345 350 Gly Pro Tyr Thr Thr Tyr Ser Asp Ser Trp Tyr Lys Gly Thr Val Tyr 355 360 365 Asn Asp Lys Ile Lys Thr Ile Pro Ile Lys Ala Ser Lys Leu Tyr Tyr 370 375 380 Glu Gln Thr Lys Asn Leu Ile Gly Ile Thr Phe Thr Gly Ser Thr His 385 390 395 400 Arg Leu His Tyr Cys Gly Gly Leu Tyr Ser Ser Val Trp Leu Ser Ala 405 410 415 Gly Arg Ser Tyr Phe Glu Thr Lys Gly Pro Tyr Thr Asp Ile Thr Tyr 420 425 430 Asn Pro Phe Ser Asp Arg Gly Glu Gly Asn Met Leu Trp Ile Asp Trp 435 440 445 Leu Thr Lys Asn Asp Ser Val Tyr Ser Lys Thr Ser Ser Lys Cys Leu 450 455 460 Ile Glu Asn Leu Pro Leu Trp Ala Ser Val Tyr Gly Tyr Lys Glu Tyr 465 470 475 480 Cys Ser Lys Val Thr Gly Asp Thr Asn Ile Glu His Asn Cys Arg Cys 485 490 495 Val Ile Arg Ser Pro Tyr Thr Val Pro Gln Leu Leu Asp His Asn Asn 500 505 510 Pro Phe Arg Gly Tyr Val Pro Tyr Ser Phe Asn Phe Gly Asn Gly Lys 515 520 525 Met Pro Gly Gly Ser Ser Leu Val Pro Ile Arg Met Arg Ala Lys Trp 530 535 540 Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu Ala Ile Ala Gln 545 550 555 560 Ala Gly Pro Phe Ala Tyr His Ser Asp Ile Lys Lys Val Ser Leu Gly 565 570 575 Ile Lys Tyr Arg Phe Lys Trp Val Trp Gly Gly Asn Pro Val Ser Gln 580 585 590 Gln Val Val Arg Asn Pro Cys Lys Thr Thr Gln Gly Ser Ser Gly Asn 595 600 605 Arg Val Pro Arg Ser Ile Gln Val Val Asp Pro Arg Tyr Asn Thr Pro 610 615 620 Glu Leu Thr Ile His Ala Trp Asp Phe Arg His Gly Phe Phe Gly Arg 625 630 635 640 Lys Ala Ile Lys Arg Met Gln Glu Gln Pro Ile Pro His Asp Thr Phe 645 650 655 Ser Ala Gly Phe Lys Arg Ser Arg Arg Asp Thr Glu Ala Leu Gln Cys 660 665 670 Ser Gln Glu Glu Gln Gln Lys Glu Asn Leu Leu Phe Pro Val Gln Gln 675 680 685 Leu Lys Arg Val Pro Pro Trp Glu Thr Ser Gln Glu Ser Gln Ser Glu 690 695 700 Glu Glu Asn Ser Gln Lys Gln Glu Thr Leu Ser Gln Gln Leu Arg Asp 705 710 715 720 Gln Leu His Lys Gln Arg Leu Met Gly Glu Gln Leu Arg Ser Leu Leu 725 730 735 Tyr Gln Met Gln Arg Val Gln Gln Asn Gln His Ile Asn Pro Met Leu 740 745 750 Leu Pro Lys Gly Leu Ala Leu Thr Ser Ile Ser His Asn Val Ile 755 760 765 <210> 938 <211> 69 <212> PRT <213> Torque teno virus <400> 938 Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Pro Trp Trp Arg 1 5 10 15 Arg Arg Trp Arg Arg Trp Arg Arg Arg Arg Arg Pro Arg Arg Arg Arg 20 25 30 Pro Arg Arg Arg Tyr Arg Arg Arg Arg Thr Val Arg Arg Arg Gly Arg 35 40 45 Gly Arg Trp Thr Arg Ala His Arg Arg Trp Arg Arg Lys Gly Lys Arg 50 55 60 Ser Arg Lys Lys Lys 65 <210> 939 <211> 200 <212> PRT <213> Torque teno virus <400> 939 Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Thr Arg Arg Cys Asn Ile 1 5 10 15 Val Gly Tyr Met Pro Leu Leu Ile Cys Gly Glu Asn Thr Val Ala Thr 20 25 30 Asn Tyr Ala Thr His Ser Asp Asp Ser Tyr Tyr Pro Gly Pro Phe Gly 35 40 45 Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg Ile Leu Tyr Asp Glu 50 55 60 Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ser Ser Asn Glu Asp Leu Asp 65 70 75 80 Leu Cys Arg Tyr Leu Gly Cys Thr Leu Tyr Val Phe Arg His Pro Glu 85 90 95 Val Asp Phe Ile Ile Ile Ile Asn Thr Ser Pro Pro Phe Leu Asp Thr 100 105 110 Glu Ile Thr Gly Pro Ser Ile His Pro Gly Met Met Ala Leu Asn Lys 115 120 125 Arg Ser Arg Trp Ile Pro Ser Ile Lys Asn Arg Pro Gly Arg Lys His 130 135 140 Tyr Ile Lys Ile Lys Val Gly Ala Pro Arg Met Phe Thr Asp Lys Trp 145 150 155 160 Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Phe Ala 165 170 175 Ser Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp Thr 180 185 190 Ile Val Val Ser Phe Gln Val Leu 195 200 <210> 940 <211> 155 <212> PRT <213> Torque teno virus <400> 940 Gln Ser Met Tyr Asn Asp Cys Leu Ser Val Leu Pro Asp Asn Phe Ala 1 5 10 15 Glu Thr Ser Gly Lys Gly Thr Gln Leu His Glu Asn Ile Ile Gln His 20 25 30 Leu Pro Tyr Tyr Asn Thr Thr Gln Thr Gln Ala Gln Phe Lys Arg Phe 35 40 45 Ile Glu Asn Met Asn Ala Thr Asn Gly Asp Asn Ile Trp Ala Ser Tyr 50 55 60 Ile Asn Thr Thr Lys Phe Ser Ser Ala Asn Thr Pro Lys Asn Asp Thr 65 70 75 80 Gly Ile Gly Gly Pro Tyr Thr Thr Tyr Ser Asp Ser Trp Tyr Lys Gly 85 90 95 Thr Val Tyr Asn Asp Lys Ile Lys Thr Ile Pro Ile Lys Ala Ser Lys 100 105 110 Leu Tyr Tyr Glu Gln Thr Lys Asn Leu Ile Gly Ile Thr Phe Thr Gly 115 120 125 Ser Thr His Arg Leu His Tyr Cys Gly Gly Leu Tyr Ser Ser Val Trp 130 135 140 Leu Ser Ala Gly Arg Ser Tyr Phe Glu Thr Lys 145 150 155 <210> 941 <211> 160 <212> PRT <213> Torque teno virus <400> 941 Gly Pro Tyr Thr Asp Ile Thr Tyr Asn Pro Phe Ser Asp Arg Gly Glu 1 5 10 15 Gly Asn Met Leu Trp Ile Asp Trp Leu Thr Lys Asn Asp Ser Val Tyr 20 25 30 Ser Lys Thr Ser Ser Lys Cys Leu Ile Glu Asn Leu Pro Leu Trp Ala 35 40 45 Ser Val Tyr Gly Tyr Lys Glu Tyr Cys Ser Lys Val Thr Gly Asp Thr 50 55 60 Asn Ile Glu His Asn Cys Arg Cys Val Ile Arg Ser Pro Tyr Thr Val 65 70 75 80 Pro Gln Leu Leu Asp His Asn Asn Pro Phe Arg Gly Tyr Val Pro Tyr 85 90 95 Ser Phe Asn Phe Gly Asn Gly Lys Met Pro Gly Gly Ser Ser Leu Val 100 105 110 Pro Ile Arg Met Arg Ala Lys Trp Tyr Pro Thr Leu Phe His Gln Lys 115 120 125 Glu Val Leu Glu Ala Ile Ala Gln Ala Gly Pro Phe Ala Tyr His Ser 130 135 140 Asp Ile Lys Lys Val Ser Leu Gly Ile Lys Tyr Arg Phe Lys Trp Val 145 150 155 160 <210> 942 <211> 183 <212> PRT <213> Torque teno virus <400> 942 Trp Gly Gly Asn Pro Val Ser Gln Gln Val Val Arg Asn Pro Cys Lys 1 5 10 15 Thr Thr Gln Gly Ser Ser Gly Asn Arg Val Pro Arg Ser Ile Gln Val 20 25 30 Val Asp Pro Arg Tyr Asn Thr Pro Glu Leu Thr Ile His Ala Trp Asp 35 40 45 Phe Arg His Gly Phe Phe Gly Arg Lys Ala Ile Lys Arg Met Gln Glu 50 55 60 Gln Pro Ile Pro His Asp Thr Phe Ser Ala Gly Phe Lys Arg Ser Arg 65 70 75 80 Arg Asp Thr Glu Ala Leu Gln Cys Ser Gln Glu Glu Gln Gln Lys Glu 85 90 95 Asn Leu Leu Phe Pro Val Gln Gln Leu Lys Arg Val Pro Pro Trp Glu 100 105 110 Thr Ser Gln Glu Ser Gln Ser Glu Glu Glu Asn Ser Gln Lys Gln Glu 115 120 125 Thr Leu Ser Gln Gln Leu Arg Asp Gln Leu His Lys Gln Arg Leu Met 130 135 140 Gly Glu Gln Leu Arg Ser Leu Leu Tyr Gln Met Gln Arg Val Gln Gln 145 150 155 160 Asn Gln His Ile Asn Pro Met Leu Leu Pro Lys Gly Leu Ala Leu Thr 165 170 175 Ser Ile Ser His Asn Val Ile 180 <210> 943 <211> 766 <212> PRT <213> Torque teno virus <400> 943 Met Ala Trp Arg Trp Trp Trp Gln Arg Arg Trp Arg Arg Arg Arg Trp 1 5 10 15 Pro Arg Arg Arg Trp Arg Arg Leu Arg Arg Arg Arg Pro Arg Arg Pro 20 25 30 Val Arg Arg Arg Arg Arg Arg Thr Thr Val Arg Arg Arg Arg Trp Arg 35 40 45 Gly Arg Arg Gly Arg Arg Thr Tyr Thr Arg Arg Ala Val Arg Arg Arg 50 55 60 Arg Arg Pro Arg Lys Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr 65 70 75 80 Val Arg Asn Cys Ser Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly 85 90 95 His Thr Lys Ala Gly Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr 100 105 110 Thr Gln Ile Gln Pro Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser 115 120 125 Leu Lys Val Leu Trp Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser 130 135 140 Tyr Pro Asn Thr Gln Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe 145 150 155 160 Trp Phe Tyr Arg Asp Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg 165 170 175 Asn Pro Pro Phe Lys Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro 180 185 190 Gly Met Met Met Gln Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln 195 200 205 Thr Arg Pro Lys Gly Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro 210 215 220 Asn Met Phe Ala Asp Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val 225 230 235 240 Pro Leu Val Gln Ile Val Val Ser Ala Ala Ser Leu Leu His Pro Phe 245 250 255 Cys Pro Pro Gln Thr Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys 260 265 270 Asp Ile Tyr Asp Glu Cys Ile Gly Val Asn Glu Thr Met Lys Asp Lys 275 280 285 Tyr Lys Lys Leu Gln Thr Thr Leu Tyr Thr Thr Cys Thr Tyr Tyr Gln 290 295 300 Thr Thr Gln Val Leu Ala Gln Leu Ser Pro Ala Phe Gln Pro Ala Met 305 310 315 320 Lys Pro Thr Thr Thr Gln Ser Ala Ala Thr Ala Thr Thr Leu Gly Asn 325 330 335 Tyr Val Pro Glu Leu Lys Tyr Asn Asn Gly Ser Phe His Thr Gly Gln 340 345 350 Asn Ala Val Phe Gly Met Cys Ser Tyr Lys Pro Thr Asp Ser Ile Met 355 360 365 Thr Lys Ala Asn Gly Trp Phe Trp Gln Asn Leu Met Val Asp Asn Asn 370 375 380 Leu His Ser Ser Tyr Gly Lys Ala Thr Leu Glu Cys Met Glu Tyr His 385 390 395 400 Thr Gly Ile Tyr Ser Ser Ile Phe Leu Ser Pro Gln Arg Ser Leu Glu 405 410 415 Phe Pro Ala Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg 420 425 430 Ala Val Gly Asn Val Val Trp Phe Gln Tyr Ser Thr Lys Met Asp Thr 435 440 445 Asn Phe Asp Glu Thr Lys Cys Lys Cys Val Leu Lys Asn Ile Pro Leu 450 455 460 Trp Ala Ala Phe Asn Gly Tyr Ser Asp Phe Ile Met Gln Glu Leu Ser 465 470 475 480 Ile Ser Thr Glu Ile His Asn Phe Gly Ile Val Cys Phe Gln Cys Pro 485 490 495 Tyr Thr Phe Pro Pro Cys Phe Asn Lys Asn Lys Pro Leu Lys Gly Tyr 500 505 510 Val Phe Tyr Asp Thr Thr Phe Gly Asn Gly Lys Met Pro Asp Gly Ser 515 520 525 Gly His Val Pro Ile Tyr Trp Gln Gln Arg Trp Trp Ile Arg Leu Ala 530 535 540 Phe Gln Val Gln Val Met His Asp Phe Val Leu Thr Gly Pro Phe Ser 545 550 555 560 Tyr Lys Asp Asp Leu Ala Asn Thr Thr Leu Thr Ala Arg Tyr Lys Phe 565 570 575 Lys Phe Lys Trp Gly Gly Asn Ile Ile Pro Glu Gln Ile Ile Lys Asn 580 585 590 Pro Cys His Arg Glu Gln Ser Leu Ala Ser Tyr Pro Asp Arg Gln Arg 595 600 605 Arg Asp Leu Gln Val Val Asp Pro Ser Thr Met Gly Pro Ile Tyr Thr 610 615 620 Phe His Thr Trp Asp Trp Arg Arg Gly Leu Phe Gly Ala Asp Ala Ile 625 630 635 640 Gln Arg Val Ser Gln Lys Pro Gly Asp Ala Leu Arg Phe Thr Asn Pro 645 650 655 Phe Lys Arg Pro Arg Tyr Leu Pro Pro Thr Asp Arg Glu Asp Tyr Arg 660 665 670 Gln Glu Glu Asp Phe Ala Leu Gln Glu Lys Arg Arg Arg Thr Ser Thr 675 680 685 Glu Glu Ala Gln Asp Glu Glu Ser Pro Pro Glu Ser Ala Pro Leu Leu 690 695 700 Gln Gln Gln Gln Gln Gln Arg Gln Leu Ser Val His Leu Ala Glu Gln 705 710 715 720 Gln Arg Leu Gly Val Gln Leu Arg Tyr Ile Leu Gln Glu Val Leu Lys 725 730 735 Thr Gln Ala Gly Leu His Leu Asn Pro Leu Leu Leu Gly Pro Pro Gln 740 745 750 Thr Arg Ser Ile Ser Leu Ser Pro Pro Lys Ala Tyr Ser Pro 755 760 765 <210> 944 <211> 70 <212> PRT <213> Torque teno virus <400> 944 Met Ala Trp Arg Trp Trp Trp Gln Arg Arg Trp Arg Arg Arg Arg Trp 1 5 10 15 Pro Arg Arg Arg Trp Arg Arg Leu Arg Arg Arg Arg Pro Arg Arg Pro 20 25 30 Val Arg Arg Arg Arg Arg Arg Thr Thr Val Arg Arg Arg Arg Trp Arg 35 40 45 Gly Arg Arg Gly Arg Arg Thr Tyr Thr Arg Arg Ala Val Arg Arg Arg 50 55 60 Arg Arg Pro Arg Lys Arg 65 70 <210> 945 <211> 201 <212> PRT <213> Torque teno virus <400> 945 Leu Val Leu Thr Gln Trp Ser Pro Gln Thr Val Arg Asn Cys Ser Ile 1 5 10 15 Arg Gly Ile Val Pro Met Val Ile Cys Gly His Thr Lys Ala Gly Arg 20 25 30 Asn Tyr Ala Ile His Ser Glu Asp Phe Thr Thr Gln Ile Gln Pro Phe 35 40 45 Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser Leu Lys Val Leu Trp Asp 50 55 60 Glu His Gln Lys Phe Gln Asn Arg Trp Ser Tyr Pro Asn Thr Gln Leu 65 70 75 80 Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe Trp Phe Tyr Arg Asp Gln 85 90 95 Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg Asn Pro Pro Phe Lys Leu 100 105 110 Asn Lys Tyr Ser Ser Ala Met Tyr His Pro Gly Met Met Met Gln Ala 115 120 125 Lys Arg Lys Leu Val Val Pro Ser Phe Gln Thr Arg Pro Lys Gly Lys 130 135 140 Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro Asn Met Phe Ala Asp Lys 145 150 155 160 Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val Pro Leu Val Gln Ile Val 165 170 175 Val Ser Ala Ala Ser Leu Leu His Pro Phe Cys Pro Pro Gln Thr Asn 180 185 190 Asn Pro Cys Ile Thr Phe Gln Val Leu 195 200 <210> 946 <211> 147 <212> PRT <213> Torque teno virus <400> 946 Lys Asp Ile Tyr Asp Glu Cys Ile Gly Val Asn Glu Thr Met Lys Asp 1 5 10 15 Lys Tyr Lys Lys Leu Gln Thr Thr Leu Tyr Thr Thr Cys Thr Tyr Tyr 20 25 30 Gln Thr Thr Gln Val Leu Ala Gln Leu Ser Pro Ala Phe Gln Pro Ala 35 40 45 Met Lys Pro Thr Thr Thr Gln Ser Ala Ala Thr Ala Thr Thr Leu Gly 50 55 60 Asn Tyr Val Pro Glu Leu Lys Tyr Asn Asn Gly Ser Phe His Thr Gly 65 70 75 80 Gln Asn Ala Val Phe Gly Met Cys Ser Tyr Lys Pro Thr Asp Ser Ile 85 90 95 Met Thr Lys Ala Asn Gly Trp Phe Trp Gln Asn Leu Met Val Asp Asn 100 105 110 Asn Leu His Ser Ser Tyr Gly Lys Ala Thr Leu Glu Cys Met Glu Tyr 115 120 125 His Thr Gly Ile Tyr Ser Ser Ile Phe Leu Ser Pro Gln Arg Ser Leu 130 135 140 Glu Phe Pro 145 <210> 947 <211> 161 <212> PRT <213> Torque teno virus <400> 947 Ala Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg Ala Val 1 5 10 15 Gly Asn Val Val Trp Phe Gln Tyr Ser Thr Lys Met Asp Thr Asn Phe 20 25 30 Asp Glu Thr Lys Cys Lys Cys Val Leu Lys Asn Ile Pro Leu Trp Ala 35 40 45 Ala Phe Asn Gly Tyr Ser Asp Phe Ile Met Gln Glu Leu Ser Ile Ser 50 55 60 Thr Glu Ile His Asn Phe Gly Ile Val Cys Phe Gln Cys Pro Tyr Thr 65 70 75 80 Phe Pro Pro Cys Phe Asn Lys Asn Lys Pro Leu Lys Gly Tyr Val Phe 85 90 95 Tyr Asp Thr Thr Phe Gly Asn Gly Lys Met Pro Asp Gly Ser Gly His 100 105 110 Val Pro Ile Tyr Trp Gln Gln Arg Trp Trp Ile Arg Leu Ala Phe Gln 115 120 125 Val Gln Val Met His Asp Phe Val Leu Thr Gly Pro Phe Ser Tyr Lys 130 135 140 Asp Asp Leu Ala Asn Thr Thr Leu Thr Ala Arg Tyr Lys Phe Lys Phe 145 150 155 160 Lys <210> 948 <211> 187 <212> PRT <213> Torque teno virus <400> 948 Trp Gly Gly Asn Ile Ile Pro Glu Gln Ile Ile Lys Asn Pro Cys His 1 5 10 15 Arg Glu Gln Ser Leu Ala Ser Tyr Pro Asp Arg Gln Arg Arg Asp Leu 20 25 30 Gln Val Val Asp Pro Ser Thr Met Gly Pro Ile Tyr Thr Phe His Thr 35 40 45 Trp Asp Trp Arg Arg Gly Leu Phe Gly Ala Asp Ala Ile Gln Arg Val 50 55 60 Ser Gln Lys Pro Gly Asp Ala Leu Arg Phe Thr Asn Pro Phe Lys Arg 65 70 75 80 Pro Arg Tyr Leu Pro Pro Thr Asp Arg Glu Asp Tyr Arg Gln Glu Glu 85 90 95 Asp Phe Ala Leu Gln Glu Lys Arg Arg Arg Thr Ser Thr Glu Glu Ala 100 105 110 Gln Asp Glu Glu Ser Pro Pro Glu Ser Ala Pro Leu Leu Gln Gln Gln 115 120 125 Gln Gln Gln Arg Gln Leu Ser Val His Leu Ala Glu Gln Gln Arg Leu 130 135 140 Gly Val Gln Leu Arg Tyr Ile Leu Gln Glu Val Leu Lys Thr Gln Ala 145 150 155 160 Gly Leu His Leu Asn Pro Leu Leu Leu Gly Pro Pro Gln Thr Arg Ser 165 170 175 Ile Ser Leu Ser Pro Pro Lys Ala Tyr Ser Pro 180 185 <210> 949 <211> 21 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(1) <223> /replace="Phe" <220> <221> MOD_RES <222> (2)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(20) <223> Any amino acid <220> <221> SITE <222> (1)..(21) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 949 Trp Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa 1 5 10 15 Xaa Xaa Xaa Xaa His 20 <210> 950 <211> 203 <212> PRT <213> Torque teno virus <400> 950 Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Thr Arg Arg Cys Asn 1 5 10 15 Ile Val Gly Tyr Met Pro Leu Leu Ile Cys Gly Glu Asn Thr Val Ala 20 25 30 Thr Asn Tyr Ala Thr His Ser Asp Asp Ser Tyr Tyr Pro Gly Pro Phe 35 40 45 Gly Gly Gly Met Thr Thr Asp Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ser Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Leu Gly Cys Thr Leu Tyr Val Phe Arg His Pro 85 90 95 Glu Val Asp Phe Ile Ile Ile Ile Asn Thr Ser Pro Pro Phe Leu Asp 100 105 110 Thr Glu Ile Thr Gly Pro Ser Ile His Pro Gly Met Met Ala Leu Asn 115 120 125 Lys Arg Ser Arg Trp Ile Pro Ser Ile Lys Asn Arg Pro Gly Arg Lys 130 135 140 His Tyr Ile Lys Ile Lys Val Gly Ala Pro Arg Met Phe Thr Asp Lys 145 150 155 160 Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Phe 165 170 175 Ala Ser Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Thr Ile Val Val Ser Phe Gln Val Leu Gln Ser 195 200 <210> 951 <211> 203 <212> PRT <213> Torque teno virus <400> 951 Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Arg Arg Arg Cys Asn 1 5 10 15 Ile Val Gly Tyr Leu Pro Ile Leu Ile Cys Gly Gly Asn Thr Val Ser 20 25 30 Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Asn Tyr Pro Gly Pro Phe 35 40 45 Gly Gly Gly Met Thr Thr Asp Lys Phe Ser Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ala Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Leu Gly Cys Thr Phe Tyr Phe Phe Arg His Pro 85 90 95 Glu Val Asp Phe Ile Ile Lys Ile Asn Thr Met Pro Pro Phe Leu Asp 100 105 110 Thr Thr Ile Thr Ala Pro Ser Ile His Pro Gly Leu Met Ala Leu Asp 115 120 125 Lys Arg Ala Arg Trp Ile Pro Ser Leu Lys Asn Arg Pro Gly Lys Lys 130 135 140 His Tyr Ile Lys Ile Arg Val Gly Ala Pro Lys Met Phe Thr Asp Lys 145 150 155 160 Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Tyr 165 170 175 Ala Thr Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Thr Val Val Val Asn Ser Gln Val Leu Gln Ser 195 200 <210> 952 <211> 203 <212> PRT <213> Torque teno virus <400> 952 Lys Ile Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg Arg Cys Tyr 1 5 10 15 Ile Ile Gly Cys Leu Pro Leu Val Phe Cys Gly Glu Asn Thr Thr Ala 20 25 30 Gln Asn Tyr Ala Thr His Ser Asp Asp Met Ile Ser Lys Gly Pro Tyr 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Phe Thr Arg Phe Met Asn Phe Trp Thr Val Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Val Gly Cys Lys Leu Ile Phe Phe Lys His Pro 85 90 95 Thr Val Asp Phe Met Val Gln Ile Asn Thr Gln Pro Pro Phe Leu Asp 100 105 110 Thr Ser Leu Thr Ala Ala Ser Ile His Pro Gly Ile Met Met Leu Ser 115 120 125 Lys Arg Arg Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Arg Lys 130 135 140 His Arg Val Val Val Arg Val Gly Ala Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Asp Leu Cys Asp Thr Val Leu Leu Ser Ile Phe 165 170 175 Ala Thr Ala Arg Asp Leu Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Asn Pro Cys Val Asn Phe Gln Ile Leu Gly Pro 195 200 <210> 953 <211> 203 <212> PRT <213> Torque teno virus <400> 953 Lys Ile Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg Arg Cys Tyr 1 5 10 15 Ile Ile Gly Tyr Leu Pro Leu Ile Phe Cys Gly Glu Asn Thr Thr Ala 20 25 30 Asn Asn Phe Ala Thr His Ser Asp Asp Met Ile Ala Lys Gly Pro Trp 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Tyr Asp 50 55 60 Glu Phe Thr Arg Phe Met Asn Phe Trp Thr Val Ser Asn Glu Asp Leu 65 70 75 80 Asp Leu Cys Arg Tyr Val Ser Cys Lys Leu Ile Phe Phe Lys His Pro 85 90 95 Thr Val Asp Phe Ile Val Arg Ile Asn Thr Glu Pro Pro Phe Leu Asp 100 105 110 Thr Asn Leu Thr Ala Ala Gln Ile His Pro Gly Ile Met Met Leu Ser 115 120 125 Lys Lys His Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Arg Lys 130 135 140 His Arg Val Val Val Arg Val Gly Pro Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Asp Leu Cys Asp Thr Val Leu Leu Ser Val Phe 165 170 175 Ala Thr Ala Cys Asp Leu Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp 180 185 190 Asn Pro Cys Val Asn Phe Gln Ile Leu Gly His 195 200 <210> 954 <211> 203 <212> PRT <213> Torque teno virus <400> 954 Lys Leu Ile Ile Lys Gln Trp Gln Pro Asn Phe Ile Arg His Cys Tyr 1 5 10 15 Ile Ile Gly Tyr Met Pro Leu Ile Ile Cys Gly Glu Asn Thr Phe Ser 20 25 30 His Asn Tyr Ala Thr His Ser Asp Asp Met Leu Ser Thr Gly Pro Tyr 35 40 45 Gly Gly Gly Met Thr Thr Thr Lys Phe Thr Leu Arg Ile Leu Phe Asp 50 55 60 Glu Tyr Gln Arg His Leu Asn Phe Trp Thr Val Ser Asn Gln Asp Leu 65 70 75 80 Asp Leu Ala Arg Tyr Leu Gly Thr Lys Ile Ile Phe Phe Arg His Pro 85 90 95 Thr Val Asp Phe Val Val Gln Ile His Thr Gln Pro Pro Phe Gln Asp 100 105 110 Thr Glu Ile Thr Ala Pro Ser Ile His Pro Gly Met Leu Ile Leu Ser 115 120 125 Lys Lys His Ile Leu Ile Pro Ser Leu Lys Thr Arg Pro Ser Lys Lys 130 135 140 His Tyr Val Lys Val Arg Val Gly Ala Pro Arg Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Pro Gln Ser Glu Leu Cys Asp Val Thr Leu Leu Val Ile Tyr 165 170 175 Ala Thr Ala Cys Asp Leu Gln Tyr Pro Phe Gly Ser Pro Gln Thr Asp 180 185 190 Asn Val Cys Val Asn Phe Gln Ile Leu Gly Gln 195 200 <210> 955 <211> 204 <212> PRT <213> Torque teno virus <400> 955 Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg His Cys Lys 1 5 10 15 Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr Gln 20 25 30 Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala Ser 35 40 45 Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile Tyr 50 55 60 Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His Asp 65 70 75 80 Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg His 85 90 95 Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe Glu 100 105 110 Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu Met Leu Leu 115 120 125 Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg Gly 130 135 140 Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn Asn 145 150 155 160 Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln Leu 165 170 175 Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser Thr 180 185 190 Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn 195 200 <210> 956 <211> 204 <212> PRT <213> Torque teno virus <400> 956 Thr Leu Val Leu Arg Gln Trp Gln Pro Asp Val Ile Arg His Cys Lys 1 5 10 15 Ile Thr Gly Arg Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr Gln 20 25 30 Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala Ser 35 40 45 Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile Tyr 50 55 60 Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His Asp 65 70 75 80 Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg His 85 90 95 Pro Asp Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe Glu 100 105 110 Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Leu Leu Met Leu Leu 115 120 125 Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg Gly 130 135 140 Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn Asn 145 150 155 160 Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln Leu 165 170 175 Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser Thr 180 185 190 Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn 195 200 <210> 957 <211> 203 <212> PRT <213> Torque teno virus <400> 957 Lys Leu Val Leu Thr Gln Trp Asn Pro Gln Thr Val Arg Lys Cys Val 1 5 10 15 Ile Arg Gly Phe Leu Pro Leu Phe Phe Cys Gly Gln Gly Ala Tyr His 20 25 30 Arg Asn Phe Thr Asp His Tyr Asp Asp Val Phe Pro Lys Gly Pro Ser 35 40 45 Gly Gly Gly His Gly Ser Met Val Phe Asn Leu Ser Phe Leu Tyr Gln 50 55 60 Glu Phe Lys Lys His His Asn Lys Trp Ser Arg Ser Asn Leu Asp Phe 65 70 75 80 Asp Leu Val Arg Tyr Lys Gly Thr Val Ile Lys Leu Tyr Arg His Gln 85 90 95 Asp Phe Asp Tyr Ile Val Trp Ile Ser Arg Thr Pro Pro Phe Gln Glu 100 105 110 Ser Leu Leu Thr Val Met Thr His Gln Pro Ser Val Met Leu Gln Ala 115 120 125 Lys Lys Cys Ile Ile Val Lys Ser Tyr Arg Thr His Pro Gly Gly Lys 130 135 140 Pro Tyr Val Thr Ala Lys Val Arg Pro Pro Arg Leu Leu Thr Asp Lys 145 150 155 160 Trp Tyr Phe Gln Ser Asp Phe Cys Asn Val Pro Leu Phe Ser Leu Gln 165 170 175 Phe Ala Leu Ala Glu Leu Arg Phe Pro Ile Cys Ser Pro Gln Thr Asp 180 185 190 Thr Asn Cys Ile Asn Phe Leu Val Leu Asp Asp 195 200 <210> 958 <211> 203 <212> PRT <213> Torque teno virus <400> 958 Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys Arg 1 5 10 15 Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe Ala 20 25 30 Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro Phe 35 40 45 Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe Glu 50 55 60 Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn Leu 65 70 75 80 Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His Pro 85 90 95 Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly Gly 100 105 110 Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu Ala 115 120 125 Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly Arg 130 135 140 Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp Lys 145 150 155 160 Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile Met 165 170 175 Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr Asp 180 185 190 Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser 195 200 <210> 959 <211> 204 <212> PRT <213> Torque teno virus <400> 959 Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr Val Arg Asn Cys Ser 1 5 10 15 Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly His Thr Lys Ala Gly 20 25 30 Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr Thr Gln Ile Gln Pro 35 40 45 Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser Leu Lys Val Leu Trp 50 55 60 Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser Tyr Pro Asn Thr Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe Trp Phe Tyr Arg Asp 85 90 95 Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg Asn Pro Pro Phe Lys 100 105 110 Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro Gly Met Met Met Gln 115 120 125 Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln Thr Arg Pro Lys Gly 130 135 140 Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro Asn Met Phe Ala Asp 145 150 155 160 Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val Pro Leu Val Gln Ile 165 170 175 Val Val Ser Ala Ala Ser Leu Leu His Pro Phe Cys Pro Pro Gln Thr 180 185 190 Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys Asp 195 200 <210> 960 <211> 205 <212> PRT <213> Torque teno virus <400> 960 Lys Leu Val Leu Thr Gln Trp His Pro Asn Thr Met Arg Arg Cys Leu 1 5 10 15 Ile Lys Gly Ile Val Pro Leu Val Ile Cys Gly His Thr Arg Trp Asn 20 25 30 Tyr Asn Tyr Ala Leu His Ser Lys Asp Tyr Thr Glu Glu Gly Arg Tyr 35 40 45 Pro His Gly Gly Ala Leu Ser Thr Thr Thr Trp Ser Leu Lys Val Leu 50 55 60 Tyr Asp Glu His Leu Lys His His Asp Phe Trp Gly Tyr Pro Asn Asn 65 70 75 80 Gln Leu Asp Leu Ala Arg Tyr Lys Gly Ala Lys Phe Thr Phe Tyr Arg 85 90 95 His Lys Lys Thr Asp Phe Ile Ile Phe Phe Asn Arg Lys Pro Pro Phe 100 105 110 Lys Leu Asn Lys Tyr Ser Cys Ala Ser Tyr His Pro Gly Met Leu Met 115 120 125 Gln Gln Arg His Lys Ile Leu Leu Pro Ser Tyr Glu Thr Lys Pro Lys 130 135 140 Gly Arg Pro Lys Ile Thr Val Arg Ile Lys Pro Pro Thr Leu Leu Glu 145 150 155 160 Asp Lys Trp Tyr Thr Gln Gln Asp Leu Cys Asp Val Asn Leu Leu Gln 165 170 175 Leu Val Val Thr Ala Ala Asp Phe Arg His Pro Leu Cys Ser Pro Gln 180 185 190 Thr Asn Thr Pro Thr Thr Thr Phe Gln Val Leu Lys Asp 195 200 205 <210> 961 <211> 204 <212> PRT <213> Torque teno virus <400> 961 Arg Leu Ile Leu Arg Gln Trp Gln Pro Ala Thr Arg Arg Arg Cys Thr 1 5 10 15 Ile Thr Gly Tyr Leu Pro Ile Val Phe Cys Gly His Thr Arg Gly Asn 20 25 30 Lys Asn Tyr Ala Leu His Ser Asp Asp Tyr Thr Pro Gln Gly Gln Pro 35 40 45 Phe Gly Gly Ala Leu Ser Thr Thr Ser Phe Ser Leu Lys Val Leu Phe 50 55 60 Asp Gln His Gln Arg Gly Leu Asn Lys Trp Ser Phe Pro Asn Asp Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Cys Lys Phe Ile Phe Tyr Arg Thr 85 90 95 Lys Gln Thr Asp Trp Val Gly Gln Tyr Asp Ile Ser Glu Pro Tyr Lys 100 105 110 Leu Asp Lys Tyr Ser Cys Pro Asn Tyr His Pro Gly Asn Met Ile Lys 115 120 125 Ala Lys His Lys Phe Leu Ile Pro Ser Tyr Asp Thr Asn Pro Arg Gly 130 135 140 Arg Gln Lys Ile Ile Val Lys Ile Pro Pro Pro Asp Leu Phe Val Asp 145 150 155 160 Lys Trp Tyr Thr Gln Glu Asp Leu Cys Ser Val Asn Leu Val Ser Leu 165 170 175 Ala Val Ser Ala Ala Ser Phe Leu His Pro Phe Gly Ser Pro Gln Thr 180 185 190 Asp Asn Pro Cys Tyr Thr Phe Gln Val Leu Lys Glu 195 200 <210> 962 <211> 204 <212> PRT <213> Torque teno virus <400> 962 Lys Leu Ile Leu Thr Gln Trp Asn Pro Ala Ile Val Lys Arg Cys Asn 1 5 10 15 Ile Lys Gly Gly Leu Pro Ile Ile Ile Cys Gly Glu Pro Arg Ala Ala 20 25 30 Phe Asn Tyr Gly Tyr His Met Glu Asp Tyr Thr Pro Gln Pro Phe Pro 35 40 45 Phe Gly Gly Gly Met Ser Thr Val Thr Phe Ser Leu Lys Ala Leu Tyr 50 55 60 Asp Gln Tyr Leu Lys His Gln Asn Arg Trp Thr Phe Ser Asn Asp Gln 65 70 75 80 Leu Asp Leu Ala Arg Tyr Arg Gly Cys Lys Leu Arg Phe Tyr Arg Ser 85 90 95 Pro Val Cys Asp Phe Ile Val His Tyr Asn Leu Ile Pro Pro Leu Lys 100 105 110 Met Asn Gln Phe Thr Ser Pro Asn Thr His Pro Gly Leu Leu Met Leu 115 120 125 Ser Lys His Lys Ile Ile Ile Pro Ser Phe Gln Thr Arg Pro Gly Gly 130 135 140 Arg Arg Phe Val Lys Ile Arg Leu Asn Pro Pro Lys Leu Phe Glu Asp 145 150 155 160 Lys Trp Tyr Thr Gln Gln Asp Leu Cys Lys Val Pro Leu Val Ser Ile 165 170 175 Thr Ala Thr Ala Ala Asp Leu Arg Tyr Pro Phe Cys Ser Pro Gln Thr 180 185 190 Asn Asn Pro Cys Thr Thr Phe Gln Val Leu Arg Lys 195 200 <210> 963 <211> 203 <212> PRT <213> Torque teno virus <400> 963 Lys Ile Val Leu Thr Gln Trp Asn Pro Gln Thr Thr Arg Lys Cys Ile 1 5 10 15 Ile Arg Gly Met Met Pro Val Leu Trp Ala Gly Met Gly Thr Gly Gly 20 25 30 Arg Asn Tyr Ala Val Arg Ser Asp Asp Tyr Val Val Asn Lys Gly Phe 35 40 45 Gly Gly Ser Phe Ala Thr Glu Thr Phe Ser Leu Lys Val Leu Tyr Asp 50 55 60 Gln Phe Gln Arg Gly Phe Asn Arg Trp Ser His Thr Asn Glu Asp Leu 65 70 75 80 Asp Leu Ala Arg Tyr Arg Gly Cys Arg Trp Thr Phe Tyr Arg His Lys 85 90 95 Asp Thr Asp Phe Ile Val Tyr Phe Thr Asn Asn Pro Pro Met Lys Thr 100 105 110 Asn Gln Phe Ser Ala Pro Leu Thr Thr Pro Gly Met Leu Met Arg Ser 115 120 125 Lys Tyr Lys Val Leu Ile Pro Ser Phe Gln Thr Arg Pro Lys Gly Arg 130 135 140 Lys Thr Val Thr Val Lys Ile Arg Pro Pro Lys Leu Phe Gln Asp Lys 145 150 155 160 Trp Tyr Thr Gln Gln Asp Leu Cys Ser Val Pro Leu Val Gln Leu Asn 165 170 175 Val Thr Ala Ala Asp Phe Thr His Pro Phe Gly Ser Pro Leu Thr Glu 180 185 190 Thr Pro Cys Val Glu Phe Gln Val Leu Gly Asp 195 200 <210> 964 <211> 204 <212> PRT <213> Torque teno mini virus <400> 964 Lys Leu Asn Ile Lys Glu Trp Gln Pro Ile Thr Ile Arg Lys Thr Lys 1 5 10 15 Val Lys Gly Leu Tyr Pro Ala Phe Leu Cys Asn Asp Gln Arg Ile Gly 20 25 30 Asn Asn Ala Ile Gln Tyr Leu Asp Ser Ile Ala Pro His His Phe Pro 35 40 45 Gly Gly Gly Gly Phe Gly Ile Ile Gln Phe Thr Leu Gln Gly Leu Tyr 50 55 60 Glu Gln Phe Ile Lys Ala Thr Asn Trp Trp Thr Gln Thr Asn Cys Ser 65 70 75 80 Leu Pro Leu Ile Arg Tyr Asn Phe Cys Lys Leu Lys Phe Tyr Arg Thr 85 90 95 Ala Asn Val Asp Tyr Val Val Lys Ile Ile Arg Cys Tyr Pro Leu Lys 100 105 110 Ala Thr His Asp Leu Tyr Met Gln Thr Gln Pro Ser Ile Leu Met Arg 115 120 125 Asp Lys His Ser Ile Leu Ile Pro Cys Met Lys Asn Gly Arg Asn Arg 130 135 140 Lys Thr Tyr Lys Thr Ile Lys Val Arg Pro Pro Thr Gln Met Thr Asn 145 150 155 160 Gly Trp Phe Phe Gln Lys Asp Leu Cys Asn Phe Pro Leu Leu Val Ile 165 170 175 Leu Ala Thr Ala Ala Ser Phe Asp Arg Tyr Tyr Thr Asn Ser Lys Ala 180 185 190 Lys Ser Thr Thr Ile Gly Phe Ile Ser Leu Asn Thr 195 200 <210> 965 <211> 204 <212> PRT <213> Anelloviridae sp. <400> 965 Lys Ile Arg Ile Ser Glu Trp Gln Pro Thr Lys Ile Ile Lys Ser Lys 1 5 10 15 Val Lys Gly Ile Tyr Pro Cys Phe Leu Ser Asn His Lys Arg Leu Ser 20 25 30 Asn Asn Phe Val Gln Trp Ile Asp Ser Thr Thr Ala His Leu Met Pro 35 40 45 Gly Gly Gly Gly Phe Gly Ile Ile Gln Phe Thr Leu Asn Gly Leu Tyr 50 55 60 Glu Leu Phe Cys Lys Ala Gln Asn Trp Trp Thr Lys Ser Asn Cys Asn 65 70 75 80 Leu Pro Leu Val Arg Phe Cys Gly Thr Thr Leu Lys Phe Trp Ala Ala 85 90 95 Glu Asn Tyr Asp Tyr Val Val His Ile Gln Arg Cys Tyr Pro Met Cys 100 105 110 Cys Thr Asp Leu Met Tyr Met Ser Cys Gln Pro Phe Ile Met Met Met 115 120 125 Thr Lys Asn Thr Ile Phe Val Pro Cys Thr Lys Asn Lys Pro Arg Ala 130 135 140 Lys Arg Tyr Lys Lys Ile Phe Val Lys Pro Pro Ala Gln Met Thr Thr 145 150 155 160 Gln Trp Tyr Phe Gln Ser Gln Leu Ala Lys Thr Gly Leu Ile Ile Ile 165 170 175 Arg Thr Ala Ala Cys Ser Leu Asp Arg Ile Tyr Thr Ser Ser Thr Ala 180 185 190 Ser Ser Thr Thr Ile Gly Leu Val Ser Leu His Thr 195 200 <210> 966 <211> 204 <212> PRT <213> Torque teno mini virus <400> 966 Thr Ile Arg Leu Arg Gln Trp Asn Pro Arg Thr Thr Arg Leu Cys Lys 1 5 10 15 Ile Lys Gly His Ile Pro Leu Ile Ile Cys Gly Arg Asp Arg Gln Ile 20 25 30 Phe Asn Trp Met Gln Tyr Tyr Asp Ser Ile Gly Pro Val Glu Gln Ser 35 40 45 Gly Gly Gly Gly Trp Ser Ser Ile Val Phe Ser Leu Gly Ala Leu Tyr 50 55 60 Gln Gln Phe Lys Arg Leu Met Asn Trp Trp Thr Lys Asp Asn Asp Gly 65 70 75 80 Leu Pro Leu Val Gln Tyr Arg Gly Cys Lys Phe Lys Phe Tyr Lys Ser 85 90 95 Trp Asp Cys Asp Tyr Ile Val Thr Ala Gln Thr Cys Pro Pro Met Thr 100 105 110 Asp Thr Glu Tyr Lys His Leu Asp Ser His Pro Tyr Arg Gln Leu Met 115 120 125 Asn Lys Arg Pro Ile Ile Val Pro Asn Leu Val Arg Lys Pro Ser Lys 130 135 140 Lys Thr Tyr Lys Ile Lys Arg Phe Pro Pro Pro Ser Leu Leu Gln Asn 145 150 155 160 Lys Trp Tyr Phe Gln Gln Asp Phe Cys Ala Thr Asn Leu Leu Met Leu 165 170 175 Thr Thr Ser Ala Ala Ser Phe Asp Gln Phe Trp Leu Pro Asn Asp Glu 180 185 190 Ile Ser Gln Val Ile Thr Phe His Ser Leu Asn Thr 195 200 <210> 967 <211> 204 <212> PRT <213> Torque teno mini virus <400> 967 Lys Ile Ile Leu Lys Gln Phe Gln Pro Gln Thr Ile Lys Arg Val Lys 1 5 10 15 Ile Lys Arg Leu Glu Cys Leu Phe His Cys Asn Ala Lys Lys Ile Tyr 20 25 30 Phe Asn Leu Gln Met Tyr Glu Thr Ser Thr Val Pro Pro His Leu Pro 35 40 45 Gly Gly Gly Gly Trp Ser Cys Lys Val Phe Thr Leu Asn Ala Leu Tyr 50 55 60 Asp Ala Phe Lys His Cys Arg Asn Val Trp Thr Gly Ser Asn His Asn 65 70 75 80 Leu Pro Leu Val Arg Tyr Met Gly Cys Lys Phe Thr Leu Tyr Gln Ser 85 90 95 Glu Thr Gln Asp Tyr Val Phe Lys Tyr Gln Asn His Tyr Pro Met Val 100 105 110 Ser Thr Ile Glu Ser Tyr Asn Ala Cys Gln Pro Ser Met Leu Met Met 115 120 125 Asp Asn Arg Thr Lys Lys Ile Pro Ser Lys Lys Thr Lys His Lys Arg 130 135 140 Lys Pro Tyr Thr Ile Val Lys Ile Arg Pro Pro Ala Gln Met Gln Asn 145 150 155 160 Lys Trp Tyr Phe Thr His Asp Ile Ala Asn Thr Pro Leu Leu Leu Ile 165 170 175 Tyr Ser Ala Ala Cys Ser Phe Asp Asn Tyr Tyr Ile Ser Thr Asp Ser 180 185 190 Glu Ser Thr Asn Ile Ser Ile Pro Leu Leu Arg Thr 195 200 <210> 968 <211> 204 <212> PRT <213> Torque teno mini virus <400> 968 Thr Ile Thr Val Lys Gln Phe Gln Pro Pro Asn Val Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Leu Met Asn Leu Ile Tyr Phe Asn Gln Lys Arg Leu Ile 20 25 30 Phe Asn Ser Val Met Tyr Glu Asn Ser Leu Val Pro Glu Glu His Pro 35 40 45 Gly Gly Gly Gly Phe Ser Val Ile Lys Leu Ser Leu Glu Thr Met Tyr 50 55 60 Asp Ser His Leu Arg Cys His Asn Trp Trp Thr Thr Ser Asn Glu Asp 65 70 75 80 Leu Pro Leu Val Arg Tyr Ser Gly Met Thr Val Lys Leu Tyr Gln Ser 85 90 95 Lys Tyr Thr Asp Tyr Val Phe Lys Tyr Gln Asn Tyr Leu Pro Gly Thr 100 105 110 Ser Thr Tyr Leu Thr Tyr Pro Ala Cys Gln Pro Ser Met Met Met Met 115 120 125 Ala Lys Asn Ser Val Ile Val Pro Ser Leu Glu Thr Lys Arg Arg Arg 130 135 140 Lys Pro Tyr Lys Lys Ile His Ile Lys Pro Thr Ser Gln Leu Gln Thr 145 150 155 160 Lys Trp Tyr Phe Gln Thr Asp Leu Asn Lys Thr Pro Leu Ala Ile Phe 165 170 175 Tyr Thr Ala Ala Cys Ser Leu Thr Ser Tyr Tyr Leu Ser Pro Asp Trp 180 185 190 Glu Ser Asn Asn Ile Ser Ile Leu His Leu Asn Thr 195 200 <210> 969 <211> 204 <212> PRT <213> TTV-like mini virus <400> 969 Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr 1 5 10 15 Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly 20 25 30 Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro 35 40 45 Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr 50 55 60 Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp 65 70 75 80 Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser 85 90 95 Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn 100 105 110 Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu Met Met Met Met 115 120 125 Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys 130 135 140 Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn 145 150 155 160 Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile 165 170 175 His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys 180 185 190 Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr 195 200 <210> 970 <211> 204 <212> PRT <213> Torque teno mini virus <400> 970 Lys Leu Thr Leu Lys Glu Trp Gln Pro Lys Thr Ile Arg Lys Ser Cys 1 5 10 15 Ile Lys Gly Leu His Cys Leu Phe Ile Val Thr Glu Asp Thr Ile Ser 20 25 30 Arg Asn Tyr Arg Met Tyr Glu His Ser Phe Thr Gly Glu His Trp Pro 35 40 45 Ser Gly Gly Gly Phe Ser Val Thr Lys Tyr Thr Leu Asp Gly Leu Tyr 50 55 60 Glu Gln His Gln Leu Asp Arg Asn Trp Trp Thr Lys Pro Asn Thr Asn 65 70 75 80 Met Pro Leu Val Arg Tyr Leu Gly Cys Lys Ile Thr Phe Tyr Gln Ser 85 90 95 Trp Glu Val Asp Tyr Val Cys Asn Ile Asn Leu Thr Trp Pro Met Val 100 105 110 Ala Thr Asn Leu Leu Tyr Leu Ser Cys His Pro Asn Phe Met Met Met 115 120 125 Asn His Lys Ala Ile Phe Val Pro Ser Lys Ile Thr Lys Arg Leu Arg 130 135 140 Arg Gly Lys Lys Thr Val Arg Leu Arg Pro Pro His Gln Met Ile Asn 145 150 155 160 Lys Trp Tyr Phe Ala Lys Glu Leu Ala Lys Thr Gly Leu Val Met Leu 165 170 175 Thr Ala Ala Ala Ala Ser Phe Asp His Tyr Tyr Ile Gly Ser Asp Lys 180 185 190 Leu Ser Asn Asn Cys Thr Phe Thr Ser Leu Asn Pro 195 200 <210> 971 <211> 204 <212> PRT <213> Torque teno midi virus <400> 971 Lys Ile Pro Ile Tyr Gln Trp Gln Pro Asp Ser Ile Arg Lys Cys Lys 1 5 10 15 Ile Lys Gly Val Gly Thr Leu Val Leu Gly Ala His Gly Lys Gln Phe 20 25 30 Val Cys Tyr Thr Asp Val Glu Thr Arg Ala Pro Pro Pro Lys Ala Pro 35 40 45 Gly Gly Gly Gly Phe Gly Cys Lys Gln Phe Ser Leu Gln Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Arg Asn Asn Ile Trp Thr His Thr Asn Ile Asn 65 70 75 80 Leu Asp Leu Val Arg Tyr Leu Arg Ala Ala Phe Thr Phe Tyr Arg His 85 90 95 Pro Asp Ile Asp Phe Ile Ile Asn Tyr Asp Arg Gln Pro Pro Phe Tyr 100 105 110 Leu Asp Lys Phe Thr Tyr Pro Leu Cys His Pro Gln Asn Leu Leu Leu 115 120 125 Gly Lys His Lys Ile Ile Leu Leu Ser Lys Ala Ser Lys Pro Asn Gly 130 135 140 Lys Val Lys Lys Arg Ile Ile Ile Lys Pro Pro Lys Gln Met Ile Thr 145 150 155 160 Lys Trp Phe Phe Gln Glu Gln Phe Thr Thr Gln Pro Leu Leu Ser Leu 165 170 175 Arg Ala Ala Ala Ala Ser Phe Gln Tyr Pro His Ile Gly Cys Cys Met 180 185 190 Pro Asn Arg Val Val Thr Phe Ser Ala Leu Asn Pro 195 200 <210> 972 <211> 204 <212> PRT <213> Torque teno midi virus <400> 972 Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys 1 5 10 15 Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met 20 25 30 Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro 35 40 45 Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr 50 55 60 Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp 85 90 95 Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln 100 105 110 Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu 115 120 125 Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly 130 135 140 Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu 165 170 175 Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn 180 185 190 Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu Asn His 195 200 <210> 973 <211> 204 <212> PRT <213> Torque teno midi virus <400> 973 Thr Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Val Leu Cys Lys 1 5 10 15 Ile Lys Gly Tyr Asp Ser Ile Ile Trp Gly Ala Glu Gly Thr Gln Phe 20 25 30 Gln Cys Ser Thr His Glu Met Tyr Glu Tyr Thr Arg Gln Lys Tyr Pro 35 40 45 Gly Gly Gly Gly Phe Gly Val Gln Leu Tyr Ser Leu Glu Tyr Leu Tyr 50 55 60 Asp Gln Trp Lys Leu Arg Asn Asn Ile Trp Thr Lys Thr Asn Gln Leu 65 70 75 80 Lys Asp Leu Cys Arg Tyr Leu Lys Cys Val Met Thr Phe Tyr Arg His 85 90 95 Gln His Ile Asp Phe Val Ile Val Tyr Glu Arg Gln Pro Pro Phe Glu 100 105 110 Ile Asp Lys Leu Thr Tyr Met Lys Tyr His Pro Tyr Met Leu Leu Gln 115 120 125 Arg Lys His Lys Ile Ile Leu Pro Ser Gln Thr Thr Asn Pro Arg Gly 130 135 140 Lys Leu Lys Lys Lys Lys Thr Ile Lys Pro Pro Lys Gln Met Leu Ser 145 150 155 160 Lys Trp Phe Phe Gln Gln Gln Phe Ala Lys Tyr Asp Leu Leu Leu Ile 165 170 175 Ala Ala Ala Ala Cys Ser Leu Arg Tyr Pro Arg Ile Gly Cys Cys Asn 180 185 190 Glu Asn Arg Met Ile Thr Leu Tyr Cys Leu Asn Thr 195 200 <210> 974 <211> 204 <212> PRT <213> Torque teno midi virus <400> 974 Lys Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys Lys Cys Lys 1 5 10 15 Ile Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly Lys Gln Tyr 20 25 30 Asn Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro 35 40 45 Gln Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr 50 55 60 Gln Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr 65 70 75 80 Thr Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu Tyr Arg His 85 90 95 Pro Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro Pro Phe Leu 100 105 110 Leu Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu 115 120 125 Ala Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly 130 135 140 Lys Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln Met Ile Thr 145 150 155 160 Lys Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu Phe Lys Leu 165 170 175 Cys Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser His Gly Ala 180 185 190 Gln Ser Thr Ile Phe Ser Ala Tyr Ala Leu Asn Thr 195 200 <210> 975 <211> 204 <212> PRT <213> Torque teno midi virus <400> 975 Phe Leu Lys Leu Val Gln Trp Gln Pro Asp Arg Ile Arg Lys Cys Thr 1 5 10 15 Ile Lys Gly Arg Gly Thr Leu Val Met Gly Ala His Gly Arg Gln Met 20 25 30 Ile Cys Phe Thr Asn Val Lys Asp Arg Leu Thr Pro Ser Arg Ala Pro 35 40 45 Ala Gly Gly Gly Phe Gly Val Glu Arg Ile Thr Leu Ala His Leu Tyr 50 55 60 Glu Glu Trp Lys Ala Arg Asn Asn Val Trp Thr Ala Thr Asn Glu Asn 65 70 75 80 Thr Asp Leu Gly Arg Tyr Thr Gly Cys Lys Ile Ser Phe Tyr Arg His 85 90 95 Leu Asp Thr Asp Phe Ile Ile Lys Tyr Ser Arg Asn Pro Pro Phe Asn 100 105 110 Leu Glu Lys Tyr Ser Tyr Met Tyr Met Gln Pro Gln Glu Leu Leu Leu 115 120 125 Gly Lys His Lys Arg Ile Leu Leu Ser Lys Lys Thr Asn Pro Lys Gly 130 135 140 Lys Leu Lys Thr Thr Leu Lys Ile Gly Pro Pro Lys Leu Leu Thr Asn 145 150 155 160 Lys Trp Leu Leu Gln Ser Glu Leu Ala Lys Gln Asp Leu Val Glu Ile 165 170 175 Ser Ala Ala Ala Ala Ser Phe Thr Tyr Pro Thr Ile Gly Cys Cys Asn 180 185 190 Glu Asn Arg Ile Leu Asn Leu Tyr Ser Ile Asn Thr 195 200 <210> 976 <211> 24 <212> PRT <213> Torque teno virus <400> 976 Pro Tyr Thr Asp Ile Thr Tyr Asn Pro Phe Ser Asp Arg Gly Glu Gly 1 5 10 15 Asn Met Leu Trp Ile Asp Trp Leu 20 <210> 977 <211> 24 <212> PRT <213> Torque teno virus <400> 977 Ala Tyr Thr Asp Ile Lys Tyr Asn Pro Phe Thr Asp Arg Gly Glu Gly 1 5 10 15 Asn Met Leu Trp Ile Asp Trp Leu 20 <210> 978 <211> 24 <212> PRT <213> Torque teno virus <400> 978 Ala Tyr Ser Asp Ile Ile Tyr Asn Pro Leu Thr Asp Lys Gly Thr Gly 1 5 10 15 Asn Ile Ile Trp Ile Asp Tyr Leu 20 <210> 979 <211> 24 <212> PRT <213> Torque teno virus <400> 979 Ala Tyr Thr Asp Val Ile Tyr Asn Pro Phe Thr Asp Lys Gly Thr Gly 1 5 10 15 Asn Met Val Trp Ile Asp Tyr Leu 20 <210> 980 <211> 24 <212> PRT <213> Torque teno virus <400> 980 Ala Tyr Gln Asp Ile Ile Tyr Asn Pro Phe Thr Asp Lys Gly Ile Gly 1 5 10 15 Asn Ile Val Trp Ile Asp Trp Leu 20 <210> 981 <211> 24 <212> PRT <213> Torque teno virus <400> 981 Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly Phe Gly 1 5 10 15 Asn Arg Ile Tyr Ile Gln Trp Cys 20 <210> 982 <211> 24 <212> PRT <213> Torque teno virus <400> 982 Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly Phe Gly 1 5 10 15 Asn Arg Ile Tyr Ile Gln Trp Cys 20 <210> 983 <211> 24 <212> PRT <213> Torque teno virus <400> 983 Ala Tyr Thr Glu Val Ser Tyr Asn Pro Trp Thr Asp Glu Gly Thr Gly 1 5 10 15 Asn Val Val Cys Leu Gln Tyr Leu 20 <210> 984 <211> 24 <212> PRT <213> Torque teno virus <400> 984 Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp Lys Gly Thr Gly 1 5 10 15 Asn Lys Val Trp Met Asp Pro Leu 20 <210> 985 <211> 24 <212> PRT <213> Torque teno virus <400> 985 Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg Ala Val Gly 1 5 10 15 Asn Val Val Trp Phe Gln Tyr Ser 20 <210> 986 <211> 24 <212> PRT <213> Torque teno virus <400> 986 Ala Tyr Gln Asp Val Thr Tyr Asn Pro Asn Cys Asp Arg Gly Val Asn 1 5 10 15 Asn Arg Val Trp Val Gln Pro Leu 20 <210> 987 <211> 24 <212> PRT <213> Torque teno virus <400> 987 Ala Tyr Gln Asp Val Thr Tyr Asn Pro Leu Met Asp Lys Gly Val Gly 1 5 10 15 Asn His Ile Trp Phe Gln Tyr Asn 20 <210> 988 <211> 24 <212> PRT <213> Torque teno virus <400> 988 Ala Tyr Val Asp Thr Thr Tyr Asn Pro Leu Met Asp Lys Gly Lys Gly 1 5 10 15 Asn Lys Ile Trp Phe Gln Tyr Leu 20 <210> 989 <211> 24 <212> PRT <213> Torque teno virus <400> 989 Ala Tyr Arg Asp Ile Val Tyr Asn Pro Phe Leu Asp Lys Ala Gln Gly 1 5 10 15 Asn Met Val Trp Phe Gln Tyr His 20 <210> 990 <211> 21 <212> PRT <213> Torque teno mini virus <400> 990 Glu Cys Arg Tyr Asn Pro Phe Asn Asp Lys Ser Thr Gly Asn Asn Thr 1 5 10 15 Phe Phe Val Ser Asn 20 <210> 991 <211> 21 <212> PRT <213> Anelloviridae sp. <400> 991 Glu Cys Arg Tyr Asn Pro Leu Ala Asp Lys Gly Lys Gly Asn Lys Ile 1 5 10 15 Tyr Leu Ile Ser Ile 20 <210> 992 <211> 21 <212> PRT <213> Torque teno mini virus <400> 992 Thr Cys Arg Tyr Asn Pro Leu Lys Asp Thr Gly Glu Gly Asn Gln Val 1 5 10 15 Phe Phe Lys Ser Thr 20 <210> 993 <211> 21 <212> PRT <213> Torque teno mini virus <400> 993 Thr Ile Arg Tyr Ser Pro Asn Arg Asp Thr Gly Glu Asn Asn Ile Cys 1 5 10 15 Tyr Phe Lys Pro Ile 20 <210> 994 <211> 21 <212> PRT <213> Torque teno mini virus <400> 994 Thr Thr Arg Tyr Asn Pro Asn Arg Asp Glu Gly Ile Gln Asn Glu Met 1 5 10 15 Tyr Leu Val Asn Val 20 <210> 995 <211> 21 <212> PRT <213> TTV-like mini virus <400> 995 Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu 1 5 10 15 Tyr Leu Leu Ser Asn 20 <210> 996 <211> 21 <212> PRT <213> Torque teno mini virus <400> 996 Asp Ile Arg Tyr Ala Pro Asp Arg Asp Thr Gly Val Gly Asn Lys Val 1 5 10 15 Tyr Leu Lys Ser Val 20 <210> 997 <211> 20 <212> PRT <213> Torque teno midi virus <400> 997 Cys Arg Tyr Asn Pro Ala Ile Asp Thr Gly Lys Gly Asn Thr Ile Trp 1 5 10 15 Leu His Ser Asn 20 <210> 998 <211> 20 <212> PRT <213> Torque teno midi virus <400> 998 Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp Gly Asn Met Ile Tyr 1 5 10 15 Leu Val Ser Thr 20 <210> 999 <211> 20 <212> PRT <213> Torque teno midi virus <400> 999 Gly Arg Tyr Asn Pro Ala Ile Asp Asp Gly Lys Gly Asn Lys Ile Tyr 1 5 10 15 Leu Gln Thr Ile 20 <210> 1000 <211> 20 <212> PRT <213> Torque teno midi virus <400> 1000 Leu Arg Tyr Asn Pro His Glu Asp Thr Gly His Gly Asn Glu Ile Tyr 1 5 10 15 Leu Thr Ser Thr 20

Claims (94)

  1. 합성 아넬로좀으로서:
    (I) 유전 요소로서:
    (a) 프로모터 요소,
    (b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
    (c) SEQ ID NO: 878의 뉴클레오티드 185 내지 255의 핵산 서열 또는 이에 대하여 적어도 90% 동일한 뉴클레오티드 서열을 포함하는 5’ UTR을 포함하는 유전 요소; 및
    (ii) SEQ ID NO: 921 또는 927의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
    를 포함하며;
    유전 요소가 단백질성 외부 내에 봉입되며;
    상기 합성 아넬로좀이 상기 유전 요소를 인간 세포 내로 운반할 수 있는, 합성 아넬로좀.
  2. 제1항에 있어서, 상기 유전 요소가 SEQ ID NO: 878의 뉴클레오티드 185 내지 255의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열 또는 이에 대하여 적어도 95% 동일한 핵산 서열을 포함하는, 합성 아넬로좀.
  3. 제1항 또는 제2항에 있어서, 상기 유전 요소가 SEQ ID NO: 886의 뉴클레오티드 185 내지 254의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열 또는 이에 대하여 적어도 95% 동일한 핵산 서열을 포함하는, 합성 아넬로좀.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 878의 뉴클레오티드 512 내지 2545에 의해 인코딩되는, 합성 아넬로좀.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 886의 뉴클레오티드 501 내지 2489에 의해 인코딩되는, 합성 아넬로좀.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 유전 요소가 하기 핵산 서열:
    (i) SEQ ID NO: 878의 뉴클레오티드 3141 내지 3264, 또는
    (i) SEQ ID NO: 886의 뉴클레오티드 3076 내지 3176;
    또는 이에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는, 합성 아넬로좀.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 ORF1 분자가 표 D2 또는 표 D4에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 합성 아넬로좀.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 ORF1가 하기 아미노산 서열:
    (i) SEQ ID NO: 883, 또는
    (ii) SEQ ID NO: 891;
    또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 합성 아넬로좀.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 표 C1 또는 표 C2에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 합성 아넬로좀.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 유전 요소가 표 C1 또는 표 C2에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 합성 아넬로좀이 표 C1 또는 표 C2에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함하지 않는, 합성 아넬로좀.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 유전 요소가 표 C1 또는 표 C2에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하지 않는, 합성 아넬로좀.
  13. 합성 아넬로좀으로서:
    (I) 유전 요소로서:
    (a) 프로모터 요소,
    (b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
    (c) SEQ ID NO: 894의 뉴클레오티드 178 내지 248의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
    (ii) SEQ ID NO: 933의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
    를 포함하며;
    유전 요소가 단백질성 외부 내에 봉입되며;
    상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
  14. 합성 아넬로좀으로서:
    (I) 유전 요소로서:
    (a) 프로모터 요소,
    (b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
    (c) SEQ ID NO: 903의 뉴클레오티드 176 내지 246의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
    (ii) SEQ ID NO: 939의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
    를 포함하며;
    유전 요소가 단백질성 외부 내에 봉입되며;
    상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
  15. 합성 아넬로좀으로서:
    (I) 유전 요소로서:
    (a) 프로모터 요소,
    (b) 외인성 이펙터를 인코딩하는 핵산 서열로서, 상기 핵산 서열은 프로모터 요소에 작동 가능하게 연결되는 핵산 서열, 및
    (c) SEQ ID NO: 911의 뉴클레오티드 170 내지 240의 핵산 서열에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는 유전 요소; 및
    (ii) SEQ ID NO: 945의 아미노산 서열 또는 이에 대하여 적어도 90% 동일성을 갖는 아미노산 서열을 포함하는 ORF1 분자를 포함하는 단백질성 외부
    를 포함하며;
    유전 요소가 단백질성 외부 내에 봉입되며;
    상기 합성 아넬로좀이 유전 요소를 진핵 세포 내로 운반할 수 있는, 합성 아넬로좀.
  16. 제13항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 894의 뉴클레오티드 572 내지 2758에 의해 인코딩되는, 합성 아넬로좀.
  17. 제14항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 903의 뉴클레오티드 581 내지 2884에 의해 인코딩되는, 합성 아넬로좀.
  18. 제15항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 911의 뉴클레오티드 614 내지 2911에 의해 인코딩되는, 합성 아넬로좀.
  19. 제13항 내지 제18항 중 어느 한 항에 있어서, 상기 유전 요소가 하기 핵산 서열:
    (i) SEQ ID NO: 894의 뉴클레오티드 3555 내지 3696,
    (ii) SEQ ID NO: 903의 뉴클레오티드 3720 내지 3828; 또는
    (iii) SEQ ID NO: 911의 뉴클레오티드 3716 내지 3815;
    또는 이에 대하여 적어도 90% 서열 동일성을 갖는 핵산 서열을 포함하는, 합성 아넬로좀.
  20. 제13항에 있어서, 상기 ORF1 분자가 표 D6에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 합성 아넬로좀.
  21. 제14항에 있어서, 상기 ORF1 분자가 표 D8에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 합성 아넬로좀.
  22. 제15항에 있어서, 상기 ORF1 분자가 표 D10에 열거된 바와 같은 아르기닌-풍부 영역, 젤리-롤 도메인, 초가변 도메인, N22 도메인 및/또는 C-말단 도메인의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는 아미노산 서열을 포함하는, 합성 아넬로좀.
  23. 제13항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 900의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 합성 아넬로좀.
  24. 제14항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 908의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 합성 아넬로좀.
  25. 제15항에 있어서, 상기 ORF1 분자가 SEQ ID NO: 916의 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는, 합성 아넬로좀.
  26. 제13항에 있어서, 표 C3에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 합성 아넬로좀.
  27. 제14항에 있어서, 표 C4에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 합성 아넬로좀.
  28. 제15항에 있어서, 표 C5에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 추가로 포함하는, 합성 아넬로좀.
  29. 제13항에 있어서, 상기 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  30. 제14항에 있어서, 상기 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  31. 제15항에 있어서, 상기 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  32. 제13항에 있어서, 상기 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  33. 제14항에 있어서, 상기 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  34. 제15항에 있어서, 상기 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  35. 제13항에 있어서, 상기 유전 요소가 표 C3에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  36. 제14항에 있어서, 상기 유전 요소가 표 C4에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  37. 제15항에 있어서, 상기 유전 요소가 표 C5에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하는, 합성 아넬로좀.
  38. 제13항 내지 제37항 중 어느 한 항에 있어서, 상기 합성 아넬로좀이 표 C3 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 포함하는 폴리펩티드를 포함하지 않는, 합성 아넬로좀.
  39. 제13항 내지 제38항 중 어느 한 항에 있어서, 상기 유전 요소가 표 C3 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 또는 ORF1/2의 아미노산 서열 또는 이에 대하여 적어도 85% 동일성을 갖는 아미노산 서열을 인코딩하지 않는, 합성 아넬로좀.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 상기 ORF1 분자가 아미노산 서열 YNPX2DXGX2N을 포함하며, Xn이 각각 독립적으로 임의의 n개의 아미노산의 인접 서열인, 합성 아넬로좀.
  41. 제40항에 있어서, 상기 ORF1 분자가 아미노산 서열 YNPX2DXGX2N에 측접하는 제1 베타 가닥 및 제2 베타 가닥을 추가로 포함하며, 예를 들어, 상기 제1 베타 가닥이 아미노산 서열 YNPX2DXGX2N의 티로신(Y) 잔기를 포함하고/포함하거나, 상기 제2 베타 가닥이 아미노산 서열 YNPX2DXGX2N의 제2 아스파라긴(N) 잔기(N에서 C로)를 포함하는, 합성 아넬로좀.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 ORF1 분자가 N-말단에서 C-말단 방향의 순서로, 제1 베타 가닥, 제2 베타 가닥, 제1 알파 나선, 제3 베타 가닥, 제4 베타 가닥, 제5 베타 가닥, 제2 알파 나선, 제6 베타 가닥, 제7 베타 가닥, 제8 베타 가닥 및 제9 베타 가닥을 포함하는, 합성 아넬로좀.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 상기 유전 요소가 숙주 세포에서 회전환 복제에 의해 증폭되어, 예를 들어, 적어도 8개 카피를 생성할 수 있는, 합성 아넬로좀.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 상기 유전 요소가 단일-가닥인, 합성 아넬로좀.
  45. 제1항 내지 제44항 중 어느 한 항에 있어서, 상기 유전 요소가 환형인, 합성 아넬로좀.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 유전 요소가 DNA인, 합성 아넬로좀.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, 상기 유전 요소가 음성 가닥 DNA인, 합성 아넬로좀.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 상기 유전 요소가 세포에 유입되는 아넬로좀의 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0.5%, 0.2%, 0.1% 미만의 빈도로 통합되며, 예를 들어, 합성 아넬로좀이 비-통합성인, 합성 아넬로좀.
  49. 제1항 내지 제48항 중 어느 한 항에 있어서, 상기 유전 요소가 표 16-1에 나타낸 컨센서스 5’ UTR 핵산 서열의 서열을 포함하는, 합성 아넬로좀.
  50. 제1항 내지 제49항 중 어느 한 항에 있어서, 상기 유전 요소가 표 16-2에 나타낸 컨센서스 GC-풍부 영역의 서열을 포함하는, 합성 아넬로좀.
  51. 제1항 내지 제50항 중 어느 한 항에 있어서, 상기 유전 요소가 적어도 100개 뉴클레오티드 길이의 서열을 포함하며, 이는 적어도 70%(예를 들어, 약 70 내지 100%, 75 내지 95%, 80 내지 95%, 85 내지 95% 또는 85 내지 90%)의 위치에서 G 또는 C로 이루어진, 합성 아넬로좀.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, 상기 유전 요소가 SEQ ID NO: 120의 핵산 서열을 포함하는, 합성 아넬로좀.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, 상기 유전 요소가 표 11의 핵산 서열의 뉴클레오티드 1 내지 393의 아넬로바이러스 5’ UTR 보존된 도메인 뉴클레오티드 서열과 적어도 85% 서열 동일성을 갖는 서열 및 표 11의 핵산 서열의 뉴클레오티드 2868 내지 2929의 아넬로바이러스 GC-풍부 영역에 대하여 적어도 85% 서열 동일성을 갖는 서열을 포함하는, 합성 아넬로좀.
  54. 제1항 내지 제53항 중 어느 한 항에 있어서, 상기 유전 요소가 표 11의 뉴클레오티드 서열에 대하여 적어도 75% 동일성을 포함하는, 합성 아넬로좀.
  55. 제1항 내지 제54항 중 어느 한 항에 있어서, 상기 프로모터 요소가 야생형 아넬로바이러스에 대하여 외인성인, 합성 아넬로좀.
  56. 제1항 내지 제55항 중 어느 한 항에 있어서, 상기 프로모터 요소가 야생형 아넬로바이러스에 대하여 내인성인, 합성 아넬로좀.
  57. 제1항 내지 제56항 중 어느 한 항에 있어서, 상기 외인성 이펙터가 치료제, 예를 들어, 치료적 펩티드 또는 폴리펩티드 또는 치료적 핵산을 인코딩하는 합성 아넬로좀.
  58. 제1항 내지 제57항 중 어느 한 항에 있어서, 상기 외인성 이펙터가 조절 핵산, 예를 들어, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, 안티센스 RNA, gRNA; 형광 태그 또는 마커, 항원, 펩티드, 천연-생물활성 펩티드로부터의 합성 또는 유사체 펩티드, 효능제 또는 길항제 펩티드, 항-미생물 펩티드, 포어(pore)-형성 펩티드, 바이사이클릭 펩티드, 표적화 또는 세포독성 펩티드, 분해 또는 자가-파괴 펩티드, 소분자, (예를 들어, 면역 반응/신호에 대한 감수성에 영향을 미치는) 면역 이펙터, 사멸 단백질(예를 들어, 아폽토시스 또는 괴사의 유도제), 종양의 비-용해 저해제(예를 들어, 종양단백질의 저해제), 후성적 변형제, 후성적 효소, 전사 인자, DNA 또는 단백질 변형 효소, DNA-삽입제(intercalating agent), 유출 펌프 저해제, 핵 수용체 활성화제 또는 저해제, 프로테아좀 저해제, 효소에 대한 경쟁적 저해제, 단백질 합성 이펙터 또는 저해제, 뉴클레아제, 단백질 단편 또는 도메인, 리간드, 항체, 수용체, 또는 CRISPR 시스템 또는 성분을 포함하는, 합성 아넬로좀.
  59. 제1항 내지 제58항 중 어느 한 항에 있어서, 상기 외인성 이펙터가 miRNA를 포함하며, 숙주 유전자의 발현을 감소시키는, 합성 아넬로좀.
  60. 제1항 내지 제59항 중 어느 한 항에 있어서, 상기 외인성 이펙터가 약 20 내지 200, 30 내지 180, 40 내지 160, 50 내지 140, 60 내지 120, 200 내지 2000, 200 내지 500, 500 내지 1000, 1000 내지 1500 또는 1500 내지 2000개 뉴클레오티드 길이의 핵산 서열을 포함하는, 합성 아넬로좀.
  61. 제1항 내지 제60항 중 어느 한 항에 있어서, 상기 외인성 이펙터를 인코딩하는 핵산 서열이 약 20 내지 200, 30 내지 180, 40 내지 160, 50 내지 140, 60 내지 120, 200 내지 2000, 200 내지 500, 500 내지 1000, 1000 내지 1500 또는 1500 내지 2000개 뉴클레오티드 길이인, 합성 아넬로좀.
  62. 제1항 내지 제61항 중 어느 한 항에 있어서, (예를 들어, 단백질성 외부에) 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, ORF1, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이와 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는, 합성 아넬로좀.
  63. 제1항 내지 제62항 중 어느 한 항에 있어서, 상기 유전 요소가 약 1.5 내지 2.0, 2.0 내지 2.5, 2.5 내지 3.0, 3.0 내지 3.5, 3.1 내지 3.6, 3.2 내지 3.7, 3.3 내지 3.8, 3.4 내지 3.9, 3.5 내지 4.0, 4.0 내지 4.5 또는 4.5 내지 5.0 kb의 길이를 갖는, 합성 아넬로좀.
  64. 제1항 내지 제63항 중 어느 한 항에 있어서, 상기 합성 아넬로좀이 인간 세포, 예를 들어, 면역 세포, 간 세포 또는 폐 상피 세포를 감염시킬 수 있는, 합성 아넬로좀.
  65. 제1항 내지 제64항 중 어느 한 항에 있어서, 예를 들어, 실시예 4에 기재된 방법에 따라 검출되는 바와 같이, 실질적으로 비-면역원성인, 예를 들어, 검출 가능한 및/또는 원하지 않는 면역 반응을 유도하지 않는, 합성 아넬로좀.
  66. 제65항에 있어서, 실질적으로 비-면역원성인 아넬로좀이 면역 반응이 결여된 기준 대상체에서의 효능의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 100%인 효능을 대상체에서 갖는, 합성 아넬로좀.
  67. 제1항 내지 제66항 중 어느 한 항에 있어서, 상기 적어도 1000개의 아넬로좀의 집단이 적어도 약 100개 카피(예를 들어, 적어도 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000개 카피)의 유전 요소를 하나 이상의 인간 세포 내로 운반할 수 있는, 합성 아넬로좀.
  68. 제1항 내지 제67항 중 어느 한 항에 있어서, (예를 들어, 단백질성 외부에) 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF2, ORF2/2, ORF2/3, ORF2t/3, ORF1, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이와 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 포함하는, 합성 아넬로좀.
  69. 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 및 약제학적으로 허용 가능한 담체 또는 부형제를 포함하는 약제학적 조성물.
  70. 제69항에 있어서, 적어도 103, 104, 105, 106, 107, 108 또는 109개의 합성 아넬로좀을 포함하는, 약제학적 조성물.
  71. 제69항 또는 제70항에 있어서, 상기 약제학적 조성물이 사전결정된 입자:감염성 유닛의 비(예를 들어, 300:1 미만, 200:1 미만, 100:1 미만 또는 50:1 미만)를 갖는, 약제학적 조성물.
  72. 하기 중 하나 이상(예를 들어, 그 전부)을 인코딩하는 핵산 분자:
    (i) ORF1 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF1 영역을 포함하는 것;
    (ii) ORF2 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF2 영역을 포함하는 것; 및/또는
    (iii) ORF3 분자, 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 것, 또는 표 B1 내지 표 B5 중 어느 하나에 열거된 바와 같은 핵산 서열의 ORF3 영역을 포함하는 것.
  73. 제72항에 있어서, 상기 핵산 분자가 플라스미드, 바이러스 게놈 또는 (예를 들어, 시험관 내 환화에 의해 생성되는) 이중-가닥 환형 DNA인, 핵산 분자.
  74. 반응 혼합물로서:
    (i) 제1항 내지 제73항 중 어느 한 항의 합성 아넬로좀의 유전 요소의 서열을 포함하는 제1 핵산(예를 들어, 이중-가닥 또는 단일-가닥 환형 DNA), 및
    (ii) 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 서열을 포함하는, 반응 혼합물.
  75. 제74항에 있어서, 상기 제1 핵산 및 상기 제2 핵산이 동일한 핵산 분자에 존재하는, 반응 혼합물.
  76. 제74항에 있어서, 상기 제1 핵산 및 상기 제2 핵산이 상이한 핵산 분자인, 반응 혼합물.
  77. 제74항에 있어서, 상기 제1 핵산 및 상기 제2 핵산이 상이한 핵산 분자이며, 상기 제2 핵산이 이중-가닥 환형 DNA로서 제공되는, 반응 혼합물.
  78. 제74항에 있어서, 상기 제1 핵산 및 상기 제2 핵산이 상이한 핵산 분자이며, 상기 제1 및 제2 핵산이 이중-가닥 환형 DNA로서 제공되는, 반응 혼합물.
  79. 제76항에 있어서, 상기 제2 핵산 서열이 헬퍼 세포 또는 헬퍼 바이러스에 의해 포함되는, 반응 혼합물.
  80. 합성 아넬로좀의 제조 방법으로서, 상기 방법이
    a) 숙주 세포를 제공하는 단계로서:
    (i) 제1항 내지 제79항 중 어느 한 항의 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
    (ii) 예를 들어, 표 C1 내지 표 C5 중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자를 포함하는 숙주 세포를 제공하는 단계; 및
    b) 숙주 세포를 상기 합성 아넬로좀을 제조하기에 적합한 조건 하에서 인큐베이션시키는 단계를 포함하며,
    이렇게 함으로써 합성 아넬로좀을 제조하는, 방법.
  81. 제80항에 있어서, 단계 (a) 이전에, 상기 제1 핵산 분자 및/또는 제2 핵산 분자를 세포 내로 도입하는 단계를 추가로 포함하는, 방법.
  82. 제81항에 있어서, 상기 제2 핵산 분자가 상기 제1 핵산 분자 이전에, 이와 동시에, 또는 그 이후에 숙주 세포 내로 도입되는, 방법.
  83. 제80항 또는 제81항에 있어서, 상기 제2 핵산 분자가 숙주 세포의 게놈 내로 통합되는, 방법.
  84. 제80항 내지 제83항 중 어느 한 항에 있어서, 상기 제2 핵산 분자가 헬퍼(예를 들어, 헬퍼 플라스미드 또는 헬퍼 바이러스의 게놈)인, 방법.
  85. 제80항 내지 제84항 중 어느 한 항에 있어서, 상기 제2 핵산 분자가 아미노산 서열 [W/F]X7HX3CX1CX5H를 포함하는 ORF2 분자를 인코딩하며, Xn이 임의의 n개의 아미노산의 인접 서열인, 방법.
  86. 합성 아넬로좀 제제의 제조 방법으로서, 상기 방법이
    c) 제1항 내지 제68항 중 어느 한 항에 따른 복수의 합성 아넬로좀, 제69항 내지 제71항 중 어느 한 항의 약제학적 조성물 또는 제74항 내지 제79항 중 어느 한 항의 반응 혼합물을 제공하는 단계;
    d) 선택적으로 복수의 아넬로좀을 본원에 기재된 오염물질, 광학 밀도 측정치(예를 들어, OD 260), (예를 들어, HPLC에 의한) 입자 개수, 감염성(예를 들어, 입자:감염성 유닛 비) 중 하나 이상에 대하여 평가하는 단계; 및
    c) 예를 들어, (b)의 파라미터 중 하나 이상이 특정 임계값을 만족한다면, 복수의 합성 아넬로좀을 예를 들어, 대상체로의 투여에 적합한 약제학적 조성물로서 제형화하는 단계를 포함하는, 방법.
  87. 숙주 세포로서:
    (i) 제1항 내지 제86항 중 어느 한 항의 합성 아넬로좀의 유전 요소의 핵산 서열을 포함하는 제1 핵산 분자, 및
    (ii) 선택적으로, 표 C1 내지 표 C5중 어느 하나에 열거된 바와 같은 ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 또는 ORF1/2로부터 선택되는 아미노산 서열 또는 이에 대하여 적어도 85% 서열 동일성을 갖는 아미노산 서열 중 하나 이상을 인코딩하는 제2 핵산 분자를 포함하는, 숙주 세포.
  88. 포유동물 세포로의 외인성 이펙터(예를 들어, 치료적 외인성 이펙터)의 운반 방법으로서:
    (a) 제1항 내지 제87항 중 어느 한 항의 합성 아넬로좀을 제공하는 단계; 및
    (b) 포유동물 세포를 합성 아넬로좀과 접촉시키는 단계를 포함하며;
    합성 아넬로좀이 유전 요소를 포유동물 세포 내로 운반할 수 있으며;
    선택적으로, 숙주 세포에서 유전 요소를 단백질성 외부 내에 봉입하기에 적합한 조건 하에서, 유전 요소를 숙주 세포 내로 도입함으로써 합성 아넬로좀이 생성되며;
    이렇게 함으로써 치료적 외인성 이펙터를 포유동물 세포에 운반하는, 방법.
  89. 상기 유전 요소를 숙주 세포에 운반하기 위한 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 또는 제69항 내지 제71항 중 어느 한 항의 약제학적 조성물의 용도.
  90. 대상체에서 질병 또는 장애를 치료하기 위한 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 또는 제69항 내지 제71항 중 어느 한 항의 약제학적 조성물의 용도.
  91. 제90항에 있어서, 상기 질병 또는 장애가 면역 장애, 인터페론병증(interferonopathy)(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는 용도.
  92. 대상체에서 질병 또는 장애를 치료하는 데 사용하기 위한, 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 또는 제69항 내지 제71항 중 어느 한 항의 약제학적 조성물.
  93. 대상체에서의 질병 또는 장애의 치료 방법으로서, 상기 방법이 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 또는 제69항 또는 제71항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하며, 상기 질병 또는 장애가 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는 방법.
  94. 대상체에서 질병 또는 장애를 치료하기 위한 의약의 제조에서의 제1항 내지 제68항 중 어느 한 항의 합성 아넬로좀 또는 제69항 내지 제71항 중 어느 한 항의 약제학적 조성물의 용도로서, 선택적으로, 상기 질병 또는 장애가 면역 장애, 인터페론병증(예를 들어, I형 인터페론병증), 감염성 질병, 염증성 장애, 자가면역 질환, 암(예를 들어, 고형 종양, 예를 들어, 폐암) 및 위장 장애로부터 선택되는, 용도.
KR1020217021777A 2018-12-12 2019-12-12 아넬로좀 및 사용 방법 KR20210131310A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862778866P 2018-12-12 2018-12-12
US201862778841P 2018-12-12 2018-12-12
US62/778,866 2018-12-12
US62/778,841 2018-12-12
PCT/US2019/065995 WO2020123816A2 (en) 2018-12-12 2019-12-12 Anellosomes and methods of use

Publications (1)

Publication Number Publication Date
KR20210131310A true KR20210131310A (ko) 2021-11-02

Family

ID=69165586

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217021777A KR20210131310A (ko) 2018-12-12 2019-12-12 아넬로좀 및 사용 방법

Country Status (11)

Country Link
US (1) US20220042042A1 (ko)
EP (1) EP3894570A2 (ko)
JP (1) JP2022513797A (ko)
KR (1) KR20210131310A (ko)
CN (1) CN113631716A (ko)
AU (1) AU2019397058A1 (ko)
BR (1) BR112021011124A2 (ko)
CA (1) CA3121528A1 (ko)
IL (1) IL283782A (ko)
MX (1) MX2021006977A (ko)
WO (1) WO2020123816A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201160A1 (en) 2017-04-28 2018-11-01 Agrospheres, Inc. Compositions and methods for enzyme immobilization
MX2019012845A (es) 2017-04-28 2019-11-28 Agrospheres Inc Composiciones y metodos para encapsular y administrar agroquimicos de forma escalable.
WO2019060903A1 (en) 2017-09-25 2019-03-28 Agrospheres, Inc. COMPOSITIONS AND METHODS FOR PRODUCING AND EVOLVING ADMINISTRATION OF BIOLOGICAL PRODUCTS

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6395472B1 (en) * 1999-02-05 2002-05-28 Abbott Laboratories Methods of utilizing the TT virus
MX2016007324A (es) * 2013-12-12 2017-03-06 Broad Inst Inc Suministro, uso y aplicaciones terapeuticas de los sistemas y composiciones crispr-cas para actuar sobre hbv y trastornos y enfermedades virales.
RU2020100074A (ru) * 2017-06-13 2021-08-03 Флэгшип Пайониринг Инновейшнз V, Инк. Композиции, содержащие куроны, и пути их применения

Also Published As

Publication number Publication date
AU2019397058A1 (en) 2021-06-10
IL283782A (en) 2021-07-29
CA3121528A1 (en) 2020-06-18
BR112021011124A2 (pt) 2022-03-15
WO2020123816A3 (en) 2020-08-06
EP3894570A2 (en) 2021-10-20
MX2021006977A (es) 2021-10-13
US20220042042A1 (en) 2022-02-10
CN113631716A (zh) 2021-11-09
JP2022513797A (ja) 2022-02-09
WO2020123816A2 (en) 2020-06-18

Similar Documents

Publication Publication Date Title
US11446344B1 (en) Anellovirus compositions and methods of use
US20230279423A1 (en) Compositions comprising curons and uses thereof
KR20210125990A (ko) 단백질 대체 치료 양식을 운반하기 위한 아넬로좀
KR20210131310A (ko) 아넬로좀 및 사용 방법
KR20210131309A (ko) 분비형 치료 양식을 운반하기 위한 아넬로좀
KR20210131308A (ko) 세포내 치료 양식을 운반하기 위한 아넬로좀
KR20230036109A (ko) 바큘로바이러스 발현 시스템
KR20230124682A (ko) Rna를 봉입하는 아넬로바이러스 캡시드의 시험관 내어셈블리
KR20230041686A (ko) 아넬로바이러스를 확인 및 특징화하는 방법 및 이의 용도
KR20230036110A (ko) 탠덤 아넬로바이러스 구축물
KR20230146560A (ko) 하이브리드 aav-아넬로벡터

Legal Events

Date Code Title Description
A201 Request for examination