KR20230040353A - 유전 장애를 위한 핵산 치료제 - Google Patents

유전 장애를 위한 핵산 치료제 Download PDF

Info

Publication number
KR20230040353A
KR20230040353A KR1020237005223A KR20237005223A KR20230040353A KR 20230040353 A KR20230040353 A KR 20230040353A KR 1020237005223 A KR1020237005223 A KR 1020237005223A KR 20237005223 A KR20237005223 A KR 20237005223A KR 20230040353 A KR20230040353 A KR 20230040353A
Authority
KR
South Korea
Prior art keywords
virus
composition
nucleic acid
protein
simian
Prior art date
Application number
KR1020237005223A
Other languages
English (en)
Inventor
크리스천 마트랑가
켈시 에이. 호
안드레이 제이. 자루
제임스 로빈스 애비셔
캐서린 제이. 윌리암스
Original Assignee
그린라이트 바이오사이언시스, 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그린라이트 바이오사이언시스, 아이엔씨. filed Critical 그린라이트 바이오사이언시스, 아이엔씨.
Publication of KR20230040353A publication Critical patent/KR20230040353A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7115Nucleic acids or oligonucleotides having modified bases, i.e. other than adenine, guanine, cytosine, uracil or thymine
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5123Organic compounds, e.g. fats, sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16211Human Immunodeficiency Virus, HIV concerning HIV gagpol
    • C12N2740/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/70Vectors containing special elements for cloning, e.g. topoisomerase, adaptor sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/20Vector systems having a special element relevant for transcription transcription of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Dermatology (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Immunology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

생체외 또는 생체내에서 표적 세포로 하나 이상의 트랜스진을 전달하기 위한, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 긴 말단 반복부 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 핵산 분자를 포함하는 레트로바이러스 (예를 들어, 렌티바이러스)에 기초한 조성물이 본원에 제공된다. 조성물은 유전자 발현과 관련된 임의의 장애 (예를 들어, 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 B, 색소성 망막염, 뒤시엔느 근이영양증, 낭성 섬유증, 암 등)와 연관된 증상을 치료 및/또는 호전시키기 위해 생물학적 효과를 갖는 임의의 트랜스진 (예를 들어, 베타-글로빈, 인자 VIII, RP GTPase 조절인자 (RPGR), 디스트로핀, 낭성 섬유증 막횡단 전도도 조절인자 (CFTR), 키메라 항원 수용체 등)을 표적 세포 (예를 들어, 조혈 줄기 세포 (HSC), 간 세포, 안구 세포, 근육 세포, 상피 세포, T 세포 등)에 전달하고/거나 안정적으로 발현하는데 유용하다.

Description

유전 장애를 위한 핵산 치료제
현재의 유전자 요법 접근법의 예에는 도 2에 나타낸 바와 같은 CRISPR-기반 시스템, 예컨대 CRISPR/Cas9, 레트로바이러스, 렌티바이러스, 헤르페스바이러스, 아데노바이러스 및 아데노-연관 바이러스 (AAV)가 포함되나 이에 제한되지는 않는다. 이들 다양한 접근법에는 많은 이점이 있지만, 상당한 한계도 존재한다. 예를 들어, 레트로바이러스 및 일부 CRISPR-기반 시스템은 일반적으로 성공하기 위해 세포 분열 및 상동성 재조합을 필요로 하며, 따라서 비-분열 세포에서는 기능하지 않는다. AAV에서, 트랜스진 크기 제한이 있어, 용량 및 유용성을 효과적으로 제한한다. 아데노바이러스의 다른 제한은, 예를 들어, 제한된 효능으로 인한 높은 용량과 연관된 독성 및 바이러스에 대한 면역 반응으로 인한 반복 투약의 유효성 감소를 포함한다. 더욱이, 치료적 용량에 대한 바이러스의 생산은 상당한 비용이 들 수 있다.
도 2에 나타낸 바와 같이, 렌티바이러스는 이전에 유전자 요법 프로그램을 위한 모델로서 사용되어 왔다. 렌티바이러스는 광범위한 숙주를 감염시키고 때때로 잠복 DNA 형태로 게놈에 통합되는 ssRNA 게놈 바이러스 (예를 들어, HIV)이다. 현재의 유전자 요법 프로그램에서, 렌티바이러스 입자는 더 안전한 스플릿 구축물 설계를 사용하여 생산된다. 예를 들어, 3세대 설계는 4개의 플라스미드를 사용하는 유전자 요법을 수반한다: 관심 유전자를 운반하고 게놈에 통합되는 전달 플라스미드, 입자 형성, 역전사 및 통합 기능을 제공하는 패키징 플라스미드, 광범위한 숙주 범위를 제공하는 외피 플라스미드, 및 mRNA의 핵 외수송을 제공하는 플라스미드. 렌티바이러스 접근법의 일반적인 한계는 바이러스의 생산이 느리고 비용이 많이 드는 세포 확장을 필요로 하고, 바이러스 입자의 프로세싱이 비효율적이라는 것이다.
그러므로, 오늘날 이용가능한 것보다 개선된 유전자 전달 시스템에 대한 필요성이 남아있다.
생체내 유전자 요법을 위한 핵산 조성물이 본원에 개시되어 있다. 조성물은 트랜스진-코딩 핵산 분자, 역전사효소 및/또는 인테그라제를 발현하는 핵산 분자를 제공하고, 트랜스진의 역전사 및 통합을 지원하는 보조 핵산 분자를 함유할 수 있고, 전달 시스템을 함유할 수 있는 최소 설계를 포함한다. 조성물은 레트로바이러스 rev env 유전자에 의해 코딩되는 단백질을 발현하는 핵산 서열을 필요로 하지 않는다. 그러나, 조성물은 레트로바이러스 rev 유전자, 레트로바이러스 env 유전자, 또는 둘 다에 의해 코딩되는 하나 이상의 단백질을 발현하는 핵산 서열을 함유할 수 있다. 본 발명은 또한 핵산 분자, 사용 방법, 치료 방법, 핵산 주형, 세포 및 키트를 제공한다. 본 발명은 또한 핵산의 안정성 및/또는 기능 및/또는 코딩된 단백질의 안정성 및/또는 기능을 증가시키기 위한 변형을 제공한다. 이들 변형은 하나 이상의 내재적 불안정성 (INS) 요소의 돌연변이; N-말단 메티오닌-글리신 디펩티드를 갖는 기능적 유닛, 예컨대 인테그라제; 귀소 단백질에 기능적 유닛, 예컨대 인테그라제의 융합체; 숙주 세포에서의 발현을 위한 코돈 최적화의 사용; 및/또는 프라이밍 올리고뉴클레오티드의 사용을 포함할 수 있다. 다른 변형은 본원에 개시된 바와 같다.
본 발명의 일부 측면은 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자를 포함한다. 본 발명의 일부 측면은 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 Pol 폴리단백질의 하나 이상의 단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자를 포함하지만, 레트로바이러스 rev 유전자 및 레트로바이러스 env 유전자 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 포함하지 않는다. 본 발명의 일부 측면은 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자를 포함하지만, 레트로바이러스 rev env 유전자 둘 다에 의해 코딩되는 단백질을 발현하는 핵산 서열을 포함하지 않는다. 본 발명의 일부 측면은 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자를 포함하고, 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있다. Pol 폴리단백질 성분의 발현은 반드시 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하는 것은 아니다. Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 5' UTR, Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자일 수 있다. 대안적으로, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소 및 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자일 수 있다. Pol 폴리단백질 성분 역전사효소 및 인테그라제는 폴리시스트론성 구축물 상에 발현될 수 있다. 일부 실시양태에서, 폴리시스트론성 구축물은 바이시스트론성이다. 일부 실시양태에서, 폴리시스트론성 구축물은 트리시스트론성이다. Pol 폴리단백질 성분 역전사효소 및 인테그라제는 하나 이상의 폴리시스트론성 요소와 함께 발현될 수 있다. 폴리시스트론성 요소는 개재 내부 리보솜 진입 부위 (IRES), 2A 펩티드-코딩 서열, 또는 다른 폴리시스트론성 요소일 수 있다. Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 2개의 핵산 분자일 수 있으며, 여기서 이들 중 하나는 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소를 코딩하는 핵산 서열, 및 3' UTR을 포함하고, 다른 하나는 5' UTR, 적어도 Pol 폴리단백질 성분 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함한다. 도 3-5c는 본 발명의 일부 측면의 예시적인 실시양태를 예시한다.
본 발명의 일부 측면은 비-바이러스 전달 시스템에 패키징된 조성물을 제공하며, 여기서 조성물은 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자; 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자를 포함한다. 본 발명의 일부 측면은 비-바이러스 전달 시스템에 패키징된 조성물을 제공하며, 여기서 조성물은 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자; 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자를 포함하지만, 레트로바이러스 rev 유전자 및 레트로바이러스 env 유전자 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 포함하지 않는다. 본 발명의 일부 측면은 비-바이러스 전달 시스템에 패키징된 조성물을 제공하며, 여기서 조성물은 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자; 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자를 포함하지만, 레트로바이러스 rev env 유전자 둘 다에 의해 코딩되는 단백질을 발현하는 핵산 서열을 포함하지 않는다. 본 발명의 일부 측면은 비-바이러스 전달 시스템에 패키징된 조성물을 제공하며, 여기서 조성물은 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자, 및 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자를 포함하고, 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있다.
일부 측면에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 하나 이상의 기능적 유닛을 코딩하는 핵산 서열을 포함한다. 일부 측면에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 또한 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 포함할 수 있다. 하나 이상의 부속 단백질은 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 매트릭스 단백질 (MA), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택될 수 있다. 일부 측면에서, 부속 단백질은 하나 이상의 돌연변이를 함유할 수 있다. 일부 측면에서, CA는 돌연변이체 CA이다. 일부 측면에서, 돌연변이체 CA는 N74D 및/또는 E45A 돌연변이를 갖고, 넘버링은 야생형 HIV-1 캡시드 단백질에 상응한다. 일부 측면에서, 야생형 HIV-1 균주는 NL4-3일 수 있다. 일부 측면에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 또한 하나 이상의 Gag 폴리단백질 부속 단백질 (즉, Gag 폴리단백질 성분인 부속 단백질)을 코딩하는 핵산 서열을 포함할 수 있다. 하나 이상의 부속 단백질은 Pol 폴리단백질 성분과 동일한 핵산 분자 상에 코딩될 수 있다. 하나 이상의 부속 단백질은 또한 하나 이상의 폴리시스트론성 요소와 함께 발현될 수 있다. 폴리시스트론성 요소는 개재 IRES, 2A 펩티드-코딩 서열, 또는 다른 폴리시스트론성 요소일 수 있다. 대안적으로, 하나 이상의 부속 단백질은 Pol 폴리단백질 성분을 코딩하는 핵산 분자와 상이한 하나 이상의 핵산 분자에 의해 코딩될 수 있으며, 여기서 각 핵산 분자는 5' UTR 및 3' UTR을 포함한다. 일부 실시양태에서, Gag 폴리단백질 부속 단백질은 NC, CA, MA 및 p6으로부터 선택될 수 있다. 일부 실시양태에서, Gag 폴리단백질 부속 단백질은 Gag 폴리단백질에 의해 코딩될 수 있다. 다른 실시양태에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 Gag 폴리단백질을 코딩하지 않는다. 일부 실시양태에서, 부속 단백질 MA는 임의의 핵산 분자에 의해 코딩되지 않는다. 일부 실시양태에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 gag-pol 유전자를 포함한다. 일부 실시양태에서, gag-pol 유전자는 프레임시프트 돌연변이를 포함한다. 일부 실시양태에서, 프레임시프트 돌연변이는 단일 뉴클레오티드 삽입 또는 결실이다.
본 발명의 일부 측면은 Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 하나 이상의 핵산 분자를 제공하며, 이는 핵산 분자의 안정성을 증가시키고/거나 코딩된 단백질의 안정성을 증가시키도록 변형된다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 RNA 분자 (예를 들어, mRNA 분자)이고, RNA 분자 (예를 들어, mRNA 분자)의 안정성을 증가시키기 위한 하나 이상의 변형을 임의로 포함할 수 있다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 DNA 분자이고, DNA 분자 및/또는 상응하는 mRNA 분자의 안정성을 증가시키기 위한 하나 이상의 변형을 임의로 포함할 수 있다. 일부 실시양태에서, 하나 이상의 Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 핵산 분자는 하나 이상의 내재적 불안정성 (INS) 요소에 하나 이상의 돌연변이를 포함한다. 하나 이상의 INS 요소는 TAGAT, ATAGA, AAAAG, ATAAA, TTATA 등으로부터 선택될 수 있다. 일부 실시양태에서, INS 요소의 코돈은 INS 요소가 변경 또는 제거되는 동안 기능적 단백질 서열이 보존되도록 (즉, 침묵 돌연변이) 동일한 아미노산에 대한 대체 코돈으로 돌연변이된다. 일부 실시양태에서, 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 N-말단 메티오닌-글리신 디펩티드를 포함하는 인테그라제 폴리펩티드를 코딩한다. 일부 실시양태에서, 하나 이상의 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 5' 말단에서 메티오닌-글리신 디펩티드를 코딩하고, 일부 실시양태에서 하나 이상의 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 메티오닌-글리신 디펩티드를 내부적으로 코딩한다.
본 발명의 일부 측면은 하나 이상의 Pol 폴리단백질 성분 (예를 들어, 인테그라제)이 귀소 단백질에 융합되며, 이는 성분, 예컨대 인테그라제를 숙주 세포의 특이적 서열로 지정할 수 있음을 제공한다. 일부 실시양태에서 귀소 단백질은 회문 서열을 인식하고, 일부 실시양태에서 귀소 단백질은 제한 부위를 인식한다. 일부 실시양태에서 귀소 단백질은 제한 효소이다. 일부 실시양태에서 제한 효소는 I-PpoI이다. 일부 실시양태에서 귀소 단백질은 뉴클레아제-불활성화된 제한 효소이다. 일부 실시양태에서, 귀소 단백질은 I-PpoI N119A이다.
본 발명의 일부 측면은 예를 들어 조성물의 하나 이상의 핵산 분자가 숙주 세포에서의 발현을 위해 코돈 최적화됨을 제공함으로써 숙주 세포에서 증가된 번역을 제공한다. 일부 측면에서, 숙주 세포는 포유동물 세포이다. 일부 측면에서, 숙주 세포는 인간 세포이다. 일부 측면에서, 숙주 세포는 조류 세포이다.
본 발명의 일부 측면은 조성물이 프라이밍 올리고뉴클레오티드를 추가로 포함함을 제공한다. 일부 실시양태에서, 프라이밍 올리고뉴클레오티드는 GUCCCUGUUCGGGCGCCA (서열식별번호(SEQ ID NO): 18) 또는 GTCCCTGTTCGGGCGCCA (서열식별번호: 19)이다. 일부 실시양태에서, 프라이밍 올리고뉴클레오티드는 역전사효소 프라이밍 요소에 대해 상보적인 조작된 서열일 수 있다.
본 발명의 일부 측면은 핵산 분자가 RNA 분자 또는 DNA 분자임을 제공한다. 예를 들어, 핵산 분자는 ssDNA 분자, dsDNA 분자, ssRNA 분자 또는 dsRNA 분자일 수 있다.
본 발명의 일부 측면은 하나 이상의 트랜스진을 포함하는 핵산 분자가 2개 이상의 트랜스진을 포함할 수 있음을 제공하며, 여기서 트랜스진은 하나 이상의 폴리시스트론성 요소에 의해 분리된다. 폴리시스트론성 요소는 하나 이상의 IRES 및/또는 2A 펩티드를 코딩하는 하나 이상의 서열 및/또는 다른 폴리시스트론성 요소일 수 있다. 이 핵산 분자는 하나 이상의 인핸서를 포함할 수 있다. 예를 들어, 하나 이상의 인핸서는 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 포함할 수 있다.
본 발명의 일부 측면은 핵산 분자가 RNA 분자이고, 변형된 리보뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함함을 제공한다. 일부 실시양태에서, 변형된 리보뉴클레오시드는 슈도우리딘 또는 슈도우리딘의 유도체 (예를 들어, N1-메틸슈도우리딘)이다. 일부 실시양태에서, 변형된 리보뉴클레오시드는 N6-메틸아데노신이다. 다른 실시양태에서, 하나 이상의 트랜스진을 포함하는 핵산 분자는 RNA 분자일 수 있고, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 추가로 포함할 수 있다.
본 발명의 일부 측면은 Pol 폴리단백질 성분, 부속 단백질 및/또는 LTR이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 노랑가슴 카푸친 시미안 포말상 바이러스, 또는 임의의 이들의 조합으로부터의 Pol 폴리단백질 성분, 부속 단백질 및/또는 LTR에 기초한 것임을 포함한다. 본 발명의 다른 측면은 핵산 분자가 비-바이러스 전달 시스템에 패키징됨을 제공한다. 예를 들어, 이들은 지질 나노입자에 패키징될 수 있다.
본 발명의 측면은 하나 이상의 프로모터가 하나 이상의 조직-특이적 또는 세포-특이적 프로모터를 포함함을 제공한다. 예를 들어, 프로모터는 골수, 조혈 줄기 세포 (HSC), 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포에 특이적일 수 있다. 하나 이상의 프로모터는 hCMV 프로모터를 포함할 수 있다.
본 발명의 일부 측면은 하나 이상의 트랜스진이 하나 이상의 치료적 단백질, 진단적 단백질 또는 리포터 단백질, 또는 그의 단편을 코딩함을 제공한다. 예를 들어, 하나 이상의 트랜스진은 하나 이상의 치료적 단백질, 진단적 단백질 또는 리포터 단백질, 또는 그의 단편을 코딩할 수 있다. 치료적 단백질은 베타-글로빈, 낭성 섬유증 막횡단 전도도 조절인자 (CFTR), 인자 VIII, 디스트로핀, 또는 RP GTPase 조절인자 (RPGR)일 수 있다. 리포터 단백질은 형광 단백질 또는 루시페라제일 수 있다.
본 발명의 다른 측면은 비-바이러스 전달 시스템이 특이적 조직 또는 세포 유형으로 표적화됨을 제공한다. 특이적 조직 또는 세포 유형은 골수, HSC, 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포일 수 있다. 비-바이러스 전달 시스템은 지질 나노입자, 리포솜, 폴리펩티드 나노입자, 실리카 나노입자, 금 나노입자, 중합체성 나노입자, 덴드리머, 양이온성 나노에멀젼, 무기 담체 (예컨대 CaP), 중합체 및 지질 하이브리드 담체이다.
유전자 발현을 필요로 하는 대상체에서 유전자를 발현하는 방법이 또한 제공되며, 여기서 방법은 상기 언급된 핵산 또는 그의 조성물 (예를 들어, 지질 나노입자)의 유효량을 대상체에게 투여하는 것이 대상체에서 하나 이상의 트랜스진의 발현을 초래함을 포함한다. 방법은 핵산을 세포에 전달함으로써 세포에서 유전자를 발현함을 초래한다. 방법은 핵산 또는 그의 조성물 (예를 들어, 지질 나노입자)을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현함으로써 핵산 또는 그의 조성물 (예를 들어, 지질 나노입자)을 사용하는 것을 포함할 수 있다.
본 발명의 측면은 핵산 또는 그의 조성물 (예를 들어, 지질 나노입자)을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현함으로써 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법을 제공한다. 치료될 질환 또는 병태는 유전 질환 또는 병태일 수 있다. 질환 또는 병태는 유전적 유전 질환 또는 병태일 수 있다. 질환 또는 병태는 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 B, 색소성 망막염, 뒤시엔느 근이영양증, 낭성 섬유증, 또는 암일 수 있다.
본 발명의 일부 측면은 하나 이상의 트랜스진이 표적 세포의 게놈에 통합됨을 제공한다. 예를 들어, 하나 이상의 트랜스진은 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 6개월, 적어도 1년 동안, 또는 대상체의 평생 동안 안정적으로 발현될 수 있다.
본 발명의 일부 측면은 핵산 또는 그의 조성물 (예를 들어, 지질 나노입자)의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현함으로써 면역 반응의 도출을 필요로 하는 대상체에서 면역 반응을 도출하는 방법을 제공한다. 예를 들어, 대상체는 암을 가질 수 있고, 하나 이상의 트랜스진은 종양 항원을 코딩한다. 대안적으로, 대상체는 감염성 질환을 갖거나 걸릴 위험이 있을 수 있고, 하나 이상의 트랜스진은 감염성 질환과 연관된 항원을 코딩한다. 실시양태는 핵산의 국부적 또는 전신적 전달을 포함한다.
본 발명의 측면은 또한 5' UTR, 하나 이상의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 하나 이상의 핵산 주형을 제공하며, 여기서 Pol 폴리단백질 성분의 발현은 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하지 않는다. 본 발명의 다른 측면은 5' UTR, 프레임시프트 돌연변이를 포함하는 gag-pol 유전자를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 하나 이상의 핵산 주형을 제공한다. 본 발명의 또 다른 측면은 5' UTR, gag-pol 유전자를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 하나 이상의 핵산 주형을 제공하며, 여기서 gag-pol 유전자는 매트릭스 단백질을 코딩하지 않는다. 핵산 주형은 또한 MA, p6, NC, CA, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 포함할 수 있다. 일부 실시양태에서, 주형의 Pol 폴리단백질 성분 및/또는 부속 단백질은 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 노랑가슴 카푸친 시미안 포말상 바이러스, 또는 임의의 이들의 조합으로부터의 Pol 폴리단백질 및 부속 단백질에 기초한다. 핵산, 예컨대 RNA를 생산하는 방법이 또한 제공되며, 여기서 방법은 핵산 주형의 시험관내 전사를 포함한다.
본 발명의 다른 측면은 상기 언급된 핵산 또는 핵산 주형을 포함하는 키트를 제공한다. 핵산 또는 핵산 주형은 하나 이상의 컨테이너에 제공될 수 있다.
본 발명의 다른 이점, 특징 및 용도는 특정한 예시적이고 비제한적인 실시양태의 상세한 설명; 도면; 비제한적인 실시예; 및 청구범위로부터 명백할 것이다.
도 1은 mRNA-기반 유전자 요법 플랫폼에 대한 접근법을 개관하는 개략도이다.
도 2는 유전자 요법에 대한 현재의 접근법의 예 및 각 접근법과 연관된 주요 이점 및 과제를 기술하는 표이다.
도 3은 트랜스진-코딩 전달 핵산 설계의 예시적인 실시양태를 개관하는 개략도이다. RNA 생산 요소는 RNA 폴리머라제 프로모터 (예를 들어, T7 RNA 폴리머라제 프로모터) 및 주형 선형화를 위한 제한 소화 부위를 포함한다.
도 4는 정규 설계와 비교하여 역전사 및 통합 복합체 설계의 예시적인 실시양태를 예시하는 개략도이다. Pol 폴리단백질은 정규 설계로부터의 인라인 gag/pol 설계와 비교하여 별도의 구축물로부터 생산되므로, 번역 미끄러짐이 더 이상 필요하지 않다. 일부 실시양태에서, 하나 이상의 부속 레트로바이러스 단백질은 Pol 폴리단백질과 함께 시스로 코딩된다. RNA 생산 요소는 RNA 폴리머라제 프로모터 (예를 들어, T7 RNA 폴리머라제 프로모터) 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다.
도 5a-5c는 역전사 및 통합 기계류 설계의 예시적인 실시양태를 예시하며, 여기서 Pol 폴리단백질 성분은 하나 이상의 핵산 분자 상에 별도의 단백질로서 코딩된다. RNA 생산 요소는 RNA 폴리머라제 프로모터 (예를 들어, T7 RNA 폴리머라제 프로모터) 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 도 5a는 프로테아제 (PR), 역전사효소/RNase H (RT) 및 인테그라제 (IN)가 각각 단일 핵산 구축물 상에 코딩되고 각 성분이 PR에 의한 오토프로세싱에 의해 분리되는 예시적인 실시양태를 예시하는 개략도이다. 도 5b는 개별 유닛 RT 및 IN이 바이시스트론성 구축물 상에 있는 예시적인 실시양태를 예시하는 개략도이다. 도 5c는 개별 유닛 RT 및 IN이 별도의 구축물 상에 있는 예시적인 실시양태를 예시하는 개략도이다.
도 6은 mRNA-기반 유전자 요법 접근법을 도시하는 또 다른 개략도이다. 역전사 및 통합에 필요한 바이러스 기계류 (예를 들어, 바이러스 효소 및/또는 하나 이상의 부속 단백질) 및 트랜스진은 별도의 RNA 상에 제공된다. 임의로 표면 마커를 사용하는 비-바이러스 전달 시스템은 RNA를 표적 세포에 전달하는데 사용된다. 트랜스진-코딩 RNA는 렌티벡터 '게놈' RNA로도 지칭된다. 트랜스진의 발현은 바이러스 효소의 번역, 렌티벡터 '게놈' RNA의 DNA로의 전환, 및 표적 세포에서 DNA의 게놈 DNA로의 통합에 의존하며, 이는 트랜스진의 오래 지속되는 발현을 초래한다.
도 7a 및 7b는 RNA-유래 기능적 유닛이 트랜스진-코딩 RNA로부터 리포터 유전자 발현을 구동함을 보여준다. 도 7a는 기능적 유닛, Gag 폴리단백질 RNA 및 Pol 폴리단백질 RNA (기능적 유닛 mRNA), 및 트랜스진-코딩 RNA ('게놈' RNA)의 개략도를 보여준다. 도 7b는 기능적 유닛 RNA로 형질감염된 경우 리포터 트랜스진의 발현을 보여준다.
도 8a-8d는 최적화된 기능적 유닛 RNA가 향상된 발현을 나타내고 표적 소기관에 국재화됨을 보여준다. 도 8a는 WT 인테그라제 (IN); 안정화된 Met-Gly, 인간 코돈 최적화된 (hCO) IN; 및 안정화된 Met-Gly hCO ΔINS IN를 코딩하는 RNA 구축물을 도시하는 개략도이다. 도 8b는 폴리아데닐화 전 및 후의 Met-Gly, hCO ΔINS IN mRNA의 모세관 전기영동도를 보여준다. 도 8c는 WT IN mRNA, Met-Gly hCO IN mRNA; 및 Met-Gly hCO ΔINS IN mRNA의 발현의 웨스턴 블롯 분석을 보여준다. 도 8d는 293FT 세포로의 RNA 형질감염 후 최적화된 인테그라제의 세포하 국재화를 보여주는 공초점 현미경법 이미지를 보여준다.
도 9는 역전사효소가 개별 p51 및 p66 서브유닛으로서 코딩되는 예시적인 실시양태를 예시한다.
도 10은 부위-지정 게놈 통합을 위해 인테그라제가 귀소 단백질에 융합된 예시적인 실시양태를 예시한다. 인테그라제는 Pol 폴리단백질의 일부로서 발현될 때 또는 개별 유닛으로서 발현될 때 귀소 단백질에 융합될 수 있다.
본 개시내용의 일부 측면에 따라, 최소 설계 핵산 조성물은 생체내 유전자 요법에 효과적이다. 이 최소 설계는 느리고 비용이 많이 드는 세포 내 확장에 의해 바이러스를 생산해야 하는 필요성; 및 비효율적일 수 있는 바이러스 입자의 프로세싱에 대한 필요성을 포함하여 렌티바이러스 접근법의 일부 한계를 극복할 수 있다. 이들은 개시된 핵산 조성물의 이점의 예이며, 관련 기술분야의 통상의 기술자는 다른 이점을 인식할 것이다. 본 개시내용은 또한 핵산 분자, 사용 방법, 치료 방법, 핵산 주형, 세포 및 키트를 제공한다. 본 개시내용은 또한 핵산의 안정성 및/또는 기능, 및/또는 코딩된 단백질의 안정성 및/또는 기능을 증가시키기 위한 변형을 제공한다. 이들 변형은 하나 이상의 내재적 불안정성 (INS) 요소의 돌연변이; N-말단 메티오닌-글리신 디펩티드를 갖는 기능적 유닛, 예컨대 인테그라제; 귀소 단백질로의 기능적 유닛, 예컨대 인테그라제의 융합체; 숙주 세포에서의 발현을 위한 코돈 최적화의 사용; 및/또는 프라이밍 올리고뉴클레오티드의 사용을 포함할 수 있다. 다른 변형은 본원에 개시된 바와 같다.
일부 측면에서, 핵산 및 트랜스진 (예를 들어, 그러나 베타-글로빈, 낭성 섬유증 막횡단 전도도 조절인자 (CFTR), 인자 VIII, 디스트로핀, 또는 RP GTPase 조절인자 (RPGR)에 제한되지는 않음)의 전달을 위한 핵산의 조성물, 키트, 및 사용 방법이 본원에 제공된다. 일부 측면에서, 본 개시내용은 프로테아제 활성, 역전사, 및 트랜스진-코딩 핵산 분자의 통합을 제공하도록 프로세싱된 레트로바이러스 Pol 폴리단백질을 코딩하는 적어도 제1 핵산 분자, 및 하나 이상의 트랜스진의 표적 세포로의 전달을 위한 긴 말단 반복부 (LTR) 서열에 의해 플랭킹된 하나 이상의 트랜스진을 포함하는 적어도 제2 핵산 분자를 포함하는, 레트로바이러스 (예를 들어, 렌티바이러스)에 기초한 비-바이러스 조성물을 제공한다. 하나 이상의 트랜스진을 포함하는 핵산 분자는 또한 본원에서 "트랜스진-코딩 핵산 분자"로 지칭될 수 있다. 일부 측면에서, 본 개시내용은 역전사 및 통합 활성을 코딩하는 유닛을 포함하나 이에 제한되지는 않는 별도의 다중 기능적 유닛으로서 Pol 폴리단백질의 성분의 코딩을 제공한다. 이들 다중 기능적 유닛은 1개의 핵산 또는 2개 이상의 핵산 상에 코딩될 수 있다. Pol 폴리단백질의 프로테아제는 또한 다른 Pol 폴리단백질 성분 중 하나 이상과 동일한 또는 상이한 구축물 상에 코딩될 수 있거나, 필요한 효소적 활성 (예를 들어, 역전사효소, 인테그라제)이 바이러스 폴리단백질로서 코딩되지 않는 경우 생략될 수 있다. 일부 실시양태에서, Pol 폴리단백질 성분은 개재 폴리시스트론성 요소와 함께 하나 이상의 핵산 상에 코딩된다. 폴리시스트론성 요소는 IRES 및/또는 2A 서열 및/또는 다른 폴리시스트론성 요소일 수 있다. 일부 실시양태에서, 본 개시내용의 조성물은 트랜스진-코딩 핵산의 역전사 및 통합을 향상시킬 수 있는 하나 이상의 부속 레트로바이러스 단백질 (부속 단백질)을 코딩하는 하나 이상의 핵산 서열을 추가로 포함한다. 본원에서 사용된 바와 같은 "부속 단백질"은 트랜스진-코딩 핵산의 역전사 및/또는 통합을 향상시킬 수 있는 Pol 폴리단백질 성분 이외의 임의의 레트로바이러스 단백질을 지칭한다. 부속 단백질은 MA, CA, NC 및 Env를 포함하나 이에 제한되지는 않는 구조적 단백질, 또는 Tat, Rev, Nef, Vpr, Vpu 및 Vif를 포함하나 이에 제한되지는 않는 비-구조적 단백질일 수 있다. 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 핵산 서열은 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 상에 있을 수 있거나, Pol 폴리단백질 성분을 코딩하지 않는 하나 이상의 핵산 상에 있을 수 있다. 일부 실시양태에서, mRNA의 안정성은 예를 들어 하나 이상의 내재적 불안정성 (INS) 요소에 돌연변이를 도입함으로써 증가된다. 일부 실시양태에서, 번역된 단백질의 안정성은 예를 들어 N-말단 메티오닌-글리신 디펩티드를 혼입함으로써 증가된다. 일부 실시양태에서, mRNA의 번역 효율은 숙주 세포에서의 발현을 위한 코돈 최적화 (예를 들어, 인간 세포에서의 발현을 위한 코돈 최적화)를 사용하여 증가된다. 일부 실시양태에서, 본 개시내용의 단백질, 예컨대 인테그라제는 귀소 단백질에 융합된다. 일부 실시양태에서, 조성물은 프라이밍 올리고뉴클레오티드를 포함한다. 본 개시내용의 핵산 및 조성물은 세포, 조직, 장기 또는 대상체에 의한 하나 이상의 트랜스진의 생체외 또는 생체내 발현을 위해, 또는 재조합 단백질의 생산을 위한 시험관내 발현을 위해 사용될 수 있다. 또한, 핵산 분자는 비-바이러스 전달 시스템 (예를 들어, 지질 나노입자)으로 패키징될 수 있으며, 그러므로 세포 내 확장을 필요로 하고 느리고 비용이 많이 드는 바이러스 입자를 생산할 필요성을 회피하고, 바이러스-기반 접근법, 예컨대 면역원성과 연관된 위험을 회피할 수 있다.
정의
분자 및 세포 생화학의 일반적인 방법은 교과서, 예컨대 문헌 [Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., CSH Laboratory Press 2001)]; [Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999)]; [Protein Methods (Bollag et al., John Wiley & Sons 1996)]; [Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999)]; [Viral Vectors (Kaplift & Loewy eds., Academic Press 1995)]; [Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997)]; 및 [Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]에서 찾아볼 수 있으며, 이들의 개시내용은 본원에 참조로 포함된다.
항체 (복수형으로 상호교환적으로 사용됨)는 이뮤노글로불린 분자의 가변 영역에 위치된 적어도 하나의 항원 인식 부위를 통해 표적, 예컨대 탄수화물, 폴리뉴클레오티드, 지질, 폴리펩티드 등에 특이적으로 결합할 수 있는 이뮤노글로불린 분자이다. 본원에서 사용된 바와 같은 용어 "항체"는 무손상 (예를 들어, 전장) 폴리클로날 또는 모노클로날 항체, 뿐만 아니라 그의 항원-결합 단편 (예컨대 Fab, Fab', F(ab')2, Fv), 단일 쇄 (scFv), 그의 돌연변이체, 항체 부분을 포함하는 융합 단백질, 인간화 항체, 키메라 항체, 디아바디, 나노바디, 선형 항체, 단일 쇄 항체, 및 항체의 글리코실화 변이체, 항체의 아미노산 서열 변이체, 및 공유결합으로 변형된 항체를 포함하여 요구되는 특이성의 항원 인식 부위를 포함하는 이뮤노글로불린 분자의 임의의 다른 변형된 구성을 포함한다.
"발현 카세트" 또는 "핵산 주형"은 비번역 RNA 뿐만 아니라 유전자/코딩 관심 서열을 포함하여, DNA 또는 RNA의 생산을 위한 주형으로서 역할을 할 수 있는 임의의 핵산 구축물을 포함한다.
"폴리단백질"은 자연에서 발생할 수 있고 전형적으로 상이한 생물학적 기능을 갖는 구성요소 단백질로 절단되는 공유결합으로 결합된 더 작은 단백질을 포함하는 폴리펩티드를 지칭한다.
"Gag 폴리단백질"은 gag (그룹-특이적 항원) 유전자에 의해 코딩되는 전구체 폴리단백질을 지칭한다. Gag 폴리단백질은 성숙 동안 프로세싱되어 매트릭스 단백질 (MA), 캡시드 단백질 (CA), 스페이서 펩티드 1 (SP1), 뉴클레오캡시드 단백질 p7 (NC), 스페이서 펩티드 2 (SP2), 및 P6 단백질을 형성한다. 용어 "Gag 단백질" 및 "Gag 폴리단백질 성분"은 gag 유전자에 의해 코딩되는 하나 이상의 단백질, 즉 MA, CA, SP1, NC, SP2 또는 P6을 지칭한다.
"Pol 폴리단백질"은 pol 유전자에 의해 코딩되는 전구체 폴리단백질을 지칭한다. Pol 폴리단백질은 프로세싱되어 프로테아제 (PR), 역전사효소/RNase H (RT/RH) 및 인테그라제 (IN)를 형성한다. 각 성분은 PR에 의한 오토프로세싱에 의해 분리된다. 용어 "Pol 단백질" 및 "Pol 폴리단백질 성분"은 pol 유전자에 의해 코딩되는 하나 이상의 단백질, 즉 RT/RH, IN 또는 PR을 지칭한다.
2개의 핵산 서열의 "퍼센트 동일성"은 관련 기술분야에 공지된 임의의 방법에 의해 결정될 수 있다. 일부 실시양태에서, 2개의 핵산 서열의 퍼센트 동일성은 문헌 [Karlin and Altschul, Proc. Natl. Acad. Sci. USA 90:5873-77, 1993]에서와 같이 변형된 문헌 [Karlin and Altschul, Proc. Natl. Acad. Sci. USA 87:2264-68, 1990]의 알고리즘을 사용하여 결정된다. 이러한 알고리즘은 문헌 [Altschul et al., J. Mol. Biol. 215:403-10, 1990]의 NBLAST 및 XBLAST 프로그램 (버전 2.0)에 혼입된다. BLAST 뉴클레오티드 검색을 NBLAST 프로그램, 스코어=100, 단어 길이-12로 수행하여 표적 핵산에 대한 가이드 서열 상동성을 수득할 수 있다. 2개의 서열 사이에 갭이 존재하는 경우, Gapped BLAST는 문헌 [Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997]에 기재된 바와 같이 활용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 활용하는 경우, 각각의 프로그램의 디폴트 파라미터 (예를 들어, XBLAST 및 NBLAST)를 사용할 수 있다.
용어 "폴리시스트론성" 및 "멀티시스트론성"은 동일한 핵산 분자 내에 별도로 하나 초과의 폴리펩티드를 코딩하는 핵산 분자를 지칭하기 위해 상호교환적으로 사용된다. 예를 들어, 폴리시스트론성 mRNA는 동일한 전사체에서 하나 초과의 폴리펩티드를 코딩하는 mRNA이다. "폴리시스트론성 요소" 또는 "멀티시스트론성 요소"는 독립적인 번역 및/또는 번역후 프로세싱을 허용하기 위해 폴리시스트론성 핵산에서 개별 폴리펩티드를 분리하는 요소를 지칭한다.
용어 "폴리펩티드" 및 "단백질"은 펩티드 결합에 의해 연결된 아미노산 잔기의 중합체를 지칭하기 위해 상호교환적으로 사용되며, 본 개시내용의 목적을 위해 적어도 5개의 아미노산의 최소 길이를 갖는다. 5개 초과의 아미노산의 전장 단백질 및 그의 단편 둘 다가 정의에 포함된다. 용어는 또한 예를 들어, 디술피드-결합 형성, 글리코실화, 아세틸화, 인산화, 단백질분해적 절단 (예를 들어, 푸린 또는 메탈로프로테아제에 의한 절단) 등과 같은 폴리펩티드의 공동-번역 (예를 들어, 신호 펩티드 절단) 및 번역후 변형을 갖는 폴리펩티드를 포함한다. 또한, 본원에서 사용된 바와 같은 "폴리펩티드" 또는 "단백질"은 단백질이 기재된 방법의 목적과 관련된 원하는 활성을 유지하는 한, 천연 서열에 대한 변형, 예컨대 결실, 첨가 및 치환 (일반적으로 관련 기술분야의 통상의 기술자에게 공지된 바와 같이 본질적으로 보존적임)을 포함하는 단백질을 지칭한다. 이들 변형은 부위-지정 돌연변이유발을 통해 의도적으로 이루어질 수 있거나, 예컨대 단백질을 생산하는 숙주의 돌연변이 또는 PCR 증폭 또는 다른 재조합 DNA 방법으로 인한 오류를 통해 우발적일 수 있다.
본원에서 사용된 바와 같은 용어 "핵산" 또는 "핵산 분자"는 일반적으로 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)을 지칭한다. 일부 실시양태에서, "핵산"은 개별 핵산 잔기 (예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 개별 뉴클레오티드를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에서 사용된 바와 같은 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체 (예를 들어, 적어도 2개의 뉴클레오티드의 스트링)를 지칭하기 위해 상호교환적으로 사용될 수 있다. 핵산은 단일-가닥 또는 이중-가닥일 수 있다. 핵산 분자의 뉴클레오티드 단량체는 자연 발생 뉴클레오티드, 변형된 뉴클레오티드 또는 이들의 조합일 수 있다. 일부 실시양태에서, 변형된 뉴클레오티드는 당 모이어티 및/또는 피리미딘 또는 퓨린 염기의 변형을 포함한다.
용어 "대상체" 및 "환자"는 본원에서 상호교환적으로 사용된다. 일부 실시양태에서, 대상체는 포유동물이다. "포유동물"은 인간, 가축 및 농장 동물, 및 동물원, 스포츠 또는 애완 동물, 예컨대 개, 말, 고양이, 소, 양, 염소, 돼지, 낙타 등을 포함하여 포유동물로서 분류되는 임의의 동물을 지칭한다. 일부 실시양태에서, 포유동물은 인간이다. 일부 실시양태에서, 대상체는 조류이다.
본 개시내용의 조성물의 "치료 유효량"은 일반적으로 원하는 생물학적 반응, 예를 들어 표적 세포에서 트랜스진을 발현하고 병태를 치료하는 등의 반응을 도출하기에 충분한 양을 지칭한다. 관련 기술분야의 통상의 기술자가 이해하는 바와 같이, 본원에 기재된 작용제의 유효량은 인자, 예컨대 치료될 병태, 투여 방식, 및 대상체의 연령, 신체 조성 및 건강에 따라 달라질 수 있다.
용어 "트랜스진" 또는 "트랜스진 서열"은 관심 단백질 또는 RNA 산물을 코딩하는 외인성 뉴클레오티드 서열을 지칭한다.
용어 "치료하다", "치료하는", "치료" 및 "요법"은 대상체가 병태를 앓고 있는 동안 발생하는 행동으로서, 병태 (또는 병태와 연관된 증상)의 중증도를 감소시키거나 병태 (또는 병태와 연관된 증상)의 진행을 지연시키거나 늦추는 행동을 포함한다.
최소 유전자 요법 플랫폼
본 개시내용은 잠재적으로 무엇보다도 트랜스진-코딩 핵산의 역전사 및 통합을 제공하도록 프로세싱된 레트로바이러스 Pol 폴리단백질을 코딩하는 적어도 제1 핵산, 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진을 포함하는 적어도 제2 핵산 분자를 포함하는 최소 시스템을 사용하여 레트로바이러스 (예를 들어, 렌티바이러스) 기원의 핵산 분자가 트랜스진 (예를 들어, 유전자 요법에서 사용하기 위한)을 전달, 통합 및 안정적으로 발현하기 위해 사용될 수 있다는 발견에 부분적으로 기초한다. 일부 실시양태에서, Pol 폴리단백질의 성분은 하나 이상의 핵산 분자 상에 별도의 유닛으로서 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 시스템은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 실시양태에서, 최소 시스템은 2개의 핵산 분자, 역전사효소 및 인테그라제 기능을 제공하는 1개의 핵산 분자 (프로테아제로 프로세싱되는 폴리단백질로서, 또는 별도로 코딩된 유닛으로서), 및 하나 이상의 트랜스진을 코딩하는 1개의 핵산 분자를 포함한다. 일부 실시양태에서, 최소 시스템은 2개 이상의 핵산 분자 (예를 들어, 2, 3, 4 또는 5개 또는 그 초과)를 포함한다. 핵산 분자는 비-바이러스 전달 시스템 (예를 들어, 지질 나노입자)으로 패키징되며, 그러므로 바이러스 입자의 생산을 우회할 수 있으며, 이는 세포 내 확장을 필요로 하고 느리고 비용이 많이 들며, 바이러스-기반 접근법과 연관된 위험, 예컨대 면역원성을 회피할 수 있다.
본 개시내용의 조성물은 현재의 유전자 및 세포 요법 접근법에 비해 여러 장점을 갖는다. 현재의 유전자 요법 접근법, 예컨대 CRISPR/Cas9, 레트로바이러스, 렌티바이러스, 헤르페스바이러스, 아데노바이러스, 및 아데노-연관 바이러스 (AAV)와 연관된 과제의 일부는 도 2에 나타낸다. 기존 접근법과 비교하여, 본 개시내용의 조성물은 분열 및 비-분열 세포 둘 다에서 기능할 수 있고/거나, 높은 트랜스진 크기 용량 (예를 들어, 4-5 kb, 5-6 kb, 6-7 kb, 7-8 kb, 8-9 kb, 9-10 kb, 또는 4 kb 초과, 5 kb 초과, 6 kb 초과, 7 kb 초과, 8 kb 초과, 9 kb 초과, 또는 10 kb 초과)을 가질 수 있고/거나, 바이러스 및/또는 바이러스 입자의 값비싼 생산을 필요로 하지 않는다. 본 개시내용의 조성물은 또한 HIV-1 및 3세대 렌티바이러스 벡터와 연관된 일부 한계를 극복한다. HIV-1 벡터에서, HIV-1 라이프 사이클에 필요한 모든 성분은 단일 RNA 게놈 상에 있다. HIV-1 벡터는 또한 복제 감응성 (즉, 통합 후 복제할 수 있음)이고, 게놈의 바이러스 입자로의 패키징을 허용하는 패키징 신호를 갖고, HIV-1 mRNA에 대한 mRNA 핵 외수송 요소를 갖고, 시스에 바이러스 기계류를 갖는다. HIV-1 벡터는 생체내 사용을 배제하는 안전성 문제를 나타낸다. 한편, 차세대 lab-기반 렌티바이러스는 통합 단계 후 자가-불활성화, 별도의 구축물에 대한 트랜스의 바이러스 기계류, 및 프로모터/인핸서 영역을 갖는 트랜스진을 특징으로 한다. 그러나, 이들은 다중 플라스미드로 패키징 세포의 공동-형질감염을 필요로 하여, 비효율적인 바이러스 입자 생산을 초래한다. 부분적으로 패키징된 또는 잘못 패키징된 바이러스 입자는 또한 고도로 면역원성이다. 앞서 언급된 렌티바이러스 벡터에 대한 개선에서, 본원에 기재된 최소 RNA 설계는 입자 형성 또는 패키징을 필요로 하지 않으며, 일부 실시양태에서 별도의 구축물 상에 트랜스로 역전사 및 통합 기능만을 특징으로 한다. 역전사 및 통합 및 전달 (즉, 트랜스진-코딩) 기능을 제공하는 최소 성분만을 필요로 함으로써, 바이러스 입자가 자가-불활성화하고 생성을 우회하면서, 본 개시내용의 조성물은 현재의 렌티바이러스 접근법과 연관된 과제를 해결한다. 또한, 비-바이러스 전달 시스템은 표적화 모이어티로 쉽게 기능화될 수 있어 투여 및 핵산 합성 (예를 들어, RNA 합성)을 단순화할 수 있으며, 전달 시스템 생산은 무세포 둘 다일 수 있으므로, 제조 프로세스를 단순화할 수 있다.
본원에 기재된 조성물은 하기 기본 성분을 포함한다: 트랜스진-코딩 핵산의 역전사 (예를 들어 RT/RH) 및 통합 (예를 들어 IN)을 위한 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 핵산 분자. Pol 폴리단백질은 발현 및 프로세싱되어 트랜스진-코딩 핵산 분자의 프로테아제 활성 (예를 들어 PR 단백질), 역전사효소 활성 (예를 들어 RT/RH 단백질), 및 통합 (예를 들어 IN 단백질)을 제공할 수 있다. Pol 폴리단백질 성분은 대신 하나 이상의 핵산 분자 상에 별도의 다중 기능적 유닛으로서 발현될 수 있다. 별도의 유닛으로서 발현되는 경우, 프로테아제 활성을 제공하는 Pol 폴리단백질 성분은 발현될 수 있거나 발현되지 않을 수 있다. 본 개시내용의 조성물은 트랜스진-코딩 핵산의 역전사 및 통합을 향상시키기 위한 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 핵산 서열을 임의로 추가로 포함할 수 있다. 하나 이상의 부속 단백질은 하나 이상의 Pol 폴리단백질 성분과 함께 시스 또는 트랜스로 코딩될 수 있다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 본 개시내용의 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 실시양태에서, 조성물은 2개의 핵산 분자, 역전사효소 및 인테그라제 기능을 제공하는 1개의 핵산 분자 (예를 들어, 그러나 Pol 폴리단백질 및/또는 하나 이상의 부속 레트로바이러스 단백질에 제한되지는 않음) 및 하나 이상의 트랜스진을 코딩하는 1개의 핵산 분자를 포함한다. 일부 실시양태에서, 조성물은 2개 이상의 핵산 분자 (예를 들어, 2, 3, 4 또는 5개 또는 그 초과)를 포함한다. 일부 실시양태에서, 조성물은 임의의 부속 레트로바이러스 단백질을 포함하지 않는다. 본 개시내용의 조성물은 생체내 또는 생체외 전달을 위해 비-바이러스 전달 시스템 (예를 들어, 지질 나노입자)에 패키징된다.
핵산 분자는 RNA 분자 또는 DNA 분자 (게놈 및/또는 cDNA 둘 다), 또는 RNA 및 DNA의 하이브리드일 수 있으며, 여기서 핵산은 데옥시리보뉴클레오티드 및 리보뉴클레오티드 (예를 들어, 인공 또는 천연)의 임의의 조합을 함유한다. 핵산 분자는 단일-가닥 (ss) 또는 이중-가닥 (ds)일 수 있거나, 단일-가닥 및 이중-가닥 서열 둘 다의 일부를 함유할 수 있다. 일부 실시양태에서, 핵산 분자는 DNA 분자이다. DNA 분자는 ssDNA 분자 또는 dsDNA 분자 (예를 들어, 선형 dsDNA 분자)일 수 있다. 일부 실시양태에서, 핵산 분자는 RNA 분자이다. RNA 분자는 ssRNA 또는 dsRNA 분자일 수 있다. 일부 실시양태에서, RNA 분자는 ssRNA 분자일 수 있다. 일부 실시양태에서, 핵산 분자는 mRNA 분자일 수 있다.
일부 실시양태에서, 본 개시내용의 조성물은 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 RNA 분자, 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 RNA 분자를 포함한다. 일부 실시양태에서, 본 개시내용의 조성물은 2개의 RNA 분자를 포함한다: 레트로바이러스 Pol 폴리단백질을 코딩하는 제1 RNA 분자 및 LTR 서열에 의해 플랭킹된 트랜스진 서열을 포함하는 제2 RNA 분자. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 RNA 분자는 프로테아제 프로세싱에 의해 분리된 각 성분을 갖는 정규 유닛으로서 폴리단백질을 발현한다. 일부 실시양태에서, Pol 폴리단백질 성분을 코딩하는 RNA 분자는 이를 개별 유닛으로서, 예를 들어 바이시스트론성 구축물로서 발현한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 RNA 분자는 본원에 기재된 바와 같은 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 RNA 분자를 포함한다. 핵산 분자가 RNA 분자인 실시양태에 대한 생체내 접근법은 도 1 및 도 6에 개관되어 있다.
역전사 및 통합 기능
시스템의 하나 이상의 핵산은 프로테아제 활성, 역전사, 및 하나 이상의 트랜스진의 통합을 담당하는 기능적 유닛을 제공하도록 프로세싱된 레트로바이러스 Pol 폴리단백질을 코딩한다. 일부 실시양태에서, 5' UTR, 레트로바이러스 Pol 폴리단백질 (레트로바이러스 pol 유전자)을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자는 역전사 및 통합 기능을 제공한다. 그러므로, 일부 실시양태에서, 모든 Pol 폴리단백질 성분은 5' 및 3' UTR을 갖는 1개의 핵산 분자 상에 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분은 각각 5' 및 3' UTR을 갖는 2개 이상의 핵산 분자 상에 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분은 각각 5' 및 3' UTR을 갖는 하나 이상의 핵산 분자 상에 코딩되고, 하나 이상의 폴리시스트론성 요소 (예를 들어, 하나 이상의 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소)에 의해 분리된다. 번역을 용이하게 하는 임의의 다른 폴리시스트론성 요소가 또한 사용될 수 있다. 일부 실시양태에서, 핵산 분자는 Pol 프로테아제를 코딩하지 않으며, 예를 들어 Pol 폴리단백질 성분 역전사효소 및 인테그라제는 하나 이상의 핵산 분자 상에 별도의 유닛으로서 코딩되거나, 개재 폴리시스트론성 요소 (예를 들어, IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소)에 의해 분리된다. 추가 실시양태에서, Pol 폴리단백질 성분 역전사효소는 개별 p51 및 p66 서브유닛으로서 코딩될 수 있다 (도 9). 일부 실시양태에서, p51 및 p66은 각각 5' 및 3' UTR을 갖는 별도의 핵산 분자 상에 코딩된다. 일부 실시양태에서, p51 및 p66은 폴리시스트론성 요소 (예를 들어, IRES 또는 2A 펩티드-코딩 서열, 또는 다른 폴리시스트론성 요소)에 의해 분리된 동일한 핵산 상에 별도의 유닛으로서 코딩된다.
pol 발현을 위해 gag로부터의 번역 미끄러짐이 요구되는 정규 설계와 비교하여, 일부 실시양태에서, Pol 단백질의 발현은 별도의 구축물로부터 Pol 폴리단백질 또는 개별 Pol 폴리단백질 성분을 생성하고 mRNA 안정성 및 높은 수준의 번역을 위해 상이한 UTR을 코딩함으로써 증가될 수 있다. 일부 실시양태에서, mRNA 안정성 및/또는 번역 수준을 개선하기 위해 이종 UTR이 선택된다. 일부 실시양태에서, UTR은 안정적이고 고도로 번역된 mRNA 분자로부터의 3' 또는 5' 서열을 포함한다 (예를 들어, 그러나 β-글로빈, 액틴, GAPDH, 튜불린, 히스톤 또는 시트르산 사이클 효소에 제한되지는 않음). 조작된 또는 합성 UTR (즉, 비-자연 발생이고 돌연변이된 자연-발생 UTR과 구별되는 합리적 설계에 기초한 UTR)은 또한 안정성 및/또는 번역을 향상시키는데 사용될 수 있다. 인간 UTR의 서열은 진뱅크(GenBank)에서 이용가능하다.
일부 실시양태에서, 기능적 유닛을 코딩하는 것 외에, 핵산 서열은 역전사 및/또는 통합을 향상시키기 위한 하나 이상의 부속 레트로바이러스 단백질을 코딩한다. 일부 실시양태에서, 하나 이상의 부속 단백질은 하나 이상의 Pol 폴리단백질 성분과 함께 시스로 코딩된다 (즉, 동일한 핵산 분자에 의해 코딩됨). 일부 실시양태에서, 하나 이상의 부속 단백질은 모든 Pol 폴리단백질 성분과 함께 시스로 코딩된다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질과 함께 시스로 코딩된다. 그러므로, 일부 실시양태에서, 모든 Pol 폴리단백질 성분 및 부속 단백질은 5' 및 3' UTR을 갖는 하나의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 뉴클레오티드 서열은 하나 이상의 폴리시스트론성 요소 (예를 들어, 하나 이상의 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소)에 의해 분리된다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 뉴클레오티드 서열은 Pol 폴리단백질 성분 및/또는 부속 단백질을 포함하는 융합 단백질을 코딩한다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질 성분으로부터 트랜스로 코딩된다 (즉, 별도의 핵산 분자에 의해 코딩됨). 일부 실시양태에서, Pol 폴리단백질 성분 및 부속 단백질은 각각 5' 및 3' UTR을 갖는 2개 이상 (예를 들어, 2, 3, 4 또는 5개 또는 그 초과)의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, UTR은 안정적이고 고도로 번역된 mRNA 분자로부터의 3' 또는 5' 서열을 포함한다 (글로빈, 액틴, GAPDH, 튜불린, 히스톤 또는 시트르산 사이클 효소를 포함하나 이에 제한되지는 않음).
일부 실시양태에서, 하나 이상의 부속 단백질은 gag 매트릭스 단백질 (MA) (p17), 뉴클레오캡시드 (NC) (p9), 캡시드 단백질 (CA) (p24), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택된다. 일부 실시양태에서, 부속 단백질은 야생형 단백질일 수 있거나, 돌연변이된 단백질일 수 있다. 일부 실시양태에서, 돌연변이된 부속 단백질은 CA N74D 또는 CA E45A이다. 넘버링은 야생형 HIV-1 CA 단백질에 상응하고, 다른 레트로바이러스 CA 단백질의 상응하는 돌연변이는 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 일부 측면에서, 야생형 HIV-1 균주는 NL4-3일 수 있다. 일부 실시양태에서, 시스템은 MA, NC, CA, p6, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 하나의 부속 단백질을 포함한다. 일부 실시양태에서, 부속 단백질은 NC이다. 일부 실시양태에서, 부속 단백질은 CA이다. 일부 실시양태에서, 본 개시내용의 조성물은 MA, NC, CA, p6 Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 2개의 부속 단백질을 포함한다. 일부 실시양태에서, 본 개시내용의 조성물은 MA, NC, CA, p6, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 3개의 부속 단백질을 포함한다. 일부 실시양태에서, 본 개시내용의 조성물은 MA, NC, CA, p6, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 4, 5, 6, 7 또는 8개의 부속 단백질을 포함한다. 일부 실시양태에서, 시스템은 MA, NC, CA, p6, Vif, Tat, Nef, Vpr 및 Vpu를 포함한다.
일부 실시양태에서, 하나 이상의 부속 단백질은 gag 폴리단백질 (p55)로부터 발현된다. 그러므로, 일부 실시양태에서, 핵산 분자는 레트로바이러스 gag 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 정규 gag-pol 중첩 배향으로 gag pol 유전자를 포함하는 핵산 서열을 포함한다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 Gag 및 Pol 폴리단백질의 융합체를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 본 개시내용의 핵산은 2A 펩티드-코딩 서열에 의해 분리된 Gag 및 Pol 폴리단백질을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 하나 이상의 Pol 폴리단백질 성분 및 하나 이상의 Gag 폴리단백질 성분을 별도의 유닛으로서 코딩한다. 일부 실시양태에서, 별도의 유닛은 하나 이상의 폴리시스트론성 요소 (예를 들어, 하나 이상의 2A 펩티드-코딩 서열 및/또는 IRES 및/또는 다른 폴리시스트론성 요소)에 의해 연결된다. 일부 실시양태에서, 본 개시내용의 핵산은 매트릭스 단백질 (MA)을 코딩하지 않는 변형된 gag-pol 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산은 프레임시프트 돌연변이를 포함하는 변형된 gag-pol 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산은 gag-pol 프레임시프트 메카니즘을 방해하는 단일 뉴클레오티드 삽입을 포함하는 변형된 gag-pol 유전자를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산은 MA를 코딩하지 않는 gag 유전자를 포함한다.
일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 레트로바이러스 rev 및 레트로바이러스 env 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 레트로바이러스 rev env 유전자 둘 다에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 레트로바이러스 Gag 단백질을 코딩하는 임의의 핵산 서열을 포함하지 않는다. 다른 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 모든 레트로바이러스 Gag 단백질을 발현할 수 있는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 하기 레트로바이러스 Gag 단백질: MA, SP1, SP2 및 p6을 코딩하는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 MA를 코딩하는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 레트로바이러스 Gag 단백질을 코딩하는 임의의 핵산 서열을 포함하지 않는다. 다른 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 모든 레트로바이러스 Gag 단백질을 발현할 수 있는 핵산 서열을 포함하지 않는다.
일부 실시양태에서, 본 개시내용의 조성물은 NC를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, NC는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 NC를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 NC를 코딩한다. 일부 실시양태에서, 다른 Gag 단백질 (MA, CA, SP1, SP2 및 p6 포함)을 코딩하는 핵산 서열은 존재하지 않는다. 일부 실시양태에서, MA, SP1, SP2 및 p6을 코딩하는 핵산 서열은 존재하지 않는다.
일부 실시양태에서, 본 개시내용의 조성물은 CA를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, CA는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 CA를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 CA를 코딩한다. 일부 실시양태에서, 다른 Gag 단백질 (MA, NC, SP1, SP2 및 p6 포함)을 코딩하는 핵산 서열은 존재하지 않는다. 일부 실시양태에서, MA, SP1, SP2 및 p6을 코딩하는 핵산 서열은 존재하지 않는다.
일부 실시양태에서, 본 개시내용의 조성물은 Vif를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Vif는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 Vif를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 Vif를 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 Tat를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Tat는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 Tat를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 Tat를 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 Nef를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Nef는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 Nef를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 Nef를 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 Vpr을 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Vpr은 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 Vpr을 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 Vpr을 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 Vpu를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Vpu는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 Vpu를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 Vpu를 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 MA를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, MA는 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 MA를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 MA를 코딩한다.
일부 실시양태에서, 본 개시내용의 조성물은 p6을 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, p6은 5' UTR 및 3' UTR을 포함하는 별도의 핵산 분자에 의해 코딩된다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 시스로 p6을 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Pol 폴리단백질을 코딩하는 핵산 분자는 시스로 p6을 코딩한다.
일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 하나 이상의 레트로바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 동일한 레트로바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 2개 이상의 상이한 레트로바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 하기로부터의 핵산 서열에 기초한다: 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 조류 육종 백혈증 바이러스 (ASLV), 내인성 친이종 MuLV-관련된 바이러스 VP62 (XMRV), 영장류 T-림프친화성 바이러스 (PTLV), 외사시 진피 육종 바이러스 (WDSV), 인간 포말상 바이러스 (HFV), , 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 노랑가슴 카푸친 시미안 포말상 바이러스, 또는 이들의 조합. 일부 실시양태에서, 핵산 서열은 HFV로부터의 핵산 서열에 기초한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 하나 이상의 렌티바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 하기로부터의 핵산 서열에 기초한다: 인간 면역결핍 바이러스 (HIV) (예를 들어, HIV-1, HIV-2), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 젬브라나병 바이러스, 푸마 렌티바이러스, 또는 이들의 조합. 일부 실시양태에서, 핵산 서열은 HIV-1로부터의 핵산 서열에 기초한다 (예를 들어, 진뱅크 수탁 번호 AF033819). HIV 게놈으로부터의 뉴클레오티드 서열은 관련 기술분야의 통상의 기술자에게 이용가능하다. 예를 들어, HIV 게놈 브라우저 (로스 앨러모스 국립연구소(Los Alamos National Laboratory)): www.hiv.lanl.gov/content/sequence/genome_browser/browser 및 ["Numbering positions in HXB2": Korber et al. - 저널 미상, UCSD와 제휴 및 LANL 데이터베이스에서 참조]을 참조한다. HIV 내의 유전자를 식별하기 위한 심층 주석 리소스는 또한 www.hiv.lanl.gov/content/sequence/HIV/MAP/annotation에서 제공된다.
용어 "에 기초한" 또는 "로부터 유래된"은 핵산 서열 (또는 아미노산 서열)이 염기 서열에 비해 하나 이상의 변형을 포함할 수 있음을 나타내는 것으로 이해될 것이다. 그러므로, 핵산 서열은 상응하는 야생형 핵산 서열에 비해 하나 이상의 변형 (예를 들어, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 첨가, 하나 이상의 뉴클레오티드의 치환, 또는 이들의 조합)을 포함할 수 있다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 서열은 상응하는 야생형 핵산 서열과 적어도 60% 동일성 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 9%, 96%, 95%, 98% 또는 99% 동일성)을 갖는다. 일부 측면에서, 야생형 Pol 폴리단백질은 HIV-1 균주 NL4-3으로부터 유래된다.
Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 자연 발생 핵산 분자에 비해 하나 이상의 화학적 또는 생물학적 변형을 포함할 수 있다. 변형은 핵산 또는 단백질 안정성 및/또는 전사/번역 효율을 향상시키고/거나 면역원성을 감소시킬 수 있다. 변형은 변형된 핵염기, 변형된 백본 (예를 들어, 포스포라미드, 포스포로티오에이트, 포스포로디티오에이트, O-메틸포스포라미다이트 연결 및/또는 펩티드 핵산)을 포함할 수 있지만 이에 제한되지는 않는다.
일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 mRNA 또는 상응하는 mRNA 안정성을 개선하는 하나 이상의 돌연변이를 포함한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 Rev 독립성을 개선하는 하나 이상의 돌연변이를 포함한다. 일부 실시양태에서, 핵산 서열은 하나 이상의 내재적 불안정성 (INS) 요소에 돌연변이 (예를 들어, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 첨가, 하나 이상의 뉴클레오티드의 치환, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, INS 요소의 코돈은 INS 요소를 변경 또는 제거하면서 단백질 서열을 보존하기 위해 대체 코돈으로 대체된다. 일부 실시양태에서, INS 요소는 인간에서의 발현을 위해 최적화된 코돈으로 대체된다. 일부 실시양태에서, 하나 이상의 INS 요소는 TAGAT, ATAGA, AAAAG, ATAAA 및 TTATA, 또는 다른 INS 요소 (예를 들어, 문헌 [Wolff et al. Nucleic Acids Res. 31(11):2839-51 (2003)]에 기재된 것들)로부터 선택된다. 일부 실시양태에서, INS 요소는 완전히 제거된다. 일부 실시양태에서, INS 요소는 부분적으로 제거된다. 일부 실시양태에서, 핵산 서열은 인간에서의 발현을 위해 코돈 최적화된다. 이들 변형은 역전사효소, 인테그라제, 캡시드, 매트릭스, 뉴클레오캡시드, p6, Vif, Nef, Vpu 또는 Vpr 중 하나 이상을 코딩하는 뉴클레오티드 서열에 존재할 수 있다.
일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 상응하는 단백질의 안정성을 개선하는 하나 이상의 돌연변이를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 안정화 메티오닌-글리신 디펩티드를 포함하는 인테그라제 폴리펩티드를 코딩한다. 일부 실시양태에서, 본 개시내용의 핵산은 N-말단 메티오닌-글리신 디펩티드를 포함하는 인테그라제 폴리펩티드를 코딩한다.
일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 숙주 세포에서 번역 효율을 개선하는 하나 이상의 돌연변이를 포함한다. 일부 실시양태에서, 본 개시내용의 핵산 분자의 코돈은 인간에서의 발현을 위해 최적화된다.
일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 하기로부터 선택된 하나 이상의 변형을 포함한다: 숙주 세포 (예를 들어, 인간 또는 다른 포유동물 또는 조류 세포)에서의 발현을 위한 코돈 최적화, INS 요소의 부분적 또는 완전한 제거, 및 안정화 메티오닌-글리신 디펩티드를 사용한 인테그라제의 변형. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 숙주 세포 (예를 들어, 인간 또는 다른 포유동물 또는 조류 세포)에서의 발현을 위해 코돈 최적화되고, INS 요소의 완전한 또는 부분적 제거를 포함하고, 메티오닌-글리신 디펩티드로 변형된 인테그라제 폴리펩티드를 코딩한다.
일부 실시양태에서, Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 부위-지정 게놈 통합을 위해 귀소 단백질에 융합된 인테그라제를 코딩한다 (도 10). 귀소 단백질은 특이적 DNA 서열을 인식하므로 인테그라제를 특이적 서열로 지정한다. 이 접근법은 유전독성이 더 적을 잠재성을 갖는다. 일부 실시양태에서, 인테그라제는 Pol 폴리단백질에 의해 코딩된다. 일부 실시양태에서, 인테그라제는 별도의 유닛으로서 코딩된다. 일부 실시양태에서, Pol 폴리단백질은 귀소 단백질에 융합된다. 일부 실시양태에서, 귀소 단백질은 트랜스진의 게놈 유전자좌를 표적화한다. 일부 실시양태에서, 귀소 단백질은 제한 부위를 인식하는 효소이다. 제한 부위를 인식하는 효소는 관련 기술분야에 공지되어 있다. 예를 들어, www.neb.com/tools-and-resources/selection-charts/alphabetized-list-of-recognition-specificities를 참조한다. 제한 부위를 인식하는 효소의 비제한적인 예에는 하기가 포함되나 이에 제한되지는 않는다: AatII, AbaSI, Acc65I, AccI, AciI, AclI, AcuI, AfeI, AflII, AflIII, AgeI, AhdI, AleI-v2, AluI, AlwI, AlwNI, ApaI, ApaLI, ApoI, AscI, AseI, AsiSI, AvaI, BsoBI, AvaII, AvrII, BaeGI, BaeI, BamHI, BanI, BanII, BbsI, BbvCI, BbvI, BccI, BceAI, BcgI, BciVI, BclI, BfaI, BglI, BglII, BlpI, BmgBI, BmrI, BmtI, BpmI, BpuEI, Bpu10I, BsaAI, BsaBI, BsaHI, BsaJI, BsaWI, BsaXI, BseRI, BseYI, BsgI, BsiEI, BsiHKAI, BsiWI, BslI, BsmAI BcoDI, BsmBI-v2, BsmFI, BsmI, BspCNI, BspEI, BspHI, Bsp1286I, BspMI, BfuAI, BsrBI, BsrDI, BsrFI-v2, BsrGI, BssHII, BssSI-v2, BstAPI, BstBI, BstEII, BstNI, BstUI, BstXI, BstYI, Bsu36I, BtgI, BtgZI, BtsCI, BtsIMutI, BtsI-v2, Cac8I, ClaI, BspDI, CspCI, CviAII, CviKI-1, CviQI, DdeI, DpnI, DraI, DrdI, EaeI, EarI, EciI, Eco53kI, EcoNI, EcoO109I, EcoP15I, EcoRI, EcoRV, Esp3I, FatI, FauI, Fnu4HI, FokI, FseI, FspEI, FspI, HaeII, HaeIII, HgaI, HhaI, HincII, HindIII, HinfI, HinP1I, HpaI, HphI, HpyAV, HpyCH4III, HpyCH4IV, HpyCH4V, Hpy99I, Hpy188I, Hpy166II, Hpy188III, I-CeuI, I-SceI, KasI, KpnI, LpnPI, MboI, Sau3AI, DpnII, MboII, MfeI, MluCI, MluI, MlyI, MmeI, MnlI, MscI, MseI, MslI, MspA1I, MspI, HpaII, MspJI, MwoI, NaeI, NarI, Nb.BbvCI, Nb.BsmI, Nb.BsrDI, Nb.BssSI, Nb.BtsI, NcoI, NdeI, NgoMIV, NlaIII, NlaIV, NmeAIII, NotI, NruI, NsiI, NspI, Nt.AlwI, Nt.BbvCI, Nt.BsmAI, Nt.BspQI, Nt.BstNBI, Nt.CviPII, PacI, PaqCI, PciI, PflMI, PI-PspI, PI-SceI, PleI, PluTI, PmeI, PmlI, PpuMI, PshAI, PsiI-v2, PspGI, PspOMI, PspXI, PstI, PvuI, PvuII, RsaI, RsrII, SacI, SacII, SalI, SapI BspQI, Sau96I, SbfI, ScrFI, SexAI, SfaNI, SfcI, SfiI, SfoI, SgrAI, SmaI, SmlI, SnaBI, SpeI, SphI, SrfI, SspI, StuI, StyD4I, SwaI, TaqI-v2, TfiI, TseI, ApeKI, Tsp45I, TspRI, Tth111I, PflFI, XbaI, XcmI, XhoI, PaeR7I, XmaI, TspMI, XmnI 및 ZraI. 일부 실시양태에서, 귀소 단백질은 귀소 엔도뉴클레아제이다. 귀소 엔도뉴클레아제는 문헌 [Stoddard, B.I., Homing endonucleases from mobile group I introns: discovery to genome engineering, Mobile DNA 5, 7 (2014)]에 개시된 것들과 같이 관련 기술분야에 공지되어 있다. 귀소 엔도뉴클레아제의 비제한적인 예에는 I-TevI, I-HmuI, I-Bth035I, I-CreI, I-AniI, I-PpoI 및 I-Ssp6803I가 포함된다. 일부 실시양태에서, 귀소 단백질은 I-PpoI이다. 일부 실시양태에서, 귀소 단백질은 임의의 게놈 손상을 방지하기 위해 임의의 원치않는 뉴클레아제 활성을 제거하도록 변형될 수 있다. 일부 실시양태에서, 귀소 단백질은 I-PpoI(N119A) 등이다. 일부 실시양태에서, 인테그라제 폴리펩티드는 임의의 원치않는 뉴클레아제 활성을 제거하도록 변형된다. 일부 실시양태에서, 인테그라제 폴리펩티드는 D64V 돌연변이 등을 포함한다.
특정 실시양태에서, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 분자는 RNA 분자 (예를 들어, ssRNA 분자, 예컨대 mRNA 분자)이다. 일부 실시양태에서, 5' UTR, 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 RNA 분자는 RT 및 인테그라제 기능을 제공한다. 일부 실시양태에서, 5' UTR, 개별 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자는 RT 및 인테그라제 기능을 제공한다. 일부 실시양태에서, 모든 Pol 폴리단백질 성분은 5' 및 3' UTR을 갖는 하나의 RNA 분자 상에 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분은 각각 5' 및 3' UTR을 갖는 2개 이상의 RNA 분자 상에 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분은 각각 5' 및 3' UTR을 갖는 하나 이상의 RNA 분자 상에 코딩되고, 하나 이상의 폴리시스트론성 요소에 의해 분리된다. 하나 이상의 폴리시스트론성 요소는 IRES 및/또는 2A 펩티드-코딩 서열 및/또는 다른 폴리시스트론성 요소일 수 있다. 일부 실시양태에서, 예를 들어 RT 및 인테그라제에 대한 Pol 폴리단백질 성분이 별도의 RNA 분자 상에 코딩되거나, 폴리시스트론성 요소, 예컨대 개재 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소에 의해 분리된 경우, RNA 분자는 Pol 폴리단백질 프로테아제를 코딩하지 않는다. 일부 실시양태에서, 역전사 및/또는 통합을 향상시키기 위한 하나 이상의 부속 단백질을 코딩하는 핵산 분자가 추가로 존재한다. 일부 실시양태에서, 하나 이상의 부속 단백질은 하나 이상의 Pol 폴리단백질 성분과 함께 시스로 코딩된다 (즉, 동일한 RNA 분자에 의해 코딩됨). 일부 실시양태에서, 하나 이상의 부속 단백질은 모든 Pol 폴리단백질 성분과 함께 시스로 코딩된다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질과 함께 시스로 코딩된다. 그러므로, 일부 실시양태에서, 모든 Pol 폴리단백질 성분 및 부속 단백질은 5' 및 3' UTR을 갖는 하나의 RNA 분자 상에 코딩된다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 뉴클레오티드 서열은 하나 이상의 폴리시스트론성 요소, 예컨대 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소에 의해 분리된다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질 성분으로부터 트랜스로 코딩된다 (즉, 별도의 핵산 분자에 의해 코딩됨). 일부 실시양태에서, 각각의 Pol 폴리단백질 성분 및 부속 단백질은 각각 5' 및 3' UTR을 갖는 2개 이상 (예를 들어, 2, 3, 4 또는 5개 또는 그 초과)의 RNA 분자에 의해 코딩된다. 일부 실시양태에서, UTR은 안정적인 mRNA 분자로부터의 3' 또는 5' 서열을 포함한다 (글로빈, 액틴, GAPDH, 튜불린, 히스톤 또는 시트르산 사이클 효소를 포함하나 이에 제한되지는 않음).
일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있다. 일부 실시양태에서, 본 개시내용의 조성물은 레트로바이러스 rev 유전자 및 레트로바이러스 env 유전자 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 본 개시내용의 핵산 분자 또는 조성물은 레트로바이러스 rev env 유전자 둘 다에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 본 개시내용의 조성물은 하기 레트로바이러스 Gag 단백질: MA, SP1, SP2 및 p6을 코딩하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 본 개시내용의 조성물은 레트로바이러스 Gag 단백질을 코딩하는 임의의 핵산 서열을 포함하지 않는다. 다른 실시양태에서, 본 개시내용의 조성물은 모든 레트로바이러스 Gag 단백질을 발현할 수 있는 핵산 서열을 포함하지 않는다.
일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 RNA 분자는 하나 이상의 변형된 리보뉴클레오시드를 포함한다. 일부 실시양태에서, 변형된 리보뉴클레오시드는 하기로부터 선택된다: 2-티오우리딘, 5-아자우리딘, 슈도우리딘, 4-티오우리딘, 5-메틸우리딘, 5-메틸슈도우리딘, 5-아미노우리딘, 5-아미노슈도우리딘, 5-히드록시우리딘, 5-히드록시슈도우리딘, 5-메톡시우리딘, 5-메톡시슈도우리딘, 5-에톡시우리딘, 5-에톡시슈도우리딘, 5-히드록시메틸우리딘, 5-히드록시메틸슈도우리딘, 5-카르복시우리딘, 5-카르복시슈도우리딘, 5-포르밀우리딘, 5-포르밀슈도우리딘, 5-메틸-5-아자우리딘, 5-아미노-5-아자우리딘, 5-히드록시-5-아자우리딘, 5-메틸슈도우리딘, 5-아미노슈도우리딘, 5-히드록시슈도우리딘, 4-티오-5-아자우리딘, 4-티오슈도우리딘, 4-티오-5-메틸우리딘, 4-티오-5-아미노우리딘, 4-티오-5-히드록시우리딘, 4-티오-5-메틸-5-아자우리딘, 4-티오-5-아미노-5-아자우리딘, 4-티오-5-히드록시-5-아자우리딘, 4-티오-5-메틸슈도우리딘, 4-티오-5-아미노슈도우리딘, 4-티오-5-히드록시슈도우리딘, 2-티오시티딘, 5-아자시티딘, 슈도이소시티딘, N4-메틸시티딘, N4-아미노시티딘, N4-히드록시시티딘, 5-메틸시티딘, 5-아미노시티딘, 5-히드록시시티딘, 5-메톡시시티딘, 5-에톡시시티딘, 5-히드록시메틸시티딘, 5-카르복시시티딘, 5-포르밀시티딘, 5-메틸-5-아자시티딘, 5-아미노-5-아자시티딘, 5-히드록시-5-아자시티딘, 5-메틸슈도이소시티딘, 5-아미노슈도이소시티딘, 5-히드록시슈도이소시티딘, N4-메틸-5-아자시티딘, N4-메틸슈도이소시티딘, 2-티오-5-아자시티딘, 2-티오슈도이소시티딘, 2-티오-N4-메틸시티딘, 2-티오-N4-아미노시티딘, 2-티오-N4-히드록시시티딘, 2-티오-5-메틸시티딘, 2-티오-5-아미노시티딘, 2-티오-5-히드록시시티딘, 2-티오-5-메틸-5-아자시티딘, 2-티오-5-아미노-5-아자시티딘, 2-티오-5-히드록시-5-아자시티딘, 2-티오-5-메틸슈도이소시티딘, 2-티오-5-아미노슈도이소시티딘, 2-티오-5-히드록시슈도이소시티딘, 2-티오-N4-메틸-5-아자시티딘, 2-티오-N4-메틸슈도이소시티딘, N4-메틸-5-메틸시티딘, N4-메틸-5-아미노시티딘, N4-메틸-5-히드록시시티딘, N4-메틸-5-메틸-5-아자시티딘, N4-메틸-5-아미노-5-아자시티딘, N4-메틸-5-히드록시-5-아자시티딘, N4-메틸-5-메틸슈도이소시티딘, N4-메틸-5-아미노슈도이소시티딘, N4-메틸-5-히드록시슈도이소시티딘, N4-아미노-5-아자시티딘, N4-아미노슈도이소시티딘, N4-아미노-5-메틸시티딘, N4-아미노-5-아미노시티딘, N4-아미노-5-히드록시시티딘, N4-아미노-5-메틸-5-아자시티딘, N4-아미노-5-아미노-5-아자시티딘, N4-아미노-5-히드록시-5-아자시티딘, N4-아미노-5-메틸슈도이소시티딘, N4-아미노-5-아미노슈도이소시티딘, N4-아미노-5-히드록시슈도이소시티딘, N4-히드록시-5-아자시티딘, N4-히드록시슈도이소시티딘, N4-히드록시-5-메틸시티딘, N4-히드록시-5-아미노시티딘, N4-히드록시-5-히드록시시티딘, N4-히드록시-5-메틸-5-아자시티딘, N4-히드록시-5-아미노-5-아자시티딘, N4-히드록시-5-히드록시-5-아자시티딘, N4-히드록시-5-메틸슈도이소시티딘, N4-히드록시-5-아미노슈도이소시티딘, N4-히드록시-5-히드록시슈도이소시티딘, 2-티오-N4-메틸-5-메틸시티딘, 2-티오-N4-메틸-5-아미노시티딘, 2-티오-N4-메틸-5-히드록시시티딘, 2-티오-N4-메틸-5-메틸-5-아자시티딘, 2-티오-N4-메틸-5-아미노-5-아자시티딘, 2-티오-N4-메틸-5-히드록시-5-아자시티딘, 2-티오-N4-메틸-5-메틸슈도이소시티딘, 2-티오-N4-메틸-5-아미노슈도이소시티딘, 2-티오-N4-메틸-5-히드록시슈도이소시티딘, 2-티오-N4-아미노-5-아자시티딘, 2-티오-N4-아미노슈도이소시티딘, 2-티오-N4-아미노-5-메틸시티딘, 2-티오-N4-아미노-5-아미노시티딘, 2-티오-N4-아미노-5-히드록시시티딘, 2-티오-N4-아미노-5-메틸-5-아자시티딘, 2-티오-N4-아미노-5-아미노-5-아자시티딘, 2-티오-N4-아미노-5-히드록시-5-아자시티딘, 2-티오-N4-아미노-5-메틸슈도이소시티딘, 2-티오-N4-아미노-5-아미노슈도이소시티딘, 2-티오-N4-아미노-5-히드록시슈도이소시티딘, 2-티오-N4-히드록시-5-아자시티딘, 2-티오-N4-히드록시슈도이소시티딘, 2-티오-N4-히드록시-5-메틸시티딘, N4-히드록시-5-아미노시티딘, 2-티오-N4-히드록시-5-히드록시시티딘, 2-티오-N4-히드록시-5-메틸-5-아자시티딘, 2-티오-N4-히드록시-5-아미노-5-아자시티딘, 2-티오-N4-히드록시-5-히드록시-5-아자시티딘, 2-티오-N4-히드록시-5-메틸슈도이소시티딘, 2-티오-N4-히드록시-5-아미노슈도이소시티딘, 2-티오-N4-히드록시-5-히드록시슈도이소시티딘, N6-메틸아데노신, N6-아미노아데노신, N6-히드록시아데노신, 7-데아자아데노신, 8-아자아데노신, N6-메틸-7-데아자아데노신, N6-메틸-8-아자아데노신, 7-데아자-8-아자아데노신, N6-메틸-7-데아자-8-아자아데노신, N6-아미노-7-데아자아데노신, N6-아미노-8-아자아데노신, N6-아미노-7-데아자-8-아자아데노신, N6-히드록시아데노신, N6-히드록시-7-데아자아데노신, N6-히드록시-8-아자아데노신, N6-히드록시-7-데아자-8-아자아데노신, 6-티오구아노신, 7-데아자구아노신, 8-아자구아노신, 6-티오-7-데아자구아노신, 6-티오-8-아자구아노신, 7-데아자-8-아자구아노신, 6-티오-7-데아자-8-아자구아노신, 및 N1-메틸슈도우리딘. 일부 실시양태에서, 변형된 리보뉴클레오시드는 슈도우리딘 또는 슈도우리딘의 유도체이다. 일부 실시양태에서, 슈도우리딘의 유도체는 N1-메틸슈도우리딘이다. 일부 실시양태에서, 변형된 리보뉴클레오시드는 N6-메틸아데노신이다.
일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 RNA 분자는 하기를 포함하나 이에 제한되지는 않는 하나 이상의 변형을 포함한다: 5' 말단 캡 (예를 들어, 5'-7mG 캡 구조); 폴리(rA) 꼬리의 포함; 3' UTR 또는 5' UTR의 변경; mRNA를 작용제 (예를 들어, 단백질 또는 상보적 핵산 분자)와 복합체화하는 것; mRNA 분자의 구조를 변화시키는 요소의 포함 (예를 들어, 2차 구조를 형성하는 요소); 및 C 및/또는 U 잔기 수의 감소. 일부 실시양태에서, 폴리(rA) 서열은 약 10-500개의 뉴클레오티드로부터 유래된다. 일부 실시양태에서, 폴리(rA) 서열은 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 또는 적어도 500개의 뉴클레오티드이다. RNA 분자에 대한 다른 화학적 및 생물학적 변형은 관련 기술분야에 공지되어 있다.
Pol 폴리단백질 성분 및 부속 단백질 핵산 주형
한 측면에서, 본 개시내용은 또한 본원에 기재된 Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질을 코딩하는 핵산 분자의 생산을 위한 핵산 주형 (예를 들어, 재조합 DNA 구축물)을 제공한다. 일부 실시양태에서, 핵산 주형은 RNA 분자를 생산하는데 사용된다. 일부 실시양태에서, RNA 분자는 무세포 방법 (예를 들어, 시험관내 전사 또는 무세포 RNA 합성)을 사용하여 생산된다. 예를 들어, 미국 특허 공개 번호 2017-0292138, 2018-0087045 2019-0144489를 참조하며, 이들은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, 핵산 주형은 RNA 생산 요소 (예를 들어, T7 프로모터, 소화 부위 등)에 더하여 5' UTR, 하나 이상의 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함한다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' UTR, 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' UTR, 개별 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, 각각 T7 프로모터, 및 5' 및 3' UTR을 갖는 2개 이상의 핵산 주형은 Pol 폴리단백질 성분을 코딩한다. 일부 실시양태에서, 각각 T7 프로모터, 및 5' 및 3' UTR을 갖는 하나 이상의 주형은 Pol 폴리단백질 성분을 코딩하며, 여기서 Pol 폴리단백질 성분은 하나 이상의 폴리시스트론성 요소에 의해 분리된다. 하나 이상의 폴리시스트론성 요소는 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소일 수 있다. 일부 실시양태에서, 핵산 주형은 Pol 폴리단백질 프로테아제를 코딩하지 않는다.
일부 실시양태에서, 핵산 주형은 역전사 및/또는 통합을 향상시키기 위한 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, 하나 이상의 부속 단백질은 하나 이상의 Pol 폴리단백질 성분과 함께 시스로 코딩된다 (즉, 동일한 핵산 분자에 의해 코딩됨). 일부 실시양태에서, 하나 이상의 부속 단백질은 모든 Pol 폴리단백질 성분과 함께 시스로 코딩된다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질과 함께 시스로 코딩된다. 일부 실시양태에서, 1개의 핵산 주형은 모든 Pol 폴리단백질 성분 및 부속 단백질을 코딩한다. 일부 실시양태에서, Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 뉴클레오티드 서열은 하나 이상의 폴리시스트론성 요소에 의해 분리된다. 폴리시스트론성 요소는 IRES 및/또는 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소일 수 있다. 일부 실시양태에서, 하나 이상의 부속 단백질은 Pol 폴리단백질 성분으로부터 트랜스로 코딩된다 (즉, 별도의 핵산 분자에 의해 코딩됨). 일부 실시양태에서, 각각의 Pol 폴리단백질 성분 및 부속 단백질은 각각 T7 프로모터, 및 5' 및 3' UTR을 갖는 2개 이상 (예를 들어, 2, 3, 4 또는 5개 또는 그 초과)의 핵산 주형에 의해 코딩된다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' UTR, gag-pol 유전자를 코딩하는 핵산 서열, 3' UTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' UTR, 프레임시프트 돌연변이를 포함하는 gag-pol 유전자를 코딩하는 핵산 서열, 3' UTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, gag-pol 유전자는 매트릭스 단백질을 코딩하지 않는다.
일부 실시양태에서, UTR은 안정적이고 고도로 번역된 mRNA 분자로부터의 3' 또는 5' 서열을 포함한다 (글로빈, 액틴, GAPDH, 튜불린, 히스톤 또는 시트르산 사이클 효소를 포함하나 이에 제한되지는 않음).
일부 실시양태에서, 핵산 주형은 레트로바이러스 rev env 유전자에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는다. 일부 실시양태에서, 핵산 주형은 하기 레트로바이러스 Gag 단백질: MA, SP1, SP2 및 p6을 코딩하는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 핵산 주형은 MA를 코딩하는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 핵산 주형은 NC 및 CA 중 하나 이상을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 본 개시내용의 조성물은 레트로바이러스 Gag 단백질 (MA, CA, NC, SP1, SP2, P6)을 코딩하는 임의의 핵산 서열을 포함하지 않는다. 다른 실시양태에서, 본 개시내용의 조성물은 모든 레트로바이러스 Gag 단백질을 발현할 수 있는 핵산 서열을 포함하지 않는다. 일부 실시양태에서, 핵산 주형은 NC, CA, MA, p6, Vif, Tat, Nef, Vpr 및 Vpu 중 하나 이상을 코딩하는 핵산 서열을 포함한다. Pol 폴리단백질 및/또는 부속 단백질을 코딩하는 예시적인 핵산 주형은 도 4-5에 나타낸다. 일부 실시양태에서, RNA 분자는 무세포 방법 (예를 들어, 시험관내 전사, 무세포 RNA 합성)을 사용하여 생산된다.
트랜스진-코딩 핵산
한 측면에서, 본 개시내용은 하나 이상의 트랜스진의 숙주 게놈으로의 통합을 용이하게 하는 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진을 포함하는 핵산 분자를 제공한다. 핵산 분자는 바이러스 패키징 신호 (예를 들어, Psi 패키징 요소) 및/또는 Rev 반응 요소 (RRE)를 포함하지 않을 수 있다. 그러므로, 트랜스진-코딩 핵산 분자는 하나 이상의 트랜스진을 코딩하고, 하나 이상의 트랜스진을 숙주 세포 게놈에 통합하는데 도움이 될 서열을 함유하나; 시스템은 어떠한 바이러스 입자의 생산도 허용하지 않는다. 일부 실시양태에서, 트랜스진-코딩 핵산 분자는 5' LTR과 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함한다.
본원에서 사용된 바와 같은 용어 "긴 말단 반복부" 또는 "LTR"은 레트로바이러스 RNA의 역전사에 의해 형성된 프로바이러스 DNA의 어느 한쪽 말단에서 발견되고 수백 또는 수천 번 반복되는 RNA 또는 DNA의 서열을 지칭한다. LTR은 이들의 유전적 물질을 숙주 게놈에 통합하기 위해 바이러스에 의해 사용된다 (예를 들어, LTR의 말단은 프로바이러스의 숙주 게놈으로의 통합에 참여함). 일부 실시양태에서, LTR은 자가-불활성화된다. 3' LTR은 단일 역전사 라운드 후 5' LTR로 전달되는 결실 (예를 들어, 3' LTR의 U3 영역에서의 전사 인핸서 또는 인핸서 및 프로모터의 결실)을 가질 수 있다. 3' LTR에서의 결실 (예를 들어, 3' LTR의 U3 영역에서의 전사 인핸서 또는 인핸서 및 프로모터의 결실)은 10-50개, 50-100개, 100-150개, 150-200개 또는 그 초과의 뉴클레오티드일 수 있다. 일부 실시양태에서, 3' LTR에서의 결실은 100-150개의 뉴클레오티드이다. 일부 실시양태에서, 3' LTR에서의 결실은 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 또는 150개의 뉴클레오티드이다. 일부 실시양태에서, LTR, Pol 폴리단백질 성분, 및/또는 하나 이상의 부속 단백질은 동일한 레트로바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, LTR, Pol 폴리단백질 성분 및/또는 하나 이상의 부속 단백질은 2개 이상의 상이한 레트로바이러스로부터의 핵산 서열에 기초한다. 일부 실시양태에서, LTR은 하기로부터의 LTR에 기초한다: 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 조류 육종 백혈증 바이러스 (ASLV), 내인성 친이종 MuLV-관련된 바이러스 VP62 (XMRV), 영장류 T-림프친화성 바이러스 (PTLV), 외사시 진피 육종 바이러스 (WDSV), 인간 포말상 바이러스 (HFV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 노랑가슴 카푸친 시미안 포말상 바이러스, 또는 이들의 조합. 일부 실시양태에서, LTR은 HFV로부터의 LTR에 기초한다. 일부 실시양태에서, LTR은 렌티바이러스 LTR이다. 일부 실시양태에서, 렌티바이러스 LTR은 하기로부터의 LTR에 기초한다: 인간 면역결핍 바이러스 (HIV) (예를 들어, HIV-1, HIV-2), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 젬브라나병 바이러스, 푸마 렌티바이러스, 또는 이들의 조합. 일부 실시양태에서, LTR은 HIV-1로부터의 LTR에 기초한다 (예를 들어, 진뱅크 수탁 번호 AF033819에서 게놈 서열을 갖는 HIV-1). 다른 LTR은 예를 들어 상기 기재된 바와 같이 진뱅크에서 관련 기술분야에서 찾아볼 수 있다.
용어 "에 기초한" 또는 "로부터 유래된"은 핵산 서열이 염기 서열에 비해 하나 이상의 변형을 포함할 수 있음을 나타내는 것으로 이해될 것이다. 그러므로, LTR은 상응하는 야생형 핵산 서열에 비해 하나 이상의 변형 (예를 들어, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 첨가, 하나 이상의 뉴클레오티드의 치환, 또는 이들의 조합)을 포함할 수 있다.
일부 실시양태에서, LTR은 야생형 LTR과 적어도 60% 동일성 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 9%, 96%, 95%, 98% 또는 99% 동일성)을 갖는다.
HIV-1 RT는 역전사 반응 전에 바이러스 게놈의 프라이밍을 위해 세포질 tRNA에 의존한다. 일부 실시양태에서, 트랜스진-코딩 핵산 분자는 하나 이상의 역전사효소 프라이밍 요소 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과)를 포함할 수 있다. 일부 실시양태에서, 역전사효소 프라이밍 요소는 내인성 tRNA에 대한 결합 부위이다. 일부 실시양태에서, 프라이밍 요소는 리실 tRNA에 대한 결합 부위이다. 일부 실시양태에서, 역전사효소 프라이밍 요소는 합성 프라이머 결합 부위이다. 일부 실시양태에서, 역전사효소 프라이밍 요소는 합성 프라이머 결합 부위이고, 하나 이상의 합성 프라이머가 트랜스진-코딩 핵산 분자 및 Pol 폴리단백질 성분을 코딩하는 핵산 분자와 함께 사용하기 위해 제공된다. 합성 프라이머는 합리적 설계에 기초한 비-자연 발생 프라이머이다. 합성 프라이머는 자연 발생 서열에 기초할 수 있음이 이해될 것이다. 합성 프라이머 결합 부위는 상보적 서열이다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 표적 세포로의 전달 전에 하나 이상의 RNA 또는 DNA 프라이밍 올리고뉴클레오티드로 프라이밍된다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 하나 이상의 짧은 RNA 또는 DNA 프라이밍 올리고뉴클레오티드와 함께 공동-전달된다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 5-10, 10-15, 15-20, 20-25, 25-30, 5-15, 5-20, 5-25, 5-30, 10-20, 10-25, 10-30, 15-25, 또는 15-30개의 뉴클레오티드 길이이다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오티드 길이이다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 30-50 또는 50-80 또는 80-100, 100-150개, 또는 최대 약 200개의 뉴클레오티드일 수 있다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 약 70-80개의 뉴클레오티드일 수 있다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 약 70, 71, 72, 73, 74, 75, 76, 77, 78, 79 또는 80개의 뉴클레오티드일 수 있다. 일부 실시양태에서, RNA 또는 DNA 프라이밍 올리고뉴클레오티드는 약 76개의 뉴클레오티드일 수 있다. 일부 실시양태에서, 프라이밍 올리고뉴클레오티드는 RT 프라이밍 요소에 대해 상보적인 조작된 올리고뉴클레오티드이다. 일부 실시양태에서, 프라이밍 올리고뉴클레오티드는 GUCCCUGUUCGGGCGCCA (서열식별번호: 18) 또는 GTCCCTGTTCGGGCGCCA (서열식별번호: 19)이다.
하나 이상의 트랜스진의 발현은 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 제어 서열을 사용하여 제어될 수 있으며, 여기서 제어 서열은 프로모터, 인핸서 및 다른 조절 서열을 포함한다. 일부 실시양태에서, 전달 핵산은 프로모터에 연결된 단일 트랜스진을 포함한다. 일부 실시양태에서, 전달 핵산은 2개 이상의 트랜스진을 포함한다. 일부 실시양태에서, 각 트랜스진은 그 자신의 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 단일 프로모터는 2개 이상의 트랜스진에 작동가능하게 연결된다. 일부 실시양태에서, 2개 이상의 트랜스진의 일부 트랜스진은 이들 자신의 프로모터에 작동가능하게 연결되고, 2개 이상의 트랜스진의 일부 트랜스진은 공통 프로모터에 작동가능하게 연결된다.
2개 이상의 트랜스진은 하나 이상의 폴리시스트론성 요소에 의해 분리될 수 있다. 하나 이상의 폴리시스트론성 요소는 하나 이상의 IRES 및/또는 하나 이상의 2A 펩티드-코딩 서열, 및/또는 다른 폴리시스트론성 요소일 수 있다. IRES는 메신저 RNA (mRNA) 서열의 중간에서 단백질 번역의 개시를 허용하는 뉴클레오티드 서열이다. 2A 펩티드는 2A 펩티드 서열 내의 리보솜 스키핑 사건을 통해 단일 리딩 프레임 내에서 별개의 단백질 산물의 효율적인 화학양론적 생산을 허용하는 작은 (18-22개 아미노산) 서열이다. 번역을 용이하게 하는 임의의 다른 폴리시스트론성 요소가 또한 사용될 수 있다.
진핵생물 세포에서 기능적인 임의의 프로모터가 본 발명에서 사용될 수 있다. 일부 실시양태에서, 프로모터는 트랜스진과 자연적으로 연관된 것일 수 있고, 주어진 유전자의 코딩 세그먼트 및/또는 엑손의 상류에 있는 5' 비-코딩 서열을 단리함으로써 수득될 수 있다. 이러한 프로모터는 내인성 프로모터 또는 천연 프로모터로 지칭될 수 있다. 다른 실시양태에서, 트랜스진은 재조합 또는 이종 프로모터의 제어 하에 위치될 수 있으며, 이는 그의 천연 환경에서 코딩된 핵산 서열과 정상적으로 연관되지 않은 프로모터를 지칭한다. 일부 실시양태에서, 프로모터는 조직-특이적 또는 세포-특이적 (예를 들어, 골수, 조혈 줄기 세포 (HSC), T 세포, 간, 안구 조직 또는 근육 등에 특이적)이다. 일부 실시양태에서, 프로모터는 구성적 활성 프로모터이다. 일부 실시양태에서, 프로모터는 유도성 프로모터이다. 일부 실시양태에서, 프로모터는 2개 이상의 상이한 프로모터로부터의 서열 요소를 포함하는 키메라 프로모터일 수 있다. 적합한 프로모터는 바이러스, 예컨대 폴리오마 바이러스, 아데노바이러스, 계두 바이러스, 소 유두종 바이러스, 조류 육종 바이러스, 사이토메갈로바이러스 (CMV) (예를 들어, hCMV, mCMV), 라우스 육종 바이러스 (RSV), 및 시미안 바이러스 40 (SV40)의 게놈으로부터 유래된 프로모터, 또는 이종 포유동물 프로모터, 예컨대 액틴 프로모터, 인간 신장 인자-1 알파 (EF1a) 프로모터, CAG 프로모터, 티미딘 키나제 (TK) 프로모터, 유비퀴틴 프로모터, 인간 포스포글리세레이트 키나제 (PGK) 프로모터, 인간 글리세르알데히드-3-포스페이트 데히드로게나제 (GAPDH) 프로모터, 또는 리보솜 단백질 프로모터를 포함한다. 대안적으로, 조직-특이적 프로모터, 예컨대 로돕신 (Rho) 프로모터, 로돕신 키나제 (RhoK) 프로모터, 콘로드 호메오박스 함유 유전자 (CRX) 프로모터, 신경 망막-특이적 류신 지퍼 단백질 (NRL) 프로모터, 난황형 황반부 이영양증 2 (VMD2) 프로모터, 티로신 히드록실라제 프로모터, 뉴런-특이적 에놀라제 (NSE) 프로모터, 성상교세포-특이적 신경교 원섬유성 산성 단백질 (GFAP) 프로모터, 인간 α1-항트립신 (hAAT) 프로모터, 포스포에놀피루베이트 카르복시키나제 (PEPCK) 프로모터, 간 지방산 결합 단백질 프로모터, Flt-1 프로모터, IFN-β 프로모터 (예를 들어, mIFN-β 프로모터), Mb 프로모터, SP-B 프로모터, SYN1 프로모터, WASP 프로모터, SV40/hAlb 프로모터, SV40/CD43, SV40/CD45, NSE/RU5' 프로모터, ICAM-2 프로모터, GPIIb 프로모터, GFAP 프로모터, 피브로넥틴 프로모터, 엔도글린 프로모터, 엘라스타제-1 프로모터, 데스민 프로모터, B29 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, NphsI 프로모터, OG-2 프로모터, 및 mNUS 프로모터가 전사를 구동하는데 사용될 수 있다. 일부 실시양태에서, 프로모터는 hCMV 프로모터이다.
하나 이상의 트랜스진의 전사는 하나 이상의 인핸서 서열을 트랜스진-코딩 핵산 분자에 삽입함으로써 추가로 증가 또는 조정될 수 있다. 인핸서는 프로모터에 대해 5' 또는 3'에 위치될 수 있다. 적합한 인핸서는 진핵생물 세포 바이러스로부터의 인핸서, 예컨대 SV40 인핸서, CMV 초기 프로모터 인핸서, 또는 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 포함할 수 있다. 일부 실시양태에서, 인핸서는 WPRE이다.
일부 실시양태에서, 트랜스진-코딩 핵산 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터, 및 3' LTR을 포함한다. 일부 실시양태에서, 프로모터는 hCMV 프로모터이다. 일부 실시양태에서, 트랜스진-코딩 핵산 분자는 프로모터 및/또는 트랜스진에 작동가능하게 연결된 하나 이상의 인핸서를 추가로 포함한다. 일부 실시양태에서, 인핸서는 WPRE 요소이다. 일부 실시양태에서, 트랜스진 코딩 핵산 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 프로모터, 인핸서, 및 3' LTR을 포함한다. 일부 실시양태에서, 트랜스진-코딩 핵산 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 hCMV 프로모터, WPRE 인핸서, 및 3' LTR을 포함한다.
트랜스진-코딩 핵산 분자는 자연 발생 핵산 분자에 비해 하나 이상의 화학적 또는 생물학적 변형을 포함할 수 있다. 변형은 안정성 및/또는 전사/번역 효율을 향상시키고/거나 면역원성을 감소시킬 수 있다. 변형은 변형된 핵염기, 변형된 백본 (예를 들어, 포스포라미드, 포스포로티오에이트, 포스포로디티오에이트, O-메틸포스포라미다이트 연결 및/또는 펩티드 핵산)을 포함할 수 있지만 이에 제한되지는 않는다.
일부 실시양태에서, 트랜스진-코딩 핵산 분자는 RNA 분자 (예를 들어, ssRNA 분자)이다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터, 및 3' LTR을 포함한다. 일부 실시양태에서, 프로모터는 hCMV 프로모터이다. 일부 실시양태에서, 트랜스진-코딩 RNA는 프로모터 및/또는 트랜스진에 작동가능하게 연결된 하나 이상의 인핸서를 추가로 포함한다. 일부 실시양태에서, 인핸서는 WPRE 요소이다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 프로모터, 인핸서, 및 3' LTR을 포함한다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 hCMV 프로모터, WPRE 인핸서, 및 3' LTR을 포함한다.
일부 실시양태에서, 트랜스진-코딩 RNA 분자는 자연 발생 RNA에 비해 하나 이상의 화학적 또는 생물학적 변형을 포함한다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 임의의 변형된 리보뉴클레오시드를 포함하지 않는다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 하나 이상의 변형된 리보뉴클레오시드를 포함한다. 적합한 변형된 리보뉴클레오시드의 예는 설명의 다른 곳에서 제공된다. 일부 실시양태에서, RNA 분자는 하기를 포함하나 이에 제한되지는 않는 하나 이상의 변형을 포함한다: 변형된 리보뉴클레오시드, 5' 말단 캡 (예를 들어, 5'-7mG 캡 구조); 폴리(rA) 꼬리의 포함; mRNA를 작용제 (예를 들어, 단백질 또는 상보적 핵산 분자)와 복합체화하는 것; RNA 분자의 구조를 변화시키는 요소의 포함 (예를 들어, 2차 구조를 형성하는 요소); 및 C 및/또는 U 잔기 수의 감소. 일부 실시양태에서, 폴리(rA) 서열은 약 10-500개의 뉴클레오티드로부터 유래된다. 일부 실시양태에서, 폴리(rA) 서열은 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 또는 적어도 500개의 뉴클레오티드이다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 캡핑되지 않는다. RNA 분자에 대한 다른 화학적 및 생물학적 변형은 관련 기술분야에 공지되어 있다.
트랜스진-코딩 핵산 주형
한 측면에서, 본 개시내용은 또한 트랜스진-코딩 핵산 분자의 생산을 위한 핵산 주형 (예를 들어, 재조합 DNA 구축물)을 제공한다. 일부 실시양태에서, 핵산 주형은 트랜스진-코딩 RNA 분자를 생산하는데 사용된다. 일부 실시양태에서, 트랜스진-코딩 RNA 분자는 무세포 방법 (예를 들어, 시험관내 전사 또는 무세포 RNA 합성)을 사용하여 생산된다. 예를 들어, 미국 특허 공개 번호 20170292138, 20180087045 20190144489를 참조하며, 이들은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, 핵산 주형은 RNA 생산 요소 (예를 들어, T7 프로모터, 소화 부위 등)에 더하여 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터, 및 3' LTR을 포함한다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터, 및 3' LTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, 프로모터는 hCMV 프로모터이다. 일부 실시양태에서, 핵산 주형은 프로모터 및/또는 트랜스진에 작동가능하게 연결된 하나 이상의 인핸서를 추가로 포함한다. 일부 실시양태에서, 인핸서는 WPRE 요소이다. 일부 실시양태에서, 핵산 주형은 T7 프로모터, 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 프로모터, 인핸서, 3' LTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 일부 실시양태에서, 트랜스진-코딩 핵산 주형은 5' LTR, 하나 이상의 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 hCMV 프로모터, WPRE 인핸서, 3' LTR, 및 임의로 주형 선형화를 위한 하나 이상의 제한 소화 부위를 포함한다. 트랜스진-코딩 핵산 분자를 코딩하는 예시적인 핵산 주형은 도 3에 나타낸다.
트랜스진
일부 실시양태에서, 트랜스진-코딩 핵산 분자는 하나 이상의 트랜스진을 코딩한다. 일부 실시양태에서, 트랜스진-코딩 핵산 분자는 2개 이상의 트랜스진 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 초과)을 코딩한다. 특정 실시양태에서, 트랜스진-코딩 핵산 분자는 오직 하나의 트랜스진을 코딩한다.
일부 실시양태에서, 트랜스진은 치료적 분자, 진단적 분자 또는 리포터 분자를 코딩한다.
일부 실시양태에서, 트랜스진은 치료적 분자를 코딩한다. 치료적 분자는 핵산 또는 폴리펩티드일 수 있다. 본 개시내용의 치료적 분자는 예를 들어 세포, 조직, 장기 또는 대상체에서 결핍되거나 비정상적인 단백질을 대체하고, 기존의 생물학적 경로를 증대시키고, 신규 기능 또는 활성을 제공하기 위해 사용될 수 있다. 치료적 분자는 또한 면역 반응을 도출하는데 사용될 수 있다. 트랜스진의 예시적인 유형은 효소, 보조인자, 담체 단백질, 수송 단백질, 시토카인, 신호전달 단백질, 자살 유전자 산물, 약물 저항성 단백질, 종양 저해제 단백질 호르몬, 면역조정 특성을 갖는 펩티드, 관용원성 펩티드, 면역원성 펩티드, 항체 및 그의 항원-결합 단편, 항산화제 분자, 조작된 이뮤노글로불린-유사 분자, 융합 단백질, 면역 공동-자극 분자, 면역조정 분자, 키메라 항원 수용체, 독소, 종양 저해제 단백질, 성장 인자, 막 단백질, 수용체, 혈관활성 단백질, 리간드 단백질, 항바이러스 단백질, 리보자임, RNA, 리보스위치, mRNA, RNA 간섭 (예를 들어, shRNA, siRNA, microRNA) 분자, 및 그의 유도체를 코딩하는 서열을 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 트랜스진에 의해 코딩되는 치료적 단백질은 하기를 포함하나 이에 제한되지는 않는다: 시토카인, 낭성 섬유증 막횡단 전도도 조절인자 단백질 (CFTR), 디스트로핀, 유트로핀, 혈액 응고 (응혈) 인자 (예를 들어, 인자 XIII, 인자 IX, 인자 X, 인자 VIII, 인자 VIIa, 단백질 C, 인자 VII, B 도메인-결실 인자 VIII, 또는 응고 인자의 높은-활성 또는 더 긴 반감기 변이체, 또는 응고 인자의 활성 또는 비활성 형태), 망막 색소 상피-특이적 65 kDa 단백질 (RPE65), 에리트로포이에틴, LDL 수용체, 지단백질 리파제, 오르니틴 트랜스카르바밀라제, 베타-글로빈, 알파-글로빈, 스펙트린, 알파-항트립신, 아데노신 데아미나제 (ADA), 금속 수송체 (ATP7A 또는 ATP7), 술파미다제, 리소좀 저장 질환에 관여하는 효소, 하이포크산틴 구아닌 포스포리보실 트랜스퍼라제, 베타-25 글루코세레브로시다제, 스핑고미엘리나제, 리소좀 헥소사미니다제, 분지쇄 케토산 데히드로게나제, 인슐린-유사 성장 인자 1 또는 2, 혈소판 유래 성장 인자, 표피 성장 인자, 신경 성장 인자, 신경영양 인자-3 및 -4, 뇌-유래 신경영양 인자, 신경교 유래 성장 인자, 형질전환 성장 인자 알파 및 베타, 알파-인터페론, 베타-인터페론, 인터페론-감마, 인터루킨-2, 인터루킨-4, 인터루킨-12, 과립구-대식세포 콜로니 자극 인자, 림포톡신, 헤르페스 심플렉스 바이러스 티미딘 키나제, 시토신 데아미나제, 디프테리아 독소, 시토크롬 P450, 데옥시시티딘 키나제, 종양 괴사 인자, p53, Rb, Wt-1, NF1, 본 히펠-린다우 (VHL), SERCA2a, 선종성 결장 폴립증 (APC), VEGF, 마이크로디스트로핀, 미니디스트로핀, 리소좀산 리파제, 아릴술파타제 A 및 B, ATP7A 및 B, 인슐린, 글루코키나제, 구아닐레이트 시클라제 2D (GUCY2D), Rab 에스코트 단백질 1, LCA 5, 오르니틴 케토산 아미노트랜스퍼라제, 망막층간분리 1, USH1C, RP GTPase 조절인자 (RPGR), MERTK, DFNB1, ACHM 2, 3 및 4, PKD-1 또는 PKD-2, TPP1, CLN2, 리소좀 저장 질환과 관련된 유전자 산물 (예를 들어, 술파타제, N-아세틸글루코사민-1-포스페이트 트랜스퍼라제, 카텝신 A, GM2-AP, NPC1, VPC2, 스핑고지질 활성화인자 단백질), 및 이를 필요로 하는 대상체에서 치료적 효과를 가질 수 있는 임의의 다른 펩티드 또는 단백질 또는 그의 유도체.
용어 "그의 유도체"는 임의의 치료적 또는 기능적 활성 단편, 또는 기본 폴리펩티드의 변형을 포함하는 것으로 이해될 것이다. 폴리펩티드의 유도체는 상응하는 야생형 폴리펩티드 서열에 비해 하나 이상의 변형 (예를 들어, 하나 이상의 뉴클레오티드의 결실, 하나 이상의 뉴클레오티드의 첨가, 하나 이상의 뉴클레오티드의 치환, 또는 이들의 조합)을 포함할 수 있다. 일부 실시양태에서, 유도체는 상동체이다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질 (또는 그의 서열) 사이의 서열 유사성으로부터 추론된다. 상동성을 확립하는데 유용한 서열 사이의 유사성의 정밀한 백분율은 문제가 되는 핵산 및 단백질에 따라 다르지만, 상동성을 확립하는데 일상적으로 사용되는 서열 유사성은 25% 정도로 작다. 더 높은 수준의 서열 유사성, 예를 들어 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 또는 그 초과가 또한 상동성을 확립하기 위해 사용될 수 있다. 일부 실시양태에서, 유도체는 기본 폴리펩티드와 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 폴리펩티드이다. 서열 유사성 백분율을 결정하는 방법은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 일부 실시양태에서, 유사성은 예를 들어 BLASTP 및 BLASTN 알고리즘 (예를 들어 디폴트 파라미터 사용)을 포함하는 본원에 기재된 것들과 같은 알고리즘을 사용하여 결정될 수 있다. 일부 측면에서, 야생형 HIV-1 균주는 NL4-3이다.
일부 실시양태에서, 트랜스진은 베타-글로빈 또는 그의 유도체를 코딩한다. 베타-글로빈 유전자는 베타-지중해빈혈 또는 겸상 적혈구 질환을 치료하기 위한 유전자 요법에 사용될 수 있다. 일부 실시양태에서, 베타-글로빈 유전자는 인간 베타-글로빈 유전자이다. 일부 실시양태에서, 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 골수 또는 HSC에 특이적이다. 일부 실시양태에서, 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진은 천연 베타-글로빈 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000509.1 또는 그의 단편에 상응하는 아미노산 서열을 갖는 베타-글로빈 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000509.1 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 아미노산 서열을 갖는 베타-글로빈 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000518.5 또는 그의 단편에 상응하는 핵산 서열을 갖는 베타-글로빈 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000518.5 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 핵산 서열을 갖는 베타-글로빈 유전자를 포함한다.
일부 실시양태에서, 트랜스진은 CFTR 또는 그의 유도체를 코딩한다. CFTR 유전자는 낭성 섬유증을 치료하기 위한 유전자 요법에 사용될 수 있다. 일부 실시양태에서, CFTR 또는 그의 유도체를 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, CFTR 또는 그의 유도체를 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 상피 세포에 특이적이다. 일부 실시양태에서, CFTR 또는 그의 유도체를 코딩하는 트랜스진은 천연 CFTR 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, CFTR 또는 그의 유도체를 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000483.3 또는 그의 단편에 상응하는 아미노산 서열을 갖는 CFTR 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000483.3 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 아미노산 서열을 갖는 CFTR 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000492.4 또는 그의 단편에 상응하는 핵산 서열을 갖는 CFTR 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000492.4 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 핵산 서열을 갖는 CFTR 유전자를 포함한다.
일부 실시양태에서, 트랜스진은 인자 VIII 또는 그의 유도체를 코딩한다. 인자 VIII 유전자는 혈우병 B를 치료하기 위한 유전자 요법에 사용될 수 있다. 일부 실시양태에서, 인자 VIII 유전자는 인간 인자 VIII 유전자이다. 일부 실시양태에서, 인자 VIII 또는 그의 유도체를 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 인자 VIII 또는 그의 유도체를 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 간에 특이적이다. 일부 실시양태에서, 프로모터는 골수 또는 HSC에 특이적이다. 일부 실시양태에서, 인자 VIII 또는 그의 유도체를 코딩하는 트랜스진은 천연 인자 VIII 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 인자 VIII 또는 그의 유도체를 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000123.1 또는 그의 단편에 상응하는 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_063916.1 또는 그의 단편에 상응하는 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000123.1 또는 NCBI 참조 서열 번호 NP_063916.1 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 아미노산 서열을 갖는 인자 VIII 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000132.4 또는 그의 단편에 상응하는 핵산 서열을 갖는 인자 VIII 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_019863.2 또는 그의 단편에 상응하는 핵산 서열을 갖는 인자 VIII 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000132.4 또는 NCBI 참조 서열 번호 NM_019863.2, 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 핵산 서열을 갖는 인자 VIII 유전자를 포함한다.
일부 실시양태에서, 트랜스진은 디스트로핀 또는 그의 유도체를 코딩한다. 디스트로핀 유전자는 뒤시엔느 근이영양증 (DMD)을 치료하기 위한 유전자 요법에 사용될 수 있다. 일부 실시양태에서, 디스트로핀 유전자는 마이크로-디스트로핀 또는 미니-디스트로핀 유전자이다 (Vincent et al., Nature Genetics 5:130 (1993); Wang et al., Proc Natl Acad Sci USA 97:13714-9 (2000) [미니-디스트로핀]; Harper et al., Nat Med. 8:253-61 (2002) [마이크로-디스트로핀]). 일부 실시양태에서, 디스트로핀 유전자는 인간 디스트로핀 유전자이다. 일부 실시양태에서, 디스트로핀 또는 그의 유도체를 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 디스트로핀 또는 그의 유도체를 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 근육 세포에 특이적이다. 일부 실시양태에서, 디스트로핀 또는 그의 유도체를 코딩하는 트랜스진은 천연 디스트로핀 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 디스트로핀 또는 그의 유도체를 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000100.3 또는 그의 단편에 상응하는 아미노산 서열을 갖는 디스트로핀 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000100.3 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 아미노산 서열을 갖는 디스트로핀 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000109.4 또는 그의 단편에 상응하는 핵산 서열을 갖는 디스트로핀 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000109.4 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 핵산 서열을 갖는 디스트로핀 유전자를 포함한다.
일부 실시양태에서, 트랜스진은 RP GTPase 조절인자 (RPGR) 또는 그의 유도체를 코딩한다. RPGR 유전자는 색소성 망막염에 대한 유전자 요법에 사용될 수 있다. 일부 실시양태에서, RPGR 유전자는 인간 RPGR 유전자이다. 일부 실시양태에서, RPGR 또는 그의 유도체를 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, RPGR 또는 그의 유도체를 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 안구 조직에 특이적이다. 일부 실시양태에서, RPGR 또는 그의 유도체를 코딩하는 트랜스진은 천연 RPGR 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, RPGR 또는 그의 유도체를 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000319.1 또는 그의 단편에 상응하는 아미노산 서열을 갖는 RPGR 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NP_000319.1 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 아미노산 서열을 갖는 RPGR 폴리펩티드를 코딩한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000328.3 또는 그의 단편에 상응하는 핵산 서열을 갖는 RPGR 유전자를 포함한다. 일부 실시양태에서, 트랜스진은 NCBI 참조 서열 번호 NM_000328.3 또는 그의 단편과 적어도 60% 동일한 (예를 들어, 70%, 80%, 90% 내지 100%, 95% 내지 100%, 98% 내지 100%, 또는 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한) 핵산 서열을 갖는 RPGR 유전자를 포함한다.
일부 실시양태에서, 트랜스진은 키메라 항원 수용체 (CAR)를 코딩한다. CAR은 암을 치료하기 위해 사용될 수 있다. 일부 실시양태에서, CAR을 코딩하는 트랜스진은 hCMV 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, CAR을 코딩하는 트랜스진은 조직-특이적 또는 세포-특이적 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 HSC 또는 T 세포 (예를 들어, 세포독성 T 세포)에 특이적이다. 일부 실시양태에서, CAR을 코딩하는 트랜스진은 WPRE 인핸서에 추가로 작동가능하게 연결된다.
일부 실시양태에서, 트랜스진은 리포터 분자를 코딩한다. 리포터 분자는 핵산 또는 폴리펩티드일 수 있다. 리포터 분자는 유전자 발현을 측정하고 일반적으로 측정가능한 신호, 예컨대 형광, 발광 또는 색상을 생성하는데 사용될 수 있는 분자를 지칭한다. 일부 실시양태에서, 폴리펩티드는 루시페라제이다. 일부 실시양태에서, 폴리펩티드는 형광 단백질이다. 형광 단백질은 관련 기술분야에 공지되어 있고, 여기 시 광을 재방출하는 능력을 갖는 형광 화합물인 형광단의 하위 부류이다. 형광단은 제1 특정 파장의 여기 광 에너지를 흡수한 후, 제2 더 긴 특정 파장에서 광 에너지를 재방출할 것이다. 각 유형의 형광단은 그의 화학적 구조의 성질 및 환경에 따라 상이한 파장의 광에 반응하고 방출한다. 일부 실시양태에서, 본 발명에 유용한 형광 단백질은 하기를 포함하나 이에 제한되지는 않는다: 그린 형광 단백질 (예를 들어, wt-GFP, EGFP, 에메랄드, 슈퍼폴더 GFP, 아자미 그린, mWasabi, TagGFP, TurboGFP, AcGFP, ZsGreen, T-사파이어 등), 블루 형광 단백질, (예를 들어, EBFP, EBFP2, 아주라이트, mTagBFP 등), 시안 형광 단백질 (예를 들어, ECFP, mECFP, 세룰리언, mTurquoise, CyPet, AmCyan1, Midori-Ishi Cyan, TagCFP, mTFP1 (Teal) 등), 옐로우 형광 단백질 (예를 들어, EYFP, 토파즈, 비너스, mCitrine, YPet, TagYFP, PhiYFP, ZsYellow1, mBanana 등), 오렌지 형광 단백질 (예를 들어, 쿠사비라 오렌지, 쿠사비라 Orange2, mOrange, mOrange2, dTomato, dTomato-Tandem, TagRFP, TagRFP-T, DsRed, DsRed2, DsRed-Express (T1), DsRed-단량체, mTangerine 등), 또는 레드 형광 단백질 (예를 들어, mRuby, mApple, mStrawberry, AsRed2, mRFP1, JRed, mCherry, HcRed1, mRaspberry, dKeima-Tandem, HcRed-Tandem, mPlum, AQ143 등). 일부 실시양태에서, 트랜스진은 GFP를 코딩한다. 일부 실시양태에서, 리포터 분자는 세포, 조직, 장기 또는 유기체에서 단백질이 위치된 위치를 식별하기 위해 다른 단백질 코딩 서열에 프레임 내에서 융합될 수 있다. 본 개시내용에 따라 사용하기 위한 리포터는 본원에 기재되거나 관련 기술분야의 통상의 기술자에게 공지된 임의의 리포터를 포함한다.
사용 방법
본 개시내용의 핵산 및 조성물은 유전자 발현과 관련된 임의의 장애와 연관된 증상을 치료 및/또는 호전시키기 위한 생물학적 효과를 갖는 임의의 트랜스진을 전달하는데 사용될 수 있다. 본 개시내용의 방법은 예를 들어 트랜스진을 통합하고 안정적으로 발현함으로써 결핍되거나 비정상적인 단백질을 대체하고, 기존의 생물학적 경로를 증대시키고, 신규 기능 또는 활성을 제공하기 위해 사용될 수 있다. 본 개시내용의 방법은 또한 트랜스진을 일시적으로 발현하고 면역 반응을 도출하기 위해 사용될 수 있다.
한 측면에서, 본 개시내용은 트랜스진 발현을 필요로 하는 대상체에서 트랜스진을 발현하는 방법을 제공하며, 방법은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 개시된 트랜스진은 이를 필요로 하는 대상체에서 발현될 수 있다. 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물은 대상체에서 하나 이상의 트랜스진을 발현하는데 사용될 수 있다.
한 측면에서, 본 개시내용은 세포에서 트랜스진을 발현하는 방법을 제공하며, 방법은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물을 세포에 전달하여, 그에 의해 세포에서 하나 이상의 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 적합한 세포 유형은 HSC, 간 세포, 안구 세포 (예를 들어, 망막 세포), 근육 세포, 상피 세포, T 세포 (예를 들어, 세포독성 T 세포) 등을 포함하나 이에 제한되지는 않는다. 일부 측면에서, 개시된 트랜스진은 세포에서 발현될 수 있다. 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물은 세포에서 하나 이상의 트랜스진을 발현하는데 사용될 수 있다.
한 측면에서, 본 개시내용은 조직에서 트랜스진을 발현하는 방법을 제공하며, 방법은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물을 조직에 전달하여, 그에 의해 조직에서 하나 이상의 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 적합한 조직은 골수, 근육, 안구 조직, 심장 조직, 간 조직, 상피 조직, 결합 조직, 신경 조직, 위장 조직 등을 포함하나 이에 제한되지는 않는다. 일부 측면에서, 개시된 트랜스진은 조직에서 발현될 수 있다. 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물은 조직에서 하나 이상의 트랜스진을 발현하는데 사용될 수 있다.
한 측면에서, 본 개시내용은 장기에서 트랜스진을 발현하는 방법을 제공하며, 방법은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물을 장기에 전달하여, 그에 의해 장기에서 하나 이상의 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 적합한 장기는 눈, 심장, 폐, 간, 위, 비장, 췌장, 소장, 대장, 신장, 골수, 뇌 등을 포함하나 이에 제한되지는 않는다. 일부 측면에서, 개시된 트랜스진은 장기에서 발현될 수 있다. 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물은 장기에서 하나 이상의 트랜스진을 발현하는데 사용될 수 있다.
한 측면에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물을 사용하여 병태를 치료하는 방법을 제공하며, 방법은 조성물을 치료를 필요로 하는 대상체에게 투여하여, 그에 의해 대상체에서 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 개시된 트랜스진은 병태를 치료하기 위해 사용될 수 있다. 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진 서열을 포함하는 트랜스진-코딩 핵산을 포함하는 조성물은 병태를 치료하기 위해 사용될 수 있다.
일부 실시양태에서, 하나 이상의 트랜스진은 표적 세포의 게놈에 통합된다 (예를 들어, 대상체에서). 일부 실시양태에서, 하나 이상의 트랜스진은 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 6개월, 적어도 1년, 적어도 2년, 적어도 3년, 적어도 4년, 또는 적어도 5년 동안 안정적으로 발현된다. 일부 실시양태에서, 하나 이상의 트랜스진은 1-2주, 2-4주, 1-3개월, 3-6개월, 6-9개월, 9-12개월, 1-2년, 2-3년, 3-4년 또는 4-5년, 또는 그 초과 동안 안정적으로 발현된다. 일부 실시양태에서, 하나 이상의 트랜스진은 대상체의 평생 동안 안정적으로 발현된다. 일부 실시양태에서, 본 개시내용의 조성물은 하나 이상의 트랜스진을 표적 세포의 게놈에 통합하는데 사용된다 (예를 들어, 대상체에서).
유전자 발현과 관련된 임의의 질환, 장애 또는 병태 (예를 들어, 트랜스진의 통합 및 안정적 발현이 요구될 수 있는 경우)는 치료될 수 있다. 일부 실시양태에서, 치료될 질환, 장애 또는 병태는 유전 병태이다. 유전 질환, 장애 또는 병태는 유전적 또는 비-유전적일 수 있다. 일부 실시양태에서, 질환, 장애 또는 병태는 신경퇴행성, 증식성, 염증성 또는 자가면역 질환, 장애 또는 병태이다. 일부 실시양태에서, 치료될 병태는 낭성 섬유증 (및 기타 폐 질환), 혈우병 A, 혈우병 B, 베타-지중해빈혈, 겸상 적혈구 질환, 빈혈 및 다른 혈액 응고 장애, 알츠하이머병, 파킨슨병, 헌팅톤병, 근위축성 측삭 경화증, 간질 및 다른 신경학적 장애, 암, 당뇨병, 근이영양증 (예를 들어, 뒤시엔느, 베커), 레버 선천성 흑암시, 리소좀 저장 질환, 어셔 증후군 1C, 뇌회형 위축, 코넥신 26 난청, 색맹, X-연관 망막층간분리, 다낭성 신장 질환, 고셔병, 헐러병, 아데노신 데아미나제 결핍, 글리코겐 저장 질환 및 다른 대사 결함, 폼페병, 울혈성 심부전, 색소성 망막염, 고형 장기 (예를 들어, 뇌, 간, 신장, 심장)의 질환 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 치료될 병태는 암이다. 일부 실시양태에서, 암은 혈액암 (예를 들어, 림프종, 백혈병, 다발성 골수종 등), 유방암, 전립선암, 소화기 계통 암 (예를 들어, 식도암, 위암, 결장직장암), 간암, 자궁경부암, 난소암 또는 자궁암, 췌장암, 폐암, 뇌암 (예를 들어, 교모세포종), 피부암 (예를 들어, 흑색종), 또는 근육 또는 신경 육종 등이다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, 베타-지중해빈혈 또는 겸상 적혈구 질환의 치료를 필요로 하는 대상체에서 베타-지중해빈혈 또는 겸상 적혈구 질환을 치료하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 베타-글로빈 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, 겸상 적혈구 질환의 치료를 필요로 하는 대상체에서 겸상 적혈구 질환을 치료하는 방법을 제공한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 베타-지중해빈혈 또는 겸상 적혈구 질환의 치료에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 CFTR 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, 낭성 섬유증의 치료를 필요로 하는 대상체에서 낭성 섬유증을 치료하는 방법을 제공한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 낭성 섬유증의 치료에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 인자 VIII 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, 혈우병 B의 치료를 필요로 하는 대상체에서 혈우병 B를 치료하는 방법을 제공한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 혈우병 B의 치료에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 디스트로핀 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, DMD의 치료를 필요로 하는 대상체에서 DMD를 치료하는 방법을 제공한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 DMD의 치료에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사/통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 RPGR 또는 그의 유도체를 코딩하는 트랜스진을 포함하는 핵산을 포함하는 조성물을 투여하는 것을 포함하는, 색소성 망막염의 치료를 필요로 하는 대상체에서 색소성 망막염을 치료하는 방법을 제공한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 색소성 망막염의 치료에 사용될 수 있다.
일부 실시양태에서, 본 개시내용은 트랜스진-코딩 핵산의 역전사 및 통합을 위해 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 LTR 서열에 의해 플랭킹된 키메라 항원 수용체 (CAR)를 코딩하는 트랜스진을 포함하는 핵산 분자를 포함하는 조성물을 투여하는 것을 포함하는, 암 치료를 필요로 하는 대상체에서 암을 치료하는 방법을 제공한다. 일부 실시양태에서, 치료될 병태는 암이다. 일부 실시양태에서, 암은 혈액암 (예를 들어, 림프종, 백혈병, 다발성 골수종 등), 유방암, 전립선암, 소화기 계통 암 (예를 들어, 식도암, 위암, 결장직장암), 간암, 자궁경부암, 난소암 또는 자궁암, 췌장암, 폐암, 뇌암 (예를 들어, 교모세포종), 피부암 (예를 들어, 흑색종), 근육 또는 신경 육종 등이다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 측면에서, 본 개시내용의 조성물은 암의 치료에 사용될 수 있다.
일부 실시양태에서, 하나 이상의 트랜스진은 일단 표적 세포의 게놈에 (예를 들어, 대상체에서) 통합되면 일시적으로 발현된다. 일시적인 발현은 면역 반응을 도출하기에 충분하다. 면역 반응으로부터 이익을 얻을 수 있는 임의의 질환, 장애 또는 병태가 치료될 수 있다. 그러므로, 일부 실시양태에서, 본 개시내용은 하나 이상의 트랜스진을 일시적으로 발현함으로써 면역 반응의 도출을 필요로 하는 대상체에서 면역 반응을 도출하는 방법을 제공하며, 방법은 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자 및 긴 말단 반복부 서열에 의해 플랭킹된 트랜스진을 포함하는 핵산 분자를 포함하는 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 트랜스진을 발현하는 것을 포함한다. 일부 실시양태에서, 질환, 장애 또는 병태는 암이고, 트랜스진은 종양 항원을 코딩할 수 있다. 일부 실시양태에서, 질환, 장애 또는 병태는 감염성 질환 (예를 들어, 감염성 작용제, 예컨대 병원성 유기체에 의해 야기되는 질환)이고, 트랜스진은 감염성 질환과 연관된 항원을 코딩할 수 있다. 대상체는 감염성 질환에 걸릴 위험이 있을 수 있고, 조성물은 예방적으로 투여될 수 있다. 일부 측면에서, 본 개시내용의 조성물은 면역 반응을 도출하기 위해 사용될 수 있다.
비-바이러스 전달 시스템
본 개시내용의 핵산 분자는 비-바이러스 전달 시스템을 통해 세포, 조직 또는 대상체에 전달된다. 관련 기술분야에 공지된 임의의 적합한 비-바이러스 전달 시스템은 본 개시내용의 핵산 분자를 생체외 또는 생체내에서 표적 조직 및/또는 세포로 전달하는데 사용될 수 있다.
일부 실시양태에서, 핵산 분자 (예를 들어, RNA, ssDNA, 선형 dsDNA)는 지질 나노입자 (LNP)에 패키징된다. DNA 분자 및 RNA 분자 (예를 들어, mRNA 분자)를 패키징하기 위한 적합한 LNP는 관련 기술분야에 공지되어 있다. 일부 실시양태에서, LNP는 하나 이상의 이온화가능 또는 양이온성 지질 (예를 들어, N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸암모늄 클로라이드 (DOTMA); 1,2-디올레오일-3-트리메틸암모늄-프로판 (DOTAP); 1,2-디올레오일-3-디메틸암모늄 프로판 (DODAP); DODMA; Dlin-MC3-DMA (MC3); LP-01; 디케토피페라진-기반 이온화가능 지질, cKK-E12); 하나 이상의 중성 포스포지질 (예를 들어, 콜레스테롤), 하나 이상의 양쪽이온성 지질 분자 (예를 들어, 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민 (DOPE)), 및/또는 하나 이상의 PEG-변형 지질을 포함한다. 일부 실시양태에서, LNP는 지질 단층 내에 폴리락트산 (PLA) 또는 폴리(락트산-코-글리콜산) (PGLA) 중합체를 포함한다. 일부 실시양태에서, 이온화가능 지질은 pH-의존적 이온화가능 물질이다.
일부 실시양태에서, LNP를 포함하나 이에 제한되지는 않는 비-바이러스 전달 시스템은 표적 세포 또는 조직 상의 수용체에 특이적으로 결합하는 폴리펩티드 (예를 들어, 바이러스 외피 또는 캡시드 단백질, 항체 또는 그의 항원-결합 단편, 또는 다른 표적화 모이어티)와 접합된다. 일부 실시양태에서, LNP는 특정 세포, 조직 또는 장기에 대한 표적화를 용이하게 하는 소분자에 접합된다. 적합한 세포 유형은 HSC, 간 세포 (예를 들어, 간세포), 안구 세포 (예를 들어, 망막 세포), 근육 세포, 상피 세포, T 세포 (예를 들어, 세포독성 T 세포) 등을 포함하나 이에 제한되지는 않는다. 적합한 조직은 골수, 근육, 안구 조직, 심장 조직, 간 조직, 상피 조직, 결합 조직, 신경 조직, 위장 조직 등을 포함하나 이에 제한되지는 않는다. 적합한 장기는 눈, 심장, 폐, 간, 위, 비장, 췌장, 소장, 대장, 신장 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 표적 세포 또는 조직은 골수, HSC, 상피 세포, 간 세포 (예를 들어, 간세포), 안구 세포 (예를 들어, 망막 세포), 근육 세포, T 세포 (예를 들어, 세포독성 T 세포)를 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 본 개시내용의 핵산 분자는 수용액 (예컨대 완충액, 예를 들어 수크로스 시트레이트 완충액)에서, 또는 지질, 중합체, 펩티드, 또는 세포로의 진입을 용이하게 하는 다른 화합물과 조합하여 네이키드로 전달될 수 있다. 핵산 분자는 임의의 적합한 기술을 사용하여, 예를 들어 직접 주사, 미세주사, 형질감염, 뉴클레오펙션, 전기천공법, 리포펙션, 고압 분무, 바이오리틱 등에 의해 표적 세포 또는 대상체에 도입될 수 있다. 일부 실시양태에서, 핵산 분자는 양이온성 양친매성체와 복합체화된다. 일부 실시양태에서, 핵산 분자는 형질감염제 (예를 들어, 리포펙타민(Lipofectamine)™, 리포펙틴(Lipofectin)™, jetPEI, RNAiMAX, 및 인비보펙타민(Invivofectamine), 메가펙틴(MegaFectin)™, 트랜스잇(TransIT)™)와 복합체화된다. 일부 실시양태에서, 핵산 분자는 세포-침투 펩티드 (예를 들어, 다가양이온성 또는 양친매성 펩티드)와 복합체화된다.
일부 실시양태에서, 본 개시내용의 핵산 분자는 리포솜, 지질 나노입자, 폴리펩티드 나노입자, 무기 물질 (예를 들어, 실리카 나노입자, 금 나노입자, 및 무기-기반 담체, 예컨대 CaP), 합성 중합체, 덴드리머, 양이온성 나노에멀젼, 중합체성 나노입자, 중합체 및 지질 하이브리드 담체, 또는 이들의 조합에 패키징된다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 바이러스 캡시드에 패키징된다.
일부 실시양태에서, 본 개시내용의 핵산 분자는 폴리에틸렌이민 (PEI), 폴리아크릴레이트, 폴리(β-아미노 에스테르) (PBAE) 및 폴리(아스파르타미드) (PAsp)에 기초한 나노입자를 포함하나 이에 제한되지는 않는 중합체성 나노입자에 패키징된다.
일부 실시양태에서, 본 개시내용의 핵산 분자는 리포솜에 패키징된다. 리포솜은 주로 지질 이중층으로 구성될 수 있는 인공적으로 제조된 소포이다. 리포솜은 상이한 크기일 수 있지만, 예컨대 직경이 수백 나노미터일 수 있고 좁은 수성 구획에 의해 분리된 일련의 동심원 이중층을 함유할 수 있는 다중층 소포 (MLV), 직경이 50 nm 미만일 수 있는 작은 단세포 소포 (SUV), 및 직경이 50 내지 500 nm일 수 있는 큰 단층 소포 (LUV)에 제한되지는 않는다. 리포솜 설계는 건강하지 못한 조직에 대한 리포솜의 부착을 개선하거나 사건, 예컨대 엔도사이토시스 (그러나 이에 제한되지는 않음)를 활성화시키기 위해 옵소닌 또는 리간드를 포함할 수 있지만 이에 제한되지는 않는다. 리포솜은 핵산 분자의 전달을 개선하기 위해 낮은 또는 높은 pH를 함유할 수 있다. 일부 실시양태에서, 본 개시내용의 핵산 분자는 리포솜, 예컨대 1,2-디올레일옥시-N,N-디메틸아미노프로판 (DODMA) 리포솜, 마리나 바이오테크(Marina Biotech) (미국 워싱턴주 모텔)로부터의 DiLa2 리포솜, 1,2-디리놀레일옥시-3-디메틸아미노프로판 (DLin-DMA), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란 (DLin-KC2-DMA), 및 MC3 (US20100324120; 그의 내용은 그 전문이 본원에 참조로 포함됨)으로부터 형성된 것들에 패키징된다. 일부 실시양태에서, 리포솜은 PEG화된다.
본 개시내용의 핵산 분자 (예를 들어, 리포솜, 지질 나노입자, 양이온성 나노에멀젼, 중합체성 나노입자 등에 패키징됨)는 전신적으로 또는 국부적으로, 정맥내로, 피내로, 동맥내로, 병변내로, 종양내로, 두개내로, 관절내로, 전립선내로, 흉막내로, 기관내로, 비강내로, 유리체내로, 질내로, 직장내로, 국소적으로, 근육내로, 복강내로, 피하로, 결막하, 방광내로, 점막으로, 심낭내, 탯줄내로, 안구내로, 경구로, 국부적으로, 흡입 (예를 들어, 에어로졸 흡입)에 의해, 주사에 의해, 주입에 의해, 연속 주입에 의해, 표적 세포의 직접 국재화된 관류 베이딩에 의해, 카테터를 통해, 세정을 통해, 크림으로, 또는 관련 기술분야의 통상의 기술자에게 공지된 바와 같은 임의의 다른 방법 또는 전술한 방법의 임의의 조합 (예를 들어, 본원에 참조로 포함된 문헌 [Remington's Pharmaceutical Sciences (1990)] 참조)에 의해 투여될 수 있다.
일부 실시양태에서, 본 개시내용의 핵산 분자 (예를 들어, 리포솜, 지질 나노입자, 양이온성 나노에멀젼, 중합체성 나노입자에 패키징됨)는 제약상 허용되는 담체를 포함하는 제약 조성물의 형태로 투여된다. 본원에서 사용된 바와 같은 "제약상 허용되는 담체"는 임의의 및 모든 용매, 분산 매질, 코팅, 계면활성제, 항산화제, 보존제 (예를 들어, 항박테리아제, 항진균제), 등장화제, 흡수 지연제, 염, 보존제, 약물, 약물 안정화제 (예를 들어, 항산화제), 겔, 결합제, 부형제, 붕해제, 윤활제, 감미제, 향미제, 염료, 관련 기술분야의 통상의 기술자에게 공지된 바와 같은 이러한 유사 물질 및 이들의 조합 (예를 들어, 본원에 참조로 포함된 문헌 [Remington's Pharmaceutical Sciences (1990)] 참조)을 포함한다. 임의의 통상적인 담체가 활성 성분과 호환불가능한 경우를 제외하고, 치료적 또는 제약 조성물에서의 그의 사용이 고려된다. 생물학적 활성 분자 및 적합한 담체를 갖는 지질 나노입자를 위한 조성물은 예를 들어 본원에 참조로 포함된 미국 특허 번호 7,404,969에 개시되어 있다.
본 개시내용의 핵산 분자는 1회 투여될 수 있거나, 대안적으로 이들은 복수의 투여로 투여될 수 있다. 여러 번 투여되는 경우, 화합물은 상이한 경로를 통해 투여될 수 있다. 예를 들어, 첫 번째 (또는 처음 몇 번) 투여는 영향을 받은 조직에 직접 수행될 수 있는 반면, 이후 투여는 전신적일 수 있다.
키트
한 측면에서, 본 개시내용은 하나 이상의 트랜스진의 전달을 위한 키트를 제공한다. 일부 실시양태에서, 키트는 유효량의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 본 개시내용에 따른 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진을 코딩하는 핵산 분자를 포함하는 조성물을 포함한다. 일부 실시양태에서, 키트는 유효량의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자, 및 본 개시내용에 따른 LTR 서열에 의해 플랭킹된 하나 이상의 트랜스진을 코딩하는 핵산 분자를 단위 투여 형태로 포함하는 조성물을 포함한다. 일부 실시양태에서, 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 분자는 하나 이상의 부속 레트로바이러스 단백질을 추가로 코딩한다. 일부 실시양태에서, 조성물은 하나 이상의 부속 레트로바이러스 단백질을 코딩하는 하나 이상의 추가 핵산 분자를 포함한다. 일부 실시양태에서, 키트는 2개의 핵산 분자를 포함하는 조성물을 포함한다. 일부 실시양태에서, 키트는 2개 이상의 핵산 분자 (예를 들어, 2, 3, 4 또는 5개)를 포함하는 조성물을 포함한다. 일부 실시양태에서, 핵산 분자는 지질 나노입자로 전달을 위해 패키징 또는 제형화된다. 일부 실시양태에서, 키트는 조성물을 포함하는 멸균 컨테이너를 포함한다. 이러한 컨테이너는 박스, 앰플, 병, 바이알, 튜브, 백, 파우치, 블리스터-팩, 또는 관련 기술분야에 공지된 다른 적합한 컨테이너 형태일 수 있다. 이러한 컨테이너는 플라스틱, 유리, 라미네이트 종이, 금속 호일, 또는 의약을 담기에 적합한 다른 재료로 제조될 수 있다. 원하는 경우, 조성물은 이를 필요로 하는 대상체에게 세포를 투여하기 위한 지시사항과 함께 제공된다.
실시예
본원에 기재된 본 발명이 보다 완전하게 이해될 수 있도록, 하기 실시예가 제시된다. 본 출원에 기재된 실시예는 본원에 제공된 방법, 조성물 및 시스템을 예시하기 위해 제공되며, 어떠한 방식으로든 그 범주를 제한하는 것으로 해석되어서는 안된다.
실시예 1: 생체내 유전자 요법을 위한 mRNA-코딩된 최소 렌티바이러스 기계류
트랜스진-코딩 주형을 도 3에 나타낸 바와 같이 설계하였다. 트랜스진-코딩 핵산 주형은 5'에서 3'으로, 5' LTR, 역전사효소 프라이밍 요소, 트랜스진에 작동가능하게 연결된 프로모터, 인핸서, 및 3' LTR을 포함한다. 추가 RNA 생산 요소는 5' T7 RNA 폴리머라제 프로모터 및 3' 소화 부위를 포함한다. 트랜스진-코딩 핵산 주형으로부터 생산된 RNA 분자는 레트로바이러스 역전사효소가 변형된 리보뉴클레아제를 복사할 수 없기 때문에 비변형된 뉴클레오시드를 포함한다 (Swanstrom et al., J. Biol. Chem. 256:1115-1121(1981)). 또한, RNA는 RNA 안정성을 향상시키기 위해 5'-7mG 캡 구조 및 폴리(rA) 꼬리를 갖는다.
(역전사/통합을 위한) Pol 폴리단백질을 코딩하는 2개의 최소 핵산 주형을 도 4에 나타낸 바와 같이 설계하였다. 정규 유전자 구축은 인라인으로 발현되는 gagpol을 제공하며, 이는 Pol 폴리단백질 발현을 위한 번역 미끄러짐을 필요로 한다. 신규 설계는 폴리단백질 유닛 (또는 하기 설명된 바와 같은 심지어 잠재적으로 별도의 유닛)으로서 별도의 구축물로부터 pol을 프로세싱함으로써 pol 발현을 증가시킨다. 이들 신규 설계는 증가된 mRNA 안정성 및 번역을 위해 상이한 UTR을 코딩한다. 이 신규 설계는 역전사 및 pol과의 통합에 필수적인 부속 단백질 유닛을 임의로 코딩하며, 이는 2A와 함께 시스일 수 있다. 제1 핵산 주형은 5'에서 3'으로, 5' UTR, Pol 폴리단백질 형태의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함한다. 추가 RNA 생산 요소는 5' T7 RNA 폴리머라제 프로모터 및 3' 소화 부위를 포함한다. 제2 핵산 주형은 5'에서 3'으로, 5' UTR, 하나 이상의 레트로바이러스 부속 단백질을 코딩하는 핵산 서열, Pol 폴리단백질 형태의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함한다. 부속 단백질 유닛은 pol 폴리단백질 유전자에 의해 코딩되지 않는 레트로바이러스 요소를 포함하고, 그 예에는 gag 폴리단백질 (p55), MA (p17), CA (p24), NC (p9), p6, tat, nef, vpr, vif 및 vpu가 포함되나 이에 제한되지는 않는다. 추가 RNA 생산 요소는 5' T7 RNA 폴리머라제 프로모터 및 3' 소화 부위를 포함한다. 이들 핵산 주형으로부터 생산된 mRNA 분자는 변형된 (예를 들어, 슈도우리딘) 및 비변형된 뉴클레오시드 둘 다를 포함한다. 변형된 뉴클레오시드의 사용은 최종 mRNA 분자의 면역원성을 감소시킨다. 또한, mRNA는 효율적인 번역 및 안정성을 보장하기 위해 5'-7mG 캡 구조 및 폴리(rA) 꼬리를 갖는다. 예를 들어, 3' UTR은 폴리 A 꼬리를 코딩할 수 있다.
Pol 폴리단백질의 다중-기능적 유닛을 발현하기 위한 적어도 3개의 상이한 구축물을 도 5에 나타낸 바와 같이 설계하였다. 첫째, 도 5a에 나타낸 바와 같이, 구축물은 프로테아제 (PR), 역전사효소/RNase H (RT), 및 인테그라제 (IN)를 정규 유닛으로서 제공하며, 여기서 각 성분은 PR에 의한 오토프로세싱에 의해 분리된다. 둘째, 도 5b에 나타낸 바와 같이, Pol 폴리단백질 성분 개별 유닛 RT 및 IN은 바이시스트론성 구축물 상에 코딩된다. 셋째, 도 5c에 나타낸 바와 같이, Pol 폴리단백질 성분 개별 유닛이 별도의 구축물 상에 코딩된다. 이들 구축물을 사용할 수 있는 다양한 시나리오가 있다. 첫째, 모든 Pol 폴리단백질 성분은 5' 및 3' UTR을 갖는 하나의 mRNA 상에 폴리단백질로서 코딩될 수 있으며 (도 5a에 의해 표시됨), 여기서 PR 프로테아제는 폴리단백질 (pol)로서 성분을 코딩할 때 필요하다. 둘째, Pol 폴리단백질 성분 RT 및 IN 유닛은 각각 개재 IRES 또는 2A 서열이 있는 5' 및 3' UTR을 갖는 하나 이상의 구축물 상에 코딩될 수 있으며 (도 5b에 의해 표시됨), 여기서 PR 프로테아제는 "비-폴리단백질" 개별 유닛으로서 요소를 코딩할 때 필요하지 않다. 셋째, Pol 폴리단백질 성분 RT 및 IN 유닛은 각각 5' 및 3' UTR을 갖는 2개 이상의 구축물 상에 코딩될 수 있다 (도 5c에 의해 표시됨). 넷째, Pol 폴리단백질 성분 RT 및 IN 유닛 및 부속 단백질 유닛은 각각 개재 IRES 또는 2A 서열이 있는 5' 및 3' UTR을 갖는 하나의 구축물 상에 코딩될 수 있다. 이 시나리오에서, 부속 요소가 폴리단백질, 예를 들어 Gag 폴리단백질로서 코딩되는 경우, PR 프로테아제가 필요할 것이다. 그리고 다섯번째 비제한적인 시나리오로서, Pol 폴리단백질 성분 RT 및 IN 유닛 및 부속 단백질 유닛은 각각 5' 및 3' UTR을 갖는 2개 이상의 구축물 상에 코딩될 수 있다.
실시예 2: 겸상 적혈구 질환을 치료하기 위한 베타-글로빈의 생체내 전달
베타-글로빈 트랜스진을 포함하는 실시예 1에 기재된 바와 같은 트랜스진-코딩 핵산 주형은 숙주 세포 게놈으로의 통합을 위해 LTR에 의해 플랭킹된 베타-글로빈 유전자를 포함하는 RNA 분자를 생산하는데 사용된다. 실시예 1에 기재된 바와 같이, 5'에서 3'으로, 5' UTR, Pol 폴리단백질 형태의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 주형은 레트로바이러스 Pol 단백질을 코딩하는 RNA 분자를 생산하는데 사용된다.
2개의 RNA 분자를 포함하는 유효량의 지질 나노입자 조성물이 겸상 적혈구 질환을 치료하기 위해 겸상 적혈구 질환을 앓고 있는 환자에게 투여된다.
실시예 3: 인간 세포에서 RNA 안정성 및 번역의 개선
본원에 기재된 RNA-매개 트랜스진 통합 시스템의 기초를 형성하는 렌티바이러스-유래 유전자는 세포에서 합성 유전자 발현에 대한 과제를 제기할 수 있다. 렌티바이러스 복제 단계는 바이러스 유전자 및 조절 요소, 구조적 단백질, 복제적 효소, 및 복제에 중요한 숙주 인자와의 상호작용의 전체 보완에 의해 조율되는 엄격하게 제어되는 시공간적 프로세스를 거친다. 이 실시예는 RNA-기반 통합 시스템의 안정성 및 효율을 증가시키기 위한 여러 변형을 기술한다.
기능적 유닛 RNA의 증가된 안정성
하나 이상의 Pol 폴리단백질 성분 및/또는 부속 단백질을 코딩하는 하나 이상의 핵산 분자는 또한 "기능적 유닛 핵산"으로 지칭된다. 최소한의 통합-감응성 RNA 시스템의 생성은 일반적으로 역전사 및 프로바이러스 통합에 직접 영향을 미치지 않는 바이러스 유전자의 제거를 수반한다. 그러나, 전장 바이러스 게놈의 부재 하에 야생형 개별 바이러스 RNA (즉, 역전사효소 (RT) 및 인테그라제 (IN))의 발현은 예를 들어 Rev와 같은 부속 단백질 없이는 어렵다. 또한, 야생형 HIV-1 RNA는 전사체 전체에 존재하는 짧은 5-뉴클레오티드 반복부인 내재적 불안정성 요소 (INS)의 존재로 인해 본질적으로 불안정적이다 (Wolff et al. Nucleic Acids Res. 31(11):2839-51 (2003)). HIV-1 감염 동안, Rev는 RNA 전사체에 결합하고 안정화할 수 있기 때문에 INS의 효과에 대응할 수 있다. Rev의 부재 하에 RNA 안정성을 증가시키기 위해, 기능적 유닛 mRNA 전체에 걸쳐 5개의 주요 INS 서열을 식별, 제거 및 대체하였다: TAGAT, ATAGA, AAAAG, ATAAA, TTATA 또는 다른 INS 요소 (예를 들어, 문헌 [Wolff et al. Nucleic Acids Res. 31(11):2839-51 (2003)]에 기재된 것들과 같음). INS 제거는 부분적이거나 완전할 수 있다. INS 서열은 대체 코돈으로 대체되어, RNA의 안정성을 증가시키면서 단백질 서열을 보존할 수 있다.
또한, 인간 코돈 최적화 (hCO)는 인간 세포에서 증가된 유전자 발현을 초래한다. 전장 gag-pol 유전자를 사용한 이전 연구는 인간 코돈 최적화 후 Rev-독립성을 입증하였다 (Kotsopoulou et al. J Virol. 74(10): 4839-52 (2000)). 표적 세포에서 증가된 번역 및 안정성을 위해 hCO 기능적 유닛 mRNA를 생성하였다. 또 다른 반복에서, 남아있는 INS 요소를 제거하고 hCO 서열로부터 대체하였다.
이들 개선은 RT, IN, 매트릭스 (MA), 캡시드 (CA), 뉴클레오캡시드 (NC) 및 Vpr RNA를 포함하는 모든 Pol 폴리단백질 성분 및 부속 단백질에 적용되었다.
기능적 유닛 단백질의 증가된 안정성
입력 mRNA로부터의 이들의 세포질 번역으로 인해, 이 시스템에서 기능적 유닛 (예를 들어, Pol 폴리단백질 성분 및 부속 단백질)은 들어오는 바이러스 입자에서 관찰되는 시공간적 조정이 부족할 수 있다. 활성 IN 및 RT가 바이러스 게놈에 매우 근접하게 패키징되는 들어오는 바이러스 입자와 달리, 이 RNA-기반 시스템은 먼저 들어오는 기능적 유닛 mRNA의 번역 및 트랜스진-코딩 RNA와 새롭게-번역된 기능적 유닛의 후속 상호작용을 필요로 한다. 그러므로, 기능적 유닛의 단백질 수명이 중요하다.
야생형 IN 단백질은 야생형 IN의 N-말단 잔기가 단백질분해적 분해에 대한 기질이기 때문에 세포에서 수명이 짧다 (Mulder et al. J Biol Chem. 275(38):29749-53 (2000)). 발현 플라스미드를 사용한 이전 연구는 이러한 분해가 N-말단 메티오닌-글리신 디펩티드의 첨가에 의해 중화됨을 입증하였다 (Cherepanov et al. FASEB J. 14(10):1389-99 (2000)). 여러 N-말단 Met-Gly IN 구축물을 생성하였다. 이들 mRNA는 WT HIV 유전자로부터 유래되고/거나, hCO이고/거나, INS 구축물의 제거 및 대체를 거쳤다.
표적 세포에서 pol-유래 기능적 유닛의 세포질 재지정
일부 실시양태에서, 단수 gag 또는 pol 유전자를 코딩하는 RNA가 생성되었으며, 이는 통합전 복제 단계 동안 핵 구멍 교차에 필요한 중요한 구조적 단백질, 또는 RT 및 IN을 각각 포함한다. 이 전략은 기능적 유닛 RNA 서열이 천연 Gag 또는 Pol 폴리단백질로서 번역되는 반면, gag pol 유전자의 분리는 세포내 활성을 선호하는 화학양론적 최적화를 가능하게 한다는 점에서 유리하다. 야생형 비율의 gag pol 유전자의 발현은 생산자 세포로부터 세포외 공간으로 새로운 바이러스의 어셈블리, 발아 및 방출을 초래한다 (Sundquist et al. Cold Spring Harb Perspect Med. 2(7):a006924 (2012)). 생산자 세포에서 기능적 RT 및 IN 활성에 대한 일부 증거가 있지만 (Al Mosabbir et al. Biotechnol. Lett. 38(10):1715-21 (2016)), 생산자 세포에서 새로운 바이러스 유전자 산물의 발현은 주로 새로운 비리온 형성을 선호하는 것으로 이해된다. gagpol을 코딩하는 발현 플라스미드의 여러 연구는 입자 형성으로부터 pol 산물의 세포내 활성을 향한 바이러스 유전자 발현의 재지정을 나타내었다 (Al Mosabbir et al. Biotechnol. Lett. 38(10):1715-21 (2016), Karacostas V et al. Virology 193(2):661-71 (1993)). 이를 위해, DNA 플라스미드 형질감염을 수반하는 여러 메카니즘이 확립되었다: (1) 바이러스 발아 동안 Gag 폴리단백질을 원형질막에 고정시키는 매트릭스 단백질을 코딩하는 gag 서열의 결실 (Al Mosabbir et al. Biotechnol. Lett. 38(10):1715-21 (2016)), 및 (2) gag-pol 프레임시프트 메카니즘을 방해하는 단일-뉴클레오티드 삽입 (Karacostas V et al. Virology 193(2):661-71 (1993)). 이들 변형은 전장 바이러스 게놈의 맥락에서 설명되었지만, (1) 추가-게놈 단수 유전자 발현 및 (2) 합성 기능적 RNA에 대해서는 탐색되지 않았다. gag- 및 pol-유래 폴리단백질로서 발현되는 기능적 유닛의 세포내 활성을 촉진하기 위해, 여러 신규 전장 gagpol RNA가 조작되었다: (1) 입자 발아의 방지를 위한 매트릭스-결실 gag-pol RNA, (2) 매트릭스-결실 단수 gag RNA, (3) 입자 발아의 방지를 위한 hCO 매트릭스-결실 gag-pol RNA, (4) 단수 리딩 프레임에서 gag pol을 초래하는 돌연변이를 함유하는 RNA, (5) 세포내 pol 활성을 위한 hCO gag-pol 프레임시프트된 RNA, (6) 세포내 Pol 산물 축적을 초래하는 최적화된 비율로 단수 gag 또는 pol RNA의 형질감염.
역전사 반응의 촉진을 위한 프라이밍된 RNA 게놈
HIV-1 RT는 역전사 반응 전에 바이러스 게놈의 프라이밍을 위해 세포질 tRNA에 의존한다. 짧은 RNA 또는 DNA 올리고를 사용한 바이러스 게놈의 프라이밍을 통해 시험관내 역전사 반응의 증가된 효율이 관찰되었다 (Iwatani et al. J Biol Chem. 278(16):14185-95 (2003)). 본 발명자들의 통합-감응성 시스템에서 역전사 반응의 효율을 증가시키기 위한 전략으로서, 트랜스진-코딩 RNA는 기능적 유닛 mRNA(들)와 함께 표적 세포로 공동-전달되기 전에 짧은 RNA 또는 DNA 올리고로 프라이밍된다.
캡핑되지 않은 트랜스진-코딩 RNA
HIV-1 RNA 게놈은 생산자 세포에서 전사 후 캡핑된다. 바이러스 진입 후, 바이러스 게놈은 역전사 전에 세포 숙주 인자, 예컨대 RNA 탈분지 효소 1 (DBR1)에 의해 탈캡핑된다 (Galvis et al. J Virol. 2017 Nov 14;91(23): e01377-17 (2017)). 역전사 단계의 효율을 증가시키기 위해, 캡핑되지 않은 트랜스진-코딩 RNA를 생산하고 기능적 유닛 mRNA(들)와 공동-형질감염시켰다.
실시예 4: 재료 및 방법
실시예 5 및 6에 기재된 연구에서 사용된 재료 및 방법이 기재되어 있다.
IVT 주형 설계
UTR 및 5' T7 프로모터를 포함하는 기능적 유닛 RNA의 IVT에 대한 DNA 주형 서열을 pTWIST Amp 클로닝 벡터 (트위스트 바이오사이언스(Twist Bioscience))에 클로닝하였다. LTR 및 5' T7 프로모터를 포함하는 트랜스진-코딩 RNA에 대한 IVT 주형 서열을 진아트(GeneArt) (써모피셔(ThermoFisher))로부터의 pMK 백본에 클로닝하였다.
RNA 제조 및 정제
IVT 주형을 함유하는 플라스미드는 BsmBI 또는 Bsu36I 및 SfiI (뉴 잉글랜드 바이오랩스(New England Biolabs))로 소화에 의해 선형화되었다. 소화된 DNA는 이소프로판올 침전되었다. 소화된 DNA 주형 (30 ng/μL)을 NTP (트랜스진-코딩 RNA: 7.5 mM CTP, 1.5 mM GTP, 7.5 mM UTP; 기능적 유닛 RNA: 4 mM ATP, 4 mM CTP, 4 mM GTP, 4 mM UTP), 클린캡(CleanCap) (트랜스진-코딩 RNA: 클린캡 GG, 6 mM; 기능적 유닛 RNA: 클린캡 AG, 5 mM), 0.1M MgSO4, 0.1M 스페르미딘, T7 RNA 폴리머라제 (트랜스진-코딩 RNA: 0.2 mg/mL; 기능적 유닛 RNA: 0.1 mg/mL), 및 40 U/mL TIPP (뉴 잉글랜드 바이오랩스)의 존재 하에 37℃에서 4시간 동안 인큐베이션하였다. 반응물을 DNase (써모 피셔)로 처리하고, 37℃에서 15분 동안 인큐베이션하였다. RNA는 LiCl 침전되었고, THE RNA 저장 용액 (써모 피셔)에 재현탁되었다. 시험관내 전사된 RNA는 이. 콜라이(E. coli) 폴리(A) 폴리머라제 (뉴 잉글랜드 바이오랩스)를 사용하여 효소적으로 폴리아데닐화되었다. RNA (0.25 μg/μL)를 이. 콜라이 폴리(A) 폴리머라제 (0.1 U/μL), 1X 폴리A 폴리머라제 반응 완충액 및 10 mM ATP의 존재 하에 37℃에서 20분 동안 인큐베이션하였다. RNA는 LiCl 침전되었고, THE RNA 저장 용액 (기능적 유닛 RNA)에 재현탁되거나 HPLC (트랜스진-코딩 RNA)에 의해 정제되었다. 폴리아데닐화는 바이오애널라이저(BioAnalyzer) (애질런트 테크놀로지스(Agilent Technologies))를 사용하여 확인되었다.
RNA 형질감염
293FT 세포 (써모 피셔)를 리포펙타민 2000 (써모 피셔)을 사용하여 RNA로 형질감염시켰다. 트랜스진 발현 실험을 위해, 48-웰 플레이트에 시딩된 세포를 표시된 비율로 500 ng의 총 RNA로 형질감염시키고, 웰당 0.5 μL의 리포펙타민 2000과 복합체화시켰다. 웨스턴 블롯팅을 위해, 12-웰 플레이트에 시딩된 293FT 세포를 웰당 1 μg의 인테그라제 RNA 및 2 μL 리포펙타민 2000으로 형질감염시켰다. 공초점 현미경법을 위해, 293FT 세포를 24-웰 플레이트의 폴리-D-리신-코팅된 #1 커버슬립 (일렉트론 마이크로스코피 사이언시스) 상에 시딩하였다. 세포를 24-웰 플레이트의 웰당 1 μg의 인테그라제 RNA로 형질감염시켰다.
웨스턴 블롯팅
형질감염 후 48시간에, 형질감염된 세포를 Halt 프로테아제 억제제 (피어스(Pierce), 써모 피셔)를 함유하는 RIPA 완충액 (피어스, 써모 피셔)에 재현탁시켰다. -80℃에서 2회의 동결-해동 사이클 후, 세포 현탁액을 4℃에서 벤조아제 뉴클레아제의 존재 하에 용해시켰다 (시그마 알드리치). 용해물을 37℃에서 5분 동안 인큐베이션하고, EDTA로 처리하고, 20분 동안 4℃에서 21,000 x g에서 원심분리를 통해 정화하였다. 용해물을 NuPage 4-12% Bis-Tris 겔 (써모 피셔) 상에 전기영동하고, 0.2 μg PVDF 멤브레인 (Trans-Blot Turbo Mini, 바이오-래드(Bio-Rad))으로 옮겼다. 멤브레인을 인테그라제 (앱캠(Abcam), [In-2], ab66645) 및 β-액틴 (앱캠, ab8227)에 대한 1차 항체로 프로빙하였다. 인테그라제 및 β-액틴을 각각 형광 2차 염소 항-마우스 및 염소 항-토끼 항체 (앱캠)로 검출하였다. 블롯을 Li-Cor 이미저 상에 이미지화하였다.
면역세포화학 및 공초점 현미경법
형질감염 후 24시간에, 형질감염된 293FT 세포를 PBS로 세척하고, 4% 파라포름알데히드에서 7분 동안 실온에서 고정시켰다 (일렉트론 마이크로스코피 사이언시스). 고정 후, 세포를 PBS로 세척하였다. 고정된 세포를 300nM DAPI (비오티움(Biotium)), ViaFluor-647 (비오티움), 및 실온에서 밤새 차단 완충액 (PBS 중 5% FBS, 1% BSA 및 1X TBS Tween (써모 피셔))에서 CF-568 염료 (Mix-and-Stain, 비오티움)와 접합된 1:100 항-인테그라제 항체 (앱캠, [In-2], ab66645)로 밤새 염색하였다. 염색된 커버슬립을 PBS로 세척하고, 프로롱 글라스(ProLong Glass) (써모피셔)를 사용하여 슈퍼프로스트 플러스(Superfrost Plus) 현미경 슬라이드 (피셔(Fisher)) 상에 탑재하였다. 니콘/요꼬가와(Nikon/Yokogawa) CSU-W1 스피닝 디스크 공초점 현미경을 사용하여 샘플을 시각화하였다.
나노루시페라제 검정
세포를 푸리마진 없이 Nano-Glo 완충액 (프로메가(Promega))에서 37℃에서 10분 동안 용해시켰다. 웰당 20 μL의 세포 용해물에 1:50 푸리마진 (프로메가)을 포함하는 25 μL의 Nano-Glo 완충액을 첨가함으로써 96-웰 불투명 플레이트 (코스타(Costar))에서 나노루시페라제 검정을 수행하였다. 푸리마진 첨가 직후 BioTek HTX 플레이트 판독기에서 발광을 판독하였다.
실시예 5: RNA-유래 기능적 유닛은 트랜스진-코딩 RNA로부터 리포터 유전자 발현을 구동한다
293 FT 세포를 Gag 폴리단백질을 코딩하는 RNA, Pol 폴리단백질을 코딩하는 RNA, 및 나노루시페라제 (Nluc)를 코딩하는 트랜스진-코딩 RNA, 또는 트랜스진-코딩 RNA 단독으로 형질감염시켰다. RNA 구축물은 도 7a에 나타낸다. 형질감염 후 3일에 Nluc 검정을 위해 세포를 수확하였다. 루미노미터를 통해 Nluc 활성을 평가하였다. Nluc 활성은 배경 (RLU)에 상대적인 광 유닛으로서 표시된다 (도 7b). 48-웰 플레이트의 웰당 500 ng RNA 형질감염에서 RNA 종의 비율이 표시된다. 통계적 유의성을 스튜던트 t-테스트; n=3에 의해 결정 및 확인하였다. 이들 결과는 렌티바이러스 RNA-유래 기능적 유닛이 LTR에 의해 플랭킹된 트랜스진-코딩 RNA로부터 리포터 유전자 발현을 구동할 수 있음을 입증한다. 결과는 개별 mRNA 기능적 유닛 플러스 트랜스진-코딩 RNA 형질감염에 대한 화학양론을 추가로 안내한다.
실시예 6: 안정화된 기능적 유닛 발현
RNA 및/또는 단백질 안정성을 증가시키기 위해 실시예 3에 기재된 하나 이상의 변형을 갖는 최적화된 인테그라제 (IN)-코딩 기능적 유닛 mRNA는 야생형 인테그라제보다 더 안정적으로 발현되고 인간 세포의 핵에 국재화된다. 야생형 IN, 안정화된 Met-Gly, hCO IN, 및 안정화된 Met-Gly hCO ΔINS IN을 코딩하는 RNA의 RNA 구축물 설계 요소는 도 8a에 나타낸다. ΔINS IN에서, 불안정성 서열 (INS)을 식별하고 코돈-최적화하여 RNA 안정성을 증가시켰다.
293FT 세포를 각각의 표시된 RNA로 형질감염시키고, 형질감염 (p.t.) 후 48시간에 웨스턴 블롯 용해를 위해 수확하였다. 인테그라제는 야생형 IN을 코딩하는 구축물과 비교하여 최적화된 구축물로부터 더 높은 수준에서 발현되었다. 야생형 IN 단백질 밴드는 최적화된 구축물로부터의 것들과는 대조적으로 48시간 p.t.에서 검출불가능하였다 (도 8c). 293FT 세포로의 RNA 형질감염 후 최적화된 IN (Met-Gly hCO ΔINS IN)의 세포하 국재화를 또한 결정하였다 (도 8d). 세포를 최적화된 IN RNA로 형질감염시키고, 형질감염 후 24시간에 고정시키고, 면역형광을 위해 프로세싱하였다. 고정된 세포를 접합된 항-IN 항체, DAPI (핵) 및 팔로이딘-647 (액틴)으로 염색하였다. 인테그라제는 강하게 발현되었고 핵에 국재화되었다. 이들 결과는 최적화된 인테그라제-코딩 기능적 유닛 mRNA가 표적 소기관에 대한 향상된 발현 및 국재화를 나타내었음을 입증한다.
실시예에 기재된 예시적인 뉴클레오티드 서열의 요약이 하기 표 1에 제공된다.
표 1. 예시적인 뉴클레오티드 서열
Figure pct00001
실시양태
하기 실시양태는 본 개시내용의 범주 내에 있다. 또한, 본 개시내용은 하나 이상의 나열된 실시양태로부터의 하나 이상의 제한, 요소, 절 및 설명 용어가 이 섹션의 또 다른 나열된 실시양태에 도입되는 이들 실시양태의 모든 변경, 조합 및 순열을 포함한다. 예를 들어, 또 다른 실시양태에 의존적인 임의의 나열된 실시양태는 동일한 염기 실시양태에 의존적인 이 섹션의 임의의 다른 나열된 실시양태에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 목록으로서 제시되는 경우 (예를 들어 마쿠시 그룹 형식으로), 요소의 각 서브그룹이 또한 개시되어 있으며, 임의의 요소(들)가 그룹으로부터 제거될 수 있다. 일반적으로, 본 개시내용 또는 본 개시내용의 측면이 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 본 발명의 특정 실시양태 또는 본 발명의 측면는 이러한 요소 및/또는 특징으로 이루어지거나 본질적으로 이루어진다는 것이 이해되어야 한다. 또한, 용어 "포함하는" 및 "함유하는"은 개방형인 것으로 의도되며 추가 요소 또는 단계의 포함을 허용한다는 점에 유의한다. 범위가 주어지는 경우, 종점이 포함된다. 또한, 달리 표시되지 않거나 관련 기술분야의 통상의 기술자의 문맥 및 이해로부터 달리 명백하지 않는 한, 범위로서 표현되는 값은 문맥에서 명백히 달리 지시하지 않는 한, 범위의 하한 단위의 10분의 1까지 본 발명의 상이한 실시양태에서 언급된 범위 내의 임의의 특정 값 또는 하위 범위를 가정할 수 있다.
1. 하기를 포함하는 조성물로서:
(i) 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자; 및
(ii) 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자,
여기서 조성물은 레트로바이러스 rev env 유전자에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는 것인
조성물.
2. 실시양태 1에 있어서, Pol 폴리단백질 성분의 발현이 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하지 않는 것인 조성물.
3. 실시양태 1-2에 있어서, (i)의 하나 이상의 핵산 분자가 Gag 폴리단백질을 코딩하지 않는 것인 조성물.
4. 실시양태 1-3에 있어서, (i)의 하나 이상의 핵산 분자가 5' UTR, Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자인 조성물.
5. 실시양태 1-3에 있어서, (i)의 하나 이상의 핵산 분자가 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소 및 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자인 조성물.
6. 실시양태 5에 있어서, Pol 폴리단백질 성분 역전사효소 및 인테그라제가 바이시스트론성 구축물 상에서 발현되는 것인 조성물.
7. 실시양태 5-6에 있어서, Pol 폴리단백질 성분 역전사효소 및 인테그라제가 개재 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드-코딩 서열과 함께 발현되는 것인 조성물.
8. 실시양태 1-3에 있어서, (i)의 하나 이상의 핵산 분자가 2개의 핵산 분자이며, 여기서 2개의 핵산 분자 중 하나가 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소를 코딩하는 핵산 서열, 및 3' UTR을 포함하고, 여기서 2개의 핵산 분자 중 다른 하나가 5' UTR, 적어도 Pol 폴리단백질 성분 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 것인 조성물.
9. 실시양태 1-8에 있어서, (i)의 하나 이상의 핵산 분자가 또한 하나 이상의 Gag 폴리단백질 부속 단백질을 코딩하는 핵산을 포함하는 것인 조성물.
10. 실시양태 9에 있어서, 하나 이상의 Gag 폴리단백질 부속 단백질이 Pol 폴리단백질 성분과 동일한 핵산 분자 상에 코딩되는 것인 조성물.
11. 실시양태 10에 있어서, 하나 이상의 Gag 폴리단백질 부속 단백질이 개재 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드-코딩 서열과 함께 발현되는 것인 조성물.
12. 실시양태 9에 있어서, 하나 이상의 Gag 폴리단백질 부속 단백질이 Pol 폴리단백질 성분으로서 하나 이상의 상이한 핵산 분자에 의해 코딩되며, 여기서 각 핵산 분자가 5' UTR 및 3' UTR을 포함하는 것인 조성물.
13. 실시양태 9-12 중 어느 하나에 있어서, Gag 폴리단백질 부속 단백질이 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 매트릭스 단백질 (MA), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택되는 것인 조성물.
14. 실시양태 13에 있어서, Gag 폴리단백질 부속 단백질이 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 매트릭스 단백질 (MA), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)를 포함하는 것인 조성물.
15. 실시양태 14에 있어서, Gag 폴리단백질 부속 단백질이 Gag 폴리단백질에 의해 코딩되는 것인 조성물.
16. 실시양태 1-15 중 어느 하나에 있어서, (i) 및 (ii)의 핵산 분자가 RNA 분자 또는 DNA 분자인 조성물.
17. 실시양태 16에 있어서, (i) 및 (ii)의 핵산 분자가 ssDNA 분자 또는 dsDNA 분자인 조성물.
18. 실시양태 16에 있어서, (i) 및 (ii)의 핵산 분자가 ssRNA 분자인 조성물.
19. 실시양태 1-18 중 어느 하나에 있어서, (ii)의 핵산 분자가 2개 이상의 트랜스진을 포함하고, 트랜스진이 하나 이상의 내부 리보솜 진입 부위 (IRES) 및/또는 하나 이상의 2A 펩티드-코딩 서열에 의해 분리된 것인 조성물.
20. 실시양태 1-19 중 어느 하나에 있어서, (ii)의 핵산 분자가 하나 이상의 인핸서를 추가로 포함하는 것인 조성물.
21. 실시양태 20에 있어서, 하나 이상의 인핸서가 우드척 간염 바이러스 전사후 조절 요소를 포함하는 것인 조성물.
22. 실시양태 1-21 중 어느 하나에 있어서, (i) 및/또는 (ii)의 하나 이상의 핵산 분자가 RNA 분자이고, 변형된 리보뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
23. 실시양태 22에 있어서, 변형된 리보뉴클레오시드가 슈도우리딘 또는 슈도우리딘의 유도체인 조성물.
24. 실시양태 1-23 중 어느 하나에 있어서, (ii)의 핵산 분자가 RNA 분자이고, 5'- 7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 추가로 포함하는 것인 조성물.
25. 실시양태 1-24 중 어느 하나에 있어서, Pol 단백질 및/또는 LTR이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV)로부터의 Pol 단백질 및/또는 LTR에 기초한 것인 조성물.
26. 실시양태 1-25 중 어느 하나에 있어서, 조성물이 비-바이러스 전달 시스템에 패키징된 것인 조성물.
27. 실시양태 26에 있어서, 조성물이 지질 나노입자에 패키징된 것인 조성물.
28. 하기를 포함하는 조성물로서:
(i) 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자; 및
(ii) 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자;
여기서 조성물은 레트로바이러스 rev env 유전자에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않고, 여기서 조성물은 비-바이러스 전달 시스템에 패키징된 것인
조성물.
29. 실시양태 28에 있어서, (i) 및 (ii)의 RNA 분자가 ssRNA 분자인 조성물.
30. 실시양태 28-29 중 어느 하나에 있어서, 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택된 하나 이상의 부속 단백질을 코딩하는 제3 RNA 분자를 추가로 포함하는 조성물.
31. 실시양태 28에 있어서, 제1 RNA 분자가 NC, CA, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 추가로 포함하는 것인 조성물.
32. 실시양태 28-31 중 어느 하나에 있어서, 제2 RNA 분자가 2개 이상의 트랜스진을 포함하고, 트랜스진이 하나 이상의 내부 리보솜 진입 부위 (IRES) 및/또는 2A 펩티드-코딩 서열을 코딩하는 하나 이상의 서열에 의해 분리된 것인 조성물.
33. 실시양태 28-32 중 어느 하나에 있어서, 제2 RNA 분자가 하나 이상의 인핸서를 추가로 포함하는 것인 조성물.
34. 실시양태 33에 있어서, 하나 이상의 인핸서가 우드척 간염 바이러스 전사후 조절 요소를 포함하는 것인 조성물.
35. 실시양태 28-34 중 어느 하나에 있어서, 제1 RNA 분자가 변형된 뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
36. 실시양태 28-35 중 어느 하나에 있어서, 제2 RNA 분자가 5'- 7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
37. 실시양태 1-36 중 어느 하나에 있어서, 하나 이상의 프로모터가 하나 이상의 조직-특이적 또는 세포-특이적 프로모터를 포함하는 것인 조성물.
38. 실시양태 37에 있어서, 하나 이상의 조직-특이적 또는 세포-특이적 프로모터가 골수, 조혈 줄기 세포 (HSC), 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포에 특이적인 것인 조성물.
39. 실시양태 1-36 중 어느 하나에 있어서, 하나 이상의 프로모터가 hCMV 프로모터를 포함하는 것인 조성물.
40. 실시양태 1-39 중 어느 하나에 있어서, 하나 이상의 트랜스진이 하나 이상의 치료적 분자, 진단적 분자 또는 리포터 분자, 또는 그의 단편을 코딩하는 것인 조성물.
41. 실시양태 40에 있어서, 하나 이상의 트랜스진이 하나 이상의 치료적 단백질, 진단적 단백질 또는 리포터 단백질, 또는 그의 단편을 코딩하는 것인 조성물.
42. 실시양태 41에 있어서, 치료적 단백질이 베타-글로빈, 낭성 섬유증 막횡단 전도도 조절인자 (CFTR), 인자 VIII, 디스트로핀, 또는 RP GTPase 조절인자 (RPGR)인 조성물.
43. 실시양태 41에 있어서, 리포터 단백질이 형광 단백질 또는 루시페라제인 조성물.
44. 실시양태 38-43 중 어느 하나에 있어서, Pol 단백질, 부속 단백질 및/또는 LTR이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV)로부터의 Pol 단백질, 부속 단백질 및/또는 LTR에 기초한 것인 조성물.
45. 실시양태 26 또는 28-44 중 어느 하나에 있어서, 비-바이러스 전달 시스템이 특이적 조직 또는 세포 유형으로 표적화된 것인 조성물.
46. 실시양태 45에 있어서, 특이적 조직 또는 세포 유형이 골수, HSC, 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포인 조성물.
47. 실시양태 28-46 중 어느 하나에 있어서, 비-바이러스 전달 시스템이 지질 나노입자, 리포솜, 폴리펩티드 나노입자, 실리카 나노입자, 금 나노입자, 중합체성 나노입자, 덴드리머, 또는 양이온성 나노에멀젼인 조성물.
48. 실시양태 1-47 중 어느 하나의 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 유전자 발현을 필요로 하는 대상체에서 유전자를 발현하는 방법.
49. 실시양태 1-47 중 어느 하나의 조성물을 세포에 전달하여, 그에 의해 세포에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 세포에서 유전자를 발현하는 방법.
50. 실시양태 1-47 중 어느 하나의 조성물을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 실시양태 1-47 중 어느 하나의 조성물을 사용하는 방법.
51. 실시양태 1-47 중 어느 하나의 조성물을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법.
52. 실시양태 51에 있어서, 질환 또는 병태가 유전 질환 또는 병태인 방법.
53. 실시양태 51에 있어서, 질환 또는 병태가 유전적 유전 질환 또는 병태인 방법.
54. 실시양태 51에 있어서, 질환 또는 병태가 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 B, 색소성 망막염, 뒤시엔느 근이영양증, 낭성 섬유증, 또는 암인 방법.
55. 실시양태 48-54 중 어느 하나에 있어서, 하나 이상의 트랜스진이 표적 세포의 게놈에 통합되는 것인 방법.
56. 실시양태 55에 있어서, 하나 이상의 트랜스진이 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 6개월, 적어도 1년 동안, 또는 대상체의 평생 동안 안정적으로 발현되는 것인 방법.
57. 실시양태 1-47 중 어느 하나의 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 면역 반응의 도출을 필요로 하는 대상체에서 면역 반응을 도출하는 방법.
58. 실시양태 57에 있어서, 대상체가 암을 갖고, 하나 이상의 트랜스진이 종양 항원을 코딩하는 것인 방법.
59. 실시양태 57에 있어서, 대상체가 감염성 질환을 갖거나 걸릴 위험이 있고, 하나 이상의 트랜스진이 감염성 질환과 연관된 항원을 코딩하는 것인 방법.
60. 실시양태 48-59 중 어느 하나에 있어서, 조성물이 국부적으로 또는 전신적으로 전달되는 것인 방법.
61. 실시양태 60에 있어서, 조성물이 주사에 의해, 흡입에 의해, 정맥내로, 복강내로, 피하로, 근육내로, 경구로, 비강내로, 폐 투여에 의해, 경피로, 경점막으로, 또는 종양내로 전달되는 것인 방법.
62. 실시양태 1-47 중 어느 하나의 조성물에서 사용하기 위한, 5' UTR, 하나 이상의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함하며, 여기서 Pol 폴리단백질 성분의 발현은 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하지 않는 것인 하나 이상의 핵산 발현 카세트.
63. 실시양태 62에 있어서, 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택된 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 추가로 포함하는 핵산 발현 카세트.
64. 실시양태 62 또는 63에 있어서, Pol 단백질 및/또는 부속 단백질이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV)로부터의 Pol 단백질 및 부속 단백질에 기초한 것인 핵산 발현 카세트.
65. 실시양태 62-64 중 어느 하나의 핵산 발현 카세트를 시험관내에서 전사하는 것을 포함하는, RNA 분자를 생산하는 방법.
66. 실시양태 1-47 중 어느 하나의 조성물 또는 실시양태 62-65 중 어느 하나의 핵산 발현 카세트를 포함하는 하나 이상의 컨테이너를 포함하는 키트.
등가물 및 범주
본 발명의 여러 실시양태가 본원에서 기술되고 예시되었지만, 관련 기술분야의 통상의 기술자는 기능을 수행하고/거나 본원에 기재된 결과 및/또는 하나 이상의 이점을 수득하기 위해 다양한 다른 수단 및/또는 구조를 용이하게 구상할 것이며, 각각의 이러한 변경 및/또는 변형은 본원에 기재된 본 발명의 실시양태의 범주 내에 있는 것으로 간주된다. 보다 일반적으로, 관련 기술분야의 통상의 기술자는 본원에 기재된 모든 파라미터, 치수, 재료 및 구성이 예시를 의미하며 실제 파라미터, 치수, 재료 및/또는 구성이 본 발명의 교시내용이 사용되는 특정 애플리케이션 또는 애플리케이션들에 의존할 것임을 용이하게 이해할 것이다. 관련 기술분야의 통상의 기술자는 단지 일상적인 실험을 사용하여 본원에 기재된 본 발명의 특정 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 따라서, 전술한 실시양태는 단지 예로서 제시된 것이며, 첨부된 청구범위 및 그에 대한 등가물의 범주 내에서, 본 발명의 실시양태는 구체적으로 기술되고 청구된 것과 달리 실시될 수 있음을 이해해야 한다. 본 개시내용의 발명의 실시양태는 본원에 기재된 각각의 개별 특징, 시스템, 물품, 재료, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 물품, 재료, 키트 및/또는 방법이 상호 불일치하지 않는 경우, 2개 이상의 이러한 특징, 시스템, 물품, 재료, 키트 및/또는 방법의 임의의 조합이 본 개시내용의 발명의 범주 내에 포함된다.
본원에서 정의되고 사용된 바와 같은 모든 정의는 사전 정의, 참조로 포함된 문서의 정의, 및/또는 정의된 용어의 일반적인 의미를 통제하는 것으로 이해되어야 한다.
본원에 개시된 모든 참고문헌, 특허 및 특허 출원은 각각 인용된 대상과 관련하여 참조로 포함되며, 이는 일부 경우에 문서 전체를 포함할 수 있다.
본 명세서 및 청구범위에서 본원에서 사용된 바와 같은 단수형은 명백히 반대되는 표시가 없는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본 명세서 및 청구범위에서 본원에서 사용된 바와 같은 어구 "및/또는"은 그렇게 결합된 요소, 즉 일부 경우에 결합적으로 존재하고 다른 경우에 이접적으로 존재하는 요소 중 "하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. "및/또는"으로 나열된 다중 요소는 동일한 방식으로, 즉 그렇게 결합된 요소 중 "하나 이상"으로 해석되어야 한다. "및/또는" 절에 의해 구체적으로 식별된 요소 이외의 다른 요소가, 구체적으로 식별된 요소와 관련이 있든 없든 상관 없이 임의로 존재할 수 있다. 그러므로, 비제한적인 예로서, 개방형 언어, 예컨대 "포함하는"과 함께 사용될 때 "A 및/또는 B"에 대한 언급은 한 실시양태에서 A만을 지칭할 수 있고 (임의로 B 이외의 요소를 포함함); 또 다른 실시양태에서 B만을 지칭할 수 있고 (임의로 A 이외의 요소를 포함함); 또 다른 실시양태에서 A 및 B 둘 다 (임의로 다른 요소를 포함함) 등을 지칭할 수 있다.
본 명세서 및 청구범위에서 본원에서 사용된 바와 같은 "또는"은 상기 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로 해석되어야 하며, 즉 요소의 수 또는 목록, 및 임의로 추가의 나열되지 않은 항목 중 적어도 하나 (그러나 또한 하나 초과를 포함함)를 포함하는 것으로 해석되어야 한다. 명백히 반대로 표시된 용어, 예컨대 "중 오직 하나" 또는 "중 정확히 하나" 또는 청구범위에서 사용될 때 "로 이루어진"만이 요소의 수 또는 목록의 정확히 하나의 요소의 포함을 지칭할 것이다. 일반적으로, 본원에서 사용된 바와 같은 용어 "또는"은 배타적 용어, 예컨대 "어느 하나", "중 하나", "중 오직 하나", 또는 "중 정확히 하나"가 앞에 있는 경우에 배타적인 대안 (즉, "하나 또는 다른 하나, 그러나 둘 다는 아님")을 나타내는 것으로만 해석되어야 한다. 청구범위에서 사용되는 경우 "로 본질적으로 이루어진"은 특허법 분야에서 사용된 바와 같은 일반적인 의미를 가져야 한다.
본 명세서 및 청구범위에서 본원에서 사용된 바와 같이, 하나 이상의 요소 목록과 관련하여 어구 "적어도 하나"는 요소 목록 내에 구체적으로 나열된 각각 및 모든 요소 중 적어도 하나를 반드시 포함할 필요는 없지만 요소 목록의 요소의 임의의 조합을 배제하지 않는, 요소 목록의 요소 중 임의의 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하는 것으로 이해되어야 한다. 이 정의는 또한 구체적으로 식별된 요소와 관련이 있든 없든 상관 없이 어구 "적어도 하나"가 지칭하는 요소 목록 내에서 구체적으로 식별된 요소 이외의 요소가 임의로 존재할 수 있음을 허용한다. 그러므로, 비제한적인 예로서, "A 및 B 중 적어도 하나" (또는 동등하게 "A 또는 B 중 적어도 하나" 또는 동등하게 "A 및/또는 B 중 적어도 하나")는 한 실시양태에서 B가 존재하지 않는 적어도 하나 (임의로 하나 초과 포함)의 A (및 임의로 B 이외의 요소를 포함함); 또 다른 실시양태에서 A가 존재하지 않는 적어도 하나 (임의로 하나 초과 포함)의 B (및 임의로 A 이외의 요소를 포함함); 또 다른 실시양태에서 적어도 하나 (임의로 하나 초과 포함)의 A 및 적어도 하나 (임의로 하나 초과 포함)의 B (및 임의로 다른 요소 포함) 등을 지칭할 수 있다.
또한, 명백히 반대되는 표시가 없는 한, 하나 초과의 단계 또는 행위를 포함하는 본원에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서는 반드시 방법의 단계 또는 행위가 인용되는 순서로 제한되지 않는다는 것을 이해해야 한다.
청구범위 및 상기 명세서에서, 모든 전환 어구, 예컨대 "포함하는", "포괄하는", "보유하는", "갖는", "함유하는", "수반하는", "수용하는", "로 구성된" 등은 개방형으로 이해되어야 하며, 즉 포함하되 이에 제한되지 않는 것을 의미하는 것으로 이해되어야 한다. 전환 어구 "로 이루어진" 및 "로 본질적으로 이루어진"만이, 미국 특허청 특허 심사 절차 매뉴얼 섹션 2111.03에 제시된 바와 같이 각각 폐쇄형 또는 반폐쇄형 전환 어구일 수 있다. 개방형 전환 어구 (예를 들어, "포함하는")를 사용하여 이 문서에 기재된 실시양태는 또한 대안적인 실시양태에서 개방형 전환 어구에 의해 기재된 특징으로 "이루어진" 및 "본질적으로 이루어진" 것으로 고려된다는 것을 이해해야 한다. 예를 들어, 본 개시내용이 "A 및 B를 포함하는 조성물"을 기술하는 경우, 본 개시내용은 또한 "A 및 B로 이루어진 조성물" 및 "A 및 B로 본질적으로 이루어진 조성물"의 대안적인 실시양태를 고려한다.
SEQUENCE LISTING <110> GreenLight Biosciences, Inc. <120> NUCLEIC ACID THERAPEUTICS FOR GENETIC DISORDERS <130> G0830.70039WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/053,474 <151> 2020-07-17 <160> 19 <170> PatentIn version 3.5 <210> 1 <211> 4664 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60 ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180 agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240 gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300 agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360 agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420 catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540 gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600 gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660 accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900 ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140 tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440 gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500 agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560 ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620 agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680 cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800 gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980 gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040 tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100 ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160 caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220 cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280 tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340 aagcaggctc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2400 tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2460 gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 2520 tgccctggcc caccctcgtg accaccttca cctacggcgt gcagtgcttc gcccgctacc 2580 ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 2640 agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 2700 agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 2760 acatcctggg gcacaagctg gagtacaact acaacagcca caaggtctat atcaccgccg 2820 acaagcagaa gaacggcatc aaggtgaact tcaagacccg ccacaacatc gaggacggca 2880 gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 2940 tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 3000 gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3060 agctgtacaa gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg 3120 ccgctcgagt ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg 3180 tctcgattct acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt 3240 tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3300 gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3360 tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3420 gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3480 cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3540 gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3600 ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg 3660 cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 3720 ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 3780 atctcccttt gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct 3840 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3900 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3960 ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 4020 ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 4080 ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 4140 tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg 4200 tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 4260 aggggggact ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta 4320 ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 4380 cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt 4440 tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta 4500 gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat 4560 cagagagtga gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 4620 tcacaaattt cacaaataaa gcattttttt cactgcacct aagg 4664 <210> 2 <211> 4664 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60 ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180 agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240 gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300 agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360 agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420 catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540 gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600 gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660 accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900 ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140 tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440 gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500 agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560 ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620 agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680 cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800 gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980 gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040 tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100 ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160 caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220 cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280 tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340 aagcaggctc caccatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2400 tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2460 gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 2520 tgccctggcc caccctcgtg accaccttcg gctacggcct gatgtgcttc gcccgctacc 2580 ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 2640 agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 2700 agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 2760 acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 2820 acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 2880 gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 2940 tgcccgacaa ccactacctg agctaccagt ccaaactgag caaagacccc aacgagaagc 3000 gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3060 agctgtacaa gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg 3120 ccgctcgagt ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg 3180 tctcgattct acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt 3240 tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3300 gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3360 tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3420 gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3480 cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3540 gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3600 ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg 3660 cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 3720 ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 3780 atctcccttt gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct 3840 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3900 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3960 ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 4020 ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct 4080 ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 4140 tcccgggagc ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg 4200 tacctttaag accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa 4260 aggggggact ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta 4320 ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc 4380 cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt 4440 tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta 4500 gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat 4560 cagagagtga gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 4620 tcacaaattt cacaaataaa gcattttttt cactgcacct aagg 4664 <210> 3 <211> 4346 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 60 ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 120 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac 180 agggacttga aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct 240 gaagcgcgca cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact 300 agcggaggct agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt 360 agatcgcgat gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa 420 catatagtat gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa 480 acatcagaag gctgtagaca aatactggga cagctacaac catcccttca gacaggatca 540 gaagaactta gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata 600 gagataaaag acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag 660 accaccgcac agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa 720 ttggagaagt gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc 780 caccaaggca aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt 840 gttccttggg ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac 900 ggtacaggcc agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc 960 tattgaggcg caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc 1020 aagaatcctg gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg 1080 ctctggaaaa ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc 1140 tctggaacag atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta 1200 cacaagctta atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca 1260 agaattattg gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg 1320 gctgtggtat ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt 1380 ttttgctgta ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca 1440 gacccacctc ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg 1500 agagagagac agagacagat ccattcgatt agtgaacgga tctcgacggt atcggttaac 1560 ttttaaaaga aaagggggga ttggggggta cagtgcaggg gaaagaatag tagacataat 1620 agcaacagac atacaaacta aagaattaca aaaacaaatt acaaaaattc aaaattttat 1680 cgataagctt gggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 1740 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 1800 gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta 1860 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 1920 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 1980 gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga 2040 tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg 2100 ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg 2160 caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac 2220 cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgactc 2280 tagaggatcc actagtccag tgtggtggaa ttctgcagat atcaacaagt ttgtacaaaa 2340 aagcaggctc caccatggct aagacttccg aacagagggt gaacattgct acactgctga 2400 cagaaaataa gaagaaaatc gtggataagg cttcccagga tctgtggcgg agacacccag 2460 acctgatcgc accaggagga attgctttct ctcagaggga ccgcgctctg tgcctgcgag 2520 attacggctg gttcctgcat ctgatcacct tttgtctgct ggccggagat aagggcccca 2580 tcgagtctat tgggctgatc agtattcgag aaatgtataa ctcactggga gtgcccgtcc 2640 ctgcaatgat ggagagcatt agatgcctga aagaagccag cctgtccctg ctggacgaag 2700 aggacgccaa cgagaccgca ccctactttg attacattat taaggctatg agctaaaccc 2760 agctttcttg tacaaagtgg ttgatatcca gcacagtggc ggccgctcga gtctagaggg 2820 cccgcggttc gaaggtaagc ctatccctaa ccctctcctc ggtctcgatt ctacgcgtac 2880 cggttagtaa tgatcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 2940 attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 3000 catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 3060 tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 3120 gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 3180 ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 3240 tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 3300 tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 3360 tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 3420 cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 3480 tccccgcctg gcgatggtac cggtgtggaa agtccccagg ctccccagca ggcagaagta 3540 tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 3600 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa 3660 ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc catggctgac 3720 taattttttt tatttatgca gaggccgagg ccgcctctgc ctctgagcta ttccagaagt 3780 agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctcccggga gcttgtatat 3840 ccattttcgg atctgatcag cacgtgcaca attcgagctc ggtaccttta agaccaatga 3900 cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 3960 taattcactc ccaacgaaga caagatctgc tttttgcttg tactgggtct ctctggttag 4020 accagatctg agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat 4080 aaagcttgcc ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac tctggtaact 4140 agagatccct cagacccttt tagtcagtgt ggaaaatctc tagcagtagt agttcatgtc 4200 atcttattat tcagtattta taacttgcaa agaaatgaat atcagagagt gagaggaact 4260 tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 4320 aagcattttt ttcactgcac ctaagg 4346 <210> 4 <211> 4663 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660 aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720 gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780 ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840 ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900 tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960 aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020 aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560 cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620 atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680 attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740 cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800 tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860 cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920 acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980 ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040 tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100 tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160 ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220 ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280 gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340 aagtttgtac aaaaaagcag gctccaccat ggtgagcaag ggcgaggagc tgatcaagga 2400 gaacatgaga agcaagctgt acctggaagg cagcgtgaac ggccaccagt tcaagtgcac 2460 ccacgaaggg gagggcaagc cctacgaggg caagcagacc gcgaggatca aggtggtgga 2520 gggaggcccc ctgccgttcg cattcgacat cctggccacc atgtttatgt acgggagcaa 2580 ggtgttcatc aagtaccccg ccgacctccc cgattatttt aagcagtcct tccctgaggg 2640 cttcacatgg gagagagtca tggtgttcga agacgggggc gtgctgaccg ccacccagga 2700 caccagcctc caggacggcg agctcatcta caacgtcaag ctcagagggg tgaacttccc 2760 agccaacggc cccgtgatgc agaagaaaac actgggctgg gagcccagca ccgagaccat 2820 gtaccccgct gacggcggcc tggaaggcag atgcgacaag aagctgaagc tcgtgggcgg 2880 gggccacctg cacgtcaact tcaagaccac atacaagtcc aagaaacccg tgaagatgcc 2940 cggcgtccac tacgtggacc gcagactgga aagaatcaag gaggccgaca acgagaccta 3000 cgtcgagcag tacgagcacg ctgtggccag atactccaac ctgggcggag gcatggacga 3060 gctgtacaag taaacccagc tttcttgtac aaagtggttg atatccagca cagtggcggc 3120 cgctcgagtc tagagggccc gcggttcgaa ggtaagccta tccctaaccc tctcctcggt 3180 ctcgattcta cgcgtaccgg ttagtaatga tcgacaatca acctctggat tacaaaattt 3240 gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 3300 ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 3360 ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 3420 tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 3480 agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 3540 cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 3600 tgtcggggaa gctgacgtcc tttccatggc tgctcgcctg tgttgccacc tggattctgc 3660 gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 3720 gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 3780 tctccctttg ggccgcctcc ccgcctggcg atggtaccgg tgtggaaagt ccccaggctc 3840 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa 3900 gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 3960 catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc 4020 tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctctgcctc 4080 tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct 4140 cccgggagct tgtatatcca ttttcggatc tgatcagcac gtgcacaatt cgagctcggt 4200 acctttaaga ccaatgactt acaaggcagc tgtagatctt agccactttt taaaagaaaa 4260 ggggggactg gaagggctaa ttcactccca acgaagacaa gatctgcttt ttgcttgtac 4320 tgggtctctc tggttagacc agatctgagc ctgggagctc tctggctaac tagggaaccc 4380 actgcttaag cctcaataaa gcttgccttg agtgcttcaa gtagtgtgtg cccgtctgtt 4440 gtgtgactct ggtaactaga gatccctcag acccttttag tcagtgtgga aaatctctag 4500 cagtagtagt tcatgtcatc ttattattca gtatttataa cttgcaaaga aatgaatatc 4560 agagagtgag aggaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat 4620 cacaaatttc acaaataaag catttttttc actgcaccta agg 4663 <210> 5 <211> 5611 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660 aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720 gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780 ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840 ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900 tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960 aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020 aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560 cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620 atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680 attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740 cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800 tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860 cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920 acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980 ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040 tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100 tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160 ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220 ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280 gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340 aagtttgtac aaaaaagcag gctccaccat ggaagacgcc aaaaacataa agaaaggccc 2400 ggcgccattc tatcctctag aggatggaac cgctggagag caactgcata aggctatgaa 2460 gagatacgcc ctggttcctg gaacaattgc ttttacagat gcacatatcg aggtgaacat 2520 cacgtacgcg gaatacttcg aaatgtccgt tcggttggca gaagctatga aacgatatgg 2580 gctgaataca aatcacagaa tcgtcgtatg cagtgaaaac tctcttcaat tctttatgcc 2640 ggtgttgggc gcgttattta tcggagttgc agttgcgccc gcgaacgaca tttataatga 2700 acgtgaattg ctcaacagta tgaacatttc gcagcctacc gtagtgtttg tttccaaaaa 2760 ggggttgcaa aaaattttga acgtgcaaaa aaaattacca ataattcaga aaattattat 2820 catggattct aaaacggatt accagggatt tcagtcgatg tacacgttcg tcacatctca 2880 tctacctccc ggttttaatg agtacgattt tgtaccagag tcctttgatc gtgacaaaac 2940 aattgcactg ataatgaatt cctctggatc tactgggtta cctaagggtg tggcccttcc 3000 gcatagaact gcctgcgtca gattctcgca tgccagagat cctatttttg gcaatcaaat 3060 cattccggat actgcgattt taagtgttgt tccattccat cacggttttg gaatgtttac 3120 tacactcgga tatttgatat gtggatttcg agtcgtctta atgtatagat ttgaagaaga 3180 gctgttttta cgatcccttc aggattacaa aattcaaagt gcgttgctag taccaaccct 3240 attttcattc ttcgccaaaa gcactctgat tgacaaatac gatttatcta atttacacga 3300 aattgcttct gggggcgcac ctctttcgaa agaagtcggg gaagcggttg caaaacgctt 3360 ccatcttcca gggatacgac aaggatatgg gctcactgag actacatcag ctattctgat 3420 tacacccgag ggggatgata aaccgggcgc ggtcggtaaa gttgttccat tttttgaagc 3480 gaaggttgtg gatctggata ccgggaaaac gctgggcgtt aatcagagag gcgaattatg 3540 tgtcagagga cctatgatta tgtccggtta tgtaaacaat ccggaagcga ccaacgcctt 3600 gattgacaag gatggatggc tacattctgg agacatagct tactgggacg aagacgaaca 3660 cttcttcata gttgaccgct tgaagtcttt aattaaatac aaaggatatc aggtggcccc 3720 cgctgaattg gaatcgatat tgttacaaca ccccaacatc ttcgacgcgg gcgtggcagg 3780 tcttcccgac gatgacgccg gtgaacttcc cgccgccgtt gttgttttgg agcacggaaa 3840 gacgatgacg gaaaaagaga tcgtggatta cgtcgccagt caagtaacaa ccgcgaaaaa 3900 gttgcgcgga ggagttgtgt ttgtggacga agtaccgaaa ggtcttaccg gaaaactcga 3960 cgcaagaaaa atcagagaga tcctcataaa ggccaagaag ggcggaaagt ccaaattgta 4020 aacccagctt tcttgtacaa agtggttgat atccagcaca gtggcggccg ctcgagtcta 4080 gagggcccgc ggttcgaagg taagcctatc cctaaccctc tcctcggtct cgattctacg 4140 cgtaccggtt agtaatgatc gacaatcaac ctctggatta caaaatttgt gaaagattga 4200 ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 4260 tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 4320 tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 4380 tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 4440 ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 4500 gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaagc 4560 tgacgtcctt tccatggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 4620 tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 4680 ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 4740 ccgcctcccc gcctggcgat ggtaccggtg tggaaagtcc ccaggctccc cagcaggcag 4800 aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 4860 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 4920 cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 4980 ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg agctattcca 5040 gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc cgggagcttg 5100 tatatccatt ttcggatctg atcagcacgt gcacaattcg agctcggtac ctttaagacc 5160 aatgacttac aaggcagctg tagatcttag ccacttttta aaagaaaagg ggggactgga 5220 agggctaatt cactcccaac gaagacaaga tctgcttttt gcttgtactg ggtctctctg 5280 gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc 5340 tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg 5400 taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca gtagtagttc 5460 atgtcatctt attattcagt atttataact tgcaaagaaa tgaatatcag agagtgagag 5520 gaacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac 5580 aaataaagca tttttttcac tgcacctaag g 5611 <210> 6 <211> 6770 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgggt gcgagagcgt cagtattaag cgggggagaa ttagatcgat gggaaaaaat 120 tcggttaagg ccagggggaa agaaaaaata taaattaaaa catatagtat gggcaagcag 180 ggagctagaa cgattcgcag ttaatcctgg cctgttagaa acatcagaag gctgtagaca 240 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 300 taatacagta gcaaccctct attgtgtgca tcaaaggata gagataaaag acaccaagga 360 agctttagac aagatagagg aagagcaaaa caaaagtaag aaaaaagcac agcaagcagc 420 agctgacaca ggacacagca atcaggtcag ccaaaattac cctatagtgc agaacatcca 480 ggggcaaatg gtacatcagg ccatatcacc tagaacttta aatgcatggg taaaagtagt 540 agaagagaag gctttcagcc cagaagtgat acccatgttt tcagcattat cagaaggagc 600 caccccacaa gatttaaaca ccatgctaaa cacagtgggg ggacatcaag cagccatgca 660 aatgttaaaa gagaccatca atgaggaagc tgcagaatgg gatagagtgc atccagtgca 720 tgcagggcct attgcaccag gccagatgag agaaccaagg ggaagtgaca tagcaggaac 780 tactagtacc cttcaggaac aaataggatg gatgacacat aatccaccta tcccagtagg 840 agaaatctat aaaagatgga taatcctggg attaaataaa atagtaagaa tgtatagccc 900 taccagcatt ctggacataa gacaaggacc aaaggaaccc tttagagact atgtagaccg 960 attctataaa actctaagag ccgagcaagc ttcacaagag gtaaaaaatt ggatgacaga 1020 aaccttgttg gtccaaaatg cgaacccaga ttgtaagact attttaaaag cattgggacc 1080 aggagcgaca ctagaagaaa tgatgacagc atgtcaggga gtggggggac ccggccataa 1140 agcaagagtt ttggctgaag caatgagcca agtaacaaat ccagctacca taatgataca 1200 gaaaggcaat tttaggaacc aaagaaagac tgttaagtgt ttcaattgtg gcaaagaagg 1260 gcacatagcc aaaaattgca gggcccctag gaaaaagggc tgttggaaat gtggaaagga 1320 aggacaccaa atgaaagatt gtactgagag acaggctaat tttttaggga agatctggcc 1380 ttcccacaag ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc 1440 agaagagagc ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat 1500 agacaaggaa ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc 1560 acaataaaga taggggggca attaaaggaa gctctattag atacaggagc agatgataca 1620 gtattagaag aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga 1680 ggttttatca aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct 1740 ataggtacag tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact 1800 cagattggct gcactttaaa ttttcccatt agtcctattg agactgtacc agtaaaatta 1860 aagccaggaa tggatggccc aaaagttaaa caatggccat tgacagaaga aaaaataaaa 1920 gcattagtag aaatttgtac agaaatggaa aaggaaggaa aaatttcaaa aattgggcct 1980 gaaaatccat acaatactcc agtatttgcc ataaagaaaa aagacagtac taaatggaga 2040 aaattagtag atttcagaga acttaataag agaactcaag atttctggga agttcaatta 2100 ggaataccac atcctgcagg gttaaaacag aaaaaatcag taacagtact ggatgtgggc 2160 gatgcatatt tttcagttcc cttagataaa gacttcagga agtatactgc atttaccata 2220 cctagtataa acaatgagac accagggatt agatatcagt acaatgtgct tccacaggga 2280 tggaaaggat caccagcaat attccagtgt agcatgacaa aaatcttaga gccttttaga 2340 aaacaaaatc cagacatagt catctatcaa tacatggatg atttgtatgt aggatctgac 2400 ttagaaatag ggcagcatag aacaaaaata gaggaactga gacaacatct gttgaggtgg 2460 ggatttacca caccagacaa aaaacatcag aaagaacctc cattcctttg gatgggttat 2520 gaactccatc ctgataaatg gacagtacag cctatagtgc tgccagaaaa ggacagctgg 2580 actgtcaatg acatacagaa attagtggga aaattgaatt gggcaagtca gatttatgca 2640 gggattaaag taaggcaatt atgtaaactt cttaggggaa ccaaagcact aacagaagta 2700 gtaccactaa cagaagaagc agagctagaa ctggcagaaa acagggagat tctaaaagaa 2760 ccggtacatg gagtgtatta tgacccatca aaagacttaa tagcagaaat acagaagcag 2820 gggcaaggcc aatggacata tcaaatttat caagagccat ttaaaaatct gaaaacagga 2880 aagtatgcaa gaatgaaggg tgcccacact aatgatgtga aacaattaac agaggcagta 2940 caaaaaatag ccacagaaag catagtaata tggggaaaga ctcctaaatt taaattaccc 3000 atacaaaagg aaacatggga agcatggtgg acagagtatt ggcaagccac ctggattcct 3060 gagtgggagt ttgtcaatac ccctccctta gtgaagttat ggtaccagtt agagaaagaa 3120 cccataatag gagcagaaac tttctatgta gatggggcag ccaataggga aactaaatta 3180 ggaaaagcag gatatgtaac tgacagagga agacaaaaag ttgtccccct aacggacaca 3240 acaaatcaga agactgagtt acaagcaatt catctagctt tgcaggattc gggattagaa 3300 gtaaacatag tgacagactc acaatatgca ttgggaatca ttcaagcaca accagataag 3360 agtgaatcag agttagtcag tcaaataata gagcagttaa taaaaaagga aaaagtctac 3420 ctggcatggg taccagcaca caaaggaatt ggaggaaatg aacaagtaga taaattggtc 3480 agtgctggaa tcaggaaagt actattttta gatggaatag ataaggccca agaagaacat 3540 gagaaatatc acagtaattg gagagcaatg gctagtgatt ttaacctacc acctgtagta 3600 gcaaaagaaa tagtagccag ctgtgataaa tgtcagctaa aaggggaagc catgcatgga 3660 caagtagact gtagcccagg aatatggcag ctagattgta cacatttaga aggaaaagtt 3720 atcttggtag cagttcatgt agccagtgga tatatagaag cagaagtaat tccagcagag 3780 acagggcaag aaacagcata cttcctctta aaattagcag gaagatggcc agtaaaaaca 3840 gtacatacag acaatggcag caatttcacc agtactacag ttaaggccgc ctgttggtgg 3900 gcggggatca agcaggaatt tggcattccc tacaatcccc aaagtcaagg agtaatagaa 3960 tctatgaata aagaattaaa gaaaattata ggacaggtaa gagatcaggc tgaacatctt 4020 aagacagcag tacaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 4080 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 4140 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 4200 ccagtttgga aaggaccagc aaagctcctc tggaaaggtg aaggggcagt agtaatacaa 4260 gataatagtg acataaaagt agtgccaaga agaaaagcaa agatcatcag ggattatgga 4320 aaacagatgg caggtgatga ttgtgtggca agtagacagg atgaggatta aagctcgctt 4380 tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg 4440 gggatattat gaagggcctt gagcatctgg attctgccta ataagaaaca tttattgtca 4500 ttgcagagac gcggccgcgc gtctcaatga agagcgtcga cgcatgcgga ggctaggtgg 4560 aggctcagtg atgataagtc tgcgatggtg gatgcatgtg tcatggtcat agctgtttcc 4620 tgtgtgaaat tgttatccgc tcagagggca caatcctatt ccgcgctatc cgacaatctc 4680 caagacatta ggtggagttc agttcggcgt atggcatatg tcgctggaaa gaacatgtga 4740 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 4800 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 4860 ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 4920 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 4980 ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 5040 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 5100 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 5160 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 5220 ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 5280 aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 5340 gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 5400 tctacggggt ctgacgctct attcaacaaa gccgccgtcc cgtcaagtca gcgtaaatgg 5460 gtagggggct tcaaatcgtc ctcgtgatac caattcggag cctgcttttt tgtacaaact 5520 tgttgataat ggcaattcaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 5580 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 5640 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 5700 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 5760 gcgagagcca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 5820 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 5880 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 5940 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 6000 atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 6060 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 6120 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 6180 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 6240 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 6300 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 6360 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 6420 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 6480 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 6540 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 6600 aaaagtgcca gatacctgaa acaaaaccca tcgtacggcc aaggaagtct ccaataactg 6660 tgatccacca caagcgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtca 6720 tgcataatcc gcacgcatct ggaataagga agtgccattc cgcctgacct 6770 <210> 7 <211> 1700 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgggt gcgagagcgt cagtattaag cgggggagaa ttagatcgat gggaaaaaat 120 tcggttaagg ccagggggaa agaaaaaata taaattaaaa catatagtat gggcaagcag 180 ggagctagaa cgattcgcag ttaatcctgg cctgttagaa acatcagaag gctgtagaca 240 aatactggga cagctacaac catcccttca gacaggatca gaagaactta gatcattata 300 taatacagta gcaaccctct attgtgtgca tcaaaggata gagataaaag acaccaagga 360 agctttagac aagatagagg aagagcaaaa caaaagtaag aaaaaagcac agcaagcagc 420 agctgacaca ggacacagca atcaggtcag ccaaaattac cctatagtgc agaacatcca 480 ggggcaaatg gtacatcagg ccatatcacc tagaacttta aatgcatggg taaaagtagt 540 agaagagaag gctttcagcc cagaagtgat acccatgttt tcagcattat cagaaggagc 600 caccccacaa gatttaaaca ccatgctaaa cacagtgggg ggacatcaag cagccatgca 660 aatgttaaaa gagaccatca atgaggaagc tgcagaatgg gatagagtgc atccagtgca 720 tgcagggcct attgcaccag gccagatgag agaaccaagg ggaagtgaca tagcaggaac 780 tactagtacc cttcaggaac aaataggatg gatgacacat aatccaccta tcccagtagg 840 agaaatctat aaaagatgga taatcctggg attaaataaa atagtaagaa tgtatagccc 900 taccagcatt ctggacataa gacaaggacc aaaggaaccc tttagagact atgtagaccg 960 attctataaa actctaagag ccgagcaagc ttcacaagag gtaaaaaatt ggatgacaga 1020 aaccttgttg gtccaaaatg cgaacccaga ttgtaagact attttaaaag cattgggacc 1080 aggagcgaca ctagaagaaa tgatgacagc atgtcaggga gtggggggac ccggccataa 1140 agcaagagtt ttggctgaag caatgagcca agtaacaaat ccagctacca taatgataca 1200 gaaaggcaat tttaggaacc aaagaaagac tgttaagtgt ttcaattgtg gcaaagaagg 1260 gcacatagcc aaaaattgca gggcccctag gaaaaagggc tgttggaaat gtggaaagga 1320 aggacaccaa atgaaagatt gtactgagag acaggctaat tttttaggga agatctggcc 1380 ttcccacaag ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc 1440 agaagagagc ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat 1500 agacaaggaa ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc 1560 acaataaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt 1620 ccaactacta aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa 1680 gaaacattta ttgtcattgc 1700 <210> 8 <211> 1619 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatggga ttccttgacg gcatcgacaa ggcgcaagag gagcacgaga aatatcatag 120 caactggagg gcgatggcat cagacttcaa cttgccgcca gtcgtggcta aagagatagt 180 agcaagctgc gataagtgtc aactgaaggg tgaagcgatg cacggtcaag tggactgttc 240 ccctggtata tggcaactgg actgtaccca tctcgaaggt aaagtcattt tggttgctgt 300 acatgttgcc tctgggtata tcgaggctga ggtgattcca gcagaaacgg gacaggaaac 360 agcttatttc ttgctcaagc ttgccgggag atggcctgtg aaaactgttc atacagataa 420 tggtagcaat tttactagta cgaccgtgaa agcagcttgt tggtgggcag ggattaagca 480 agaattcgga atcccgtata acccgcagag tcagggcgtt attgagagca tgaacaagga 540 actgaaaaaa ataattgggc aagtgagaga tcaggctgag catcttaaaa ctgctgtaca 600 aatggcggtg ttcatacata attttaagcg gaagggagga attggaggat actctgcggg 660 agagaggata gtggatataa tagcgaccga tattcagaca aaggagctgc aaaaacagat 720 aacgaaaata caaaattttc gagtttacta tcgggactcc cgcgatcccg tgtggaaagg 780 tccagcgaaa ttgctttgga agggcgaagg cgcggtagtg atccaggaca attctgatat 840 caaagtggtc ccaaggcgga aagcaaagat aatccgcgac tacggcaagc aaatggcagg 900 agatgattgc gtcgcatcac gacaggacga agatggcggc ggcggctcca tggccctgac 960 caacgcccag atcctggccg tgatcgacag ctgggaggaa accgtgggcc agttccccgt 1020 gatcacccac catgtgcctc tgggcggagg cctccaggga accctgcact gttacgagat 1080 ccccctggcc gctccttacg gcgtgggctt tgccaagaac ggccccacca gatggcagta 1140 caagcggacc atcaaccagg tggtgcacag atggggcagc cacaccgtgc cctttctgct 1200 ggaacccgac aacatcaacg gcaagacctg caccgccagc cacctgtgcc acaacaccag 1260 atgccacaac cccctgcacc tgtgctggga gagcctggac gacgccaagg gccggaattg 1320 gtgccctggc cctaatggcg gatgtgtgca tgccgtcgtg tgcctgagac agggacctct 1380 gtatggccct ggcgctacag tggctggccc tcagcagagg ggctcccact tcgtggtgta 1440 aagctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct aagtccaact 1500 actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta ataagaaaca 1560 tttattgtca ttgcagagac gcggccgcgc gtctcaatga agagcgtcga cgcatgcgg 1619 <210> 9 <211> 3764 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgggc ttttttaggg aagatctggc cttcccacaa gggaaggcca gggaattttc 120 ttcagagcag accagagcca acagccccac cagaagagag cttcaggttt ggggaagaga 180 caacaactcc ctctcagaag caggagccga tagacaagga actgtatcct ttagcttccc 240 tcagatcact ctttggcagc gacccctcgt cacaataaag ataggggggc agctcaagga 300 ggctctcctg gacaccggag cagacgacac cgtgctggag gagatgtcgt tgccaggccg 360 ctggaagccg aagatgatcg ggggaatcgg cggtttcatc aaggtgcgcc agtatgacca 420 gatcctcatc gaaatctgcg gccacaaggc tatcggtacc gtgctggtgg gccccacacc 480 cgtcaacatc atcggacgca acctgttgac gcagatcggt tgcacgctga acttccccat 540 tagccctatc gagacggtac cggtgaagct gaagcccggg atggacggcc cgaaggtcaa 600 gcaatggcca ttgacagagg agaagatcaa ggcactggtg gagatttgca cagagatgga 660 aaaggaaggg aaaatctcca agattgggcc tgagaacccg tacaacacgc cggtgttcgc 720 aatcaagaag aaggactcga cgaaatggcg caagctggtg gacttccgcg agctgaacaa 780 gcgcacgcaa gacttctggg aggttcagct gggcatcccg caccccgcag ggctgaagaa 840 gaagaaatcc gtgaccgtac tggatgtggg tgatgcctac ttctccgttc ccctggacga 900 agacttcagg aagtacactg ccttcacaat cccttcgatc aacaacgaga caccggggat 960 tcgatatcag tacaacgtgc tgccccaggg ctggaaaggc tctcccgcaa tcttccagag 1020 tagcatgacc aaaatcctgg agcctttccg caaacagaac cccgacatcg tcatctatca 1080 gtacatggat gacttgtacg tgggctctga tctagagata gggcagcacc gcaccaagat 1140 cgaggagctg cgccagcacc tgttgaggtg gggactgacc acacccgaca agaagcacca 1200 gaaggagcct cccttcctct ggatgggtta cgagctgcac cctgacaaat ggaccgtgca 1260 gcctatcgtg ctgccagaga aagacagctg gactgtcaac gacatacaga agctggtggg 1320 gaagttgaac tgggccagtc agatttaccc agggattaag gtgaggcagc tgtgcaaact 1380 cctccgcgga accaaggcac tcacagaggt gatcccccta accgaggagg ccgagctcga 1440 actggcagaa aaccgagaga tcctaaagga gcccgtgcac ggcgtgtact atgacccctc 1500 caaggacctg atcgccgaga tccagaagca ggggcaaggc cagtggacct atcagattta 1560 ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc cggatgaggg gtgcccacac 1620 taacgacgtc aagcagctga ccgaggccgt gcagaagatc accaccgaaa gcatcgtgat 1680 ctggggaaag actcctaagt tcaagctgcc catccagaag gaaacctggg aaacctggtg 1740 gacagagtat tggcaggcca cctggattcc tgagtgggag ttcgtcaaca cccctcccct 1800 ggtgaagctg tggtaccagc tggagaagga gcccatagtg ggcgccgaaa ccttctacgt 1860 ggatggggcc gctaacaggg agactaagct gggcaaagcc ggatacgtca ctaaccgggg 1920 cagacagaag gttgtcaccc tcactgacac caccaaccag aagactgagc tgcaggccat 1980 ttacctcgct ttgcaggact cgggcctgga ggtgaacatc gtgacagact ctcagtatgc 2040 cctgggcatc attcaagccc agccagacca gagtgagtcc gagctggtca atcagatcat 2100 cgagcagctg atcaagaagg aaaaggtcta tctggcctgg gtacccgccc acaaaggcat 2160 tggcggcaat gagcaggtcg acaagctggt ctcggctggc atcaggaagg tgctattcct 2220 ggatggcatc gacaaggccc aggacgagca cgagaaatac cacagcaact ggcgggccat 2280 ggctagcgac ttcaacctgc cccctgtggt ggccaaagag atcgtggcca gctgtgacaa 2340 gtgtcagctc aagggcgaag ccatgcatgg ccaggtggac tgtagccccg gcatctggca 2400 actcgattgc acccatctgg agggcaaggt tatcctggta gccgtccatg tggccagtgg 2460 ctacatcgag gccgaggtca ttcccgccga aacagggcag gagacagcct acttcctcct 2520 gaagctggca ggccggtggc cagtgaagac catccatact gacaatggca gcaatttcac 2580 cagtgctacg gttaaggccg cctgctggtg ggcgggaatc aagcaggagt tcgggatccc 2640 ctacaatccc cagagtcagg gcgtcgtcga gtctatgaat aaggagttaa agaagattat 2700 cggccaggtc agagatcagg ctgagcatct caagaccgcg gtccaaatgg cggtattcat 2760 ccacaatttc aagcggaagg gggggattgg ggggtacagt gcgggggagc ggatcgtgga 2820 catcatcgcg accgacatcc agactaagga gctgcaaaag cagattacca agattcagaa 2880 tttccgggtc tactacaggg acagcagaaa tcccctctgg aaaggcccag cgaagctcct 2940 ctggaagggt gagggggcag tagtgatcca ggataatagc gacatcaagg tggtgcccag 3000 aagaaaggcg aagatcatta gggattatgg caaacagatg gcgggtgatg attgcgtggc 3060 gagcagacag gatgaggatg gcggcggcgg ctccatggcc ctgaccaacg cccagatcct 3120 ggccgtgatc gacagctggg aggaaaccgt gggccagttc cccgtgatca cccaccatgt 3180 gcctctgggc ggaggcctcc agggaaccct gcactgttac gagatccccc tggccgctcc 3240 ttacggcgtg ggctttgcca agaacggccc caccagatgg cagtacaagc ggaccatcaa 3300 ccaggtggtg cacagatggg gcagccacac cgtgcccttt ctgctggaac ccgacaacat 3360 caacggcaag acctgcaccg ccagccacct gtgccacaac accagatgcc acaaccccct 3420 gcacctgtgc tgggagagcc tggacgacgc caagggccgg aattggtgcc ctggccctaa 3480 tggcggatgt gtgcatgccg tcgtgtgcct gagacaggga cctctgtatg gccctggcgc 3540 tacagtggct ggccctcagc agaggggctc ccacttcgtg gtgtaaagct cgctttcttg 3600 ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 3660 attatgaagg gccttgagca tctggattct gcctaataag aaacatttat tgtcattgca 3720 gagacgcggc cgcgcgtctc aatgaagagc gtcgacgcat gcgg 3764 <210> 10 <211> 4474 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 60 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 660 aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc tggaggagga 720 gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa aattgaacca 780 ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa aagagcagtg 840 ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat gggcgcagcg 900 tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca gcagcagaac 960 aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt ctggggcatc 1020 aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca acagctcctg 1080 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 1140 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 1200 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 1260 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 1320 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 1380 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 1440 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 1500 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 1560 cggtatcggt taacttttaa aagaaaaggg gggattgggg ggtacagtgc aggggaaaga 1620 atagtagaca taatagcaac agacatacaa actaaagaat tacaaaaaca aattacaaaa 1680 attcaaaatt ttatcgataa gcttgggagt tccgcgttac ataacttacg gtaaatggcc 1740 cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg tatgttccca 1800 tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg 1860 cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg 1920 acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac tttcctactt 1980 ggcagtacat ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca 2040 tcaatgggcg tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg 2100 tcaatgggag tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact 2160 ccgccccatt gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag 2220 ctcgtttagt gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata 2280 gaagacaccg actctagagg atccactagt ccagtgtggt ggaattctgc agatatcaac 2340 aagtttgtac aaaaaagcag gctccaccat ggtcttcaca ctcgaagatt tcgttgggga 2400 ctggcgacag acagccggct acaacctgga ccaagtcctt gaacagggag gtgtgtccag 2460 tttgtttcag aatctcgggg tgtccgtaac tccgatccaa aggattgtcc tgagcggtga 2520 aaatgggctg aagatcgaca tccatgtcat catcccgtat gaaggtctga gcggcgacca 2580 aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct gtggatgatc atcactttaa 2640 ggtgatcctg cactatggca cactggtaat cgacggggtt acgccgaaca tgatcgacta 2700 tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc aaaaagatca ctgtaacagg 2760 gaccctgtgg aacggcaaca aaattatcga cgagcgcctg atcaaccccg acggctccct 2820 gctgttccga gtaaccatca acggagtgac cggctggcgg ctgtgcgaac gcattctggc 2880 gtaaacccag ctttcttgta caaagtggtt gatatccagc acagtggcgg ccgctcgagt 2940 ctagagggcc cgcggttcga aggtaagcct atccctaacc ctctcctcgg tctcgattct 3000 acgcgtaccg gttagtaatg atcgacaatc aacctctgga ttacaaaatt tgtgaaagat 3060 tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc 3120 ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct 3180 ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca 3240 ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt 3300 ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg 3360 cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga 3420 agctgacgtc ctttccatgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt 3480 ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc 3540 cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt 3600 gggccgcctc cccgcctggc gatggtaccg gtgtggaaag tccccaggct ccccagcagg 3660 cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa agtccccagg 3720 ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc 3780 gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 3840 tggctgacta atttttttta tttatgcaga ggccgaggcc gcctctgcct ctgagctatt 3900 ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc tcccgggagc 3960 ttgtatatcc attttcggat ctgatcagca cgtgcacaat tcgagctcgg tacctttaag 4020 accaatgact tacaaggcag ctgtagatct tagccacttt ttaaaagaaa aggggggact 4080 ggaagggcta attcactccc aacgaagaca agatctgctt tttgcttgta ctgggtctct 4140 ctggttagac cagatctgag cctgggagct ctctggctaa ctagggaacc cactgcttaa 4200 gcctcaataa agcttgcctt gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc 4260 tggtaactag agatccctca gaccctttta gtcagtgtgg aaaatctcta gcagtagtag 4320 ttcatgtcat cttattattc agtatttata acttgcaaag aaatgaatat cagagagtga 4380 gaggaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 4440 cacaaataaa gcattttttt cactgcacct aagg 4474 <210> 11 <211> 3260 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgggc ttttttaggg aagatctggc cttcccacaa gggaaggcca gggaattttc 120 ttcagagcag accagagcca acagccccac cagaagagag cttcaggttt ggggaagaga 180 caacaactcc ctctcagaag caggagccga tagacaagga actgtatcct ttagcttccc 240 tcagatcact ctttggcagc gacccctcgt cacaataaag ataggggggc agctcaagga 300 ggctctcctg gacaccggag cagacgacac cgtgctggag gagatgtcgt tgccaggccg 360 ctggaagccg aagatgatcg ggggaatcgg cggtttcatc aaggtgcgcc agtatgacca 420 gatcctcatc gaaatctgcg gccacaaggc tatcggtacc gtgctggtgg gccccacacc 480 cgtcaacatc atcggacgca acctgttgac gcagatcggt tgcacgctga acttccccat 540 tagccctatc gagacggtac cggtgaagct gaagcccggg atggacggcc cgaaggtcaa 600 gcaatggcca ttgacagagg agaagatcaa ggcactggtg gagatttgca cagagatgga 660 aaaggaaggg aaaatctcca agattgggcc tgagaacccg tacaacacgc cggtgttcgc 720 aatcaagaag aaggactcga cgaaatggcg caagctggtg gacttccgcg agctgaacaa 780 gcgcacgcaa gacttctggg aggttcagct gggcatcccg caccccgcag ggctgaagaa 840 gaagaaatcc gtgaccgtac tggatgtggg tgatgcctac ttctccgttc ccctggacga 900 agacttcagg aagtacactg ccttcacaat cccttcgatc aacaacgaga caccggggat 960 tcgatatcag tacaacgtgc tgccccaggg ctggaaaggc tctcccgcaa tcttccagag 1020 tagcatgacc aaaatcctgg agcctttccg caaacagaac cccgacatcg tcatctatca 1080 gtacatggat gacttgtacg tgggctctga tctagagata gggcagcacc gcaccaagat 1140 cgaggagctg cgccagcacc tgttgaggtg gggactgacc acacccgaca agaagcacca 1200 gaaggagcct cccttcctct ggatgggtta cgagctgcac cctgacaaat ggaccgtgca 1260 gcctatcgtg ctgccagaga aagacagctg gactgtcaac gacatacaga agctggtggg 1320 gaagttgaac tgggccagtc agatttaccc agggattaag gtgaggcagc tgtgcaaact 1380 cctccgcgga accaaggcac tcacagaggt gatcccccta accgaggagg ccgagctcga 1440 actggcagaa aaccgagaga tcctaaagga gcccgtgcac ggcgtgtact atgacccctc 1500 caaggacctg atcgccgaga tccagaagca ggggcaaggc cagtggacct atcagattta 1560 ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc cggatgaggg gtgcccacac 1620 taacgacgtc aagcagctga ccgaggccgt gcagaagatc accaccgaaa gcatcgtgat 1680 ctggggaaag actcctaagt tcaagctgcc catccagaag gaaacctggg aaacctggtg 1740 gacagagtat tggcaggcca cctggattcc tgagtgggag ttcgtcaaca cccctcccct 1800 ggtgaagctg tggtaccagc tggagaagga gcccatagtg ggcgccgaaa ccttctacgt 1860 ggatggggcc gctaacaggg agactaagct gggcaaagcc ggatacgtca ctaaccgggg 1920 cagacagaag gttgtcaccc tcactgacac caccaaccag aagactgagc tgcaggccat 1980 ttacctcgct ttgcaggact cgggcctgga ggtgaacatc gtgacagact ctcagtatgc 2040 cctgggcatc attcaagccc agccagacca gagtgagtcc gagctggtca atcagatcat 2100 cgagcagctg atcaagaagg aaaaggtcta tctggcctgg gtacccgccc acaaaggcat 2160 tggcggcaat gagcaggtcg acaagctggt ctcggctggc atcaggaagg tgctattcct 2220 ggatggcatc gacaaggccc aggacgagca cgagaaatac cacagcaact ggcgggccat 2280 ggctagcgac ttcaacctgc cccctgtggt ggccaaagag atcgtggcca gctgtgacaa 2340 gtgtcagctc aagggcgaag ccatgcatgg ccaggtggac tgtagccccg gcatctggca 2400 actcgattgc acccatctgg agggcaaggt tatcctggta gccgtccatg tggccagtgg 2460 ctacatcgag gccgaggtca ttcccgccga aacagggcag gagacagcct acttcctcct 2520 gaagctggca ggccggtggc cagtgaagac catccatact gacaatggca gcaatttcac 2580 cagtgctacg gttaaggccg cctgctggtg ggcgggaatc aagcaggagt tcgggatccc 2640 ctacaatccc cagagtcagg gcgtcgtcga gtctatgaat aaggagttaa agaagattat 2700 cggccaggtc agagatcagg ctgagcatct caagaccgcg gtccaaatgg cggtattcat 2760 ccacaatttc aagcggaagg gggggattgg ggggtacagt gcgggggagc ggatcgtgga 2820 catcatcgcg accgacatcc agactaagga gctgcaaaag cagattacca agattcagaa 2880 tttccgggtc tactacaggg acagcagaaa tcccctctgg aaaggcccag cgaagctcct 2940 ctggaagggt gagggggcag tagtgatcca ggataatagc gacatcaagg tggtgcccag 3000 aagaaaggcg aagatcatta gggattatgg caaacagatg gcgggtgatg attgcgtggc 3060 gagcagacag gatgaggatt agagctcgct ttcttgctgt ccaatttcta ttaaaggttc 3120 ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct tgagcatctg 3180 gattctgcct aataagaaac atttattgtc attgcagaga cgcggccgcg cgtctcaatg 3240 aagagcgtcg acgcatgcgg 3260 <210> 12 <211> 3212 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgttt tttagggaag atctggcctt cccacaaggg aaggccaggg aattttcttc 120 agagcagacc agagccaaca gccccaccag aagagagctt caggtttggg gaagagacaa 180 caactccctc tcagaagcag gagccgatag acaaggaact gtatccttta gcttccctca 240 gatcactctt tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc 300 tctattagat acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg 360 gaaaccaaaa atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat 420 actcatagaa atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt 480 caacataatt ggaagaaatc tgttgactca gattggctgc actttaaatt ttcccattag 540 tcctattgag actgtaccag taaaattaaa gccaggaatg gatggcccaa aagttaaaca 600 atggccattg acagaagaaa aaataaaagc attagtagaa atttgtacag aaatggaaaa 660 ggaaggaaaa atttcaaaaa ttgggcctga aaatccatac aatactccag tatttgccat 720 aaagaaaaaa gacagtacta aatggagaaa attagtagat ttcagagaac ttaataagag 780 aactcaagat ttctgggaag ttcaattagg aataccacat cctgcagggt taaaacagaa 840 aaaatcagta acagtactgg atgtgggcga tgcatatttt tcagttccct tagataaaga 900 cttcaggaag tatactgcat ttaccatacc tagtataaac aatgagacac cagggattag 960 atatcagtac aatgtgcttc cacagggatg gaaaggatca ccagcaatat tccagtgtag 1020 catgacaaaa atcttagagc cttttagaaa acaaaatcca gacatagtca tctatcaata 1080 catggatgat ttgtatgtag gatctgactt agaaataggg cagcatagaa caaaaataga 1140 ggaactgaga caacatctgt tgaggtgggg atttaccaca ccagacaaaa aacatcagaa 1200 agaacctcca ttcctttgga tgggttatga actccatcct gataaatgga cagtacagcc 1260 tatagtgctg ccagaaaagg acagctggac tgtcaatgac atacagaaat tagtgggaaa 1320 attgaattgg gcaagtcaga tttatgcagg gattaaagta aggcaattat gtaaacttct 1380 taggggaacc aaagcactaa cagaagtagt accactaaca gaagaagcag agctagaact 1440 ggcagaaaac agggagattc taaaagaacc ggtacatgga gtgtattatg acccatcaaa 1500 agacttaata gcagaaatac agaagcaggg gcaaggccaa tggacatatc aaatttatca 1560 agagccattt aaaaatctga aaacaggaaa gtatgcaaga atgaagggtg cccacactaa 1620 tgatgtgaaa caattaacag aggcagtaca aaaaatagcc acagaaagca tagtaatatg 1680 gggaaagact cctaaattta aattacccat acaaaaggaa acatgggaag catggtggac 1740 agagtattgg caagccacct ggattcctga gtgggagttt gtcaataccc ctcccttagt 1800 gaagttatgg taccagttag agaaagaacc cataatagga gcagaaactt tctatgtaga 1860 tggggcagcc aatagggaaa ctaaattagg aaaagcagga tatgtaactg acagaggaag 1920 acaaaaagtt gtccccctaa cggacacaac aaatcagaag actgagttac aagcaattca 1980 tctagctttg caggattcgg gattagaagt aaacatagtg acagactcac aatatgcatt 2040 gggaatcatt caagcacaac cagataagag tgaatcagag ttagtcagtc aaataataga 2100 gcagttaata aaaaaggaaa aagtctacct ggcatgggta ccagcacaca aaggaattgg 2160 aggaaatgaa caagtagata aattggtcag tgctggaatc aggaaagtac tatttttaga 2220 tggaatagat aaggcccaag aagaacatga gaaatatcac agtaattgga gagcaatggc 2280 tagtgatttt aacctaccac ctgtagtagc aaaagaaata gtagccagct gtgataaatg 2340 tcagctaaaa ggggaagcca tgcatggaca agtagactgt agcccaggaa tatggcagct 2400 agattgtaca catttagaag gaaaagttat cttggtagca gttcatgtag ccagtggata 2460 tatagaagca gaagtaattc cagcagagac agggcaagaa acagcatact tcctcttaaa 2520 attagcagga agatggccag taaaaacagt acatacagac aatggcagca atttcaccag 2580 tactacagtt aaggccgcct gttggtgggc ggggatcaag caggaatttg gcattcccta 2640 caatccccaa agtcaaggag taatagaatc tatgaataaa gaattaaaga aaattatagg 2700 acaggtaaga gatcaggctg aacatcttaa gacagcagta caaatggcag tattcatcca 2760 caattttaaa agaaaagggg ggattggggg gtacagtgca ggggaaagaa tagtagacat 2820 aatagcaaca gacatacaaa ctaaagaatt acaaaaacaa attacaaaaa ttcaaaattt 2880 tcgggtttat tacagggaca gcagagatcc agtttggaaa ggaccagcaa agctcctctg 2940 gaaaggtgaa ggggcagtag taatacaaga taatagtgac ataaaagtag tgccaagaag 3000 aaaagcaaag atcatcaggg attatggaaa acagatggca ggtgatgatt gtgtggcaag 3060 tagacaggat gaggattaaa gctcgctttc ttgctgtcca atttctatta aaggttcctt 3120 tgttccctaa gtccaactac taaactgggg gatattatga agggccttga gcatctggat 3180 tctgcctaat aagaaacatt tattgtcatt gc 3212 <210> 13 <211> 1115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatggga ttcctggacg gcattgacaa ggctcaggag gagcacgaga agtaccactc 120 gaattggcgg gccatggcct ccgacttcaa cctgccaccc gtcgtcgcta aggagatcgt 180 tgctagctgc gacaagtgcc agctgaaagg cgaggctatg cacgggcagg ttgattgctc 240 tcccggcatc tggcagctcg actgtactca cctggagggc aaggtcatcc tggtcgccgt 300 gcacgtggcc tctggttaca tcgaggctga ggtcatccct gcagagactg gccaggagac 360 tgcctatttc ctgctgaaac tggccggccg gtggcctgtg aagacagtgc acacagataa 420 cggctccaac ttcacctcca ccactgtgaa ggctgcctgc tggtgggctg ggatcaagca 480 ggagttcggg atcccctata acccacagtc tcagggcgtg atcgaatcca tgaacaagga 540 gctgaagaag atcatcggcc aggttccgga ccaggcagag cacctgaaga ctgcagtgca 600 catggccgtg ttcatccaca acttcaagcg aaagggcgcc atcggtgcct actcagccgg 660 cgagcggatc gtggacatca tcgccactga catccagacc aaagagctgc agaagcagat 720 caccaagatc cagaacttcc gtgtgtacta ccgggactcc cgggaccctg tgtggaaggg 780 ccctgccaag ctgctgtgga agggcgaggg cgccgtggtc attcaggaca actgtgacat 840 caaggttgtg cccaggcgca aggccaagat tatccgggac tacggcaagc agatggctgg 900 cgacgactgt gtggcctctc gtcaagatga ggactaaagc tcgctttctt gctgtccaat 960 ttctattaaa ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag 1020 ggccttgagc atctggattc tgcctaataa gaaacattta ttgtcattgc agagacgcgg 1080 ccgcgcgtct caatgaagag cgtcgacgca tgcgg 1115 <210> 14 <211> 1115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatggga ttccttgacg gcatcgacaa ggcgcaagag gagcacgaga aatatcatag 120 caactggagg gcgatggcat cagacttcaa cttgccgcca gtcgtggcta aagagatagt 180 agcaagctgc gataagtgtc aactgaaggg tgaagcgatg cacggtcaag tggactgttc 240 ccctggtata tggcaactgg actgtaccca tctcgaaggt aaagtcattt tggttgctgt 300 acatgttgcc tctgggtata tcgaggctga ggtgattcca gcagaaacgg gacaggaaac 360 agcttatttc ttgctcaagc ttgccgggag atggcctgtg aaaactgttc atacagataa 420 tggtagcaat tttactagta cgaccgtgaa agcagcttgt tggtgggcag ggattaagca 480 agaattcgga atcccgtata acccgcagag tcagggcgtt attgagagca tgaacaagga 540 actgaaaaaa ataattgggc aagtgagaga tcaggctgag catcttaaaa ctgctgtaca 600 aatggcggtg ttcatacata attttaagcg gaagggagga attggaggat actctgcggg 660 agagaggata gtggatataa tagcgaccga tattcagaca aaggagctgc aaaaacagat 720 aacgaaaata caaaattttc gagtttacta tcgggactcc cgcgatcccg tgtggaaagg 780 tccagcgaaa ttgctttgga agggcgaagg cgcggtagtg atccaggaca attctgatat 840 caaagtggtc ccaaggcgga aagcaaagat aatccgcgac tacggcaagc aaatggcagg 900 agatgattgc gtcgcatcac gacaggacga agattaaagc tcgctttctt gctgtccaat 960 ttctattaaa ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag 1020 ggccttgagc atctggattc tgcctaataa gaaacattta ttgtcattgc agagacgcgg 1080 ccgcgcgtct caatgaagag cgtcgacgca tgcgg 1115 <210> 15 <211> 1067 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgttt ttagatggaa tagataaggc ccaagaagaa catgagaaat atcacagtaa 120 ttggagagca atggctagtg attttaacct accacctgta gtagcaaaag aaatagtagc 180 cagctgtgat aaatgtcagc taaaagggga agccatgcat ggacaagtag actgtagccc 240 aggaatatgg cagctagatt gtacacattt agaaggaaaa gttatcttgg tagcagttca 300 tgtagccagt ggatatatag aagcagaagt aattccagca gagacagggc aagaaacagc 360 atacttcctc ttaaaattag caggaagatg gccagtaaaa acagtacata cagacaatgg 420 cagcaatttc accagtacta cagttaaggc cgcctgttgg tgggcgggga tcaagcagga 480 atttggcatt ccctacaatc cccaaagtca aggagtaata gaatctatga ataaagaatt 540 aaagaaaatt ataggacagg taagagatca ggctgaacat cttaagacag cagtacaaat 600 ggcagtattc atccacaatt ttaaaagaaa aggggggatt ggggggtaca gtgcagggga 660 aagaatagta gacataatag caacagacat acaaactaaa gaattacaaa aacaaattac 720 aaaaattcaa aattttcggg tttattacag ggacagcaga gatccagttt ggaaaggacc 780 agcaaagctc ctctggaaag gtgaaggggc agtagtaata caagataata gtgacataaa 840 agtagtgcca agaagaaaag caaagatcat cagggattat ggaaaacaga tggcaggtga 900 tgattgtgtg gcaagtagac aggatgagga ttaaagctcg ctttcttgct gtccaatttc 960 tattaaaggt tcctttgttc cctaagtcca actactaaac tgggggatat tatgaagggc 1020 cttgagcatc tggattctgc ctaataagaa acatttattg tcattgc 1067 <210> 16 <211> 1568 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgccc attagcccta tcgagacggt accggtgaag ctgaagcccg ggatggacgg 120 cccgaaggtc aagcaatggc cattgacaga ggagaagatc aaggcactgg tggagatttg 180 cacagagatg gaaaaggaag ggaaaatctc caagattggg cctgagaacc cgtacaacac 240 gccggtgttc gcaatcaaga agaaggactc gacgaaatgg cgcaagctgg tggacttccg 300 cgagctgaac aagcgcacgc aagacttctg ggaggttcag ctgggcatcc cgcaccccgc 360 agggctgaag aagaagaaat ccgtgaccgt actggatgtg ggtgatgcct acttctccgt 420 tcccctggac gaagacttca ggaagtacac tgccttcaca atcccttcga tcaacaacga 480 gacaccgggg attcgatatc agtacaacgt gctgccccag ggctggaaag gctctcccgc 540 aatcttccag agtagcatga ccaaaatcct ggagcctttc cgcaaacaga accccgacat 600 cgtcatctat cagtacatgg atgacttgta cgtgggctct gatctagaga tagggcagca 660 ccgcaccaag atcgaggagc tgcgccagca cctgttgagg tggggactga ccacacccga 720 caagaagcac cagaaggagc ctcccttcct ctggatgggt tacgagctgc accctgacaa 780 atggaccgtg cagcctatcg tgctgccaga gaaagacagc tggactgtca acgacataca 840 gaagctggtg gggaagttga actgggccag tcagatttac ccagggatta aggtgaggca 900 gctgtgcaaa ctcctccgcg gaaccaaggc actcacagag gtgatccccc taaccgagga 960 ggccgagctc gaactggcag aaaaccgaga gatcctaaag gagcccgtgc acggcgtgta 1020 ctatgacccc tccaaggacc tgatcgccga gatccagaag caggggcaag gccagtggac 1080 ctatcagatt taccaggagc ccttcaagaa cctgaagacc ggcaagtacg cccggatgag 1140 gggtgcccac actaacgacg tcaagcagct gaccgaggcc gtgcagaaga tcaccaccga 1200 aagcatcgtg atctggggaa agactcctaa gttcaagctg cccatccaga aggaaacctg 1260 ggaaacctgg tggacagagt attggcaggc cacctggatt cctgagtggg agttcgtcaa 1320 cacccctccc ctggtgaagc tgtggtacca gctggagaag gagcccatag tgggcgccga 1380 aaccttctaa agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta 1440 agtccaacta ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa 1500 taagaaacat ttattgtcat tgcagagacg cggccgcgcg tctcaatgaa gagcgtcgac 1560 gcatgcgg 1568 <210> 17 <211> 1928 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 agaccaggaa ttacatttgc ttctgacaca actgtgttca ctagcaacct caaacagagc 60 cgccatgccc attagcccta tcgagacggt accggtgaag ctgaagcccg ggatggacgg 120 cccgaaggtc aagcaatggc cattgacaga ggagaagatc aaggcactgg tggagatttg 180 cacagagatg gaaaaggaag ggaaaatctc caagattggg cctgagaacc cgtacaacac 240 gccggtgttc gcaatcaaga agaaggactc gacgaaatgg cgcaagctgg tggacttccg 300 cgagctgaac aagcgcacgc aagacttctg ggaggttcag ctgggcatcc cgcaccccgc 360 agggctgaag aagaagaaat ccgtgaccgt actggatgtg ggtgatgcct acttctccgt 420 tcccctggac gaagacttca ggaagtacac tgccttcaca atcccttcga tcaacaacga 480 gacaccgggg attcgatatc agtacaacgt gctgccccag ggctggaaag gctctcccgc 540 aatcttccag agtagcatga ccaaaatcct ggagcctttc cgcaaacaga accccgacat 600 cgtcatctat cagtacatgg atgacttgta cgtgggctct gatctagaga tagggcagca 660 ccgcaccaag atcgaggagc tgcgccagca cctgttgagg tggggactga ccacacccga 720 caagaagcac cagaaggagc ctcccttcct ctggatgggt tacgagctgc accctgacaa 780 atggaccgtg cagcctatcg tgctgccaga gaaagacagc tggactgtca acgacataca 840 gaagctggtg gggaagttga actgggccag tcagatttac ccagggatta aggtgaggca 900 gctgtgcaaa ctcctccgcg gaaccaaggc actcacagag gtgatccccc taaccgagga 960 ggccgagctc gaactggcag aaaaccgaga gatcctaaag gagcccgtgc acggcgtgta 1020 ctatgacccc tccaaggacc tgatcgccga gatccagaag caggggcaag gccagtggac 1080 ctatcagatt taccaggagc ccttcaagaa cctgaagacc ggcaagtacg cccggatgag 1140 gggtgcccac actaacgacg tcaagcagct gaccgaggcc gtgcagaaga tcaccaccga 1200 aagcatcgtg atctggggaa agactcctaa gttcaagctg cccatccaga aggaaacctg 1260 ggaaacctgg tggacagagt attggcaggc cacctggatt cctgagtggg agttcgtcaa 1320 cacccctccc ctggtgaagc tgtggtacca gctggagaag gagcccatag tgggcgccga 1380 aaccttctac gtggatgggg ccgctaacag ggagactaag ctgggcaaag ccggatacgt 1440 cactaaccgg ggcagacaga aggttgtcac cctcactgac accaccaacc agaagactga 1500 gctgcaggcc atttacctcg ctttgcagga ctcgggcctg gaggtgaaca tcgtgacaga 1560 ctctcagtat gccctgggca tcattcaagc ccagccagac cagagtgagt ccgagctggt 1620 caatcagatc atcgagcagc tgatcaagaa ggaaaaggtc tatctggcct gggtacccgc 1680 ccacaaaggc attggcggca atgagcaggt cgacaagctg gtctcggctg gcatcaggaa 1740 ggtgctataa agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta 1800 agtccaacta ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa 1860 taagaaacat ttattgtcat tgcagagacg cggccgcgcg tctcaatgaa gagcgtcgac 1920 gcatgcgg 1928 <210> 18 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 gucccuguuc gggcgcca 18 <210> 19 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 gtccctgttc gggcgcca 18

Claims (129)

  1. 하기를 포함하는 조성물:
    (i) 5' 및 3' 비번역 영역 (UTR)에 의해 플랭킹된 하나 이상의 Pol 폴리단백질 성분을 코딩하는 하나 이상의 핵산 분자; 및
    (ii) 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 핵산 분자.
  2. 제1항에 있어서, 조성물이 레트로바이러스 rev 유전자 및 레트로바이러스 env 유전자 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는 것인 조성물.
  3. 제1항 또는 제2항에 있어서, 조성물이 레트로바이러스 rev env 유전자에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는 것인 조성물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 조성물이 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있는 것인 조성물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, Pol 폴리단백질 성분의 발현이 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하지 않는 것인 조성물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 5' UTR, Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자인 조성물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소 및 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 핵산 분자인 조성물.
  8. 제1항 내지 제5항 및 제7항 중 어느 한 항에 있어서, Pol 폴리단백질 성분 역전사효소 및 인테그라제가 폴리시스트론성 구축물 상에서 발현되는 것인 조성물.
  9. 제8항에 있어서, 폴리시스트론성 구축물이 바이시스트론성 또는 트리시스트론성인 조성물.
  10. 제1항 내지 제5항 및 제7항 내지 제9항 중 어느 한 항에 있어서, Pol 폴리단백질 성분 역전사효소 및 인테그라제가 하나 이상의 폴리시스트론성 요소와 함께 발현되는 것인 조성물.
  11. 제10항에 있어서, 폴리시스트론성 요소가 개재 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드-코딩 서열인 조성물.
  12. 제1항 내지 제5항 및 제7항 내지 제11항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 2개의 핵산 분자이며, 여기서 2개의 핵산 분자 중 하나가 5' UTR, 적어도 Pol 폴리단백질 성분 역전사효소를 코딩하는 핵산 서열, 및 3' UTR을 포함하고, 여기서 2개의 핵산 분자 중 다른 하나가 5' UTR, 적어도 Pol 폴리단백질 성분 인테그라제를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 것인 조성물.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 또한 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 포함하는 것인 조성물.
  14. 제13항에 있어서, 하나 이상의 부속 단백질이 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 매트릭스 단백질 (MA), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택되는 것인 조성물.
  15. 제14항에 있어서, 하나 이상의 부속 단백질이 돌연변이체 부속 단백질인 조성물.
  16. 제15항에 있어서, 돌연변이체 부속 단백질이 N74D 돌연변이, E45A 돌연변이 또는 둘 다를 임의로 포함하는 돌연변이체 캡시드 단백질 (CA)이며, 여기서 넘버링이 야생형 HIV-1 캡시드 단백질에 상응하는 것인 조성물.
  17. 제1항 내지 제12항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 또한 하나 이상의 Gag 폴리단백질 부속 단백질을 코딩하는 핵산 서열을 포함하는 것인 조성물.
  18. 제13항 내지 제17항 중 어느 한 항에 있어서, 하나 이상의 부속 단백질이 Pol 폴리단백질 성분과 동일한 핵산 분자 상에 코딩되는 것인 조성물.
  19. 제18항에 있어서, 하나 이상의 부속 단백질이 하나 이상의 폴리시스트론성 요소와 함께 발현되는 것인 조성물.
  20. 제19항에 있어서, 폴리시스트론성 요소가 개재 내부 리보솜 진입 부위 (IRES) 또는 2A 펩티드-코딩 서열인 조성물.
  21. 제13항 내지 제17항 중 어느 한 항에 있어서, 하나 이상의 부속 단백질이 Pol 폴리단백질 성분을 코딩하는 핵산 분자와 상이한 하나 이상의 핵산 분자에 의해 코딩되며, 여기서 각 핵산 분자가 5' UTR 및 3' UTR을 포함하는 것인 조성물.
  22. 제13항 내지 제21항 중 어느 한 항에 있어서, Gag 폴리단백질 부속 단백질이 Gag 폴리단백질에 의해 코딩되는 것인 조성물.
  23. 제1항 내지 제21항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 Gag 폴리단백질을 코딩하지 않는 것인 조성물.
  24. 제1항 내지 제4항, 제6항, 제7항 및 제13항 내지 제22항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 gag-pol 유전자를 포함하는 것인 조성물.
  25. 제24항에 있어서, gag-pol 유전자가 프레임시프트 돌연변이를 포함하는 것인 조성물.
  26. 제25항에 있어서, 프레임시프트 돌연변이가 단일 뉴클레오티드 삽입 또는 결실인 조성물.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 조성물이 매트릭스 단백질을 코딩하는 핵산 서열을 포함하지 않는 것인 조성물.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 하나 이상의 내재적 불안정성 (INS) 요소에 적어도 하나의 돌연변이를 포함하는 것인 조성물.
  29. 제28항에 있어서, 하나 이상의 INS 요소가 TAGAT, ATAGA, AAAAG, ATAAA 및 TTATA로부터 선택되는 것인 조성물.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 N-말단 메티오닌-글리신 디펩티드를 포함하는 인테그라제 폴리펩티드를 코딩하는 것인 조성물.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 하나 이상의 Pol 폴리단백질 성분이 귀소 단백질에 융합된 것인 조성물.
  32. 제31항에 있어서, 귀소 단백질에 융합된 Pol 폴리단백질 성분 중 적어도 하나가 인테그라제 폴리펩티드인 조성물.
  33. 제31항 또는 제32항에 있어서, 귀소 단백질이 I-PpoI인 조성물.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자 및/또는 (ii)의 핵산 분자가 숙주 세포에서의 발현을 위해 코돈 최적화된 것인 조성물.
  35. 제34항에 있어서, 숙주 세포가 포유동물 세포인 조성물.
  36. 제35항에 있어서, 포유동물 세포가 인간 세포인 조성물.
  37. 제34항에 있어서, 숙주 세포가 조류 세포인 조성물.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 조성물이 프라이밍 올리고뉴클레오티드를 추가로 포함하는 것인 조성물.
  39. 제38항에 있어서, 프라이밍 올리고뉴클레오티드가 GUCCCUGUUCGGGCGCCA 또는 GTCCCTGTTCGGGCGCCA인 조성물.
  40. 제38항에 있어서, 프라이밍 올리고뉴클레오티드가 RT 프라이밍 요소에 대해 상보적이 되도록 조작된 것인 조성물.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, (i) 및 (ii)의 핵산 분자가 RNA 분자 또는 DNA 분자인 조성물.
  42. 제1항 내지 제40항 중 어느 한 항에 있어서, (i) 및 (ii)의 핵산 분자가 ssDNA 분자 또는 dsDNA 분자인 조성물.
  43. 제1항 내지 제40항 중 어느 한 항에 있어서, (i) 및 (ii)의 핵산 분자가 ssRNA 분자 또는 dsRNA 분자인 조성물.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, (ii)의 핵산 분자가 2개 이상의 트랜스진을 포함하고, 트랜스진이 하나 이상의 폴리시스트론성 요소에 의해 분리된 것인 조성물.
  45. 제44항에 있어서, 하나 이상의 폴리시스트론성 요소가 하나 이상의 내부 리보솜 진입 부위 (IRES) 및/또는 하나 이상의 2A 펩티드-코딩 서열을 포함하는 것인 조성물.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, (ii)의 핵산 분자가 하나 이상의 인핸서를 추가로 포함하는 것인 조성물.
  47. 제46항에 있어서, 하나 이상의 인핸서가 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 포함하는 것인 조성물.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, (i)의 하나 이상의 핵산 분자가 RNA 분자이고, 변형된 리보뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
  49. 제48항에 있어서, 하나 이상의 변형이 슈도우리딘 또는 슈도우리딘의 유도체를 포함하는 것인 조성물.
  50. 제49항에 있어서, 슈도우리딘의 유도체가 N1-메틸슈도우리딘인 조성물.
  51. 제48항에 있어서, 하나 이상의 변형이 N6-메틸아데노신을 포함하는 것인 조성물.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, (ii)의 핵산 분자가 RNA 분자이고, 변형된 리보뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 추가로 포함하는 것인 조성물.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, Pol 폴리단백질 성분, 부속 단백질 및/또는 LTR이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 또는 노랑가슴 카푸친 시미안 포말상 바이러스로부터의 Pol 폴리단백질 성분 및/또는 LTR에 기초한 것인 조성물.
  54. 제1항 내지 제53항 중 어느 한 항에 있어서, 조성물이 비-바이러스 전달 시스템에 패키징된 것인 조성물.
  55. 제54항에 있어서, 비-바이러스 전달 시스템이 지질 나노입자, 리포솜, 폴리펩티드 나노입자, 실리카 나노입자, 금 나노입자, 중합체성 나노입자, 덴드리머, 또는 양이온성 나노에멀젼인 조성물.
  56. 제54항에 있어서, 비-바이러스 전달 시스템이 지질 나노입자인 조성물.
  57. 하기를 포함하는 조성물로서:
    (i) 5' 비번역 영역 (UTR), 레트로바이러스 Pol 폴리단백질을 코딩하는 핵산 서열, 및 3' UTR을 포함하는 제1 RNA 분자; 및
    (ii) 5' 긴 말단 반복부 (LTR)와 3' LTR 사이에 하나 이상의 역전사효소 프라이밍 요소 및 하나 이상의 트랜스진에 작동가능하게 연결된 하나 이상의 프로모터 서열을 포함하는 제2 RNA 분자;
    여기서 조성물은 비-바이러스 전달 시스템에 패키징된 것인
    조성물.
  58. 제57항에 있어서, 조성물이 레트로바이러스 rev 유전자 및 레트로바이러스 env 유전자 중 적어도 하나에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는 것인 조성물.
  59. 제57항 또는 제58항에 있어서, 조성물이 레트로바이러스 rev env 유전자 둘 다에 의해 코딩되는 단백질을 발현하는 핵산 서열을 함유하지 않는 것인 조성물.
  60. 제57항에 있어서, 조성물이 기능적 레트로바이러스 Rev 및/또는 Env 단백질의 부재 하에 하나 이상의 트랜스진을 숙주 게놈에 통합할 수 있는 것인 조성물.
  61. 제57항 내지 제60항 중 어느 한 항에 있어서, (i) 및 (ii)의 RNA 분자가 ssRNA 분자 또는 dsRNA 분자인 조성물.
  62. 제57항 내지 제61항 중 어느 한 항에 있어서, 하나 이상의 부속 단백질을 코딩하는 제3 RNA 분자를 추가로 포함하는 조성물.
  63. 제62항에 있어서, 하나 이상의 부속 단백질이 뉴클레오캡시드 (NC), 캡시드 단백질 (CA), 매트릭스 단백질 (MA), p6, 바이러스 감염성 인자 (Vif), 전사 트랜스활성화인자 (Tat), 음성 조절 인자 (Nef), 바이러스 단백질 R (Vpr), 및 바이러스 단백질 u (Vpu)로부터 선택되는 것인 조성물.
  64. 제63항에 있어서, 하나 이상의 부속 단백질이 돌연변이체 부속 단백질인 조성물.
  65. 제64항에 있어서, 돌연변이체 부속 단백질이 N74D 돌연변이, E45A 돌연변이 또는 둘 다를 임의로 포함하는 돌연변이체 캡시드 단백질 (CA)이며, 여기서 넘버링이 야생형 HIV-1 캡시드 단백질에 상응하는 것인 조성물.
  66. 제57항 내지 제61항 중 어느 한 항에 있어서, 제1 RNA 분자가 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 추가로 포함하는 것인 조성물.
  67. 제66항에 있어서, 하나 이상의 부속 단백질이 NC, CA, MA, p6, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택되는 것인 조성물.
  68. 제57항 내지 제61항 중 어느 한 항에 있어서, 하나 이상의 Gag 폴리단백질 부속 단백질을 코딩하는 제3 RNA 분자를 추가로 포함하는 조성물.
  69. 제57항 내지 제61항 중 어느 한 항에 있어서, 제1 RNA 분자가 하나 이상의 Gag 폴리단백질 부속 단백질을 코딩하는 핵산 서열을 추가로 포함하는 것인 조성물.
  70. 제68항 또는 제69항에 있어서, Gag 폴리단백질 부속 단백질이 Gag 폴리단백질에 의해 코딩되는 것인 조성물.
  71. 제57항 내지 제70항 중 어느 한 항에 있어서, 제1 RNA 분자가 gag-pol 유전자를 포함하는 것인 조성물.
  72. 제71항에 있어서, gag-pol 유전자가 프레임시프트 돌연변이를 포함하는 것인 조성물.
  73. 제72항에 있어서, 프레임시프트 돌연변이가 단일 뉴클레오티드 삽입 또는 결실인 조성물.
  74. 제57항 내지 제73항 중 어느 한 항에 있어서, 조성물이 매트릭스 (MA) 단백질을 코딩하는 핵산 서열을 포함하지 않는 것인 조성물.
  75. 제57항 내지 제74항 중 어느 한 항에 있어서, 제1 또는, 존재하는 경우, 제3 RNA 분자가 하나 이상의 내재적 불안정성 (INS) 요소에 돌연변이를 포함하는 것인 조성물.
  76. 제75항에 있어서, 하나 이상의 INS 요소가 TAGAT, ATAGA, AAAAG, ATAAA 및 TTATA로부터 선택되는 것인 조성물.
  77. 제57항 내지 제76항 중 어느 한 항에 있어서, 제1 RNA 분자가 N-말단 메티오닌-글리신 디펩티드를 포함하는 인테그라제 폴리펩티드를 코딩하는 것인 조성물.
  78. 제57항 내지 제77항 중 어느 한 항에 있어서, Pol 폴리단백질이 귀소 단백질에 융합된 것인 조성물.
  79. 제78항에 있어서, 인테그라제 폴리펩티드가 귀소 단백질에 융합된 것인 조성물.
  80. 제78항 또는 제79항에 있어서, 귀소 단백질이 I-PpoI인 조성물.
  81. 제57항 내지 제80항 중 어느 한 항에 있어서, 제1 및/또는 제2 RNA 분자가 숙주 세포에서의 발현을 위해 코돈 최적화된 것인 조성물.
  82. 제81항에 있어서, 숙주 세포가 포유동물 세포인 조성물.
  83. 제82항에 있어서, 포유동물 세포가 인간 세포인 조성물.
  84. 제81항에 있어서, 숙주 세포가 조류 세포인 조성물.
  85. 제57항 내지 제84항 중 어느 한 항에 있어서, 조성물이 프라이밍 올리고뉴클레오티드를 추가로 포함하는 것인 조성물.
  86. 제85항에 있어서, 프라이밍 올리고뉴클레오티드가 GUCCCUGUUCGGGCGCCA (서열식별번호: 18) 또는 GTCCCTGTTCGGGCGCCA (서열식별번호: 19)인 조성물.
  87. 제85항에 있어서, 프라이밍 올리고뉴클레오티드가 RT 프라이밍 요소에 대해 상보적이 되도록 조작된 것인 조성물.
  88. 제57항 내지 제87항 중 어느 한 항에 있어서, 제2 RNA 분자가 2개 이상의 트랜스진을 포함하고, 트랜스진이 하나 이상의 폴리시스트론성 요소에 의해 분리된 것인 조성물.
  89. 제88항에 있어서, 하나 이상의 폴리시스트론성 요소가 하나 이상의 내부 리보솜 진입 부위 (IRES) 및/또는 하나 이상의 2A 펩티드-코딩 서열을 포함하는 것인 조성물.
  90. 제57항 내지 제89항 중 어느 한 항에 있어서, 제2 RNA 분자가 하나 이상의 인핸서를 추가로 포함하는 것인 조성물.
  91. 제90항에 있어서, 하나 이상의 인핸서가 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 포함하는 것인 조성물.
  92. 제57항 내지 제91항 중 어느 한 항에 있어서, 제1 또는 제2 RNA 분자가 변형된 뉴클레오시드, 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
  93. 제57항 내지 제92항 중 어느 한 항에 있어서, 제2 RNA 분자가 5'-7mG 캡 구조 및 폴리 (rA) 꼬리로부터 선택된 하나 이상의 변형을 포함하는 것인 조성물.
  94. 제92항에 있어서, 하나 이상의 변형이 슈도우리딘 또는 슈도우리딘의 유도체를 포함하는 것인 조성물.
  95. 제94항에 있어서, 슈도우리딘의 유도체가 N1-메틸슈도우리딘인 조성물.
  96. 제92항에 있어서, 하나 이상의 변형이 N6-메틸아데노신을 포함하는 것인 조성물.
  97. 제1항 내지 제96항 중 어느 한 항에 있어서, 하나 이상의 프로모터가 하나 이상의 조직-특이적 또는 세포-특이적 프로모터를 포함하는 것인 조성물.
  98. 제97항에 있어서, 하나 이상의 조직-특이적 또는 세포-특이적 프로모터가 골수, 조혈 줄기 세포 (HSC), 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포에 특이적인 것인 조성물.
  99. 제97항 또는 제98항에 있어서, 하나 이상의 프로모터가 hCMV 프로모터를 포함하는 것인 조성물.
  100. 제1항 내지 제99항 중 어느 한 항에 있어서, 하나 이상의 트랜스진이 하나 이상의 치료적 분자, 진단적 분자 또는 리포터 분자, 또는 그의 단편을 코딩하는 것인 조성물.
  101. 제1항 내지 제99항 중 어느 한 항에 있어서, 하나 이상의 트랜스진이 하나 이상의 치료적 단백질, 진단적 단백질 또는 리포터 단백질, 또는 그의 단편을 코딩하는 것인 조성물.
  102. 제101항에 있어서, 치료적 단백질이 베타-글로빈, 낭성 섬유증 막횡단 전도도 조절인자 (CFTR), 인자 VIII, 디스트로핀, 또는 RP GTPase 조절인자 (RPGR)인 조성물.
  103. 제101항에 있어서, 리포터 단백질이 형광 단백질 또는 루시페라제인 조성물.
  104. 제57항 내지 제103항 중 어느 한 항에 있어서, Pol 폴리단백질 성분, 부속 단백질 및/또는 LTR이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 또는 노랑가슴 카푸친 시미안 포말상 바이러스로부터의 Pol 폴리단백질 성분, 부속 단백질 및/또는 LTR에 기초한 것인 조성물.
  105. 제54항 및 제57항 내지 제104항 중 어느 한 항에 있어서, 비-바이러스 전달 시스템이 특이적 조직 또는 세포 유형으로 표적화된 것인 조성물.
  106. 제105항에 있어서, 특이적 조직 또는 세포 유형이 골수, HSC, 상피 세포, 간 세포, 안구 세포, 근육 세포, 또는 T 세포인 조성물.
  107. 제57항 내지 제104항 중 어느 한 항에 있어서, 비-바이러스 전달 시스템이 지질 나노입자, 리포솜, 폴리펩티드 나노입자, 실리카 나노입자, 금 나노입자, 중합체성 나노입자, 덴드리머, 또는 양이온성 나노에멀젼인 조성물.
  108. 제1항 내지 제107항 중 어느 한 항의 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 유전자 발현을 필요로 하는 대상체에서 유전자를 발현하는 방법.
  109. 제1항 내지 제107항 중 어느 한 항의 조성물을 세포에 전달하여, 그에 의해 세포에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 세포에서 유전자를 발현하는 방법.
  110. 제1항 내지 제107항 중 어느 한 항의 조성물을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 제1항 내지 제107항 중 어느 한 항의 조성물을 사용하는 방법.
  111. 제1항 내지 제107항 중 어느 한 항의 조성물을 대상체에게 전달하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법.
  112. 제111항에 있어서, 질환 또는 병태가 유전 질환 또는 병태인 방법.
  113. 제111항에 있어서, 질환 또는 병태가 유전적 유전 질환 또는 병태인 방법.
  114. 제111항에 있어서, 질환 또는 병태가 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 B, 색소성 망막염, 뒤시엔느 근이영양증, 낭성 섬유증, 또는 암인 방법.
  115. 제108항 내지 제114항 중 어느 한 항에 있어서, 하나 이상의 트랜스진이 표적 세포의 게놈에 통합되는 것인 방법.
  116. 제115항에 있어서, 하나 이상의 트랜스진이 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 6개월, 적어도 1년 동안, 또는 대상체의 평생 동안 안정적으로 발현되는 것인 방법.
  117. 제1항 내지 제107항 중 어느 한 항의 조성물의 유효량을 대상체에게 투여하여, 그에 의해 대상체에서 하나 이상의 트랜스진을 발현하는 것을 포함하는, 면역 반응의 도출을 필요로 하는 대상체에서 면역 반응을 도출하는 방법.
  118. 제117항에 있어서, 대상체가 암을 갖고, 하나 이상의 트랜스진이 종양 항원을 코딩하는 것인 방법.
  119. 제117항에 있어서, 대상체가 감염성 질환을 갖거나 걸릴 위험이 있고, 하나 이상의 트랜스진이 감염성 질환과 연관된 항원을 코딩하는 것인 방법.
  120. 제108항 내지 제119항 중 어느 한 항에 있어서, 조성물이 국부적으로 또는 전신적으로 전달되는 것인 방법.
  121. 제120항에 있어서, 조성물이 주사에 의해, 흡입에 의해, 정맥내로, 복강내로, 피하로, 근육내로, 경구로, 비강내로, 폐 투여에 의해, 경피로, 경점막으로, 또는 종양내로 전달되는 것인 방법.
  122. 제1항 내지 제107항 중 어느 한 항의 조성물에서 사용하기 위한, 5' UTR, 하나 이상의 레트로바이러스 Pol 폴리단백질 성분을 코딩하는 핵산 서열, 및 3' UTR을 포함하며, 여기서 Pol 폴리단백질 성분의 발현은 인라인 gag 유전자로부터의 번역 미끄러짐을 필요로 하지 않는 것인 하나 이상의 핵산 주형.
  123. 제1항 내지 제107항 중 어느 한 항의 조성물에서 사용하기 위한, 5' UTR, gag-pol 유전자를 코딩하는 핵산 서열, 및 3' UTR을 포함하는 하나 이상의 핵산 주형.
  124. 제123항에 있어서, gag-pol 유전자가 프레임시프트 돌연변이를 포함하는 것인 하나 이상의 핵산 주형.
  125. 제1항 내지 제107항 중 어느 한 항의 조성물에서 사용하기 위한, 5' UTR, gag-pol 유전자를 코딩하는 핵산 서열, 및 3' UTR을 포함하며, 여기서 gag-pol 유전자는 매트릭스 단백질을 코딩하지 않는 것인 하나 이상의 핵산 주형.
  126. 제122항 내지 제125항 중 어느 한 항에 있어서, NC, CA, MA, p6, Vif, Tat, Nef, Vpr 및 Vpu로부터 선택된 하나 이상의 부속 단백질을 코딩하는 핵산 서열을 추가로 포함하는 핵산 주형.
  127. 제122항 내지 제126항 중 어느 한 항에 있어서, Pol 폴리단백질 성분 및/또는 부속 단백질이 인간 면역결핍 바이러스 (HIV), 시미안 면역결핍 바이러스 (SIV), 비스나/메디 바이러스 (VMV), 염소 관절염-뇌염 바이러스 (CAEV), 말 감염성 빈혈 바이러스 (EIAV), 고양이 면역결핍 바이러스 (FIV), 소 면역결핍 바이러스 (BIV), 인간 포말상 바이러스 (HFV), 뮤린 백혈병 바이러스 (MLV), 몰로니 뮤린 백혈병 바이러스 (MoLV), 프렌드 바이러스 (FV), 아벨슨 뮤린 백혈병 바이러스 (A-MLV), 뮤린 줄기 세포 바이러스 (MSCV), 마우스 유선 종양 바이러스 (MMTV), 몰로니 뮤린 육종 바이러스 (MoMSV), 라우스 육종 바이러스 (RSV), 후지나미 육종 바이러스 (FuSV), FBR 뮤린 골육종 바이러스 (FBR MSV), 조류 골수구종증 바이러스-29 (MC29), 조류 적혈모구증 바이러스 (AEV), 인간 T-세포 백혈병 바이러스 (HTLV), 프렌드 MLV (FrMLV), 조류 육종 바이러스 (ASV), 조류 백혈증 바이러스, 조류 골수모세포증 바이러스, UR2 육종 바이러스, Y73 육종 바이러스, 야그지크테 양 레트로바이러스, 랑구르 바이러스, 메이슨-화이자 원숭이 바이러스, 다람쥐 원숭이 레트로바이러스, 조류 암종 밀 힐 바이러스 2, 소 백혈병 바이러스, 영장류 T-림프친화성 바이러스 1, 영장류 T-림프친화성 바이러스 2, 영장류 T-림프친화성 바이러스 3, 외사시 진피 육종 바이러스, 외사시 표피 과다형성 바이러스 1, 외사시 표피 과다형성 바이러스 2, 병아리 합포체 바이러스, 고양이 백혈병 바이러스, 핀켈-비스키스-진킨스 뮤린 육종 바이러스, 가드너-아른스테인 고양이 육종 바이러스, 긴팔원숭이 유인원 백혈병 바이러스, 기니피그 유형-C 종양 바이러스, 하디-주커맨 고양이 육종 바이러스, 하비 뮤린 육종 바이러스, 키르스텐 뮤린 육종 바이러스, 코알라 레트로바이러스, 몰로니 뮤린 육종 바이러스, 돼지 유형-C 종양 바이러스, 망상내피증 바이러스, 스나이더-테일렌 고양이 육종 바이러스, 트래거 오리 비장 괴사 바이러스, 바이퍼 레트로바이러스, 양털 원숭이 육종 바이러스, 젬브라나병 바이러스, 푸마 렌티바이러스, 소 포말상 바이러스, 말 포말상 바이러스, 고양이 포말상 바이러스, 갈색큰갈라고 프로시미안 포말상 바이러스, 보르네오 오랑우탄 시미안 포말상 바이러스, 중앙 침팬지 시미안 포말상 바이러스, 시노몰구스 마카크 시미안 포말상 바이러스, 동부 침팬지 시미안 포말상 바이러스, 그리벳 시미안 포말상 바이러스, 게논 시미안 포말상 바이러스, 일본 마카크 시미안 포말상 바이러스, 레서스 마카크 시미안 포말상 바이러스, 거미 원숭이 시미안 포말상 바이러스, 다람쥐 원숭이 시미안 포말상 바이러스, 타이완 마카크 시미안 포말상 바이러스, 서부 침팬지 시미안 포말상 바이러스, 서부 로랜드 고릴라 시미안 포말상 바이러스, 흰술귀 마모셋 시미안 포말상 바이러스, 또는 노랑가슴 카푸친 시미안 포말상 바이러스로부터의 Pol 폴리단백질 성분 및 부속 단백질에 기초한 것인 핵산 주형.
  128. 제122항 내지 제127항 중 어느 한 항의 핵산 주형을 시험관내에서 전사하는 것을 포함하는, RNA 분자를 생산하는 방법.
  129. 제1항 내지 제107항 중 어느 한 항의 조성물 또는 제122항 내지 제127항 중 어느 한 항의 핵산 주형을 포함하는 하나 이상의 컨테이너를 포함하는 키트.
KR1020237005223A 2020-07-17 2021-07-16 유전 장애를 위한 핵산 치료제 KR20230040353A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063053474P 2020-07-17 2020-07-17
US63/053,474 2020-07-17
PCT/US2021/042015 WO2022016077A1 (en) 2020-07-17 2021-07-16 Nucleic acid therapeutics for genetic disorders

Publications (1)

Publication Number Publication Date
KR20230040353A true KR20230040353A (ko) 2023-03-22

Family

ID=77519749

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237005223A KR20230040353A (ko) 2020-07-17 2021-07-16 유전 장애를 위한 핵산 치료제

Country Status (10)

Country Link
US (1) US20220096525A1 (ko)
EP (1) EP4182332A1 (ko)
JP (1) JP2023535381A (ko)
KR (1) KR20230040353A (ko)
CN (1) CN116171326A (ko)
AU (1) AU2021308688A1 (ko)
BR (1) BR112023000784A2 (ko)
CA (1) CA3184980A1 (ko)
IL (1) IL299446A (ko)
WO (1) WO2022016077A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024201067A1 (en) * 2023-03-31 2024-10-03 Dawn Therapeutics Limited Transfection system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050048652A1 (en) * 2003-08-19 2005-03-03 Iowa State University Research Foundation, Inc. Retroelement vector system for amplification and delivery of nucleotide sequences in plants
US7404969B2 (en) 2005-02-14 2008-07-29 Sirna Therapeutics, Inc. Lipid nanoparticle based compositions and methods for the delivery of biologically active molecules
HUE056773T2 (hu) 2009-06-10 2022-03-28 Arbutus Biopharma Corp Továbbfejlesztett lipid készítmény
WO2012156839A2 (en) * 2011-05-19 2012-11-22 Ospedale San Raffaele S.R.L. New generation of splice-less lentiviral vectors for safer gene therapy applications
KR20180002636A (ko) 2015-03-30 2018-01-08 그린라이트 바이오사이언시스, 아이엔씨. 리보핵산의 무세포 생산
WO2017083356A1 (en) * 2015-11-09 2017-05-18 Immune Design Corp. A retroviral vector for the administration and expression of replicon rna expressing heterologous nucleic acids
KR20230079463A (ko) 2016-04-06 2023-06-07 그린라이트 바이오사이언시스, 아이엔씨. 리보핵산의 무세포 생산
KR102571743B1 (ko) 2017-10-11 2023-08-29 그린라이트 바이오사이언시스, 아이엔씨. 뉴클레오시드 트리포스페이트 및 리보핵산 생산을 위한 방법 및 조성물

Also Published As

Publication number Publication date
CN116171326A (zh) 2023-05-26
JP2023535381A (ja) 2023-08-17
EP4182332A1 (en) 2023-05-24
AU2021308688A1 (en) 2023-02-16
WO2022016077A1 (en) 2022-01-20
US20220096525A1 (en) 2022-03-31
BR112023000784A2 (pt) 2023-03-28
CA3184980A1 (en) 2022-01-20
IL299446A (en) 2023-02-01

Similar Documents

Publication Publication Date Title
KR102712142B1 (ko) Cas-형질전환 마우스 배아 줄기 세포 및 마우스 및 이것의 용도
JP7463358B2 (ja) アデノ随伴ウイルスベクタープロデューサー細胞株
US20040219516A1 (en) Viral vectors containing recombination sites
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
AU2022204199A1 (en) Gene editing of deep intronic mutations
TWI232239B (en) Novel method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same
US11427931B2 (en) Mutant viral capsid libraries and related systems and methods
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
BRPI0613784A2 (pt) expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise
CN101208425A (zh) 产生复制缺陷型腺病毒的细胞系
AU2024202171A1 (en) Novel OMNI-50 CRISPR nuclease
US20050251872A1 (en) Lentiviral vectors, related reagents, and methods of use thereof
JP2021515575A (ja) ウイルスベクター産生系
EP3974524A1 (en) Dna vectors, transposons and transposases for eukaryotic genome modification
KR20210049133A (ko) 무혈청 배지에서 벡터 제조
US20240336936A1 (en) Methods and constructs for production of lentiviral vector
KR20210149702A (ko) 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도
CN112105389B (zh) 用于转染抵抗细胞类型的组合物
KR20240037192A (ko) 게놈 통합을 위한 방법 및 조성물
KR20230040353A (ko) 유전 장애를 위한 핵산 치료제
TW202229558A (zh) 用於同時基因活化的核酸構建體
KR20220139344A (ko) 신경변성 질환을 치료하기 위한 조성물 및 방법
WO2023062365A2 (en) Lentiviral vectors