KR20230074507A - 자가-표적화 발현 벡터 - Google Patents

자가-표적화 발현 벡터 Download PDF

Info

Publication number
KR20230074507A
KR20230074507A KR1020237012892A KR20237012892A KR20230074507A KR 20230074507 A KR20230074507 A KR 20230074507A KR 1020237012892 A KR1020237012892 A KR 1020237012892A KR 20237012892 A KR20237012892 A KR 20237012892A KR 20230074507 A KR20230074507 A KR 20230074507A
Authority
KR
South Korea
Prior art keywords
dna
motif
binding
vector
nucleic acid
Prior art date
Application number
KR1020237012892A
Other languages
English (en)
Inventor
폴 제임스 로쓰웰
미할 레기에비츠
토마스 안토니 제임스 에디
레오노르 막시모 퀸타네이로
Original Assignee
터치라이트 아이피 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 터치라이트 아이피 리미티드 filed Critical 터치라이트 아이피 리미티드
Publication of KR20230074507A publication Critical patent/KR20230074507A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/532Closed or circular
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Control Of Electric Motors In General (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Toilet Supplies (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 다수의 응용에서 사용될 수 있는 신규한 핵산 분자 및 이를 제조하는 방법에 관한 것이다. 이러한 핵산 분자는 바람직하게는 DNA 벡터, 선택적으로, DNA 발현 벡터이다. 핵산 분자는 핵산 분자 자체 내에 하나 이상의 특정한 결합 모티프가 존재하기 때문에 핵과 같은 특정한 세포 위치로 벡터를 표적화할 수 있다. 따라서, 본 발명의 핵산 분자는 또한 표적화 전달 벡터, 특히 자가-표적화 전달 벡터(self-targeted delivery vector) 또는 스마트 전달 벡터로서 기술될 수 있다.

Description

자가-표적화 발현 벡터
본 발명은 다수의 응용에서 사용될 수 있는 신규한 핵산 분자 및 이를 제조하는 방법에 관한 것이다. 이러한 핵산 분자는 바람직하게는 DNA 벡터, 선택적으로, DNA 발현 벡터이다. 이 핵산 분자는 핵산 분자 자체 내에 하나 이상의 특정한 결합 모티프가 존재하기 때문에 핵과 같은 특정한 세포 위치로 벡터를 표적화할 수 있다. 따라서, 본 발명의 핵산 분자는 또한 표적화 전달 벡터, 특히 자가-표적화 전달 벡터(self-targeted delivery vector) 또는 스마트 전달 벡터로서 기술될 수 있다. 따라서, 이러한 구조체(construct)는 그들이 발현이 요구되는 위치로 페이로드(payload)를 효과적으로 전달할 수 있으므로 표적화(targeting)하는 것으로 기술될 수 있다. 본 발명은 또한 벡터를 제조하는 독특한 방법에 관한 것이다. 본 발명의 벡터는 폐쇄형, 즉, 유리 말단이 없는 것일 수 있거나, 또는 말단 뉴클레오티드가 벡터 내에서 쌍을 형성하나, 상호 간에 연결되지 않는 것인 개방형일 수 있다. 벡터가 원하는 위치를 표적화될 수 있게 하는 적어도 하나의 "점착성 말단(sticky end)"을 갖는 벡터가 실제적으로 개시된다.
비정상적인 유전자를 보충하거나 또는 교정하거나 유익한 단백질을 제조하는 등 다수의 이유로 유전 물질을 세포에 도입하는 것이 목표이다. 돌연변이 유전자가 필수 단백질의 부재 또는 돌연변이를 유발하는 경우, 세포 기능을 회복시키기 위해 해당 유전자의 정상 카피를 도입하는 것이 바람직하다. 또한, 펩티드가 아닌 활성 RNA 엔티티(entity)를 코딩하는 유전 물질의 도입이 바람직하다.
유전자와 같은 유전 물질은 일반적으로 치료에 직접 적용되지 않는다. 유전 물질은 세포로의 전달을 위해 벡터 내에 포함된다. 유전 물질을 세포로 전달하는 것은 여러 가지 방법으로 수행할 수 있다. 일부 바이러스가 세포를 감염시켜 유전 물질을 전달할 수 있기 때문에 종종 벡터로 사용된다. 네이키드(naked) DNA 또는 DNA 복합체(비-바이러스 벡터)도 사용된다.
비-바이러스 벡터는 바이러스 벡터에 비해 대규모 생산 및 낮은 숙주 면역원성과 같은 특정한 잇점을 제공한다. 그러나, 플라스미드와 같은 비-바이러스성 벡터는 더 낮은 수준의 형질감염 및 발현, 및 따라서, 더 낮은 효능을 가져올 수 있다. 플라스미드와 같은 전통적인 비-바이러스성 벡터는 또한 박테리아에서 증폭될 수 있으며, 이는 하기에서 보다 상세하게 논의되는 바와 같이 유전 물질의 오염 가능성이 있다는 것을 의미한다.
플라스미드 및 미니-서클(mini-circle)과 같은 비-바이러스성 벡터는 주요 전달 장애물, 특히, 핵산을 정확한 세포에 전달하고, 핵산을 세포 내로 전달하고, 필요에 따라, 핵 또는 기타 세포 내 위치에 전달하는 방법에 직면할 수 있다. 세포외 기질, 엔도솜/리소솜 환경, 엔도솜 막 및 핵 외피를 포함한, 유전 물질을 세포로 효율적으로 전달하기 위한 많은 장벽이 존재한다.
핵 수송(nuclear import)은 진핵 세포에서 유전자 발현에 대한 매우 잘 알려진 병목 현상(bottleneck)이며 형질감염된 DNA의 비교적 작은 비율이 핵 내로 전위된다.
핵 국재화 신호 또는 서열 (nuclear localization signal or sequence: NLS)과 같은 펩티드로 비-바이러스성 벡터를 태깅하는 것을 포함한, 다양한 전략이 이용되었다. 이중체 DNA 핵 표적화 서열(duplexed DNA nuclear targeting sequence: DTS)의 이용은 또한 벡터를 핵에 국재화시키는 능력을 증가시켰지만 이들은 이중체 내에 포함되며 본원에 기재된 바와 같은 결합 모티프가 아니다. 또한, DNA는 표적화를 시도하기 위해 표면 관능화(surface functionalization)를 갖는 리포솜과 복합체화되었다. 리포솜의 사용은 양이온성 지질의 독성으로 인해 전신 전달을 허용할 수 없기 때문에, 제한이 없지 않다.
표적화 전달 시스템(targeted delivery system)은 통상적으로 목적 DNA, 다가 양이온(polycation), 일반적으로 폴리라이신 또는 양이온성 지질, 및 상기 다가 양이온에 접합된 표적 리간드를 포함한다. 그러나, DNA가 순환 동안 표적화 리간드로부터 분리될 가능성이 있다. 또한, DNA의 활성을 유지하면서 기능성 도메인을 DNA에 직접 접합시킬 필요가 있다. 예를 들어, NLS가 플라스미드와 접합되었을 때 플라스미드의 핵 흡수가 상당히 증가한 것으로 입증되었다. 그러나, 이용된 접합(conjugation) 방법으로 인해 플라스미드는 접합 후 발현 활성을 상실했다(Sebestyen et al, Natl. Biotech., 16(1998), pp. 80-85). 따라서, 접합은 DNA의 발현 감소를 초래할 수 있다.
화학적 표적화 전달(chemically targeted delivery)의 추가적 제공은 바이러스 유래 ITR을 포함하는 DNA 벡터의 특징이다. 예를 들어, WO2019/143885에 기술된 캡시드-불포함 AAV 벡터는 ITR 서열과 같은 바이러스 유래 서열을 포함하고, WO2019/051289에 기술된 지질 나노입자 전달 시스템을 사용하여 전달된다. 유사하게, WO2019/246544는 DNA 벡터를 표적화하기 위해 보조제(secondary agent)에 의존하는 바이러스 유래 ITR을 갖는 벡터를 기술한다.
표적화하지 않으며, 원하는 목적지에 도달하기 전에 많은 것이 손실되기 때문에 원하는 효과를 보장하기 위해 훨씬 더 많은 양의 벡터가 필요하다. 따라서, 제공되는 벡터의 양을 줄일 수 있는 것이 바람직하다.
그러나, 펩티드 및 실제로 단백질 및 기타 소분자로 DNA를 태깅하는 것은 어려울 수 있으며 벡터가 추가 엔티티를 포함한다는 것을 의미한다. 표적화를 위해 벡터에 추가 엔티티를 태깅할 필요 없이 특이적 표적화를 허용하는 "올인원(all in one)" 또는 최소 솔루션을 제공하는 것이 훨씬 더 바람직할 것이다. 따라서, 표적화 전달을 위한 단일 단위가 매력적이다.
바이러스 게놈에서 유래된 유전자 전달 벡터와 같이 당업계에서 전형적으로 사용되는 핵산 분자는 면역계가 순환하는 "외래" DNA를 인식할 수 있기 때문에 유전자 전달 벡터의 수용자에서 면역 반응을 유도할 수 있기 때문에 문제가 될 수 있다. 이러한 유전자 전달 벡터는 역 말단 반복부(inverted terminal repeat: ITR)와 같은 바이러스 서열을 가질 수 있으며, 이는 선천적 면역계를 자극할 수 있고 또한 벡터로부터의 발현을 억제하는 DNA 복구(repair) 효소를 동원할 수 있다. DNA가 박테리아 세포에서 생산되는 경우, 진핵생물 개체 내에서 이질적인 것으로 식별되어 유사하게 거부될 수 있는 DNA 메틸화의 원핵생물 패턴을 가질 것이다. 예를 들어, 플라스미드(pDNA)는 자연적으로 발생하는 원형 dsDNA 분자이며, 한 세대에서 다음 세대로 안정적으로 유전되는 별도의 염색체 DNA 단편이다. 플라스미드 및 그 유도체는 다양한 정도의 성공으로 유전자 전달 벡터로 사용되었다.
핵산 벡터를 생산하는 방법도 문제가 될 수 있다. 박테리아 세포 내에서 핵산 구조를 제조하면 최종 생성물이 지질다당류(LPS), 내독소 및 기타 원핵생물-특이적 분자로 오염될 위험이 있다. 이들은 실질적으로 미생물 병원체의 지표이기 때문에, 진핵생물 개체에서 면역 반응을 일으킬 수 있다. 실제로, 세포-기반 시스템 내에서 핵산 벡터를 제조하면 숙주 세포의 게놈 물질을 포함한, 최종 생성물 내에 존재하는 세포 배양물로부터의 오염 물질의 위험이 있다. 세포 내에서 핵산을 생산하는 것은 합성 방법보다 핵산을 생산하기 위해 더 많은 물질을 공급해야 하기 때문에 비효율적이다. 비용 문제 외에도, 세포 배양물의 사용은 많은 경우 증폭 과정의 재현성에 어려움을 줄 수 있다. 세포의 복잡한 생화학 환경에서, 원하는 핵산 생성물의 품질과 수율을 제어하는 것은 어렵다. 핵산이 증폭되는 세포에 독성이 있을 수 있는 염기서열을 다루는 것도 어렵다. 재조합 사건(recombination event)도 목적 핵산의 정확한 생산에 문제를 일으킬 수 있다.
DNA는 세포를 사용하지 않고 합성적으로 생산될 수 있다. 올리고뉴클레오티드는 변형된 뉴클레오티드를 사용하여 사슬의 연장에 의해 화학적으로 합성될 수 있다. 이러한 빌딩 블록(building block)의 제조는 비용을 수반한다. 각 뉴클레오티드의 단계적 첨가는 불완전한 과정이며(각 사슬이 연장될 가능성을 '커플링 효율(coupling efficiency)'이라고 함), 더 긴 서열의 경우, 개시된 사슬의 대부분이 전장의 정확한 생성물이 되지 않을 것이다. 이것은 긴 서열의 대규모 생산을 배제한다- 이러한 공정에 대해, 길이, 정확도 및 규모 사이에 항상 희생이 있어야 한다. 이러한 올리고뉴클레오티드의 주요 용도는 여전히 낮은 수백 뉴클레오티드 범위이며(예를 들면, 프라이머 및 프로브), 최대 정확한 길이는 약 300개 뉴클레오티드 길이로 생각된다. 일반적으로, 합성 올리고뉴클레오티드는 길이가 약 15-25개 염기인 단일-가닥 핵산 분자이다.
합성 공정에 대한 바람직한 대안은 주형에 의존하는, 핵산의 효소적 생산이다. 핵산 합성을 위한 무세포, 인 비트로 효소 공정은 숙주 세포의 사용에 대한 요구를 피하므로, 특히 GMP(Good Manufacturing Practices) 표준에 따른 생산이 요구되는 경우 유리하다. 결과적으로, 효소에 의해 생산된 핵산은 세포-유래 오염물의 위험 없이 훨씬 더 효율적으로 제조될 수 있다.
따라서, 더 안전하고 수용자에 의한 허용성이 더 높고, 이상적으로는 세포 내에서 즉각적인 분해에도 저항성이 있는 효소에 의해 생산되고 개선된 구조체가 요구된다. 또한, 이러한 개선된 구조체가 표적화하는 경우, 예를 들어, 특정 조직 또는 세포 유형, 또는 핵을 포함한 세포 내의 특정 위치를 향하여 구조체를 지향시킬 수 있는 경우 바람직하다. 원하는 위치를 향해 벡터를 표적화하는 것이 유전자 치료 등의 목표이다. 대안적으로, 특정한 박테리아 세포를 표적화하는 것은 특정한 세포 유형 내에서 살균제의 발현을 허용할 수 있다. 진균 또는 원생생물과 같은 다른 미생물에 대해서도 유사한 접근법을 취할 수 있다.
본 발명은 구체적으로, 표적화 핵산 구조체를 효율적이고 효과적으로 제조하기 위한 신규한 무세포 및 인 비트로 방법 및 표적화 구조체 자체에 관한 것이다.
이용가능한 기술은 실질적으로 DNA로부터 제조된 합성 표적화 구조체/벡터를 개시하지 않으며 그러한 구조체를 제조하는 방법을 기술하지도 않는다.
발명의 요약
본 발명은 본원 전체에서 구조체(construct)로도 불리는, 표적화 벡터에 관한 것이다. 표적화 벡터는 또한 표적화 전달 벡터(targeting delivery vector)로 지칭될 수 있다. 표적화 벡터는 바람직하게는 DNA 벡터 또는 DNA와 RNA의 하이브리드이다. 벡터는 이중체 핵산(duplexed nucleic acid)의 일부를 포함한다. 표적화 벡터는 바람직하게는 발현 벡터이다. "발현"을 위한 유전 물질이 이중체에 포함될 수 있다. 이중체 섹션은 각 말단에서 캡핑된다. 이러한 캡은 이중체와 완전히 연속적일 수 있으며, 즉, 캡핑된 말단은 폐쇄된 말단이거나, 또는 이중체의 하나의 가닥과만 연속적이고, "비-연속적(non-continuous)" 가닥의 말단 뉴클레오티드 사이에 닉(nick) 또는 더 큰 갭(gap)을 포함할 수 있다. 벡터는 연속적이거나(공유 결합에 의해 폐쇄된) 또는 불연속적인(닉 또는 갭을 포함하는) 단일 가닥의 핵산으로 구성될 수 있다. 일부 구체예에서, 하나의 캡핑된 말단에 단일 갭이 존재하거나 또는 단지 닉이 존재한다. 벡터는 적어도 하나의 캡핑된 말단에 적어도 하나의 구조 모티프(structural motif)를 포함한다. 구조 모티프는 벡터를 표적화하거나, 가이드하거나 또는 안내할 수 있는 적어도 하나의 결합 모티프를 포함한다. 벡터는 바람직하게는 합성이고 효소적으로 무세포 방식으로 제조된다.
벡터의 표적은 바람직하게는 세포이다. 세포 표적은 세포와 연관된 표적이다. 표적은 세포 또는 세포 위치(즉, 핵)의 표적화를 가능하게 하는 세포 위 또는 세포 내의 임의의 적절한 엔티티(entity)일 수 있다. 따라서, 본원에서 사용되는 표적화(targeting)는 핵산이 비-표적 세포 또는 표적 세포 위치에 우선하여 표적 세포로 전달되어 발현 수준을 보조할 수 있게 하는 것이다.
따라서, 이중체가 양 말단에서 캡핑된 것을 특징으로 하는, 이중체 섹션을 포함하는 표적화 DNA 벡터로서, 상기 이중체의 적어도 하나의 말단은 구조 모티프로 캡핑되고, 상기 구조 모티프는 적어도 하나의 결합 모티프를 포함하는 것인 표적화 DNA 벡터를 제공한다.
표적화 DNA 벡터는 전달 벡터일 수 있다. 상기 벡터는 원하는 표적 세포 또는 세포 내 원하는 표적 위치로 전달될 수 있다.
독립적으로, 벡터는 하기 선택적(optional) 특징 중 하나 이상을 포함할 수 있다:
듀플렉스 DNA는 동일하거나 상이할 수 있는 구조 모티프로 양쪽 말단에 캡핑될 수 있다.
각각의 캡핑된 말단은 독립적으로 공유적으로 폐쇄될 수 있고, 즉 이중체 DNA와 연속적일 수 있거나, 또는 개방될 수 있으며, 즉 닉 또는 갭을 포함할 수 있다.
이중체 DNA는 일 말단에서 구조 모티프로 독립적으로 캡핑되고, 제2 말단에서 헤어핀, T자형 헤어핀, 스템 루프, 루프, 벌지(bulge), 또는 십자형으로 캡핑될 수 있다.
구조 모티프는 동일하거나 상이할 수 있는 다수의 결합 모티프를 포함할 수 있다. 구조 모티프는 동일하거나 상이할 수 있는 3개 이상의 결합 모티프와 같은 결합 모티프의 어레이를 포함할 수 있다. 따라서 어레이는 결합 모티프의 멀티플렉스(multiplex)일 수 있다.
결합 모티프는 벡터의 표적화 전달을 담당한다. 결합 모티프는 세포 표적(cellular target)에 결합한다. 결합 모티프는 세포 표적에 대한 결합을 허용하는 형태(conformation)를 형성한다.
결합 모티프는 하기 중 하나 이상에 있는 표적에 결합할 수 있다:
(i) 세포 표면;
(ii) 핵 외피;
(iii) 핵 수송 시스템;
(iv) 세포 구획(cellular compartment)
(v) 핵 성분(nuclear component);
(vi) 세포질 봉입물(cytoplasmic inclusion); 및/또는
(vii) 세포질 단백질 또는 펩티드.
결합 모티프가 핵 표적화를 가능하게 하는 것이 바람직할 수 있다. 따라서 결합 모티프는 일반적으로 세포의 핵으로 수송되는 엔티티(entity)에 대해 특이적일 수 있다. 그러한 엔티티는 히스톤, 뉴클레올린(nucleolin), 텔로미어 결합 단백질 등을 포함한다.
결합 모티프는 DNA 복구 효소를 동원하는 공지된 부위가 포함되지 않도록 설계되는 것이 바람직할 수 있다. 대표적인 부위로는 바이러스 ITR이 있다.
결합 모티프는 결합 모티프의 결합 특이성을 담당하는 것이 형태, 또는 형태 및 주요/특이적 잔기 및/또는 서열의 형태의 조합이 되도록 설계되는 것이 바람직할 수 있다.
의심의 여지를 없애기 위해, 본원에서 사용된 결합 모티프는 이중 가닥 DNA에 존재하는 컨센서스(consensus) 서열이 아니다. 대표적인 컨센서스 서열 부위는 제한 엔도뉴클레아제 부위, 메틸트랜스퍼라아제 및 전사 인자이다. 그러한 것은 특정한 형태를 필요로 하지 않는다. 결합은 1차 서열이 아닌 구조에 의해 결정된다.
선택적으로, 결합 모티프는 역 말단 반복부(internal terminal repeats) 등과 같은 바이러스 유래 게놈 서열로부터 유래되지 않는다.
특히, 결합 모티프가 구조 모티프 내에 있고, 효과적으로 단일 가닥으로 제공된다는 것이 본원에 제시된다. 결합 모티프가 상보적인 서열과 함께 존재하는 경우, 이는 잠재적인 이중 가닥 간섭을 초래할 수 있다. 이 시나리오에서, 이중체 또는 이중 가닥 서열의 형성은 바람직하지 않은 결합 모티프의 형태의 형성과 경쟁할 것이다. 결합 모티프가 상보적인 서열과 함께 존재하는 경우, 각 결합 모티프는 센스 및 안티센스 버전으로 존재할 것이며, 따라서 이중체를 형성할 수 있다. 따라서, 결합 모티프를 이중체 섹션보다, 구조 모티프 내에 포함시키는 것이 바람직하다.
벡터는 또한 하기 중 하나 이상에 결합할 수 있는 추가적인 결합 모티프를 포함할 수 있다:
(i) 펩티드 또는 단백질;
(ii) 소분자;
(iii) 항체 또는 그의 유도체;
(iv) 효소;
(v) 면역자극제;
(vi) 효능제(agonist) 또는 길항제;
(vii) 아쥬번트 및/또는
(viii) 핵산.
그러한 결합 모티프는 표적화를 담당하는 결합 모티프와 구별될 수 있다. 따라서, 이것은 벡터에 추가적 기능성(functionality)을 제공하기 위해 벡터에 제공되는 추가적인 결합 모티프이다.
표적화 벡터는 진핵 세포, 선택적으로 식물 세포, 원생생물 세포, 진균 세포, 인간 세포 또는 비-인간 동물 세포 내에 또는 그 위에 존재하는 세포 표적에 지향될 수 있다. 표적 엔티티는 임의의 적합한 세포 표적일 수 있다.
표적화 벡터는 박테리아 세포와 같은 원핵 세포 위에 또는 내에 존재하는 세포 표적으로 지향될 수 있다. 선택적으로, 상기 세포는 그람 음성 또는 그람 양성 박테리아 세포이다. 표적 벡터는 결합 모티프의 특이적 결합에 의해 표적으로 전달된다.
결합 모티프(들)에 의해 벡터가 세포 핵으로 전달되는 것이 바람직할 수 있다. 표적은 히스톤, 뉴클레올린 및/또는 텔로미어 결합 단백질일 수 있다.
이중체 DNA는 유전자 서열 또는 그의 단편 및 선택적으로, 프로모터를 포함할 수 있다. 프로모터는 유전자 서열 또는 그의 단편에 작동가능하게 연결될 수 있다.
표적화 벡터는 표적화 발현 벡터일 수 있다.
표적화 벡터는 변형된 뉴클레오티드, 선택적으로 캡핑된 말단(capped ends)에 변형된 뉴클레오티드를 포함할 수 있다.
표적화 벡터는 실질적으로 순수한 DNA, 선택적으로 95% DNA(중량 기준)일 수 있다.
표적화 벡터는 DNA/RNA 하이브리드일 수 있다.
구조 모티프는 구조 모티프의 서열에서 뉴클레오티드 염기 사이의 수소 결합의 형성을 허용할 수 있고, 선택적으로, 상기 뉴클레오티드 염기 사이의 수소 결합은 왓슨-크릭(Watson-Crick) 염기쌍, 후그스틴(Hoogsteen) 염기쌍 또는 비-정규(non-canonical) 염기쌍 형성을 포함한다.
구조 모티프는 비-정규 DNA 구조를 형성하고, 하기 중 하나 이상을 포함할 수 있다:
a) 헤어핀(hairpin);
b) 크로스-암(cross-arm);
c) 삼중체(triplex);
d) G-삼중체;
e) G-사중체(quadruplex);
f) i-모티프;
g) 유사 매듭(pseudoknot);
h) 스템 루프; 및/또는
i) 벌지(bulge) 또는 루프.
결합 모티프가 취하는 구조 또는 형태는 구조 및/또는 서열-의존적 방식으로 표적과의 결합을 허용할 수 있다.
결합 모티프는 하기 중 하나 이상일 수 있다.
a) 압타머(aptamer);
b) G-사중체;
c) 촉매;
d) i-모티프 및/또는
e) 삼중 가닥 DNA.
결합 모티프는 특이적일 수 있다. 특이적이라는 것은 결합 모티프가 임의의 다른 엔티티에 우선하여 표적 엔티티에 선택적으로 결합한다는 것을 의미한다. 이것은 주로 그것이 형성하는 형태 때문이지만 특정한 또는 핵심 잔기의 존재를 포함할 수도 있다.
본 발명은 또한 본원에 기술된 바와 같은 벡터를 수용자(recipient)에게 투여하는 단계를 포함하는, DNA 벡터를 표적 세포 위치로 전달하는 방법에 관한 것이다. 수용자는 그것을 필요로 하는 인간 또는 동물일 수 있거나, 또는 인 비트로 세포, 조직 또는 기관일 수 있다. 따라서, 본 발명은 DNA 벡터를 표적 위치로 전달하기 위한 본원에 기재된 바와 같은 벡터의 용도로 확장된다.
본 발명은 또한 핵산 벡터를 제조하는 방법에 관한 것이다. 벡터는 본원에 기재된 바와 같을 수 있다.
상기 방법의 단계들은 하기를 포함할 수 있다:
(a) 핵산 주형을 제공하는 단계로서, 상기 핵산 주형은:
(i) 제1 구조 모티프에 인접한 제1 가공 모티프(processing motif),
(ii) 제1 구조 모티프,
(iii) 상기 이중체 DNA의 단일 가닥,
(iv) 제2 가공 모티프에 인접한, 제2 캡핑된 말단의 적어도 일부를 포함하는 제2 구조 모티프,
(v) 제2 가공 모티프를 포함하는 서열을 포함하고,
상기 가공 모티프는 절단 부위를 포함하는 엔도뉴클레아제에 대한 인식 부위를 포함하는 염기쌍 형성 섹션을 형성할 수 있는 서열을 포함하고,
상기 구조 모티프는 분자내 수소 결합을 형성할 수 있는 하나 이상의 서열을 포함하거나, 또는, 상기 제1 또는 제2 캡핑된 말단은 결합 모티프를 포함하는 구조 모티프를 포함하는 것인 단계;
(b) RCA(rolling circle amplification)가 가능한 폴리머라아제를 사용하여 상기 주형을 증폭하켜 단일 가닥 연쇄체(concatamer)를 생성시키는 단계;
(c) 상기 단일 가닥 연쇄체를 엔도뉴클레아제와 접촉시켜 단일 가닥 DNA 구조체를 방출시키는 단계로서, 3' 말단 뉴클레오티드는 상기 구조체의 단일 가닥 부분에 인접하여 염기 쌍을 형성한 것인 단계; 및
(d) 상기 단일 가닥 DNA 구조체를 폴리머라아제와 접촉시켜 상기 단일 가닥 DNA 중간체를 주형으로 사용하여 3' 말단 뉴클레오티드를 연장하여 이중체 섹션을 형성하는 단계.
이 방법의 증폭 부분은 프라이머의 사용을 필요로 하거나 프리마아제(primase) 또는 닉카아제(nickase) 효소를 사용하여 개시될 수 있다.
본원에 기술된 방법을 사용하면 캡핑된 말단 중 하나에 닉이 있거나(nicked) 또는 갭이 있는(gapped) 것인 벡터가 수득될 것이라는 것을 당업자는 이해할 것이다. 따라서, 캡핑된 말단 중 하나는 폐쇄된 말단이다. 양 말단에서 닉이 필요한 경우, 이는 닉카아제 효소를 사용하여 이를 달성할 수 있다.
5' 말단 뉴클레오티드는 또한 상기 구조체의 단일 가닥 부분에 염기 쌍을 이룰 수 있고, 폴리머라아제는 5' 말단 뉴클레오티드까지 이중체를 구성할 수 있다. 5' 뉴클레오타이드와 3' 뉴클레오타이드 사이의 닉은 그 후 적절하게 라이게이션될 수 있다.
상기 방법은 단계 (e) 닉 또는 갭을 공유적으로 폐쇄하기 위해 적합한 효소 또는 시약을 첨가하는 단계를 더 포함할 수 있다. 적합한 효소는 리가아제(ligase)일 수 있다.
주형 핵산은 캡핑된 말단을 형성하는 데 필요한 전체 서열보다 더 큰 캡핑된 말단의 부분을 포함할 수 있다. 이러한 경우, 그로부터 전사된 단일 가닥 생성물은 폴리머라아제 효소에 의해 연장되기 전에 닉카아제와 접촉될 수 있다. 닉카아제는 연장을 위해 적절한 3' 말단 뉴클레오티드를 노출시킬 수 있다.
도 1: 상이한 구조적 모티프, 및 따라서, 벡터의 우측에 있는 캡에 상이한 결합 모티프를 포함하는 벡터의 성능의 비교를 보여주는 그래프. 결합 모티프는 표적 단백질과 상호 작용하여 핵 수송 경로를 장악하고, 보고된 DNA의 핵 수송을 강화하도록 선택되었다; HEK293에서 테스트되었다. 이 실시예에서, 벡터는 완전히 공유결합으로 폐쇄되었다.
도 2: 중간 농도에서 형질감염된 캡 내에 단일 결합 모티프를 갖는 벡터의 성능을 보여주는 그래프; HEK293에서 테스트되었다.
도 3: 저농도에서 형질감염된 캡 내에 단일 결합 모티프를 갖는 벡터의 성능을 보여주는 그래프; HEK293에서 테스트되었다.
도 4: 중간 농도에서 형질감염된 캡 내에 단일 결합 모티프를 갖는 벡터의 성능을 보여주는 그래프; HepG2에서 테스트되었다.
도 5: 벡터가 모두 공유결합으로 폐쇄된 것인 본 발명의 벡터의 다양한 구체예를 도시한다. 상단에는 좌측 및 우측 말단 모두에 G-사중체(quadruplexes)를 갖는 벡터가 표시된다. 두 번째 벡터는 좌측 말단에 압타머 및 우측 말단에 상이한 압타머를 포함한다. 세 번째 구조는 일 말단에 G-사중체를 포함하고, 나머지 말단에 압타머를 포함한다. 네 번째 구조는 각 말단에 스템 루프(stem loop)를 포함하고, 상기 루프는 스템 구조에 의해 함께 유지되는 DNA의 단일 가닥이다. 이 경우, 루프는 GAA와 같은 간단한 트리뉴클레오티드일 수 있다.
도 6: 벡터가 공유결합에 의해 폐쇄되지 않고, 하나 이상의 닉(nick)을 포함하는 것인 본 발명의 다양한 구체예를 도시한다. 모든 예는 좌측 및 우측 말단에 G-사중체를 포함한다. 도시된 바와 같이, 닉은 이중체(duplex)의 양 말단 중 하나, 또는 이중체의 양 말단 모두에 존재할 수 있다.
도 7a: 본 출원의 실시예에서 사용된 예시적인 벡터를 도시한다. 상단에 있는 벡터는 일 말단에 복수의 스트렙타비딘 압타머를 포함하는 캡을 포함하고, 나머지 캡은 단순한 스템 루프 (루프의 GAA)인 것인 이중체화된 선형 벡터인 벡터의 단순화된 도시이다. 이 경우, 벡터는 공유결합에 의해 폐쇄된다. 또한, 프로모터 (EF1α), 유전자 (SEAP), 및 폴리A 신호(SV40)를 갖는, 벡터에 존재하는 발현 카세트가 도시된다. 이 경우, 벡터는 결합 모티프로서 단일 압타머를 갖는 캡핑된 말단으로서, 상기 압타머는 스트렙타비딘에 결합하는 것인 캡핑된 말단, 또는 4개의 스트렙타비딘 압타머를 포함하는 캡핑된 말단을 포함한다. 도 7b는 실시예에서 이용된 실험 프로토콜의 일부를 나타내고, 이 프로토콜에서 벡터는 스트렙타비딘-코팅된 플레이트에 2시간 30분 동안 노출되고, 그 후, 미결합 벡터는 세척에 의해 제거된다. 압타머가 없는 벡터가 대조군으로 이용된다.
도 8: 이 도면은 3개의 벡터를 이용한, 도 7b에 표시된 결합 실험의 그래프이다. 이 벡터들은 대조군 (압타머 불포함), 단일 압타머, 및 4개의 압타머를 포함하는 캡핑된 말단이다. 4개의 스트렙타비딘 압타머를 포함하는 벡터의 개선된 결합 능력이 표시되고, 단일 압타머에 대해서도 우수한 결합 결과가 수득된다. 대조군(압타머 불포함)은 특이적 결합을 나타내지 않고, 세척에 의해 제거된다. 그래프는 벡터의 농도 (nM) 대 결합된 DNA (RFU: relative fluorescence unit)의 플롯이다.
도 9: 이 도면은 실시예에서 제조되고 테스트된 벡터에 대해 이용된 다양한 대안적인 캡핑된 말단을 도시한다. 이용된 다양한 캡핑된 말단은 스템 루프, 압타머, G-사중체, 및 멀티플렉스-압타머(multiplex-aptamer)이다. 이 경우, 캡핑된 말단 모두가 (유전자의 센스 서열의 측면에서 볼 때) 벡터의 우측 말단에 포함되었으나, 당업자는 (좌측 또는 우측) 어느 "말단"이나 결합 모티프를 포함할 수 있다는 것을 이해할 것이다.
도 10: 본원에 기술된 방법의 일 구체예를 도시한다. 이중 가닥 주형 분자(1)가 표시된다. 삼각형은 이중 가닥 주형이 니킹되어 주형의 하나의 가닥만의 증폭을 개시할 수 있게 하는, 적절한 닉킹 부위(nicking site)를 나타낸다. 가공(processing) 모티프 (101) 및 구조 모티프 (103)를 코딩하는 서열이 표시된다. 이 경우, 구조 모티프는 3개의 성분을 포함한다: 구조적 스템을 형성하는 2개의 서열(105 및 106), 및 결합 모티프를 형성하는 중앙 서열 (107). 단일 가닥 형태가 되면, 가공 모티프가 형성되고 엔도뉴클레아제(가위 및 점선)와 같은 적절한 효소를 사용하여 가공할 수 있다(2). 가공이 완료되면(3), 분자는 폴리머라아제와 접촉하여 이중체를 채울 수 있으며, 이중체는 개방된 상태로 유지되거나(4) 리가아제에 의해 공유결합에 의해 폐쇄될 수 있다(5).
도 11: 실시예 5에서 사용된 주형의 도시이다.
도 12: 실시예 5에 상세히 기술된 바와 같이, 표적화 벡터를 생성하기 위해 본 발명의 방법을 사용한 결과를 보여주는 겔 사진이다.
도 13: 중간(moderate) 농도에서 형질감염된 단일 캡 내에 복수의 결합 모티프를 갖는 벡터의 성능을 보여주는 그래프; HEK293에서 테스트되었다.
도면의 상세한 설명
도 1은 캡에서 사용하기 위해 선택된 결합 모티프의 측면에서 다른 상이한 벡터로 형질감염된 HEK293 세포에서 벡터로부터의 정규화된(normalized) SEAP 발현(U/mL 배지)의 비교를 보여주는 그래프이다. 결합 모티프는 핵으로 수송되는(imported) 표적 단백질(히스톤 H4: H4_Gq 및 H4_sl, 뉴클레올린: nucl, 및 인간 텔로미어 G-사중체 인식 인자: hTel)과 상호작용하도록 선택되었다. 그래프는 사용된 벡터에 대한 결과(SEAP 발현(U/mL))를 보여주는 막대 차트이다.
도 2는 우측 말단에 단일 결합 모티프를 포함하는 벡터의 감소된 양으로 형질감염된 HEK293 세포에서 정규화된 SEAP 발현(U/mL 배지)을 나타내는 그래프이다. 결합 모티프는 인간 텔로미어 G-사중체 모티프였다. 캡핑된 말단을 갖는 벡터 0.4㎍에 0.5 ㎍의 경쟁자 벡터(SEAP 불포함)를 도핑(dope)했다. 그래프는 사용된 벡터에 대한 결과(SEAP 발현(U/mL))를 보여주는 막대 차트이다.
도 3은 우측 말단에 단일 결합 모티프를 포함하는 벡터의 감소된 양으로 형질감염된 HEK293 세포에서 정규화된 SEAP 발현(U/mL 발현)을 나타내는 그래프이다. 결합 모티프는 인간 텔로미어 G-사중체 모티프였다. 결합 모티프를 갖는 벡터 0.2 ㎍에 0.7㎍ 경쟁자 벡터(SEAP 불포함)를 도핑했다. 그래프는 사용된 벡터에 대한 결과(SEAP 발현(U/mL))를 보여주는 막대 차트이다.
도 4는 우측 말단에 단일 결합 모티프를 포함하는 벡터의 감소된 양으로 형질감염된 HepG2 세포에서 정규화된 SEAP 발현(U/mL 발현)을 나타내는 그래프이다. 결합 모티프는 인간 텔로미어 G-사중체 모티프였다. 결합 모티프를 갖는 벡터 0.4 ㎍에 0.5㎍ 경쟁자 벡터(SEAP 없음)를 사용했다. 그래프는 사용된 벡터에 대한 결과(SEAP 발현(U/mL))를 보여주는 막대 차트이다.
도 5: 벡터가 모두 공유결합으로 폐쇄된 것인 본 발명의 벡터의 다양한 구체예를 도시한다. 상단에는 좌측과 우측 말단에 모두 G-사중체를 갖는 벡터가 표시된다. 두 번째 벡터는 좌측 말단에 하나의 압타머, 및 우측 말단에 다른 압타머를 포함한다. 세 번째 구조는 일 말단에 G-사중체를 포함하고 나머지 말단에 압타머를 포함한다. 네 번째 구조는 각 말단에 스템 루프를 포함하며, 여기서 루프는 스템 구조에 의해 함께 유지되는 DNA의 단일 가닥이다. 모두는 DNA의 이중체 섹션과 구조적 모티프로부터 형성되고 결합 모티프를 포함하는 하나 이상의 캡핑된 말단을 포함하여, 벡터가 원하는 대로 표적화되거나 지향될 수 있게 한다.
도 6: 벡터가 공유적으로 폐쇄되지 않고 하나 이상의 닉 또는 갭을 포함하는 것인 본 발명의 다양한 구체예를 도시한다. 모든 예는 선형 이중체 섹션과 캡핑된 말단을 보여준다. 본원에 표시된 모든 예시적인 벡터는 좌측 및 우측 말단에 G-사중체를 포함한다. 닉(단순 백본 파손(break)) 또는 갭(이중체 섹션 중 단일 가닥의 하나 이상의 뉴클레오티드)이 도시된 바와 같이, 이중체의 일 말단(우측 또는 좌측) 또는 양 (우측 및 좌측) 말단에 존재할 수 있다.
도 7a: 본 출원의 실시예에서 사용된 예시적인 벡터를 도시한다. 상단에 있는 벡터는 일 말단에 복수의 스트렙타비딘 압타머를 포함하는 캡을 포함하고, 나머지 캡은 단순한 스템 루프 (루프의 GAA)인 것인 이중체 선형 벡터인 벡터의 단순화된 도시이다. 이 경우, 벡터는 공유결합에 의해 폐쇄된다. 또한, 프로모터 (EF1α), 유전자 (SEAP), 및 폴리A 신호(SV40)를 갖는, 벡터에 존재하는 발현 카세트가 도시된다. 이 경우, 벡터는 결합 모티프로서 단일 압타머를 갖는 캡핑된 말단으로서, 상기 압타머는 스트렙타비딘에 결합하는 것인 캡핑된 말단, 또는 4개의 스트렙타비딘 압타머를 포함하는 캡핑된 말단을 포함한다. 도 7b는 실시예에서 이용된 실험 프로토콜의 일부를 나타내고, 이 프로토콜에서 벡터는 스트렙타비딘-코팅된 플레이트에 2시간 30분 동안 노출되고, 그 후, 미결합 벡터는 세척에 의해 제거된다. 압타머가 없는 벡터가 대조군으로 이용된다. 그 후, 인터칼레이팅 형광단(intercalating fluorophore)가 검출 목적을 위해 상기 플레이트에 결합된 벡터에 결합하기 위해 이용된다.
도 8: 이 도면은 3개의 벡터를 이용한, 도 7b에 표시된 결합 실험의 그래프이다. 이 벡터들은 대조군 (압타머 불포함), 단일 압타머, 및 4개의 압타머를 포함하는 캡핑된 말단이다. 4개의 스트렙타비딘 압타머를 포함하는 벡터의 개선된 결합 능력이 표시되고, 단일 압타머에 대해서도 우수한 결합 결과가 수득된다. 대조군(압타머 불포함)은 특이적 결합을 나타내지 않고, 세척에 의해 제거된다. 그래프는 벡터의 농도 (nM) 대 결합된 DNA (RFU: relative fluorescence unit)의 플롯이다.
도 9: 이 도면은 실시예에서 제조되고 테스트된 벡터에 대해 이용된 다양한 대안적인 캡핑된 말단을 도시한다. 이용된 다양한 캡핑된 말단은 스템 루프, 압타머, G-사중체, 및 멀티플렉스-압타머(multiplex-aptamer)이다. 이 경우, 캡핑된 말단 모두가 (유전자의 센스 서열의 측면에서 볼 때) 벡터의 우측 말단에 포함되었으나, 당업자는 (좌측 또는 우측) 어느 "말단"이나 결합 모티프를 포함할 수 있다는 것을 이해할 것이다.
도 10: 본원에 기술된 방법의 일 구체예를 도시한다. 이중 가닥 주형 분자 (1)가 표시된다. 삼각형은 이중 가닥 주형이 니킹되어 주형의 하나의 가닥만의 증폭을 개시할 수 있게 하는, 적절한 닉킹 부위(nicking site)를 나타낸다. 가공 모티프 (101) 및 구조 모티프 (103)를 코딩하는 서열이 표시된다. 이 경우, 구조 모티프는 3개의 성분을 포함한다: 구조적 스템을 형성하는 2개의 서열(105 및 106), 및 결합 모티프를 형성하는 중앙 서열(central sequence) (107). 단일 가닥 형태 (2)가 되면, 가공 모티프 (201)가 형성되고 엔도뉴클레아제 (202)와 같은 적절한 효소를 사용하여 처리할 수 있다. 구조 모티프 (203)가 구조, 이 경우, G-사중체(207)가 개재된, (205)와 (206) 사이에 형성된 스템인 구조가 형성될 수 있게 허용된다는 것을 알 수 있다. 가공 (3) 후에, 분자는 폴리머라아제와 접촉하여 이중체를 채울 수 있으며(fill-in), 이중체는 (4)로 표시된 바와 같이, 개방된 상태로 유지되거나(닉(211)이 표시됨), (5)로 표시된 바와 같이, 라이게이션(213)을 통해 공유결합에 의해 폐쇄될 수 있다. 명료성을 높이기 위해, 한번에 단 하나의 말단이 표지되었으나, 표지들은 나머지 말단에도 동일하게 적용될 수 있다.
도 11은 실시예 5에서 사용된 주형의 도시로서, 닉킹 부위, 형태 모티프(conformational motif)에 인접한 가공 모티프, 목적 서열, 제2 가공 모티프에 인접한 제2 형태 모티프, 및 목적 서열에 유사한 크기의 백본을 포함한다. 백본에는 dsDNA만 절단할, 추가적인 엔도뉴클레아제 표적 부위가 있다.
도 12는 실시예 5에서 제2 가닥 합성 및 라이게이션에 의한 벡터의 생산을 나타내는 SafeView로 염색한 0.8% 아가로스 겔을 보여준다. 래인 1과 9는 Thermo Scientific Gene Ruler 1kb Plus DNA 사다리이다. 래인 2는 모든 효소가 결핍되고; 래인 3은 T4 DNA 리가제를 포함하며; 래인 4는 T4 DNA 리가제 및 T5 엑소뉴클레아제 정화(clean-up) 단계를 포함하고; 래인 5는 T4 DNA 폴리머라아제를 포함하며; 래인 6은 T4 DNA 폴리머라아제 및 T5 엑소뉴클레아제 정화 단계를 포함하고; 래인 7은 T4 폴리머라아제와 T4 리가아제를 모두 포함하며; 래인 8은 T4 폴리머라아제 및 T4 리가아제 및 T5 엑소뉴클레아제 단계를 포함한다.
도 13은 실시예 6에 기술된 바와 같이, 단일 말단에 복수의 구조화된 말단 모티프(structured terminal motif)를 포함하는 리포터 DNA로 형질감염된 HEK293 세포에서 정규화된 SEAP 발현(U/ml 배지)을 도시하는 그래프를 보여준다.
발명의 상세한 설명
본 발명은 자신을 원하는 세포 위치로 표적화하고 전달할 수 있는 벡터 제공의 필요성을 충족시킨다. 따라서, 벡터는 원하는 위치에 도달하기 위해 추가 지원이 필요하지 않기 때문에 표적화하는 것으로 기술될 수 있다. 원하는 위치는 조직 유형, 세포 유형, 및/또는 세포 내의 위치일 수 있다고 생각된다. 원하는 위치는 박테리아 또는 진균과 같은 병원체의 특정한 스트레인(strain)일 수 있다. 상기 세포는 생체내(in vivo) 또는 생체외(ex vivo) 또는 시험관내(in vitro)일 수 있다. 벡터는 벡터 내에, 특히 구조 모티프 내에 포함된 결합 모티프의 존재로 인해 표적화할 수 있다. 하나 이상의 결합 모티프가 포함되는 것이 바람직하다. 결합 모티프는 이중체 또는 선형 섹션보다는 캡핑된 말단에 존재하는 것이 바람직하다. 실험적으로, 본 발명자들은 복수의 결합 모티프의 포함이 훨씬 더 개선된 표적화를 가능하게 한다는 것을 입증하였다. 벡터는 이중체 핵산의 섹션을 포함하는 것으로 기술될 수 있으며, 이는 양 말단에서 캡핑된다. 이중체는 선형 섹션으로 기술될 수 있다. 캡은 동일하거나 다를 수 있다. 캡은 개방형(open-ended)이거나 또는 폐쇄형일 수 있다. 적어도 하나의 캡은 구조 모티프를 포함한다. 상기 구조 모티프는 구조를 취할 수 있다. 구조 모티프는 하나 이상의 결합 모티프를 포함한다. 결합 모티프는 함께 구조 모티프를 형성할 수 있거나, 구조 모티프는 하나 이상의 결합 모티프의 구조를 지지할 수 있다. 벡터는 캡핑된 말단이 동일하거나 각 말단이 다를 수 있다. 표적화를 위한 결합 모티프를 포함하기 위해 하나의 말단만 요구된다. 다른 말단은 소분자를 수송하는 것과 같은 다른 기능을 위한 결합 모티프를 포함할 수 있다. 따라서 벡터는 비대칭일 수 있다.
벡터는 원하는 세포 표적에 대한 결합 모티프(들)를 통한 특이적 결합에 의해 전달되도록 설계된다. 벡터는 DNA 손상 복구 경로 개시가 필요한 경우, 이는 벡터로부터의 발현을 감소시킬 수 있기 때문에 DNA 복구 효소를 동원하는 것으로 알려진 서열 및 구조를 피하도록 설계된다. 그러한 구조는 바람직하게는 제외되는 바이러스 ITR을 포함할 수 있다.
벡터
본 발명은 핵산 벡터, 바람직하게는 DNA 벡터에 관한 것이다. 핵산 벡터는 유전 물질이 복제 및/또는 발현될 수 있는 세포 내로 유전 물질을 운반하는 비히클(vehicle)로 정의될 수 있다. 유전 정보를 세포에 전달하는 벡터의 목적은 일반적으로 표적 세포에서 삽입물을 단리, 증식 또는 발현하는 것이다. 벡터는 RNA로의 전사 및/또는 단백질 발현을 위해 설계될 수 있다. 표적 세포에서 이식유전자(transgene) 또는 그의 단편의 발현을 위해 특별히 설계된 벡터는 유전자 또는 그의 단편의 발현을 구동하는 프로모터 서열을 가질 수 있다. 본 발명에 따른 벡터는 임의의 적합한 유형의 벡터일 수 있고 세포 내에서 임의의 유형의 RNA 또는 단백질의 발현을 가져올 수 있다. 벡터는 유전자 또는 그의 단편에 코딩된 정보를 세포에서 단백질 또는 RNA 구조로 번역할 수 있게 한다. 발현되는 유전자에는 메신저 RNA(mRNA)로 전사된 후 단백질로 번역되는 유전자뿐만 아니라 tRNA(transfer RNA) 및 rRNA(ribosomal RNA)와 같은 RNA로 전사되나, 단백질로 번역되지 않는 유전자가 포함된다. 벡터는 발현 벡터인 것이 바람직할 수 있다. 발현 벡터는 유전자 또는 그의 단편을 포함할 수 있고, 유전자는 이식유전자, 즉 그것이 도입되는 세포에 이미 존재하지 않는 유전자일 수 있다. 유전자는 단백질 또는 RNA 엔티티를 코딩할 수 있다.
발현 벡터는 유전자 또는 그의 단편의 전사 및 뒤이은 생성된 mRNA의 번역을 통해 세포내에서 단백질을 생산할 수 있다. 상이한 유기체에서의 발현은, 많은 요소가 유사하지만, 단백질 생산을 가능하게 하기 위한 상이한 요건을 초래한다. 일반적으로, 요구되는 요소는 전사 개시를 위한 프로모터 및 종결 신호일 수 있다. 발현 카세트가 포함될 수 있다. 진핵 세포에서의 발현을 위해, 발현 카세트는 하나 이상의 프로모터 또는 인핸서 요소, 및 유전자, 유전자의 단편, 또는 목적 mRNA 또는 단백질을 코딩하는 기타 코딩 서열을 포함한다. 발현 카세트는 목적 단백질을 코딩하는 서열에 작동 가능하게 연결된 진핵 프로모터, 및 선택적으로 인핸서 및/또는 진핵 전사 종결 서열로 구성될 수 있다. 진핵 시스템을 위한 목적 유전자 또는 코딩 서열의 예는 항원 엔티티에 대한 코딩 서열을 포함할 수 있고, 따라서 벡터는 핵산 백신일 수 있다. 원핵 발현 벡터의 경우, 벡터는 원핵 프로모터 및 종결 서열을 포함할 수 있다. 임의의 발현 벡터 또는 발현 카세트의 프로모터는 유도성일 수 있고, 이는 발현이 유도제의 도입에 의해 요구될 때만 개시된다는 것을 의미한다.
단백질 생산 없이 RNA를 생산하도록 설계된 발현 벡터는 유전자 또는 그의 단편의 전사를 유도하는 적합한 프로모터를 포함할 수 있다. 유전자 또는 그의 단편은 임의의 적합한 RNA 분자, 예를 들어 메신저 RNA(mRNA), 트랜스퍼 RNA(tRNA), 리보솜 RNA(rRNA), 안티센스 RNA(asRNA), 가이드 RNA(gRNA), siRNA(small interfering RNA), miRNA(microRNA), lncRNA(long non-coding RNA), piRNA(Piwi interacting RNA) 및 shRNA(short hairpin RNA)를 코딩할 수 있다. 대안적으로, RNA는 리보자임(ribozyme) 또는 압타머를 형성할 수 있다.
벡터는 무세포 과정에서 효소적으로 만들어지는 것과 같이 인위적으로 합성되는 것이 바람직하기 때문에, 발현을 위한 임의의 유전자 또는 그의 단편을 설계하는 것이 가능하다. 따라서, 세포독성일 수 있고, 유전자 서열이 박테리아 등에서 증식하기 어려울 수 있다.
따라서, 유전자 또는 그의 단편은 세포 내에서 RNA 또는 단백질 산물을 코딩한다. 유전자 단편은 엑손(실제로 단백질 서열을 코딩하는 유전자의 부분들)만 포함하는 유전자 조각과 관련될 수 있다. 대안적으로, 유전자 단편은 전체 단백질 자체가 아니라, 더 큰 단백질의 단량체 또는 서브유닛을 코딩할 수 있다. 유전자 단편은 또한 핵산 백신의 생산, 예를 들면, 세포에서 발현을 위한 바이러스로부터의 항원성 단백질의 일부의 포함과 관련될 수 있다. 그러한 상황에서, 세포에서 전체 단백질을 생산하는 것은 바람직하지 않을 수 있다. 따라서, 세포에서의 발현에 적합하다면, 단편은 유전자의 작은 조각일 수 있다. 예는 면역 반응을 유도하기 위한 바이러스의 스파이크 단백질의 일부이다.
벡터는 바람직하게는 DNA(데옥시리보핵산) 벡터이다. 벡터는 하이브리드 벡터일 수 있고, 이는 상이한 유형의 뉴클레오티드가 벡터에 혼입(incorporate)된다는 것을 의미하며, 본원에서 논의된 합성 방법을 이용하여 가능하다. 하이브리드 벡터에서, 이중체 섹션은 DNA이고, 캡핑된 말단이 RNA(리보핵산)와 같은 또 다른 유형의 핵산일 수 있거나, 또는 변형된 뉴클레오티드를 사용하는 것이 바람직할 수 있다. 대안적으로 이중체의 섹션은 RNA 또는 변형된 뉴클레오티드일 수 있다. 벡터는 80% 이상 DNA, 85, 90 또는 95% DNA일 수 있다.
벡터는 실질적으로 순수한 핵산이고, 예를 들어 벡터가 적어도 95% 핵산인 것이 바람직하다. 벡터는 95, 96, 97, 98, 99 또는 100% 핵산일 수 있다. 선택적으로, 벡터는 실질적으로 순수한 DNA이고, 예를 들어, 벡터는 95% 이상 DNA이다. 벡터는 95, 96, 97, 98, 99 또는 100% DNA일 수 있다. 벡터가 실질적으로 단백질 또는 펩티드를 포함하지 않아서, 벡터의 5% 미만이 단백질 또는 펩티드인 것이 바람직할 수 있다. 선택적으로, 벡터는 4, 3, 2 또는 1% 미만이 펩티드 또는 단백질이다. 벡터는 NLS와 같은 펩티드 표적화 서열을 포함하지 않는 것이 바람직하다. 본원에서 사용되는, 백분율은 벡터 자체의 중량 기준 백분율을 의미한다. 부착 부위(attachment site)를 사용하여, 분자는 운반될 벡터에 치료제로서 부착될 수 있고, 따라서, 벡터의 물질도 아니고 표적화 메커니즘도 아니라는 것을 이해할 것이다.
벡터는 DNA 또는 RNA와 같은 천연 핵산 분자일 수 있다. 벡터는 DNA인 것이 바람직하다. 벡터는 또한 비천연 핵산 분자를 포함할 수 있다. 비천연 핵산 분자 또는 제노 핵산(xeno nucleic acid: XNA)의 예는 1,5-무수헥시톨 핵산(1,5-anhydrohexitoal nucleic acid: HNA), 시클로헥센 핵산(cyclohexene nucleic acid: CeNA), 트레오스 핵산(threose nucleic acid: TNA), 글리콜 핵산(GNA), 잠금 핵산 (locked nucleic acid: LNA), 펩티드 핵산 (PNA) 및 FANA이 포함된다. 하치모지(Hachimoji) DNA는 천연 핵산, DNA 및 RNA에 존재하는 4/5 종 외에 4종의 합성 뉴클레오티드를 사용하는 합성 핵산 유사체이다. 합성 핵산 분자를 인식하기 위해 효소를 조작(engineer)하거나, 돌연변이시키거나, 또는 개발하였고, 따라서 본 발명의 방법 및 생성물은 이러한 유사체, 또는 합성 및 천연 핵산의 하이브리드 및 그의 키메라에 동일하게 적용된다.
벡터가 도 5와 6을 포함한, 여러 도면에 도시되었다. DNA 벡터를 그릴 때, 선형 이중체(linear duplex)의 "상부 가닥"을 올바른 방향(말단이 개방된 경우, 5'-3' 방향임)에서 "센스 가닥"으로 배치하는 것이 관례이다. 이러한 관례는 본원에 포함된 도면에 반영되었다. 명확성을 위해, 벡터의 캡핑된 말단은, 그러한 관례에 따라 도시될 때, 분자가 실질적으로 공유결합에 의해 폐쇄될 수 있고, 말단 뉴클레오티드를 갖지 않는 경우, 말단에 유리 뉴클레오티드가 있다는 것을 시사하는 5' 및 3'보다, "좌측" 및 "우측"으로 지정될 수 있다. 구조 모티프는 좌측 말단 및/또는 우측 말단에 존재할 수 있다.
벡터는 무세포 방식으로 인 비트로에서 효소를 이용하여 생성될 수 있는, 합성 DNA 구조이다. 이러한 합성 DNA는 신생(de novo) 제조가 가능하며, 염색체와 같은 천연 게놈 구조를 편집하는 것에 의해 생성되지 않는다. 벡터는 동원체(centromeric) 서열, 또는 중심체로 작용하는 서열을 포함하지 않는다. 벡터는 인공 인간 염색체가 아니다.
벡터는 임의의 적합한 크기, 선택적으로, 5Mb 미만의 크기, 예를 들면, 0.1KB 내지 5Mb 사이의 임의의 크기, 예를 들어 최대 1Mb, 최대 2Mb, 최대 3Mb, 최대 4Mb 또는 최대 5Mb일 수 있다. 유전자 서열의 전달을 위해, 벡터는 0.1Kb 내지 1Mb, 선택적으로 0.1Kb 내지 0.75Mb, 선택적으로 0.1Kb 내지 0.5Mb, 선택적으로 0.1Kb 내지 0.25Mb(250Kb) 사이의 임의의 적합한 크기일 수 있다. 최소 크기는 이중체 서열의 길이에 따라 다를 것이나, 대략 0.1Kb, 0.2Kb, 0.3Kb, 0.4Kb 또는 0.5Kb 일 수 있다. 이들 사이의 모든 중간 크기 범위가 가능하다.
이중체 (duplex)
벡터는 이중체 섹션(duplexed section) 또는 "이중체"를 포함할 수 있다. 이중체 섹션은 또한 선형 섹션(linear section)으로 기술될 수 있다. 이중체는 DNA 또는 DNA와 RNA의 하이브리드인, 상보적인 폴리뉴클레오티드 가닥을 갖는 분자의 섹션이다. 이중체가 2개의 상보적인 폴리뉴클레오티드 가닥(분자간) 또는 동일한 폴리뉴클레오티드 가닥의 2개의 상보적인 부분(분자내)으로 형성될 수 있다는 것이 당업자에 의해 이해될 것이다. 본 발명의 이중체는 임의의 적합한 길이일 수 있다. 이중체는 2개의 가닥 또는 1개의 가닥에 의해 형성될 수 있다. 이중체는 순수한 DNA이거나 또는 RNA와의 하이브리드일 수 있다. 본원에 기술된 방법은 RNA 및 DNA를 갖는 이중체의 생성을 허용한다.
유전자 또는 그의 단편은 이중체 섹션 내에 포함되는 것이 바람직하다. 따라서, 프로모터 및 선택적으로 종결 서열을 포함하는 전체 발현 카세트가 이중체에 존재할 수 있다. 프로모터는 유전자 또는 그의 단편에 작동가능하게 연결될 수 있다.
벡터는 인공적으로 제조될 수 있기 때문에, 선택을 위한 마커와 같은 외래 서열을 포함할 필요가 없다. 항생제 내성 유전자와 같은 선택 마커는 벡터가 세포 환경에서 증식될 때 요구된다.
이중체 섹션은 평활, 개방 말단(blunt, open ends)을 갖지 않고, 따라서, 평행한 말단 뉴클레오티드 잔기-(자기 상보성을 갖는 하나의 가닥일 수 있는), 각각의 상보적 가닥의 3' 및 5' 말단을 갖지 않는다. 양 말단에서, 이중체 가닥 중 적어도 하나는 나머지 가닥을 넘어서 연장되어 오버행(overhang)이 존재한다. 이 오버행은 캡핑된 말단을 형성할 수 있다. 오버행이 계속되어 이중체의 반대쪽 가닥에 연결될 수 있다(폐쇄된 말단).
이중체는 임의의 적합한 길이일 수 있으며, 일부 인간 유전자는 길이가 수 킬로베이스이기 때문에 운반하는 서열에 따라 달라질 것이다. 벡터는 플라스미드의 효과적인 대체물이고, 최대 100,000개의 염기쌍의 삽입물을 운반할 수 있다. 따라서, 이중체 섹션은 최대 100,000 bp(base pairs), 50,000 bp, 또는 25,000 bp 길이일 수 있다.
본원에 기재된 바와 같은 표적화 및 전달을 위한 결합 모티프는 바람직하게는 이중체 섹션에 포함되지 않는다; 그들은 대신 분자의 말단에 있는 구조 모티프 내에 존재한다. 이는 벡터의 페이로드(payload)가 어떠한 구조로부터의 간섭 없이 적절하게 전달되는 것을 보장한다.
이중체는 유전자, 이식유전자, 활성 RNA에 대한 코딩 서열, 유전자 편집을 위한 공여체 서열 등을 포함한, 세포에 전달하는 것이 바람직한 임의의 적절한 서열("페이로드")을 포함할 수 있다.
이중체는 표적 세포 내에서 핵산의 활성을 증가시키는 프로모터, 인핸서, 종결, 폴리A 신호 서열 등과 같은 적절한 서열을 포함할 수 있다. 이는 당업자의 소관에 속한다.
캡핑된 말단 (Capped end)
이중체의 각 말단은 캡핑된다. 캡핑된 말단 또는 "캡(cap)"은 특히 엑소뉴클레아제를 통한 세포 내 분해로부터 이중체의 말단을 보호하는 역할을 한다. 본원에서 사용된, 이중체의 캡핑된 말단은 분자내 수소 결합을 이용하여 함께 유지될 수 있는 구조를 취할 수 있다. 따라서, 이중체의 적어도 하나의 가닥은 나머지 가닥의 말단을 지나 계속 이어지고 캡을 형성하여, 세포에서 이중체를 분해로부터 보호한다. 따라서, 이중체는 유리 5' 및 3' 말단을 갖는 평활 말단형이 아니다. 캡핑된 말단은 이중체의 나머지 가닥보다 더 긴 단일 가닥으로부터 형성되고, 이 단일 연장 가닥은 구조로 폴딩되고, 바람직하게는 이중체의 나머지 가닥의 말단 뉴클레오티드 근처에서 어닐링되어, 말단을 "캡핑"하고, 엑소뉴클레아제 등의 진입을 입체적으로 방지하는 것으로 간주될 수 있다. 그것은 폐쇄된 말단에서 나머지 가닥과 연속적일 수 있으므로, 공유 결합에 의해(covalently) 폐쇄된 말단을 제공한다.
캡핑된 말단은 폐쇄된 말단일 수 있고, 이는 이중체의 각 말단이 캡에 공유 결합되어 있다는 것을 의미한다. 달리 말하면, 캡과 이중체는 연속 가닥이다.
캡핑된 말단은 개방된 말단일 수 있고, 이는 이중체의 일 말단만이 캡에 공유결합에 의해 부착된다는 것을 의미한다. 다르게 표현하면, 이중체의 한 가닥만이 캡으로 이어지고, 반면에, 캡의 말단 뉴클레오티드와 이중체의 반대쪽 가닥의 말단 뉴클레오티드 사이에는 갭이 있다. 이 상황에서, 말단 뉴클레오티드는 벡터를 안정화하고 세포 내에서 즉각적인 분해를 방지하기 위해 벡터 내에 보호(secure)될 수 있다.
이중체의 하나의 캡핑된 말단은 간단한 캡일 수 있고, 예를 들어 하나 이상의 헤어핀(연속) 또는 닉킹된 헤어핀(갭 포함)일 수 있다. 대안적으로, 일 말단은 다수의 단순한 형태, 예를 들면, 스템 루프(단일 가닥 핵산의 루프가 있는 이중체), 루프(단일 가닥 핵산의 루프), 두 개의 헤어핀으로 구성된 T자형, 벌지(bulge) 등을 취할 수 있다. 그러나, 캡핑된 말단은 다중 스템 루프(별 모양 형성), 다중 헤어핀, 크로스 암, 십자형, 유사 매듭(pseudoknot), G-사중체 또는 i-모티프와 같은 보다 복잡한 구조를 캡 내에 포함할 수 있다. 이들은 인간 염색체의 말단에서 캡으로 이용된다. 이러한 단순하거나 더 복잡한 캡은 개방되거나 또는 폐쇄될 수 있다. 캡이 개방된 경우, 말단 뉴클레오티드(들)는, 하기에서 추가로 논의되는 바와 같이 캡 및/또는 이중체 내에 보호될 수 있다.
원하는 위치로 전달할 수 있는 표적화 벡터가 되기 위해, 캡 중 적어도 하나는 구조 모티프를 포함한다. 2개의 캡 모두 구조 모티프를 포함할 수 있으며, 각각은 독립적으로 설계될 수 있다. 구조 모티프는 캡에서 원하는 구조가 형성될 수 있게 하는 서열이다. 이러한 구조는 생리학적 조건 또는 벡터가 사용되는 환경(예를 들어, 박테리아 세포 배양)과 같은 관련 조건 하에서 구조가 형성되도록 설계될 수 있다. 구조 모티프는 벡터를 안정화시키는 역할을 할 수 있어서, 예를 들어 분해에 대해 더 높은 내성을 갖는다. 유전자 또는 그의 단편이 변화 없이 원하는 표적에 온전하게 도달하는 것을 보장하기 위해서는 안정한 벡터가 바람직하다. 구조 모티프는 환경의 이온 강도 및/또는 pH에 따라 특정 조건에서만 구조를 형성할 수 있다. 벡터가 특정 세트의 조건, 예를 들면, 세포 조건 하에서만 특정 구조를 형성하도록 설계되는 경우, 구조 모티프를 포함하는 캡핑된 말단이 폐쇄된 말단이어서, 다른 조건 하에서 단순하게 이중체의 말단들 간에 단일 가닥 루프를 형성할 수 있는 것이 바람직할 수 있다.
폐쇄된 캡 말단은 보호가 필요한 말단 뉴클레오티드가 없다는 것을 의미한다. 폐쇄된 말단은 이중체의 양 말단과 연속적이다. 캡핑된 말단 중 적어도 하나가 폐쇄되거나 캡핑된 말단 모두가 폐쇄되는 것이 바람직할 수 있다.
캡핑된 말단이 개방된 경우, 즉각적인 분해를 방지하기 위해 말단 뉴클레오티드가 보호되는 것이 바람직하다.
캡핑된 말단은 임의의 적합한 길이의 폴리뉴클레오티드 섹션을 포함할 수 있다. 캡핑된 말단의 길이는 캡핑된 말단의 복잡성에 따라 달라질 것이다. 단순한 헤어핀의 경우, 이중체의 말단에 헤어핀을 형성하기 위해 필요한 최소량의 서열이 존재한다. 그러나 다중 압타머(multiple aptamers) 또는 G-사중체와 같은 더 복잡한 구조의 경우, 캡핑된 말단은 최대 800개 염기 또는 최대 700개 염기, 최대 600개 염기 또는 최대 500개 염기 길이와 같이 길이가 수백개 염기일 수 있다.
개방된 캡핑된 말단(open capped end)
본 발명의 벡터는 폴리뉴클레오타이드/벡터가 연속적이지 않도록 "개방된" 하나 또는 두 개의 캡핑된 말단을 가질 수 있다. 개방된 캡핑된 말단이 존재하는 경우, 닉/갭의 각 면에는 유리 말단 뉴클레오티드(5' 및 3' 말단 뉴클레오티드)가 있다. 닉은 백본이 불완전하여 연결되지 않은 두 개의 인접한 뉴클레오티드 사이에서 발견된다. 말단 잔기 사이에 하나 이상의 누락된 뉴클레오티드(들)가 있는 경우, 갭이 발생하며, 선택적으로 말단 뉴클레오티드는 다수의 뉴클레오티드에 의해 떨어져 있다. 이러한 닉 또는 갭은 캡에서 또는 그 근처에서 나타나나, 이중체 섹션에서는 나타나지 않는다.
캡핑된 말단이 개방된 경우, 말단 뉴클레오티드 잔기가, 말단에 구조 모티프가 존재하는 경우 구조 모티프를 포함한 벡터의 또다른 부분에 분자 내에서 수소 결합되는 것이 바람직하다. 따라서, 예를 들어, 캡핑된 말단의 말단 뉴클레오티드(3' 또는 5')는 캡핑된 말단의 다른 잔기와 염기쌍을 이룰 수 있고, 이중체의 말단 잔기(5' 또는 3')는 이중체 내에서 염기쌍을 형성한다. 일 양태에서, 말단 뉴클레오티드는 구조체에서 다른 뉴클레오티드와 염기쌍을 형성한다. 효과적으로, 벡터는 엑소뉴클레아제가 분해할 수 있는 말단 뉴클레오티드가 있는 핵산의 유리 단일 가닥이 없도록 한다.
그러나, 말단 잔기 중 하나 이상은 수소 결합, 또는 보다 구체적으로, 염기-쌍 형성이 없을 수 있다. 이 경우, 캡핑된 말단은 말단 뉴클레오티드를 둘러싸거나 포위하거나, 에워싸서 말단 뉴클레오티드를 보호하여, 단일 가닥 뉴클레아제가 자유롭게 구조체 내의 인접한 뉴클레오티드로부터 말단 뉴클레오티드를 절단( 그 후, 인접한 뉴클레오티드들을 지속적으로 절단)할 수 없게 한다. 즉, 더 큰 엔티티가 그에 도달하는 것이 불가능하기 때문에, 말단은 분해로부터 입체적으로 보호된다. 예를 들어, 말단 뉴클레오티드는 4중 모티프 내에 보호될 수 있다.
추가 양태에서, 각각의 말단은 적어도 말단 잔기를 포함하는 이중체의 형성에 의해 보호될 수 있다. 이중체는 뉴클레오티드 서열 사이의 염기쌍 형성에 의해 형성된다. 이러한 서열은 인접하거나(헤어핀) 분리될 수 있다(스템 루프 등).
잔기는 핵산 중합체를 구성하는 단일 단위, 예를 들면, 뉴클레오티드를 의미한다. 말단 잔기는 3' 또는 5' 말단에서 뉴클레오티드 가닥의 말단에 있는 잔기이다.
말단은 4중체와 같은 형태/구조 내에 보호될 수 있다.
사중체는 염색체의 텔로미어 말단 구조에 관련될 수 있는, 사중(네 가닥) 구조이다. 기본적인 패턴은 후그스틴(Hoogsteen) 수소 결합 및 중심 양이온에 대한 배위로 안정화된 4개 잔기의 평면 배열인 테트라드(tetrad)이다. 사중체는 복수의 테트라드의 스택킹(stacking)에 의해 형성된다. 서열이 처음에 이러한 배열로 폴딩되는 방식에 따라 다수의 상이한 위상(topology)가 형성될 수 있다. 사중체 구조는 양이온, 특히 칼륨의 존재에 의해 더 안정화될 수 있다. 사중체는 DNA, RNA, LNA 및 PNA에서 가능한 것으로 나타났으며 분자내(intramolecular)일 수 있다.
예시적인 사중체는 G-풍부 서열로부터 형성된 G-사중체 및 시토신-풍부 서열에 의해 형성된 i-모티프(삽입된(intercalated) 모티프)를 포함한다.
따라서, 일 양태에서, 말단 뉴클레오티드는 사중체, 선택적으로 G-사중체 또는 i-모티프 내에 보호된다.
구조 모티프 (Structural Motif)
구조 모티프는 핵산의 단일 가닥으로부터 형성되도록 설계된다. 구조 모티프는 그것이 구조를 형성할 수 있게 하는 서열을 가지며, 이 구조는 바람직하게는 DNA의 단일 가닥으로부터 형성된 2차 구조이다. 이 구조는 캡핑된 말단을 형성하기 위해 신장된 이중체의 하나의 가닥이기 때문에, 핵산의 폴딩된 단일 가닥으로 기술될 수 있다. 폐쇄된 말단 구성(configuration)에서, 이 단일 가닥은 이중 가닥의 반대쪽, 상보적인 가닥을 형성한다. 따라서, 비폴딩(unfolded) 구성에 있을 때, 폐쇄된 말단은 이중체의 말단 사이에 루프를 형성한 핵산의 단일 가닥이다. 보관 조건과 같은 특정 조건에서, 구조 모티프는 단순히 단일 가닥의 루프로 존재할 수 있다. 그 후, 그 구조는 생리학적 조건과 같은 사용에 적합한 조건에서 재형성될 수 있다.
모티프가 형성하는 구조는 서로 상호 작용하는 핵산의 염기에 의해 달성될 수 있다. 구조는 모티프를 구조로 유지하기 위해 분자 내 수소 결합을 포함할 수 있다. 구조를 유지시키는 적절한 상호 작용 및 결합이 본원에서 더 기술된다.
구조 모티프는 임의의 적합한 구조 또는 형태를 형성할 수 있다. 핵산의 단일 가닥을 기반으로 많은 구조가 가능하다. 여기에는 헤어핀, 스템, 스템 루프, 루프, 벌지, T자형(쌍을 이룬 헤어핀) 및 십자형이 포함된다. 삼중체(분자내일 수 있는, 핵산의 세 가닥), 더 복잡한 구조, 예를 들면, G-삼중체, 사중체, i-모티프, 유사 매듭 또는 이들의 조합도 달성될 수 있다.
단일 가닥 내에 상보적인 서열의 적절한 영역을 포함시키는 것에 의해 구조 모티프를 설계하는 것이 가능하다. 상보성(complementarity)이 본원에서 정의된다.
서열 및 기타 조건에 따라, 핵산은 생물학적 중요성을 갖는 것으로 생각되는 다양한 구조 모티프를 형성할 수 있다.
반대 방향으로 읽을 때, 뉴클레오티드 서열에서 대개 상보적인 동일한 가닥의 두 영역이 이중체를 형성하기 위해 염기쌍을 형성할 때, 헤어핀이 형성된다. 회문(palindromic) 뉴클레오티드 서열은 헤어핀을 형성할 수 있다. 헤어핀은 완전히 상보적일 수 있지만, 입체 장애로 인해, 헤어핀의 끝(tip)에 있는 수개의 염기쌍이 짝을 이루지 못할 수 있다. 헤어핀은 끝에 비상보적 서열의 수개의 염기를 포함할 수 있다.
스템 루프 분자내 염기쌍 형성은 단일 가닥 핵산에서 발생할 수 있는 패턴이다. 이 구조는 헤어핀 루프(hairpin loop)로도 알려져 있다. 동일한 가닥의 두 영역이 반대 방향으로 읽을 때, 뉴클레오티드 서열에서 대개 상보적인, 동일한 가닥의 2개의 영역이 염기쌍을 형성하여, 쌍을 이루지 않은 단일 가닥 루프로 종료되는 이중 나선을 형성하는 경우, 이 구조가 발생한다.
유사 매듭은 스템의 절반이 또 다른 스템의 두 절반 사이에 삽입(intercalate)된 것인 적어도 2개의 스템-루프 구조를 포함하는 핵산 이차 구조이다.
십자형 핵산은 십자형 모양의 스템, 분지점(branch point), 및 루프로 구성된 구조를 형성하기 위해 적어도 역반복 서열(inverted repeat)의 6개 뉴클레오티드 서열이 필요한 구조이다.
G-사중체 2차 구조(G4)는 구아닌이 풍부한 서열에 의해 핵산에서 형성된다. 그들은 형태가 나선형이며 하나 이상의 가닥으로부터 형성될 수 있는 구아닌 테트라드를 포함한다. I-모티프는 G-사중체 구조와 유사한, 시토신이 풍부한 DNA에 의해 형성된 4가닥 사중체 구조이다. C가 풍부한 DNA 영역은 인간 게놈의 유전자 조절 부분에서 일반적이다.
i-모티프(intercalated-motif DNA)는 G-사중체 구조와 유사한, 시토신이 풍부한 4가닥 사중체 DNA 구조이다.
삼중체(triplex) DNA(H-DNA 또는 삼중-가닥 DNA로도 알려짐)는 3개의 올리고뉴클레오티드가 서로 감겨 삼중 나선을 형성하는 DNA 구조이다. 삼중 가닥 DNA에서, 세 번째 가닥은 후그스틴 염기쌍 또는 역전된(reversed) 후그스틴 수소 결합을 형성하여 B-형 DNA(Watson-Crick 염기쌍을 통한) 이중 나선에 결합한다.
따라서, 구조 모티프는 뉴클레오티드가 비정규(non-canonical) 구조를 형성하도록 허용한다. 이 구조는 결합 모티프를 제공하기 위해, 구조 모티프의 기능과 관련하여 중요하다. 결합 모티프는 다양한 부분 간의 혼동을 방지하기 위해 "형태(conformation)"를 갖는 것으로 기술되나, 용어, 형태, 구조, 2차 구조, 3차 구조, 구성(configuration), 또는 기하 구조(geometry)는 모두 상호 교환적으로 사용될 수 있다. 이중 나선 또는 B-DNA는 정규(canonical) Watson-Crick 염기쌍이 있는 DNA 구조인 것으로 확인한다.
구조 모티프는 분자내 수소 결합을 형성할 수 있는 서열을 포함한다. 이러한 수소 결합은 임의의 종류의 염기쌍이거나 사중체(tetraplexes/quodruplexes)와 같은 구조에서 볼 수 있는 후그스틴 타입 수소 결합일 수 있다.
특히, 구조 모티프는 서열의 또 다른 부분에 대해 염기쌍을 형성할 수 있는 하나 이상의 서열 부분을 포함하는 서열일 수 있다.
따라서, 구조 모티프는 단순히 "상보적"이고, 역평행(antiparallel) 또는 실제로 평행 이중체를 형성하기 위해 염기쌍을 형성하는 서열의 2개 섹션을 포함할 수 있다. 이 이중체는 가닥의 말단 잔기(즉, 3' 또는 5' 말단)를 포함하거나 포함하지 않을 수 있다. 이 경우, 구조 모티프는 헤어핀(2개의 섹션이 인접함) 또는 스템 루프(2개의 섹션이 단일 가닥 핵산을 남기는 스페이서 서열에 의해 분리되는 경우)를 형성할 수 있다. 이러한 구조는 구조 모티프에 역반복 서열을 포함함으로써 달성될 수 있음을 이해할 것이다. 회문 서열은 하나의 섹션에서 5'에서 3'으로의 서열 판독(reading)이 그와 이중체를 형성하는 상보적인 섹션에서 5'에서 3'으로의 서열 판독과 일치하는 것인 이중 가닥 핵산 서열의 섹션이다.
따라서, 구조 모티프는 헤어핀, 스템 루프 또는 유사매듭 중 하나 이상의 형성에 필요한 서열을 포함할 수 있다. 이러한 모든 형태는 이중체를 형성할 수 있는 2개의 섹션의 서열을 공통적으로 갖는다. 대안적인 구조는 두 부분의 서열을 가지고 있다. 대체 구조에는 이중 구조를 형성할 수 있는 서열의 섹션도 포함하는, 래리엇(lariat) 또는 라쏘(lasso)가 포함된다.
구조 모티프는 삼중체일 수 있다. 그러한 경우, 3개의 올리고뉴클레오티드가 서로 감겨 삼중 나선을 형성한다. 삼중 가닥 DNA에서, 세 번째 가닥은 후그스틴 염기쌍 또는 역 후그스틴 수소 결합을 형성하여 (Watson-Crick 염기쌍을 통한) B형 DNA 이중 나선에 결합한다. 삼중체 DNA는 H-DNA라고도 한다. 3개의 섹션이 적절한 서열을 가질 때 분자 내에서 형성될 수 있다. 일부 경우에, 삼중체는 벡터 내의 이중체를 이용하여 형성될 수 있고, 추가적인 삼중체 형성 올리고뉴클레오티드가 첨가되며, 따라서 삼중체는 분자간이다. 삼중체는 DNA와 RNA 가닥 사이의 하이브리드일 수 있다.
구조 모티프는 다양한 형태 또는 구조의 하이브리드일 수 있다.
조건과 함께, 가닥의 서열, 길이 및 배향에 따라 구조를 형성하기 위한 특정한 전제 조건이 있다. 핵산의 수화 및 다양한 이온 및/또는 리간드의 존재가 또한 핵산의 구조에 영향을 미칠 수 있다. 예를 들어, 보다 산성인 pH에서, i-모티프가 형성될 가능성이 더 높은 반면 알칼리성 pH 또는 중성에서는 단일 가닥일 수 있다. 사중체 모티프는 낮은 염 농도에서 더 단순한 헤어핀 구조를 형성할 수 있는 반면, 생리학적 pH에서 칼륨 이온이 존재할 때, G-사중체 구조를 취할 것이다.
구조 형성을 위한 일부 서열 요건은 하기 표 1에서 일부 예시적 서열과 함께 상세히 기술된다:
Figure pct00001
이러한 구조 모두는 생리학적 조건에서 형성되는 것으로 기록되었다.
구조 모티프는 캡핑된 말단의 형성을 허용하는 서열을 효과적으로 제공한다. 따라서, 길이가 최대 800개 뉴클레오티드, 최대 700개, 최대 600개 또는 최대 500개 뉴클레오티드일 수 있다. 최소 구조 모티프는 약 12개의 뉴클레오티드를 포함할 수 있고, 결합 모티프의 최소 섹션, 바람직하게는 길이가 적어도 5개의 뉴클레오티드의 최소 섹션과 함께, 6개 염기쌍의 헤어핀이 형성될 수 있다.
구조 모티프에 대한 적합한 서열을 설계할 때, 당업자는, 상보적인 이중체 및 구조 모티프 중 중요한 서열을 사용하는 것을 피하기 위해 어느 정도의 주의가 필요하다는 것을 인식할 것이고, 이는 올바른 배향의 이중체 및 캡핑된 말단의 형성을 방해할 수 있고, 특히, 벡터가 단일 가닥 출발 분자로부터 제조되는 경우, 방해할 수 있기 때문이다. 당업자는 서열의 구조를 https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html을 포함한, 적절한 소프트웨어로 확인될 수 있다는 것을 알 것이다.
구조 모티프는 적어도 하나의 결합 모티프를 포함한다. 본원에 기재된 상이한 구조는 결합 모티프를 형성하기에 적격일 수 있다. 예를 들어, 사중체는 뉴클레올린에 대한 결합 모티프인 G 풍부 루프(G rich loop)를 포함하는 구조 모티프이다.
수소결합 형성 및 염기쌍 형성
수소 결합은 분자 간 또는 분자 내에서, 분자간으로 또는 분자내로, 비공유 타입의 결합이다. 이러한 결합은 동일한 분자 또는 상이한 분자의 전기적 음성 원자(수소 수용체)와 또다른 전기적 음성 원자와 공유 결합에 의해 결합하는 수소 원자(수소 공여체는 질소, 산소 또는 불소 원자일 수 있으나, 다른 공여체와 더 약한 수소결합이 형성될 수 있음)로부터 형성된다. 그들은 쌍극자-쌍극자 상호 작용의 가장 강한 종류이다. 수소 결합은 DNA 이중 나선에서 특이적 염기쌍 형성을 담당하며 DNA 이중 나선 구조의 안정성에 대한 인자이다.
일반적으로, Watson-Crick 염기쌍 형성에서, 수소 결합은 뉴클레오티드의 함질소 염기(핵염기) 사이에 형성된다. DNA의 아데닌-티민(AT), RNA의 아데닌-우라실(AU) 및 DNA 및 RNA의 시토신-구아닌(CG)인 표준 염기쌍 형성에서, 수소 결합이 형성된다. AT/U와 C-G 쌍 형성은 상보적인 염기의 아민과 카르보닐기 사이에 이중 또는 삼중 수소 결합을 형성하는 기능을 한다.
워블(wobble) 염기쌍은 표준 Watson-Crick 염기쌍 규칙을 따르지 않는 핵산 분자, 가장 현저하게, RNA의 2개의 뉴클레오티드 사이의 쌍이다. 4개의 주요 워블 염기쌍은 구아닌-우라실(GU), 하이포산틴-우라실(IU), 하이포크산틴-아데닌(IA) 및 하이포크산틴-시토신(IC)이다. 워블 염기쌍의 열역학적 안정성은 왓슨-크릭 염기쌍과 유사한다. 워블 염기쌍은 RNA 구조에서 근본적이다.
수소 결합에 의해 함께 유지되는 핵산 구조에서 대체 또는 비정규 염기 쌍 형성도 가능하다. 이들은 일반적으로 RNA에서 더 일반적이지만 DNA 및 기타 핵산에서도 가능하다. 비정규 염기쌍의 한 예는 후그스틴 및 역 후그스틴 염기쌍이다. 이러한 상호 작용에서, 퓨린 염기인 아데닌과 구아닌은 그들의 정상적인 방향을 뒤집고(flip) 파트너와 새로운 세트의 수소 결합을 형성한다. 후그스틴 수소 결합 형성은 본원에서 더 자세히 논의되는 i-모티프 및 G-사중체와 같은 사중체에 존재하는 것으로 나타났다.
다양한 염기쌍 형성 메커니즘의 조합도 예상할 수 있다. 예를 들어, 정규 B형 DNA의 A-T 및 G-C 염기쌍의 수소 결합이 형성되면, 핵염기의 여러 수소 결합 공여체 및 수용체 그룹이 사용되지 않은 상태로 남는다. 각 퓨린 염기는 주홈(major groove)에 노출된 가장자리에 두 개의 이러한 그룹이 있다. 삼중체 DNA는 이중체와 세 번째 올리고뉴클레오티드 가닥 간에 분자간으로 형성될 수 있다. 세 번째 가닥 염기는 B-형 이중체에서 퓨린과 후그스틴-타입 수소 결합을 형성할 수 있다.
염기쌍은 또한, 천연 염기와 비천연 염기 사이, 및 비천연 염기의 쌍 간에 형성될 수 있다.
분자내 수소 결합은 또한, 고전적인 염기쌍 형성으로 정의되지 않는 상호작용, 예를 들면, Hoogsteen 수소 결합 형성에 의해 안정화되는 G-사중체의 G-테트라드에서 구아닌 잔기의 평면 배열(planar arrangement)일 수 있다. 이러한 구조는 하기에서 더 논의된다.
또한, 핵산 분자의 안정화는 염기-스택킹(base-stacking) 상호작용에 의존할 수 있다. 파이-파이 스택킹(π-π 스택킹이라고도 함)은 파이(pi) 결합을 포함하기 때문에, 방향족 고리 사이의 매력적인 비공유 상호 작용을 의미한다. 이러한 상호 작용은 수소 결합 형성에 의해 결합된 핵산 분자 내의 핵염기 스택킹에서 중요한다. 따라서, 단일 가닥 핵산 구조체는 염기-스택킹 상호작용에 의해 더 안정화될 가능성이 있다. 핵산을 안정화시키는 다른 상호작용도 가능하며, 이들은 파이-양이온 상호작용, 반데르발스 상호작용 및 소수성 상호작용을 포함한다.
이러한 모든 상호작용 및 결합은 본 발명에 따른 이중체 섹션의 임의의 유형의 캡핑된 말단에 존재할 수 있으며, 단순한 또는 복합적 캡핑된 말단 또는 구조 모티프에 존재한다.
2개의 뉴클레오티드 서열이 엄격한 조건 하에 서로 혼성화될 때, 2개의 서열은 실질적으로 상보적인 것으로 간주될 수 있다. 일부 구체예에서, 2개의 뉴클레오티드 서열이 고도로 엄격한 조건 하에 서로 혼성화될 때, 2개의 서열은 실질적으로 상보적인 것으로 간주된다.
핵산 혼성화와 관련하여 엄격한 혼성화 조건은 서열 의존적이며 상이한 조건 하에서 상이하다. 핵산의 혼성화는 본원에 참조에 의해 포함된, Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I Chapter 2, Elsevier, New York (1993)에 상세하게 기술된다. 엄격성은 혼성화 온도 및 염 농도에 의해 결정된다(고온 및 저염이 더 엄격함). 완전히 상보적이지 않은 서열의 경우, 불완전한 하이브리드가 형성될 수 있는 수준까지 엄격성을 낮추어야 한다. 혼성화의 엄격도가 너무 낮으면, 비특이적 결합이 너무 많이 발생하고, 원하는 벡터가 형성되거나 유지되지 않을 것이며, 이러한 낮은 엄격도 조건은 본 발명의 맥락에서 바람직하지 않는다.
일반적으로, 고도로 엄격한 혼성화 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 융점(Tm)보다 약 5℃ 더 낮도록 선택된다.
Tm은 (정의된 이온 강도 및 pH 하에서) 표적 서열의 50%가 완벽하게 일치하는 서열(상보적)에 혼성화되는 온도이다. 특정 세트의 상보적 서열에 대한 Tm과 동일하도록 매우 엄격한 조건이 선택된다.
혼성화에 적합한 조건이 이용될 수 있으며, 예를 들어, PCR 프라이머 어닐링을 위한 조건이 적절할 것이다. 혼성화는 45 내지 65℃, 선택적으로 50 내지 55℃의 온도에서 일어날 수 있다.
사중체
G-사중체의 서열은 다양하며 추정 식(putative formula)에 의해 정의될 수 있다: (G3+N1-nG3+N1-nG3+N1-nG3+), 식 중에서, N은 구아닌을 포함한 임의의 뉴클레오티드이다. 구아닌 사이의 잔기의 수는 루프의 길이를 정의한다. 7개 뉴클레오티드보다 큰 루프가 관찰되었다. G-사중체는 속성상 고도로 다형성이다. 우선성(right hand) 및 좌선성(left hand) 사중체가 모두 보고되었다.
사중체(또는 테트라플렉스(tetraplex)라고도 함)는 예를 들어 중심 이온 주위에 착물을 형성할 수 있다. 다수의 리간드, 소분자 및 단백질이 사중체에 결합할 수 있다. 이들 리간드는 천연 발생 또는 합성일 수 있다. 모든 규명된(characterized) G-사중체 결합 단백질은 FMR1 G-사중체 결합 단백질의 이전에 기술된 RG-풍부 도메인(RRGDG RRRGG GGRGQ GGRGR GGGFKG - 서열번호 2)과 유사한, NIQI(Novel Interesting Quadruplex Interaction Motif)로 불리는 20개 아미노산 길이의 모티프/도메인(RGRGR GRGGG SGGSG GRRGG - 서열번호 1)을 공유한다. 양이온성 포르피린은 G-사중체와 인터칼레이션에 의해(intercalatively) 결합하는 것으로 나타났다. 사분자(quartet)를 스택킹한 사중체와 이를 유지시키는 핵산의 루프를 매칭시키는 것이 중요할 수 있다. π-π 상호작용은 리간드 결합에 대한 중요한 결정자일 수 있다. 리간드는 평행한 폴딩된 사중체에 대한 높은 친화도를 가져야 한다. 다른 구조 모티프에 결합하여 그들을 안정화시키는 리간드도 고려된다.
i-모티프
이중체를 형성하는 적어도 2개의 평행한 시토신-풍부 가닥은 "삽입-모티프(intercalated-motif)"의 형성을 초래하는 역평행(antiparallel) 배향으로 삽입된다. 이러한 구조는 1, 2, 3 또는 4개의 가닥으로 형성될 수 있으며, 각각은 가닥 배향, 서열 길이 및 C:C+ 염기쌍의 개수의 측면에서 다를 것이다. 일반적으로, 이러한 구조는 산성 조건에서 안정화된다. 다양한 리간드가 생리학적 조건에서 작동할 수 있도록 i-모티프를 안정화하도록 설계되었다.
크로스 암
크로스-암 구조는 역반복을 갖는 핵산에 의해 형성되고, 가닥내 염기쌍 형성을 포함한다. DNA에서, 이는 일반적으로 AT가 풍부한 영역에 임베딩된다. 이러한 암은 예각으로 형성될 수 있다. T자형 헤어핀이 크로스 암 구조의 예이다.
헤어핀
역반복(IR) 또는 회문(palindrome)이 있는 서열은 헤어핀의 형성을 초래한다. 헤어핀은 서열이 완전히 상보적인 경우에도 말단/끝에 쌍을 이루지 않은 염기의 작은 루프를 가질 수 있다. 헤어핀은 임의의 적절한 역반복 서열(inverted repeat sequence)로 구성될 수 있다.
버블 또는 벌지
이러한 구조는 하나의 가닥이 단일 가닥으로 불거져 나오는, 쌍을 이루지 않은 뉴클레오티드를 포함하는 것인 이중체 핵산에서 형성된다. 이는 이중체의 한쪽 또는 양쪽에서 일어날 수 있다. 이들은 전사 버블(transcription bubble)에서 자연적으로 발생한다.
삼중체 DNA
삼중체는 올리고퓨린-올리고피리미딘 이중체와 제3 가닥 사이에서 Hoogsteen 또는 역 Hoogsteen 결합을 통해 서열 특이적 방식으로 형성된다. 삼중체는 순전히 DNA, 순전히 RNA 또는 DNA와 RNA의 하이브리드일 수 있다. 삼중체 구조의 형성은 올리고뉴클레오티드 길이, 염기 조성, pH, 2가 양이온의 존재 및 온도와 같은 여러 인자들에 따라 달라진다. 삼중체는 인간 세포에서 검출되었고, 따라서, 생리학적 조건에서 형성될 것이다.
결합 모티프
구조 모티프는 하나 이상의 결합 모티프를 포함한다. 결합 모티프는 벡터의 표적화를 담당한다. 결합 모티프는 벡터가 원하는 위치로 전달되는 것을 돕기 위해 벡터와 원하는 표적의 상호작용을 허용한다. 결합 모티프가 구조 모티프 내에 포함되어 있기 때문에, 해당 구조의 일부를 형성한다. 따라서, 결합 모티프는 구조 모티프 내에서 형태(conformation)를 취할 수 있다. 즉, 결합 모티프는 모양, 형태, 기하 형태, 또는 구성을 갖는다. 이러한 형태는 결합 모티프의 기능에 중요하다. 형태만으로도 모티프의 표적으로의 결합을 보장하기에 충분할 수 있다.
결합 모티프의 형태는 모티프의 서열에 따라 다르지만, 단순히 서열 그 자체가 결합 모티프의 활성을 담당하는 것은 아니다. 따라서, 그 효과는 전달 동안 자가 상보적 핵산 서열에 혼성화하는 핵산 서열, 또는 이중체 DNA에 존재할 수 있는 컨센서스(consensus) DNA 서열의 인식으로 인한 것이 아니다.
결합 모티프의 특이성은 특정 잔기의 존재와 중요한 구조, 예를 들면, 뉴클레올린에 결합하기 위한 사중체 루프의 G 잔기의 조합으로 인한 것일 수 있다.
따라서, 결합 모티프의 활성은 형태 단독, 또는 형태와 구조 내의 하나 이상의 잔기의 위치의 조합으로 인한 것일 수 있다. 이러한 잔기는 사중체 루프의 G 잔기와 같이 핵심(key) 또는 특이적 잔기로 기술될 수 있다.
결합 모티프는 본원에 기술된 하나 이상의 구조/형태의 임의의 조합을 포함할 수 있다. 예를 들어, 트롬빈에 결합하는 DNA 압타머는 서열 d(GGTTGGTGTGGTTGG)를 가지며, 용액에서 일 말단에서 부홈(narrow groove)에 걸친(spanning) 2개의 T-T 루프 및 또 다른 말단에서 주홈(wide groove)에 걸친 T-G-T 루프에 의해 연결된 2개의 구아닌 사분자(quartet)로 구성된, 폴딩된 구조를 형성하는 것으로 알려져 있다. G 사분자(quartet)는 G 테트라드로도 불리는 정사각형 평면 구조이며 이러한 구조는 G 사중체에서 형성된다. 따라서, 이 특정한 압타머에는 사분자와 루프가 필요하다.
결합 모티프는 그 구조가 결합 모티프의 기능에 중요하기 때문에 구조 모티프 내에 존재한다. 예를 들어, 도 10에서 알 수 있는 바와 같이, 결합 모티프(이 경우, 207)는 스템 구조(205 및 206)를 형성하는 2개의 서열 사이에 들어맞는다. 따라서, 전체 구조 모티프는 이 예에서 결합 모티프와 스템을 포함한다. 이 예에서 구조 모티프는 결합 모티프에 대한 지지를 제공하고 스캐폴드 역할을 하며, 캡핑된 말단에서 안정성을 제공한다. 구조 모티프는 실질적으로, 하나 이상의 결합 모티프를 포함할 수 있으므로, 벡터에서 결합 모티프를 지지하기 위해 최소의 잔기가 필요하다. 예를 들어, 사중체는, 상기 사중체의 루프가 결합 모티프를 제공하는 것인 구조 모티프를 제공할 수 있다.
결합 모티프의 어레이가 존재하는 경우, 이들 각각은 각각의 결합 모티프가 올바른 형태를 형성할 수 있도록 개재 서열에 의해 분리될 수 있다. 어레이의 적절한 폴딩을 보장하기 위해, 이 개재 서열들은 독특한 서열의 분지 스템(branching stem)을 형성할 수 있거나, 또는 각 모티프의 독립적인 폴딩을 실시하고 어레이의 폴딩을 단일 형태로 제한하도록 설계될 수 있다.
결합 모티프는 압타머일 수 있다. 압타머는 특이적 표적 분자에 결합하는 올리고뉴클레오티드이다. 일반적으로 압타머는 고유한 구조 및 잠재적인 표적 결합 능력을 갖는다. 이러한 특징은 압타머가 하나의 관능기(functional group)만 다른 표적을 구별할 수 있는, 고 친화도(nM 내지 pM 범위) 및 특이성 결합 분자가 되게 한다. 압타머는 "핵산 항체"로 불릴 수 있다. 그들은 소분자 및 단백질에서 전체 세포(whole call) 또는 박테리아에 이르기까지 정의된 표적에 결합할 수 있다. 암 세포에 결합할 수 있는 압타머가 정의되었다(Tawiah et al, Biomedicines 2017, 5, 51, 5030051, 본원에 참조로 포함됨).
압타머는 일반적으로 큰 랜덤 서열 풀에서 반복적으로 선택하는 것에 의해 생성할 수 있지만, 천연 압타머는 예를 들면, 리보스위치(riboswitch)에도 존재한다. 핵산 압타머는 표적에 대한 인 비트로 선택, 또는 이와 동등하게 SELEX(systematic evolution of ligands by exponential enrichment)를 통해 생성된 주어진 표적에 대한 항체에 필적하는 선택성을 갖는 핵산 종(항체 모방체)이다. 이것은 소분자에서 세포에 이르는 범위일 수 있다. 압타머는 정전기적 상호작용, 소수성 상호작용, 형태 선택(conformational selection) 및 유도 맞춤(induced fitting)과 같은 다양한 비공유적 상호작용을 통해 동족(cognate) 표적에 결합할 수 있다. 압타머 서열의 가변성이 다양성을 제공하는 것이다. 압타머가 폴딩하는 방식, 핵산의 순서(order) 및 이들이 있는 환경 조건이 모두 표적 결합에 기여한다. 압타머는 차별적인 인식을 제공할 수 있으나, 시험관 내에서 완전히 조작할 수 있고 화학 합성에 의해 쉽게 생산되며 치료 응용 분야에서 면역원성을 거의 또는 전혀 유도하지 않기 때문에 항체에 비해 잇점을 갖는다.
일반적으로 압타머는 대개 단일 가닥 핵산으로 제공되어, 예를 들어 인체에서 빠르게 제거되나, 본 발명은 압타머를 더 큰 벡터 내에 포함함으로써 압타머를 효과적으로 안정화시켜 즉각적인 분해로부터 보호한다.
압타머는 세포 표면 위에 또는 세포 내에 있는 임의의 적합한 표적에 결합하도록 설계될 수 있다. 예는 세포 표면 수용체 또는 핵 수송 성분(nuclear transport component)을 포함한다. 표적은 본원에서 정의된 바와 같을 수 있다.
결합 모티프는 삼중체일 수 있다. 삼중체는 본원에 기술된 바와 같다.
결합 모티프는 사중체일 수 있다. 사중체는 본원에서 논의된다. 사중체의 형성에는 8개의 후그스틴(Hoogsteen) 수소 결합을 이용하여 4개의 잔기의 평면 어셈블리(planar assembly)에 의해 형성되어 이러한 구조를 고도로 열적으로 안정적으로 만드는, 스택킹된 G-테트라드 또는 C-테트라드가 요구된다. 안정화 금속 양이온이 포함될 수 있거나 대안적으로 안정화 소분자가 사용될 수 있다. 이러한 내용은 Maleki et al, Nucleic Acid Research, 47(20), 10744-10753, 2019 및 Goncalves et al, Chem Commun, 2006, 7(45), 4685-4687에 설명되어 있으며, 두 문헌 모두 참조에 의해 본원에 포함된다.
사중체는 각각 고유한 특이적인 특징을 가질 수 있다. 그들의 독특함은 그들의 구별되는 폴딩 패턴에서 볼 수 있다. 폴딩 패턴의 이러한 고유한 차이는 루프 연결성 및 안정화 금속 양이온의 변화를 수반할 수 있으며, 이는 홈(groove) 구조의 차이를 초래한다. 홈 너비와 모양의 차이가 결합 능력을 설계할 수 있는 기회를 제공한다. 사중체는 특정한 표적에 결합할 수 있다. 벡터를 세포의 핵으로 표적화하기 위해 사중체를 사용할 수 있다.
결합 모티프는 리보자임 또는 데옥시리보자임(DNA자임)과 같은 촉매일 수 있다. 촉매 핵산은 구조에 프로그래밍할 수 있고, 변형하기 쉽고 더 안정적이다. 특히 DNA로 구성된 것들이 그렇다. 그들은 압타머와 거의 같은 방식으로 표적에 대해 특이적이도록 설계될 수 있다. 촉매 핵산은 당업자에게 공지되어 있다. 촉매 핵산은 구조에서 프로그래밍이 가능하고, 변형하기 쉬우며, DNA 효소는 단백질 대응물보다 더 안정적인 경향이 있다. 압타머 개발과 유사한 방법을 이용하여 촉매 핵산을 개발할 수 있다. 보고된 첫번째 DNA자임(DNAzyme)은 GR5라고 하며 RNA 절단을 위해 설계되고, 활성 부위에 단지 15개의 뉴클레오티드를 갖는다. DNA자임은 G-사중체 또는 삼중체 구조 내에 포함될 수 있다. 이는 Ma & Liu, iScience 23, 100815, 2020에 설명되어 있으며, 본원에 참조로 포함된다.
결합 모티프는 구조적 또는 형태적 요소의 적절한 혼합물일 수 있다. 결합 모티프는 결합 특이성을 제공하기 위해 특정 위치에서 하나 이상의 핵심 또는 특이적 잔기에 의존할 수 있다.
결합 모티프는 구조 모티프에 의해 유지되는, 단일 가닥 핵산의 섹션일 수 있다. 이러한 구조의 예는 G-사중체의 루프이다. 따라서, 상기 단일 가닥에 대한 상보적 서열은 벡터에 없다. 이는 결합 모티프의 형성과 이중체의 형성 사이의 경쟁을 방지한다.
이전에 언급한 바와 같이, 결합 모티프가 표적 엔티티에 선택적으로 결합하는 능력을 부여하는 것은 형태 또는 형태와 특정한(특이적 또는 핵심) 잔기의 존재의 조합이다. 따라서, 결합 모티프는 원하는 위치 내의 뉴클레오티드 서열에 대한 상보성에만 기초하여 벡터를 전달을 위해 표적화하지 않는다.
따라서, 결합 모티프의 형태 또는 비-선형적 정보량(information content)이 중요한다. 하기에서 더 정의되는, 컨센서스 서열은 선형적 정보량에 의존하나, 형태에 의존하지 않는다. 이는, 구조가 유지되는 한, 결합 모티프가 서열의 변형에 보다 잘 적응한다는 것을 의미한다.
또한, 의심의 여지를 없애기 위해, 결합 모티프는 형태 독립적인 컨센서스 서열이 아니다. 예를 들어, 제한 효소, 메틸트랜스퍼라제, 재조합효소, 전사 인자 등과 같은 단백질 및 효소의 DNA로의 결합을 허용하는 컨센서스 서열은 이중 가닥 DNA에 존재한다. 이들은 일반적으로 길이가 4-50개 뉴클레오티드인 짧은 DNA 서열인 경향이 있다. 서열 특이적 DNA 결합 단백질은 일반적으로 이중 가닥 B-DNA의 주홈과 상호 작용하고, 이는 염기쌍을 식별하는 더 많은 관능기를 노출하기 때문이다. 따라서, 서열이 비-정규 구조 없이, 이중 가닥 DNA, 또는 심지어 때로는 단일 가닥 DNA에 존재하는 동안, 상기 서열이 대개 인식된다.
결합 모티프가 원하는 표적에 특이적으로 결합하고 다른 성분에는 결합하지 않도록 결합 모티프가 특이적인 것이 바람직하다. 결합 조건은 바람직하게는 생리학적 조건 또는 세포가 유지되는 조건이다. 결합은 예를 들어 글리코실화, 유비퀴틴화, 메틸화 등과 같은 번역 후 변형과 같이 변형된 표적과 비변형(unmodified) 표적을 구별하기에 충분히 특이적일 수 있다. 압타머는 예를 들어 비변형 표적에만 결합할 수 있을 만큼 충분히 특이적인 것으로 나타났다.
구조 모티프 내에 단일 결합 모티프가 있을 수 있지만, 복수의 결합 모티프, 예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 결합 모티프, 바람직하게는 2 내지 5개, 2 내지 4개의 결합 모티프가 있는 것이 바람직하다. 이러한 결합 모티프는 동일하거나 상이할 수 있다. 상이한 경우, 상이한 엔티티에 결합할 수 있거나, 보다 바람직하게는, 결합 모티프는 각각 동일한 표적의 다른 부분에 결합한다. 이러한 방식으로, 결합 모티프는 특이적 표적화가 달성되는 것을 보장한다.
결합 모티프의 어레이가 제공될 수 있다. 어레이는 3개 이상의 결합 모티프를 포함하며, 각각은 동일하거나 상이할 수 있다. 어레이 중 결합 모티프는 모티프가 폴딩되도록 링커 또는 스페이서 서열에 의해 적절하게 분리될 수 있다.
결합 친화도는 벡터(이 경우 결합 모티프)와 그의 리간드/결합 파트너 간의 결합 상호작용의 강도로 정의할 수 있다. 결합 친화도는 일반적으로 평형 해리 상수(KD)로 측정되고 보고된다; 이는 두 엔터티 간의 상호 작용이 깨질 가능성을 정의한다. KD 값이 작을수록 결합 모티프의 그의 표적에 대한 결합 친화력이 더 크다. KD 값이 클수록 결합 모티프와 표적이 상호 간에 더 약하게 끌리고 결합한다. 리간드 결합 분석은, 바람직하게는 평형 조건 하에서, 수행될 수 있다. KD를 결정하기 위한 프로토콜은 당업자에게 잘 알려져 있으며, 겔-이동 분석(gel-shift assay), 풀-다운 분석(pull-down assay), 평형 투석, ELISA, 분석 초원심분리, 바이오층 간섭계(bio-layer interferometry: BLI), 표면 플라즈몬 공명(SPR), 및 분광 분석과 같은 다양한 기술을 포함한다. KD는 Koff 대 Kon의 비율(즉, Koff/Kon)로부터 구하고 몰 농도(M)로 표시된다.
결합 친화도는 두 분자 사이의 수소 결합, 정전기적 상호 작용, 소수성 및 반 데르 발스 힘과 같은 비공유 분자간 상호 작용에 의해 영향을 받는다. 따라서, 결합 모티프의 세심한 설계가 원하는 표적에 결합하는 것을 가능하게 한다.
최적/생리학적 조건에서 결합의 특이성은 결합될 수 있는 표적의 균일성(uniformity)으로 정의될 수 있다. 특이성이 높을수록 결합될 수 있는 표적이 더 균일하다. 고도로 특이적인 압타머는 표적의 유형뿐만 아니라 이루어진 변형도 구별할 수 있다. 대조적으로, 무차별적(promiscuous) 결합 모티프는 다양한 관련 구조에 결합된다. 특정한 구체예에서, 표적에 특이적으로 결합하는 결합 모티프는 1 mM 이하, 100 nM 이하, 10 nM 이하 또는 3 nM 이하의 KD로 표적에 결합하는 모티프를 의미하는 것으로 의도된다. 향후 피코몰 또는 심지어 펨토몰 범위의 KD로 결합하는 결합 모티프를 선택하는 것이 가능할 수 있다.
모티프가 그의 표적에 결합하는 능력을 결정하기 위해 경쟁 분석(competitive assay)을 이용할 수 있다.
본원에서 사용된, 용어 특이적 결합(specific binding)은 결합이 일어나는 환경에서 가능한 결합 파트너를 구별하는 모티프의 능력을 의미한다. 다른 잠재적 표적이 존재할 때 하나의 특정한 표적과 상호작용하는 결합 모티프는 그것이 상호작용하는 표적에 "특이적으로 결합한다"고 한다. 일부 구체예에서, 특이적 결합은 결합 모티프와 그의 표적 사이의 회합(association)의 정도를 검출하거나 결정함으로써 평가되고; 일부 구체예에서, 특이적 결합은 결합 모티프-표적 복합체의 해리 정도를 검출하거나 결정함으로써 평가되며; 일부 구체예에서, 특이적 결합은 그의 표적과 또 다른 엔티티 사이의 상호작용에서 경쟁하는 결합제의 능력을 검출하거나 결정함으로써 평가된다. 일부 구체예에서, 특이적 결합은 다양한 농도에 걸쳐 이러한 검출 또는 결정을 수행함으로써 평가된다.
결합 모티프 표적
결합 모티프는 바람직하게는 표적에 대해 특이적이거나 표적에 특이적으로 결합할 수 있다. 이 표적은 임의의 적합하거나 바람직한 표적일 수 있다. 본원에서 사용된, 결합 모티프는 표적에 결합할 수 있는 표적화가능한(targetable) 핵산을 의미한다. 결합 모티프는 구조 모티프의 일부이다. 벡터는 세포 표적에 특이적인 적어도 하나의 결합 모티프를 포함한다. 벡터는, 필요한 경우, 벡터가 비-DNA 페이로드를 운반하는 데 사용될 수 있도록 비-세포 표적에 특이적인 별도의 결합 모티프를 선택적으로 포함할 수 있다.
본원에서 사용된, 표적은 하나 이상의 결합 모티프에 결합하거나 그렇지 않으면 상호작용할 수 있는 임의의 화합물 또는 엔티티를 지칭하는 것으로 의도된다. 표적의 예는 펩티드, 단백질, 변형된 단백질, 당단백질, 펩티도글리칸, 지질, 인지질, 당지질, 핵산 및/또는 콜레스테롤을 포함한다. 표적은 또한 표적 엔티티 또는 간단히 엔티티로도 지칭될 수 있다.
세포 표적은 세포의 표면, 예를 들면, 막 단백질, 수용체, 리간드, 당, 글리코실화 단백질, 펩티도글리칸, 지질, 인지질 또는 당지질에 존재할 수 있다.
세포 표면 표적을 표적으로 삼는 것이 바람직하고, 이는 다세포 유기체에서 적절한 마커/표적의 선택에 의해 특정 조직 또는 세포 유형으로의 벡터의 지향을 가능하게 하기 때문이다. 세포 유형은 암성일 수 있고 표적은 그러한 세포에서만 발현될 수 있다. 이는 제거가 바람직한 세포에만 세포독성 유전자 또는 그의 단편의 특이적 전달을 허용할 수 있다. 대안적으로, 결합 모티프는 특정 조직 유형, 예를 들어 심장 질환을 치료하기 위한 심근으로의 벡터의 표적화를 허용할 수 있다.
세포 표적은 혈뇌 장벽(blood brain barrier)에 있어서, 벡터가 혈뇌 장벽을 통과하도록 지원할 수 있다. 압타머는 이미 성공적으로 혈뇌 장벽을 표적으로 삼고 통과하는 것으로 확인되었다.
세포 표적은 세포 내에 존재할 수 있다. 진핵 세포의 경우, 표적은 핵막, 미토콘드리아 막, 소포체(ER) 막, 골지체 막 및 리소좀 막과 같은 소기관을 둘러싸는 세포의 내부 막에 존재할 수 있다. 각각의 내막(internal membrane)은 고유하므로 이러한 차이를 이용하여 이러한 특정 소기관을 표적화할 수 있다.
핵을 표적화하는 것은 발현을 위한 적절한 위치로 벡터의 전달을 허용하기 때문에 진핵 세포에 대해 바람직하다. 핵막은 이중막이기 때문에 핵막이라고도 한다. 표적은 핵공 복합체(nuclear pore complex: NPC)의 일부일 수 있다. 표적은 임포틴(importin)-α 및 임포틴-β와 같은 세포 핵 수송 단백질일 수 있다. 표적은 핵 수송 시스템의 일부일 수 있다. 핵 표적화는 사중체를 포함함으로써 달성될 수 있다. 핵을 표적화하는 것은 또한 히스톤 등을 표적화하기 위한 결합 모티프를 설계하는 것에 의해 달성될 수 있다. 핵 매트릭스를 표적화하는 것도 유리할 수 있다. 염색질의 구성에서 역할을 하는 것으로 생각되는. 스캐폴드 또는 매트릭스 관련 단백질(SAR 또는 MAR)과 같은 많은 단백질이 핵 매트릭스와 연관될 수 있다. 이러한 표적화는 벡터를 핵 내의 전사 활성 스팟으로 국재화시키는 것이 바람직한 경우 유리할 수 있다.
세포 표적은 엔도솜 시스템의 일부일 수 있으므로 세포 안팎으로의 수송을 돕는다.
대안적으로, 단백질 및 봉입체(inclusion)와 같은 세포질 성분이 표적화될 수 있다. 예를 들어, 이것은 프리온 또는 단백질 플라크(proteinaceous plaque)와 같은 바람직하지 않은 세포질 성분을 가진 세포의 특이적 표적화를 허용할 수 있다.
세포 표적은 미토콘드리아 상에 존재할 수 있어서, 미토콘드리아 내에서 발현을 허용한다. 이것은 미토콘드리아-연관 질환에 적절할 수 있다.
핵 표적화(nuclear targeting)는 더 많은 유전자 또는 그의 단편이 발현이 필요한 위치로 전달되기 때문에, 치료 용량에 필요한 벡터의 양을 줄일 수 있다는 점에서 유리하다. 또한, 백신과 같은 적용의 경우, 핵 표적화는 유전자 또는 그의 단편의 보다 이른 발현을 허용하여 면역계로부터 보다 신속한 반응을 제공할 수 있다.
핵산은 일반적으로 핵공 복합체(NPC)를 통해 핵으로 들어간다; 이것은 크고 수많은 단백질로 구성된 핵막의 수성 채널이다. NPC를 통한 진입은 크기에 의존적일 있고, 벡터가 작을수록 핵에 더 신속하게 국재화될 수 있다. 다른 기술은 NPC를 통해 벡터를 표적화하기 위해 NLS 펩티드를 부착시킬 수 있으나, 이러한 접근법은 성공의 수준이 다양했다. 전사 인자와 같은 단백질은 세포 유형 및/또는 세포의 발달 단계에 따라 핵으로 이동할 준비가 된 상태로 세포질에 존재할 수 있다. 또한 전사 인자의 풍부도(abundance) 및 발현은 가변적일 수 있다. 핵 전달을 보장하기 위해 일반적으로 핵으로 이동되는 엑티티를 표적화하는 것이 바람직하다. 그러한 표적은 히스톤, 뉴클레올린, 텔로미어 결합 단백질 등을 포함한다. 이들은 상이한 세포 유형에 걸친 그들의 항시적 발현 및 핵 표적화를 허용하는 이들의 입증된 능력으로 인해 선호되는 표적이다.
핵으로 이동되는 세포 특이적 단백질을 표적으로 하여, 세포-특이적 핵 표적화가 가능할 수 있다.
벡터의 생산적인 전달은 세포 진입을 필요로 할 뿐만 아니라 벡터가 세포 표면에서 세포질을 통해 궁극적으로 핵 외피를 가로질러 핵으로 이동할 수 있도록 하는 많은 세포 이벤트를 필요로 할 수 있다. 따라서, 세포내 이동 구성요소들(intracellular trafficking components)이 결합 모티프에 대한 표적을 제공할 수도 있다. 여러 단백질 및 기타 분자가 세포내 이동/세포질 수송/핵 수송에 관여하며, 이들은 폴리아민, 핵산 결합 단백질, 미세소관, 디네인(dynein), 양이온성 단백질, 샤페론 및 핵 수송 단백질, 텔로미어 결합 단백질, 히스톤 또는 뉴클레올린을 포함한다.
세포질은 단백질로 가득 차 있으며 2000개 염기쌍보다 큰 핵산은 유용한 시간(time frame) 내에 세포질을 통해 효과적으로 확산될 수 없다는 것이 이전에 밝혀졌는다. 따라서, 세포내 이동의 구성요소에 결합하는 결합 모티프를 포함하면 특히 더 큰 벡터의 경우, 세포질을 통한 전달 속도를 증가시킬 수 있다.
벡터가 세포에 들어가면, 엔도사이토시스(endocytosis)되어 벡터가 엔도솜에 집중될 수 있다. 결국, 엔도솜은 리소좀으로 전달될 수 있으며, 엔도좀의 내용물은 분해된다. 따라서, 벡터를 효과적으로 표적화하기 위해 엔도솜 경로를 표적화하는 것은 바람직하지 않다. 따라서 벡터는 엔도사이토시스 이외의 메커니즘(예를 들면, 특정 수송체를 표적화함)을 통해 세포 진입을 표적화하거나, 엔도솜을 탈출하는 메커니즘을 포함할 수 있다. 엔도솜 탈출(endosome escape)의 고효율은 하기 특성 중 하나 이상을 나타내는 수용체를 선택함으로써 달성될 수 있다: 고도로 발현된 세포 표면 수용체(>105), 신속한 수용체 흡수(약 20분이 가장 빠른 것으로 간주됨) 및/또는 수용체의 향상된 엔도솜 탈출 효율(약 1% 카고(cargo) 탈출). 예를 들어, 간 세포 표면 수용체 ASGPR은 간 세포의 표면에서 높은 수준으로 발현되고(세포당 106개 수용체) 빠르게 내재화된다.
표적에 결합할 뿐만 아니라 세포 내로 내재화하는 결합 모티프를 선택할 수 있다. 예를 들어, 압타머와 관련하여, 세포-기반 SELEX는 압타머가 표적에 결합한 후 내재화되는 것을 보장하기 위해 이용되었다.
표적화를 위한 가능한 막관통 수용체는 다음과 같는다. 이 목록은 포괄적이지 않는다:
유전자(기호(전체 명칭)) 리간드 기능 엔도사이토시스 유형

G-단백질 결합 수용체(G-protein coupled receptor: GPCR)
1. ADRB1(Adrenoceptor β1) 에피네프린, 노르에피네프린 카테콜아민 작용 매개 CDE(clathrin-dependent endocytosis: 클라트린 의존 엔도사이토시스)
2. ADRB2(Adrenoceptor β2) 에피네프린, 노르에피네프린 카테콜아민 작용 매개 CDE
3. ADRB3(Adrenoceptor β3) 노르에피네프린 카테콜아민 작용 매개 CDE
4. CCR5(Chemokine (C-C motif) receptor 5 ) CCl3, CCl4, CCl5, CCl8, CCl13, CCl16 백혈구 수송, 혈관신생, 세포사멸(apoptosis) CDE
5. CXCR1(Chemokine (C-C motif) receptor 1) CXCl6,CXCl8 백혈구 수송, 혈관신생, 세포사멸 CDE
6. CXCR2 (Chemokine (C-C motif) receptor 2) CXCl1,CXCl2,CXCl3, CXCl5 CXCl6, CXCl7, CXCl8 백혈구 수송, 혈관신생, 세포사멸 CDE
7. CXCR4(Chemokine (C-C motif) receptor 4) CXCl14 백혈구 수송, 혈관신생,
세포사멸
CDE
8. F2R 응고 인자 II 수용체)
트롬빈 혈소판 활성화, 혈관 발달 CDE
수용체 티로신 키나제(Receptor tyrosine kinase: RTK)
9. CSF1R(Colony stimulating factor 1 receptor) M-CSF,IL34 대식세포 조절제 CDE
10. EGFR(Epidermal growth factor receptor) EGF 증식, 분화 CDE/CIE((clathrin-independent endocytosis)
11. ERBB2(Erb-b2 receptor tyrosine kinase 2) EGF 증식, 분화 CDE
12. ERBB3(Erb-b2 receptor tyrosine kinase 3) EGF 증식, 분화 CDE
13. ERBB4(Erb-b2 receptor tyrosine kinase 4) EGF 증식, 분화 CDE
14. FGFR1(Fibroblast growth factor receptor 1) FGF1, FGF2, FGF3, FGF6, FGF7 증식, 분화 CDE/CIE
15. FGFR2(Fibroblast growth factor receptor 2) FGF1, FGF4, FGF6, FGF7, FGF8 증식, 분화 CDE/CIE
16. FGFR3(Fibroblast growth factor receptor 3) FGF3, FGF4, FGF5, FGF6, FGF7 증식, 분화 CDE/CIE
17. FGFR4(Fibroblast growth factor receptor 4) FGF1, FGF3, FGF4, FGF5, FGF9 증식, 분화 CDE/CIE
18. FLT1(Fms-related tyrosine kinase 1)/ VEGFR1(Vascular endothelial growth factor receptor 1) VEGFA,VEGFB,PGF 혈관신생 CDE/CIE
19. IGF1R(Insulin-like growth factor 1 receptor) IGF1, IGF2 증식, 분화 CDE
20. IGF2R(Insulin-like growth factor 2 receptor) IGF2, 트랜스페린 증식, 분화 CDE
21. KDR(Kinase insert domain receptor)/ VEGFR2(Vascular endothelial growth factor receptor2) VEGFA, VEGFC 증식, 혈관신생 CDE/CIE
22. MET(Tyrosine-protein kinase met) HGF 증식, 혈관신생 CDE
23. NTRK1(Neurotrophic tyrosine kinase receptor type 1) NGF 분화 CDE
24. PDGFRA(Platelet-derived growth factor α receptor) PDGFC 증식, 분화, CDE
25. TGFBR1(Transforming growth factor β receptor 1) TGF-β 증식 종양 형질전환(tumor transformation) CDE/CIE
26. TGFBR2(Transforming growth factor β receptor 2) TGF-β 증식, 종양 형질전환 CDE/CIE
막관통 수용체(Transmembrane receptor: TMR)
27. FOLR1(Folate receptor 1) 엽산 엽산 수송 CDE
28. FOLR2(Folate receptor 2) 엽산 엽산 수송 CDE
29. FOLR3(Folate receptor 3 엽산 엽산 수송 CDE
30. IL2RA(Interleukin 2 receptor α) IL2 면역계 조절 Indt(클라트린/카베올린 비의존 세포내이입)
31. IL2RB(Interleukin 2 receptor β) IL2, IL15 면역계 조절 산업
32. IL2RG(Interleukin 2 receptor γ) IL2,IL-4,IL15 면역계 조절 산업
33. LDLR(Low density lipoprotein receptor) LDL, ApoB100, ApoE, IDL 지질 수송 CDE
34. TFRC(Transferrin receptor) 트랜스페린, HFE 철 수송 CDE
일부 적절한 세포 표적 압타머가 하기에 포함된다:
압타머 표적 서열 내재화? 구조
arahh001 원발성 종양 내피 세포에 존재 ACGTACCGACTTCGTATGCCAACAGCCCTTTATCCACCTC 예(yes) -
TEPP TfR EpCAM GCGCGGTACCGCGCTAACGGAGGTTGCGTCCGT 예, 혈뇌장벽도 통과함 2개의 스템 루프
MUC1 뮤신(OVCAR-3, A549, 췌장, 전립선, MCF-7, HepG2) GCAGTTGATCCTTTGGATACCCTGG 알려지지 않음(unknown) -
S1.3/
S2.2
뮤신(MCF-7) GGGAGACAAGAATAAACGCTCAAGCAGTTGATCCTTTGGATACCCTGGTTCGACAGGAGGCTCACAACAGGC 알려지지 않음 -
5TR-1 뮤신(MCF-7) GGGAGACAAGAATAAACGCTCAAGAAGTGAAAATGACAGAACACAACATTCGACAGGAGGCTCCACAACAGGC 알려지지 않음 -
SGC8 단백질 티로신 키나아제 7(PTK7)(CCRF-CEM - T 세포 백혈병) ATCTAACTGCTGCGCCCGCCGGGAAAATACTGTACGGTAGA-(CH2)6-NH2 알려지지 않음 스템 루프
SGA16 단백질 티로신 키나아제 7(PTK7)(CCRF-CEM - T 세포 백혈병) TTTAAAATACCAGCTTATTCAATTAGTCACACTTAGAGTTCTAGCTGCTGCGCCCGCCGGGAAAATACTGTACGGATAGATAGTAAGTGCAATCT 알려지지 않음 2개의 스템 루프
SYL3C EpCAM(MDA-MB-231, Kato III, HT-29, T47D, 세포 분류(cell sorting) 압타머 세트) CACTACAGAGGTTGCGTCTGTCCCACGTTGTCATGGGGGGTTGGCCTG 알려지지 않음 2개의 작은 스템 루프
SYL1
SYL2
SYL3
SYL4
EpCAM; MDA-MB-231, 카토 III, HT-29, T47D
세포분류 압타머 세트로 보고됨
AGCGTCGAATACCACTACAGTTTGGCTCTGGGGGATGTGGAGGGGGGTATGGGTGGGAGTCAATGGAGCTCGTGGTCAG
AGCGTCGAATACCACTACAGAGCTCGGGGTTTTTTGGGGTTTTTTGGGGTTTTGGTGGGGCTAATGGAGCTCGTGGTCAG
AGCGTCGAATACCACTACAGAGGTTGCGTCTGTCCCACGTTGTCATGGGGGGTTGGCCTGCTAATGGAGCTCGTGGTCAG
AGCGTCGAATACCACTACAGAGCTCCGGGGTTTTTGGGGGTTTTTCTGGGGTTTTTTGGGGCTAATGGAGCTCGTGGTCAG
알려지지 않음 이중 G-사중체
스템 루프

스템 상의 스템 루프 G-사중체
TDO5 IgG 수용체; 라모스(Ramos) 세포 (B세포 림프종) AACACCGGGAGGTAGGTTCGGTGGCTGTTCAGGGTCTCCTCCCGGTG-(CH2)6-NH2 알려지지 않음 스템 루프
A1 데이터 부재; A549 세포 GGTTGCATGCCGTGGGGAGGGGGGTGGGTTTTTAGGCGTACTCAG(CH2)6-NH2 알려지지 않음 G-사중체
AS1411;우리 후보 뉴클레올린; C6, HeLa, Hep-G2, Caco-2,U87MG, F11, C6, CT-26 TTGGTGGTGGTGGTTGTGGTGGTGGTGG 알려지지 않음 2x G-사중체
GMT4,8 데이터 없음; CCRF-CEM, U87 TGACGAGCCCAAGTTACCTTGGTGATGGTTTTTGGTGGTAACGGGGGCGGGTGAGTAGAATCTCCGCTGCCTACA G-사중체
CSC1 데이터 없음; DU145 ACCTTGGCTGTCGTGTTGTAGGTGGTTTGCTGCGGTGGGCTCAAGAAGAAAGCGCAAAGGTCAGTGGTCAGAGCGT 알려지지 않음 -
CSC13 데이터 없음; 전립선암 줄기세포 ACCTTGGCTGTCGTGTTGTGGGGTGTCGTATCTTTCGTGTCTTATTATTTTCTAGGGGAGGTCAGTGGTCAGAGCGT 알려지지 않음 -
KDED2a-3 데이터 없음; DLD-1 TGCCCGCGAAAACTGCTATTACGTGTGAGAGGAAAGATCACGCGGGTTCGTGGACACGGTTTTTTTTTTTTT 알려지지 않음 중간 줄기
KCHA10 데이터 없음; HCT116 ATCCAGAGTGACGCAGCAGGGGAGGCGAGAGCGCACAATAACGATGGTTGGGACCCAACTGTTTGGACACGGGTGGCTTAGTTTTTTTTTTTTT -
R13 데이터 없음; A549 TCTCTAGTTATTGAGTTTTCTTTTATGGGTGGGTGGG GGG TTTTT G-사중체
S6 데이터 없음; SK-BR-3 TGGATGGGGAGATCCGTTGAGTAAGCGGGCGTGTCTCTCTGCCGCCTTGCTATGGGG 2x 스템 루프
GBI-10 GGCTGTTGTGAGCCTCCTCCCAGAGGGAAGACTTTAGGTTCGGTTCACGTCCCGCTTATTCTTACTCCC -
A-1 데이터 없음; HepG2 TAACTCAATAAGCTAGGTGGGTGGGGGACACTACCCGGGGGGTGGTTGGGT G-사중체
데이터 없음; H23 세포 분류 짧은 올리고 -
표 3 - 표적화할 수 있는 예시적인 압타머.
하기 표는 본 발명자들에 의해 선택되고 예시된 표적을 묘사한다(실시예 참조). 히스톤 H4는 진핵 세포의 염색질 구조에 관여하는 5종의 주요한 히스톤 단백질 중 하나이다.
표적 결합 모티프 구조
H4-K16Ac 스템 루프
H4 G-사중체
H4(현미경용) 2개의 큰 루프
H4 스템-루프
표 4. 표적 후보 및 결합 모티프 구조.
본 발명의 벡터는 복수의 결합 모티프를 가질 수 있으므로 복수의 표적에 결합할 수 있다. 예를 들어, 특정한 세포 표적에 대한 결합 모티프뿐만 아니라 핵 표적에 대한 결합 모티프를 포함하는 것이 가능하여, 특이적 세포 진입뿐만 아니라 해당 특정 세포에서 핵 진입을 보장한다. 결합 모티프가 벡터의 상이한 말단에 있는 것이 바람직할 수 있다. 대안적으로, 이러한 상이한 결합 모티프들은 벡터의 일 말단에 어레이로 존재할 수 있다.
전달
본 발명의 핵산 벡터는 벡터를 원하는 세포 표적으로 향하게 하는 결합 모티프의 덕분으로 전달 벡터로 기술될 수 있다. 따라서, 본 발명의 벡터는 결합 모티프를 포함하는 구조 모티프의 포함에 의해, 세포 표적화 메카니즘이 벡터 자체의 핵산 내에 포함된 것인 전달 벡터일 수 있다.
본 발명의 벡터는 특정되거나 원하는 세포 표적에 그 자체를 전달하기 위해 사용될 수 있다. 이 세포 표적은 생체 내(in vivo) 또는 시험관 내(in vitro)일 수 있다.
벡터는 펩티드 서열, 리포좀 등과 같은 화학적 전달제의 사용 없이, 그러한 전달을 위해 준비될 수 있다. 이는 벡터가 올인원(all-in-one) 솔루션을 제공하여, 완벽하게 해결되지 않은 문제에 대한 최소한의 솔루션을 제공하기 때문이다. 즉, 벡터는 "네이키드(naked)" DNA로 제공될 수 있다. 네이키드 DNA는 고유한 단순성과 DNA 자체의 낮은 면역원성 때문에 매력적인 비-바이러스 유전자 벡터이다.
본 발명의 벡터는 개체의 세포, 조직 또는 기관으로의 인 비보 전달을 위해 개체에게 투여하기에 적합한 약학적 조성물에 혼입될 수 있다. 전형적으로, 약학적 조성물은 본 발명의 벡터 및 약학적으로 허용되는 담체를 포함한다. 예를 들어, 본 발명의 벡터는 원하는 치료 투여 경로에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥 주사 또는 동맥 내 주입(intra-arterial infusion)을 통한 수동 조직 주입(passive tissue transfusion)이 잠재적인 치료 경로이다. 치료 목적을 위한 약학적 조성물은 용액, 마이크로 에멀젼, 분산액 등으로 제형화될 수 있다. 멸균 주사 용액은 필요한 양의 벡터를 적절한 완충액에 필요에 따라 하나 또는 조합된 성분과 함께 포함한 다음 여과 멸균하여 제조할 수 있다.
본원에 개시된 바와 같은 벡터는 국소, 전신, 양막내, 척수강내, 두개내, 동맥내, 정맥내, 림프내, 복강내, 피하, 기관, 조직내(예를 들어, 근육내, 심장내, 간내, 신장내, 대뇌내), 경막내, 방광내, 결막(예를 들어, 안와외(extra-orbital), 안와내, 안와뒤, 망막내, 망막하, 맥락막, 맥락막하, 기질내(intra-stromal), 전안방내(intra-cameral) 및 유리체내), 달팽이관내 및 점막(예를 들어, 경구, 직장, 비강) 투여에 적합한 약학적 조성물에 포함될 수 있다.
벡터를 포함하는 약학적 활성 조성물은 이식유전자(transgene)를 수용자의 특정 세포에 전달하도록 제형화될 수 있으며, 결과적으로, 세포 내에서 이식유전자의 치료적 발현이 일어난다. 조성물은 또한 약학적으로 허용되는 담체를 포함할 수 있다.
본원에 제공된 조성물 및 벡터는 다양한 목적을 위해 이식유전자를 전달하는데 사용될 수 있다.
본원에 기술된 벡터는 생체내에서 세포의 형질도입을 위해 유기체에 투여될 수 있다.
그러한 핵산을 투여하는 적합한 방법이 이용가능하고 당업자에게 잘 알려져 있다. 본원에 개시된 벡터의 예시적인 투여 방식은 경구, 직장, 경점막, 비강내, 흡입(예를 들어, 에어로졸을 통해), 협측(buccal)(예를 들어, 설하), 질, 척수강내, 안구내, 피하, 경피, 내피내, 자궁내(in utero), 비경구(예를 들어, 정맥내, 피하, 진피내, 두개내, 근육내, 흉막내, 뇌내 및 관절내), 국소(예를 들어, 피부 및 기도 표면을 포함한, 점막 표면으로의 투여, 및 경피 투여), 림프내 투여 등, 및 직접적인 조직 또는 기관 주사를 포함한다. 예를 들어, 백신에 대해, 원하는 세포가 근육 세포인 경우, 직접 주사가 적절할 수 있다.
추가로, 1개 초과의 이식유전자/코딩 서열이 조성물 중 단일 벡터에 또는 복수의 벡터에 포함될 수 있다.
대안적으로, 개체로부터 세포를 제거하고, 그에 벡터를 도입하고, 그 후, 상기 세포를 개체 내로 다시 재도입할 수 있다. 체외(ex vivo) 치료를 위해 개체로부터 세포를 제거한 후 개체에 다시 도입하는 방법이 당업자에게 공지되어 있다. 대안적으로, (다른 공여자로부터의) 동종 세포가 변형되어 개체에 도입될 수 있다.
전달은 개체의 세포가 아닌 표적 세포, 예를 들어, 박테리아, 진균 또는 기생충 세포에 특이적일 수 있다. 이 경우, 벡터에는 원치 않는 세포 유형의 제거를 돕기 위해 독성 이식유전자가 포함될 수 있다.
조건 (Conditions)
핵산 구조는 조건의 변화에 의해 영향을 받을 수 있다. 구조 모티프에 대한 서열은 핵산 구조물이 사용되는 조건(예를 들어, pH, 온도, 염 농도, 압력, 단백질 농도, 당 농도, 삼투압 등)에서 형태(conformation)를 취하도록 선택될 수 있다.
벡터는 생리학적 조건 또는 미생물에서 단백질 생산에 유리한 조건과 같은 다수의 다양한 조건에서 사용될 수 있다.
생리학적 조건은 해당 유기체 또는 세포 시스템에 대해 자연적으로 발생할 수 있는 외부 또는 내부 환경의 조건이며, 구조 모티프가 적절한(relevant) 구조를 취하기 위한 적합한 조건일 수 있다.
캡/구조 모티프의 폴딩을 돕기 위해 추가적인 안정화 엔티티를 사용할 수 있다. 예를 들어, G-사중체는 앞서 설명한 바와 같이 이온 및 소분자 리간드를 사용하여 안정화될 수 있다. 삼중체의 안정화제는 본원에 참조에 의해 포함된, del Mundo et al, BBA - Molecular Cell Research 1866 (2019) 118539에 기술된 확장된 방향족 고리 구조를 가진 분자를 포함한다.
본원에서 상보적인 것으로 정의된 서열은 생리학적 조건 하에서 이중체를 형성할 수 있는 것이 바람직하다.
핵산 백신
본 발명의 벡터는 핵산, 선택적으로 DNA 백신으로서 특히 유용하다.
벡터는 숙주 세포에서의 발현, 특히 항원 생산을 위해 사용될 수 있다. DNA 또는 RNA 백신은 일반적으로 감염성 유기체의 변형된 형태 또는 일부를 코딩한다. DNA 또는 RNA 백신은 개체에 투여되고, 개체 내에서 감염성 유기체의 선택된 단백질을 발현하여, 그 단백질에 대한, 일반적으로 보호성인 면역 반응을 개시한다. DNA 또는 RNA 백신은 또한 암 면역요법 접근법에서 종양 항원을 코딩할 수 있다.
따라서, 본 발명의 벡터는 백신 조성물일 수 있다. 상기 조성물은 면역원성 효과를 증진시키기 위해 임의의 아쥬반트 서열을 더 포함할 수 있다. 백신 조성물은 이러한 백신의 용이한 발현을 허용하는 적합한 조직으로 표적화될 수 있다(targeted). 대표적인 것이 근육세포다. 백신이 암 백신인 경우, 벡터는 국소화된 반응을 허용하기 위해 암에 의해 영향을 받는 세포 유형에 표적호될 수 있고, 예를 들면, 전립선암 백신은 전립선 세포를 표적으로 할 수 있다.
유전자 치료
벡터는 개체가 해당 유전자의 기능장애 버전에 의해 유발되는 유전적 질환을 갖는 경우, 기능적 유전자 또는 그의 단편을 발현하기 위해 사용될 수 있다. 그러한 질환의 예는 당업계에 잘 알려져 있다. 예를 들어, 질환에 의해 영향을 받는 조직, 기관 또는 세포 유형에서 유전자 또는 그의 단편의 발현을 표적화하는 것, 예를 들어, 췌장에서 인슐린을 발현하도록 표적화하는 것이 바람직할 수 있다.
세포독소 전달
벡터는 세포에 세포독성인 유전자 또는 그의 단편을 발현하기 위해 사용될 수 있다. 이는 암의 치료에서 바람직하다. 벡터를 암 관련 마커를 발현하는 세포에 특이적으로 표적화함으로써, 세포를 사멸시킬 수 있다. 또한, 항박테리아 또는 항진균 접근법을 위해 동일한 접근이 취해질 수 있다. 이들은 인간 또는 동물인 개체의 감염을 유발했거나, 또는 환경 또는 산업적 공정 내에 존재할 수 있는 병원성 유기체일 수 있다. 벡터를 특정한 미생물에 표적화하는 것에 의해, 해당 미생물을 선택적으로 제거할 수 있다. 이는 예를 들어 병원성 박테리아만 표적화될 것이기 때문에, 치료학적으로 명확한 잇점을 가지며, 오염물, 예를 들면, 수역(bodies of water)의 시아노박테리아도 제거될 수 있기 때문에, 환경적으로, 및 산업적으로도 명확한 잇점을 갖는다.
세포독소는 아폽토시스 또는 세포 괴사에 의해 세포 사멸을 유도할 수 있는 임의의 적합한 단백질 또는 펩티드일 수 있다. 세포독소는 개체의 면역 세포에 의해 생성된 것일 수 있거나, 대안적으로 독 또는 식물로부터의 독소와 같이, 상이한 종으로부터 유래될 수 있다.
치료 용도
인간 또는 동물의 치료 용도를 위해, 특히 벡터에 박테리아 복제 원점이 결여되고, 내성 유전자(즉, 항생제에 대한 내성 유전자)가 결여되고, 메틸화의 원핵생물 패턴이 결여되고(동일한 것이 도움이 될 수 있는 백신 제외), 핵산을 숙주 세포에 대해 이질적인 것으로 식별하는 서열이 없는 것이 바람직하다.
벡터의 모든 가능한 치료 용도가 구상된다.
추가 기능
본 발명의 벡터는 변형된 뉴클레오티드를 포함할 수 있다. 하기 섹션에서 볼 수 있는 바와 같이, 벡터를 제조하는 한 가지 방법은 폴리머라아제 효소를 사용하는 것을 포함하므로, 반응에 변형된 뉴클레오티드를 공급하는 것이 가능하다. 변형된 뉴클레오티드는 소분자, 펩티드, 아쥬반트, 효능제(agonist), 길항제, 면역자극제, 마커, 비콘(beacon), 항체 또는 그의 단편 및/또는 단백질과 같은 다수의 다른 엔티티에 대한 부착 부위(attachment point)를 형성할 수 있다. 이러한 엔티티는 세포 내에서 기능을 가질 수 있고, 벡터에 의해 제공되는 유전자 또는 그의 단편을 보충하고, 및/또는 추가적인 표적화를 제공하는 역할을 할 수 있다. 예를 들어, 파클리탁셀과 같은 화학요법 약물은 암 세포를 표적화하기 위해 세포독성 유전자에 부착될 수 있다.
따라서, 본 발명의 벡터는 병용 요법(combined therapy)을 원하는 위치로 표적화할 수 있다.
벡터가 백신을 전달하는 경우, 아쥬반트, 면역 자극제 또는 효능제를 코딩하는 서열을 벡터에 포함시키거나, 본원에 기술된 부착 부위를 이용하여 벡터에 부착된 동일한 것을 공급하는 것이 가능하다. 이는 특히 암 백신과 관련이 있을 수 있다.
대안적으로, 벡터는 소분자, 펩티드, 아쥬반트, 효능제, 길항제, 면역자극제, 마커, 비콘, 항체 또는 그의 단편 및/또는 단백질과 같은 엔티티에 특이적인 추가 결합 모티프를 포함할 수 있다. 이는 벡터가 이러한 엔티티를 원하는 위치로 수송시킬 수 있게 할 것이다. 일 구체예에서, 캡핑된 말단 중 하나는 표적에 특이적인 결합 모티프(들)를 포함할 수 있는 반면, 나머지 캡핑된 말단은 소분자 약물과 같은 엔티티를 운반하는 결합 모티프를 포함한다.
또한, 이 기술은 추적을 허용하는 형광 뉴클레오티드와 같은 마커 및 추적자(tracer)의 벡터로의 회합을 허용한다.
벡터의 캡핑된 말단은 또한, 프라이머 결합 부위에 대한 위치 또는 프리마아제(primase)에 대한 인식 서열과 같은 추가 기능을 제공하기 위한 추가 서열을 포함할 수 있다.
벡터에 도입된 변형된 뉴클레오티드는 다른 엔티티의 연결을 허용하거나 전하 변형에 기여하거나 추적 가능한 마커를 제공할 수 있다. 그의 예가 하기 표 5에 기술된다:
새로운 특징 뉴클레오티드의 예 용도/잇점
클릭(click) 화학에 적합한 핵산 알킨-변형(alkyne-modified) 뉴클레오티드는 아지드 모이어티와 반응하여 트리아졸 링크를 형성함 항체, 효능제, 아쥬반트와 같은 엔티티 공격
전하 감소 알파-티올 뉴클레오티드 지질막 통과 및/또는 엔도솜 탈출 지원
형광 Cy5 또는 Cy3 결합 뉴클레오티드 세포 내 벡터 추적 및 위치 파악
변형된 뉴클레오티드는 벡터의 임의의 부분에 포함될 수 있다. 벡터를 제조하는 고유한 방법에서 알 수 있는 바와 같이, 변형된 뉴클레오티드는 이중체 섹션 및/또는 실제로 캡핑된 말단 중 하나 또는 둘 다에 추가될 수 있다.
벡터 제조
본원에 기술된 벡터는 본원에서 기술되는 고유한 방법을 이용하여 제조될 수 있다. 하기의 제조 방법은 두 개의 캡핑된 말단을 갖고, 그 중 적어도 하나는 폐쇄된 말단인 것인 벡터를 제조하기에 적합하다. 이 방법은 매우 효율적이며 채워지고(filled-in) 폐쇄될 수 있는 단일 가닥 중간체를 초기에 생산하는 것에 의해 대규모 생산을 가능하게 한다. 이 방법은 리가아제와 같은, 두 개의 유리 말단을 연결하는 효소의 사용에 의해 완전히 공유적으로 폐쇄된 벡터를 생산하도록 변형될 수 있다. 대안적으로, 두 개의 개방된 캡이 필요한 경우, 특정한 닉카아제(nickase)를 사용하여 캡에 닉을 도입할 수 있고, 이 닉카아제에 대한 특정 인식 부위를 벡터에 포함시킬 수 있다.
벡터를 제조하는 방법은 적절한 폴리머라아제 효소를 사용한 RCA(rolling circle amplification)에 의한 주형 핵산의 증폭에 의존하며, 그 결과, 연쇄체(concatemer)로 불리는, 주형의 다수의 반복물(repeat)을 포함하는 단일 가닥 핵산이 생산된다. 그 후, 이 단일 가닥 핵산 연쇄체는 벡터로 가공(process)될 수 있다. 따라서, 벡터는 처음에 핵산의 단일 가닥 합성을 통해 제조될 수 있다.
본 발명의 방법은 헤어핀의 이중 가닥 섹션이 효소 결합 및 절단을 허용하기 때문에 단일 가닥 중 적절한 효소에 의한 절단을 허용하는 염기쌍 섹션의 형성에 의존한다. 그 후, 이는 다수의 벡터의 연쇄체에서 각 개별 벡터를 분리한다.
이 방법으로 제조된 벡터는 구조 모티프로 각 말단이 캡핑된 이중체(그의 단일 가닥) 섹션을 가진 벡터이다. 이 경우, 구조 모티프는 단순하거나 복잡할 수 있다. 캡핑된 말단 중 하나는 이 방법에 따라 제조되는 경우, 폐쇄되고, 즉, 벡터는 전적으로 핵산의 하나의 가닥으로부터 제조되고, 반대쪽 말단은 단일 가닥의 5' 및 3' 말단 뉴클레오티드에 의해 형성되지 않는다. 추가 단계에서 벡터를 완전히 공유적으로 폐쇄시키는 것이 가능하다.
주형은 단일 가닥 핵산을 코딩한다. 주형은:
(i) 제1 구조 모티프에 인접한 제1 가공 모티프
(ii) 제1 구조 모티프,
(iii) 상기 이중체 섹션의 단일 가닥,
(iv) 제2 가공 모티프에 인접한 제2 구조 모티프
(v) 제2 가공 모티프를 코딩하고,
상기 가공 모티프는 절단 부위를 포함하는 엔도뉴클레아제에 대한 인식 부위를 포함하는 염기쌍 섹션을 형성할 수 있는 서열을 포함하고,
상기 구조 모티프는 분자내 수소 결합을 형성하고 캡핑된 말단을 형성할 수 있는 적어도 하나의 서열을 포함하고, 선택적으로(optionally), 상기 제1 또는 제2(좌측 또는 우측) 캡핑된 말단은 결합 모티프를 포함하는 구조 모티프를 포함한다.
주형은 RCA를 이용하여 증폭되어, 단일 가닥 연쇄체(single stranded concatemer)를 생성할 수 있다. 이 연쇄체는 엔도뉴클레아제를 사용하여 단일 가닥 중간체로 가공될 수 있다.
그 후, 단일 가닥 중간체를 제2 폴리머라아제와 접촉시키고, 이는 바람직하게는 가닥 치환이 아니고, 상기 중간체를 3' 말단을 신장하기 위한 주형으로 사용하여, 이중체 섹션을 형성한다.
가닥은 유리 5' 말단까지 연장될 수 있으며, 이 시점에, 벡터가 리가아제와 같은 효소와 접촉되고, 인접한 잔기 사이에서 닉이 폐쇄될 수 있다.
증폭 프로세스 또는 신장 프로세스는 기질(즉, 핵산 생성을 위한 적절한 뉴클레오시드) 및 임의의 보조 인자(예를 들어, 염, 이온 등)의 첨가를 필요로 할 것이다. 반응을 위한 적절한 조건은 완충액의 존재 및 효소가 작동할 수 있는 온도를 포함한다. RCA를 위한 적절한 조건은 등온일 수 있다. 가닥 연장을 위한 적절한 조건은 등온일 수 있다.
증폭은 핵산 주형의 복수의 카피를 생성하거나, 또는 핵산 주형에 상보적인 핵산 서열의 복수의 카피를 생성하는 것이다. 본 발명의 방법에서, 증폭은 핵산 주형에 상보적인 복수의 핵산 서열 카피의 생성을 의미하는 것이 바람직하다.
주형이 이중 가닥인 경우, 원하는 생성물에 상보적인 가닥이 주형으로 사용되는 것을 보장하는 기술이 이용되는 것이 바람직하다. 이는 하기에서 더 논의되는 여러 방법에 의해 달성될 수 있다.
증폭 또는 신장에서 사용되는 경우, 뉴클레오시드는 핵산 염기(핵염기)가 당 모이어티에 연결된 것인 화합물이다. 핵산 염기는 천연 또는 변형/합성 핵염기일 수 있다. 핵산 염기는 특히, 퓨린 염기(예를 들면, 아데닌 또는 구아닌), 피리미딘(예를 들면, 시토신, 우라실 또는 티민), 또는 데아자퓨린(deazapurine) 염기를 포함할 수 있다. 핵산 염기는 리보스 또는 데옥시리보스 당 모이어티일 수 있다. 당 모이어티는 천연 당, 당 대체물, 치환된 당 또는 변형된 당을 포함할 수 있다. 뉴클레오시드는 2'-히드록실, 2'-데옥시 또는 2',3'-디데옥시 형태의 당 모이어티를 포함할 수 있다.
뉴클레오티드 또는 뉴클레오티드 염기는 뉴클레오시드 포스페이트를 의미한다. 이는 천연, 합성 또는 변형된 뉴클레오티드, 또는 대리 교체 모이어티(surrogate replacement moiety)(예를 들어, 이노신)을 포함한다. 뉴클레오시드 포스페이트는 뉴클레오시드 모노포스페이트(NMP), 뉴클레오시드 디포스페이트(NDP) 또는 뉴클레오시드 트리포스페이트(NTP)일 수 있다. 뉴클레오시드 포스페이트의 당 모이어티는 리보오스와 같은 오탄당일 수 있다. 뉴클레오티드는 데옥시리보뉴클레오시드 트리포스페이트(dNTP) 또는 리보뉴클레오시드 트리포스페이트(rNTP)일 수 있으나, 이에 한정되지 않는다.
뉴클레오티드 유사체는 천연 뉴클레오티드와 구조적으로 유사한 화합물이다. 뉴클레오티드 유사체는 변경된 백본, 당 모이어티, 핵염기 또는 이들의 조합을 가질 수 있다. 이러한 유사체의 사용은 상이한 염기쌍-형성을 가질 수 있는 핵산을 초래하고 이러한 염기가 스택킹될 때 발생하는 상호작용은 천연 핵산에서 볼 수 있는 것과 상이할 수 있는 것으로 이해될 것이다.
증폭 반응 및/또는 연장 반응은 바람직하게는, 온도 순환을 필요로 하는 PCR과 같은 증폭과 달리, 등온(일정한 온도에서 일어남)이다. 이 방법은 임의의 적절한 주형, 바람직하게는 환형 핵산 주형(circular nucleic acid template)의 증폭에 이용될 수 있다. 핵산 주형은 최소량을 포함한, 반응에 적절한 양으로 제공될 수 있다.
핵산 주형은 RCA를 이용하여 증폭되는 것이 바람직하다.
증폭에 사용되는 폴리머라아제 효소 또는 효소들은 교정(proofreading) 또는 비-교정 핵산 폴리머라아제일 수 있다. 사용되는 핵산 폴리머라아제는 가닥 치환 핵산 폴리머라아제일 수 있다. 핵산 폴리머라아제는 호열성 또는 중온성 핵산 폴리머라아제일 수 있다.
이 방법은 고충실도(high fidelity) 증폭을 위한 조건에서 핵산 주형을 증폭하기 위해 높은 처리능(highly processive)의 가닥 치환 폴리머라아제를 필요로 할 수 있다. 폴리머라아제가 주형을 정확하게 복제하는 능력을 폴리머라아제의 충실도(fidelity)라고 한다. 정확한 뉴클레오티드 도입과 부정확한 뉴클레오티드 도입을 효과적으로 구별하는 것 외에도, 일부 폴리머라아제는 3'-5'(3' to 5') 엑소뉴클레아제 활성을 갖는다. 이 교정 활성은 부정확하게 포함된 염기를 절제하고, 올바른 염기로 교체하기 위해 사용된다. 고충실도 증폭은 주형의 충실한 복제를 제공하기 위해 낮은 오입률(misincorporation rate)과 교정 활성을 결합하는 폴리머라아제를 활용한다. 대안적으로, 비-가닥 치환(non-strand displacing) 효소를 헬리카아제와 함께 사용할 수 있다.
증폭 반응은 증폭 후 단일 가닥 증폭 핵산을 생성하는 폴리머라아제를 사용할 수 있다. 따라서, 이 폴리머라아제는 가닥 치환 합성을 수행할 수 있다.
일부 구체예에서, Phi29 DNA 폴리머라아제 또는 Phi29-유사 폴리머라아제가 주형을 증폭하기 위해 사용될 수 있다. 대안적으로, Phi29 DNA 폴리머라아제 및 또 다른 폴리머라아제의 조합이 사용될 수 있다.
증폭 반응은 본 방법의 하나의 버전에서 저 농도의 프라이머를 사용할 수 있다. 본 발명자들은 저 농도의 프라이머가 증폭 반응이 단일 가닥 핵산만을 생성할 수 있게 하므로, 저 농도의 프라이머가 유리하다는 것을 확인했다. 프라이머는 핵산 합성 반응을 프라이밍하기 위해 주형 내의 서열에 혼성화되는 짧은 선형 올리고뉴클레오티드이다. 프라이머는 RNA, DNA, 비천연 핵산 또는 이들의 혼합물과 같은 임의의 핵산일 수 있다. 프라이머는 천연, 합성 또는 변형된 뉴클레오티드를 포함할 수 있다.
대안적으로, 주형이 이중 가닥 환형 주형이라고 가정하면, 이중 가닥 주형의 하나의 가닥에 닉을 만들기 위해 닉킹 효소가 사용될 수 있다. 이것은 폴리머라아제를 위한 진입 부위(entry point)를 남기고, 그 후, 핵산 합성 반응을 프라이밍하기 위해 주형 자체의 닉이 생성된(nicked) 가닥을 이용한다.
따라서, 핵산 주형은 주형을 적어도 폴리머라아제 및 뉴클레오티드와 접촉시키고, 반응 혼합물을 핵산 증폭에 적합한 조건 하에서 인큐베이션시키는 것에 의해 증폭된다. 핵산 주형의 증폭은 등온 조건에서 수행될 수 있다. 추가적인 성분은 하기 중 하나 이상을 포함할 수 있다: 닉킹 효소(닉카아제), 보조인자(예를 들면, 마그네슘 이온), 프라이머, 프리마아제, 헬리카아제 및/또는 완충제.
환형 주형의 RCA는 주형에 의해 코딩된 인접한 다중 반복물(본원에서 각각은 서열 단위(sequence unit)로 지칭됨)을 갖는 선형 단일 가닥 연쇄체를 생성한다. 주형의 특성으로 인해, 각 서열 단위는 구조 모티프가 양측면에 있는(flanking) 이중체 형성을 위한 섹션을 포함하고, 외부 측면(outer flanking)에는 가공 모티프가 제공된다. 각각의 서열 단위는 또한 백본 서열을 포함할 수 있다.
연쇄체는 엔도뉴클레아제를 사용하여 핵산 구조체로 가공될 수 있다. 절단 부위가 구조 모티프의 말단 잔기를 방출한다.
연쇄체 핵산의 절단 부위가 필수 엔도뉴클레아제에 의해 절단되면, 이는 가공 모티프로부터 구조 모티프를 방출시켜, 적절한 조건에서 캡핑된 말단이 형성될 수 있게 한다.
증폭 및 가공(processing) 반응은 동시에 발생할 수 있다. 즉, 연쇄체가 형성되면 바로 연쇄체를 가공하기 위해 엔도뉴클레아제가 존재할 수 있거나, 증폭이 더 진행되거나 실제로 완료될 때까지 엔도뉴클레아제 추가가 지연될 수 있다.
이 방법의 초기 단계는 구조 모티프에 의해 형성된 캡핑된 말단이 있는 단일 가닥 핵산을 제조한다. 구조 모티프는 경우에 따라, 캡핑된 말단을 형성하기 위한 서열의 부분을 제공할 수 있고, 이는 두번째 단계에서 더 신장되어 완전한 캡핑된 말단을 형성한다. 3' 뉴클레오티드가 완전히 보호된 경우, 이 단일 가닥 핵산 중간체를 닉카아제와 접촉시켜 신장을 위해 3' 뉴클레오티드를 노출시키는 것이 필요할 수 있다.
이 방법의 다음 단계는 단일 가닥 핵산 중간체를 폴리머라아제 효소와 접촉시키는 것이다. 폴리머라아제 효소는 중간체의 유리 3' 말단을 신장시키고, "이중체 섹션"의 단일 가닥 부분을 주형으로 사용하여 이 섹션에 대한 상보적 서열을 합성하여 이중체를 형성한다. 따라서, 전체 "이중체 섹션"이 가닥의 신장에 의해 생성될 수 있다. 가닥은 중간체의 유리 5' 말단까지 신장되어, 2개의 인접한 잔기 사이에 닉만 남을 수 있다. 이 닉은 분자를 완전히 공유결합으로 폐쇄하기 위해 리가아제와 같은 적절한 효소를 사용하여 폐쇄시킬 수 있다.
두번째 단계는 가닥 치환형이 아닌 폴리머라아제를 필요로 할 수 있다. 하이브리드 이중체를 생성하기 위해, RNA 폴리머라아제를 포함한 임의의 적합한 폴리머라제일 수 있다. 적합한 효소는 Q5® High-Fidelity DNA Polymerase(NEB, US), Q5U® Hot Start High-Fidelity DNA Polymerase(NEB), Phusion® High-Fidelity DNA Polymerase(NEB), OneTaq® DNA Polymerase(NEB), Taq DNA Polymerase(NEB), LongAmp® Taq DNA Polymerase(NEB), Epimark® Hot Start Taq DNA Polymerase(NEB), T7 DNA Polymerase(NEB), DNA Polymerase I(NEB), SP6 RNA Polymerase(NEB), T7 RNA Polymerase(NEB), E.coli Poly(A) Polymerase(NEB), Poly(U) Polymerase(NEB), T3 RNA Polymerase(NEB), E.coli RNA Polymerase Core Enzyme(NEB), E.coli RNA Polymerase Holoenzyme(NEB), 또는 Hi-T7® RNA Polymerase(NEB)를 포함한다. 말단 트랜스퍼라아제도 본 발명의 방법에 사용하기에 적절할 수 있다.
증폭 단계 또는 신장 단계는 핵산을 합성하기 위해 적절한 뉴클레오티드의 존재 하에 수행될 수 있다. 변형된 뉴클레오티드를 벡터에 포함시키기 위해 이들 단계에 변형된 뉴클레오티드를 공급하는 것이 가능하다.
따라서, 본 벡터를 제조하는 방법은 명쾌하고 효율적이다.
주형
주형(1)에서, 이중체(104)의 하나의 가닥을 코딩하는 서열은 양쪽에서 구조 모티프(103)를 코딩하는 서열에 의해 플랭킹되고(flank), 외부 플랭킹에는 가공 모티프(101)가 제공된다. 코딩된 서열은 중첩되어(nested), 이중체 섹션이 구조 모티프에 의해 플랭킹되고, 구조 모티프는 다시 가공 모티프에 직접 접하고, 상기 구조 모티프 및 가공 모티프는 함께 포맷팅 요소(formatting element)를 형성한다. 따라서, 가공 모티프와 구조 모티프의 서열은 연속적이다. 달리 말하면, 이중체 섹션의 각 말단에 있는 포맷팅 요소는 반대 방향 또는 거울상(mirrored) 방향으로 되어 있어, 구조 모티프가 이중체 섹션에 가장 근접하고, 가공 모티프는 포맷팅 요소의 가장 바깥쪽 부분이 되게 한다.
포맷팅 요소는 독특하지만, 가공 모티프가 구조 모티프에서 절단되기 때문에, 최종 생성물에 완전한 형태로 존재하지 않는다. 가공 동안, 엔도뉴클레아제의 작용은 가공 모티프의 절단 부위가 절단되도록 하여, 가공 모티프를 제거한다. 따라서, 부분적으로 제거된 유용한 생성물을 생산하여, 최종 생성물에 불필요한 서열을 최소한으로 포함되도록 하고, 이중체 섹션에 더 많은 공간을 제공하게 하는 메커니즘이다. 따라서, 가공 모티프와 인접한 구조 모티프는 절단 부위가 절단될 때까지 효과적으로 연결되어, 생성물의 말단 잔기를 방출한다. 엔도뉴클레아제에 대한 절단 부위에 의해 효과적으로 분리된, 구조 모티프에 인접한 가공 모티프의 조합은 단일 단계 공정에서 엔도뉴클레아제를 사용하여 더 긴 단일 가닥 핵산 분자로부터 격리된(sequestered) 말단을 가진 단일 가닥 핵산의 직접적인 생산을 가능하게 한다. 가공 모티프는 제한 효소에 의한 처리를 통해 단일 가닥 핵산으로부터 제거되어, 격리된 말단을 갖는 단일 가닥 핵산에는 존재하지 않는다.
포맷팅 요소는 엔도뉴클레아제의 작용에 의해 효과적으로 절단되고, 따라서, 최종 생성물에서 부분적으로 제거된다.
가공 모티프 (Processing motif)
가공 모티프(101)는 엔도뉴클레아제에 대한 인식 부위 및 관련된 절단 부위를 포함하는 염기쌍 섹션(base-paired section)(201)을 형성할 수 있는 서열을 포함한다. 절단 부위는 인식 부위로부터 멀리 떨어져 있을 수 있지만, 두 부위 모두 일반적으로 이중체 구조에 있어야 한다는 것이 이해될 것이다.
하나의 포맷(format)에서, 가공 모티프는 가공 모티프 내에서 또 다른 서열에 결합할 수 있는 서열의 적어도 하나의 영역을 포함하기 때문에 염기쌍 섹션을 형성할 수 있으며, 이러한 섹션은 서열이 자기-상보적인(self-complementary) 것으로 보일 수 있다. 이 서열들은 연속적일 수 있거나 스페이서 요소에 의해 분리될 수 있다. 이러한 모티프는 단일 가닥 핵산에 서열의 상보적인 스트레치를 포함하여 설계할 수 있다. 두 서열 모두 핵산의 동일한 가닥에 존재하지만, 분자의 설계가 하나의 서열이 분자내에서 나머지 서열에 결합하기 위한 올바른 배향에 있다는 것을 보장한다는 것을 이해할 것이다. 예를 들어, DNA에서, 염기쌍이 형성되기 위해, 서열은 역평행해야 한다. 이러한 모티프는 예를 들어 바이러스 단일 가닥 게놈에서 일반적이다.
가공 모티프의 염기쌍 섹션은 인접하여 헤어핀 등을 형성할 수 있다. 핵산은 역평행 이중 가닥 헤어핀 유사 구조를 형성할 수 있다. 헤어핀 구조는 스템(stem)이라 불리는 이중 가닥 염기쌍 영역으로 구성된다. 대안적으로, 가공 모티프의 염기쌍 섹션은 스템-루프와 같은 구조가 형성되도록 염기쌍을 형성할 수 있는 서열의 2개의 스트레치(stretch) 사이에 스페이서 서열을 포함할 수 있다. 스페이서는 임의의 적절한 길이일 수 있다. 헤어핀은 본원에서 본원에서 정의된, 회문(palindromic)인 핵산 서열로 형성될 수 있다.
핵산 분자의 염기쌍 또는 이중 가닥 섹션은 또한 상보적인 서열을 가질 수 있다. 염기쌍 형성 및 듀플렉스는 본원에서 추가로 정의된다.
가공 모티프의 염기쌍 섹션에, 엔도뉴클레아제에 대한 인식 부위 및 관련된 절단 부위가 포함된다. 전체 가공 모티프가 필수 엔도뉴클레아제를 사용하여 단일 가닥으로부터 절단될 수 있도록 절단 부위가 염기쌍 섹션의 기부(footing)에 형성되는 것이 바람직하다.
염기쌍 형성은 단일 가닥 내에서 서열의 적어도 두 섹션 사이에서 일어난다. 이 염기쌍 형성은 표준일 수 있거나(즉, DNA의 아데닌(A)-티민(T), RNA의 아데닌(A)-우라실(U) 및 DNA 및 RNA의 시토신(C)-구아닌(G)인 왓슨 및 크릭 고전적 염기쌍) 또는 비-정규적(즉, 후그스틴(Hoogsteen) 염기쌍 또는 탄소-수소 및 산소/질소 기 등의 상호 작용)일 수 있다. 이들은 다른 곳에서 설명된다.
주형은 이러한 특징을 가진 가공 모티프를 코딩하는 하나 이상의 서열을 포함한다. 가공 모티프는 상이한 서열일 수 있다.
주형은 제1 가공 모티프를 코딩하는 서열 및 제2 가공 모티프를 코딩하는 서열을 포함할 수 있다. 주형에 의해 코딩된, 제1 및 제2 가공 모티프는 구조 모티프의 외부 가장자리(및 포맷팅 요소 내)에 배치되어, 이중체 섹션의 각 말단이 반대 배향(정방향 및 역방향)인 포맷팅 요소로 끝난다.
(가공 전) 단일 가닥 핵산 연쇄체에서 가공 모티프에 대한 요건의 속성을 고려할 때, 제1 및 제2 가공 모티프의 서열은 동일하거나 다를 수 있다. 그들이 동일한 경우, 제한 부위는 염기쌍 부분의 기부에 형성되어, 전체 가공 모티프가 필수 엔도뉴클레아제를 사용하여 단일 가닥으로부터 절단될 수 있다. 따라서, 이중체 섹션에 대한 가공 모티프의 배향(전 또는 후)에 관계없이, 절단 부위가 염기쌍을 형성한 섹션의 최종 염기쌍 또는 그 염기로도 기술될 수 있는, 염기쌍 섹션의 기부에 존재하기 때문에, 전체 가공 모티프가 핵산에서 절단될 수 있다.
대안적으로, 단일 가닥 핵산 연쇄체(가공 전)에서 제1 및 제2 가공 모티프는 다를 수 있고, 따라서, 절단 부위를 포함하는 엔도뉴클레아제에 대한 각 인식 부위도 달라서, 본 발명의 단일 가닥 연쇄체의 가공 시에 상이한 엔도뉴클레아제의 사용을 가능하게 한다.
따라서, 주형은 동일하거나 상이한 제1 및 제2 가공 모티프를 코딩하는 서열을 포함할 수 있다.
엔도뉴클레아제는 폴리뉴클레오티드 사슬 내의 포스포디에스테르 결합을 절단하는, 단백질 또는 DNA와 같은 핵산으로 구성된 효소이다. 본 발명에서, 격리된 말단을 갖는 핵산 분자를 생산하기 위해서, 이중 가닥 핵산을 통한 절단이 필요하다. 따라서, 각각 단일 가닥을 절단하는, 두 개의 엔도뉴클레아제의 조합이 필요할 수 있다. 대안적으로, 두 가닥을 모두 절단하는 단일 효소가 사용될 수 있다. 엔도뉴클레아제는 예를 들어, 닉킹 엔도뉴클레아제, 호밍(homing) 엔도뉴클레아제, Cas9와 같은 가이드 엔도뉴클레아제 또는 제한 엔도뉴클레아제일 수 있다. 닉킹 엔도뉴클레아제는 한 가닥만 절단하도록 변형된, 변형된 제한 엔도뉴클레아제일 수 있다.
일 양태에서, 엔도뉴클레아제는 제한 엔도뉴클레아제이다.
제한 엔도뉴클레아제는 특정 인식 부위 내 또는 그 부근의 절단 부위에서 이중 가닥 핵산을 절단하는 효소이다. 절단하기 위해, 모든 제한 엔도뉴클레아제는 이중체의 각 백본(즉, 각 가닥)을 통해 1개씩, 두 개의 절개를 만든다. 제한 엔도뉴클레아제는 인식 부위를 인식하기 위해 이중 가닥 핵산의 존재를 필요로 하므로, 엔도뉴클레아제가 핵산을 절단할 수 있도록 하기 위해서는 이러한 구조가 필요하다. 따라서, 본 발명자들은 단일 가닥 분자가 인식 및 절단 부위를 포함하는 이중 가닥 구조를 형성하도록, 바람직하게는 자기-상보적 서열을 이용하여, 단일 가닥 핵산 내에 염기쌍 섹션의 구축을 제안한다.
제한 엔도뉴클레아제는 뉴클레오티드의 특이적 서열을 인식하고, 이중체에 이중 가닥 절단을 생성한다. 인식 부위는 또한 염기의 수에 따라 분류될 수 있으며, 일반적으로 4개에서 8개의 염기일 수 있다. 전부는 아니지만 많은 인식 부위가 회문(palindromic)이며, 이 특성은 염기쌍 섹션에 더 쉽게 배치할 수 있도록 서열 설계를 돕기 때문에 가공 모티프를 설계할 때 매우 유용한다. 단일 가닥 포맷에서, 서로 염기쌍을 이룰때 회문을 형성할 수 있는 섹션을 역반복(inverted repeat) 서열이라고 한다. 이러한 2개의 서열은 단일 가닥 핵산에서 스페이서 서열에 의해 분리될 수 있다.
제한 엔도뉴클레아제는 평활 절단형(blunt cutter)(즉, 염기쌍 섹션을 통한 일직선으로 절단)이거나 오프셋 방식 절단형(즉, 절단이 염기쌍 섹션을 통해 엇갈리게(staggered) 이루어짐)일 수 있다. 절단 부위는 인식 부위 내에 또는 근처에 있을 수 있고, 따라서, 절단 부위는 인식 부위의 일부일 필요가 없다. 따라서, 절단 부위는 인식 부위와 연관되지만 반드시 그의 일부를 형성하지는 않는다.
천연 및 조작된(engineered) 수천 개의 제한 엔도뉴클레아제가 인식 및 절단 부위와 함께 알려져 있다. 임의의 적합한 인식 및 절단 부위가 가공 모티프에 포함될 수 있다. 클로닝 등에 일반적으로 사용되는 예시적인 제한 엔도뉴클레아제는 HhaI, HindIII, NotI, EcoRI, ClaI, BamHI, BglII, DraI, EcoRV, PstI, SalI, SmaI, SchI 및 XmaI이다. New England Biolabs 및 ThermoFisher Scientific과 같은 공급업체에서 많은 제품이 상업적으로 입수가능하다.
엔도뉴클레아제를 사용한 절단이 단일 가닥 핵산 연쇄체의 포맷팅 요소로부터 구조적 모티프를 방출시키기 위해, 절단 부위가 주형의 구조적 모티프에 인접하여, 구조 모티프의 말단 뉴클레오티드가 단일 가닥 핵산 분자 중간체의 말단(terminal) 잔기 및 말단을 형성하는 것이 바람직하다.
주형 내에, 코딩된 것은 포맷팅 요소이며, 그의 일 부분은 중간체 단일 가닥 핵산 분자 및 최종 벡터에서 폴딩되도록 설계된 구조 모티프를 코딩하는 서열이다. 구조 모티프는 단일 가닥 핵산 분자 중간체의 말단(즉, DNA 및 RNA에 대한 5' 및 3' 말단)을 보호(secure)할 수 있어, 3' 및 5' 말단이 궁극적으로 연결될 수 있으며, 특히 3' 말단이 신장을 위한 프라이머로 작용한다.
구조 모티프
구조 모티프(103)는 내부적으로 염기쌍 섹션 또는 이중체를 형성할 수 있는 서열(105 및 106)을 포함한다. 이 염기쌍 섹션 또는 이중체는 엔도뉴클레아제에 의한 처리 전에 연쇄체에서 형성될 수 있거나 엔도뉴클레아제로 처리한 후에, 가공 모티프가 연쇄체에서 제거된 후에 형성될 수 있다. 이러한 구조는 가공 모티프가 엔도뉴클레아제에 의해 절단되어야 형성될 수 있다.
이중체는 단일 가닥 내에서 적어도 2개의 서열 섹션 사이의 염기쌍 형성에 의해 형성될 수 있다. 이 염기쌍 형성은 표준일 수 있거나(즉, DNA의 아데닌(A)-티민(T), RNA의 아데닌(A)-우라실(U) 및 DNA 및 RNA의 시토신(C)-구아닌(G)인 왓슨 및 크릭 고전적 염기쌍) 또는 비-정규적(즉, 후그스틴(Hoogsteen) 염기쌍, 또는 탄소-수소 및 산소/질소 기 등의 상호 작용)일 수 있다. 후그스틴 쌍은 G-사중체로 불리는, 단일 가닥 핵산 G-풍부 세그먼트, 또는 i-모티프로 불리는 C-풍부 세그먼트의 특정 구조 형성을 허용한다. G-사중체는 일반적으로 짧은 스페이서에 의해 분리된, 4개의 G 삼중체(triplet)가 필요하다. 이것은 후그스틴 결합 구아닌 분자의 스택킹된 회합으로 구성된 평면 사중체(quartet)의 조립을 허용한다.
따라서. 구조 모티프는 자기-상보적이거나, 또는, 단일 가닥 핵산 분자 내의 다른 서열, 즉 이중체 섹션 또는 이중체 섹션 내의 스페이서 서열에 대해 상보적인 서열의 섹션을 포함할 수 있다.
구조 모티프는 1개 초과의 염기쌍 섹션 또는 이중체를 형성하기 위한 서열을 포함할 수 있으며, 이들 각각은 단일 가닥 핵산의 스페이서 서열에 의해 분리되거나, 염기쌍 섹션 또는 이중체는 하기 중 하나 이상을 포함할 수 있는 더 큰 구조의 일부를 형성할 수 있다: 헤어핀; 단일 가닥 영역; 벌지 루프; 내부 루프; 다중 분기 루프 또는 접합부(junction). 구조 모티프는 벡터와 관련하여 전술한 바와 같을 수 있다. 구조 모티프는 결합 모티프를 포함할 수 있으며, 이는 또한 벡터와 관련하여 전술한 바와 같다.
구조 모티프가 적어도 하나의 염기쌍 섹션 또는 듀플렉스를 형성하면, 단일 가닥 핵산 분자의 말단 잔기가 보호될 수 있다. 단일 가닥 DNA의 말단에 있는 말단 뉴클레오티드(또는 잔기)는 바람직하게는 중간체의 다른 잔기와 염기 쌍을 이룬다. 이는 말단 잔기가 폴리머라아제 효소에 의한 신장이나, 신장된 가닥으로의 라이게이션에 적합하게 한다.
단일 가닥 핵산 중간체에서 종말 말단(말단 뉴클레오티드)이 단일 가닥 형태가 아닌 것이 바람직하다. 이들 말단은 각각의 말단 잔기와 단일 가닥 핵산 중간체의 또 다른 부분 사이의 염기쌍의 존재에 의해 안정화된다.
연쇄체(concatemeric) 핵산 분자의 구조 모티프는 일단 가공되면, 단일 가닥 핵산 구조체의 일 말단을 형성한다. 말단 잔기는 일반적으로 구조 모티프에 의해 보호(확보)된다.
본 발명에 따른 바람직한 구조 모티프는 헤어핀, 스템 루프, 접합부, 유사매듭, ITR, 변형된 ITR, 합성 ITR, i-모티프 및 G-사중체로서 폴딩될 수 있는 서열을 포함한다. 구조 모티프는 전술한 바와 같을 수 있다.
헤어핀은 핵산의 단일 가닥의 인접한 상보적 서열 사이의 염기쌍 형성으로 인해 형성된, DNA 또는 RNA와 같은 핵산의 구조이다. 이웃하는 상보적 서열은 수개의 뉴클레오티드, 예를 들어 1-10 또는 1-5개의 뉴클레오티드에 의해 분리될 수 있다. 상보적 서열의 2개의 섹션 사이에 비상보적 서열의 루프가 포함되면, 이는 헤어핀 루프 또는 스템 루프를 형성한다. 루프는 스템 또는 이중 가닥 섹션과 같이 임의의 적합한 길이일 수 있다. 다른 유사한 구조는 라리엇(lariats)을 포함한다.
각 말단의 구조 모티프는 동일한 특정 구조(즉, 헤어핀, 스템 루프, ITR 등)로 폴딩되거나, 또는 각각 독립적으로 다른 구조로 폴딩되도록 설계될 수 있다(즉, 제1 말단은 헤어핀이고, 제2 말단은 ITR이다).
앞서 논의된 바와 같이, 구조 모티프는 전술된 바와 같이 결합 모티프를 포함할 수 있다. 그들은 압타머 등과 같은 기능적 구조를 형성할 수 있다. 예시된 방법에서, 2개의 상보적 서열(105 및 106)이 구조 모티프 내에서 결합 모티프를 플랭킹한다. 그러한 설계는 발명자가 구조 모티프가 본 발명의 방법에 사용하기에 적합함을 보장하면서 결합 모티프에 대한 중앙 섹션을 대안적 모티프로 대체할 수 있게 하고, 플랭킹 상보적 서열이 결합 모티프를 "지지(support)"하는 스템 구조의 형성을 보장하기 때문이다.
이중체
주형은 또한 이중체 섹션의 단일 가닥을 코딩한다. 이중체 섹션은 임의의 적합한 길이의 임의의 원하는 핵산 서열일 수 있다.
이중체 섹션은 바람직하게는, 선택적으로 발현 카세트 내에, 유전자 또는 그의 단편을 포함한다. 이중체 섹션은 세포에서 발현하기 위한 이식유전자, 예를 들면, 유전자 또는 유전 물질을 포함할 수 있다. 이식유전자는 발현 카세트 내에서 프로모터 서열에 작동가능하게 연결될 수 있다.
이중체 섹션은 치료제(therapeutic product)를 코딩하는 서열을 포함할 수 있다. 치료제는 DNA 압타머, 단백질, 펩티드, 또는 작은 간섭 RNA와 같은 RNA 분자일 수 있다. 치료적 유용성을 제공하기 위해, 이러한 이중체 섹션은 하나 이상의 프로모터 또는 인핸서 요소 및 목적 mRNA 또는 단백질을 코딩하는 유전자 또는 기타 코딩 서열을 포함하는 발현 카세트를 포함할 수 있다. 발현 카세트는 목적 단백질을 코딩하는 서열에 작동가능하게 연결된 진핵 프로모터, 및 선택적으로, 인핸서 및/또는 진핵 전사 종결 서열을 포함할 수 있다.
이중체 섹션은 숙주 세포에서 발현하기 위한 DNA의 생산, 특히 DNA 백신의 생산에 사용될 수 있다. DNA 백신은 일반적으로, 전체 게놈과 같은 감염성 유기체의 DNA의 변형된 형태를 코딩한다. DNA 백신은 개체에 투여되고, 개체 내에서 감염성 유기체의 선택된 단백질을 발현하여, 그 단백질에 대한, 일반적으로 보호성인 면역 반응을 개시한다. DNA 백신은 또한 암 면역요법 접근법에서 종양 항원을 코딩할 수 있다. 임의의 DNA 백신을 이중체 섹션으로 사용할 수 있다.
또한, 본 발명의 방법은 다른 유형의 치료용 DNA 분자, 예를 들어 유전자 요법에 사용되는 것들을 생성할 수 있다. 예를 들어, 그러한 DNA 분자는, 개체가 해당 유전자의 기능장애 버전에 의해 유발된 유전적 장애가 있는 경우, 기능성 유전자를 발현하기 위해 사용될 수 있다. 그러한 질병의 예는 당업계에 잘 알려져 있다.
이중체 섹션 또는 구조 모티프를 코딩하는 주형의 부분에는 박테리아 복제 기원이 결여되고, 내성 유전자(즉, 항생제에 대한 내성 유전자)가 결여되고, 메틸화의 원핵생물 패턴(동일한 것이 도움이 될 수 있는 백신 제외) 또는 외래 DNA의 기타 마커가 결여되는 것이 바람직하다. 그러나, 주형의 나머지가 처리되고, 생성물로부터 제거되므로, 이러한 엔티티는 이중체 섹션 및 구조 모티프 외부에 존재할 수 있다.
주형은 바람직하게는 환형이거나 환형화할 수 있다. 주형은 이중 가닥 또는 단일 가닥일 수 있다.
주형이 이중 가닥인 경우, 주형은 제1 가공 모티프 전에 닉킹 효소에 대한 서열을 포함하는 것이 바람직하다. 대안적으로, 닉킹 엔도뉴클레아제(nicking endonuclease)로도 알려진 이 효소는 이중체의 한 가닥만을 가수분해하여, 절단이 아닌, "닉킹된(nicked)" 핵산 분자를 생성한다. 이는 추가 프라이머에 대한 요구 없이, 롤링 서클 증폭(RCA)을 위한 시작점을 제공하고 증폭 반응에서 핵산 연쇄체의 하나의 가닥만이 생성되는 것을 보장할 수 있다. 이러한 효소는 예를 들어 New England Biolabs 및 Thermo Fisher Scientific에서 상업적으로 입수할 수 있다. 이러한 효소는 정확한 가닥이 주형으로 직접 사용되도록 주형의 적합한 가닥에 인식 및 절단 부위를 설계할 수 있을 정도로 충분히 특이적이다.
주형은 임의의 적합한 핵산, DNA 또는 RNA와 같은 천연 핵산이거나, 이전에 논의된 바와 같이, 인공 핵산일 수 있다. 주형은 DNA인 것이 바람직하다.
생성된 핵산은 DNA, RNA 또는 이들의 하이브리드와 같은 임의의 적합한 핵산일 수 있다. DNA 벡터가 바람직하다. 벡터는 변형된 염기를 포함할 수 있으므로 간단한 화학적 수단을 사용하여 다른 엔티티가 벡터에 연결될 수 있다.
주형의 증폭
단일 가닥 핵산 중간체를 생산하기 위해서, 주형을 효소적으로 증폭시켜야 한다.
주형은 하나 이상의 폴리머라아제 효소로 증폭될 수 있다. 폴리머라아제 효소는 핵산을 증폭시키기 위해 충분한 원료 또는 기질(예를 들면, 뉴클레오티드) 및 보조 인자(예를 들면, 금속 이온 등)가 제공되는 경우, 주형을 사용하여 상보적인 핵산 카피를 합성할 수 있다.
임의의 적합한 폴리머라아제 효소가 이 증폭 단계에 사용될 수 있으며, 하나의 효소 또는 효소의 조합을 사용할 수 있다.
상기 효소는 주형의 특성에 따라 DNA 폴리머라아제 또는 RNA 폴리머라아제, 또는 합성 주형을 사용하거나 합성 단일 가닥 핵산을 제조하기 위해 인공, 변형된, 조작된, 또는 돌연변이 폴리머라아제일 수 있다.
증폭은 가닥 치환 방법을 통해 진행하는 것이 바람직하다. 이것은 (PCR 처럼) 가열 및 냉각의 반복된 주기가 필요하지 않은 등온 방법이지만, 폴리머라아제 효소는 주형에 어닐링된 임의의 가닥을 치환시킬 수 있다. Phi29, Deep Vent®, BST DNA 폴리머라아제 I 및 그의 변이체를 포함한, 가닥-치환형 폴리머라아제가 알려져 있다. 이는 여러 폴리머라아제가 동일한 주형에 동시에 작용할 수 있고, 각 중합효소는 이전 중합효소에 의해 생성된 초기(nascent) 가닥을 대체한다는 것을 의미한다.
가장 바람직한 가닥 치환 증폭(strand displacement amplification) 기술은 롤링 서클 증폭(RCA)이다. 이 증폭 방법에서, 가닥 치환 중합효소는 초기 올리고뉴클레오티드를 신장시키면서, 환형 주형 주위를 지속적으로 진행한다. 이것이 핵산의 긴 연쇄체 가닥의 생성을 가져온다.
닉킹 엔도뉴클레아제로 주형을 닉킹함으로써 이중 가닥 환형 주형에서 증폭 반응이 개시되도록 하는 것이 바람직하다. 이러한 효소는 위에서 검토된다. 이중 가닥 주형의 단일 가닥을 닉킹시키는 것에 의해, 폴리머라아제가 결합할 수 있도록 주형을 개방하고, 환형 주형 주위를 따라 여러 차례 처리하는 것에 의해, 생성된 유리 3' 말단을 이용하여 이 가닥을 연쇄체 핵산으로 신장시킬 수 있다.
주형의 닉킹 부위와 닉킹 엔도뉴클레아제를 사용하면 RCA로부터 단일 가닥 연쇄체를 만드는 방법만 허용되고, 상기 효소를 사용하여 단 하나의 백본만 절단되기 때문에, 반대 가닥의 증폭을 방지할 수 있다.
따라서 주형 중 닉킹 부위를 사용하는 것이 바람직하고, 이는 원하는 생성물의 생산을 허용하고, 이중 가닥 주형의 상보적 가닥의 원치 않는 증폭을 방지하기 때문이다.
대안적으로, 본 발명자들은 원하는 주형 가닥에 어닐링하도록(그의 상보적 가닥에는 어닐링되지 않음) 설계된 매우 적은 양의 특이적 프라이머를 사용하여, 이중 가닥 주형의 단 하나의 가닥만을 대량으로 제조하도록 증폭이 진행되게 할 수 있다는 것을 발현했다. 이 양태에서, 피코몰 양(picomolar quantity)의 프라이머만 요구된다. 따라서, 프라이머는 1 pM 내지 100 nM의 양으로 공급될 수 있다.
주형이 단일 가닥인 경우, 프라이머를 사용하여 롤링 서클 증폭을 개시할 수 있다. 바람직하게는, 프라이머는 주형에만 어닐링하고 연쇄체 핵산 분자에는 어닐링하지 않도록 설계되어, 단 하나의 종(species)의 연쇄체가 제조되는 것을 보장한다.
주형은 적어도 하나의 폴리머라아제와 접촉된다. 1종, 2종, 3종, 4종 또는 5종의 상이한 폴리머라아제가 사용될 수 있다. 폴리머라아제는 핵산의 중합체를 합성하는 임의의 적합한 폴리머라아제일 수 있다. 폴리머라아제는 DNA 또는 RNA 폴리머라아제일 수 있다. 임의의 상업적으로 입수가능한 폴리머라아제를 포함한, 임의의 폴리머라아제가 사용될 수 있다. 2종, 3종, 4종, 5종 또는 그 이상의 상이한 폴리머라제가 사용될 수 있으며, 예를 들어 교정 기능을 제공하는 1종의 폴리머라아제와 그렇지 않은 1종 이상의 다른 폴리머라아제가 사용될 수 있다. 상이한 메커니즘을 갖는 폴리머라아제, 예를 들어 가닥 치환형 폴리머라아제 및 다른 방법에 의해 핵산을 복제하는 폴리머라아제가 사용될 수 있다. 가닥 치환 활성을 갖지 않는 DNA 폴리머라아제의 적합한 예는 T4 DNA 폴리머라아제이다.
폴리머라아제는 공정 조건 하에서 연장된 인큐베이션에 의해 활성이 실질적으로 감소되지 않도록 매우 안정적일 수 있다. 따라서, 이 효소는 바람직하게는 온도 및 pH를 포함하지만 이에 제한되지 않는 다양한 공정 조건 하에서 긴 반감기를 갖는다. 또한 폴리머라아제는 제조 공정에 적합한 하나 이상의 특징을 갖는 것이 바람직하다. 폴리머라아제는 바람직하게는 예를 들어 교정 활성을 가짐으로써 높은 충실도를 갖는다. 또한, 폴리머라아제는 높은 처리능(processivity), 높은 가닥 치환 활성 및 뉴클레오티드 및 핵산에 대한 낮은 Km을 보이는 것이 바람직하다. 폴리머라아제는 환형 및/또는 선형 DNA를 주형으로 사용할 수 있다. 폴리머라아제는 이중 가닥 또는 단일 가닥 핵산을 주형으로 사용할 수 있다. 폴리머라아제는 그의 교정 활성과 관련되지 않은 엑소뉴클레아제 활성을 나타내지 않는 것이 바람직하다.
당업자는 시판되는 폴리머라아제, 예를 들어, Phi29 (New England Biolabs, Inc., Ipswich, MA, US), Deep Vent® (New England Biolabs, Inc.), Bst(Bacillus stearothermophilus) DNA 폴리머라아제 I (New England Biolabs, Inc.), DNA 폴리머라아제 I의 클레나우(Klenow) 단편 (New England Biolabs, Inc.), M-MuLV 역전사효소 (New England Biolabs, Inc.), VentR®(exo-minus) DNA 폴리머라아제 (New England Biolabs, Inc.), VentR® DNA 폴리머라아제 (New England Biolabs, Inc.), Deep Vent® (exo-) DNA 폴리머라아제 (New England Biolabs, Inc.), Bst DNA 폴리머라아제 큰 단편(large fragment) (New England Biolabs, Inc.), 고-충실도(hi-fidelity) 융합 DNA 폴리머라아제 (예를 들면, Pyrococcus-like, New England Biolabs, MA), 피로코커스 퓨리오수스(Pyrococcus furiosus)로부터의 Pfu DNA 폴리머라아제 (Agilent, La Jolla, CA), T7 DNA 폴리머라아제의 Sequenase™ 변이체, T7 DNA 폴리머라아제, T4 DNA 폴리머라아제, 피로코커스 종 GB-D로부터의 DNA 폴리머라아제 (New England Biolabs, MA), 또는 써모코커스 리토랄리스(Thermococcus litoralis)로부터의 DNA 폴리머라아제(New England Biolabs - NEB, MA)에 의해 보여지는 특성의 비교에 의해, 주어진 폴리머라아제가 앞서 정의된 특징을 보이는지 여부를 결정할 수 있다.
대안적으로, 폴리머라아제는 DNA-의존성 RNA 폴리머라아제일 수 있다. 예시적인 효소는 T3 RNA 폴리머라아제, T7 RNA 폴리머라아제, Hi-T7™ RNA 폴리머라아제, SP6 RNA 폴리머라아제, 대장균 폴리(A) 폴리머라아제, 대장균 RNA 폴리머라아제, 및 대장균 RNA 폴리머라아제, Holoenzyme(모두 NEB로부터 구입가능함)을 포함한다.
높은 처리능이 언급되는 경우, 이는 일반적으로 주형과의 회합/해리당 폴리머라아제 효소에 의해 추가되는 뉴클레오티드의 평균 개수, 즉, 단일 회합 이벤트에서 수득되는 프라이머 신장의 길이를 나타낸다.
가닥 치환형 폴리머라아제가 바람직하다. 바람직한 가닥 치환형 폴리머라아제는 Phi29, Deep Vent 및 Bst DNA 폴리머라아제 I 또는 이들의 변이체이다. "가닥 치환(strand displacement)"은 합성 동안 폴리머라아제가 이중 가닥 DNA의 영역과 접촉할 때 상보적 가닥을 치환하는 능력을 기술한다. 따라서, 주형은 상보적 가닥을 치환하고, 새로운 상보적 가닥을 합성하는 것에 의해 증폭된다. 따라서, 가닥 치환 복제 동안, 새로 복제된 가닥이 치환되어 폴리머라아제가 추가적인 상보적 가닥을 복제할 수 있는 자리를 내줄 것이다. 증폭 반응은 프라이머 또는 단일 가닥 주형의 유리 말단이 주형의 상보적 서열에 어닐링되면 개시된다(둘 다 프라이밍 이벤트임). 핵산 합성이 진행되고, 추가 프라이머 또는 주형에 어닐링된 다른 가닥을 만나면, 폴리머라아제가 이를 대체하고 가닥 신장을 계속한다. 이중 가닥 주형이 새로운 가닥의 지속적인 합성에 장애가 되지 않기 때문에, 변성의 주기가 효율적인 증폭에 필수적이지 않다는 점에서 가닥 치환 증폭 방법은 PCR 기반 방법과 다르다는 것을 이해해야 한다. 가닥 변위 증폭은, 초기 주형이 이중 가닥인 경우, 초기 주형을 변성시키고, 사용되는 경우, 프라이머가 프라이머 결합 부위에 어닐링할 수 있도록 1회의 초기 가열만 필요할 수 있다. 그 후, 증폭은 더 이상 가열이나 냉각이 필요하지 않기 때문에, 등온으로 기술될 수 있다. 대조적으로, PCR 방법은 이중 가닥 DNA를 용융시키고, 새로운 단일 가닥 주형을 제공하기 위해, 증폭 과정 동안 변성의 주기(즉, 섭씨 94도 이상으로 온도 상승)를 필요로 한다. 가닥 치환 동안 폴리머라아제는 이미 합성된 핵산의 가닥을 치환할 것이다.
본 발명의 방법에 사용되는 가닥 치환 폴리머라아제는 바람직하게는 20 kb 이상, 보다 바람직하게는 30 kb 이상, 50 kb 이상, 또는 70 kb 이상의 처리능을 갖는다. 일 구체예에서, 가닥 치환 DNA 폴리머라아제는 phi29 DNA 폴리머라아제에 필적하거나 또는 더 큰 처리능을 갖는다.
주형과 폴리머라아제 및 닉카아제 또는 프라이머의 접촉은 주형에 대한 프라이머의 어닐링을 촉진하는 조건 하에서 일어날 수 있다. 그 조건은 프라이머의 혼성화를 허용하는 단일 가닥 DNA의 존재를 포함한다. 그 조건은 또한 프라이머의 주형으로의 어닐링을 허용하는 온도 및 완충액을 포함된다. 프라이머의 특성에 따라, 적절한 어닐링/혼성화 조건을 선택할 수 있다. 본 발명에서 사용되는 바람직한 어닐링 조건의 예는 30 mM Tris-HCl pH 7.5, 20 mM KCl, 8 mM MgCl2를 포함하는 완충액을 포함한다. 어닐링은, 열을 사용하는 변성에 이어 원하는 반응 온도로의 점진적인 냉각에 의해 수행될 수 있다.
주형 및 폴리머라아제는 또한 뉴클레오티드와 접촉한다. 주형, 폴리머라아제 및 뉴클레오티드의 조합은 반응 혼합물을 형성한다. 반응 혼합물은 또한 하나 이상의 프라이머, 또는 대안적으로 닉킹 효소(nickase) 또는 프라이밍 효소(프리마아제)를 포함할 수 있다. 반응 혼합물은 또한 독립적으로 하나 이상의 금속 양이온 또는 핵산 합성에 필요한 임의의 다른 보조 인자를 포함할 수 있다.
뉴클레오티드는 핵산의 단량체 또는 단일 단위이며, 뉴클레오티드는 함질소(nitrogenous) 염기, 5탄당(리보오스 또는 데옥시리보오스) 및 적어도 하나의 인산기로 구성된다. 임의의 적합한 뉴클레오티드가 사용될 수 있다.
뉴클레오티드는 유리산, 그들의 염 또는 킬레이트, 또는 유리산 및/또는 염 또는 킬레이트의 혼합물로 존재할 수 있다.
뉴클레오티드는 1가 금속 이온 뉴클레오티드 염 또는 2가 금속 이온 뉴클레오티드 염으로서 존재할 수 있다.
함질소 염기는 아데닌(A), 구아닌(G), 티민(T), 시토신(C) 및/또는 우라실(U)일 수 있다. 함질소 염기는 또한 5-메틸시토신(m5C), 슈도우리딘(Ψ), 디히드로우리딘(D), 이노신(I) 및/또는 7-메틸구아노신(m7G)과 같은 변형된 염기일 수 있다.
5탄당이 데옥시리보오스이어서, 뉴클레오티드는 데옥시뉴클레오티드인 것이 바람직하다.
뉴클레오티드는 dNTP로 표시되는 데옥시뉴클레오시드 트리포스페이트의 형태일 수 있다. 이것은 본 발명의 바람직한 구체예이다. 적합한 dNTP는 dATP(데옥시아데노신 트리포스페이트), dGTP(데옥시구아노신 트리포스페이트), dTTP(데옥시티미딘 트리포스페이트), dUTP(데옥시우리딘 트리포스페이트), dCTP(데옥시시티딘 트리포스페이트), dITP(데옥시이노신 트리포스페이트), dXTP(데옥시크산토신 트리포스페이트), 및 이들의 유도체 및 변형된 버전을 포함할 수 있다. dNTP는 dATP, dGTP, dTTP 또는 dCTP, 또는 이들의 변형된 버전 또는 유도체 중 하나 이상을 포함하는 것이 바람직하다. dATP, dGTP, dTTP 및 dCTP, 또는 이들의 변형된 버전의 혼합물을 사용하는 것이 바람직하다.
뉴클레오티드는 용액 상태이거나 동결건조된 형태로 제공될 수 있다. 뉴클레오티드의 용액이 바람직하다.
뉴클레오티드는 임의의 새롭게 설계된 인공 염기를 포함한 하나 이상의 적합한 염기, 바람직하게는 아데닌(A), 구아닌(G), 티민(T), 시토신(C) 중 하나 이상의 혼합물로 제공될 수 있다. 2개, 3개 또는 바람직하게는 4개의 모든 뉴클레오티드(A, G, T 및 C)가 핵산을 합성하는 과정에서 사용된다.
연쇄체 (Concatemer)
연쇄체는 주형에 존재하는 서열 단위의 반복된 단위를 갖는 핵산 분자이다. 각 서열 단위는 전술된 바와 같이, 포맷팅 요소가 양측에 플랭킹된 이중체 섹션에 대한 서열을 포함한다. 서열 단위는 또한 주형에 의해 코딩된 백본 서열을 포함할 수 있고, 이 서열은 본 발명의 벡터에 궁극적으로 존재하지 않는다.
연쇄체 핵산 분자는 복수의 서열 단위, 예를 들어 10, 50, 100, 200, 500 또는 심지어 1000개 이상의 연속된 서열 단위를 포함할 수 있다. 연쇄체 분자는 크기가 적어도 5 kb, 적어도 50 kb, 적어도 100 kb 또는 최대 200 kb 길이일 수 있다.
연쇄체 핵산 분자의 가공(processing)
주형이 증폭되면, 또는 증폭 중에도, 연쇄체 핵산은 하나 이상의 가공 부위를 절단할 필수 엔도뉴클레아제를 사용하여 단일 가닥 중간체로 가공될 수 있다.
따라서, 가공 모티프는 연쇄체 핵산의 형태로, 염기쌍 부분을 형성할 수 있는 것이 바람직하다. 따라서, 가공 모티프는 염기쌍이 등온 증폭에 적합한 조건 하에서 형성되도록 설계될 수 있다. 이러한 염기쌍 부분이 연쇄체 핵산 내에 형성되면, 필요한 절단 부위와 함께 엔도뉴클레아제에 대한 인식 부위가 형성된다. 이러한 명쾌한 시스템은 핵산의 단일 가닥에 불과하다는 사실에도 불구하고, 연쇄체의 가공을 허용한다. 연쇄체 핵산 내에 가공 부위의 형성을 허용하여, 하나 이상의 엔도뉴클레아제의 첨가에 의해 이러한 연쇄체를 가공하는 단일 단계를 가능하게 하는 것은 주형의 설계이다.
엔도뉴클레아제는 증폭 반응이 완료되면 첨가되거나, 증폭 반응이 진행 중이거나 또는 증폭 반응이 시작될 때 첨가될 수 있다. 엔도뉴클레아제가 첨가되기 전에 증폭 반응이 진행되어, 연쇄체 핵산이 신속하게 가공되는 것을 보장하는 것이 바람직하다. 대안적으로, 엔도뉴클레아제를 첨가하기 전에 증폭 과정을 완료할 있다(즉, 주형 소진, 뉴클레오티드 소진, 반응 혼합물의 점성이 너무 높음).
또한 가공 모티프 및 관련된 주형 "백본"으로 구성된 부산물도 생성된다.
3' 말단의 신장 및 선택적 폐쇄(optional closure)
엔도뉴클레아제로 절단한 후 단일 가닥 중간체의 3' 말단은 중간체와 염기쌍을 형성하여, 프라이머로 작용할 수 있다. 닉카아제의 적용 후에 3' 말단이 신장에 이용될 수 있도록 3' 말단에 또는 그 근처에 닉킹 부위를 설계하는 것이 가능하다.
중간체는 적어도 하나의 폴리머라아제 효소와 접촉된다. 1종, 2종, 3종, 4종 또는 5종의 상이한 폴리머라아제가 사용될 수 있다. 폴리머라아제는 핵산의 중합체를 합성하는 임의의 적합한 폴리머라아제일 수 있다. 폴리머라아제는 DNA 또는 RNA 폴리머라아제일 수 있다. 임의의 상업적으로 입수가능한 폴리머라아제를 포함한, 임의의 폴리머라아제가 사용될 수 있다. 2종, 3종, 4종, 5종 또는 그 이상의 상이한 폴리머라제가 사용될 수 있으며, 예를 들어 교정 기능을 제공하는 1종의 폴리머라아제와 그렇지 않은 1종 이상의 다른 폴리머라아제가 사용될 수 있다. 상이한 메커니즘을 갖는 폴리머라아제가 사용될 수 있으나, 폴리머라아제가 가닥 치환하지 않는 것이 바람직하다. 가닥 치환 활성을 갖지 않는 DNA 폴리머라아제의 적합한 예는 T4 DNA 폴리머라아제이다.
폴리머라아제는 공정 조건 하에서 연장된 인큐베이션에 의해 활성이 실질적으로 감소되지 않도록 매우 안정적일 수 있다. 따라서, 이 효소는 바람직하게는 온도 및 pH를 포함하지만 이에 제한되지 않는 다양한 공정 조건 하에서 긴 반감기를 갖는다. 또한 폴리머라아제는 제조 공정에 적합한 하나 이상의 특징을 갖는 것이 바람직하다. 폴리머라아제는 바람직하게는, 예를 들어 교정 활성을 가짐으로써, 높은 충실도를 갖는다. 또한, 폴리머라아제는 높은 처리능. 및 뉴클레오티드 및 핵산에 대한 낮은 Km을 보이는 것이 바람직하다. 폴리머라아제는 선형 DNA를 주형으로 사용할 수 있다. 폴리머라아제는 단일 가닥 핵산을 주형으로 사용할 수 있다. 폴리머라아제는 그의 교정 활성과 관련되지 않은 엑소뉴클레아제 활성을 나타내지 않는 것이 바람직하다.
당업자는 시판되는 폴리머라아제, 예를 들어, Deep Vent® (New England Biolabs, Inc.), Bst(Bacillus stearothermophilus) DNA 폴리머라아제 I (New England Biolabs, Inc.), DNA 폴리머라아제 I의 클레나우(Klenow) 단편 (New England Biolabs, Inc.), M-MuLV 역전사효소 (New England Biolabs, Inc.), VentR®(exo-minus) DNA 폴리머라아제 (New England Biolabs, Inc.), VentR® DNA 폴리머라아제 (New England Biolabs, Inc.), Deep Vent® (exo-) DNA 폴리머라아제 (New England Biolabs, Inc.), Bst DNA 폴리머라아제 큰 단편(large fragment) (New England Biolabs, Inc.), 고-충실도(hi-fidelity) 융합 DNA 폴리머라아제 (예를 들면, Pyrococcus-like, New England Biolabs, MA), 피로코커스 퓨리오수스(Pyrococcus furiosus)로부터의 Pfu DNA 폴리머라아제 (Agilent, La Jolla, CA), T7 DNA 폴리머라아제의 Sequenase™ 변이체, T7 DNA 폴리머라아제, T4 DNA 폴리머라아제, 피로코커스 종 GB-D로부터의 DNA 폴리머라아제 (New England Biolabs, MA), 또는 써모코커스 리토랄리스(Thermococcus litoralis)로부터의 DNA 폴리머라아제(New England Biolabs - NEB, MA)에 의해 보여지는 특성의 비교에 의해, 주어진 폴리머라아제가 앞서 정의된 특징을 보이는지 여부를 결정할 수 있다.
대안적으로, 폴리머라아제는 DNA-의존성 RNA 폴리머라아제일 수 있다. 예시적인 효소는 T3 RNA 폴리머라아제, T7 RNA 폴리머라아제, Hi-T7™ RNA 폴리머라아제, SP6 RNA 폴리머라아제, 대장균 폴리(A) 폴리머라아제, 대장균 RNA 폴리머라아제, 및 대장균 RNA 폴리머라아제, Holoenzyme(모두 NEB로부터 구입가능함)을 포함한다.
높은 처리능이 언급되는 경우, 이는 일반적으로 주형과의 회합/해리당 폴리머라아제 효소에 의해 추가되는 뉴클레오티드의 평균 개수, 즉, 단일 회합 이벤트에서 수득되는 프라이머 신장의 길이를 나타낸다.
중간체 및 폴리머라아제 효소는 또한 이중체 섹션의 단일 가닥을 이중체의 상보적 가닥을 합성하기 위한 프라이머로 사용하여 중간체의 3' 말단을 신장하기 위해 적합한 조건에서 적합한 시약과 함께 배치될 것이다. 따라서, 이 단계에서 폴리머라아제의 작용은 단일 가닥 섹션을 주형으로 사용하여 이중체를 합성하는 것이다. 3' 말단이 이중체 섹션의 말단까지 신장되는 것이 바람직하고, 가장 바람직하게는 중간체의 5' 말단에 인접할 때까지 신장된다. 3' 말단을 5' 말단에 인접할 때까지 신장시키는 것이 리가아제와 같은 효소를 사용하여 벡터의 공유결합에 의한 폐쇄를 허용하기 때문에, 3' 말단을 5' 말단에 인접할 때까지 신장시키는 것이 유리하다. 시약 제공을 포함한, 신장 반응에 적합한 조건은 증폭 단계와 관련하여 설명된다.
3' 및 5' 말단은 라이게이션되어, 벡터를 공유결합에 의해 폐쇄시킬 수 있다. 벡터를 공유적으로 폐쇄시키기 위해, 신장된 중간체를 리가아제 효소와 접촉시킬 수 있다. DNA 벡터의 말단은 일 말단의 3'-하이드록실과 다른 말단의 5'-포스포릴 사이의 포스포디에스테르 결합의 형성에 의해 함께 연결된다. RNA도 유사하게 라이게이션될 수 있다. 보조 인자가 일반적으로 반응에 관여하며, 이는 일반적으로 ATP 또는 NAD+이다.
핵 표적화 (Nuclear Targeting)
히스톤은 핵에서 가장 풍부한 단백질이며 히스톤을 세포질에서 핵으로 능동적으로 수송하는 데 별개의 수송(import) 경로가 관여한다. 이 사실은 히스톤 수송 경로를 이용하는 것이 치료 또는 기타 목적을 위해 목적 DNA의 핵 국재화(nucelar localization)를 향상시키는 보편적인 방법이라는 것을 의미한다.
뉴클레올린은 다양한 기능을 가진 셔틀링 단백질이며 다양한 세포 구획에서 찾을 수 있으나, 핵에 가장 풍부하다.
인간 텔로미어는 여러 단백질에 의해 유지되며, 그 중 일부는 텔로미어 서열의 반복체 (TTAGGG)n에 의해 형성될 수 있는 G-사중체 구조에 특이적으로 결합하고, 4개의 반복체 (TTAGGG)4는 G-사중체 구조를 형성하는 데 필요한 최소 서열을 구성한다. 또한 반복체 (TTAGGG)n으로 구성된 염색체의 말단이 G-사중체 구조에 선택적인 DNA 압타머에 효과적으로 결합한다는 증거가 있다.
G-사중체 구조 (TTAGGG)4를 형성하는 데 필요한 DNA의 최소 서열이 선천적으로 G-사중체 구조를 인식하는 단백질의 핵 수송을 이용(hijack)할 수 있는 결합 모티프를 갖는 구조를 형성할 수 있는 구조 모티프를 구축하기 위해 본 발명자에 의해 사용되었다.
본원에 예시된 구조 모티프는 핵 수송 경로를 이용하기 위해 단백질 인자의 3개의 별개의 부류(class)를 표적으로 한다. 결합 모티프를 포함하는 캡으로 목적 이중체 DNA의 일 말단 또는 양 말단을 폐쇄시키는 것은 치료 또는 기타 목적을 위해 목적 DNA의 핵 흡수 및 발현을 향상시키는 혁신적인 전략을 구성한다.
본 발명은 이제 하기 비-한정적인 실시예를 참조하여 설명될 것이다.
실시예 1
DNA 벡터 중 결합 모티프의 존재에 의해 강화된 핵 수송(Nuclear import)
벡터 합성:
SEAP(secreted embryonic alkaline phosphatase) 유전자를 포함하는 벡터 DNA를 자체적으로 합성했다. 다양한 버전을 구축했고, 각 버전은 서로 다른 캡핑된 말단을 갖는다. 이러한 캡핑된 말단은:
i) 히스톤 H4 압타머,
ii) 뉴클레올린 압타머,
iii) 텔로미어 G-사중체 구조였다.
포유류 발현 카세트 [프로모터 - 유전자 - 폴리A 서열] [Ef1α-SEAP-SV40poly(A)]를 갖는 다양한 선형 이중체 DNA를 생성했고, 각 버전은 다양한 캡핑된 말단에 대한 구조 모티프에 포함되었고, 각각은 상기 발현 카세트의 하류에 배치되어 벡터의 우측 캡핑된 말단을 형성하였다.
i) 히스톤 H4(H4_ GqH4_ sl)
ii) 뉴클레올린: (nucl)
iii) 인간 텔로미어 G- 사중체(hTel)
벡터의 좌측 말단도 구조 모티프, 이 경우, 공지된 단백질 인자에 대한 결합 친화도가 없는, 3-뉴클레오티드 루프 GAA를 갖는 단순한 스템-루프에 대한 서열로 캡핑되었다.
기준(reference) DNA("압타머 불포함(no aptamer)"으로 지칭됨)는 양 말단에 3-뉴클레오티드 GAA 루프를 포함했다.
형질감염( transfection ):
제조사의 가이드라인에 따라 시판되는 PEIpro 형질감염 시약(Polyplus-transfection)을 사용하여 DNA를 HEK293 세포(ATCC)에 형질감염시켰다.
간략하게, 세포를 형질감염 24시간 전에 6-웰 플레이트에 웰당 7×105개 세포의 밀도로 10% FBS(Sigma), 2mM L-글루타민(Sigma) 및 1% 비필수 아미노산 용액(Sigma)으로 보충된 2 ml DMEM의 총 부피에 접종했다.
세포가 70% 컨플루언시(confluency)에 도달할 때까지(24시간) 5% CO2 인큐베이터에서 37℃에서 인큐베이션하였다. PEIpro와의 벡터 복합체를 표 6에 표시된 바와 같이 생성하였다. 실온에서 15분 동안 인큐베이션한 후, 무혈청 DMEM 중 DNA-PEI 복합체를 세포 배양물에 첨가하였다(점적). 세포 배양물을 담은 플레이트를 37℃에서 5% CO2 분위기로 유지되는 인큐베이터에 넣었다. SEAP(Secreted Alkaline Phosphatase) 활성을 위해 9시간 후에 배지를 수집하고 모든 샘플에 대해 생물학적 중복실험(biological duplicates)을 수행했다. Luminescence-based SEAP Reporter Gene Assay Kit(Abcam)를 사용하여 SEAP 발현의 수준(U/ml 배지)을 결정했다.
실험 전반에 걸쳐 동일한 형질감염 효율을 보장하기 위해, CMV-eGFP 벡터와의 공동 형질감염을 수행했다(형질감염에 사용된 DNA 질량의 10%는 eGFP를 코딩하는 선형 DNA였다). 형광 중앙값(median)은 유동 세포분석을 이용하여 48시간 후에 측정하고, 실험 전반에 걸쳐 불변인 것으로 확인하였다.
표 6. 형질감염 프로토콜:
Figure pct00002
하기에 발현 카세트(Ef1a-SEAP-SV40poly(A))의 하류에 위치한 다양한 구조 모티프의 서열이 기재된다. 밑줄로 표시된 서열은 결합 모티프로 작용하는 구조 모티프의 섹션(또는 대조군에서 트리뉴클레오티드 루프를 형성하는 섹션)을 나타낸다. 결합 모티프의 각 측면(플랭킹)에는, 이 경우에, 서로 혼성화하여 지지하는 스템 구조를 형성하여, 벡터에서 압타머를 효과적으로 고정하는 상보적 서열인 구조 모티프의 서열이 있다. 따라서, 특이적 결합 모티프가 배치될 수 있는 "주형" 구조 모티프를 설계하는 것이 가능하다는 것을 알 수 있다. 이 경우, 플랭킹 서열은 상호 간에 상보적이다.
Figure pct00003
Figure pct00004
결과
핵 수송 경로를 개선하기 위해 캡핑된 말단에 압타머를 포함하는 벡터는 대조군 벡터(압타머 불포함(no apt))와 비교하여 SEAP 발현의 상당한 증가를 보였다(도 1). SEAP를 뺀 "벡터"는 발현을 보이지 않았다.
실시예 2
감소된 양의 벡터가 사용될 때 압타머를 포함하는 캡핑된 말단의 존재에 의해 강화된 벡터의 핵 수송
실시예 1에 기술된 바와 같이 제조사의 프로토콜에 따라 PEI Pro를 사용하여 전술된 바와 같은 벡터를 HEK293에 형질감염시켰다; 이를 위해 6-웰 플레이트를 사용하고 모든 샘플에 대해 생물학적 중복실험을 수행했다. SEAP(Secreted Alkaline Phosphatase) 활성(U/ml 배지로 표현됨)은 AbCam 상용 키트를 사용하여 형질감염 9시간 후에 분석하였다.
실험 전반에 걸쳐 동일한 형질감염 효율을 보장하기 위해, CMV-eGFP 벡터와의 공동 형질감염을 수행했다(형질감염에 사용된 DNA 질량의 10%는 eGFP를 코딩하는 선형 DNA였다). 형광 중앙값은 유동 세포분석을 이용하여 측정했하고, 실험 전반에 걸쳐 불변인 것으로 확인하였다.
경쟁 벡터(리포터 유전자 불포함)가 형질감염된 DNA의 일정한 질량을 유지하게 하면서, 감소된 양의 SEAP 리포터 유전자가 있는 벡터를 사용했다.
표 7. 감소된 양 (0.4 ㎍/웰)의 벡터의 형질감염 프로토콜
Figure pct00005
표 8. 감소된 양 (0.2 ㎍/웰)의 벡터의 형질감염 프로토콜
Figure pct00006
Figure pct00007
결과
더 적은 양의 벡터가 형질감염에 사용되는 경우, 구조 모티프 hTel을 포함하는 벡터의 발현 수준은 기준 벡터(압파머 불포함)의 발현 수준보다 훨씬 더 높았다- 0.4 ㎍/웰(도 2) 및 0.2 ㎍/웬(도 3). 이것은 상기 벡터가 비변형(unmodified) 벡터보다 적은 양으로 사용될 수 있다는 것을 보여준다.
실시예 3
HepG2 세포주에서 평가된 핵 수송 강화
실시예 1에 기술된 바와 같이 제조사의 프로토콜에 따라 PEI Pro 형질감염 시약을 사용하여 전술된 바와 같은 벡터를 HepG2에 형질감염시켰다. 이를 위해 6-웰 플레이트를 사용하고 모든 샘플에 대해 생물학적 중복실험을 수행했다. SEAP(Secreted Alkaline Phosphatase) 활성(U/ml 배지로 표현됨)은 AbCam 상용 키트를 사용하여 형질감염 9시간 후에 분석하였다. 실험 전반에 걸쳐 동일한 형질감염 효율을 보장하기 위해, CMV-eGFP 벡터와의 공동 형질감염을 수행했다(형질감염에 사용된 DNA 질량의 10%는 eGFP를 코딩하는 선형 DNA였다). 형광 중앙값은 유동 세포분석을 이용하여 측정했하고, 실험 전반에 걸쳐 불변인 것으로 확인하였다.
표 9. 감소된 양의 벡터의 형질감염 프로토콜
Figure pct00008
Figure pct00009
결과
HepG2 세포 배양에서 구조 모티프 hTel을 포함하는 벡터로부터의 SEAP 발현은 구조 모티프가 결여된 동일한 벡터(apt 불포함(no apt))보다 훨씬 높다 (도 4).
실시예 4
결합 모티프가 벡터에서 기능적이라는 것의 입증 - 스트렙타비딘 압타머
벡터를 합성하기 위한 말단 전환(end conversion) 방법이 캡핑된 말단을 형성하기 위한 구조의 독립적인 폴딩과 양립하도록 보장하기 위해, 스트렙타비딘-코팅된 플레이트에 대한 스트렙타비딘 압타머의 결합을 선택하였다. 스트렙타비딘 압타머 서열은 포유동물 리포터 카세트를 갖는 발현 카세트의 하류에서 사용되었다. 벡터의 단일 말단에서의 가공을 포함하는 구조 모티프의 두 가지 다른 구성이 합성되었다: i) 단일 스트렙타비딘 압타머, 및 ii) 4개의 분지형 스트렙타비딘 압타머의 어레이.
스트렙타비딘 압타머를 갖는 가공 형태 모티프(processing conformational motif)의 서열
Figure pct00010
이중체 서열
Figure pct00011
수득된 벡터를 스트렙타비딘-코팅된 플레이트에 대한 결합에 대해 테스트하였다. 플레이트에 유지된 DNA의 양은 피코그린 통합 분석(pico-green incorporation assay)으로 검출하였다.
결합 프로토콜
DNA를 실온에서 2시간 동안 결합 완충액에서 스트렙타비딘-코팅된 플레이트와 혼합하였다. 플레이트를 동일한 결합 완충액으로 3회 세척하고, 플레이트에 결합된 DNA를 DNA 분리 없이, 플레이트에서 PicoGreen 분석으로 검출했다.
결합 완충액 (10x)
1M NaCl
20 mM MgCl2
50 mM KCl
10 mM CaCl2
200 mM Tris-HCl, pH 7.6
결과
4개의 스트렙타비딘 압타머(원)로 구성된 본 발명에 따른 벡터(해리 상수, KD=5.6 nM)는 단일 압타머를 포함하는 벡터(KD=17.4 nM, 정사각형)보다 훨씬 더 강하게 결합한다. 어느 말단에도 압타머를 포함하지 않는 대조군 DNA는 플레이트에 대한 특이적 결합을 나타내지 않았다. 이 결과는 기능적 압타머가 벡터의 말단에 단일 모티프 또는 모티프의 어레이로 배치될 수 있다는 증거가 된다. 피팅 곡선(fitting curve)이 도 8에 도시된다.
실시예 5:
공유결합에 의해 폐쇄된 맞춤형(cutom) 캡핑된 말단을 갖는 벡터의 생산.
주형: 주형 A(도 11).
주형은 닉킹 부위, 형태 모티프(conformational motif)에 인접한 가공 모티프, 목적 서열, 제2 가공 모티프에 인접한 제2 형태 모티프, 및 목적 서열과 유사한 크기의 백본을 포함한다. 백본에는 dsDNA만 자르는 추가적인 엔도뉴클레아제 표적 부위가 있다.
20 ㎕의 닉킹 반응
·4 ㎕ 주형(1 ㎍/㎕)
·13 ㎕ H2O
·2 ㎕ CutSmart 완충액(NEB)
·1 ㎕ 닉카아제 (Nb.BsrDI, NEB)
37℃에서 180분 동안 인큐베이션하고, 그 후, 80℃에서 20분 동안 인큐베이션했다.
1000 ㎕의 증폭 반응
·4 ㎕ 주형(0.2 ㎍/㎕)
·100 ㎕ 완충액 - 10x
- 300 mM 트리스 pH 7.9
- 300 mM KCl
- 50 mM (NH4)2SO4
- 100 mM MgCl2
·837 ㎕ ddH2O
·20 ㎕ dNTP(100 mM)(Bioline)
·35 ㎕ SSB(5 ㎍/㎕)(대장균 SSB, 자체 제조)
·2 ㎕ 무기 피로포스파타아제 (2 U/㎕) (Enzymatics)
·2 ㎕ phi29 DNA 중합효소(100 U/㎕)(Enzymatics)
30℃에서 16시간 동안 인큐베이션했다.
가공(processing) 반응
· 1000 ㎕ 증폭 반응
· 20㎕ MlyI(10 U/㎕)
37℃에서 180분 동안 인큐베이션했다.
정제 반응
200 ㎕의 가공된 반응물을 PCR 클린-업(clean-up) 컬럼(Macherey-Nagel)을 통해 통과시키고, 20 ㎕로 용출했다.
50 ㎕의 제2 가닥 합성 반응
·10 ㎕ 주형
·1 ㎕ T4 DNA 폴리머라아제(exo-)(3 U/㎕)
·1 ㎕ T4 DNA 리가아제(400,000 U/㎕)
·5 ㎕ T4 DNA 리가아제 완충액 @ 10x
- 50 mM 트리스-HCl
- 10 mM MgCl2
- 1 mM ATP
- 10 mM DTT
·0.5 ㎕ dNTP(40 mM)
·32.5 ㎕ ddH2O
37℃에서 180분 동안 인큐베이션했다.
엑소뉴클레아제 클린-업
·25 ㎕ 제2 가닥 합성 반응
·0.2 ㎕ T5 엑소뉴클레아제 (10 U/㎕)
37℃에서 16시간 동안 인큐베이션했다.
결과: 도 12에 표시된 겔이 도시된다. 도 12는 제2 가닥 합성 및 라이게이션에 의한 폐쇄된 선형 DNA 벡터의 생산을 입증하는, SafeView로 염색한 0.8% 아가로스 겔을 보여준다. 레인 1 및 9는 Thermo Scientific Gene Ruler 1kb Plus DNA 래더이다. 레인 2에는 모든 효소가 결여된다; 레인 3은 T4 DNA 리가아제를 포함하고; 레인 4는 T4 DNA 리가아제 및 T5 엑소뉴클레아제 클린-업 단계를 포함하고; 레인 5는 T4 DNA 폴리머라아제를 포함하며; 레인 6은 T4 DNA 폴리머라아제 및 T5 엑소뉴클레아제 클린-업 단계를 포함하고; 레인 7은 T4 폴리머라아제 및 T4 리가아제를 모두 포함하며; 레인 8은 T4 폴리머라아제 및 T4 리가아제 모두와 T5 엑소뉴클레아제 단계를 포함한다.
두 효소 중 하나만 존재하는 경우에는 엑소뉴클레아제-내성(즉, 폐쇄된 DNA) 생성물이 존재하지 않으나, 폴리머라아제와 리가아제를 모두 포함하면 엑소뉴클레아제 분해에 저항하는 폐쇄된 분자가 형성된다는 것을 알 수 있다.
실시예 6.
핵 수송은 벡터의 3'-말단(캡)에 다중 결합 모티프의 존재에 의해 향상될 수 있다.
하나의 구조 모티프에 결합 모티프의 어레이를 포함하는 효과를 조사하기 위해, 히스톤 및 뉴클레올린과 같은 다양한 핵 요소를 표적화하는 결합 모티프를 이용하여, 여러 핵 수송 실험을 수행했다.
3'-말단에 표적에 대한 다양한 버전의 다중 압타머를 포함하는, 포유류 발현 카세트[Ef1a-SEAP-SV40poly(A)]를 갖는 선형 이중 가닥 DNA를 생성했다:
i) 인간 텔로미어 G-사중체-히스톤 H4(hTel-H4_Gq)
ii) 3x 뉴클레올린(3x nucl)
iii) 히스톤 H4-뉴클레올린(H4_Gq-nucl)
iv) 4x EpCAM 스템 루프(4x EpCAM)
PEI Pro 형질감염 시약을 사용하여 DNA를 HEK293T로 형질감염시켰다. AbCam 상용 키트(AbCam, Cambridge, UK)를 사용하여 형질감염 9시간 후 SEAP(Secreted Alkaline Phosphatase) 활성(U/mL 배지로 표현됨)을 분석했다. 실시예 전체에 걸쳐 동일한 형질감염 효율을 보장하기 위해, CMV-eGFP 벡터와의 공동 형질감염을 수행하였다(형질감염에 사용된 DNA 질량의 10%는 eGFP를 암호화하는 선형 DNA였다). 형광 중앙값은 유동 세포측정법을 이용하여 측정하고, 실험 전반에 걸쳐 불변인 것으로 확인하였다.
사용된 서열:
Figure pct00012
본 실시예에 대한 결과는 도 13에 도시되며, 이는 핵 표적화 동안, 결합 모티프의 어레이를 포함하는 것이 유리하다는 것을 명확하게 보여준다. 대조군 DNA("No Apt")는 핵 표적화 결합 모티프의 어레이를 포함하는 모든 실험 버전보다 분명히 더 적은 SEAP를 생성했다. 단일 구조 모티프 내에 클러스터링된 복수의 압타머는 리포터 유전자 발현을 최대 5배 증가시킨다는 것을 알 수 있다. 어레이의 적절한 폴딩을 보장하기 위해, 각 모티프의 독립적인 폴딩을 유도하고, 어레이의 폴딩을 하나의 가능한 형태로 제한하도록 고유한 서열의 분지(branching) 시스템을 설계하였다.
SEQUENCE LISTING <110> Lightbio Limited <120> Self-targeting expression vector <130> P33403WO1 <160> 53 <170> PatentIn version 3.5 <210> 1 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Parallel stranded DNA (stabilised by Hoogsteen bonds or reverse Watson-Crick bonding) <400> 1 cctattaaat cc 12 <210> 2 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Parallel stranded DNA (stabilised by Hoogsteen bonds or reverse Watson-Crick bonding) <400> 2 aaaaaaaaaa taattttaaa tattt 25 <210> 3 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Hairpin <400> 3 tggggcccca 10 <210> 4 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Cross-arm <400> 4 atggtcttgc atgcaaggcc atatatggca ccat 34 <210> 5 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Intermolecular Triplex <400> 5 aagaagaaga agaag 15 <210> 6 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Triplex <400> 6 cctccccctc ctttttggag ggggaggttt ttggaggggg agg 43 <210> 7 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> i-motif bimolecular <400> 7 cccctaaccc taa 13 <210> 8 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> i-motif unimolecular <400> 8 ccctaacccc taaccctaac ccctaa 26 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Quadruplex dimeric parallel strand <400> 9 aggggggagg gagggtgg 18 <210> 10 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Quadruplex antiparallel unimolecular <400> 10 ggttggtgtg gttgg 15 <210> 11 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Quadruplex antiparallel tetramer <400> 11 ttagggttag gg 12 <210> 12 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> NIQI <400> 12 Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Ser Gly Gly Ser Gly Gly 1 5 10 15 Arg Gly Arg Gly 20 <210> 13 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> FMR1 G-quadruplex binding protein RG-rich domain <400> 13 Arg Arg Gly Asp Gly Arg Arg Arg Gly Gly Gly Gly Arg Gly Gln Gly 1 5 10 15 Gly Arg Gly Arg Gly Gly Gly Phe Lys Gly 20 25 <210> 14 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> DNA Aptamer that binds to thrombin <400> 14 ggttggtgtg gttgg 15 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Arahh001 <400> 15 acgtaccgac ttcgtatgcc aacagccctt tatccacctc 40 <210> 16 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> TEPP <400> 16 gcgcggtacc gcgctaacgg aggttgcgtc cgt 33 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> MUC1 <400> 17 gcagttgatc ctttggatac cctgg 25 <210> 18 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> S1.3/2.2 <400> 18 gggagacaag aataaacgct caagcagttg atcctttgga taccctggtt cgacaggagg 60 ctcacaacag gc 72 <210> 19 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> 5TR-1 <400> 19 gggagacaag aataaacgct caagaagtga aaatgacaga acacaacatt cgacaggagg 60 ctcacaacag gc 72 <210> 20 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> SGC8 <400> 20 atctaactgc tgcgccgccg ggaaaatact gtacggttag a 41 <210> 21 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> SGA16 <400> 21 tttaaaatac cagcttattc aattagtcac acttagagtt ctagctgctg cgccgccggg 60 aaaatactgt acggatagat agtaagtgca atct 94 <210> 22 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> SYL3C <400> 22 cactacagag gttgcgtctg tcccacgttg tcatgggggg ttggcctg 48 <210> 23 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> SYL1 <400> 23 agcgtcgaat accactacag tttggctctg ggggatgtgg aggggggtat gggtgggagt 60 caatggagct cgtggtcag 79 <210> 24 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> SYL2 <400> 24 agcgtcgaat accactacag agctcggggt tttttggggt tttttggggt tttggtgggg 60 ctaatggagc tcgtggtcag 80 <210> 25 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> SYL3 <400> 25 agcgtcgaat accactacag aggttgcgtc tgtcccacgt tgtcatgggg ggttggcctg 60 ctaatggagc tcgtggtcag 80 <210> 26 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> SYL4 <400> 26 agcgtcgaat accactacag agctccgggg tttttggggg tttttctggg gttttttggg 60 gctaatggag ctcgtggtca g 81 <210> 27 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> TDO5 <400> 27 aacaccggga ggatagttcg gtggctgttc agggtctcct cccggtg 47 <210> 28 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> A1 <400> 28 ggttgcatgc cgtggggagg ggggtgggtt ttatagcgta ctcag 45 <210> 29 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> AS1411 <400> 29 ttggtggtgg tggttgtggt ggtggtgg 28 <210> 30 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> GMT4,8 <400> 30 tgacgagccc aagttacctt ggtgatggtt tttggtggta acgggggcgg gtgagtagaa 60 tctccgctgc ctaca 75 <210> 31 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> CSC1 <400> 31 accttggctg tcgtgttgta ggtggtttgc tgcggtgggc tcaagaagaa agcgcaaagg 60 tcagtggtca gagcgt 76 <210> 32 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> CSC13 <400> 32 accttggctg tcgtgttgtg gggtgtcgta tctttcgtgt cttattattt tctaggggag 60 gtcagtggtc agagcgt 77 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> KDED2a-3 <400> 33 tgcccgcgaa aactgctatt acgtgtgaga ggaaagatca cgcgggttcg tggacacggt 60 tttttttttt 70 <210> 34 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> KCHA10 <400> 34 atccagagtg acgcagcagg ggaggcgaga gcgcacaata acgatggttg ggacccaact 60 gtttggacac ggtggcttag tttttttttt t 91 <210> 35 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> R13 <400> 35 tctctagtta ttgagttttc ttttatgggt gggtgggggg ttttt 45 <210> 36 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> S6 <400> 36 tggatgggga gatccgttga gtaagcgggc gtgtctctct gccgccttgc tatgggg 57 <210> 37 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> GBI-10 <400> 37 ggctgttgtg agcctcctcc cagagggaag actttaggtt cggttcacgt cccgcttatt 60 cttactccc 69 <210> 38 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> A-1 <400> 38 taactcaata agctaggtgg gtgggggaca ctacccgggg ggtggttggg t 51 <210> 39 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Minimal sequence to form G-quadruplex structure <400> 39 ttagggttag ggttagggtt aggg 24 <210> 40 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> no aptamer (control) <400> 40 ctgctcacct gccagctacg gacgcggaac gcgtccgtag ctggcaggtg agcag 55 <210> 41 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> H4_Gq <400> 41 ctgctcacct gccagctacg gacgcgtggt ggggttcccg ggagggcggc tacgggttcc 60 gtaatcagat ttgtgtcgcg tccgtagctg gcaggtgagc ag 102 <210> 42 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> H4_SL <400> 42 ctgctcacct gccagctacg gacgcgcgca ggttaaatcc caaatggtcc gagggttgcg 60 cgcgtccgta gctggcaggt gagcag 86 <210> 43 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> nucl <400> 43 ctgctcacct gccagctacg gacgcgtggt ggtggtggtt gtggtggtgg tgggcgcgtc 60 cgtagctggc aggtgagcag 80 <210> 44 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> hTEL <400> 44 ctgcgcgctc gctcgctcac tgaggccttt agggttaggg ttagggttag ggttggcctc 60 agtgagcgag cgagcgcgca g 81 <210> 45 <211> 2995 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the EF1a -SEAP-SV40pA cassette <400> 45 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360 gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420 cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480 ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540 caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600 gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660 gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720 ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780 gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840 acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900 tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960 tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020 gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080 ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140 gtggttcaaa gtttttttct tccatttcag gtgtcgtgac ctaggaagct tgccaccatg 1200 gttctggggc cctgcatgct gctgctgctg ctgctgctgg gcctgaggct acagctctcc 1260 ctgggcatca tcccagttga ggaggagaac ccggacttct ggaaccgcga ggcagccgag 1320 gccctgggtg ccgccaagaa gctgcagcct gcacagacag ccgccaagaa cctcatcatc 1380 ttcctgggcg atgggatggg ggtgtctacg gtgacagcag ccaggatcct aaaagggcag 1440 aagaaggaca aactggggcc tgagataccc ctggctatgg accgcttccc atatgtggct 1500 ctgtccaaga catacaatgt agacaaacat gtgccagaca gtggagccac agccacggcc 1560 tacctgtgcg gggtcaaggg caacttccag accattggct tgagtgcagc cgcccgcttt 1620 aaccagtgca acacgacacg cggcaacgag gtcatctccg tgatgaatcg ggccaagaaa 1680 gcagggaagt cagtgggagt ggtaaccacc acacgagtgc agcacgcctc gccagccggc 1740 acctacgccc acacggtgaa ccgcaactgg tactcggacg ccgacgtgcc tgcctcggcc 1800 cgccaggagg ggtgccagga catcgctacg cagctcatct ccaacatgga cattgatgtg 1860 atcctgggtg gaggccgaaa gtacatgttt cgcatgggaa ccccagaccc tgagtaccca 1920 gatgactaca gccaaggtgg gaccaggctg gacgggaaga atctggtgca ggaatggctg 1980 gcgaagcgcc agggtgcccg gtatgtgtgg aaccgcactg agctcatgca ggcttccctg 2040 gacccgtctg tgacccatct catgggcctc tttgagcctg gagacatgaa atacgagatc 2100 caccgagact ccacactgga cccctccctg atggagatga cagaggctgc cctgcgcctg 2160 ctgagcagga acccccgcgg cttcttcctc ttcgtggagg gtggtcgcat cgaccacggt 2220 catcacgaaa gcagggctta ccgggcactg actgagacga tcatgttcga cgacgccatt 2280 gagagggcgg gccagctcac cagcgaggag gacacgctga gcctcgtcac tgccgaccac 2340 tcccacgttt tctccttcgg aggctacccc ctgcgaggga gctccatctt cgggctggcc 2400 cctggcaagg cacgggacag gaaggcctac acggtcctcc tatacggaaa cggtccaggc 2460 tatgtgctca aggacggcgc ccggccggat gttaccgaga gcgagagcgg gagccccgag 2520 tatcggcagc agtcagcagt gcccctggac gaagagacgc acgcaggcga ggacgtggcg 2580 gtgttcgcgc gcggcccgca ggcgcacctg gttcacggcg tgcaggagca gaccttcata 2640 gcgcacgtca tggccttcgc cgcctgcctg gagccctaca ccgcctgcga cctggcgccc 2700 cccgccggca ccaccgacgc cgcgcaccca gggcggtccc ggtccaagcg tctggattga 2760 gaattcgccc gggcagacat gataagatac attgatgagt ttggacaaac cacaactaga 2820 atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 2880 attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 2940 cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggta 2995 <210> 46 <211> 181 <212> DNA <213> Artificial Sequence <220> <223> strSQ (4 aptamers) <400> 46 ctgctcacct gccagctacg gacgcggcca cgaacgcacc gatcgcaggt ttcgtggcgc 60 gcgtaacgca ccgatcgcag gtttacgcgc agcgagcaac gcaccgatcg caggtttgct 120 cgccgcccaa acgcaccgat cgcaggtttt gggcgcgcgt ccgtagctgg caggtgagca 180 g 181 <210> 47 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> strApt <400> 47 ctgctcacct gccagctacg gacgcgggga acgcaccgat cgcaggtttc cccgcgtccg 60 tagctggcag gtgagcag 78 <210> 48 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> noApt (no aptamer control) <400> 48 ctgctcacct gccagctacg gacgcggaac gcgtccgtag ctggcaggtg agcag 55 <210> 49 <211> 3558 <212> DNA <213> Artificial Sequence <220> <223> SEAP-2A-eGFP <400> 49 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480 acggtgggag gtctatataa gcagagctcc taggcgttta gtgaaccgtc agaatcgatc 540 gaatcccggc cgggaacggt gcattggaac gcggattccc cgtgccaaga gtgacgtaag 600 taccgcctat agagtctata ggcccacaaa aaatgctttc ttcttttaat atactttttt 660 gtttatctta tttctaatac tttccctaat ctctttcttt cagggcaata atgatacaat 720 gtatcatgcc tctttgcacc attctaaaga ataacagtga taatttctgg gttaaggcaa 780 tagcaatatt tctgcatata aatatttctg catataaatt gtaactgatg taagaggttt 840 catattgcta atagcagcta caatccagct accattctgc ttttatttta tggttgggat 900 aaggctggat tattctgagt ccaagctagg cccttttgct aatcatgttc atacctctta 960 tcttcctccc acagctcctg ggcaacgtgc tggtctgtgt gctggcccat cactttggca 1020 aagaattggg atatcgattg atggctgtaa gcttggaccg ccaccatggt gagcaagggc 1080 gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga cgtaaacggc 1140 cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa gctgaccctg 1200 aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt gaccaccctg 1260 acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca cgacttcttc 1320 aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa ggacgacggc 1380 aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa ccgcatcgag 1440 ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct ggagtacaac 1500 tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat caaggtgaac 1560 ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca ctaccagcag 1620 aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct gagcacccag 1680 tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct ggagttcgtg 1740 accgccgccg ggatcactct cggcatggac gagctgtata agggaagcgg agctactaac 1800 ttcagcctgc tgaagcaggc tggagacgtg gaggagaacc ctggacctat ggttctgggg 1860 ccctgcatgc tgctgctgct gctgctgctg ggcctgaggc tacagctctc cctgggcatc 1920 atcccagttg aggaggagaa cccggacttc tggaaccgcg aggcagccga ggccctgggt 1980 gccgccaaga agctgcagcc tgcacagaca gccgccaaga acctcatcat cttcctgggc 2040 gatgggatgg gggtgtctac ggtgacagca gccaggatcc taaaagggca gaagaaggac 2100 aaactggggc ctgagatacc cctggctatg gaccgcttcc catatgtggc tctgtccaag 2160 acatacaatg tagacaaaca tgtgccagac agtggagcca cagccacggc ctacctgtgc 2220 ggggtcaagg gcaacttcca gaccattggc ttgagtgcag ccgcccgctt taaccagtgc 2280 aacacgacac gcggcaacga ggtcatctcc gtgatgaatc gggccaagaa agcagggaag 2340 tcagtgggag tggtaaccac cacacgagtg cagcacgcct cgccagccgg cacctacgcc 2400 cacacggtga accgcaactg gtactcggac gccgacgtgc ctgcctcggc ccgccaggag 2460 gggtgccagg acatcgctac gcagctcatc tccaacatgg acattgatgt gatcctgggt 2520 ggaggccgaa agtacatgtt tcgcatggga accccagacc ctgagtaccc agatgactac 2580 agccaaggtg ggaccaggct ggacgggaag aatctggtgc aggaatggct ggcgaagcgc 2640 cagggtgccc ggtatgtgtg gaaccgcact gagctcatgc aggcttccct ggacccgtct 2700 gtgacccatc tcatgggcct ctttgagcct ggagacatga aatacgagat ccaccgagac 2760 tccacactgg acccctccct gatggagatg acagaggctg ccctgcgcct gctgagcagg 2820 aacccccgcg gcttcttcct cttcgtggag ggtggtcgca tcgaccacgg tcatcacgaa 2880 agcagggctt accgggcact gactgagacg atcatgttcg acgacgccat tgagagggcg 2940 ggccagctca ccagcgagga ggacacgctg agcctcgtca ctgccgacca ctcccacgtt 3000 ttctccttcg gaggctaccc cctgcgaggg agctccatct tcgggctggc ccctggcaag 3060 gcacgggaca ggaaggccta cacggtcctc ctatacggaa acggtccagg ctatgtgctc 3120 aaggacggcg cccggccgga tgttaccgag agcgagagcg ggagccccga gtatcggcag 3180 cagtcagcag tgcccctgga cgaagagacg cacgcaggcg aggacgtggc ggtgttcgcg 3240 cgcggcccgc aggcgcacct ggttcacggc gtgcaggagc agaccttcat agcgcacgtc 3300 atggccttcg ccgcctgcct ggagccctac accgcctgcg acctggcgcc ccccgccggc 3360 accaccgacg ccgcgcaccc agggcggtcc cggtccaagc gtctggattg agaattccct 3420 ttcggggcag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 3480 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 3540 agctgcaata aacaagtt 3558 <210> 50 <211> 154 <212> DNA <213> Artificial Sequence <220> <223> hTel - H4_Gq <400> 50 ctgctcacct gccagctacg gacgcggcca cgtttagggt tagggttagg gttagggttc 60 gtggcagcgc gttggtgggg ttcccgggag ggcggctacg ggttccgtaa tcagatttgt 120 gtacgcgccg cgtccgtagc tggcaggtga gcag 154 <210> 51 <211> 174 <212> DNA <213> Artificial Sequence <220> <223> 3x nucl <400> 51 ctgctcacct gccagctacg gacgcggcca cgtggtggtg gtggttgtgg tggtggtggg 60 cgtggcagcg cgttggtggt ggtggttgtg gtggtggtgg gacgcgcagc gagctggtgg 120 tggtggttgt ggtggtggtg gggctcgccg cgtccgtagc tggcaggtga gcag 174 <210> 52 <211> 155 <212> DNA <213> Artificial Sequence <220> <223> H4_Gq - nucl <400> 52 ctgctcacct gccagctacg gacgcggcca cgtggtgggg ttcccgggag ggcggctacg 60 ggttccgtaa tcagatttgt gtcgtggcag cgcgttggtg gtggtggttg tggtggtggt 120 gggacgcgcc gcgtccgtag ctggcaggtg agcag 155 <210> 53 <211> 169 <212> DNA <213> Artificial Sequence <220> <223> 4xEpCAM <400> 53 ctgctcacct gccagctacg gacgcggcca cgacagaggt tgcgtctgtc gtggcgcgcg 60 tacagaggtt gcgtctgtac gcgcagcgag cacagaggtt gcgtctgtgc tcgccgccca 120 acagaggttg cgtctgttgg gcgcgcgtcc gtagctggca ggtgagcag 169

Claims (22)

  1. DNA의 이중체 섹션(duplexed section)을 포함하는 표적화 DNA 발현 벡터로서, 상기 이중체 섹션이 양 말단에서 캡핑되고, 상기 이중체의 적어도 하나의 말단은 구조 모티프로 캡핑되고, 상기 구조 모티프는 세포 표적에 결합할 수 있는 형태를 형성하는 적어도 하나의 결합 모티프를 포함하는 것을 특징으로 하는 표적화 발현 벡터.
  2. 청구항 1에 있어서, 상기 이중체 DNA는 양쪽 말단이 동일하거나 상이할 수 있는 구조 모티프로 캡핑된 것인 표적화 발현 벡터.
  3. 청구항 1에 있어서, 상기 이중체 DNA은 일 말단에서 구조 모티프로 캡핑되고, 제2 말단에서 헤어핀, T자형 헤어핀, 크로스-암(cross-arm), 스템 루프, 루프, 벌지(bulge) 또는 십자형으로 캡핑된 것인 표적화 발현 벡터.
  4. 선행하는 항 중 어느 한 항에 있어서, 상기 구조 모티프는 동일하거나 상이할 수 있는 결합 모티프의 어레이를 포함하는 것인 표적화 발현 벡터.
  5. 선행하는 항 중 어느 한 항에 있어서, 상기 결합 모티프는 하기 중 하나 이상에 있는 세포 표적에 결합할 수 있는 것인 표적화 발현 벡터:
    (i) 세포 표면;
    (ii) 핵 외피;
    (iii) 핵 수송 시스템;
    (iv) 세포 구획(cellular compartment);
    (v) 핵 성분(nuclear component);
    (vi) 세포질 봉입물(cytoplasmic inclusion); 및/또는
    (vii) 세포질 단백질 또는 펩티드.
  6. 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 벡터는 하기 중 하나 이상에 결합할 수 있는 결합 모티프를 더 포함하는 것인 표적화 발현 벡터:
    (i) 펩티드 또는 단백질;
    (ii) 소분자;
    (iii) 항체 또는 그의 유도체;
    (iv) 효소;
    (v) 면역자극제;
    (vi) 효능제 또는 길항제;
    (vii) 아쥬번트 및/또는
    (viii) 핵산.
  7. 청구항 5에 있어서, 상기 표적은 진핵 세포, 선택적으로, 식물 세포, 원생생물 세포, 진균 세포, 인간 세포 또는 비-인간 동물 세포 내에 또는 그 위에 존재하는 것인 표적화 발현 벡터.
  8. 청구항 5에 있어서, 상기 표적은 원핵 세포 위에 또는 그 내에 존재하고, 선택적으로 상기 세포는 박테리아 세포인 것인 표적화 발현 벡터.
  9. 선행하는 항 중 어느 한 항에 있어서, 상기 선형 이중체 DNA가 유전자 서열 또는 그의 단편, 및 선택적으로, 프로모터를 포함하는 것인 표적화 발현 벡터.
  10. 청구항 9에 있어서, 상기 유전자 또는 그의 단편은 기능성 RNA 분자를 코딩하는 것인 표적화 발현 벡터.
  11. 선행하는 항 중 어느 한 항에 있어서, 상기 벡터는 변형된 뉴클레오티드, 선택적으로, 캡핑된 말단에 변형된 뉴클레오티드를 포함하는 것인 표적화 발현 벡터.
  12. 선행하는 항 중 어느 한 항에 있어서, 상기 발현 벡터는 실질적으로 순수한 DNA, 선택적으로, 95% DNA인 것인 표적화 발현 벡터.
  13. 선행하는 항 중 어느 한 항에 있어서, 상기 구조 모티프는 상기 구조 모티프의 서열에서 뉴클레오티드 염기 사이의 수소 결합의 형성을 허용하고, 선택적으로 상기 뉴클레오티드 염기 사이의 수소 결합은 왓슨-크릭(Watson-Crick) 염기쌍, 후그스틴(Hoogsteen) 염기쌍 또는 비-정규(non-canonical) 염기쌍을 포함하는 것인 표적화 발현 벡터.
  14. 선행하는 항 중 어느 한 항에 있어서, 캡핑된 말단 중 하나 또는 둘 모두가 공유결합에 의해 폐쇄된 것인 표적화 발현 벡터.
  15. 선행하는 항 중 어느 한 항에 있어서, 상기 구조 모티프는 비-정규 DNA 구조를 형성하고, 하기 중 하나 이상을 포함할 수 있는 것인 표적화 발현 벡터:
    a) 헤어핀;
    b) 크로스-암;
    c) 삼중체(triplex);
    d) G-삼중체;
    e) G-사중체;
    f) i-모티프;
    g) 유사 매듭(pseudoknot);
    h) 스템 루프; 및/또는
    i) 벌지 또는 루프.
  16. 선행하는 항 중 어느 한 항에 있어서, 상기 결합 모티프가 취하는 구조가 구조 및/또는 서열 의존적 방식으로 표적과의 회합을 허용하는 것인 표적화 발현 벡터.
  17. 선행하는 항 중 어느 한 항에 있어서, 상기 결합 모티프는 하기 중 하나 이상인 것인 표적화 발현 벡터:
    a) 압타머;
    b) 사중체;
    c) 촉매;
    d) i-모티프; 및/또는
    e) 삼중 가닥 DNA.
  18. 선행하는 항 중 어느 한 항에 있어서, 상기 결합 모티프가 특이적인 것인 표적화 발현 벡터.
  19. 구조 모티프에 의해 양 말단이 캡핑된 이중체 섹션을 포함하는 벡터의 제조 방법으로서:
    (a) 하기를 코딩하는 서열을 포함하는 핵산 주형을 제공하는 단계로서:
    (i) 제1 구조 모티프에 인접한 제1 가공 모티프,
    (ii) 제1 구조 모티프,
    (iii) 상기 이중체 DNA의 단일 가닥,
    (iv) 제2 가공 모티프에 인접한 제2 구조 모티프,
    (v) 제2 가공 모티프
    상기 가공 모티프는 절단 부위를 포함하는 엔도뉴클레아제에 대한 인식 부위를 포함하는 염기쌍(base-paired) 섹션을 형성할 수 있는 서열을 포함하고,
    상기 구조 모티프는 분자내 수소 결합을 형성하고 캡핑된 말단을 형성할 수 있는 하나 이상의 서열을 포함하며,
    선택적으로, 상기 제1 또는 제2 캡핑된 말단 중 하나는 결합 모티프를 포함하는 것인 단계;
    (b) RCA(rolling circle amplification)가 가능한 폴리머라아제를 사용하여 상기 주형을 증폭하켜 단일 가닥 연쇄체(concatemer)를 생성시키는 단계;
    (c) 상기 연쇄체를 엔도뉴클레아제와 접촉시켜 단일 가닥 DNA 중간체를 방출시키는 단계로서, 상기 중간체에서 3' 말단 뉴클레오티드는 구조체의 단일 가닥 부분에 인접하여 염기 쌍을 형성한 것인 단계; 및
    (d) 단일 가닥 DNA 구조체를 폴리머라아제와 접촉시켜 상기 단일 가닥 DNA 중간체를 주형으로 사용하여 3' 말단 뉴클레오티드를 연장하여 이중체 섹션을 형성하는 단계를 포함하는 것인 방법.
  20. 청구항 19에 있어서, 상기 5' 말단 뉴클레오티드는 상기 벡터의 단일 가닥 부분에 인접하여 염기쌍을 형성하고, 상기 방법은 상기 벡터를 리가아제를 사용하여 공유결합에 의해 폐쇄시키는 단계를 더 포함하는 것인 방법.
  21. 청구항 1에 있어서, 상기 결합 모티프는 세포 표적에 대한 결합을 허용하기 위해 형태 내에 특정한 뉴클레오티드 잔기의 존재를 포함하는 것인 핵산.
  22. 청구항 1에 있어서, 상기 결합 모티프는 단백질; 당단백질, 지단백질을 포함한 변형된 단백질; 펩티드; 탄수화물; 지질 또는 당지질 또는 인지질을 포함한 변형된 지질에 결합하는 것인 핵산.
KR1020237012892A 2020-09-18 2021-09-20 자가-표적화 발현 벡터 KR20230074507A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB2014751.8 2020-09-18
GBGB2014751.8A GB202014751D0 (en) 2020-09-18 2020-09-18 Targeting vector
PCT/GB2021/052439 WO2022058755A1 (en) 2020-09-18 2021-09-20 Self-targeting expression vector

Publications (1)

Publication Number Publication Date
KR20230074507A true KR20230074507A (ko) 2023-05-30

Family

ID=73139036

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237012892A KR20230074507A (ko) 2020-09-18 2021-09-20 자가-표적화 발현 벡터

Country Status (11)

Country Link
US (1) US20230357790A1 (ko)
EP (1) EP4214321A1 (ko)
JP (1) JP2023542347A (ko)
KR (1) KR20230074507A (ko)
CN (1) CN116615546A (ko)
AU (1) AU2021344868A1 (ko)
CA (1) CA3195897A1 (ko)
GB (1) GB202014751D0 (ko)
IL (1) IL301407A (ko)
MX (1) MX2023003201A (ko)
WO (1) WO2022058755A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023220454A1 (en) * 2022-05-13 2023-11-16 Twister Biotech, Inc. Conjugated composition and method for delivering a therapeutic nucleic acid sequence to a living cell
WO2023220729A2 (en) * 2022-05-13 2023-11-16 Flagship Pioneering Innovations Vii, Llc Double stranded dna compositions and related methods

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10119005A1 (de) * 2001-04-18 2002-10-24 Roche Diagnostics Gmbh Verfahren zur Proteinexpression ausgehend von stabilisierter linearer kurzer DNA in zellfreien in vitro-Transkription/Translations-Systemen mit Exonuklease-haltigen Lysaten oder in einem zellulären System enthaltend Exonukleasen
TW200817512A (en) * 2006-07-07 2008-04-16 Kirin Pharma Kk Human artificial chromosome (hac) vector, and human cell pharmaceutical comprising human artificial chromosome (hac) vector
GB201509578D0 (en) * 2015-06-03 2015-07-15 Univ Singapore Vectors
SG11201809002RA (en) * 2016-04-29 2018-11-29 Univ Nanyang Tech G-quadruplex-containing antisense oligonucleotides
EP3763823A1 (en) * 2016-08-16 2021-01-13 Touchlight IP Limited Closed linear dna production
NZ761412A (en) 2017-09-08 2024-07-05 Generation Bio Co Lipid nanoparticle formulations of non-viral, capsid-free dna vectors
NZ761178A (en) * 2017-09-08 2024-05-31 Generation Bio Co Modified closed-ended dna (cedna)
WO2019143885A1 (en) 2018-01-19 2019-07-25 Generation Bio Co. Closed-ended dna vectors obtainable from cell-free synthesis and process for obtaining cedna vectors
CA3104113A1 (en) 2018-06-22 2019-12-26 Asklepios Biopharmaceutical, Inc. Vectors for gene delivery that persist within cells
GB201905651D0 (en) * 2019-04-24 2019-06-05 Lightbio Ltd Nucleic acid constructs and methods for their manufacture

Also Published As

Publication number Publication date
AU2021344868A9 (en) 2023-07-06
IL301407A (en) 2023-05-01
CA3195897A1 (en) 2022-03-24
CN116615546A (zh) 2023-08-18
AU2021344868A1 (en) 2023-05-18
WO2022058755A1 (en) 2022-03-24
JP2023542347A (ja) 2023-10-06
US20230357790A1 (en) 2023-11-09
EP4214321A1 (en) 2023-07-26
MX2023003201A (es) 2023-07-07
GB202014751D0 (en) 2020-11-04

Similar Documents

Publication Publication Date Title
JP7093728B2 (ja) 化学的に修飾されたガイドrnaを使用する高特異性ゲノム編集
KR102595683B1 (ko) 변형된 가이드 rna
KR102418185B1 (ko) 단일 가닥 rna-편집 올리고뉴클레오타이드
JP7068821B2 (ja) 化学修飾を有するガイドrna
Montiel-Gonzalez et al. Current strategies for site-directed RNA editing using ADARs
EP4053285A2 (en) Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same
CN113939591A (zh) 编辑rna的方法和组合物
KR20210029772A (ko) 유전자 편집을 위한 변형된 가이드 rna
CN116042611A (zh) 编辑rna的方法和组合物
CN113661242A (zh) 包含经修饰的环状多核糖核苷酸的组合物及其用途
CN114981409A (zh) 用于基因组整合的方法和组合物
CN117487801A (zh) Dna合成的方法
KR20160089530A (ko) Hbv 및 바이러스 질병 및 질환을 위한 crispr­cas 시스템 및 조성물의 전달,용도 및 치료적 적용
US20180171354A1 (en) Vectors
KR102302679B1 (ko) 가이드 rna 및 엔도뉴클레아제를 유효성분으로 포함하는 암 치료용 약학적 조성물
KR20230074507A (ko) 자가-표적화 발현 벡터
KR20220123398A (ko) 합성 가이드 rna, 이의 조성물, 방법 및 용도
US20240277872A1 (en) Modified mrna, modified non-coding rna, and uses thereof
JP2023544817A (ja) CRISPR/Cas12f1システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
KR20240139088A (ko) 킬로베이스 규모의 rna 가이드 게놈 리콤비니어링
US20230272416A1 (en) Method and system for delivering nucleic acid
KR102703683B1 (ko) 유전자 편집을 위한 TaRGET 시스템 및 이의 용도
CN117460839A (zh) 具有增强的针对外切核酸酶的抗性的线性dna
KR20220018410A (ko) 세포질에서 자가전사가 가능하고 유전체 편집을 제공하는 rna/dna 시스템
CN114616338A (zh) 生成哑铃形dna载体的方法

Legal Events

Date Code Title Description
A201 Request for examination