KR20240003762A - RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도 - Google Patents

RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도 Download PDF

Info

Publication number
KR20240003762A
KR20240003762A KR1020230084276A KR20230084276A KR20240003762A KR 20240003762 A KR20240003762 A KR 20240003762A KR 1020230084276 A KR1020230084276 A KR 1020230084276A KR 20230084276 A KR20230084276 A KR 20230084276A KR 20240003762 A KR20240003762 A KR 20240003762A
Authority
KR
South Korea
Prior art keywords
rna
mrna
construct
zcchc2
cells
Prior art date
Application number
KR1020230084276A
Other languages
English (en)
Inventor
김빛내리
서제니
정수진
Original Assignee
서울대학교산학협력단
기초과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단, 기초과학연구원 filed Critical 서울대학교산학협력단
Publication of KR20240003762A publication Critical patent/KR20240003762A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)

Abstract

본원은 RNA 안정성 및/또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법 및 상기 방법에 의해 스크리닝된 신규 조절 엘리먼트에 관한 것이다.
본원의 스크리닝 방법을 통해 RNA 안정성 및/또는 mRNA 번역을 증가시키는 신규 조절 엘리먼트를 얻을 수 있다. 또한, 이러한 신규 조절 엘리먼트는 목적 단백질의 발현을 증가시킬 수 있으므로, 목적 단백질의 용도에 따라 다양한 분야에 응용 가능하다.

Description

RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도{A method of screening regulatory elements for enhancing RNA stability or mRNA translation, new regulatory elements according to the method, and use thereof}
본원은 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법, 상기 방법에 의해 스크리닝된 신규 조절 엘리먼트 및 이의 용도에 관한 것이다.
바이러스는 세포의 유전자 발현 기구를 가로채기 위해 다양한 기전을 진화시켰고, 이 분야의 연구는 RNA 생물학 및 생명 공학의 발전에 크게 기여하였다. 예를 들면, 7-메틸구아노신 캡, 내부 리보솜 진입 부위 및 RNA 삼중 나선은 각각 레오바이러스, 소아마비 바이러스 및 카포시 육종 연관 헤르페스 바이러스에서 처음 발견되었다. 인간 면역결핍 바이러스(HIV)는 바이러스 전사 및 RNA 배출(export)을 위한 세포 인자를 모집하기 위해 각각 TAR(transactivation response region)과 RRE(rev-response element)를 활용하는 것으로 알려져 있다(Vaishnav, et. al., New Biol., 1991, 3, 142-150; Dingwall, et. al., EMBO J., 1990, 9, 4145-4153). B형 간염 바이러스(HBV)는 바이러스 전사체를 안정화시키는 숙주 뉴클레오딜 전이효소를 가져오기 위해 PRE(posttranscriptional regulatory element)에 의존한다(Kim, et. al., Nat. Struct. Mol. Biol., 2020, 27, 581-588; Huang, et. al., Mol. Cell. Biol., 1993, 13, 7476-7486).
그러나 이러한 발견은 전체 바이러스의 극히 일부에 불과한 병원성 바이러스에 대해 낮은 스루풋(throughput)을 갖는 분석을 통해 이루어졌다. 현재까지, 6,828종의 바이러스가 명명되었으며, NCBI 게놈 데이터베이스는 14,775개의 완전한 바이러스 게놈 서열을 보유하고 있다(O'Leary, et. al., Nucleic Acids Res., 2016, 44, D733-D745). 최근 심층 시퀀싱을 기초로 한 균유전체학(metagenomics) 연구는 환경 및 동물 샘플에서 수십만 개의 추가 바이러스 서열을 검출하였다(Neri, et. al., Cell, 2022, 185, 4023-4037). 이렇듯 사용 가능한 서열의 수가 방대하지만, 임상적 또는 산업적 관련성이 없는 서열은 대부분 미개발 상태로 존재하고 있다. 따라서, 급증하는 바이러스 서열 데이터는 기능적 주석에 대해 중요한 과제를 제시하며, 바이러스 서열 데이터를 해석하기 위해 보다 효과적인 전략을 요구한다.
이러한 배경 하에, 본 발명자들은 바이러스 서열 데이터를 이용하여 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트 및 이의 용도를 개발하였다.
본원의 하나의 목적은 RNA 안정성 및/또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법을 제공하는 것이다.
본원의 다른 하나의 목적은 RNA 안정성 및/또는 mRNA의 번역 증가용 조절 엘리먼트를 제공하는 것이다.
본원의 또 다른 하나의 목적은 목적 단백질의 유전자 및 이의 3' UTR에 상기 조절 엘리먼트를 포함하는 컨스트럭트, 벡터, 또는 재조합 숙주 세포를 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 컨스트럭트, 벡터, 또는 재조합 숙주 세포를 포함하는 조성물을 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 재조합 숙주 세포를 배양하는 단계; 및 목적 단백질을 분리하는 단계를 포함하는 목적 단백질의 제조 방법을 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 컨스트럭트 또는 벡터를 주형으로 시험관 내에서 컨스트럭트를 전사하는 단계; 및 전사된 mRNA 컨스트럭트를 회수하는 단계를 포함하는, mRNA 컨스트럭트의 제조 방법을 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 RNA 안정성 및/또는 mRNA 번역 증가를 위한 용도를 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 질환의 예방 또는 치료를 위한 용도를 제공하는 것이다.
본원의 또 다른 하나의 목적은 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 mRNA 컨스트럭트 또는 목적 단백질의 제조를 위한 용도를 제공하는 것이다.
본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 당해 기술분야의 통상의 지식을 가진 자는 통상의 실험만을 사용하여 본 출원에 기재된 본 출원의 특정 양태에 대한 다수의 등가물을 인지하거나 확인할 수 있다. 또한, 이러한 등가물은 본 출원에 포함되는 것으로 의도된다.
본 출원의 하나의 양태는 RNA 안정성 및/또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법이다. 스크리닝된 조절 엘리먼트는 RNA 안정성 및/또는 mRNA 번역을 증가시켜 목적한 단백질의 발현을 증가시킬 수 있다.
구체적으로, 상기 방법은 하기 단계를 포함할 수 있다:
(a) 바이러스 게놈을 타일링(tiling)하여 복수의 올리고뉴클레오티드를 제조하는 단계;
(b) 상기 올리고뉴클레오티드 각각을 포함하는 벡터의 풀(pool)을 제조하는 단계로서, 상기 벡터는 리포터의 유전자 및 이의 3' UTR에 하나의 올리고뉴클레오티드를 포함하는 것인, 단계;
(C) 각각의 벡터를 세포 내에 도입시키는 단계;
(d) 상기 세포로부터 DNA와 RNA 또는 유리 mRNA(free mRNA)와 무거운 폴리솜(Heavy polysome; HP)을 분리하여 각 올리고뉴클레오티드 별로 식 (1) 또는 식 (2)의 값을 구하는 단계;
- 식 (1) = Log2(RNA/DNA)
- 식 (2) = Log2(HP/유리 mRNA)
(e) 식 (1)의 값이 0.5를 초과하고/하거나 식 (2)의 값이 0.2를 초과하는 올리고뉴클레오티드를 각각 RNA 안정성 및/또는 mRNA 번역 증가용 조절 엘리먼트로 선별하는 단계.
본 출원에서 사용되는 바이러스 게놈은 공지의 데이터베이스(예: NCBI 등)로부터 얻을 수 있다.
(a) 단계의 타일링(tiling)은 당업계에서 게놈의 특성을 분석할 때 사용되고 있는 하나의 방법으로서, 게놈의 서열을 일정 크기(슬라이딩 윈도우)를 가진 세그먼트(segment)로 나누어 복수의 세그먼트를 생성할 때, 하나의 세그먼트의 1번 위치로부터 일정 변위(shift) 크기로 이동하여 다음의 세그먼트를 생성하는 방법이다. 예를 들어, 상기 슬라이딩 윈도우의 크기는 100 nt 내지 500 nt일 수 있으나 이에 제한되지 않는다. 또한, 상기 변위는 1 nt 내지 500 nt일 수 있으나 이에 제한되지 않는다. 슬라이딩 윈도우 및 변위의 크기는 당업자가 적절하게 선택할 수 있다.
상기 복수의 세그먼트에 1종 이상의 바코드 서열이 추가될 수 있다. 구체적으로, 하나의 세그먼트의 하류에 2종 이상의 바코드 서열이 1종씩 추가되어, 하나의 세그먼트 당 2 이상의 올리고뉴클레오티드가 생성될 수 있다. 즉, 본 출원에서 복수의 올리고뉴클레오티드는 1종 이상의 바코드 서열을 포함할 수 있다.
(b) 단계에서 복수의 올리고뉴클레오티드가 하나씩 벡터로 도입되어 복수의 벡터(즉, 벡터의 풀(pool))가 제조된다. 이때 올리고뉴클레오티드는 벡터 내 리포터 유전자의 3' UTR에 도입될 수 있다.
본 출원에서 리포터는 루시페라아제, 형광 단백질, 베타-갈락토시다아제, 클로람페니콜 아세틸전달효소, 또는 에쿼린(aequorin)일 수 있으나, 이에 제한되지 않는다.
본 출원에서 벡터를 세포내로 도입시키는 방법은 핵산을 세포 내로 도입하는 어떤 방법(예: 형질감염 또는 형질전환)도 포함되며, 세포에 따라 당 분야에서 공지된 바와 같은 적합한 표준 기술을 선택하여 수행할 수 있다. 예를 들어, 전기천공법(electroporation), 인산칼슘(CaPO4) 침전, 염화칼슘(CaCl2) 침전, 미세주입법(microinjection), 폴리에틸렌글리콜(PEG)법, DEAE-덱스트란법, 양이온 리포좀법, 및 초산 리튬-DMSO법 등이 있으나, 이에 제한되지 않는다.
(d) 단계에서 벡터가 도입된 세포로부터 DNA와 RNA 또는 유리 mRNA와 HP를 분리하는 방법은 당 분야에서 공지된 바와 같은 적합한 표준 기술을 선택하여 수행할 수 있다.
하나의 구현예로서 (d) 단계는 RNA 및 DNA를 추출하여 분리하고/하거나, 분리된 RNA에 DNase I을 처리하여 벡터의 DNA를 제거하는 단계를 포함할 수 있으나, 이에 제한되지 않는다.
하나의 구현예로서 (d) 단계는 세포를 용해하고 원심분리하여, 폴리솜을 유리 mRNA 및 HP로 분획하거나, 또는 유리 mRNA, 모노솜(Monosome), 가벼운 폴리솜(Light polysome; LP), 중간 폴리솜(Medium polysome; MP) 및 HP로 분획하는 단계를 포함할 수 있으나, 이에 제한되지 않는다.
분리된 DNA와 RNA 또는 유리 mRNA 및 HP를 토대로 각 올리고뉴클레오티드 별(즉, 바이러스 게놈의 각 세그먼트 별) 식 (1) 또는 식 (2)의 값을 구할 수 있다. 예를 들어, 분리된 RNA를 역전사하여 cDNA를 얻은 후, DNA, cDNA 및 원래 벡터의 풀을 PCR로 증폭한 후 시퀀싱하여 각 올리고뉴클레오티드 별 식 (1) 또는 식 (2)의 값을 구할 수 있으나, 이에 제한되지 않는다.
상기 계산된 식 (1)의 값이 0.5를 초과하거나 식 (2)의 값이 0.2를 초과하는 올리고뉴클레오티드는 각각 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트로 선별할 수 있다.
본 출원에서 RNA 안정성 증가용 조절 엘리먼트는 추가로 p-값이 0.05 미만인 조건을 만족할 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 상기 스크리닝하는 방법에 의해 스크리닝된 RNA 안정성 및/또는 mRNA 번역 증가용 조절 엘리먼트이다. 상기 조절 엘리먼트는 RNA 안정성 및/또는 mRNA 번역을 증가시켜 단백질의 발현을 증가시킬 수 있다.
구체적으로, 상기 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트는 식 (1) 또는 식 (2)의 값이 각각 0.5 또는 0.2를 초과하는 조절 엘리먼트일 수 있으나, 이에 제한되지 않는다.
예를 들어, 조절 엘리먼트에 대한 식 (1) 또는 식 (2)의 값은 하기 단계를 포함하는 방법을 통해 구할 수 있다:
(i) 리포터의 유전자 및 이의 3' UTR에 조절 엘리먼트를 포함하는 벡터를 제조하는 단계;
(ii) 벡터를 세포 내에 도입시키는 단계; 및
(iii) 상기 세포로부터 DNA와 RNA 또는 HP와 유리 mRNA을 분리하여 식 (1) 또는 식 (2)의 값을 구하는 단계.
구체적으로, 상기 RNA 안정성 증가용 조절 엘리먼트는 추가로 p-값이 0.05 미만인 조건을 만족할 수 있으나, 이에 제한되지 않는다.
본 출원에서 식 (1)의 값이 0.5를 초과하는 조절 엘리먼트는 RNA 안정성을 증가시킬 수 있으며, 서열번호 1 내지 50 중 어느 하나의 염기 서열 또는 이의 RNA 염기 서열; 또는 이와 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 상동성(homology) 또는 동일성(identity)을 갖는 염기 서열을 포함할 수 있으나, 이에 제한되지 않는다.
본 출원에서 식 (2)의 값이 0.2를 초과하는 조절 엘리먼트는 mRNA의 번역을 증가시킬 수 있으며, 서열번호 17, 20, 및 51 내지 78 중 어느 하나의 염기 서열 또는 이의 RNA 염기 서열; 또는 이와 적어도 90%, 95%, 96%, 97%, 98% 또는 99% 상동성 또는 동일성을 갖는 염기 서열을 포함할 수 있으나, 이에 제한되지 않는다.
한편 본 출원에서 "특정 서열번호의 염기 서열을 포함하는 조절 엘리먼트", 또는 "특정 서열번호의 염기 서열을 가지는 조절 엘리먼트"라고 기재되어 있다 하더라도, 해당 서열번호의 염기 서열로 구성된 조절 엘리먼트와 동일 혹은 상응하는 기능을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 염기 서열을 갖는 조절 엘리먼트도 본 출원에서 사용될 수 있음은 자명하다.
예를 들어, 상기 조절 엘리먼트와 동일 혹은 상응하는 기능을 가지는 경우라면 해당 서열번호의 조절 엘리먼트 서열 내부나 말단에 무의미한 서열이 부가되거나 혹은 해당 서열번호의 조절 엘리먼트 서열 내부나 말단의 일부 서열이 결실된 조절 엘리먼트도 본원의 범위 내에 속하는 것이 자명하다.
상동성(homology) 및 동일성(identity)은 두 개의 주어진 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
임의의 두 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 서열의 상동성, 유사성 또는 동일성을 결정할 수 있다.
본 출원의 조절 엘리먼트는 TENT4와 상호작용하여, 폴리(A) 테일의 길이 증가, 혼합 테일링에 의한 폴리(A) 테일의 안정성 증가, 또는 둘 모두를 유도할 수 있다
본 출원의 다른 하나의 양태는, 목적 단백질의 유전자 및 이의 3' UTR에 본 발명의 조절 엘리먼트를 포함하는 컨스트럭트이다.
본 출원에서 목적 단백질은 본 발명의 조절 엘리먼트에 의해 RNA 안정성 및/또는 mRNA의 번역이 증가될 수 있는 한 제한되지 않으나, 리포터, 생리활성 펩타이드, 항원, 또는 항체 또는 이의 단편으로부터 선택될 수 있다.
본 출원에서 생리활성 폴리펩타이드는 호르몬, 사이토카인, 사이토카인 결합 단백질, 효소, 성장인자, 또는 인슐린일 수 있으나, 이에 제한되지 않는다.
본 출원에서 항원은 백신 항원, 암 관련 항원, 알레르기 항원일 수 있으나, 이에 제한되지 않는다.
하나의 구현예로서 본 출원의 컨스트럭트는 하나 이상의 바코드 서열, 정방향 어댑터 서열, 역방향 어댑터 서열, 폴리(A) 테일의 서열, 또는 이들의 조합을 추가로 포함할 수 있으나, 이에 제한되지 않는다.
하나의 구현예로서 본 출원의 컨스트럭트는 프로모터 서열을 추가로 포함할 수 있으며, 이 때 목적 단백질은 프로모터 서열과 작동 가능하게 연결될 수 있으나, 이에 제한되지 않는다.
하나의 구현예로서 본 출원의 컨스트럭트는 아데노 관련 바이러스, 아데노바이러스, 알파바이러스, 레트로바이러스(예: 감마 레트로바이러스, 및 렌티바이러스), 파보바이러스, 헤르페스바이러스, 및 SV40으로 이루어진 군으로부터 선택되는 바이러스의 5' 반복서열 및 3' 반복서열을 포함할 수 있으나, 이에 제한되지 않는다.
하나의 구현예로서 본 출원의 mRNA 컨스트럭트는 5' UTR, 3'UTR, 폴리(A) 테일의 서열, 또는 이들의 조합을 추가로 포함할 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트를 포함하는 벡터 또는 상기 벡터의 풀(pool)이다.
본 출원에서 사용된 용어 "벡터"는 적합한 숙주 내에서 목적 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 목적 단백질을 코딩하는 염기 서열을 함유하는 유전자 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열 등의 구성을 포함할 수 있으나, 이에 제한되지 않는다. 상기 벡터는 적당한 숙주세포 내로 도입된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있거나, 또는 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 숙주세포 내에서 발현 가능한 것이면 특별히 제한되지 않으며, 당업계에 알려진 임의의 벡터를 이용하여 숙주세포에 도입시킬 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 목적 단백질의 유전자의 전사를 개시 및 매개하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 벡터는 시험관내(in vitro), 생체내(in vivo), 또는 생체외(ex vivo) 세포에서 목적 단백질을 발현시킬 수 있다. 예를 들어, 본 출원의 벡터를 이용하여 생체내 또는 생체외 세포에서 목적 단백질을 발현시키는 경우, 상기 벡터를 치료 목적으로 이용할 수 있다. 또한, 본 출원의 벡터를 이용하여 시험관내 세포에서 목적 단백질을 발현시키는 경우, 상기 벡터를 목적 단백질의 제조 목적으로 이용할 수 있다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트 또는 벡터를 포함하는 재조합 숙주 세포이다.
본 출원에서 숙주 세포는 목적 단백질을 발현시킬 수 있는 세포를 모두 포함하며, 자연적 또는 인위적으로 유전적 변형이 일어난 세포를 포괄한다. 또한, 상기 숙주 세포는 진핵 세포 및 원핵 세포를 포함하며, 구체적으로 진핵 세포 또는 포유 동물(예: 인간) 유래 세포일 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트, 벡터 또는 재조합 숙주 세포를 포함하는 조성물이다. 본 출원의 컨스트럭트, 벡터, 재조합 숙주 세포 또는 이들을 포함하는 조성물은 시험관내(in vitro), 생체내(in vivo), 또는 생체외(ex vivo)에서 목적 단백질을 발현시킬 수 있다.
하나의 구현예로서 상기 조성물이 개체에게 투여되는 경우 상기 컨스트럭트, 벡터 또는 재조합 숙주 세포에 의해 목적 단백질을 개체에게 제공할 수 있으므로, 제공된 목적 단백질의 용도에 따라 질병(예: 감염병)의 예방 또는 치료 효과를 나타낼 수 있다. 따라서, 상기 조성물은 약학 조성물일 수 있으나, 이에 제한되지 않는다.
또한, 하나의 구현예로서 상기 컨스트럭트, 벡터 또는 재조합 숙주 세포를 이용하여 시험관내 또는 생체외에서 본 출원의 mRNA 컨스트럭트 또는 목적 단백질을 생산할 수 있다. 따라서, 상기 조성물은 본 출원의 mRNA 컨스트럭트 또는 목적 단백질의 제조를 위한 조성물일 수 있으나, 이에 제한되지 않는다.
예를 들어, 목적 단백질이 백신 항원인 경우, 상기 컨스트럭트, 벡터, 재조합 숙주 세포 또는 조성물 자체가 백신으로 이용되거나, 또는 이들을 이용하여 백신 항원을 제조할 수 있다.
하나의 구현예로서 본 출원의 컨스트럭트 또는 벡터는 TENT4를 코딩하는 유전자; 또는 이들의 조합을 추가로 포함하거나, 본 출원의 재조합 숙주 세포 또는 조성물이 TENT4 또는 이를 코딩하는 유전자; 또는 이들의 조합을 추가로 포함하여, TENT4와의 상호작용을 통해 폴리(A) 테일의 길이 증가, 폴리(A) 테일의 안정성 증가 또는 둘 모두를 유도하여, RNA 안정성 또는 mRNA 번역을 증가시킬 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 상기 조절 엘리먼트와 상호작용하는 TENT4 또는 이를 코딩하는 유전자를 포함하는 조성물이다.
상기 TENT4와의 상호작용을 통해 폴리(A) 테일의 길이 증가, 혼합 테일링을 통한 폴리(A) 테일의 안정성 증가 또는 둘 모두를 유도하여, RNA 안정성 또는 mRNA 번역을 증가시킬 수 있다. 따라서, 상기 조성물은 시험관내(in vitro), 생체내(in vivo), 또는 생체외(ex vivo)에서 본 출원의 목적 단백질의 발현을 증가시킬 수 있다.
하나의 구현예로서, 목적 단백질의 발현을 위해 상기 조성물은 본 출원의 컨스트럭트, 벡터 및/또는 재조합 숙주 세포를 추가로 포함하거나, TENT4 또는 이를 코딩하는 유전자가 본 출원의 컨스트럭트, 벡터, 및/또는 재조합 숙주 세포에 포함될 수 있다.
하나의 구현예로서 상기 조성물에 의해 생체내 발현이 증가되는 목적 단백질의 용도에 따라, 상기 조성물은 질병의 예방 또는 치료 효과를 나타낼 수 있다. 따라서, 상기 조성물은 약학 조성물일 수 있으나, 이에 제한되지 않는다.
또한, 하나의 구현예로서 상기 조성물을 이용하여 시험관내 또는 생체외에서 본 출원의 mRNA 컨스트럭트 또는 목적 단백질을 생산할 수 있다. 따라서, 상기 조성물은 본 출원의 mRNA 컨스트럭트 또는 목적 단백질의 제조를 위한 조성물일 수 있으나, 이에 제한되지 않는다.
예를 들어, 목적 단백질이 백신 항원인 경우, 상기 조성물에 의해 생체내에서 백신 항원의 발현이 증가할 수 있으므로 상기 조성물을 백신 조성물로 이용하거나, 또는 상기 조성물을 이용하여 시험관내 또는 생체외에서 백신 항원을 제조할 수 있다.
본 출원의 다른 하나의 양태는, 상기 재조합 숙주 세포를 배양하는 단계; 및 목적 단백질을 회수하는 단계를 포함하는 목적 단백질의 제조 방법이다.
본 출원에서 상기 재조합 숙주 세포를 이용하여 목적 단백질을 생산하는 방법은 당업계에 널리 알려져 있는 방법을 이용하여 수행할 수 있다. 구체적으로, 상기 배양은 배치 공정, 주입 배치 또는 반복 주입 배치 공정(fed batch or repeated fed batch process)에서 연속식으로 배양할 수 있으나, 이에 제한되는 것은 아니다. 배양에 사용되는 배지는 숙주 세포에 따라 통상의 기술자가 적절하게 선택할 수 있다. 구체적으로는 본 출원의 재조합 숙주 세포를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 또는 혐기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
상기 목적 단백질의 제조 방법은, 상기 배양 단계 이후, 추가적인 공정을 더 포함할 수 있다. 상기 추가 공정은 목적 단백질의 용도에 따라 적절히 선택될 수 있다.
구체적으로, 상기 목적 단백질의 제조 방법은 상기 배양 단계 이후 상기 재조합 숙주 세포, 재조합 숙주 세포의 건조물, 재조합 숙주 세포의 추출물, 재조합 숙주 세포의 배양물, 상기 배양물의 상등액, 재조합 숙주 세포의 파쇄물 중에서 선택된 하나 이상의 물질로부터 목적 단백질을 회수하는 단계를 포함할 수 있다.
상기 방법은 상기 회수 단계 이전, 혹은 동시에 조합 숙주 세포를 용해시키는 단계를 추가로 포함할 수 있다. 조합 숙주 세포의 용해는 본 출원이 속하는 기술 분야에서 통상적으로 사용되는 방법, 예를 들어, 용해용 완충용액, 소니케이터, 열 처리 및 후렌치 프레서 등에 의해 실시할 수 있다. 또한 상기 용해 단계는 세포벽/세포막 분해 효소, 핵산 분해 효소, 핵산 전이 효소, 및/또는 단백질 분해 효소 등 효소반응을 포함할 수 있으나 이에 제한되지 않는다.
본 출원에서 재조합 숙주 세포의 건조물은 목적 물질을 축적한 세포를 건조시켜 제조할 수 있으나, 이에 제한되지 않는다.
본 출원에서 재조합 숙주 세포의 추출물은 상기 세포에서 세포벽/세포막을 분리하고 남은 물질을 의미할 수 있다. 구체적으로, 세포를 용해시켜 수득한 성분에서 세포벽/세포막을 제외한 나머지 성분을 의미할 수 있다. 상기 세포 추출물은 목적 단백질을 포함하며, 목적 단백질 외의 성분으로는 세포의 단백질, 탄수화물, 핵산, 섬유질 중 하나 이상의 성분이 포함되어 있을 수 있으나 이에 제한되지 않는다.
본 출원에서 회수 단계는 당해 기술 분야에 공지된 적합한 방법(예컨대 원심분리, 여과, 음이온 교환 크로마토그래피, 결정화 및 HPLC 등)을 이용하여, 목적 단백질을 회수할 수 있다.
본 출원에서 회수 단계는 정제 공정을 포함할 수 있다. 상기 정제 공정은 세포로부터 목적 단백질만을 분리하여 순수 정제하는 것일 수 있다. 상기 정제 공정을 통해, 순수 정제된 목적 단백질이 제조될 수 있다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트 또는 벡터를 시험관 내에서 전사하는 단계; 및 전사된 mRNA 컨스트럭트를 회수하는 단계를 포함하는, mRNA 컨스트럭트의 제조 방법이다.
상기 전사 방법 및 회수 방법은 당해 기술 분야에 공지된 적합한 방법을 이용할 수 있다.
하나의 구현예로서 상기 방법은 전사 후 DNase I을 처리하여 주형으로 사용된 컨스트럭트 또는 벡터의 DNA를 제거하는 단계; 및/또는 세척하는 단계를 추가로 포함할 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 RNA 안정성 및/또는 mRNA 번역 증가를 위한 용도이다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 질환의 예방 또는 치료를 위한 용도이다.
본 출원의 다른 하나의 양태는, 상기 컨스트럭트, 벡터, 재조합 숙주 세포, 또는 조성물의 목적 단백질의 제조를 위한 용도이다.
본원의 스크리닝 방법을 통해 RNA 안정성 및/또는 mRNA 번역을 증가시키는 신규 조절 엘리먼트를 얻을 수 있다. 또한, 이러한 신규 조절 엘리먼트는 목적 단백질의 발현을 증가시킬 수 있으므로, 목적 단백질의 용도에 따라 다양한 분야에 응용 가능하다.
도 1A 내지 1E는 조절 RNA 엘리먼트를 동정하기 위한 바이로믹 스크린에 관한 것이다.
도 1A는 인간을 감염시킬 수 있는 바이러스를 스크리닝하여 총 종의 수 및 평균 게놈 크기를 나타낸 것이다. 각 과(family)의 총 종의 수 및 평균 게놈 크기는 회색 막대로 표시하였다. 라이브러리에서 다루는 게놈의 총 종의 수 및 평균 부분은 컬러 막대로 나타내었다.
도 1B는 바이로믹스 스크린을 위한 실험 구조 설계 및 실험절차를 모식도로 나타낸 것이다. 65nt 타일링 단계에서 130nt 길이의 세그먼트 30,367개를 각각 3개의 다른 바코드와 연결하여 총 91,101개의 올리고를 생성하였다. 상기 올리고는 반딧불이 루시페라아제 구조의 3'UTR에 클로닝되었다. 다음으로 플라스미드 풀을 HCT116 세포 내로 형질감염하였다. RNA 안정성 효과를 정량화하기 위해, 리포터 DNA 및 RNA를 추출하여 PCR로 증폭한 후 시퀀싱하였다. 폴리솜 프로파일링의 경우, 수크로스 구배 원심분리로 5개의 분획을 수득하였고 리포터 RNA를 시퀀싱하였다.
도 1C는 RNA 풍부도(abundance)를 순위별로 정렬한 그래프이다. RNA 풍부도 점수는 log2 비율(RNA의 리드 분획을 DNA의 리드 분획으로 나눈 값)로 계산하였다. 양성 대조군(HCMV 1E, WPRE), 음성 대조군(HCMV 1Em), 간염 델타 바이러스의 자가 절단 리보자임 및 바이러스 miRNA를 나타내었다.
도 1D는 바이러스 리포터 mRNA의 폴리솜(polysome)을 프로파일링 한 결과를 나타낸 것이다. 색은 각 분획에서 RNA의 상대적 풍부도를 나타내는 것이다. 20개의 클러스터는 계층적 클러스터링을 사용하여 생성되었고, heavy polysome 및 유리 mRNA 사이의 리드 비율에 따라 정렬하였다.
도 1E는 대표적인 클러스터에서의 RNA 분포 패턴을 나타낸 것이다.
도 2는 바이러스 조절 엘리먼트의 검증에 관한 것이다.
도 2A는 RNA 풍부도(X축) 및 번역(Y축)에 미치는 영향을 비교한 그래프이다.
도 2B는 선택된 16개의 세그먼트에 대한 유효성을 루시페라아제 활성을 통해 조사한 것이다. K1-K16(도 2A에서 하늘색 점으로 표시)은 이중 루시페라아제 리포터에서 개별적으로 클로닝하였다. Ctrl은 K 엘리먼트가 없는 리포터를 나타내며 정규화에 사용되었다. 데이터는 평균±평균의 표준 오차(SEM)로 표시하였다(n=8번의 생물학적 반복실험). *p는 0.05 미만을, **p는 0.01 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 2C는 Saffold 바이러스(NC_009448.2, 왼쪽) 및 Aichi 바이러스 1(NC_001918.1, 오른쪽)의 게놈 구조 및 각 바이러스에 표시된 K4 및 K5 엘리먼트의 게놈 좌표를 나타낸 것이다.
도 2D는 UTR 리포터의 루시페라아제 활성을 나타낸 것이다. *p<0.05를 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 2E는 절단된 K5 리포터의 루시페라아제 활성을 나타낸 것으로, 120-K5(8132-8251, 120-nt) 및 110-K5(8142-8251, 110-nt)는 K5의 잘린 형태를 나타낸다. 데이터는 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 3A 내지 3E는 K5 엘리먼트의 특성에 관한 것이다.
도 3A는 K5 변종 및 동족체를 포함하는 이차 스크리닝에 대한 모식도를 나타낸 것이다. 상동 엘리먼트는 피코르나바이러스 88개의 3' 말단 130-nt 세그먼트에서 파생되었다. RNA 안정성은 도 1B에서와 같이 측정하였다.
도 3B는 이차 스크리닝의 결과를 나타낸 것이다. DNA 수(X축) 및 RNA 수(Y축)는 염기서열분석으로 측정하였다. K5(빨간색), K5m(진한 빨간색) 및 코부 바이러스의 상동 세그먼트(분홍색)를 표시하였다.
도 3C는 K5의 돌연변이를 사용한 이차 스크리닝의 결과로, 치환 돌연변이체로 측정한 RNA/DNA 비율(위) 및 하나 또는 두 개의 뉴클레오티드 결실 후 정량화한 비율(아래)을 나타낸 것이다. K5 및 K5m 결과의 RNA/DNA 비율은 수평선으로 나타내었다. 데이터는 치환에 대해 평균±SEM 오차 막대 및 결실에 대해 음영으로 표시하였다(n=3).
도 3D는 K5의 2차 구조를 예측한 것이다. 염기 식별 점수(자홍색으로 표시) 및 염기쌍 점수(염기쌍 사이의 파란색 선의 너비로 표시)는 이차 스크리닝으로 측정하였다.
도 3E는 스크리닝에 사용된 Picornaviridae 3' UTR 서열의 Cladogram을 나타낸 것이다. 코부바이러스 속은 붉은색 음영으로 강조하여 표시하였다. 엘리먼트 보존 점수(붉은색 상자)는 인간 아이치 바이러스의 K5 엘리먼트에 대한 서열 상동성의 정도를 나타내었다. RNA 안정화 효과는 녹색 상자로 표시하였다.
도 4는 K5가 AAV 벡터 및 합성 mRNA로부터의 유전자 발현을 향상시키는 것을 보여준다.
도 4A는 K5 엘리먼트 또는 WPRE를 포함하는 AAV 구조를 간략하게 나타낸 것이다. K5 활동을 저해하는 G-돌출부의 결실은 별표로 나타내었다.
도 4B는 10,000 moi의 Hela 세포로 형질도입된 K5 또는 WPRE를 포함하는 rAAV 구조로부터의 GFP 발현을 나타낸 것이다. 데이터는 모의 값으로 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 4C는 rAAV에 감염된 Hela 세포의 GFP의 발현을 유세포 분석으로 확인한 것이다.
도 4D는 eK5 및 그 돌연변이(위) 및 알파 글로빈 UTR(GBA) 및/또는 K5(아래)를 포함하는 d2EGFP IVT mRNA 구조를 포함하거나 포함하지 않는 반딧불이 루시페라제 인코딩 IVT mRNA를 개략적으로 나타낸 것이다.
도 4E는 HeLa 세포에 전달된 합성 mRNA로부터의 루시페라아제 발현을 나타낸 것이다. 데이터는 Ctrl(24hpt) 값으로 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 4F는 형질감염 후 72시간에 d2EGFP mRNA 리포터로 형질감염된 HeLa 세포로 웨스턴 블롯을 수행한 결과이다.
도 5는 K5가 TENT4에 의해 혼합 테일링을 유도하는 것을 보여준다.
도 5A는 Hire-PAT로 측정한 Poly(A)의 길이 분포를 나타낸 것이다. 정규화된 강도(임의 단위, a.u.)는 리드(read)의 백분위수이며, 이를 다음의 모든 Hire-PAT 분석에 적용하였다. HeLa 세포를 대조군, K5 리포터, 또는 그의 돌연변이체 K5m 플라스미드로 형질감염하였다. 크기 마커 역할을 하는 PCR의 부산물은 별표로 나타내었다.
도 5B는 대조군 및 K5 리포터의 루시페라제 발현에 의해 측정된 말단 뉴클레오티딜 전이효소가 K5 활성에 미치는 녹다운 효과를 나타낸 것이다. 밀접하하게 연관된 paralog는 TENT3(TENT3A/TUT4/ZCCHC11 및 TENT3B/TUT7/ZCCHC6), TENT4(TENT4A/PAPD7/TRF4-1/TUT5 및 TENT4B/PAPD5/TRF4-2/TUT3) 및 TENT5(TENT5A, TENT5B, TENT5C 및 TENT5D)와 함께 감소한 점에 유의해야 한다. 데이터는 각 리포터 구조에 대해 대조군 siRNA(siCont) 값으로 정규화하였고 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 5C는 Hire-PAT에 의해 측정된 K5 리포터 mRNA의 폴리(A) 길이 분포를 나타낸 것이다. HeLa 세포를 TENT4 억제제 RG7834 또는 R-이성질체 RO0321로 처리하였다. PCR의 부산물은 별표로 나타내었다.
도 5D는 HeLa 세포에서 K5를 포함하는 리포터의 폴리(A) 테일의 3' 말단 위치 내에서 비아데노신 잔기를 계산하기 위한 유전자 특이적 TAIL-seq를 나타낸 것이다. 각 위치의 혼합 테일링 비율은 3' 말단으로부터의 거리로 표시하였다.
도 5E는 RO0321 또는 RG7834의 존재 하에 K5 및 eK5 플라스미드로 형질감염된 HeLa 세포의 루시페라아제 활성을 나타낸 것이다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl) 없이 리포터에 대해 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 5F는 RO0321 또는 RG7834의 존재 하에 K5 및 eK5 플라스미드로 형질감염된 HeLa 세포의 RT-qPCR 결과를 나타낸 것이다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl) 없이 리포터에 대해 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 5G는 HCT116 모세포 및 ZCCHC14 KO 세포에서 K5 리포터의 루시페라아제 분석 결과를 나타낸 것이다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl) 없이 리포터로 정규화하였고 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 5H는 eK5를 사용한 RaPID(RNA-단백질 상호작용 검출) 실험에 이어 질량-분광 분석 결과를 나타낸 것이다. eK5 엘리먼트가 없는 3xBoxB 서열은 음성 대조군으로 사용하였다. 하늘색 점은 두 번 이상의 반복실험(Log2FC>1)에서 농축된 단백질을 나타내는 것이다. 100,000개의 유사값은 누락된 LFQ 값에 추가하였다. DNAJC21 및 ZCCHC2는 세포질 국소화 및 핵산 GO 용어를 갖는 단백질을 나타내는 것이다.
도 5I는 eK5를 사용한 RaPID(RNA-단백질 상호작용 검출) 실험에 이어 웨스턴 블롯 결과를 나타낸 것이다. eK5 엘리먼트가 없는 3xBoxB 서열은 음성 대조군으로 사용하였다. 100,000개의 유사값은 누락된 LFQ 값에 추가하였다. DNAJC21 및 ZCCHC2는 세포질 국소화 및 핵산 GO 용어를 갖는 단백질을 나타내는 것이다.
도 6은 K5의 호스트 인자로서의 ZCCHC2의 기능을 보여준다.
도 6A는 ZCCHC14 및 C.elegans gls-1과 비교한 ZCCHC2의 도메인 구조를 나타낸 것이다. 3개의 단백질로 계산된 아미노산 유사성 점수는 각 도메인 구조 위에 표시하였다. 상기 단백질 중에서 가장 높은 유사성 영역은 붉은색 괄호로 나타내었다. 도 6I, K 및 L에 사용된 ZCCHC2 변이체, ΔC(1-375 a.a), ΔN(201-1,178 a.a) 및 ZnF 변이체를 ZCCHC2 구조 아래에 나타내었다.
도 6B는 HeLa 모세포 및 TENT4 이중 KO 세포의 용해물을 사용하여 RNase A의 존재 하에서 항-TENT4A 및 항-TENT4B와의 공동 면역침전으로 ZCCHC2와 TENT4 사이의 상호작용을 나타낸 것이다. 단백질은 웨스턴 블롯으로 시각화하였다. ZCCHC14 및 TENT4A는 동일한 양의 샘플을 가지는 다른 겔로 분석하였다. 교차 반응 밴드는 별표로 나타내었다.
도 6C는 해당되는 항체를 사용한 웨스턴 블롯에 이어 아세포 분석으로 검사된 ZCCHC2의 국소화를 나타낸 것이다. GM130은 동일한 양의 샘플을 가지는 다른 겔로 분석하였다.
도 6D는 3' UTR에서 eK5로 EGFP mRNA를 안정적으로 발현하는 HeLa 세포에서 항-ZCCHC2 항체로 면역침전한 후 RT-qPCR을 수행한 결과를 나타낸 것이다. normal rabbit IgG를 사용한 면역침전을 대조군 및 정규화에 사용하였다. EGFP-eK5 mRNA는 다른 RNA(GAPDH, U1 snRNA 및 18S rRNA)와 달리 anti-ZCCHC2 항체로 특이적으로 침전되었다. 데이터는 EGFP-eK5(IgG) qPCR 값으로 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 6E는 HeLa 모세포 및 HeLa ZCCHC2 KO 세포에서 Hire-PAT 분석으로 측정한 K5 및 K5m 리포터 mRNA의 Poly(A) 테일의 길이 분포를 나타낸 것이다. 크기 마커 역할을 하는 PCR의 부산물은 별표로 나타내었다.
도 6F는 HeLa 모세포 및 ZCCHC2 KO 세포에서 유전자 특이적 TAIL-seq에 의해 측정된 K5 리포터 mRNA의 3' 폴리(A) 테일의 마지막 3개 위치 내의 비아데노신(Non-adenosine) 빈도를 나타낸 것이다.
도 6G는 K5 리포터로 형질감염된 HeLa 모세포 및 ZCCHC2 KO 세포에서의 루시페라아제 발현을 나타낸 것이다. 세포를 TENT4 억제제 RG7834 또는 그의 R-이성질체 RO0321로 처리하였다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl)가 없는 리포터로 정규화하였고 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 6H는 야생형 ZCCHC2의 이소성 발현을 가지는 HeLa ZCCHC2 KO 세포의 구조를 나타낸 것이다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl)가 없는 리포터로 정규화하였고, 평균±SEM(n=3)으로 표시하였다. *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 6I는 야생형 ZCCHC2, ZCCHC2 징크 핑거 돌연변이 및 ZCCHC2 ΔN 구조를 나타낸 것이다. 데이터는 각 조건에서 K5 엘리먼트(Ctrl)가 없는 리포터로 정규화하였고, 평균±SEM으로 표시하였다(n=4(왼쪽), n=3(오른쪽)).
도 6J는 테더링 분석 결과로, λN 태그가 있거나 없는 ZCCHC2 단백질을 HeLa 세포에서 3xBoxB 루시페라아제 리포터 mRNA와 함께 공동 발현한 결과를 나타낸 것이다. TNRC6B 단백질의 C-말단 침묵(silencing) 도메인(716 내지 1,028 아미노산)을 대조군으로 사용하였다. 데이터는 야생형 샘플의 값으로 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 6K는 테더링 분석 결과로, ZCCHC2 징크-핑거 돌연변이를 리포터 mRNA에 인위적으로 연결하여 활성화된 결과를 나타낸 것이다. ZCCHC2 징크-핑거 돌연변이는 리포터 mRNA에 인위적으로 연결될 때 활성화되었다. 데이터는 야생형 샘플의 값으로 정규화하였고, 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 6L은 FLAG-태그된 ZCCHC2 단백질(F-ZCCHC2)을 HeLa ZCCHC2 KO 세포에서 일시적으로 발현하고, anti-FLAG 항체로 면역침전하여, 웨스턴 블랏팅에 의해 분석한 결과를 나타낸 것이다. 전장 또는 이의 절단된 돌연변이(ΔC, ΔN) ZCCHC2 단백질을 TENT4 단백질과 상호작용하는 능력에 대해 비교하였다. TENT4A와 GAPDH는 동일한 겔로 검출하였고, 다른 단백질은 동일한 양의 샘플이 있는 별도의 겔로 분석하였다. 교차 반응 밴드는 별표로 나타내었다.
도 7은 조절 RNA가 바이러스피어(virosphere)에 널리 퍼져 있는 것을 보여준다.
도 7A는 RO0321 또는 RG7834를 포함하는 HCT116 세포의 K1 내지 K16 엘리먼트에 대한 루시페라아제 리포터 분석을 나타낸 것이다.
도 7B는 K3, K4 및 K5 리포터로 형질감염된 HCT116 모세포 및 ZCCHC14 KO 세포를 루시페라아제 분석한 결과이다. 데이터는 각 조건에서 K5(Ctrl)가 없는 리포터로 정규화하였고 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 7C는 K3, K4 및 K5 리포터로 형질감염된 HeLa 모세포 및 ZCCHC2 KO 세포를 루시페라아제 분석한 결과이다. 데이터는 각 조건에서 K5(Ctrl)가 없는 리포터로 정규화하였고 평균±SEM으로 표시하였다(n=3). *p는 0.05 미만을 나타내며, 양측 스튜던트 t-테스트를 수행하였다.
도 7D는 혼합 테일링을 이용하는 바이러스의 개략적인 모식도를 나타낸 것이다. RE, 1E 및 K3는 각각 HBV, HCMV 및 Norovirus에서 유래하였고, TENT4를 모집(recruit)하기 위해 ZCCHC14에 의존하였다. Saffold 바이러스의 K4는 TENT4에 의존하지만, ZCCHC14 및 ZCCHC2와는 독립적이었다.
도 7E는 RNA 풍부도(왼쪽), 번역(가운데) 및 세포내 국소화(오른쪽)를 제어하는 바이러스 패밀리에서 RNA 엘리먼트의 광범위한 분포를 나타낸 것이다.
도 8은 HCMV 1E 엘리먼트 및 루프 돌연변이를 포함하는 타일(tiles)의 도식이다.
도 9는 TENT4-ZCCHC14 복합체를 모집하는 SL2.7 RNA를 미끼로 사용하여 RNA 풀다운 후 질량 분석법 분석을 수행한 결과이다. SL2.7 돌연변이(X축) 및 '비드 전용' 컨트롤(Y축)을 정규화에 이용하였다. 파란색 점은 SL2.7 샘플에서 상당히 풍부한 단백질을 나타낸다(Log2FC > 0.8 및 FDR < 0.1). 누락된 LFQ 값에 허위값(pseudovalue) 10,000이 추가되다. HEK293T 세포 용해물을 RNA 풀다운에 사용했다(n=2). SAMD4 단백질은 이의 SAM 도메인을 통해 RNA에 결합하지만 SL2.7 11에 대한 강화 활성은 없다. K0355는 SAMD4B와 상호 작용하는 것으로 알려져 있다.
도 10은 K5가 렌티바이러스 벡터 및 합성 mRNA로부터의 유전자 발현을 향상시키는 것을 보여준다.
도 10A는 K5 엘리먼트 또는 WPRE를 포함하는 렌티바이러스 컨스트럭트를 간략하게 나타낸 것이다. K5 활동을 저해하는 G-돌출부의 결실은 별표로 나타내었다.
도 10B는 렌티바이러스에 감염된 Hela 세포의 GFP의 발현을 유세포 분석으로 확인한 것이다.
이하, 실험예 및 실시예를 통하여 본 발명을 더욱 상세하게 설명하기로 한다. 이들은 단지 본 발명을 예시하기 위한 것으로, 본 발명의 범위가 이들 실험예 및 실시예에 의해 제한되는 것으로 해석되지는 않는다.
[실험예]
1. 세포주 배양
본원에서 사용된 모든 세포주는 마이코플라즈마 음성 테스트를 거쳤다. HeLa 세포(서울대학교의 C. H. Chun 기증, ATCC(STR 프로파일링)에 의해 인증되었음), Lenti-X 293T 세포(Clontech, 632180) 및 293AAV 세포(Cell biolabs, AAV-100)를 10% FBS(Welgene, S001-01)가 포함된 DMEM 배지에서 배양하였다. HCT116 세포(ATCC, CCL-247)는 10% FBS를 포함하는 McCoy's 5A(Welgene, LM 005-01)에서 배양하였다.
2. 바이로믹 스크린(viromic screen)을 위한 올리고(oligo) 디자인
인간을 감염시킬 수 있는 바이러스의 게놈 서열을 NCBI 바이러스 게놈 브라우저(2020년 1월 10일 검색, 804개 서열, 504개 바이러스)에서 검색하였다. 각 바이러스에 대한 추가 정보는 NCBI 뉴클레오티드의 GenBank 파일에서 검색하였다. 서열 유사성 및 바이러스 분류를 기반으로, 143개의 대표적인 바이러스 종을 선정하고 우드척 간염 바이러스를 대조군으로 추가하였다. RNA 바이러스의 타일링(tiling)을 위해, 포지티브 센스 방향인 서열의 전체 게놈을 타일링에 사용하였다. DNA 바이러스의 경우, 코딩 전사체의 3' UTR의 서열 및 비코딩 RNA의 전체 서열을 올리고(oligo) 디자인에 사용하였다. UTR 주석이 없는 경우, UTR은 폴리 아데닐화 신호(PAS) 주석에 기초하여 예측되었다. PAS 주석이 없는 경우, PAS는 종결 코돈으로부터 800 bp의 범위 내에서 Dragon PolyA Spotter ver. 1.2를 사용하여 예측하였다. PAS를 예측할 수 없는 경우, 타일링을 위해 종결 코돈의 하류(downstream)에 있는 390-bp 영역을 사용하였다. 타일링을 위한 게놈 영역을 결정한 뒤, 65nt 변위(shift) 크기로 130nt의 슬라이딩 윈도우가 있는 올리고(oligo)를 설계하였다. 후에 복제에 사용된 SacI 또는 NotI 제한위치(restriction sites)가 포함된 윈도우가 포함된 경우, 제한위치에서 윈도우를 종결하여 더 짧은 세그먼트(segment)를 제조하였다. 다음 세그먼트는 제한위치에서 시작하여 플라스미드 제작 중에 SacI 또는 NotI에 의한 세그먼트의 절단을 방지하였다. 따라서 상기 스크리닝은 제한위치 서열을 포함하는 일부 바이러스의 엘리먼트를 놓칠 수 있다. 또한, 상기 디자인은 65nt보다 긴 일부 엘리먼트를 놓칠 수 있다. 예를 들면, 크기가 100nt인 엘리먼트의 누락될 확률을 대략 50% 정도이다.
적어도 3 해밍 거리(hamming distance)를 갖는 7bp 랜덤 서열의 3개의 바코드를 각 올리고 서열에 추가하였다. 대조군으로, 1E 세그먼트 및 그 스템 루프 돌연변이를 라이브러리에 추가하였다. 추가적으로, 인간 B형 간염 바이러스 PRE 및 이에 대응되는 스템 루프 돌연변이를 대조군으로 포함하였다. 양성 및 음성 대조군을 각각 타일링하였다. 총 30,367개의 세그먼트와 91,101개의 올리고를 설계하였다.
2차 스크리닝을 위해, 5개 클래스의 K5 돌연변이를 디자인하였다. 1) 단일 뉴클레오티드 치환의 경우, K5 전체에 걸쳐 각 위치의 염기가 다른 3가지 염기 타입으로 변환되었다. 2) 단일 뉴클레오티드 결손의 경우, 각 위치의 염기가 제거되었다. 3) 2개의 뉴클레오티드 결손의 경우, 모든 위치에서 2개의 연속적인 뉴클레오티드가 결실되었다. 4) 염기쌍의 유의성을 조사하기 위해, 2차 구조는 6개의 다른 RNA 2차 예측 소프트웨어에서 예측하였고, 38개의 예측된 염기쌍은 수집 및 염기쌍을 보존하는 방법으로 변이되었다(AT/TA/GC/CG/GU/UG/del). 5) 예상된 루프에서 무작위로 선택된 2개의 염기는 다른 조합을 만들기 위해 변이되었다. 또한, 다른 picornaviruses(Kobuvirus 속 45개 포함)의 88개의 상동 엘리먼트를 포함하는 K5의 동족체(homolog)를 스크리닝하였다. 상동성이 모호한 경우, 올리고 디자인을 위해 3'-최대 130nt를 사용하였다. 총합해서, 2차 스크리닝을 위한 라이브러리는 3개의 바코드 각각 당 1,288개의 엘리먼트를 포함하여, 총 3,864개 올리고가 생성되었다.
3. 플라스미드 풀(pool) 생성
170nt 길이의 올리고(16nt의 정방향 어댑터 서열, 17nt의 역방향 어댑터 서열 및 7nt의 바코드 서열 포함)를 Synbio Tchnologies에서 합성하였다. NotI 및 SacI 제한 부위는 부위는 Q5 High-Fidelity 2X Master Mix(NEB, M0492) 및 SacI-univ-F 및 NotI-univ-R 프라이머를 사용하여 6 사이클의 PCR 의해 추가되었다. 증폭된 생성물은 6% Native PAGE gel, SYBRgold(Invitrogen, S11494) 염색을 사용하여 정제하였다. 정제된 증폭 생성물 및 pmirGLO-3XmiR-1 벡터는 SacI-HF(NEB, R3156S) 및 NotI-HF(NEB, R3189S)로 절단하였고, DNA 연결효소(NEB, M0202M)를 T4에 의해 반딧불이 루시페라아제(luciferase) 유전자의 3' UTR에 클로닝하였다. 연결 생성물을 Zymo Oligo Clean & Concentrator kit(Zymo Research, #D4061)로 정제하였고, Lucigen Endura ElectroCompetent cell(Lucigen, LU60242-2)로 형질전환 하였다. 형질전환된 박테리아는 37℃에서 1시간동안 재생한 후 30℃에서 14시간 동안 진탕 배양하였다. 콜로니의 수는 대략 1E7로 확인되었다. 사용한 프라이머 서열을 하기 표 1에 나타내었다.
4. 라이브러리 구축
RNA 안정성 스크리닝을 위해, 4E5 HCT116 세포를 형질감염 1일 전에 접종(seeding)하였다. 1.5 μg의 플라스미드 풀(pool)을 Lipofectamine3000(Invitrogen, L3000001) 및 p3000을 사용하여 형질감염시켰다. RNA 및 DNA는 Allprep RNA/DNA Mini Kit(Qiagen, 80004)를 사용하여 형질전환 48시간 후에 추출하였으며, RNA에 재조합 DNase I(RNase-free)(TAKARA, 2270A)을 처리하여 남은 플라스미드 DNA를 제거하였다. RNA는 SSIV reverse transcriptase(Invitrogen, 18090010)를 사용하여 역전사되었다. 추출된 DNA, RNA로부터 얻어진 cDNA 및 원래 플라스미드 풀(pool)은 14 사이클의 PCR로 증폭되었고, 혼합된 프라이머 MPRAlib_N/NN/NNN_F 및 MPRAlib_N/NN/NNN_R가 사용되었다(표 1). 두번째 PCR의 6 사이클은 Illumina index primer를 사용하여 수행되었다. PCR 증폭물은 Illumina Novaseq 6000 플랫폼을 사용하여 차세대 염기서열분석에 의해 시퀀싱되었다.
핵/세포질 분획 스크리닝을 위해, 세포질은 세포질 용해 버퍼(0.15 μg/μl digitonin [Merck, D141], 150 mM NaCl, 50 mM HEPES [pH 7.0-7.6], 20 U/ml RNase 억제제 [Ambion, AM2696], 1X 프로테아제 억제제 [Calbiochem, 535140], 1X 포스파타제 억제제 [Merck, P0044])로 수득되었다. 라이브러리 제조 단계는 RNA 안정성 스크리닝과 동일하게 수행되었다.
폴리솜(polysome) 분획 스크리닝을 위해, Gradient MasterTM(Biocomp, B108-2)을 사용하여 10-50%의 수크로오스 구배를 준비하였다. RNA 안정성 스크리닝의 3배 규모를 가지는 HCT116 세포를 37℃에서 1분 동안 100μg/ml 시클로헥시미드(cycloheximide)로 처리하고, 150μl PEB(20mM Tris-Cl pH 7.5, 100mM KCl, 5mM MgCl2, 0.5% NP-40 [Merck, 74385])와 100U/ml RNase 억제제, 1X 프로테아제 억제제 및 1X 포스파타제 억제제로 얼음 위에서 10분간 용해한 뒤 원심분리하였다. 상등액을 수크로오스 구배에 적층하였고, SW41Ti 로터와 Beckman Coulter Ultracentrifuge Optima XE를 사용하여 4℃에서 2시간 동안 36,000 rpm으로 원심분리하였다. 샘플은 Model 2110 fraction collector(Bio-Rad, 7318303) 및 Model EM-1 Econo UV detector(Bio-Rad)에 결합된 Biologic LP system을 사용하여 0.25 ml 분획으로 수득하였다. 0.75 ml의 TRIzolTM LS Reagent(Life Technologies)를 각 분획에 바로 첨가하였다. 하기 그래프와 같이 폴리솜 분획법(polysome fractionation)에 따라 유리 mRNA(free mRNA), 모노솜(monosome), 가벼운 폴리솜(Light polysome; LP; 2-3개의 리보솜), 중간 폴리솜(Medium polysome; MP; 4-8개의 리보솜), 및 무거운 폴리솜(Heavy polysome; HP; 9개 이상의 리보솜)을 254nm 흡광도 트렌드를 이용하여 구분하였고, Direct-Zol RNA Miniprep kit(Zymo Research, R2052)를 사용하여 추출하였다.
다음 라이브러리 제조 단계는 RNA 안정성 스크리닝과 동일한 방법으로 수행되었다. 시퀀싱 데이터는 하기 식별자 DOI로 Zenodo 데이터베이스에서 이용가능하다 [DOI: 10.5281/zenodo.6777910(안정성), 10.5281/zenodo.6717932(폴리솜), 10.5281/zenodo.6696870(2차 스크리닝), 10.5281/zenodo.7773943(핵/세포질 분획)].
5. 데이터 분석
모든 샘플에 대해 read를 매개 변수-local과 함께 bowtie 2.2.6을 사용하여 올리고에 대해 정렬하였다. 정렬된 read를 바코드와 정확하게 일치하는 고유한 정렬로 필터링하였다. 통계 테스트는 mpralm 함수를 사용하여 MPRAnalyze로 수행하였다. scipy 모듈 및 히스토그램 플롯의 Spearman 상관 계수를 사용하여 기술 성능을 평가하였다. 정규화된 카운트를 시각화에 사용하였다. 폴리솜 분석의 경우, DESeq2를 사용한 분산 안정화를 변환한 후, 5개의 분획의 평균을 뺀 뒤 각 분획의 상대 거리를 계산하였다. 상기 각 분획의 상대 거리는 scipy 모듈에서 계층적 클러스터링을 수행하는데 사용하였다. 또 다른 번역의 정량화를 위해 다음과 같은 식으로 평균 리보솜 부하(Mean ribosome load; MRL)를 계산하였다.
1 x p(Monosome) + 2.5 x p(Light polysome) + 6 x p(Medidum polysome) + 11 x p(Heavy polysome)
p(X): X(각 분획)의 시퀀싱 리드(read) 비율
mRNA 안정성 컷오프의 경우, 음성 조절 엘리멘트에 대해 Log2(RNA/DNA) 〈 -1 및 p-값〈 0.001을 사용하였고, 양성 조절 엘리멘트에 대해 Log2(RNA/DNA) 〉 0.5 및 p-값〈 0.05을 사용하였다. 번역 활성화 엘리멘트 컷오프에는 Log2(heavy polysome/free mRNA) 〉0.2 및/또는 MRL 〉4.5을 사용하였으며, 번역 하향조절 엘리멘트 컷오프에는 Log2(heavy polysome/free mRNA)〈 -0.2 및/또는 MRL〈 3.5을 사용하였다.
두 번째 스크리닝 치환 데이터의 경우, 치환 및 결실의 염기 동일성 점수(Base-identity score)를 하기 식으로 계산하였다.
A : 야생형 K5의 안정성
치환 데이터에 대한 염기쌍 점수(Base-pairing score)를 하기 식으로 계산하였다.
결실 데이터에 대한 염기쌍 결실 점수(Pair-deletion score)를 하기 식으로 계산하였다.
피코르나바이러스의 트리 구성을 위해, NCBI에서 검색된 바이러스 서열을 ClusterOmega에 의해 정렬하고, FigTree v1.4.4를 사용하여 시각화하였다. 보존 점수(conservation score)는 상위 33종에 걸쳐 다중 서열을 정렬한 후 K5 엘리먼트와 동일한 뉴클레오티드의 수로 계산하였다. RNA 구조 시각화를 위해, RNAfold를 사용하여 구조를 예측하고 forna를 사용하여 시각화하였다.
6. 플라스미드 구축
검증 실험을 위해 선택된 엘리먼트는 플라스미드 라이브러리 풀에서 PCR로 증폭되었으며, pmirGLO-3XmiR-1 벡터에서 반딧불이 유전자의 3' UTR에 클로닝하였다. 루시페라아제 구조의 경우, K5 엘리먼트(8122-8251:NC_001918.1)를 플라스미드 풀 라이브러리로부터 증폭하였고, PCR 증폭에 의해 추가로 55bp 및 110bp를 첨가하여 eK5 엘리먼트(8067-8251:NC_001918.1) 및 전체 UTR(8012-8251:NC_001918.1)을 제조하였다. 120-K5 엘리먼트(8132-8251: NC_001918.1), 110-K5 엘리먼트(8142-8251: NC_001918.1) 및 K5m 엘리먼트(8122-8251,8185ΔG: NC_001918.1)는 pmirGLO-3XmiR-1 K5 플라스미드로부터 증폭하였고, eK5m 엘리먼트(8067-8251: NC_001918.1)는 pmirGLO-3XmiR-1 eK5 플라스미드로부터 증폭하였다. K4 엘리먼트(7931-8060: NC_009448.2)는 플라스미드 풀 라이브러리로부터 증폭하고, PCR 증폭에 의해 50 bp를 추가로 포함하여 eK4 엘리먼트를 제조하였다(7881-8060: NC_009448.2). 1E 엘리먼트(414-463:RNA2.7)는 pmirGLO-3XmiR-1 1E 벡터로부터 증폭하였다.
AAV 생산을 위해, pAAV-CAG-GFP(Addgene, Plasmid #37825) 플라스미드를 주형으로 사용하였다. K5 엘리먼트(8122-8251: NC_001918.1), K5m 엘리먼트(8122-8251,8185ΔG: NC_001918.1), eK5 엘리먼트(8067-8251: NC_001918.1), 및 eK5m 엘리먼트(8067-8251,8185ΔG: NC_001918.1)를 pmirGLO-3XmiR-1 eK5 및 eK5m 플라스미드로부터 증폭하였고, 깁슨 어셈블리에 의해 pAAV-CAG-GFP 플라스미드 내의 WPRE 서열을 대체하였다. 대조군 플라스미드의 경우, pAAV-CAG-GFP에서 GFP 유전자의 3' UTR의 WPRE 서열을 PCR 기반 증폭으로 제거하였다.
d2EGFP 플라스미드 구축을 위해, pmirGLO-3XmiR-1 벡터로부터의 반딧불이 루시페라아제 유전자를 GBA 5' UTR, d2EGFP CDS 및 GBA 3' UTR로 대체하여 대조군 플라스미드를 제조하였다. 루시페라아제 구축물로부터의 UTR을 증폭시키고, 상기 d2EGFP 대조군 벡터에 삽입하였다.
테더링 및 구조물 구축을 위해, pmirGLO-3xmir1-5xBoxB 벡터로부터 pmirGLO-3xBoxB를 생성하였고, pGK-ZCCHC2 구축물의 경우 HCT116 cDNA로부터 증폭된 ZCCHC2를 pGK 벡터 내로 서브클로닝하였다. ZCCHC2 ΔC(1-375 a.a) 및 ZCCHC2 ΔN(201 aa-1,178 a.a) 구조를 포함하는 테더링 구조는 pGK-TEV-HA-λN에서 ZCCHC2의 서브클로닝하여 생성하였다. ZCCHC2 징크-핑거 돌연변이 버전을 제조하기 위해, mutagenesis PCR으로 징크-핑거(CX2CX3GHX4C)의 제1 및 제2 시스테인을 세린으로 대체하였다. TNRC6B C-term 구조의 경우, TNRC6B 유전자의 C-term 영역(716-1,028 a.a)을 HCT116 cDNA으로 증폭하였고, 깁슨 어셈블리를 사용하여 pGK 및 pGK-TEV-HA-λN 벡터에 서브클로닝하였다.
RaPID 실험을 위해, d2EGFP, pmirGLO-3xBoxB, 및 pmirGLO-3xmir-1-eK5 플라스미드로부터 EGFP CDS, 3xBoxB 서열 및 eK5 서열을 각각 증폭하였으며, 깁슨 어셈블리를 이용하여 pCK 벡터 내로 서브클로닝하였다.
상기 방법으로 생성된 플라스미드의 리스트는 표 1에 나타내었다.
7. 루시페라아제 분석 및 형질감염(transfection)
루시페라아제 분석은 다음과 같은 방법으로 수행하였다. Lipofectamine 3000에 의한 루시페라아제 리포터 분석을 위해, 0일차에 24웰 플레이트 상의 HeLa 또는 HCT116 세포의 2E5를 100ng pmirGLO-3XmiR-1 플라스미드로 형질감염시키고 2일차에 수득하였다. 녹다운 실험을 위해, 각 표적 유전자에 대해 100ng pmirGLO-3XmiR-1 K5 플라스미드 및 40nM siRNA(Dharmacon siRNA smartpool)를 Lipofectamine 3000으로 공동-형질감염하였다. ZCCHC2 구조 실험을 위해, 50 ng pmirGLO-3XmiR-1 플라스미드 및 60 ng pGK-null 또는 pGK-ZCCHC2 또는 pGK-ZCCHC2 징크-핑거 돌연변이 구조를 공동-형질감염하였다. 테더링 실험을 위해, 50 ng pmirGLO-3xBoxB 플라스미드 및 60 ng pGK-ZCCHC2 야생형/돌연변이 구축물을 λN-HA-TEV flag가 있거나 없도록 공동-형질감염하였다. 루시페라아제 분석을 위해, 제조사의 지침에 따라 Dual-luciferase reporter assay system(Promega)으로 세포를 용해하고 분석하였다.
8. RT-qPCR
RNeasy Mini Kit(Qiagen, 74106)로 RNA를 추출하고, DNase(Qiagen, 79254)를 처리하였으며, Primescript RTmix(Takara, RR036A)로 역전사하였다. mRNA 수준은 SYBR Green assays(Life Technologies, 4367659) 및 StepOnePlus Real-Time PCR System(Applied Biosystems) 또는 QuantStudio 3(Applied Biosystems)로 측정하였다. RT-qPCR 프라이머의 목록은 표 1에 제시되어 있다.
9. AAV 생성 및 정제
AAV 생성 및 정제는 다음과 같은 방법으로 수행되었다. 293 AAV 세포주(Cell Biolabs, #AAV-100)를 10% FBS, 0.1 mM MEM Non-essential Amino Acids(NEAA) 및 2mM L-글루타민을 포함하는 DMEM에서 배양하였다. GFP 단백질을 운반하는 AAV를 생산하기 위해, 293 AAV 세포주를 150mm 페트리 접시에 오버나잇으로 분주하였고, 70% 정도 성장하면 pAAV-CAG-GFP 플라스미드 변이체(Addgene, 37825)를 pAdDelta6F6(Addgene, 112867) 및 pAAVDJ(Cell Biolabs, VPK-420-DJ) 플라스미드와 함께 Lipofectamine 3000 및 p3000으로 공동-형질감염하였다. 72시간동안 트렌스펙션한 뒤 세포를 수득하였으며, 2.5 ml의 무혈청 DMEM에 재현탁하였다. 이후, 세포 용해는 4번의 냉동/해동(알코올/드라이 아이스에서 30분 동결 및 37℃ 수조에서 15분, 매주기마다 해동)을 통해 수행되었다. AAV 상층액은 4℃에서 10분 동안 10,000Хg에서 원심분리하여 수득되었다. ViraBindTM AAV Purification Kit(Cell Biolabs)로 AAV를 정제한 후, 제조사의 지침에 따라 QuickTiterTM AAV Quantitation Kit(Cell Biolabs)로 바이러스 역가를 측정하였다. 형질도입을 위해, HeLa 세포를 12웰 플레이트에 분주하였고, 대조군으로 PBS를 사용한 모의 감염과 함께 2,000 및 10,000 moi로 AAV에 감염시켰다. 감염 5일 후, GFP 신호를 유세포 분석기(BD Accuri C6 Plus)로 검출하였다.
10. 시험관 내 전사된 RNA 제조
시험관 내 전사된 RNA의 경우, DNA 주형은 정방향 프라이머(T7 프로모터+gene_specific_F) 및 역방향 프라이머(T120+gene_specific_R, 5'말단의 2'-O- Methylated deoxyuridine의 두개 뉴클레오티드)를 사용한 PCR을 수행하여 제조되었다. 250ng의 DNA 주형은 mMESSAGE mMACHINETM T7 전사 키트(Invitrogen, AM1344) 및 성분(각각 7.5mM ATP/CTP/UTP[NEB, N0450S], 1.5mM GTP 및 6mM CleanCap® Reagent AG(3' OMe)[TriLink Biotechnologies, N-7413-10])를 사용해 시험관 내에서 전사하였다. 상기 DNA 주형은 재조합 DNase I(RNase-free)을 사용하여 제거하였고, RNeasy MiniElute Cleanup Kit(Qiagen, 74204)를 사용하여 세척하였다. 시험관내 전사 주형 제조에 사용되는 프라이머는 표 1에 제시하였다.
11. mRNA 형질감염된 샘플 제조 및 분석
12웰 플레이트 상의 2E5 HeLa 세포를 Lipofectamine MessengerMax을 사용하여 시험관 내 전사된 RNA로 형질감염시켰다. 루시페라아제 mRNA로 형질감염된 샘플의 경우, 세포를 용해하고, 제조사의 지침에 따라 Dual-luciferase reporter assay system으로 분석하였다. d2EGFP 샘플의 경우, 세포를 1X 프로테아제 억제제 및 1X 포스파타제 억제제를 포함하는 RIPA lysis and extraction buffer(Thermo, 89901)로 얼음에서 10분 동안 용해한 뒤 원심분리 하였다. 상기 샘플을 5X SDS 완충액으로 끓인 뒤, ladder(Thermo, 26616)를 사용하여 Novex SDS-PAGE gel(10-20%)에 로딩하였다. 겔을 methanol-activated PVDF membrane(Millipore)으로 옮긴 후, 멤브레인을 5% skim milk를 포함하는 PBS-T로 블로킹한 뒤, 1차 항체로 프로브하여 PBS-T로 3회 세척하였다. 상기 1차 항체는 1차 항체로 anti-EGFP(1:3,000, CAB4211, Invitrogen) 및 anti-alpha-TUBULIN(1:300, Abcam, ab52866)을 사용하였다. Anti-mouse 또는 anti-rabbit HRP-conjugated 2차 항체(Jackson ImmunoResearch Laboratories)를 1시간동안 인큐베이션하고, PBS-T로 3회 세척하였다. 화학발광은 West Pico 또는 Femto Luminol 시약(Thermo)을 사용했으며, 신호는 ChemiDoc XRS+ System(Bio-Rad)으로 검출하였다. d2EGFP 샘플의 경우, GFP 신호를 유세포 분석기(BD Accuri C6 Plus)로 검출하였다.
12. Hire-PAT 분석
Hire-PAT 분석 및 모세관 전기영동 데이터의 신호 처리를 문헌(Kim et al., Nat. Struct. Mol. Biol., 2020, 27, 581-588)에 설명된 바와 같이 수행하였다. 반딧불이 루시페라아제 유전자의 폴리(A) 사이트를 상기 문헌에서 Sanger sequencing으로 확인된 바와 같이 이용하였으며, 폴리(A) 사이트에 대한 정방향 PCR 프라이머는 표 1에 제시되었다.
13. 유전자 특이적 TAIL-seq
RG7834 처리 시 폴리(A) 테일의 길이 분포를 측정하기 위해, HeLa 세포를 RO0321(Glixx Laboratories Inc, GLXC-11004) 또는 RG7834(Glixx Laboratories Inc, GLXC-221188)가 처리된 반딧불이 루시페라아제의 3' UTR에 K5 엘리먼트를 포함하는 pmirGLO-3XmiR-1 플라스미드로 트랜스펙션하였고, 2일 내에 수득하였다. 모세포 및 ZCCHC2 녹아웃 사이의 폴리(A) 테일 길이 분포를 비교하기 위해, 모세포 및 ZCCHC2 녹아웃 세포를 RG7834 처리된 샘플과 동일하게 제조하였다. 유전자 특이적 TAIL-seq를 수행하기 위해, rRNA가 고갈된 총 RNA(Truseq Strnd Total RNA LP Gold, Illumina, 20020599)를 3' 어댑터에 결찰하였고, RNase T1(Ambion)으로 부분적으로 단편화하였다. Urea-PAGE gel(300-1500 nt)로 정제한 뒤 RNA를 역전사하고, PCR로 증폭하였다. 반딧불이 루시페라아제 PCR 증폭을 위해, GS-TAIL-seq-FireflyLuc-F를 정방향 프라이머로 사용하였다. 라이브러리는 spike-in mixture를 포함하는 PhiX control library v.2(Illumina)로 Illumina platform(Miseq)에서 paired-end run(51X251 cycles)으로 시퀀싱하였다. TAIL-seq 시퀀싱 데이터는 DOI:10.5281/zenodo.6786179.의 식별자를 가지는 Zenodo 데이터베이스에 보관하였다.
TAIL-seq는 Tailseeker v.3.1.5로 분석하였다. 각각의 전사체에 대해, 유전자는 bowtie2.2.6을 사용하여 반딧불이 루시페라아제 구성 서열 및 인간 전사체에 read 1을 매핑하여 확인하였다. 그 다음으로, 해당 폴리(A) 테일의 길이 및 3' 말단의 수정을 read 2로 추출하였다. 혼합 테일링 비율은 폴리(A) 테일 길이가 50nt보다 긴 전사체로부터 계산하였다.
14. TENT4, ZCCHC2 및 ZCCHC14 녹아웃(KO) 세포 제조
TENT4 dKO 세포는 상기 Kim et al. 문헌과 동일한 방법으로 제조되었다. 또한, ZCCHC2 및 ZCCHC14 녹아웃 세포주도 상기 Kim et al. 문헌의 설명에 따라 제조되었다. 6웰 플레이트 상의 4E5 HeLa 세포 및 24웰 플레이트 상의 1E5 HCT116 세포를 ZCCHC2에 대한 sgRNA(ACCTCAGGACGGACTTACCG(서열번호 96), PAM 서열은 TGG) 및 ZCCHC14에 대한 sgRNA(CAAGTGGGCAGCGCGCGCCGCC(서열번호 97), PAM 서열은 CGG)를 포함하는 300 ng pSpCas9(BB)-2A-GFP-px458 플라스미드(Addgene #48138)를 사용하여 Metafectene(Biontex, T020)으로 각각 트랜스펙션하였다. 단일 세포 스크리닝 후, 생어 시퀀싱 및 웨스턴 블롯 분성을 수행하여 낙아웃된 균주를 확인하였다. 모세포 및 변형된 게놈 서열은 표 1에 나열하였고 삽입된 서열은 빨간색으로 표시하였다.
15. RNA 근접 라벨링 분석
RaPID(RNA-protein interaction detection) assay는 다음 방법으로 수행되었다. 구체적으로, Lenti-X 293T(Clontech, 632180) 및 BASU RaPID 플라스미드(Addgene #107250)로부터 생성된 렌티바이러스 운반 구조물을 형질도입하여 BASU 발현 HeLa 안정 세포주를 생성하였다. 150pi 플레이트로부터의 1E7 세포를 Lipofectamine mMAX(Life Technologies, LMRNA015)를 사용하여 상기 합성된 40μg의 RNA로 형질감염시켰다. 16시간 후, 상기 세포에 200μM 비오틴(Sigma, B4639)을 1시간동안 처리하였다. 처리된 세포를 얼음에서 1X 프로테아제 억제제 및 1X 포스파타제 억제제를 포함하는 RIPA lysis and extraction buffer(Thermo, 89901)로 10분간 용해하고 원심분리하였다. 상기 용해물은 Pierce streptavidin beads(Thermo, 88816)와 함께 4℃에서 밤새 회전하며 배양하였다. 비드를 세척버퍼 1(1mM DTT, 프로테아제 및 포스파타제 칵테일 억제제를 포함하는 1% SDS)로 3회 세척하고, 세척 버퍼(0.1% Na-DOC, 1% 트리톤 X-100, 0.5M NaCl, 50mM HEPES pH 7.5, 1mM DTT, 프로테아제 및 포스파타제 칵테일 억제제를 포함하는 1uM EDTA)로 1번 세척한 후, 세척 버퍼 3(0.5% Na-DOC, 150 mM NaCl, 0.5% NP-40, 10 mM Tris-HCl, 1 mM DTT, 프로테아제 및 포스파타제 칵테일 억제제를 포함하는 1μM EDTA)으로 1회 세척하였다.
웨스턴 블롯의 경우, 단백질을 Elution buffer(1.5x Lamelli sample buffer, 0.02 mM DTT, 4 mM Biotin)로 용출시킨 후, anti-ZCCHC2(1:250, Atlas Antibodies, HPA040943), anti-TENT4A(1:500, Atlas Antibodies, HPA045487), anti-alpha-TUBULIN(1:300, Abcam, ab52866) 및 anti-HA(1:2000, Invitrogen, 715500) 1차 항체를 사용하여 웨스턴 블롯으로 분석하였다. LC-MS/MS의 경우, 시료를 1분 동안 37℃에서 분해 완충액(50mM Tris pH8.0)으로 6회 세척하였다. 세척 후, 단백질 결합 비드를 37℃에서 1시간 동안 1M DTT 2μL를 포함하는 digestion buffer 180μL으로 배양한 다음, 0.5M IAA 16μL를 추가하여 37℃에서 1시간 동안 배양하였다. 이후, 0.1g/L trypsin 2μL를 추가하여 37℃에서 밤새 배양하였다. 나머지 분해물은 HiPPR(Thermo, 88305)을 사용하여 제거하고, LC-MS/MS 분석 전에 ZipTip C18 수지(Millipore, ZTC18S960)로 세척하였다.
LC-MS/MS 분석은 nanoAcquity 시스템(Waters)과 결합된 Orbitrap Eclipse Tribrid(Thermo)를 사용하여 수행하였다. 미세관 분석(내경 75μmХ100cm) 및 트랩(내경 150μmХ3cm) 컬럼을 3um Jupiter C18 particle(Phenomenex)로 충전하였다. LC 플로우는 95% 용매 A(0.1% formic acid(Merck))에서 35% 용매 B(100% acetonitrile, 0.1% formic acid) 범위의 60분 선형 구배로 300nl/min으로 설정하였다. 전체 MS scan(m/z 300-1,800)은 120k 해상도(m/z 200)에서 획득하였다. 고에너지 충돌 해리(HCD) 단편화는 1.4 번째 전구체 격리 윈도우를 포함하는 30% 정규화된 충돌 에너지(NCE)에서 발생하였다. MS2 스캔은 30k의 해상도에서 획득하였다.
MS/MS raw data는 FragPipe(v18.0)에 통합된 MSFragger1(v3.7), IonQuant2(v1.8.10) 및 Philosopher3(v4.8.1)를 사용해 분석하였다. 표지되지 않은 단백질의 식별 및 정량화를 위해, 트립신으로 지정된 효소와 함께 built-in FragPipe workflow(LFQ-MBR)를 사용하였다. 표적-유인 데이터베이스(오염 물질 포함)는 Swiss-Prot human database4(2022년 10월)에서 Fragpipe로 생성하였다. combined_protein.tsv 파일은 추가 분석에 사용하였다. 농축 컷오프의 경우, 최소 2번의 반복실험에 의해 1을 초과하는 Log2FC가 사용되었다.
16. 공동 면역침전(co-IP) 및 웨스턴 블로팅
co-IP 실험을 위해, 1 mM DL-Dithiothreitol(DTT), 1X Protease 억제제 및 RNase A(Thermo, EN0531)를 포함하는 버퍼 A(100 mM KCl, 0.1 mM EDTA, 20 mM HEPES [pH 7.5], 0.4% NP-40, 10% 글리세롤)를 사용하여 얼음 위에서 150pi 플레이트의 모세포 및 TENT4 dKO 세포를 20분간 용해한 다음 원심분리 하였다. 단백질 A 및 G 세파로스 비드(1:1 혼합, 총 20μl)가 접합된 12.5μg 항체(NMG, 항-TENT4A 및 항-TENT4B)를 1mg의 상기 용해물과 함께 면역침전에 사용하였다. 4℃에서 2시간동안 인큐베이션 한 뒤, 비드를 세척하고 20 μl의 2XSDS 완충액으로 끓이고, ladder(Thermo, 26616 and 26619)와 함께 4-12%(Novex) SDS-PAGE 겔에 로딩하였다. 도메인 co-IP 실험을 위해, 전장 ZCCHC2, 절단된 ZCCHC2 구조물 및 플래그 태그를 갖는 음성 구조물을 ZCCHC2KO 세포에 트랜스펙션하였으며, 상기 세포를 2일 내에 용해하였다. 상기 용해물 1mg에 ANTI-FLAG® M2 Affinity Gel(Merck, A2220-10ML) 10μl를 추가한 뒤 4℃에서 2시간동안 배양하여 면역침전을 수행하였다. 입력 샘플의 경우, 50μg의 세포 용해물을 사용하였다. 겔을 methanol-activated PVDF membrane(Millipore)으로 옮긴 후, 멤브레인을 5% skim milk를 포함하는 PBS-T로 블로킹하였으며, 1차 항체로 프로브한 뒤 PBS-T로 3회 세척하였다. Anti-ZCCHC2(1:250, atlas HPA040943), anti-ZCCHC14(1:1,000, Bethyl Laboratories, A303-096A), anti-TENT4A(1:500, Atlas Antibodies, HPA045487), anti-TENT4B(1:500, lab-made), anti-GAPDH(1:1,000, Santa Cruz, sc-32233) 및 anti-FLAG(1:1000, abcam, ab1162)를 상기 1차 항체로 사용하였다. Anti-mouse 또는 anti-rabbit HRP 컨쥬게이트 2차 항체(Jackson ImmunoResearch Laboratories)를 사용하여 1시간동안 배양하고, PBS-T로 3회 세척하였다. 화학발광은 West Pico 또는 Femto Luminol 시약(Thermo, 34580 및 34095)으로 수행되었고, 신호는 ChemiDoc XRS+System(Bio-Rad)으로 검출하였다.
17. RNA pulldown-LC-MS/MS 데이터 재분석
MS/MS 데이터는 인간 Swiss-Prot 데이터베이스 v.12/5/2018 기본설정을 사용하여 MaxQuant v.1.5.3.30으로 처리되었으며, 단백질 수준 0.8% FDR 컷오프를 적용하였다.
MaxQuant 출력 파일 중에서, MaxLFQ 강도 값은 proteingroups.txt 파일에서 추출하였다. MaxLFQ intensity 값에 10,000의 유사 값을 추가한 뒤, Limma를 수행하고, 유의한 유전자를 Log2FC 〈 0.8 및 FDR 〉 0.1로 필터링하였다.
18. 도메인 보존 분석
UniProt Align 도구를 사용하여 ZCCHC2(Q9C0B9), ZCCHC14(A0A590UJW6) 및 GLS-1(Q8I4M5)을 정렬하고 3개 단백질의 보존 점수를 계산하였다.
19. RNA 면역침전
ZCCHC2 면역침전을 위해, Lenti-X 293T(Clontech, 632180) 세포로부터 생성된 구조물에 따른 렌티바이러스 운반체를 형질도입하여 3' UTR에서 K5 엘리먼트를 갖는 EGFP를 발현하는 HeLa 안정 세포주를 생성하였다. 또한, lysis buffer(20 mM HEPES pH7.6 [Ambion, AM9851 및 AM9856], 0.4% NP-40, 100 mM KCl, 0.1 mM EDTA, 10% glycerol, 1 mM DTT, 1X Protease inhibitor [Calbiochem, 535140])로 상기 세포를 얼음 위에서 30분간 처리하여 용해하고, 원심분리하여 세포 용해물을 수득하였다. 음성대조군으로는 10μg의 normal rabbit IgG(Cell Signaling, 2729S)을 사용하였고, ZCCHC2 면역침전을 위해 10μg의 ZCCHC2 항체(atlas, HPA040943)를 사용하였다. 항체가 단백질 A 마그네틱 비드(Life Technologies, 10002D)에 부착된 후, 1mg의 세포 용해물을 항체 접합 비드와 함께 2시간 동안 인큐베이션한 다음, 세척 완충액(상기와 동일한 lysis buffer로, 0.2% NP-40 포함)으로 세척하였다. 정규화를 위해 사용된 5ng의 반딧불이 루시페라아제 mRNA를 spike-in으로 각 샘플에 추가한 뒤, RNA를 TRIzol 시약(Life Technologies)으로 정제하여 RT-qPCR에 사용하였다. RT-qPCR 프라이머는 표 S5에 나타내었다.
20. 세포내 분획
아세포 분획은 다음 방법으로 수행하였다. 구체적으로, 세포질 분획을 얻기 위해, 세포를 200μl의 세포질 용해 완충액(0.2 μg/μl digitonin [Merck, D141], 150 mM NaCl, 50 mM HEPES [pH 7.0-7.6], 0.1 mM EDTA, 1 mM DTT, 20 U/ml RNase inhibitor, 1X Protease inhibitor, 1X Phosphatase inhibitor)으로 용해하였다. 세포막 및 핵 분획의 경우, 제조사의 지침에 따라 세포내 단백질 분획 키트(Thermo Scientific, 78840)를 사용하여 분획하였다. 1차 항체로는 Anti-GM130(1:500, BD Bioscience, 610822) 및 anti-Histone(1:2000, cell signaling, 4499)을 사용하였다.
본 출원의 실험예에서 사용된 시약 및 재료를 하기 표 2에 기재하였다.
[실시예]
1. 조절 RNA 엘리먼트를 동정하기 위한 바이로믹 스크린
바이러스 RNA 엘리먼트의 라이브러리를 구축하기 위해, 올리고 합성의 기술적 한계 때문에 인간 바이러스로 초기 선별을 수행하고 다른 관련 종을 포함하도록 2차 스크린을 확장하는 2단계의 접근방식을 수행하였다. 인간을 감염시킬 수 있는 바이러스를 식별하기 위해, 현재 114개 속과 40개 과에 속하는 502종의 인간 바이러스에 주석을 달고 있는 NCBI 데이터베이스를 사용하였다.
도 1A 및 표 3에 나타낸 바와 같이, 수작업으로 검사한 후 96개의 속과 37개의 과를 대표하는 143종을 선정하였고, 서열 유사성이 가까운 종과 모호하게 분류되거나 인간 감염에 대한 명확한 증거가 부족한 종을 제외하였다. 본원의 카탈로그는 볼티모어 분류 시스템의 7개 그룹 모두를 포함하였다. RNA 바이러스의 경우, 전체 게놈 서열을 사용하였다. 일반적으로 더 큰 게놈을 가진 DNA 바이러스의 경우, 비번역 영역(UTR) 및 비암호화된 유전자가 포함되었다.
도 1B에 나타낸 바와 같이, 슬라이딩 윈도우 크기가 130nt이고 65n의 스텝 크기로 바이러스 게놈을 타일링(tiling)하여 총 30,367개의 세그먼트를 생성하여 스크린용 올리고를 설계하였다. 상기 각 세그먼트는 신뢰가능한 검출을 위해 세 가지 다른 바코드를 가지도록 제조하였다. 양성 대조군으로, HCMV(human cytomegalovirus)의 lncRNA2.7로부터의 '1E' 엘리먼트를 포함하는 4개의 세그먼트(도 8) 및 유전자 발현을 향상시키는 것으로 알려진 우드척 간염 바이러스의 WPRE(woodchuck posttranscriptional regulatory element)를 포함하는 1개의 세그먼트를 포함시켰다. 비기능 대조군으로 우리는 1E의 루프에서 비활성화 돌연변이를 포함하는 돌연변이(1Em)를 사용하였다. 상기 설계된 올리고를 합성한 뒤 PCR로 증폭하였고, 루시페라아제 리포터 플라스미드의 3' UTR에 삽입하였다. 상기 구축된 라이브러리에는 총 91,101개의 리포터 플라스미드가 포함되었고, 143개의 인간 바이러스 및 개의 우드척 간염 바이러스에서 30,367개의 세그먼트가 포함되었다.
기능적 평가를 위해, 플라스미드 풀을 인간 결장암 세포주(HCT116)에 형질감염시켜 유전자 발현에 대한 각 엘리먼트의 영향을 정량화하였다(도 1B). RNA 풍부도(abundance)에 미치는 영향을 모니터링하기 위해 플라스미드 및 mRNA를 모두 추출, 증폭 및 시퀀싱하여 mRNA의 리드 비율과 형질주입된 DNA의 리드 비율 사이의 비율을 계산하였다('RNA/DNA'). 번역 조절 엘리먼트를 탐색하고자 수크로우스 구배 원심분리를 사용하여 세포질 추출물을 5개의 분획(유리 mRNA, 모노솜, 가벼운 폴리솜(LP), 중간 폴리솜(MP), 및 무거운 폴리솜(HP))으로 분리하였고, 상기 추출물을 RNA 추출 및 시퀀싱에 사용하여 각 UTR에 대한 번역 효율을 예측하였다.
2. 조절 RNA 엘리먼트의 동정
mRNA 풍부도(abundance)에 대한 30,302개의 바이러스 세그먼트(3개의 바코드가 모두 감지된 세그먼트 30,190개)에 미치는 영향을 확인하기 위해 다음과 같은 실험을 수행하였다. 실험 결과는 4회 반복 실험과 바코드 사이에서 재현이 가능하였다. 구체적으로, 1E 및 WPRE에 걸친 양성 대조군은 1E 돌연변이에 비해 mRNA 수준이 증가되었다(도 1C). 245개의 상향 조절 세그먼트와 628개의 하향 조절 세그먼트를 동정하였다. mRNA의 풍부도를 증가시킨 세그먼트는 mRNA 안정성을 향상시키는 것으로 알려진 PRE의 일부인 인간 B형 간염 바이러스의 스템-루프 알파를 포함하였다. 음성 엘리먼트는 D형 간염 바이러스(HDV)의 자가 절단 리보자임 같은 핵산분해효소에 의해 절단된 RNA, 및 DROSHA에 의해 절단될 가능성이 있는 인간 사이토메갈로바이러스(인간 베타헤르페스바이러스 5로도 알려짐) 및 엡스타인바 바이러스의 microRNA 좌위를 포함하여, 리포터 mRNA 붕괴를 초래하였다(도 1C).
따라서, 상기 실험으로 RNA를 안정화하는 세그먼트(Log2(RNA/DNA) 〉 0.5, p-값 〈 0.05) 또는 불안정화하는 세그먼트(Log2(RNA/DNA) 〈 -1, p-값 〈 0.001)를 효과적으로 동정하였다(표 4 및 5). 표 4의 50개 세그먼트는 양성 대조군 WPRE 또는 HCMV 1E와 유사하거나 이보다 높은 Log2(RNA/DNA) 값을 가져, 우수한 RNA 풍부도를 나타냄을 확인하였다(도 1C).
RNA를 안정화하는 세그먼트
RNA를 불안정화하는 세그먼트
또한, 폴리솜 프로파일링 시퀀싱 데이터(도 1D)를 사용하여 30,155개 세그먼트(3개의 바코드가 모두 감지된 세그먼트 29,786개)의 번역 효과를 평가하였다. 돌연변이가 아닌 WPRE와 1E는 번역에 대한 긍정적인 영향과 일치하는 heavy polysome 분획에서 풍부하게 존재하였다(도 1E). 535개의 상향조절 세그먼트 및 66개의 하향조절 세그먼트를 식별하여, heavy polysome 및 유리 mRNA 분획 사이의 리드 비율(Log2(HP/유리 mRNA) 〉0.2)을 사용하여 변역 효율을 추정하였다(표 6). 하기 표 6의 30개 세그먼트는 양성 대조군 WPRE 및 HCMV 1E와 마찬가지로 heavy polysome 분획에서 풍부하게 존재하므로, mRNA 번역을 증가시킬 수 있음을 확인하였다(도 1E).
3. 조절 엘리먼트의 검증
추정된 mRNA 풍부도와 번역 효율 사이의 매우 약한 상관관계는 대부분의 바이러스 엘리먼트가 mRNA 풍부도 또는 번역에 영향을 미친다는 것을 시사하였다. 그럼에도 불구하고, 일부 세그먼트는 두 가지 측면 모두에 영향을 미치는 것으로 확인되었다. 이를 검증하기 위해, RNA 풍부함과 번역을 모두 향상시킨 이전에 연구되지 않은 16개의 후보를 선택하였다(도 2A, 표 7; Log2(HP/free mRNA) 〉0.2 및 MRL 〉4.5를 만족함). 3' UTR 리포터 및 개별 루시페라아제 분석을 사용하여 16개 후보 중 15개가 통계적 유의성(p<0.05)으로 루시페라아제 발현이 증가했음을 확인하였다(도 2B).
Saffold 바이러스의 3' UTR(7931-8060 NC_009448.2)에서 K4 엘리먼트 및 아이치(Aichi) 바이러스 1(AiV-1)의 3' UTR(8122-8251: NC_001918.1)에서 K5 엘리먼트를 추가 조사하였다(도 2C). 상기 두 바이러스 모두 단일 폴리펩티드를 암호화하는 단일 가닥의 양성 RNA 게놈을 가진 Picornaviridae과에 속하며, 상기 바이러스는 단백질 분해로 인해 여러 단편으로 가공되었다. Saffold 바이러스 및 AiV-1은 각각 Cardiovirus 속과 Kobuvirus 속에 포함되며, 위장염을 비롯한 비교적 경미한 증상을 유발하는 바이러스에 광범위하게 분포하고 아직까지 조사가 잘 되지 않은 것으로 확인되었다.
엘리먼트의 경계를 매핑하기 위해, K4 및 K5의 확장되거나 잘린 세그먼트를 조사하였다. Saffold 바이러스의 전체 3' UTR를 포함하는 K4의 확장된 180nt 세그먼트("eK4", 7881-8060)는 기존 K4 세그먼트와 유사한 효과를 나타내었으며, 이를 통해 3' 말단 130nt가 K4의 활성을 전달하기에 충분하다는 것이 확인되었다. 그러나, K5의 확장된 형태("eK5", 8067-8251, 185nt, 서열번호 94)는 루시페라아제 발현을 더욱 향상시켜 기존 K5, K4 및 확장된 K4(eK4)를 포함한 다른 엘리먼트를 능가하였다(도 2D). 또한, K5보다 짧은 120nt(8132-8251, 서열번호 95)의 세그먼트는 K5보다 높은 활성을 나타내었다. 주목할 점은, K5가 mRNA 풍부도 및 번역 스크리닝 모두에서 상위 25개 후보 중 하나로 선정되었다는 것으로, 이는 K5가 특히 강력한 엘리먼트임을 시사하였다. K5에 대한 절단 실험은 3' 말단의 110nt(8142-8251) 초과의 엘리먼트가 최소 K5 엘리먼트를 구성할 수 있음을 보여주었다(도 2E). K5 함유 세그먼트는 mRNA 수준을 증가시켰으며, 더 중요한 것은 단백질 수준이 스크리닝 데이터와 일치하였다.
4. K5 엘리먼트의 특성화
K5를 자세히 특성화하기 위해, K5 돌연변이 및 동족체(homolog)에 대한 2차 high-throughput assay을 수행하였다(도 3A 및 B). 돌연변이 유도를 위해 130-nt K5 엘리먼트의 모든 위치에 단일 뉴클레오타이드 치환, 단일 뉴클레오타이드 결실 및 2연속 뉴클레오타이드 결실을 수행하였다(도 3C). 또한, 서열을 변경하였지만 예측된 2중 구조(duplex structure)를 보존하는 보상 돌연변이를 도입하였다. 추가로, 루프는 상이한 조합으로 무작위로 선택된 최대 2개의 염기가 치환되었다. 3개의 바코드로 총 1,201개의 돌연변이를 합성하였다. 클로닝 및 형질감염 후, mRNA 풍부도에 대한 돌연변이의 효과를 평가하기 위해 형질감염된 DNA 수준에 상대적인 mRNA 수준을 측정하였다(도 3B).
도 3D에 나타낸 바와 같이, 특정 뉴클레오티드 서열의 기여도를 정량화하기 위해, 단일 염기 치환 데이터를 사용하여 '염기 동일성 점수'를 계산하였다. 또한 스템 영역의 염기쌍에 대한 요구 사항을 나타내는 보상 돌연변이 데이터를 기반으로 '염기쌍 점수'를 계산하였다. 그 결과, 일부 돌연변이, 특히 처음 14개 뉴클레오티드의 돌연변이가 mRNA 수준을 약간 증가시켰는데(도 3C) 이는 자가억제 활성을 나타내며, 이러한 결과는 절단 실험(도 2E)과 일치하였다. 또한, 다른 변이체의 경우 K5와 유사하거나 이보다 높게 mRNA 수준을 증가시켰다(도 3C). 대조적으로, 첫 번째 헤어핀(피리미딘이 풍부한 말단 루프를 포함함) 및 두 번째 헤어핀(G 돌출부(bulge) 포함함)에 대한 돌연변이는 mRNA 수준을 실질적으로 감소시켰으며, 이를 통해 상기 헤어핀들이 K5 활성에 결정적임을 확인하였다(도 3D). 상기 결과는 결실 및 보상 돌연변이의 결과와 일치하였다.
K5의 계통발생학적 분포를 조사하기 위해, 88개 피코르나바이러스 종(K5 및 다른 피코르나바이러스 엘리먼트 87개)의 3' UTR 세그먼트를 2차 스크리닝에 포함하였다. 이러한 피코르나바이러스 중 43개의 코부바이러스 세그먼트(표 8; K5와 적어도 59% 상동성을 가짐)는 두 번째 헤어핀의 G돌출부에 결실이 있는 비기능 대조군 K5m보다 mRNA 수준을 더 많이 상향 조절하였고(도 3D 및 3E; 표 8), K5와 유사하거나 더 높게 mRNA 수준을 상향 조절하였다. 상기 결과를 통해 K5가 코부바이러스속에 보존되어 있음을 확인하였다. 보존된 3' 서열이 결여된 일부 코부바이러스 세그먼트는 분석결과 활성이 낮았다. 이러한 3' 서열의 결여는 데이터베이스의 주석이 불완전하기 때문일 수 있다.
코부바이러스속을 제외한 대부분의 피코르나바이러스 3' UTR은 mRNA 풍부도를 증가하지 못하였다(도 3E). 그러나 몇몇의 예외가 있었는데, 특히 K4 양성 엘리먼트(RNA/DNA ratio = 1.514)를 포함하는 사폴드(Saphold) 바이러스와 관련된 분 카디오바이러스 1(Boone cardiorvirus 1; NC_038305.1)의 세그먼트(서열번호 187; RNA/DNA ratio = 1.2433)가 이에 해당하였다. 두 바이러스 모두 카디오바이러스에 속한다. 따라서, 카디오바이러스의 K4 및 이의 상동 엘리먼트는 별개의 보존된 조절 엘리먼트 그룹의 구성이 가능하다. 구체적으로, 하기 K4의 염기 서열 중 밑줄친 염기 서열(NC_009448.2의 7952번 내지 7988번)은 동족체인 분 카디오바이러스 1의 세그먼트 내 상응하는 염기 서열(하기에서 밑줄친 염기 서열)과 78.38%의 동일성을 갖는다. 따라서, 카디오바이러스의 3'UTR 내 염기 서열이면서, 사폴드 바이러스 유전자 내의 7952번 내지 7988번의 염기 서열과 적어도 70% 동일성을 갖는 염기 서열을 포함하는 동족체는 K4와 같이 mRNA 풍부도를 증가시킬 수 있음을 알 수 있다.
K4
AACATCCTCTCGATCGGATCGCAACGTGTTACCCAGGAATCCACTTGGGTGTACGCGGCCGTTCTGACGTTGGAATTCTGTAGATGAAAGTTAGCTAGGAGCTTTTAATTGGAAATGAGAACAAAAAAAA (서열번호 82)
밑줄: NC_009448.2의 7952-7988
Boone cardiovirus 1
TTCGGTTGAGCCCCCACCCGGTACAACGCTTTACCTTAGAAGCCACTAAGGTGTACGCGGTCATCGGGGACCCCTCCTGGCCTTTGGTTTATTGGTGAATTACTAGTTCAGTTAGGTTTTGTTAGTTAGG (서열번호 187)
5. K5에 의한 벡터 및 합성 mRNA로부터의 유전자 발현 향상
K5가 다른 분자적 맥락에서도 기능할 수 있는지 여부를 테스트하기 위해, 인간 유전자 치료에 대해 낮은 독성으로 효율적인 유전자 전달을 가능하게 하는 Parvoviridae 계통에 속하는 단일 가닥 DNA 바이러스인 아데노 관련 바이러스(AAV)를 기반으로 하는 벡터 시스템을 사용하였다. 도 4에 나타낸 바와 같이, WPRE는 AAV 35에서 유전자 발현을 향상시켰지만, 큰 크기(~600nt) 및 AV의 제한된 포장 용량(1.7-3kb)으로 인해 AAV에서의 사용이 제한되었다.
최소 K5(120nt) 또는 eK5(185nt) 서열 및 비활성 돌연변이(K5m 및 eK5m) 및 WPRE를 대조군으로 평가하였다. AAV 벡터 내에 EGFP 코딩 서열의 다운스트림에 이러한 세그먼트를 삽입하고 유전자 발현에 미치는 영향을 측정하였다(도 4A). 도 4B 및 도 4C에 나타낸 바와 같이, K5와 eK5로 인해 모두 두 가지 다른 형질도입 조건에서 AAV 벡터로부터 GFP 발현이 증가되었다. 특히, eK5의 효과(~3배)는 WPRE의 효과(~2배)보다 더 뛰어남이 확인되었다. 이를 통해, eK5가 포장 공간을 절약하면서 AAV 벡터를 크게 개선할 수 있음을 확인하였다.
또한, 렌티바이러스 벡터를 사용하여 상기 실험을 반복하였다. 그 결과 렌티바이러스 벡터를 이용하더라도 AAV 벡터와 마찬가지로 eK5로 인해 GFP 발현이 증가됨을 확인하였다(도 10).
시험관 내 전사(IVT) mRNA는 COVID-19 백신에 의해 예시된 바와 같이 유전자 전달을 위한 또 다른 중요한 플랫폼을 나타내었다. IVT mRNA에 대한 K5의 효과를 테스트하기 위해, 도 4D에 나타낸 바와 같이 기능적 eK5의 유무에 따른 루시페라제 인코딩 mRNA를 합성하였다. 상기 mRNA는 cap-1 유사체, pmirGLO 벡터로부터 유래된 3' UTR 서열, 및 120 nt의 폴리(A) 테일을 포함하였다. 상기 mRNA를 HeLa 세포에 형질감염시키고 최대 72시간 동안 배양하였다. 도 4E에 나타낸 바와 같이, 기능적 eK5가 없는 경우, 루시페라아제 수치는 시간이 지남에 따라 급격히 감소하여 형질주입된 mRNA의 수명이 짧음을 확인하였다. 그러나, eK5가 포함되었을 때, 발현 지속 기간이 급격히 증가함을 확인하였다.
mRNA를 안정화하는 데 널리 사용되는 GFP 코딩 서열(d2EGFP)과 알파-글로빈 3' UTR(GBA)을 포함하는 또 다른 IVT mRNA 세트에서도 유사한 관찰이 확인되었다. 도 4D 및 도 4F에 나타낸 바와 같이, 3' UTR 내의 위치와 상관없이, eK5의 포함으로 상기 알파-글로빈 3' UTR-함유 mRNA로부터 단백질 생산이 실질적으로 증가되었다. 이상의 결과로부터, K5는 플라스미드, AAV 벡터 및 합성 mRNA를 포함하여 테스트한 모든 맥락에서 활성화되며, 이를 통해 광범위한 조절 활성 및 치료 가능성을 확인하였다.
6. K5의 TENT4에 의한 혼합 테일링 유도
합성 mRNA 형질감염을 사용한 시간 경과 실험에서 연장된 단백질 발현(도 4E)은 K5가 적어도 세포질에서 mRNA 안정성을 증가시킴으로써 작용한다는 것을 확인하였다. 진핵생물의 mRNA 안정성은 주로 디아데닐화(deadenylation) 단계에서 결정된다. 따라서, K5의 메커니즘을 이해하기 위해 고분해능 폴리(A) 테일 분석(Hire-PAT)을 통해 폴리(A) 테일 길이를 모니터링하였다. Hire-PAT는 G/I 테일링에 이어 유전자 특이적 정방향 프라이머와 폴리(A)와 G/I 서열 사이의 접합부에 결합하는 역방향 프라이머와 함께 RT-PCR을 사용하였다. 도 5A에 나타낸 바와 같이, K5가 리포터 mRNA의 정상 상태 폴리(A) 테일 길이를 증가시킨다는 것을 확인하였다. 이는 디아데닐화의 억제, 폴리(A) 테일의 확장 또는 둘 다를 통한 폴리(A) 테일 조절 관련 메커니즘을 의미한다.
상기 변화가 말단 뉴클레오티딜 전이효소(terminal nucleotidyl transferases; TENT)에 의해 촉매되는 테일의 확장과 관련될 가능성을 테스트하기 위해, TENT를 고갈시키고 K5 리포터 컨스트럭트로 루시페라아제 분석을 수행하였다. 도 5B에 나타낸 바와 같이, TENT4 이원체(paralog)(TENT4A 및 TENT4B)의 녹다운은 특히 K5 리포터 발현을 감소시킨 반면, 다른 TENT(TENT1, TENT2, TENT3A/B(TUT4 및 TUT7이라고도 함) 및 TENT5A/B/C/D)는 K5 활동에 미치는 유의한 영향이 확인되지 않았다. TENT4의 관여를 추가로 검증하기 위해, TENT4 효소의 화학적 억제제인 RG7834 및 비활성 대조군 R-이성질체 RO0321을 사용하였다. 도 5C에 나타낸 바와 같이, K5 리포터 mRNA의 폴리(A) 테일은 RG7834에 의해 특이적으로 단축되어 TENT4가 실제로 K5 기능에 필요함을 확인하였다.
TENT4A(PAPD7, TRF4-1 및 TUT5로도 알려짐) 및 TENT4B(PAPD5, TRF4-2 및 TUT3로도 알려짐)는 비-아데노신 잔기의 간헐적 혼입과 함께 폴리(A) 테일을 연장한다('혼합 테일링(mixed tailing)'으로 알려진 프로세스). 생성된 혼합 테일은 주요 디아데닐라제 복합체인 CCR4-NOT이 아데노신 잔기를 선호하기 때문에 디아데닐화를 효과적으로 방해하여 전사체를 안정화한다. 혼합된 테일의 빈도를 측정하여 혼합 테일의 직접적인 관여를 조사하기 위해 우리는 TAIL-seq의 수정된 버전(이를 "유전자 특이적 TAIL-seq(GS-TAIL-seq)"로 명명함)을 개발하였다. 구체적으로, RNA는 비오틴과 접합되고 부분적으로 단편화된 3' 어댑터에 결찰되었다. 3' 말단 단편은 스트렙타비딘 비드를 사용하여 농축하고, 어댑터에 결합하는 프라이머로 역전사한 다음, PCR에 의해 유전자 특이적 정방향 프라이머로 증폭하였다. 상기 시퀀싱 데이터는 데이터는 K5 리포터 mRNA가 혼합 꼬리에 대해 예상되는 바와 같이 주로 말단 및 끝에서 두 번째 위치에 비아데노신 잔기를 갖는다는 것을 확인하였다. 도 5D에 나타낸 바와 같이, 혼합된 테일링 빈도는 RG7834 처리 후 감소하여 K5가 TENT4를 통해 혼합 테일링을 유도함을 확인하였다. 도 5F에 나타낸 바와 같이, GS-TAIL-seq 데이터는 또한 RG7834 처리된 셀에서 K5 리포터의 폴리(A) 테일이 짧아지는 것을 확인하여 도 5C에 나타낸 Hire-PAT 데이터를 확증하였다.
또한 도 5E 내지 도 5G에 나타낸 바와 같이, HeLa 및 HCT116 세포에 RG7834를 처리했을 때 K5 및 eK5 리포터의 루시페라아제 활성 및 mRNA 풍부도는 감소하였다. 단일 G 결실(K5m 및 eK5m)을 포함하는 K5 및 eK5의 비활성 돌연변이는 RG7834에 의해 유의한 영향을 받지 않아 특이성이 입증되었다. 이러한 결과들은 함께, TENT4에 의해 촉매되는 혼합 테일링을 통해 K5가 작용하는 메커니즘을 지지하다.
그러나, 신기하게도 바이러스 RNA에 TENT4를 모집하는 것으로 알려진 어댑터 단백질인 ZCCHC14가 없을 때 K5가 완전히 활성화된 상태를 유지한다는 것을 확인하였다. 도 5G에 나타낸 바와 같이, ZCCHC14가 리포터 발현 및 테일 연장 모두에서 K5 활성에 필요하지 않음을 확인하였다. 이러한 ZCCHC14 의존성 결여는 K5를 인식하는 다른 인자가 있을 수 있음을 시사하였다.
7. K5에 대한 호스트 인자(ZCCHC2) 동정
잠재적인 K5 어댑터를 동정하기 위해, 'RNA-단백질 상호작용 검출(RNA-protein interaction detection; RaPID)' 방법을 수행하였다. 도 5H에 나타낸 바와 같이, eK5 및 BoxB 엘리먼트를 포함하는 IVT mRNA를 λN 펩타이드 융합 비오틴 리가아제인 BASU를 안정적으로 발현하는 세포에 형질감염하였다. 16시간 후, 세포를 1시간 동안 비오틴으로 처리하여 BASU가 미끼와 관련된 단백질을 비오티닐화하였고, 이어서 세포 용해, 스트렙타비딘 포획 및 비오티닐화된 단백질의 질량 분석을 수행하였다. 도 5H에 나타낸 바와 같이, eK5가 결여된 대조군 RNA에 비해 eK5 함유 mRNA에 농축된 단백질에서 핵산 결합 GO 용어인 ZCCHC2 및 DNAJC21을 갖는 두 개의 세포질 단백질을 확인하였다(도 5H, 표 9).
직교적으로, HCMV 1E 스템-루프(SL2.7)를 미끼로 사용하는 시험관내 RNA-풀다운 실험에 의해 수득될 수 있는 TENT4 복합체를 조사하였다. 그 결과, 1E와 상호작용하는 것으로 알려진 TENT4A, TENT4B, ZCCHC14, SAMD4A, K0355 외에도 ZCCHC2도 발견되었다(도 9). ZCCHC2의 강도가 낮고 1E 활성에 필요하지는 않지만, ZCCHC2는 상기 풀다운 실험에서 특이적으로 농축되었으며, ZCCHC2가 TENT4 복합체의 이전에는 알려지지 않은 구성 요소일 수 있음이 예상되었다. 특히, ZCCHC2는 RaPID 및 RNA 풀다운 실험 모두에서 일반적으로 농축된 유일한 단백질이었다.
ZCCHC2와 eK5 사이의 상호작용을 검증하기 위해, RaPID 실험에 이어 western-boltting을 수행하고 eK5 미끼와 관련된 ZCCHC2를 검출하였다(도 5I). TENT4A는 또한 약간이지만 풍부하여 TENT4A가 ZCCHC2보다 eK5와 덜 안정적으로 연관될 수 있음을 의미하였다.
8. ZCCHC2의 특성화
도 6A에 나타낸 바와 같이, ZCCHC2는 본질적으로 무질서한 긴 영역, PX 도메인 및 CCHC 유형 징크 핑거(ZnF) 도메인을 가진 126kDa의 특성이 잘 확인되지 않은 단백질이다. ZCCHC2는 ZCCHC14와 관련이 멀지만, 1E 및 PRE에서 CNGGN 펜타 루프와 상호 작용하는 것으로 알려진 SAM 도메인이 없는 것으로 확인되었다. 또한, C. legans의 gls-1 단백질은 PX 또는 ZnF 도메인이 결여되어 있을 지라도, ZCCHC2와 관련이 있을 것으로 예상되었다. gls-1은 이전에 TENT4의 동족체인 GLD-4와 상호 작용하는 것으로 확인되었다.
ZCCHC2가 TENT4에 결합하는지 테스트하기 위해, 공동 면역침강법(co-immunoprecipitation)을 수행하였다. 도 6B에 나타낸 바와 같이, ZCCHC2는 HeLa 모세포에서 TENT4A 및 TENT4B에 대한 항체와 함께 공동 면역침전되었지만, TENT4A/B 이중 녹아웃 세포에서는 확인되지 않았다. 이러한 상호작용은 RNase A-처리된 조건 하에서 검출되었으며, TENT4와 ZCCHC2 사이의 RNA-비의존적 상호작용을 나타내었다. 도 6C에 나타낸 바와 같이, 세포내 분획은 ZCCHC2가 세포질에 국한되는 것으로 나타났으며, 이는 ZCCHC2가 TENT4와 세포질 복합체를 형성함을 시사하였다. 참고로, TENT4 단백질은 핵과 세포질 모두에 분포하며, TENT4A는 주로 세포질에, TENT4B는 주로 핵에 분포하였다. 또한, 3' UTR 내의 eK5로 EGFP를 안정적으로 발현하는 HeLa 세포주를 사용하여 RNA 면역침전에 이어 RT-qPR(RIP-QPCR)을 수행하였다. 도 6D에 나타낸 바와 같이, ZCCHC2가 eK5 함유 EGFP mRNA와 특이적으로 상호 작용하여 도 5H 및 도 5I에 나타낸 RaPID 및 RNA 풀다운 결과를 다시 한번 확증하였다. 이상의 결과로부터, ZCCHC2는 K5 및 TENT4 모두와 상호 작용함을 확인하였다.
다음으로, K5 매개 조절에서 ZCCHC2의 기능을 조사하기 위해 CRISPR-Cas9로 HeLa 세포에서 ZCCHC2 유전자를 절제하였다. 상기 낙아웃(KO)을 통해 Hire-PAT 분석을 수행하여 폴리(A) 테일의 길이 분포를 조사하였다. 도 6E에 나타낸 바와 같이, K5 리포터 mRNA의 폴리(A) 테일은 모세포에 비해 ZCCHC2 KO 세포에서 감소하였다. 대조적으로, K5 돌연변이는 ZCCHC2 KO 세포에서 더 이상 짧아지지 않고 모세포에서 짧은 테일을 가지는 것이 확인되었다. 유사한 결과가 eK5 컨스트럭트에서 확인되었으며, ZCCHC2가 테일 연장 효과에 중요하다는 것을 확인하였다. 또한, 도 6F에 나타낸 바와 같이, 유전자 특이적 TAIL-seq 실험은 ZCCHC2 KO가 혼합 테일링의 감소를 초래하는 것으로 나타났으며, 이를 통해 ZCCHC2가 K5 리포터 mRNA의 혼합 테일링에 필요함을 확인하였다.
동일하게, K5 리포터를 사용한 루시페라아제 분석 및 RT-qPCR은 ZCCHC2가 없는 경우 K5가 더 이상 리포터 발현을 향상시킬 수 없다는 것을 확인하였다. 상기 결과는 더 긴 eK5 컨스트럭트를 사용하여 확인되었다. 도 6G에 나타낸 바와 같이, RG7834는 모세포와 달리 ZCCHC2 KO 세포에서 K5 리포터 발현에 유의한 영향을 미치지 않는 것을 확인하였다. 이상의 결과로부터, ZCCHC2가 K5에 중요한 요소이며 ZCCHC2의 이 기능이 TENT4의 활동을 필요로 한다는 것을 확인하였다.
ZCCHC2의 역할을 검증하기 위해, ZCCHC2-발현 플라스미드를 ZCCHC2 KO 세포에 형질감염시켜 회복 실험을 수행하였다. 도 6H에 나타낸 바와 같이, ZCCHC2의 이소성 발현은 K5 및 eK5 구축물에서 루시페라아제 발현을 증가시켰지만 돌연변이체에서는 증가하지 않음을 확인하였다. 따라서 ZCCHC2는 실제로 K5의 기능을 매개하는 핵심 요소임을 확인하였다. ZCCHC2의 ZnF 도메인에 돌연변이를 도입했을 때 돌연변이는 KO 세포를 회복시키지 못하였고, 이는 RNA 결합 모티프가 중요한 역할을 함을 나타내었다. 또한, 도 6A에 나타낸 바와 같이, ZCCHC2와 관련 단백질 ZCCHC14 및 gls-1 사이에 높은 상동성 영역(하기에서는 'HS'라고도 함)을 포함하는 N-말단 200 아미노산이 결여된 결실 돌연변이(ΔN)를 생성하였다. 도 6I에 나타낸 바와 같이, 상기 ΔN 돌연변이는 ZCCHC2 KO 세포의 결함을 회복하는 데 실패했으며, 이는 ZCCHC2의 N-말단이 중요한 기능을 함을 나타내었다.
표적 RNA에 대한 ZCCHC2의 직접적인 활성을 추가로 확인하기 위해, K5 대신 BoxB 엘리먼트를 포함하는 루시페라아제 리포터를 활용하여 테더링(tethering) 실험을 수행하였다. 도 6J에 나타낸 바와 같이, ZCCHC2 단백질이 λN 태그를 통해 테더링되었을 때, 리포터 발현은 특이적으로 상향 조절되었다. 대조군으로 TNRC6B 단백질을 부착한 경우 발현이 감소하였다. 도 6I 및 도 6K에 나타낸 바와 같이, 회복 실험에서 비활성 상태였던 ZCCHC2 ZnF 돌연변이는 λN-BoxB 시스템을 통해 리포터 RNA에 테더링되었을 때 작동하는 것을 확인하였다. 이상의 결과로부터, ZnF가 RNA 결합 모듈로만 작용하고 활성화 기능에 비필수적이라는 것을 확인하였다.
다음으로, ZCCHC2의 어느 부분이 TENT4 모집을 담당하는지 확인하였다. 도 6A에 나타낸 바와 같이, FLAG-태그가 있는 ZCCHC2의 두 가지 결실 돌연변이를 생성했는데, 돌연변이 중 하나는 C-말단 결실(ΔC, N-말단의 1-375 a.a 포함)을 가지고 다른 하나는 N-말단 결실(ΔN, 201-1,178 a.a 포함)을 가지도록 제조하였다. 도 6L에 나타낸 바와 같이, 항-FLAG 항체는 전장 및 ΔC ZCCHC2 단백질을 발현하는 세포에서 TENT4A 및 TENT4B 모두를 공동 침전시켰으며, TENT4와 ZCCHC2 사이의 상호작용이 확인되었다. 상기 결과로 PX 및 ZnF 도메인을 포함하는 C-말단 부분이 TENT4 결합에 필수적이라는 것을 확인하였다. 특히, 도 6I 및 도 6L에 나타낸 바와 같이, ΔN은 TENT4A 또는 TENT4B와 상호 작용하지 못했는데, 이는 ZCCHC2가 N-말단을 통해 TENT4를 모집할 수 있음을 나타내었다. 상기 N-말단 부분에는 HS 영역이 포함되어 있으며, 상기 HS 영역은 C. elegans(도 6A)에서 ZCCHC2의 먼 동족체인 gls-1의 GLD4 결합 영역과 서열이 유사함을 확인하였다. 따라서, HS 영역은 단백질-단백질 상호작용을 매개하는 이전에 정의되지 않은 보존된 도메인을 구성할 수 있음을 확인하였다.
이상의 결과로부터, ZCCHC2가 N-말단과 C-말단을 사용하여 각각 TENT4 및 K5와 상호 작용한다는 것을 확인하였다. 도 7에 나타낸 바와 같이, 상기 상호 작용은 TENT4에서 K5로의 모집을 매개하여 혼합 테일링을 초래할 수 있음을 확인하였다. 또한, 긴 폴리(A) 테일은 진핵 생물 번역 개시 인자 복합체(eIF4F)의 구성 요소인 eIF4G와 상호 작용하도록 잘 확립된 세포질 폴리(A) 결합 단백질(PABPC)을 모집하여 번역을 촉진할 수 있음을 확인하였다. 상호배타적이지는 않지만, 추가로 알려지지 않은 인자들이 K5 및 ZCCHC2에 의해 유도된 번역 활성화에 관여할 수 있음을 확인하였다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실험예 및 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (11)

  1. 하기를 포함하는, RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법:
    (a) 바이러스 게놈을 타일링(tiling)하여 복수의 올리고뉴클레오티드를 제조하는 단계;
    (b) 상기 올리고뉴클레오티드 각각을 포함하는 벡터의 풀(pool)을 제조하는 단계로서, 상기 벡터는 리포터의 유전자 및 이의 3' UTR에 하나의 올리고뉴클레오티드를 포함하는 것인, 단계;
    (C) 각각의 벡터를 세포 내에 도입시키는 단계;
    (d) 상기 세포로부터 DNA와 RNA 또는 유리 mRNA(free mRNA)와 무거운 폴리솜(Heavy polysome; HP)을 분리하여, 각 올리고뉴클레오티드 별로 식 (1) 또는 식 (2)의 값을 구하는 단계; 및
    - 식 (1) = Log2(RNA/DNA)
    - 식 (2) = Log2(HP/유리 mRNA)
    (e) 식 (1)의 값이 0.5를 초과하거나 식 (2)의 값이 0.2를 초과하는 올리고뉴클레오티드를 각각 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트로 선별하는 단계.
  2. 제1항에 따른 식 (1) 또는 식 (2)의 값이 각각 0.5 또는 0.2를 초과하는, RNA 안정성 또는 mRNA의 번역 증가용 조절 엘리먼트.
  3. 제2항에 있어서, 상기 식 (1)의 값이 0.5를 초과하는 조절 엘리먼트는 서열번호 1 내지 19 및 21 내지 50 중 어느 하나의 염기 서열 또는 이의 RNA 염기 서열; 또는 이와 적어도 90% 동일성을 갖는 염기 서열을 포함하는, 조절 엘리먼트.
  4. 제2항에 있어서, 상기 식 (2)의 값이 0.2를 초과하는 조절 엘리먼트는 서열번호 17 및 51 내지 78 중 어느 하나의 염기 서열 또는 이의 RNA 염기 서열; 또는 이와 적어도 90% 동일성을 갖는 염기 서열을 포함하는, 조절 엘리먼트.
  5. 목적 단백질의 유전자 및 이의 3' UTR에 제2항 내지 제4항 중 어느 한 항의 조절 엘리먼트를 포함하는, 컨스트럭트.
  6. 제5항에 있어서, 목적 단백질이 리포터, 생리활성 펩타이드, 항원, 또는 항체 또는 이의 단편으로부터 선택되는, 컨스트럭트.
  7. 제5항에 있어서, 상기 컨스트럭트는 mRNA 컨스트럭트인, 컨스트럭트.
  8. 제5항의 컨스트럭트를 포함하는, 벡터.
  9. 제5항의 컨스트럭트 또는 상기 컨스트럭트를 포함하는 벡터를 포함하는, 재조합 숙주 세포.
  10. 제5항의 컨스트럭트; 상기 컨스트럭트를 포함하는 벡터; 또는 상기 컨스트럭트 또는 벡터를 포함하는 재조합 숙주 세포를 포함하는, 조성물.
  11. 제10항에 있어서, 상기 조성물은 질병의 예방 또는 치료; 또는 mRNA 컨스트럭트 또는 목적 단백질의 제조를 위한 것인, 조성물.
KR1020230084276A 2022-06-29 2023-06-29 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도 KR20240003762A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220080073 2022-06-29
KR1020220080073 2022-06-29

Publications (1)

Publication Number Publication Date
KR20240003762A true KR20240003762A (ko) 2024-01-09

Family

ID=89381112

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020230084276A KR20240003762A (ko) 2022-06-29 2023-06-29 RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도
KR1020230084275A KR20240003761A (ko) 2022-06-29 2023-06-29 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법,상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도
KR1020230084274A KR20240003760A (ko) 2022-06-29 2023-06-29 RNA 안정성 또는 mRNA 번역 증가용 신규 조절 엘리먼트,이와 상호작용하는 ZCCHC2, 및 이들의 용도

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020230084275A KR20240003761A (ko) 2022-06-29 2023-06-29 mRNA 번역 증가용 조절 엘리먼트를 스크리닝하는 방법,상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도
KR1020230084274A KR20240003760A (ko) 2022-06-29 2023-06-29 RNA 안정성 또는 mRNA 번역 증가용 신규 조절 엘리먼트,이와 상호작용하는 ZCCHC2, 및 이들의 용도

Country Status (2)

Country Link
KR (3) KR20240003762A (ko)
WO (3) WO2024005574A1 (ko)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007181454A (ja) * 2005-12-06 2007-07-19 Keio Gijuku 分子ディスプレイ法により特異的に選択された蛋白質をコードするdna配列のマイクロアレイによる高感度検出方法
JP2011504110A (ja) * 2007-11-23 2011-02-03 パナジェン インコーポレイテッド マイクロrnaアンチセンスpna、これを含む組成物、及びその使用及び評価方法
JP2022522660A (ja) * 2019-02-26 2022-04-20 ソウル大学校産学協力団 Tut4/7発現調節因子を含む癌予防又は治療用薬学的組成物
EA202192580A1 (ru) * 2019-03-22 2022-03-10 Инкоудид Терапьютикс, Инк. Мультиплексирующие регуляторные элементы для идентификации клеточно-типоспецифичных регуляторных элементов
CA3134400A1 (en) * 2019-03-26 2020-10-01 Peking University Method for identifying functional elements
WO2020242278A1 (ko) * 2019-05-30 2020-12-03 서울대학교 산학협력단 바이러스 감염 및 활성 억제 방법
EP4204015A2 (en) * 2020-08-31 2023-07-05 The Board of Trustees of the Leland Stanford Junior University Systems and methods for producing rna constructs with increased translation and stability

Also Published As

Publication number Publication date
WO2024005575A1 (ko) 2024-01-04
KR20240003760A (ko) 2024-01-09
KR20240003761A (ko) 2024-01-09
WO2024005574A1 (ko) 2024-01-04
WO2024005577A1 (ko) 2024-01-04

Similar Documents

Publication Publication Date Title
US10858647B2 (en) Removal of DNA fragments in mRNA production process
US11685924B2 (en) Genetic elements driving circular RNA translation and methods of use
Konermann et al. Transcriptome engineering with RNA-targeting type VI-D CRISPR effectors
Chen et al. Translational control by DHX36 binding to 5′ UTR G-quadruplex is essential for muscle stem-cell regenerative functions
EP3645722A2 (en) Novel crispr rna targeting enzymes and systems and uses thereof
McHale et al. A 22‐nt artificial micro RNA mediates widespread RNA silencing in A rabidopsis
Rissland et al. The influence of microRNAs and poly (A) tail length on endogenous mRNA–protein complexes
JP6708548B2 (ja) 新規真核細胞および目的の生成物を組換え発現させるための方法
CN112384620B (zh) 用于筛选和鉴定功能性lncRNA的方法
CN110343724B (zh) 用于筛选和鉴定功能性lncRNA的方法
JP5258874B2 (ja) Rna干渉タグ
US11021704B2 (en) Methods for RNA promoter identification
White Formation and evolution ofTombusvirusdefective interfering RNAs
Seo et al. Functional viromic screens uncover regulatory RNA elements
Roner et al. Identification of the 5′ sequences required for incorporation of an engineered ssRNA into the reovirus genome
KR20240003762A (ko) RNA 안정성 또는 mRNA 번역 증가용 조절 엘리먼트를스크리닝하는 방법, 상기 방법에 따른 신규 조절 엘리먼트, 및 이의 용도
Kovalev et al. Interviral recombination between plant, insect, and fungal RNA viruses: role of the intracellular Ca2+/Mn2+ pump
KR20180100139A (ko) 미니-ILL RNase, 미니-ILL RNase에 의한 RNA 서열 절단의 특이성을 변화시키는 방법, 및 이의 용도
Chen et al. mRNA translation control by Dhx36 binding to 5’UTR G-quadruplex structures is essential for skeletal muscle stem cell regenerative functions
McFadden Structure-Function Relationships of Long Non-Coding RNA in Prostate Cancer
Feng et al. RNA-dependent RNA polymerases in the black-legged tick produce Argonaute-dependent small RNAs and regulate genes
Zheng et al. Genome-wide identification and characterization of long noncoding rnas involved in chinese wheat mosaic virus infection of Nicotiana benthamiana. Biology. 2021; 10: 232
Xiao et al. Research progress in digging and validation of miRNA target genes using experimental methods
Cao et al. Identification of RNA structures and their roles in RNA functions
JP2017528151A (ja) 干渉性分子のスクリーニング方法