KR20190139960A - 핵산 변형 및 식별 방법 - Google Patents

핵산 변형 및 식별 방법 Download PDF

Info

Publication number
KR20190139960A
KR20190139960A KR1020197033605A KR20197033605A KR20190139960A KR 20190139960 A KR20190139960 A KR 20190139960A KR 1020197033605 A KR1020197033605 A KR 1020197033605A KR 20197033605 A KR20197033605 A KR 20197033605A KR 20190139960 A KR20190139960 A KR 20190139960A
Authority
KR
South Korea
Prior art keywords
cells
pna
rna
modified
cell
Prior art date
Application number
KR1020197033605A
Other languages
English (en)
Inventor
스테판 엘. 아메레스
브라이언 레이치홀프
베로니카 에이. 헬족
조한스 주베르
맛시아스 무할
Original Assignee
아이엠비에이 - 인스티투트 퓨어 몰레쿨라레 바이오테크놀로지 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP17166629.0A external-priority patent/EP3388530A1/en
Application filed by 아이엠비에이 - 인스티투트 퓨어 몰레쿨라레 바이오테크놀로지 게엠베하 filed Critical 아이엠비에이 - 인스티투트 퓨어 몰레쿨라레 바이오테크놀로지 게엠베하
Publication of KR20190139960A publication Critical patent/KR20190139960A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/107Modifications characterised by incorporating a peptide nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 PNA를 제공하는 단계; 수소 결합 파트너의 첨가 또는 제거에 의해 PNA의 하나 또는 그 이상의 핵염기를 변형시켜, 하나 또는 그 이상의 핵염기의 염기 페어링 능력 (capacity)을 변경시키는 단계; 하나 이상의 변형된 핵염기에 대한 염기 페어링을 포함하여, 상보적 핵산을 PNA에 염기 페어링하는 단계; 적어도 하나의 변형된 핵염기에 상보적인 위치에서 상보적 핵산의 서열을 확인하는 단계를 포함하는 다중 핵산(PNA)을 식별하는 방법을 제공한다.

Description

핵산 변형 및 식별 방법
본 발명은 핵산 프로세싱 및 시퀀싱 (서열 분석) 분야에 관한 것이다.
4-티오우리딘 (4-Thiouridine, s4U) 및 6-티오구아노신 (6-thioguanosine, s6G)과 같은 뉴클레오티드 유사체는 예를 들어 천연의 효소에 의해 초기 (nascent) RNA에 쉽게 통합된다 (Tani et al., Genome Res. 22, 947-956 (2012)). 잘 알려진 유사체 중에는 5-브로모우리딘 (5-bromouridine, 5BrU), 5-에티닐우리딘 (5-ethynyluridine, 5-EU), 6-티오구아노신 (6-thioguanosine, s6G) 및 4-티오 우리딘 (s4U)이 있고, 이들은 세포에 의해 용이하게 통합되고 각각 항체 검출, 시클로부가반응 (cycloaddition reactions) 및 티올-특이적 반응성 및 친화도에 대한 독특한 물리-화학적 특성을 제공한다 (Eidinoff et al., Science. 129, 1550-1551 (1959); Jao et al. PNAS 105, 15779-15784 (2008); Melvin et al. Eur. J. Biochem. 92, 373-379 (1978); Woodford et al. Anal. Biochem. 171, 166-172 (1988); Dolken et al. RNA 14, 1959-1972 (2008); Rabani et al. Nat Biotechnol. 29, 436-442 (2011)). 4-티오우리딘 (s4U)은 RNA 발현의 역학을 연구하기 위해 가장 널리 사용되는 뉴클레오티드 유사체이다. 다른 뉴클레오티드와 유사하게, s4U는 전기 천공 또는 리포펙션없이 세포에 의해 빠르게 흡수된다. 세포에서, 세포 우리딘-키나아제에 의한 인산화는 파리 (fly), 뮤린 (murine) 및 인간 세포를 포함하는 광범위한 세포 유형에서 새롭게 합성된 RNA에 효율적으로 통합되는 인산화된 (phosphorylated) s4U의 축적 풀 (accumulating pool)을 생성한다 (상기, Dolken 2008). 또한, 파리 및 마우스에서 생체 내 (in vivo) 전사체의 세포-유형-특이적 표지화 (cell-type-specific labeling)는 톡소플라스마 곤디 (Toxoplasma gondii) 우라실 포스포리보실전달효소 (uracil phosphoribosyltransferase, UPRT)의 세포-유형-특이적 발현과 조합하여 4-티오우라실을 사용함으로써 달성될 수 있고, 이는 리보오스-5-포스페이트를 우라실 (또는 4-티오우라실)의 N1 질소에 결합시켜 RNA에 혼입된 (4-티오-)우리딘 모노포스페이트를 생성한다 (Cleary et al. Nat Biotechnol. 23, 232-237 (2005)).
세포 내 RNA 생체내 합성(biogenesis), 처리, 및 턴오버 카이네틱 (turnover kinetics)을 특징짓기 위해 4-티오우리딘 (s4U) 대사성 (metabolic) RNA-표지화(라벨링)을 사용하는 현재 프로토콜은 s4U에서 티올기의 가역적 비오틴화 (biotinylation)를 통한 생화학적 분리를 사용한다 [예 : N-[6-(비오틴아미도)헥실]-3'-(2'-피리딜디티오)프로피온아미드 (HPDP-비오틴) 또는 비오틴-결합 메탄티오술포네이트 (MTS-비오틴)을 통한] (상기, Cleary et al., 2005). 그러나, 생화학적 분리 방법과 마찬가지로, 기본 프로토콜은 시간이 많이 걸리며 일반적으로 비오틴화 효율 (특히 짧은 RNA 종에 적용되는 경우) 및 표적 외 (off-target) 반응성에 한계가 있기 때문에 낮은 신호-대-잡음비 (signal-to-noise ratios)의 문제가 발생한다 (Duffy 등, Mol Cell. 59, 858?866 (2015); Neymotin 등, RNA 20 : 1645-1652 (2014)).
WO 2006/125808 A1은 티올화된 RNA를 함유하는 드-노보 (de-novo) 전사된 RNA를 분석하는 마이크로어레이-기반 방법을 기술하고 있다.
WO 2004/101825 A1 및 WO 2016/154040 A2는 생합성 표지 및 RNA 분리 방법에 관한 것이다.
Miller 등, Nature Methods 6 (6), 2009 : 439-441은 황색초파리 (Drosophila melanogaster)에서 4-티오우라실 식품 소재 (4-thiouracil food source)를 통한 RNA의 표지를 기술하고 있다.
Schwalb et al., Science 352 (6290), 2016 : 1225-1228은 총 mRNA 합성 및 분해를 추정할 수 있는 일시적 전사체 (transient transcriptome) 서열 분석 방법에 관한 것이다.
Hartmann et al., Handbook of RNA Biochemistry vol. 2, 2014, chapter 8.3.3, pp. 164-166은 4-티오우리딘 잔기를 아이오도아세트아마이드 (iodoacetamides) 또는 황-계 (sulfur-based) 화합물로 변형시켜 4-티오우리딘-변형된 RNA의 합성 후 표지화 (postsynthetic labelling)에 관한 것이다.
Testa 등, Biochemistry, 38 (50), 1999 : 16655-16662는 우라실과 비교하여 티오우라실 (s2U 및 s4U)의 변경된 기본 페어링 강도를 개시한다.
Hara et al., Biochemical and Biophysical Research Communica-tions 38(2), 1970: 305-311은 tRNA의 4- 티오우리딘-특이적 스핀-표지화를 개시하고 있다.
Fuchs et al., Genome Biology 15 (5), 2014 : 1465-6906은 RNA에서 4-티오 우리딘 태그의 결정에 의한 게놈 전체 전사 신장률의 결정에 관한 것이다. 상기 방법은 이러한 라벨링(표지화)된 RNA의 비오틴화 (biotinylation) 및 정제를 필요로한다.
또한, 가역적 비오틴화 전략에서 표지화된 RNA는 단독으로 분석될 수 있다. 즉 전체 RNA와 관련하여 분석될 수 없다. 고 처리량 서열 분석(시퀀싱)에 의한 세포 내 RNA 카이네틱의 정확한 측정은 따라서 시점 당 3 개의 RNA 서브세트 (표지 된 RNA, 총 RNA 및 비표지된 RNA)의 분석이 필요하므로, 이러한 접근법은 비싸고 다운스트림 분석이 불가능하다.
따라서, 본 발명의 목적은 변형된 핵산을 검출하는 방법, 바람직하게는 자동화된 검출을 허용하는 정도로 방법을 단순화하는 것이다.
발명의 요약
본 발명은 단일 뉴클레오티드 분해능으로 폴리뉴클레오티드 (PNA) 종에서의 변형을 검출할 수 있는 뉴클레오티드-유사체 유도체화 (nucleotide-analog derivatization) 화학에 기초한다. 본 발명의 방법은 PNA 변형의 신속한 그리고 전사체 전체 분석 (transcriptome-wide analysis)을 위한 확장 가능하고, 매우 정량적이며, 비용 및 시간 효율적인 방법을 제공한다.
제 1 측면에서, 본 발명은 PNA를 제공하는 단계; 수소 결합 파트너의 첨가 또는 제거에 의해 PNA의 하나 또는 그 이상의 핵염기를 변형시켜 하나 또는 그 이상의 핵염기의 염기 페어링 능력 (base pairing capacity)을 변경시키는 단계; 적어도 하나의 변형된 핵염기에 대한 염기 페어링을 포함하여, 상보적 핵산을 PNA에 염기 페어링하는 단계; 적어도 하나의 변형된 핵염기에 상보적인 위치에서 상보적 핵산의 서열을 식별 (확인)하는 단계를 포함하는 다중 핵산 (polynucleic acid, PNA)을 식별하는 방법을 제공한다.
바람직한 실시양태에서, PNA는 세포 내에서, 특히 자체적으로 염기 페어링 능력을 변경시키는 변형으로 합성되거나, 염기 페어링 능력을 변경하도록 추가로 변형될 수 있다. 따라서, 본 발명은 또한 다음을 포함하는 다중 핵산 (PNA)을 식별하는 방법으로서 정의될 수 있다: 세포에서 PNA를 발현시키는 단계; 세포로부터 PNA를 단리하는 단계; 세포에서 및/또는 단리 후 PNA의 하나 또는 그 이상의 핵염기를 변형시키는 단계; 여기서 세포 내 또는 단리 후 또는 둘 다의 변형(들)은 하나 또는 그 이상의 핵염기의 수소 결합 파트너를 추가 또는 제거하여, 하나 이상의 핵염기의 염기 페어링 능력을 변경시키는 단계; 적어도 하나의 변형된 핵염기에 대한 염기 페어링을 포함하여 상보적 핵산을 PNA에 염기 페어링하는 단계; 적어도 하나의 변형된 핵염기에 상보적인 위치에서 상보적 핵산의 서열을 식별(확인)하는 단계.
본 발명은 또한 본 발명의 방법을 수행하기 위한 키트, 특히 티올 변형된 핵염기 및 티올기에서 티올 변형된 핵염기를 알킬화하기에 적합한 알킬화제를 포함하는 키트를 제공하며, 여기서 알킬화제는 수소 결합 공여체 (donor) 또는 수용체 (acceptor)를 포함한다. 본 발명의 모든 실시양태는 다음의 상세한 설명에서 함께 설명되며, 모든 바람직한 실시양태는 모든 실시양태, 측면, 방법 및 키트에 관한 것이다. 예를 들어, 키트 또는 그 구성요소는 본 발명의 방법에 사용되거나 적합할 수 있다. 기재된 방법에 사용된 임의의 구성 요소가 키트에 제공될 수 있다. 본 발명의 방법의 바람직하고 상세한 설명은 키트 구성 요소 또는 주어진 방법 단계에 대한 키트 구성 요소의 적합성 또는 조합에 대해 동일하게 사용된다. 달리 언급되지 않는 한, 모든 실시양태는 서로 조합될 수 있다.
본 발명의 상세한 설명
본 발명은 다중 핵산 (PNA로 약칭됨)을 합성 PNA (변형 PNA라고도 함)를 생성하도록 변형시키는 방법에 관한 것이다. PNA의 샘플에서 합성 PNA의 존재는 상기 샘플의 PNA 시퀀싱 판독에서 발견될 수 있고, 이에 의해 변형된 PNA를 식별할 수 있다. 본 발명의 이점은 이러한 변형이 비-변형 PNA로부터 정제/분리없이 수행될 수 있다는 것이다.
구체적으로, 본 발명의 방법은 수소 결합 파트너의 첨가 또는 제거에 의해 PNA의 하나 이상의 핵염기를 변형시켜, 하나 이상의 핵염기의 염기 페어링 능력 (또는 거동)을 변화시키는 단계; 적어도 하나의 변형된 핵염기에 대한 염기 페어링을 포함하여, 상보적 핵산을 PNA에 염기 페어링하는 단계를 포함한다.
천연 핵염기는 A (아데닌), G (구아닌), C (시토신) 및 T (티민) / U (우라실)이다. 본 발명의 변형은 RNA의 경우 A, G, C, U 뉴클레오티드 또는 DNA의 경우 A, G, C, T 뉴클레오티드에 비교하여 비-천연인 핵염기를 야기한다. 변형은 변경된 염기 페어링 거동을 초래하여, A와 T/U 사이 및 C와 G 사이에 우선적인 (preferential) 염기 페어링 (수소 결합에 의한 결합)을 변경시킨다. 이것은 상보적 핵산으로서 천연 핵염기와의 염기 페어링이 하나의 천연 핵산에서 다른 천연 핵산으로 변한다는 것을 의미한다. 바람직하게는 상보성 핵산은 DNA이고 U 대신에 T가 사용된다. 변경된 A는 C 또는 G에 결합할 수 있고; 변경된 T 또는 U는 C 또는 G에 결합할 수 있고; 변경된 C는 A 또는 T/U에 결합할 수 있고; 변경된 G는 A 또는 T/U에 결합할 수 있다. 이러한 변형은 당업계에 공지되어 있다. 변형은 일반적으로 마이너(minor)한 것이며 기본 페어링 거동이 변경되도록 변경을 최소로 유지한다. 예를 들어, A와 G는 각각 퓨린 고리 시스템을 유지하고 C와 T/U는 피리미딘 고리를 유지한다.
예를 들어, Harcourt et al. (Nature 2017, 541 : 339-346)은 그러한 변형에 대한 리뷰 및 요약을 제공한다.
변형 예는 다음과 같다: A 에서 m6A로, m1A로, 이노신으로, 2-아미노아데닌으로의 변형; C에서 m5C (5-메틸 시토신)로, hm5C (5-하이드록시메틸 시토신)로, 슈도우리딘으로, 2-티오시토신으로, 5-할로시토신으로, 5-프로피닐 (-C=C-CH3) 시토신으로, 5-알키닐 시토신으로의 변형; T 또는 U에서 2-티오우라실로, s4U (4-티오우라실)로, 2-티오티민으로, 4-피리미디논으로, 슈도우라실로, 5-할로우라실, 예를 들어 5-브로모우라실 (5-브로모우리딘 (5BrU)), 5-프로피닐 (-C=C-CH3) 우라실, 5-알키닐 우라실, 예를 들어 5-에티닐우라실로의 변형; G에서 하이포잔틴 (hypoxanthine)으로, 잔틴으로, 이소구아닌으로의 변형; A 또는 G에서 아데닌 및 구아닌의 6-메틸 및 기타 (other) 6-알킬 유도체로의 변형; 아데닌 및 구아닌의 2-프로필 및 기타 2-알킬 유도체로의 변형. 추가의 변형은 6-아조-우라실, -시토신 및 -티민, 8-할로-, 8-아미노-, 8 티올-, 8-티오알킬-, 8-하이드록실- 및 다른 8-치환된 아데닌 및 구아닌, 5-할로 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 2-F-아데닌, 2-아미노아데닌, 8-아자구아닌 및 8-아자데닌, 7-데 아자구아닌 (7-deazaguanine) 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌이다. 천연 핵염기는 상기 지시된 바와 같이 가장 가까운 변형된 (closest modified) 핵염기로 변형되는 것이 바람직하지만, 원칙적으로 핵염기는 상기 언급 된 바와 같이 임의의 변형된 핵염기로 변형될 수 있다. 관련 인자 (relevant factor)는 수소 결합 패턴의 변화로, 다른 염기쌍 파트너가, 변형되지 않은 핵염기와 비교하여, 변형된 핵염기에 결합할 수 있다. 결합 파트너의 변화는 절대적인 확실성을 요구하지 않으며, 천연 결합 파트너에 대한 결합의 확실성이 예컨대 적어도 10 %, 적어도 20 %, 적어도 30 %, 적어도 40 %, 적어도 50 %, 적어도 60 %, 적어도 70 %, 적어도 80 %, 적어도 90 % 또는 적어도 100 % 변화하는 것으로 충분하다. 특정 핵염기는 하나 이상의 상보적 핵염기 (특히, 워블 염기 (wobble bases)에 결합할 수 있다. 변화를 결정하기 위한 기준 조건 (reference conditions)은 생리적 등장성 수용액에서, 바람직하게는 대기압 및 37 ℃에서, 역전사 효소에 대한 표준 조건 (standard conditions)에 있다. 예시적인 조건은 pH 7.5-8.5에서 50mM 트리스-HCl, 75mM KCl, 3mM MgCl2, 10mM DTT이다. 이러한 변화는 서열 분석 (시퀀싱) 및 서열 비교와 같은 전류 검출 수단에 의해 모니터링될 수 있다. 또한, 하나 이상의 변형이 PNA 분자에 포함될 수 있고 단지 분자 당 또는 복수의 분자 당 하나의 검출이 필요하다. 물론, 하나의 천연 핵염기에서 다른 천연 핵염기 (상보적 핵산에서)로의 수소 결합의 변화율이 높을수록 검출의 확실성이 높아진다. 따라서, 적어도 50 % 또는 적어도 80 % 의 높은 염기쌍 비율 변화가 바람직하다.
"할로 (Halo)"는 할로겐, 특히 F, Cl, Br 또는 I를 의미하고; Br은 예를 들어 5BrU에서 특히 바람직하다. "알킬 (Alkyl)"은 알킬 잔기, 바람직하게는 분지형 또는 비분지형, 치환 또는 비치환된 길이 C1-C12의 알킬 잔기를 의미한다. 선택적인 O 치환기 및/또는 선택적인 N 치환기를 갖는 길이가 C1-C4의 알킬 잔기, 예를 들어 아세트아미드 또는 임의의 다른 알킬 카르보닐, 탄산 (carbonic acid) 또는 아미드가 바람직하다.
PNA의 특히 바람직한 변형된 핵염기는 5-브로모우리딘 (5BrU), 5-에티닐우리 딘 (5-EU), 6-티오구아노신 (s6G), 4-티오우리딘 (s4U), 5-비닐-우리딘, 5-아지도 메틸-우리딘 및 N6-알릴아데노신 (a6A)이다.
염기 페어링 (base paring) 거동은 당업계에 공지되어 있거나, 또는 이들의 페어링을 방지하기 위한 방해를 포함하여, 수소 결합 공여체 또는 수용체의 변화로부터 추론될 수 있다. 예를 들어, 4-피리미디논 (변형된 U 또는 T)은 바람직하게는 A 대신에 G와 염기쌍을 갖는다 (Sochacka et al., Nucleic Acids Res. 2015 Mar 11; 43 (5) : 2499-2512).
PNA의 핵염기의 변형은 탄소와 같은 치환기 (예를 들어 메틸기 또는 다른알킬기에서와 같은)에 의해 산소 (O) 또는 질소 (N) 원자 상의 수소 (H)의 치환일 수있고 이에 의해 수소 결합 공여체로서 H를 제거할 수 있다. 변형은 탄소와 같은 치환기 (예를 들어 메틸기 또는 다른 알킬기에서)에 의해 산소 (O) 또는 질소 (N) 원자의 자유 전자쌍의 치환일 수 있고, 이에 의해 수소 결합 수용체로서 전자쌍을 제거할 수 있다. 변형은 황 (S) 또는 SH로 O를 대체한 다음, 상기 변형 중 하나, 특히 S 또는 SH의 알킬화를 수행하는 것을 포함할 수 있다. S 또는 SH에 의해 O를 대체하는 바람직한 방법은 생합성에 의해 효소 예를 들어 s4U와 같은 S 또는 SH 변형된 뉴클레오티드를 갖는 전사 효소를 제공하는 것이다. 전사 효소는 세포 내에 존재할 수 있다.
본 발명의 변형은 1 단계 변형 또는 하나 이상의 단계, 예컨대 2, 3, 그 이상의 단계에 의한 변형일 수 있다. 예를 들어, 변형의 제 1 부분은 세포와 같은 하나의 반응 환경에서 수행되고, 제 2 변형은 다른 반응 환경에서, 예를 들어 세포로부터 PNA의 분리 후 수행된다. 바람직하게는, 이러한 제 2 또는 추가 변형은 제 1 변형에 의존하며, 예를 들어 제 1 변형에 의해 변경된 원자에 대해 수행된다. 다단계 변형이 특히 바람직하며, 여기서 제1 변형은, 예를 들어 RNA 또는 DNA 중합효소와 같은 효소에 의해 PNA 내로 변형된 뉴클레오티드/핵염기를 통합하는 효소적 변형이다. 이 단계에서, 효소적 가공성을 위해, 효소 활성을 손상시키지 않도록 또는 효소 활성을 허용할 정도로 손상시키기 위해 작은 변형만이 포함된다. 작은 변형은 예를 들어 상응하는 천연 핵염기와 비교하여 단지 1 또는 2 개의 원자 (수소는 카운팅하지 않음)의 변화이다. 추가 단계에서, 통합된 변형된 핵염기는 임의의 수단, 예를 들어 알킬화를 포함하는 습식 화학적 방법에 의한 본원에 기재된 변형된 핵염기로 추가로 변형될 수 있다. 이러한 추가 변형은 세포 외부에 있을 수 있고, 효소적 또는 비효소적일 수 있다. 바람직하게는 제 1 단계에서 도입된 변형을 목표로 한다. 세포에서 (제 1) 변형은 세포에 변형된 핵염기 (예를 들어, 변형 된 뉴클레오티드)를 공급하는 것에 의해 유도되거나 강화된 변형일 수 있으며, 이어서 세포는 생합성된 PNA에 통합(혼입)된다. "향상된 (Enhanced)"은 자연 발생의 변형 이상을 의미한다.
(제 1) 변형은 세포에 변형된 핵염기를 제공하지 않고 세포 내부의 자연적인 과정일 수도 있다. 이러한 자연적인 과정은 예를 들어 tRNA의 티올화이다 (Thomas et al., Eur J Biochem. 1980, 113(1):67-74; Emilsson et al., Nucleic Acids Res 1992, 20(17): 4499-4505; Kramer et al., J. Bacteriol. 1988, 170(5): 2344-2351). 이러한 자연 발생적 변형은 또한 본 발명의 방법에 의해, 예를 들어 이러한 변형된 핵염기와 함께 염기 불일치를 검출함으로써 검출될 수 있고 또는 직접적으로 또는 이들 자연 변형된 핵염기의 추가 (제 2) 변형에 의해 염기 페어링 거동 (base pairing behaviour)을 변경시킬 수 있다. 일부 자연적 변형은 스트레스 반응 또는 다른 환경 영향의 결과일 수 있다. 이에 의해, 본 발명의 방법은 세포의 이러한 반응 및 세포에서의 영향을 검출하는데 사용될 수 있다. 예는 UV 광, 특히 근적외선 조사에 대한 반응으로, 특히 tRNA에서 s4U 변형이다 (Kramer et al., 상기). 특히 tRNA에서 s4U 변형은 또한 세포의 성장 속도를 측정하기 위해 사용될 수 있다 (Emilsson et al., 상기). 성장 지표로서 사용되는 이러한 변형은 본 발명의 방법에 따라 검출될 수 있다. 바람직하게는, 이러한 자연적 변형을 위해 유박테리아 또는 고세균이 사용된다.
본 발명의 바람직한 실시양태에서, 변형 단계는 티올 변형된 핵염기를 PNA에 도입하고 (변형의 제 1 부분), 알킬화제 (변형의 제 2 부분)로 상기 티올 핵염기를 알킬화함으로써 수행된다. 티올 반응성 알킬화제는 아이오도아세트아미드, 말레이미드, 벤질 할라이드 및 브로모메틸케톤을 포함한다. 알킬화제는 상기 언급 된 바와 같은 알킬기 및 이탈기, 예컨대 할로겐화물 예를 들어 Br 또는 Cl를 포함할 수 있다. 상기 제제는 티올의 S-알킬화에 의해 반응하여 안정한 티오에테르 생성물을 생성한다. NBD (4-니트로벤조-2옥사-1,3-디아졸) 할라이드와 같은 아릴화제는 친핵체에 의한 방향족 할라이드의 유사한 치환에 의해 티올 또는 아민과 반응한다. 가역적 티올 변형을 위한 티오설페이트가 또한 이용 가능하다. 티오설페이트는 화학량론적으로 티올과 반응하여 혼합된 디술피드 (disulfides)를 형성한다. 티올은 또한 이소티오시아네이트 및 숙신이미딜 에스테르와 반응한다. 이소티오시아네이트 및 숙신이미딜 에스테르가 또한 아민과 반응하는데 사용될 수 있다.
티올의 변형은 또한 티올을 티오케톤으로 전환시키는 단계를 포함할 수 있다. 티오케톤기는 수소 결합 파트너의 첨가 또는 제거에 의해 추가로 변형(개질)될 수 있다. 티오케톤으로의 전환은 Kohler et al.에서 기술된 바와 같이 촉매로서 전이 금속 클러스터 상에서 수소의 제거를 포함할 수 있다 (Angew. Chem. Int. Ed. Engl. 1996, 35(9): 993-995). 티오케톤으로의 전환은 본 발명의 변형을 수행하기 위한 반응 화학에 대하여 추가 옵션을 허용한다. Kohler et al.은 또한 아릴에 대한 티올 또는 티오케톤의 도입을 설명하고, 이는 또한 본 발명의 변형된 핵염기에서 티오변형 (thiomodification)(thiol, thioketone)을 생성하기 위한 본 발명의 옵션이다.
티올의 알킬화는 또한 티올 (SH)-연결된 알킬화로 지칭된다. 티올 알킬화의 이점은 "연질(soft)" 티올에 대한 이의 선택성이며, 반면 비티올화된 핵염기는 변하지 않은 채로 남아있을 수 있다는 것이다 (HSAB theory - "hard and soft (Lewis) acids and bases", Pearson et al., JACS 1963, 85(22): 3533-3539). 아이오도아세트아미드는 모든 티올과 쉽게 반응하여 티오에테르를 형성한다; 이들은 또한 사용될 수 있는 브로모아세트아미드보다 다소 더 반응성이 있다. 말레이미드는 티올-선택적 변형, 정량 및 분석을 위한 우수한 시약이다. 이 반응에서, 티올을 말레이미드의 이중 결합에 걸쳐 첨가하여 티오에테르를 수득한다. 상기 언급된 티오케톤을 통해 알킬화가 또한 가능하다.
바람직하게는, 변형은 우리딘의 위치 4에서의 알킬화를 포함한다. 이 위치에서 우리딘의 자연적 (natural) 수소 결합 거동과의 간섭은 매우 효과적이다. 이러한 변형은 알킬화제, 예를 들어 수소 결합 파트너, 바람직하게는 수소 결합 수용체를 포함하는 알킬화제, 또는 수소 결합 파트너를 포함하지 않는 알킬화제로 이루어질 수 있고, 이에 따라 우리딘의 위치 4에서 정상적으로 일어날 수 있는 수소 결합을 차단할 수 있다. 이러한 알킬화는 상기 언급된 바와 같이, 4-티오우리딘을 통한 2 단계 변형으로 수행될 수 있다.
다른 바람직한 알킬화는 구아노신의 위치 6에 있다. 이러한 알킬화는 표준 GC 쌍에서 단지 2 개의 유효 수소 결합 (GC에서 3 개 대신)을 갖는 G*A 워블 쌍으로의 오페어링율 (mispairing rate)을 증가시킨다. 특히 바람직한 실시양태에서, 구아니딘의 위치 6에서의 알킬화의 도입은 구아니딘의 6-티오구아노신 (s6G)으로의 변형 및 티오-위치의 알킬화를 포함한다. 따라서, 이것은 상기 언급된 바와 같이 티오구아노신을 통한 2 단계 변형에서 이러한 알킬화의 추가적인 바람직한 예이다. 6-티오구아노신은 6-티오구아노신 뉴클레오티드의 존재 하에 생합성에 의해 PNA 내로 통합될 수 있다.
바람직한 알킬화제는 화학식 Hal-(C)xOyNz (수소는 나타내지 않음)를 가지며, Hal은 할로겐을 의미하고, C는 x가 1 내지 8인, 분지형 또는 비분지형 x C 원자의 탄소 사슬을 의미하고, O는 y가 0 내지 3 인 C 원자에 대한 y 산소 치환기를 의미하고, N은 z가 0 내지 3 인 C 원자에 대한 z 질소 치환기를 의미한다. N은 바람직하게는 하나 이상의 -NH2 또는 이중 결합 = NH이고, O는 바람직하게는 -OH 또는 이중 결합 = O이다. Hal은 바람직하게는 Br 또는 I로부터 선택된다.
특히 바람직하게는, PNA는 하나 이상의 4-티오우리딘 또는 6-티오구아노신, 바람직하게는 2, 3, 4, 5, 6, 7, 8, 9, 10 개 또는 그 이상의 4-티오우리딘 또는 6-티오구아노신을 포함한다. 하나 이상의 핵염기를 변형시키는 것은 수소 결합 수용체 또는 공여체와 같은 수소 결합 파트너를 티올 변형된 핵염기에 부착시키는 것을 포함할 수 있다. 이러한 부착은 임의의 화학적 변형에 의해 수행될 수 있으며, 알킬화, 예컨대 상기 언급된 할라이드 함유 알킬화제에 의한 알킬화가 바람직하다.
알킬화의 대안은 산화에 의한 변형이다. 이러한 변형은 예를 들어 Burton, Biochem J 204 (1967) : 686 및 Riml et al., Angew Chem Int Ed Engl. 2017; 56 (43) : 13479-13483에 개시되어 있다. 예를 들어, 핵염기, 특히 티올화된 핵염기는 산화에 의해 변형되어 수소 결합 공여체 또는 수용체를 변형시킬 수 있다. 전술한 바와 같은 티올화된 핵염기를 통한 2 단계 방법의 경우, 티올기의 황은 예컨대 OsO4, NaIO3, NaIO4, 또는 클로로퍼옥시-벤조산 또는 H2O2와 같은 과산화물에 의해 산화될 수 있다. 예를 들어, s4U는 C로 산화될 수 있으며 (Schofield et al., Nature Methods, doi:10.1038/nMeth.4582), 이는 염기페어링/혼성화 (base paring/hybridization) 거동을 U-A에서 C-G로 변경한다. Burton(상기)에 의해 제시된 바와 같이, 상기 산화는 티올 중간체를 필요로 하지 않지만, 특히 생합성 변형의 경우에 상기 티올 중간체가 바람직하다 (하기 참조). 이러한 C 유사체는 예를 들어 트리플루오로에틸화 시티딘 (예를 들어, 2,2,2-트리플루오로에틸아민의 존재 하에서 산화 생성물)이다. C 유사체는 시토신의 염기 페어링 거동 및/또는 피리미딘-2-온 고리를 보유(retain)할 수 있다. 피리미딘-2-온 고리 상의 4 위치는 예를 들어 아미노기 (C에서와 같이)에 의해 치환될 수 있거나 R이 알킬기, 방향족기, 알칸기, NH2, 트리플루오로에틸렌, MeO 등으로부터 선택되는 R-NH 기와 같은 다른 치환기를 포함할 수 있다 (Schofield et al., 특히 보충 도 1 참조; 본원에 참조로 통합됨).
바람직하게는, 변형된 핵염기, 예를 들어 티올 변형된 염기는 세포에서 생합성을 통해 또는 세포 효소에 의해 (예를 들어, 시험관 내 전사에 의해) PNA 내로 통합된다. 또한, 변형된 핵염기의 화학적 도입이 가능하다. 예를 들어 유기 또는 반합성 합성과 같은 (비-생물학적) 화학적 PNA 합성에 의해 가능하다. 생합성은 주형 PNA (보통 DNA, 특히 게놈 DNA) 및 주형 의존적 합성 (전사, 역전사)에 기초한 PNA의 합성이다. 이러한 전사에 적합한 효소는 RNA 중합효소, DNA 중합효소, 역전사 효소이다. 효소는 천연 및 변형된 뉴클레오티드 (변형된 핵염기를 포함하는)를 생합성 된 PNA 분자 내로 통합시킬 수 있다. 뉴클레오티드 모노머 유닛은 PNA를 형성할 때 연결된다. 이러한 모노머는 변형된 형태로 제공되어 PNA 내로 통합될 수 있다. 바람직하게는, 하나의 천연 뉴클레오티드 유형 (A, G, C, T/U)만이 변형되고, 즉 PNA 내로 통합되는 변형된 (비-천연) 대응물 (counterparts)을 갖는다. 또한, 모든 천연 뉴클레오티드 유형은 변형된 핵염기(들)가 상응하는 천연 (비-변형된) 핵염기보다 적은 수로 존재하는 것이 바람직하다. "상응 (Corresponding)"은 천연 핵염기를 복원하는데 필요한 최소 원자 (수소는 카운팅되지 않음) 변화를 갖는 천연 핵염기를 의미한다. 예를 들어, A, G, C, T/U는 변형된 U (또는 A, G, C, T/U로부터 선택된 임의의 다른 변형된 뉴클레오티드 유형)와 함께 제공된다.
바람직하게는 주어진 유형의 변형된 뉴클레오티드 대 비-변형(천연) 뉴클레오티드는 약 20 % 또는 그 이하, 예들 들어 15 % 또는 그 이하 또는 10 % 또는 그 이하 또는 심지어 5 % EH는 그 이하 (모든 몰 %)이다. 변형된 뉴클레오티드는 상응하는 천연 뉴클레오티드 대신에 통합될 것이지만, 이후에 본 발명의 방법에서 비정형 염기 페어링 (위에서 상세히 설명된 바와 같이 변경된 염기 페어링 거동)을 야기할 것이며, 이는 천연의 대응되는 뉴클레오티드 (natural counterpart nucleotide)보다 변형된 뉴클레오티드에 또 다른 상보적인 뉴클레오티드 염기 페어링을 야기할 것이다.
따라서 혼성화된 상보적 가닥의 서열 변화, 예를 들어 새롭게 합성된 상보 적 가닥이 나타날 것이다. 따라서, 적어도 하나의 변형된 핵염기와의 염기 페어링은 변형되지 않은 핵염기와의 염기 페어링 보다는 다른 뉴클레오티드와의 염기 페어링을 초래할 수 있고, 그렇지 않으면 상기 핵염기는 동일하다.
생합성을 통해 알킬화된 핵염기, 예를 들어, 티올 중간체를 사용하지 않는 상기에 기술된 바와 같은 알킬화된 핵염기를 PNA 내로 통합하는 것도 가능하다. 예를 들어, 알킬화 된 뉴클레오티드는 세포 내로 통합되어 PNA 합성 동안 상기 세포에 의해 사용될 수 있다. 이러한 방법은 Jao et al., Proc. Nat. Acad. Sci. USA 105 (41), 2008:15779 and Darzynkiewicz et al. Cytometry A 79A, 2011:328에 기재되어 있다. 특히, 본 발명에 따라 사용되는 효과적인 변형된 뉴클레오티드는 5-에티닐-우리딘 (5-EU)이다. 에티닐-표지된 우리딘은 세포 투과성이며 천연 유사체 우리딘 대신에 초기 (nascent) RNA 내로 통합된다.
PNA는 Cu(I)-촉매 클릭 화학 (예를 들어, Presolski et al., Current Protocols in Chemical Biology 3, 2011:153; or Hong et al. Angew. Chem. Int. Ed. 48, 2011:9879 에 기술됨)을 통해 추가로 변형되어 아지드-기능화된 분자 (azide-functionalized molecules), 예를 들어 NHS 에스테르, 말레이미드, 아지도-산, 아지도-아민을 통해 추가 기능기 (functionalized groups)를 도입하여 에티닐-기의 오로쏘 (ortho) 위치에서 케톤의 수소 결합 능력에 영향을 미친다.
다른 실시양태에서, 이러한 아지드-기능화된 분자는 세포 자체 내로 도입되어 변형된 핵염기로서 PNA 분자로 생합성될 수 있다. 생성된 아지드-기능화된 PNA는 Cu(I)-촉매된 (CuAAC) 또는 Cu(I)-없는 스트레인 (strain) 촉진 (SPAAC) 클릭 화학을 통해 검출될 수 있으며 변형되지 않은 핵염기 (C, T / U, A, G)와 비교할 때 핵염기의 수소 결합 기능을 변경하는 작용기를 도입한다.
PNA의 하나 또는 그 이상의 핵염기를 변형시키는 추가의 예는 비닐-기능화(관능화)된 핵염기, 예컨대 5-비닐-우리딘의 PNA 내로의 통합을 포함한다. 비닐기는 변형되지 않은 핵염기의 수소 결합 능력을 변경시키기 위해 추가로 변형될 수 있다 (Rieder et al. Angew. Chem. Int. Ed. 53, 2014 : 9168 참조).
특히 바람직한 실시양태에서, PNA의 하나 또는 그 이상의 핵염기를 변형시키는 것은 알릴기의 고리화를 포함하고/하거나 PNA의 핵염기의 할로겐화, 특히 요오드화 (iodination)를 포함한다. 변형된 핵염기는 바람직하게는 알릴 핵염기, 예컨대 N6-알릴아데노신 ("a6A")이며, 이는 알릴기와 관련된 고리화에 의해 추가로 변형될 수 있다. 이러한 알릴 핵염기는 PNA 합성 동안, 특히 본원의 다른 실시양태에 대해 기재된 바와 같은 세포에서, PNA에 통합될 수 있다. 할로겐화 및/또는 고리화는 Shu et al., J. Am. Chem. Soc., 2017, 139 (48): 17213-17216에 기재된 원리를 따를 수 있다. 바람직하게는 상기 방법은 세포에 N6-알릴아데노신을 통합시킨 후, 예를 들어 요오드화된 전자(former)의 알릴기, 예를 들어 예를 들어, 핵염기의 퓨린 (변형된 A 또는 G의 경우) 또는 피리미딘 (변형된 C 또는 T/U의 경우) 그룹에 질소를 갖는 알릴기의 고리화를 초래하는 원소 요오드 (I2)로 요오드화하는 단계를 포함한다. 상기 변형은 서열 분석(시퀀싱) 또는 혼성화 (하이브리드화) 동안 판독될 수있는 변경된 염기 페어링을 초래한다. 예를 들어, a6A는 A와 같이 거동하고 포유류 세포 내에서 새로 합성된 RNA에 대사적으로 통합될 수 있다. 마일드한 버퍼 조건 하에서 a6A의 N6-알릴기의 요오드화는 자발적으로 N1, N6-고리화 아데노신의 형성을 유도하고 역전사의 상보적인 DNA 합성 동안 반대 위치에서 돌연변이를 일으킨다. 추가의 바람직한 실시양태에서, PNA의 하나 이상의 핵염기 변형은 5-브로 모-우리딘 (5-BrU) 핵염기의 PNA 내로의 도입을 포함한다. 5-BrU는 호변 이성질체 (tautomer)로 존재하는 돌연변이원으로서, 이는 아데닌 또는 구아닌 (도 37a 참조)과 염기쌍을 이루는 케토- 및 에놀-폼 (form)으로 존재하며, 이는 PCR과 같은 증폭 반응에서 T>C 전환의 증가를 가져온다 (변형되지 않은 U와 비교하여). 따라서, 이것에서 및 본 발명의 일반적인 바람직한 실시양태에서, PNA의 하나 이상의 핵염기를 변형시키는 것은 호변이성의 핵염기를 도입하며, 이 호변이성체 (tautomeric forms)는 변형된 T/U 및 변형된 C의 경우에 퓨린 염기 (A 및 G)와의 염기쌍일 수 있고, 또는 변형된 A 및 G의 경우 피리미딘 염기 (T 및 C)와 염기쌍일 수 있다. 퓨린/피리미딘 염기 둘 다와의 염기 페어링은 여기서 비변형된 A, G, U/T, C의 경우 보다 동일한 (그러나 반드시 동일하지는 않은) 염기 페어링 거동을 의미한다 (비-상보적인 염기와 거의 쌍을 이루지 않음). 다시 말하면, 호변이성의 염기 (tautomeric base)는 변형되지 않은 염기 (워블 거동)보다 동일한 염기 코어 구조 의 비-상보적 염기 (퓨린 또는 피리미딘)와의 염기 페어링을 증가시켰다. 상기 증가는 표준 조건, 특히 PCR에 대한 것이다.
이러한 워블 거동은 변형된 핵염기에 상응하는 특정 위치에서 혼합된 염기의 증가된 결과에 의해 결정될 수 있다. 워블 염기 검출은 임의의 실시예에서 본 발명의 방법의 바람직한 판독 (read-out)이다 (도 5B, 24B, 37C 비교).
추가의 관련된 실시양태에서, 5-BrU 또는 임의의 다른 할로겐화된 핵염기는 아미노기에 의한 할로겐의 치환에 의해(할로겐을 아미노기로 치환함으로써) 추가로 변형될 수 있다. 예를 들어, 5-BrU는 5-아미노우리딘으로 전환시키기 위해 암모니아로 가열될 수 있다. 이러한 아미노-변형된 (amino-modified) 핵염기는 역전사 동안 염기 페어링을 변화시키고/변화시키거나 추가적인 워블 거동을 도입할 것이다.
PNA (변형된 핵염기를 갖는)는 RNA 또는 DNA를 포함하거나 이로 구성될 수 있다. 예시적인 RNA는 mRNA, 마이크로 RNA (miRNA 또는 miR), 짧은 헤어핀 RNA (shRNA), 작은 간섭 RNA (siRNA), PIWI- 상호 작용 RNA (piRNA), 리보솜 RNA (rRNA), tRNA-유도된 작은 RNA (tsRNA), 전달 RNA (tRNA), 작은 핵소체 RNA (snoRNA), 작은 핵 RNA (snRNA), 긴 논-코딩 RNA (lncRNA), 또는 이의 전구체 RNA 분자이다. DNA는 예를 들어 게놈 DNA, cDNA, 플라스미드 DNA 또는 DNA 벡터이다. PNA는 이중 또는 단일 가닥일 수 있다.
"포함하다 (Comprise)"는 개방형 용어에 관한 것이며 분자가 다른 구성 (member), 예를 들어 다른 유형의 뉴클레오티드 (LNA와 같은 인공적으로 변형된 뉴클레오티드를 포함하는 RNA 또는 DNA가 존재할 수 있음)을 함유할 수 있다. "구성되는 (Consist of)"는 필수사항이 준수된 구성을 요구하는 폐쇄형 정의로 간주된다. 즉 완전한 RNA 또는 완전한 DNA를 준수하도록 요구하는 폐쇄된 정의로 간주된다.
바람직하게는, A, G, C, U 또는 T로부터 선택된 각각의 뉴클레오티드 유형에 대해, 변형된 PNA는 변형된 뉴클레오티드보다 더 많은 천연 뉴클레오티드를 포함한다. 여기서, PNA는 본 발명에 따른 모든 변형을 갖는 최종 PNA에 관한 것이다. PNA는 바람직하게는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 또는 그 이상 및 최대 30 개의 변형된 뉴클레오티드를 포함한다. 바람직하게는, 소수의 핵염기, 예컨대 20 % 또는 그 이하, 예를 들어 PNA 분자에서 15 % 또는 그 이하 또는 10 % 이하 또는 그 이하 또는 심지어 5 % 또는 그 이하 (모든 몰 %)의 핵염기가 변형된다.
PNA 분자는 임의의 길이를 가질 수 있다. 바람직하게는 적어도 10 nt (뉴클레오티드)의 길이를 갖는다. 특히 바람직하게는 10 nt, 20 nt, 30 nt, 40 nt, 50 nt, 75 nt, 100 nt, 250 nt, 500 nt, 1000 nt, 2500 nt, 5000 nt, 10000 nt, 25000 nt, 50000 nt, 100000 nt 또는 그 이상의 길이 또는 이 값들 사이의 임의의 범위의 길이이다. 바람직한 범위는 10 내지 100000 nt 또는 50 내지 50000 nt의 길이이다.
바람직하게는 PNA는 뉴클레오티드의 특정 세포 분획, 예컨대 총 RNA 분획, mRNA 분획 또는 DNA 분획, 예컨대 플라스미드 DNA 또는 게놈 DNA로부터 유래된다. 분획은 길이, 뉴클레오티드 유형 또는 서열 (예를 들어, mRNA에서의 폴리(A)-꼬리 또는 5'- 캡)와 같은 공통 특성을 갖는 PNA를 단리함으로써 선택될 수 있다.
본 발명의 방법은 상보적 핵산에 의해 PNA를 염기 페어링하는 단계를 포함한다. 상기 염기 페어링에서, 변형된 핵염기 중 적어도 하나는 (일반적으로 PNA의 몇몇 핵염기의 염기 페어링에 의해) 염기쌍이 되어야 한다. 상보적 핵산과의 염기 페어링은 PNA를 핵산 가닥과 혼성화함으로써 촉진될 수 있다. 이는 연장 반응 (extension reaction), 예를 들어 PCR 중에도, 또는 프로브 핵산을 혼성화함으로써 발생할 수 있다. 상보적 핵산은 임의의 길이, 예를 들어 PNA에 대해 상기 개시된 길이를 가질 수 있다.
상보적 핵산의 서열은 적어도 하나의 변형된 핵염기에 상보적인 위치에서 적어도 확인된다. 서열 결정은 당업계에 공지된 임의의 일반적인 절차에 의해 수행 될 수 있다. 이러한 방법은 상보적 가닥 생성에 기초한 방법, 예를 들어 PCR에 의해, 단편 기반 시퀀싱 방법 (fragment based sequencing method)인 차세대 시퀀싱 (NGS)에서와 같이 완전히 또는 부분적으로 상보적 가닥을 생성하는 것에 기초한 방법을 포함한다.
원하는 경우, 단편 판독 값을 조합된 서열 (combined sequence)로 조립 (assemble)할 수 있다. 그러나, 본 발명의 용도를 위해, 변형된 핵염기에 대한 상보적 핵염기가 특히 그의 인접 서열 (예를 들어 +/-5 nt, +/-10 nt, +/-15 nt 또는 +/-20 nt의 이웃)로 확인되는 한, 이것은 필요하지 않다. 서열을 결정하는 추가의 방법은 프로브에 결합하는 것을 포함하며, 이로써 공지된 혼성화 프로브 서열을 통해 PNA의 서열이 상보적 서열로서 결정된다.
특히 상보적 핵산이 miRNA, shRNA, siRNA에 대한 상보적 핵산의 경우와 같이 작은 경우, 다른 옵션은 작은 핵산 서열 분석 (시퀀싱)이다. 작은 핵산은 예를 들어, 10 nt 내지 200 nt, 바람직하게는 12 nt 내지 100 nt 또는 14 nt 내지 50 nt의 길이의 범위일 수 있다. 200nt보다 긴 길이 또는 10nt보다 짧은 길이도 가능하다.
상보적 핵산의 단편은 평균적으로 그러한 길이를 가질 수 있다. 단편은 NGS에 대해 당업계에 공지된 물리적 또는 화학적 수단에 의해 생성될 수 있다. NGS 동안 수득된 것과 같은 단편을 포함하여 작은 핵산의 경우, 프라이머 또는 프로브에 대한 혼성화 서열로서 사용될 수 있는 핵산에 어댑터를 결합시키는 것이 바람직하다. 이러한 어댑터는 또한 라벨에 의해 작은 핵산을 식별하기 위해 바코드와 같은 특징적인 서열을 함유할 수 있다. 바코드는 PNA가 수득된 샘플 또는 PNA 분자의 유래 또는 이의 단편인 상보적 핵산 (단편 유래)에 대한 표지를 제공할 수 있다.
이러한 바코드는 다중 서열 분석에 유용할 수 있으며, 여기서 상이한 서열의 다수의 핵산, 예를 들어 복수의 상이한 상보적 핵산 및/또는 하나 이상의 상보적 핵산의 복수의 단편이 서열 분석된다. 이러한 복수는 예를 들어 2 내지 1000 개 또는 그 이상의 핵산일 수 있다. 반드시 어댑터를 필요로 하지 않는 다른 가능성은 프라이머 또는 프로브를 PNA에 상응하는 상보적 핵산 서열에 혼성화하는 것이다. 이러한 프라이머 또는 프로브는 공지된 서열에 혼성화되거나 무작위로, 예를 들어 랜덤(무작위) 프라이머를 사용하여 혼성화될 수 있다. 랜덤 프라이머는 본 발명의 키트와 관련하여 하기에 기술되며, 임의의 이러한 랜덤 프라이머는 본 발명의 방법에서 사용될 수 있다.
본 발명의 바람직한 실시양태에서, 단일 세포의 PNA는 본 발명에 따라 확인된다. 따라서, 세포의 PNA는 분리되고 다른 세포의 PNA와 분리되어 유지된다. "PNA 분리 유지 (Keeping PNA separate)"는 조사 중인 세포의 PNA 서열 분석 정보를 다른 세포의 서열 분석 정보와 혼합하지 않고도 조사 중인 세포의 PNA를 식별할 수있는 상태로 유지하는 것을 의미한다. 이는 PNA를 물리적으로 분리하거나 표지화함으로써, 특히 목적하는 세포 (cell of interest)를 식별하는 표지, 예를 들어 바코드에 의한 표지로 PNA 또는 상보적 핵산을 표지화함으로써 달성될 수 있다. 이를 통해 단일 세포의 PNA 대사를 분석할 수 있다. 단일 세포 분석은 단일 세포 서열 분석 방법에 의해 수행될 수 있다 (Eberwine et al. Nat. Methods. 11 (1) : 25-27). 서열 분석 (시퀀싱)에 대한 대안으로, 라이브러리에서 바람직하게는 어댑터와 함께 상보적 핵산 또는 이들의 단편을 제조하는 것이 또한 가능하다. 그런 다음 라이브러리는 독립적으로 시퀀싱되거나 다른 용도로 제공될 수 있다.
티올-특이적 알킬화와 같은 본 발명의 변형은 상보적 뉴클레오티드의 정량적 "오- (mis-)" 통합을 유발하며, 이는 전술한 바와 같이 상이한 수소 결합 패턴을 형성한다. 예를 들어, 구아노신은 예를 들어 전사 또는 역전사 동안에, 변형된 핵염기 (예를 들어 알킬화된 4-티오우리딘) 상보적 핵산 결합에 걸쳐 (across) 아데노신 대신에 통합될 수 있다. 여전히, (역) 전사 효소 - 가공성 (processivity)은 대체로 염기쌍으로된 (base paired) 뉴클레오티드가 추가의 방해없이 PNA와 함께 증폭될 수 있기 때문에 영향을 받지 않는다.
첫 번째 효소 변형 후 두 번째 변형과의 조합이 바람직하다 (예를 들어, 변형된 핵염기를 통합(도입)함으로써). 위에서 언급한 바와 같이 잘 확립되고 독성이 없는 s4U 대사성 표지화 프로토콜 (metabolic labeling protocols)과의 조합. 변형된 핵염기로 인한 상보적 핵산에서의 서열 변화를 야기하는 본 발명의 시퀀싱(서열 분석) 방법은 NGS와 같은 이용 가능한 고-처리량 (high-throughput) 서열 분석 방법에 커플링될 수 있다. PNA/상보적 핵산의 상이한 개별 분자들 사이에서 상이한, 특히 불완전하거나 부분적인, 서열 변화는 이용 가능한 계산 방법에 의해 확인될 수 있다. 예를 들어, 차세대 염기 서열 분석 데이터 세트에서 T> C 전환 (G 염기 페어링 증가를 가져오는 U 변형으로 인한)이 추적될 수 있다. 이러한 고도로 자동화된 방법은 컴퓨터화된 분석과 조합하여 본 발명이 본 발명의 바람직한 어플리케이션인 세포 내 RNA 프로세싱 카이네틱에 빠르게 접근할 수 있게 한다.
본 발명은 상보적인 염기 페어링으로 인하여 RNA 중합효소 II- 의존성 전사 산물 (아웃풋)을 정확하게 보고할 수 있다. RNA 생체내 합성 (biogenesis), 프로세싱 및 턴오버의 세포 내 카이네틱에 대한 이해는 본질적으로 생애 (life)에서 주어진 생물학적 과정에 영향을 미치는 유전자 발현 패턴의 변화에 대한 분자 기초 (molecular basis)를 밝히는데 필수적이다.
따라서, 바람직하게는, 본 발명의 방법은 세포에서 PNA의 변형 또는 쉽게 변형된 변경을 결정하는데 사용될 수 있다. 이러한 "쉽게 변형된 변경 (easily modified alterations)"은 상기 기재된 다단계 방법과 관련이 있으며, 여기서 제 1 변형 (변경으로도 지칭됨)이 세포에서 수행되고, 이후의 변형은 제 2 또는 추가 단계에서, 일반적으로 PNA의 단리 후 세포 외부에서 수행된다.
바람직하게는, 본 발명의 방법은 세포, 특히 살아있는 세포에서 수행된 적어도 제 1 변형/변경으로 RNA (PNA로서)를 변형시키는데 사용된다. 이는 발현된 RNA가 변형되기 때문에 RNA 발현 변화를 추적할 수 있게 한다.
유전자 정보의 조절된 발현은 세포 항상성을 유지하고, 변화하는 환경 조건에 반응할 수 있는 세포 유연성을 제공하며, - 조절이 잘되지 않는 경우 - 암과 같은 인간 질병에 기여한다. 이러한 필수 생물학적 과정의 기초는 전사체 특이적 방식으로 RNA 전사, 프로세싱 및 분해의 상대적 카이네틱을 제어하는 엄격하게 조절되는 분자 사건 (이벤트)이다.
mRNA 또는 마이크로RNA (microRNA)과 같은 논코딩 RNA를 포함한 수많은 RNA 종을 포함하는 세포 RNA 풀은 게놈에서 선택된 유전자좌의 전사에 의해 정의되고, 고-처리량 시퀀싱과 같은 RNA 프로파일링 기술에 의해 정성적으로 및 정량적으로 평가될 수 있다. 그러나, 정상 상태 RNA 수준의 풍도 (abundance) 측정은 전사 활성 그 자체를 정확하게 반영하지 못한다. 실제로, RNA 안정성은 임의의 주어진 RNA 분자의 상대적 풍도를 결정하는데 주요한 역할을 한다. 게놈 스케일에서 전사 및 RNA 붕괴율 (decay rates)을 측정하기 위한 접근법은 RNA 발현의 동역학 및 그 기본 조절 메카니즘에 대해 이해하는데 유용하다. 본 발명에 따르면, RNA 생체내 합성 (biogenesis) 및 턴오버의 세포 내 카이네틱을 결정할 수 있다.
RNA는 세포 자체의 대사에 의해, 예를 들어, 변경된 또는 변형된 뉴클레오티드를 자연적으로 처리된(가공된) RNA에 통합함으로써, 변경되거나 변형될 수 있다.
이러한 변경은 (단독으로 또는 추가 변형 후) 수소 결합 거동을 변화시키는 본 발명의 변형을 선택적으로 도입하는데 사용될 수 있다. 대사에 영향을 미치기 때문에, 이러한 방법은 변 된 뉴클레오티드가 서열 분석되는 경우 "대사 서열 분석 (metabolic sequencing)"으로 지칭된다. 상보적 (폴리)뉴클레오티드에 대한 시퀀싱 단계 또는 일반적으로 임의의 염기 페어링 단계는 상기 언급된 바와 같이 고-처리량 시퀀싱 방법으로 자동화되고 처리(가공)될 수 있다.
본 발명은 RNA 생체내 합성 및 턴오버의 세포 내 카이네틱을 결정하기에 적합한 고-처리량-호환가능한 대사성 표지화 프로토콜 (metabolic labelling protocol)을 제공한다. 그것은 RNA 중합효소 II-의존성 폴리아데닐화 전사 산물 (transcriptional output)을 정확하게 측정하고, 전체적 전사 후 유전자 조절 시그니처를 재현하여, 높은 시간적 분해능으로 세포에서 RNA 발현 카이네틱 (생체 내 생성 및 턴오버 포함)을 제공하는 문제를 해결한다.
세포는, 진핵 세포 및 원핵 세포, 그람 음성 및 그람 양성 세포, 진균 세포, 조류 세포, 식물 세포, 동물 세포, 포유 동물 세포, 예컨대 설치류 세포, 영장류 세포, 인간 세포, 비인간 세포, 고세균 세포, 조류 세포, 양서류 세포, 예컨대 개구리 세포, 파충류 세포, 유대류 (marsupial) 세포, 박테리아 세포와 같은 임의의 세포일 수 있다.
변형의 시간적 (temporal) 제어를 통해 변화를 모니터링 할 수 있다. 예를 들어, 변형이없는 세포 RNA 발현의 단계 (phase)는 변형이 있는 세포 RNA 발현의 단계와 비교된다. 이러한 단계 (phase)는 바람직하게는 동일한 세포 또는 세포 배양에서 비교된다.
예를 들어, 변형이 있는 단계 다음에는 변형이 없는 단계가 이어지고 그 반대도 마찬가지이다. 따라서, 본 발명에서 바람직하게는, 하나 이상의 세포는 적어도 2 개의 배양 단계에서 배양되며, 여기서 하나의 배양 단계는 수소 결합 파트너의 첨가 또는 제거에 의해 변형된 뉴클레오티드를 생합성 RNA에의 통합을 포함하고; 및 또 다른 배양 단계는 변형된 뉴클레오티드의 생합성 RNA 내로의 이러한 통합이 결여된다.
"또 다른 배양 단계 (another culturing phase)"는 변형된 뉴클레오티드를 생합성 RNA에 통합하지만 상이한, 예를 들어 다른 하나의 배양 단계에서와 같이 더 낮은 농도에서 통합한다. 다른 하나의 단계에서와 같이 상이한 또는 더 낮은 농도는 변형된 뉴클레오티드의 생합성 RNA 내로의 통합에서의 차이 (특히 상이한 농도)를 관찰하기에 충분해야 한다.
본 발명의 방법은 따라서 다음을 포함하는 다중 핵산 (PNA)을 확인하는 방법으로서 정의될 수 있다: 세포에서 PNA를 발현시키는 단계; PNA의 하나 이상의 핵염기를 변형시키는 단계; 세포로부터 PNA를 분리하는 단계; 선택적으로 (임의로) PNA를 추가로 변형시키는 단계; 여기서 단리 전 또는 후에 또는 함께 하나 이상의 핵염기의 수소 결합 파트너를 추가 또는 제거하여 하나 이상의 염기 페어링의 능력을 변경시키는 단계; 적어도 하나의 변형된 핵염기와의 염기 페어링을 포함하여, PNA에 상보적 핵산을 염기 페어링하는 단계; 적어도 하나의 변형된 핵염기와 적어도 상보적인 위치에서 상보적 핵산의 서열을 확인하는 단계. 특히 바람직한 대사성-표지화 (metabolic-labeling) (즉, RNA 중합효소와 같은 효소에 의한 것과 같은, 세포 대사에 의한 변형)은 4-티오우리딘-통합 이벤트(사건)에 의한 것이다. 이것은 U의 기본 페어링 거동을 변경하는 데 사용할 수 있다.
적어도 2 개의 배양 단계에서 상이한 수준의 PNA 변형, 특히 RNA 변형이 촉진되는 세포의 적어도 2 개의 배양 단계에서의 방법이 특히 바람직하다.
이것은 변형된 핵염기의 상이한 농도를 세포에 제공하여, 세포가 변형 된 핵염기를 상이한 수준 또는 농도로 PNA, 특히 RNA에 포함시킬 수 있게 함으로써 달성될 수 있다. 상기와 같이, 바람직하게는 변형된 핵염기는 티올 변형된 핵염기이다. 하나의 단계에서 PNA 변형 수준은 변형되지 않을 수 있다. 단계, 특히 PNA 변형이 있는 단계는 상기 PNA 변형에 대해 미리 설정된 시간 주기 (time period)를 가져야 한다. 상이한 단계들 사이의 통합을 비교함으로써, 미리 설정된 시간 주기에서의 턴오버 속도 (turnover rate)를 계산할 수 있다. 특히 바람직한 실시양태에서, 턴오버 또는 분해 속도는 다른 단계와 비교하여 적어도 하나의 단계에서 변형된 핵염기를 PNA에 통합시키는 것에 기초하여 계산된다. 바람직하게는, 상기 단계는 연속 배양 단계이다.
다른 세포의 배양 단계 사이에 추가 비교가 있을 수 있다. 이러한 비교는 이들 세포 사이의 차등 발현 및 PNA 턴오버를 추정을 허용한다. 세포 또는 세포 그룹 중 하나는 대조군일 수 있고 다른 세포 또는 다른 세포 그룹은 조사 중인 후보 세포 또는 세포 그룹일 수 있다. 세포 또는 세포 그룹 둘 다는 변형된 핵염기를 PNA 내로 통합하는 단계를 가질 수 있으며, 이는 비교된다. 바람직하게는 이러한 통합 단계는 세포에 PNA 내로의 통합을 위한 변형된 핵염기를 제공함으로써 제어된다. 바람직하게는 동일한 양의 변형된 핵염기가 세포 대사의 비교에 적합한 각 세포 또는 각 세포 그룹에 제공된다. 바람직하게는, 통합 단계에 이어 추가 통합이 없는 단계가 뒤따른다. 예를 들어 세포 또는 세포 그룹에 추가로 변형된 핵염기를 공급하는 것을 중단함으로써. 통합 단계에 이어 환원 (reduced) 통합 단계 또는 상이한 수준에서의 통합이 뒤따를 수 있다. 변형된 핵염기의 PNA 내로의 통합 수준에서의 임의의 변화에 이어 세포의 대사의 적응 (adaption)이 뒤따르고, 이는 본 발명의 방법에 의해 모니터링될 수 있다. 예를 들어, 통합 단계에 이어 통합이 낮거나 없는 단계가 뒤따르면 변형된 PNA의 분해를 모니터링할 수 있다. 통합되지 않거나 제한된 통합 단계 이후에 통합 단계 또는 제한된 통합 단계보다 높은 통합 단계가 뒤따르면 변형된 PNA의 축적(빌드-업)을 모니터링할 수 있다.
따라서, 본 발명의 방법의 하나의 용도는 적어도 2 개의 세포 또는 세포에서 적어도 2 개의 상이한 성장 단계에서 (상기 기재된 바와 같은) 적어도 하나의 변형 된 핵염기와 상보적인 위치에서 상보적 핵산의 확인된 서열을 비교하는 것이고, 여기서 상기 적어도 2 개의 세포 또는 성장 단계는 상기 적어도 2 개의 세포 또는 상기 성장 단계 사이에 차등 발현 (보통 mRNA 또는 조절 RNA 발현을 포함하는 유전자 발현)을 갖는다. 상기 차등 (유전자) 발현은 세포에서 적어도 하나의 유전자의 억제 또는 자극에 의해 야기될 수 있다. 이러한 방법은 세포 대사에서 특정 섭동 (perturbation)의 차등 발현 효과를 스크리닝하는데 사용될 수 있다.
상기 차등 발현은, 스크리닝 방법에서와 같이, 알려지지 않은 유전자 일 수 있으며, 여기서 조절 억제제 또는 활성화제 또는 표현형 효과 (phenotypical effect)를 갖는 임의의 다른 물질은 세포에서의 특정 유전적 효과에 대해 조사된다. 이 방법의 다른 실시양태에서, 표적 유전자는 공지될 수 있고 다른 유전자의 유전자 발현에 대한 추가의 2차 효과가 조사된다. 예를 들어, 공지된 유전자는 종양유전자 (oncogene) 또는 종양 억제 유전자 (tumor suppressor gene)와 같은 공지된 조절 유전자일 수 있다.
세포 또는 세포 그룹(집단)은 시험관 내 또는 생체, 예를 들어 식물, 박테리아 세포, 진균 세포, 조류 세포, 비인간 동물 또는 인간과 같은 생체 내 배양물에 존재할 수있다. 생체 내 세포의 경우, 변형된 핵염기는 유기체에 변형된 핵염기를, 예를 들어 혈관계에 전신적으로 또는 유기체의 목적하는 기관에 국소적으로, 투여함으로써 세포에 공급될 수 있다. 따라서, 생체 내 또는 특정 목적 (interest) 기관에서의 PNA의 대사를 모니터링하는 것이 가능하다. 그 다음에, PNA는 예를 들어 생검에 의해 또는 분비된 PNA의 경우에 체액 샘플로부터 또는 비인간 유기체를 희생시킴으로써 유기체로부터 단리될 수 있다. 바람직하게는 유기체로부터의 단일 세포의 PNA는 단리되고 본 발명의 방법에 따라 예를 들어 전술한 바와 같이 표지화 및/또는 라이브러리 제너레이션(generation) 및/또는 단일 세포 시퀀싱에 의해 분석될 수 있다. 배양 단계에 대한 모든 설명은 생체 내 처리(treatment)에도 적용되며 "성장 단계 (growth phase)"라고 지칭된다. "성장 단계 (Growth phases)"는 세포의 성장 또는 세포의 증식을 필요로 하지 않지만 확인되고 분석된 PNA 대사 또는 "성장"을 지칭한다.
상이한 수준의 PNA 및 PNA 턴오버의 비교는 유기체의 발달 (development) 및 질환 동안 세포가 존재하는 상이한 상태 간의 세포 대사의 차이를 밝히는데 중요하다. PNA의 전환율(turnover rate)을 측정할 수 있으면 어떤 경로가 활성이고 덜 활성인지 또는 비활성인지를 밝힐 수 있다. 이와 관련하여, 전환율은 세포 또는 조직 또는 기관에 존재하는 mRNA와 같은 PNA의 농도만을 측정하는 PNA (특히 RNA)의 정상 상태 농도 측정에 대한 추가 측정을 제공한다.
바람직하게는 2 개의 배양 단계 (culturing phases)의 생합성 PNA, 바람직하게는 RNA는 상기 세포로부터 수집되고, 또한 바람직하게는 혼합되며, 여기서 상보적 핵산을 PNA에 염기 페어링 (염기쌍화)하는 것은 전사, 예를 들어 PNA로서 RNA의 경우 역전사에 의한 상보적 다중 핵산 가닥, 바람직하게는 DNA 가닥의 생성을 포함한다.
본 발명의 특별한 이점은 변형을 통해 생성된 PNA 및 변형이 없거나 거의 없는 유사한 (comparable) PNA, 또는 각각의 상보적 핵산이 분리될 필요가 없다는 것이다. 상보적 핵산과 PNA의 염기 페어링은 변형된 PNA와 비변형된 PNA의 혼합물일 수 있다. PNA/상보적 핵산의 서열은 상보적 핵산의 서열/동일성이 (변형의 유무에 관계없이) 결정될 수 있고, 비교함으로써 변형 이벤트 (modification events)에 의해 추론될 수 있기 때문에 조합하여 결정될 수 있다. 이러한 비교는 바람직하게는 컴퓨터화된 서열 비교이다.
본 발명의 방법은 특히 바람직하게 변형되지 않은 핵염기와의 염기 페어링 이외의 다른 뉴클레오티드와의 염기 페어링을 야기하는 적어도 하나의 변형된 핵염기에 대한 염기 페어링의 실시양태에 따르면, 상보적인 다중 핵산 가닥의 서열을 결정하고 가닥 서열 (strand sequences)을 비교하는 단계를 추가로 포함하고, 수소 결합 파트너의 첨가 또는 제거에 의한 변형의 결과로서 변형된 상보적 핵산은 변형없는 상보적 핵산과 비교함으로써 확인될 수 있다. 바람직하게는 뉴클레오티드의 서열은 NGS 및 고 처리량 시퀀싱에 사용되는 것과 같은 단편으로 결정된다. 결정될 서열 (다수가 적어도 하나의 변형된 핵염기에 상보적인 위치를 유지함)은 10nt 내지 500nt, 바람직하게는 12nt 내지 250nt 또는 15nt 내지 100nt의 길이를 가질 수 있다.
적어도 하나의 변형된 핵염기에 상보적인 위치에서 적어도 상보적 핵산의 서열의 컴퓨터화된 확인은 비변형된 PNA의 서열과의 비교를 포함할 수 있다. 이러한 비교 서열은 EBI 또는 NCBI와 같은 서열 데이터베이스로부터 수득될 수 있거나, 또는 천연 염기의 천연 상보적 염기에 대한 염기 페어링에 의한 것과 같은 변형의 도입이 없이 PNA 생성에 의해 결정될 수 있다. 이러한 비교를 위한 컴퓨터 프로그램 제품 또는 상기 방법을 위한 컴퓨터 판독 가능 매체가 본 발명의 키트에 포함될 수 있다.
본 발명은 티올 변형된 핵염기 및 티올기에서 티올 변형된 핵염기를 알킬화하기에 적합한 알킬화제를 포함하는 본 발명의 방법을 수행하기에 적합한 키트를 추가로 제공하며, 여기서 알킬화제는 수소 결합 공여체 또는 수용체를 포함하며, 바람직하게는 알킬화제는 상기 언급된 임의의 것, 특히 바람직하게 아이오도아세트 아미드이다. 그러나, 임의의 상기 기재된 알킬화제, 임의의 상기 변형에 적합한 작용제, 특히 변형된 염기를 갖는 변형된 뉴클레오티드, 예컨대 티올 변형된 뉴클레오티드가 본 발명의 키트에 포함될 수 있다.
키트는 바람직하게는 프라이머, A, G, C 및 T로부터 선택된 뉴클레오티드, 역전사 효소 또는 이들의 조합, 바람직하게는 모든 이들 성분을 추가로 포함한다. 예시적인 프라이머는 무작위로 선택된 프라이머의 혼합물인 랜덤 프라이머 (무작위 프라이머)이다. 이러한 랜덤 프라이머 혼합물은 적오도 50 개 또는 적어도 100 개, 적어도 500 개의 상이한 프라이머를 가질 수 있다. 랜덤 프라이머는 랜덤 헥사머, 랜덤 펜타머, 랜덤 펜타머, 랜덤 옥타머 등을 포함할 수 있다.
키트는 PNA 폴리머라아제, 바람직하게는 폴리머라아제의 중합용 버퍼(완충제)를 추가로 포함할 수 있다. 폴리머라아제는 DNA 또는 RNA 폴리머라아제일 수 있다.
본 발명의 키트는 또한 어댑터 핵산을 포함할 수있다. 이러한 어댑터는 전술 한 바와 같이 어댑터 결합 상보적 핵산 (adaptor bound complementary nucleic acids)을 생성하기 위해 핵산에 결찰될 수있다. 어댑터는 전술한 바와 같은 하나 이상의 바코드를 포함할 수 있다. 키트는 또한 DNA 리가아제와 같은 리가아제를 포함할 수 있다.
키트의 성분은 바이알 또는 플라스크와 같은 적합한 용기에 제공될 수 있다.
키트는 또한 본 발명의 방법 중 임의의 것을 수행하기 위한 설명서 (instructions) 또는 매뉴얼을 포함할 수있다.
본 발명은 하기 도면에 의해 추가로 설명되지만, 본 발명의 이들 측면 반드시 제한되는 것은 아니다.반드시 한정되지 않고하기 도면 및 실시 예에 의해 추가로 설명된다.
도 1. RNA의 대사 서열 분석을 위한 티올 (SH)-연결된 알킬화의 개략도. 세포는 4-티오우리딘 (s4U)으로 처리되며, 이는 세포 흡수시 새로 전사된 RNA에 통합된다. 주어진 시점에서 총 RNA를 제조 할 때, 새로 생성된 RNA 종에 존재하는 s4U- 잔류물은 아이오도아세트아미드 (IAA)로 처리하여 카복시아미도메틸화되고, 염기-페어링 계면에서 부피가 큰 그룹 (bulky group)이 된다. 잘 확립된 RNA 라이브러리 제조 프로토콜과 조합될 때, s4U-삽입 부위에 부피 큰 그룹 (bulky group)의 존재는 역전사 (RT) 동안 알킬화된 s4U에 걸친(across) G의 특이적이고 정량적인 잘못된 통합(오통합)을 초래한다. s4U-함유 부위는 T에서 C 로의 전이를 호출(calling)함으로써 단일 뉴클레오티드 분해능으로 고 처리량 시퀀싱 라이브러리에서 생물 정보 학적으로 식별될 수 있다.
도 2. 티올-연결된 알킬화에 의한 4-티오우라실-유도체화. (A) 4-티오우라실 (s4U)은 티올 반응성 화합물 아이오도아세트아미드 (IAA)와 반응하여 친핵성 치환 (SN2) 반응의 결과로서 카르복시아미도메틸기를 s4U의 티올기에 부착시킨다. 석출물 (educt)의 흡수 최대 값 (4-티오우라실; s4U; λmax ≒ 335 nm) 및 생성물 (카르복시아미드도메틸화된 4-티오우라실; *s4U; λmax ≒ 297 nm)이 표시된다. (B) 지시된 농도의 아이오도아세트아미드 (IAA)의 존재 및 부재에서의 4-티오우라실 (s4U)의 흡수 스펙트럼. 1 mM s4U를 50 mM 인산 나트륨 완충액 (pH 8.0) 및 10 % DMSO의 존재 하에 37 ℃에서 1 시간 동안 지시된 농도의 IAA와 함께 인큐베이션하였다. 데이터는 적어도 3 개의 독립적 복제물 (리플리케이트, replicates)의 평균 ± SD를 나타낸다. (C) (B)에 나타낸 바와 같이 335nm에서의 흡수 정량. P-값 (독립표본 t- 검정)이 표시된다. (D) 50mM 인산 나트륨 완충액 (pH 8.0) 및 10 %의 DMSO 존재 하에 지시된 온도에서 5 분 동안 인큐베이션 후 10mM 아이오도아세트아미드 (IAA)의 부재 및 존재 하에서의 1mM 4-티오우라실 (s4U)의 흡수 스펙트럼. 데이터는 적어도 3 개의 독립적 복제물의 평균 ± SD를 나타낸다. (E) (D)에 나타낸 바와 같이 335nm에서의 흡수 정량. P-값 (독립표본 t-검정)이 표시된다. (F) 50 mM 인산 나트륨 완충액 (pH 8.0) 및 10 %의 DMSO 의 존재 하에 표시된 시간 동안 37 ℃에서 인큐베이션 후 10 mM 아이오도아세트아미드 (IAA)의 존재 및 부재 하에서의 1 mM 4-티오우라실 (s4U)의 흡수 스펙트럼. 데이터는 적어도 3 개의 독립적 복제물의 평균 ± SD를 나타낸다. (G) (F)에 나타낸 바와 같이 335nm에서 흡수 정량. P-값 (독립표본 t-검정)이 표시된다. (H) 50 mM 인산 나트륨 완충액 (pH 8.0) 및 지시된 양의 DMSO의 존재 하에 50 ℃에서 2 분 동안 인큐베이션 후 10 mM 아이오도아세트아미드 (IAA)의 부재 및 존재 하에서의 1 mM 4-티오우라실 (s4U)의 흡수 스펙트럼. 데이터는 적어도 3 개의 독립적 복제물의 평균 ± SD를 나타낸다. (I) (H)에 나타낸 바와 같이 335nm에서 흡수 정량. P-값 (독립표본 t-검정)이 표시된다. (J) 지시된 pH의 50mM 인산 나트륨 완충액 및 10 % DMSO 의 존재 하에 50 ℃에서 5 분 동안 인큐베이션 후 10mM 아이오도아세트아미드 (IAA)의 부재 및 존재 하에서의 1mM 4-티오우라실 (s4U)의 흡수 스펙트럼. 데이터는 적어도 3 개의 독립적 복제물의 평균 ± SD를 나타낸다. (K) (J)에 나타낸 바와 같이 335nm에서 흡수의 정량. P-값 (독립표본 t-검정)이 표시된다. (L) 50 mM 인산 나트륨 완충액 (pH 8.0) 및 50 %의 DMSO (최적 반응 [rxn] 조건) 존재 하에 50 ℃에서 15 분 동안 인큐베이션 후 10 mM 아이오도아세트아미드 (IAA)의 존재 및 부재 하에서의 1 mM 4-티오우라실 (s4U)의 흡수 스펙트럼. 데이터는 적어도 3 개의 독립적 복제물의 평균 ± SD를 나타낸다. (M) (J)에 나타낸 바와 같이 335nm에서 흡수의 정량. P-값 (독립표본 t-검정)이 표시된다.
도 3. 티올-연결된 알킬화에 의한 4-티오우리딘-유도체화. (A) 4-티오우리 딘 (s4U)은 티올 반응성 화합물 아이오도아세트아미드 (IAA)와 반응하여, 친핵성 치환 (SN2) 반응의 결과로서 카르복시아미도 메틸기를 s4U의 티올기에 부착시킨다.
(B) 질량 분석에 의한 s4U-알킬화의 분석. 40 nmol 4-티오우리딘을 표준 반응 완충제 (50 mM NaPO4 (pH 8), 50 % DMSO) 중 지시된 농도의 아이오도아세트아미드와 50 ℃에서 15 분 동안 인큐베이션 하였다. 1 % 아세트산으로 반응을 중지시켰다. Kinetex F5 Pentafluorophenyl 컬럼 (150 mm x 2.1 mm; 2.6 μm, 100 Å; Phenomenex)을 사용하여 100 μl/min의 유속으로 Ulitimate U300 BioRSLC HPLC 시스템 (Dionex; Thermo Fisher Scientific)에서 산성화된 샘플을 분리하였다. 뉴클레오시드는 다음의 SRM으로 전기분무 이온화 후 TSQ Quantiva 질량 분석기 (Thermo Fisher Scientific)를 사용하여 온라인 분석하였다: 4-티오우리딘 m/z 260 → 129, 알킬화 4-티오우리딘 m/z 318 → 186. 트레이스 파인더 소프트웨어 스위트 (Trace Finder software suite)(Thermo Fisher Scientific)를 사용하여 데이터를 해석하고 수동으로 검증하였다. (C) (B)에 표시된 두 개의 기술적 복제물에서 두 개의 독립적인 실험의 정량. 지시된 IAA 농도에서 분획화 알킬화된 s4U는 s4U 및 알킬화된 s4U의 피크 체류 시간에서 상대적으로 정규화된 신호 강도를 나타낸다. 데이터는 평균 ± SD를 나타낸다.
도 4. 4-티오우리딘-함유 RNA의 알킬화는 역전사 가공성에 영향을 미치지 않는다. (A) 역전사 효소-가공성에 대한 s4U-알킬화의 효과를 결정하기 위해, 우리는 5 '및 3'어댑터 서열에 의해 플랭크된 (flanked) 초파리 소형 RNA dme-let-7의 서열 내의 단일 위치 (p9)에서 4-티오우리딘 (s4U) 통합을 함유하는 합성 76nt 긴 RNA를 사용하였다. 3' 어댑터 서열에 순차적으로 역상보적인 (reverse and complement) 5' 32P-표지된 DNA 올리고뉴클레오티드의 연장에 따라, 아이오도아세트아미드 (IAA)로 처리하기 전후에 시판되는 역전사 효소를 사용하여 역전사를 분석하였다. (B) (A)에서 제조된 반응을 폴리아크릴아미드 겔 전기영동에 이어서 인광 분석 하였다. 역전사 효소 수퍼스크립트 II (SSII), 수퍼스크립트 III (SSIII) 또는 Quant-seq RT (QS)로 수행된, IAA 처리의 존재 및 부재에서의 s4U-함유 및 비-함유 RNA의 프라이머 연장 결과가 도시되어 있다. 어댑터 서열을 제외한 RNA 성분의 서열이 도시되어 있으며; s4U 잔류물의 위치는 적색으로 표시된다. 표시된 ddNTP를 역전사 반응에 첨가하여 RNA 서열 분석을 수행 하였다. PR, 5' 32P-표지된 DNA 프라이머; bg, 백그라운드 정지 시그널; *p9, 위치 9에서의 종결 신호; FL, 전장 산물. (C) (B)에 도시된 실험의 3 개의 독립적인 복제물의 정량. 선행 백그라운드 드롭 오프 시그널에 대한 정규화 후 p9에서의 드롭 오프 시그널 (+ vs - IAA 처리)의 비율이 지시된 역전사 효소를 사용하는 대조군 및 s4U-함유 RNA에 대해 결정되었다. 데이터는 평균 ± SD를 나타낸다. 독립표본 t-검정을 사용하여 통계적 분석을 수행 하였다.
도 5. 알킬화는 단일 뉴클레오티드 분해능으로 RNA에서의 s 4 U 통합의 정량적 식별을 가능하게 한다. (A) 단일 위치 (p9)에서 4-티오우리딘 (s4U) 통합이 있거나없는 RNA를 아이오도아세트아미드 (IAA)로 처리하고 전장 제품의 역전사 및 겔 추출에 적용하였고 PCR 증폭 및 고-처리량 (HTP) 시퀀싱이 이어졌다. (B) 지시된 역전사 효소를 사용하는 아이오도아세트아미드 (IAA) 처리의 존재 또는 부재 하에 대조군 RNA (왼쪽 패널) 및 s4U 함유 RNA (오른쪽 패널)의 각 위치에 대한 돌연변이율이 도시되어 있다. 막대는 3 개의 독립적인 반복 실험의 평균 돌연변이율 ± SD를 나타낸다. 각 복제물 (r1-r3)에서 시퀀스된 판독 수가 표시된다. p9에서의 뉴클레오티드 동일성 발생이 도시되어 있다. (C) 수퍼스크립트 II (SSII), 수퍼스크립트 III (SSIII) 또는 Quant-seq 역전사효소 (QS)를 사용하는 아이오도아세트아미드 (IAA) 처리의 존재 또는 부재에서의 지시된 돌연변이에 대한 돌연변이율. 돌연변이율은 s4U 함유 및 비-함유 RNA 올리고뉴클레오티드 둘 다에 대해 동일한 뉴클레오티드 동일성을 갖는 위치에 걸쳐 평균화되었다. P-값 (독립표본 t-검정으로 결정)이 표시된다. N.s., 유의하지 않음 (p> 0.05).
도 6. mES 세포 생존능 및 대사성 RNA 표지에 대한 s 4 U 처리의 효과. (A) 미처리 조건과 비교하여 12 시간 (왼쪽) 또는 24 시간 (오른쪽) 동안 지시된 농도의 4-티오우리딘 (s4U)의 존재 하에 배양된 mES 세포의 생존능이 도시되어있다. 후속 실험에 사용된 최종 농도 (100 μM)는 삼각형과 점선으로 표시된다. (B) 펄스로 표시된 시간 동안 s4U-대사성 표지 후 s4U 통합을 총 RNA로 정량화, 또는 우리딘 추적에서의 후속 배지 교체. s4U 통합은 단일 RNA에 대한 전체 RNA의 소화 (digestion) 및 탈인산화 후 HPLC 분석에 의해 결정되었다. 24 시간 펄스 표지화 시점으로 표준화된 330 nm에서의 백그라운-감산된 (Background-subtracted) s4U 신호 강도 및 260 nm에서의 우리딘 신호 강도의 흡광도가 도시되어 있다. s4U-흡착 최대 값에 대한 칼럼 체류 시간 (분)이 도시되어 있다. (C) HPLC에 의해 측정된 변형되지 않은 우리딘과 비교한 s4U의 치환 속도. mES 세포에서 s4U-대사성 펄스 및 추적 표지 실험의 모든 시점에 걸친 총 RNA에서의 s4U 통합. 값은 3 개의 독립적인 리플리케이트(복제물)의 평균 ± SD를 나타낸다. 24 시간 표지 후 최대 통합 속도가 표시된다.
도 7. Quant-seq mRNA 3' 말단 시퀀싱 라이브러리 제조 프로토콜. Quant-seq는 전체 RNA를 인풋으로 사용하므로 사전 폴리 (A) 농축 또는 rRNA 고갈이 필요하지 않다. 라이브러리 생성은 올리고 (dT) 프라이밍에 의해 개시된다. 프라이머에는 이미 일루미나(Illumina)-호환 링커 서열이 포함되어 있다 (녹색, 상단 :“어댑터”, 다음 단계 : 마지막 벤드). 첫 번째 가닥 합성 후 RNA가 제거되고 두 번째 가닥 합성은 랜덤 프라이밍 및 DNA 중합효소에 의해 개시된다. 랜덤 프라이머에는 일루미나 (Illumina) - 호환 링커 시퀀스도 포함되어 있다 (파란색으로 표시). 제 1 및 제 2 가닥 합성 사이에는 정제가 필요하지 않다. 인서트 크기는 더 짧은 판독 (SR50 또는 SR100)에 최적화되어 있다. 제 2 가닥 합성 후에 자기 (magnetic) 비드-기반 정제 단계가 이어진다. 그런 다음 라이브러리가 증폭되어 클러스터 생성에 필요한 시퀀스가 도입된다 (빨간색과 보라색으로 표시). 멀티플렉싱을 위한 PCR 증폭 단계 동안 외부 바코드 (BC)가 도입된다.
도 8. 대사성 표지 시의 mES 세포의 mRNA에서의 s 4 U 통합 이벤트. (A) 표준 mRNA 시퀀싱 (상단 3 개 패널), 캡 분석 유전자 발현 (CAGE; 중간 3 개 패널) 및 mRNA 3' 말단 시퀀싱 (하단 3 개 패널)을 사용하여 제조된 mES 세포의 총 RNA로부터 생성된 3 개의 독립적인 mRNA 라이브러리에 대한 대표적인 게놈 브라우저 스크린 샷. 유전자 트림 (Trim) 28을 암호화하는 마우스 게놈의 대표 영역이 도시되어 있다. (B) 3' 번역되지 않은 영역 (UTR)을 포함하여 Trim 28의 mRNA 3' 말단을 암호화하는 게놈 영역을 확대한다. 처리되지 않은 mES 세포 또는 24 시간 동안 s4U- 대사성 표지가 표지된 mES 세포의 총 RNA로부터 제조된 mRNA 3 '말단 시퀀싱 라이브러리의 커버리지 플롯이 나타난 이후의 변형 및 시퀀싱이 도시되어 있다. 커버리지 도표에 기초한 개별 판독의 서브 세트가 도시되어 있다. 개별 판독 값 내의 빨간색 막대는 T> C 전환을 나타낸다. 검은 막대는 T> C 이외의 다른 돌연변이를 나타낸다.
도 9. mES 세포에서 s 4 U 대사성 RNA 표지 후 mRNA 3' 말단 서열 분석에서의 돌연변이율의 전체적 분석. 24 시간 동안 s4U 대사성 표지 전후에 mES 세포의 총 RNA로부터 생성된 mRNA 3 '말단 시퀀싱 라이브러리를 주석이 달린 (annotated) 3'비번역 영역 (UTR)에 맵핑하고, 임의의 주어진 돌연변이율이 모든 발현된 유전자에 대해 결정되었다. Tukey boxplots는 UTR 당 돌연변이를 백분율로 보여준다. 극단치 (outliers)는 표시되지 않는다. 각 개별 돌연변이에 대한 중앙값(median)의 평균 관찰 빈도가 표시된다. T> C 전환 증가의 통계적 분석은 Mann-Whitney 테스트에 의해 결정되었다.
도 10. mES 세포에서 폴리아데닐화된 전사 산물(아웃풋) 결정. (A) 본 발명에 의해 mES 세포에서 폴리아데닐화된 mRNA의 전사 산물을 결정하기 위한 실험 설정. (B) (A)에 기술된 3'말단 시퀀싱에 의해 검출된, 백만 단위(in counts per million (cpm)의 전사체( "정상 상태 (Steady-state)")를 포함하는 비-T> C 전환 및 전사체 ("SLAM-seq")를 포함하는 T> C 전환의 상대적 풍도 (abundance). 정상 상태에 비해 SLAM-seq로 과도하게 표현된 전사체는 적색으로 표시된다 (높은 전사 산물; n = 828). 정상 상태에서 가장 풍부한 전사체는 노란색으로 표시된다 (높은 정상 상태 발현; n = 825). mES 세포 특이적 1 차 - miRNA 클러스터 miR-290 및 miR-182에 상응하는 전사체가 도시되어 있다. (C) 예측된 기본 전사 인자 (독창적 경로 분석 사용; www.Ingenuity.com) 및 분자 경로 (Enrichr의 사용)의 관점에서, 새롭게 전사된 RNA (SLAM-seq) 중에서 기존의 mRNA 3' 말단 시퀀싱 (Steady-state)에 의해 정상 상태에서 검출된 상위 825 개의 유전자로 과도하게 표현된 828 개의 유전자의 비교.
도 11. mES 세포에서의 mRNA 안정성의 전체적 분석. (A) 본 발명에 의해 mES 세포에서 폴리아데닐화된 mRNA의 안정성을 결정하기 위한 실험 설정. (B) mES 세포에서 mRNA 반감기의 전체적(global) 분석. mES 세포에서 9430 개의 풍부하게 발현된 유전자의 주석이 달린 (annotated) 3' UTR에 대한 판독 맵핑을 포함하는 T> C 전환의 상대 분율은 24 시간 펄스 표지화 시점으로 정규화되었고 시간에 따른 중간, 위 및 아래 사분위수는 4.0 h의 중앙값(median)의 mRNA 반감기 (~t1/2)를 나타내는 단일 지수 붕괴 카이네틱을 사용하여 피팅하였다. (C) 개별 예시 전사물의 반감기 계산. Junb, Id1, Eif5a 및 Ndufa7에 대한 3 개의 독립적인 복제물의 24 시간 펄스 시점에 대한 판독(read)을 포함하는 T> C 전환의 평균 분율이 도시되어 있으며 단일 지수 붕괴 카이네틱에 적합하다. 곡선 피팅에 의해 결정된 각 전사물의 평균 반감기 (t1/2)가 표시된다. (D) 관련 GO-텀즈 (GO-terms) 에 따라 조절 (예 : 전사 조절, 신호 전달, 세포주기 및 발달) 또는 하우스-키핑 (즉, 세포 외 매트릭스, 대사 프로세스 및 단백질 합성)으로 분류된 전사체에 대한 mRNA 3' 말단 시퀀싱에 의해 결정된 mRNA 반감기의 투키(Tukey) 박스플롯 표현. 각 카테고리의 전사체의 수가 표시된다. P-값 (맨-휘트니 (Mann-Whitney) 검정에 의해 결정)이 표시된다.
도 12. 작은 RNA의 대사성 표지화를 위한 티올-연결 알킬화. (A) 초파리 S2 세포의 크기-선택된 (size-selected) 총 RNA로부터 생성된 작은 RNA 라이브러리에 대한 대표적인 게놈 브라우저 스크린 샷. miR-184를 코딩하는 황색 초파리 게놈의 대표적인 영역이 도시되어 있다. 티민 (T, 적색)을 코딩하는 뉴클레오티드 위치는 각각의 작은 RNA 종의 5 '말단에 대해 지시된다. miR-184-3p 및 -5p에 대해 모든 5' 이소폼의 99 %를 나타내는 판독(read)이 표시되며 각각의 판독 수는 백만 분의 일 (parts per million, ppm)로 표시된다. (B) 24 시간 동안의 s4U 대사성 표지 전후에 초파리 S2 세포의 총 RNA로부터 생성된 작은 RNA 시퀀싱 라이브러리는 주석이 달린 miRNA에 매핑되었고, 임의의 주어진 돌연변이율은 풍부하게 발현된 miRNA (> 100 ppm)에 대해 결정되었다. 투키 (Tukey) 박스플롯 (boxplots)은 miRNA 당 돌연변이를 백분율로 나타낸다. 극단치는 표시되지 않는다. 각각의 개별 돌연변이에 대한 중앙값(median)의 관찰 빈도가 지시된다. Man-Whitney 테스트에 의해 결정된 P-값이 표시되어 있다.
도 13. 마이크로RNA 생체 내 합성 (biogenesis)의 세포 내 카이네틱. (A) 마이크로RNA는 ~ 22nt 마이크로RNA 이중체 (duplex)를 생성하는 세포질의 핵 및 다이서 (Dicer)에 있는 RNase III 효소 드로샤 (Drosha)에 의한 순차적 프로세싱를 통해 헤어핀-함유 RNA 중합 효소 II 전사체 (1 차 마이크로 RNA, 예비(pri)-miRNA)로부터 유래된다. 헤어핀-처리 중간체 (전구체-마이크로RNA, 예비-miRNA)는 RanGTP-의존적 방식으로 Ranbp21에 의해 핵에서 세포질로 내보내진다. (B) 누적 분포도는 지시된 시간 동안 s4U로 처리된 초파리 ago2 ko (Drosophila ago2 ko) S2 세포의 총 RNA로부터 생성된 작은 RNA 라이브러리에서 42 개의 풍부하게 발현된 miRNA (왼쪽) 또는 20 miR*s (오른쪽)에 대한 중앙값(median) T> C 돌연변이율을 보여준다. P-값은 콜모고로프-스미르노프 (Kolmogorov-Smirnov) 검정 (**** = p <10-4)에 의해 결정되었다. Bgmax는 최대 배경 오류율을 나타낸다. (C) 표시된 miRNA (왼쪽) 또는 miR*s (오른쪽)의 평균 풍도 (abundance)는 s4U에 의한 대사성 표지 후 지시된 시점에서 판독을 포함하는 정상 상태 또는 T> C 전환에서 보여진다. 총 작은 RNA로 정규화된 판독 횟수는 백만 분의 일 (parts per million, ppm)로 표시된다. 최대 백그라운드 (Bgmax)를 초과하는 과잉의 돌연변이율 (Mu)가 표시된다. (D) 미트론 (mirtron) 헤어핀은 단백질 코딩 전사체의 스플라이싱을 통해 생성된다. 인트론 라리아트 (lariat) 디브랜칭 (debranching) 미트론 헤어핀은 세포질에서 전사 후 우릴화되고, 이는 예비(pri)-미트론의 2nt-3' 돌출부를 조절하여 다이서 (Dicer)에 의한 miRNA 생합성을 방지한다. (E) s4U- 표지화 실험의 지시된 시점에서 표준 miRNA (회색) 또는 미트론 (적색)에 대한 백만 분의 일 (ppm)의 T> C 돌연변이율 (상단) 또는 작은 RNA-정규화된 T> C 판독 값. 중간값과 사분위-간 범위가 표시된다. P-값 (맨-휘트니 (Mann-Whitney) 검정)은 (*, p <0.05; **, p <0.01; ***, p <0.001)로 표시된다. N.d, 감지되지 않음.
도 14. 마이크로 RNA 로딩의 세포 내 카이네틱. (A) 생산 시, 마이크로 RNA 이중체(듀플렉스)는 아르고너트 (Argonaute) 단백질 Ago1에 로딩된다. 이 과정에서 두 가닥 중 하나인 miR 가닥이 Ago1에 선택적으로 유지되는 반면 다른 하나인 miR* 가닥은 방출 및 분해된다. Ago1에 결합된 단일 가닥 miRNA는 성숙 miRNA-유도 침묵 복합체 (miRISC)를 형성한다. (B) ago2 ko S2 세포에서의 s4U 대사성 표지화 실험 과정에서 20 개의 풍부하게 발현된 miR 및 miR* 쌍의 T> C 전환 함유 판독 값 (ppm)의 중앙값 누적 (median accumulation). miR (빨간색) 및 miR* (파란색)의 중앙값과 사분위수 범위가 표시된다. 값은 두 개의 독립적인 측정에서 파생된다. P-값은 맨 ㅇ휘트니 검정에 의해 결정된 miR 및 miR*의 유의한 분리를 나타낸다 (*, p <0.05; ****, p <0.0001). (C) miR (빨간색, 위쪽) 및 miR* (파란색, 아래쪽)의 (B)에 표시된 시간 경과 (time course)의 확대.
도 15. 엑소핵산분해성 (exonucleolytic) miRNA 트리밍의 세포 내 카이네틱. (A) 초파리에서 엑소핵산분해성 (exonucleolytic) miRNA 성숙에 대한 모델이다. 마이크로 RNA 세트 (예 : miR-34)는 Acer1에 로딩하고 miR* 가닥을 제거할 때 성숙 유전자 조절 miRNA 유도 침묵 복합체를 형성하는 3'-에서-5' 엑소리보뉴클레아제 니블러 (Nibbler)에 의해 매개되는 엑소핵산분해성 (exonucleolytic) 성숙을 겪는 더 긴 ~ 24nt miRNA 이중체(듀플렉스)로서 다이서(Dicer)에 의해 생성된다. (B) 작은 RNA의 고-처리량 시퀀싱 또는 노던-혼성화 실험 (오른쪽)에 의해 결정된 초파리 아고2ko (Drosophila ago2ko) S2 세포에서의 miR-34-5p의 정상 상태 길이 분포 (작은 막대는 18 개에 대한 측정 값의 평균 ± 표준 편차를 나타내며; 평균 클로닝 수는 백만 분의 일, ppm 단위로 표시된다.) (C) 지시된 시간 동안 s4U 대사성 표지가 표지된 초파리 아고2ko (Drosophila ago2 ko) S2 세포로부터 제조된 라이브러리에서의 miR-34-5p의 길이 분포. T> C 전환 포함 판독 값 (레이블, 빨간색, 상단) 및 모든 판독 값 (정상 상태, 검은 색, 하단)의 길이 분포가 표시된다. 기본 판독 수가 표시된다. 데이터는 2 개의 독립적 반복 실험의 평균 ± 표준 편차를 보여준다. (D) 지시된 시간 동안 s4U 대사성 표지가 표지된 초파리 아고2ko (Drosophila ago2ko) S2 세포로부터 제조된 라이브러리에서 miR-34-5p의 가중 평균 길이. 데이터는 T> C 전환 포함 판독 값 (레이블, 빨간색) 및 모든 판독 값 (정상 상태, 검은 색)의 평균 ± 표준 편차를 나타낸다. T> C 전환-함유 판독의 가중 평균 길이의 감소는 엑소핵산용해 (exonucleolytic) 트리밍 (회색 영역으로 강조됨)을 나타낸다. (E) 초파리 S2 세포의 s4U 대사성 표지화 후 miR-34-5p (miR-가닥, 빨강) 및 miR-34-3p (miR* 가닥, 파랑)에서의 판독 값을 포함하는 T> C 전환의 상대적 존재비에 의해 결정된 miR-34-5p의 로딩. 두 개의 독립적인 실험의 평균 ± 표준 편차가 표시된다. 로딩은 miR*로부터 miR의 분리 및 강조된 회색 영역으로 표시된다.
도 16. miRNA의 차등 안정성. (A) 예비(pre)-miRISC를 형성하는 Ago1에 마이크로 RNA 이중체를 로딩할 때, miR* 가닥 (파란색)이 분해되어 성숙한 miRNA-유도 침묵 복합체 (miRISC)를 생성한다. miRISC에서의 miRNA의 정확한 안정성은 불분명하게 남아있다. (B) 초파리 ago2ko S2 세포에서 s4U 대사성 표지화 시간 경과에 걸쳐 41 개의 풍부하게 발현된 miRNA (적색, 좌측) 및 20 개의 miR* (청색, 우측)에 대한 T- 위치 당 돌연변이율의 증가. 각각의 작은 RNA에 대해, 모든 T-위치에 걸친 중간 값(median) 돌연변이율을 결정하고 24 시간 시점으로 정규화하였다. 중앙값과 사분위수 범위가 표시된다. 값은 두 개의 독립 반복 실험의 평균을 나타낸다. 중앙값 반감기 (t1/2) 및 95 % 신뢰 구간은 단일 지수 곡선 피팅에 의해 결정되었다. (C) 41 개의 miR (적색) 및 20 개의 miR* (청색)의 반감기를 나타내는 투키 (Tukey) 박스플롯. P-값은 맨-휘트니 (Mann-Whitney) 검정에 의해 결정되었다. (D) 지시된 miR (적색) 및 miR* (청색)의 정상 상태 풍도 및 평균 반감기. 평균 반감기는 2 개의 독립 반복 실험의 평균을 나타낸다. 두 개의 독립적인 실험 (r1 및 r2)에 대한 개별 반감기 측정 값이 보고된다. 측정의 총 시간을 초과한 반감기 데이터는 > 24h로 표시된다. (E) 41 개의 miR (적색) 및 20 개의 miR*(청색) 가닥에 대해 2 개의 독립적인 생물학적 복제물(복제)에서 결정된 반감기 값의 비교. 피어슨의 상관 계수 (rP) 및 관련 p-값이 표시된다. (F) 마이크로 RNA 안정성은 miRNA의 정상 상태 풍도에 차등적으로 기여한다. 40 개의 miR의 반감기 값은 정상 상태 풍도와 관련하여 표시된다. 데이터는 두 개의 독립적인 생물학적 복제물의 평균을 나타낸다.
도 17. 아르고너트(Argonaute) 단백질 동일성은 작은 RNA 안정성을 결정한다. (A) 초파리에서, miRNA는 우선적으로 Ago1에 로딩되어 miRISC를 형성한다. 동시에, miR*의 서브세트가 Ago2로 로드되어 siRISC를 형성한다. siRISC 형성은 3' 말단 리보오스의 2' 위치에서 Ago2-결합된 작은 RNA의 특이적 메틸화를 동반한다. 아르고너트 단백질 동일성이 작은 RNA 안정성에 차등적으로 영향을 미치는 지에 대하여 알려져 있지 않다. (B) 파이 차트는 야생형 초파리 S2 세포로부터의 작은 RNA 라이브러리에서 상이한 엔도-siRNA 클래스 및 miRNA의 상대적 풍도를 나타낸다. 표준 클로닝 프로토콜 (비산화, 상단 다이어그램) 및 변형된 3' 말단이 있는 작은 RNA를 풍부하게 하는 클로닝 전략 (산화, 하단 다이어그램)의 결과가 표시된다. miR 및 miR*의 비율은 두 라이브러리 모두에 대해 표시된다. 7 개 데이터 세트의 평균 분포가 표시된다. 평균 라이브러리 뎁스(depth)가 표시된다. (C) 히트 맵 (heat maps)은 표시된 라이브러리 (회색조)에서 miR (적색) 및 miR* (청색)의 상대적 존재비를 보여준다. 라이브러리에서 상대 표현의 비율은 작은 RNA와 AGO1 (녹색) 또는 AGO2 (적색)의 우선적 연관성을 나타낸다. (D) CRISPR/Cas9 게놈 공학 (ago2ko)에 의한 야생형 (wt) S2 세포 또는 Ago2가 고갈된 S2 세포의 웨스턴 블롯 분석. 액틴은 로딩 제어를 나타낸다. (E) 야생형 (wt) 및 ago2ko 초파리 S2 세포에서 Ago2-풍부 miR 및 miR*의 상대적 풍도. 중앙값과 사분위수 범위가 표시된다. P-값은 윌콕슨 부호순위 검증 (Wilcoxon matched-pairs signed rank test)에 의해 결정되었다. (F) 야생형 (wt, 검은 색) 또는 ago2ko S2 세포 (빨간색)의 s4U 대사성 표지화 타임코스로부터 준비된 표준 라이브러리로부터 또는 3' 말단 (wt 산화, 청색blue)을 갖는 작은 RNA를 풍부하게 하는 클로닝 전략을 이용하는 야생형 S2 세포로부터 제조된 Ago2-(왼쪽) 및 Ago1-풍부 작은 RNA (오른쪽)의 붕고 카이네틱. 2 단계 (two-phase) 또는 1 단계 (one-phase) 지수 핏(메인 텍스트에서 특정된)의 중간값 및 사분위 범위가 표시된다. 곡선-피팅에 의해 결정된 반감기 (t1/2)가 표시된다. 2 단계 카이네틱의 경우, 고속 및 저속 카이네틱의 상대적 기여가 표시된다. (G) ago2ko S2 세포에서 30 개의 가장 풍부한 miRNA (빨간색, Ago1) 또는 변형된 3' 말단을 갖는 작은 RAN를 풍부하게 하는 클로닝 전략을 사용하는 작은 RNA 라이브러리에서 가장 풍부한 miR 및 miR* (청색, Ago2)의 반감기. 중앙값과 사분위수 범위가 표시된다. P-값은 Mann-Whitney 검정에 의해 결정되었다.
도 18. 초파리 S2 세포에서의 4-티오우리딘 대사성 표지화. 초파리 S2 세포의 펄스 표지화(라벨링) 실험에서 지시된 시간 동안 s4U 대사성 표지화 후 총 RNA 로의 s4U 통합의 정량화. HPLC에 의해 결정된 비변형 우리딘과 비교한 s4U의 치환 속도가 도시되고 전술한 바와 같이 결정되었다 (Spitzer et al. (2014) Meth Enzymol 539, 113-161.). 값은 3 개의 독립적인 반복 실험의 평균 ± SD를 나타낸다. 24 시간 표지 후 최대 통합 속도가 표시된다.
도 19. 아이오도아세트아미드 처리는 작은 RNA 라이브러리의 품질에 영향을 미치지 않는다. 아이오도아세트아미드로 처리하기 전후의 초라피 S2 세포의 총 RNA로부터 생성된 작은 RNA 시퀀싱 라이브러리를 주석이 달린 miRNA에 맵핑하고 풍부하게 발현 된 miRNA (> 100 ppm)를 분석하였다. (A) 아이오도아세트아미드-처리된 또는 처리되지 않은 총 RNA의 작은 RNA 라이브러리로부터 각각의 miRNA에 대해 임의의 주어진 돌연변이율을 측정하였다. Tukey 박스플롯은 miRNA 당 돌연변이를 백분율로 나타낸다. 극단치는 표시되지 않는다. 각각의 개별 돌연변이에 대한 중간값 관찰 빈도가 표시된다. (B) 아이오도아세트아미드 처리되거나 처리되지 않은 총 RNA로부터 제조된 작은 RNA 라이브러리에서의 miRNA의 풍도. 피어슨 상관 계수 및 관련 p-값이 표시된다. (C) 아이오도아세트아미드-처리된 또는 처리되지 않은 총 RNA로부터 제조된작은 RNA 라이브러리에서 개별 miRNA에 대한 발현의 배수-변화 (fold-change).
도 20. 대사성 표지된 작은 RNA에서 s 4 U 통합의 빈도. 투키 (Tukey) 박스플롯은 24 시간 동안 s4U 대사성 표지가 표지된 초파리의 크기 선택된 (size selected) 총 RNA로부터 제조된 작은 RNA 라이브러리에서 71 개의 풍부하게 발현된 (> 100 ppm) miRNA 각각에 대해 1, 2 또는 3 개의 T> C 돌연변이를 포함하는 T> C 전환(전환) 판독의 분율을 보여준다. T> C 전환 판독의 중앙값 분율이 표시된다.
도 21. s 4 U-대사성 표지는 마이크로 RNA 생체 내 합성 (biogenesis) 또는 로딩에 영향을 미치지 않는다. 마이크로 RNA 전구체의 5p- 또는 3p 아암 (arm)에서 파생되거나 (왼쪽) 선택적 아르고너트-로딩에 의해 정의된 miR 또는 miR* 가닥을 구성하는 (오른쪽) 주어진 작은 RNA의 개별 위치에서의 T> C 전환의 과도 (Over-) 또는 과소표현 (underrepresentation). 결과는 71 개의 풍부하게 발현된 (> 100 ppm) 마이크로 RNA (35 5p- 및 36 3p-miRNA, 또는 44 개의 miR 및 27 개의 miR*에 해당)로부터 유도된다. 상대적인 표현에서 통계적으로 유의미한 차이는 맨-휘트니 (Mann-Whitney) 검정에 의해 표시된 위치에 대하여 전체 모집단과 비교되었다. n.s., p> 0.05; 제한된 데이터 포인트로 인해 결정되지 않았음.
도 22. 전구체-miRNA 테일링 (tailing)은 효율적인 miRNA 생체 내 합성 (biogenesis)을 방해한다. 지시된 시간 동안 s4U로 처리한 후 ago2ko S2 세포로부터 제조된 SLAM-seq 작은 RNA 라이브러리에서 예비(pre)-miRNA 우리딘화(uridylation)와 T> C 돌연변이율의 상관 관계. 피어슨의 상관 계수 (rP) 및 관련 p-값이 표시된다.
도 23. 아이오도아세트아미드로 6-티오구아노신 (s 6 G)의 화학적 변형. 6-티오구아노신과 아이오도아세트아미드 (A)의 화학 반응 및 6-티오구아노신을 아이오도아세트아미드 (B)로 처리할 때 질량 분석법에 의해 결정된 알킬화 효율이 도시되어 있다.
도 24. 알킬화는 G에서 A 로의 전환에 의한 단일 뉴클레오티드 분해능에서 RNA로의 s 6 G 통합을 확인한다. (A) 단일 위치 (p8)에서 6-티오구아노신 (s6G) 의 통합이 있거나 없는 RNA가 아이오도아세트아미드 (IAA)로 처리되고 전장 산물 (product)의 역전사 및 겔 추출 후 PCR 증폭 및 고 처리량 (HTP) 시퀀싱이 이어진다. (B) 지시된 역전사 효소를 사용하는 아이오도아세트아미드 (IAA) 처리의 존재 또는 부재 하에 대조군 RNA (좌측 패널) 및 s6G-함유 RNA (우측 패널)의 각 위치에 대한 돌연변이율이 도시되어 있다. 값은 3 개의 독립적 복제물 (복제)의 평균 돌연변이율 ± SD를 나타낸다. 각 복제물 (r1-r3)에서 시퀀스된 판독 수가 표시된다. p8에서 뉴클레오티드 동일성 발생이 도시되어 있다. (C) 수퍼스크립트 (Superscript) II (SSII), 수퍼스크립터Superscript III (SSIII) 또는 Quant-seq 역전사 효소 (QS)를 사용하는 아이오도아세트아미드 (IAA) 처리의 존재 또는 부재에서 표시된 돌연변이에 대한 돌연변이율. 돌연변이율은 s6G- 함유 및 비-함유 RNA 올리고뉴클레오티드 둘 다에 대해 동일한 뉴클레오티드 동일성을 갖는 위치에 걸쳐 (across) 평균화되었다. P-값 (독립표본 t-검정으로 결정)이 표시된다. N.s.,유의하지 않음 (p> 0.05).
도 25. SLAM-seq를 이용한 전사 반응의 시간-분해 맵핑 (time-resolved mapping). (A) K562 세포에서 15 내지 60 분(15 내지 60')의 플라보피리돌 처리 (300nM) 후 SLAM-seq 실험 맵핑 반응의 샘플 워크 플로우. (B) 플라보피리돌 처리가 있거나 없는 저(low)-턴오버 유전자, GAPDH에 대한 총 및 전환된 (≥2 T> C) 판독 수의 맵핑. (C) 모든 판독 또는 ≥1 및 ≥2 T> C 전환을 갖는 판독을 고려한 플라보피리돌-유도 발현 변화의 박스 플롯. 휘스커 (Whisker)는 5 ~ 95 % 범위를 나타낸다. (D) BCR/ABL 이펙터 경로 및 키나아제 억제제의 단순화된 개략도는 K562 세포에서 SLAM-seq를 사용하여 조사하였다 (30' 전처리, 60' s4U 표지화). (E) SLAM-seq에서 50 개의 가장 가변적인 상향 및 하향 조절된 유전자의 히트맵 및 계층적 클러스터링 및 지시된 억제제로 처리된 K562 세포에서 총 mRNA 수준에서의 그들의 거동. (F) (D)에서 적어도 하나의 억제제에 의해 총 mRNA 또는 SLAM-seq에서 ≥ 2-배 탈조절된 것으로 검출된 유전자의 예상(추정된) 반감기. (G) (D)에 기술된 바와 같이 지시된 억제제로 처리된 K562로부터의 SLAM-seq 판독치의 주요 성분 분석. (p> 0.05).
도 26. BETi 과민증은 BRD4에 의한 전체 전사 조절과 다르다. (A) AID-BRD4 녹-인 대립 유전자 및 Tir1 전달 벡터 SOP의 개략도. (B) SOP로 형질 도입되고 옥신 (100μM IAA)으로 처리된 K562AID-BRD4 세포에서 BRD4의 면역블롯팅. (C) 60’동안 s4U 표지 전에 30’동안 옥신으로 처리된 K562AID-BRD4 세포의 SLAM-seq 반응. (D) 60’동안 s4Us4U 표지 전에 30’동안 JQ1 (200nM)으로 처리된 K562 세포의 SLAM-seq 반응. (E) (C)에 도시된 K562 세포 및 동일하게 처리된 MV4-11 세포에서 JQ1에 대한 SLAM-seq의 반응의 비교. R, 피어슨 상관 계수. (F) K562, MOLM-13 및 MV4-11 세포에서 유전자 필수성 (essentiality) (14, 15)을 나타내는 평균 SLAM-seq 반응 및 평균 CRISPR 점수의 비교. 모든 3 개의 세포주에서 유의미한 하향 조절 된 모든 유전자가 제시되어있다 (FDR ≤ 0.1). (G) (C)에서 수행된 바와 같이 JQ1 또는 CDK9 억제제 NVP-2로 처리된 MOLM-13 세포로부터의 s4U 표지된 SLAM-seq 판독치의 주요 성분 분석. (H) 지시된 세포주에서 JQ1에 대한 SLAM-seq 반응과 CDK9 억제에 대한 Spearman의 순위 상관 관계의 히트맵 및 계층적 군집화.
도 27. 크로마틴 컨텍스트 (context)는 BETi 과민증을 결정한다. (A) K562 세포에서 지시된 예측 인자에 의해 설정된 발현 매칭 대조군으로부터 BETi 과민감성 유전자의 구별을 위한 ROC 곡선. (B) BE562 과민성 유전자 및 K562 세포에서 공개된 수퍼 인핸서 표적의 중첩을 나타내는 벤-다이어그램. (C) (B)에서 카테고리를 예시하는 선택된 유전자에 대한 H3K27ac ChIP-seq 및 수퍼 인핸서 주석의 샘플 트랙. (D) TSS로부터 500bp 또는 2000bp 내의 214 개의 크로마틴 시그니처에 기초한 BETi 과민감성 유전자를 분류하기 위한 단순화된 모델 생성 워크 플로우. (E) 헬드-아웃 테스트( held-out test) 세트에서 평가된 BETi 과민증의 2 개의 독립적인 염색질 시그니처 기반 모델에 대한 (A)와 같은 ROC 곡선. (F) 정규화된 모델 계수를 기반으로 (E)에 표시된 GLM에 대한 가장 강한 포지티브 및 네거티브 예측 변수 5 개의 상대적 기여도. (G) 125 BETi 과민성 유전자의 TSS에서 (F)에서의 예측 인자의 상대적인 ChIP-seq 밀도의 히트맵 및 계층적 군집화.
도 28. MYC는 모든 암 유형에서 세포성 대사의 선택적 직접 활성화제이다. (A) MYC-AID 대립 유전자 및 Tir1 벡터의 개략도. (B) 지시된 시간 동안 옥신 처리 후 K562MYC-AID 세포에서의 MYC 면역블롯팅. (C) K562MYC-AID 세포에서의 MYC 분해 후의 SLAM-seq 프로파일 (30' 옥신 전처리, 60' s4U 표지). (D) 모든 mRNA 및 현저하게 농축된 유전자 세트의 SLAM-seq 반응. (E) (B)에서와 같이 HCT116MYC-AID 세포에서의 MYC 면역블롯팅. (F) K562MYC-AID 및 HCT116MYC-AID 세포에서 SLAM-seq 반응의 비교. (G) 발현-매칭된 컨트롤(대조군) 세트로부터 (C) (FDR≤0.1, log2FC≤-1)에서의 MYC-의존적 유전자를 구별하는 상이한 예측 인자의 ROC 곡선. MYC/MAX ChIP, TSS로부터 2kbp 내의 ChIP-seq 신호에 의해 순위가 정해진 유전자; GLM, 214 개의 염색질 프로파일을 기반으로 하는 엘라스틱-넷 GLM. (H) (G)에서 GLM에 대한 가장 강한 포지티브 및 네거티브 예측 변수의 상대적 기여. (I) 672 개의 암 세포주에서 MYC 및 SLAM-seq-기반 MYC-표적 시그니처의 발현. MYC 또는 MYCL 수준이 MYC 수준을 초과하는 샘플은 강조 표시된다. (J, K) MYC 발현이 높거나 낮은 (I) 또는 AML 환자의 세포주에서 MYC-표적 시그니터의 GSEA. (L) 높거나 낮은 MYC 발현 및 암 유형에 기초하여 분리된 5583 명의 환자 샘플에 대한 MYC-표적 시그니처 발현. ****, p <0.0001 (윌콕슨 순위 합계 검정).
도 29. 차등적 유전자 발현을 맵핑하기 위한 SLAM-seq의 실험 설정. (A) BETi 처리 및 MYC 표적 유전자의 간접 억제에 의해 예시되는 상이한 교체율 turnover rate)을 갖는 유전자에 대한 mRNA 수준에 대한 표적화된 섭동 (perturbation) 및 이의 일차 및 이차 효과의 개략도. (B) 아이오도아세트아미드에 의한 mRNA의 4-티오우리딘 잔기의 알킬화. (C) 60' 표지화 시간을 갖는 SLAM-seq 실험에서 ≥ 1 또는 2 T> C 전환으로 판독에 대한 백그라운드 오류율의 기여. s4U 처리된 세포 및 처리되지 않은 세포로부터의 mRNA의 병렬 알킬화 및 서열 분석에 의해 백그라운드 시그널을 측정하였다. 박스플롯은 s4U 처리된 라이브러리에서 표지 된 판독의 분율 (fraction)로부터 추정된 높은 (상위 10 %) 중간 (45-55 %) 및 낮은 (하위 10 %) mRNA 턴오버를 갖는 유전자에 대한 오류율을 보여준다. 휘스커(Whiskers)는 5 ~ 95 % 범위를 나타낸다. (D) 판독 당 T-함량 (content)의 함수로서 SLAM-seq에 의해 새로 합성된 mRNA의 회수. 추정치는 새로 합성된 mRNA에서 T 당 11.4 %의 표지 효율에 기초한다. 상단 히스토그램은 다양한 판독 길이 (read lengths)에 대해 3'UTR 판독의 T-함량을 보여준다. (E) 도 25E에 도시된 SLAM-seq 샘플에 대해 지시된 키나아제 억제제로 처리된 K562 세포에서 MAPK 및 AKT 경로 억제의 검증.
도 30. 골수성 백혈병 세포주에서 직접적인 JQ1 반응. (A)도 26D에서 JQ1로 처리된 K562 세포에 대한 SLAM-seq에 의해 측정된 전체 유전자 발현 변화를 요약한 박스플롯. (B, C) 세포주 MOLM-13 및 MV4-11에 대해 도 2d에서와 같이 SLAM-seq에 의해 맵핑 된 JQ1 처리에 대한 1 차 반응. (D) (A)에서와 같이 MOLM-13 및 MV4-11 세포에 대한 JQ1 처리 시 전체 유전자 발현 변화의 요약. (E, F) 지시된 세포주에 대한 JQ1 처리 시 유전자 발현 변화의 페어와이즈 (pairwise) 비교. (G)도 26, B 및 C에 나타낸 K562 세포에서 JQ1 및 급성 (acute) BRD4 분해에 대한 SLAM-seq 반응의 비교. MOLM-13, MV4-11 및 K562에서의 JQ1-처리 시 및 BRD4-분해 시에 공통적으로 (commonly) 유도된 유전자는 청색으로 강조 표시된다. ****는 0으로부터의 중간값의 편차에 대해 윌콕슨의 부호 순위 검정으로 계산된 p <0.0001을 나타낸다.
도 31. 세포 및 전사 수준에서 CDK9 및 BET 브로모도메인 (bromodomain) 억제의 시너지(상승 작용). (A) CellTiter-Glo 발광 세포 생존력 어세이에 의해 측정된, 3 일 동안 지시된 용량의 NVP-2 및 JQ1에 의한 MOLM-13 및 OCI-AML3 세포의 성장 억제. (B) (A)에서의 JQ1 및 NVP-2의 상승 효과는 블리스 가성성 (Bliss additivity)에 대한 초과(excess)로 표현된다. (C) JQ1, NVP-2에 대한 1 차 반응 및 60’동안의 s4U 표지 전 30’동안 처리된 MOLM-13 세포에서의 지시된 용량에서의 조합된 처리. (D) JQ1에 대한 반응 및 (C)에서 나타낸 NVP-2의 중간 용량 (6nM)의 페어와이즈 비교. R은 피어슨 상관 계수를 나타낸다. (E) (C)에서와 같이 OCI-AML3 세포의 NVP-2 및 JQ1 처리 시 mRNA 아웃풋의 전체적인 변화. 포인트는 3 개의 독립 복제물(복제)에 대하여 SLAM-seq의 총 판독 값에 대한 표지된 s4U의 분율을 나타낸다. (F) (E)에서 NVP-2 및 JQ1로 처리된 OCI/AML-3 세포로부터의 SLAM-seq 판독치의 주요 성분 분석. 백분율은 각 주성분에 의해 설명된 전체 분산의 분율을 나타낸다.
도 32. JQ1 과민증 예측 변수 도출 및 테스트. (A) 90' JQ1 처리 (30' 전처리 + 60' s4U 표지화) 후 SLAM-seq 반응에 기초한 JQ-1 과민성 유전자 및 균형잡힌 컨트롤 유전자 선택에 대한 워크 플로우. 컨트롤 유전자는 반복 서브 샘플링 및 콜모고로브-스미르노브 (Kolmogorov-Smirnov) 검정 (KS)을 사용하여 동일한 기준선 발현에 대한 테스팅에 의해 선택되었다. (B) 수퍼 인핸서 (SE)에 의한 JQ1 과민성 대 컨트롤 유전자의 예측을 위한 ROC 곡선. 각각의 SE는 가장 가까운 TSS를 갖는 유전자에 할당되었고 유전자는 수퍼 인핸서 순위에 따라 분류되었다. (C)도 27E에 도시된 K562 세포에서 BETi-과민성의 TSS 기반 분류 (classifiers)를 도출하기 위한 워크 플로우. SVM - 벡터 머신 지원, GLM - 엘라스틱 넷 (elastic net) 정규화에 의해 유도된 일반 선형 모델, GBM - 그래디언트 부스트 모델 (gradient boosted model).
도 33. K562 세포에서 JQ1-과민성을 예측하는 GLM의 특성화. (A)도 27E에 도시된 GLM에 기여하는 모든 예측 변수에 대한 계수 막대 그래프. 인접 테이블에는 각 예측 변수, 상응하는 공개된 ChIP-seq 트랙의 식별자 (표 S1 참조) 및 전사 시작 위치로부터 500bps 또는 2000bp 이내에서 신호가 측정되었는지 여부가 나열된다. (B) (A)에서 5 개의 가장 강하게 포지티브 및 네거티브한 독특한 고유 예측 변수 의 상대적 ChIP-seq 시그널에 기초한 JQ1-과민성 및 컨트롤 유전자의 히트맵 (Heatmap) 및 계층적 군집화.
도 34. 내생적으로 태그된 MYC-AID 세포주에서 MYC 분해에 대한 1 차 반응. (A) 도 4C에서 나타낸 옥신으로 처리된 K562MYC-AID 세포의 SLAM-seq 반응의 볼케이노 플롯. 삽입된 세트는 하향 조절된 유전자 및 상향 조절된 유전자의 총 수 (FDR ≤ 0.1) 및 2 배 이상 탈조절된 유전자를 열거한다. 가독성을 위해 정규 값은 20으로 제한된다. (B) 표시된 GO-텀즈(GO-terms) 관련된 유전자에 대한 (B)에서의 HCT116MYC-AID 세포의 SLAM-seq 반응. (C) (A)에서와 같이 옥신으로 처리된 HCT116MYC-AID 세포의 SLAM-seq 결과를 보여주는 볼케이노 플롯. (D) GO-텀즈(GO-terms)로 그룹화된 상이한 RNA 중합효소 복합체의 서브 유닛을 코딩하는 유전자에 대한 K562MYC-AID 세포에서 급성 MYC 분해에 대한 SLAM-seq 반응.
도 35. MYC-의존성 유전자 발현의 염색질-기반 예측. (A) 도 28C에서 MYC-분해에 반응하지 않는 유전자 (FDR ≤ 0.1, -0.2 ≤ log2FC ≤ 0.2)로부터 MYC-의존성 유전자 (FDR ≤ 1, log2FC ≤ -1)의 식별에 있어서 5 개의 분류기 (classifier)의 성능을 측정하는 ROC 곡선. 모델은 도. 32에서와 같이 802 개의 유전자의 시험 세트에 대해 트레이닝되고, 268 개의 유전자의 시험 세트에 대해 평가되어 도출되었다. (B) 검증을 위해 보류된(held-out) 추가 유전자 세트에 대해 (A)에서 보여주는 GLM의 성능을 평가하는 ROC 곡선. (C) (A)에서 보여주는 GLM의 모든 예측 변수의 계수. (D) 유전자의 TSS로부터 2000bp 이내에 MYC 칩-시퀀스 피크의 존재에 의한 MYC 의존성 유전자의 예측을 위한 ROC. 각각의 유전자에 대해, 세포 mRNA 수준에 가장 강한 기여를 하는 TSS는 도 32에서와 같이 CAGE-seq 신호에 기초하여 선택되었다. SPP 피크 - SPP에 의해 호출된 (called) 피크, IDR 피크 - 2 %의 재현불가능한 발견률 (discovery rate) 임계값을 통과하는 피크. (E) 상기와 같이 MYC-결합 유전자 및 MYC-의존성 유전자로 그룹화된 7135 개의 유전자의 벤 다이어그램.
도 36. 인간 암 세포주에서 MYC 오쏘로그 (orthologs)의 발현. (A) 672 개의 암 세포주로부터의 RNA-seq 프로파일에서 MYC 및 MYCL 발현의 비교. (B) (A)에서와 같이 암 세포주에서 MYC 및 MYCN 발현의 비교.
도 37. 서열 분석에 의해 측정된 5-브로모우리딘 (5BrU)-함유 RNA 올리고뉴클레오티드의 역전사 동안 pH-의존성 염기-페어링 빈도. (a) 5BrU의 호변 이성질체 형태는 아데닌 또는 구아닌과 다른 pH-의존성 염기-페어링 특성을 나타낸다. (b) RNA와 관련하여 5BrU-변형 위치에서 뉴클레오티드 오통합 (misincorporation)에 대한 pH 의존적 효과를 검출하기 위한 실험의 개요. (c) 지시된 pH 조건 하에서 역전사 후 5BrU 변형된 뉴클레오티드 위치에서 관찰된 특이적 전환에 대한 전환율. pH7 조건에 대한 전환율에서의 배수 증가 (fold-increase)가 표시된다. 독립 측정의 수는 n = 3이며 막대는 평균 전환 속도 ± SD를 나타낸다. P-값 (페어링되지 않은, 파라메트릭 독립표본 t- 검정)이 표시된다. N.s., 유의하지 않음 (p> 0.05); *, p <0.05; **, p <0.01; ***, p <0.001; 및 ****, p <0.0001.
실시예:
실시예 1 : 재료 및 방법
s 4 U의 카르복시아미도메틸화
달리 지시되지 않는 한, 1 mM 4-티오우라실 (SIGMA), 800 μM 4-티오우리딘 (SIGMA), 또는 s4U 대사성 표지화 실험에서 제조된 5 - 50 μg 총 RNA를 사용하여 표준 조건 (50 % DMSO, 10 mM 아이오도아세트아미드, 50 mM 소듐포스페이트 완충액 pH 8, 50 ℃에서 15 분 동안) 하에 카르복시아미도메틸화를 수행하였다. 과량의 DTT를 첨가하여 반응을 퀀칭하였다.
흡착 측정
달리 지시되지 않는 한, 1mM 4-티오우라실을 최적의 반응 조건 (10mM 요오도 아세트 아미드, 50 % DMSO, 50mM 소듐 포스페이트 완충액 pH8, 15 ℃에서 15 분 동안) 하에서 인큐베이션하였다. 100mM DTT를 첨가하여 반응을 퀀칭하고, 나노드롭 (Nanodrop) 2000 기기 (Thermo Fisher Scientific)에서 흡착 스펙트럼을 측정한 후, 400 nm에서 흡착의 베이스라인 서브트랙션 (baseline subtraction)을 수행하였다.
질량 분석
40 nmol 4-티오우리딘 또는 6-티오구아노신을 0.05, 0.25, 0.5 또는 5 μmol 아이오도아세트아미드 표준 표준 반응 조건 (50 mM 소듐 포스페이트 완충액, pH 8; 50 % DMSO)의 존재 또는 존재하에 50 ℃에서 15분 동안 반응시켰다. 1 % 아세트산으로 반응을 중지시켰다. Kinetex F5 펜타플루오로페닐 (Pentafluorophenyl) 컬럼 (150 mm x 2.1 mm; 2.6 μm, 100 Å; Phenomenex)을 사용하여 100 μl/min의 유속으로 Ulitimate U300 BioRSLC HPLC 시스템 (Dionex; Thermo Fisher Scientific)에서 산성화된 샘플을 분리하였다.
뉴클레오시드는 다음 SRM으로 전기분무 이온화 후 TSQ Quantiva 질량 분석기 (Thermo Fisher Scientific)를 사용하여 온라인 분석되었다 : 4-티오우리딘 m/z 260 → 129, 알킬화 4-티오우리딘 m/z 318 → 186, 6-티오-구아노신 m/z 300 → 168 및 알킬화된 6-티오-구아노신 m/z 357 → 225. 트레이스 파인더 소프트웨어 스위트 (Trace Finder software suite) (Thermo Fisher Scientific)을 사용하여 데이터를 해석하고 수동으로 검증하였다.
프라이머 연장 어세이
프라이머 연장 어세이는 Nilsen et al. (Cold Spring Harb Protoc. 2013, 1182-1185)에 기재된 대로 수행되었다. 간략하게, 주형 RNA 올리고 뉴클레오티드 (5L-let-7-3L or 5L-let-7-s4Up9-3L; Dharmacon; 시퀀스 표 참조)는 제조자의 지시에 따라 탈보호되었고 폴리아크릴아미드 겔-용리를 변성하여 정제하였다. 표준 반응 조건 (50 % DMSO, 50 mM 소듐포스페이트 완충액, pH 8)에서 100 μM 정제된 RNA 올리고뉴클레오티드를 10 mM 아이오도아세트아미드 (+ IAA) 또는 EtOH (-IAA)로 50 ℃에서 15 분 동안 처리하였다. 20 mM DTT를 첨가한 후 에탄올 침전에 의해 반응을 정지시켰다. γ-32P-ATP (Perkin-Elmer) 및 T4-폴리뉴클레오티드 키나아제 (NEB)를 사용하여 RT 프라이머 (서열 표 참조)를 5' 방사성 표지 한 후, 폴리아크릴아미드 겔-정제를 변성시켰다. 640 nM γ-32P-RT 프라이머를 PCR 머신에서 2 x 어닐링 버퍼 (500 mM KCl, 50 mM Tris pH 8.3)에서 400 nM 5L-let-7-3L or 5L-let-7-s4Up9-3L로 어닐링하였다 (3 분 95 ℃, 30 초 85 ℃램프 0.5 ℃/s, 5 분 25 ℃ 램프 0.1 ℃/s).
역전사를 제조자에 의해 권장된 바와 같이 수퍼스크립트 II (Invitrogen), 수퍼스크립트 III (Invitrogen) 또는 Quant-seq RT (Lexogen)를 사용하여 수행하였다. 디데옥시뉴클레오티드 (dideoxynucleotide) 반응의 경우, 최종 농도의 500 μM ddNTP (지시된 대로)를 RT 반응에 첨가하였다. 완료 시, RT 반응을 포름아미드 로딩 완충액 (겔 로딩 완충액 II, Thermo Fisher Scientific)에 재현탁시키고 12.5 % 변성 폴리아크릴아미드 겔 전기 영동시켰다. 겔을 건조시키고, 저장 인광 스크린 (PerkinElmer)에 노출시키고, 태풍 TRIO 가변 모드 이미저 (Amersham Biosciences)에서 이미지화하고 ImageQuant TL v7.0 (GE Healthcare)을 사용하여 정량화하였다. 드롭-오프 분석을 위해, p9에서의 신호 강도는 개별 반응에 대한 선행 드롭- 오프 신호 강도 (bg,도 4B)로 정규화되었다. s4U-함유 및 비-함유 RNA 올리고뉴클레오티드에 대한 드롭 오프 신호 (+IAA/-IAA)에서의 변화를 리포팅하는 값을 지시된 역전사 효소에 대해 비교하였다. 상응하는 셋업을 사용하여 4-티오우리딘에 대한 대안으로서 6-티오구아노신 변형을 분석하였다.
표. 프라이머 연장 어세이에 사용되는 RNA 올리고뉴클레오티드. s4U는 4-티오우리딘을 나타내고; s6U는 6-티오구아노신을 나타낸다. let-7의 검사된 서열 (inspected sequence)은 이탤릭체로 표시된다.
Figure pct00001
프라이머 연장 어세이에 사용되는 DNA 올리고뉴클레오티드.
Figure pct00002
cDNA 증폭 후 일루미나 (Illumina) 고-처리량 시퀀싱에 사용되는 DNA 올리고 뉴클레오티드. 바코드 뉴클레오티드 (N)는 이탤릭체로 표시된다.
Figure pct00003
s 4 U 또는 s 6 G 표지된 RNA의 HPLC 분석
대사성 표지화 후 총 RNA 로의 s4U- 또는 s6G- 통합의 분석은 Spitzer et al. (Meth Enzymol. 539, 113-161 (2014))에 기재된 대로 수행되었다.
세포 생존력 분석
실험 전날 96 웰 당 5000 mES 세포를 시딩하였다. 상이한 농도의 s4U(지시된 대로)를 함유하는 배지는 12 시간 또는 24 시간 동안 세포에 첨가되었다. 세포 생존력은 제조사의 지시에 따라 CellTiter-Glo® 발광 세포 생존력 분석 (Promega)에 의해 평가되었다. Gen5 소프트웨어 (v2.09.1)를 사용하여 시너지 (Synergy)에서 발광 신호가 측정되었다.
세포 배양
마우스 배아 줄기 (mES) 세포 (클론 AN3-12)를 Haplobank (Elling et al., WO2013/079670)로부터 입수하고 15 % FBS (Gibco), 1x 페니실린-스트렙토마이신 용액 (100 U/ml 페니실린, 0.1mg/ml 스트렙토마이신, SIGMA), 2mM L-글루타민 (SIGMA), 1x MEM 비-필수 아미노산 용액 (SIGMA), 1mM 소듐 피루베이트 (SIGMA), 50μM 2-머캅토에탄올 (Gibco) 및 20 ng/ml LIF (사내 제작)에서 배양하였다. 세포를 5 % CO2와 함께 37 ℃에서 유지하고 매 2 일마다 계대시켰다.
시퀀싱을 변경하기 위한 RNA의 변형 ( "SLAM-seq")
실험 전날 mES 세포를 10 cm 접시에 105 세포/ml의 밀도로 시딩 하였다. s4U 대사성 표지화는 표준 배지에서 mES 세포를 인큐베이션하지만 수중의 500 mM 스톡 용액에서 100 μM s4U 또는 s6G (SIGMA)를 첨가하여 수행하였다. 대사성 표지화(metabolic labeling) 동안, s4U 또는 s6G 함유 배지를 3 시간마다 교환 하였다. 우리딘 추적 실험을 위해, s4U 또는 s6G 함유 배지를 버리고, 세포를 1x PBS로 2 회 세척하고 10 mM 우리딘 (SIGMA)이 보충된 표준 배지와 함께 배양 하였다. 세포를 TRIzol® (Ambion)에 직접 용해시키고, 이소프로판올 침전 동안에 0.1mM 최종 농도의 DTT를 첨가한 것을 제외하고는 제조자 지침에 따라 RNA를 추출 하였다. RNA를 1mM DTT에 재현탁시켰다. 5 ㎍의 총 RNA를 최적의 반응 조건 하에서 10 mM 아이오도아세트아미드로 처리한 후 에탄올을 침전시키고 QuantSeq 3' 말단 mRNA 라이브러리 제조에 적용였다 (Moll et al., Nat Methods 11 (2014); WO2015 / 140307) .
RNA 라이브러리 준비
표준 RNA 서열 (seq) 라이브러리는 제조사의 지시에 따라 NEBNext® Ultra ™ Directional RNA 라이브러리 프렙 키트 (NEB)를 사용하여 제조되었다. Cap-seq 라이브러리는 마그네틱 리보제로 키트 (RiboZero Kit) (Epicenter)를 사용한 리보솜 고갈(depletion)이 단편화 전에 수행되었다는 점을 제외하고는, Mohn et al. (Cell. 157, 1364-1379 (2014))에서 이전에 설명된 대로 제조하였다. 메신저 RNA 3' 말단 시퀀싱은 제조사의 지시에 따라 Quant-seq mRNA 3' 말단 라이브러리 제조 키트 (Lexogen)를 사용하여 수행되었다.
데이터 분석
겔 이미지를 ImageQuant v7.0a (GE Healthcare)를 사용하여 정량화 하였다. 프리즘 v7.0 (GraphPad) 또는 R (v2.15.3)에서 1 차 반응에 대한 적분 속도 법칙에 따라 곡선 피팅을 수행 하였다. 통계 분석은 Prism v7.0a (GraphPad), Excel v15.22 (Microsoft) 또는 R (v2.15.3)에서 수행되었다.
생물 정보학
합성 RNA 샘플의 시퀀싱 분석을 위해 (도 5), 바코드에서 0 개의 불일치를 허용하는 Picard Tools BamIn-dexDecoder v1.13을 사용하여 바코딩 된 라이브러리를 역다중화(demultiplex) 하였다. 결과 파일은 피카드-툴 (picard-tools) SamToFastq v1.82를 사용하여 fastq로 전환되었다. Cutadapt v1.7.1을 사용하여 어댑터를 트리밍하고 (어댑터 시퀀스에서 기본적으로 10 % 불일치를 허용) 21nt 길이의 시퀀서를 필터링하였다. 결과 서열을 bowtie v0.12.9를 사용하여 성숙 dme-let-7 서열 (5'-TGAGGTAGTAGGTTGTATAGT-3', 서열번호 7)에 정렬시키고 3 개의 불일치를 허용하고 samtools v0.1.18을 사용하여 bam으로 전환시켰다. 모호한 뉴클레오티드 (N)를 포함하는 서열을 제거 하였다. 나머지 정렬된 판독 값은 파일 형식으로 전환되었다. 마지막으로, 위치 당 각 돌연변이의 분율이 파일업 (pileup)으로부터 추출되었다. 아웃풋 테이블을 분석하고 Excel v15.22 (Microsoft) 및 Prism v7.0a (GraphPad)로 플로팅하였다.
mRNA 3' 말단 시퀀싱 데이터 분석을 위해, 바코드가 있는 라이브러리는 바코드에서 1 개의 불일치를 허용하는 피카드 툴 (Picard Tools) BamIndexDecoder v1.13을 사용하여 역 다중화되었다. 어댑터는 cutadapt v1.5를 사용하여 클리핑되었고 판독 값은 ≥ 15 개 뉴클레오티드에 대한 사이즈-필터 (size-filter)였다. STAR 얼라이너 v2.5.2b를 사용하여 마우스 게놈 mm10에 판독물을 정렬시켰다. 정렬 점수는 판독 길이 (read length)에 대해 정규화된 정렬 동일성 ≥ 0.3 및 정렬 스코어 ≥ 0.3에 대해 필터링되었다. ≥ 30 개의 매치를 갖는 정렬만 보고되었다. 오버랩이 약 ≥ 15bp 를 갖는 키메릭 정렬만이 허용되었다. 2-패스 매핑이 사용되었다. < 200kb의 인트론이 필터링되고, 비-정규 (non-canonical) 접합을 포함하는 정렬이 필터링되었다. 매핑된 염기 비 ≥ 0.1에 대한 불일치 또는 최대 10 개의 불일치가 있는 정렬이 필터링되었다. 1,2,3, N 판독에 의한 접합(junction)에 허용되는 최대 간격 수는 각각 10kb, 20kb, 30kb 및 50kb로 설정되었다. (1) 비정규 모티프, (2) GT/AG 및 CT/AC 모티프, (3) GC/AG 및 CT/GC 모티프, (4) AT/AC 및 GT/AT 모티프는 각각 20, 12, 12, 12로 설정되었다. "스퓨리어스 (Spurious)" 접합 필터링이 사용되고 판독에 허용된 최대 다중 정렬 수를 1로 설정하였다. FeatureCounts를 사용하여 엑손 판독 (exonic reads)(Gencode)이 정량화되었다.
캡(Cap) 분석 유전자 발현 (CAGE)의 경우, 바코드에서 1 개의 불일치를 허용하는 피카드 툴 (Picard Tools) BamIndexDecoder v1.13을 사용하여 바코드가 있는 라이브러리를 역 다중화 하였다. 판독의 처음 4nt가 seqtk를 사용하여 트리밍되었다. 알려진 rRNA 서열 (RefSeq)에 대해 BWA (v0.6.1)와 정렬함으로써 리보솜 RNA에 대한 판독이 스크리닝되었다. rRNA 감산 판독 (subtracted reads)이 Mus 근 (musculus) 게놈 (mm10)에 대해 TopHat (v1.4.1)와 정렬되었다. 최대 멀티 히트는 1, 세그먼트 길이는 18, 세그먼트 불일치는 1로 설정되었다. 또한 유전자 모델은 GTF (Gencode VM4)로 제공되었다.
mRNA 3' 말단 시퀀싱 (Quant-seq) 데이터 세트의 분석을 위해, 바코드에서 1 개의 불일치를 허용하는 피카드 툴 (Picard Tools) BamIndexDecoder v1.13을 사용하여 판독을 역 다중화 하였다. 역 다중화된 판독의 5 '말단에서 5 개의 뉴클레오티드가 트리밍되었다. 판독은 마우스 게놈 mm10에 정렬되었고 주석이 달린 3 'UTR (Gencode)에서의 정렬은 SLAMdunk를 사용하여 계수되었다 (Neumann & Rescheneder, t-neumann.github.io/slamdunk/; Herzog et al., Nature Methods 14, 1198?1204 (2017)). 간단히, SLAMdunk는 유연하고 빠른 판독 매핑 프로그램인 NextGenMap에 의존하며 매핑 단계에서 T> C 불일치 페널티를 제거하는 개조된 (adapted) 스코어링 체계를 사용하여 조정되었다. 3' UTR에 정렬된 비- T> C 함유 판독 및 T> C 함유 판독이 각각 s4U- 또는 표지되지 않은 전사체 풍도 (transcript abundance)를 추론하기 위해 정량화되었다. 전사 산물(아웃풋) 분석을 위해, SLAMdunk를 갖는 고-처리량 시퀀싱 데이터를 마우스 게놈 mm10에 정렬 한 후 모든 유전자에 대해 정규화된 판독의 수 (cpm에서; "정상-상태 발현") 및 ≥1 T/C 돌연변이를 포함하는 정규화된 판독의 수 (cpm에서; "전사 산물 (아웃풋)")가 수득되었다. 미토콘드리아 (Mt-) 및 예측된 (GM-) 유전자는 분석에서 제외되었다. 백그라운드 T/C 판독 (s4U 표지화없이 관찰된 T/C 판독)을 1 시간 시점에서의 T/C 판독에서 차감하고, "정상-상태 발현"의 평균에 대해 > 5 cpm의 발현 역치를 설정하였다. 높은 전사 산물을 갖는 유전자를 확인하기 위해, 식 Y = 0.6378*X - 1.676에 의해 기술된 log10 (정상상태 발현) 대 log10 (전사 산물) (유전자 수 : 6766)을 플로팅한 후에 선형 회귀가 피팅되었다. 각 유전자에 대해, 피팅된 곡선까지의 거리는 ΔY = 전사 산물 (cpm)-(0.6378 * 정상상태 발현(cpm) -1.676)에서와 같이 계산되었다 ( "ΔY"). "높은 전사 산물 (High transcriptional output)" 유전자는 ΔY> 0.5 (유전자 수 : 828)에 의해 정의되었다. "고 발현 유전자 (High expression genes)"는 정상 상태 CPM> log10 (2.15) (유전자 수 : 825)에 의해 정의되었다. 각 클래스의 유전자를 정의하는 전사 인자 네트워크를 예측하기 위해, 생물학자가 유전자 발현 데이터 세트와 같은 실험 결과에 중요한 치료 관련 네트워크를 발견, 시각화 및 탐색할 수 있는 웹 제공 응용 프로그램인 Ingenuity Pathway Analysis (Qiagen) v27821452가 "높은 전사 산물" 또는 "고 발현"유전자의 인풋과 함께 사용되었다. Ingenuity Pathways Analysis에 대한 자세한 설명은 www.Ingenuity.com에서 확인한다. 상위 5 개의 예측된 업스트림 조절자가 표시된다. "높은 전사 산물"또는 "고 발현" 유전자의 경로를 예측하기 위해, 온라인 툴 Enrichr가 두 유전자 클래스의 투입(인풋)과 함께 사용되었다. 상위 5 개의 예상 경로가 표시된다.
실시예 2 : RNA의 대사 시퀀싱 (metabolic sequencing)을 위한 티올-연결 알킬화
배양된 세포에서 RNA 발현 카이네틱을 결정하기 위해 s4U- 또는 s6G- 표지 및 비표지 RNA 종의 생화학적 분리 필요성을 우회하는 유도체화 전략의 예로 원리 검증 (proof-of-principle)으로서 티올 뉴클레오티드-유사체가 선택되었다 (도 1): 이 전략은 잘 확립된 대사성 표지화 (metabolic labeling) 방식을 기반으로 하지만 비효율적이고 시간이 많이 걸리는 비오티닐화 단계(biotinylation-step)를 피한다. 잘 확립된 RNA 라이브러리 제조 프로토콜과 결합되면, s4U-통합 부위에서 부피가 큰 그룹의 존재는 역전사 (RT) 동안 G의 특이적이고 정량적인 오통합 (misincorporation)을 초래하지만, RT-가공성을 방해하지는 않는다. 따라서, s4U- 또는 s6G- 함유 서열은 T에서 C 로의 전이를 호출함으로써 단일 뉴클레오티드 분해능(resolution)으로 고-처리량 시퀀싱 라이브러리에서의 서열 비교에 의해 또는 생물정보학적으로 식별될 수 있다.
중요하게도, 우리딘을 시토신으로 전환시키는 효소는 공지되어 있지 않으며, 예를들어 일루미나 HiSeq 2500 플랫폼을 사용하는 고 처리량 RNA 시퀀싱 데이터세트에서의 유사한 오류율 (즉, T> C 전환)은 드물게 발생하며 1 만 분의 1 미만의 빈도로 발생한다. 이 접근법은 가장 바람직한 실시양태, RNA의 대사성 서열 분석 (metabolic sequencing)을 위한 티올 (SH)-연결 알킬화의 약어로서 "SLAM-seq"로 지칭된다.
SLAM-seq는 고-처리량 시퀀싱에 의해 단일-뉴클레오티드 분해능에서 RNA 종에서의 대사성-표지화-유래 4-티오우리딘 통합 이벤트를 검출할 수 있게 하는 뉴클레오티드-유사체 유도체화 화학에 기초한다. 우리는 새로운 방법이 RNA 중합 효소 II-의존적(종속) 폴리아데닐화 전사 산물을 정확하게 측정하고 마우스 배아 줄기 세포에서 전체적 전사 후 (post-transcriptional) 유전자 조절 시그니처를 요약한다는 것을 보여준다. 본 발명은 높은 시간적 분해능 (temporal resolution)으로 RNA 발현 카이네틱의 신속한 전사체 전체 분석을 위한 확장 가능하고, 고 정량적이며, 비용 및 시간 효과적인 방법을 제공한다.
s4U-유도체화를 위해, 본 발명자들은 효과적인 1 차 티올-반응성 화합물의 예로서 아이오도아세트아미드 (IAA)를 사용하여, 친핵성 치환 (SN2) 반응의 결과로서 카르복시아미도메틸기를 티올기에 부착시켰다 (도 2A). s6G와 같은 다른 티올화된 핵염기 (thiolated nucleobases)와 유사한 반응이 발생한다 (도 23A).
다양한 매개 변수 (예 : 시간, 온도, pH, IAA 농도 및 DMSO)의 함수로서 s4U 유도체화의 효율을 정량적으로 모니터링하기 위해, 4-티오우라실 (~ 335nm)의 특성 흡수 스펙트럼을 모니터링하였다. 여기서 - 아이오도아세트아미드 (IAA)로 반응 시 - ~ 297 nm로 이동하였다 (도 2B에서 K) (45). 최적의 반응 조건 (10mM IAA; 50mM NaPO4, pH8; 50 % DMSO; 50 ℃; 15 분)에서 335nm에서의 흡수는 처리되지 않은 4-티오우라실에 50 배 감소하여 적어도 98 %의 알킬화율 (alkylation rate)을 가져왔다(도 2L 및 M). (4-티오우라실의 흡수 스펙트럼 및 그의 알킬화된 유도체는 부분적으로 겹치기 때문에 전환율은 과소 평가될 수 있다.)
질량 분석법에 의한 리보오스 컨텍스트 (즉, 4-티오우리딘 또는 6-티오구아노신)에서의 티올-특이적 알킬화의 분석은 완전한 유도체화 효율에 근접함을 확인 하였다 (도 3 및 23B).
s4U 또는 s6G 통합 이벤트의 정량적 회수는 역전사 효소가 드롭-오프 (drop-off)없이 알킬화된 s4U-잔기(residues)를 통과한다고 가정한다. 역전사 효소-가공성에 대한 s4U- 또는 s6G- 알킬화의 효과를 결정하기 위해, 단일 s4U 또는 s6G 통합을 함유하는 합성 RNA(서열에 대해서는 실시예 1의 표 참조)를 사용하였고 프라이머 연장 어세이에서 3 개의 상업적으로 입수 가능한 역전사 효소 (RT) - 수퍼스크립트 II, 수퍼스크립트 III, 및 Quant-seq RT - 를 분석하였다 (도 4A). 백그라운드 드롭-오프 신호로 정규화 할 때, 동일한 서열을 갖는 비-s4U- 또는 비-s6G-함유 올리고와 비교할 때 RT 가공성에 대한 s4U- 또는 s6G- 알킬화의 유의한 영향을 관찰하지 못하였다 (도 4B 및 C 및 도 24B). 우리는 알킬화가 역전사의 조기 종결 (premature termination)을 초래하지 않는다는 결론을 내렸다. 역전사 효소 - 지시된 뉴클레오티드 통합에 대한 s4U- 및 s6G- 알킬화의 효과를 평가하기 위해, 본 발명자들은 프라이머 연장 반응의 전장 산물을 단리하고, PCR을 통해 cDNA를 증폭시키고, 일루미나 HiSeq2500 기기를 사용하여 라이브러리를 고 처리량 시퀀싱 하였다 (도 5A 및 24A). 예상한 바와 같이, 우리딘은 10-2 미만의 평균 돌연변이율을 갖는 아이오도아세트아미드로의 처리에 관계없이 비-s4U- 또는 비-s6G-함유 컨트롤 RNA에서 3 개의 모든 RT에 의해 정확하게 역전사되었다 (도 5B 및 24B). 왼쪽 패널).
대조적으로, s4U의 존재는, 심지어 알킬화가 없는 경우에도, 일정한 10 % 내지 11 % T에서 C 로의 전환을 유발하였고, 이는 아마도 s4U-호변체(tautomeres)의 염기-페어링 변이 때문일 것이다 (도 5B, 우측 상단 패널). s6G의 경우, G 에서 A 로의 전환이 관찰되었다 (도 24B, 오른쪽 패널). 특히, 아이오도아세트아미드-처리에 의한 s4U의 알킬화는 T에서 C 로의 전환에서 8.5 배 증가를 유발하여, 모든 시험된 RT에서 0.94를 초과하는 돌연변이율을 가져왔다 (도 5B 우측 하단 패널). 일루미나 고-처리량 시퀀싱 데이터세트 (10-3 이하)에서 보고된 시퀀싱 오류와 비교할 때 신호 대 잡음비 > 940 : 1을 얻었다. 중요하게도, 본 발명자들은 임의의 주어진 비-티올-함유 뉴클레오티드의 돌연변이율에 대한 아이오도아세트아미드 처리의 유의한 영향을 관찰하지 못하였다 (도 5C 및 24C). 우리는 아이오도아세트아미드 처리 후 역전사는 비-티올-함유 뉴클레오티드의 서열 정보에 영향을 미치지 않으면서 단일 뉴클레오티드 분해능으로 RNA에서 s4U 또는 s6G-통합의 정량적 식별을 가능하게 한다는 결론을 내렸다.
실시예 3 : mES 세포에서 대사적으로 표지된 mRNA에서 변형된 뉴클레오티드의 통합
우리는 다양한 s4U 농도에서 12 시간 또는 24 시간 후 s4U 대사성 RNA 표지화를 허용하는 마우스 배아 줄기 세포의 능력을 테스트하였다 (도 6A). 이전에 보고 된 바와 같이, s4U의 높은 농도는 12 시간 또는 24 시간 표지화 후 각각 3.1mM 또는 380μM의 EC50으로 세포 생존력을 손상시켰다 (도 6A). 따라서, 우리는 100μM s4U의 표지 조건을 사용했는데, 이는 세포 생존력에 큰 영향을 미치지 않았다. 이러한 조건 하에서, 우리는 표지화 후 3h, 6h, 12h 및 24h에서 총 RNA 제조에서 s4U-통합의 계속적 증가를 검출하였고, 우리딘 추적 후 3h, 6h, 12h 및 24h에서 계속적 감소를 검출하였다(도 6B). 예상된 바와 같이, 통합은 단일 지수 카이네틱을 따르고, 최대 평균 통합은 1.78 % s4U이며, 총 RNA에서 56 개 우리딘마다 하나의 s4U 통합에 상응한다 (도 6C). 이러한 실험은 mES 세포에서 s4U-표지화 조건을 확립하며, 이는 섭동되지 않은 조건 하에서 RNA 생체 내 합성 및 교체율을 측정하는데 사용될 수 있다.
고 처리량 시퀀싱 데이터세트에서 s4U 통합 이벤트를 발견하는 방법의 능력를 테스트하기 위하여, 24 시간 동안 s4U-대사성 RNA 표지화 후 배양된 세포로부터 제조된 총 RNA를 사용하여 mRNA 3' 말단 라이브러리 (Lexogen’s QuantSeq, 3' mRNA-시퀀싱 라이브러리 제조 키트를 사용함)를 생성하였다 (도 7) (Moll et al., 상기). Quant-seq 3' mRNA-Seq 라이브러리 준비 키트는 유전자 Trim28에 대해 예시 된 바와 같이 폴리아데닐화된 RNA의 3'말단에 근접한 서열의 일루미나-호환성 라이브러리를 생성한다 (도 8A). 다른 mRNA-시퀀싱 프로토콜과 달리, 전사체 당 하나의 단편 만이 생성되므로, 유전자 길이에 대한 판독의 정규화는 필요하지 않다. 이것은 높은 가닥-특이성을 가진 정확한 유전자 발현 값을 가져온다
또한 시퀀싱-준비 라이브러리는 4.5 시간 내에 생성할 수 있으며 ~ 2 시간의 실습 시간 (hands-on time)이 제공된다. 발명과 결합될 때, Quant-seq는 라이브러리가 낮은 수준의 이질성을 나타 내기 때문에 전사체-특이적 영역에 걸친 돌연변이율의 정확한 결정을 용이하게 한다. 실제로, s4U 대사성 표지화 후 24 시간에 mES 세포의 총 RNA로부터 Quant-seq 프로토콜을 통해 U-변형 된 RNA의 라이브러리 생성 시, 비표지된 mES 세포의 총 RNA로부터 제조된 라이브러리와 비교할 때, T> C 전환의 강한 축적을 관찰하였다 (도 8B).
이 전사체 전체에서 이 관찰을 확인하기 위해, 주석이 달린 3' UTR에 대한 판독 값을 정렬하고 UTR 당 임의의 주어진 돌연변이의 발생을 검사하였다 (도 9). s4U 대사 표지가 없는 경우, 본 발명자들은 임의의 주어진 돌연변이, 일루미나-보고된 (Illumina-reported) 시퀀싱 오류율과 일치하는 비율(rate)에 대해 0.1 % 또는 그 이하의 중간값의 돌연변이율을 관찰하였다. 24 시간의 s4U 대사성 표지 후, 본 발명자들은 통계적으로 유의미한 (p <10-4, Mann-Whitney 검정), T> C 돌연변이율이 25 배 증가한 반면, 다른 모든 돌연변이율은 예상된 시퀀싱 오차율 미만으로 유지되었다 (도 9). 보다 구체적으로, 본 발명자들은 24 시간 표지화 후 2.56 %의 중간값의 s4U 통합을 측정하였고, 이는 매 39 개의 우리딘에서 하나의 s4U 통합에 상응하였다. (RNA에 대한 중앙값 통합 빈도는 전체 RNA에서 HPLC에 의해 추정된 것보다 높다 [그림 6C]. 가장 확실한 것은 rRNA와 같은 안정적인 논-코딩 RNA 종이 총 RNA에서 강하게 과다하게 표현되었기 때문이다.) 이들 분석은 새로운 방법이 배양된 세포에서 s4U-대사성 RNA 표지화 후의 mRNA에서 s4U 통합 이벤트를 발견하였음을 확인한다.
이전에 보고된 바와 같이, 본 발명자들은 s6G 또는 5-에티닐우리딘 (ethynyluridine)과 같은 다른 변형된 뉴클레오티드의 동일한 통합 결과를 예측한다 (Eidinoff et al., Science. 129, 1550-1551 (1959); Jao et al. PNAS 105, 15779-15784 (2008); Melvin et al. Eur. J. Biochem. 92, 373-379 (1978); Woodford et al. Anal. Biochem. 171, 166-172 (1988)).
실시예 4 : 역전사 동안 5-브로모-우리딘 사용 및 pH-의존성 염기-페어링 빈도
Yu et al. (Journal of Biological Chemistry, 268 : 21, 15935-15943, 1993)은 염기성 유사 브로모우라실이 중합 동안 pH의 함수로서 G (구아닌)과 미스페어(mispair)를 형성한다는 것을 입증하였다. 또한, 5BrU는 세포에 의해 흡수되고, 인산화되고, 초기 RNA에 도입된다 (Larsen et al., Current Protocols in Cytometry. 12 (7.12): 7.12.1-7.12.11, 2001). 우리는 pH-변형 NGS 라이브러리 제조 및 시퀀싱에 의해 5BrU-표지화를 식별하는 데 사용할 수 있음을 입증한다. 단일 중앙 위치에서 5BrU 변형을 함유한 합성 RNA 올리고뉴클레오티드 100 pmol을 사용하였다. RNA 서열 5'-ACACUCUUUCCCUACACGACGCUCUUCCGAUCU-UGAGGUAGU[5BrU]AGGUUGUAUAGUAGAUCGGAAGAGCACACGUCUC-3´ (서열번호 8)는 역전사 및 증폭에 사용 된 2 개의 밑줄 친 링커 서열 및 중앙 위치에서 5-브로모우리딘 표지인 [5BrU]을 갖는다.
역전사는 RT DNA 올리고뉴클레오티드 프라이머 (5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGAT-CT-3 ', 서열번호 9) 및 pH가 각각 pH7, pH8, 또는 pH9로 조정된 5 x RT 완충액을 사용하여 제조사의 지시에 따라 수퍼스크립트 II (Thermo Fisher Scientific)에 의해 수행하였다. 역전사 후, 1 pmol 역전사 생성물에, DNA 올리고뉴클레오티드 Solexa PCR Fwd (5´- AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3´, 서열번호 10)및 Solexa IDX rev. (5´-CAAGCAGAAGACGGCATACGAGATNNNNNN-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3´, 서열번호 11; NNNNNN은 바코드-뉴클레오티드의 위치를 나타낸다)를 사용하여 제조사의 지시에 따라 KAPA 리얼-타임 라이브러리 앰플리케이션 키트 (KAPA 바이오시스템)를 사용한 PCR 증폭을 수행하였다. 증폭된 라이브러리는 일루미나 MiSeq 플랫폼을 사용한 고-처리량 시퀀싱으로 서열 분석되었다. 5BrU 뉴클레오티드에 대한 전환율은 5BrU의 위치에서 T (티민)의 예측된 다수 판독 치 (expected majority readout) 이외의 뉴클레오티드 A (아데닌), G (구아닌) 및 C (시토신)의 빈도를 계산하여 결정하였다.
5BrU 또는 최종 판독 치에서 T의 A (T> A 전환) 로의 pH-의존성 전환율은, pH 7에서의 3·10-4 의 백그라운드 전환율에 비교하여, 역전사 동안 pH가 pH 8 및 pH 9로 각각 증가함에 따라 1.1 배 및 1.4 배 증가를 나타낸다 (도 37C). T> G 전환율은 pH 7에서 1· 10-4의 낮은 백그라운드 전환율에 비해 1.2 배 및 1.9 배 증가한다. 대조적으로, T> C 전환율은 pH 7에서 3·10-4 의 백그라운드 전환율에 비해 2.2 배 및 4.3 배 증가한다. 전환율의 pH 의존적 변화의 시그니처는 RNA에서 5BrU에 대해 특징적이며 전사 동안 초기 (nascent) RNA에 통합되는 5BrU의 수를 식별하는데 사용될 수 있다.
실시예 5 : mES 세포에서 폴리아데닐화된 전사 산물의 결정
짧은 s4U 펄스 표지화에 이어지는 mRNA 3' 말단 시퀀싱이 폴리아데닐화된 전사 산물을 정확하게 보고하는지 테스트하기 위해, 본 발명자들은 mES 세포를 짧은 1 시간 s4U-펄스에 적용한 후 총 RNA 추출 및 mRNA 3' 말단 라이브러리 제조를 수행 하였다 (도 10A). Quant-seq-생성 라이브러리를 마우스 게놈에서 주석이 달린 (annotated) 3' UTR에 매핑하고 새로 전사된 RNA를 나타내는 T> C 전환의 존재에 대하여 분석하였다 (그림 10A). 새로 전사된 폴리아데닐화된 전사체 (즉, T> C 전환 함유)와 정상 상태 (즉, T> C 및 비 T> C 전환 함유) 폴리아데닐화된 전사체의 상대 풍도 (abundance)를 비교할 때, 본 발명자들은 새로 전사된 RNA 사이에서 과도하게 표현된 828 개의 유전자로 이루어진 전사체의 서브세트를 관찰하였다 (도 10B). 상위 과도하게 표현된 전사체 중에 ES 세포 특이적 마이크로RNA 클러스터 (miR-290- 및 miR182 클러스터)가 있는데, 이들은 핵에서 도로샤(Drosha)가 마이크로 RNA 헤어핀을 절단할 때 빠르게 붕괴되기 때문에 특히 수명이 짧아서 정상 상태에서 높은 수준으로 축적되지 않는 것으로 판단된다 (도 10B).
새로운 방법에 의해 측정된 드 노보 (de novo) 전사 산물을 보다 체계적으로 특성화하기 위해, 예측된 기본 전사 인자 (Ingenuity Pathway Analysis, www.Ingenuity.com 사용) 및 관련 분자 경로 (Enrichr 사용) 측면에서, 본 발명자들은 새로 전사된 RNA뿐만 아니라 통상적인 mRNA 3' 말단 시퀀싱에 의해 정상 상태에서 검출된 상위 825 유전자 중에서 과도하게 표현된 828 유전자의 유전자 리스트 농축 분석 (enrichment analysis)을 수행 하였다 (도 10C) : 예상대로, 높은 수준의 정상 상태 (steady-state)의 발현은 다능성-관련 전사 인자 네트워크를 예측하지 못하였고, 이는 리보솜 단백질, mRNA 가공(프로세싱) 및 전자 수송과 같은 하우스-키핑 경로와 주로 관련이 있다. 대조적으로, 본 발명의 방법에 의한 드 노보 (de novo) 전사체 분석은 Oct4 (POU5F1), NANOG 및 SOX2 및 다능성 네트워크를 포함하는, 주요 mES 세포-특이적 전사 인자를 성공적으로 예측하였다 (도 10C). 우리는 RNA 변형 및 mRNA 3' 말단 시퀀싱과 조합하여 짧은 s4U-펄스 표지화가 전사 안정성 효과로부터 즉각적인 전사 산물을 분리할 수 있게 하므로 전사 유전자 조절을 연구할 수 있는 빠르고 확장 가능한 방법을 제공한다.
실시예 6 : mRNA 전사체 안정성 측정
본 발명의 방법이 mRNA 전사체 안정성을 측정하기 위해 사용될 수 있는지를 확인하기 위해, 본 발명자들은 24 시간 동안 mES 세포에서 RNA의 s4U 표지화를 수행 한 후, 과량의 비-티올 함유 우리딘 (non-thiol containing uridine)을 사용한 추적 (chase)을 수행하고, 다양한 시점 (0 분, 15 분, 30 분, 1 시간, 3 시간, 6 시간, 12 시간 및 24 시간)에서 총 RNA를 제조한 후 이어서 U-변형 및 mRNA 3' 말단 시퀀싱을 수행하였다 (도 11A). 다시, 우리는 마우스 게놈에서 주석이 달린 (annotated) 3' UTR에 라이브러리를 매핑하고, 오래된 (old) 전사체를 나타내는, T> C 전환의 존재에 대하여 라이브러리를 분석하였다 (도 11A).
9430 개의 유전자에 대해 정상 상태 풍도 (분석 과정에서 일정하게 유지됨)에 대해 정규화된, 시간 경과에 따른 전사체 함유 T> C 전환의 전체적 분석은 4h의 중간값의 mRNA 반감기를 나타냈다 (도 11B). 예상한 바와 같이, 개별 전사체의 반감기는 1 배 이상의 차이가 있었다 (도 11C). mRNA 안정성에 대한 제어는 유전자 발현의 시간적 순서 (temporal order)에 필수적이다.
새로운 방법은, '전사 조절 (transcriptional regulation)', '신호 전달 (signal transduction)', '세포 주기 (cell cycle)' 또는 '발달 (development)'과 같은 GO 텀즈 (GO terms)와 관련된 조절 전사체 (regulatory transcripts)는 하우스 키핑 전사체에 비해 반감기가 상당히 짧았기 때문에, '세포 외 매트릭스 (extracellular matrix)’, ‘대사 과정 (metabolic process)’, 및 ‘단백질 합성 (protein synthesis)'과 같은 GO 텀즈 (GO terms)로 분류되는 핵심 기본 원칙을 되풀이하였다. 결론적으로, 본 발명은 mRNA 안정성의 정확한 평가를 가능하게 하여 전사 후 유전자 조절을 연구하기 위한 편리한 방법을 제공한다. 도시된 바와 같이, 상기 방법은 마우스 배아 줄기 세포에서 전사 후 유전자 조절 시그너처를 재현한다.
실시예 7 : 작은 RNA의 대사 시퀀싱 (metabolic sequencing)을 위한 티올-연결 알킬화
작은 RNA 침묵 경로 (silencing pathways)의 세포 내 카이네틱에 대해 이해하기 위해서, 우리는 표지된 RNA 종의 생화학적 단리에 대한 필요성을 바이패스하는 뉴클레오티드-유사체 유도체화 전략을 적용하였고 RNA 생체 내 합성 및 전체 RNA의 컨텍스트에서의 턴오버 카이네틱의 결정을 가능하게 하였다 (도 12): 이 전략은 잘 확립된 4-티오우리딘 (s4U) 대사성 RNA 표지화 방법을 기반으로하지만 효과가 없고 실험적으로 까다로운 바이오티닐화 단계를 설프히드릴 (sulfhydryl)-반응성 화합물인 아이오도아세트아미드와 s4U 함유 RNA와의 반응과 관련된 짧은 화학 처리로 대체하며, 이는 - s4U 반응 시 - 염기-페어링 계면에서 공유 결합된 아미도메틸기를 생성한다 (도 1). 작은 RNA 시퀀싱과 같은 통상적인 RNA 라이브러리 준비 프로토콜과 컴바인할 때, s4U 통합 부위에 부피가 큰 그룹의 존재는 역전사 (RT) 동안 G의 특이적이고 정량적인 잘못된 통합(misincorporation)을 야기하지만, RT-가공성을 방해하지는 않는다. s4U 통합 이벤트는 단일 뉴클레오티드 분해능 (resolution)으로 고-처리량 시퀀싱 라이브러리에서 및 T에서 C 로의 전이를 호출함으로써 표지되지 않은 RNA의 관점에서 일반적으로 생체정보학적으로 서열 비교에 의해 식별될 수 있으므로, 절대적 표지화 효율의 측정을 위한 스파이크-인 솔루션이 필요하지 않다. 중요하게도, 우리딘을 시토신으로 전환시키는 효소는 알려져 있지 않으며, 예를 들어 일루미나 HiSeq 2500 플랫폼을 사용하는 고 처리량 RNA 시퀀싱 데이터세트에서 T> C 오류율은 드물게 발생하며, 1만 중 하나보다 적은 빈도로 발생한다. 우리는 이 접근 방식을 작은 RNA의 대사성 시퀀싱 (metabolic sequencing)을 위한 티올(SH)-연결 알킬화라고 지칭한다.
대사적으로 표지된 작은 RNA를 발견할 수 있는 이 방법의 능력을 시험하기 위해, 세포 생존성을 방해하지 않는 조건 (즉, 500 μM)에서 24 시간 동안 s4U와 함께 초파리 S2 세포를 인큐베이션 한 후 총 RNA 추출 및 작은 RNA 시퀀싱을 수행하였다. 대사성 표지화는 총 RNA의 HPLC 분석에 의해 확인되었고 (도 18), 43 개의 우리딘 중 하나에서 s4U 통합에 상응하는 2.3 %의 표지화 효율을 나타낸다. 24 시간 동안 s4U 대사 표지 후 초파리 S2 세포의 사이즈-선택된 (size-selected) 총 RNA로부터 라이브러리 생성시, 본 발명자들은 miR-184 4 유전자좌에 대해 예시된 바와 같이, 표지되지 않은 세포로부터 제조된 라이브러리와 비교할 때 T> C 전환의 강한 축적을 관찰하였고, 이는 풍부하게 발현된 마이크로 RNA, miR-184-3p 및 이의 덜 풍부한 miR*, miR-184-5p를 발생시킨다 (도 12A). 게놈 스케일에서 이 관찰을 확인하기 위해, 우리는 초파리 게놈에서 주석이 달린 마이크로RNA 유전자좌에 대한 판독을 정렬하고 miRNA 당 전체 T-함량에 대해 정규화된 임의의 주어진 돌연변이의 빈도를 검사하였다 (도 12B). s4U 대사성 표지의 부재 하에서, 임의의 주어진 돌연변이에 대해 0.1 % 미만의 중간값 돌연변이율, 일루미나-보고된 (Illumina-reported) 시퀀싱 오류율과 일치하는 비율을 관찰 하였다. (표지되지 않은 총 RNA의 아이오도아세 아미드 처리,는 고-처리량 시퀀싱에 의해 결정된 바와 같이, 작은 RNA 풍도 (abundance) 및 돌연변이율에 대해 검출 가능한 영향이 없었다. 도 19 참조). 24 시간의 s4U 대사성 표지화 후, 본 발명자들은 통계적으로 유의한 (p <10-4, 맨-휘트니 검정 (Mann-Whitney test)), T> C 돌연변이율에서의 74 배 증가를 관찰하였고 반면 다른 모든 돌연변이는 예상된 시퀀싱 오류율 미만으로 유지되었다 (도 12B). 보다 구체적으로, 우리는 24 시간 표지화 후, 45 개의 우리딘마다 하나의 s4U 통합에 상응하는, 2.22 %의 중간값(median) s4U 통합을 측정하였고, 이는 총 RNA의 HPLC 측정에 의해 결정된 통합율과 일치한다 (도 18). 섭동(교란)되지 않은 조건 하에서의 대사성 표지화는 최대 하나의 s4U 통합 이벤트를 나타내는 대다수 (> 95 %)의 작은 RNA를 발생시켰고 (도 20), 이는 개선된 비오티닐화 (biotinylation) 전략을 통해서도 정량적 회복에 불충하지만 (Duffy et al., 2015, 상기) 화학적 s4U 유도체화에 의해 쉽게 식별될 수 있다 (도 12).
단일 뉴클레오티드 분해능으로 s4U 통합을 회복시키는 본 발명 방법의 능력은 마이크로 RNA 프로세싱 및 로딩에 대한 s4U 대사성 표지화의 영향을 체계적으로 분석할 수 있게 하였다.
이를 위해, 본 발명자들은, 선택적 아르고너트 (Argonaute) 로딩에 의해 정의되는 것과 같이, 마이크로 RNA 전구체의 5p- 또는 3p 아암으로부터 유래되거나, 또는 miR 또는 miR* 가닥을 구성하는 주어진 작은 RNA의 개별 위치에서 T> C 전환의 과잉 또는 과소 표현을 결정하였다. 71 개의 풍부하게 발현된 (> 100 ppm) 마이크로 RNA (35 5p- 및 36 3p-miRNA, 또는 44 miR 및 27 miR*에 상응)를 컨설팅할 때, 우리는 임의의 주어진 위치에서 상대적인 T> C 돌연변이율에서 유의미한 체계적인 변화를 관찰하지 못했다 (도 21). 우리는 s4U 대사성 표지화 마이크로 RNA 생체 내 합성 (biogenesis) 또는 로딩에 영향을 미치지 않는다고 결론을 내렸다.
배양된 초파리 S2 세포에서 s4U 대사성 RNA 표지화 후 SLAM-seq는 정량적으로 단일 뉴클레오티드 분해능에서 작은 RNA에서 s4U 통합 이벤트를 복구하였고 마이크로 RNA의 생체내 생성 및 로딩에 대한 s4U 표지화의 위치 의존적 영향은 유의하지 않은 것으로 나타났다.
실시예 8 : 마이크로 RNA 생체 내 발생의 세포 내 카이네틱
마이크로 RNA는 핵에서 도로샤 (Drosha)와 세포질에서 다이서 (Dicer)에 의해 순차적으로 가공(처리)된 헤어핀-함유 NA 중합 효소 II 전사체에서 유래되고, 성숙한 miRNA 이중체를 발생시킨다 (도 13). miRNA 생체 내 생성의 세포 내 카이네틱을 조사하기 위해, s4U로 대사성 표지화 후 5 분, 15 분, 30 분 및 60 분에 초파리 S2 세포의 크기-선택된 총 RNA로부터 제조된 작은 RNA 라이브러리에서 풍부하게 발현된 miRNA (정상 상태에서 > 100 ppm)의 T> C 돌연변이율의 증가를 측정하고, s4U 표지화 부재 하에서 검출된 오류율과 비교하였다 (도 13B). 5 분 정도로 짧은 표지화 시간이 지난 후, 모든 miR의 17 % 및 모든 miR*의 90 %가 최대 백그라운드 수준 이상의 오류율을 보이는, T> C 전환율의 상당한 (유의한) 상승을 검출하었다. 이 분율은 15 분, 30 분 및 1 시간 후에 각각 74 %, 93 % 및 100 % miR로 시간이 지남에 따라 증가한다. 보존적 측정에 기초하여, 모든 miRNA (42 개 중 22 개)의 50 % 이상이 단기간 (즉, 5분)에 검출 가능하게 생산되어 (즉, miR 또는 이의 각각의 miR* 파트너에서 최대 T> C 전환율 초과), miRNA-프로세싱 (가공)의 세포 내 조직에서의 현저한 효율을 나타내었다.
또한 시간이 경과에 따라 miRNA 분자의 수에 대한 프록시 (proxy)로 T> C 전환-포함 (함유) 판독의 수를 결정하였다 (도 13C). 평균적으로, 정상 상태 풍도(존재비)가 높은 miRNA는 또한 높은 생산율 (예 : miR-184 또는 miR-14)를 나타내고, 다른 것들은 높은 생체 내 합성률 (예 : miR-276b 또는 miR-190) 또는 그 반대의 경우 (즉, miR-980 또는 miR-11)에도 불구하고 낮은 정상 상태 풍도를 나타내었는데, 이는 miRNA의 생산율이 세포 내 풍도의 유일한 결정 요인이 아님을 나타낸다.
우리의 전반적 분석 결과는 전체 miRNA 생체 내 생성에서 예기치 않게 높은 효율이 나타났지만, 선택된 작은 RNA는 상당히 낮은 비율(속도)로 생산되었다. 이러한 비효율적으로 생산된 miRNA의 예는 도로샤-유도 프로세싱 (Drosha-directed processing) 대신에 스플라이싱에 의해 생성되는 미트론 (즉, miR-1003, miR-1006 또는 miR-1008; 도 13C)이었다. 스플라이싱-유래 전구체 헤어핀은, 3' 말단 스플라이스 수용체 부위를 인식하는 말단 뉴클레오티딜트랜스퍼라아제 테일러에 의한 우리딘화 (uridylation)를 위해 특별히 표적화되기 때문에, 선택적으로 약화될 수 있으며, 이로써 효율적인 다이서-매개 프로세싱을 방지하고 및 엑소핵산분해성 (exonucleolytic) 붕괴를 유발할 수 있다 (도 13D). 표준(정규, canonical) miRNA와 비교할 때, 미트론은 시간 경과에 따라 미트론은 T> C 돌연변이율이 현저히 감소하고 판독을 포함하는(함유하는) T> C 전환율이 덜 빠르게 축적되기 때문에, 우리의 데이터는 미트론 생체 내 합성 (mirtron biogenesis) 의 선택적 억제에 대한 실험적 증거를 제공한다 (도 13D). 예비(pre)-miRNA 헤어핀의 우리딘화가 미트론 생체 내 합성 (mirtron biogenesis)의 억제에 기반을 둔다는 가설에서, 우리는 pre-miR 테일링과 T> C 전환율 (conversion rate) 사이의 유의한 상관 관계를 발견하였다 (도 22).
요약하면, 새로운 방법은 miRNA 생산의 세포 내 속도에서 현저한 효율을 밝혀 내고 miRNA 생체 내 합성에 대한 전구체-헤어핀 우리딘화의 선택적 억제 효과의 요점을 설명한다.
실시예 9 : 리보핵단백질 (ribonucleoprotein) 복합체로의 작은 RNA 로딩 모니터링
마이크로 RNA 생체 내 합성은 miRNA 이중체를 생성한다. 그러나 miRNA 이중 체 (miR 가닥)의 두 가닥 중 하나만 우선적적으로 Ago1에 로딩되고 선택적으로 안정화되는 반면, 다른 가닥 (miR* 가닥)은 miRNA 로딩 과정에서 방출 및 분해된다 (도 14A). 본 발명의 방법이 살아있는 세포에서 miRNA 이중체 생산 및 miRNA 로딩의 프로세싱을 재현하는지 테스트하기 위해, 우리는 20 개의 miRNA에 대한 판독을 포함하는 T> C 전환의 상대적 축적을 분석하여 충분히 높은 수준의 miR과 그 파트너 miR*를 검출하였다 (도 14B). 우리는 s4U 대사성 표지화 후 (즉, 5 분, 15 분 및 30 분; Mann Whitney 검정 p> 0.05) 초기 시점에서 miR과 miR* 쌍의 풍도에서 유의미한 차이를 관찰하지 못했으며, 로딩으로부터 속도론적으로 (kinetically) 분리되는 프로세스에서 miRNA가 초기에 이중체로서 축적됨을 확인하였다. 1 시간 후, 우리는 miR* 가닥에 비해 miR의 축적이 유의하게 더 높다는 것을 검출하였고 (Mann Whitney test p <0.05, 도 14B), 이는 - 평균적으로 - miRNA의 Ago1 로의 로딩이 miRNA 생체 내 합성에 비해 훨씬 느린 속도로 발생한다는 것을 나타낸다.
보다 상세한 분석은 miRNA 축적의 기초가 되는 2 단계 과정 (biphasic process)을 밝혀냈다 : 첫 번째 단계는 miR과 miR* (kmiR = 0.35 ± 0.03과 kmiR* = 0.32 ± 0.03) 사이에서 동일했기 때문에, miRNA의 이중체로서 축적이 반영되었다. 특히, 두번째 느린 단계는 miR 및 miR* 둘 다에 대해 생체 내 합성 단계로부터 상쇄되었다. miR*s (kmiR* = 0.32 ± 0.03)의 축적률의 급격한 감소는 miR* 가닥의 대다수 (즉, ~ 81 %)가 miRNA 로딩의 결과로 급속히 분해되고 있음을 나타낸다. 대조적으로, miR 가닥은 miR* 가닥 (kmiR* = 0.32 ± 0.03)에 비해 훨씬 더 빠른 제 2 축적 률 (kmiR = 0.26 ± 0.03)을 나타내었고, 이는 miRISC 형성으로 인한 miR 가닥의 선택적 안정화를 설명한다. 그러나 초기 생체 내 합성율 (kmiR = 0.35 ± 0.03)과 비교할 때, miR도 2 단계 카이네틱 (kmiR = 0.26 ± 0.03)의 감소를 보여 주었으며, 단지 ~ 74 %의 miR- 가닥이 효과적으로 로딩되는 반면 miRNA의 약 4 분의 1은 이중체로서 아마도 분해될 것이다. 이것은 miRNA의 축적을 위한 주요 제한 요소를 나타내는 비어있는 (empty) 아르고너트-가용성 (Argonaute-availability)과 일치하며, 그들의 과발현은 세포 내 miRNA 풍도를 전체적으로 증가시킨다.
개별 miR : miR* 쌍에 대한 추가 조사 결과 miRNA 이중체 사이에서 다양한 로딩 효율이 나타났다: miR-184의 경우 몇 분 이내에 가닥 분리 - 따라서 로딩 -가 검출될 수 있지만, 밴탐 (bantam)은 ~ 30 분 이전에 가닥 분리가 발생하는 약간 지연된 로딩 카이네틱을 나타내었다; miR-282는 가장 효율적으로 로딩되지 않은 miRNA들 사이에 랭크되었다 (도 14D). 특히, 상이한 로딩 카이네틱은 Ago1 로딩에 대한 열역학적 규칙을 따랐으며, 여기서 miRNA 이중체의 시드 또는 3' 지지 영역에서의 불일치가 miRISC의 효율적인 형성을 촉진시켰다.
요약하면,이 새로운 방법은 miRNA 생체 내 합성 (biogenesis) 및 로딩 카이네틱에 대한 상세한 통찰 (insights)을 보여 주었다.
실시예 10 : 이소miR (IsomiR) 생산
축적 증거는, 다양한 세포 내 프로세스가 마이크로 RNA의 서열 및 기능을 다양화하지만, 기본 메카니즘은 잘 이해되지 않고 정상 상태의 작은 RNA 시퀀싱 라이브러리로부터 분석(dissect)하기 어렵다는 것을 시사한다. isomiR 생산을 위한 잘 확립된 한 가지 예는 파리에서의 miRNA의 엑소핵산분해성 성숙 (exonucleolytic maturation)이다. 초파리에서 miRNA의 대부분은 ~ 22nt 작은 RNA로 생산되지만, 선택된 miRNA는 더 길게, ~ 24mers로 생성되며, 이는 유전자 조절 miRISC를 형성하기 위해 3 '에서 5' 엑소리보뉴클레아제 니블러에 의해 매개되는 추가의 엑소핵산분해성 성숙을 필요로 한다. 표준 작은 RNA 시퀀싱 라이브러리 및 고-분해능 (high-resolution) 노던 혼성화 실험에서, miR-34-5p는 동일한 5' 이소폼 (isoform)의 3' 말단 절단 (truncation)으로부터 유래된 풍부하게 발현된 24-21mer 이소폼으로부터 다양한 길이의 프로파일 범위를 나타낸다 (도 15B). 다수의 miR-34-5p 이소폼을 발생시키는 이벤트의 세포 내 순서를 분리(구분)하는 본 발명 방법의 능력을 테스트하기 위해, 본 발명자들은 S2 세포의 총 RNA로부터 제조된 작은 RNA 라이브러리를 s4U-대사성 표지화 시간 경과 후에 분석하였다. 전체 시간 코스에서 매우 유사한 길이의 프로파일을 보이는 정상 상태의 작은 RNA와는 대조적으로, miR-34-5p 판독을 포함하는 T> C 전환은 재조합 Dcr-1 또는 파리 용해물 (fly lysate) 및 합성 pre-miR-34를 사용하는 이전의 시험관 내 프로세싱 실험과 일치하여, 24mer 이소폼으로 완전히 초기에 축적되었다 (도 15C, 하단). 3 시간 이후에, 우리는 miR-34-5p 3' 이소폼을 함유하는 더 짧은 T> C 전환의 출현을 검출하였다 (도 15C 상단). 이 시점부터 시간에 따른 miR-34-5p의 가중 평균 길이는 지속적으로 감소하여, 정상 상태에서 관찰된 miR-34-5p의 평균 길이 프로파일에 천천히 접근하였다 (도 15D). 본 발명자들은 본 발명의 방법이 니블러-유도 3' 에서 5' 엑소핵산분해성(용해성) 트리밍에 의해 예시된 바와 같이, isomiR의 발생을 밝혀냈다고 결론내었다.
miRNA의 엑소핵산분해성 성숙은 Ago1 로의 로딩을 필요로 하고 생화학적 증거는 아마도 니블러 (Nibbler)가 단일-가닥 특이적 3' 에서 5' 엑소리보뉴클레아제로서의 기능을 제안했기 때문에 트리밍이 miR* 가닥 제거 후에만 발생한다는 것을 시사한다. 우리의 방법으로 miRNA 로딩과 isomiR 생성을 동시에 측정할 수 있었기 때문에, miR-34-5p 트리밍 신호 (도 15D)와 miR-34 이중 로딩 카이네틱 (도 15E)을 비교하여 이 가설을 테스트 하였다. 우리는 1 시간의 대사성 표지화 후에, 라이브러리에서 miR-34-5p 및 -3p 축적의 오프셋에 의해 결정된 바와 같이, miR-34 로딩 및 miR* 가닥 제거 후에 실제로 트리밍이 발생한 것을 관찰 하였다 (도 15E). 결론적으로, 본 발명의 방법은 miRNA 이소폼 생산의 세포 내 순서를 밝혀 내고, 따라서 살아있는 세포에서 miRNA의 서열과 기능을 다양화하는 프로세스에 빛을 비출 수 있는 강력한 툴을 제공한다.
실시예 11 : 마이크로 RNA 안정성
상이한 miRNA가 달리 구별하기 어려운 단백질 복합체로 조립되는 동안, 누적 증거 (accumulating evidences)는 이들의 안정성이 극적으로 다를 수 있음을 시사한다 (도 16). 그러나 현재 이용 가능한 기술은 개별 miRNA에 대한 상대적인 반감기만을 측정하고 miRNA 안정성에 대한 자세한 이해를 가로막는다. 또한, 섭동(교란)되지 않은 조건 하에서 대사성 표지화는 표지된 작은 RNA의 대다수 (> 95 %)가 최대 하나의 s4U 통합 이벤트를 나타내도록 자극하는데 (도 20), 이는 개선된 비오티닐화 전략을 통해서도 정량적 회복에 불충분하고 (Duffy et al., 2015, 상기), miRNA에서 U-함량이 크게 다르기 때문에 상이한 miRNA 서열을 편향시킨다. 대조적으로, 본 발명의 방법은 표준 작은 RNA 라이브러리와 관련하여 절대적이고, 서열 함량-정규화된 miRNA 안정성에 대한 신속한 접근을 제공한다 (도 16). 최대 24 h 동안 s4U 대사성 표지화를 받은 초파리 S2 세포의 총 RNA로부터 제조된 SLAM-seq 작은 RNA 라이브러리에서 miRNA-U-함량으로 정규화된 T> C 전환율을 분석함으로써, 12 h 의 중간값 반감기를 결정하였다. 41 개의 풍부하게 발현된 miR 가닥에 대한 13 h 는 (도 16B), 평균 miRNA 반감기가 ~ 4-6 시간의 평균 반감기를 나타내는 mRNA에 비해 유의하게 (상당히) 길다는 것을 나타낸다. miR과 대조적으로, miR*은 0.44 h의 훨씬 짧은 반감기를 나타내었고 (도 16B), 이는 miR 로딩의 결과로서 향상된 턴오버와 일치한다 (도 14). 전반적으로, miR*은 miR에 비해 상당히 안정적이지 않다 (도 16C). 그러나, miR 조차도 불안정한 miR-12-5p (t1/2 = 1.7 h) 및 안정한 밴탐 -5p (t1/2> 24 h)에 의해 예시된 바와 같이, 1 배 이상의 크기에 의해 본질적으로 상이한 안정성을 나타냈다. 중요하게도, 본 발명의 방법은 개개의 작은 RNA 반감기에 대한 강력한 통찰력을 제공하여, 다양한 작은 RNA 안정성에 걸쳐 재현성이 높은 결과를 제공한다 (도 16E).
정상 상태에서 최고 수준으로 누적된(축적된) 2 개의 miRNA에 의해 예시된 바와 같이, 마이크로 RNA 안정성은 S2 세포에서 작은 RNA 프로파일의 확립에 주요 기여 인자이다 : 밴텀은 상대적으로 느린 생체 내 합성 (도 13)과 중간 로딩 속도 (도 14)를 보였지만, 비정상적으로 높은 안정성 (t1/2> 24 h)으로 인해 최고 정상 상태 수준까지 누적(축적)되었다. 대조적으로, 두 번째로 가장 풍부한 miRNA인 miR-184-3p는 밴탐-5p (t1/2 = 6 h)에 비해 3 배 덜 안정적이지만, 매우 높은 생체 내 합성 및 로딩 카이네틱 때문에 여전히 높은 수준으로 축적된다 (도 13 및 14). 따라서 SLAM-seq에 의한 작은 RNA의 대사성 시퀀싱은 miRNA-매개 유전자 조절에 대한 주요 결정인자인 정상 상태 작은 RNA 프로파일의 확립에 대한 miRNA 생체 내 합성, 로딩 및 턴오버의 상대적인 기여도를 밝혀 낸다.
실시예 12 : 아르고너트 단백질 동일성은 작은 RNA 안정성을 정의한다
포유류와 곤충 모두의 게놈은 아르고너트 (Argonaute) 단백질 군의 여러 단백질을 암호화하는데, 그 중 일부는 다양한 메커니즘에 의해 전사체의 구분된 서브세트를 조절하기 위하여 작은 RNA를 선택적으로 로딩한다. miRNA 이중체 (듀플렉스)는 본질적으로 비대칭적이고, 즉 miR 가닥이 우선적으로 Ago1에 로딩되는 반면, 각각의 miRNA 전구체는 파리에서 2 개의 별개의 편재적으로 (ubiquitously) 발현된 아르고너트 단백질로 차등적으로 분류되는 2 개의 성숙한 작은 RNA 가닥을 잠재적으로 생성할 수 있다. 대부분의 miR과 대조적으로, miR*는 종종 기능성 종으로서 RNAi 경로에서 이펙터 단백질인 Ago2에 로딩되고, Ago2-RISC 조립의 최종 단계에서 메틸트랜스퍼라아제 Hen1에 의해 3' 말단 리보오스의 2' 위치에서 선택적 메틸화를 겪는다. (도 17A). Ago2의 고갈은 세포 생존력을 손상시키지 않으며, 작은 RNA의 선택적 안정화에서 Ago 단백질의 역할을 조사할 수 있게 한다. 또한, 작은 RNA 반감기가 그들이 연관된 Ago 단백질의 동일성에 의해 본질적으로 결정되는지 이해하기위한 실험적 프레임 워크를 제공하였다.
우리는 먼저 일반적인 작은 RNA 복제 (주로 Ago1-결합 작은 RNA 반영)에 의해 총 RNA에서 생성된 작은 RNA 라이브러리를 총 RNA에서 생성되지만 산화에 의해 메틸화된 (즉, Ago2-결합) 작은 RNA를 풍부하게 하는 라이브러리와 비교하여 야생형 초파리 S2 세포에서 Ago2로 특이적으로 조립될 수 있는 miRNA 세트를 확립하였다. 통상적인 클로닝 접근법에서 작은 RNA의 대부분은 miRNA (특히 miR 가닥)로 구성되어 있지만, 산화는 트랜스포손, 유전자 (주로 겹치는 mRNA 전사체로부터 유래) 및 긴 폴드-백 전사체를 생성하는 유전자좌 (구조화된 유전자좌)로부터 유래된 Ago2-결합 내인성 작은 RNA를 선택적으로 농축시킨다. 전술한 바와 같이, 메틸화 (즉, Ago2-결합) miRNA의 서브세트는 miR*에 대해 선택적으로 농축되었다. 비산화 및 산화된 작은 RNA 라이브러리의 비교를 통해 Ago1 또는 Ago2에서의 축적에 따라 miR 및 miR* 가닥을 분류할 수 있다 (도 17C). CRISPR/Cas9 게놈 공학에 의해 Ago2가 고갈된 야생형 S2 및 S2 세포에서 생성된 기존의 작은 RNA 라이브러리에서 Ago2-농축(풍부) 작은 RNA의 풍도를 비교함으로써 (도 17D), 본 발명자들은 Ago2-농축(풍부) 작은 RNA가 Ago2의 고갈 시 유의하게 덜 풍부하다는 것을 확인하였다 (p <0.002, 윌콕슨 부호 순위 검정, 도 17E).
다음으로 s4U 대사성 표지화에 이어 SLAM-seq에 의해 야생형 및 Ago2-고갈 된 (ago2ko) 세포로부터 사전 분취된 총 작은 RNA 라이브러리에서 작은 RNA 안정성을 측정함으로써 Ago2-농축 작은 RNA의 안정성을 결정하였다. 야생형 세포에서, Ago2-농축 작은 RNA는 2-단계 붕괴 카이네틱을 따랐으며, 여기서 집단의 대다수 (즉, 94 %)는 높은 안정성 (t1/2> 24h)을 보였으며 소수만이 miR* 과 유사한 반감기(t1/2 = 0.2 h)로 급속한 붕괴를 겪었다. 긴 반감기와 연관된 모집단이 메틸화된 작은 RNA 라이브러리에서 동일한 작은 RNA 종의 안정성을 결정함으로써 Ago2-결합 분율을 나타낼 수 있는지 시험하였다. 실제로, Ago2-농축 작은 RNA는 > 24 시간의 반감기를 갖는 단일 지수 붕괴 카이네틱을 따랐다 (도 17F). 반대로, Ago2-고갈된 S2 세포에서, Ago2-농축 작은 RNA는 다시 듀얼-단계 붕괴 카이네틱을 따랐으나, 집단의 대다수 (63 %)는 miR*-유사 안정성 (t1/2 = 0.4 h)을 나타내며, 이는 Ago2의 부재 하에서, 이들 작은 RNA 파트너 가닥이 Ago1에 로딩 될 때 주로 붕괴된다는 것을 나타낸다. 대조적으로, Ago1-농축 작은 RNA는 Ago2의 존재 및 부재에서 동일한 안정성을 가졌다 (도 17F). 따라서 우리의 데이터는 특정 Ago-단백질로의 로딩에 의해 결정되는 miRNA의 집단-특이적 (population-specic) 안정성을 밝혀 낸다.
마지막으로, 작은 RNA 반감기가 그들이 연결하는 Ago 단백질의 정체성에 의해 본질적으로 결정되는지를 분석하기 위해, Ago1 및 Ago2에서 가장 풍부한 30 개의 작은 RNA의 안정성을 비교 하였다 (도 17G). 이 분석은 Ago2-결합된 작은 RNA는 Ago1-결합된 작은 RNA (p <10-4; 맨 휘트니 검정)와 비교하여 상당히 높은 안정성을 나타냄을 보여 주었는데, 아마도 Ago2-결합된 작은 RNA의 메틸화가 Ago1이 아닌 Ago2에서 작은 RNA의 안정화에 기여하기 때문일 것이다.
요약하면, 우리는 건강과 질병에서 유전자 발현 상태에 영향을 미치는 작은 RNA 프로파일의 확립 및 유지를 기본으로 하는 분자 메커니즘의 분석을 위한 실험적 프레임 워크를 제공한다.
실시예 13 : SLAM-seq는 BRD4-MYC 축의 직접적 유전자 조절 기능을 정의한다.
BRD4 및 MYC와 같은 전사 조절 인자의 직접 표적 유전자를 정의하는 것은 기본 세포 기능을 이해하고 치료 개발을 위해 중요하다. 그러나 직접적인 조절 관계를 해독하는 것은 여러 가지 이유로 여전히 어려운 과제이다. 게놈 결합 부위는 예를 들어 염색질 면역 침전 및 시퀀싱 (ChIP-seq)에 의해 맵핑될 수 있지만, 단지 인자의 결합은 이웃 유전자에 대한 조절 기능을 예측하지 못한다. 대안적인 접근법은 주어진 조절자의 실험적 교란에 따른 차등 발현 프로파일링과 관련된다.
SLAM-seq가 또한 예를 들어 시그널링 경로의 섭동에 의해 유발된 보다 특정한 전사 반응을 포착하는지 여부를 추가로 시험하기 위해, 우리는 K562 세포를 그들의 구동 (driving) 종양 유전자 BCR/ABL의 소분자 억제제 및 MEK 및 AKT로 처리하였고, 이는 BCR/ABL의 구분된 시그널링 캐스케이드 다운스트림에서 매개체로서 작용한다 (도 25D, 도 30, A 및 B).
세포 배양
백혈병 세포주 K562, MOLM-13 및 MV4-11을 RPMI 1640 및 10 % 소태아혈청 (FCS)에서 배양 하였다. OCI/AML-3 세포를 10 % FCS를 함유하는 MEM-알파에서 성장시켰다. HCT116 및 Lenti-X 렌티 바이러스 패키징 세포 (Clontech)를 DMEM 및 10 % FCS에서 배양 하였다. 모든 성장 배지에는 L 글루타민 (4mM)이 보충되었다. 성장 곡선을 위해, 세포를 100μM IAA (인돌-3-아세트산 나트륨 염, 시그마-알드리치)의 존재 또는 부재하에 2·106 세포/ml의 초기 밀도로 시딩하고, 배지와 IAA를 리뉴얼하고 세포의 서브-컨플루언트를 유지하기 위하여 1 : 2.6의 비로 24 시간마다 분할 하였다. Guava EasyCyte 유세포 분석기 (Merck Millipore)를 사용하여 24 시간마다 세포 밀도를 측정 하였다.
72 시간 동안 JQ1 및 NVP-2의 조합으로 처리된 세포의 생존력 분석을 CellTiter-Glo 루미니선트 셀 바이어빌리티 어세이 (CellTiter-Glo Luminescent Cell Viability Assay (Promega)를 사용하여 수행하였다. 엔스파이어 멀티모드 플레이트 리더 (Per-kin Elmer)를 사용하여 상대 발광 신호 (RLU)를 기록하였다. 약물 치료에 대한 분별 반응은 α = 1-(RLU 처리 / RLU 미처리)로 정의되었고 상승 작용은 블리스 가성성(부가성)(eob)에 대한 초과로 계산되었으며, 여기서 eob = αNVP-2,JQ1 - αJQ1 - (αNVP-2 · 1 - αJQ1)이다.
이 실시예에서 사용된 플라스미드 및 벡터
플라스미드 pLCG (hU6-sgRNA-EFS-SpCas9-P2A-GFP)로부터 SpCas9 및 sgRNA를 발현시켰다. pLCG는 공개적으로 이용 가능한 Cas9 발현 벡터 (lentiCRISPR v2, Addgene 플라스미드 # 52961)를 기초로 클로닝되었고 개선된 chiRNA 컨텍스트 (context)를 포함한다. pLCG에 sgRNA 서열이 클로닝되었다. 표적 유전자좌의 상동성 지향 복구 (homology directed repair)를 위한 공여자로서, AID 녹-인 카세트가 유전자 합성 (통합 DNA 기술) 및 표적 세포주의 게놈 DNA로부터의 ca. 500bp 상동성 아암 (HA)의 PCR-증폭에 의해 생성되었다.
모든 구성 성분은 형질 감염을 모니터링하기 위한 구성적 GFP 발현을 추가로 제공하는 렌티 바이러스 플라스미드 골격 (Addgene plasmid # 14748)으로 조립되었고, 최종 벡터 pLPG-AID-BRD4 (5'HA-BlastR-P2A-V5-AID-스페이서-3'HA-hPGK-eGFP) 및 pLPG-MYC-AID (5'HA- 스페이서-AID-P2A-BlastR-3'HA-hPGK-eGFP)를 생성하였다.
급성 단백질 고갈 실험을 위해, 공개된 렌티 바이러스 벡터 SOP (pRRL-SFFV-Tir1-3xMYC-tag-T2A-Puro)를 사용하여 Oryza sativa Tir1을 도입 하였다. 경쟁적 증식 분석을 위해, 벡터 SO-블루 (pRRL-SFFV-Tir1-3xMYC-tag-T2A-EBFP2)를 사용하여 Tir1을 도입 하였다. shRNAmir-인서트를 전달하는 벡터 LT3GEN을 사용하여 RNAi를 수행 하였다.
게놈 편집 및 렌티 바이러스 형질 도입
AID 녹-인 세포주를 유도하기 위해, 플라스미드 pLCG 및 pLPG를 MaxCyte STX 전기천공기 (K562)를 사용한 전기 천공 또는 FuGENE HD 형질 감염 시약 (Promega, HCT116)을 사용한 형질 감염에 의해 공동-전달 하였다. 성공적인 녹인을 위해 블라 스티시딘 (10㎍/ml, Invitrogen)으로 선별한 후, BD FACSAria III 세포 분류기 (BD Bio-sciences)를 사용하여 GFP-단일 세포 클론을 분리 하였다. 클론은 조 세포 용 해물 상에서 PCR-유전자형 분석에 의해 특성화되었다. 녹인은 태그된 단백질의 면역 블롯팅에 의해 추가로 확인되었고, K562의 경우, 클론은 야생형 세포의 면역 표현형과 가장 잘 일치하는 유세포 분석으로 특성화되었다.
급성 단백질 고갈 실험을 위해, 검증된 동형 접합 AID 녹-인 클론을 Tir1 발현 벡터 SOP로 형질 도입 하였다. 렌티 바이러스 입자의 패키징은 표준 절차에 따라 바이러스 플라스미드 및 헬퍼 플라스미드 pCMVR8.74 (애드진 플라스미드 # 22036) 및 pCMV-VSV-G (애드진 플라스미드 #8454)의 폴리에틸렌이민 형질감염 (PEI, MW 25000, 폴리사이언스) 에 의해 Lenti-X 세포에서 수행되었다. 표적 세포는 제한 희석에서 감염되고 퓨로마이신 (2㎍/ml, Sigma-Aldrich)에서 선택되었다. 전이 유전자의 잠재적 침묵을 피하기 위해 새로 형질 도입되고 선택된 세포로 모든 고갈 실험을 수행 하였다.
면역 블롯팅 및 면역 표현형
1 차 항체의 화학 발광 검출은 HRP-접합된 2 차 항체 (Cell Signaling Technology, 카탈로그 번호 # 7074, # 7076 및 # 7077)를 사용하여 수행되었다. 대안적으로, 토끼 및 마우스 일차 항체의 형광 검출은 오디세이 CLx 이미징 시스템 (LI-COR 바이오사이언스) 상에서 이차 항체 IRDye 680RD 염소 항-토끼 IgG 및 IRDye 800CW 염소 항-마우스 IgG (LI-COR)를 사용하여 수행하였다.
면역 표현형을 위해, 세포를 FACS-완충제 (PBS 중 5 % FCS)로 세척하고, FCS-수용체 차단 펩티드 (Human TruStain FcX, Biolegend, FACS-완충제로 1:20 희석)와 함께 10’동안 실온에서 사전 배양 하였다. 플루오로포어-접합된 항체를 1 : 400의 최종 희석에 첨가하고, 세포를 4 ℃에서 20 분 동안 인큐베이션 하였다. BD LSRFortessa 유세포 분석기 (BD Biosciences)에 대한 분석 전에 염색된 세포를 2 회 세척하고 FACS-버퍼에 재현탁시켰다.
크로마틴 분별
크로마틴 (염색질) 분별을 위해, 세포를 빙냉 PBS에서 세척하고 염색질 추출 완충액 (20mM Tris-HCl, 100mM NaCl, 5mM MgCl2, 10 % 글리세롤, 0.2 % IGEPAL CA-630, 20mM β-글리세로포스페이트, 2mM NaF, 2mM Na3VO4, 프로테아제 억제제 칵테일 (EDTA-free, Roche), pH 7.5)에 재현탁하였다. 불용성 분획을 원심 분리 (16000g, 5', 4 ℃)에 의해 침전시키고, 염색질 추출 완충액으로 3 회 세척한 후 이를 재현탁시켰다. 총 세포 분획 및 상청액을 각각 첫 번째 침전 전 및 후에 샘플링 하였다. 모든 분획에 SDS (소듐 도데실 설페이트, 0.1 % (w/v))를 보충하고, 벤조나아제 (Merck Millipore, 30', 4 ℃)로 분해하고 Bioruptor 초음파 장치 (Diagenode)에서 초음파 처리하여 재용해시켰다.
SLAM-seq
모든 SLAM-seq 분석은 부착 세포에 대해 60-70 % 컨플루언시 또는 현탁 세포에 대한 혈구 계수에서 계수된 최대 세포 밀도의 60 %에서 수행되었다. 각각의 분석 5-7 시간 전에, 성장 배지를 흡인하고 교체 하였다. 달리 언급되지 않는 한, 세포는 지시된 소분자 억제제 또는 100 μM IAA로 30 분 동안 전처리되어 완전한 표적 억제 또는 분해를 사전 설정한다. 새로 합성된 RNA는 100μM 4-티오우리딘 (s4U, Carbosynth)의 최종 농도에서 개별 시간 범위 (45' 또는 60')로 표시되었다. 드라이아이스상에서 플레이트를 직접 스냅 동결시켜 부착 세포를 수확하였다. 현탁 세포를 회전시키고 즉시 스냅 동결 (snap-freezing) 시켰다. RNA 추출은 RNeasy Plus Mini Kit (Qiagen)를 사용하여 수행되었다. 총 RNA를 15' 동안 아이오도아세트아미드 (Sigma, 10mM)에 의해 알킬화시키고, 에탄올 침전에 의해 RNA를 재정제 하였다. 500ng 알킬화된 RNA를 시판 키트 (일루미나 용 QuanSeq 3 'mRNA-Seq 라이브러리 제조 키트 FWD 및 일루미나, 렉소젠(Lexogen) 용 PCR 애드온 키트)를 사용하여 3'mRNA 서열 분석 라이브러리를 생성하기 위한 인풋(input)으로서 사용 하였다. 딥 시퀀싱은 HiS-eq1500 및 HiSeq2500 플랫폼 (Illumina)을 사용하여 수행되었다.
차등 유전자 발현 분석, PCA 및 GO-텀 (GO-term) 농축(강화)
유전자 수준 분석의 경우, 동일한 유전자의 다른 UTR 주석에 매핑된 원시 판독 (raw reads)을 Entrez Gene ID로 요약하였다. 키나아제 억제제를 사용한 K562 세포의 파일럿 연구는 단일 실험으로서 수행되었다. 차등 유전자 발현의 분석은 50bp 시퀀싱 실행 (플라보피리돌 및 DMSO)에 대한 하나 이상의 조건에서 ≥10 의 판독을 갖는 유전자 또는 100bp 시퀀싱 실행 (mk2206, 트라메티닙, 닐로티닙, 트라메티닙 + mk2206 및 DMSO)에 대한 하나 이상의 조건에서 ≥ 20 의 판독을 갖는 유전자로 제한된다. 적어도 20 개의 판독을 갖는 유전자로 제한됨 + mk2206 및 DMSO). 차등 발현을 추정하기 위해, 1 개의 원시 판독의 의사-카운트 (pseudo-count)를 모든 유전자에 추가하였다.
다른 모든 SLAM-seq 실험은 3 번 수행되었으며 다음과 같이 분석되었다. 차등 유전자 발현 호출은 기본 설정과 함께 DESeq2 (버전 1.14.1)를 사용하여 ≥ 2 T>C 전환(전환)을 갖는 원시 판독 카운트(수)에서 또는 전체 정규화에 대한 상응하는 총 mRNA 판독에 대해 추정된 크기 인자를 갖는 원시 판독 카운트에서 수행되었다. 다운 스트림 분석은 DESeq2에 의한 FDR 추정을 위해 모든 내부 필터를 통과하는 유전자로 제한되었다. 주된 성분 분석은 주어진 실험의 모든 조건에서 500 개의 가장 가변적인 유전자에 대한 변이 안정화 변형 후 수행되었다. PANTHER 과잉표현 테스트 (ANTHER Overrepresentation Test) (FDR 다중 테스트 수정을 통한 Fisher's Exact, pantherdb.org)에 의해 K562MYC-AID + Tir1에서 IAA-처리 시 SLAM-seq에서 유전자에 대해 현저하고 강하게 하향조절된 (FDR ≤ 0.1, log2FC ≤ -1) 유전자에 대해 GO-텀 (GO-term) 농축 분석을 수행 하였다.
mRNA 턴오버 추정
교란되지 않은 K562 세포에서 mRNA 턴오버의 대략적인 추정치를 얻기 위해, mRNA 생합성의 정상 상태 평형을 가정하고, 연장된 s4U 노출 후 완전한 표지화에 접근하는 1 차 카이네틱으로 붕괴시켰다. 임의의 유전자 i에 대해, 60 분의 s4U 표지 후 총 판독 횟수 내에서 전환된 판독 (≥ 2 T> C 전환율)의 분율 βi은 세포 mRNA 반감기를 다음과 같이 계산하는데 사용될 수있다 :
Figure pct00004
크로마틴 면역 침전 후 심층 시퀀싱 (ChIP-Seq)
ChIP-Seq의 경우, 1·108 ~ 2·108 K562AID-BRD4 + Tir1 세포를 100μM IAA 또는 DMSO로 1 시간 동안 처리하고, 실온에서 10' 동안 1 % 포름알데히드와 가교결합시키고 5' 동안 500mM 글리신으로 퀀칭 후 얼음 냉각 PBS로 2 회 세척 하였다. 핵의 단리 후, 펠렛을 단백질 분해 효소 억제제 (Complete, Roche)를 함유하는 용해 완충액 (10mM Tris-HCl, 100mM NaCl, 1mM EDTA, 0.5mM EGTA, 0.1 % Na-데옥시콜레이트 및 0.5 % N- 라우로일사르코신, pH 8.0)에 용해시켰다. 크로마틴 전단은 Bioruptor 초음파 처리 장치 (Diagenode)를 사용하여 수행되었다. 세포 파편을 16000g에서 10' 동안 4 ℃에서 원심 분리하여 펠렛화 하였다. DMSO- 및 IAA- 처리된 ChIP- 샘플 크로마틴 사이의 직접적인 비교를 허용하기 위해, RN2 : K562 ≒ 1:10의 비에서 내부 표준화를 위한 스파이크-인 컨트롤(대조군)로서 마우스 AML 세포주 (RN2)로부터의 크로마틴을 첨가 하였다. 트리톤 X-100을 첨가하고 (1 % 최종 농도), 5-10㎍의 항체와 함께 크로마틴 용해물을 회전 휠 상에서 4 ℃에서 밤새 인큐베이션함으로써 면역 침전을 수행 하였다. 항체-크로마틴 복합체를 회전 휠 상에서 4 ℃에서 2 시간 동안 자성 세파로오스 비드 (G & E Healthcare; TE에서 1mg / ml BSA로 2 시간 동안 실온에서 차단됨)로 포획 하였다. 비드는 RIPA 완충액 (150mM NaCl, 50mM Tris-HCl, 0.1 % SDS, 1 % IGEPAL CA-630, 0.5 % Na-데옥시콜레이트, pH 8.0), Hi-Salt 완충액 (500mM NaCl, 50mM Tris- HCl, 0.1 % SDS, 1 % IGEPAL CA-630, pH 8.0), LiCl 완충액 (250mM LiCl, 50mM Tris-HCl, 1 % IGEPAL CA-630, 0.5 % Na-데옥시콜레이트, pH 8.0)으로 각가 1회 및 TE로 2 회 세척되었다. 면역 복합체를 1 % SDS, 100mM NaHCO3에서 용리시켰다. 샘플을 37 ℃에서 30 분 동안 RNase A (100μg/ml)로 처리하고, NaCl (200mM)을 첨가하고, 65 ℃에서 6 시간 동안 가교를 역전시킨 후, 2 시간 동안 45 ℃에서 200 μg/ml의 단백질분해효소 K로 분해하였다. 침전된 물질뿐만 아니라 전단된 크로마틴 투입물 (ChIP에 사용된 물질의 1 %)로부터 페놀-클로로포름 추출 및 에탄올 침전에 의해 게놈 DNA를 회수 하였다. 일루미나 (Illumina) 시퀀싱을 위한 라이브러리는 일루미나 용 NEBNext 울트라 II DNA 라이브러리 프렙 키트 (NEBNext Ultra II DNA Library Prep Kit for Illumina) (New England Biolabs, #7645)를 사용하여 제조되었다.
스파이크-인 제어된 ChIP-seq 데이터 분석
스파이크-인 제어 ChIP-seq 샘플의 분석을 위해, 인간 및 마우스 게놈 서열 (GRCh38 및 mm10)을 병합함으로써 하이브리드 기준 게놈을 제조 하였다. 먼저 bowtie2 v2.2.9 (-민감한)를 사용하여 이 하이브리드 게놈에 대해 판독을 정렬한 후 인간 및 마우스 빈(bin)으로 분리 하였다. 각 트랙의 판독 적용 범위는 deeptools v2.5.0.1을 사용하여 계산되었으며 스파이크-인 정규화 요소를 사용하여 크기를 다시 조정하였다. DMSO-처리된 샘플과 IAA-처리된 샘플 사이의 비율을 계산하기 전에 생성된 정규화된 커버리지 트랙이 해당 인풋(input) 신호에 의해 더 감산되었다.
ChIP-seq 및 Click-seq 데이터의 재분석 및 수퍼-인핸서 호출
이전에 공개된 Click-seq 데이터, H3K27ac ChIP-seq 데이터 및 투입(인풋) 샘플은 컷어댑터(cutadapt)를 사용하여 어댑터 시퀀스를 제거한 후 bowtie (버전 1.1.2)로 GRCh38에 다시 정렬되었다. K562 세포의 경우, 수퍼-인핸서 근위 유전자가 사용되었다. MV4-11 및 MOLM-13의 경우 기본 매개 변수와 함께 MACS2 (v2.1.0.20140616)를 사용하여 H3K27ac 피크를 호출하였다. 기본 매개 변수와 함께 ROSE v0.1을 사용하여 수퍼 인핸서 호출이 수행되었다. 수퍼-인핸서는 100kb 내에서 가장 가까운 TSS에 기초하여 유전자에 할당되었다. 후속 비교는 할당된 Entrez GeneID 및 SLAM-seq에서 검출 가능한 발현을 갖는 수퍼-인핸서 근위 전사체로 제한되었다.
전사 반응의 예측 모델링
GRCh38.p9의 모든 Refseq 전사체의 TSS 위치는 www.ensembl.org/biomart에서 다운로드되었다. 각각의 가닥 상의 각 TSS로부터 300bp 내의 CAGE-seq 판독 밀도는 K562 세포의 공개된 CAGE-seq 데이터로부터 추출되었다. 두 번의 반복 실험에서 가장 높은 평균 신호를 갖는 TSS는 추가 분석을 위해 유지되었다. 공개적으로 이용 가능한 213 개의 사전 분석된 ChIP-seq 트랙과 1 개의 전체 게놈 바이설파이트 시퀀싱 실험은 ENCODE 프로젝트 (www.encodeproject.org/) 또는 Cistrome Data Browser (cistrome.org/db/)에서 얻었다. 각 TSS 주변의 500 및 2000bp 내의 ChIP-seq 신호는 분류 모델링을 위한 인풋(input)으로 사용되었다.
JQ1 과민증의 예측 모델링을 위해, SLAM-seq (FDR ≤ 0.1, log2FC ≤ -0.7)에 의해 측정된 200nM JQ1에 대한 K562 세포의 반응에 기초하여 유전자를 하향 조절된 것으로 분류 하였다. 영향을 받지 않는 유전자 (FDR> 0.1, -0.1 ≤ log2FC ≤ 0.1)는 반복 샘플링 및 콜모고로프-스미르노프 검정(Kolgogorov-Smirnov test)에 의한 표적 분포와 비교하여 동일한 크기 및 기준선 mRNA 발현에서 매치된 컨트롤 세트를 제공하기 위하여 서브 샘플링되었다. 쿼리(Query) 및 컨트롤 유전자를 TSS-ChIP-seq 신호 매트릭스와 교차시키고 트레이닝 (75 %) 및 테스트 세트 (25 %)로 나누었다. CARET 패키지를 사용하여 파라미터를 튜닝하는 동안 5 배 이상의 교차 검증을 통해 5 개의 독립적 분류기 (엘라스틱 넷 GLM, 기울기 부스팅 머신 및 선형, 다항식 및 방사형 커널이 있는 SVM)를 트레이닝하기 위해 스케일링 및 센터링된 ChIP 신호를 사용하였다. 모든 4 개의 최종 모델의 성능을 보류 (held-out) 테스트 세트에서 비교하였다.
MYC-의존성 전사의 예측 모델링을 위해, 유전자는 K562MYC-AID +Tir1 세포에 IAA- 처리 시, SLAM-seq에서의 반응에 기초하여 하향조절된 (FDR ≤ 0.1, log2FC ≤ -1) 또는 영향을 받지 않는 (FDR ≤ 0.1, -0.2 ≤ log2FC ≤ 0.2) 것으로 분류되었다. 영향을 받지 않는 유전자를 추가로 서브 샘플링하여 JQ1 반응 모델링에 대해 기술된 바와 같이 동일한 크기 및 발현-매칭 컨트롤 세트를 제공하였다. 샘플 크기가 크면 유전자를 트레이닝 (60 %) 및 테스트 세트 (20 %)와 추가 검증 세트 (20 %)로 나누고 JQ1 반응 모델링에 대해 설명된대로 처리하였다.
세포주 및 암 환자 RNA-seq 데이터에서 직접 MYC 표적 시그니처 분석
경험적 MYC 반응 시그니처와 MYC 발현의 비교를 위해, 672 인간 암 세포주의 FPKM-정규화된 유전자 발현 데이터를 Klijn et al. (Nat. Bio-technol. 33, 306?12 (2015))로부터 얻었다. MYC보다 높은 수준에서 MYCN 또는 MYCL을 발현하는 세포주는 제외되었고, 나머지 샘플은 MYC- 높음 (상위 20 % MYC 발현) 또는 MYC 낮음 (하위 20 % MYC 발현)으로 분류되었다. K562MYC-AID + Tir1 및 HCT116 MYC-AID + Tir1에서 유의미하게 하향조절된 (FDR ≤ 0.1), 그리고 Entrez GeneID에 의해 세포주 발현 데이터 세트에 주석을 단 (annotated) 모든 유전자 중에서, 두 세포주에서 가장 강한 평균 하향 조절을 갖는 100 개의 유전자를 공통 MYC 반응 시그니처로 정의하였다. 모든 시그너처 유전자의 발현에 대한 균형 잡힌 추정치를 얻기 위해, 각 유전자에 대한 FPKM 값을 모든 세포주에 걸쳐 스케일링하고 모든 시그너처 유전자의 스케일링된 발현 값을 각 세포주에 대해 평균화 하였다. 11 개의 TCGA 프로젝트에서 5583 명의 암 환자에 대한 상한 사분위의 정규화된 유전자 발현 데이터를 portal.gdc.cancer.gov에서 다운로드하여 세포주 데이터 세트에 대해 설명한 대로 각 암 유형에 대해 독립적으로 처리하였다. 유전자 세트 농축 분석을 GSEA Desktop v3.0 베타를 사용하여 수행 하였다.
프로테오믹스 (proteomics)을 위한 샘플 준비
K562AID-BRD4 + Tir1 세포를 100μM IAA 또는 DMSO로 60' 동안 3 회의 독립적 인 실험에서 처리하고, 빙냉 PBS로 3 회 세척하고, 원심 분리 및 스냅 동결에 의해 펠렛화 하였다. 펠렛을 용해 완충액 (10M 우레아, 50mM HCl)에 재현탁시키고 실온에서 10' 동안 인큐베이션 한 후 1M 트리스-버퍼 (Tris-HCl, cfinal = 100mM, pH 8)로 pH를 조정 하였다. 핵산을 벤조나아제 (Merck Millipore, 펠렛 당 250U, 1 시간 37 ℃)로 분해하고, DTT (4mM, 30’, 37 ℃)로 퀀칭 (quenching)하기 전에 알킬화 (15mM, 30', 실온)를 위하여 아이오도아세트아미드를 첨가하였다. 단백질 분해를 위해, 샘플 당 200㎍ 단백질을 100mM 트리스-버퍼로 6M의 요소 농도로 희석하고 1:50 (3h, 37 ℃)의 효소-대-단백질 비율에서 Lys-C (Wako)로 분해시켰다. 샘플을 100mM 트리스-버퍼로 추가로 희석시켜, 1:50 의 효소-대-단백질 비율로 트립신 (트립신 골드, 프로메가)으로 분해(37 ℃, 밤새)된 2M의 최종 우레아 농도가 되도록 하였다. 10 % 트리플루오로 아세트산 (TFA, Pierce)을 사용하여 pH를 <2로 조정하고 C18 카트리지 (Sep-Pak Vac (50mg), Waters)를 사용하여 탈염시켰다. 펩타이드를 70 % 아세토니트릴 (ACN, 크로마솔브, 구배 등급 (gradient grade), 시그마-알드리치) 및 0.1 % TFA로 용리시킨 후 동결 건조시켰다. TMTsixplex Isobaric Label 시약 세트 (Thermo Fisher Scientific)를 사용하여 등압 (Isobaric) 표지화를 수행하고, 샘플을 등 몰량으로 혼합하고 동결 건조시켰다. C18 카트리지를 사용하여 재정제한 후, 펩티드를 70 % ACN 및 0.1 % 포름산 (FA, Suprapur, Merck)으로 용리시킨 후 동결 건조시켰다.
강력한 양이온 교환 크로마토그래피 (SCX)에 의한 프로테오믹스 샘플 분별
건조된 샘플을 SCX 완충제 A (5mM NaH2PO4, 15 % ACN, pH 2.7)에 용해시켰다. SCX는 UltiMate 3000 래피드 세퍼레이션 (Rapid Separation) 시스템 (Thermo Fisher Scientific)을 사용하여 35μl/min의 유량과 맞춤형 TOSOH TSKgel SP-2PW SCX 컬럼 (5μm 입자, 12.5nm 기공 크기, 1mm id x 250mm)을 사용하여 200μg의 펩티드에서 수행되었다. x 250mm). 분리를 위해, 10분(10') 동안 100 % 완충제 A로 시작하여 3 원 구배 (ternary gradient)를 사용한 후, 80분 (80') 간 10 % 완충제 B (5mM NaH2PO4, 1M NaCl, 15 % ACN, pH 2.7) 및 50 % 완충제 C (5mM Na2HPO4, 15% ACN, pH 6)로, 10분(10') 간 완충제 B 및 50 % 완충제 C로, 10분(10') 간 완충제 B 및 50 % 완충제 C로 선형 증가 시키고 및 추가 15 분 (15') 동안 등용매 용리 (isocratic elution) 하였다. 통과액 (flow-through) 을 단일 분획으로 수집하고, 구배 분획을 따라 140 분 (140')에 걸쳐 매분마다 수집하고, 110 분획으로 모으고 -80 ℃에서 저장 하였다.
펩티드 정량화를 위한 LC-MS/MS
LC-MS/MS는 Proxeon 나노스프레이 소스 (Thermo Fisher Scientific)가 장착 된 Q Exactive HF 질량 분석기 (Thermo Fisher Scientific)에 연결된 Thermo Fisher RSLC 나노 시스템 (Thermo Fisher Scientific)을 사용하여 수행되었다. 이동상으로서 0.1 % TFA를 사용하여 25μL/분으로 트랩 컬럼 (Thermo Fisher Scientific, PepMap C18, 5mm × 300μm ID, 5μm 입자, 100Å 기공 크기)에 펩티드를 로딩 하였다. 10 분 후, 트랩 컬럼은 분석 컬럼 (Thermo Fisher Scientific, PepMap C18, 500mm × 75μm ID, 2μm, 100Å)에 따라 스위칭되었다. 구배는 이동상 (mobile phases) 98 % A (H2O/FA, 99.9/ 0.1, v/v) 및 2 % B (H2O/ACN/FA, 19.92/80/0.08, v/v/v)로 스타트 하였고, 이후 60 분 동안 35 % B. 이어서 5 분 동안 90 % B, 5 분 동안 일정하게 유지, 30 ℃에서 평형을 위해 5분 동안 98% A 및 2% B로 수행하였다.
Q Exactive HF 질량 분석기는 전체 스캔 (m/z 범위 350-1650, 공칭 분해능 120000, 목표 값 3E6)과 가장 풍부한 10 개의 이온에 대한 MS/MS 스캔을 사용하여 데이터 종속 모드로 작동되었다. MS/MS 스펙트럼은 35 %의 정규화된 충돌 에너지, 1.2m/z의 분리 폭, 60.000의 해상도, 1E5의 목표 값 및 첫 번째 고정 질량을 115 m/z로 설정하여 획득하였다. 단편화를 위해 선택된 전구체 이온 (할당되지 않은 충전 상태 제외, 1,> 8)을 30초 (30”) 동안 동적 배제 목록 (dynamic exclusion list)에 두었다. 또한 최소 AGC 대상은 1E4로 설정되었고 강도 임계 값은 4E4로 설정되었다. 펩티드 매치 특징이 바람직하게 설정되었고 동위 원소 제외 특징이 가능해졌다.
프로테오믹스 데이터 분석
원시 데이터는 프로테옴 디스커버러 (Proteome Discoverer) (버전 1.4.1.14, Thermo Fisher Scientific)로 처리되었다. 인간 SwissProt 데이터베이스 및 첨부된 오염 물질 (총 20508 개 단백질 서열)로 구성된 데이터베이스에 대해 MS Amanda (버전 1.4.14.8240)를 사용하여 데이터베이스 검색을 수행 하였다. 메티오닌의 산화는 동적 변형으로 설정되었고, N-말단에서 시스테인 및 TMT의 카바미도메틸레이션 (carbamidomethylation)이 이루어지고 리신은 고정된 변형으로 지정되었다. 트립신은 프롤린이 뒤따르는 경우를 제외하고 리신 또는 아르기닌 후 절단하는 단백질 가수 분해 효소로 정의되었으며, 최대 2 개의 누락된 (missed) 절단이 허용되었다. 전구체 및 단편 이온 내성은 각각 5ppm 및 0.03Da로 설정되었다. 확인된 스펙트럼을 퍼콜레이터 (Percolator)를 사용하여 스코어링하고 펩티드 스펙트럼 매치 수준에서 0.5 % FDR로 여과하였다. 단백질 그룹화는 엄격한 파시모니 (parsimony) 원리를 적용하여 프로테옴 디스커버러 (Proteome Discoverer)에서 수행되었다. 리포터 이온 강도는 10ppm의 적분 공차로 가장 확실한 중심 질량에서 추출되었다. 2 개 이상의 독특한 펩티드로 검출된 모든 단백질에 대해, 단백질 수준 정량화는 주어진 단백질 그룹 내의 모든 독특한 펩티드에 기초하여 계산되었다. 차등적으로 풍부한 단백질의 통계적 신뢰는 림마 (limma)를 사용하여 계산되었다.
질량 분석을 위한 세포 대사 산물의 제조
세포를 100μM IAA 또는 DMSO (1 : 5000 (v/v))의 존재 하에 예열된 성장 배지에서 2·105 세포/ml로 시딩하였다. 24 시간 후에 배지를 교환하고, 48 시간 후에 세포를 계수하고 수집하고, PBS로 2 회 세척하고 스냅 동결시켰다. 샘플 당 4·106 개의 세포 펠렛을 MeOH, ACN 및 H2O의 혼합물 (2:2:1 (v/v)의 비로)에서 용해시키고 볼텍싱하고 스냅-냉동 (snap-frozen) 시켰다. 완전한 용해를 위해, 세포는 3회 사이클의 스냅 동결, 해동 및 초음파 처리 (10', 4 ℃, Bioruptor 초음파 처리 장치 (Diagenode)에서 최대 강도)를 거쳤다. 단백질을 -20 ℃에서 1 시간 동안 침전시킨 다음 원심 분리 (15 ', 18000g, 4 ℃) 하였다. 상청액을 회수하고 SpeedVac 농축기에서 증발시키고, 펠렛을 초음파 처리 (10', 4 ℃)에 의해 ACN 및 H2O (v/v)의 1 : 1 혼합물로 재용해시키고 원심 분리 (4 ℃, 15', 18000g)에 의해 잔류 잔해물을 제거 하였다.
세포 대사 산물의 표적화된 LC-MS/MS
분석 전에, 50㎕의 ACN을 각각의 샘플 60㎕에 첨가하고 3㎕를 UltiMate 3000 XRS HPLC 시스템 (Dionex, Thermo Scientific)에 주입 하였다. 대사 산물은 5 % 이동상 A (물 중 10mM 암모늄 아세테이트, pH 7.5)에서 시작하여 ZIC-HILIC 컬럼 (100 x 2.1mm, 3.5μm, 200A, Merck) 및 100μl/min의 유량을을 사용하여 상 B (ACN)에서 최대 50 % A로 증가시키는 14' 구배를 사용하여 분리되었다. MS/MS는 음이온 모드에서 선택된 반응 모니터링 (SRM)을 사용하여 TSQ Quantiva 삼중 사중극자 질량 분석기 (TSQ Quantiva triple quadrupole mass spectrometer, Thermo Scientific)를 사용하여 수행되었다. 3 개의 독립적인 실험으로부터의 샘플을 각각 기술적으로 3 회 분석하고 MS 데이터를 트레이스파인더 (TraceFinder, Thermo Scientific)를 사용하여 분석 하였다.
결과
전처리 30분 (30') 및 s4U 표지화 60 분 (60') 후 SLAM-seq는 mRNA 반감기에 의해 편향되지 않은 소분자 억제제 (도 25E, 도 30F)에 대한 즉각적인 반응을 나타내었고, 총 mRNA 수준에서의 변화는 몇몇 짧은-수명의 mRNA로 제한되었다 (도 25F). 3 가지 억제제 모두를 사용한 단일-제제 처리는 특이적이고 뚜렷한 전사 반응을 유발하였고 (도 30C), MEK 및 AKT 억제제를 조합한 처리는 BCR/ABL 억제 후 관찰된 효과에 근사된 것으로 확인되었고 (도 25, E 및 G), BCR/ABL의 주요 이펙터 경로에서 이들의 기능과 일치하다. 이러한 파일럿 연구는 SLAM-seq를, mRNA 반감기와 상관없이 그리고 간접 효과를 배제하는 타임-스케일에서, 성숙 mRNA 수준에서 프로브 특이적인 전체 전사 반응에 대하여 신속하고 접근 가능하며 확장 가능한 접근 방식으로 확립한다. 특정 조절제의 신속한 섭동과 결합하여, SLAM-seq는 직접적인 전사 표적 유전자를 명확하게 식별할 수 있다.
BRD4의 경우와 같이 선택적인 억제제를 이용할 수 없는 방대한 수의 조절제를 조사하기 위하여 이 접근법을 일반화하기 위해, SLAM-seq와 화학적-유전자 단백질 분해를 결합하고자 하였다. 명백한 표적 할당을 위한 충분히 빠른 카이네틱을 달성하기 위해, 본 발명자들은 AID-태크된(태깅된) 단백질을 1 시간 이내에 분해하는 옥신-유도성 데그론 (AID. auxin-inducible degron) 시스템을 사용하였다.
구체적으로, 본 발명자들은 최소한의 AID-태그를 보유하도록 K562 세포의 BRD4 유전자좌를 변형시켰고 (도 26A), 높은 수준의 라이스 F-박스 단백질 Tir1을 발현하는 렌티 바이러스 벡터로 동종 접합적으로 태그된 클론을 형질 도입하였으며, 이는 옥신 (인돌-3-아세트산, IAA)으로 처리 시 AID-태그된 단백질의 유비퀴틴화를 매개한다. 실제로, AID-태그된 세포의 옥신 처리는 30 분 내에 매우 특이적이고 (도 31, A 및 C), BRD4의 거의 완전한 분해를 유발하였다 (도 26B 및 도 31B). 태그의 도입 또는 Tir1 발현 및 옥신 처리는 내약성은 우수하지만 (well tolerated), 보고된 필수 기능에 따라, BRD4의 지연된 분해 (prolonged degradation)는 증식을 강하게 억제 하였다 (도 31, D 및 E).
다음으로 BRD4 해독의 직접적인 전사 결과를 맵핑하기 위해, 우리는 30 분 동안 옥신으로 세포를 처리하고 다음 60 분 동안 s4U로 새로 합성된 RNA를 표지화 하였다. SLAM-seq에 의해 표지된 mRNA의 후속 정량은 CDK9 억제의 효과와 유사하게 전사의 전체적 하향 조절 (도 26C 및도 31F)을 나타냈다. 이 현상의 기본적 조절 이벤트를 조사하기 위해, BRD4 저하 시 염색질-결합 (바인딩된) 코어 전사 기구 (core transcription machinery)의 수준을 측정했다.
사전개시 복합체의 구성요소나 DSIF, NELF 또는 P-TEFb 중 어느 것도 전체적 리쿠르트먼트(recruitment)가 손상된 것으로 보이지 않았지만, 우리는 S2에서 Pol2의 인산화의 현저한 감소를 보였지만 C-말단 헵타드 반복 (C-terminal heptad repeats)의 S5는 아니었다는 것을 주목하였고(그림 26D). 이는 프로모터 근위 퍼즈 릴리스 (promoter proximal pause release)에서의 결함을 나타낸다. 실제로, BRD4 분해 시 (옥신 처리 60 분 후) Pol2의 스파이크-인 제어된 ChIP-시퀀싱은 활성 (active) 전사 개시 부위 (TSS)에서 Pol2 점유의 현저한 증가를 보여 주었고, 반면에 Pol2 밀도는 유전자 몸체 전체에서 감소되었다 (도 26, E 및 F 및 도 32A). 유사하게, S5-인산화된 Pol2의 수준은 프로모터에서 증가한 반면, S2-인산화된 Pol2 (후기 신장 단계 (late elongation steps)와 관련됨)는 유전자 몸체 전체에서 크게 감소되었다 (도 26, E 및 F 및도 32, B 및 C). 이러한 발견은 염색질에 대한 CDK9 동원(recruitment)과 무관한 pan-BET 단백질 분해 시 전사의 광범위한 감소와 일치하며, BRD4의 손실이 이러한 효과를 매개하기에 충분하다는 것을 입증한다. 이들 결과는 대부분의 활성 프로모터에서 정지된 중합효소의 방출을 라이센싱하는데 있어서 BRD4의 중심적인 역할을 확립한다.
이러한 발견은 활성 TSS에 대한 BRD4의 무차별 (promiscuous) 결합 및 코어 전사 기구와의 물리적 상호 작용과 일치하지만, 이들은 통상적인 발현 분석에서 BETi 처리 후 관찰 된 선택적 효과와 대비된다. BETi의 즉각적인 전사 효과를 정의하고 이를 BRD4 분해와 비교하기 위해, 본 발명자들은 K562 세포 및 급성 골수성 백혈병 (AML) 세포주 MV4-11에서 상이한 용량의 BETi JQ1로 처리 한 후 SLAM-seq를 수행하였다. 두 세포 유형에서, 고용량 JQ1 처리 (1 또는 5 μM)는 BRD4 분해 후 관찰된 효과와 유사하게 전사를 크게 억제하고 (도 26G,도 33A) 전체적으로 감소 된 Pol2-S2 인산화 (도 33B)를 나타내었다. 이는 BRD4의 전체적 전사 기능이 BET 브로모도메인-의존성이라는 것을 나타낸다.
중요하게도, Pol2 S2 인산화에 대한 고-용량 BETi 처리의 효과는 항 증식 효과 이전의 시점에서 BRD4의 녹다운 (knockdown)에 의해 다시 재현되었다 (도 33, C 및 D). 편재적으로 발현된 BETi 타겟인, BRD2 또는 BRD3의 억제는 이러한 현상을 유발하지 않았다. 이들 결과는 BETi의 전체적 전사 효과가 주로 BRD4 억제에 의해 매개되고 단백질을 함유하는 다른 BET-브로모도메인에 의해 보상될 수 없음을 입증한다.
1μM 이상의 JQ1 용량이 AML 및 기타 JQ1-민감성 암 세포주에서 성장 억제 농도를 크게 초과함에 따라, 우리는 200nM의 보다 선택적인 용량에 대한 직접적인 전사 반응을 탐색하여, 광범위한 AML 모델에서 강력한 항-백혈병 효과를 유발하고자하였다. 소수의 BETi 비감수성 백혈병 세포주 중 하나 인 K562 세포에서, 200nM JQ1은 적은 수의 전사체의 선택적 탈조절을 유도하였다 (도 26H). 놀랍게도, 동일한 용량으로 두 개의 매우 민감한 AML 세포주를 처리하면 스케일에 필적하는 전사 반응을 촉발 시켰고 (도 26H 및 도 34, A 및 B), MYC 및 전-골수종 (pan-myeloid) 의존성을 포함하는, 유사한 BETi-과민성 전사체 세트에 영향을 미쳤다 (도 26I 및도 34, C 및 D). 이러한 결과 백혈병에서 BETi 저항이 1 차 전사 반응의 부족보다는 2 차적 적응에 의해 결정됨을 보여준다. 우리는 또한 BET 억제 또는 BRD4 분해 후 공통적으로 상향조절된 작은 세트의 유전자에 주목하였다 (도 34E). 흥미롭게도, 이들은 AML에서의 종양 억제제인 EGR1을 포함하며, 이는 이러한 관점에서 BETi의 강력한 효과에 기여할 수 있다. 우리의 결과는 BETi에 대한 1 차 전사 반응의 엄청난 (profound) 용량-의존성을 보여주며 치료적 활성 용량이 과민성 유전자의 작은 세트의 탈조절 (deregulating)을 통해 항-백혈병 효과를 촉발한다는 것을 보여준다. 더욱이, 이것은 기본 전사 기구의 부분 억제가 암 의존성을 선택적으로 표적화하기 위해 이용될 수 있는 매우 특이적인 반응을 유도할 수 있음을 나타낸다.
특정 전사체가 BETi에 과민반응을 일으키는 요인을 탐색하기 위해, 우리는 이 현상이 일반적인 Pol2 퍼즈 릴리즈 (pause release) 기구와의 간섭에 대한 뚜렷한 민감성(감도)을 단순히 반영하는지 궁금해 하였다. 이것을 테스트하기 위해, 우리는 SLAM-seq를 사용하여 BET 억제 (200nM JQ1)에 대한 전사 반응을 선택적인 CDK9 억제제 NVP-2의 상이한 용량에 의해 유발되는 효과와 비교하였다. 고-용량 CDK9 억제 (60nM NVP-2)는 전체적으로 전사를 억제하는 반면, 중간 용량 (6nM NVP-2)은 BETi에 대한 보존된 반응(도 27, A 및 B 및도 35B)과는 다른 선택적 전사 반응을 유발했다 (도 35A). CDK9 및 BET 억제제가 이전 보고서 및 AML에 대한 연구 (도 35, C 및 D)에서 강력한 상승 효과를 나타내었기 때문에, 우리는이 현상의 근원적인 전사 반응을 조사하고자 했다. 선택적 단일-제제 효과와 대조적으로, JQ1 및 NVP-2의 중간 용량을 조합하면 고-용량 CDK9 억제와 유사한 전체적 전사 손실이 유발되었다 (도 27, A 및 B 및도 35A). 이러한 관찰은 유전자적으로 별개의 AML 세포주에서도 마찬가지이며 (도 35, E 및 F), BETi와 CDK9i 사이의 치료적 상승 작용은 전체 전사의 상승적 억제에 크게 근거하여 이 조합의 내약성 (tolerability)에 대한 우려 (concerns)가 있음을 시사한다. 전반적으로, 본 발명자들의 결과는 Pol2 퍼즈 릴리스 (pause release)에서 그들의 표적의 일반적인 역할에도 불구하고, CDK9 및 BET 억제제의 치료적 활성 용량이 선택적 전사 반응을 유발하기 위해 이 프로세스에서 다른 병목 현상을 이용한다는 것을 보여준다.
BETi 과민성의 현상이 특정 염색질 특징에 의해 결정되는지 여부를 조사하기 위해, 우리는 먼저 TSS에서의 BRD4 점유율 수준 또는 BETi에 대한 접근성이 동일한 기준선 발현 (FDR ≤ 0.1, -0.1 ≤ log2FC ≤ 0.1; 도. 36A)을 갖는 동일한 크기의 비반응성 유전자 코호트와 직접적 BETi 표적 (FDR ≤ 0.1, log2FC ≤ -0.7)을 구별할 수 있는지 여부를 테스트하였다. BRD4 점유율이 유전자의 무작위 선택을 거의 능가할 수는 없지만 (AUC 0.52, 도 31C) 최근에 클릭-seq (Click-seq)로 측정한 BETi의 염색질 결합 수준이 BETi 반응 (AUC 0.63; 그림 36B)을 부분적으로 설명할 수 있다고 보고되었고, 이는 약물 접근성의 차이가 선택적 BETi 효과에 기여한다는 것을 시사한다. 또 다른 광범위하게 채택된 모델은 BETi의 전사 및 치료 효과가 수퍼-인핸서를 선택적으로 억제하는 능력에 기인한 것으로, BETi 표적의 우수한 예측 인자로서 H3K27ac-기반 조절 가능성을 확인하는 최근 연구에 의해 도전 받았다 (challenged) . 이러한 연구는 장기간 약물 치료 후 기존의 RNA-seq에 의존하기 때문에 SLAM-seq 프로파일을 사용하여 두 모델을 모두 재평가하였다. 유전자의 H3K27ac- 기반 조절 포텐셜과 수퍼-인핸서 (super-enhancer)와의 연관성 둘 다 BETi에 대한 과민증을 적당한 정확도로 예측하였다 (각각 AUTOC 0.66 및 0.64, 도 27C). 그러나, BETi-민감성 유전자의 3 분의 2는 수퍼-인핸서에 할당될 수 없었고, 발현된 수퍼-인핸서 관련 유전자의 대다수는 BETi 처리에 반응하지 않았다 (도 27, D 및 E). 이러한 관찰은 다른 백혈병 세포주에서도 마찬가지이며 (도 36C), BET 억제에 대한 민감성은 수퍼-인핸서의 존재와 관련이 있지만 수퍼-인핸서의 존재에 의해 결정되지는 않는다는 것을 보여주며, 이는 더 복잡한 요인이 이 현상의 기초가 된다는 것을 시사한다.
이들을 탐구하기 위해, 우리는 K562 세포에 대해 이용 가능한 광범위한 프로파일링 데이터를 이용하고 유전자 조절의 조합 모드를 모델링하기 위한 편견없는 접근법을 고안하였다. 구체적으로, BETi-민감성 및 비반응성 유전자의 TSS 주위에서 500 및 2000 bp 내에서 214 개의 ChIP- 및 메틸옴 (methylome) 시퀀싱 실험의 신호를 추출하고, 이 데이터를 사용하여 이후에 보유된 테스트 유전자에 기초하여 평가된 다양한 분류 모델을 트레이닝시켰다 (도 27F 및 도 36D). 이 접근법은 높은 피델리티 (fidelity) (AUC> 0.8, 도 27G 및 도 36E)를 갖는 BETi 감도를 예측하는 다중 분류기를 생성했으며, 그 중 엘라스틱 넷 회귀에 의해 도출된 일반화된 선형 모델 (GLM)이 있다. 이 모델의 계수의 재분석은, 높은 수준의 TSS-근위 REST 및 H3K27ac를 포함한 여러 요인이 BETi 과민증과 관련이 있으며, 신장 (elongation)의 조절자인 SUPT5H의 높은 점유율은 가장 강력한 음성 예측 인자라는 것을 보여주었다 (도 27H 및 도 37A). 무감독 (unsupervised) 클러스터링은 가장 예측 가능한 TF 및 보조 인자가 BETi 민감성 또는 비반응성 유전자의 별개의 하위 클러스터에서만 풍부하다는 것을 보여 주었다 (도 27I 및 도 37B). 예를 들어, BETI 민감성 유전자의 별개의 그룹 (distinct group)에서 높은 양 (high loads)의 양성 예측 변수 NFRKB 및 HMBOX1이 발견되는 반면, BETi-민감성 유전자의 별개의 서브클러스터에서 CREM 및 SUPT5H의 높은 결합이 관찰되었다. 이와 함께, 이러한 연구 결과 BETi에 대한 전사 반응이 유전자좌-특이적 조절자에 의해 결정되고 단일 통합 염색질 인자에 기초하여 예측될 수 없다는 것을 시사한다.
BETi 민감성의 복잡한 결정 인자와 유사하게, BETi의 치료적 영향은 여러 개의 과민성 표적 유전자의 탈조절을 통해 매개될 수 있다. 백혈병에서 탁월한 BETi- 과민성 유전자로 MYC를 검증한 후, MYC 억제에 대한 전사 및 세포 반응은 이러한 맥락에서 BETi의 주요 이펙터 메커니즘으로 간주되어야 한다. 그러나, MYC의 직접적인 유전자 조절 기능은 특정 표적에 대한 활성화, 억제 및 용량-의존적 효과를 설명하는 연구와 일반적인 전사 증폭기로서 MYC의 역할을 설명하는 연구 사이에서 여전히 논의되고 있다. 이러한 모델을 테스트하기 위해, 우리는 내인성 MYC의 급성 손실에 따라 mRNA 생산량(아웃풋)의 직접적인 변화를 측정하고자 하였다. 이를 위해, 본 발명자들은 KID 세포의 MYC 유전자좌가 AID-태그 (도 28A)를 보유하도록 조작하였고, 이는 동형 접합 Tir1-발현 클론에서 30 분 이내에 빠른 MYC 분해를 유발 하였다 (도 28B). 그런 다음 MYC 분해 후 60 분에 걸쳐 새로 합성된 mRNA의 생산량을 정량화하기 위하여 SLAM-seq를 사용하였다.
BRD4 의 분해 및 약리학적 CDK9 및 BET 억제와 비교하여, MYC의 급성 소실은 mRNA 생성에서 전체적 변화보다는 매우 특이적인 결과를 초래 하였다 (도 28C). 이들은 712 개의 유전자에 대한 억제 효과에 의해 지배되는 반면, 단지 15 개의 mRNA만이 강하게 상향 조절되었다. 따라서, K562 세포에서, MYC는 직접적인 억제자 또는 전사의 일반적인 증폭제로서 작용하지 않지만, 주로 특정 표적 유전자의 전사 활성화제로서 기능한다 (도 28C). 이들은 712 개의 유전자에 대한 억제 효과에 의해 지배되는 반면, 단지 15 개의 mRNA만이 강력하게 상향 조절되었다. 따라서, K562 세포에서, MYC는 직접적인 억제 자 또는 전사의 일반적인 증폭 제로서 작용하지 않지만, 주로 특정 표적 유전자의 전사 활성화제로서 기능한다.
MYC는 거의 모든 활성 프로모터를 차지하는 것으로 알려져 있기 때문에, 우리는 다음으로 MYC 유비쿼터스 바인딩에도 불구하고 선택적 전사 활성화를 발휘하는 방법에 대하여 조사하였다.
이를 위해, 우리는 그것들의 프로모터에서에서 상이한 ChIP-seq 신호에 기초하여 MYC 의존성-전사물 (FDR ≤ 0.1, log2FC ≤ -1)을 예측하기 위해 분류 모델을 트레이닝하였다. 엘라스틱 넷 (Elastic net) 회귀는 MYC-의존성 유전자 조절 (AUC 0.91)을 고도로 예측하는 간단한 GLM을 산출 하였다. 이 모델의 가장 큰 기여는 MYC 자체의 풍도 (abundance)였다. 실제로, 통상적인 피크 호출에 의해 결정된 프로모터에서의 MYC의 존재가 MYC-민감성 전사체를 확인하는 데 실패하지만, MYC 또는 그의 보조 인자 (co-factor) MAX의 결합 수준은 중간 정확도 (각각 0.76 및 0.74)로 MYC-의존성 유전자 조절을 예측한다. 이러한 결과는 직접적 MYC 의존성 전사체가 강한 MYC 결합 및 MNT, NKRF, TBL1XR1, EP300 및 YY1과 같은 추가 인자에 의한 추가 변조 (modulation) 또는 보상 (compensation)에 의해 정의됨을 시사한다.
MYC-의존성 유전자 조절의 세포 기능을 조사하기 위해, 본 발명자들은 직접적 MYC 표적 유전자 중 생물학적 프로세스의 농축을 분석 하였다. 놀랍게도, 급성 MYC-소실 (loss)은, 모든 리보솜 생합성 인자의 36 %, AMP 대사의 주요 조절자, 및 드-노보 (de-novo) 퓨린 합성 경로(도 28, C 및 D)의 6 가지 효소 모두를 포함하여, 단백질 및 뉴클레오티드 생합성 (도 28d) 과 관련된 유전자들을 주로 하향조절하였다. 실제로, MYC 분해는 단백질 합성을 점진적으로 손상 시켰고 (도 28E), 증식 결함 (proliferation defects)의 개시 전에 세포 AMP 및 GMP 수준뿐만 아니라 그들의 업스트림 중간체 (intermediate) AICAR의 강한 감소를 초래하였다 (도 28F). 단백질 및 뉴클레오티드 생합성에서 주요 효소를 직접 제어하는 MYC의 역할과 중합효소 I, II 및 III의 여러 서브유닛은 MYC 과다 발현시 총 세포 RNA에서의 보고된 증가에 대한 설명을 제공한다. 이러한 효과 이차적 성질을 지니고 있으며, 전체적 전사적 효과 때문이 아니라는 개념을 지지한다.
MYC의 직접적인 전사 기능이 다른 상황에서 보존되는지 테스트하기 위하여, 본 발명자들은 특히 높은 수준의 MYC를 발현하는 HCT116 결장 암종 세포의 MYC 유전자좌 내로 동형 접합 AID-태그를 조작하였다. K562의 경우, TIR1-발현 HCT116MYC-AID 세포의 옥신 처리는 30 분 이내에 MYC의 완전한 분해를 촉발시켰다 (도 28G). SLAM-seq 프로파일링은 동일한 세포 프로세스에 영향을 미치고 K562 세포에서의 반응과 상관 관계가있는 매우 선택적인 전사 효과 (도 28H)를 나타냈다 (R = 0.64,도 28H). 두 개의 관련이 없는 세포주 사이의 MYC 표적 보존이 다른 암 유형으로 확장되는지 여부를 테스트하기 위해, SLAM-seq에서 가장 강력하게 하향 조절된 유전자 100 개의 시그니처를 도출하고 그 발현을 672 개의 암 세포주의 패널에서 MYC 수준과 비교 하였다. 실제로, MYC와 우리의 시그니처의 발현 수준은, 시그니처를 잃지 않고 낮은 수준의 MYC를 발현하는 극단치의 작은 부분을 제외하고는, 잘 연관되어 있다 (그림 28I). 특히, 이러한 모든 극단치(이상값)은 높은 수준의 MYCN 또는 MYCL을 발현하며, 이는 MYC 파라로그 (paralog)가 핵심 MYC 타겟의 조절에서 중복 기능을 가지고 있음을 나타낸다. 직접적 MYC 표적의 우리의 시그니처는 11 개의 주요 인간 암에 걸쳐 5583 개의 1 차 환자 샘플로부터의 TCGA RNA-seq 프로파일에서 MYC 수준과 강하게 상관(연관)되었다 (도 28J). 이러한 연구 결과는 다양한 인간 암에 걸쳐 MYC는 보존된 전사 표적 세트의 발현을 유도하며, 이는 발암성 기능을 차단하기 위한 진입점 (entry points)으로 간주되어야 한다는 것을 입증한다.
요약하면, 빠른 화학적-유전적 섭동(동요)과 SLAM-seq를 결합하면 전사 인자 및 보조 인자의 특이적이고 전체적 직접적인 기능을 조사하기 위한 간단하면서도 강력한 전략이 확립된다. 이러한 접근법을 사용하여, 우리는 계통(lineage)- 및 질환-관련 발현 프로그램의 조절자로서, 전사적 퍼즈-릴리스 (pause-release)에서의 전체적 보조 인자 (co-factor)로서 광범위하게 연구되는 인자인, BRD4를 기능적으로 특성화한다. 한편, 우리는 이전에 전체적 전사 증폭기로 관련되었던 MYC가 기본 동화 프로세스, 특히 단백질 및 뉴클레오티드 생합성을 촉진하기 위해 제한되고 보존된 표적 유전자 세트를 활성화 시킨다는 것을 발견하였다. 보다 일반적으로, mRNA 산물 (아웃풋)에서의 변화의 직접적인 정량화를 가능하게 함으로써, SLAM-seq는 임의의 교란에 대한 직접적인 전사 반응을 정의하기 위한 간단하고 강력하고 확장 가능한 방법을 제공하고 세포의 조절 와이어링(wiring)을 탐구한다.
SEQUENCE LISTING <110> IMBA - INSTITUT F? MOLEKULARE BIOTECHNOLOGIE GMBH <120> Nucleic acid modification and identification method <130> r72339 <150> EP 17166629.0 <151> 2017-04-13 <150> EP 18165712.3 <151> 2018-04-04 <160> 11 <170> PatentIn version 3.5 <210> 1 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> 5L-let-7-3L <400> 1 acacucuuuc ccuacacgac gcucuuccga ucuugaggua guagguugua uaguagaucg 60 gaagagcaca cgucuc 76 <210> 2 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> 5L-let-7-s4U-p9-3L <220> <221> modified_base <222> (42)..(42) <223> s4u <400> 2 acacucuuuc ccuacacgac gcucuuccga ucuugaggua guagguugua uaguagaucg 60 gaagagcaca cgucuc 76 <210> 3 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> let-7-s6G sequence <220> <221> modified_base <222> (8)..(8) <223> s6g <400> 3 ugagguagua gguuguauag u 21 <210> 4 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> RT primer <400> 4 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 5 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Solexa_PCR_fwd <400> 5 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 6 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Solexa_IDX_rev <220> <221> misc_feature <222> (25)..(30) <223> n is a, c, g, or t <400> 6 caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> mature dme-let-7 sequence <400> 7 tgaggtagta ggttgtatag t 21 <210> 8 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> synthetic RNA oligonucleotide <220> <221> misc_structure <222> (44)..(44) <223> 5-Br-U <400> 8 acacucuuuc ccuacacgac gcucuuccga ucuugaggua guuagguugu auaguagauc 60 ggaagagcac acgucuc 77 <210> 9 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 10 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 11 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> primer <220> <221> misc_feature <222> (25)..(30) <223> n is a, c, g, or t <400> 11 caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60 atct 64

Claims (20)

  1. PNA를 제공하는 단계; 수소 결합 파트너의 첨가 또는 제거에 의해 PNA의 하나 또는 그 이상의 핵염기를 변형시켜, 하나 또는 그 이상의 핵염기의 염기 페어링 능력 (capacity)을 변경시키는 단계; 하나 이상의 변형된 핵염기에 대한 염기 페어링을 포함하여, 상보적 핵산을 PNA에 염기 페어링하는 단계; 적어도 하나의 변형된 핵염기에 상보적인 위치에서 상보적 핵산의 서열을 식별하는 단계를 포함하는 다중 핵산(PNA)을 식별하는 방법.
  2. 청구항 1에 있어서, 변형은 변경된 염기 페어링 거동을 야기하여, 이로써 A, T/U, C 및 G로부터 선택된 천연 핵염기와 비교하여 A와 T/U 사이 및 C와 G 사이의 우선적 (preferential) 염기 페어링을 변경하는 것인, 방법.
  3. 청구항 1 또는 청구항 2에 있어서, 변형 단계가 티올 변형된 핵염기의 포함에 의한 것인, 방법.
  4. 청구항 3에 있어서, 티올 핵염기를 수소 결합 파트너를 포함하는 알킬화제로 알킬화하는 단계를 추가로 포함하는, 방법.
  5. 청구항 3에 있어서, 티올 핵염기를 산화시키는 단계를 추가로 포함하는, 방법.
  6. 청구항 1 또는 청구항 2에 있어서, 변형이 수소 결합 파트너를 포함하는 알킬화제로 우리딘의 위치 4에서 알킬화하는 것을 포함하는 것인, 방법.
  7. 청구항 1 내지 청구항 6 어느 한 항에 있어서, PNA가 하나 이상의 4-티오우리딘 또는 6-티오구아노신을 포함하는 것인, 방법.
  8. 청구항 1 내지 청구항 7 중 어느 한 항에 있어서, PNA가 상기 염기 페어링 능력을 변경시키는 변형을 갖는 세포에서 합성되는 것인, 방법.
  9. 청구항 1 내지 청구항 8 중 어느 한 항에 있어서, 변형된 핵염기, 바람직하게는 티올 변형된 핵염기가 세포에서 생합성을 통해 PNA에 통합되고, 바람직하게는 하나 이상의 핵염기를 변형시키는 것은 수소 결합 파트너를 변형된 핵염기에 부착 또는 제거하는 것을 포함하는 것인, 방법.
  10. 청구항 1 내지 청구항 9 중 어느 한 항에 있어서, 적어도 하나의 변형된 핵염기와의 염기 페어링은 변형되지 않은 핵염기와의 염기 페어링 이외에 또 다른 뉴클레오티드와의 염기 페어링을 초래하고, 그렇지 않으면 상기 핵염기는 동일한 것인, 방법.
  11. 청구항 1 내지 청구항 10 중 어느 한 항에 있어서, PNA가 RNA 또는 DNA를 포함하거나 RNA 또는 DNA로 구성되는 것인, 방법.
  12. 청구항 1 내지 청구항 11 중 어느 한 항에 있어서, A, G, C, U 또는 T로부터 선택된 각각의 뉴클레오티드 유형에 대해, 변형된 PNA는 변형된 뉴클레오티드보다 더 많은 천연 뉴클레오티드를 포함하는 것인, 방법.
  13. 청구항 1 내지 청구항 12 중 어느 한 항에 있어서, PNA가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상 및 최대 30 개의 변형된 뉴클레오티드를 포함하는 것 인, 방법.
  14. 청구항 1 내지 청구항 13 중 어느 한 항에 있어서, PNA를 제공하는 단계는 PNA를 세포에서 발현시키는 것을 포함하고; 상기 방법은 세포로부터 PNA를 단리하는 단계를 추가로 포함하고; 세포에서 및/또는 단리 후 PNA의 하나 이상의 핵염기를 변형시키는 단계를 추가로 포함하고; 여기서 세포 내 또는 단리 후 또는 둘 다에서의 변형은 하나 이상의 핵염기의 수소 결합 파트너를 추가 또는 제거하여, 하나 이상의 핵염기의 염기 페어링 능력을 변경시키는 것인, 방법.
  15. 청구항 1 내지 청구항 14 중 어느 한 항에 있어서, 하나 이상의 세포가 적어도 2 개의 배양 또는 성장 단계에서 배양 또는 성장되고, 여기서 하나의 배양 또는 성장 단계는 변형된 뉴클레오티드를 수소 결합 파트너의 첨가 또는 제거에 의해 변형된 생합성 PNA에 통합시키는 것을 포함하며, 그리고 또 다른 하나의 배양 또는 성장 단계는 변형된 뉴클레오티드의 생합성 PNA 로의 통합이 결여되거나 또는 다른 하나의 배양 또는 성장 단계에서와 같이 상이한 농도에서 변형된 뉴클레오티드를 생합성 PNA에 통합시키는 것을 포함하고; 또는 상기 방법은 변형된 뉴클레오티드를 적어도 2 개의 상이한 세포 (two different cells)의 생합성 PNA 또는 적어도 2 개의 상이한 그룹의 세포 (two different groups of cells)에 포함시키는 것을 포함하며, 바람직하게는 2 개의 상이한 세포 또는 2 개의 상이한 그룹의 세포의 통합이 비교되는 것인, 방법.
  16. 청구항 15에 있어서, 2 개의 배양 또는 성장 단계의 또는 적어도 2 개의 상이한 세포의 생합성된 PNA 또는 적어도 2 개의 상이한 그룹의 세포는 상기 세포, 바람직하게는 혼합된 세포, 특히 바람직하게는 PNA의 세포 기원에 따라 PAN의 표지화가 있는 세포로부터 수집되고, 그리고 상보적 핵산을 PNA에 염기 페어링하는 단계는 상보적 핵산 가닥, 바람직하게는 DNA 가닥을 전사에 의해, 바람직하게는 역전사에 의해 생성하는 것을 포함하는 것인, 방법.
  17. 청구항 16에 있어서, 상보적 다중 핵산 가닥의 서열을 결정하는 단계 및 가닥 서열을 비교하는 단계를 추가로 포함하고, 수소 결합 파트너의 첨가 또는 제거에 의한 변형의 결과로서 변경된 상보적 핵산이 변형이 없는 상보적 핵산과의 비교에 의해 식별될 수 있는 것인, 방법.
  18. 청구항 1 내지 청구항 17 중 어느 한 항에 있어서, 적어도 2 개의 세포 또는 세포에서 적어도 2 개의 상이한 성장 단계에서 적어도 하나의 변형된 핵염기와 상보적인 위치에서 상보적 핵산의 식별된 서열을 비교하는 단계를 포함하고, 상기 적어도 2 개의 세포 또는 성장 단계가 상기 적어도 2 개의 세포 또는 상기 성장 단계에서 또는 차등적 유전자 발현을 가지며, 바람직하게는 차등적 유전자 발현이 세포에서 적어도 하나의 유전자의 억제 또는 자극에 의해 야기되는 것인, 방법.
  19. 티올 변형된 핵염기 및 티올기에서 티올 변형된 핵염기를 알킬화하기에 적합한 알킬화제를 포함하는 청구항 1 내지 청구항 18 중 어느 한 항의 방법을 수행하기 위한 키트로서, 알칼화제가 수소 결합 공여체 또는 수용체를 포함하고, 바람직하게는 알킬화제가 아이오도아세트아미드인, 키트.
  20. 청구항 19에 있어서, 프라이머, A, G, C 및 T로부터 선택된 뉴클레오티드, 역전사 효소 또는 이들의 조합물, 바람직하게는 이들 모든 성분을 추가로 포함하는 키트.
KR1020197033605A 2017-04-13 2018-04-13 핵산 변형 및 식별 방법 KR20190139960A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP17166629.0A EP3388530A1 (en) 2017-04-13 2017-04-13 Nucleic acid modification and identification method
EP17166629.0 2017-04-13
EP18165712.3 2018-04-04
EP18165712 2018-04-04
PCT/EP2018/059518 WO2018189367A1 (en) 2017-04-13 2018-04-13 Nucleic acid modification and identification method

Publications (1)

Publication Number Publication Date
KR20190139960A true KR20190139960A (ko) 2019-12-18

Family

ID=62002637

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197033605A KR20190139960A (ko) 2017-04-13 2018-04-13 핵산 변형 및 식별 방법

Country Status (10)

Country Link
US (2) US11299779B2 (ko)
EP (2) EP3760734A1 (ko)
JP (2) JP7341891B2 (ko)
KR (1) KR20190139960A (ko)
CN (1) CN110520540B (ko)
AU (1) AU2018252187A1 (ko)
CA (1) CA3058540A1 (ko)
DK (1) DK3589748T3 (ko)
LT (1) LT3589748T (ko)
WO (1) WO2018189367A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2019289911B2 (en) * 2018-06-20 2024-03-28 Pathoquest Method for discriminating between live and dead microbes in a sample
GB202111184D0 (en) * 2021-08-03 2021-09-15 Hendriks Gerardus Johannes Methods

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030180769A1 (en) 2002-02-05 2003-09-25 Metzker Michael L. Substituted 4,4-difluoro-4-bora-3A,4A-diaza-s-indacene compounds for 8-color DNA sequencing
US20040259135A1 (en) 2003-05-09 2004-12-23 Cleary Michael D. Biosynthetic labeling and separation of RNA
WO2006125808A1 (en) 2005-05-25 2006-11-30 Dkfz Deutsches Krebsforschungszentrum Method for analysis of de-novo transcribed rna in vivo
AU2009325069B2 (en) * 2008-12-11 2015-03-19 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
EP2599859A1 (en) 2011-11-30 2013-06-05 IMBA-Institut für Molekulare Biotechnologie GmbH Haploid cells
CN105980575A (zh) * 2013-03-14 2016-09-28 卡里布生物科学公司 以核酸为靶的核酸的组合物和方法
EP2921556A1 (en) 2014-03-21 2015-09-23 Lexogen GmbH Copy number preserving RNA analysis method
US20180080061A1 (en) 2015-03-23 2018-03-22 The Regents Of The University Of California Biosynthetic labeling and separation of rna

Also Published As

Publication number Publication date
EP3589748A1 (en) 2020-01-08
US11859248B2 (en) 2024-01-02
US20230054714A1 (en) 2023-02-23
WO2018189367A1 (en) 2018-10-18
DK3589748T3 (da) 2020-09-07
CN110520540A (zh) 2019-11-29
JP2023155370A (ja) 2023-10-20
AU2018252187A1 (en) 2019-08-22
JP2020516302A (ja) 2020-06-11
US11299779B2 (en) 2022-04-12
EP3589748B1 (en) 2020-07-22
LT3589748T (lt) 2020-10-26
EP3760734A1 (en) 2021-01-06
JP7341891B2 (ja) 2023-09-11
US20190177785A1 (en) 2019-06-13
CN110520540B (zh) 2023-10-03
CA3058540A1 (en) 2018-10-18

Similar Documents

Publication Publication Date Title
Kumar et al. Deciphering epitranscriptome: modification of mRNA bases provides a new perspective for post-transcriptional regulation of gene expression
Li et al. Base-resolution mapping reveals distinct m1A methylome in nuclear-and mitochondrial-encoded transcripts
Marchand et al. HydraPsiSeq: a method for systematic and quantitative mapping of pseudouridines in RNA
Qu et al. Circular RNA: a new star of noncoding RNAs
Wilusz Controlling translation via modulation of tRNA levels
Holoch et al. Small-RNA loading licenses Argonaute for assembly into a transcriptional silencing complex
US8841073B2 (en) Methods for identifying RNA segments bound by RNA-binding proteins or ribonucleoprotein complexes
US11859248B2 (en) Nucleic acid modification and identification method
Cacabelos et al. The epigenetic machinery in the life cycle and pharmacoepigenetics
Song et al. CRISPR-free, programmable RNA pseudouridylation to suppress premature termination codons
US20150045237A1 (en) Method for identification of the sequence of poly(a)+rna that physically interacts with protein
US10907165B2 (en) Methods of enhancing translation ability and stability of RNA molecules, treatments, and kits
Sterling et al. An efficient and sensitive method for preparing cDNA libraries from scarce biological samples
Ibáñez-Cabellos et al. Acute depletion of telomerase components DKC1 and NOP10 induces oxidative stress and disrupts ribosomal biogenesis via NPM1 and activation of the P53 pathway
WO2017035821A1 (zh) RNA 5mC重亚硫酸盐测序的文库构建方法及其应用
Mauer et al. The RNA demethylase FTO targets m6Am in snRNA to establish distinct methyl isoforms that influence splicing
EP3388530A1 (en) Nucleic acid modification and identification method
Hu et al. Global view of dynamic expression and precise mapping of mitochondrial tRNAs-derived fragments during stressed conditions in S. pombe
Herzog et al. Thiol-linked alkylation for the metabolic sequencing of RNA
Jansson et al. Ribosomal RNA methylation induced by MYC regulates translation
Hofmann Transcriptome maps of general eukaryotic RNA degradation factors and identification and functional characterization of the novel mRNA modification N3-methylcytidine
Das Recovery from Oxidative stress: insights into stress granule disassembly process
Huh A Stress-Induced TRNA Depletion Response Mediates Codon-Based Translational Repression and Growth Suppression
Haugen et al. Regulation of the Drosophila transcriptome by Pumilio and the CCR4-NOT deadenylase complex
Liu et al. NAP-seq reveals multiple classes of structured noncoding RNAs with regulatory functions

Legal Events

Date Code Title Description
E902 Notification of reason for refusal