KR20230104207A - 헤어핀 올리고뉴클레오티드 및 그의 용도 - Google Patents

헤어핀 올리고뉴클레오티드 및 그의 용도 Download PDF

Info

Publication number
KR20230104207A
KR20230104207A KR1020237018519A KR20237018519A KR20230104207A KR 20230104207 A KR20230104207 A KR 20230104207A KR 1020237018519 A KR1020237018519 A KR 1020237018519A KR 20237018519 A KR20237018519 A KR 20237018519A KR 20230104207 A KR20230104207 A KR 20230104207A
Authority
KR
South Korea
Prior art keywords
rna
sequence
trna
oligonucleotide
hairpin
Prior art date
Application number
KR1020237018519A
Other languages
English (en)
Inventor
타오 팬
크리스토퍼 디 카탄스키
크리스토퍼 피 왓킨스
Original Assignee
더 유니버서티 오브 시카고
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 유니버서티 오브 시카고 filed Critical 더 유니버서티 오브 시카고
Publication of KR20230104207A publication Critical patent/KR20230104207A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/122Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다. 양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 3'-말단 뉴클레오티드의 당 위치는 당의 2',3'-다이알데하이드 산화 생성물을 포함한다. 양태들에서, 본 발명은 바이오마커를 개발하는데 있어서 헤어핀 올리고뉴클레오티드의 용도를 제공한다. 양태들에서, 본 발명은 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하는 고체 지지체를 제공하고, 이때 올리고뉴클레오티드는 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화된다. 양태들에서, 본 발명은 또한 (a) RNA 서열을 헤어핀 올리고뉴클레오티드에 접합시켜 구조물을 형성하고, (b) RNA 서열을 cDNA 서열로서 역전사하고, (c) PCR을 사용하여 cDNA 서열을 증폭시키는 것을 포함하는, RNA 서열 라이브러리를 제조하는 방법을 제공한다.

Description

헤어핀 올리고뉴클레오티드 및 그의 용도
관련 출원의 교차-참조
본 출원은 전체적으로 본원에 참고로 도입된, 2020년 11월 6일자로 출원된 미국 가출원 제63/110,605호를 우선권 주장하다.
연방 지원된 연구 개발에 관한 진술
본 발명은 국립 보건원에 의해 HG008935의 인가 번호하에서 정부 지원으로 이루어졌다. 정부는 본 발명에 일정한 권리를 갖는다.
전자적으로 제출된 자료의 참고 도입
본원과 동시에 제출되고 다음과 같이 확인된 컴퓨터-판독가능한 뉴클레오티드 서열 목록이 전체적으로 본원에 참고로 도입된다: 2021년 11월 5일자로 생성되어 "757154_ST25.TXT"로 명명된 1개의 32,847 바이트 ASCII(텍스트) 파일.
RNA 서열분석(RNA-seq)에서 수행되는 전형적인 효소 및 화학적 처리는, 특히 소형 RNA의 경우, 샘플 회수에 상당한 장애를 야기할 수 있다. 또한, tRNA의 매우 높은 존재량(abundance)으로 인해, 소형 RNA-seq는 종종 라이브러리 구성을 서열분석하기 전에 크기별로 다른 RNA로부터 tRNA를 분리하여 수행된다; 이 분리는 tRNA와 다른 소형 RNA의 데이터 연결을 해제시킬 수 있으며, 이로 인해 귀중한 생물학적 정보를 잃을 수 있다. 또한, 라이브러리 구성 전에 및 구성 중에 다시 tRNA의 겔 정제가 필요한 프로토콜을 기반으로 하는 RNA-seq 절차는 비효율적이며 다량의 투입 물질이 필요하다.
가장 일반적으로 사용되는 상업용 RNA-seq 키트는 전사후 변형도 함유하는 소형 RNA(<약 200개 뉴클레오티드) 연구와 상용가능하지 않다. 소형-RNA-seq 키트는 종종 역전사 전에 순차적인 어댑터 접합(ligation: 결찰이라고도 함)에 의존하므로, 변형으로부터의 불완전 역전사 생성물이 생물학적 정보 및 해석을 왜곡할 수 있다. 통상적인 RNA-seq 절차 및 키트는 또한 다수의 샘플을 처리하는 데 필요한 다중화 수준이 부족하다.
새로운 RNA-seq 라이브러리 제조 전략 및 이와 함께 사용하기 위한 헤어핀 올리고뉴클레오티드가 필요하다.
양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다.
양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 3'-말단 뉴클레오티드의 당 위치는 당의 2',3'-다이알데하이드 산화 생성물을 포함한다.
양태들에서, 본 발명은 바이오마커를 개발하는데 있어서, 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드의 용도를 제공하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3' -포스페이트를 포함한다.
양태들에서, 본 발명은 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하는 고체 지지체를 제공하고, 상기 올리고뉴클레오티드는 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'- 하이드록실 및 3'-포스페이트를 포함하고, 올리고뉴클레오티드는 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화(immobilization)된다.
양태들에서, 본 발명은 다음을 포함하는, RNA 서열 라이브러리를 제조하는 방법을 제공한다: (a) RNA 서열을 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드(이때, 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다)에 접합시켜 구조물을 형성하고, (b) RNA 서열을 cDNA 서열로서 역전사시키고, (c) PCR을 사용하여 cDNA 서열을 증폭시킨다.
추가의 양태들은 본원에 기술된 바와 같다.
도 1은 본 발명의 양태들에 따른 RNA-서열분석(RNA-seq) 라이브러리 제조를 묘사하고, 비생산적인 1차 접합 후 올리고뉴클레오티드 헤어핀에 의해 수행되는 과정을 보여준다.
도 2a는 본 발명의 양태에 따른 RNA-seq 라이브러리 제조의 개략도이다. 도 2b는 본 발명에 따른 포획 헤어핀 올리고(CHO)의 특징을 삽입된 설명과 함께 묘사한다. 도 2c는 데메틸라제 처리 유무에 따른, 전체 RNA-seq 라이브러리로부터의 최종 PCR 생성물을 보여준다. DNA 크기 마커는 겔의 왼쪽에 표시되어 있다. 인간 tRNA에서 m1A58 및 m1G37 변형에 의해 야기된 주요 RT(역전사효소) 정지는 겔 오른쪽에 표시된다. TdT는 RT의 비정상적인 말단 트랜스퍼라제 활성으로부터 유도된 생성물에 상응한다. 도 2d는 데메틸라제 처리 유무에 따른, 다양한 양의 투입 전체 RNA로부터 제작된 라이브러리의 최종 PCR 생성물을 보여준다. 도 2e는 데메틸라제 및/또는 과요오드산염 처리의 유무에 따른, HEK293T 전체 RNA(대조군) 및 인간 대변 총 핵산으로 시작하는 라이브러리의 최종 PCR 생성물을 보여준다. 도 2f는 데메틸라제 처리 유무에 따른, 다중화된 구강(혀 스크래핑 시료(tongue scrapes)) 마이크로바이옴 라이브러리의 최종 PCR 생성물을 보여준다.
도 3a는 헤어핀 올리고뉴클레오티드에 합성 올리고뉴클레오티드의 접합 결과를 보여준다. 도 3b는 데메틸라제 및/또는 과요오드산염 처리 유무에 따른, 접합된 올리고뉴클레오티드가 고체 지지체 비드(bead)에 고정화된 역전사 실험의 결과를 보여준다. 도 3c는 2차 접합에서 추가의 프라이머를 부가한 후 수행된 PCR 생성물을 나타내며, 이는 투입 RNA가 3'-A 또는 3'-C로 끝나는 경우 최종 생성물에 약간의 편향이 있음을 보여준다. 도 3d는 탈포스포릴화 단계의 효율을 입증한다. 도 3e는 과요오드산염 처리 유무에 따른, 상이한 말단 뉴클레오티드를 갖는 헤어핀 올리고뉴클레오티드의 접합 생성물을 보여준다. 도 3f는 원-팟(one-pot) 서열분석에서 tRNA 하전을 측정하는 개략도를 묘사한다. 도 3g는 도 3g에 나타낸, 처리 유(+,+) 무(-,-)에 따른 최종 PCR 생성물을 보여준다.
도 4a는 다양한 유형의 RNA의 존재를 나타내는 에스케리키아 콜라이(E.coli) 게놈에 맵핑된 RNA-seq 결과를 묘사한다. 도 4b는 서열분석 또는 마이크로어레이 하이브리드화에 의해 측정된 tRNAArg 또는 tRNALeu 이소수용체의 상대적 존재량의 비교를 묘사한다; 각 쌍의 왼쪽에 있는 옅은 색 점들은 마이크로어레이 데이터이고, 각 쌍의 오른쪽에 있는 짙은 색 점들은 RNA-seq 데이터이다. 도 4c는 데메틸라제 처리 유무에 따른, RNA로부터 제작된 라이브러리의 비교를 묘사한다. 도 4d는 개별 tRNA에 따른 돌연변이 분획의 히트맵이다. 도 4e는 데메틸라제의 유무에 따른, rpm(분당 판독수)>1에서 비-암호화 RNA 전사체의 존재량을 묘사한다.
도 5a는 10분 동안 3가지의 급성 스트레스 조건의 존재 및 부재하에, LB에서 성장한 에스케리키아 콜라이로부터의 전체 RNA의 생물학적 복제물들 중 RNA 전사체 존재량의 상관관계를 보여준다. 도 5b는 데메틸라제로 처리된 샘플과 처리되지 않은 샘플의 전사체 존재량 사이의 관계를 보여준다. 도 5c는 데메틸라제 처리 유무에 따른, 라이브러리로부터의 tRNAPro(GGG)에 따른 돌연변이율을 보여준다. 도 5d는 데메틸라제 처리 유무에 따른, tRNAPro(GGG)에 따른 판독물 밀도를 보여준다. 도 5e는 상이한 스트레스 및 비스트레스 조절 동안 3개의 스트레스-반응성 소형 비-암호화 RNA 및 비반응성 조절 RNA SRP(ffs로도 알려진 신호 인식 입자 RNA)의 존재량을 묘사한다. 도 5e에서 분석된 스트레스-반응성 서열은 다음이었다: 산화 스트레스에 반응하는 OxyS(+); 철 결핍에 반응하는 rhyB(삼각형); 글루코스 결핍에 반응하는 sgrS(사각형); 및 무반응성 조절 서열인 ffs(SRP; 원). 도 5f는 스트레스 및 대조군(없음)으로 비스트레스 동안 3개의 스트레스-반응성 소형 비-암호화 RNA 및 조절 RNA SRP(ffs)의 커버리지 밀도를 묘사한다. 도 5g는 스트레스 동안 에스케리키아 콜라이 RNA 존재량 및 변형의 변화를 묘사한다.
도 6a는 판독물을 다양한 유형의 RNA를 나타내는 인간 게놈에 맵핑하는 방법을 묘사한다. 도 6b는 서열분석 또는 마이크로어레이 하이브리드화에 의해 측정된 tRNAArg 이소수용체의 상대적 존재량의 비교를 묘사한다; 각 쌍의 왼쪽에 있는 옅은 색 점들은 마이크로어레이 데이터이고, 각 쌍의 오른쪽에 있는 짙은 색 점들은 RNA-seq 데이터이다. 도 6c는 1 ㎍, 100 ng, 또는 10 ng의 전체 RNA로 시작하는 라이브러리로부터의 tRNA 존재량 결과의 상관관계를 묘사한다. 도 6d는 rpm>10에서 소형 비-암호화 RNA 전사체의 존재량을 묘사한다.
도 7a는 데메틸라제 처리하에 상이한 RNA 부류로부터의 전사체 존재량의 상관관계를 보여준다. 도 7b는 각 부류 내의 상이한 RNA 부류의 생물학적 복제물의 상관관계를 보여준다. 도 7c는 본 발명의 RNA-seq 방법을 사용한 데메틸라제-처리된 라이브러리로부터의 tRNA 존재량 대 통상적인 방법을 사용하여 제작된 데메틸라제-처리된 tRNA 라이브러리의 연구의 상관관계를 묘사한다. 도 7d는 데메틸라제 처리 하에 및 처리 없이 제작된 라이브러리로부터 tRNAArg(ACG)에 따른 돌연변이율을 묘사한다. 도 7e는 tRNAArg(ACG)에 따른 판독물 밀도를 보여준다. 도 7f는 rpm>2에서 검출된 마이크로RNA의 존재량을 묘사한다. 도 7g는 폴리(A)-선택된 RNA로부터 제작된 RNA-서열분석 라이브러리의 판독물 분석을 묘사한다. 도 7h는 대부분의 판독물이 생물학적 복제물들 사이에 적합한 상관관계 하에, mRNA에 맵핑됨을 보여준다.
도 8a는 RNA-seq에 CMC 반응을 도입하는 것의 개략도를 묘사한다. 도 8b는 생물학적 복제물 중에서 인간 rRNA의 각각의 뉴클레오티드 위치에서의 돌연변이 및 정지 분획을 묘사한다. 도 8c는 18S rRNA에서 Ψ-풍부 영역의 돌연변이 및 정지 분획을 묘사한다. 도 8d는 28S rRNA에서 Ψ-풍부 영역의 돌연변이 및 정지 분획을 묘사한다. 도 8e는 18S rRNA의 길이를 따라 각각의 뉴클레오티드 부위에서 판독물의 돌연변이 분획을 보여준다. 도 8f는 도 8e에서와 동일한 방식으로 분석된 판독물의 정지 분획을 보여준다.
도 9a는 인간 혀 스크래핑 시료(scraping)로부터의 주요 RNA 부류에 판독물의 할당을 보여준다. 도 9b는 다양한 세균 분류학적 부류로부터의 SRP RNA와 5S rRNA의 상관관계를 보여준다. 값은 log10 존재량의 Z-점수로 계산된다. 도 9c는 도 9b에서와 같이 세균 분류학적 부류에 대해 SRP RNA 존재량과 모든 확인된 tRNA의 합의 상관관계를 보여준다. 도 9d는 도 9b에서와 같이 세균 분류학적 부류에 대해 5S rRNA와 모든 확인된 tRNA의 합의 상관관계를 보여준다. 도 9e는 프레보텔라 멜라니노제니카(Prevotella melaninogenica)의 SRP에 대한 판독물 맵핑을 보여준다; 판독물은 유전자의 주석이 달린 5'-말단(상단)(대문자)에 맵핑된 반면, 전사체의 3'-말단(하단)은 게놈 서열(소문자) 내로의 유전자 주석보다 1 내지 3개 염기를 지나 있다; 연장된 3'-말단은 SRP 구조적 맥락(중간)과 일치한다. 도 9f는 로티아 뮤실라기노사(Rothia mucilaginosa)의 SRP에 대한 판독물 맵핑을 보여준다; 판독물은 유전자의 주석이 달린 5'-말단(상단)의 2 내지 5개 염기 하류에 맵핑된 반면, 3'-말단(하단)은 주석이 달린 말단의 4 내지 8개 뉴클레오티드 만큼 짧아지는 3'-말단을 갖는 개체들간 이종성을 보여준다.
도 10a는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 또는 16S 앰플리콘 유전자 서열분석에 의해 측정된 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다. 도 10b는 tRNA, 5S rRNA, SRP RNA 및 16S 앰플리콘 서열분석에 의해 측정된 바와 같이, 상이한 4 개체에 대한 2일 연속 혀의 미생물 존재량의 배수 변화를 보여준다. 도 10c는 인간 대변으로부터의 상이한 주요 RNA 부류에 판독물 할당을 보여준다. 도 10d는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 또는 16S 앰플리콘 유전자 서열분석에 의해 측정된 2개의 인간 대변 샘플로부터의 미생물의 분류학적 조성을 보여준다.
도 11a는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 또는 16S 앰플리콘 유전자 서열분석에 의해 측정된 4개의 상이한 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다. 도 11b는 안티코돈 "TTT" 또는 "CTT"를 갖는 tRNA를 사용하여 계산된 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다.
도 12a는 인간 혀 스크래핑 시료로부터의 로티아 속의 세균의 개별 tRNA에 따른 돌연변이율의 히트맵을 보여준다. 도 12b는 A에서와 같은 히트맵을 보여주지만, 데메틸라제 처리에 민감한 돌연변이를 확인한다. 도 12c는 속으로부터 선택된 tRNA의 위치 37 및 주변 염기에서의 돌연변이율을 보여준다. 도 12d는 데메틸라제 처리 유무에 따른, 인간 혀의 여러 세균 분류군에서 선택된 tRNA의 위치 22에서의 돌연변이율을 보여준다. 도 12e는 D에서와 같이 인간 혀로부터 악티노박테리아(Actinobacteria)의 위치 58에서의 N1-메티아데노신(m1A)(m1A58)을 확인한다. 도 12f는 연속 2일에 4명의 인간 혀 스크래핑 시료로부터 데메틸라제 처리없이 선택된 세균 부류에 대한 위치 22에서의 돌연변이율을 보여준다. 도 12g는 연속 2일에 4명의 인간 혀 스크래핑 시료로부터 데메틸라제 처리없이 악티노박테리아에 대한 위치 58에서의 돌연변이율을 보여준다. 도 12h는 인간 대변으로부터 D에서와 같이 선택된 세균 부류에서 m1A22를 확인한다. 도 12i는 인간 대변으로부터 E에서와 같이 악티노박테리아에서의 m1A58을 확인한다.
도 13은 SARS-CoV-2 감염 개체의 코에서 수득한 샘플에서 검출된 tRNA의 히스토그램을 묘사한다.
도 14는 건강한 대조군 및 인플루엔자- 및 SARS CoV-2-감염 환자의 비인두 면봉시료로부터 수득한 샘플로부터의 tRNA 분석 결과를 묘사한다. 도 14a는 3개의 환자 그룹에 대한 tRNA 서열을 따른 순차적인 영역에서의 tRNA 단편화 패턴을 보여준다. 도 14b는 3개 환자 그룹 중 특정 tRNA의 5'-절반 단편에서 tRNA 판독물의 분획을 보여준다; ns, 유의하지 않음, P-값: * <0.05; ** <0.01; *** <10-3 및 **** <10-4. 도 14c는 3개 환자 그룹 중 동일한 샘플에서 소형 rRNA에 대한 특정 tRNA의 상대적 존재량을 보여준다. 도 14d는 샘플들 중 특정 tRNA 염기 변형 프로필의 패턴을 보여준다.
도 15는 6명의 대장암(CRC) 환자로부터의 종양 및 인접 조직에서의 tRNA-seq 존재량, 변형 및 단편화의 척도를 묘사한다. 도 15a는 tRNAAla(TGC)의 존재량이 인접 조직보다 종양에서 일관되게 더 높다는 것을 보여준다(왼쪽 패널). 대조적으로, tRNALeu(AAG) 수준은 가변적이어서, 다양한 종양의 이종성을 강조한다(오른쪽 패널). 도 15b, 위쪽 패널은 특정 tRNA에서의 변형이 서열분석에서 혼입오류(돌연변이)에 의해 검출될 수 있음을 보여준다. 아래 패널은 샘플을 데메틸라제 효소로 처리하면 다른 유형(I)에 영향을 미치지 않으면서 한 유형의 염기 변형(m1A)을 제거할 수 있음을 보여준다. 도 15c는 상이한 세포 조건에 반응하는 세포 뉴클레아제 절단(cleavage)으로부터 생성된 tRNA 단편을 보여준다.
도 16은 개변 환자에서 미토콘드리아 tRNA의 종양 발현 패턴을 묘사한다. 도 16a는 미토콘드리아 tRNA의 발현이 6명의 환자 중 4명의 환자에 대해 인접 조직에 비해 종양에서 더 낮음을 보여준다. 도 16b는 미토콘드리아 tRNA 발현 데이터의 더 큰 데이터 세트를 포함하면 높은 BMI(체질량 지수) 환자의 종양이 낮은 BMI 환자의 종양에 비해 더 높은 미토콘드리아 tRNA 유전자 발현을 나타냄이 드러난다는 것을 보여준다.
도 17은 CRC 환자에서 5S rRNA 발현에 의해 측정된 미생물 군집의 조성을 묘사한다.
도 18은 아종 검출을 보여주는, 1명의 환자로부터의 에스케리키아 페칼리스(E. faecalis) tRNATyr 데이터를 묘사한다. 도 18a는 서열분석 동안의 염기 혼입오류 사건이 마이크로바이옴 샘플에서 tRNA 변형(m1A) 또는 유전적 다양성(SNP)으로 인한 것일 수 있음을 보여준다. 위치 7에서의 혼입오류는 밀접하게 관련된 세균 종들 사이의 유전적 다양성을 반영하고, 도 18b는 종 구성이 수술 후 상당히 변경되는 것을 보여준다. 위치 23에서의 혼입오류는 염기 변형을 반영하고, 도 18c는 상기 변형의 분율이 수술 후 변화함을 보여준다.
양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 상기 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다. 양태들에서, 3'-말단 뉴클레오티드의 당 성분은 펜토스일 수 있고, 펜토스는 리보스일 수 있다.
양태들에서, 본 발명은 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드를 제공하고, 이때 상기 3'-말단 뉴클레오티드의 당 위치는 당의 2',3'-다이알데하이드 산화 생성물을 포함한다.
본원에서 사용되는 바와 같이, "올리고뉴클레오티드"는 전형적으로 길이가 200개 미만 뉴클레오티드인 폴리뉴클레오티드 쇄이며, 양태들에서 10 내지 80개의 뉴클레오티드(예를 들어, 10, 20, 30, 40, 50, 60, 70 또는 80개 뉴클레오티드)이다. 올리고뉴클레오티드는 단일-가닥 또는 이중-가닥일 수 있으며, DNA, RNA 또는 둘 다로 이루어질 수 있다. "헤어핀 올리고뉴클레오티드"는 폴리뉴클레오티드가 단일-가닥 루프를 갖는 이중-가닥 줄기를 갖는 구조를 형성하기 위해 그 자체로 다시 접힐 수 있도록 자가-상보성 서열을 갖는 폴리뉴클레오티드의 한 유형을 지칭한다(예를 들어, 도 1 및 2 참조).
양태들에서, 본원에 기술된 임의의 헤어핀 올리고뉴클레오티드는 추가로 5'-말단 리보뉴클레오티드를 포함할 수 있다. 상기 5'-말단 리보뉴클레오티드는 5'-포스페이트를 포함할 수 있다.
양태들에서, 본원에 기재된 임의의 헤어핀 올리고뉴클레오티드는 (i) 바코드 서열; (ii) 친화성 모이어티-태그된(moiety-tagged) 뉴클레오티드; 및 (iii) 프라이머 결합 부위를 추가로 포함할 수 있다. 도 2b에 도시된 바와 같이, 본 발명의 한 양태에서, 바코드 및 프라이머 결합 부위 서열은 헤어핀 올리고뉴클레오티드의 줄기 영역을 형성하는 폴리뉴클레오티드 서열의 신장부(stretch) 내에 삽입될 수 있는 반면, 본 발명의 한 양태에서, 친화성 모이어티-태그된 뉴클레오티드는 헤어핀 뉴클레오티드의 루프 내부에 있을 수 있다.
양태들에서, 헤어핀 올리고뉴클레오티드는 다음 식(I): 5'-Phos-rA CT-X-AGA TCG GAA GAG CAC ACG AT (서열번호 86)-LT-AGA CGT GTG CTC TTC CGA TCT (서열번호 87)-Z-AG rU-3'-Phos (이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티로 태그된 티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다)의 뉴클레오티드 서열을 포함할 수 있다. 양태들에서, 식(II)의 뉴클레오티드 서열은 다음을 포함할 수 있다: 5'-Phos-rA CT-X-GAT CGT CGG ACT GTA GAA CAT (서열번호 88)-LT-AG AGT TCT ACA GTC CGA CGA TC (서열번호 89)-Z-AG rU-3'-Phos (이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티로 태그된 티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다).
하기 표는 전술한 예시적인 헤어핀 올리고뉴클레오티드의 전장 DNA 서열들을 제시한다:
[표 1] 예시적인 헤어핀 올리고뉴클레오티드
Figure pct00001
본원에서 사용되는 바와 같이, "바코드"라는 용어는 바코드가 연관되어 있는 폴리뉴클레오티드의 일부 특징을 확인할 수 있게 하는 공지된 핵산 서열을 지칭한다. 종종, 확인될 폴리뉴클레오티드의 특징은 폴리뉴클레오티드가 유래된 샘플이다. 양태들에서, 바코드는 길이가 적어도 3, 4, 5, 6개 이상의 뉴클레오티드이다. 양태들에서, 바코드는 길이가 3개 뉴클레오티드보다 짧지 않다. 양태들에서, 다수의 바코드를 함유하는 혼합물에서 각각의 바코드는 적어도 2개의 뉴클레오티드 위치, 예를 들면, 적어도 2, 3, 4, 5개 이상의 위치가 다수 바코드중 다른 모든 바코드와 상이하다. 바람직하게, 혼합물 중의 바코드는 적어도 3개의 뉴클레오티드 위치가 서로 상이하다. 일반적으로, 바코드는 충분한 길이를 가지며, 연관된 바코드를 기반으로 샘플을 확인할 수 있도록 충분히 상이한 서열을 포함한다.
본원에서 사용되는 바와 같이, 용어 "프라이머"는 상보성 뉴클레오티드 서열과 하이브리드화될 수 있고 DNA 합성을 위한 출발점을 제공할 수 있는 뉴클레오티드 서열을 지칭한다. 프라이머는 상보성 뉴클레오티드 서열에 대한 특이적인 결합을 제공하기에 충분한 길이이다. 프라이머는 길이가 6, 7, 8, 9, 10개 이상의 염기, 전형적으로 길이가 15, 16, 17, 18, 19 또는 20개의 뉴클레오티드일 수 있다. 프라이머는, 예를 들어, 더 긴 단일-가닥 폴리뉴클레오티드 서열 내의 서열일 수 있다. 대안적으로, 프라이머는 단일-가닥 올리고뉴클레오티드일 수 있다.
양태들에서, 본원에 기술된 임의의 헤어핀 올리고뉴클레오티드는 고체 지지체 상에 고정화될 수 있다. 고체 지지체는 컬럼 크로마토그래피와 같은 생화학 공정에 사용하기에 적합한 임의의 고체 지지체일 수 있다. 예를 들어, 고체 지지체는 공극-제어 유리, 또는 폴리스티렌 지지체와 같은 중합체 지지체일 수 있다. 적합한 고체 지지체는 종종 중합체이고, 다양한 형태 및 조성을 가질 수 있다. 일부 고체 지지체는 천연 물질에서 유래하고, 다른 고체 지지체는 합성적으로 변형된 천연 물질에서 유래하고, 다른 고체 지지체는 합성 물질이다. 적합한 지지체 물질의 예는 아가로스 및 덱스트란과 같은 폴리사카라이드, 폴리아크릴아미드, 폴리스티렌, 폴리비닐 알콜, 하이드록시에틸 메타크릴레이트와 메틸 메타크릴레이트의 공중합체, 실리카, 테플론, 유리 등을 포함하지만, 이로 제한되지 않는다. 양태들에서, 고체 지지체는 비드를 포함할 수 있다. 양태들에서, 비드는 실질적으로 균일한 구형 비드일 수 있다.
양태들에서, 본원에 기술된 임의의 헤어핀 올리고뉴클레오티드는 RNA-서열 라이브러리를 제조하는데 사용될 수 있다. 양태들에서, 헤어핀 올리고뉴클레오티드는 RNA-서열 라이브러리를 제조하는 다중화 방법(multiplex method)에 사용된다. 본원에서 사용되는 바와 같이, 용어 "다중화"는 다수의 샘플을 모으고 모인 샘플을 하나 이상의 생화학적 공정에 동시에 적용하는 것을 지칭한다. 예시적인 방법은 하기에서 기술한다.
양태들에서, 본 발명은 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하는 고체 지지체를 제공하고, 상기 올리고뉴클레오티드는 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'- 하이드록실 및 3'-포스페이트를 포함하고, 올리고뉴클레오티드는 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화된다.
올리고뉴클레오티드 상의 친화성 모이어티 및 고체 지지체 상의 리간드 모이어티는 친화성 쌍을 형성한다. "친화성 쌍"은, 예를 들어, 소수성, 친수성, 수소 결합, 극성, 전하, 불소친화성 등과 같은 고유한 성질을 통해 서로 특이적으로 결합하는 친화성 모이어티 및 리간드 모이어티를 포함한다. "친화성 모이어티" 및 "리간드 모이어티"란 용어는 모이어티 자체의 정체성을 제한하지 않고(예를 들어, 리간드 모이어티는 친화성 모이어티보다 작을 필요는 없다) 친화성 쌍을 형성할 수 있는 것으로서 모이어티를 식별한다. 친화성 쌍의 잘 알려진 유형 한 가지는 단백질과 그 리간드이다. 친화성 모이어티 및 리간드 모이어티는 각각 직접 또는 간접적으로 오쏘에스터 링커를 통해 올리고뉴클레오티드 및 고체 지지체에 별개로 부착될 수 있다. 양태들에서, 친화성 모이어티는 비오틴 태그, 말토스 태그, 글루타티온 태그, 아다만탄 태그, 아릴보론산 태그, 폴리-히스티딘 펩티드 태그, 폴리-설프하이드릴 태그, 말레이미드 태그, 아지도 태그 등이다. 이들 양태에서, 상응하는 리간드 모이어티는 아비딘 또는 스트렙타비딘, 말토스 결합 단백질, 글루타티온 S-트랜스퍼라제(GST), 쿠커비투릴 또는 사이클로덱스트린, 디올 함유 분자, 고정화 금속 친화성 크로마토그래피(IMAC) 매트릭스, 설프하이드릴-함유 화합물, 알킨 또는 사이클로옥틴 등이다. 양태들에서, 친화성 모이어티는 비오틴일 수 있고, 리간드 모이어티는 스트렙타비딘일 수 있다(예를 들어, 도 2a 및 2b 참조). 숙련된 자라면 친화성 쌍의 어느 구성원을 올리고뉴클레오티드에 부착하고 어느 구성원을 고체 지지체에 부착할 지를 결정할 수 있다. 전술한 바와 같이, 양태들에서, 고체 지지체는 비드일 수 있다. 양태들에서, 비드는 실질적으로 균일한 구형 비드일 수 있다.
고체 지지체는 본원에 기술된 바와 같은 임의의 헤어핀 올리고뉴클레오티드를 포함할 수 있다. 예를 들어, 올리고뉴클레오티드는 (a) 리보뉴클레오티드로서의 5'-말단 뉴클레오티드, (b) 바코드 서열, (c) 헤어핀의 루프 내부의 친화성 모이어티로 태그된 뉴클레오티드, 및 (d) 프라이머 결합 부위를 추가로 포함할 수 있다.
양태들에서, 본 발명은 다음을 포함하는 RNA 서열 라이브러리를 제조하는 방법을 제공한다:
(a) RNA 서열을 헤어핀 올리고뉴클레오티드에 접합시켜 구조물, 3'-말단 뉴클레오티드를 포함하는 올리고뉴클레오티드(이때, 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다)를 형성하고,
(b) RNA 서열을 cDNA 서열로서 역전사시키고,
(c) PCR을 사용하여 cDNA 서열을 증폭시킨다.
양태들에서, 상기 방법은 (i) 리보뉴클레오티드로서의 5'-말단 뉴클레오티드, (ii) 바코드 서열, (iii) 헤어핀의 루프 내부의 친화성 모이어티-태그된 뉴클레오티드, 및 (iv) 프라이머 결합 부위를 추가로 포함하는 헤어핀 올리고뉴클레오티드를 포함할 수 있다.
도 2a는 RNA-seq 라이브러리의 제조에 사용되는 본 발명의 헤어핀 올리고뉴클레오티드의 비제한적 양태를 개략적으로 묘사한다. 공정은 제조된 포획 헤어핀 올리고뉴클레오티드(CHO)를 RNA 분자에 접합시키는 것으로 시작할 수 있으며, 이때 CHO는 3'-말단 뉴클레오티드를 포함하고, 상기 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다. 헤어핀 올리고뉴클레오티드는 "온-비드(on-bead)" RNA 서열분석 라이브러리 제조를 가능하게 하도록 설계될 수 있다. 예시적인 CHO로서, 도 2b에 도시된 바와 같은 CHO의 특징은 다음이다: (1) 효율적인 접합을 위한 5'-포스페이트; (2) 효율적인 RNA-RNA 접합을 위한 5'-말단 리보뉴클레오티드; (3) 다수 샘플의 다중화/혼합을 가능하게 하기 위한 바코드 서열; (4) 고정화를 가능하게 하기 위한 CHO의 루프 내부의 친화성-모이어티-태그된 뉴클레오티드; (5) 프라이머 결합 부위; (6) 당 성분이 2'-하이드록실을 포함하여 연장되지 않은 헤어핀 올리고뉴클레오티드에 대한 접합을 방지하고 비생산적인 접합 생성물의 산화를 가능하게 하는 3'-말단 뉴클레오티드; 및 (7) CHO의 자가-접합을 방지하기 위한 3'-포스페이트. 양태들에서, 3'-말단 뉴클레오티드의 당 성분은 펜토스일 수 있고, 펜토스는 리보스일 수 있다.
RNA 분자는 임의의 적합한 RNA 서열일 수 있다. 양태들에서, RNA 서열은 전체 RNA(예를 들어, 샘플 내의 상이한 유형의 RNA에 대한 헤어핀 올리고뉴클레오티드의 접합에 의해 형성된 여러 상이한 구조물)를 포함할 수 있다. 또 다른 양태에서, RNA 서열은 소형 RNA일 수 있다. 소형 RNA에는 tRNA, 마이크로RNA, piRNA, tRNA의 단편, rRNA, 긴 비-암호화 RNA(lncRNA), 스플라이소좀 RNA(snRNA), 소형 핵소체 RNA(snoRNA) 등이 포함된다. 양태들에서, 사용되는 RNA 서열은 tRNA일 수 있다.
하나의 양태로서, 도 1 및 2a는 RNA 리가제를 사용한 tRNA에 대한 바코드-함유 CHO의 접합을 보여준다. 임의의 적합한 RNA 리가제, 예를 들어, T4 RNA 리가제 1 또는 2 등을 사용할 수 있다. 양태들에서, 사용된 리가제는 T4 RNA 리가제 1일 수 있다. 5'-말단 리보뉴클레오티드는 5'-포스페이트를 포함할 수 있고 접합 효율을 촉진할 수 있다. 3'-포스페이트는 1차 접합에서 헤어핀 올리고뉴클레오티드의 자가-접합을 차단하여, RNA에 대한 헤어핀 올리고뉴클레오티드 접합의 효율을 향상시킨다.
바코드 접합 반응 후, 모든 후속 반응은 고체 지지체 상에 tRNA-함유 CHO의 고정화 후에 수행될 수 있다. 올리고뉴클레오티드는 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화될 수 있다. 이것은 간단한 세척으로 모든 단계에서 과잉 시약의 제거를 촉진하여, 각 단계동안 샘플 손실을 상당히 감소시킨다.
상기 방법의 양태들에서, 고체 지지체는 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하고, 상기 올리고뉴클레오티드는 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함하고, 올리고뉴클레오티드는 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화된다. 양태들에서, 친화성 모이어티는 비오틴일 수 있고, 리간드 모이어티는 스트렙타비딘일 수 있다(예를 들어, 도 2a 및 2b 참조).
상기 방법의 양태들에서, 고체 지지체는 비드일 수 있다. 양태들에서, 고체 지지체는 (a) 리보뉴클레오티드로서의 5'-말단 뉴클레오티드, (b) 바코드 서열, (c) 헤어핀의 루프 내부의 친화성 모이어티로 태그된 뉴클레오티드, 및 (d) 프라이머 결합 부위를 추가로 포함하는 올리고뉴클레오티드를 고정화시킨다. 양태들에서, 고체 지지체는 RNA-서열 라이브러리를 제조하는데 사용될 수 있다. 다른 양태들에서, 고체 지지체는 RNA-서열 라이브러리를 제조하는 다중화 방법에 사용될 수 있다. 바코드 표시된 CHO가 고체 지지체에 고정화된 후, 샘플을 모아서 다중화할 수 있다.
tRNA-함유 CHO를 고체 지지체에 결합시킨 후, RNA의 선택적인 효소 또는 화학 처리를 수행하여 RNA 변형을 프로파일링하거나 RNA 구조를 맵핑할 수 있다. 예를 들어, 데메틸라제 처리는 tRNA 및 tRNA 단편 서열분석의 효율 및 정량화를 개선하고, 마이크로바이옴 tRNA 또는 mRNA에서 N1-메틸아데노신(m1A)과 같은 새로운 RNA 변형을 발견하기 위한 검증을 제공한다. 많은 RNA의 구조적 맵핑은 2'-OH(SHAPE)에 2-메틸니코틴산 이미다졸리드를 사용하거나 염기 형태에 다이메틸설페이트/케톡살을 사용하는 것과 같은 화학 반응을 수반한다. RNA 변형 연구에서, 슈도우리딘(Ψ) 또는 5-메틸시토신(m5C) 부위를 확인하는 데 화학 반응을 사용한다. 예를 들어, 도 2a는 tRNA에서 왓슨-크릭(Watson-Crick) 표면 메틸화를 제거하기 위해 tRNA를 포함하는 비드-고정화된 CHO를 데메틸라제로 처리하는 것을 묘사한다. 양태들에서, 데메틸라제는 AlkB 데메틸라제 혼합물일 수 있다.
도 1 및 2a는 RNA-seq 라이브러리의 제조에 사용될 수 있는 다른 절차의 예를 추가로 묘사한다. 탈메틸화 후, 3'-포스페이트 기는 알칼리성 포스파타제로 제거할 수 있다. 양태들에서, 알칼리성 포스파타제는 송아지 장(CIP)에서 수득된다.
탈포스포릴화 후, CHO의 3'-OH는 역전사효소에 의해 연장되어 RNA의 cDNA 카피를 만들 수 있다. 임의의 적합한 역전사효소(RT), 예를 들어, TGI RT, AMV RT, ThermoScript™ RT(Invitrogen™), MMLV RT, SuperScript™ IV RT(Invitrogen™) 등을 사용할 수 있다. 양태들에서, 역전사효소는 SuperScript™ IV RT(Invitrogen™)일 수 있다.
역전사 후, tRNA 서열은 RNase로 절단(digesting)될 수 있다. RNase H와 같이, DNA/RNA 이중체에서 RNA 가닥을 분해할 수 있는 엔도뉴클레아제 RNase가 바람직하다. 양태들에서, RNase는 RNase H일 수 있다.
RNase 절단 후, CHO는 과요오드산염, 바람직하게는 과요오드산나트륨(NaIO4)으로 산화시킬 수 있다. 도 1에 예시된 바와 같이, CHO는 초기 접합 단계 후에 상이한 결과를 가질 수 있어서, 과요오드산염으로 처리될 때 CHO의 일부만이 산화되기 쉬울 것이다.
모든 CHO는 탈포스포릴화가 일어날 수 있지만, 탈포스포릴화의 최종 생성물은 상이할 수 있다. RNA에 성공적으로 접합된 CHO는 3'-OH의 역전사 효소에 의해 쇄 연장이 일어날 것이다. 이어서, 이들 CHO는 3'-말단 데옥시리보뉴클레오티드를 가질 것이다, 즉, 말단 3'-OH 및 2'-H를 가질 것이다. 이들 CHO는 과요오드산염 산화에 필요한 2',3'-디올 구조를 갖지 않을 것이다. 따라서, 2'- 및 3'-OH 둘 다에서 종결되는 CHO, 즉 접합을 거치지 않아서 cDNA에 의해 연장되지 않은 CHO 만이 과요오드산염에 의해 산화될 것이다(예를 들어, 도 1b 참조). 산화된 CHO의 말단 다이알데하이드(예를 들어, 도 1b 참조)는 이러한 CHO가 후속의 2차 접합이 일어나는 것을 방지하므로, 후속 반응에서 기술적 노이즈를 감소시킬 것이다.
2차 접합이 이어질 수 있으며(예를 들어, 도 1 및 2a 참조), PCR 증폭 전에 2차 "역" 프라이머 결합 부위를 부가하여 상보성 DNA 가닥 둘 다 PCR 동안 생성될 것이다. 2차 접합 올리고뉴클레오티드는 5'-말단에 단분자 지수(Unimolecular Index(UMI)) 서열 및 3'-말단에 다이데옥시 뉴클레오티드를 포함할 수 있다(예를 들어, 도 1 참조). 3'-말단 다이데옥시 뉴클레오티드는 올리고뉴클레오티드의 자가-접합을 차단한다. UMI는 샘플 라이브러리의 각 분자에 고유하게 태그를 지정하는 데 사용되는 짧은 서열이다. 이들은 서열분석중 오류 교정 및 정확도 향상을 제공하고 RNA-서열분석중 PCR 인공물의 중복제거를 가능하게 하는 분자 바코딩의 한 유형이다. 2차 접합 단계에서 사용하기 위한 예시적인 올리고뉴클레오티드는 다음 식(III): 5'-Phos-NNN NNN GAT CGT CGG ACT GTA GAA-3ddC (서열번호 22)의 올리고뉴클레오티드, 및 식(IV): 5'-Phos-NNN NNN AGA TCG GAA GAG CAC ACG-3ddC(서열번호 23)의 올리고뉴클레오티드 (이때, N의 문자열은 6개 뉴클레오티드 길이의 UMI 서열을 나타낸다)이다.
RNA-seq 라이브러리 제조 후, cDNA 연장된-CHO는 PCR 증폭이 일어날 수 있다. 임의의 적합한 PCR 시약 시스템 및 유전자증폭기(thermocycler) 기기를 PCR에 사용할 수 있다. PCR 생성물은 용액 중에 유리하고, DNA 서열분석에 용이하게 사용할 수 있다.
상기에 예시된 바와 같이, 방법은 여러 양태를 포함할 수 있다. 양태들에서, 상기 방법은 접합 후 3'-포스페이트를 탈포스포릴화시키고, 역전사후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 것을 추가로 포함할 수 있다. 양태들에서, 상기 방법은 또한 접합 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화(Watson-Crick face methylation)를 탈메틸화하는 것을 포함할 수 있다. 양태들에서, 방법은 또한 역전사후 RNA 서열을 절단하고, 증폭 전에 2차 접합을 수행하여 2차 프라이머 결합 부위를 부가하는 것을 포함할 수 있다. 양태들에서, 방법은 1차 접합 후 고체 지지체 상에 구조물을 고정화시키는 것을 추가로 포함할 수 있다. 양태들에서, 방법은 또한 고정화후 3'-포스페이트를 탈포스포릴화하고, 역전사후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 것을 포함할 수 있다. 양태들에서, 방법은 또한 고정화 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화를 탈메틸화하는 것을 포함할 수 있다. 양태들에서, 방법은 또한 역전사후 RNA 서열을 절단하고 증폭 전에 2차 접합을 수행하여 2차 프라이머 결합 부위를 부가하는 것을 포함할 수 있다. 양태들에서, 방법은 전체 RNA, 소형 RNA, tRNA, 마이크로 RNA, piRNA 또는 이들의 임의의 조합을 포함하는 RNA를 사용할 수 있다. 양태들에서, 방법은 다중화 방법을 포함할 수 있다. 양태들에서, 본 발명은 바코드 어댑터 접합, 고정화 및 역전사에 이어서 2차 어댑터 접합, 및 온-비드 PCR에 사용되는 친화성 모이어티-태그된 올리고뉴클레오티드를 포함할 수 있다. RNA-seq 라이브러리 구성에서 다수의 단계의 단일화는 동일한 반응에서 많은 샘플의 다중화를 가능하게 하므로, 시간, 시약 및 기술적 노이즈를 감소시키고 처리량을 크게 증가시킨다. 상기 설계는 또한 온-비드로 RNA의 효율적인 효소 및 화학적 처리를 포함할 수 있게 한다.
고체 지지체-기반 RNA-seq 방법의 개발은 다중화된 서열분석 라이브러리 제조, 온-비드 효소 및 화학 처리, 원-팟 tRNA 존재량, 변형 및 하전 측정, 및 DNA의 개입없이 전체 핵산 마이크로바이옴 샘플의 분석을 가능하게 한다.
고체 지지체 상에서 서열분석 라이브러리 구성의 대부분의 절차를 수행할 수 있다는 이점은 각각의 절차 사이에 완충제 및 시약의 신속한 교환, 오염물의 철저한 제거, 및 크기 선택 또는 어댑터/RT 프라이머 제거를 요하는 모든 절차의 배제를 가능하게 한다는 것이다. 고체 지지체 플랫폼은 또한, RNA에서 왓슨-크릭 표면 메틸화를 제거하는데 사용되는 데메틸라제와 같은 효소로 RNA의 온-비드 처리를 가능하게 하여, 효율적이고 정량적인 tRNA 서열분석 및 마이크로바이옴 tRNA 변형의 검증을 가능하게 하다.
양태들에서, 본 발명의 헤어핀 올리고뉴클레오티드는 바이오마커를 개발하는데 사용될 수 있다. 양태들에서, 바이오마커를 개발하는 것은 tRNA 단편화 프로필을 생성하는 것을 포함한다. 양태들에서, 바이오마커는 고체 생검 또는 액체 생검으로부터 개발될 수 있다. 양태들에서, 바이오마커는 액체 생검으로부터 개발될 수 있다. 유체 생검 또는 유동상 생검으로도 알려진 "액체 생검"이라는 용어는 혈액, 혈장, 타액, 소변, 비강 분비물 등으로부터 수집된 물질과 같은 비-고체 생물학적 물질의 샘플링 및 분석을 지칭한다. 양태들에서, 바이오마커는 바이러스성 질환 중증도 또는 암에 대한 바이오마커일 수 있다.
본원에서 언급된 본 발명의 헤어핀 올리고뉴클레오티드, 전체 RNA, cDNA, 프라이머, 핵산, 단백질, 폴리펩티드 및 세포(이들의 집단 포함)는 단리 및/또는 정제될 수 있다. 본원에서 사용되는 바와 같이, "단리된"이란 용어는 그의 자연 환경으로부터 제거되었음을 의미한다. 본원에서 사용되는 바와 같이, "정제된"이란 용어는 순도가 증가된 것을 의미하고, 이때 "순도"는 상대적인 용어이며 반드시 절대 순도로 해석되어서는 안 된다. 예를 들어, 순도는 적어도 약 50%일 수 있고, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%보다 클 수 있거나, 또는 약 100%일 수 있다.
다음은 본 발명의 특정 양태들을 포함한다.
1. 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드로서, 3'-말단 뉴클레오티드의 당 성분이 2'-하이드록실 및 3'-포스페이트를 포함하는 헤어핀 올리고뉴클레오티드.
2. 3'-말단 뉴클레오티드의 당 성분이 펜토스이고, 펜토스가 리보스인, 양태 1의 헤어핀 올리고뉴클레오티드.
3. 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드로서, 3'-말단 뉴클레오티드의 당 위치가 당의 2',3'-다이알데하이드 산화 생성물을 포함하는 헤어핀 올리고뉴클레오티드.
4. 5'-말단 리보뉴클레오티드를 추가로 포함하는, 양태 1 내지 3 중 어느 하나의 헤어핀 올리고뉴클레오티드.
5. 다음을 추가로 포함하는, 양태 1 내지 4 중 어느 하나의 헤어핀 올리고뉴클레오티드:
(a) 바코드 서열,
(b) 헤어핀 루프 내부의 친화성 모이어티-태그된 뉴클레오티드, 및
(c) 프라이머 결합 부위.
6. 하기 서열을 포함하는, 양태 5의 헤어핀 올리고뉴클레오티드:
5'-Phos-rACT-X-AGA TCG GAA GAG CAC ACG AT(서열번호 86)-LT-AGA CGT GTG CTC TTC CGA TCT(서열번호 87)-Z-AG rU-3'-Phos
(이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티-태그된-티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다).
7. 하기 서열을 포함하는, 양태 5의 헤어핀 올리고뉴클레오티드:
5'-Phos-rACT-X-GAT CGT CGG ACT GTA GAA CAT(서열번호 88)-LT-AG AGT TCT ACA GTC CGA CGA TC(서열번호 89)-Z-AG rU-3'-Phos,
(이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티-태그된-티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다).
8. 고체 지지체 상에 고정화된, 양태 1 내지 7 중 어느 하나의 헤어핀 올리고뉴클레오티드.
9. RNA-서열 라이브러리를 제조하는데 있어서, 양태 1 내지 8 중 어느 하나의 헤어핀 올리고뉴클레오티드의 용도.
10. RNA-서열 라이브러리를 제조하는 다중화 방법에서, 양태 1 내지 8 중 어느 하나의 헤어핀 올리고뉴클레오티드의 용도.
11. 바이오마커를 개발하는데 있어서, 양태 1 내지 8 중 어느 하나의 헤어핀 올리고뉴클레오티드의 용도.
12. 바이오마커가 액체 생검으로부터 개발되는, 양태 11의 용도.
13. 바이오마커의 개발이 tRNA 단편화 프로필의 생성을 포함하는, 양태 11 또는 12의 용도.
14. 바이러스성 질환 중증도에 대한 바이오마커를 개발하는데 있어서, 양태 1 내지 8 중 어느 하나의 헤어핀 올리고뉴클레오티드의 용도.
15. 암에 대한 바이오마커를 개발하는데 있어서, 양태 1 내지 8 중 어느 하나의 헤어핀 올리고뉴클레오티드의 용도.
16. 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하는 고체 지지체로서, 상기 올리고뉴클레오티드가 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분이 2'-하이드록실 및 3'-포스페이트를 포함하고, 상기 올리고뉴클레오티드가 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화되는, 고체 지지체.
17. 친화성 모이어티가 비오틴이고, 리간드 모이어티는 스트렙타비딘인, 양태 16의 고체 지지체.
18. 고체 지지체가 비드인, 양태 16 또는 17의 고체 지지체.
19. 올리고뉴클레오티드가 다음을 추가로 포함하는, 양태 16 내지 18 중 어느 하나의 고체 지지체:
(a) 리보뉴클레오티드로서의 5'-말단 뉴클레오티드,
(b) 바코드 서열,
(c) 헤어핀의 루프 내부의 친화성 모이어티로 태그된 뉴클레오티드, 및
(d) 프라이머 결합 부위.
20. RNA-서열 라이브러리를 제조하는데 있어서, 양태 16 내지 19 중 어느 하나의 고체 지지체의 용도.
21. RNA-서열 라이브러리를 제조하는 다중화 방법에서, 양태 16 내지 19 중 어느 하나의 고체 지지체의 용도
22. 하기 단계를 포함하는, RNA 서열 라이브러리의 제조 방법:
(a) RNA 서열을 헤어핀 올리고뉴클레오티드에 접합시켜 구조물을 형성하는 단계(상기 올리고뉴클레오티드는 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분은 2'-하이드록실 및 3'-포스페이트를 포함한다),
(b) RNA 서열을 cDNA 서열로서 역전사시키는 단계, 및
(c) PCR을 사용하여 cDNA 서열을 증폭시키는 단계.
23. 헤어핀 올리고뉴클레오티드가 추가로 다음을 포함하는, 양태 22의 방법:
(i) 리보뉴클레오티드로서의 5'-말단 뉴클레오티드,
(ii) 바코드 서열,
(iii) 헤어핀의 루프 내부의 친화성 모이어티-태그된 뉴클레오티드, 및
(iv) 프라이머 결합 부위.
24. 접합 후 3'-포스페이트를 탈포스포릴화하고, 역전사 후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 단계를 추가로 포함하는, 양태 22 또는 양태 23의 방법.
25. 접합 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화를 탈메틸화시키는 단계를 추가로 포함하는, 양태 24의 방법.
26. 역전사 후 RNA 서열을 절단하고, 증폭 전에 2차 접합을 수행하여 2차 프라이머 결합 부위를 부가하는 단계를 추가로 포함하는, 양태 22 내지 25 중 어느 하나의 방법.
27. 접합 후 고체 지지체 상에 구조물을 고정화시키는 단계를 추가로 포함하는, 양태 22 또는 양태 23의 방법.
28. 고정화 후 3'-포스페이트를 탈포스포릴화하고, 역전사 후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 단계를 추가로 포함하는, 양태 27의 방법.
29. 고정화 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화를 탈메틸화시키는 단계를 추가로 포함하는, 양태 28의 방법.
30. 역전사 후 RNA 서열을 절단하고 증폭 전에 2차 프라이머 결합 부위를 부가하기 위해 2차 접합을 수행하는 것을 추가로 포함하는, 양태 27 내지 29 중 어느 하나의 방법.
31. RNA 서열이 전체 RNA, 소형 RNA, tRNA, 마이크로RNA, piRNA 또는 이들의 임의의 조합을 포함하는, 양태 22 내지 30 중 어느 하나의 방법.
32. 상기 방법이 다중화 방법을 포함하는, 양태 22 내지 31 중 어느 하나의 방법.
전술한 내용은 단지 양태들의 예라는 점에 유의해야 하다. 다른 예시적인 양태는 본원의 전체 설명으로부터 명백하다. 또한 당해 분야의 숙련자는 이러한 양태 각각이 본원에 제공된 다른 양태와 다양한 조합으로 사용될 수 있음을 이해할 것이다.
하기 실시예는 본 발명을 추가로 예시하지만, 그 범위를 어떤 식으로든 제한하는 것으로 해석되어서는 안 됨은 물론이다.
실시예 1
방법
본 발명의 양태에 따라, 하기의 방법을 RNA-seq 라이브러리 제조에 사용하였다.
RNA의 제조
tRNA 탈아실화
37℃에서 100 mM TrisHCl(pH 9.0) 용액에서 30분 동안 먼저 탈아실화한 다음, 180 mM의 최종 농도에서 아세트산나트륨(pH 4.8)을 첨가하여 중화함으로써 전체 RNA를 라이브러리 구성을 위해 제조하였다. 이어서, 탈아실화된 RNA를 에탄올 침전시키고 물에 재현탁시키거나, Zymo Oligo Clean-and-Concentrator™ 스핀 컬럼을 사용하여 탈염시켰다.
tRNA 하전을 위한 원-팟 탈아실화 및 β-제거
7 μL 중 500 ng 이하의 전체 RNA를 라이브러리 구성 전에 선택적인 원-팟 베타-제거에 사용하였다. 시작하기 위해, 1 μL의 90 mM 아세트산나트륨 완충액(pH 4.8)을 7 μL의 투입 RNA 에 첨가하였다. 다음으로, 1 μL의 새로 제조한 150 mM 과요오드산나트륨 용액을 첨가하고 혼합하였다; 반응 조건은 16 mM NaIO4, 10 mM NaOAc, pH 4.8이었다. 과요오드산염 산화는 실온에서 30분 동안 진행하였다. 최종 60 mM에서 1 μL의 0.6 M 리보스를 첨가하여 산화를 중단시키고 5분 동안 배양하였다. 다음으로, 5 μL의 새로 제조한 100 mM 나트륨 테트라보레이트(pH 9.5)를 첨가하여 최종 농도가 33 mM이 되도록 하였다. 상기 반응물을 45℃에서 30분 동안 배양하였다. β-제거 및 3'-말단 복구를 정지하기 위해, 5 μL의 T4 PNK 믹스(200 mM TrisHCl pH 6.8, 40 mM MgCl2, 4U/μL T4 PNK, New England Biolabs(NEB))를 반응에 첨가하고, 37℃에서 20 분동안 배양하였다. 이어서, T4 PNK를 65℃에서 10분 동안 배양하여 열 불활성화시켰다. 총 20 μL의 상기 반응 혼합물은 하기에 기술된 30 μL의 접합 마스터 믹스를 첨가함으로써 1차 바코드 접합에 바로 사용될 수 있다.
RNA-seq에 대한 일반적 프로토콜
1차 바코드 접합
투입 물질은 탈아실화되었거나 또는 전술한 바와 같이 베타-제거 및 말단 복구가 일어났다. 1 μg 이하의 전체 RNA 투입물을 다음 성분들과 함께 50 μL의 접합 반응에 사용하였다: 1 U/μL T4 RNA 리가제 I(NEB), 1xNEB T4 RNA 리가제 I 완충액, 15% PEG8000, 50 μM ATP, 1 mM 헥사아민 코발트 클로라이드, 및 5% DMSO. 접합 혼합물을 샘플에 첨가한 후, 헤어핀을 1 μM의 최종 농도로 첨가하고 샘플을 16℃에서 밤새(12+ 시간) 배양하였다.
Dynabead에 대한 결합
접합 믹스를 동부피의 물을 첨가함으로써 희석하여 용액의 점도를 감소시켰다. 다음으로, 스트렙타비딘-코팅된 Dynabeads™ MyOne™ C1(ThermoFisher)을 헤어핀 올리고에 대해 1.2:1 과량으로 각각의 샘플에 첨가하였다(예를 들어, 50 μL 반응물은 50 pmol 헤어핀 올리고를 함유하였다; 비드는 10 mg/ml로 공급되었고 mg 당 500 pmol 비오티닐화 올리고의 결합력을 가졌으므로 12 μL 슬러리를 첨가하였다). 비드-샘플 혼합물을 실온에서 15분 동안 배양하였다. 결합 후, 상등액을 제거하고, 비드를 고염 세척 완충액(1 M NaCl, 20 mM TrisHCl, pH 7.4)으로 1회 및 저염 세척 완충액(100 mM NaCl, 20 mM TrisHCl, pH 7.4)으로 1회 세척하였다.
세척 후, 개별적으로 바코드 표시된 여러 샘플을 후속 단계에서 혼합할 수 있다. 이 단계에서, 효소 또는 화학적 처리는 AlkB 데메틸라제 반응 또는 CMC 처리와 같은 라이브러리 제조 프로토콜에 통합될 수 있다(하기의 방법 참조).
탈포스포릴화
다음을 함유하는 50 μL의 탈포스포릴화 믹스를 다중화된 샘플에 온-비드로 첨가하였다: 0.04 U/μL 송아지 장 포스파타제(Roche), 10 mM MgCl2, 0.5 mM ZnCl2, 20 mM HEPES, pH 7.3. 샘플을 37℃에서 30분 동안 배양하였다. 이어서, 샘플을 고염 세척 완충액으로 1회 및 저염 세척 완충액으로 1회 세척한 다음, 20 μL 물에 재현탁하였다
역전사
5 μL의 SuperScript™ IV VILO 5x 마스터 믹스(ThermoFisher)를 탈포스포릴화된 샘플에 25 μL의 최종 부피로 첨가한 다음, 55℃에서 10분 동안 배양하였다. 이어서, 샘플을 고염 세척 완충액으로 1회 및 저염 세척 완충액으로 1회 세척하였다.
RNase H 절단
비드를 0.4 U/uL RNase H(NEB) 및 1x NEB RNase H 완충액을 함유하는 50 μL의 RNase H 마스터 믹스에 재현탁하고 37℃에서 15분 동안 배양하였다. 이어서, 샘플을 고염 세척 완충액으로 1회 및 저염 세척 완충액으로 1회 세척하였다. 이어서, 샘플을 40 μL 물에 재현탁하였다.
과요오드산염 산화
새로 제조된 0.5 M 아세트산나트륨(pH 5) 중 10 μL의 250 mM 과요오드산나트륨의 5x 용액을 RNase H-절단된 샘플에 첨가하고 실온에서 30분 동안 배양하였다. 그 후, 리보스를 167 mM의 최종 농도로 첨가하여 과량의 과요오드산염을 실온에서 5분 동안 급냉시켰다. 이어서, 샘플을 고염 세척 완충액으로 1회 및 저염 세척 완충액으로 1회 세척하였다.
2차 접합
비드를 다음 성분과 함께 50 μL의 접합 마스터 믹스에 재현탁하였다: 2 U/μL T4 RNA 리가제 I(NEB), 1x NEB T4 RNA 리가제 I 완충액, 2 μM 2차 접합 올리고, 25% PEG8000, 50 μM ATP, 7.5% DMSO 및 1 mM 헥사아민 코발트 클로라이드. 반응물을 실온에서 밤새(12+ 시간) 배양하였다. 이어서, 반응물을 1 부피의 물로 희석하여 점도를 감소시키고, 고염 세척 완충액으로 1회 및 저염 세척 완충액으로 1회 세척한 다음, 약 10 내지 20 mg/mL의 비드를 함유한 물에 재현탁하였다(초기 접합 반응 당 6 내지 12 μL). 샘플은 4℃에서 저장하거나 -20℃에서 동결시킬 수 있다; 동결은 비드를 손상시킬 수 있지만, 여전히 다음 PCR 단계에 사용할 수 있다.
PCR
Q5 DNA 폴리머라제(NEB)를 사용하고 제조업체의 지시에 따라 2차 접합 반응에서의 비드 슬러리 생성물의 5 내지 10%를 사용하여 50 μL PCR 반응을 실행하였다: 0.02 U/μL Q5 DNA 폴리머라제, 1x Q5 반응 완충액, 0.2 mM dNTP, 0.5 μM Illumina 인덱스 프라이머 및 0.5 μM Illumina 다중 프라이머. 전형적인 PCR 주기는 98℃에서 10초, 55℃에서 15초, 및 72℃에서 20초로 9, 12, 및 15 주기였으며, 이어서 가장 좋은 조건을 선택하였다. 이어서, DNA 정제 및 농축 키트(Zymo)로 PCR 반응물을 처리하였다.
TBE-PAGE 겔 추출
탈염 후, PCR 생성물을 dsDNA 크기 마커를 함유한 10% 비-변성 TBE 겔상에서 전기영동하였다; 레인을 원하는 생성물 크기에 따라 절단하고, 피펫 팁으로 으깬 다음, 파쇄-침지 완충액(500 mM 아세트산나트륨, pH 5.0)에 재현탁하였다. 겔 단편들을 밤새 추출한 다음 에탄올 침전시켰다.
올리고뉴클레오티드 서열
본원에 기술된 실험에 사용된 올리고뉴클레오티드 서열은 하기 표에서 확인된다.
표 1 내지 3은 본 발명에 따른 예시적인 헤어핀 올리고뉴클레오티드를 제공한다. 서열은 Integrated DNA Technology, Inc.(IDT)에서 주문할 수 있는 포맷으로 주석이 달려 있다. 예를 들어, "/5Phos/"는 5'-포스페이트를 나타낸다. 각 표의 마지막 줄에 열거된 짧은 올리고뉴클레오티드 서열(L2)은 RNA-seq 방법의 2차 접합 단계에서 표의 앞부분에 열거된 헤어핀 올리고뉴클레오티드 서열과 함께 사용되는 올리고뉴클레오티드이다. 각 L2의 UMI는 "N" 잔기로 표시된다; UMI는 샘플 복잡성을 최대화하기 위해 hexN(6개 뉴클레오티드 길이)이다. RNA-seq에서 특정 올리고뉴클레오티드의 사용으로 인해 여기에 나타난 데이터는 도면 번호로 식별된다.
올리고뉴클레오티드는 쌍-말단 또는 단일-말단 DNA 합성-서열분석 방법에 사용되도록 설계된다. 쌍-말단 서열분석에서, 서열분석은 DNA 단편의 양쪽 말단에서 수행된다. 첫 번째 프라이머가 어닐링되고, 모든 후속 염기는 성장하는 가닥에 그 염기가 부가됨에 따라 결정된다. 이것은 정방향 가닥의 "판독물 1" 서열분석이다. 다음으로, UMI 서열을 함유하는 또 다른 프라이머가 인덱스를 측정하는 "인덱싱 판독"에서 어닐링 및 연장된다. 마지막으로, 세 번째 프라이머가 어닐링 및 연장되어, 역방향 가닥을 "판독물 2"로서 서열분석한다. 대조적으로, 단일-말단 서열분석에서는, 판독물 1과 인덱싱 판독만 수행된다. 다양한 DNA 서열분석 기기 및 플랫폼이 상업적으로 이용가능하다. DNA 서열분석을 수행하기에 바람직한 시스템은 Illumina, Inc.의 NGS(차세대 서열분석) 시스템이다.
두 가지 유형의 헤어핀 올리고뉴클레오티드가 설계되었는데, 그 중 하나는 "판독물 1" 서열분석의 시작부분에서 바코드가 판독되고, 다른 하나는 "판독물 2" 서열분석의 시작부분에서 바코드가 판독된다. 일반적으로, "판독물 2"의 시작부분에 바코드를 갖는 디자인이 바람직한데, 그 이유는 이 디자인이 실행 초기에 "복잡성" 또는 측정된 서열 다양성을 최대화하기 때문이다. 판독물 1 서열분석을 위해 설계된 헤어핀 올리고뉴클레오티드에 대한 서열은 /5Phos/rA CT XXXX GAT CGT CGG ACT GTA GAA CAT /iBiodT/AG AGT TCT ACA GTC CGA CGA TC ZZZZ AG rU/3Phos/(서열번호 19)이고, 이때 "X"는 바코드 서열(적어도 3개 뉴클레오티드 길이; 여기에는 4개 뉴클레오티드 바코드가 나타나 있음)이고 "Z"는 "X" 바코드 뉴클레오티드의 역 보체인 서열이다. 판독물 2 서열분석을 위해 설계된 헤어핀 올리고뉴클레오티드의 서열은 /5Phos/rA CT XXXX AGA TCG GAA GAG CAC ACG AT/iBiodT/ AGA CGT GTG CTC TTC CGA TCT ZZZZ AG rU/3Phos/(서열번호 15)이고, 이때 "X"는 바코드 서열(적어도 3개의 뉴클레오티드 길이; 여기에는 4개의 뉴클레오티드 바코드가 나타나 있음)이고 "Z"는 "X" 바코드 뉴클레오티드의 역 보체인 서열이다. 인덱싱 판독에 사용되는 해당 L2 올리고뉴클레오티드는 표 1 내지 3의 마지막 줄에 나타내었다. "판독물 1" 디자인은, 바코드 서열이 계속 측정될 것이므로, 쌍-말단 또는 단일-말단 서열분석과 상용가능하다. 상기 형태에서는 복잡성과 관련하여 추가의 주의를 기울일 수 있으며, 이것은 다수의 바코드를 사용함으로써 또는 Illumina에서 권장하는 바와 같은 스파이크-인 컨트롤(예: Phi-X 컨트롤 DNA)을 사용하여 강화할 수 있다.
동일한 길이의 임의의 두 서열을 비교할 때, 해밍 거리(Hamming distance)는 상응하는 부호가 상이한 서열 위치의 수이다. 바코드에 대한 해밍 거리는, 바코드를 판독하는 동안 서열분석기가 오류를 발생시키는 경우 단일 오류를 식별하고 올바른 바코드를 할당할 수 있도록 선택된다. 예를 들어, 해밍 거리가 1인 경우, 단일 오류로 인해 하나의 바코드가 다른 바코드로 바뀌고, 오류가 절대 검출되지 않을 것이다. 해밍 거리가 2인 경우에는, 단일 오류를 검출할 수 있지만 오류 판독물이 동일하게 두 개의 바코드에서 발생할 가능성이 있으므로, 오류를 용이하게 교정할 수 없다. 해밍 거리가 3인 경우에는, 단일 오류를 검출하고 교정할 수 있다. 해밍 거리가 3보다 크면 다수의 오류를 검출할 수 있지만, 서열분석기 오류는 드물고 이중 오류는 두 배로 드물기 때문에 다수의 오류는 무시할 수 있을 것으로 예상된다. 작은 바코드의 경우, 예를 들어, 3개의 뉴클레오티드의 경우, 해밍 거리 3을 유지하는 4개의 상이한 바코드만 가능하다. 따라서, 3개의 뉴클레오티드 디자인(표 2)의 경우, 적어도 2의 해밍 거리를 사용하여 12개의 상이한 바코드가 있을 수 있다.
[표 2]*
Figure pct00002
*바코드는 적어도 2의 해밍 거리만큼 이격되어 있는 3개 뉴클레오티드이다. 헤어핀은 판독물 1 프라이머에 어닐링된다.
[표 3]**
Figure pct00003
**바코드는 적어도 3의 해밍 거리만큼 이격되어 있는 4개 뉴클레오티드이다(오류 교정). 헤어핀은 판독물 1 프라이머에 어닐링된다.
[표 4]***
Figure pct00004
***바코드는 적어도 3의 해밍 거리만큼 이격되어 있는 4개 뉴클레오티드이다(오류 교정). 헤어핀은 판독물 2 프라이머에 어닐링된다.
표 5는 RNA-seq 공정의 최종 PCR 단계에 사용된 올리고뉴클레오티드 서열을 제공한다. 이들 올리고뉴클레오티드는 Illumina TreSeq™ 소형 RNA 인덱스 프라이머를 약 5개 염기를 지나 연장시킨다. 프라이머를 사용하여 Illumina 서열분석 플랫폼과 상용가능한 라이브러리를 제조한다.
[표 5]
Figure pct00005
32P-표지화
5'-말단 표지화: 방사성표지화 반응은 32P T4 PNK 믹스(1 U/μL T4 PNK, 30 mM 이미다졸-HCl 완충액, 2.5 μM[15 μCi/μL] γ-32P ATP, 1 mM ADP의 최종 농도)를 5'-포스포릴화 올리고뉴클레오티드 용액(최종 농도 1.25 μM)에 첨가하여 수행하였다. 샘플을 37℃에서 30분 동안 배양하였다; 이어서, T4 PNK를 65℃에서 10분 동안 배양하여 열 불활성화시켰다.
dTTP 혼입: 역전사는, 1x SuperScript™ IV VILO 믹스에서 5 μL의 샘플을 제거한 것을 제외하고는 RNA-seq 부분에 기술된 바와 같이 수행하였다; 여기에 1 μL의 10 μCi/μL α-32P dTTP를 첨가하였다. 배양 후에, 샘플을 겔 전기영동으로 분석하기 전에 2 μL의 18 mg/ml 프로테이나제 K(Roche)로 처리하였다.
하기의 방법을 결과에 기술된 RNA-seq 라이브러리의 하나 이상의 용도에 이용하였다.
에스케리키아 콜라이 성장, 스트레스, RNA 추출
에스케리키아 콜라이 MG1655 세포를 스트레스 조건을 적용하기 전에 LB에서 0.4의 A600으로 성장시켰다. 모의(mock) 처리된 세포 25 mL를 10분 동안 성장하도록 두었다. H2O2를 25 mL 세포에 10분 동안 0.5%의 최종 농도로 첨가하여 과산화수소 스트레스를 유도하였다. α-메틸 글루코시드-6-포스페이트(αMG)를 25 mL의 세포에 10분 동안 1 mM의 최종 농도로 첨가하여 글루코스 포스페이트 스트레스를 유도하였다. 25 mL의 세포에 2,2'-다이피리딜(DIP)을 10 분 동안 250 μM의 최종 농도로 첨가하여 철 결핍 스트레스를 유도하였다. 12000 rcf 및 경사분리 배지에서 1분 동안 25 mL 배양물을 원심분리하여 세포를 수확하였다. 세포를 0.5 mL 빙냉 용해 완충액(150 mM KCl, 2 mM EDTA, 20 mM HEPES pH 7.5)에 재현탁한 다음 액체 질소에서 순간 동결시켰다. RNA를 고온의 산-페놀 프로토콜로 추출하였다. 간략하게, 0.5 mL의 산-완충 페놀(pH 4.5 시트레이트)을 동결된 샘플에 첨가하였다. 샘플을 50℃에서 30분 동안 진탕하면서 열 차단하에 배양하였다. 추가의 페놀 추출 및 2회 클로로폼 추출을 위해 수성상을 추출한 후, 최종적으로 글리코블루, 300 mM 아세트산나트륨 및 3 부피의 에탄올로 침전시켰다. 샘플을 -80℃에서 1시간 동안 배양한 다음, 최대 속도(20k RCF)에서 45분 동안 원심분리하여 RNA를 펠릿화하였다. 펠릿을 70% 에탄올로 2회 세척한 다음, 물에 재현탁하였다.
HEK 세포 배양 및 RNA 추출
HEK293T 세포를 표준 조건 하에서 완전 DMEM 배지와 함께 배양하였다. 간략하게, HEK293T 세포를 10% FBS 및 1% Pen-Strep(페니실린-스트렙토마이신)을 함유한 Hyclone™ DMEM 배지(GE Healthcare Life Sciences, SH30022.01)에서 80% 밀집도까지 성장시키고 계대배양하였다. 세포를 수집하고, TRIzol™(ThermoFisher, 15596026)을 사용하여 세포가 80 내지 90% 밀집도에 도달했을 때 제조업체의 프로토콜에 따라 전체 RNA를 추출하였다.
MCF7 성장 및 RNA 추출
MCF7 세포를 10% FBS(ThermoFisher, 10082147), 0.01 mg/ml 소 인슐린(Sigma-Aldrich, I0516) 및 10 nM β-에스트라디올(Sigma-Aldrich, E2758)을 함유한 EMEM 배지(ATCC, 30-2003) 배지에서 80% 밀집도까지 배양하고, 1:3의 비율로 계대배양하였다. TRIzol™을 사용하여 전체 RNA를 추출하였다.
대변 및 구강 샘플 수집 및 RNA 추출
구강: 연속 2일에 1명의 여성 및 3명의 남성 지원자(지원자당 2개 샘플)로부터 혀등 스크래핑 시료를 수집하였다[A 및 B 샘플]. 샘플 수집은 BreathRx Gentle Tongue Scraper(Philips Sonicare)를 사용했으며, 먹거나 마시거나 구강 위생을 수행하기 전에 수행되었다. 혀에서 가능한 한 뒤쪽에서 시작하여 스크레이퍼를 전체 표면에 걸쳐 3회 연속 앞으로 통과시켰다. 스크래핑 시료를 500-μl RNAlater™ 안정화 용액(Invitrogen)과 혼합하고 추출할 때까지 -80℃에서 저장하였다.
위장관: 대변 시료를 1명의 여성 및 1명의 남성 지원자가 자가-수집하였다. 지원자에게는 상업용 "토일렛 햇(toilet hat)" 대변 시료 수집 키트(Fisherbrand Commode Specimen Collection System, Thermo Fisher Scientific)를 제공하였다. 시료는 즉시 실험실로 이송하였고(<1시간) 완전히 균질화시켰다. 멸균 스패튤라를 사용하여 100-mg 대변을 냉동바이알로 옮긴 다음, 700-μl RNAlater 안정화 용액을 첨가하였다. 시료를 추출할 때까지 -80℃에서 저장하였다.
전체 RNA 추출: 후에 4℃에서 10분 동안 17,200 rcf에서 원심분리에 의해 혀등 및 대변 샘플로부터 RNA를 제거하였다. 펠릿화된 물질을 400 μL의 0.3 M NaOAc/HOAc, 10 mM EDTA (pH 4.8)에서 동 부피의 아세테이트-포화 페놀 클로로포름(pH 4.8)으로 용해시켰다. 1.0 mm 유리 용해 비드(Bio-Spec Products, 오클라호마주 바틀즈빌 소재)를 1:1 비(비드:샘플 중량)로 첨가한 후, 샘플을 최대 강도에서 1분 간격으로 2회 왕복 비드 비터(Mini-Beadbeater-16, Bio-Spec Products)에 넣었다. 샘플을 4℃에서 15분 동안 17,200 rcf에서 원심분리한 후, 전체 RNA를 재추출하고 이소프로판올 침전시켰다. 펠릿을 75% 에탄올로 세척한 후, 산-완충 용출 완충액(10 mM NaOAc, 1 mM EDTA, pH 4.8)에 재현탁하였다.
AlkB 및 AlkB D135S 정제
이들 프로토콜은 DM-tRNA-seq에 대해 이전에 기술된 프로토콜로부터 채택하였다(문헌[Zheng et al., Nature Methods 12, 835, 2015]). 간략하게, NEB T7 발현 세포를 37℃에서 50 μM 카나마이신의 존재하에 LB 배지에서 0.6 내지 0.8의 A600까지 성장시켰다. 세포가 일단 원하는 밀도에 도달하면, IPTG 및 황산철을 각각 1 mM 및 5 μM의 최종 농도가 되도록 첨가하였다. 유도 후에, 세포를 30℃에서 밤새 배양하였다. 세포를 수집하고 펠릿화한 다음 용해 완충액(10 mM Tris, pH 7.4, 5% 글리세롤, 2 mM CaCl2, 10 mM MgCl2, 10 mM 2-머캅토에탄올) + 300 mM NaCl에 재현탁하였다. 세포를 초음파처리로 용해한 다음, 17,400xg에서 20분 동안 원심분리하였다. 완충액 A(세척을 위한 용해 완충액 + 1 M NaCl) 및 B(용출을 위한 용해 완충액 + 1 M NaCl 및 500 mM 이미다졸)를 함유한 Ni-NTA 초유동(superflow) 카트리지(Qiagen)를 사용하여 가용성 단백질을 먼저 정제한 다음, 완충액 A(컬럼 부하를 위한 용해 완충액 + 100 mM NaCl) 및 B(용출을 위한 용해 완충액 + 1.5 M NaCl)를 사용하여 이온 교환(Mono S GL, GE Healthcare)으로 추가로 정제하였다.
폴리(A)-선별
제조업체의 지시에 따라 NEBNext® Poly(A) mRNA 자기 단리 모듈(Catalog #: E7490S)을 사용하여 HEK mRNA 서열분석을 위한 폴리(A)-선별을 수행하였다.
AlkB 처리 조건
데메틸라제 완충액 조건은 공개된 조건에서 수정되었다(문헌[Li et al., Nat Struct Mol Biol 25, 1047, doi:10.1038/s41594-018-0142-5, 2018]). 3개의 저장액은 반응 직전에 새로 만들었다: L-아스콜브산 200 mM, 2-케토글루테레이트 3 mM 및 황산철암모늄 5 mM. 최종 반응 완충액은 2 mM L-아스콜브산, 1 mM 2-케토글루테레이트, 0.3 mM 황산철암모늄, 100 mM KCl, 50 mM MES(pH 6), 50 ng/μL BSA, 4 μM 야생형 AlkB, 및 4 μM AlkB-D135S를 함유하였다. 50 μL의 반응 혼합물을 접합, 고정화 및 세척 후 경사분리된 스트렙타비딘 비드 슬러리 5 내지 20 μL에 첨가하였다. 37℃에서 30분 동안 반응을 지속하였다. 반응 후에, 비드를 고염 세척 완충액(20 mM TrisHCl pH 7.4, 1 M NaCl, 0.1% Tween20)으로 1회 및 저염 세척 완충액(20 mM TrisHCl pH 7.4, 100 mM NaCl)으로 1회 세척하였다.
CMC 처리/라이브러리 구성
MCF7 전체 RNA 서열분석 라이브러리는 다음과 같이 구성하였다. 먼저 소형 RNA(<200 nt)를 스핀 컬럼(Zymo RNA Clean & Concentrator™-5, R1016)을 사용하여 1 μg MCF7 전체 RNA에서 제거하고, 대형 RNA(>200 nt)를 미세원심분리관에서 18 μl 멸균 H2O로 용출시켰다. RNA를 PCR 튜브로 옮기고 2 μl 마그네슘 RNA 단편화 완충액(NEB, E6150S)을 각각의 튜브에 첨가하고, 튜브를 94℃에서 유전자증폭기에서 5분 동안 배양하여 RNA를 약 200 nt로 단편화하였다. 이어서, 2 μl RNA 단편화 정지 용액을 각 튜브에 첨가하였다. 샘플을 H2O로 50 μl로 희석하고 Zymo 스핀 컬럼을 사용하여 단편화된 RNA를 정제하였다; RNA는 마이크로원심분리관에서 16 μl 멸균 H2O로 용출시켰다. RNA 단편의 3'-말단 복구를 위해, 2 μl 10x T4 PNK 완충액 및 2 μl T4 PNK를(ThermoFisher, EK0032) 10 U/μl로 첨가하고, 혼합물을 37℃에서 30분 동안 배양하였다. 단편화되고 말단-복구된 RNA를, 전술한 RNA-seq 프로토콜을 하기의 변형하에 사용하여 서열분석 라이브러리를 구성하는데 사용하였다. 단편화된 RNA를 바코드 표시된 헤어핀 올리고뉴클레오티드에 접합시키고 스트렙타비딘 비드에 결합시켰다. 이어서, 샘플을 모으고, 혼합하고, ±CMC(N-사이클로헥실-N'-(2-모폴리노에틸)카보디이미드) 처리(+CMC:-CMC = 1.5:1 비)를 위해 두 부분으로 나누었다. 12 μl 멸균 H2O 및 24 μl TEU 완충액(50 mM Tris-HCl(pH 8.3), 4 mM EDTA, 7 M 우레아)을 먼저 각 튜브에 첨가한 다음, TEU 완충액 중의 새로 제조한 1 M CMC 4μl를 +CMC 샘플에 첨가하고, 4 μl의 멸균 H2O를 -CMC 샘플에 첨가하였다. 샘플을 에펜도르프 열혼합기(Eppendorf ThermoMixer)에서 1400 rpm(분당 회전수)으로 16시간 동안 30℃에서 배양하였다. 샘플을 고염 완충액으로 2회 및 저염 완충액으로 1회 세척하였다. 이어서, 샘플을 40 μl의 50 mM 탄산나트륨 및 2 mM EDTA(pH 10.4) 완충액으로 재현탁시키고, 37℃에서 6시간 동안 1400 rpm으로 배양하였다. 비드를 고염 완충액으로 2회 및 저염 완충액으로 1회 세척한 다음, 포스파타제 처리 및 역전사와 같은 RNA-seq 단계를 진행하였다.
tRNA 마이크로어레이
tRNA 마이크로어레이는 cDNA 합성이 필요없는 정제된 tRNA 또는 전체 RNA에서 시작하는 4가지 공정으로 이루어진다: (i) 탈아실화, (ii) T4 DNA 리가제로 모든 tRNA의 3'-CCA에 올리고뉴클레오티드를 접합시키는 것을 이용한 tRNA의 선택적 형광단 표지화, (iii) 하이브리드화, 및 (iv) 데이터 분석. 에스케리키아 콜라이 및 인간 tRNA 마이크로어레이 방법의 재현성 및 결과의 검증은 이전에 광범위하게 기술되었다(문헌[Dittmar et al., EMBO Rep 6, 151, 2005; Pavon-Eternod et al., Nucleic Acids Res 37, 7268, doi:gkp787pii10.1093/nar/gkp787, 2009]).
판독물 처리 및 맵핑
라이브러리는 Illumina Hi-Seq 또는 NEXT-seq 플랫폼에서 서열분석되었다. 쌍-말단 판독물을 JGI BBtools 툴세트의 비비머지(bbmerge)와 결합시켰다. 샘플 바코드가 판독물의 시작부분에 배향되도록 판독물을 통합하였다: 판독물-2 바코드로 구성된 라이브러리의 경우, 비비머지(bbmerge) 투입물에 대해 판독물1 및 판독물2의 순서가 뒤집혔다. 다음으로, 통합된 판독물, 즉 각각의 인덱스당 하나의 파일을 fastX 툴키트 바코드 스플리터를 사용하여 바코드로 분할하였다. 맞춤형 파이썬(python) 스크립트(GitHub에서 사용가능)를 사용하여 바코드 서열(처음 7개 nt)을 제거하고 UMI를 사용하여 판독물을 축소시킨 다음, UMI(마지막 6개 염기)를 제거하였다. 다음 판독물은 "국소" 매개변수와 함께 보타이2(bowtie2)를 사용하여 맵핑하였다. 인간 샘플은, 필요한 경우에 부가된 "CCA" 말단이 증가된, 40보다 큰 점수를 갖는 tRNA-스캔 SE로부터 예측된 성숙 tRNA의 엄선된 목록으로, 또는 앙상블 HG19 orf, ncRNA 및 엄선된 tRNA를 조합한 게놈으로 맵핑되었다. 에스케리키아 콜라이 샘플은, 40보다 큰 점수를 가지고 필요한 경우 CCA가 부가된 tRNA-스캔 SE로부터의 비-중복 tRNA의 엄선된 목록으로, 또는 앙상블 ORF, 및 tRNA 유전자를 포함한 앙상블 ncRNA를 포함하는 조합 에스케리키아 콜라이 게놈으로 맵핑되었다. 보타이2 출력 sam 파일은 bam 파일로 변환된 다음, 샘툴(samtool)을 사용하여 정렬하였다. 다음 IGV는 판독물을 1 nt 윈도우로 축소하는데 사용하였다. IGV output.wig 파일은 맞춤형 파이썬 스크립트(GitHub에서 사용가능)를 사용하여 재포되었다. 보타이2 출력 Sam 파일도 또한 각각의 유전자에 맵핑된 모든 판독물을 합산하기 위해 패처 연구소(pachter lab)의 eXpress와 함께 사용되었다. 맞춤형 R 스크립트(GitHub)를 사용하여 데이터를 시각화하였다.
판독물 수 및 맵핑 비율은 표 6에 제공된다.
[표 6]
Figure pct00006
CMC 반응에서 판독물 처리
Illumina Hi-Seq 플랫폼으로부터 원시 100 bp 쌍-말단 서열분석 판독물을 수득하였다. 판독물1 판독물은 맞춤형 파이썬 스크립트를 사용하여 쌍을 이룬 판독물2 판독물 상에 바코드 서열을 갖는 바코드에 의해 분할되었다. 판독물2 판독물은 fastx_barcode_splitter(fastx_toolkit,http://hannonlab.cshl.edu/fastx_toolkit/)를 사용하여 바코드로 분할되었다. 판독물1 판독물의 경우, 판독물의 시작부분의 무작위 6개 뉴클레오티드 고유 분자 식별자(UMI) 서열 및 판독물 끝부분의 바코드 표시된 어댑터 서열은 15개 nt 컷오프를 갖는 단일-말단 모드를 이용하여 Trimmomatic을 사용하여 제거하였다. 판독물2 판독물의 경우, 판독물 시작부분의 7개 nt 바코드 서열 및 판독물 끝부분의 UMI 및 어댑터 서열은 15개 nt 컷오프를 갖는 쌍-말단 모드를 이용하여 Trimmomatic으로 제거하였다. 이어서, 판독물을 보타이2를 사용하여 인간 rRNA 전사체에 맵핑하였다. 출력 sam 파일은 bam 파일로 변환시킨 다음, 샘툴(samtool)을 사용하여 정렬 및 인덱싱하였다. "igvtools count"(IGV, http://software.broadinstitute.org/software/igv/download)의 명령줄 버전을 사용하여 단일 염기 분해능에서 뉴클레오티드 조성, 삽입 및 결실을 산출하였다. "bedtools genomecov"(bedtools, https://bedtools.readthedocs.io/ en/latest/)를 사용하여 각각의 위치에서 모든 판독물의 시작 및 끝을 산출하였다. 모든 출력 파일 및 참조 서열을 각 샘플에 대해 단일 파일로 결합하였으며, 돌연변이율 및 정지율은 맞춤형 파이썬 스크립트로 계산하였다. 출력 파일을 분석하여 표적 슈도우리딘 부위를 확인하였다.
마이크로바이옴 tRNA 분석
이들은 상당한 변형하에 이전에 공개된 파이프라인에서 변형되었다. 75개 또는 100개 뉴클레오티드의 원시 쌍-말단 서열 판독물은 Illumina-utils(https://github.com/merenlab/illumina-utils에서 사용가능)에 의해 처리하였다. 삽입물은 7개 뉴클레오티드 샘플 바코드 및 무작위 6개 뉴클레오티드 고유 분자 식별자(UMI)를 함유하였다. tRNA 분자의 길이가 74 내지 96개 뉴클레오티드의 범위임을 고려할 때, 정방향 및 역방향 100개 뉴클레오티드 판독물은 일부 tRNA 서열을 완전히 포함하고 다른 서열에서는 부분적으로 중첩되었다. Illumina-utils 'iu-merge-pairs' 명령은, 전체보다 더 중첩된 경우 돌출 어댑터 서열을 트리밍하면서 완전히 및 부분적으로 중첩되는 판독물을 둘 다 통합하도록 업그레이드되었다(플래그, '--마커-유전자-엄격함(--marker-gene-stringent)'은 부분 중첩뿐 아니라 전체 중첩의 고려도 가능하게 한다). 중첩 영역에서 제로 미스매치와 부합하는 판독물을 유지함으로써('-최대-수-미스매치 0(-max-num-mismatches 0)' 옵션), 변형-유도된 돌연변이의 분석에 중요한 잘못된 염기 호출을 최소화하였다.
도구는 후속 단계의 많은 단계를 자동화하기 위한 Snakemake 작업흐름을 포함하여, 판독물로부터 tRNA 서열을 확인하기 위해 Anvi'o 다중-오믹스(multi-omics) 플랫폼에서 개발되었다(https://github.com/merenlab/anvio에서 사용가능). 'anvi-gen-tRNAseq-database' 명령은 동적 프로그래밍 알고리즘(모듈 'trnaidentifier')을 실행하여 판독물중 tRNA 특징을 프로파일링함으로써 프리-tRNA와 같은 다른 관련 종과 함께 성숙하고 단편적인 tRNA를 선택한다. 상기 방법에서 모든 판독물은 3'-CCA에서 시작되었으므로, T-팔(T arm)의 보존된 뉴클레오티드에 대한 수용체 뉴클레오티드 및 정확한 길이를 포함한, tRNA 선택을 위한 최소 기준 세트를 정의하였으며, 그 중에서 7개중 5개가 확인되어야 했다. 알고리즘은 판독물의 5'-말단에 대하여, 안티코돈 루프를 포함한 특징을 계속 검색하고, 이때 전장 판독물은 염기쌍 수용체 줄기 및 그 사이의 모든 특징을 함유한다. 알고리즘은 가변(V) 루프와 같이 길이가 가변적일 수 있는 특징을 접할 때 각각의 가능한 서열을 검색하고, 정규적으로 보존된 위치의 "비보존" 뉴클레오티드와 줄기의 염기쌍 미스매치의 최소 합계로 특징 프로필을 반환시킨다.
tRNA스캔-SE(v1.3.1)가 Ensembl Genomes 2016 데이터베이스에 저장된 4,235개의 최적-표준 세균 게놈("염색체"의 조립 수준을 갖는 비-내공생 게놈)으로부터 동정된 일련의 참조 tRNA 서열을 검색하기 위해 GAST 도구를 사용하여 tRNA 서열에 분류학적으로 주석을 달았다.
변형 분석을 위해 tRNA 서열로부터 특정 뉴클레오티드 위치를 선택하였다. 위치는 Anvi'o가 프로파일링한 특징과 관련하여 확인하였다. 예를 들어, 많은 tRNA 종에서 m1A 변형 부위인 정규 위치 22는 안티코돈 줄기의 5'-뉴클레오티드, 정규 위치 27로부터 5개의 뉴클레오티드인 것으로 확인된다. Anvi'o 작업흐름은 안티코돈으로 tRNA 종을 분류하는 각 분류군 내 관심 위치에서의 뉴클레오티드 분포를 분석하였다. 탈메틸화된 샘플 분할 및 미처리 샘플 분할 둘 다에서 적어도 50개의 판독물로 나타난 tRNA 종을 선택하였다. 변형에 의해 야기될 가능성이 있는 돌연변이는, 미처리 분할로부터 판독물의 적어도 5%에서 3개의 상이한 뉴클레오티드를 갖는 tRNA 종만을 고려함으로써 단일 뉴클레오티드 다형성을 갖는 관련된 tRNA 서열과 같은 뉴클레오티드 변이체의 다른 공급원으로부터 분리되었다. 탈메틸화된 분할에서 상당히 감소된 돌연변이 특징은 추정 변형을 확인하였다(χ2 p-값<0.001, 탈메틸화 실험에서 4개 뉴클레오티드의 관찰된 수를 미처리 실험으로부터의 분포를 고려하여 4개 뉴클레오티드의 예상된 수와 비교하는 χ2 시험으로부터).
결과
RNA-seq 과정
도 2c 내지 2f 및 도 3a 내지 3g는 RNA-seq 플랫폼의 다양한 양태 및 RNA-seq 라이브러리 제조에 플랫폼을 사용하는 다양한 양태를 조사하기 위해 수행된 실험 결과를 나타낸다. 달리 언급되지 않는 한, 실험의 투입 물질은 HEK293T 세포로부터의 전체 RNA였다. 도면들은 반응 생성물을 분석하는 전기영동 겔의 이미지를 보여준다. DNA 크기 마커는 왼쪽에 표시되어 있다. 인간 tRNA의 m1A58 및 m1G37 변형에 의해 야기된 주요 RT(역전사효소) 정지는 오른쪽에 표시되어 있다. TdT는 RT의 비정상적인 말단 트랜스퍼라제 활성으로부터 유도된 생성물에 해당한다.
T4 RNA 리가제 I을 사용한 접합은 CHO의 이중체 구조와 양립가능하였고, 3'-A 또는 3'-C 말단을 갖는 RNA 기질 사이에 편향을 나타내지 않았으며(도 3a), 이는 뒤에서 논의되는 하전된 tRNA 측정에 필요한 성질이다.
일부는 투입 RNA가 접합되고 나머지는 접합되지 않은 채 모든 CHO의 스트렙타비딘 비드 결합 후에, 선택적 효소 처리를 위해 샘플을 2개로 분할할 수 있다. 이 경우, 한 샘플은 AlkB 데메틸라제 혼합물에 노출시켜 tRNA에서 왓슨-크릭 표면 메틸화를 제거하고, 다른 샘플은 대조군으로서 처리하지 않은 상태로 두었다. 온-비드 효소 반응은 tRNA 샘플에서 각각 m1A58 및 m1G37 밴드의 제거 및 감소로 나타난 바와 같이 매우 효율적이었다(도 2c).
열안정성 Superscript™ IV RT를 사용한 역전사는 비드 상의 고정화에 의해 억제되지 않았다(도 3b). cDNA 생성물에 대한 온-비드 2차 어댑터 접합 후에, PCR을 온-비드로 직접 수행하여 서열분석 준비가 된 오프-비드 생성물을 생성하였다(도 3c). 3'-포스페이트는 3'-OH로부터 후속 역전사를 허용하기 위해 알칼리성 포스파타제를 사용하여 온-비드로 제거하였다(도 3d). 도 3e에 나타낸 바와 같이, 과요오드산염 처리는 3'-말단 리보스를 갖는 CHO에 대한 접합을 방지하였지만 3'-말단 데옥시리보스를 갖는 동일한 올리고뉴클레오티드에는 영향을 미치지 않은 것으로 확인되었다.
1차 바코드 접합 반응을 제외한 모든 반응은 온-비드로 수행되었다. 이것은 간단한 세척으로 모든 단계에서 과잉 시약의 제거를 용이하게 하고, 각 단계 동안 샘플 손실을 상당히 감소시켰으며, 전체 RNA 투입물이 10 ng에 불과한 RNA-seq 라이브러리를 구성할 수 있게 하였다(도 2d).
RNA-seq 프로토콜은 또한 인간 대변(도 2e) 또는 인간 혀(도 2f)와 같은 복잡한 샘플로부터 단리된 전체 핵산으로부터 고품질 RNA-seq 라이브러리를 생성하였다. 이들 샘플에 존재하는 상당한 양의 DNA는 추가 DNase 처리 유무에 관계없이 라이브러리 구성을 방해하지 않았다(도 2e). 대변 샘플 S1*은 1차 접합 단계 전에 먼저 DNase I로 처리한 반면, S1 및 S2는 DNase 처리없이 동일한 샘플을 사용하였다. 샘플 (+) 과요오드산염은 1차 접합 단계 전에 산화된 과요오드산염이었고, 이는 RNA-CHO 접합을 방지하였다. HEK293T 라이브러리에서 보인 m1A58 밴드는 대변 샘플 라이브러리에는 거의 없으며, 이는 인간 tRNA가 마이크로바이옴 서열분석 라이브러리에 소량으로 존재함을 시사한다.
tRNA 하전 연구를 위한 설계 목표로서, 도 3f에 개략적으로 도시된, 반응 중간체가 침전되거나 정제되지 않도록 단일 튜브에서 이들 시약을 순차적으로 첨가할 수 있도록 산화 및 베타-제거 프로토콜을 변형시켰다. 최종 혼합물을 CHO 접합에 바로 사용하였다. 도 3g는 도 3f에 나타낸 처리 유(+,+) 무(-,-)에 따른 최종 PCR 생성물을 보여준다.
전체 에스케리키아 콜라이 RNA
에스케리키아 콜라이로부터의 전체 RNA를 연구하는데 있어서 RNA-seq의 사용을 여기에서 보여준다. 처음에는 tRNA를 염두에 두고 설계되었지만, RNA-seq 시스템은 원칙적으로 다른 유형의 RNA를 검출할 수 있다. 라이브러리는 전체 에스케리키아 콜라이 RNA로부터 구성되었다. 최종 PCR 생성물은 서열분석을 위해 15 내지 150개 뉴클레오티드의 cDNA 삽입물에 대해 선택된 크기였다.
도 4 및 5는 전체 에스케리키아 콜라이 RNA의 서열분석으로부터 여러 분석 결과를 묘사한다. 도 4a에서, RNA-seq 결과를 에스케리키아 콜라이 게놈에 맵핑하였다. 예상된 바와 같이, 대부분의 판독물은 성숙한 tRNA(92%)에 정렬되는 반면, 나머지 판독물은 rRNA, 비-암호화 RNA(ncRNA) 및 mRNA에 정렬되었다. 판독물의 소 분획을 비-암호화 RNA에 맵핑한다. 스트레스가 없을 때, ncRNA 판독물은 주로 잘 특성화 된 ffs(SRP RNA), ssrS(6S RNA) 및 rnpB(RNase P RNA)를 포함하여 소수의 풍부한 RNA 종 사이에서 분할되었다(도 4a). 판독물의 비율은 대략적으로 각 범주에서 세포 RNA 전사체의 몰비를 반영하고, 이때 tRNA는 몰 기준으로 80 내지 90%를 구성한다. 스트레스가 없을 때, ncRNA 판독물은 주로 잘 특성화된 ffs(SRP RNA), ssrS(6S RNA) 및 rnpB(RNase P RNA)를 포함하여 소수의 풍부한 RNA 종 사이에서 분할되었다(도 4a). 전사체 커버리지의 큰 차이를 고려할 때, 생물학적 복제물로부터의 존재량은 tRNA(r2>0.95), rRNA(r2>0.85) 및 ncRNA(r2>0.75)에 대해 상관관계가 잘 나타났지만, mRNA에 대해서는 낮았다(도 4c). 서열분석에 의해 수득된 tRNA 존재량 측정의 정량적 특성은 tRNAArg 및 tRNALeu의 이소수용체 계열에 대한 마이크로어레이 하이브리드에 의해 수득된 것과 비교하여 검증하였다(도 4b; 각 쌍의 왼쪽의 옅은 색 점은 마이크로어레이 데이터이고, 각 쌍의 오른쪽의 짙은 색 점은 에는 RNA-seq 데이터이다).
tRNA는 세균에서 고도로 변형되기 때문에, RNA 샘플을 AlkB-데메틸라제 혼합물로 온-비드로 처리하였으며, 이것은 인간 tRNA에서 N1-메틸아데노신(m1A), N1-메틸구아노신(m1G) 및 N3-메틸시토신(m3C)의 왓슨-크릭 표면 메틸화를 효과적으로 제거한다. m1A 및 m3C는 에스케리키아 콜라이 tRNA에는 없으므로, 데메틸라제 처리는 m1G 20을 함유하는 7개의 에스케리키아 콜라이 tRNA에만 영향을 미칠 수 있다. 예상된 바와 같이, tRNA의 존재량은, AlkB 데메틸라제 혼합물에 의한 처리 유무에 관계없이, 전체적인 수준에서 상관관계가 잘 나타난(r2>0.95) 반면, RNA 부류 rRNA, ncRNA 및 mRNA에 대한 상관관계는 생물학적 복제물과 동일한 범위 내에 속하였다(도 4c). mRNA에 대한 낮은 상관관계는 낮은 판독물 수에 기인한다.
도 4d는 개별 tRNA를 따른 돌연변이 분획의 히트맵을 묘사하고, 높은 돌연변이 분획을 갖는 소수의 부위를 나타낸다. RT 판독(read-through)으로 인해 왓슨-크릭 표면에서의 RNA 변형이 빈번하게 cDNA에 돌연변이 특징을 남긴다는 것은 잘 확립되어 있다. RT는 또한 변형된 뉴클레오티드에서 정지할 수 있다. 변형의 화학적 특성 및 서열분석에 사용되는 특정 RT에 따라, 개별적 변형 부위의 돌연변이 및 정지 분획은 광범위하게 달라질 수 있다. 대부분의 부위는 이노신(I), 2-티오시토신(s2C), 4-티오우리딘(s4U), N1-메틸구아노신(m1G) 및 3-(3-아미노-3-카복시프로필)우리딘(acp3U)과 같은 알려진 변형에 해당한다. 데메틸라제 처리에 민감한 m1G 변형을 먼저 분석하였다(도 5c 및 5d). Superscript™ IV RT는 때때로 m1G를 완전히 판독하였지만 높은 빈도로 정지하였다. 데메틸라제 처리는 메틸화를 제거하여, 돌연변이 및 정지 분획을 실질적으로 감소시켰다. 통상적인 방법(문헌[Zheng et al., Nature Methods 12, 835, 2015])으로 제조된 RNA-seq 라이브러리 분석에 사용되는 TGI RT에 비해, SuperScript™ IV RT는 돌연변이율은 낮지만, m1G에서 정지율은 더 높다.
왓슨-크릭 표면에서의 다른 에스케리키아 콜라이 tRNA 변형은 위치 8의 4-티오우리딘(s4U), 위치 32의 2-티오시토신(s2C), 및 안티코돈 흔들림(wobble) 위치 34의 리시딘, 위치 37의 2-메틸티오-N6-이소펜테닐아데노신(ms2i6A) 및 위치 47의 3-(3-아미노-3-카복시프로필)우리딘(acp3U)과 같은 벌키한 변형을 포함한다. 이들 변형은 돌연변이 및 정지 분획에서 매우 큰 차이를 나타내었다(도 4d 및 5c). 벌키한 34 및 37 변형은 가장 높은 정지 분획을 나타내었다. acp3U 및 m1G는 둘 다 실질적인 정지와 함께 비슷한 돌연변이 분획을 나타내었다. s4U 및 s2C는 둘 다 정지없이 돌연변이에 의해 검출되었다(도 4d 및 5c). s4U8의 경우, 돌연변이 분획은 상이한 tRNA 중에서 매우 가변적이었으며, 이는 이러한 생물학적 조건하에서 변형 분획의 차이를 반영할 수 있다. s2C32 변형에 대해 훨씬 더 높은 돌연변이 수준이 관찰되었으며, 이는 높은 변형 수준 및 Superscript™ IV RT의 특유의 성질 둘 다를 반영할 수 있다. s2C32는 호열성 그룹 II 인트론 3과 상이한 RT를 사용한 이전 연구에서 에스케리키아 콜라이 tRNA에서 검출되지 않았다.
약 50개의 비-암호화 RNA가 에스케리키아 콜라이에서 관찰되었으며 발현 수준은 약 2,000배까지 달라졌다(도 4e). 스트레스가 없을 때, 이들은 SRP RNA(ffs), tmRNA(ssrA) 및 RNase P RNA(rnpB)와 같은 여러 보존된 세균 RNA 종이 우세하였지만, 대다수는 훨씬 낮은 수준으로 발현되어 스트레스 반응에서 예상되는 역할과 일치하였다. 도 4e는 rpm>1에서 비-암호화 RNA 전사체의 존재량을 묘사한다. 데이터는 데메틸라제 처리가 미미한 효과만 있음을 보여준다.
상기 및 하기의 실험은 tRNA 및 소형 비-암호화 RNA의 동시 분석을 보여준다. 극도로 높은 수준의 tRNA로 인해, 소형 RNA 서열분석은 일반적으로 tRNA에서 떨어져 있는 RNA를 크기-선별함으로써 수행하였다. 전체 RNA에서 시작하여, 이 접근법은 모든 RNA 유형을 대략적인 몰비에 따라 단일 라이브러리에 통합한다.
에스케리키아 콜라이 스트레스 반응
3가지 급성 스트레스 조건에 에스케리키아 콜라이를 적용하여 생물학적 반응을 연구하는데 있어서 RNA-seq의 응용을 여기에서 보여준다. H2O2의 첨가는 산화 스트레스에 해당하고, 2,2'-디피리딜(DIP)의 첨가는 철 결핍에 해당하고, α-메틸 글루코시드-6-포스페이트(aMG)의 첨가는 글루코스 결핍에 해당한다.
도 5a 내지 5g는 3가지 급성 스트레스 조건에 적용된 에스케리키아 콜라이로부터 전체 RNA를 서열분석한 결과를 묘사한다.
도 5a는 10분 동안 3개의 급성 스트레스 조건의 존재 및 부재하에, LB에서 성장한 에스케리키아 콜라이로부터의 전체 RNA의 생물학적 복제물 중에서의 RNA 전사체 존재량의 상관관계를 보여준다. 존재량 상관관계는 tRNA, rRNA 및 ncRNA에 대해 잘 일치하지만, mRNA의 매우 낮은 커버리지로 인해 mRNA에 대해서는 일치하지 않는다. 도 5b는 데메틸라제로 처리된 샘플과 미처리 샘플의 전사체 존재량 사이의 관계를 보여준다. 도 5c는 데메틸라제 처리 유무에 따른, 라이브러리로부터의 tRNAPro(GGG)에 따른 돌연변이율을 보여준다. 미처리 샘플은 알려진 m1G37 및 s4U8 변형에서 돌연변이 피크를 나타낸다. m1G37 돌연변이는 데메틸라제 처리로 방지되지만, s4U8 돌연변이는 영향을 받지 않는다. 도 5d는 데메틸라제 처리 유무에 따른, tRNAPro(GGG)에 따른 판독물 밀도를 나타내며, 이는 데메틸라제 처리에 의해 대부분 제거되는 m1G37에서의 강한 정지를 입증한다. 스트레스 조건에서 성장한 에스케리키아 콜라이에 대한 5A 내지 D에 나타낸 결과는 스트레스를 받지 않은 에스케리키아 콜라이에 대해 앞에서 논의된 것을 반영한다(도 4a 내지 4d).
스트레스에 대한 주요 세균 반응은 특정 비-암호화 RNA의 상향조절이다. 도 5e에서 분석된 스트레스-반응성 서열은 다음이었다: 산화 스트레스에 반응하는 OxyS(+); 철 결핍에 반응하는 rhyB(삼각형); 글루코스 결핍에 반응하는 sgrS(사각형); 및 미반응 대조군 서열인 ffs(SRP; 원). 도 5f는 스트레스 하에서 및 대조군(없음)으로서 스트레스가 없을 때 3개의 스트레스-반응성 소형 비-암호화 RNA 및 대조군 RNA SRP(ffs)의 커버리지 밀도를 묘사한다. 각각의 스트레스에 대해 특정 RNA 발현의 극적인 증가가 검출되었다: 산화 스트레스에 대해 oxyS에서 약 75배 증가, 철 결핍에 대해 ryhB에서 약 10배 증가, 및 글루코스 결핍에 대해 sgrS에서 약 60배 증가(도 5e 내지 5g). 대조군 서열인 ffs(SRP RNA)의 수준은 모든 조건에서 변하지 않고 유지되었다(도 5e 및 5f).
도 5g는 데메틸라제 처리없이 라이브러리로부터 검출된 모든 소형 비-암호화 RNA의 존재량의 배수 변화를 묘사한다; 문헌과 일치하게, 소수의 전사체만이 개개 스트레스에 반응하였다.
tRNA 존재량, 하전 및 변형의 변화도 또한 동일한 스트레스 조건: 산화 스트레스, 철 결핍 및 글루코스 결핍 하에서 연구하였다. 이러한 급성 스트레스 조건 하에서(10분) tRNA 존재량의 변화는 1.3배 이내였다. 개별 tRNA를 따라 돌연변이율을 분석할 때, αMG 및 DIP 스트레스 후에만 위치 8에서 광범위한 과변형이 관찰된 반면, 위치 32에서의 저변형은 DIP 스트레스로부터만 발생하였다.
세린 및 글리신에 대한 tRNA를 제외하고, 대부분의 tRNA 하전 수준의 변화도 또한 작았으며 벌크 범위 이내였다. 3가지 스트레스 조건 모두에서 tRNASer 하전 수준은 1.8배까지 증가하였다; 4개의 tRNASer 이소수용체 모두 동일한 경향을 따랐다. 이 결과는 스트레스 전에 사용된 배양 조건 하에서 알려진 낮은 수준의 tRNASer 하전과 일치한다. 다른 방향에서, tRNAGly 이소수용체 하전 수준 변화는 벌크 범위보다 1.7배까지 낮았다.
이러한 결과는 tRNA를 통한 급성 에스케리키아 콜라이 스트레스 반응이 tRNA 존재량의 변화보다 tRNA 하전을 통해 더 빠르게 발생함을 시사한다. 그러나, 스트레스가 지속됨에 따라 tRNA 존재량의 큰 변화가 이어질 수 있는 것도 가능하다.
스트레스가 tRNA 변형에 영향을 미치는 방식도 조사하였다. 각각의 스트레스와 스트레스를 받지 않은 대조군 사이의 비교 돌연변이 분획을 이용하여 높은 신뢰도로 분석할 수 있었던 4개의 변형 중에서, m1G37 수준은 스트레스 하에서 거의 변화하지 않았지만 acp3U47 수준은 3가지 스트레스 조건 모두에서 증가한 것으로 확인되었다. 대조적으로, s2C32 및 s4U8 수준 둘 다의 실질적인 변화는 스트레스 조건에 따라 달랐다. S2C32 수준은 철 결핍하에서만 감소되었다. S4U8 수준은 철 결핍 및 글루코스 결핍 하에서 증가했지만 산화 스트레스 하에서는 증가하지 않았다. 이러한 변화의 정확한 역할 및 메커니즘은 직접적으로 명확하지는 않다.
HEK293T RNA
HEK293T RNA로부터 전체 인간 RNA를 연구하는데 있어서 RNA-seq의 응용을 여기에서 보여준다.
도 6 및 7은 전체 인간 RNA의 서열분석으로부터의 여러 분석의 결과를 묘사한다.
RNA-seq 라이브러리는 인간 전체 RNA로 구축되었다(도 6a). 예상된 바와 같이, 대부분의 판독물은 tRNA(95%)로부터였으며, 나머지는 ncRNA(2.9%), rRNA(2%) 및 mRNA(0.1%)로부터였다. ncRNA 판독물에는 lncRNA, snRNA, snoRNA 등이 포함되었으며, 대부분 lncRNA 및 snRNA이었다. 데메틸라제-처리된 라이브러리에 의해 수득된 tRNA 존재량의 정량적 특성은 tRNAArg의 이소수용체 계열에 대한 마이크로어레이 하이브리드화에 의해 수득된 것과 비교하여 검증하였다(도 6b; 각 쌍의 왼쪽의 옅은 색 점은 마이크로어레이 데이터이고, 각 쌍의 오른쪽의 짙은 색 점은 RNA-seq 데이터이다).
인간 tRNA는 많은 tRNA 종에서 다중 왓슨-크릭 표면 메틸화를 갖는다. 여기에는 위치 58의 m1A, 위치 37의 m1G, 위치 32의 m3C, 위치 26의 2,2-디메틸구아노신(m22G), 및 위치 9의 m1G가 포함된다. 그러므로, 데메틸라제 처리는 tRNA 존재량 측정에 큰 영향을 미칠 수 있다. 실제로, 데메틸라제 처리 유무에 따른 서열분석 결과를 비교하면, 데메틸라제 처리 유무에 따른 생물학적 복제물의 우수한 상관관계에도 불구하고(도 7b, r2>0.95), tRNA의 전체 존재량은 단지 적당히 상관관계를 나타내었다(도 7a, r2 약 0.68). 이러한 불일치는 부분적으로 특정 인간 tRNA에 대한 판독물 할당의 증가된 불명료함 및/또는 미처리 샘플에서 저변형 tRNA의 과잉-표현에 기인할 수 있다.
RNA-seq의 서열분석 결과와 이전에 공개된 DM-tRNA-seq의 결과(문헌[Zheng et al., Nature Methods 12, 835, 2015])의 비교는 양호한 상관관계를 나타내었다(도 7c). 본 발명의 RNA-seq와 이전 DM-tRNA-seq 간의 주요 차이점은 상이한 RT 효소의 사용, 라이브러리 구성에 수반된 단계, 및 RNA-seq의 전체 RNA 대 DM-tRNA-의 겔 정제된 tRNA의 투입이다.
RNA-seq 방법의 견고성은 10, 100 및 1000 ng의 전체 RNA로 시작하는 라이브러리를 구축하여 시험하였다(도 2d 및 6c). 도 6c는 1 ㎍, 100 ng, 또는 10 ng의 전체 RNA로 시작하는 라이브러리로부터의 tRNA 존재량 결과의 상관관계를 묘사한다. 10 ng의 총 RNA 투입에서도, tRNA 존재량은 약 0.94의 r2로 이들 라이브러리 사이에 상관관계를 잘 나타내었다.
광범위한 tRNA 변형 환경은 개별 tRNA에 따른 돌연변이 분획의 분석에 의해 쉽게 명백해졌으며, 상기 분석은 높은 돌연변이 분획을 갖는 많은 부위를 밝혀내었다. 대부분의 돌연변이 부위는 위치 58의 N1-메틸아데노신(m1A), 위치 37의 N1-메틸구아노신(m1G), 위치 32의 N3-메틸시토신(m3C), 위치 26의 N2,2-다이메틸구아노신(m22G) 및 위치 9의 m1G/m1A과 같은 알려진 변형에 해당하였다. m1G37을 제외하고, 근본적으로 왓슨-크릭 표면의 모든 메틸화는 tRNA 서열 전체에 걸쳐 높은 돌연변이 분획을 생성하였다(도 7d).
데메틸라제 처리 후 tRNA에서 돌연변이 분획을 분석하였다. 예상된 바와 같이, 모든 주요 변화는 m1A, m1G 및 m3C와 같은 데메틸라제-민감성 변형 부위에서 발생하였다(도 7e 참조). 데메틸라제 처리는 핵-암호화된 tRNA 및 미토콘드리아-암호화된 tRNA 둘 다에서 상기 변형들과 관련된 돌연변이 및 정지를 제거하거나 감소시켰지만, 많은 tRNA의 흔들림 안티코돈 위치에서 이노신(I) 변형은 영향을 받지 않았다.
tRNA 이외에, 많은 소형 비-암호화 RNA도 확인되었다(도 6d). 그들의 존재량은 약 2,000배까지 달라졌다. 도 6d는 rpm>10에서 소형 비-암호화 RNA 전사체의 존재량을 묘사한다. 예상된 바와 같이, 이들 중 대부분은 스플라이소좀 RNA 및 snoRNA, 그리고 도 7f에 나타낸 소수의 풍부한 마이크로-RNA이다. tRNA 단편은 여기에서 분석하지 않았으며 이 범주에서 제외되었다.
RNA-seq는 처음에 소형 RNA를 연구하기 위해 설계되었지만, 원칙적으로 mRNA를 연구하는데 사용할 수 있다. 폴리(A)-선택된 후 단편화된 RNA를 투입물로 사용하여 서열분석 라이브러리를 또한 제조하였다. 이 경우, 대부분의 판독물은 실제로 mRNA 및 폴리아데닐화 ncRNA(97%)에 맵핑되었으며, 이때 소 분획만 tRNA(2%) 및 rRNA(0.6%)에 맵핑되었다(도 7g). 복제물은 mRNA에 대해 상관관계를 잘 나타내어(r2 = 0.91), 전사체 서열분석을 위한 RNA-seq 방법의 유용성을 뒷받침하였다(도 7h).
화학 처리에 의한 슈도우리딘(Ψ) 부위 맵핑
RNA의 엄격한 화학 처리를 포함하는 용도를 위한 온-비드 프로토콜의 견고성을 여기에서 보여준다.
도 8은 인간 rRNA에서 Ψ 부위를 조사하기 위한 RNA-seq의 사용을 묘사한다.
RNA의 화학 처리는, RNA 구조적 맵핑 또는 RNA 변형의 확인과 같은 많은 용도를 갖는다. Ψ 부위를 확인하는 확립된 방법은 N-사이클로헥실-N'-β-(4-메틸모폴리늄)에틸카보디이미드(CMC)를 사용하는 반응이다. Ψ는 CMC-처리 샘플을 미처리 대조군과 비교할 때 발견되는 Ψ 부위에서의 증가된 RT 정지 및/또는 돌연변이에 의해 검출된다.
인간 rRNA는 약 100개의 알려진 Ψ 부위를 가지고 있다. 이들을 맵핑하기 위해, 전체 RNA를 화학적으로 단편화하고, 3' 말단을 복구한 다음, 헤어핀 올리고뉴클레오티드에 접합시켰다. 온-비드 탈메틸화 단계는 서열분석 라이브러리를 구축하는데 있어서 CMC 반응으로 대체되었다(도 8a). 각각의 rRNA 위치에는 정지 및 돌연변이 분획이 할당되었고, 생물학적 복제물 사이에 양호한 상관관계가 관찰되었다(r2>0.95)(도 8b). Ψ 부위가 풍부한 것으로 알려진 18S(도 8c) 및 28S(도 8d) rRNA의 영역뿐 아니라, 전장 18S rRNA(도 8e 및 8f)도 조사하였다. 알려진 모든 Ψ 부위는 도 8c 내지 8f에서 별표로 표시되어 있다. 알려진 Ψ 부위의 CMC-처리 샘플에서 정지 및/또는 돌연변이 분획에서 강한 신호가 확인되어, 접근법의 유용성을 검증하였다.
본 실시예는 스트렙타비딘 비드가 pH 8 내지 10에서 수행되는 2 단계 및 30 내지 37℃에서 몇시간의 배양을 포함하는, CMC 반응과 같은 엄격한 화학 처리를 견딜 수 있음을 보여준다.
마이크로바이옴 tRNA 서열분석
마이크로바이옴과 같은 복잡한 샘플을 연구할 때 RNA-seq 접근법의 유용성을 여기에서 보여준다.
도 9 내지 12는 인간 대변 및 혀에서 마이크로바이옴을 조사하기 위한 RNA-seq의 사용을 묘사한다.
대부분의 마이크로바이옴 특성화 기술은 DNA를 서열분석하고, 이는 미생물 활성이 아니라 군집 구성원을 결정할 수 있다. 이전 작업은 마우스 맹장에서 tRNA 발현 및 tRNA 변형을 측정하는 마이크로바이옴 tRNA-seq 접근법(문헌[Schwartz et al., Nat Commun 9, 5353, doi:10.1038/s41467-018-07675-z, 2018])을 개발하였다. 그러나, 이전의 방법은 라이브러리 구성 전에 대량의 투입 물질 및 tRNA의 겔 정제의 필요, 및 라이브러리 구성동안 cDNA 생성물의 필요를 포함하여 많은 한계를 갖는다.
이전 연구에서 사용된 에스케리키아 콜라이 및 인간 세포주는 한정된 배양물로부터 수득되었으며, 이때 투입 샘플의 양은 사실상 무한정이었으며 데이터 복잡성은 낮았는데, 이는 각 샘플이 단일 참조 게놈에 정렬될 수 있었기 때문이다. 대조적으로, 인간 대변 및 혀의 샘플은 훨씬 더 복잡하다. 이들 샘플로부터의 RNA-seq 라이브러리가 우수한 질을 가졌음이 입증되어(도 2e 및 2f 참조), RNA-seq 라이브러리를 서열분석에 사용하였으며 이전에 개발된 드노보 tRNA-seq 파이프라인을 사용하여 tRNA 존재량 및 변형에 대해 데이터를 분석하였다. 대변 및 혀 샘플의 경우, 모든 tRNA-상용성 판독물의 >95%가 세균에 할당되었으며, 이는 절차가 마이크로바이옴 특성화에 대해 높은 가치의 결과를 산출했음을 시사한다.
도 9a는 인간 혀 스크래핑 시료로부터의 상이한 주요 RNA 부류에 판독물의 할당을 보여준다. 도 9b는 다양한 세균 분류학적 부류로부터의 SRP RNA와 5S rRNA의 상관관계를 보여준다. 값들은 log10 존재량의 Z-점수로 계산된다. 도 9c는 도 9b에서와 같이 세균 분류학적 부류에 대해 SRP RNA 존재량과 모든 확인된 tRNA의 합의 상관관계를 보여준다. 도 9d는 도 9b에서와 같이 세균 분류학적 부류에 대해 5S rRNA와 모든 확인된 tRNA의 합의 상관관계를 보여준다. 도 9e는 프레보텔라 멜라니노게니카(Prevotella melaninogenica)의 SRP에 대한 판독물 맵핑을 보여준다; 판독물은 유전자의 주석이 달린 5'-말단(상단)(대문자)에 맵핑된 반면, 전사체의 3'-말단(하단)은 게놈 서열(소문자) 내로의 유전자 주석보다 1 내지 3개 염기를 지나 있다; 연장된 3'-말단은 SRP 구조적 맥락(중간)과 일치한다. 도 9f는 로티아 뮤실라기노사(Rothia mucilaginosa)의 SRP에 대한 판독물 맵핑을 보여준다; 판독물은 유전자의 주석이 달린 5'-말단(상단)의 2 내지 5개 염기 하류에 맵핑된 반면, 3'-말단(하단)은 주석이 달린 말단의 4 내지 8개 nt 만큼 짧아지는 3'-말단을 갖는 개체들간 이종성을 보여준다.로티아 뮤실라기노사(Rothia mucilaginosa)의 SRP에 대한 판독물 맵핑을 보여준다.
도 10a는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 또는 16S 앰플리콘 유전자 서열분석에 의해 측정된 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다; 악티노박테리아는 RNA와 16S DNA 서열분석 기술 사이의 변이를 설명하는 16S 앰플리콘 서열분석에 의한 검출을 회피하는 것으로 알려져 있다. 도 10b는 tRNA, 5S rRNA, SRP RNA 및 16S 앰플리콘 서열분석에 의해 측정된 바와 같이, 4명의 상이한 개체에 대해 2일 연속 혀 미생물 존재량의 배수 변화를 보여준다. 도 10c는 인간 대변의 여러 주요 RNA 부류에 판독물 할당을 보여준다. 도 10d는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 16S 앰플리콘 유전자 서열분석에 의해 측정된 2개의 인간 대변 샘플로부터의 미생물의 분류학적 조성을 보여준다.
도 11a는 tRNA, 5S rRNA, SRP RNA를 사용하여 계산되거나 16S 앰플리콘 유전자 서열분석에 의해 측정된 4개의 상이한 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다. 도 11b는 안티코돈 "TTT" 또는 "CTT"를 갖는 tRNA를 사용하여 계산된 인간 혀 스크래핑 시료로부터의 미생물의 분류학적 조성을 보여준다.
tRNA 변형도 또한 분석하였다. 도 12a는 인간 혀 스크래핑 시료로부터의 로티아 속으로부터의 세균의 개별 tRNA에 따른 돌연변이율의 히트맵을 보여준다. 도 12b는 도 12a에서와 같은 히트맵을 나타내지만, 데메틸라제 처리에 민감한 돌연변이를 확인하고 이 속의 풍부한 m1A58 변형을 확인한다. 도 12c는 위치 37에서의 돌연변이율 및 로티아 속의 선택 tRNA의 주변 염기를 보여주고, m1G37을 데메틸라제 민감성 변형으로 식별한다. 도 12d는 데메틸라제 처리 유무에 따른 인간 혀의 여러 세균 분류군에서 선택된 tRNA의 위치 22에서의 돌연변이율을 보여주며, 이는 변형 m1A22를 확인한다. 도 12e는 도 13d에서와 같이 인간 혀로부터 악티노박테리아에서 m1A58을 확인한다. 도 12f는 연속 2일에 4명의 인간 혀 스크래핑 시료로부터 데메틸라제 처리없이 선택 세균 부류에 대한 위치 22에서의 돌연변이율을 보여준다. 도 12g는 연속 2일에 4명의 인간 혀 스크래핑 시료로부터의 데메틸라제 처리없이 악티노박테리아에 대한 위치 58에서의 돌연변이율을 보여준다. 도 12h는 인간 대변으로부터 도 12d에서와 같이 선택 세균 부류에서 m1A22를 확인한다. 도 12i는 인간 대변으로부터 도 12e에서와 같이 악티노박테리아에서 m1A58을 확인한다.
RNA-seq는 한 번에 많은 샘플을 처리하는 능력, 투입 샘플 양의 매우 실질적인 감소, 모든 크기 선택 단계의 배제, 및 온-비드 데메틸라제 반응을 포함하여, 여러 방식으로 마이크로바이옴 tRNA-seq의 응용을 개선한다.
실시예 2
SARS-CoV-2
하기의 실시예는, 본 발명의 양태들에 따라서, 잠재적인 SARS-CoV-2 바이오마커의 개발을 위한, 실시예 1에서 일반적으로 기술되고 본원에 기술된 바와 같은 헤어핀 올리고뉴클레오티드를 사용하는 RNA 라이브러리 제조의 RNA-seq 방법의 용도를 입증한다.
도 13은 SARS-CoV-2에 감염된 개인의 코에서 수득된 샘플에서 검출된 tRNA의 히스토그램을 묘사한다.
이전에 SARS-CoV-2로 진단을 받은 개인으로부터 10개의 비강 면봉 샘플을 채취하였다. 샘플에서 인간 및 미생물 tRNA를 검출하기 위해 RNA-seq 방법을 적용하였다. 검출된 tRNA를 기반으로 블라인드 클러스터링 분석을 수행하고 입원 기간에 따라 측정된 환자의 결과와 비교하였다. 주요 클러스터는 중증 증상(>15일 입원) 및 경증/매우 경미한 증상(<3일)에 잘 부합한다.
SARS-CoV-2 환자 및 대조군으로 건강한 개인으로부터의 비인두 면봉시료를 서열분석하여 COVID19 검사에 사용된 비인두 면봉시료에서 얻을 수 있는 서열분석 데이터의 질을 결정하였다. 이들 샘플은 바이오매스가 낮고, 표준 UV 흡광도 측정으로 종종 감지할 수 없는 소량의 RNA만 함유한다. 낮은 샘플 바이오매스는 qPCR-기반 진단에서는 문제가 되지 않지만, 대부분의 RNA-서열분석 기술에는 장애가 된다.
tRNA 단편화는 모든 샘플에서 광범위하게 발생하였다. 건강한 대조군(n=5), 인플루엔자 감염(n=4) 및 SARS-CoV-2 감염(n=57) 개인에 대해 tRNA를 따른 순차적 영역에 맵핑된 판독물의 분획을 나타내었다(도 14a). tRNA의 단편화는 각각의 환자 그룹에 대해 일관되고 고유한 패턴을 보여준다. 단편 절단은 주로 안티코돈 영역에서 발생한다.
특정 tRNA의 단편화는 비감염, 인플루엔자 및 SARS-CoV-2 감염된 개인을 구별할 수 있다(도 14b); ns, 유의하지 않음, P-값: * <0.05; ** <0.01; *** <10-3, **** <10-4. 5.8S rRNA로 표준화된, 특정한 전장 tRNA의 존재량 차이는 상이한 바이러스 감염(즉, 인플루엔자와 SARS Cov-2)을 구별할 수 있으며, 경증으로 발전한 SARS-CoV-2 환자(n=36) 또는 중증(n=21) 증상으로 발전한 SARS-CoV-2 환자도 구별할 수 있다(도 14c). 경미한 증상이 나타난 환자는 더 많은 부분의 단편화된 tRNA를 나타내며, 이는 강력한 선천적 면역 반응으로부터의 더 많은 RNase 분비와 일치한다.
동일한 서열분석 데이터에서 조사된 또 다른 매개변수는 RT 돌연변이 특징을 통한 RNA 변형의 정량적 비교이다. 특정 tRNA 변형은 건강한 환자를 바이러스 감염 및 SARS-CoV-2 감염 증상 발생과 구별할 수 있다(도 14d).
결과는 RNA-seq 기술이 뱅크화된 비인두 면봉시료로부터 고품질 tRNA 서열분석 결과를 생성할 수 있음을 입증한다. 인간 비인두 영역의 tRNA 단편화 프로필은 호흡기 바이러스 감염으로 인한 합병증 위험이 높은 환자를 식별하여 감염 결과에 대한 예후인자로서 바이오마커가 될 가능성을 갖는다.
실시예 3
대장암
하기의 실시예는 본 발명의 양태들에 따라서, 잠재적인 대장암(CRC) 바이오마커의 개발을 위해, 실시예 1에 일반적으로 기술되고 본원에 기술된 바와 같은 헤어핀 올리고뉴클레오티드를 사용하는 RNA 라이브러리 제조의 RNA-seq 방법의 사용을 입증한다.
6명의 CRC 환자로부터의 종양 및 인접 조직으로부터의 tRNA를 서열분석하였다. 실험은 이들 샘플에서 tRNA를 연구하는 실행가능성을 조사하고, 종양이 동종인지 또는 환자 통계자료(즉, 체질량 지수, BMI)와 관련된 tRNA-수준 변화를 나타내는지 여부를 측정하였다.
이들 샘플로부터 얻은 대부분의 RNA 데이터는 예상된 바와 같이 tRNA(71%)였다. 나머지 RNA는 rRNA(7.3%), mt_tRNA(2.7%) 및 기타 RNA(19%)였다.
고해상도 데이터는 >300개의 염색체-암호화된 tRNA 유전자(도 15) 및 22개의 미토콘드리아-암호화된 tRNA 유전자(도 16)에 대한 상이한 성질의 검사를 가능하게 하였다.
도 15는 6명의 대장암(CRC) 환자로부터의 종양 및 인접 조직에서의 tRNA-seq 존재량, 변형 및 단편화의 척도를 묘사한다. 발현 수준(도 15a): tRNA 존재량은 환자들 사이에서 상당한 이종성을 나타낸다. 예를 들어, 아미노산 알라닌의 코돈을 판독하는 tRNA의 발현은 환자들 사이에서 상대적으로 일정하고, 종양은 인접 조직보다 약 2배 더 높은 수준을 발현한다(왼쪽 패널). 대조적으로, 아미노산 류신의 코돈을 판독하는 tRNA는 BMI 또는 tRNAAla 발현 수준에 관계없이 각 환자에서 뚜렷한 발현 패턴을 나타낸다(오른쪽 패널). 변형(도 15b): tRNA-seq는 서열분석 라이브러리 구성 동안 뉴클레오티드 혼입오류를 초래하는 전사후 메틸화 변형을 검출하였다(상단 패널). 특정 변형은 메틸화를 제거하는 탈메틸화 효소로 샘플을 처리함으로써 혼입오류(m1A)를 제거하는 반면, 다른 변형(I)은 영향을 받지 않았다(하단 패널). 단편화(도 15c): tRNA 단편은 상이한 세포 조건에 대한 반응으로 세포 뉴클레아제 절단에 의해 생성되며, 그들 자신의 조절 비-암호화 RNA 계열에 속한다. RNA-seq 분석은 tRNA 2차 구조 영역(예를 들어, D-루프, 안티코돈-루프, T-루프)에서 절단 부위의 위치를 기반으로 분류될 수 있는 상이한 3' 말단을 가진 tRNA를 구별한다. 예상된 바와 같이, tRNA 단편은 전체 tRNA 판독물의 약 1 내지 10%를 차지하고, 이때 가장 일반적인 것은 안티코돈-루프(30 내지 39)의 절단이다. 예기치 않게, T 루프(50 내지 59)의 절단은 종양과 인접 조직 사이에서 현저하게 상이하고, 이는 tRNA 단편 프로필이 유용한 바이오마커가 될 수 있음을 시사한다.
도 16은 개별 환자에서 미토콘드리아 tRNA의 종양 발현 패턴을 묘사한다. 미토콘드리아 tRNA는 6명의 환자 중 4명에 대해 인접 조직에 비해 종양에서 상당히 저발현되며(도 16a), 이는 암에서 바르부르크(Warburg) 효과 및 미토콘드리아 기능장애와 일치하는 결과이다. 이들 샘플에서는, BMI가 낮은 환자와 높은 환자의 샘플 간의 차이의 강한 패턴이 없었다. 분석이 The Cancer Genome Atlas(TCGA)에 있는 수백 개의 샘플을 포함하도록 확장되었을 때, 데이터는 미토콘드리아 유전자의 발현이 높은 BMI를 가진 환자와 비교하여 낮은 BMI를 가진 환자의 종양에서 상당히 낮다는 것을 보여준다(도 16b).
tRNA 이외에, RNA-seq 기술은 또한 미생물로부터 소형 RNA를 포획하여, 개별 환자에서 미생물 군집의 구성을 분석하기 위해 미생물 5S rRNA의 사용을 가능하게 하였다(도 17). 환자 중 3명은 높은 악티노박테리아 분획을 나타낸다. 3명의 환자 중 2명은 CRC의 재발이 발생한 것으로 알려져 있다; 연구는 세 번째 환자의 CRC 상태가 변화되는지 확인하기 위해 확장되고 있다.
개별 환자의 염색체 tRNA 결과는 또한 고해상도에서 염기 변형 및 종간 다형성을 통해 종 차이를 확인하는 데 사용될 수 있다. 초기 분석은 CRC 재발과 관련되는 것으로 알려진 공생 장 세균 엔테로코커스 페칼리스(E. faecalis)에 초점을 맞췄다. 혼입오류는 마이크로바이옴 샘플의 유전적 다양성을 반영하는 tRNA 염기 변형(m1A) 또는 염기 다양성(SNP)에 기인할 수 있다. 수술 전, 수술 중 및 수술 후에 환자로부터 채취한 샘플에서 엔테로코커스 페칼리스의 tRNATyr에 따른 혼입오류 결과(도 18a)는 몇 가지 통찰을 제공한다. 첫째, 위치 7 및 74는 시간이 지남에 따라 혼입오류의 변화를 보여준다. tRNA 구조 및 변형에 대한 확립된 지식, 및 데메틸라제 처리에 대한 돌연변이의 둔감성에 기초하여, 이러한 변화는 수술 후 엔테로코커스 속의 밀접하게 관련된 종의 차등화 축적으로 인한 유전적 다양성을 나타내는 것으로 확인되었다(도 18b). 나타난 감소하는 다양성은 수술 후 상당히 변경된 종 구성을 나타낸다. 대조적으로, 위치 23에서의 혼입오류는 데메틸라제 처리에 민감했으며, 이는 이것이 tRNA의 염기 변형으로부터, 이 경우 N1-메틸아데노신으로부터 비롯됨을 시사한다(도 18c). 혼입오류 분획은 수술 후 약 20% 증가했으며, 이는 장내 엔테로코커스에서의 이러한 변형이 치료 상태의 영향을 반영함을 시사한다.
결과는 RNA-seq 기술에 의해 가능해진 분석이 종양에서 RNA 가변성에 대한 많은 상이한 통찰을 허용함을 입증한다.
간행물, 특허 출원 및 특허를 포함하여, 본원에 인용된 모든 참고문헌은, 각각의 참고문헌이 개별적으로 및 구체적으로 참고로 도입되는 것으로 명시되고 그 전체가 본원에 나타낸 것과 동일한 정도로 참고로 도입된다.
본 발명을 설명하는 맥락에서(특히 다음 청구범위의 맥락에서) 용어 "하나" 및 "그" 및 "적어도 하나" 및 유사한 언급대상의 사용은, 본원에 달리 나타내지 않거나 문맥상 명백히 모순되지 않는 한, 단수형 및 복수형을 둘 다 포함하는 것으로 해석되어야 한다. "적어도 하나"라는 용어 뒤에 하나 이상의 항목의 목록(예를 들어, "A 및 B 중 적어도 하나")이 사용되는 것은, 본원에 달리 나타내지 않거나 문맥상 명백히 모순되지 않는 한, 열거된 항목 중에서 선택된 하나의 항목(A 또는 B) 또는 열거된 항목 중 2개 이상의 임의의 조합(A 및 B)을 의미하는 것으로 해석되어야 한다. "이루어지는", "갖는", "포함하는" 및 "함유하는"이라는 용어는 달리 언급되지 않는 한 제한이 없는 용어(즉, "포함하지만 이로 제한되지 않는"을 의미)로 해석되어야 한다. 본원에서 값의 범위를 열거하는 것은 단지, 본원에서 달리 나타내지 않는 한, 범위 내에 속하는 각각의 별개의 값을 개별적으로 언급하는 속기 방법으로서 역할을 하기 위한 것이며, 각각의 별개의 값은 본원에서 개별적으로 인용된 것처럼 명세서에 도입된다. 본원에 기술된 모든 방법은 본원에 달리 나타내지 않거나 문맥상 명백히 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 모든 예 또는 예시적인 언어(예를 들어, "와 같은")의 사용은 단지 본 발명을 더 잘 예시하기 위한 것이며 달리 청구되지 않는 한 본 발명의 범위에 대한 제한을 제기하는 것이 아니다. 명세서의 어떤 언어도 임의의 청구되지 않은 요소를 본 발명의 실시에 필수적인 것으로 지시하는 것으로 해석되어서는 안 된다.
본 발명을 수행하기 위해 본 발명자들에게 알려진 최선의 방식을 포함하여 본 발명의 바람직한 양태들이 본원에 기술되어 있다. 이러한 바람직한 양태들의 변화는 전술한 설명을 읽을 때 당해 분야의 통상의 숙련자에게 명백해질 수 있다. 본 발명자들은 숙련된 전문가가 이러한 변화를 적절하게 사용할 것을 기대하고, 본 발명자들은 본 발명이 본원에 구체적으로 기술된 것과 달리 실시될 것을 의도한다. 따라서, 본 발명은 해당 법률이 허용하는 바에 따라 여기에 첨부된 청구범위에 인용된 주제의 모든 수정 및 등가물을 포함한다. 또한, 본원에 달리 나타내지 않거나 문맥상 명백히 모순되지 않는 한, 모든 가능한 변화에서 전술한 요소들의 임의의 조합은 본 발명에 포함된다.
SEQUENCE LISTING <110> The University of Chicago <120> HAIRPIN OLIGONUCLEOTIDES AND USES THEREOF <130> 757154 <140> PCT/US2021/058258 <141> 2021-11-05 <150> US 63/110,605 <151> 2020-11-06 <160> 89 <170> PatentIn version 3.5 <210> 1 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 actggaaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt tccagu 56 <210> 2 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 ccaactggaa agatcggaag agcacacgat tagacgtgtg ctcttccgat ctttccagu 59 <210> 3 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synethic <400> 3 ccaactggaa agatcggaag agcacacgat tagacgtgtg ctcttccgat ctttccagut 60 gg 62 <210> 4 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 actggaaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt tccagutgg 59 <210> 5 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or t <400> 5 nnnnnngatc gtcggactgt agaactctga acgtc 35 <210> 6 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 acgttcagag ttctacagtc cgacgatc 28 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 agacgtgtgc tcttccgatc t 21 <210> 8 <211> 13 <212> RNA <213> Prevotella melaninogenica <400> 8 aagacgggca agu 13 <210> 9 <211> 18 <212> RNA <213> Prevotella melaninogenica <400> 9 gcuuguccac cccgccuc 18 <210> 10 <211> 12 <212> DNA <213> Prevotella melaninogenica <400> 10 ccaccccgcc tc 12 <210> 11 <211> 14 <212> RNA <213> Rothia mucilaginosa <400> 11 ucuugccucu uacg 14 <210> 12 <211> 17 <212> RNA <213> Rothia mucilaginosa <400> 12 cguaaggggu uuuucua 17 <210> 13 <211> 10 <212> DNA <213> Rothia mucilaginosa <400> 13 ggtttttcta 10 <210> 14 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(6) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (49)..(51) <223> n is a, c, g, t or u <400> 14 actnnnagat cggaagagca cacgattaga cgtgtgctct tccgatctnn nagu 54 <210> 15 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(7) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (50)..(53) <223> n is a, c, g, t or u <400> 15 actnnnnaga tcggaagagc acacgattag acgtgtgctc ttccgatctn nnnagu 56 <210> 16 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(8) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (51)..(55) <223> n is a, c, g, t or u <400> 16 actnnnnnag atcggaagag cacacgatta gacgtgtgct cttccgatct nnnnnagu 58 <210> 17 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(9) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (52)..(57) <223> n is a, c, g, t or u <400> 17 actnnnnnna gatcggaaga gcacacgatt agacgtgtgc tcttccgatc tnnnnnnagu 60 <210> 18 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(6) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (51)..(53) <223> n is a, c, g, t or u <400> 18 actnnngatc gtcggactgt agaacattag agttctacag tccgacgatc nnnagu 56 <210> 19 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(7) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (52)..(55) <223> n is a, c, g, t or u <400> 19 actnnnngat cgtcggactg tagaacatta gagttctaca gtccgacgat cnnnnagu 58 <210> 20 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(8) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (53)..(57) <223> n is a, c, g, t or u <400> 20 actnnnnnga tcgtcggact gtagaacatt agagttctac agtccgacga tcnnnnnagu 60 <210> 21 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (4)..(9) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (54)..(59) <223> n is a, c, g, t or u <400> 21 actnnnnnng atcgtcggac tgtagaacat tagagttcta cagtccgacg atcnnnnnna 60 gu 62 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or t <400> 22 nnnnnngatc gtcggactgt agaac 25 <210> 23 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or t <400> 23 nnnnnnagat cggaagagca cacgc 25 <210> 24 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 acttgaaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt tcaagu 56 <210> 25 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 acttaggaga tcggaagagc acacgattag acgtgtgctc ttccgatctc ctaagu 56 <210> 26 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 acttgttaga tcggaagagc acacgattag acgtgtgctc ttccgatcta acaagu 56 <210> 27 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 acttaccaga tcggaagagc acacgattag acgtgtgctc ttccgatctg gtaagu 56 <210> 28 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 acttccaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt ggaagu 56 <210> 29 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 acttttgaga tcggaagagc acacgattag acgtgtgctc ttccgatctc aaaagu 56 <210> 30 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 actttgtaga tcggaagagc acacgattag acgtgtgctc ttccgatcta caaagu 56 <210> 31 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 acttcacaga tcggaagagc acacgattag acgtgtgctc ttccgatctg tgaagu 56 <210> 32 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 acttgcgaga tcggaagagc acacgattag acgtgtgctc ttccgatctc gcaagu 56 <210> 33 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 acttctaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt agaagu 56 <210> 34 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 acttattaga tcggaagagc acacgattag acgtgtgctc ttccgatcta ataagu 56 <210> 35 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 acttggcaga tcggaagagc acacgattag acgtgtgctc ttccgatctg ccaagu 56 <210> 36 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 actggaagat cgtcggactg tagaacatta gagttctaca gtccgacgat cttccagu 58 <210> 37 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 actcagagat cgtcggactg tagaacatta gagttctaca gtccgacgat ctctgagu 58 <210> 38 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 actaccagat cgtcggactg tagaacatta gagttctaca gtccgacgat ctggtagu 58 <210> 39 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 acttcaggat cgtcggactg tagaacatta gagttctaca gtccgacgat cctgaagu 58 <210> 40 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 actatgggat cgtcggactg tagaacatta gagttctaca gtccgacgat cccatagu 58 <210> 41 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 actgatggat cgtcggactg tagaacatta gagttctaca gtccgacgat ccatcagu 58 <210> 42 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 actctacgat cgtcggactg tagaacatta gagttctaca gtccgacgat cgtagagu 58 <210> 43 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 acttaccgat cgtcggactg tagaacatta gagttctaca gtccgacgat cggtaagu 58 <210> 44 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 actagtcatc gtcggactgt agaacattag agttctacag tccgacgatc gactagu 57 <210> 45 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 acttggtgat cgtcggactg tagaacatta gagttctaca gtccgacgat caccaagu 58 <210> 46 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 actgtctgat cgtcggactg tagaacatta gagttctaca gtccgacgat cagacagu 58 <210> 47 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 actccttgat cgtcggactg tagaacatta gagttctaca gtccgacgat caaggagu 58 <210> 48 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 actggaaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt tccagu 56 <210> 49 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 actcagaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt ctgagu 56 <210> 50 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 actaccaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt ggtagu 56 <210> 51 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 acttcagaga tcggaagagc acacgattag acgtgtgctc ttccgatctc tgaagu 56 <210> 52 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 actatggaga tcggaagagc acacgattag acgtgtgctc ttccgatctc catagu 56 <210> 53 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 actgatgaga tcggaagagc acacgattag acgtgtgctc ttccgatctc atcagu 56 <210> 54 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 actatggaga tcggaagagc acacgattag acgtgtgctc ttccgatctc catagu 56 <210> 55 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 acttaccaga tcggaagagc acacgattag acgtgtgctc ttccgatctg gtaagu 56 <210> 56 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 actagtcaga tcggaagagc acacgattag acgtgtgctc ttccgatctg actagu 56 <210> 57 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 acttggtaga tcggaagagc acacgattag acgtgtgctc ttccgatcta ccaagu 56 <210> 58 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 actgtctaga tcggaagagc acacgattag acgtgtgctc ttccgatcta gacagu 56 <210> 59 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 actccttaga tcggaagagc acacgattag acgtgtgctc ttccgatcta aggagu 56 <210> 60 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 actggaaaga tcggaagagc acacgattag acgtgtgctc ttccgatctt tccagu 56 <210> 61 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 aatgaacggc gaccaccgag atctacacgt tcagagttct acagtccgac gatc 54 <210> 62 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 caagcagaag acggcatacg agatcgtgat gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 63 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 caagcagaag acggcatacg agatacatcg gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 64 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 caagcagaag acggcatacg agatgcctaa gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 65 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 caagcagaag acggcatacg agattggtca gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 66 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 caagcagaag acggcatacg agatcactgt gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 67 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 caagcagaag acggcatacg agatattggc gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 68 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 caagcagaag acggcatacg agatgatctg gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 69 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 caagcagaag acggcatacg agattcaagt gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 70 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 caagcagaag acggcatacg agatctgatc gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 71 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 caagcagaag acggcatacg agataagcta gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 72 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 caagcagaag acggcatacg agatgtagcc gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 73 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 caagcagaag acggcatacg agattacaag gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 74 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 caagcagaag acggcatacg agatttgact gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 75 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 caagcagaag acggcatacg agatggaact gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 76 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 caagcagaag acggcatacg agattgacat gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 77 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 caagcagaag acggcatacg agatggacgg gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 78 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 caagcagaag acggcatacg agatctctac gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 79 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 caagcagaag acggcatacg agatgcggac gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 80 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 caagcagaag acggcatacg agattttcac gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 81 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 caagcagaag acggcatacg agatggccac gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 82 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 caagcagaag acggcatacg agatcgaaac gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 83 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 caagcagaag acggcatacg agatcgtacg gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 84 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 caagcagaag acggcatacg agatccactc gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 85 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 caagcagaag acggcatacg agatgctacc gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 86 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 agatcggaag agcacacgat 20 <210> 87 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 agacgtgtgc tcttccgatc t 21 <210> 88 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 gatcgtcgga ctgtagaaca t 21 <210> 89 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 agagttctac agtccgacga tc 22

Claims (32)

  1. 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드로서, 3'-말단 뉴클레오티드의 당 성분이 2'-하이드록실 및 3'-포스페이트를 포함하는, 헤어핀 올리고뉴클레오티드.
  2. 제1항에 있어서,
    3'-말단 뉴클레오티드의 당 성분이 펜토스이고, 펜토스가 리보스인, 헤어핀 올리고뉴클레오티드.
  3. 3'-말단 뉴클레오티드를 포함하는 헤어핀 올리고뉴클레오티드로서, 3'-말단 뉴클레오티드의 당 위치가 당의 2',3'-다이알데하이드 산화 생성물을 포함하는, 헤어핀 올리고뉴클레오티드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    5'-말단 리보뉴클레오티드를 추가로 포함하는, 헤어핀 올리고뉴클레오티드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    (a) 바코드 서열;
    (b) 헤어핀의 루프 내부의 친화성 모이어티-태그된(moiety-tagged) 뉴클레오티드; 및
    (c) 프라이머 결합 부위
    를 추가로 포함하는, 헤어핀 올리고뉴클레오티드.
  6. 제5항에 있어서,
    하기 서열을 포함하는, 헤어핀 올리고뉴클레오티드:
    5'-Phos-rACT-X-AGA TCG GAA GAG CAC ACG AT(서열번호 86)-LT-AGA CGT GTG CTC TTC CGA TCT(서열번호 87)-Z-AG rU-3'-Phos
    이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티-태그된 티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다.
  7. 제5항에 있어서,
    하기 서열을 포함하는, 헤어핀 올리고뉴클레오티드:
    5'-Phos-rACT-X-GAT CGT CGG ACT GTA GAA CAT(서열번호 88)-LT-AG AGT TCT ACA GTC CGA CGA TC(서열번호 89)-Z-AG rU-3'-Phos
    이때, X는 적어도 3, 4, 5 또는 6개 뉴클레오티드의 바코드이고, LT는 친화성 모이어티-태그된 티민 뉴클레오티드이고, Z는 바코드 서열의 역 보체인 뉴클레오티드의 서열이다.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    고체 지지체 상에 고정화(immobilization)된, 헤어핀 올리고뉴클레오티드.
  9. RNA-서열 라이브러리를 제조하는데 있어서, 제1항 내지 제8항 중 어느 한 항의 헤어핀 올리고뉴클레오티드의 용도.
  10. RNA-서열 라이브러리를 제조하는 다중화 방법(multiplex method)에서, 제1항 내지 제8항 중 어느 한 항의 헤어핀 올리고뉴클레오티드의 용도.
  11. 바이오마커를 개발하는데 있어서, 제1항 내지 제8항 중 어느 한 항의 헤어핀 올리고뉴클레오티드의 용도.
  12. 제11항에 있어서,
    바이오마커가 액체 생검으로부터 개발되는, 용도.
  13. 제11항 또는 제12항에 있어서,
    바이오마커의 개발이 tRNA 단편화 프로필의 생성을 포함하는, 용도.
  14. 바이러스성 질환 중증도에 대한 바이오마커를 개발하는데 있어서, 제1항 내지 제8항 중 어느 한 항의 헤어핀 올리고뉴클레오티드의 용도.
  15. 암에 대한 바이오마커를 개발하는데 있어서, 제1항 내지 제8항 중 어느 한 항의 헤어핀 올리고뉴클레오티드의 용도.
  16. 리간드 모이어티 및 헤어핀 올리고뉴클레오티드를 포함하는 고체 지지체로서, 상기 올리고뉴클레오티드가 친화성 모이어티 및 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분이 2'-하이드록실 및 3'-포스페이트를 포함하고, 상기 올리고뉴클레오티드가 헤어핀 올리고뉴클레오티드의 친화성 모이어티를 고체 지지체의 리간드 모이어티에 결합시킴으로써 고체 지지체 상에 고정화되는, 고체 지지체.
  17. 제16항에 있어서,
    친화성 모이어티가 비오틴이고, 리간드 모이어티가 스트렙타비딘인, 고체 지지체.
  18. 제16항 또는 제17항에 있어서,
    비드(bead)인, 고체 지지체.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서,
    올리고뉴클레오티드가 다음을 추가로 포함하는, 고체 지지체:
    (a) 리보뉴클레오티드로서 5'-말단 뉴클레오티드;
    (b) 바코드 서열;
    (c) 헤어핀의 루프 내부의 친화성 모이어티로 태그된 뉴클레오티드; 및
    (d) 프라이머 결합 부위.
  20. RNA-서열 라이브러리를 제조하는데 있어서, 제16항 내지 제19항 중 어느 한 항의 고체 지지체의 용도.
  21. RNA-서열 라이브러리를 제조하는 다중화 방법에서, 제16항 내지 제19항 중 어느 한 항의 고체 지지체의 용도.
  22. 하기 단계를 포함하는, RNA-서열 라이브러리의 제조 방법:
    (a) RNA 서열을 헤어핀 올리고뉴클레오티드에 접합(ligation)시켜 구조물을 형성하는 단계로서, 상기 올리고뉴클레오티드가 3'-말단 뉴클레오티드를 포함하고, 이때 3'-말단 뉴클레오티드의 당 성분이 2'-하이드록실 및 3'-포스페이트를 포함하는, 단계;
    (b) RNA 서열을 cDNA 서열로서 역전사시키는 단계; 및
    (c) PCR을 사용하여 cDNA 서열을 증폭시키는 단계.
  23. 제22항에 있어서,
    헤어핀 올리고뉴클레오티드가 다음을 추가로 포함하는, 방법:
    (i) 리보뉴클레오티드로서 5'-말단 뉴클레오티드;
    (ii) 바코드 서열;
    (iii) 헤어핀의 루프 내부의 친화성 모이어티-태그된 뉴클레오티드; 및
    (iv) 프라이머 결합 부위.
  24. 제22항 또는 제23항에 있어서,
    접합 후 3'-포스페이트를 탈포스포릴화하고, 역전사 후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 단계를 추가로 포함하는, 방법.
  25. 제24항에 있어서,
    접합 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화(Watson-Crick face methylation)를 탈메틸화시키는 단계를 추가로 포함하는, 방법.
  26. 제22항 내지 제25항 중 어느 한 항에 있어서,
    역전사 후 RNA 서열을 절단(digesting)하고, 증폭 전에 2차 접합을 수행하여 2차 프라이머 결합 부위를 부가하는 단계를 추가로 포함하는, 방법.
  27. 제22항 또는 제23항에 있어서,
    접합 후에 구조물을 고체 지지체 상에 고정화시키는 단계를 추가로 포함하는, 방법.
  28. 제27항에 있어서,
    고정화 후 3'-포스페이트를 탈포스포릴화하고, 역전사 후 2',3'-디올을 포함하는 3'-말단 뉴클레오티드를 과요오드산염으로 산화시키는 단계를 추가로 포함하는, 방법.
  29. 제28항에 있어서,
    고정화 후 및 탈포스포릴화 전에 RNA 서열의 뉴클레오티드 상에서의 왓슨-크릭 표면 메틸화를 탈메틸화시키는 단계를 추가로 포함하는, 방법.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서,
    역전사 후 RNA 서열을 절단하고, 증폭 전에 2차 접합을 수행하여 2차 프라이머 결합 부위를 부가하는 단계를 추가로 포함하는, 방법.
  31. 제22항 내지 제30항 중 어느 한 항에 있어서,
    RNA 서열이 전체 RNA, 소형 RNA, tRNA, 마이크로 RNA, piRNA 또는 이들의 임의의 조합을 포함하는, 방법.
  32. 제22항 내지 제31항 중 어느 한 항에 있어서,
    다중화 방법을 포함하는, 방법.
KR1020237018519A 2020-11-06 2021-11-05 헤어핀 올리고뉴클레오티드 및 그의 용도 KR20230104207A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063110605P 2020-11-06 2020-11-06
US63/110,605 2020-11-06
PCT/US2021/058258 WO2022099010A2 (en) 2020-11-06 2021-11-05 Hairpin oligonucleotides and uses thereof

Publications (1)

Publication Number Publication Date
KR20230104207A true KR20230104207A (ko) 2023-07-07

Family

ID=81458636

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237018519A KR20230104207A (ko) 2020-11-06 2021-11-05 헤어핀 올리고뉴클레오티드 및 그의 용도

Country Status (10)

Country Link
US (1) US20230416727A1 (ko)
EP (1) EP4240863A2 (ko)
JP (1) JP2023548857A (ko)
KR (1) KR20230104207A (ko)
CN (1) CN116829713A (ko)
AU (1) AU2021376394A1 (ko)
CA (1) CA3197283A1 (ko)
IL (1) IL302555A (ko)
MX (1) MX2023005263A (ko)
WO (1) WO2022099010A2 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6380377B1 (en) * 2000-07-14 2002-04-30 Applied Gene Technologies, Inc. Nucleic acid hairpin probes and uses thereof
US7754475B2 (en) * 2006-01-25 2010-07-13 Agilent Technologies, Inc. Nucleic acid probes and microarrays for analysis of polynucleotides
US7807372B2 (en) * 2007-06-04 2010-10-05 Northwestern University Screening sequence selectivity of oligonucleotide-binding molecules using nanoparticle based colorimetric assay
US20140274729A1 (en) * 2013-03-15 2014-09-18 Nugen Technologies, Inc. Methods, compositions and kits for generation of stranded rna or dna libraries
MA41298A (fr) * 2014-12-30 2017-11-07 X Chem Inc Procédés de marquage de banques codées par de l'adn

Also Published As

Publication number Publication date
WO2022099010A3 (en) 2022-06-23
EP4240863A2 (en) 2023-09-13
WO2022099010A9 (en) 2022-08-18
WO2022099010A2 (en) 2022-05-12
CN116829713A (zh) 2023-09-29
IL302555A (en) 2023-07-01
JP2023548857A (ja) 2023-11-21
AU2021376394A9 (en) 2024-02-08
MX2023005263A (es) 2023-07-18
CA3197283A1 (en) 2022-05-12
AU2021376394A1 (en) 2023-06-15
US20230416727A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
CN113166797B (zh) 基于核酸酶的rna耗尽
US11072819B2 (en) Methods of constructing small RNA libraries and their use for expression profiling of target RNAs
EP2470675B1 (en) Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation
Munafó et al. Optimization of enzymatic reaction conditions for generating representative pools of cDNA from small RNA
JP4651386B2 (ja) 二重鎖プロモーターの一本鎖をコードするプライマーの使用法
JP2010516284A (ja) マイクロrnaの検出のための方法、組成物及びキット
Roberts et al. Identification of methods for use of formalin-fixed, paraffin-embedded tissue samples in RNA expression profiling
WO2014152030A1 (en) Removal of dna fragments in mrna production process
WO2018195217A1 (en) Compositions and methods for library construction and sequence analysis
CN107109698B (zh) Rna stitch测序:用于直接映射细胞中rna:rna相互作用的测定
CN111936635A (zh) 用于单分子测序的单链环状dna模板的产生
CN111801427B (zh) 用于单分子的单链环状dna模板的产生
CN102421914A (zh) 基于流产转录的分子检测
CN115244188A (zh) 用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物
WO2014134320A1 (en) Methods, compositions and systems for the analysis of nucleic acid molecules
AU2018367394A1 (en) Method for making a cDNA library
CN112680796A (zh) 一种靶标基因富集建库方法
WO2019177684A1 (en) Methods of quantifying rna and dna variants through sequencing employing phosphorothioates
KR20230104207A (ko) 헤어핀 올리고뉴클레오티드 및 그의 용도
US20200283813A1 (en) Size selection of rna using poly(a) polymerase
CN114787385A (zh) 用于检测核酸修饰的方法和系统
CN104694630A (zh) 用于多重连接扩增技术的探针制备方法
Lu et al. Identification of full-length circular nucleic acids using long-read sequencing technologies
Watkins Development and Applications of a High-Throughput Small RNA Sequencing Method
Head et al. Practical Guide