JP2022177068A - 変異プロファイリングのためのrnaプローブ及びその使用 - Google Patents
変異プロファイリングのためのrnaプローブ及びその使用 Download PDFInfo
- Publication number
- JP2022177068A JP2022177068A JP2022139711A JP2022139711A JP2022177068A JP 2022177068 A JP2022177068 A JP 2022177068A JP 2022139711 A JP2022139711 A JP 2022139711A JP 2022139711 A JP2022139711 A JP 2022139711A JP 2022177068 A JP2022177068 A JP 2022177068A
- Authority
- JP
- Japan
- Prior art keywords
- rna
- sequence
- library
- barcode
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035772 mutation Effects 0.000 title abstract description 81
- 239000000523 sample Substances 0.000 title description 12
- 108020004518 RNA Probes Proteins 0.000 abstract description 86
- 239000003391 RNA probe Substances 0.000 abstract description 86
- 238000000034 method Methods 0.000 abstract description 44
- 238000006243 chemical reaction Methods 0.000 abstract description 35
- 239000003607 modifier Substances 0.000 abstract description 17
- 238000004458 analytical method Methods 0.000 abstract description 15
- 230000037430 deletion Effects 0.000 abstract description 9
- 238000012217 deletion Methods 0.000 abstract description 9
- 230000037431 insertion Effects 0.000 abstract description 8
- 238000003780 insertion Methods 0.000 abstract description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 182
- VAYGXNSJCAHWJZ-UHFFFAOYSA-N dimethyl sulfate Chemical compound COS(=O)(=O)OC VAYGXNSJCAHWJZ-UHFFFAOYSA-N 0.000 description 34
- 108020004414 DNA Proteins 0.000 description 27
- 239000002773 nucleotide Substances 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 238000003752 polymerase chain reaction Methods 0.000 description 23
- 238000007481 next generation sequencing Methods 0.000 description 18
- 150000007523 nucleic acids Chemical class 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- 108020004635 Complementary DNA Proteins 0.000 description 13
- 239000003795 chemical substances by application Substances 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 239000000243 solution Substances 0.000 description 13
- 238000010804 cDNA synthesis Methods 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 12
- 238000013507 mapping Methods 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 11
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 10
- 102100034343 Integrase Human genes 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000010839 reverse transcription Methods 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 238000007385 chemical modification Methods 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 238000010828 elution Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000000869 mutational effect Effects 0.000 description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000002898 library design Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 4
- 239000013614 RNA sample Substances 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 150000007513 acids Chemical class 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000009257 reactivity Effects 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 230000026279 RNA modification Effects 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 229910052697 platinum Inorganic materials 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- MULNCJWAVSDEKJ-UHFFFAOYSA-N 1-methyl-7-nitroisatoic anhydride Chemical compound [O-][N+](=O)C1=CC=C2C(=O)OC(=O)N(C)C2=C1 MULNCJWAVSDEKJ-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000721047 Danaus plexippus Species 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical group C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- KJMRWDHBVCNLTQ-UHFFFAOYSA-N N-methylisatoic anhydride Chemical compound C1=CC=C2C(=O)OC(=O)N(C)C2=C1 KJMRWDHBVCNLTQ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091012456 T4 RNA ligase 1 Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 238000012172 direct RNA sequencing Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000006011 modification reaction Methods 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- -1 1 -methyl-6-nitroisatoic anhydride Chemical compound 0.000 description 1
- YIAQYVXJOPEWOS-UHFFFAOYSA-N 1h-imidazole;2-methylpyridine-3-carboxylic acid Chemical compound C1=CNC=N1.CC1=NC=CC=C1C(O)=O YIAQYVXJOPEWOS-UHFFFAOYSA-N 0.000 description 1
- SXUXMRMBWZCMEN-UHFFFAOYSA-N 2'-O-methyl uridine Natural products COC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-UHFFFAOYSA-N 0.000 description 1
- SXUXMRMBWZCMEN-ZOQUXTDFSA-N 2'-O-methyluridine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 SXUXMRMBWZCMEN-ZOQUXTDFSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 108091029499 Group II intron Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- VIHYIVKEECZGOU-UHFFFAOYSA-N N-acetylimidazole Chemical compound CC(=O)N1C=CN=C1 VIHYIVKEECZGOU-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 108010078678 Osmolite Proteins 0.000 description 1
- 235000017284 Pometia pinnata Nutrition 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 238000000505 RNA structure prediction Methods 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108091027753 UTRdb Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012650 click reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000012159 eCLIP Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- OWQPEDNXDCVXJO-UHFFFAOYSA-N imidazol-1-yl-(2-methylpyridin-3-yl)methanone Chemical compound CC1=NC=CC=C1C(=O)N1C=NC=C1 OWQPEDNXDCVXJO-UHFFFAOYSA-N 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008863 intramolecular interaction Effects 0.000 description 1
- VYFOAVADNIHPTR-UHFFFAOYSA-N isatoic anhydride Chemical class NC1=CC=CC=C1CO VYFOAVADNIHPTR-UHFFFAOYSA-N 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 239000012022 methylating agents Substances 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 231100000310 mutation rate increase Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- ALLGTQOHAQKUOH-UHFFFAOYSA-N sulfo-cy3 dbco Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCNC(=O)CCCCCN(C=1C(C\2(C)C)=CC(=CC=1)S([O-])(=O)=O)C/2=C/C=C/C1=[N+](CCCS(O)(=O)=O)C2=CC=C(S(O)(=O)=O)C=C2C1(C)C ALLGTQOHAQKUOH-UHFFFAOYSA-N 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
【課題】RNAライブラリを用いて変異プロファイリングを行う場合に、導入された塩基の変異、挿入及び欠失等の検出精度を改善する。【解決手段】(a)解析対象RNAにバーコード配列を付加した1又は複数のRNAプローブを調製する工程、(b)RNAプローブとRNA修飾剤とを接触させる工程、及び(c)工程(b)で得られたRNAプローブの配列中で修飾を受けた塩基の位置と頻度を検出する工程、を含み、バーコード配列はRNA修飾剤との反応が抑制される構造を有する、RNAの高次構造を解析するための方法。【選択図】図3
Description
本発明は、変異プロファイリングのためのRNAプローブに関し、より詳細には、解析対象RNAに構造化バーコード配列を付加したRNAプローブ及びそれを用いてRNAの高次構造を解析する方法に関する。
RNAはタンパク質合成の鋳型として機能する生体分子であるが、一方で、RNA自身が密に折りたたまれた高次構造を形成し、遺伝子発現、転写産物の細胞内局在及びスプライシング機構などを制御している。これらの機能性RNAの多くは、一次配列としての塩基が構造形成にて立体的に特定の配置をとることで規定されている。このRNA高次構造は、ステム(STEM)、ステムループ(STEM-LOOP)、キッシングループ(KISSING-LOOP)、マルチジャンクション(MULTI-JUNCTION)、キンクターン(KINK-TURN)、シュードノット(PSEUDOKNOT)、4重鎖(QUADRUPLEX)などの多様な構造モチーフの組み合わせから形成される。これらの構造モチーフの種類と組み合わせの数は膨大である上に、複数の平衡状態をとり得るため予測が困難である。これに対し、特定の塩基に対する化学的な修飾反応と、次世代シーケンシングによって得られた配列データを組み合わせてRNA高次構造を決定する技術が開発されている。
例えば、選択的に核酸の糖の2位の炭素に修飾を加えるSHAPE-MaP法(特許文献1参照)や、硫酸ジメチル(DMS)を用いるDMS-MaPseq法(非特許文献1参照)などの変異プロファイリング(Mutational Profiling:MaP)が、RNAの二次構造を推定するために使用されている。化学修飾の分布はRNAの二次構造と相関しており、相補DNAの塩基配列を決定する際に、位置特異的な逆転写終結、置換、挿入又は欠失による変異として記録される。
変異プロファイリングは次世代シーケンシングとの統合によって、より広範な種類のRNAを同時解析可能である。例えばDMS-MaPseq法やSHAPE-MaP法においては、変異が導入されたRNA由来のDNA断片をコンピュータ上にてリファレンスゲノムに対してマッピングする。この操作によって複数種類が混合された条件において配列が仕分けされ、複数領域や異なる分子のRNAに対して構造特異的な変異を同時カウントできる。またPORE-cupine法などにおいてはナノポアシーケンサーによって修飾種が与える直接的な電位の変化の検出により、同一分子内の変異を複数種類カウントできる(例えば、非特許文献2参照)。しかしながら、これらは配列の仕分けにリファレンスゲノムに対するマッピング操作を使用しているため、類似する配列が存在している場合にどのゲノム位置由来かどうかわからなくなる欠点が存在する。例えば、遺伝子ファミリー、アリル特異的なRNAなどがあげられる。さらに、RNA修飾試薬による変異導入は類似する配列の多様性を増加させるため、この効果を増長する。
Megan Zubradt et al.DMS-Mapseq for genome-wide or targeted RNA structure probing in vivo.Nat Methods. 14,75-82(2017)
Aw,J.G.A.,Lim,S.W.,Wang,J.X.et al.Determination of isoform-specific RNA structure with nanopore long reads.Nat Biotechnol(2020).https://doi.org/10.1038/s41587-020-0712-z
多種類のRNAを含むRNAライブラリを用いて上述した化学修飾による変異プロファイリングを行う場合、1つ又は数個の塩基のみが異なる配列からなるRNAについては、化学修飾により生じた変異と、ライブラリ中に含まれ得る天然の多様な配列とを相補DNAの整列により識別することが難しいという問題があった。
本発明は、RNAライブラリを用いて変異プロファイリングを行う場合に、解析対象のRNA高次構造に影響を与えることなく、導入された塩基の変異、挿入及び欠失等の検出精度を改善することを課題とする。
本発明は、かかる課題を解決するためになされたものであって、変異プロファイリングを行う際に、RNAライブラリに含まれるそれぞれのRNAに、異なる固有の配列であって化学修飾剤との反応が抑制されるような構造を有するバーコード配列を付加するようにした。
すなわち、本発明の第一の視点において、RNAの高次構造を解析するための方法は、(a)解析対象RNAにバーコード配列を付加した1又は複数のRNAプローブを調製する工程、(b)RNAプローブとRNA修飾剤とを接触させる工程、及び(c)工程(b)で得られたRNAプローブの配列中で修飾を受けた塩基の位置と頻度を検出する工程、を含む。このバーコード配列はRNA修飾剤との反応が抑制される構造を有することと解析対象RNAと高次構造を形成しないことを特徴とする。上記検出工程(c)は、以下の工程を含むことが好ましい。
(c1)工程(b)で得られたRNAプローブの混合物を鋳型として逆転写酵素により相補DNAを合成する工程、(c2)相補DNAの塩基配列を決定し、バーコード配列を含む塩基配列を整列させる工程、及び(c3)整列させた塩基配列に生じた変異の位置と頻度を検出する工程。
(c1)工程(b)で得られたRNAプローブの混合物を鋳型として逆転写酵素により相補DNAを合成する工程、(c2)相補DNAの塩基配列を決定し、バーコード配列を含む塩基配列を整列させる工程、及び(c3)整列させた塩基配列に生じた変異の位置と頻度を検出する工程。
本発明の他の視点では、複数の塩基対を含む構造を形成するバーコード配列が付加された解析対象RNAを含むRNAプローブ及び、このRNAプローブの複数を含むRNAプローブライブラリが提供される。さらなる実施形態では、このRNAプローブライブラリの2以上の複製物からなるRNAプローブライブラリ群が提供される。複製されたすべてのRNAプローブは、さらに第2のバーコード配列を含み、この第2のバーコード配列は、1つのライブラリ内ではすべて同一配列であるが他のライブラリとの間では識別可能である。
本発明によれば、RNAライブラリを用いて変異プロファイリングを行う場合に、解析対象のRNA高次構造に影響を与えることなく、導入された塩基の変異、挿入及び欠失等の検出精度を改善することができる。
次に、本発明の各実施形態について、図面を参照して説明する。なお、以下に説明する各実施形態は、特許請求の範囲に係る発明を限定するものではなく、また、各実施形態の中で説明されている諸要素及びその組み合わせの全てが本発明の解決手段に必須であるとは限らない。
(定義)
本明細書において、「解析対象RNA」又は「目的RNA」とは、互換的な意味を有し、生体内で低分子化合物やタンパク質と相互作用する可能性がある配列を有するRNA分子をいう。この解析対象RNAは、生体から抽出して得られた生物学的試料をそのまま用いてもよく、あるいは人工的に合成したRNAであってもよい。人工的に合成する場合は、RNAの配列情報に基づいて抽出した、RNAの機能構造単位であるモチーフ領域を含むことが好ましい。「モチーフ領域」とは、RNAが対象となる物質と相互作用するための機能構造単位を意味する。このRNAモチーフの構成要素であるステム-ループやシュードノットなどを構造モチーフと称し、この構造モチーフの組み合わせによってRNAの高次構造が形成される。本発明のRNAプローブに含まれるモチーフ領域は、単一のステム-ループ構造(ヘアピンループ構造)からなる場合もあれば、複数のステム-ループ構造(多分岐ループ構造)を含む場合もある。また1つ以上のキンクターン(kink-turn)、シュードノット(pseudoknot)、グアニン4重鎖(G-quadruplex)などを含む場合もある。また構造モチーフはワトソンクリック塩基対だけでなくフーグスティーン塩基対によっても構成され得る。
本明細書において、「解析対象RNA」又は「目的RNA」とは、互換的な意味を有し、生体内で低分子化合物やタンパク質と相互作用する可能性がある配列を有するRNA分子をいう。この解析対象RNAは、生体から抽出して得られた生物学的試料をそのまま用いてもよく、あるいは人工的に合成したRNAであってもよい。人工的に合成する場合は、RNAの配列情報に基づいて抽出した、RNAの機能構造単位であるモチーフ領域を含むことが好ましい。「モチーフ領域」とは、RNAが対象となる物質と相互作用するための機能構造単位を意味する。このRNAモチーフの構成要素であるステム-ループやシュードノットなどを構造モチーフと称し、この構造モチーフの組み合わせによってRNAの高次構造が形成される。本発明のRNAプローブに含まれるモチーフ領域は、単一のステム-ループ構造(ヘアピンループ構造)からなる場合もあれば、複数のステム-ループ構造(多分岐ループ構造)を含む場合もある。また1つ以上のキンクターン(kink-turn)、シュードノット(pseudoknot)、グアニン4重鎖(G-quadruplex)などを含む場合もある。また構造モチーフはワトソンクリック塩基対だけでなくフーグスティーン塩基対によっても構成され得る。
「RNAプローブ」とは、解析対象RNAを含む核酸分子、好ましくは、RNAからなる核酸分子であって、増幅のためのプライマー結合部位やバーコード配列などが付加された核酸分子をいう。また、「ライブラリ」とは、複数(2つ以上)種類の異なる分子(例えば、複数の異なるDNA分子又は複数の異なるRNA分子など)の集合を指す。本実施形態に係る方法では、必要に応じて、多数のRNAプローブを用いて解析を行うことができるため、用語、「ライブラリ」は、好ましくは10個以上、より好ましくは102個以上、103個以上、又は104個以上、さらに好ましくは106個以上の異なるRNA分子を含み得る。
「RNAの高次構造」とは、溶液中において、主に、分子内での塩基対の形成に基づく部分的な二本鎖形成(ステム構造ともいう)と、該塩基対形成のない部分の1本鎖構造、又は環状1本鎖構造(ループ構造という)と、またはそれらの組み合わせをいうものとする。このような構造は、溶液の状態(温度、塩濃度等)により特定の平衡状態にありRNA分子の運動とともに変動するものである。「ステム構造」とは、RNAに含まれる任意の核酸配列と当該核酸配列に対して相補的な配列とにより形成される二重らせん構造を意味する。本明細書において、「相補的」とは、2つの核酸配列がハイブリダイズする能力を意味し、2つの配列がハイブリダイズすればよいことから、ステム構造を構成する2つの核酸配列は、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%、または100%の配列相補性を有していればよい。
「バーコード配列」とは、核酸分子に対して1種類毎に又は1分子毎に付加される固有の配列を有するタグである。「インデックス」又は「固有分子識別子(Unique Molecular Identifier:UMI)」などとも呼ばれる。UMIは、典型的には溶液中の各分子にランダム配列を割り当てることで増幅バイアスの軽減による定量性の向上を目的としている。複数の解析対象RNAに対して、1種類のRNA毎に異なる固有の配列を有するバーコード配列が付加されるようにすると、複数のRNAを同時に修飾処理及び増幅処理した後に、付加されたバーコードの種類に基づいて、夫々のRNAを識別して解析することができることとなる。また、反応溶液、反応条件毎に異なるバーコードに基づいて各実験系列を識別することで、同一の次世代シーケンスデータから複数の実験データを分別して得られ、効率的なデータ解析が可能となる。
バーコード配列は、例えば、ランダムな塩基を有する核酸群として提供しうる。バーコード配列は、その配列の種類の数が重要なため、配列がランダム(配列が多様であり、かつ、配列の内容を認識する必要がないように)に合成されたものであったとしてもよい。あるいは、バーコード配列は、十分な多様性が得られるように設計された配列既知の核酸群であってもよい。
(RNAの高次構造を解析する方法)
図1は、本発明の一実施形態における、RNAの高次構造の解析方法を示すフロー図である。この方法は、解析対象RNAにバーコード配列を付加した1又は複数のRNAプローブを調製する工程(S10)と、RNAプローブとRNA修飾剤とを接触させる工程(S20)と、工程S20で得られたRNAプローブの配列中で修飾を受けた塩基の位置と頻度を検出する工程(S30)と、さらに必要に応じて、検出結果を表示する工程(S40)と、を含む。ここで、バーコード配列は、RNA修飾剤との反応が抑制される構造を有することを特徴とする。
図1は、本発明の一実施形態における、RNAの高次構造の解析方法を示すフロー図である。この方法は、解析対象RNAにバーコード配列を付加した1又は複数のRNAプローブを調製する工程(S10)と、RNAプローブとRNA修飾剤とを接触させる工程(S20)と、工程S20で得られたRNAプローブの配列中で修飾を受けた塩基の位置と頻度を検出する工程(S30)と、さらに必要に応じて、検出結果を表示する工程(S40)と、を含む。ここで、バーコード配列は、RNA修飾剤との反応が抑制される構造を有することを特徴とする。
また、別の実施形態におけるRNAの高次構造を解析する方法は、図2に示すように、上記検出工程(S30)が、工程S20で得られたRNAプローブの混合物を鋳型として逆転写酵素により相補DNAを合成する工程(S31)と、相補DNAの塩基配列を決定し、バーコード配列を含む塩基配列を整列させる工程(S32)と、整列させた塩基配列に生じた変異の位置と頻度を検出する工程(S33)と、からなることが好ましい。以下、これらの各工程について詳細に説明する。
<RNAプローブの調製工程(S10)>
解析対象RNAは、生体内での機能を発揮するためのモチーフ領域を含むことが好ましい。このモチーフ領域は、単一のステム-ループ構造(ヘアピンループ構造)からなる場合もあれば、複数のステム-ループ構造(多分岐ループ構造)を含む場合もある。本実施形態では、ステム構造を基準としてモチーフ領域を抽出することが好ましい(例えば、WO2018/003809明細書参照)。これにより、モチーフ領域を分断することなく、RNA中に実在する機能構造単位を反映したRNAプローブを調製することができる。モチーフ領域は、その機能が維持されていることを限度として、任意の配列長であってよく、例えば1000塩基以下、900塩基以下、800塩基以下、700塩基以下、600塩基以下、500塩基以下、400塩基以下、300塩基以下、200塩基以下、150塩基以下、100塩基以下、50塩基以下であってよい。
解析対象RNAは、生体内での機能を発揮するためのモチーフ領域を含むことが好ましい。このモチーフ領域は、単一のステム-ループ構造(ヘアピンループ構造)からなる場合もあれば、複数のステム-ループ構造(多分岐ループ構造)を含む場合もある。本実施形態では、ステム構造を基準としてモチーフ領域を抽出することが好ましい(例えば、WO2018/003809明細書参照)。これにより、モチーフ領域を分断することなく、RNA中に実在する機能構造単位を反映したRNAプローブを調製することができる。モチーフ領域は、その機能が維持されていることを限度として、任意の配列長であってよく、例えば1000塩基以下、900塩基以下、800塩基以下、700塩基以下、600塩基以下、500塩基以下、400塩基以下、300塩基以下、200塩基以下、150塩基以下、100塩基以下、50塩基以下であってよい。
上記解析対象RNAを含むRNAプローブの調製方法において、RNA中のステム構造は、例えばCentroidFold(Hamada,M.et al.,Bioinformatics,Vol.25,pp465-473,2009)やIPknot(Sato,K.et al.,Methods Biochem. Anal.,Vol.27,pp.i85-i93,2011)などのRNA二次構造予測ソフトを用いて認識することができる。また、RNAの配列情報には任意のものを使用することができ、例えば、UTRdb(Grillo,G.et al.,Nucl. Acids Res.,Vol.38,D75-D80,2010)、IRESite(Mokrejs,M.et al.,Nucl. Acids Res.,Vol.38,D131-D136,2010)、GenBank(Benson,D.et al.,Nucl. Acids Res.,Vol.41,D36-D42,2013)、RNAcentral(RNAcentral Consortium,Nucl. Acids Res.,Vol.43,D123-D129,2015)などのRNA配列データベースからダウンロードしたものを使用することができる。また、RNAの配列情報だけでなく構造情報も含むデータベースからRNAの配列情報を入手してもよく、例えば、Rfam(Nawrocki,E.P.et al.,Nucl. Acids Res.,Vol.43,D130-D137,2015)、Structure Surfer(Berkowitz,N.D.et al.,BMC Bioinformatics,Vol.17,p.215,2016)などからダウンロードしたものを使用することができる。また種々の手法によって決定されたRNAの三次元構造データを使用してもよく、例えば、Protein Data bank(https://www.rcsb.org/)などからダウンロードしたものを使用することができる。また自身で設計をしたRNA高次構造でもよく、例えば、RNAinverseなどのソフトウェアで設計されたデータを使用しても良い。
本工程では、解析対象RNAに付加されるバーコード配列が構造化されていることを特徴とする。「構造化」とは、RNAが溶液中で折りたたまれて二次、三次構造を形成するか、あるいは一次構造(配列)の状態に留めることをいい、それによりRNA修飾剤との反応が抑制される。例えば、RNA修飾剤が、RNAプローブ中の一本鎖領域のような非拘束ヌクレオチドを選択的に修飾する化合物であるとき、バーコード配列は、このような修飾を受けにくい複数の塩基対を含む構造を形成するように設計することができる。複数の塩基対とは、連続又は離間する2以上の塩基がバーコード配列内の他の塩基との間で水素結合を形成することを意味し、ワトソン-クリック型塩基対又はフーグスティーン型塩基対等のいずれでもよい。ワトソン-クリック型塩基対と同程度の熱力学的安定性を有するG-Uゆらぎ塩基対でもよい。生体内と同様の環境又は条件において、2以上の塩基対があれば少なくとも一時的には安定な構造を形成しうるが、より安定な構造を形成するためには3個以上の塩基対が好ましく、4個以上の塩基対がさらに好ましく、5個以上の塩基対がさらになお好ましい。塩基対の個数の上限は特に制限されないが、10個程度の塩基対があれば十分に安定な構造が得られるため、コスト的な観点から30個以下の塩基対が好ましく、20個以下の塩基対がより好ましく、15個以下の塩基対がさらに好ましい。一方、RNA修飾剤が、RNAプローブ中で二本鎖を形成するような拘束ヌクレオチドを選択的に修飾するときは、バーコード配列は、塩基対を形成しない配列、すなわち、一本鎖の構造を維持するように設計されていることが好ましい。さらに、この構造を有するバーコード配列は解析対象のRNAに影響を与えないように計算機的に配列を最適化することが好ましい。これはバーコード配列の付与自体が解析対象のRNAと分子内相互作用により元来のRNA構造とはかけ離れた構造を形成するか、あるいは構造の安定性に影響がある問題を回避するためである。計算機的な配列最適化は、ViennaRNAパッケージ等の公知のプログラムを用いて行うことができる。
<RNAプローブの修飾工程(S20)>
本工程(S20)におけるRNAの修飾反応は、前工程(S10)で調製したRNAプローブと、所望のRNA修飾剤とを接触させることでRNAプローブの修飾反応を起こさせるものである。1つの実施形態として、このRNA修飾剤は、RNAプローブ中の一本鎖領域のような非拘束ヌクレオチドを選択的に修飾する化合物が挙げられる。このような化合物は、典型的には、SHAPE試薬として知られる、リボース-2’-ヒドロキシ基と反応するイサト酸無水物誘導体、例えば、1-メチル-7-ニトロイサト酸無水物(1M7)、1-メチル-6-ニトロイサト酸無水物(1M6)、NMIA(N-メチルイサト酸無水物)及び2-メチルニコチン酸イミダゾリド(NAI)を含むがこれらに限定されない。SHAPE試薬の他に、硫酸ジメチル(DMS)は、アデノシンのN1位置、シトシンのN3位置、及びウリジンのN3位置、グアノシンのN1位置で付加物を形成するため、RNA修飾剤として用いることができる。一例として、NAIは一般的に4つ全てのヌクレオチドと反応し、DMSは、アデニンとシトシンのみと反応する。一方で、DMSは塩基性に偏ったpH(例えばpH8.0)条件下にてグアニンとウリジンにも反応できる。
本工程(S20)におけるRNAの修飾反応は、前工程(S10)で調製したRNAプローブと、所望のRNA修飾剤とを接触させることでRNAプローブの修飾反応を起こさせるものである。1つの実施形態として、このRNA修飾剤は、RNAプローブ中の一本鎖領域のような非拘束ヌクレオチドを選択的に修飾する化合物が挙げられる。このような化合物は、典型的には、SHAPE試薬として知られる、リボース-2’-ヒドロキシ基と反応するイサト酸無水物誘導体、例えば、1-メチル-7-ニトロイサト酸無水物(1M7)、1-メチル-6-ニトロイサト酸無水物(1M6)、NMIA(N-メチルイサト酸無水物)及び2-メチルニコチン酸イミダゾリド(NAI)を含むがこれらに限定されない。SHAPE試薬の他に、硫酸ジメチル(DMS)は、アデノシンのN1位置、シトシンのN3位置、及びウリジンのN3位置、グアノシンのN1位置で付加物を形成するため、RNA修飾剤として用いることができる。一例として、NAIは一般的に4つ全てのヌクレオチドと反応し、DMSは、アデニンとシトシンのみと反応する。一方で、DMSは塩基性に偏ったpH(例えばpH8.0)条件下にてグアニンとウリジンにも反応できる。
他の実施形態として、RNA修飾剤は、RNAプローブ中で二本鎖を形成するような拘束ヌクレオチドを選択的に修飾するものであってもよい。このRNA修飾剤は、例えば、二本鎖RNAを分解する酵素であるRNASEV1や、RNASEIIIファミリーのDICER、または二本鎖結合タンパク質とRNA修飾タンパク質との融合タンパク質などが含まれるがこれらに限定されない。
このようなRNA修飾剤を含む溶媒溶液を、RNAプローブを含む溶液に添加して、RNAプローブとRNA修飾剤とを接触させる。この溶液は、異なる濃度及び量のタンパク質、細胞、ウイルス、脂質、単糖及び多糖類、アミノ酸、ヌクレオチド、DNA、並びに種々の塩及び代謝産物を含有する生体溶液であってもよい。また異なる濃度及び量の低分子、中分子薬剤を含有する溶液であっても良い。また種々の界面活性剤、ポリマー、オズモライトを含有しても良い。RNA修飾剤の濃度は、RNAに所望の修飾の程度を達成するように調整することができる。
さらに、解析対象RNAは、タンパク質又は他の低分子及び高分子の生物学的リガンドの存在下で修飾することができる。RNA修飾剤の反応性がpHに依存する場合には、そのpHを、例えば、7.5~9.0の範囲、但しこれに限定されない、に維持してもよい。最大の反応性と最小の反応性ヌクレオチドを区別する機能範囲は、典型的には20~50倍に及ぶ。RNAを所望のpH(例えば、約pH8)で所望の立体配座に折り畳む任意の手順で置換することができる。このRNAを、多量体形態を排除するために、まず加熱し、続いて急いで低イオン強度緩衝液中で冷却することができる。続いて、フォールディング溶液を加えて、RNAが正確な立体配座を達成し、構造に感度が良いRNA修飾剤で探るための準備とすることができる。いくつかの実施態様において、RNAは、修飾前には自然には折り畳まれていない。RNAが熱及び/又は低塩条件により変性されている間に、修飾が行われ得る。
<修飾塩基の検出工程(S30)>
本工程は、上記修飾工程(S20)で得られたRNAプローブの配列中で、修飾を受けた塩基の位置と頻度を検出する工程である。RNA配列中における修飾塩基を読み取る方法であれば特に限定されず、例えば、修飾塩基に特異的な抗体を用いるプルダウン法や直接RNAの電位を読み取るナノポアシーケンス法であってもよい。この直接RNAナノポアシーケンス法は、単一分子レベルでRNAの修飾部位を検出するための技術である。現在、Oxford Nanopore Technologiesが開発及び市販している直接RNAシーケンシングプラットフォームでは、膜に懸濁された生物学的ナノポアを介してモータータンパク質と結合したRNAが移動する。RNAが電圧バイアス下で細孔を通過するとき、細孔狭窄部を通過する短い配列(5ヌクレオチド)の化学的同一性(つまりシーケンス)に依存して、ピコアンペアのイオン電流の変化が観察される(Garalde,D.R.,et al.(2018)Highly parallel direct RNA sequencing on an array of nanopores. Nat. Methods,及びWorkman,R.E.,et al.(2019)Nanopore native RNA sequencing of a human poly(A) transcriptome.Nat. Methods,16,1297-1305.参照)。SHAPE試薬の1つである、1-アセチルイミダゾール(Aclm)により修飾されたヌクレオチドを、この方法で検出しうることが報告されている(William Stephenson et al., Direct detection of RNA modifications and structure using single molecule nanopore sequencing.bioRxiv doi:https://doi.org/10.1101/2020.05.31.126763,Posted June 01, 2020)。
本工程は、上記修飾工程(S20)で得られたRNAプローブの配列中で、修飾を受けた塩基の位置と頻度を検出する工程である。RNA配列中における修飾塩基を読み取る方法であれば特に限定されず、例えば、修飾塩基に特異的な抗体を用いるプルダウン法や直接RNAの電位を読み取るナノポアシーケンス法であってもよい。この直接RNAナノポアシーケンス法は、単一分子レベルでRNAの修飾部位を検出するための技術である。現在、Oxford Nanopore Technologiesが開発及び市販している直接RNAシーケンシングプラットフォームでは、膜に懸濁された生物学的ナノポアを介してモータータンパク質と結合したRNAが移動する。RNAが電圧バイアス下で細孔を通過するとき、細孔狭窄部を通過する短い配列(5ヌクレオチド)の化学的同一性(つまりシーケンス)に依存して、ピコアンペアのイオン電流の変化が観察される(Garalde,D.R.,et al.(2018)Highly parallel direct RNA sequencing on an array of nanopores. Nat. Methods,及びWorkman,R.E.,et al.(2019)Nanopore native RNA sequencing of a human poly(A) transcriptome.Nat. Methods,16,1297-1305.参照)。SHAPE試薬の1つである、1-アセチルイミダゾール(Aclm)により修飾されたヌクレオチドを、この方法で検出しうることが報告されている(William Stephenson et al., Direct detection of RNA modifications and structure using single molecule nanopore sequencing.bioRxiv doi:https://doi.org/10.1101/2020.05.31.126763,Posted June 01, 2020)。
好ましい実施形態において、修飾塩基の検出工程(S30)は、図2に示すように、RNAから相補DNA(cDNA)への変換を含む変異プロファイリングである。この実施形態では、最初に、工程S20で得られたRNAプローブの混合物を鋳型として、逆転写酵素又は他のポリメラーゼによりcDNAを合成する(S31)。逆転写酵素とは、RNAからcDNAを合成する酵素であり、例えば、マウス又は鳥類の逆転写酵素のような熱安定性酵素が挙げられるが、これらに限定されない。あるいは、原核生物や真菌などのレトロトランスポゾン内に存在する逆転写酵素TGIRT(Thermostable Group II intron reverse transcriptase)であってもよい。InGex社のTGIRT-IIIは,従来のレトロウィルス由来の逆転写酵素に比べて,熱安定性や処理性,正確性が優れている。またDMSによる修飾箇所において逆転写時に変異を誘発する性質が知られている(DMS-MaPseq法)。
これらの酵素は、付加物を含むヌクレオチドを読み飛ばし、化学修飾の部位に不正確な(非相補的な)ヌクレオチドを組み込ませることにより、RNA中の化学的修飾を検出する方法が含まれる。本明細書で使用される、ヌクレオチドの取り込みに関する、「不正確な」とは、元の配列中に存在するヌクレオチドに、非相補的なヌクレオチド(ワトソン-クリックの規則に反するヌクレオチド)を組み込むことをいう。これは配列内の少数の欠失を含む。
続いて、cDNAの塩基配列を決定し、バーコード配列を含む塩基配列を整列させる(S32)。cDNAは、多種類のRNAプローブの混合物に由来するライブラリを用いることにより、超並列配列決定法(MPS)を使用して、RNAなどの核酸中の化学修飾を効率よく検出することができる。一例として、イルミナ社の次世代シーケンサーでは、数千万~数億のDNA断片の両端部のアダプターを介して5’末端側をフローセル上に固定させる。次に、フローセル上に予め固定された5’末端側のアダプターと、DNA断片の3’末端側のアダプター配列とをアニールさせて、ブリッジ状のDNA断片を形成させる。この状態でDNAポリメラーゼによる核酸増幅反応を行うことで、多数の1本鎖DNA断片を局所的に増幅して固定することができる。そして、次世代シーケンサーでは、得られた1本鎖DNAを鋳型として、シーケンシングを行うことで、2020年現在、1回の解析において約3Tbという膨大な配列情報を得ることができる。核酸を高速かつ並列に判読するこれらの技術は「次世代シーケンシング(Next-Generation Sequencing (NGS)」、「超並列シーケンシング」、「超高処理量遺伝子シーケンシング(Ultra-High-Throughput Sequencing)」又は「大規模並列シーケンシング」などとも呼ばれる。
1つの実施形態では、次世代シーケンサーによって得られた配列データ(リード)を、バーコード配列を含んだ形で整列させる。個々のバーコード配列ごとに配列データを整列させることにより、多種類のRNAプローブを含むサンプルを同時にシーケンスすることができるからである。また、解析対象RNAが類似する配列、例えば、遺伝子ファミリー、一塩基多型などを含む場合であっても、それらを識別して解析することが可能となる。
あるいは、すべてのcDNAを一緒に整列させた後、信頼度の低い整列物に関して、バーコードの変異情報を加味することでその整列を評価しても良い。いずれの方法においても、バーコード配列とともに解析対象RNA配列を整列させることで配列情報の正確性を向上することができる。
このように整列させた塩基配列に基づいて、生じた変異の位置と頻度を検出する(S33)。所定のヌクレオチドにおける変異率は、単純にその場所において、変異数(ミスマッチ、欠失及び挿入)を読み取り回数で割ったものである。各ヌクレオチドについて生の反応性を算出したデータは、種々の基準を用いて正規化することができる。シーケンスの読み取り深度や標準誤差を考慮することでデータの品質管理が可能である。
<検出結果の表示(S40)>
上記工程で検出された変異の位置と頻度は、変異ヒストグラム、シーケンスの深さ及び反応性プロファイルなどの当業者に既知の方法で図示することができる。変異位置と頻度の解析はBWA、STARなどの整列用ソフトウェア(アラインメントソフトウェア)を使用することができる。それらのデータは変異カウントとして数値化、ベクトル化され種々の演算を実施できる。また、統計的優位な反応性を示した変異に対してアノテーションをつけることができる。
上記工程で検出された変異の位置と頻度は、変異ヒストグラム、シーケンスの深さ及び反応性プロファイルなどの当業者に既知の方法で図示することができる。変異位置と頻度の解析はBWA、STARなどの整列用ソフトウェア(アラインメントソフトウェア)を使用することができる。それらのデータは変異カウントとして数値化、ベクトル化され種々の演算を実施できる。また、統計的優位な反応性を示した変異に対してアノテーションをつけることができる。
本工程におけるこれらの解析は、コンピュータ読取り可能媒体に保存されたコンピュータプログラム製品を用いて実施することができる。本発明を実施するために適当な例示的コンピュータ読取り可能媒体には、チップメモリデバイス、ディスク記憶装置、プログラマブルロジックデバイス、及び特定用途向け集積回路が含まれる。更に、本工程を実施するコンピュータプログラム製品は、単一のデバイス又はコンピューティングプラットフォーム上に設置することができ、又は複数のデバイス又はコンピューティングプラットフォーム間に分散させることができる。従って、本実施形態の方法により取得したRNAの高次構造をコンピュータと接続されたディスプレイ上に表示することができる。
(作用効果)
本実施形態で開示した構造化バーコードは、いくつかの有利な作用効果を有する。1つは、RNA修飾剤との反応において、バーコード配列が修飾される可能性が低く、バーコードとして正しく識別することが可能となる。またバーコード部分が解析対象RNA又は他のRNA分子と相互作用することが抑制される。これにより、構造化バーコード配列は、ライブラリ内の類似配列と識別できるだけでなく、同じライブラリの異なるバッチを区別することも可能である。例えば、図4は、37種類の第1のバーコード配列と、4種類の第2のバーコード配列を用いてライブラリ群を作製する方法を表す。最初に作製された37種類のDNAからなるライブラリを4種類の異なるプライマーを用いて増幅することで、1つのライブラリ内では同じ配列であるが、異なるバッチのライブラリでは異なる配列を有する第2のバーコード配列が付加される。これらを用いてインビトロ転写反応を行うことで、2種類のバーコード配列が付加されたRNAライブラリ群を作製することができる。
本実施形態で開示した構造化バーコードは、いくつかの有利な作用効果を有する。1つは、RNA修飾剤との反応において、バーコード配列が修飾される可能性が低く、バーコードとして正しく識別することが可能となる。またバーコード部分が解析対象RNA又は他のRNA分子と相互作用することが抑制される。これにより、構造化バーコード配列は、ライブラリ内の類似配列と識別できるだけでなく、同じライブラリの異なるバッチを区別することも可能である。例えば、図4は、37種類の第1のバーコード配列と、4種類の第2のバーコード配列を用いてライブラリ群を作製する方法を表す。最初に作製された37種類のDNAからなるライブラリを4種類の異なるプライマーを用いて増幅することで、1つのライブラリ内では同じ配列であるが、異なるバッチのライブラリでは異なる配列を有する第2のバーコード配列が付加される。これらを用いてインビトロ転写反応を行うことで、2種類のバーコード配列が付加されたRNAライブラリ群を作製することができる。
(RNAプローブ及びRNAプローブライブラリ)
本発明の他の実施形態としては、構造化されたバーコード配列を含むRNAプローブ及び複数の当該RNAプローブを含むRNAプローブライブラリが提供される。1つの実施形態において、構造化バーコード配列とは、複数の塩基対を含む構造を形成するバーコード配列である。本実施形態のバーコード配列としては、例えば、相補的な二本鎖構造、三重鎖構造又は四重鎖構造を含み、具体的には、ステム-ループ構造、シュードノット構造などを挙げることができる。ステム部分は相補的な二本鎖を形成するが、配列の多様性を増やすために、ワトソン-クリック型塩基対と同程度の熱力学的安定性を有するG-U、I-U、I-A及びI-Cのゆらぎ塩基対(wobble base pair)を含んでいてもよい。Iは、イノシンを表し、その塩基であるヒポキサンチンはウラシル、アデニン、シトシンと塩基対形成が可能である。ウラシルはグアニンとアデニンという2種類の塩基と対合することが可能である。
本発明の他の実施形態としては、構造化されたバーコード配列を含むRNAプローブ及び複数の当該RNAプローブを含むRNAプローブライブラリが提供される。1つの実施形態において、構造化バーコード配列とは、複数の塩基対を含む構造を形成するバーコード配列である。本実施形態のバーコード配列としては、例えば、相補的な二本鎖構造、三重鎖構造又は四重鎖構造を含み、具体的には、ステム-ループ構造、シュードノット構造などを挙げることができる。ステム部分は相補的な二本鎖を形成するが、配列の多様性を増やすために、ワトソン-クリック型塩基対と同程度の熱力学的安定性を有するG-U、I-U、I-A及びI-Cのゆらぎ塩基対(wobble base pair)を含んでいてもよい。Iは、イノシンを表し、その塩基であるヒポキサンチンはウラシル、アデニン、シトシンと塩基対形成が可能である。ウラシルはグアニンとアデニンという2種類の塩基と対合することが可能である。
他の実施形態では、複数の塩基対を含む構造が、ステム-ループ構造であり、ステム部位に1つ以上のバルジ及び/又は内部ループ構造を有する。これにより構造化バーコードがとり得る高次構造の多様性、種類を向上させることができる。また、構造特異的な変異のネガティブコントロール、ポジティブコントロールとなる塩基を同時に搭載することができる。また1本鎖RNA修飾剤のうち、末端ループには修飾を行うが、バルジや内部ループには修飾をしない分子種に対して構造化バーコードがコントロールとして機能する。
いくつかの実施形態としては、複数の塩基対を含む構造が、PDB(Protein Data Bank)に登録されているRNA構造又はその改変体である。これによりワトソン-クリック型ではないRNA高次構造をバーコード化することができる。例えば、これにより非ワトソン-クリック型塩基対でないRNA高次構造に対する修飾剤に対する構造化バーコードとして有用である。
本実施形態のRNAプローブ中における構造化バーコード配列の位置は特に制限されず任意の位置に配置することができる。例えば、解析対象RNAの5’末端側であっても3’末端側であってもよい。あるいは、相補鎖を形成するバーコード配列の一方の鎖が解析対象RNAの5’末端側に位置し、他方の鎖が3’末端側に位置してこれらが解析対象RNAを挟むように二本鎖を形成してもよい。また、構造化バーコード配列の数も特に限定されず、同一又は異なる配列の構造化バーコードが複数個存在してもよい。
本実施形態のRNAプローブには、解析対象RNAとして少なくとも1つの構造モチーフを含むRNAモチーフが含まれる。このモチーフ領域には、任意のRNA配列情報から抽出したものを用いることができる。または、本発明のRNAプローブに含まれるモチーフ領域には、RNAストラクチュローム研究によりすでに特定された任意のRNA二次構造データから選択されたものを用いてもよい。
さらに、このRNAプローブは、検出のために、蛍光色素(例えば、FITC、PE、Cy3、Cy5など)、放射性同位体、ジゴキシゲニン(DIG)、ビオチンなどにより標識されてよい。標識は、予め標識した核酸をプローブ合成時に取り込ませることによって行うことができ、例えば、5’側に標識された人工核酸を取り込ませることができる。またRNA全長に標識された人工核酸を取り込ませることができる。3’側には例えばT4 RNA ligase1を用いて標識された人工核酸を標識することができる。標識は、クリック反応などによって多段階的に行われてもよい。例えば、pCp-N3をT4 RNA ligase1を用いて3‘末端に付与したRNAに対して、DBCO-biotin、DBCO-Cy3を反応させることでRNAに蛍光色素やビオチンを取り込ませることができる。これら標識の割合は10,20,30,40,50,60,70,80,90,99,100%でも良い。
本実施形態のRNAプローブは、従来公知の任意の遺伝子工学的方法により合成することができる。好ましくは、RNAプローブは、合成の受託業者に委託して合成された鋳型DNAを転写することによって作製することができる。DNAからのRNAへの転写を行うため、RNAプローブの配列を含むDNAは、プロモーター配列を有していても良い。特に限定されないが、好ましいプロモーター配列として、T7プロモーター配列が例示される。T7プロモーター配列を用いた場合、例えば、ライフテクノロジーズ社より提供されるMEGAshortscript(商標)T7 Transcription Kitを用いて所望のRNAプローブ配列を有するDNAよりRNAを転写行うことができる。本発明において、RNAは、アデニン、グアニン、シトシン、ウラシルのみならず、修飾RNAであってもよい。修飾RNAは、例えば、プソイドウリジン、5-メチルシトシン、5-メチルウリジン、2’-O-メチルウリジン、2-チオウリジン、およびN6-メチルアデノシンが例示される。
1つの実施形態において、それぞれ異なる配列の解析対象RNAを含む複数のRNAプローブを含むRNAプローブライブラリを提供する。本実施形態では、多種類のRNAプローブを同時に用意することが好ましく、効率的にRNAプローブの鋳型を含有するオリゴ核酸ライブラリ合成(Oligonucleotide Library Synthesis)技術を用いて行うことが好ましい。これは、スライド上の規定した位置に個々の塩基をプリントするインクジェット技術を用いて、一度に1塩基ずつ合成して、指定の長さの鋳型DNAを伸長させる。次に、構築されたオリゴはスライドから切断され、プール化された後、乾燥し、1本のチューブに入れて保存される。オリゴライブラリは、その後、再溶解、増幅後、インビトロ転写反応によりRNAプローブライブラリを調製することができる。本発明において特に限定されないが、Oligonucleotide Library Synthesisは、アジレントテクノロジー社やツイスト・バイオサイエンス社に委託することによって作製することができる。
さらに他の実施形態では、複数のRNAプローブを含む本実施形態のRNAプローブライブラリを、第2のバーコード配列を含む複数のプライマーを用いて増幅することにより、2以上の複製物からなるRNAプローブライブラリ群を調製することができる。複製されたすべてのRNAプローブは、第1及び第2のバーコード配列を含み、この第2のバーコード配列は、1つのライブラリ内ではすべて同一配列であるが他のライブラリとの間では識別可能である。後述する実施例によれば、複数のRNAプローブライブラリを混合して変異プロファイリングを行った場合でもそれぞれのRNAプローブライブラリを用いて行った場合と同じ結果が得られたことから、各RNAプローブライブラリを用いてそれぞれ異なる変異プロファイリングを行った後、これらを混合して次世代シーケンシングを行った後、第2のバーコード配列を用いてそれぞれの変異プロファイリングを識別することができると考えられる。したがって、第2のバーコード配列を付与することで、反応条件の異なる変異プロファイリングを行った場合でも同一条件で次世代シーケンシング用ライブラリを調製することができ、変異のプロファイリング工程の格段の効率化が可能となる。この第1及び第2のバーコード配列を含むRNAプローブライブラリ群に、さらに異なるバーコード配列を付加することで3種類又はそれ以上のバーコード配列を含むRNAプローブライブラリ群を作製することも可能である。
本実施形態のRNAライブラリは、RNAの化学修飾の分析及び/又はRNA構造分析を行うためのキットとして使用することができる。このようなキットの使用方法として、本発明に係るRNAの高次構造解析方法が含まれる。次に実施例を挙げ、本発明を更に詳しく説明するが、本発明はこれら実施例に何ら制約されるものではない。
[実施例1]
材料と方法
(バーコード配列の設計)
本実施例におけるバーコード配列は、異なる長さのステムとループを使用した。正規の塩基対とGUゆらぎ塩基対を含む、長さ6、7又は8塩基対(bp)のステムをランダムに生成した。ステムの長さごとに、3つの異なる長さのループを使用した。各バーコードに対して、4つのテトラループ(UUCG、GAGA、GCUU、GUAA)のいずれか1つ、又は3もしくは5塩基長の配列(UCG、AGA、CUU、UAA、UUACG、GAAGA、GCUAU、AGUAA)のいずれか1つを選択した。ViennaRNAパッケージを使用して、バーコードを正しく折りたたむように制御した。コントロールとして、構造化されていない10、15及び21塩基長のバーコードを生成した。
材料と方法
(バーコード配列の設計)
本実施例におけるバーコード配列は、異なる長さのステムとループを使用した。正規の塩基対とGUゆらぎ塩基対を含む、長さ6、7又は8塩基対(bp)のステムをランダムに生成した。ステムの長さごとに、3つの異なる長さのループを使用した。各バーコードに対して、4つのテトラループ(UUCG、GAGA、GCUU、GUAA)のいずれか1つ、又は3もしくは5塩基長の配列(UCG、AGA、CUU、UAA、UUACG、GAAGA、GCUAU、AGUAA)のいずれか1つを選択した。ViennaRNAパッケージを使用して、バーコードを正しく折りたたむように制御した。コントロールとして、構造化されていない10、15及び21塩基長のバーコードを生成した。
(目的RNA配列)
構造化バーコードの有用性を実証するために、目的RNAとして以下の配列:
5’-GUGUAUGAUGAAACUACAUUAAGUUAACUCGUGCAC-3’(配列番号1)を用いた。この配列から、塩基対を形成しない12カ所の位置を選択し、各位置において、他の3つすべての塩基に変えた点変異体を作成することにより、36個の点変異体を得た。これにより、合計37個の配列が得られた。この37個の配列の任意のペアは、1又は2塩基のみが相違する。
構造化バーコードの有用性を実証するために、目的RNAとして以下の配列:
5’-GUGUAUGAUGAAACUACAUUAAGUUAACUCGUGCAC-3’(配列番号1)を用いた。この配列から、塩基対を形成しない12カ所の位置を選択し、各位置において、他の3つすべての塩基に変えた点変異体を作成することにより、36個の点変異体を得た。これにより、合計37個の配列が得られた。この37個の配列の任意のペアは、1又は2塩基のみが相違する。
(第1のライブラリ設計)
第1のライブラリに用いたバーコード配列及びライブラリ構造の概要を図3に示す。図3(a)は、1つのRNAプローブ(ID1)のバーコード配列であり、7bpのステムと4ヌクレオチドのループで構成されている。第1のライブラリ配列は、5’から3’の方向に以下の4つの部分を有する:
i)インビトロ転写(IVT)によるRNAライブラリの生成と、シーケンス用ライブラリの調製に必要な5’カセット(図3(b)における5’側の破線);
ii)個々の配列ごとに異なるバーコード配列(図3(b)の構造化バーコードを含むID1~28及び非構造化バーコードを含むID29~37);
iii)両側に2塩基のスペーサーが隣接する目的RNA配列(図3(b)の実線、なお、配列中の点変異を三角形で示す。);
iv)インビトロ転写(IVT)によるRNAライブラリの生成、逆転写及びシーケンス用ライブラリの調製に必要な3’カセット(図3(b)における3‘側の破線)。
第1のライブラリに用いたバーコード配列及びライブラリ構造の概要を図3に示す。図3(a)は、1つのRNAプローブ(ID1)のバーコード配列であり、7bpのステムと4ヌクレオチドのループで構成されている。第1のライブラリ配列は、5’から3’の方向に以下の4つの部分を有する:
i)インビトロ転写(IVT)によるRNAライブラリの生成と、シーケンス用ライブラリの調製に必要な5’カセット(図3(b)における5’側の破線);
ii)個々の配列ごとに異なるバーコード配列(図3(b)の構造化バーコードを含むID1~28及び非構造化バーコードを含むID29~37);
iii)両側に2塩基のスペーサーが隣接する目的RNA配列(図3(b)の実線、なお、配列中の点変異を三角形で示す。);
iv)インビトロ転写(IVT)によるRNAライブラリの生成、逆転写及びシーケンス用ライブラリの調製に必要な3’カセット(図3(b)における3‘側の破線)。
(第2のライブラリ設計)
第2のライブラリに用いたバーコード配列及びライブラリ構造の概要を図4に示す。この設計によるRNAは、ライブラリ内バーコード(第1のバーコード)とバッチバーコード(第2のバーコード)の2つのバーコードを含む。5’から3’の方向に以下の4つの部分に分けることができる:
i)第1のライブラリ設計で用いたものと同じ5’カセット;
ii)第1のライブラリ設計で用いたものと同じバーコード配列;
iii)両側に2塩基のスペーサーが隣接する目的RNA配列;
iv)プライマー結合を強化する12塩基のリンカー配列。
第2のライブラリに用いたバーコード配列及びライブラリ構造の概要を図4に示す。この設計によるRNAは、ライブラリ内バーコード(第1のバーコード)とバッチバーコード(第2のバーコード)の2つのバーコードを含む。5’から3’の方向に以下の4つの部分に分けることができる:
i)第1のライブラリ設計で用いたものと同じ5’カセット;
ii)第1のライブラリ設計で用いたものと同じバーコード配列;
iii)両側に2塩基のスペーサーが隣接する目的RNA配列;
iv)プライマー結合を強化する12塩基のリンカー配列。
インビトロ転写(IVT)を行う前に、さらに以下の2つの部分をポリメラーゼ連鎖反応(PCR)によって取り付けた。
v)4種類のバッチバーコード。このバーコードは、1つのバッチ内のすべての目的RNAで同じ配列である。
vi)第1のライブラリ設計で用いたものと同じ3’カセット。
v)4種類のバッチバーコード。このバーコードは、1つのバッチ内のすべての目的RNAで同じ配列である。
vi)第1のライブラリ設計で用いたものと同じ3’カセット。
(DNA鎖の合成)
上述したライブラリ及びプライマーは、DNAの形でIntegrated DNA Technologies,Inc.(IDT社)に依頼して合成した。コントロールとして、第1のライブラリで設計した構造化又は非構造化バーコード配列を持つ2つの個別のRNAプローブ(それぞれID1及びID32)を合成した。
上述したライブラリ及びプライマーは、DNAの形でIntegrated DNA Technologies,Inc.(IDT社)に依頼して合成した。コントロールとして、第1のライブラリで設計した構造化又は非構造化バーコード配列を持つ2つの個別のRNAプローブ(それぞれID1及びID32)を合成した。
(DNAからRNAの合成)
まず、PlatinumTMSuperFiTMPCR Master Mix(サーモフィッシャーサイエンティフィック株式会社製)を使用して、ライブラリをPCRで増幅した。第1のライブラリと、このライブラリ中の2つの個別の一本鎖RNA用には、T7RNAポリメラーゼプロモーター配列(IVTの認識サイト:5’-TAATACGACTCACTATAG-3’(配列番号6))の下流に5’カセット配列を有するフォワードプライマーと、3’カセット配列に相補的な配列を有するリバースプライマーを使用した。第2のライブラリを調製するためのリバースプライマーとしては、Pr_d2a(配列番号2)、Pr_d2b(配列番号3)、Pr_d2c(配列番号4)及びPr_d2d(配列番号5)を使用して4つの異なるバッチを作成し、バーコードを付加した。すべての反応において、各プライマーは、最終濃度500nMになるように添加し、テンプレートは総濃度0.4nMで提供した。反応容量は25μLであった。すべてのPCRはサーモフィッシャーサイエンティフィック株式会社のProFlexTMPCRシステムで行った。
まず、PlatinumTMSuperFiTMPCR Master Mix(サーモフィッシャーサイエンティフィック株式会社製)を使用して、ライブラリをPCRで増幅した。第1のライブラリと、このライブラリ中の2つの個別の一本鎖RNA用には、T7RNAポリメラーゼプロモーター配列(IVTの認識サイト:5’-TAATACGACTCACTATAG-3’(配列番号6))の下流に5’カセット配列を有するフォワードプライマーと、3’カセット配列に相補的な配列を有するリバースプライマーを使用した。第2のライブラリを調製するためのリバースプライマーとしては、Pr_d2a(配列番号2)、Pr_d2b(配列番号3)、Pr_d2c(配列番号4)及びPr_d2d(配列番号5)を使用して4つの異なるバッチを作成し、バーコードを付加した。すべての反応において、各プライマーは、最終濃度500nMになるように添加し、テンプレートは総濃度0.4nMで提供した。反応容量は25μLであった。すべてのPCRはサーモフィッシャーサイエンティフィック株式会社のProFlexTMPCRシステムで行った。
30秒間98℃に最初に加熱した後、98℃で10秒間、68℃で10秒間、72℃で15秒間の3ステップPCRを行った。最後のサイクルの後、温度は72℃で5分間保持され、その後4℃に冷却した。2.5μLのエキソヌクレアーゼI(New England Biolabs Inc.)を各チューブに加え、37℃で15分間インキュベートした後、再び4℃に冷却した。精製には、Monarch(登録商標)PCR&DNA Cleanup Kit(5μg)(New England Biolabs Inc.)のDNAクリーンアップおよび濃縮プロトコルを使用した。最終溶出には、10μLのDNA溶出バッファーを使用した。サーモフィッシャーサイエンティフィック株式会社のNanoDropTMOneを使用して、最終濃度を測定した。
調製された二本鎖DNAは、MEGAshortscripTMT7転写キット(サーモフィッシャーサイエンティフィック株式会社)を使用したIVT反応のテンプレートとして使用した。反応はマニュアルに従って調製した。反応容量は20μL、テンプレート濃度は100nMである。反応物を37℃で6時間インキュベートした後、TURBO DNase(キットに付属)で、37℃で15分間処理した。次に、RNAをZymo ResearchのRNA Clean&Concentrator-25で精製した。
インビトロ転写反応により合成した第1のライブラリに含まれるRNAプローブのうち、個別のストランドとして合成したID1(配列番号7)及びID32(配列番号8)の塩基配列を図5に示す。図5において、それぞれのバーコード配列部分を四角で囲み、目的RNA配列には下線を付した。
(構造プロファイリング用のRNAの調製)
RNA修飾には2つの異なる化学修飾剤を使用した。シグマアルドリッチから購入したメチル化剤の硫酸ジメチル(DMS)、及びSHAPE試薬2-メチルニコチン酸イミダゾリド(NAI)である。両方の修飾剤を用いた実験では、同じRNA調製物を使用した。6μLの水に溶解した250ngのRNA(一本鎖またはプール)を95℃で2分間インキュベートし、氷上で少なくとも2分間急冷した。次に、3μLの3.3×フォールディングバッファーを加え、サンプルを37℃で20分間インキュベートした(1×フォールディングバッファーは、100mM HEPES(pH8.0),100mM NaCl,10mM MgCl2で構成されている)。
RNA修飾には2つの異なる化学修飾剤を使用した。シグマアルドリッチから購入したメチル化剤の硫酸ジメチル(DMS)、及びSHAPE試薬2-メチルニコチン酸イミダゾリド(NAI)である。両方の修飾剤を用いた実験では、同じRNA調製物を使用した。6μLの水に溶解した250ngのRNA(一本鎖またはプール)を95℃で2分間インキュベートし、氷上で少なくとも2分間急冷した。次に、3μLの3.3×フォールディングバッファーを加え、サンプルを37℃で20分間インキュベートした(1×フォールディングバッファーは、100mM HEPES(pH8.0),100mM NaCl,10mM MgCl2で構成されている)。
(NAIによる構造プロファイリング修飾)
1000mMのNAI溶液1μLを、空の0.2mLのPCRチューブに加えた。RNAを加える直前まで、チューブを氷上で維持した。37℃で、RNAを含む9μLのサンプルをNAIに加え、溶液を上下にピペッティングして混合した。サンプルは37℃で10分間放置した。
1000mMのNAI溶液1μLを、空の0.2mLのPCRチューブに加えた。RNAを加える直前まで、チューブを氷上で維持した。37℃で、RNAを含む9μLのサンプルをNAIに加え、溶液を上下にピペッティングして混合した。サンプルは37℃で10分間放置した。
反応停止後、RNAをZymo Research社のRNA Clean and Concentrator-5キットで精製し、最終溶出量を15μLにした。NAIで修飾された各RNAサンプルについて、NAIの代わりに1μLのDMSOを使用して同じ方法で処理したコントロールサンプルを調製した。
(DMSによる構造プロファイリング修飾)
37℃で、エタノールを含む1μLの50%DMSを、先に調製したRNAを含む9μLのサンプルに加えた。サンプルを37℃で6分間放置した。5μLのβ-メルカプトエタノールで反応を停止し、完全に混合した後、37℃で2分間インキュベートした。次に、RNAをZymo ResearchのRNA Clean and Concentrator-5キットで精製し、最終溶出量を15μLにした。DMSで修飾された各RNAサンプルについて、DMSの代わりに1μLの50%エタノール水溶液を用いて同じ方法で処理したコントロールサンプルを調製した。
37℃で、エタノールを含む1μLの50%DMSを、先に調製したRNAを含む9μLのサンプルに加えた。サンプルを37℃で6分間放置した。5μLのβ-メルカプトエタノールで反応を停止し、完全に混合した後、37℃で2分間インキュベートした。次に、RNAをZymo ResearchのRNA Clean and Concentrator-5キットで精製し、最終溶出量を15μLにした。DMSで修飾された各RNAサンプルについて、DMSの代わりに1μLの50%エタノール水溶液を用いて同じ方法で処理したコントロールサンプルを調製した。
(変異プロファイリングのための逆転写)
修飾されたRNAサンプルは、3’カセット配列に相補的な配列を有するリバースプライマーを使用して逆転写反応を行った。NAI修飾RNAの場合、マンガンの存在下で酵素SuperScriptTMII逆転写酵素(サーモフィッシャーサイエンティフィック株式会社)を使用した。DMS修飾RNAの場合、TGIRTTM-III酵素(InGex)を使用した。どちらの場合も、1μLの2μMリバースプライマーを2μLの10mMdNTP(New England Biolabs)と7μLの先に修飾したRNAと混合した。サンプルは、サーモフィッシャーサイエンティフィック株式会社のProFlexTMPCRシステムでアニールされ(85℃、1分→65℃、10分→4℃で保持)、これは逆転写ステップにも使用した。次に、9μLの2.22×MaPバッファーを添加して、室温で2分間インキュベートし、1μLの酵素を加え、サンプルをサイクラーに入れて逆転写した(表2を参照)。
修飾されたRNAサンプルは、3’カセット配列に相補的な配列を有するリバースプライマーを使用して逆転写反応を行った。NAI修飾RNAの場合、マンガンの存在下で酵素SuperScriptTMII逆転写酵素(サーモフィッシャーサイエンティフィック株式会社)を使用した。DMS修飾RNAの場合、TGIRTTM-III酵素(InGex)を使用した。どちらの場合も、1μLの2μMリバースプライマーを2μLの10mMdNTP(New England Biolabs)と7μLの先に修飾したRNAと混合した。サンプルは、サーモフィッシャーサイエンティフィック株式会社のProFlexTMPCRシステムでアニールされ(85℃、1分→65℃、10分→4℃で保持)、これは逆転写ステップにも使用した。次に、9μLの2.22×MaPバッファーを添加して、室温で2分間インキュベートし、1μLの酵素を加え、サンプルをサイクラーに入れて逆転写した(表2を参照)。
逆転写が終了したら、1μLのRNaseHを加え、サンプルを37℃で20分間インキュベートした。精製には、AMPure XP(Beckman Coulter製)、使用してプロトコルに従って精製した。溶出のために、乾燥したビーズに14μLの水を加え、十分に混合し、室温で10分間インキュベートし、12.5μLの上澄みを回収した。
(次世代シーケンシング用ライブラリの調製)
ライブラリの準備には、アンプリコンPCRとインデックスPCRの2つのPCRを行った。アンプリコンPCR用1ngの逆転写生成物は、25μLの反応容量で使用した。その他の反応コンポーネントは、1xPlatinumTMSuperFiTMPCR Master Mixと1×SuperFi GC Enhancer(どちらもサーモフィッシャーサイエンティフィック株式会社製)、500nMのフォワードプライマー及びリバースプライマーを用いた。サンプルをProFlexTMPCRシステムに移した。最初に、30秒間98℃に加熱した後、98℃で10秒間、64℃で10秒間、72℃で20秒間の3ステップPCRを行った。最後のサイクルの後、温度は72℃で5分間保持され、その後4℃に冷却した。精製には、Monarch(登録商標)PCR&DNA Cleanup Kit(5μg)(New England Biolabs Inc.)のDNAクリーンアップおよび濃縮プロトコルを使用した。最終溶出には、8μLのDNA溶出バッファーを使用した。これで、次世代シーケンシング用のインデックスを付ける準備ができた。
ライブラリの準備には、アンプリコンPCRとインデックスPCRの2つのPCRを行った。アンプリコンPCR用1ngの逆転写生成物は、25μLの反応容量で使用した。その他の反応コンポーネントは、1xPlatinumTMSuperFiTMPCR Master Mixと1×SuperFi GC Enhancer(どちらもサーモフィッシャーサイエンティフィック株式会社製)、500nMのフォワードプライマー及びリバースプライマーを用いた。サンプルをProFlexTMPCRシステムに移した。最初に、30秒間98℃に加熱した後、98℃で10秒間、64℃で10秒間、72℃で20秒間の3ステップPCRを行った。最後のサイクルの後、温度は72℃で5分間保持され、その後4℃に冷却した。精製には、Monarch(登録商標)PCR&DNA Cleanup Kit(5μg)(New England Biolabs Inc.)のDNAクリーンアップおよび濃縮プロトコルを使用した。最終溶出には、8μLのDNA溶出バッファーを使用した。これで、次世代シーケンシング用のインデックスを付ける準備ができた。
次に、25μLの反応容量で1ngのアンプリコンPCR産物を用いてインデックスPCRを行った。その他の反応コンポーネントは、1xPlatinumTMSuperFiTMPCR Master MixとNextera XT Index Kit v2(Illumina)の1μMインデックスプライマーである。サンプルをProFlexTMPCRシステムに移した。30秒間98℃に最初に加熱した後、98℃で10秒間、55℃で10秒間、72℃で20秒間の3サイクルPCRを6サイクル行った。最後のサイクルの後、温度は72℃で5分間保持され、その後4℃に冷却した。精製には、AMPure XP(Beckman Coulter製)を使用してクリーンアップした。溶出のために、乾燥したビーズに13μLの水を加え、十分に混合し、室温で10分間インキュベートし、12μLの上澄みを回収した。その後、サンプルは次世代シーケンシングのために一緒に混合した。
(次世代シーケンシング)
シーケンシングには、ペアエンドリードと標準リードプライマーを使用したNextSeq500/550ミッドアウトプットキットv2.5(イルミナ社、150サイクル)を使用した。
シーケンシングには、ペアエンドリードと標準リードプライマーを使用したNextSeq500/550ミッドアウトプットキットv2.5(イルミナ社、150サイクル)を使用した。
(アラインメントとデータ分析)
FASTQファイルのアダプターは最初にトリミングされ、次に、アラインメントソフトウェアを使用して生成されたFASTQファイルのリードを、アラインメントソフトウェアを使用して参照配列が含まれたファイル (リファレンスファイル)に対してマッピングを行った。本解析ではSTARアライナーソフトウェアを用いてマッピングした。さらなる分析のために、変異、欠失および挿入をカウントした。
FASTQファイルのアダプターは最初にトリミングされ、次に、アラインメントソフトウェアを使用して生成されたFASTQファイルのリードを、アラインメントソフトウェアを使用して参照配列が含まれたファイル (リファレンスファイル)に対してマッピングを行った。本解析ではSTARアライナーソフトウェアを用いてマッピングした。さらなる分析のために、変異、欠失および挿入をカウントした。
図6は、第2のライブラリを用いて行った変異プロファイリング操作の流れを示す模式図である。それぞれ別々に化学修飾を行った4つのライブラリを1本のチューブにまとめて逆転写反応を行った。一方で比較対照用のサンプルとして前記4つのライブラリに対して別々に逆転写反応を行った4本のチューブを用意した。
結果と考察
(RNAライブラリ内の配列を区別するためのバーコード)
バーコードが変異プロファイリング実験で類似の配列を区別するのに役立つかどうかをテストするために、第1の設計によるライブラリを使用した。文字列の類似度を測る指標としてレーベンシュタイン距離を使用して、2つの配列の類似性を測定した。この距離は、ある配列を別の配列に変換するための挿入、削除、変異の最小数を示す。バーコードを付加しなければ、ライブラリ内の配列の任意のペアに対して、この数は1又は2となる。バーコードを付加すると、レーベンシュタイン距離は7以上である。したがって、変異プロファイリング実験で予想される変異率の増加があっても、シーケンスを正しく識別することができる。完全なライブラリに加えて、ライブラリの2つの単一シーケンス(ID1とID32)をコントロールとして用いた。ID1は構造化バーコードを含むが、ID32は非構造化バーコードを含む(図5参照)。
(RNAライブラリ内の配列を区別するためのバーコード)
バーコードが変異プロファイリング実験で類似の配列を区別するのに役立つかどうかをテストするために、第1の設計によるライブラリを使用した。文字列の類似度を測る指標としてレーベンシュタイン距離を使用して、2つの配列の類似性を測定した。この距離は、ある配列を別の配列に変換するための挿入、削除、変異の最小数を示す。バーコードを付加しなければ、ライブラリ内の配列の任意のペアに対して、この数は1又は2となる。バーコードを付加すると、レーベンシュタイン距離は7以上である。したがって、変異プロファイリング実験で予想される変異率の増加があっても、シーケンスを正しく識別することができる。完全なライブラリに加えて、ライブラリの2つの単一シーケンス(ID1とID32)をコントロールとして用いた。ID1は構造化バーコードを含むが、ID32は非構造化バーコードを含む(図5参照)。
3つのRNAサンプル(ライブラリ及び2つコントロール)を、上述したようにNAI又はDMSで修飾した。NAI/DMSで処理しないコントロール実験を含め、合計12サンプルとなる。単一配列を含め上記サンプルを第1のライブラリのすべての配列に整列させた。データは、それぞれのIDについて、各ヌクレオチドの変異(M)、削除(D)及び挿入(I)をカウントすることによって分析した。変異率(mut)は、M、D、Iを合計し、ある塩基位置での読み取りの総数で割ることによって計算した。配列固有の変異によるノイズを減らすために、未修飾サンプルの変異率をNAI/DMS修飾サンプルの変異率から差し引いて、下記式(1)のデルタ変異率を求めた。
デルタ変異率=修飾変異率-未修飾変異率 (1)
デルタ変異率=修飾変異率-未修飾変異率 (1)
その結果を図7に示す。図7(a)は、NAIで修飾した第1のライブラリのバーコード配列中のすべてのヌクレオチドに関するデルタ変異率絶対値を示す箱ひげ図である。図7(b)は、DMSで処理したサンプルを同様に分析した結果である。図7において、ノッチは中央値を示し、ボックスは四分位範囲を示す。また、ひげは、ボックスの端からボックスの高さの1.5倍のスパン内にある最大値又は最小値まで上下する。外れ値は円で示した。これらの結果は、NAI又はDMSのいずれの修飾剤で処理した場合でも、構造化バーコード配列(ID1~28)のデルタ変異率の絶対値が、非構造化バーコード配列(ID29~37)のデルタ変異率の絶対値よりも有意に低いことを示している。つまりバーコードの構造化によって変異を防ぐことができることを示している。
(異なるRNAライブラリを区別するためのバーコード)
第2のライブラリを使用して、バーコードがすべてのバージョンの共通プール内のRNAライブラリの異なるバージョンを区別するのに役立つかどうかを実験した。このため、第2のライブラリは、インビトロ転写の前にプライマーPr_d2a、Pr_d2b、Pr_d2c、Pr_d2dを使用してバッチバーコード(第2のバーコード)をRNAに付与し4つの異なるバージョンに区別した。図6に示したように、RNAライブラリの4つの異なるバージョンが、NAI又はDMSで修飾されるか、又はそれぞれのコントロールとして取り扱われた。精製ステップの後、ライブラリの4つのバージョンの等量を混合することにより、プールされたサンプルが各処理条件に対して作成された。ライブラリの4つの異なるバージョンとプールされたサンプルのそれぞれは、連続したステップで同じ方法で処理された。
第2のライブラリを使用して、バーコードがすべてのバージョンの共通プール内のRNAライブラリの異なるバージョンを区別するのに役立つかどうかを実験した。このため、第2のライブラリは、インビトロ転写の前にプライマーPr_d2a、Pr_d2b、Pr_d2c、Pr_d2dを使用してバッチバーコード(第2のバーコード)をRNAに付与し4つの異なるバージョンに区別した。図6に示したように、RNAライブラリの4つの異なるバージョンが、NAI又はDMSで修飾されるか、又はそれぞれのコントロールとして取り扱われた。精製ステップの後、ライブラリの4つのバージョンの等量を混合することにより、プールされたサンプルが各処理条件に対して作成された。ライブラリの4つの異なるバージョンとプールされたサンプルのそれぞれは、連続したステップで同じ方法で処理された。
これらのデルタ変異率を、ID1の対象シーケンスをX軸としてプロットした図8(a)及び図8(b)に示す。デルタ変異率は、第1のライブラリ及び第2のライブラリの4つの群すべてを示した(データはプールされたサンプルからのデータである。)。NAI(図8(a))の場合、第1のライブラリと第2のライブラリのデルタ変異率はわずかに異なるが、いずれのライブラリについても非拘束ヌクレオチド領域では変異率が高く、構造プロービングが二次構造に関する情報を反映していることを示している。予測には、ViennaRNAパッケージを使用した。DMS(図8(b))の場合、ライブラリ間の違いはそれほど顕著ではないが、NAIと同様に、構造情報は、拘束されていないことが予測される領域のデルタ変異率がより高い値を示している。実験を行った条件ではDMSは塩基GおよびUの修飾効率が低いため、塩基CおよびAのみがより高い変異率を示す。プールされたサンプルの結果と個別に処理されたサンプルの結果を比較すると、グラフの曲線間に良好なオーバーラップが見られる(図8(c)及び図8(d))。したがって、プーリングは実験の結果に大きな影響を与えないと考えられ、バーコードとしての機能を果たしている。
(第2の設計によるRNAライブラリの2次構造情報)
図8は、単一IDの変異プロファイルのみを示している。次にすべてのIDの変異プロファイルを分析し、ViennaRNAパッケージで予測した二次構造と比較した。図9は、第2のライブラリをそれぞれ単独で又はプールしてNAI又はDMSで化学修飾したときの、塩基対を形成すると予測された領域(図9の黒い領域)と非結合であると予測された領域(図9の灰色の領域)のデルタ変異率の絶対値を別々にプロットしたバイオリンプロットである。図9(a)は、NAIで処理したサンプル、図9(b)は、DMSで処理したサンプルであり、それぞれのx軸に示したIDのうち、ID1~28は構造化バーコード配列を、ID29~37は非構造化バーコード配列を含む。この結果は、4つの個別のサンプル(図9の「バイオリン」の左側)とプールされたサンプル(図9の「バイオリン」の右側)の分布が非常に似ていることも示している。DMSの場合、塩基AとCの位置のみが考慮される。
図8は、単一IDの変異プロファイルのみを示している。次にすべてのIDの変異プロファイルを分析し、ViennaRNAパッケージで予測した二次構造と比較した。図9は、第2のライブラリをそれぞれ単独で又はプールしてNAI又はDMSで化学修飾したときの、塩基対を形成すると予測された領域(図9の黒い領域)と非結合であると予測された領域(図9の灰色の領域)のデルタ変異率の絶対値を別々にプロットしたバイオリンプロットである。図9(a)は、NAIで処理したサンプル、図9(b)は、DMSで処理したサンプルであり、それぞれのx軸に示したIDのうち、ID1~28は構造化バーコード配列を、ID29~37は非構造化バーコード配列を含む。この結果は、4つの個別のサンプル(図9の「バイオリン」の左側)とプールされたサンプル(図9の「バイオリン」の右側)の分布が非常に似ていることも示している。DMSの場合、塩基AとCの位置のみが考慮される。
この結果は、各IDのサンプルについて、NAI(図9(a))又はDMS(図9(b))を使用すると、非結合領域のデルタ変異率の絶対値が高くなることを示しており、ライブラリ内の各シーケンスについて、二次構造情報を取得できることを示している。さらに、プールされたサンプルとプールされていないサンプルでは、平均値と分布の幅(標準偏差)に大きな違いは認められなかった。DMSで修飾した場合は、S/N比が向上し、修飾されたRNAと修飾されていないRNAの分布のオーバーラップは少なくなることを示している。一方で構造化バーコード(ID1~28)に対して非構造化バーコード(ID29~37)においては分布の顕著なオーバーラップが観察されることが多い。これは非構造化バーコードにおいてRNA構造予測によるデータと一致しないことを意味しており、非構造化バーコードが解析対象のRNAの構造に影響を与えたことを示している。
[実施例2]構造化バーコードの使用によるバーコード識別の正確性
全体で54種類のRNA構造が混在するマルチプレックス化されたライブラリ(RNAプローブライブラリ)に対して、96種類の構造化バッチバーコードを用意した。その後マッピングのために、ライブラリに含まれる54種類すべてのRNA構造に異なるバーコードを付与し、96×54種類のリファレンスファイルを作成した。実際にそのうちIDが異なる2種類のバッチバーコードを付加したRNAプローブライブラリを試験管内合成し、DMSによる変異プロファイル実験を行った。検証実験のために異なる構造化バッチバーコードに対して対応したインデックスを付与し、次世代シーケンシング解析を行った。その後、得られたすべてのリードをリファレンスファイルにマッピングをした。本解析ではSTARアライナーソフトウェアを用いてマッピングした。その結果を図10及び図11に示す。
全体で54種類のRNA構造が混在するマルチプレックス化されたライブラリ(RNAプローブライブラリ)に対して、96種類の構造化バッチバーコードを用意した。その後マッピングのために、ライブラリに含まれる54種類すべてのRNA構造に異なるバーコードを付与し、96×54種類のリファレンスファイルを作成した。実際にそのうちIDが異なる2種類のバッチバーコードを付加したRNAプローブライブラリを試験管内合成し、DMSによる変異プロファイル実験を行った。検証実験のために異なる構造化バッチバーコードに対して対応したインデックスを付与し、次世代シーケンシング解析を行った。その後、得られたすべてのリードをリファレンスファイルにマッピングをした。本解析ではSTARアライナーソフトウェアを用いてマッピングした。その結果を図10及び図11に示す。
図10は構造化バッチバーコード1を用いた実験であり、横軸にシーケンスとマッピングにより実際に判定されたID、縦軸にリード数の合計(Depth_sum)を示す。構造化バッチバーコード1を用いた変異プロファイル反応系では修飾剤を用いておらず、RNA構造選択的な変異導入の効果がない。実際に構造化バッチバーコード1のほとんどはID1と正しい判定を受けている。18種類のIDにマッピングが間違って行われたという判定がされているが、正解のID1に対して、その他のIDのリード数では1/1000~1/10000以下と非常に小さいため、変異プロファイルのデータの解釈に影響を与えない。
図11は構造化バッチバーコード2を用いた実験であり、横軸にシーケンスとマッピングにより実際に判定されたID、縦軸にリード数の合計(Depth_sum)を示す。構造化バッチバーコード2を用いた変異プロファイル反応系では修飾剤を用いており、RNAの高次構造選択的に変異導入が行われる。図10に対して図11では、変異導入のため一定以上のリード数の検出が行われたIDが増えた現象が確認されたものの、図10と同様に大多数のリード数はID2と正解の判定を受けた。加えて、正しいID(ID2と判定されたもの)に比して間違って判定されたID(ID2以外と判定されたもの)のリード数の総和は1/100~10000以下と非常に小さいため、変異プロファイルのデータの解釈に影響を与えない。
実際にライブラリ中の54種類のRNAごとに正確性(正しいIDと判定された割合)を確認した(図12、13)。その結果、非修飾条件における正確性は平均99.91%、変異導入条件では平均99.44%であり、変異導入条件においても高い正確性を維持していた。
以上より、構造化バッチバーコードは変異プロファイルにおいて、マッピングの正確性を損なわずに正解のバーコードIDを他の間違ったIDと明確に区別できるため、複数の異なる条件を同時に混ぜるマルチプレックス化に有用である。
[実施例3]バーコードと他のバーコード(インデックス)との組み合わせによるマルチプレックス化の効果
RNAを用いた変異プロファイル反応を終え、DNAに変換したのちに市販のインデックスプライマー(例、Nextera XT Index Kit <イルミナ社>)などと組み合わせることで、サンプルの由来や条件の複雑性を上げることができる。図14は縦軸にイルミナ社の配列に基づいたインデックスプライマー(バーコードとして機能する)、横軸に実施例2で調製した構造化RNA ID7のサンプルをマッピングした際に判定されたIDを示す。カラースケールはリード数の平均値を示す。
RNAを用いた変異プロファイル反応を終え、DNAに変換したのちに市販のインデックスプライマー(例、Nextera XT Index Kit <イルミナ社>)などと組み合わせることで、サンプルの由来や条件の複雑性を上げることができる。図14は縦軸にイルミナ社の配列に基づいたインデックスプライマー(バーコードとして機能する)、横軸に実施例2で調製した構造化RNA ID7のサンプルをマッピングした際に判定されたIDを示す。カラースケールはリード数の平均値を示す。
上記より、どのインデックスプライマーにおいても構造化バッチバーコード(ID)は高い正確性を保って識別可能であることがわかった。つまり、バッチバーコードに加え、複数の形態のDNAバーコードを組み合わせることで検体数を大規模に拡張可能と言える。例えば、10種類のインデックスプライマーと96種類の構造化バーコードを使用することで10×96の960通りの条件を設定できる。
[実施例4]構造化バーコードを用いた次世代シーケンス解析における直交性
全体で異なる1500種類のRNAプローブが混在するマルチプレックス化されたライブラリ(RNAプローブライブラリ)に対して、32種類の構造化バッチバーコードを用意した。その後マッピングのために、1500種類すべてのRNAに異なるバッチバーコードを付与し、32×1500種類(48000種類)のリファレンスファイルとともに実際にRNAプローブライブラリを試験管内合成した。次に、構造化バッチバーコードが付与されたRNAプローブライブラリ群を用いたプロファイル解析を行った。検証実験のために32の異なる構造化バッチバーコードに対してすべて32種類異なるインデックスプライマーを用いてインデックス(Index ID)を付与し、次世代シーケンサー(MiSeq<イルミナ社>)によるシーケンシング解析を行った。その後、インデックスにより32種類のファイルに分配した。バーコードが正しく機能すれば、インデックスID1に相当するファイルには構造化バッチバーコードID1が付与されたRNAプローブライブラリが含まれる。その後、得られたすべてのリードをリファレンスファイルにマッピングをした。本解析ではSTARアライナーソフトウェアを用いてマッピングした。
全体で異なる1500種類のRNAプローブが混在するマルチプレックス化されたライブラリ(RNAプローブライブラリ)に対して、32種類の構造化バッチバーコードを用意した。その後マッピングのために、1500種類すべてのRNAに異なるバッチバーコードを付与し、32×1500種類(48000種類)のリファレンスファイルとともに実際にRNAプローブライブラリを試験管内合成した。次に、構造化バッチバーコードが付与されたRNAプローブライブラリ群を用いたプロファイル解析を行った。検証実験のために32の異なる構造化バッチバーコードに対してすべて32種類異なるインデックスプライマーを用いてインデックス(Index ID)を付与し、次世代シーケンサー(MiSeq<イルミナ社>)によるシーケンシング解析を行った。その後、インデックスにより32種類のファイルに分配した。バーコードが正しく機能すれば、インデックスID1に相当するファイルには構造化バッチバーコードID1が付与されたRNAプローブライブラリが含まれる。その後、得られたすべてのリードをリファレンスファイルにマッピングをした。本解析ではSTARアライナーソフトウェアを用いてマッピングした。
図15では、横軸に正しいインデックス(Index ID)、縦軸に実際にシーケンスとマッピングにより判定された構造化バッチバーコードID(Batch BarcodeID)を示す。ヒートマップの色はマッピングされたリード数のRNAプローブライブラリ内での平均値(Depth_mean)を示す。図15に示す通り、すべての構造化バーコードについて、正しいIDへと割り振られることを確認した。さらに、図16に示す通り、誤判定はライブラリ中の1500種類RNAに対してほとんどが0または10種類未満に対して発生することがわかり、ライブラリ全体のRNAに対して影響はごく小さい。
加えてこれらの誤判定されたRNA種類に対してのリード数は正しいIDに比しておよそ1/100~10000以下であるため、さらに影響が小さく、誤判定がプロファイルの結果への解釈に影響を与えないと言える(図17)。このため、構造化バッチバーコードは意図した通り高い直交性を有していると言え、バーコードとして機能したことを示す。なお、図16にて、一部800種類、130種類程度の混在が確認されたデータ点があるが、それは隣り合ったチューブ間で連続して発生していることやバーコードにおける類似性がないため、人為的ミスによるコンタミネーションと判断され、特定の構造化バーコードによる問題ではない。
なお、本実施例で用いた構造化バーコード配列の例(ID12及びID28)を図18に示す。ID12の構造化バーコードRNAは、22塩基長:5’-GCUAGAAGAUUUGUCUUCUGGU-3’(配列番号9)で4塩基のループ構造を含む。一方、ID28の構造化バーコードRNAは、19塩基長:5’-UUGCGAGAUAUUCUCGCGA-3’(配列番号10)で3塩基のループ構造を含む。このように、構造化バーコードは塩基配列のみならず長さと高次構造を変更することもできるため、その組み合わせをさらに拡大することが可能である。
以上のように、構造化バーコードは複数の反応条件での構造プロービング試験の多重化(マルチプレックス化)が可能である。応用としては異なる反応組成、実験環境条件を複数揃えた上で構造プロービング試験を行うことができ、それらの異なる条件がRNA構造に与える影響を大規模にスクリーニングすることができる。例えば、以下の参考文献[1]~[3]に例示される方法などを用いて、構造変化をきたすことが知られている分子や条件の評価を一度に複数種類行うスクリーニングへと拡張することができる。
参考文献
[1] Komatsu, K. R., Taya, T., Matsumoto, S., Miyashita, E., Kashida, S., & Saito, H. (2020). RNA structure-wide discovery of functional interactions with multiplexed RNA motif library. Nature communications, 11(1), 1-14.
[2] Tapsin, S., Sun, M., Shen, Y., Zhang, H., Lim, X. N., Susanto, T. T., ... & Wan, Y. (2018). Genome-wide identification of natural RNA aptamers in prokaryotes and eukaryotes. Nature communications, 9(1), 1-10.
[3] Corley, M., Flynn, R. A., Lee, B., Blue, S. M., Chang, H. Y., & Yeo, G. W. (2020). Footprinting SHAPE-eCLIP Reveals Transcriptome-wide Hydrogen Bonds at RNA-Protein Interfaces. Molecular Cell, 80(5), 903-914.
[1] Komatsu, K. R., Taya, T., Matsumoto, S., Miyashita, E., Kashida, S., & Saito, H. (2020). RNA structure-wide discovery of functional interactions with multiplexed RNA motif library. Nature communications, 11(1), 1-14.
[2] Tapsin, S., Sun, M., Shen, Y., Zhang, H., Lim, X. N., Susanto, T. T., ... & Wan, Y. (2018). Genome-wide identification of natural RNA aptamers in prokaryotes and eukaryotes. Nature communications, 9(1), 1-10.
[3] Corley, M., Flynn, R. A., Lee, B., Blue, S. M., Chang, H. Y., & Yeo, G. W. (2020). Footprinting SHAPE-eCLIP Reveals Transcriptome-wide Hydrogen Bonds at RNA-Protein Interfaces. Molecular Cell, 80(5), 903-914.
Claims (1)
- 明細書に記載の発明。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020191550 | 2020-11-18 | ||
JP2020191550 | 2020-11-18 | ||
JP2022530711A JP7141165B1 (ja) | 2020-11-18 | 2021-11-17 | 変異プロファイリングのためのrnaプローブ及びその使用 |
PCT/JP2021/042250 WO2022107814A1 (ja) | 2020-11-18 | 2021-11-17 | 変異プロファイリングのためのrnaプローブ及びその使用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022530711A Division JP7141165B1 (ja) | 2020-11-18 | 2021-11-17 | 変異プロファイリングのためのrnaプローブ及びその使用 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022177068A true JP2022177068A (ja) | 2022-11-30 |
Family
ID=81708923
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022530711A Active JP7141165B1 (ja) | 2020-11-18 | 2021-11-17 | 変異プロファイリングのためのrnaプローブ及びその使用 |
JP2022139711A Pending JP2022177068A (ja) | 2020-11-18 | 2022-09-02 | 変異プロファイリングのためのrnaプローブ及びその使用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022530711A Active JP7141165B1 (ja) | 2020-11-18 | 2021-11-17 | 変異プロファイリングのためのrnaプローブ及びその使用 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240052339A1 (ja) |
EP (1) | EP4202056A4 (ja) |
JP (2) | JP7141165B1 (ja) |
CN (1) | CN116234903B (ja) |
CA (1) | CA3200114C (ja) |
IL (1) | IL301876B2 (ja) |
WO (1) | WO2022107814A1 (ja) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61255249A (ja) | 1985-05-08 | 1986-11-12 | Honda Motor Co Ltd | エンジンにおけるタイミングベルトのカバ−装置 |
JPWO2009011297A1 (ja) * | 2007-07-13 | 2010-09-24 | アークレイ株式会社 | Jak2遺伝子の変異検出用プローブおよびその用途 |
CN101586150B (zh) * | 2008-05-23 | 2016-09-28 | 陕西佰美基因股份有限公司 | 检测探针、通用寡核苷酸芯片及核酸检测方法及其用途 |
US9175338B2 (en) * | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
US9255291B2 (en) * | 2010-05-06 | 2016-02-09 | Bioo Scientific Corporation | Oligonucleotide ligation methods for improving data quality and throughput using massively parallel sequencing |
US10240188B2 (en) * | 2013-10-07 | 2019-03-26 | The University Of North Carolina At Chapel Hill | Detection of chemical modifications in nucleic acids |
WO2018003809A1 (ja) | 2016-06-27 | 2018-01-04 | 国立大学法人京都大学 | Rna構造ライブラリ |
EP3650559B1 (en) * | 2018-11-08 | 2022-06-29 | Siemens Healthcare GmbH | Direct rna nanopore sequencing with help of a stem-loop polynucleotide |
-
2021
- 2021-11-17 JP JP2022530711A patent/JP7141165B1/ja active Active
- 2021-11-17 CA CA3200114A patent/CA3200114C/en active Active
- 2021-11-17 IL IL301876A patent/IL301876B2/en unknown
- 2021-11-17 WO PCT/JP2021/042250 patent/WO2022107814A1/ja unknown
- 2021-11-17 CN CN202180064091.3A patent/CN116234903B/zh active Active
- 2021-11-17 EP EP21894688.7A patent/EP4202056A4/en active Pending
-
2022
- 2022-09-02 JP JP2022139711A patent/JP2022177068A/ja active Pending
-
2023
- 2023-04-06 US US18/296,375 patent/US20240052339A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022107814A1 (ja) | 2022-05-27 |
US20240052339A1 (en) | 2024-02-15 |
CA3200114C (en) | 2024-06-04 |
EP4202056A4 (en) | 2024-05-29 |
JP7141165B1 (ja) | 2022-09-22 |
CN116234903A (zh) | 2023-06-06 |
EP4202056A1 (en) | 2023-06-28 |
CA3200114A1 (en) | 2022-05-27 |
JPWO2022107814A1 (ja) | 2022-05-27 |
IL301876B2 (en) | 2024-05-01 |
CN116234903B (zh) | 2024-06-11 |
IL301876B1 (en) | 2024-01-01 |
IL301876A (en) | 2023-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676682B1 (en) | Methods for accurate sequence data and modified base position determination | |
JP6860662B2 (ja) | キメラ生成物の同定のためのバーコードを付けられた環状ライブラリーの構築 | |
US20240043921A1 (en) | Methods of sequencing with linked fragments | |
TW201321518A (zh) | 微量核酸樣本的庫製備方法及其應用 | |
JP2018509178A (ja) | 核酸の高度並列型および正確な測定方法 | |
JP7539770B2 (ja) | ゲノム再編成検出のための配列決定方法 | |
JP7051677B2 (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
JP2022160425A (ja) | 次世代配列決定法を用いた標的タンパク質の集団的定量方法とその用途 | |
CN106520917A (zh) | 一种基因的大片段缺失/重复检测的方法 | |
KR20180041331A (ko) | 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도 | |
JP5926189B2 (ja) | Rna分析方法 | |
JP7141165B1 (ja) | 変異プロファイリングのためのrnaプローブ及びその使用 | |
US9879318B2 (en) | Methods and compositions for nucleic acid sample preparation | |
Sharma et al. | Decryption of sequence, structure, and functional features of SINE repeat elements in SINEUP non-coding RNA-mediated post-transcriptional gene regulation | |
JP2022500062A (ja) | 塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法 | |
Olliff et al. | A Genomics Perspective on RNA |