KR20240051994A - 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 - Google Patents
레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 Download PDFInfo
- Publication number
- KR20240051994A KR20240051994A KR1020247009394A KR20247009394A KR20240051994A KR 20240051994 A KR20240051994 A KR 20240051994A KR 1020247009394 A KR1020247009394 A KR 1020247009394A KR 20247009394 A KR20247009394 A KR 20247009394A KR 20240051994 A KR20240051994 A KR 20240051994A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- retrotransposase
- seq
- domain
- protein
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 128
- 239000012634 fragment Substances 0.000 title claims abstract description 23
- 239000000203 mixture Substances 0.000 title description 15
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 589
- 239000002773 nucleotide Substances 0.000 claims abstract description 587
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 165
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 155
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 155
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 45
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 780
- 108090000623 proteins and genes Proteins 0.000 claims description 579
- 102000004169 proteins and genes Human genes 0.000 claims description 189
- 241000588724 Escherichia coli Species 0.000 claims description 179
- 238000010804 cDNA synthesis Methods 0.000 claims description 158
- 102100031780 Endonuclease Human genes 0.000 claims description 150
- 108020004635 Complementary DNA Proteins 0.000 claims description 127
- 239000002299 complementary DNA Substances 0.000 claims description 127
- 108020004414 DNA Proteins 0.000 claims description 113
- 108700026244 Open Reading Frames Proteins 0.000 claims description 112
- 102000053602 DNA Human genes 0.000 claims description 111
- 230000014509 gene expression Effects 0.000 claims description 81
- 108091034117 Oligonucleotide Proteins 0.000 claims description 68
- 108010042407 Endonucleases Proteins 0.000 claims description 66
- 101710125418 Major capsid protein Proteins 0.000 claims description 62
- 238000000338 in vitro Methods 0.000 claims description 51
- 102000004190 Enzymes Human genes 0.000 claims description 30
- 108090000790 Enzymes Proteins 0.000 claims description 30
- 230000002194 synthesizing effect Effects 0.000 claims description 29
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 23
- 230000003197 catalytic effect Effects 0.000 claims description 21
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 20
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 20
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 20
- 101710105008 RNA-binding protein Proteins 0.000 claims description 20
- 239000011535 reaction buffer Substances 0.000 claims description 19
- 239000011541 reaction mixture Substances 0.000 claims description 19
- 238000010839 reverse transcription Methods 0.000 claims description 17
- 241000282414 Homo sapiens Species 0.000 claims description 16
- 108020004999 messenger RNA Proteins 0.000 claims description 15
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 15
- 230000002441 reversible effect Effects 0.000 claims description 14
- 101710132601 Capsid protein Proteins 0.000 claims description 12
- 101710094648 Coat protein Proteins 0.000 claims description 12
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 claims description 12
- 101710141454 Nucleoprotein Proteins 0.000 claims description 12
- 101710083689 Probable capsid protein Proteins 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 12
- 230000001965 increasing effect Effects 0.000 claims description 12
- 230000004572 zinc-binding Effects 0.000 claims description 12
- 101710163270 Nuclease Proteins 0.000 claims description 11
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 claims description 11
- 241000709744 Enterobacterio phage MS2 Species 0.000 claims description 10
- 238000001042 affinity chromatography Methods 0.000 claims description 10
- 239000013043 chemical agent Substances 0.000 claims description 10
- 229910021645 metal ion Inorganic materials 0.000 claims description 10
- 235000015097 nutrients Nutrition 0.000 claims description 10
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 7
- 239000007788 liquid Substances 0.000 claims description 7
- 241000288906 Primates Species 0.000 claims description 6
- 101100007857 Bacillus subtilis (strain 168) cspB gene Proteins 0.000 claims description 5
- 241000701959 Escherichia virus Lambda Species 0.000 claims description 5
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 5
- 101150046213 araP gene Proteins 0.000 claims description 5
- 101150110403 cspA gene Proteins 0.000 claims description 5
- 101150068339 cspLA gene Proteins 0.000 claims description 5
- 239000008101 lactose Substances 0.000 claims description 5
- 230000002934 lysing effect Effects 0.000 claims description 5
- 101150093139 ompT gene Proteins 0.000 claims description 5
- 102000008579 Transposases Human genes 0.000 claims description 4
- 108010020764 Transposases Proteins 0.000 claims description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 33
- 230000035800 maturation Effects 0.000 claims 2
- 238000012407 engineering method Methods 0.000 claims 1
- 102100034343 Integrase Human genes 0.000 description 464
- 235000018102 proteins Nutrition 0.000 description 141
- 239000013615 primer Substances 0.000 description 137
- 229920002477 rna polymer Polymers 0.000 description 132
- 210000004027 cell Anatomy 0.000 description 119
- 230000005945 translocation Effects 0.000 description 94
- 230000000694 effects Effects 0.000 description 78
- 238000003776 cleavage reaction Methods 0.000 description 50
- 230000007017 scission Effects 0.000 description 50
- 238000006243 chemical reaction Methods 0.000 description 47
- 108090000765 processed proteins & peptides Proteins 0.000 description 46
- 102000040430 polynucleotide Human genes 0.000 description 45
- 108091033319 polynucleotide Proteins 0.000 description 45
- 239000002157 polynucleotide Substances 0.000 description 45
- 108091005804 Peptidases Proteins 0.000 description 37
- 239000004365 Protease Substances 0.000 description 37
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 37
- 230000004927 fusion Effects 0.000 description 37
- 239000000499 gel Substances 0.000 description 37
- 108020004417 Untranslated RNA Proteins 0.000 description 34
- 102000039634 Untranslated RNA Human genes 0.000 description 34
- 108020003589 5' Untranslated Regions Proteins 0.000 description 33
- 108020005345 3' Untranslated Regions Proteins 0.000 description 31
- 238000003556 assay Methods 0.000 description 29
- 238000011529 RT qPCR Methods 0.000 description 26
- 229940088598 enzyme Drugs 0.000 description 23
- 238000007481 next generation sequencing Methods 0.000 description 23
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 22
- 238000001597 immobilized metal affinity chromatography Methods 0.000 description 22
- 108091023045 Untranslated Region Proteins 0.000 description 21
- 229940024606 amino acid Drugs 0.000 description 21
- 150000001413 amino acids Chemical class 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 102000004196 processed proteins & peptides Human genes 0.000 description 19
- 108020004705 Codon Proteins 0.000 description 18
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- 241000713869 Moloney murine leukemia virus Species 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 16
- 238000009739 binding Methods 0.000 description 15
- 244000005700 microbiome Species 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- 241000196324 Embryophyta Species 0.000 description 14
- 230000027455 binding Effects 0.000 description 14
- 108020001019 DNA Primers Proteins 0.000 description 13
- 239000003155 DNA primer Substances 0.000 description 13
- 108010061833 Integrases Proteins 0.000 description 13
- 108091030145 Retron msr RNA Proteins 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 239000000543 intermediate Substances 0.000 description 13
- 238000002887 multiple sequence alignment Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 239000011701 zinc Substances 0.000 description 13
- 241000723792 Tobacco etch virus Species 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 230000010354 integration Effects 0.000 description 12
- 210000004962 mammalian cell Anatomy 0.000 description 12
- 229920002401 polyacrylamide Polymers 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 11
- 238000007792 addition Methods 0.000 description 11
- 230000002538 fungal effect Effects 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000012216 screening Methods 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 10
- 229950010342 uridine triphosphate Drugs 0.000 description 10
- 108091029499 Group II intron Proteins 0.000 description 9
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 9
- 108091036066 Three prime untranslated region Proteins 0.000 description 9
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 9
- 229910052725 zinc Inorganic materials 0.000 description 9
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 8
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 8
- 239000007983 Tris buffer Substances 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 229910001629 magnesium chloride Inorganic materials 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 108091027963 non-coding RNA Proteins 0.000 description 8
- 102000042567 non-coding RNA Human genes 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 241000283984 Rodentia Species 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 239000013641 positive control Substances 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 230000001177 retroviral effect Effects 0.000 description 7
- 238000010845 search algorithm Methods 0.000 description 7
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- 108010013369 Enteropeptidase Proteins 0.000 description 6
- 102100029727 Enteropeptidase Human genes 0.000 description 6
- 108010074860 Factor Xa Proteins 0.000 description 6
- 102000005720 Glutathione transferase Human genes 0.000 description 6
- 108010070675 Glutathione transferase Proteins 0.000 description 6
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 6
- -1 RT-RNAse H Proteins 0.000 description 6
- 108090000190 Thrombin Proteins 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 229960004072 thrombin Drugs 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 241000206602 Eukaryota Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- VYXSBFYARXAAKO-UHFFFAOYSA-N ethyl 2-[3-(ethylamino)-6-ethylimino-2,7-dimethylxanthen-9-yl]benzoate;hydron;chloride Chemical compound [Cl-].C1=2C=C(C)C(NCC)=CC=2OC2=CC(=[NH+]CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-UHFFFAOYSA-N 0.000 description 5
- TWYVVGMYFLAQMU-UHFFFAOYSA-N gelgreen Chemical compound [I-].[I-].C1=C(N(C)C)C=C2[N+](CCCCCC(=O)NCCCOCCOCCOCCCNC(=O)CCCCC[N+]3=C4C=C(C=CC4=CC4=CC=C(C=C43)N(C)C)N(C)C)=C(C=C(C=C3)N(C)C)C3=CC2=C1 TWYVVGMYFLAQMU-UHFFFAOYSA-N 0.000 description 5
- 238000003119 immunoblot Methods 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 230000000813 microbial effect Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 230000030648 nucleus localization Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- 108020004463 18S ribosomal RNA Proteins 0.000 description 4
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000003766 bioinformatics method Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 238000006471 dimerization reaction Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 238000011068 loading method Methods 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 4
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- 239000010754 BS 2869 Class F Substances 0.000 description 3
- 241000195940 Bryophyta Species 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 101710145242 Minor capsid protein P3-RTD Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108010076039 Polyproteins Proteins 0.000 description 3
- 229930185560 Pseudouridine Natural products 0.000 description 3
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000010494 dissociation reaction Methods 0.000 description 3
- 230000005593 dissociations Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 206010022000 influenza Diseases 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229920002704 polyhistidine Polymers 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 108700022487 rRNA Genes Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 108020004418 ribosomal RNA Proteins 0.000 description 3
- 239000013049 sediment Substances 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 201000004458 Myoma Diseases 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 2
- 101150059944 emx1 gene Proteins 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 108700032552 influenza virus INS1 Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000013081 phylogenetic analysis Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 101000977065 Acidithiobacillus ferridurans Uncharacterized 11.6 kDa protein in mobS 3'region Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 241000512259 Ascophyllum nodosum Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 101100121123 Caenorhabditis elegans gap-1 gene Proteins 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 1
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 101000861180 Cupriavidus necator (strain ATCC 17699 / DSM 428 / KCTC 22496 / NCIMB 10442 / H16 / Stanier 337) Uncharacterized protein H16_B0147 Proteins 0.000 description 1
- ZGRQPKYPJYNOKX-XUXIUFHCSA-N Cys-Cys-His-His Chemical compound C([C@H](NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ZGRQPKYPJYNOKX-XUXIUFHCSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000721047 Danaus plexippus Species 0.000 description 1
- 101100087838 Danio rerio rrm2 gene Proteins 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 108091093094 Glycol nucleic acid Proteins 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101710088172 HTH-type transcriptional regulator RipA Proteins 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108091028649 Multicopy single-stranded DNA Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 241000611306 Taeniopygia guttata Species 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 102100032938 Telomerase reverse transcriptase Human genes 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091046915 Threose nucleic acid Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- AZRNEVJSOSKAOC-VPHBQDTQSA-N [[(2r,3s,5r)-5-[5-[(e)-3-[6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoylamino]prop-1-enyl]-2,4-dioxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(\C=C\CNC(=O)CCCCCNC(=O)CCCC[C@H]2[C@H]3NC(=O)N[C@H]3CS2)=C1 AZRNEVJSOSKAOC-VPHBQDTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 244000005702 human microbiome Species 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 108010089520 pol Gene Products Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 239000013636 protein dimer Substances 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 238000010814 radioimmunoprecipitation assay Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- JBQYATWDVHIOAR-UHFFFAOYSA-N tellanylidenegermanium Chemical compound [Te]=[Ge] JBQYATWDVHIOAR-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- IBVCSSOEYUMRLC-GABYNLOESA-N texas red-5-dutp Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(C#CCNS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=C1 IBVCSSOEYUMRLC-GABYNLOESA-N 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 101150065732 tir gene Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1247—DNA-directed RNA polymerase (2.7.7.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07006—DNA-directed RNA polymerase (2.7.7.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2795/00—Bacteriophages
- C12N2795/00011—Details
- C12N2795/18011—Details ssRNA Bacteriophages positive-sense
- C12N2795/18111—Leviviridae
- C12N2795/18122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Cell Biology (AREA)
- Enzymes And Modification Thereof (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본 개시내용은 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키기 위한 시스템 및 방법을 제공한다. 이들 시스템 및 방법은 카고 뉴클레오티드 서열을 포함하는 핵산을 포함할 수 있으며, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제 및 레트로트랜스포사제와 상호 작용하도록 구성되고, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 부위에 전위시키도록 구성된다. 시스템 및 방법은 또한 레트로트랜스포사제의 기능적 단편의 사용을 포함할 수 있다.
Description
상호 참조
본 출원은 발명의 명칭이 "카고 뉴클레오티드 서열을 전위시키기 위한 시스템 및 방법(SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES)"인 2021년 9월 8일에 출원된 미국 가출원 제63/241,943호의 이익을 주장하며, 상기 출원은 그 전체가 참조로서 본원에 통합된다.
전위 가능한(transposable) 요소는 유전자 기능 및 진화에 중요한 역할을 하는 이동성 DNA 서열이다. 전위 가능한 요소는 거의 모든 형태의 생활에서 발견되지만, 이들의 출현률은 유기체에 따라 달라지며, 대부분의 진핵생물 게놈은 전위 가능한 요소를 암호화한다(인간에서 적어도 45%).
서열 목록
본 출원은 XML 포맷으로 전자적으로 제출된 서열 목록을 포함하며, 동 서열 목록은 그 전체가 참조로서 본원에 통합된다. 2022년 9월 7일에 생성된 상기 XML 사본의 명칭은 55921-734_601_SL.xml이며, 크기는 1,677,029 바이트이다.
전위 가능한 요소에 대한 기초 연구는 1940년대에 수행되었지만, DNA 조작 및 유전자 편집 적용에서 이들의 잠재적 유용성은 최근 몇 년 동안에만 인식되었다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT, reverse transcriptase) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 시스템은 (c) 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, 이중-가닥 DNA 서열은 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하며, 여기서 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는, 카고 서열의 5' 서열 또는 카고 서열의 3' 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다. 일부 실시예에서, 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함한다.
일부 실시예에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 RT 도메인 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 5' 서열 또는 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 이들의 상보체, 또는 이들의 역상보체를 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA, complementary DNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위해 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 DNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP, MS2 coat protein) 도메인을 포함한다
일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 핵산을 제공한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 적어도 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 대해 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기완과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.
일부 실시예에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다. 일부 실시예에서, 시스템은 (c) 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함한다. 일부 실시예에서, RNA는 시험관 내 전사된 RNA이다. 일부 실시예에서, RNA는 레트로트랜스포사제를 암호화하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 조작된 DNA 서열을 제공하며, 이는 (a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열; (b) 이종 카고 서열; (c) 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인를 포함하는, 레트로트랜스포사제; 및 (d) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서: (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계, (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다.
일부 측면에서, 본 개시내용은 서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소(maturase) 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산을 제공하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화한다. 일부 실시예에서, ORF는 박테리아 유기체에서의 발현에 최적화되거나, 여기서 유기체는 대장균이다. 일부 실시예에서, ORF는 포유류 유기체에서의 발현에 최적화되거나, 여기서 유기체는 영장류 유기체이다. 일부 실시예에서, 영장류 유기체는 H. 사피엔스이다. 일부 실시예에서, ORF는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열에 작동 가능하게 연결된 친화성 태그를 포함하며, 여기서 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는다. 일부 실시예에서, ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인 또는 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융합된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.
일부 측면에서, 본 개시내용은 개방 해독 프레임을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 핵산은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 상보성 DNA(cDNA)를 합성하는 방법을 제공하며, 이는 (a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계; (b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및 (c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함한다. 일부 실시예에서, 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함한다. 일부 실시예에서, cDNA를 합성하는 단계는 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 주형 RNA 분자, 프라이머 올리고뉴클레오티드, 및 역전사 효소를 인큐베이션하는 단계를 포함한다. 일부 실시예에서, 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질을 제공하며, 여기서 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그와 N-말단적으로 또는 C-말단적으로 융한된다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함한다. 일부 실시예에서, 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인이다. 일부 실시예에서, RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함한다. 일부 실시예에서, 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합된다.
일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산을 제공하며, 여기서 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하며, 여기서 (a) 개방 해독 프레임은 유기체에서의 발현에 최적화되고 유기체는 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함한다. 일부 실시예에서, 핵산은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 추가로 암호화한다. 일부 실시예에서, ORF는 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 유기체는 RT 도메인의 기원과 상이하다. 일부 실시예에서, ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함한다.
일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는 합성 올리고뉴클레오티드를 제공한다. 일부 실시예에서, 합성 올리고뉴클레오티드는 DNA 뉴클레오티드를 포함한다. 일부 실시예에서, 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 추가로 포함한다.
일부 측면에서, 본 개시내용은 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 벡터를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나를 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 핵산은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하며, 여기서 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소를 첨가함으로써 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물에 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피를 수행하는 단계를 추가로 포함한다.
일부 측면에서, 본 개시내용은 본원에 기술된 핵산 중 어느 하나의 RNA 동족체를 포함하는 시험관 내에서 전사된 mRNA를 제공한다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 카고 뉴클레오티드 서열은 조작된다. 일부 실시예에서, 카고 뉴클레오티드 서열은 이종이다. 일부 실시예에서, 카고 뉴클레오티드 서열은 유기체에 존재하는 야생형 게놈 서열의 서열을 갖지 않는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함한다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시내용은 조작된 레트로트랜스포사제 시스템을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고; (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 카고 뉴클레오티드 서열을 전위시키도록 구성된다. 일부 실시예에서, 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정된다. 일부 실시예에서, 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정된다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일부 측면에서, 본 개시내용은 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산을 제공하며, 여기서 핵산은 레트로트랜스포사제를 암호화하고, 여기서 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 여기서 유기체는 미배양 미생물이 아니다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 896-911로부터 선택되는 서열을 포함한다. 일부 실시예에서, NLS는 서열번호 897을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 N-말단에 근접한다. 일부 실시예에서, NLS는 서열번호 896을 포함한다. 일부 실시예에서, NLS는 레트로트랜스포사제의 C-말단에 근접한다. 일부 실시예에서, 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간이다
일부 실시예에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산을 포함하는 벡터를 제공한다. 일부 실시예에서, 벡터는 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함한다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 포함하는 세포를 제공한다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 제조하는 방법을 제공한다.
일부 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 방법을 제공하며, 이는 (a) 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성된 레트로트랜스포사제를 이중-가닥 데옥시리보핵산 폴리뉴클레오티드와 접촉시키는 단계를 포함하며, 여기서 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일부 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공하며, 이러한 방법은 본원에 기술된 측면 또는 실시예 중 어느 하나의 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고, 여기서 복합체는, 복합체가 표적 핵산 유전자좌에 결합할 때, 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다. 일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.
일부 측면에서, 본 개시내용은 본원에 기술된 측면 또는 실시예 중 어느 하나의 방법을 제공하며, 여기서 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 측면 또는 실시예 중 어느 하나의 핵산 또는 본원에 기술된 측면 또는 실시예 중 어느 하나의 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 레트로트랜스포사제를 암호화하는 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.
일부 측면에서, 본 개시내용은 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 이종 레트로트랜스포사제 또는 이들의 변이체를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 측면 또는 실시예 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그가 부착된다. 일부 실시예에서, 방법은 감산(subtractive) IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
일부 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공하며, 이는 조성물을 세포에 접촉시키는 단계를 포함하며, 상기 조성물은 (a) 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성된, 이중-가닥 핵산; 및 (b) 레트로트랜스포사제로서, 여기서 (i) 레트로트랜스포사제는 카고 뉴클레오티드 서열을 표적 핵산 유전자좌로 전위시키도록 구성되고, (ii) 레트로트랜스포사제는 서열번호 1-29 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고; (iii) 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 레트로트랜스포사제를 포함한다. 일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.
일부 측면에서, 본 개시내용은 본원에 기술된 단백질 중 어느 하나를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 숙주 세포는 E. coli 세포 또는 포유류 세포이다. 일부 실시예에서, 숙주 세포는 E. coli 세포이고, 여기서 E. coli 세포는 λDE3 리소겐이거나 E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다. 일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다. 일부 실시예에서, 개방 해독 프레임은 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, 스트렙 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.
일부 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일부 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 단백질 중 어느 하나를 암호화하는 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 본원에 기술된 단백질 중 어느 하나를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 단백질의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 뉴클레아제의 발현을 유도하는 단계는 추가 화학 제제 또는 영양소의 증가된 양을 첨가하거나, 온도 증가 또는 감소에 의한 것이다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질을 포함하는 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 엔도뉴클레아제를 단리하는 단계를 추가로 포함한다. 일부 실시예에서, 단리하는 단계는 단백질 추출물에 대해 IMAC, 이온 교환 크로마토그래피, 음이온 교환 크로마토그래피, 또는 양이온 교환 크로마토그래피를 거치게 하는 단계를 포함한다. 일부 실시예에서, 숙주 세포는 단백질을 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함하는 개방 해독 프레임을 포함하는 핵산을 포함한다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 단백질을 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 단백질에 접촉시킴으로써 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 친화성 태그는 IMAC 친화성 태그다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 단백질을 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
본 개시내용의 추가 측면 및 이점은, 본 개시의 예시적인 실시예만이 도시되고 설명되는, 다음의 상세한 설명으로부터 당업자에게 쉽게 명백해질 것이다. 인지하게 되겠지만, 본 개시내용은 다른 실시예 및 상이한 실시예가 가능하고, 본 개시의 몇몇 세부 사항은 다양한 명백한 측면에서 본 개시를 벗어나지 않고도 변형될 수 있다. 따라서, 도면 및 본 발명을 실시하기 위한 구체적인 내용은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되지 않아야 한다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물, 특허, 또는 특허 출원이 참조에 의해 구체적으로 및 개별적으로 통합된 것으로 표시된 것과 동일한 정도로 참조에 의해 본원에 통합된다.
본 발명의 신규한 특징은 특히 첨부된 청구범위에 명시되어 있다. 본 발명의 특징 및 장점은 본 발명의 원리가 활용되는 예시적인 실시예가 제시되는 하기 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조함으로써 보다 잘 이해될 것이다.
도 1은 박테리아 레트로트랜스포존의 게놈 맥락을 도시한다. MG140-1은 Zn-핑거 DNA 결합 도메인 및 역전사 효소 도메인을 암호화하는 예측된 레트로트랜스포사제(화살표)이다. 레트로트랜스포사제의 측면에 위치하는 영역은 레트로트랜스포사제에 대한 결합 부위를 나타낼 가능성이 있는 이차 구조를 나타낸다(2차 구조 박스 및 확대된 이미지). 다른 상동체와의 유사 영역은 레트로트랜스포존이 통합된 추정 표적 부위를 나타낸다.
도 2는 MG140 계열의 MG 레트로트랜스포사제 단백질 서열의 다중 서열 정렬(MSA)을 도시한다. 도 2a는 역전사 효소 도메인의 MSA를 도시한다. 보존된 촉매 잔기 D, QG, [Y/F]ADD, 및 LG는 컨센서스 서열 상에서 강조된다. 도 2b는 Zn-핑거 및 엔도뉴클레아제 도메인의 MSA를 도시한다. Zn-핑거 모티프(CX[2-3]C), 엔도뉴클레아제 도메인의 일부 및 뉴클레아제 촉매 잔기가 컨센서스 서열 상에서 강조된다.
도 3은 MG 및 기준 레트로트랜스포사제 유전자의 계통발생 유전자 트리를 도시한다. 도 3a는 미생물 MG 레트로트랜스포사제(계통군 4 상의 흑색 분지)가 바이러스 레트로트랜스포사제(계통군 6 상의 회색 분지)보다 진핵생물과 더 밀접하게 관련됨을 도시한다. 계통군 1: 텔로머라아제 역전사 효소; 계통군 2: II족 인트론 역전사 효소; 계통군 3: 진핵생물 R1형 레트로트랜스포사제; 계통군 4: 미생물 및 진핵생물 R2 레트로트랜스포사제; 계통군 5: 진핵생물 레트로바이러스-관련 역전사 효소; 및 계통군 6: 바이러스 역전사 효소. 도 3b는 도 3a의 계통발생 유전자 트리의 계통군 3 및 4를 도시한다. 일부 미생물 MG 레트로트랜스포사제는 다수의 Zn-핑거 모티프(수직 직사각형), 보존된 RVT_1 역전사 효소 도메인, 및 APE/RLE 또는 기타 엔도뉴클레아제 도메인(상단 및 하단 패널)을 함유한다. 일부 미생물 MG 레트로트랜스포사제는 엔도뉴클레아제 도메인(중간 패널)이 결여되어 있다.
도 4는 다양한 효소로부터의 역전사 효소 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. RT 서열은 DNA뿐만 아니라 RNA 조립체로부터 유래하였다. 기준 RT를 분류 목적을 위해 트리에 포함시켰다.
도 5a는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147) 및 관련 RT(MG148)의 신규한 계열로부터 식별된 RT 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 5b는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147)가 RT 도메인, 엔도뉴클레아제 도메인(Endo), 및 다수의 아연-결합 리본 모티프를 함유하는 반면, 계열 MG148 RT는 엔도뉴클레아제 도메인이 결여되어 있음을 입증하는 데이터를 도시한다.
도 6a는 MG140 R2 레트로트랜스포사제가 RT 및 엔도뉴클레아제(EN) 도메인뿐만 아니라 다수의 아연-핑거를 함유하고, 기준 Danio rerio R2 레트로트랜스포사제(R2Dr)와 24% 내지 26%의 평균 아미노산 동일성(AAI)을 공유한다는 것을 입증하는 데이터를 도시한다. 도 6B는 MG140-47 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 데이터를 도시한다. 기준(GQ398061) 리보솜 RNA 오페론에 대한 MG140-47 콘티그의 정렬은 MG140-47 28S rDNA 유전자(점선 박스) 내로의 R2 요소의 통합으로 인해 기준 28S rDNA 유전자에서 큰 갭을 나타낸다.
도 7a는 MG145-45 레트로트랜스포존의 게놈 맥락을 도시한다. 효소는 RT 및 아연-핑거 도메인을 함유한다. 5' 말단에서의 부분적인 18S rDNA 유전자 히트 및 3' 말단에서의 폴리-A 꼬리는 트랜스포존의 경계를 나타낼 가능성이 있다. 도 7b는 MG140-3, MG140-8, 및 MG140-45 게놈 서열의 정렬을 도시하며, 이는 정렬의 위치 200에 대한 18S rRNA 유전자의 보존을 도시하고, R2 요소가 18S rDNA 유전자(화살표)에 통합되었음을 나타낸다.
도 8a는 RT 및 엔도뉴클레아제 도메인을 갖는 MG146-1 레트로트랜스포사제를 암호화하는 콘티그를 도시한다. 도 8b는 동원에 관여할 것으로 예측된 3개의 유전자를 암호화하는 MG140-17-R2 레트로트랜스포존을 도시한다: RNA 인식 모티프 유전자(RRM); 엔도뉴클레아제 효소; 및 RT 및 RNAse H 도메인을 갖는 역전사 효소.
도 9a는 RT의 MG148 계열의 2개의 구성원의게놈 맥락을 도시한다. RT와 연관되지 않은 예측된 유전자는 백색 화살표로 표시된다. 도 9b는 RT의 상류에 보존된 영역(서열 아래의 박스)을 나타내는 MG148 계열의 5개의 구성원의뉴클레오티드 서열 정렬을 도시한다(컨센서스 서열에 걸쳐 주석이 달린 화살표).
도 10은 qPCR(MG140)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타(Taeniopygia guttata)); 양성 대조군 2: R2Bm (봄빅스 모리(Bombyx mori)). 2개의 양성 대조군은 문서화된 R2 레트로트랜스포존이다. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 11은 qPCR(MG146, MG147, MG148)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타), 문서화된 R2 레트로트랜스포존. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 12는 차세대 시퀀싱에 의해 R2 및 R2-유사 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 배경: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타).
도 13a는 다양한 부류의 신규한 계열로부터 식별된 전장 II족 인트론 RT의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 13b는 II족 인트론의 MG 계열의 요약표를 도시한다. AAI: 기준 II족 인트론 서열에 대한 MG 계열의 평균 쌍별 아미노산 동일성.
도 14a 내지 도 14d는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-1 내지 MG153-21 및 MG153-25 내지 MG153-27의 시험관 내 활성의 스크리닝을 도시한다. 도 14a 내지 도 14c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4-MarathonRT 대조군 RT. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 결과는 2개의 독립적인 실험을 나타낸다. 도 14a 레인 번호 5-14는 신규 후보 MG153-1 내지 MG153-10에 상응한다. 도 14b 레인 번호 5-14는 신규 후보 MG153-11 내지 MG153-20에 상응한다. 도 14c 레인 번호 5-8은 신규 후보 MG153-21, MG153-25, MG153-26, 및 MG153-27에 각각 상응한다. 도 14d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 14a 내지 도 14c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 15는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-28 내지 MG153-37 및 MG153-39 내지 MG153-57의 시험관 내 활성의 스크리닝을 도시한다. 도 15a 내지 도 15c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT. 굵은 글씨체로 표시된 번호는 겔 레인에 해당한다. 도 15a 레인 번호 4-13은 신규 후보 MG153-28 내지 MG153-37에 상응한다. 도 15b 레인 번호 4-13은 신규 후보 MG153-39 내지 MG153-48에 상응한다. 도 15c 레인 번호 4-13은 신규 후보 MG153-49 내지 MG153-57에 상응한다. 도 15d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 15a 내지 도 15c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 16은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 D MG165 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 16a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 12- 신규 후보 MG165-1 내지 9. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 16b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 16a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 17은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 F MG167 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 17a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 - 신규 후보 MG167-1 내지 8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 17b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 17a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 18은 차세대 시퀀싱에 의해 MG153 계열의 GII 인트론 클래스 C RT 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 결과는 2개의 독립적인 실험으로부터 결정하였다.
도 19는 포유류 세포에서 cDNA를 합성하는 표시된 대조군 RT 및 GII 인트론 클래스 C 후보의 능력을 평가하기 위한 스크리닝을 도시한다. 도 19a는 아가로오스 겔 분석에 의한 542 bp(상단) 및 100 bp(하단) PCR 산물의 검출을 도시한다. 도 19b는 D1000 TapeStation에 의한 542 bp(상단) 및 100bp(하단) PCR 산물의 검출을 도시한다. 도 19c는 추가 후보에 대한 D1000 TapeStation에 의한 542 bp PCR 산물의 검출을 도시한다. 도 19a 및 도 19b에 설명된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다.
도 20a는 전장 G2L4-유사 RT의 계통발생 트리를 도시한다. 기준 G2L4 서열 및 MG172 후보(점)가 강조된다. 도 20b는 기준 및 MG172 RT의 컬럼 277 내지 280이 역전사 효소 기능을 담당하는 촉매 잔기를 나타낸다는 것을 입증하는 데이터를 도시한다.
도 21a는 전장 LTR RT의 계통발생 트리를 도시한다. 기준 LTR RT 서열 및 MG151 후보(점)가 강조된다. 도 21b는 MG151-82 RT(ORF 7로 표지됨)의게놈 맥락을 도시한다. 예측된 도메인은 어두군 상자로서 도시되고, 긴 말단 반복(LTR)은 LTR 트랜스포존의 측면에 위치한 화살표로서 도시된다. 도 21c는 프로테아제, RT, RNAse H 및 인테그라아제 도메인을 보여주는 MG151-82의 3D 구조 예측을 도시한다.
도 22는 프로테아제, RT - RNAse H, 및 인테그라아제 도메인을 강조하기 위한 전장 pol 단백질 서열의 다중 서열 정렬을 도시한다. MMLV RT의 RT, RNAse H, 및 인테그라아제 도메인에 대한 촉매 잔기는 각 도메인 아래에 막대로 도시되어 있다. MMLV 기준 서열의 프로테아제 도메인은 정렬에 도시되지 않는다.
도 23은 프라이머 연장 검정에 의한 바이러스 후보 MG151-80 내지 MG151-97의 시험관 내 활성의 스크리닝을 도시한다. 도 23a의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형; 2-MMLV 대조군 RT; 3-Ty3 대조군 RT; 4 내지 9의 신규 후보 MG151-80 내지 85; 10- RT 대조군. 도 23b의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형, 2 내지 12- 신규 후보 MG151-87 내지 97, 13-MMLV 대조군 RT. 도 23c는 상이한 완충액 조건에서 Ty3 대조군 RT의 시험관 내 활성에 대한 시험을 도시한다. 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군; 2-완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP); 3- 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl2, 1 mM TCEP, 2% PEG-8000); 4-완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl2, 1 mM TCEP, 0.01% (v/v) Triton X-100); 5-완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl2, 1 mM TCEP, 10% 글리세롤). 도 23a 내지 도 23c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 24는 구조화된 RNA 주형 상에서 후보 MG151-89, MG151-92, 및 MG151-97의 시험관 내 RT 공정도 및 프라이밍 파라미터의 시험을 도시한다. 도 24a 및 도 24b의 경우, 레인 1: 6,10, 및 16개 뉴클레오티드 올리고 마커(화살표); 레인 2: 8, 13, 및 20개 뉴클레오티드 올리고 마커; 레인 3: 43 및 55개 뉴클레오티드 올리고 마커; 레인 4 및 10: 6개 뉴클레오티드 프라이머; 레인 5 및 11: 8개 뉴클레오티드 프라이머; 레인 6 및 12: 10개 뉴클레오티드 프라이머; 레인 7 및 13: 13개 뉴클레오티드 프라이머; 레인 8 및 14: 16개 뉴클레오티드 프라이머; 레인 9 및 15: 20개 뉴클레오티드 프라이머. 도 24a 레인 4-9는 다양한 프라이머 길이를 갖는 MMLV를 함유하는 역전사 반응에 상응한다. MMLV는 구조화된 RNA 헤어핀을 통해 역전사한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-89를 함유하는 역전사 반응에 상응한다. MG151-89는 16개 및 20개의 뉴클레오티드의 프라이머 길이를 선호하며, 구조화된 RNA 헤어핀에서 역전사를 정지시키는 것으로 보인다. 도 24b 레인 4-9는 다양한 프라이머 길이를 갖는 MG151-92를 함유하는 역전사 반응에 상응한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-97을 함유하는 역전사 반응에 상응한다. MG151-92 또는 MG151-97은 이들 실험 조건 하에서 활성인 것으로 보이지 않는다.
도 25는 2407개의 레트론 RT의계통발생 분석을 도시하며, 제1 후보는 시험관 내에서 강조된 하류 특성화를 위해 선택되었다. 문헌에서 실험적으로 검증된 16개의 레트로엔 중 9개를 첨가하고 트리에서 강조하였다. 회색 별표는 후보 MG154-MG159 및 MG173 계열 구성원을 나타낸다.
도 26은 시험관 내에서 하류 특성화를 위해 선택된 일부 레트론-RT 후보의단백질 정렬을 도시한다. 문서화된 모든 역전사 효소에 공통인 레트론-특이적 모티프 및 촉매 XXDD 코어가 도면에 표시되어 있다.
도 27a는 MG157-1 레트론(두껍고 검은 선 상에 화살표 표지된 RT)의게놈 맥락을 도시한다. 레트론 비-암호화 RNA(ncRNA)는 점선 상자로 강조 표시되어 있다. 도 27b는 MG157-1 레트론 ncRNA의 측부 역 반복이 있음을 보여주는 삽입체를 도시한다. 도 27c는 MG157-1 레트론 ncRNA의 예측된 구조를 도시한다.
도 28a는 MG160-3 레트론-유사 단일-도메인 RT의 게놈 맥락을 도시한다. RT로부터 상류에 있는 영역(점선 상자)은 MG160 구성원에 걸쳐 보존된다. 도 28b는 MG160-3의 3D 구조 예측을 도시하며, 이는 II족 인트론 동결-EM 구조에 정렬된 RT 도메인을 나타낸다. 도 28c는 5개의 MG160 구성원의 5' UTR의 예측된 구조를 도시한다.
도 29는 프라이머 연장 검정에 의한 레트론-유사 후보 MG160-1 내지 MG160-6 및 MG160-8의 시험관 내 활성의 스크리닝을 도시한다. 도 29a 레인 번호는 다음의 샘플에 상응한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 10- 신규 후보 MG160-1 내지 MG160-6 및 MG160-8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 29b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 29a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 30은 시험관 내 전사에 의한 레트론 RT 후보의 세포-무함유 발현 및 레트론 ncRNA의 생성을 도시한다. 도 30a는 세포-무함유 발현 시스템에서의 레트 론 RT 단백질 생산의 확인을 도시한다. 레인은 다음에 해당한다: 1: 래더, 2: 주형 없는 대조군, 3: MG156-1(39 kDa) , 4: MG156-2(40 kDa), 5: MG157-1(38 kDa). 도 30b는 세포-무함유 발현 시스템에서의 레트론 RT 단백질 생산의확인을 도시한다. 레인은 다음에 해당한다- 1: 래더, 2: 주형 없는 대조군, 3: MG157-2(37 kDa), 4: MG157-5(43 kDa), 5: MG159-1(53 kDa), 6: Ec86(38 kDa, 양성 대조군 레트론 RT). 도 30c는 시험관 내 전사에 의한 레트론 ncRNA 주형의생성을 도시한다. 레인은 다음의 레트론에 상응하는 다음의 ncRNA에 상응한다- 1: MG154-1, 2: MG154-2, 3: MG155-1, 4: MG155-2, 5: MG155-3, 6: MG156-1, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86, 14: MG155-4, 15: MG173-1, 16: MG155-5.
도 31은 MG140-1 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 도메인 구조를 도시한다. R2 레트로트랜스포사제(밝은 회색 화살표)는 다수의 Zn-핑거뿐만 아니라 RT 및 엔도뉴클레아제 도메인을 함유한다. MG140-1의 측면에는 트랜스포존 경계를 정의하는 5' 및 3' UTR이 위치한다. MG140-1은 표적 부위 모티프 GGTAGC에서 G 및 T 뉴클레오티드 사이에 정확하게 통합된다.
도 32는 포스포로티오에이트 결합 변형을 함유하는 DNA 올리고를 갖는 프라이머 연장에 의한 RT 활성의 시험을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress PS-변형된 프라이머 1을 갖는 주형 없는 대조군, 2: PURExpress PS-변형된 프라이머 2를 갖는 주형 없는 대조군, 3: PURExpress PS-변형된 프라이머 3을 갖는 주형 없는 대조군, 4: 변형되지 않은 프라이머를 갖는 MMLV RT, 5: PS-변형된 프라이머 1을 갖는 MMLV RT, 6: PS-변형된 프라이머 2를 갖는 MMLV RT, 7: PS-변형된 프라이머 3을 갖는 MMLV RT, 8: 변형되지 않은 프라이머를 갖는 TGIRT-III, 9: PS-변형된 프라이머 1을 갖는 TGIRT-III, 10: PS-변형된 프라이머 2를 갖는 TGIRT-III, 11: PS-변형된 프라이머 3을 갖는 TGIRT-III, 12: 변형되지 않은 프라이머를 갖는 MG153-9, 13: PS-변형된 프라이머 1을 갖는 MG153-9, 14: PS-변형된 프라이머 2를 갖는 MG153-9, 15 PS-변형된 프라이머 3을 갖는 MG153-9. MMLV RT 및 TGIRT-III은 대조군 RT이다.
도 33은 프라이머 연장 검정에 의해 RNA 주형 상에서의 레트론 RT의 활성의 스크리닝을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress 주형 없는 대조군, 2: MMLV 대조군 RT, 3: MG154-1, 4: MG155-1, 5: MG155-2, 6: MG155-3, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86 대조군 레트론 RT, 14: Sa163 대조군 레트론 RT, 15: St85 대조군 레트론 RT. 굵은 글씨체로 표시된 레인은 시험된 기질 상에 프라이머 연장 활성을 나타내는 신규한 레트론 RT에 해당한다.
도 34는 포유류 세포에서 cDNA를 합성하는 MG153 GII 유래 RT의 능력에 대한 스크리닝을 도시한다. 542 bp cDNA 합성 PCR 산물의 검출을 Taqman qPCR로 분석하였다. TGIRT가 1의 값을 나타내는 활성 TGIRT 대조군으로 cDNA 활성을 정규화하였다. Y축은 로그 10 스케일로 도시되어 있다.
도 35는 면역블롯에 의한 MG153 GII 유래 RT의 단백질 발현을 도시한다. 도 35a 및 35b:후보 RT를 함유하는 플라스미드로 세포를 형질감염시키고, 면역블롯에 의해 단백질 발현을 평가하여, RT의 N 말단에 융합된 HA 펩티드를 검출하였다. 모든 레인을 총 단백질 농도로 정규화하였다. 백색 화살표는 단백질의 예상 분자 크기의 2X에서 밴드를 가리키며, 이는 단백질 이량체를 나타낸다. 도 35a 및 도 35b에 기술된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다. 도 35c: GII 유래 RT의 다중 서열 정렬. 나타낸 영역은 정렬의 위치 196 내지 201에 상응한다. 이량체화 모티프 CAQQQ가 강조된다.
도 36은 단백질 발현에 대해 정규화된 GII 유래 RT의 상대 활성을 도시한다. cDNA 합성은 Taqman qPCR에 의해 검출되었고, 단백질 발현은 면역블롯에 의해 검출되었다. TGIRT에 상대적인 활성을 총 단백질 농도에 따라 정규화하였다. Y축은 선형 스케일로 도시되어 있다.
도 1은 박테리아 레트로트랜스포존의 게놈 맥락을 도시한다. MG140-1은 Zn-핑거 DNA 결합 도메인 및 역전사 효소 도메인을 암호화하는 예측된 레트로트랜스포사제(화살표)이다. 레트로트랜스포사제의 측면에 위치하는 영역은 레트로트랜스포사제에 대한 결합 부위를 나타낼 가능성이 있는 이차 구조를 나타낸다(2차 구조 박스 및 확대된 이미지). 다른 상동체와의 유사 영역은 레트로트랜스포존이 통합된 추정 표적 부위를 나타낸다.
도 2는 MG140 계열의 MG 레트로트랜스포사제 단백질 서열의 다중 서열 정렬(MSA)을 도시한다. 도 2a는 역전사 효소 도메인의 MSA를 도시한다. 보존된 촉매 잔기 D, QG, [Y/F]ADD, 및 LG는 컨센서스 서열 상에서 강조된다. 도 2b는 Zn-핑거 및 엔도뉴클레아제 도메인의 MSA를 도시한다. Zn-핑거 모티프(CX[2-3]C), 엔도뉴클레아제 도메인의 일부 및 뉴클레아제 촉매 잔기가 컨센서스 서열 상에서 강조된다.
도 3은 MG 및 기준 레트로트랜스포사제 유전자의 계통발생 유전자 트리를 도시한다. 도 3a는 미생물 MG 레트로트랜스포사제(계통군 4 상의 흑색 분지)가 바이러스 레트로트랜스포사제(계통군 6 상의 회색 분지)보다 진핵생물과 더 밀접하게 관련됨을 도시한다. 계통군 1: 텔로머라아제 역전사 효소; 계통군 2: II족 인트론 역전사 효소; 계통군 3: 진핵생물 R1형 레트로트랜스포사제; 계통군 4: 미생물 및 진핵생물 R2 레트로트랜스포사제; 계통군 5: 진핵생물 레트로바이러스-관련 역전사 효소; 및 계통군 6: 바이러스 역전사 효소. 도 3b는 도 3a의 계통발생 유전자 트리의 계통군 3 및 4를 도시한다. 일부 미생물 MG 레트로트랜스포사제는 다수의 Zn-핑거 모티프(수직 직사각형), 보존된 RVT_1 역전사 효소 도메인, 및 APE/RLE 또는 기타 엔도뉴클레아제 도메인(상단 및 하단 패널)을 함유한다. 일부 미생물 MG 레트로트랜스포사제는 엔도뉴클레아제 도메인(중간 패널)이 결여되어 있다.
도 4는 다양한 효소로부터의 역전사 효소 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. RT 서열은 DNA뿐만 아니라 RNA 조립체로부터 유래하였다. 기준 RT를 분류 목적을 위해 트리에 포함시켰다.
도 5a는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147) 및 관련 RT(MG148)의 신규한 계열로부터 식별된 RT 도메인의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 5b는 비-LTR 레트로트랜스포사제(MG140, MG146 및 MG147)가 RT 도메인, 엔도뉴클레아제 도메인(Endo), 및 다수의 아연-결합 리본 모티프를 함유하는 반면, 계열 MG148 RT는 엔도뉴클레아제 도메인이 결여되어 있음을 입증하는 데이터를 도시한다.
도 6a는 MG140 R2 레트로트랜스포사제가 RT 및 엔도뉴클레아제(EN) 도메인뿐만 아니라 다수의 아연-핑거를 함유하고, 기준 Danio rerio R2 레트로트랜스포사제(R2Dr)와 24% 내지 26%의 평균 아미노산 동일성(AAI)을 공유한다는 것을 입증하는 데이터를 도시한다. 도 6B는 MG140-47 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 데이터를 도시한다. 기준(GQ398061) 리보솜 RNA 오페론에 대한 MG140-47 콘티그의 정렬은 MG140-47 28S rDNA 유전자(점선 박스) 내로의 R2 요소의 통합으로 인해 기준 28S rDNA 유전자에서 큰 갭을 나타낸다.
도 7a는 MG145-45 레트로트랜스포존의 게놈 맥락을 도시한다. 효소는 RT 및 아연-핑거 도메인을 함유한다. 5' 말단에서의 부분적인 18S rDNA 유전자 히트 및 3' 말단에서의 폴리-A 꼬리는 트랜스포존의 경계를 나타낼 가능성이 있다. 도 7b는 MG140-3, MG140-8, 및 MG140-45 게놈 서열의 정렬을 도시하며, 이는 정렬의 위치 200에 대한 18S rRNA 유전자의 보존을 도시하고, R2 요소가 18S rDNA 유전자(화살표)에 통합되었음을 나타낸다.
도 8a는 RT 및 엔도뉴클레아제 도메인을 갖는 MG146-1 레트로트랜스포사제를 암호화하는 콘티그를 도시한다. 도 8b는 동원에 관여할 것으로 예측된 3개의 유전자를 암호화하는 MG140-17-R2 레트로트랜스포존을 도시한다: RNA 인식 모티프 유전자(RRM); 엔도뉴클레아제 효소; 및 RT 및 RNAse H 도메인을 갖는 역전사 효소.
도 9a는 RT의 MG148 계열의 2개의 구성원의게놈 맥락을 도시한다. RT와 연관되지 않은 예측된 유전자는 백색 화살표로 표시된다. 도 9b는 RT의 상류에 보존된 영역(서열 아래의 박스)을 나타내는 MG148 계열의 5개의 구성원의뉴클레오티드 서열 정렬을 도시한다(컨센서스 서열에 걸쳐 주석이 달린 화살표).
도 10은 qPCR(MG140)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타(Taeniopygia guttata)); 양성 대조군 2: R2Bm (봄빅스 모리(Bombyx mori)). 2개의 양성 대조군은 문서화된 R2 레트로트랜스포존이다. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 11은 qPCR(MG146, MG147, MG148)에 의한 효소의 RTns 계열의 시험관 내 활성의 스크리닝을 도시한다. 각각의 RT를 함유하는 프라이머 연장 반응으로부터 유래된 전장 cDNA 산물을 증폭시키는 프라이머를 사용하여 qPCR에 의해 활성을 검출하였다. 샘플은 100 nM 기질을 함유하는 RT 반응으로부터 유래된다. 음성 대조군: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타), 문서화된 R2 레트로트랜스포존. 음성 대조군보다 적어도 10배 신호로서 정의된 활성 후보는 짙은 회색으로 표시되고, 이들 조건에서 비활성인 후보는 밝은 회색으로 표시된다.
도 12는 차세대 시퀀싱에 의해 R2 및 R2-유사 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 배경: PURExpress 반응에서 무-주형수 대조군; 양성 대조군 1: R2Tg (태니오기아 구타타).
도 13a는 다양한 부류의 신규한 계열로부터 식별된 전장 II족 인트론 RT의 다중 서열 정렬로부터 추론된 계통발생 트리를 도시한다. 도 13b는 II족 인트론의 MG 계열의 요약표를 도시한다. AAI: 기준 II족 인트론 서열에 대한 MG 계열의 평균 쌍별 아미노산 동일성.
도 14a 내지 도 14d는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-1 내지 MG153-21 및 MG153-25 내지 MG153-27의 시험관 내 활성의 스크리닝을 도시한다. 도 14a 내지 도 14c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4-MarathonRT 대조군 RT. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 결과는 2개의 독립적인 실험을 나타낸다. 도 14a 레인 번호 5-14는 신규 후보 MG153-1 내지 MG153-10에 상응한다. 도 14b 레인 번호 5-14는 신규 후보 MG153-11 내지 MG153-20에 상응한다. 도 14c 레인 번호 5-8은 신규 후보 MG153-21, MG153-25, MG153-26, 및 MG153-27에 각각 상응한다. 도 14d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 14a 내지 도 14c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 15는 프라이머 연장 검정에 의한 GII 인트론 클래스 C 후보 MG153-28 내지 MG153-37 및 MG153-39 내지 MG153-57의 시험관 내 활성의 스크리닝을 도시한다. 도 15a 내지 도 15c의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT. 굵은 글씨체로 표시된 번호는 겔 레인에 해당한다. 도 15a 레인 번호 4-13은 신규 후보 MG153-28 내지 MG153-37에 상응한다. 도 15b 레인 번호 4-13은 신규 후보 MG153-39 내지 MG153-48에 상응한다. 도 15c 레인 번호 4-13은 신규 후보 MG153-49 내지 MG153-57에 상응한다. 도 15d는 qPCR에 의한 전장 cDNA 생산의 검출을 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 15a 내지 도 15c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 16은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 D MG165 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 16a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 12- 신규 후보 MG165-1 내지 9. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 16b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 16a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 17은 프라이머 연장 분석에 의한 역전사 효소의 GII 인트론 클래스 F MG167 패밀리의 시험관 내 활성의 스크리닝을 도시한다. 도 17a의 경우, 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 - 신규 후보 MG167-1 내지 8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 17b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 17a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 18은 차세대 시퀀싱에 의해 MG153 계열의 GII 인트론 클래스 C RT 후보의 충실도를 평가하기 위한 검정을 도시한다. 프라이머 연장 반응으로부터 생성된 cDNA 산물을 PCR-증폭하고 NGS용 라이브러리를 준비하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다. 결과는 2개의 독립적인 실험으로부터 결정하였다.
도 19는 포유류 세포에서 cDNA를 합성하는 표시된 대조군 RT 및 GII 인트론 클래스 C 후보의 능력을 평가하기 위한 스크리닝을 도시한다. 도 19a는 아가로오스 겔 분석에 의한 542 bp(상단) 및 100 bp(하단) PCR 산물의 검출을 도시한다. 도 19b는 D1000 TapeStation에 의한 542 bp(상단) 및 100bp(하단) PCR 산물의 검출을 도시한다. 도 19c는 추가 후보에 대한 D1000 TapeStation에 의한 542 bp PCR 산물의 검출을 도시한다. 도 19a 및 도 19b에 설명된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다.
도 20a는 전장 G2L4-유사 RT의 계통발생 트리를 도시한다. 기준 G2L4 서열 및 MG172 후보(점)가 강조된다. 도 20b는 기준 및 MG172 RT의 컬럼 277 내지 280이 역전사 효소 기능을 담당하는 촉매 잔기를 나타낸다는 것을 입증하는 데이터를 도시한다.
도 21a는 전장 LTR RT의 계통발생 트리를 도시한다. 기준 LTR RT 서열 및 MG151 후보(점)가 강조된다. 도 21b는 MG151-82 RT(ORF 7로 표지됨)의게놈 맥락을 도시한다. 예측된 도메인은 어두군 상자로서 도시되고, 긴 말단 반복(LTR)은 LTR 트랜스포존의 측면에 위치한 화살표로서 도시된다. 도 21c는 프로테아제, RT, RNAse H 및 인테그라아제 도메인을 보여주는 MG151-82의 3D 구조 예측을 도시한다.
도 22는 프로테아제, RT - RNAse H, 및 인테그라아제 도메인을 강조하기 위한 전장 pol 단백질 서열의 다중 서열 정렬을 도시한다. MMLV RT의 RT, RNAse H, 및 인테그라아제 도메인에 대한 촉매 잔기는 각 도메인 아래에 막대로 도시되어 있다. MMLV 기준 서열의 프로테아제 도메인은 정렬에 도시되지 않는다.
도 23은 프라이머 연장 검정에 의한 바이러스 후보 MG151-80 내지 MG151-97의 시험관 내 활성의 스크리닝을 도시한다. 도 23a의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형; 2-MMLV 대조군 RT; 3-Ty3 대조군 RT; 4 내지 9의 신규 후보 MG151-80 내지 85; 10- RT 대조군. 도 23b의 경우, 레인 번호는 다음에 해당한다: 프라이머에 어닐링된 1-RNA 주형, 2 내지 12- 신규 후보 MG151-87 내지 97, 13-MMLV 대조군 RT. 도 23c는 상이한 완충액 조건에서 Ty3 대조군 RT의 시험관 내 활성에 대한 시험을 도시한다. 레인 번호는 다음에 해당한다: 1-PURExpress 주형 없는 대조군; 2-완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP); 3- 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl2, 1 mM TCEP, 2% PEG-8000); 4-완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl2, 1 mM TCEP, 0.01% (v/v) Triton X-100); 5-완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl2, 1 mM TCEP, 10% 글리세롤). 도 23a 내지 도 23c의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 24는 구조화된 RNA 주형 상에서 후보 MG151-89, MG151-92, 및 MG151-97의 시험관 내 RT 공정도 및 프라이밍 파라미터의 시험을 도시한다. 도 24a 및 도 24b의 경우, 레인 1: 6,10, 및 16개 뉴클레오티드 올리고 마커(화살표); 레인 2: 8, 13, 및 20개 뉴클레오티드 올리고 마커; 레인 3: 43 및 55개 뉴클레오티드 올리고 마커; 레인 4 및 10: 6개 뉴클레오티드 프라이머; 레인 5 및 11: 8개 뉴클레오티드 프라이머; 레인 6 및 12: 10개 뉴클레오티드 프라이머; 레인 7 및 13: 13개 뉴클레오티드 프라이머; 레인 8 및 14: 16개 뉴클레오티드 프라이머; 레인 9 및 15: 20개 뉴클레오티드 프라이머. 도 24a 레인 4-9는 다양한 프라이머 길이를 갖는 MMLV를 함유하는 역전사 반응에 상응한다. MMLV는 구조화된 RNA 헤어핀을 통해 역전사한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-89를 함유하는 역전사 반응에 상응한다. MG151-89는 16개 및 20개의 뉴클레오티드의 프라이머 길이를 선호하며, 구조화된 RNA 헤어핀에서 역전사를 정지시키는 것으로 보인다. 도 24b 레인 4-9는 다양한 프라이머 길이를 갖는 MG151-92를 함유하는 역전사 반응에 상응한다. 레인 10-15는 다양한 프라이머 길이를 갖는 MG151-97을 함유하는 역전사 반응에 상응한다. MG151-92 또는 MG151-97은 이들 실험 조건 하에서 활성인 것으로 보이지 않는다.
도 25는 2407개의 레트론 RT의계통발생 분석을 도시하며, 제1 후보는 시험관 내에서 강조된 하류 특성화를 위해 선택되었다. 문헌에서 실험적으로 검증된 16개의 레트로엔 중 9개를 첨가하고 트리에서 강조하였다. 회색 별표는 후보 MG154-MG159 및 MG173 계열 구성원을 나타낸다.
도 26은 시험관 내에서 하류 특성화를 위해 선택된 일부 레트론-RT 후보의단백질 정렬을 도시한다. 문서화된 모든 역전사 효소에 공통인 레트론-특이적 모티프 및 촉매 XXDD 코어가 도면에 표시되어 있다.
도 27a는 MG157-1 레트론(두껍고 검은 선 상에 화살표 표지된 RT)의게놈 맥락을 도시한다. 레트론 비-암호화 RNA(ncRNA)는 점선 상자로 강조 표시되어 있다. 도 27b는 MG157-1 레트론 ncRNA의 측부 역 반복이 있음을 보여주는 삽입체를 도시한다. 도 27c는 MG157-1 레트론 ncRNA의 예측된 구조를 도시한다.
도 28a는 MG160-3 레트론-유사 단일-도메인 RT의 게놈 맥락을 도시한다. RT로부터 상류에 있는 영역(점선 상자)은 MG160 구성원에 걸쳐 보존된다. 도 28b는 MG160-3의 3D 구조 예측을 도시하며, 이는 II족 인트론 동결-EM 구조에 정렬된 RT 도메인을 나타낸다. 도 28c는 5개의 MG160 구성원의 5' UTR의 예측된 구조를 도시한다.
도 29는 프라이머 연장 검정에 의한 레트론-유사 후보 MG160-1 내지 MG160-6 및 MG160-8의 시험관 내 활성의 스크리닝을 도시한다. 도 29a 레인 번호는 다음의 샘플에 상응한다: 1-PURExpress 주형 없는 대조군, 2-MMLV 대조군 RT, 3-TGIRT-III 대조군 RT, 4 내지 10- 신규 후보 MG160-1 내지 MG160-6 및 MG160-8. 굵은 글씨체로 표시된 번호는 활성 신규 후보를 갖는 겔 레인에 상응한다. 도 29b는 qPCR에 의한 전장 cDNA 생산의 정량화를 도시한다. 진회색 막대는 배경보다 적어도 10배 높은 생성물을 생성하는 RT에 대응한다. 결과는 2개의 기술적 복제물로부터 결정하였다. 도 29a의 화살표는 전장 cDNA 산물(겔의 상단 근처의 화살표) 및 cDNA 강하의 예(아래 화살표)를 나타낸다.
도 30은 시험관 내 전사에 의한 레트론 RT 후보의 세포-무함유 발현 및 레트론 ncRNA의 생성을 도시한다. 도 30a는 세포-무함유 발현 시스템에서의 레트 론 RT 단백질 생산의 확인을 도시한다. 레인은 다음에 해당한다: 1: 래더, 2: 주형 없는 대조군, 3: MG156-1(39 kDa) , 4: MG156-2(40 kDa), 5: MG157-1(38 kDa). 도 30b는 세포-무함유 발현 시스템에서의 레트론 RT 단백질 생산의확인을 도시한다. 레인은 다음에 해당한다- 1: 래더, 2: 주형 없는 대조군, 3: MG157-2(37 kDa), 4: MG157-5(43 kDa), 5: MG159-1(53 kDa), 6: Ec86(38 kDa, 양성 대조군 레트론 RT). 도 30c는 시험관 내 전사에 의한 레트론 ncRNA 주형의생성을 도시한다. 레인은 다음의 레트론에 상응하는 다음의 ncRNA에 상응한다- 1: MG154-1, 2: MG154-2, 3: MG155-1, 4: MG155-2, 5: MG155-3, 6: MG156-1, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86, 14: MG155-4, 15: MG173-1, 16: MG155-5.
도 31은 MG140-1 R2 레트로트랜스포존이 28S rRNA 유전자에 통합됨을 입증하는 도메인 구조를 도시한다. R2 레트로트랜스포사제(밝은 회색 화살표)는 다수의 Zn-핑거뿐만 아니라 RT 및 엔도뉴클레아제 도메인을 함유한다. MG140-1의 측면에는 트랜스포존 경계를 정의하는 5' 및 3' UTR이 위치한다. MG140-1은 표적 부위 모티프 GGTAGC에서 G 및 T 뉴클레오티드 사이에 정확하게 통합된다.
도 32는 포스포로티오에이트 결합 변형을 함유하는 DNA 올리고를 갖는 프라이머 연장에 의한 RT 활성의 시험을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress PS-변형된 프라이머 1을 갖는 주형 없는 대조군, 2: PURExpress PS-변형된 프라이머 2를 갖는 주형 없는 대조군, 3: PURExpress PS-변형된 프라이머 3을 갖는 주형 없는 대조군, 4: 변형되지 않은 프라이머를 갖는 MMLV RT, 5: PS-변형된 프라이머 1을 갖는 MMLV RT, 6: PS-변형된 프라이머 2를 갖는 MMLV RT, 7: PS-변형된 프라이머 3을 갖는 MMLV RT, 8: 변형되지 않은 프라이머를 갖는 TGIRT-III, 9: PS-변형된 프라이머 1을 갖는 TGIRT-III, 10: PS-변형된 프라이머 2를 갖는 TGIRT-III, 11: PS-변형된 프라이머 3을 갖는 TGIRT-III, 12: 변형되지 않은 프라이머를 갖는 MG153-9, 13: PS-변형된 프라이머 1을 갖는 MG153-9, 14: PS-변형된 프라이머 2를 갖는 MG153-9, 15 PS-변형된 프라이머 3을 갖는 MG153-9. MMLV RT 및 TGIRT-III은 대조군 RT이다.
도 33은 프라이머 연장 검정에 의해 RNA 주형 상에서의 레트론 RT의 활성의 스크리닝을 도시한다. 레인 번호는 다음에 해당한다, 1: PURExpress 주형 없는 대조군, 2: MMLV 대조군 RT, 3: MG154-1, 4: MG155-1, 5: MG155-2, 6: MG155-3, 7: MG156-2, 8: MG157-1, 9: MG157-2, 10: MG157-5, 11: MG158-1, 12: MG159-1, 13: Ec86 대조군 레트론 RT, 14: Sa163 대조군 레트론 RT, 15: St85 대조군 레트론 RT. 굵은 글씨체로 표시된 레인은 시험된 기질 상에 프라이머 연장 활성을 나타내는 신규한 레트론 RT에 해당한다.
도 34는 포유류 세포에서 cDNA를 합성하는 MG153 GII 유래 RT의 능력에 대한 스크리닝을 도시한다. 542 bp cDNA 합성 PCR 산물의 검출을 Taqman qPCR로 분석하였다. TGIRT가 1의 값을 나타내는 활성 TGIRT 대조군으로 cDNA 활성을 정규화하였다. Y축은 로그 10 스케일로 도시되어 있다.
도 35는 면역블롯에 의한 MG153 GII 유래 RT의 단백질 발현을 도시한다. 도 35a 및 35b:후보 RT를 함유하는 플라스미드로 세포를 형질감염시키고, 면역블롯에 의해 단백질 발현을 평가하여, RT의 N 말단에 융합된 HA 펩티드를 검출하였다. 모든 레인을 총 단백질 농도로 정규화하였다. 백색 화살표는 단백질의 예상 분자 크기의 2X에서 밴드를 가리키며, 이는 단백질 이량체를 나타낸다. 도 35a 및 도 35b에 기술된 실험과 관련이 없는 레인은 흑색 상자로 덮여있다. 도 35c: GII 유래 RT의 다중 서열 정렬. 나타낸 영역은 정렬의 위치 196 내지 201에 상응한다. 이량체화 모티프 CAQQQ가 강조된다.
도 36은 단백질 발현에 대해 정규화된 GII 유래 RT의 상대 활성을 도시한다. cDNA 합성은 Taqman qPCR에 의해 검출되었고, 단백질 발현은 면역블롯에 의해 검출되었다. TGIRT에 상대적인 활성을 총 단백질 농도에 따라 정규화하였다. Y축은 선형 스케일로 도시되어 있다.
서열 목록에 대한 간단한 설명
본원과 함께 출원된 서열 목록은 본 개시에 따른 방법, 조성물, 및 시스템에 사용하기 위한 예시적인 폴리뉴클레오티드 및 폴리펩티드 서열을 제공한다. 서열 목록 내 서열에 대한 예시적인 설명이 아래에 제시되어 있다.
MG140
서열번호 1-29 및 393-401은 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.
서열번호 374-386은 HA-His-태그된 MG140 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 761-798은 MG140 UTR의 뉴클레오티드 서열을 보여준다.
서열번호 799-894는 MG140 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
MG146
서열번호 402 및 895는 MG140 전위 단백질의 전장 펩티드 서열을 보여준다.
서열번호 387은 HA-His-태그된 MG146 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG147
서열번호 388은 HA-His-태그된 MG147 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG148
서열번호 403-426은 MG148 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 389-392는 HA-His-태그된 MG148 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG149
서열번호 427-439는 MG149 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
MG151
서열번호 440-554는 MG151 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 356-362는 TwinStrep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 363-373은 strep-태그된 MG151 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG153
서열번호 555-608은 MG153 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 30-32 및 40-50은 MG153 역전사 효소 단백질 및 MS2 외피 단백질(MCP)을 포함하는 융합 단백질의 뉴클레오티드 서열을 보여준다.
서열번호 66-119는 strep-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 120-173은 MG153 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 740-756은 MCP-태그된 MG153 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG154
서열번호 609-610은 MG154 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 308-309는 strep-태그된 MG154 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 324-325는 MG154 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 340-341은 MG154 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG155
서열번호 611-615는 MG155 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 310-312는 strep-태그된 MG155 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 326-328은 MG155 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 342-344는 MG155 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG156
서열번호 616-617은 MG156 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 313-314는 strep-태그된 MG156 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 329-330은 MG156 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 345-346은 MG156 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG157
서열번호 618-622는 MG157 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 315-319는 strep-태그된 MG157 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 331-335는 MG157 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 347-351은 MG157 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG158
서열번호 623은 MG158 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 320은 strep-태그된 MG158 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 336은 MG158 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 352는 MG158 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG159
서열번호 624-626은 MG159 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 321-323은 strep-태그된 MG159 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 337-339는 MG159 역전사 효소 단백질을 암호화하는 대장균 코돈 최적화된 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 353-355는 MG159 뉴클레아제와 호환 가능한 ncRNA의 뉴클레오티드 서열을 보여준다.
MG160
서열번호 627-673은 MG160 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 174-180은 strep-태그된 MG160 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 181-187은 최적화된 MG160 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG163
서열번호 674-678은 MG163 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 188-192는 strep-태그된 MG163 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 193-197은 최적화된 MG163 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG164
서열번호 679-683은 MG164 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 198-202는 strep-태그된 MG164 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 203-207은 최적화된 MG164 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG165
서열번호 684-692는 MG165 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 208-216은 strep-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 217-225는 최적화된 MG165 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 757-759는 MCP-태그된 MG165 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG166
서열번호 693-697은 MG166 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 226-230은 strep-태그된 MG166 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 231-235는 최적화된 MG166 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG167
서열번호 698-702는 MG167 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 236-240은 strep-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 241-245는 최적화된 MG167 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 759-760은 MCP-태그된 MG167 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
MG168
서열번호 703-707은 MG168 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 246-250은 strep-태그된 MG168 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 251-255는 최적화된 MG168 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG169
서열번호 708-718은 MG169 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 256-266은 strep-태그된 MG169 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 267-277은 최적화된 MG169 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG170
서열번호 719-728은 MG170 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 278-287은 strep-태그된 MG170 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 288-297은 최적화된 MG170 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG172
서열번호 729-733은 MG172 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
서열번호 298-302는 strep-태그된 MG172 역전사 효소 단백질을 암호화하는 유전자의 뉴클레오티드 서열을 보여준다.
서열번호 303-307은 최적화된 MG172 역전사 효소 단백질을 암호화하는 대장균 코돈 유전자의 뉴클레오티드 서열을 보여준다.
MG173
서열번호 734-735는 MG173 역전사 효소 단백질의 전장 펩티드 서열을 보여준다.
기타 서열
서열번호 736-738은 포스포로티오에이트-변형된 프라이머의 뉴클레오티드 서열을 보여준다.
서열번호 739는 qPCR에 대한 Taqman 프로브의 뉴클레오티드 서열을 보여준다.
발명을 실시하기 위한 구체적인 내용
본 발명의 다양한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 수 있다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.
달리 명시되지 않는 한, 본원에 개시된 일부 방법을 실시하는 데에는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈, 및 재조합 DNA의 기술이 사용된다. 예를 들어 Sambrook 및 Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel 등(편); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames 및 G.R. Taylor(편) (1995)), Harlow and Lane(편) (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney(편) (2010))을 참조한다(이들은 그 전체가 참조로서 본원에 통합됨).
본원에서 사용되는 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 달리 명시되지 않는 한, 복수 형태도 포함하도록 의도된다. 또한, 용어 "포함하는(including, includes, having, has, with)" 또는 이의 변형된 표현이 발명을 실시하기 위한 구체적인 내용 및/또는 청구범위에 사용되는 정도까지, 이러한 용어는 용어 "포함하는(comprising)"과 유사한 방식으로 포괄적인 것으로 의도된다.
용어 "약" 또는 "대략"은 당업자에 의해 결정되는 특정 값에 대한 허용 가능한 오차 범위 내의 것을 의미하며, 이는 값이 측정되거나 결정되는 방법, 예를 들어 측정 시스템의 한계에 부분적으로 좌우될 것이다. 예를 들어, "약"은 당 기술분야의 관행에 따라 하나 또는 둘 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 최대 20%, 최대 15%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다.
본원에서 사용되는 바와 같이, "세포"는 일반적으로 생물학적 세포를 지칭한다. 세포는 살아있는 유기체의 기본 구조, 기능, 또는 생물학적 단위일 수 있다. 세포는 하나 이상의 세포를 갖는 임의의 유기체로부터 유래될 수 있다. 일부 비제한적인 예는 다음을 포함한다: 원핵 세포, 진핵 세포, 박테리아 세포, 고세균 세포, 단세포 진핵생물의 세포, 원생동물 세포, 식물 유래의 세포(예를 들어, 식물 작물, 과일, 야채, 곡물, 대두, 옥수수(corn), 옥수수(maize), 밀, 씨앗, 토마토, 쌀, 카사바, 사탕수수, 호박, 건초, 감자, 면, 대마, 담배, 개화 식물, 침엽수, 겉씨식물, 양치류, 석송, 뿔이끼류, 우산이끼, 이끼 유래의 세포), 해조류 세포(예를 들어, 보트리오코커스 브라우니(Botryococcus braunii), 클라미도모나스 라인하르트티(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 쌍발이모자반(Sargassum patens C. Agardh, 등), 해초(예를 들어, 켈프), 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추 동물(예를 들어, 초파리, 자포류, 극피동물, 선충 등) 유래의 세포. 척추동물(예를 들어, 생선, 양서류, 파충류, 새, 포유동물) 유래의 세포, 포유동물(예를 들어, 돼지, 젖소, 염소, 양, 설치류, 랫트, 마우스, 비인간 영장류, 인간 등) 유래의 세포, 등. 때로는, 세포는 천연 유기체로부터 유래되지 않는다(예를 들어, 세포는 합성으로 만들어질 수 있고, 이는 가끔 인공 세포라 불린다).
본원에서 사용되는 용어 "뉴클레오티드"는 일반적으로 염기-당-인산염의 조합을 지칭한다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열(예를 들어, 데옥시리보핵산(DNA) 및 리보핵산(RNA))의 단량체 단위일 수 있다. 뉴클레오티드라는 용어는 리보뉴클레오시드 삼인산, 아데노신 삼인산(ATP), 우리딘 삼인산(UTP), 시토신 삼인산(CTP), 구아노신 삼인산(GTP), 및 데옥시리보뉴클레오시드 삼인산, 예컨대 dATP, dCTP, dITP, dUTP, dGTP, dTTP, 또는 이들의 유도체를 포함할 수 있다. 이러한 유도체는, 예를 들어, [αS]dATP, 7-데아자-dGTP 및 7-데아자-dATP, 및 이를 함유하는 핵산 분자에 뉴클레아제 저항성을 부여하는 뉴클레오티드 유도체를 포함할 수 있다. 본원에서 사용되는 바와 같이, 용어 뉴클레오티드는 디데옥시리보뉴클레오시드 삼인산(ddNTP) 및 이들의 유도체를 지칭할 수 있다. 디데옥시리보뉴클레오시드 삼인산의 예시적인 예는 ddATP, ddCTP, ddGTP, ddITP, 및 ddTTP를 포함할 수 있지만, 이에 한정되지는 않는다. 뉴클레오티드는 표지되지 않거나, 예컨대 광학적으로 검출 가능한 모이어티(예를 들어, 형광단)를 포함하는 모이어티를 사용하여 검출 가능하게 표지될 수 있다. 표지화는 양자점(quantum dots)으로 수행될 수도 있다. 검출 가능한 표지는, 예를 들어, 방사성 동위원소, 형광 표지, 화학발광 표지, 생물발광 표지, 및 효소 표지를 포함할 수 있다. 뉴클레오티드의 형광 표지는 플루오레세인, 5-카르복시플루오레세인(FAM), 2'7'-디메톡시-4'5-디클로로-6-카르복시플루오레세인(JOE), 로다민, 6-카르복시로다민(R6G), N,N,N',N'-테트라메틸-6-카르복시로다민(TAMRA), 6-카르복시-X-로다민(ROX), 4-(4'디메틸아미노페닐아조) 벤조산(DABCYL), 캐스케이드 블루(Cascade Blue), 오레곤 그린(Oregon Green), 텍사스 레드(Texas Red), 사아닌, 및 5-(2'-아미노에틸)아미노나프탈렌-1-설폰산(EDANS)을 포함할 수 있지만 이에 한정되지는 않는다. 형광 표지된 뉴클레오티드의 특정 예는 다음을 포함할 수 있다: Perkin Elmer(Foster City, Calif)로부터 입수할 수 있는 [R6G]dUTP, [TAMRA]dUTP, [R110]dCTP, [R6G]dCTP, [TAMRA]dCTP, [JOE]ddATP, [R6G]ddATP, [FAM]ddCTP, [R110]ddCTP, [TAMRA]ddGTP, [ROX]ddTTP, [dR6G]ddATP, [dR110]ddCTP, [dTAMRA]ddGTP, 및 [dROX]ddTTP; Amersham(Arlington Heights, Il.)으로부터 입수할 수 있는 FluoroLink 데옥시뉴클레오티드, FluoroLink Cy3-dCTP, FluoroLink Cy5-dCTP, FluoroLink 플루오르 X-dCTP, FluoroLink Cy3-dUTP, 및 FluoroLink Cy5-dUTP; Boehringer Mannheim(Indianapolis, Ind.)으로부터 입수할 수 있는 플루오레세인-15-dATP, 플루오레세인-12-dUTP, 테트라메틸-로다민-6-dUTP, IR770-9-dATP, 플루오레세인-12-ddUTP, 플루오레세인-12-UTP, 및 플루오레세인-15-2'-dATP; 및 Molecular Probes(Eugene, Oreg.)로부터 입수할 수 있는 염색체 표지된 뉴클레오티드, BODIPY-FL-14-UTP, BODIPY-FL-4-UTP, BODIPY-TMR-14-UTP, BODIPY-TMR-14-dUTP, BODIPY-TR-14-UTP, BODIPY-TR-14-dUTP, 캐스케이드 블루-7-UTP, 캐스케이드 블루-7-dUTP, 플루오레세인-12-UTP, 플루오레세인-12-dUTP, 오레곤 그린 488-5-dUTP, 로다민 그린-5-UTP, 로다민 그린-5-dUTP, 테트라메틸로다민-6-UTP, 테트라메틸로다민-6-dUTP, 텍사스 레드-5-UTP, 텍사스 레드-5-dUTP, 및 텍사스 레드-12-dUTP. 뉴클레오티드는 화학적 변형에 의해 표지되거나 표시될 수도 있다. 화학적으로 변형된 단일 뉴클레오티드는 비오틴-dNTP일 수 있다. 비오틴화된 dNTP의 일부 비제한적인 예는 다음을 포함할 수 있다: 비오틴-dATP(예를 들어, 비오-N6-ddATP, 비오틴-14-dATP), 비오틴-dCTP(예를 들어, 비오틴-11-dCTP, 비오틴-14-dCTP), 및 비오틴-dUTP(예를 들어, 비오틴-11-dUTP, 비오틴-16-dUTP, 비오틴-20-dUTP).
용어 "폴리뉴클레오티드", "올리고뉴클레오티드", 및 "핵산"은 일반적으로 임의의 길이를 가진 뉴클로에티드의 중합체 형태를 지칭하도록 사용 교환적으로 사용되며, 상기 뉴클레오티드는 단일 가닥, 이중 가닥, 또는 다중 가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드이거나, 이의 유사체일 수 있다. 폴리뉴클레오티드는 세포에 대해 외인성이거나 내인성일 수 있다. 폴리뉴클레오티드는 무세포 환경에서 존재할 수 있다. 폴리뉴클레오티드는 유전자이거나 이의 단편일 수 있다. 폴리뉴클레오티드는 DNA일 수 있다. 폴리뉴클레오티드는 RNA일 수 있다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있고 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드는 하나 이상의 유사체(예를 들어, 백본, 당, 또는 핵염기가 변경된 유사체)를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형은 중합체의 조립 전 또는 후에 부여될 수 있다. 유사체의 일부 비제한적인 예는 다음을 포함한다: 5-브로모우라실, 펩티드 핵산, 제노 핵산(xeno nucleic acid), 모르폴리노, 잠금 핵산, 글리콜 핵산, 트레오스 핵산, 디데옥시뉴클레오티드, 코르디세핀, 7-데아자-GTP, 형광단 (예를 들어, 당류에 연결된 로다민 또는 플루오레세인), 티올 함유 뉴클레오티드, 비오틴 연결된 뉴클레오티드, 형광 염기 유사체, CpG 섬, 메틸-7-구아노신, 메틸화된 뉴클레오티드, 이노신, 티오우리딘, 슈도우리딘, 디하이드로우리딘, 큐오신, 및 와이오신. 폴리뉴클레오티드의 비제한적인 예는 다음을 포함한다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌/유전자좌들, 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA (tRNA), 리보솜 RNA (rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 무세포 DNA(cfDNA) 및 무세포 RNA(cfRNA)를 포함하는 무세포 폴리뉴클레오티드, 핵산 프로브, 및 프라이머. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다.
용어 "형질감염(transfection 또는 transfected)"은 일반적으로 비-바이러스적인 방법 또는 바이러스-기반 방법에 의해 핵산을 세포 내로 도입하는 것을 지칭한다. 핵산 분자는 완전한 단백질 또는 이의 기능적 부분을 암호화하는 유전자 서열일 수 있다. 예를 들어, Sambrook 등의 문헌[1989, Molecular Cloning: A Laboratory Manual, 18.1-18.88(이는 본원에 참조로서 전체적으로 통합됨)]을 참조한다.
용어 "펩티드", "폴리펩티드", 및 "단백질"은 일반적으로 펩티드 결합에 의해 결합된 적어도 2개의 아미노산 잔기로 이루어진 중합체를 지칭하도록 본원에서 상호 교환적으로 사용된다. 이 용어는 중합체의 특정 길이를 의미하지 않으며, 펩티드가 재조합 기술, 화학적 또는 효소적 합성을 사용해 생산되는지 또는 자연적으로 발생하는지를 암시하거나 구별하도록 의도되지도 않는다. 상기 용어는 자연적으로 발생하는 아미노산 중합체뿐만 아니라 적어도 하나의 변형된 아미노산을 포함하는 아미노산 중합체에도 적용된다. 일부 실시예에서, 중합체는 비-아미노산에 의해 중단될 수 있다. 상기 용어는 전장 단백질을 포함하는 임의의 길이의 아미노산 사슬, 및 2차 또는 3차 구조(예를 들어, 도메인)가 있거나 없는 단백질을 포함한다. 상기 용어는 예를 들어, 이황화 결합 형성, 당질화, 지질화, 아세틸화, 인산화, 산화, 및 표지 성분과의 접합과 같은 임의의 다른 조작에 의해 변형된 아미노산 중합체도 포함한다. 본원에서 사용되는 용어 "아미노산(들)"은, 변형된 아미노산 및 아미노산 유사체를 포함하되 이에 한정되지 않는, 천연 및 비-천연 아미노산을 일반적으로 지칭한다. 변형된 아미노산은, 아미노산 상에는 자연적으로 존재하지 않는 기 또는 화학적 모이어티를 포함하도록 화학적으로 변형된 천연 아미노산 및 비-천연 아미노산을 포함할 수 있다. 아미노산 유사체는 아미노산 유도체를 지칭할 수 있다. 용어 "아미노산"은 D-아미노산 및 L-아미노산 둘 모두를 포함한다.
본원에서 사용되는 바와 같이, "비-고유(non-native)"는 고유 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩티드 서열을 일반적으로 지칭할 수 있다. 비-고유는 친화성 태그를 지칭할 수 있다. 비-고유는 융합을 지칭할 수 있다. 비-고유는 돌연변이, 삽입, 또는 결실을 포함하는 자연 발생 핵산 또는 폴리펩티드 서열을 지칭할 수 있다. 비-고유 서열은 비-고유 서열이 융합되는 핵산 또는 폴리펩티드 서열에 의해서도 나타날 수 있는 활성(예를 들어, 효소 활성, 금속전이효소 활성, 아세틸전이효소 활성, 키나아제 활성, 유비퀴틴화 활성 등)을 나타내거나 이를 암호화할 수 있다. 비-고유 핵산 또는 폴리펩티드 서열은 유전자 조작에 의해 자연 발생 핵산 또는 폴리펩티드 서열(또는 이의 변이체)에 연결되어 키메라 핵산 또는 폴리펩티드를 암호화하는 키메라 핵산 또는 폴리펩티드 서열을 생성할 수 있다.
본원에서 사용되는 바와 같이, 용어 "프로모터"는, 유전자의 전사 또는 발현을 조절하고 RNA 전사가 개시되는 뉴클레오티드 또는 뉴클레오티드의 영역에 인접하게 위치하거나 이와 중첩될 수 있는 조절 DNA 영역을 일반적으로 지칭한다. 프로모터는 종종 전사 인자로서 지칭되는 단백질 인자에 결합하는 특이적 DNA 서열을 함유할 수 있는데, 상기 인자는 RNA 중합효소가 DNA에 결합하는 것을 용이하게 하여 유전자 전사를 유도한다. '코어 프로모터'로도 지칭되는 '기저 프로모터(basal promoter)'는 작동 가능하게 연결된 폴리뉴클레오티드의 전사 발현을 촉진하는 모든 기본 요소를 함유하는 프로모터를 일반적으로 지칭할 수 있다. 진핵생물 기저 프로모터는 TATA-박스 또는 CAAT 박스를 함유할 수 있다.
본원에서 사용되는 바와 같이, 용어 "발현"은 핵산 서열 또는 폴리뉴클레오티드가 DNA 주형으로부터 (예컨대 mRNA 또는 다른 RNA 전사체로) 전사되는 공정 또는 전사된 mRNA가 후속하여 펩티드, 폴리펩티드, 또는 단백질로 번역되는 공정을 일반적으로 지칭한다. 전사체 및 암호화된 폴리펩티드는 "유전자 산물"로서 통칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된(operably linked, operable linkage, operatively linked)" 또는 이와 문법적으로 동등한 표현은 유전자 요소, 예를 들어, 프로모터, 인핸서, 폴리아데닐화 서열 등의 병치를 일반적으로 지칭하는데, 여기서 요소들은 이들이 예상된 방식으로 작동하도록 허용하는 관계에 있다. 예를 들어, 프로모터 또는 인핸서 서열을 포함할 수 있는 조절 요소가 코딩 서열의 전사 개시에 도움을 주는 경우, 조절 요소는 코딩 영역에 작동 가능하게 연결된다. 이러한 기능적 관계가 유지되는 한, 조절 요소와 코딩 영역 사이에 개재 잔기가 있을 수 있다.
본원에서 사용되는 바와 같이, "벡터"는 일반적으로 폴리뉴클레오티드를 포함하거나 폴리뉴클레오티드와 결합하고 폴리뉴클레오티드를 세포로 전달하는 것을 매개하는데 사용될 수 있는 거대분자 또는 거대분자의 연관을 지칭한다. 벡터의 예는 플라스미드, 바이러스 벡터, 리포좀, 및 기타 유전자 전달 비히클을 포함한다. 벡터는 유전자에 작동 가능하게 연결되어 표적에서 유전자의 발현을 용이하게 하는 유전자 요소, 예를 들어 조절 요소를 일반적으로 포함한다.
본원에서 사용되는 바와 같이, "발현 카세트" 및 "핵산 카세트"는 함께 발현되거나 발현을 위해 작동 가능하게 연결된 핵산 서열 또는 요소의 조합을 지칭하기 위해 일반적으로 상호 교환적으로 사용된다. 일부 실시예에서, 발현 카세트는 조절 요소와 발현을 위해 조절 요소가 작동 가능하게 연결되는 유전자(들)의 조합을 지칭한다.
DNA 또는 단백질 서열의 "기능적 단편"은 전장 DNA 또는 단백질 서열의 생물학적 활성과 실질적으로 유사한 생물학적 활성(기능적 또는 구조적 활성)을 보유하는 단편을 일반적으로 지칭한다. DNA 서열의 생물학적 활성은 전장 서열에 기인한 방식으로 발현에 영향을 미치는 이의 능력일 수 있다.
본원에서 사용되는 바와 같이, "조작된" 객체란 객체가 인간 개입에 의해 변형되었음을 일반적으로 나타낸다. 비제한적인 예에 따르면: 핵산은 이의 서열을 자연에서 발생하지 않는 서열로 변경함으로써 변형될 수 있고; 핵산은 이 핵산을 자연에서 연관되지 않는 핵산과 결합시키되, 결합 산물이 원래 핵산에 존재하지 않는 기능을 갖도록 결합시킴으로써 변형될 수 있고; 조작된 핵산은 자연에서 존재하지 않는 서열을 이용해 시험관 내에서 합성될 수 있고; 단백질은 이의 아미노산 서열을 자연에서 존재하지 않는 서열과 치환함으로써 변형될 수 있고; 조작된 단백질은 새로운 기능 또는 특성을 획득할 수 있다. "조작된" 시스템은 적어도 하나의 조작된 구성요소를 포함한다.
본원에서 사용되는 바와 같이, "합성" 및 "인공"은, 대체적으로 자연 발생 인간 단백질과 낮은 서열 동일성(예를 들어, 50% 미만의 서열 동일성, 25% 미만의 서열 동일성, 10% 미만의 서열 동일성, 5% 미만의 서열 동일성, 1% 미만의 서열 동일성)을 갖는 단백질 또는 이의 도메인을 지칭하도록 상호 교환적으로 사용될 수 있다. 예를 들어, VPR 및 VP64 도메인은 합성 전사 활성화 도메인이다.
본원에서 사용되는 바와 같이, 용어 "전위 가능한 요소(transposable element)"는 게놈 내의 한 위치에서 다른 위치로 이동할 수 있는 DNA 서열을 지칭한다(예를 들어, 이들은 "전위(transposed)"될 수 있음). 전위 가능한 요소는 일반적으로 2개의 부류로 분할될 수 있다. 클래스 I 전위 가능한 요소, 또는 "레트로트랜스포존"은 RNA 중간체의 전사 및 번역을 통해 전위되고, 이어서 역전사를 통해 그의 새로운 위치에 재통합된다(역전사 효소에 의해 매개되는 과정). 클래스 II 전위 가능한 요소, 또는 "DNA 트랜스포존"은 트랜스포사제가 양측에 위치하는 단일-가닥 또는 이중-가닥 DNA의 복합체를 통해 전위된다. 이러한 효소 계열의 추가 특징은, 예를 들어, Nature Education 2008, 1 (1), 204; 및 Genome Biology 2018, 19 (199), 1-12에서 찾을 수 있으며, 이들 각각은 참조로서 본원에 통합된다.
본원에서 사용되는 바와 같이, 용어 "레트로트랜스포존"은 RNA 중간체를 포함하는 2-파트 "복사 및 붙여넣기" 메커니즘에 따라 기능하는 클래스 I 전위 가능한 요소를 지칭한다. "레트로트랜스포사제"는 레트로트랜스포존의 전위를 담당하는 효소를 지칭한다. 일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함한다.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서의 용어 "서열 동일성" 또는 "동일성 백분율"은, 서열 비교 알고리즘을 사용해 측정했을 때, 부분적 또는 전체 비교 윈도우에 걸쳐 비교하고 최대 상응에 정렬했을 때 동일한 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열; 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 백분율을 갖는 2개(예를 들어, 쌍으로 정렬했을 때) 또는 그 이상(예를 들어, 다수의 서열을 정렬했을 때)의 서열을 일반적으로 지칭한다. 폴리펩티드 서열에 대한 적절한 서열 비교 알고리즘은 예를 들어 다음을 포함한다: 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 30개 잔기를 초과하는 길이의 폴리펩티드 서열에 대해서는 조건부 조성 스코어 매트릭스 조정(conditional compositional score matrix)을 사용하는 BLASTP; 단어 길이(W) 2, 기대치(E) 1000000의 파라미터, 및 30개 잔기 미만의 서열에 대해서는 PAM30 스코어링 매트릭스(개방 갭 9, 연장 갭 1의 갭 비용 설정 - 이들은 https://blast.ncbi.nlm.nih.gov에서 이용할 수 있는 BLAST 세트 중 BLASTP에 대한 디폴트 파라미터임)를 사용하는 BLASTP; 일치 2, 불일치 -1, 및 갭 -1의 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW; 디폴트 파라미터를 사용하는 MUSCLE; retree 2 및 최대 반복 1000의 파라미터를 사용하는 MAFFT; 디폴트 파라미터를 사용하는 Novafold; 디폴트 파라미터를 사용하는 HMMER hmmalign.
2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "최적으로 정렬된"은 일반적으로, 예를 들어, 최고 또는 "최적화된" 동일성 백분율 점수를 생성하는 정렬에 의해 결정했을 때, 아미노산 잔기 또는 뉴클레오티드의 최대 상응성에 정렬된 2개 이상의 (예를 들어, 쌍 정렬의) (예를 들어, 다중 서열 정렬의) 서열을 지칭한다.
용어 "개방 해독 프레임" 또는 "ORF"는 일반적으로 단백질 또는 단백질의 일부를 암호화할 수 있는 뉴클레오티드 서열을 지칭한다. 개방 해독 프레임은 시작 코돈(예를 들어, RNA 분자의 경우 AUG 및 표준 코드의 DNA 분자 중 ATG로 표시됨)으로 시작할 수 있고, 프레임이 정지 코돈(예를 들어, RNA 분자의 경우 UAA, UGA 또는 UAG 및 표준 코드의 DNA 분자 중 TAA, TGA 또는 TAG로 표시됨)으로 끝날 때까지 코돈-트리플릿에서 판독될 수 있다.
하나 이상의 보존적 아미노산 치환을 갖는 본원에 기술된 효소 중 어느 하나의 변이체가 본 개시내용에 포함된다. 이러한 보존적 치환은 폴리펩티드의 3차원 구조 또는 기능을 파괴하지 않고도 폴리펩티드의 아미노산 서열에서 이루어질 수 있다. 보존적 치환은 소수성, 극성, 및 R 사슬 길이가 서로 유사한 아미노산들을 치환함으로써 달성될 수 있다. 추가적으로 또는 대안적으로, 상이한 종의 상동성 단백질의 정렬된 서열을 비교함으로써, 종들 간에 돌연변이된 아미노산 잔기(예를 들어, 암호화된 단백질의 기본 기능을 변경시키지 않은 비보존적 잔기)를 위치시킴으로써 보존적 치환을 식별할 수 있다. 이러한 보존적으로 치환된 변이체는 본원에 기술된 레트로트랜스포사제 단백질 서열 중 어느 하나(예를 들어 본원에 기술된 MG140 계열 레트로트랜스포사제, 또는 본원에 기술된 임의의 기타 계열 레트로트랜스포사제)와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는 변이체를 포함할 수 있다. 일부 실시예에서, 이러한 보존적으로 치환된 변이체는 기능적 변이체이다. 이러한 기능적 변이체는 레트로트랜스포사제의 하나 이상의 중요한 활성 부위 잔기의 활성이 파괴되지 않도록 치환된 서열을 포함할 수 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 중 적어도 하나의 치환이 결여되어 있다. 일부 실시예에서, 본원에 기술된 단백질 중 어느 하나의 기능적 변이체에는 도 2에 언급된 보존된 또는 기능적 잔기 모두의 치환이 결여되어 있다.
또한, 본 개시내용에는 효소의 활성을 감소시키거나 제거하기 위해 하나 이상의 촉매 잔기의 치환을 갖는, 본원에 기술된 효소 중 어느 하나의 변이체(예를 들어, 감소된-활성 변이체)가 포함된다. 일부 실시예에서, 본원에 기술된 단백질로서의 감소된 활성 변이체는 도 2에 언급된 적어도 1개, 적어도 2개, 또는 3개의 촉매 잔기 모두의 파괴 치환을 포함한다.
기능적으로 유사한 아미노산을 제공하는 보존적 치환 표는 다양한 참조 문헌을 통해 이용할 수 있다(예를 들어, Creighton의 문헌[Protein: Structures and Molecular Properties (W H Freeman & Co.; 2nd Edition (1993년 12월)] 참조). 다음의 8개의 기는 서로에 대해 보존적 치환인 아미노산을 각각 함유한다:
1) 알라닌 (A), 글리신 (G);
2) 아스파르트산 (D), 글루탐산 (E);
3) 아스파라긴 (N), 글루타민 (Q);
4) 아르기닌 (R), 리신 (K);
5) 이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V);
6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W);
7) 세린 (S), 트레오닌 (T); 및
8) 시스테인 (C), 메티오닌 (M).
하나 이상의 치환, 결실, 또는 삽입을 갖는 본원에 기술된 핵산 서열 중 어느 하나의 변이체가 또한 본 개시내용에 포함된다. 일부 실시예에서, 이러한 변이체는 본원에 기술된 핵산 서열 중 어느 하나와 적어도 약 80%, 적어도 약 81%, 적어도 약 82%, 적어도 약 83%, 적어도 약 84%, 적어도 약 85%, 적어도 약 86%, 적어도 약 87%, 적어도 약 88%, 적어도 약 89%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99%, 또는 100% 서열 동일성을 갖는다.
본원에 기술된 단백질 서열 중 일부는 선택된 더 큰 단백질(예를 들어, 레트로트랜스포사제)의 서열로부터 특정 도메인(예를 들어, 역전사 효소 또는 RT 도메인)의 결정을 포함한다. 이러한 경우, 도메인이 검증된(예를 들어, 3D 구조로) 기준 더 큰 단백질(예를 들어, 레트로트랜스포사제)과 다중 서열 정렬(MSA, multiple sequence alignment)을 사용하여, 선택된 단백질을 검증된 도메인이 있는 더 큰 단백질에 정렬시킴으로써 도메인 경계가 식별된다. 서열이 너무 다양하기 때문에 MSA가 결정적이지 않은 경우, 더 큰 단백질의 3D 구조가 결정되고 구조 도메인이 알려진 도메인과 비교되어 경계가 한정된다. 이들 경계는 도메인 경계 내에서 도메인에 대한 중요한 촉매 잔기의 존재를 보장함으로써 추가로 검증될 수 있다.
본원에서 사용되는 바와 같이, 용어 "LINE 레트로트랜스포사제"는 일반적으로 자율적인 비-LTR 레트로트랜스포존(긴 산재 요소(Long INterspersed Element))의 부류를 지칭한다. 본원에서 사용되는 바와 같이, 용어 "R2 레트로트랜스포사제" 또는 "R4 레트로트랜스포사제"는 일반적으로 유사한 도메인 구조를 공유하지만 R2 레트로트랜스포사제에서는 부위 특이적(예를 들어, rRNA 유전자의 특정 부위에서의 통합)일 수 있는 반면, R4 레트로트랜스포존은 rRNA 유전자뿐만 아니라 반복을 함유하는 다른 비특이적 부위 모두에서 통합될 수 있다는 점에서 상이한 LINE 레트로트랜스포사제의 하위 부류를 지칭한다.
개요
독특한 기능 및 구조를 갖는 새로운 전위 가능한 요소의 발견은 데옥시리보핵산(DNA)을 추가로 파괴할 수 있는 편집 기술을 제공함으로써, 속도, 특이성, 기능, 및 사용 편이성을 개선할 수 있다. 미생물에서 전위 가능한 요소의 예측된 출현률 및 미생물 종의 얇은 다양성에 비하여, 비교적 적은 기능적으로 특성화된 전위 가능한 요소가 문헌에 존재한다. 이는 부분적으로는 많은 수의 미생물 종이 실험실 조건에서 쉽게 배양되지 않을 수 있기 때문이다. 많은 수의 미생물 종을 포함하는 자연 환경 적소로부터의 메타게놈 시퀀싱은 신규 문서화된 전위 가능한 요소의 수를 극적으로 증가시키고 새로운 올리고뉴클레오티드 편집 기능의 발견을 가속화할 수 있는 가능성을 제공할 수 있다.
전위 가능한 요소는 게놈 내의 위치를 변화시킬 수 있는 데옥시리보핵산 서열로서, 종종 돌연변이의 생성 또는 완화를 초래한다. 진핵생물에서, 게놈의 큰 비율, 및 세포 DNA의 질량의 큰 공유는 전위 가능한 요소에 기인한다. 전위 가능한 요소는 다른 유전자를 희생하여 자신을 전파하는 "이기적 유전자(selfish genes)"이지만, 이들은 다양한 중요한 기능을 수행하고 게놈 진화에 중요한 것으로 밝혀졌다. 그들의 메커니즘에 기초하여, 전위 가능한 요소는 클래스 I "레트로트랜스포존" 또는 클래스 II "DNA 트랜스포존"으로 분류된다.
레트로트랜스포존으로도 지칭되는 클래스 I 전위 가능한 요소는 RNA 중간체를 포함하는 2개-부분 "복사 및 붙여넣기" 메커니즘에 따라 기능한다. 먼저, 레트로트랜스포존이 전사된다. 생성된 RNA는 이어서 역전사 효소(일반적으로 레트로트랜스포존 자체에 의해 암호화됨)에 의해 DNA로 다시 전환되고, 역 전사된 레트로트랜스포존은 인테그라아제에 의해 게놈 내의 그의 새로운 위치에 통합된다. 레트로트랜스포존은 3개의 목(order)으로 추가로 분류된다. 긴 말단 반복("LTR", long terminal repeat)을 갖는 레트로트랜스포존은 역전사 효소를 암호화하고 반복 DNA의 긴 가닥이 측면에 위치한다. 긴 산재된 핵 요소("LINE", long interspersed nuclear element)를 갖는 레트로트랜스포존은 역전사 효소를 암호화하고, LTR이 결여되고, RNA 중합효소 II에 의해 전사된다. 짧은 산재된 핵 요소("SINE", short interspersed nuclear element)를 갖는 레트로트랜스포존은 RNA 중합효소 III에 의해 전사되지만, 역전사 효소가 결여되어 있으며, 대신에 다른 전위 가능한 요소(예를 들어, LINE)의 역전사 기구에 의존한다.
DNA 트랜스포존으로도 지칭되는 클래스 II 전위 가능한 요소는 RNA 중간체를 포함하지 않는 메커니즘에 따라 기능한다. 많은 DNA 트랜스포존은 트랜스포사제가 트랜스포존 측부에 위치하는 말단 역위 반복("TIR", terminal inverted repeat)에 결합하고, 트랜스포존을 공여자 영역으로부터 절단하고, 이를 게놈의 표적 영역 내로 삽입하는 "절단 및 붙여넣기" 메커니즘을 나타낸다. "헬리트론(helitron)"으로 지칭되는 다른 것들은 단일-가닥 DNA 중간체를 포함하고 HUH 엔도뉴클레아제 기능 및 5'에서 3'로의 헬리카제 활성을 갖는 것으로 이해되는 문서화되지 않은 단백질에 의해 매개되는 "롤링 서클" 메커니즘을 나타낸다. 먼저, DNA의 원형 가닥을 닉킹하여 2개의 단일 DNA 가닥을 생성한다. 단백질은 닉킹된 가닥의 5' 인산염에 부착된 상태로 유지되어, 상보성 가닥의 3' 히드록실 말단을 노출시켜 중합효소가 닉킹되지 않은 가닥을 복제할 수 있게 한다. 복제가 완료되면, 새로운 가닥은 분리되고 원래 주형 가닥과 함께 자체적으로 복제된다. 또 다른 DNA 트랜스포존인 "폴린톤(Polinton)"은 "자가 합성" 메커니즘을 거치도록 이론화된다. 전위는 라켓형 구조를 형성하는 단일-가닥 염색체외 폴린톤 요소의 인테그라아제의 절제에 의해 개시된다. 폴린톤은 DNA 중합효소 B로 복제되고, 이중 가닥 폴린톤은 인테그라아제에 의해 게놈 내에 삽입된다. 또한, IS200/IS605 계열의 것들과 같은 일부 DNA 트랜스포존은, TnpA가 공여자 유전자의 후행 가닥 주형으로부터 단일 가닥 DNA 조각(원형 "트랜스포존 조인트"로서)을 절제하고 이를 표적 유전자의 복제 포크 내로 재삽입하는 "박리 및 붙여넣기" 메커니즘을 통해 진행된다.
전위 가능 요소는 생물학적 도구로서 일부 용도를 발견하였지만, 문서화된 전위 가능 요소는 가능한 생물다양성 및 표적성의 전체 범위를 포함하지 않으며, 모든 가능한 활성을 나타내지 않을 수 있다. 여기에서, 수천 개의 게놈 단편을 전위 가능한 요소에 대한 다수의 메타게놈으로부터 채굴하였다. 전위 가능한 요소의 문서화된 다양성이 확장되었을 수 있고, 신규 시스템이 고도로 표적화되고, 콤팩트하고, 정확한 유전자 편집제로 개발되었을 수 있다.
MG 효소
일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이들 후보는 하나 이상의 신규한 하위 유형을 나타낼 수 있고, 일부 하위 패밀리가 식별되었을 수 있다. 이들 레트로트랜스포사제는 약 1,400개 미만의 아미노산 길이이다. 이들 레트로트랜스포사제는 전달을 단순화할 수 있고 치료 적용을 연장할 수 있다.
일부 측면에서, 본 개시내용은 신규 레트로트랜스포사제를 제공한다. 이러한 레트로트랜스포사제는 본원에 기술된 바와 같은 MG140일 수 있다(도 1 및 도 2 참조).
일 측면에서, 본 개시내용은 메타게놈 시퀀싱을 통해 발견된 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 메타게놈 시퀀싱은 샘플에 대해 수행된다. 일부 실시예에서, 샘플은 다양한 환경으로부터 수집될 수 있다. 이러한 환경은 인간 마이크로바이옴, 동물 마이크로바이옴, 고온을 갖는 환경, 저온을 갖는 환경일 수 있다. 이러한 환경은 침전물을 포함할 수 있다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 레트로트랜스포사제는 3' 미번역 영역(UTR)에 결합하도록 구성될 수 있다. 레트로트랜스포사제는 5' 미번역 영역(UTR)에 결합할 수 있다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 포함하는 조작된 레트로트랜스포사제 시스템을 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
소스 | NLS 아미노산 서열 | 서열번호 |
SV40 | PKKKRKV | 896 |
뉴클레오플라스민 이분 NLS | KRPAATKKAGQAKKKK | 897 |
c-myc NLS | PAAKRVKLD | 898 |
c-myc NLS | RQRRNELKRSP | 899 |
hRNPA1 M9 NLS | NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY | 900 |
임포르틴-알파 IBB 도메인 | RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV | 901 |
Myoma T 단백질 | VSRKRPRP | 902 |
Myoma T 단백질 | PPKKARED | 903 |
p53 | PQPKKKPL | 904 |
마우스 c-abl IV | SALIKKKKKMAP | 905 |
인플루엔자 바이러스 NS1 | DRLRR | 906 |
인플루엔자 바이러스 NS1 | PKQKKRK | 907 |
간염 바이러스 델타 항원 | RKLKKKIKKL | 908 |
마우스 Mx1 단백질 | REKKKFLKRR | 909 |
인간 폴리(ADP-리보오스) 중합효소 | KRKGDEVDGVDEVAKKKSKK | 910 |
스테로이드 호르몬 수용체(인간) 글루코코르티코이드 | RKCLQAGMNLEARKTKK | 911 |
일부 실시예에서, 서열은 BLASTP, CLUSTALW, MUSCLE, 또는 MAFFT 알고리즘, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW 알고리즘에 의해 결정될 수 있다. 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, BLASTP 상동성 검색 알고리즘에 의해 결정될 수 있다.
일 측면에서, 본 개시내용은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 암호화하는 데옥시리보핵산 폴리뉴클레오티드를 제공한다.
일 측면에서, 본 개시내용은 조작된 핵산 서열을 포함하는 핵산을 제공한다. 일부 실시예에서, 조작된 핵산 서열은 유기체에서의 발현에 최적화된다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 유기체는 미배양 유기체가 아니다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
일부 실시예에서, 유기체는 원핵생물이다. 일부 실시예에서, 유기체는 박테리아이다. 일부 실시예에서, 유기체는 진핵생물이다. 일부 실시예에서, 유기체는 진균류이다. 일부 실시예에서, 유기체는 식물이다. 일부 실시예에서, 유기체는 포유류이다. 일부 실시예에서, 유기체는 설치류이다. 일부 실시예에서, 유기체는 인간이다.
일 측면에서, 본 개시내용은 조작된 벡터를 제공한다. 일부 실시예에서, 조작된 벡터는 레트로트랜스포사제를 암호화하는 핵산 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다.
일부 실시예에서, 조작된 벡터는 본원에 기술된 핵산을 포함한다. 일부 실시예에서, 본원에 기술된 핵산은 본원에 기술된 데옥시리보핵산 폴리뉴클레오티드이다. 일부 실시예에서, 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스이다.
일 측면에서, 본 개시내용은 본원에 기술된 벡터를 포함하는 세포를 제공한다.
일 측면에서, 본 개시내용은 레트로트랜스포사제를 제조하는 방법을 제공한다. 일부 실시예에서, 방법은 세포를 배양하는 단계를 포함한다.
일 측면에서, 본 개시내용은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 결합, 절단, 마킹, 또는 변형시키는 방법을 제공한다. 방법은 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 레트로트랜스포사제와 접촉시키는 단계를 포함할 수 있다. 일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 미배양 미생물로부터 유래된다. 일부 실시예에서, 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드이다.
일 측면에서, 본 개시내용은 표적 핵산 유전자좌를 변형시키는 방법을 제공한다. 방법은 본원에 기술된 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계를 포함할 수 있다. 일부 실시예에서, 복합체는 해당 복합체가 표적 핵산 유전자좌에 결합할 때, 해당 복합체가 표적 핵산 유전자좌를 변형시키도록 구성된다.
일부 실시예에서, 표적 핵산 유전자좌를 변형시키는 단계는 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형, 또는 전위시키는 단계를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)을 포함한다. 일부 실시예에서, 표적 핵산은 게놈 DNA, 바이러스 DNA, 바이러스 RNA, 또는 박테리아 DNA를 포함한다. 일부 실시예에서, 표적 핵산 유전자좌는 시험관 내에 있다. 일부 실시예에서, 표적 핵산 유전자좌는 세포 내에 있다. 일부 실시예에서, 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 또는 인간 세포이다. 일부 실시예에서, 세포는 일차 세포이다. 일부 실시예에서, 일차 세포는 T 세포이다. 일부 실시예에서, 일차 세포는 조혈 줄기 세포(HSC)이다.
일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 본원에 기술된 핵산 또는 본원에 기술된 벡터를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함한다. 일부 실시예에서, 핵산은 프로모터를 포함한다. 일부 실시예에서, 레트로트랜스포사제를 암호화하는 개방 해독 프레임은 프로모터에 작동 가능하게 연결된다.
일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함한다. 일부 실시예에서, 조작된 레트로트랜스포사제 시스템을 표적 핵산 유전자좌에 전달하는 단계는 리보핵산(RNA) pol III 프로모터에 작동 가능하게 연결된 조작된 가이드 RNA를 암호화하는 데옥시리보핵산(DNA)을 전달하는 단계를 포함한다.
일부 실시예에서, 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴를 유도하지 않는다.
일 측면에서, 본 개시내용은 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 숙주 세포를 제공한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 숙주 세포는 E. coli 세포이다. 일부 실시예에서, E. coli 세포는 λDE3 리소겐이거나, E. coli 세포는 BL21(DE3) 균주이다. 일부 실시예에서, E. coli 세포는 ompT lon 유전자형을 갖는다.
일부 실시예에서, 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결된다.
일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그이다. 일부 실시예에서, IMAC 태그는 폴리히스티딘 태그이다. 일부 실시예에서, 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합이다. 일부 실시예에서, 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합이다.
일부 실시예에서, 개방 해독 프레임은 숙주 세포에서의 발현을 위해 코돈 최적화된 것이다. 일부 실시예에서, 개방 해독 프레임은 벡터 상에 제공된다. 일부 실시예에서, 개방 해독 프레임은 숙주 세포의 게놈에 통합된다.
일 측면에서, 본 개시내용은 적합한 액체 배지에 본원에 기술된 숙주 세포 중 어느 하나를 포함하는 배양물을 제공한다.
일 측면에서, 본 개시내용은 적합한 성장 배지에 본원에 기술된 숙주 세포 중 어느 하나를 배양하는 단계를 포함하는, 레트로트랜스포사제를 생산하는 방법을 제공한다. 일부 실시예에서, 방법은 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함한다. 일부 실시예에서, 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함한다. 일부 실시예에서, 방법은 배양 후 숙주 세포를 단리하는 단계 및 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함한다. 일부 실시예에서, 개방 해독 프레임은 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함한다. 일부 실시예에서, IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 레트로트랜스포사제를 암호화하는 서열에 프레임-내에서 연결된다. 일부 실시예에서, 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함한다. 일부 실시예에서, 방법은 프로테아제 절단 부위에 상응하는 프로테아제를 레트로트랜스포사제에 접촉시킴으로써 IMAC 친화성 태그를 절단하는 단계를 추가로 포함한다. 일부 실시예에서, 방법은 감산 IMAC 친화도 크로마토그래피를 수행하여 레트로트랜스포사제를 포함하는 조성물로부터 친화성 태그를 제거하는 단계를 추가로 포함한다.
일 측면에서, 본 개시내용은 세포에서 유전자좌를 파괴하는 방법을 제공한다. 일부 실시예에서, 방법은 레트로트랜스포사제를 포함하는 조성물을 세포에 접촉시키는 단계를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 70%의 서열 동일성을 갖는 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체를 포함한다. 일부 실시예에서, 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 실질적으로 동일할 수 있다.
일부 실시예에서, 레트로트랜스포사제는 역전사 효소 도메인을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함한다. 일부 실시예에서, 레트로트랜스포사제는 엔도뉴클레아제 핑거 도메인을 추가로 포함한다.
일부 실시예에서, 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 약 90% 미만, 약 85% 미만, 약 80% 미만, 약 75% 미만, 약 70% 미만, 약 65% 미만, 약 60% 미만, 약 55% 미만, 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 또는 약 5% 미만 서열 동일성을 갖는다.
일부 실시예에서, 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)의 측면에 위치한다.
일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 이중-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 카고 뉴클레오티드 서열을 단일-가닥 데옥시리보핵산 폴리뉴클레오티드로서 전위시키도록 구성된다. 일부 실시예에서, 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성된다.
일부 실시예에서, 레트로트랜스포사제는 진핵생물, 진균류, 식물, 포유류, 또는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진핵생물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 진균류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 식물 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 포유류 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다. 일부 실시예에서, 레트로트랜스포사제는 인간 게놈 폴리뉴클레오티드 서열에 상보적인 서열을 포함한다.
일부 실시예에서, 레트로트랜스포사제는 하나 이상의 핵 국소화 서열(NLS)을 갖는 변이체를 포함할 수 있다. NLS는 레트로트랜스포사제의 N-말단 또는 C-말단에 근접할 수 있다. NLS는 서열번호 896-911 중 어느 하나, 또는 서열번호 896-911 중 어느 하나와 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 변이체에 대해 N-말단 또는 C-말단에 첨부될 수 있다. 일부 실시예에서, NLS는 서열번호 896-911 중 어느 하나와 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 896과 실질적으로 동일한 서열을 포함할 수 있다. 일부 실시예에서, NLS는 서열번호 897과 실질적으로 동일한 서열을 포함할 수 있다.
일부 실시예에서, 전위 활성은 표적 핵산 유전자좌를 포함하는 세포에 레트로트랜스포사제를 도입하고 세포에서 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정된다. 일부 실시예에서, 조성물은 20 pmole 이하의 레트로트랜스포사제를 포함한다. 일부 실시예에서, 조성물은 1 pmol 이하의 레트로트랜스포사제를 포함한다.
본 개시내용의 시스템은, 예를 들어 핵산 편집(예를 들어, 유전자 편집), 핵산 분자에 대한 결합(예를 들어, 서열-특이적 결합)과 같은 다양한 응용에 사용될 수 있다. 이러한 시스템은, 예를 들어 대상체에서 질환을 유발할 수 있는 유전적으로 물려받은 돌연변이를 처리(예를 들어 제거 또는 치환)하는 데 사용될 수 있고, 세포에서 유전자의 기능을 확실하게 하기 위해 유전자를 불활성화시키는 데 사용될 수 있고, (예를 들어, 역-전사된 바이러스 RNA를 절단하거나 질환-유발 돌연변이를 암호화하는 증폭된 DNA 서열을 절단함으로써) 질환을 유발하는 유전적 요소를 검출하기 위한 진단 도구로서 사용될 수 있고, 특정 뉴클레오티드 서열(예를 들어, 박테리아에서 항생제 내 박테리아를 암호화하는 서열)을 표적화하고 검출하기 위한 프로브와 조합된 비활성화된 효소로서 사용될 수 있고, 바이러스 게놈을 표적화함으로써 바이러스를 불활성화시키거나 바이러스가 숙주 세포를 감염시킬 수 없게 하는 데 사용될 수 있고, 유전자를 추가하거나 대사 경로를 변경하여 유기체가 귀중한 소분자, 거대분자, 또는 이차 대사물을 생산하도록 이를 조작하는 데 사용될 수 있고, 진화적 선택을 위한 유전자 구동 요소를 확립하는 데 사용될 수 있고, 바이오센서로서 외래 소분자 및 뉴클레오티드에 의한 세포 섭동을 검출하는 데 사용될 수 있다.
예
IUPAC 규칙에 따라, 다음의 약어가 예 전체에 걸쳐 사용된다:
A = 아데닌
C = 시토신
G = 구아닌
T = 티민
R = 아데닌 또는 구아닌
Y = 시토신 또는 티민
S = 구아닌 또는 시토신
W = 아데닌 또는 티민
K = 구아닌 또는 티민
M = 아데닌 또는 시토신
B = C, G, 또는 T
D = A, G, 또는 T
H = A, C, 또는 T
V = A, C, 또는 G
예 1 - 신규 단백질에 대한 메타게놈 분석 방법
퇴적물, 토양 및 동물로부터 메타게놈 샘플을 수집하였다. 데옥시리보핵산(DNA)을 Zymobiomics DNA 미니-분취 키트로 추출하고 Illumina HiSeq® 2500 상에서 시퀀싱하였다. 재산 소유자의 동의 하에 샘플을 수집하였다. 공개 소스로부터의 추가 원시 서열 데이터는 동물 미생물, 퇴전물, 토양, 온천, 열 벤트, 해양, 피트 보그, 퍼마프로스트, 및 하수 서열을 포함하였다. 신규한 레트로트랜스포사제를 식별하기 위해 문서화된 레트로트랜스포사제 단백질 서열에 기초하여 생성된 Hidden Markov Models을 사용하여 메타게놈 서열 데이터를 검색하였다. 검색에 의해 식별된 신규한 레트로트랜스포사제 문서화된 단백질과 정렬시켜 잠재적 활성 부위를 식별하였다. 이러한 메타게놈 워크플로우는 본원에 기술된 MG140 계열을 묘사한다.
예 2 - MG140 계열의 레트로트랜스포사제의 발견
예 1의 메타게놈 분석의 데이터를 분석한 결과, 1 계열(MG140)을 포함하는 기술되지 않은 추정 레트로트랜스포사제 시스템의 새로운 클러스터가 밝혀졌다. 이들 신규한 효소 및 이들의 예시적인 서브도메인에 대한 상응하는 단백질 서열은 서열번호 1-29, 393-401, 및 799-894로 제시된다.
예 3 - 역전사된 DNA의
시험관 내
활성의 통합(예시)
인테그라아제 활성은 대장균 용해물-기반 발현 시스템(예를 들어, myTXTL, Arbor Biosciences)에서의 발현을 통해 수행될 수 있다. 시험관 내 시험에 사용되는 성분은 3개의 플라스미드이다: T7 프로모터 하에 레트로트랜스포존 유전자를 갖는 발현 플라스미드, 표적 플라스미드, 및 선별 마커 유전자(예를 들어, Tet 내성 유전자) 주위에 레트로트랜스포사제에 의해 인식되는 5' 및 3' UTR 서열을 함유하는 공여자 플라스미드. 용해물-기반 발현 산물, 표적 DNA, 및 공여자 플라스미드를 인큐베이션하여 전위가 발생할 수 있게 한다. PCR을 통해 전위를 검출한다. 또한, 전위 산물을 T5로 태그하고 NGS를 통해 시퀀싱하여 전위 이벤트의 집단 상의 삽입 부위를 결정한다. 대안적으로, 시험관 내 전위 산물을 항생제(예를 들어, Tet) 선별 하에 대장균 내로 형질시킬 수 있으며, 여기서 선별 마커가 플라스미드 내에 안정적으로 삽입될 때 성장이 발생한다. 단일 콜로니 또는 E. coli 집단 중 어느 하나를 시퀀싱하여 삽입 부위를 결정할 수 있다.
통합 효율성을 통합된 카고가 있는 표적 DNA의 실험 출력의 ddPCR 또는 qPCR을 통해 측정할 수 있으며, ddPCR을 통해 측정된 변형되지 않은 표적 DNA의 양으로 정규화한다.
이러한 검정은 또한 용해물-기반 발현보다는 정제된 단백질 성분으로 수행될 수 있다. 이 경우, 단백질은 T7 유도성 프로모터 하에 E. coli 프로테아제-결핍 B 균주에서 발현되고, 세포는 초음파처리를 사용하여 용해되고, His-태그된 관심 단백질은 AKTA Avant FPLC(GE Lifescience) 상의 HisTrap FF(GE Lifescience) Ni-NTA 친화도 크로마토그래피를 사용하여 정제된다. 순도는 SDS-PAGE 및 InstantBlue Ultrafast(Sigma-Aldrich) 쿠마시 염색 아크릴아미드 겔(Bio-Rad) 상에서 분해된 단백질 밴드의 ImageLab 소프트웨어(Bio-Rad)에서의 밀도계를 사용하여 결정된다. 단백질은 50 mM 트리스-HCl, 300 mM NaCl, 1 mM TCEP, 5% 글리세롤; pH 7.5(또는 최대 안정성을 위해 결정된 다른 완충액)로 구성된 보관 완충액에서 탈염되고 -80°C에서 보관된다. 정제 후, 트랜스포존 유전자를 반응 완충액, 예를 들어 15 mM MgOAc2가 보충된 26 mM HEPES pH 7.5, 4.2 mM TRIS pH 8, 50 μg/mL BSA, 2 mM ATP, 2.1 mM DTT, 0.05 mM EDTA, 0.2 mM MgCl2, 30-200 mM NaCl, 21 mM KCl, 1.35% 글리세롤, (pH 7.5 측정)에서 전술한 바와 같이 표적 DNA 및 공여자 플라스미드에 첨가한다.
예 4 - 겔 시프트를 통한 레트로트랜스포존 말단 검증(예시)
레트로트랜스포존 말단을 전기영동 이동성 시프트 분석(EMSA, electrophoretic mobility shift assay)을 통해 레트로트랜스포사제 결합에 대해 시험한다. 이 경우, 표적 DNA 단편(100-500 bp)을 FAM-표지된 프라이머를 사용하는 PCR을 통해 FAM으로 말단-표지한다. 3' UTR RNA 및 5' UTR RNA를 T7 RNA 중합효소를 사용하여 시험관 내에서 생성하고 정제한다. 레트로트랜스포사제 단백질을 시험관 내 전사/번역 시스템(예를 들어, PURExpress)에서 합성한다. 합성 후, 결합 완충액(예를 들어 20 mM HEPES pH 7.5, 2.5 mM Tris pH 7.5, 10 mM NaCl, 0.0625 mM EDTA, 5 mM TCEP, 0.005% BSA, 1 μg/mL 폴리(dI-dC), 및 5% 글리세롤) 중 10 μL 반응에서 1 μL의 단백질을 50 nM의 표지된 DNA 및 100 ng의 3' 또는 5' UTR RNA에 첨가한다. 결합을 30°에서 40분 동안 인큐베이션한 다음, 2 μL의 6X 로딩 완충액(60 mM KCl, 10 mM Tris pH 7.6, 50% 글리세롤)을 첨가한다. 결합 반응을 5% TBE 겔 상에서 분리하고 시각화한다. 레트로트랜스포사제 단백질 및 표적 DNA의 존재 하의 3' 또는 5' UTR의 시프트는 성공적인 결합에 기인할 수 있고, 레트로트랜스포사제 활성을 나타낸다. 이러한 검정은 또한 E. coli 추출물 또는 정제된 단백질을 사용할 뿐만 아니라, 레트로트랜스포사제 절단 또는 돌연변이로 수행할 수 있다.
예 5 - 표적 DNA 검증의 절단(예시)
레트로트랜스포사제가 표적 DNA의 절단에 관여함을 확인하기 위해, 짧은(약 140 bp) DNA 단편을 FAM-표지된 프라이머를 사용하는 PCR을 통해 양 말단에서 FAM으로 표지한다. 시험관 내 전사/번역 레트로트랜스포사제 산물을 1 μg의 Rnase A(음성 대조군), 또는 3' UTR, 5' UTR 또는 비-특이적 RNA 단편(대조군)과 함께 사전 인큐베이션한 다음, 표지된 표적 DNA와 함께 37℃에서 인큐베이션한다. 그런 다음, DNA를 변성 겔 상에서 분석한다. DNA의 하나 또는 양쪽 가닥의 절단은 겔 상에서 상이한 속도로 이동하는 다양한 크기의 표지된 단편을 초래할 수 있다.
예 6 -
E. coli
에서의 인테그라아제 활성(예시)
조작된 E. coli 균주를 레트로트랜스포존 유전자를 발현하는 플라스미드 및 통합에 관여하는 레트로트랜스포존의 5' 및 3' UTR이 측면에 위치한 선별 마커를 갖는 온도-민감성 복제 기점을 함유하는 플라스미드로 형질전환한다. 그런 다음, 이들 유전자의 발현을 위해 유도된 형질전환체를 플라스미드 복제를 위한 제한 온도에서의 선별에 의해 게놈 표적으로의 마커의 전달에 대해 스크리닝하고, 게놈 내의 마커 통합을 PCR에 의해 확인한다.
통합을 편향되지 않은 접근법을 사용하여 스크리닝한다. 간단하게, 정제된 gDNA는 Tn5로 태그하고, 그런 다음 관심 DNA는 Tn5 태그 부착 및 선별 마커에 특이적인 프라이머를 사용하여 PCR 증폭한다. 그런 다음, 앰플리콘을 NGS 시퀀싱을 위해 준비한다. 생성된 서열의 분석을 트랜스포존 서열로 트리밍하고, 측면 서열을 게놈에 맵핑하여 삽입 위치를 결정하고, 삽입 비율을 결정한다.
예 7 - 역 전사된 DNA를 포유류 게놈에 통합(예시)
포유류 세포에서 표적화 및 절단 활성을 나타내기 위해, 인테그라아제 단백질을 단백질 서열의 N, C 또는 양쪽 말단에서 2개의 NLS 펩티드를 갖는 E. coli 또는 sf9 세포에서 정제한다. 이 절차에서, 전위에 관여하고 CMV 프로모터의 조절 하에 있는 5' 및 3' UTR 영역이 측면에 위치한 선별 가능한 네오마이신 내성 마커(NeoR) 또는 형광 마커를 함유하는 플라스미드를 합성한다. 세포를 플라스미드로 형질감염시키고, RNA 전사를 위해 4 내지 6시간 동안 회수한 다음, 정제된 인테그라아제 단백질로 전기천공한다. 게놈 내로의 항생제 내성 통합을 G418-내성 콜로니 계수(형질감염 후 7일차에 시작하도록 선별함)에 의해 정량화하고, 형광 마커에 의한 양성 전위를 형광 활성화 세포 세포 계측법에 의해 분석한다. 제2 형질감염 후 7 내지 10일차에, 게놈 DNA를 추출하여 NGS 라이브러리의 제조에 사용한다. 표적 외 빈도를, 게놈을 단편화하고 트랜스포존 마커의 앰플리콘을 제조하고 NGS 라이브러리 제조를 위한 측부 DNA에 의해 분석한다. 각각의 표적화 시스템의 활성을 시험하기 위해 적어도 40개의 상이한 표적 부위를 선택한다.
또한 포유류 세포에서의 통합을 RNA 전달을 통해 평가할 수 있다. 2개의 NLS를 갖는 레트로트랜스포사제를 암호화하는 RNA를 설계하고, 캡 및 폴리A 꼬리를 첨가한다. 제2 RNA를 선별 가능한 네오마이신 내성 마커(NeoR) 또는 5' 및 3' UTR 영역이 측면에 위치한 형광 마커를 함유하도록 설계한다. RNA 작제물을 Lipofectamine™ RNAiMAX 또는 TransIT®-mRNA 형질감염 시약을 통해 포유류 세포 내로 도입한다. 형질감염 후 10일차에, 게놈 DNA를 추출하여 ddPCR 및 NGS를 사용하여 전위 효율을 측정한다.
예 8 - RT의 생물정보학적 발견
미생물, 바이러스 및 진핵생물 게놈의 광범위한 조립-구동 메타게놈 데이터베이스를 채굴하여 역전사 효소 기능을 갖는 예측된 단백질을 검색하였다. Pfam 도메인 PF00078 및 PF07727에 대한 히트를 갖는 것에 기초하여 450만 개가 넘는 RT 단백질을 예측하였는데, 이 중 340만 개가 유의한 e-값(< 1 x 10-5)을 가졌다. RT(역전사 효소) 도메인 커버리지가 ≥ 70%이고 예측된 촉매 잔기([F/Y]XDD)를 갖는 완전한 ORF에 대해 필터링한 후, 추가 분석을 위해 거의 50만 개의 단백질을 보유하였다. RT 도메인을 이러한 단백질 세트뿐만 아니라, 공개 데이터베이스로부터 검색된 기준 서열로부터 추출하였다. 도메인 서열을 Mmseqs2 이지-클러스터를 사용해 80% 커버리지에 걸쳐 50% 동일성으로 클러스터링하였으며(Bioinformatics 2016 May 1;32(9):1323-30 참조, 이는 그 전체가 참조로서 본원에 통합됨), 대표적인 서열(총 26,824개)을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬하였고(Bioinformatics 2016; 32: 3246-3251 참조, 이는 그 전체가 참조로서 본원에 통합됨), 도메인 정렬은 FastTree2를 사용하여 계통발생 트리를 추론하는 데 사용하였다(Plos One 2010; 5: e9490 참조, 이는 그 전체가 참조로서 본원에 통합됨). RT 도메인의 계통발생 분석은 서열 다양성이 높은 많은 상이한 부류의 RT가 회수되었음을 시사한다(도 4).
예 9 - 비-LTR 레트로트랜스포존(MG140, MG146, MG147, MG148, 및 MG149 패밀리)의 예
레트로트랜스포존 생물정보학 분석
비 긴 말단 반복(비-LTR) 레트로트랜스포사제는 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. 비-LTR 레트로트랜스포사제를 도 4의 계통발생 트리의 R2/R4 및 LINE 계통군 내에서 식별하였다. R2, R4, 및 LINE으로 분류된 RT 도메인을 함유하는 전장 단백질을 99% 서열 동일성으로 클러스터링하고, 대표적인 서열을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시켰다. 이러한 정렬로부터 계통발생 트리를 추론하고, R2/R4 레트로트랜스포사제 계열뿐만 아니라 다른 RT-관련 계열을 기술하였다(도 5a).
R2는 표적-프라이밍된 역전사(TPRT)를 통해 카고를 통합하는 비-LTR 레트로트랜스포존이다. MG140 계열의 많은 R2 효소는 RT 도메인뿐만 아니라, Zn-핑거를 기술하는 엔도뉴클레아제 도메인 및 다수의 Zn-결합 리본 모티프를 함유한다(도 5b 및 6a). 일부 R2 레트로트랜스포존은, 28S rDNA 유전자의 단편이 측면에 위치한 MG140-47(서열번호 395) R2 레트로트랜스포존의 경계에 의해 도시된 바와 같이, 28S rDNA에 통합된다(도 6b). 다른 레트로트랜스포존은 18S rRNA 유전자에 통합되고, 트랜스포존의 3' 말단을 정의하는 폴리A 또는 폴리T 꼬리를 함유한다(도 7). 정확한 표적 결합 부위뿐만 아니라 5'-UTR, 3'-UTR, 및 폴리-T가 정확하고 특이적인 통합에 관여하는 것이 가능하다.
Archaeal 게놈으로부터 유래된 레트로트랜스포존 MG146-1(서열번호 402)은 RT 도메인, Zn-결합 리본 모티프, 및 엔도뉴클레아제 도메인을 함유하고, 효소 내의 도메인 구조는 다른 단일 ORF 비-LTR 레트로트랜스포존의 도메인 구조와 상이하다(도 8a).
MG147 계열 구성원 MG140-17-R2(서열번호 18) 레트로트랜스포존은 5' 및 3' UTR이 측면에 위치한 3개의 ORF로 조직된다(도 8b). RNA 인식 모티프(RRM) 유전자는 RNA 주형의 인식에 관여할 가능성이 있는 반면, 엔도뉴클레아제 유전자는 표적 부위의 인식 및 닉킹에 관여할 가능성이 있다. ORF 3개는 주형의 역전사를 담당하는 효소이며 RT 도메인, Zn-결합 리본 모티프, 및 RNAse-H 도메인을 함유한다.
계열 MG148은 모든 예상 촉매 잔기의 존재에 의해 활성일 것으로 예측되는, 초 발산 RT 상동체를 포함한다. 여러 계열 구성원에 대한 뉴클레오티드 수준에서의 정렬은 5' UTR 내에서 보존된 영역을 커버하지 않았으며, 이는 RT 기능, 활성 또는 동원에 관련될 수 있다(도 9b).
qPCR에 의한 레트로트랜스포존 RT(역전사 효소)의 시험관 내 활성 시험
레트로트랜스포존 RT의 시험관 내 활성을 40 mM Tris-HCl(pH 7.5), 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서 무세포 발현 시스템(PURExpress, NEB)에서 유래된 RT 효소와 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(200nt)을 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 전장 cDNA 산물을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽함으로써 qPCR에 의해 정량화하였다.
MG140-3(서열번호 3), MG140-6(서열번호 6), MG140-7(서열번호 7), MG140-8(서열번호 8), MG140-13(서열번호 14), 및 MG146-1(서열번호 402) 을 프라이머 연장을 통해 활성이다(도 10 및 도 11). MG140-3 및 MG146-1에 대해 충실도의 예비 평가를 수행하여, 상대 오차율이 MMLV보다 각각 1.5배 및 1.35배 더 높았다(도 12). 충실도 측정을 위해, 전술한 프라이머 연장 검정에서 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 트리밍된 판독물을 기준 서열에 정렬시키고 잘못 혼입된 빈도를 계산하였다.
통합 부위
일부 비-LTR 레트로트랜스포존(예를 들어 MG140-1과 같은 MG140 계열)은 제2(G) 위치와 제3(T) 위치 사이의 삽입 부위를 갖는 특이적 GGTGAC 모티프를 표적화함으로써 28S rDNA 유전자에 통합될 것으로 예측된다. 이러한 레트로트랜스포존 단백질의 N-말단은 3개의 아연(Zn) 핑거(CCHH 유형 중 2개 및 CCHC 유형 중 하나)를 함유하고, 이어서 YADD 활성 부위를 갖는 역전사 효소(RT) 도메인을 함유한다. 이러한 레트로트랜스포존 단백질의 C-말단은 추가 CCHC Zn-핑거를 갖는 엔도뉴클레아제 도메인을 포함한다. 단백질은 각각 289 및 478 bp 길이의 5' 및 3' UTR이 측면에 위치한다(도 31).
예 10 - II족 인트론 RT(MG153, MG163, MG164, MG165, MG166, MG167, MG168, MG169, 및 MG170 계열)
II족 생물정보학 분석
II족 인트론은 RNA 주형의 역전사를 통해 큰 카고를 표적 부위 내로 통합시킬 수 있다. II족 인트론으로부터의 RT 도메인을 식별하고 도 4의 계통발생 트리에 기술하였다. RT 효소의 측면에 > 2 kb의 서열을 갖는 콘티그로부터의 RT 도메인을 함유하는 10,000개가 넘는 고유한 전장 II족 인트론 단백질을 파라미터-globalpair -large를 사용하여 MAFFT와 정렬하였다. 이러한 정렬로부터 계통발생 트리를 추론하고, II족 인트론 계열을 추가로 식별하였다(도 13). II족 인트론 효소를 클래스 A-G, ML, 및 CL로 분류할 수 있고, 이들의 도메인 구조는 활성인 것으로 예측된 RT 도메인뿐만 아니라 인트론 동원에 관여하는 성숙효소 도메인을 포함한다. 일부 II족 인트론 단백질은 표적 인식 및 절단에 관여할 가능성이 있는 추가 엔도뉴클레아제 도메인을 함유한다. 식별된 모든 계열의 많은 후보를 실험실 특성화를 위해 지명하였다.
II족 인트론 RT 클래스 C, D, 및 F의 시험관 내 활성을 시험
GII 인트론 클래스 C(MG153), 클래스 D(MG165), 및 클래스 F(MG167) RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였으며 이는 N-말단 단일 Strep 태그를 함유하였다. RT의 발현을 SDS-PAGE 분석에 의해 확인하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양을 특정 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.
변성 겔 상의 cDNA 산물의 검출에 의해, 다음의 GII 인트론 클래스 C 후보는 이러한 실험 조건 하에서 활성이었다: MG153-1 내지 MG153-6(서열번호 555-560), MG153-9(서열번호 563), MG153-10(서열번호 564), MG153-12(서열번호 566), MG153-13(서열번호 567), MG153-15(서열번호 569), MG153-18(서열번호 572), MG153-20(서열번호 574), MG153-29 내지 MG153-31(서열번호 580-582), MG153-33 내지 MG153-37(서열번호 584-588), MG153-41(서열번호 592), MG153-42(서열번호 593), MG153-45(서열번호 596), MG153-51(서열번호 602), MG153-53(서열번호 604), MG153-54(서열번호 605), 및 MG153-57(서열번호 608). (도 14 및 15). 활성의 신규한 후보는 더 작은 cDNA 드롭오프 산물의 존재에 의해 나타나는, 고도로 가공성인 대조군 GII 클래스 C RT GsI-IIC 및 MarathonRT에 비해 다양한 정도의 겉보기 가공성을 나타낸다. qPCR에 의해, 다음의 추가 후보도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨): MG153-7(서열번호 561), MG153-8(서열번호 562), MG153-10(서열번호 564), MG153-11(서열번호 565), MG153-14(서열번호 568), MG153-17(서열번호 571), MG153-19(서열번호 573), MG153-25 내지 MG153-28(서열번호 576-579), MG153-32(서열번호 583), MG153-39(서열번호 590), MG153-40(서열번호 591), MG153-43(서열번호 594), MG153-47(서열번호 598), MG153-50(서열번호 601), MG153-55(서열번호 606) 및 MG153-56(서열번호 607)(도 14d 및 15d).
변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 D 후보 MG165-1(서열번호 684) 및 MG165-5(서열번호 688)는 이들 실험 조건 하에서 활성이다(도 16a). qPCR에 의해, 추가 후보 MG165-4(서열번호 687), MG165-6(서열번호 689), 및 MG165-8(서열번호 691)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 16b).
변성 겔 상의 cDNA 산물의 검출에 의해, GII 인트론 클래스 F 후보 MG167-1(서열번호 698) 및 MG167-4(서열번호 701)는 이들 실험 조건 하에서 활성이다(도 17a). qPCR에 의해, 추가 후보 MG167-3(서열번호 700) 및 MG167-5(서열번호 702)도 이들 실험 조건 하에서 활성이다(cDNA는 배경 대비 >10배 검출됨)(도 17b).
GII 인트론 RT의 상대 충실도 평가
GII 클래스 C MG153 후보의 상대 충실도를 평가하기 위해, 전술한 프라이머 연장 검정에서 생성된 생성된 결과적인 전장 cDNA 산물을 PCR 증폭하고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행하였다. 짝을 지은 판독물을 완벽한 중첩을 요구하고 중첩되지 않는 모든 부분을 트리밍하는 bbmerge.sh 사용하여 병합하였다(Plos One 2017; 12: e0185056). 그런 다음, 병합된 판독물을 BWA-MEM(Li H. 2013)을 사용하여 기준 주형에 정렬시키고, 파삼스타트(https://github.com/alimanfoo/pysamstats)를 사용하여 기준 대비 각 위치에서 불일치의 수를 계산하였다. 시험된 GII 클래스 C 후보 중에서, MG153-6(서열번호 560) 및 MG153-12(서열번호 566)는 MMLV 대조군 RT 및 다른 GII 인트론 클래스 C RT에 비해 재현 가능한 정도로 더 높은 오차율을 갖는다(도 18).
인간 세포 cDNA 합성 결과
포유류 환경에서 cDNA를 생산하는 이들 효소의 능력을 포유류 세포에서 발현시키고 PCR에 의한 cDNA 합성을 검출한 다음, 아가로오스 전기영동 및 D1000 TapeStation에 의해 시험하였다. 역전사 효소를 플래그-HA 태그(FH)에 더하여, N 말단에서 MS2 외피 단백질(MCP)을 갖는 융합 단백질로서 CMV 프로모터 하에서 포유류 발현을 위한 플라스미드에 클로닝하였다. MCP는 MS2 박테리오파지로부터 유래된 단백질로서, 높은 친화도(나노몰 미만 Kd)로 20개의 뉴클레오티드 RNA 줄기 루프를 인식한다. RT를 MCP와 융합하고 RNA 주형에 MS2 루프를 가짐으로써, RT가 번역되면, RNA 주형을 찾아 RNA 주형에 혼성화된 DNA 프라이머로부터 cDNA 합성을 시작하는 것이 보장된다.
CMV 프로모터 하에 RT 후보물질에 융합된 MCP를 함유하는 플라스미드를 클로닝하고 HEK293T 세포에서 형질감염을 위해 단리하였다. 형질감염은 리포펙타민 2000을 사용하여 수행하였다. 제조자 지침에 따라 mMESSAGE mMACHINE(Thermo Fisher)을 사용하여 mRNA 암호화 나노루시퍼라제(서열번호 33)를 제조하였다. mRNA 제제에 남아 있는 임의의 DNA 주형을 분해하기 위해, 반응물을 1시간 동안 Turbo Dnase(Thermo Fisher)로 처리하고, MEGAclear Transcription Clean-Up 키트(Thermo Fisher)를 사용하여 mRNA를 세정하였다. mRNA를 10mM Tris pH 7.5, 50mM NaCl 중 상보성 DNA 프라이머(서열번호 34)에 95℃에서 2분 동안 혼성화시키고, 0.1℃/s의 속도로 4℃로 냉각시켰다. MCP-RT 융합을 함유하는 플라스미드가 형질감염된 후 6시간차에, mRNA/DNA 혼성체를 Lipofectamine Messenger Max를 사용하여 HEK293T 세포 내로 형질감염시켰다. mRNA/DNA 형질감염 후 18시간차에, QuickExtra DNA 추출 용액(Lucigen)을 사용하여 세포를 용해시키고, 24 웰 플레이트에서 24 웰 당 100 μL의 빠른 추출물을 첨가하였다. 나노루시페라제는 약 500 bp 길이이고, 새롭게 합성된 cDNA로부터 100 bp 및 542 bp의 산물을 증폭하기 위한 프라이머를 설계하였다(서열번호 38 및 39). cDNA를 전술한 프라이머 세트를 사용하여 증폭시키고, PCR 산물을 아가로오스 겔 전기영동(도 19a) 또는 DNA Tape Station(도 19b)에 의해 검출하였다.
100bp 및 500bp DNA 산물의 존재에 의해 도시된 바와 같이, 대조군 GII 인트론 RT Marathon, Marathon PE2, 및 TGIRT에 대한 활성을 검출하였다(도 19a 및 19b). 또한, 신규한 GII 인트론 유래 RT MG153-1 내지 MG153-4(서열번호 555-558), MG153-7 내지 MG153-13(서열번호 561-567), MG153-15(서열번호 569), MG153-16(서열번호 570) 및 MG153-21(서열번호 575)에 대한 활성도 도시하였다(도 19a, 19b, 및 19c). 신규 RT에 대한 PCR 산물의 신호는 Marathon 및 TGIRT의 신호와 유사하였다. 전체적으로, 이는 새롭게 발견된 RT가 발현되고, 적절하게 접히고, 살아있는 포유류 세포 내에서 활성이어서, 이들의 생명공학적 적용을 위한 옵션을 개방한다는 것을 보여준다.
II족 인트론 RT는 변형된 프라이머를 사용하여 cDNA를 합성할 수 있다
RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 프라이머 내의 다양한 위치에서 포스포로티오에이트(PS) 결합 변형을 함유하는 5'-FAM 표지된 DNA 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 프라이머 1(서열번호 736, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTTGTCTG을 함유함)은 올리고의 5' 말단에 5개의 PS 결합을 함유한다. 프라이머 2(서열번호 737, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*T*G를 포함함, 여기서 *는 포스포로티오에이트 결합을 나타냄)는 올리고의 5' 및 3 말단 모두에서 5개의 PS 결합을 함유한다. 프라이머 3(서열번호 738, 서열 /56-FAM/A*G*A*C*G*GTCACAGCTT*G*T*C*TG를 함유함, 여기서 *는 포스포로티오에이트 결합을 나타냄)은 표준 결합이 2개의 최대 3' 말단 뉴클레오티드 사이에서 치환된다는 점에서 프라이머 2와 상이하다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 대조군 RT MMLV(바이러스) 및 TGIRT-III(GII 인트론)은 모두 모든 변형된 프라이머로 프라이머 연장을 수행할 수 있다(도 32). GII 인트론 RT MG153-9는 또한 시험된 모든 PS-변형된 DNA 프라이머로부터 연장될 수 있다(도 33).
인간 세포 RT 발현 및 cDNA 합성 결과
포유류 세포 환경에서 cDNA를 합성하는 신규한 GII RT의 능력을 실질적이지 않은 변형으로 전술한 바와 같이 시험하였다. PCR을 사용하여 cDNA 합성을 검출하고 아가로오스 겔 전기영동 또는 TapeStation에 의해 분석하였다. 정량적 판독을 갖기 위해, 서열번호 739로 열거된 Taqman 프로브로 이미 문서화된 Taqman qPCR 프라이머를 사용하여 Taqman qPCR 검정을 개발하였다. MG153 계열의 모든 시험된 후보는 다양한 정도로 활성이 있었으며, 활성은 400배만큼 광범위하였다(도 34). 시험된 계열의 RT는 MG153-1 내지 MG153-13, MG153-15, MG153-16, MG153-18, MG153-20, MG153-21, MG153-29 내지 MG153-31, MG153-33 내지 MG153-37, MG153-45, MG153-51, MG153-53, MG153-54, MG153-57, MG165-1, MG165-5, MG167-1 및 MG167-4를 포함한다. 여러 RT(MG153-15, MG153-53, MG153-4, MG153-18, MG153-20, MG153-7 및 MG153-5)가 TGIRT 대조군을 능가하였다(도 34).
포유류 세포에서 GII RT의 단백질 발현 및 안정성을 이해하기 위해, 면역블롯을 수행하였다. 간략하게, 형질감염된 세포를 프로테아제 억제제(24 웰 포맷의 웰 당 80 μL)가 보충된 RIPA 용해 완충액(Thermo Fisher)으로 용해시켰다. 불용성 응집체를 제거하기 위해 용해물을 4℃에서 14,000 g로 10분 동안 원심분리하였다. BCA를 사용하여 단백질을 정량화하였다. 레인 당 3 또는 10 μg의 총 단백질을 4-12% 폴리아크릴아미드 SDS 겔(Thermo Fisher)에 로딩하였다. 모든 레인을 동일한 양의 단백질로 정규화하였다. 단백질을 iBlot 겔 전달 시스템(Invitrogen)을 사용하여 PVDF 막으로 옮겼다. HRP-기반 검출 방법을 사용하여 토끼 HA 항체(Cell Signaling)를 사용하여 단백질을 검출하였다. 결과는 밴드의 강도에 의해 주어진 바와 같이, 다양한 수준의 단백질 발현 또는 안정성을 시사한다(도 35). 우리는 각 단백질의 발현을 정량화하고 총 단백질 발현에 대해 cDNA 합성 활성을 정규화하였다: 7개의 MG153 RT가 TGIRT 대조군을 능가하였다(도 36). 주목할 만한 MG153-15는 이들 조건 하에서 TGIRT보다 10배 더 높은 cDNA 합성 활성을 나타낸다.
일부 GII 유래 RT는 양성 대조군, MarathonRT, 및 MG153-1 내지 MG153-4 및 MG153-9 중 하나를 포함하는 매우 안정적인 이량체를 형성한다(도 35). "CAQQ" 모티프는 Marathon RT에서 안정한 이량체화를 담당하는 것으로 문서화되었다(Nat Struct Mol Biol. 2016 Jun; 23(6): 558-565). 면역블롯 상에서 안정한 이량체 형성을 나타낸 RT(MG153-1 내지 MG153-4)는 또한 CAQQ 이량체화 아미노산 모티프를 함유한다(도 35c). 이량체화는 복잡성이 추가됨으로 인해 바람직하지 않은 특징일 수 있으므로, 이량체를 형성하지 않는 RT는 특정 생명공학 응용에 최적일 수 있다.
RT | 예상 단백질 크기(kDa)* |
Marathon | 67.8 |
TGIRT | 67 |
MG153-1 | 74 |
MG153-2 | 74 |
MG153-3 | 74 |
MG153-4 | 67.6 |
MG153-7 | 71.7 |
MG153-8 | 67.6 |
MG153-9 | 72 |
MG153-10 | 72.2 |
MG153-11 | 70.9 |
MG153-12 | 72.5 |
MG153-13 | 67.9 |
MG153-15 | 68.6 |
MG153-16 | 71.7 |
MG153-21 | 70.6 |
*크기에는 Flag-HA-MCP 태그가 포함된다.
예 11 - G2L4 (MG172 계열)
G2L4는 도 4에 식별된, II족 인트론과 관련이 먼 RT-함유 서열(II족 인트론-유사 RT)이다. 600개가 넘는 신규한 전장 G2L4 효소를 파라미터-globalpair -large를 사용하여 MAFFT와 정렬시키고, 계통발생 트리를 이러한 정렬로부터 추론하였다(도 20). MG172 계열 구성원은 RT 및 성숙효소 도메인을 함유하며, 보존된 Y[I/L]DD 활성 부위 모티프를 가질 것으로 예측되었다. 모티프 YIDD는 최근에 하나의 G2L4 기준(BioRxiv 10.1101/2022.03.14.484287)에서 더 짧은 DNA 프라이머로 증가된 효율을 나타내는 것으로 보고되었다. MG172 효소는 평균 길이가 425 aa이고 32% AAI를 공유하는데, 이는 이들 시스템의 신규성을 강조한다.
예 12 - LTR 레트로트랜스포존(MG151 계열)
LTR 레트로트랜스포존 생물정보학 분석
긴 말단 반복(LTR) 레트로트랜스포존은 RNA 주형의 역전사를 통해 표적 부위 내로 통합된다. 레트로바이러스 및 비-바이러스 트랜스포존을 포함하는, LTR 레트로트랜스포존의 MG151 계열을 도 4의 계통발생 트리에서 식별하였다. LTR RT 도메인을 함유하는 전장 단백질을 파라미터 -globalpair -large를 사용하여 MAFFT와 정렬시켰다. 계통발생 트리를 이러한 정렬로부터 추론하였다(도 21a). MG151 계열의 100개 초과의 비-바이러스 및 레트로바이러스 RT 효소는 RT 및 RnaseH 도메인을 함유하며, 촉매 잔기의 존재에 기초하여 활성일 것으로 예측된다. LTR RT 다단백질은 또한 HIV 및 MMLV LTR RT에 대해 관찰된 것과 유사한 구조에서 프로테아제 및 인테그라아제 도메인을 암호화한다(도 21a, 21b, 21c, 및 22). RT 및 gag 또는 엔벨로프와 같은 다른 유전자는 긴 불완전한 긴 말단 반복이 측면에 위치한다(도 21b). MG151 계열 구성원은 다양하고 신규하며, 30% 아미노산 동일성을 공유한다(도 22).
LTR 레트로트랜스포존의 다단백질은 프로테아제, RT 및 Rnase H, 및 인테그라아제 기능적 단위로 자연적으로 가공된다. 따라서, MG151 RT-RNAse H 기능적 단위 경계를 서열 및 구조적 정렬의 조합에 의해 결정하였다. MG151 다단백질에 대한 3D 구조를 Alphafold2(Nature 2021; 596: 583-589; 및 Nucleic Acids Res 2022; 50: D439-D444)를 사용하여 예측하고 PyMOL(https://github.com/schrodinger/pymol-open-source)로 시각화하였다. 예를 들어, MG151-82(서열번호 457)의 경우, 예측된 3D 구조는 비구조화 링커 영역에 의해 분리된 이산적 프로테아제, RT, RNAseH, 및 인테그라아제 도메인을 식별하였다(도 21c). 따라서, RT-RNAse H 기능적 단위는 비구조화 루프가 측면에 위치한 2개의 관련 구조적 도메인으로서 결정하였다. RT 및 RNAse H 도메인을 함유하는 트리밍된 변이체를 합성 및 실험실 특성화를 위해 지명하였다.
LTR 레트로트랜스포존 RT의 시험관 내 활성 시험
LTR 레트로트랜스포존 RT(MG151)의 시험관 내 활성을, 50 mM Tris-HCl pH 8, 75 mM KCl, 3 mM MgCl2, 1 mM TCEP, 및 0.5 mM dNTP를 함유하는 반응 완충액에서, 전술한 바와 같이 5'-FAM 표지된 프라이머에 어닐링된 RNA 주형 및 무세포 발현 시스템으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 생성된 cDNA 산물을 변성 폴리아크릴아미드 겔 상에서 분리하고 Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, MG151-80 내지 MG151-84(도 23a)뿐만 아니라 MG151-87 내지 MG151-90(서열번호 524-527), 및 MG151-92 내지 MG151-95(서열번호 529-532)(도 23b)는 시험관 내에서 cDNA를 합성할 수 있다.
대조군 LTR 레트로트랜스포존 RT인 Ty3에 대해 시험관 내 활성이 관찰되는 검정 조건을 결정하기 위해, 다음의 4개의 반응 완충액을 시험하였다: 완충액 A(40 mM Tris-HCl pH 7.5, 0.2 M NaCl, 10 mM MgCl2, 1 mM TCEP); 완충액 B(20 mM Tris pH 7.5, 150 mM KCl, 5 mM MgCl2, 1 mM TCEP, 2% PEG-8000); 완충액 C(10 mm Tris-HCl pH 7.5, 80 mm NaCl, 9 mm MgCl2, 1 mM TCEP, 0.01% (v/v) Triton X-100); 및 완충액 D(10 mM Tris pH 7.5, 130 mM NaCl , 9 mM MgCl2, 1 mM TCEP, 10% 글리세롤). 완충액 A 및 B에 대해 시험관 내 활성을 관찰하였다(도 23c).
구조 RNA 주형 상에서 프라이밍 파라미터 및 가공성 시험
구조화된 RNA 주형 상에서 이들 LTR RT의 역전사 효소 활성을 결정하기 위해, 길이 6, 8, 10, 13, 16 및 20 nt의 상이한 프라이머를 구조화된 RNA 스캐폴드 상에 어닐링하였다. 이들 어닐링된 RNA/DNA 하이브리드를 전체 활성에 사용된 것과 동등한 cDNA 생성 분석에 사용하였다. 도 24에 도시된 바와 같이, MMLV는 프라이머 결합 부위가 10 내지 20 nt인 구조화된 RNA 상에서 활성이고, 주형을 5' 말단까지 완전히 연장시켜 주형 내의 모든 구조를 개방한다. MG151-89(서열번호 526)는 13-20의 프라이머 길이로 활성이고, sgRNA 스캐폴드 헤어핀에 도달할 때까지 pegRNA의 길이를 대략 18 nt 연장할 수 있다. MG151-92(서열번호 529) 및 MG151-97(서열번호 534)은 검출 수준에서 이 주형 상에서 활성이 아니었다.
예 13 - 레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG160 계열)
레트론 생물정보학 분석
박테리아 레트론은 RT-코딩 유전자(ret) 및 역위 서열, msr 및 msd를 함유하는 인접 비코딩 RNA를 암호화하는 대략 2000 bp 길이의 DNA 요소이다. 레트론은 RT-DNA 합성을 위한 고유한 메커니즘을 사용하며, 여기서 ncRNA 주형은 2개의 역위 반복(a1/a2) 사이에서 절연된 보존된 이차 구조로 접힌다. 레트론 RT는 접힌 ncRNA를 인식하고, 역전사는 역위 반복에 인접한 보존된 구아노신 2'OH로부터 개시되어, 주형 RNA와 초기 cDNA 가닥 사이에 2'-5' 결합을 형성한다. 일부 레트론에서, 이러한 2'-5' 결합은 가공된 RT-DNA의 성숙한 형태로 지속되는 반면, 다른 것에서는 엑소뉴클레아제가 DNA 산물을 절단하여 유리된 5' 말단을 생성한다. 또한, RT는 RNA 주형과 동일한 레트론으로부터 유래된 msr-msd를 표적화하여, 표적 외 역전사를 피할 수 있는 특이성을 제공한다.
4031개가 넘는 RT 도메인 서열이 도 4의 계통발생 트리에서 레트론 RT로서 식별되었다. 촉매 잔기(xxDD)의 존재 및 레트론 RT(NaxxH 및 VTG)에 문서화된 보존된 모티프에 기초하여 추가 분석을 위해 2407개의 전장 레트론 단백질 서열의 하위 집합을 선택하였다(도 25 및 26). 계열 MG154-MG159 및 MG173의 레트론은 길이가 300 내지 650 aa인 구성원을 포함하고, 이들의 5' UTR은 역위 반복이 측면에 위치한 예측된 ncRNA(msr-msd) 트리밍을 함유한다(도 27).
또한, "레트론-유사" 단일-도메인 RT 서열의 다양한 군이 도 4의 레트론 계통군 내에서 식별되었다. MG160 계열의 단일-도메인 RT는 250 내지 300 aa의 범위이고, 예상 RT 촉매 잔기 [F/Y]XDD의 존재에 기초하여 활성일 것으로 예측된다. 공개 데이터베이스에서 레트론 RT 결정 및 동결-EM 구조가 결여되어 있지만, MG160-3(서열번호 629)의 3D 구조 예측은 II족 인트론 RT 도메인과 정렬되는 보존된 RT 도메인을 나타낸다(도 28a 및 28b). MG160 계열의 5' UTR은 계열 구성원 사이에서 보존되고 요소 활성 또는 이동화에 중요할 가능성이 있는 보존된 이차 구조로 접힌다(도 28c).
MG154, MG155, MG156, MG157, MG158, 및 MG159 계열의 레트론-유사 RT의 시험관 내 활성
일반 RNA 주형에 대한 레트론 RT의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(202 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. 이들 결과에 기초하여, 다음의 레트론 RT는 그들 자신의 ncRNA가 아닌 일반 RNA 주형 상에서 프라이머 연장을 수행할 수 있다: MG155-2(서열번호 612), MG155-3(서열번호 613), MG156-2(서열번호 617), MG157-5(서열번호 622), 및 MG159-1(서열번호 624).
MG160 계열의 레트론-유사 RT의 시험관 내 활성
레트론-유사 RT(MG160 계열)의 시험관 내 활성을 무세포 발현 시스템(PURExpress, NEB)으로부터 유래된 RT 효소를 함유하는 프라이머 연장 반응에 의해 평가하였다. 발현 작제물을 E. coli에 대해 코돈 최적화하였고, 이는 N-말단 단일 Strep 태그를 함유하였다. 반응을 위한 기질은 5'-FAM 표지된 프라이머에 어닐링된 100 nM의 RNA 주형(200 nt)이었다. 반응 완충액은 다음 성분을 함유하였다: 50 mM Tris-HCl(pH 8.0), 75 mM KCl, 3 mM MgCl2, 10 mM DTT, 및 0.5 mM dNTP. 37℃에서 1시간 동안 인큐베이션한 후, 반응물을 RnaseH(NEB)와의 인큐베이션을 통해 급랭시킨 다음, 2X RNA 로딩 염료(NEB)를 첨가하였다. 생성된 cDNA 산물을 10% 변성 폴리아크릴아미드 겔 상에서 분리하고, Gel Green 설정에서 ChemiDoc을 사용하여 시각화하였다. RT 활성을 전장 cDNA 산물을 증폭시키는 프라이머를 사용해 qPCR에 의해 또한 평가하였다. 프라이머 연장 검정으로부터의 산물을 희석하여 cDNA 농도가 선형 검출 범위 내에 있도록 하였다. cDNA의 양은 문서화된 농도의 DNA 주형으로 생성된 표준 곡선의 값을 외삽하여 정량화하였다.
겔 분석에 의해, MG160-1 내지 MG160-4(서열번호 627-630) 및 MG160-6(서열번호 633)은 활성이고 대조군 GII 인트론 클래스 C RT인 GsI-IIC와 비교하여 감소된 공정성을 가졌다(도 29). 가공성은 cDNA 산물의 유사한 드롭오프 패턴을 생성하는 레트로바이러스 대조군 RT인 MMLV의 것과 더 유사하게 보인다(도 29a). qPCR에 의해, MG160-1 내지 MG160-4(서열번호 627-630)는 전장 cDNA를 생산할 수 있는 반면, MG160-6(서열번호 633)은 전장 산물보다 적은 산물을 생산하였다(도 29b).
레트론 RT(MG154, MG155, MG156, MG157, MG158, MG159, 및 MG173 계열)의 무세포 발현 및 레트론 ncRNA의 시험관 내 전사
37℃에서 2시간 동안 PURExpress 성분과 함께 N-말단 단일 Strep 태그로 E. coli- 최적화된 유전자를 암호화하는 DNA 주형의 10 ng/μL를 인큐베이션함으로써 무세포 발현 시스템(PURExpress)에서 레트론 RT를 생산하였다. 모든 시험된 레트론 RT(MG156-1(서열번호 616), MG156-2(서열번호 617), MG157-1(서열번호 618), MG157-2(서열번호 619), MG157-5(서열번호 622), MG159-1(서열번호 624))를 SDS-PAGE 분석에 의해 표시된 바와 같이 생산하였다(도 30a 및 30b).
레트론 ncRNA를 HiScribe T7 시험관 내 전사 키트(NEB) 및 T7 프로모터 다음에 각각의 ncRNA 유전자를 암호화하는 DNA 주형을 사용하여 생성하였다. 그런 다음, 반응물을 Dnase-I와 함께 인큐베이션하여 DNA 주형을 제거한 다음, RNA 클린업 키트(Monarch)로 정제한다. ncRNA의 양을 나노드롭에 의해 결정하고, 순도를 Tape Station RNA 분석에 의해 평가하였다(도 30c).
예 14 - 레트론 RT
시험관 내
활성 시험(예시)
레트론 RT 효소는 전술한 바와 같이 N-말단 단일 Strep 태그를 갖는 E. coli 코돈 최적화된 유전자를 함유하는 작제물을 사용하여 무세포 발현 시스템에서 생산된다. 효소의 발현은 SDS-PAGE 분석에 의해 확인된다. 일반 주형 상의 레트론 RT 활성은 5'-FAM 표지된 DNA 프라이머에 어닐링된 200 nt RNA를 함유하는, 전술한 바와 같은 프라이머 연장 분석에 의해 결정된다. 생성된 cDNA 산물은 변성 폴리아크릴아미드 겔 상에서 또는 전장 cDNA 산물에 특이적인 프라이머를 갖는 qPCR에 의해 검출된다.
자체 ncRNA에 대한 레트론 RT 시험관 내 활성을 완충액, dNTP, 무세포 발현 시스템으로부터 생산된 레트론 RT, 및 재접힘된 ncRNA를 함유하는 반응에서 평가한다. N-말단 단일 Strep 태그를 통해 무세포 발현 시스템으로부터 RT를 정제하기 전과 후의 RT 활성을 비교한다. 인큐베이션 후, 반응의 절반을 Rnase A/T1로 처리한다. Rnase A/T1 처리 전후의 생성물을 변성 폴리아크릴아미드 겔 상에서 평가하고 SYBR 금 염색에 의해 시각화한다. 이 절차에서, Rnase A/T1은 RNA 주형을 분해하여 ssDNA를 함유하는 더 작은 생성물로 질량 이동을 초래하는 것으로 이해된다. Rnase H는 5' 및 3' ssDNA 경계의 균질성을 개선할 것으로 예상되기 때문에, 생성물의 분포에 대한 Rnase H의 영향도 또한 겔 분석에 의해 평가된다. ncRNA 주형과 ssDNA 사이의 공유 결합은 탈분지 효소(DBR1)로 처리하기 전 또는 후에 RT 산물을 5'에서 3' ssDNA 엑소뉴클레아제(RecJ)로 인큐베이션함으로써 확인된다. RecJ는 DBR1이 RNA와 ssDNA 사이의 2'-5' 인산디에스테르 결합을 제거한 후에 ssDNA를 분해할 수 있을 것으로 예상된다.
예 15 - NGS에 의한 레트론 msr-msd 경계 결정(예시)
msr-msd 경계를 DBR1에 의해 2'-5' 인산에스테르 결합을 제거한 후 msDNA 산물의 5' 및 3' 말단에 대한 어댑터 서열의 편향되지 않은 결찰에 의해 결정한다. 생성된 결찰된 산물은 PCR 증폭시키고, 라이브러리를 제조하고, 차세대 시퀀싱을 수행한다. 시퀀싱 판독물을 기준 서열에 정렬시켜 msd의 5' 및 3' 경계를 결정한다. RT 반응에서 Rnase H의 존재가 5' 및 3' msd 경계의 균질성에 미치는 영향도 또한 평가한다.
예 16 - RT 활성에 대한 msd 내로의 삽입 서열의 체계적 평가(예시)
구별되는 길이, 예측된 이차 구조, 및 GC-함량의 서열을 NGS 및 ncRNA의 이차 구조 예측에 의해 결정된 msd 경계에 의해 알려진 선택된 삽입 부위에서 msd 내로 삽입한다. 이들 삽입 서열이 RT 활성에 미치는 영향을 전술한 바와 같이 겔 분석 또는 NGS에 의해 평가한다.
예 17 - 신규 RT의
시험관 내
활성 시험(예시)
RT 활성을 무세포 발현 시스템으로부터 유래된 RT 및 전술한 바와 같이 DNA 프라이머에 어닐링된 RNA 주형을 함유하는 프라이머 연장 검정을 사용하여 평가한다. 생성된 cDNA 산물을 전술한 바와 같이 변성 폴리아크릴아미드 겔 및 qPCR에 의해 검출한다. 변성 겔 상의 cDNA 드롭오프 산물의 검출은 신규 후보에 대한 가공성의 상대적 평가를 제공한다.
예 18 - 신규 RT의 프라이밍 파라미터 평가(예시)
최적의 프라이머 길이는 6, 8, 10, 13, 16, 또는 20개 뉴클레오티드 길이의 5'-FAM 표지된 DNA 프라이머에 어닐링된 RNA 주형 상에서 RT의 활성을 시험함으로써 결정한다. RT는 전술한 바와 같이 무세포 발현 시스템으로부터 유래된다. 반응물을 인큐베이션한 후, Rnase H의 첨가를 통해 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석한다. 최적의 프라이머 길이는 RT가 가장 많은 프라이머를 cDNA 산물로 변환할 수 있게 하는 길이로서 결정한다. 그런 다음, 실험적으로 결정된 최적의 프라이머 길이를 시험관 내 RT를 추가로 특성화하기 위해, 충실도 및 가공성 검정과 같은 후속 실험에서 사용한다.
예 19 - RT 충실도 평가(예시)
PCR 및 시퀀싱 동안 도입된 오류를 설명하기 위해, 14-nt 고유 분자 식별자(UMI) 바코드가 역전사 반응을 위한 프라이머에 포함되는 것을 제외하고는 전술한 바와 같은 프라이머 연장 검정에 의해 RT 충실도를 평가한다. 생성된 전장 cDNA 산물을 PCR 증폭시키고, 라이브러리를 준비하고, 차세대 시퀀싱을 수행한다. >5개의 리드를 갖는 바코드를 분석한다. 기준 서열과 정렬한 후, 동일한 바코드를 갖는 모든 서열 판독에 오류가 존재하는 경우, 돌연변이, 삽입 및 결실을 계수한다. 모든 시퀀싱 판독물이 아닌 하나의 시퀀싱 판독물에 존재하는 오류는 PCR 또는 시퀀싱 동안 도입되는 것으로 간주한다. RNA 주형 내의 돌연변이 핫스팟의 식별에 더하여, 치환, 삽입 및 결실 프로파일의 추가 분석을 수행한다. 충실도 측정은 또한 주형에서 변형된 염기, 예를 들어 슈도우리딘으로 수행한다.
예 20 - RT의 가공성 계수 결정(예시)
RT 가공성을 전술한 바와 같은 무세포 발현 시스템으로부터 유래된 RT 효소 및 5'-FAM 표지된 프라이머(겔 분석용) 또는 비표지된 프라이머(시퀀싱 분석용)에 어닐링된 길이가 1.6 kb 내지 6.6 kb인 RNA 주형을 함유하는 프라이머 연장 분석을 사용하여 평가한다.
cDNA 합성 동안 RNA 주형에서 떨어진 RT 효소의 재결합을 선호하지 않게 하기 위해 역전사 반응을 단일 사이클 조건 하에서 수행한다. 단일 사이클 조건을 달성하기 위한 최적의 트랩 분자 및 농도를 실험적으로 결정한다. 반응 개시 전에 인큐베이션되는 경우 cDNA 합성의 충분한 억제를 제공하지만, 그렇지 않으면 반응의 속도에 영향을 미치지 않도록 선택된 조건을 설계한다. 시험할 최적의 트랩 분자는 다양한 길이의 DNA 프라이머에 어닐링된 비관련 RNA 주형 및 비관련 RNA 주형을 포함한다.
단일 사이클 반응 조건을 최적화하면, 반응 완충액 중 DNA 프라이머에 어닐링된 RNA 주형으로 RT를 사전 평형화한 후 dNTP 및 선택된 트랩 분자를 첨가하여 반응을 개시함으로써 가공성을 평가한다. 반응물을 인큐베이션한 후, RnaseH를 첨가하여 반응물을 급랭시킨다. cDNA 산물의 크기 분포를 전술한 바와 같이 변성 폴리아크릴아미드 겔 상에서 분석하거나, 긴 판독 시퀀싱을 위해 준비한 PCR 및 라이브러리에 적용한다. 이들 실험으로부터, 전장 cDNA 산물의 50%를 생성하는 주형 길이로서 가공성 계수를 정량화한다. 단일 사이클 프라이머 연장 반응으로부터의 cDNA 산물의 길이 중앙값은 RT가 시험된 주형 상에서 해리될 확률을 추정하는 데 사용된다. 이로부터, 각각의 해리가 독립적인 이벤트이고 해리 확률이 모든 뉴클레오티드 위치에서 동일하다고 가정하면, RT가 각각의 뉴클레오티드 위치에서 해리될 확률이 계산된다. 그런 다음, 해리된 RT의 50%에서 주형의 길이를 나타내는 가공성 계수를 1/(2*P d )로서 결정하며, 여기서 P d 는 각 뉴클레오티드에서 해리 확률이다.
예 21 - 프라이머 연장부 상의 도전적인 구조의 체계적 분석(예시)
RT 활성에 대한 도전적인 주형의 영향을 평가하기 위해, 프라이머 연장 반응을 변형과 함께 전술한 바와 같이 수행한다. RNA 주형은 프라이머 결합 부위의 하류에 고정된 거리(100 내지 300 nt)에서 다음의 도전적인 모티프 중 하나를 함유한다: 동종중합체 신축, 열역학적으로 안정한 GC-풍부 줄기 루프, 슈도노트(pseudoknot), tRNA, GII 인트론, 및 염기 또는 골격 변형(예를 들어 슈도우리딘, 포스포티오레이트 결합)을 함유하는 RNA 주형. 반응을 급랭시킨 후, 폴리아크릴아미드 겔을 변성시켜 cDNA 산물의 크기 분포를 분석한다. 또한 어댑터 서열을 T4 리가아제를 사용하여 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킨다. 그런 다음, 결찰된 산물을 PCR 증폭하고, 라이브러리를 차세대 시퀀싱을 위해 준비하여 RT 잘못혼입/삽입/결실 부위 및 단일 뉴클레오티드 분해(resolution)를 갖는 RT 드롭오프 부위 모두를 식별한다. 주어진 위치에서의 RT 드롭오프의 정도는 드롭오프 산물에 상응하는 시퀀싱 판독물의 수를 전장 산물에 상응하는 시퀀싱 판독물의 수와 비교함으로써 정량화한다.
예 22 - 비-주형 염기 첨가 평가(예시)
cDNA 산물의 5' 말단에 염기의 비-주형 첨가를 차세대 시퀀싱에 의해 평가한다. 무세포 발현 시스템 및 RNA 주형으로부터 유래된 RT를 함유하는 프라이머 연장 반응을 전술한 바와 같이 수행한다. 5' 말단에서 상이한 RNA 주형 길이 및 서열 모티프의 체계적 분석을 시험한다. 어댑터 서열을 T4 리가아제에 의해 생성된 cDNA 산물의 3' 말단에 편향되지 않게 결찰시킴으로써, 이들의 3' 말단의 잠재적인 이종 성질에도 불구하고 모든 cDNA 산물이 포획된다. 그런 다음, 결찰된 산물을 PCR로 증폭시키고 차세대 시퀀싱을 위해 라이브러리를 준비한다. 전장보다 긴 실험적으로 생산된 cDNA 서열과 예상 전장 cDNA 기준 서열의 비교를 통해 RNA에 의해 주형화되지 않은 5'-말단에 대한 염기 첨가의 유형 및 수 둘 다를 식별할 수 있다.
예 23 - R2, 비-LTR 및 유사한 시스템에 대한 활성 및 가공성에 대한 5' 및 3' UTR 파라미터 결정(예시)
관심 단백질을 E. coli에서 IPTG-유도 과발현 후 Twin-strep 태그를 통해 정제한다. 정제된 단백질을, 이들의 고유 컨텍스트로부터 식별된 3' UTR 및 시작 코돈을 지나 5' UTR + 400 bp가 측면에 위치한 1 kb 및 4 kb 카고에 대해 시험한다. 활성에 대한 5' 및 3' 측부 서열의 효과를 qPCR을 통해 주형의 말단 근처의 절편에 대해 분석하여 이들 고유 특징을 갖는 카고가 우수한 결과를 생성하는지 여부를 결정한다.
예 24 - RT cDNA 합성 활성은 다수의 적용에 대해 이용될 수 있다(예시).
RNA에 의존하는 공정은 발현, 처리, 변형 및 반감기와 같은 생물학에 중요하다. RNA에 대해 수행된 생명공학에서의 품질 관리 절차는 RNA의 cDNA로의 변환을 이용한다. 따라서, 수년에 걸쳐 cDNA 라이브러리의 생산을 위해 다수의 RT가 사용되어 왔다. 이러한 목적을 위해 사용되는 상업적으로 이용 가능한 RT는 MMLV RT, AMV RT, 및 GsI-IIC RT(TGIRT)를 포함한다. 처음 2개는 레트로바이러스 RT를 나타내는 반면, 후자는 GII 인트론 유래 RT이다. GII 인트론 유래 RT뿐만 아니라 비-LTR 유래 RT는 이들의 레트로바이러스 대응물과 비교하여 여러 이점을 나타낸다. 예를 들어, 이들은 보다 가공성이어서, 구조적 및 변형된 RNA를 통해 판독한다. 구조적 또는 변형된 RNA는 RNA 단편으로서 오해석될 수 있는 조기 종결 산물을 생성하기 때문에 레트로바이러스 RT에 대한 최적의 기질이 아닐 수 있다. 또한, 일부 RT의 스위치를 주형화하는 능력은 초기 어댑터 추가를 위해 활용될 수 있어서, 어댑터 결찰 절차를 라이브러리 준비 동안 덜 중요하게 한다. 따라서, 고도로 가공성인 RT는 복합체 RNA를 갖는 라이브러리의 생성에 적합하다. 또한, 일부 고도로 가공성인 RT는 일반적으로 현재 사용되는 레트로바이러스 RT보다 작으므로, 이들의 생산 및 연관된 하류 공정을 더 용이하게 한다. 본원에 기술된 여러 신규 RT는 상업적으로 이용 가능한 TGIRT 효소를 능가하며, 일부는 cDNA 합성 활성의 10배를 초과한다. 이와 같이, 이들 신규한 RT 중 다수는 cDNA 합성 키트를 상업적으로 적용하기 위한 큰 가능성을 나타낸다.
본 발명의 바람직한 실시예가 본원에 도시되고 기술되었지만, 이러한 실시예는 단지 예시로서 제공된다는 것은 당업자에게 명백할 것이다. 본 발명은 본 명세서 내에 제공된 특정 예에 의해 한정되는 것으로 의도되지 않는다. 본 발명은 전술한 명세서를 참조하여 기술되었지만, 본원의 실시예의 설명 및 예시는 한정적인 의미로 해석되는 것을 의미하지는 않는다. 이제 본 발명을 벗어나지 않고도 많은 변이, 변화, 및 치환이 당업자에게 일어날 것이다. 또한, 본 발명의 모든 측면은 다양한 조건 및 변수에 따라 달라지는 본원에 제시된 특정 도시, 구성, 또는 상대 비율로 한정되지 않음을 이해할 것이다. 본원에 기술된 본 발명의 실시예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 따라서, 본 발명은 임의의 이러한 대안, 변형, 변이, 또는 균등물도 포괄하는 것으로 고려된다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위의 범위에 속하는 방법 및 구조와 이들의 등가물이 이에 의해 포괄되는 것으로 의도된다.
카탈로그 | 서열번호 | 설명 | 유형 |
MG140 전위 단백질 | 1 | MG140-1-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 2 | MG140-2-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 3 | MG140-3-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 4 | MG140-4-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 5 | MG140-5-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 6 | MG140-6-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 7 | MG140-7-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 8 | MG140-8-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 9 | MG140-147 전위 단백질 | 단백질 |
MG140 전위 단백질 | 10 | MG140-9-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 11 | MG140-10-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 12 | MG140-11-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 13 | MG140-12-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 14 | MG140-13-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 15 | MG140-14-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 16 | MG140-15-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 17 | MG140-16-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 18 | MG140-17-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 19 | MG140-18-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 20 | MG140-19-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 21 | MG140-20-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 22 | MG140-21-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 23 | MG140-22-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 24 | MG140-23-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 25 | MG140-24-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 26 | MG140-25-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 27 | MG140-26-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 28 | MG140-27-R2 전위 단백질 | 단백질 |
MG140 전위 단백질 | 29 | MG140-28-R2 전위 단백질 | 단백질 |
MG153 RT MCP 융합 | 30 | FH-MCP-MG153-1 | 뉴클레오티드 |
MG153 RT MCP 융합 | 31 | FH-MCP-MG153-2 | 뉴클레오티드 |
MG153 RT MCP 융합 | 32 | FH-MCP-MG153-3 | 뉴클레오티드 |
나노루시퍼라제 주형s | 33 | 나노루시퍼라제 주형 | 뉴클레오티드 |
상보성 DNA 프라이머 | 34 | 상보성 DNA 프라이머 | 뉴클레오티드 |
PCR 프라이머 | 35 | 100/542 bp 앰플리콘용 순방향 프라이머 | 뉴클레오티드 |
PCR 프라이머 | 36 | 100 bp 앰플리콘용 역방향 프라이머 | 뉴클레오티드 |
PCR 프라이머 | 37 | 542 bp 앰플리콘용 역방향 프라이머 | 뉴클레오티드 |
cDNA로부터 유래된 PCR 앰플리콘 | 38 | 100 bp 앰플리콘 | 뉴클레오티드 |
cDNA로부터 유래된 PCR 앰플리콘 | 39 | 542 bp 앰플리콘 | 뉴클레오티드 |
MG153 RT MCP 융합 | 40 | FH-MCP-MG153-4 | 뉴클레오티드 |
MG153 RT MCP 융합 | 41 | FH-MCP-MG153-7 | 뉴클레오티드 |
MG153 RT MCP 융합 | 42 | FH-MCP-MG153-8 | 뉴클레오티드 |
MG153 RT MCP 융합 | 43 | FH-MCP-MG153-9 | 뉴클레오티드 |
MG153 RT MCP 융합 | 44 | FH-MCP-MG153-10 | 뉴클레오티드 |
MG153 RT MCP 융합 | 45 | FH-MCP-MG153-11 | 뉴클레오티드 |
MG153 RT MCP 융합 | 46 | FH-MCP-MG153-12 | 뉴클레오티드 |
MG153 RT MCP 융합 | 47 | FH-MCP-MG153-13 | 뉴클레오티드 |
MG153 RT MCP 융합 | 48 | FH-MCP-MG153-15 | 뉴클레오티드 |
MG153 RT MCP 융합 | 49 | FH-MCP-MG153-16 | 뉴클레오티드 |
MG153 RT MCP 융합 | 50 | FH-MCP-MG153-21 | 뉴클레오티드 |
pET21(+)로부터 증폭시키기 위한 프라이머 | 51 | LA_061_pmgx_txtl_rv | 뉴클레오티드 |
pET21(+)로부터 증폭시키기 위한 프라이머 | 52 | LA_062_pmgx_txtl_fw | 뉴클레오티드 |
RT RNA 주형 | 53 | emx1에 대한 구조화된 RT 주형 RNA | 뉴클레오티드 |
RT RNA 주형 | 54 | emx1에 대한 구조화된 RT 주형 RNA(5' 절단됨) | 뉴클레오티드 |
RT RNA 주형 | 55 | 소형 RT 주형 | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 56 | LA321_282_FAM | 뉴클레오티드 |
NGS 프라이머 | 57 | LA065_NGS_풍부_fw | 뉴클레오티드 |
NGS 프라이머 | 58 | LA395_282_NGS | 뉴클레오티드 |
NGS 프라이머 | 59 | LA396_RT_짧은_NGS | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 60 | LA423_emx1_6pbs | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 61 | LA424_emx1_8pbs | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 62 | LA425_emx1_10pbs | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 63 | LA426_emx1_13pbs | 뉴클레오티드 |
cDNA 검정을 위한 FAM-표지된 올리고 | 64 | LA427_emx1_20pbs | 뉴클레오티드 |
NGS 충실도에 대한 UMI 프라이머 | 65 | LA430_umi_cdna | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 66 | Nstrep-MG153-1 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 67 | Nstrep-MG153-2 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 68 | Nstrep-MG153-3 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 69 | Nstrep-MG153-4 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 70 | Nstrep-MG153-5 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 71 | Nstrep-MG153-6 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 72 | Nstrep-MG153-7 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 73 | Nstrep-MG153-8 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 74 | Nstrep-MG153-9 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 75 | Nstrep-MG153-10 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 76 | Nstrep-MG153-11 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 77 | Nstrep-MG153-12 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 78 | Nstrep-MG153-13 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 79 | Nstrep-MG153-14 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 80 | Nstrep-MG153-15 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 81 | Nstrep-MG153-16 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 82 | Nstrep-MG153-17 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 83 | Nstrep-MG153-18 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 84 | Nstrep-MG153-19 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 85 | Nstrep-MG153-20 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 86 | Nstrep-MG153-21 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 87 | Nstrep-MG153-25 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 88 | Nstrep-MG153-26 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 89 | Nstrep-MG153-27 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 90 | Nstrep-MG153-28 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 91 | Nstrep-MG153-29 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 92 | Nstrep-MG153-30 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 93 | Nstrep-MG153-31 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 94 | Nstrep-MG153-32 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 95 | Nstrep-MG153-33 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 96 | Nstrep-MG153-34 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 97 | Nstrep-MG153-35 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 98 | Nstrep-MG153-36 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 99 | Nstrep-MG153-37 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 100 | Nstrep-MG153-38 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 101 | Nstrep-MG153-39 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 102 | Nstrep-MG153-40 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 103 | Nstrep-MG153-41 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 104 | Nstrep-MG153-42 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 105 | Nstrep-MG153-43 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 106 | Nstrep-MG153-44 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 107 | Nstrep-MG153-45 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 108 | Nstrep-MG153-46 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 109 | Nstrep-MG153-47 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 110 | Nstrep-MG153-48 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 111 | Nstrep-MG153-49 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 112 | Nstrep-MG153-50 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 113 | Nstrep-MG153-51 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 114 | Nstrep-MG153-52 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 115 | Nstrep-MG153-53 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 116 | Nstrep-MG153-54 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 117 | Nstrep-MG153-55 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 118 | Nstrep-MG153-56 | 뉴클레오티드 |
MG153 Strep 태그된 유전자 | 119 | Nstrep-MG153-57 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 120 | MG153-1 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 121 | MG153-2 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 122 | MG153-3 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 123 | MG153-4 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 124 | MG153-5 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 125 | MG153-6 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 126 | MG153-7 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 127 | MG153-8 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 128 | MG153-9 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 129 | MG153-10 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 130 | MG153-11 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 131 | MG153-12 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 132 | MG153-13 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 133 | MG153-14 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 134 | MG153-15 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 135 | MG153-16 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 136 | MG153-17 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 137 | MG153-18 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 138 | MG153-19 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 139 | MG153-20 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 140 | MG153-21 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 141 | MG153-25 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 142 | MG153-26 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 143 | MG153-27 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 144 | MG153-28 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 145 | MG153-29 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 146 | MG153-30 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 147 | MG153-31 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 148 | MG153-32 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 149 | MG153-33 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 150 | MG153-34 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 151 | MG153-35 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 152 | MG153-36 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 153 | MG153-37 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 154 | MG153-38 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 155 | MG153-39 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 156 | MG153-40 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 157 | MG153-41 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 158 | MG153-42 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 159 | MG153-43 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 160 | MG153-44 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 161 | MG153-45 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 162 | MG153-46 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 163 | MG153-47 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 164 | MG153-48 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 165 | MG153-49 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 166 | MG153-50 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 167 | MG153-51 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 168 | MG153-52 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 169 | MG153-53 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 170 | MG153-54 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 171 | MG153-55 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 172 | MG153-56 | 뉴클레오티드 |
MG153 대장균 코돈 최적화된 유전자 | 173 | MG153-57 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 174 | Nstrep-MG160-1 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 175 | Nstrep-MG160-2 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 176 | Nstrep-MG160-3 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 177 | Nstrep-MG160-4 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 178 | Nstrep-MG160-5 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 179 | Nstrep-MG160-6 | 뉴클레오티드 |
MG160 Strep 태그된 유전자 | 180 | Nstrep-MG160-8 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 181 | MG160-1 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 182 | MG160-2 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 183 | MG160-3 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 184 | MG160-4 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 185 | MG160-5 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 186 | MG160-6 | 뉴클레오티드 |
MG160 대장균 코돈 최적화된 유전자 | 187 | MG160-8 | 뉴클레오티드 |
MG163 Strep 태그된 유전자 | 188 | Nstrep-MG163-1 | 뉴클레오티드 |
MG163 Strep 태그된 유전자 | 189 | Nstrep-MG163-2 | 뉴클레오티드 |
MG163 Strep 태그된 유전자 | 190 | Nstrep-MG163-3 | 뉴클레오티드 |
MG163 Strep 태그된 유전자 | 191 | Nstrep-MG163-4 | 뉴클레오티드 |
MG163 Strep 태그된 유전자 | 192 | Nstrep-MG163-5 | 뉴클레오티드 |
MG163 대장균 코돈 최적화된 유전자 | 193 | MG163-1 | 뉴클레오티드 |
MG163 대장균 코돈 최적화된 유전자 | 194 | MG163-2 | 뉴클레오티드 |
MG163 대장균 코돈 최적화된 유전자 | 195 | MG163-3 | 뉴클레오티드 |
MG163 대장균 코돈 최적화된 유전자 | 196 | MG163-4 | 뉴클레오티드 |
MG163 대장균 코돈 최적화된 유전자 | 197 | MG163-5 | 뉴클레오티드 |
MG164 Strep 태그된 유전자 | 198 | Nstrep-MG164-1 | 뉴클레오티드 |
MG164 Strep 태그된 유전자 | 199 | Nstrep-MG164-2 | 뉴클레오티드 |
MG164 Strep 태그된 유전자 | 200 | Nstrep-MG164-3 | 뉴클레오티드 |
MG164 Strep 태그된 유전자 | 201 | Nstrep-MG164-4 | 뉴클레오티드 |
MG164 Strep 태그된 유전자 | 202 | Nstrep-MG164-5 | 뉴클레오티드 |
MG164 대장균 코돈 최적화된 유전자 | 203 | MG164-1 | 뉴클레오티드 |
MG164 대장균 코돈 최적화된 유전자 | 204 | MG164-2 | 뉴클레오티드 |
MG164 대장균 코돈 최적화된 유전자 | 205 | MG164-3 | 뉴클레오티드 |
MG164 대장균 코돈 최적화된 유전자 | 206 | MG164-4 | 뉴클레오티드 |
MG164 대장균 코돈 최적화된 유전자 | 207 | MG164-5 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 208 | Nstrep-MG165-1 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 209 | Nstrep-MG165-2 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 210 | Nstrep-MG165-3 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 211 | Nstrep-MG165-4 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 212 | Nstrep-MG165-5 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 213 | Nstrep-MG165-6 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 214 | Nstrep-MG165-7 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 215 | Nstrep-MG165-8 | 뉴클레오티드 |
MG165 Strep 태그된 유전자 | 216 | Nstrep-MG165-9 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 217 | MG165-1 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 218 | MG165-2 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 219 | MG165-3 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 220 | MG165-4 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 221 | MG165-5 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 222 | MG165-6 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 223 | MG165-7 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 224 | MG165-8 | 뉴클레오티드 |
MG165 대장균 코돈 최적화된 유전자 | 225 | MG165-9 | 뉴클레오티드 |
MG166 Strep 태그된 유전자 | 226 | Nstrep-MG166-1 | 뉴클레오티드 |
MG166 Strep 태그된 유전자 | 227 | Nstrep-MG166-2 | 뉴클레오티드 |
MG166 Strep 태그된 유전자 | 228 | Nstrep-MG166-3 | 뉴클레오티드 |
MG166 Strep 태그된 유전자 | 229 | Nstrep-MG166-4 | 뉴클레오티드 |
MG166 Strep 태그된 유전자 | 230 | Nstrep-MG166-5 | 뉴클레오티드 |
MG166 대장균 코돈 최적화된 유전자 | 231 | MG166-1 | 뉴클레오티드 |
MG166 대장균 코돈 최적화된 유전자 | 232 | MG166-2 | 뉴클레오티드 |
MG166 대장균 코돈 최적화된 유전자 | 233 | MG166-3 | 뉴클레오티드 |
MG166 대장균 코돈 최적화된 유전자 | 234 | MG166-4 | 뉴클레오티드 |
MG166 대장균 코돈 최적화된 유전자 | 235 | MG166-5 | 뉴클레오티드 |
MG167 Strep 태그된 유전자 | 236 | Nstrep-MG167-1 | 뉴클레오티드 |
MG167 Strep 태그된 유전자 | 237 | Nstrep-MG167-2 | 뉴클레오티드 |
MG167 Strep 태그된 유전자 | 238 | Nstrep-MG167-3 | 뉴클레오티드 |
MG167 Strep 태그된 유전자 | 239 | Nstrep-MG167-4 | 뉴클레오티드 |
MG167 Strep 태그된 유전자 | 240 | Nstrep-MG167-5 | 뉴클레오티드 |
MG167 대장균 코돈 최적화된 유전자 | 241 | MG167-1 | 뉴클레오티드 |
MG167 대장균 코돈 최적화된 유전자 | 242 | MG167-2 | 뉴클레오티드 |
MG167 대장균 코돈 최적화된 유전자 | 243 | MG167-3 | 뉴클레오티드 |
MG167 대장균 코돈 최적화된 유전자 | 244 | MG167-4 | 뉴클레오티드 |
MG167 대장균 코돈 최적화된 유전자 | 245 | MG167-5 | 뉴클레오티드 |
MG168 Strep 태그된 유전자 | 246 | Nstrep-MG168-1 | 뉴클레오티드 |
MG168 Strep 태그된 유전자 | 247 | Nstrep-MG168-2 | 뉴클레오티드 |
MG168 Strep 태그된 유전자 | 248 | Nstrep-MG168-3 | 뉴클레오티드 |
MG168 Strep 태그된 유전자 | 249 | Nstrep-MG168-4 | 뉴클레오티드 |
MG168 Strep 태그된 유전자 | 250 | Nstrep-MG168-5 | 뉴클레오티드 |
MG168 대장균 코돈 최적화된 유전자 | 251 | MG168-1 | 뉴클레오티드 |
MG168 대장균 코돈 최적화된 유전자 | 252 | MG168-2 | 뉴클레오티드 |
MG168 대장균 코돈 최적화된 유전자 | 253 | MG168-3 | 뉴클레오티드 |
MG168 대장균 코돈 최적화된 유전자 | 254 | MG168-4 | 뉴클레오티드 |
MG168 대장균 코돈 최적화된 유전자 | 255 | MG168-5 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 256 | Nstrep-MG169-1 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 257 | Nstrep-MG169-2 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 258 | Nstrep-MG169-3 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 259 | Nstrep-MG169-4 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 260 | Nstrep-MG169-5 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 261 | Nstrep-MG169-6 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 262 | Nstrep-MG169-7 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 263 | Nstrep-MG169-8 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 264 | Nstrep-MG169-9 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 265 | Nstrep-MG169-10 | 뉴클레오티드 |
MG169 Strep 태그된 유전자 | 266 | Nstrep-MG169-11 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 267 | MG169-1 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 268 | MG169-2 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 269 | MG169-3 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 270 | MG169-4 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 271 | MG169-5 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 272 | MG169-6 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 273 | MG169-7 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 274 | MG169-8 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 275 | MG169-9 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 276 | MG169-10 | 뉴클레오티드 |
MG169 대장균 코돈 최적화된 유전자 | 277 | MG169-11 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 278 | Nstrep-MG170-1 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 279 | Nstrep-MG170-2 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 280 | Nstrep-MG170-3 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 281 | Nstrep-MG170-4 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 282 | Nstrep-MG170-5 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 283 | Nstrep-MG170-6 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 284 | Nstrep-MG170-7 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 285 | Nstrep-MG170-8 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 286 | Nstrep-MG170-9 | 뉴클레오티드 |
MG170 Strep 태그된 유전자 | 287 | Nstrep-MG170-10 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 288 | MG170-1 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 289 | MG170-2 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 290 | MG170-3 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 291 | MG170-4 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 292 | MG170-5 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 293 | MG170-6 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 294 | MG170-7 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 295 | MG170-8 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 296 | MG170-9 | 뉴클레오티드 |
MG170 대장균 코돈 최적화된 유전자 | 297 | MG170-10 | 뉴클레오티드 |
MG172 Strep 태그된 유전자 | 298 | Nstrep-MG172-1 | 뉴클레오티드 |
MG172 Strep 태그된 유전자 | 299 | Nstrep-MG172-2 | 뉴클레오티드 |
MG172 Strep 태그된 유전자 | 300 | Nstrep-MG172-3 | 뉴클레오티드 |
MG172 Strep 태그된 유전자 | 301 | Nstrep-MG172-4 | 뉴클레오티드 |
MG172 Strep 태그된 유전자 | 302 | Nstrep-MG172-5 | 뉴클레오티드 |
MG172 대장균 코돈 최적화된 유전자 | 303 | MG172-1 | 뉴클레오티드 |
MG172 대장균 코돈 최적화된 유전자 | 304 | MG172-2 | 뉴클레오티드 |
MG172 대장균 코돈 최적화된 유전자 | 305 | MG172-3 | 뉴클레오티드 |
MG172 대장균 코돈 최적화된 유전자 | 306 | MG172-4 | 뉴클레오티드 |
MG172 대장균 코돈 최적화된 유전자 | 307 | MG172-5 | 뉴클레오티드 |
MG154 Strep 태그된 유전자 | 308 | Nstrep-MG154-1 | 뉴클레오티드 |
MG154 Strep 태그된 유전자 | 309 | Nstrep-MG154-2 | 뉴클레오티드 |
MG155 Strep 태그된 유전자 | 310 | Nstrep-MG155-1 | 뉴클레오티드 |
MG155 Strep 태그된 유전자 | 311 | Nstrep-MG155-2 | 뉴클레오티드 |
MG155 Strep 태그된 유전자 | 312 | Nstrep-MG155-3 | 뉴클레오티드 |
MG156 Strep 태그된 유전자 | 313 | Nstrep-MG156-1 | 뉴클레오티드 |
MG156 Strep 태그된 유전자 | 314 | Nstrep-MG156-2 | 뉴클레오티드 |
MG157 Strep 태그된 유전자 | 315 | Nstrep-MG157-1 | 뉴클레오티드 |
MG157 Strep 태그된 유전자 | 316 | Nstrep-MG157-2 | 뉴클레오티드 |
MG157 Strep 태그된 유전자 | 317 | Nstrep-MG157-3 | 뉴클레오티드 |
MG157 Strep 태그된 유전자 | 318 | Nstrep-MG157-4 | 뉴클레오티드 |
MG157 Strep 태그된 유전자 | 319 | Nstrep-MG157-5 | 뉴클레오티드 |
MG158 Strep 태그된 유전자 | 320 | Nstrep-MG158-1 | 뉴클레오티드 |
MG159 Strep 태그된 유전자 | 321 | Nstrep-MG159-1 | 뉴클레오티드 |
MG159 Strep 태그된 유전자 | 322 | Nstrep-MG159-2 | 뉴클레오티드 |
MG159 Strep 태그된 유전자 | 323 | Nstrep-MG159-3 | 뉴클레오티드 |
MG154 대장균 코돈 최적화된 유전자 | 324 | MG154-1 | 뉴클레오티드 |
MG154 대장균 코돈 최적화된 유전자 | 325 | MG154-2 | 뉴클레오티드 |
MG155 대장균 코돈 최적화된 유전자 | 326 | MG155-1 | 뉴클레오티드 |
MG155 대장균 코돈 최적화된 유전자 | 327 | MG155-2 | 뉴클레오티드 |
MG155 대장균 코돈 최적화된 유전자 | 328 | MG155-3 | 뉴클레오티드 |
MG156 대장균 코돈 최적화된 유전자 | 329 | MG156-1 | 뉴클레오티드 |
MG156 대장균 코돈 최적화된 유전자 | 330 | MG156-2 | 뉴클레오티드 |
MG157 대장균 코돈 최적화된 유전자 | 331 | MG157-1 | 뉴클레오티드 |
MG157 대장균 코돈 최적화된 유전자 | 332 | MG157-2 | 뉴클레오티드 |
MG157 대장균 코돈 최적화된 유전자 | 333 | MG157-3 | 뉴클레오티드 |
MG157 대장균 코돈 최적화된 유전자 | 334 | MG157-4 | 뉴클레오티드 |
MG157 대장균 코돈 최적화된 유전자 | 335 | MG157-5 | 뉴클레오티드 |
MG158 대장균 코돈 최적화된 유전자 | 336 | MG158-1 | 뉴클레오티드 |
MG159 대장균 코돈 최적화된 유전자 | 337 | MG159-1 | 뉴클레오티드 |
MG159 대장균 코돈 최적화된 유전자 | 338 | MG159-2 | 뉴클레오티드 |
MG159 대장균 코돈 최적화된 유전자 | 339 | MG159-3 | 뉴클레오티드 |
MG154 ncRNA | 340 | MG154-1_ncRNA | 뉴클레오티드 |
MG154 ncRNA | 341 | MG154-2_ncRNA | 뉴클레오티드 |
MG155 ncRNA | 342 | MG155-1_ncRNA | 뉴클레오티드 |
MG155 ncRNA | 343 | MG155-2_ncRNA | 뉴클레오티드 |
MG155 ncRNA | 344 | MG155-3_ncRNA | 뉴클레오티드 |
MG156 ncRNA | 345 | MG156-1_ncRNA | 뉴클레오티드 |
MG156 ncRNA | 346 | MG156-2_ncRNA | 뉴클레오티드 |
MG157 ncRNA | 347 | MG157-1_ncRNA | 뉴클레오티드 |
MG157 ncRNA | 348 | MG157-2_ncRNA | 뉴클레오티드 |
MG157 ncRNA | 349 | MG157-3_ncRNA | 뉴클레오티드 |
MG157 ncRNA | 350 | MG157-4_ncRNA | 뉴클레오티드 |
MG157 ncRNA | 351 | MG157-5_ncRNA | 뉴클레오티드 |
MG158 ncRNA | 352 | MG158-1_ncRNA | 뉴클레오티드 |
MG159 ncRNA | 353 | MG159-1_ncRNA | 뉴클레오티드 |
MG159 ncRNA | 354 | MG159-2_ncRNA | 뉴클레오티드 |
MG159 ncRNA | 355 | MG159-3_ncRNA | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 356 | TwinStrep-MG151-80 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 357 | TwinStrep-MG151-81 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 358 | TwinStrep-MG151-82 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 359 | TwinStrep-MG151-83 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 360 | TwinStrep-MG151-84 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 361 | TwinStrep-MG151-85 | 뉴클레오티드 |
MG151 TwinStrep 태그된 유전자 | 362 | TwinStrep-MG151-86 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 363 | Strep-MG151-87 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 364 | Strep-MG151-88 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 365 | Strep-MG151-89 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 366 | Strep-MG151-90 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 367 | Strep-MG151-91 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 368 | Strep-MG151-92 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 369 | Strep-MG151-93 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 370 | Strep-MG151-94 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 371 | Strep-MG151-95 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 372 | Strep-MG151-96 | 뉴클레오티드 |
MG151 Strep 태그된 유전자 | 373 | Strep-MG151-97 | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 374 | MG140-1-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 375 | MG140-3-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 376 | MG140-4-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 377 | MG140-5-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 378 | MG140-6-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 379 | MG140-7-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 380 | MG140-8-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 381 | MG140-10-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 382 | MG140-13-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 383 | MG140-14-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 384 | MG140-45-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 385 | MG140-46-HA-His | 뉴클레오티드 |
MG140 HA-His 태그된 유전자 | 386 | MG140-47-HA-His | 뉴클레오티드 |
MG146 HA-His 태그된 유전자 | 387 | MG146-1-HA-His | 뉴클레오티드 |
MG147 HA-His 태그된 유전자 | 388 | MG147-1-HA-His | 뉴클레오티드 |
MG148 HA-His 태그된 유전자 | 389 | MG148-1-HA-His | 뉴클레오티드 |
MG148 HA-His 태그된 유전자 | 390 | MG148-2-HA-His | 뉴클레오티드 |
MG148 HA-His 태그된 유전자 | 391 | MG148-3-HA-His | 뉴클레오티드 |
MG148 HA-His 태그된 유전자 | 392 | MG148-4-HA-His | 뉴클레오티드 |
MG140 전위 단백질 | 393 | MG140-45 전위 단백질 | 단백질 |
MG140 전위 단백질 | 394 | MG140-46 전위 단백질 | 단백질 |
MG140 전위 단백질 | 395 | MG140-47 전위 단백질 | 단백질 |
MG140 전위 단백질 | 396 | MG140-48 전위 단백질 | 단백질 |
MG140 전위 단백질 | 397 | MG140-49 전위 단백질 | 단백질 |
MG140 전위 단백질 | 398 | MG140-50 전위 단백질 | 단백질 |
MG140 전위 단백질 | 399 | MG140-51 전위 단백질 | 단백질 |
MG140 전위 단백질 | 400 | MG140-52 전위 단백질 | 단백질 |
MG140 전위 단백질 | 401 | MG140-53 전위 단백질 | 단백질 |
MG146 전위 단백질 | 402 | MG146-1 전위 단백질 | 단백질 |
MG148 역전사 효소 단백질 | 403 | MG148-13 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 404 | MG148-14 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 405 | MG148-15 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 406 | MG148-16 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 407 | MG148-17 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 408 | MG148-18 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 409 | MG148-19 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 410 | MG148-20 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 411 | MG148-21 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 412 | MG148-22 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 413 | MG148-23 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 414 | MG148-24 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 415 | MG148-25 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 416 | MG148-26 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 417 | MG148-27 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 418 | MG148-29 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 419 | MG148-30 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 420 | MG148-31 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 421 | MG148-32 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 422 | MG148-33 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 423 | MG148-34 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 424 | MG148-35 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 425 | MG148-36 역전사 효소 | 단백질 |
MG148 역전사 효소 단백질 | 426 | MG148-37 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 427 | MG149-1 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 428 | MG149-2 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 429 | MG149-3 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 430 | MG149-5 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 431 | MG149-6 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 432 | MG149-7 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 433 | MG149-8 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 434 | MG149-9 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 435 | MG149-10 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 436 | MG149-11 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 437 | MG149-12 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 438 | MG149-13 역전사 효소 | 단백질 |
MG149 역전사 효소 단백질 | 439 | MG149-14 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 440 | MG151-1 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 441 | MG151-2 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 442 | MG151-3 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 443 | MG151-4 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 444 | MG151-5 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 445 | MG151-6 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 446 | MG151-7 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 447 | MG151-8 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 448 | MG151-9 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 449 | MG151-10 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 450 | MG151-12 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 451 | MG151-13 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 452 | MG151-14 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 453 | MG151-15 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 454 | MG151-16 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 455 | MG151-17 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 456 | MG151-18 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 457 | MG151-19 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 458 | MG151-20 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 459 | MG151-21 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 460 | MG151-22 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 461 | MG151-23 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 462 | MG151-24 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 463 | MG151-25 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 464 | MG151-26 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 465 | MG151-27 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 466 | MG151-28 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 467 | MG151-29 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 468 | MG151-30 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 469 | MG151-31 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 470 | MG151-32 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 471 | MG151-33 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 472 | MG151-34 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 473 | MG151-35 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 474 | MG151-36 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 475 | MG151-37 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 476 | MG151-38 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 477 | MG151-39 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 478 | MG151-40 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 479 | MG151-41 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 480 | MG151-42 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 481 | MG151-43 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 482 | MG151-44 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 483 | MG151-45 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 484 | MG151-46 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 485 | MG151-47 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 486 | MG151-48 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 487 | MG151-49 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 488 | MG151-50 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 489 | MG151-51 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 490 | MG151-52 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 491 | MG151-53 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 492 | MG151-54 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 493 | MG151-55 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 494 | MG151-56 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 495 | MG151-57 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 496 | MG151-58 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 497 | MG151-59 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 498 | MG151-60 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 499 | MG151-61 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 500 | MG151-62 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 501 | MG151-63 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 502 | MG151-64 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 503 | MG151-65 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 504 | MG151-66 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 505 | MG151-67 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 506 | MG151-68 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 507 | MG151-69 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 508 | MG151-70 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 509 | MG151-71 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 510 | MG151-72 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 511 | MG151-73 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 512 | MG151-74 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 513 | MG151-75 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 514 | MG151-76 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 515 | MG151-77 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 516 | MG151-78 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 517 | MG151-79 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 518 | MG151-80 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 519 | MG151-81 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 520 | MG151-82 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 521 | MG151-83 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 522 | MG151-84 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 523 | MG151-85 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 524 | MG151-87 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 525 | MG151-88 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 526 | MG151-89 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 527 | MG151-90 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 528 | MG151-91 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 529 | MG151-92 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 530 | MG151-93 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 531 | MG151-94 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 532 | MG151-95 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 533 | MG151-96 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 534 | MG151-97 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 535 | MG151-98 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 536 | MG151-99 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 537 | MG151-100 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 538 | MG151-101 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 539 | MG151-102 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 540 | MG151-103 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 541 | MG151-104 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 542 | MG151-105 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 543 | MG151-106 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 544 | MG151-107 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 545 | MG151-108 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 546 | MG151-109 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 547 | MG151-110 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 548 | MG151-111 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 549 | MG151-112 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 550 | MG151-113 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 551 | MG151-114 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 552 | MG151-115 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 553 | MG151-116 역전사 효소 | 단백질 |
MG151 역전사 효소 단백질 | 554 | MG151-117 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 555 | MG153-1 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 556 | MG153-2 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 557 | MG153-3 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 558 | MG153-4 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 559 | MG153-5 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 560 | MG153-6 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 561 | MG153-7 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 562 | MG153-8 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 563 | MG153-9 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 564 | MG153-10 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 565 | MG153-11 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 566 | MG153-12 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 567 | MG153-13 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 568 | MG153-14 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 569 | MG153-15 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 570 | MG153-16 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 571 | MG153-17 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 572 | MG153-18 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 573 | MG153-19 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 574 | MG153-20 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 575 | MG153-21 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 576 | MG153-25 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 577 | MG153-26 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 578 | MG153-27 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 579 | MG153-28 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 580 | MG153-29 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 581 | MG153-30 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 582 | MG153-31 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 583 | MG153-32 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 584 | MG153-33 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 585 | MG153-34 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 586 | MG153-35 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 587 | MG153-36 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 588 | MG153-37 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 589 | MG153-38 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 590 | MG153-39 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 591 | MG153-40 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 592 | MG153-41 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 593 | MG153-42 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 594 | MG153-43 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 595 | MG153-44 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 596 | MG153-45 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 597 | MG153-46 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 598 | MG153-47 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 599 | MG153-48 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 600 | MG153-49 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 601 | MG153-50 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 602 | MG153-51 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 603 | MG153-52 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 604 | MG153-53 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 605 | MG153-54 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 606 | MG153-55 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 607 | MG153-56 역전사 효소 | 단백질 |
MG153 역전사 효소 단백질 | 608 | MG153-57 역전사 효소 | 단백질 |
MG154 역전사 효소 단백질 | 609 | MG154-1 역전사 효소 | 단백질 |
MG154 역전사 효소 단백질 | 610 | MG154-2 역전사 효소 | 단백질 |
MG155 역전사 효소 단백질 | 611 | MG155-1 역전사 효소 | 단백질 |
MG155 역전사 효소 단백질 | 612 | MG155-2 역전사 효소 | 단백질 |
MG155 역전사 효소 단백질 | 613 | MG155-3 역전사 효소 | 단백질 |
MG155 역전사 효소 단백질 | 614 | MG155-4 역전사 효소 | 단백질 |
MG155 역전사 효소 단백질 | 615 | MG155-5 역전사 효소 | 단백질 |
MG156 역전사 효소 단백질 | 616 | MG156-1 역전사 효소 | 단백질 |
MG156 역전사 효소 단백질 | 617 | MG156-2 역전사 효소 | 단백질 |
MG157 역전사 효소 단백질 | 618 | MG157-1 역전사 효소 | 단백질 |
MG157 역전사 효소 단백질 | 619 | MG157-2 역전사 효소 | 단백질 |
MG157 역전사 효소 단백질 | 620 | MG157-3 역전사 효소 | 단백질 |
MG157 역전사 효소 단백질 | 621 | MG157-4 역전사 효소 | 단백질 |
MG157 역전사 효소 단백질 | 622 | MG157-5 역전사 효소 | 단백질 |
MG158 역전사 효소 단백질 | 623 | MG158-1 역전사 효소 | 단백질 |
MG159 역전사 효소 단백질 | 624 | MG159-1 역전사 효소 | 단백질 |
MG159 역전사 효소 단백질 | 625 | MG159-2 역전사 효소 | 단백질 |
MG159 역전사 효소 단백질 | 626 | MG159-3 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 627 | MG160-1 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 628 | MG160-2 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 629 | MG160-3 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 630 | MG160-4 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 631 | MG160-5 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 632 | MG160-8 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 633 | MG160-6 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 634 | MG160-9 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 635 | MG160-10 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 636 | MG160-11 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 637 | MG160-12 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 638 | MG160-13 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 639 | MG160-14 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 640 | MG160-15 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 641 | MG160-16 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 642 | MG160-17 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 643 | MG160-18 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 644 | MG160-19 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 645 | MG160-20 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 646 | MG160-21 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 647 | MG160-22 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 648 | MG160-23 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 649 | MG160-24 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 650 | MG160-25 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 651 | MG160-26 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 652 | MG160-27 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 653 | MG160-28 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 654 | MG160-29 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 655 | MG160-30 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 656 | MG160-31 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 657 | MG160-32 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 658 | MG160-33 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 659 | MG160-34 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 660 | MG160-35 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 661 | MG160-36 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 662 | MG160-37 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 663 | MG160-38 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 664 | MG160-39 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 665 | MG160-40 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 666 | MG160-41 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 667 | MG160-42 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 668 | MG160-43 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 669 | MG160-44 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 670 | MG160-45 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 671 | MG160-46 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 672 | MG160-47 역전사 효소 | 단백질 |
MG160 역전사 효소 단백질 | 673 | MG160-48 역전사 효소 | 단백질 |
MG163 역전사 효소 단백질 | 674 | MG163-1 역전사 효소 | 단백질 |
MG163 역전사 효소 단백질 | 675 | MG163-2 역전사 효소 | 단백질 |
MG163 역전사 효소 단백질 | 676 | MG163-3 역전사 효소 | 단백질 |
MG163 역전사 효소 단백질 | 677 | MG163-4 역전사 효소 | 단백질 |
MG163 역전사 효소 단백질 | 678 | MG163-5 역전사 효소 | 단백질 |
MG164 역전사 효소 단백질 | 679 | MG164-1 역전사 효소 | 단백질 |
MG164 역전사 효소 단백질 | 680 | MG164-2 역전사 효소 | 단백질 |
MG164 역전사 효소 단백질 | 681 | MG164-3 역전사 효소 | 단백질 |
MG164 역전사 효소 단백질 | 682 | MG164-4 역전사 효소 | 단백질 |
MG164 역전사 효소 단백질 | 683 | MG164-5 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 684 | MG165-1 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 685 | MG165-2 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 686 | MG165-3 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 687 | MG165-4 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 688 | MG165-5 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 689 | MG165-6 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 690 | MG165-7 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 691 | MG165-8 역전사 효소 | 단백질 |
MG165 역전사 효소 단백질 | 692 | MG165-9 역전사 효소 | 단백질 |
MG166 역전사 효소 단백질 | 693 | MG166-1 역전사 효소 | 단백질 |
MG166 역전사 효소 단백질 | 694 | MG166-2 역전사 효소 | 단백질 |
MG166 역전사 효소 단백질 | 695 | MG166-3 역전사 효소 | 단백질 |
MG166 역전사 효소 단백질 | 696 | MG166-4 역전사 효소 | 단백질 |
MG166 역전사 효소 단백질 | 697 | MG166-5 역전사 효소 | 단백질 |
MG167 역전사 효소 단백질 | 698 | MG167-1 역전사 효소 | 단백질 |
MG167 역전사 효소 단백질 | 699 | MG167-2 역전사 효소 | 단백질 |
MG167 역전사 효소 단백질 | 700 | MG167-3 역전사 효소 | 단백질 |
MG167 역전사 효소 단백질 | 701 | MG167-4 역전사 효소 | 단백질 |
MG167 역전사 효소 단백질 | 702 | MG167-5 역전사 효소 | 단백질 |
MG168 역전사 효소 단백질 | 703 | MG168-1 역전사 효소 | 단백질 |
MG168 역전사 효소 단백질 | 704 | MG168-2 역전사 효소 | 단백질 |
MG168 역전사 효소 단백질 | 705 | MG168-3 역전사 효소 | 단백질 |
MG168 역전사 효소 단백질 | 706 | MG168-4 역전사 효소 | 단백질 |
MG168 역전사 효소 단백질 | 707 | MG168-5 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 708 | MG169-1 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 709 | MG169-2 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 710 | MG169-3 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 711 | MG169-4 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 712 | MG169-5 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 713 | MG169-6 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 714 | MG169-7 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 715 | MG169-8 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 716 | MG169-9 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 717 | MG169-10 역전사 효소 | 단백질 |
MG169 역전사 효소 단백질 | 718 | MG169-11 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 719 | MG170-1 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 720 | MG170-2 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 721 | MG170-3 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 722 | MG170-4 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 723 | MG170-5 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 724 | MG170-6 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 725 | MG170-7 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 726 | MG170-8 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 727 | MG170-9 역전사 효소 | 단백질 |
MG170 역전사 효소 단백질 | 728 | MG170-10 역전사 효소 | 단백질 |
MG172 역전사 효소 단백질 | 729 | MG172-1 역전사 효소 | 단백질 |
MG172 역전사 효소 단백질 | 730 | MG172-2 역전사 효소 | 단백질 |
MG172 역전사 효소 단백질 | 731 | MG172-3 역전사 효소 | 단백질 |
MG172 역전사 효소 단백질 | 732 | MG172-4 역전사 효소 | 단백질 |
MG172 역전사 효소 단백질 | 733 | MG172-5 역전사 효소 | 단백질 |
MG173 역전사 효소 단백질 | 734 | MG173-1 역전사 효소 | 단백질 |
MG173 역전사 효소 단백질 | 735 | MG173-2 역전사 효소 | 단백질 |
PS 변형된 프라이머 | 736 | PS-변형된 DNA 프라이머 #1, *로 표시된 PS 결합 | 뉴클레오티드 |
PS 변형된 프라이머 | 737 | PS-변형된 DNA 프라이머 #2, *로 표시된 PS 결합 | 뉴클레오티드 |
PS 변형된 프라이머 | 738 | PS-변형된 DNA 프라이머 #3, *로 표시된 PS 결합 | 뉴클레오티드 |
QPCR용 Taqman 프로브 | 739 | 542 bp 앰플리콘용 Taqman 프로브 | 뉴클레오티드 |
MG153 RT MCP 융합 | 740 | FH-MCP-MG153-5 | 뉴클레오티드 |
MG153 RT MCP 융합 | 741 | FH-MCP-MG153-6 | 뉴클레오티드 |
MG153 RT MCP 융합 | 742 | FH-MCP-MG153-18 | 뉴클레오티드 |
MG153 RT MCP 융합 | 743 | FH-MCP-MG153-20 | 뉴클레오티드 |
MG153 RT MCP 융합 | 744 | FH-MCP-MG153-29 | 뉴클레오티드 |
MG153 RT MCP 융합 | 745 | FH-MCP-MG153-30 | 뉴클레오티드 |
MG153 RT MCP 융합 | 746 | FH-MCP-MG153-31 | 뉴클레오티드 |
MG153 RT MCP 융합 | 747 | FH-MCP-MG153-33 | 뉴클레오티드 |
MG153 RT MCP 융합 | 748 | FH-MCP-MG153-34 | 뉴클레오티드 |
MG153 RT MCP 융합 | 749 | FH-MCP-MG153-35 | 뉴클레오티드 |
MG153 RT MCP 융합 | 750 | FH-MCP-MG153-36 | 뉴클레오티드 |
MG153 RT MCP 융합 | 751 | FH-MCP-MG153-37 | 뉴클레오티드 |
MG153 RT MCP 융합 | 752 | FH-MCP-MG153-45 | 뉴클레오티드 |
MG153 RT MCP 융합 | 753 | FH-MCP-MG153-51 | 뉴클레오티드 |
MG153 RT MCP 융합 | 754 | FH-MCP-MG153-53 | 뉴클레오티드 |
MG153 RT MCP 융합 | 755 | FH-MCP-MG153-54 | 뉴클레오티드 |
MG153 RT MCP 융합 | 756 | FH-MCP-MG153-57 | 뉴클레오티드 |
MG165 RT MCP 융합 | 757 | FH-MCP-MG165-1 | 뉴클레오티드 |
MG165 RT MCP 융합 | 758 | FH-MCP-MG165-5 | 뉴클레오티드 |
MG167 RT MCP 융합 | 759 | FH-MCP-MG167-1 | 뉴클레오티드 |
MG167 RT MCP 융합 | 760 | FH-MCP-MG167-4 | 뉴클레오티드 |
MG140 UTR | 761 | MG140-54 5' UTR | 뉴클레오티드 |
MG140 UTR | 762 | MG140-54 3' UTR | 뉴클레오티드 |
MG140 UTR | 763 | MG140-55 5' UTR | 뉴클레오티드 |
MG140 UTR | 764 | MG140-55 3' UTR | 뉴클레오티드 |
MG140 UTR | 765 | MG140-56 5' UTR | 뉴클레오티드 |
MG140 UTR | 766 | MG140-56 3' UTR | 뉴클레오티드 |
MG140 UTR | 767 | MG140-1 5' UTR | 뉴클레오티드 |
MG140 UTR | 768 | MG140-1 3' UTR | 뉴클레오티드 |
MG140 UTR | 769 | MG140-3 5' UTR | 뉴클레오티드 |
MG140 UTR | 770 | MG140-3 3' UTR | 뉴클레오티드 |
MG140 UTR | 771 | MG140-4 5' UTR | 뉴클레오티드 |
MG140 UTR | 772 | MG140-4 3' UTR | 뉴클레오티드 |
MG140 UTR | 773 | MG140-5 5' UTR | 뉴클레오티드 |
MG140 UTR | 774 | MG140-5 3' UTR | 뉴클레오티드 |
MG140 UTR | 775 | MG140-6 5' UTR | 뉴클레오티드 |
MG140 UTR | 776 | MG140-6 3' UTR | 뉴클레오티드 |
MG140 UTR | 777 | MG140-7 5' UTR | 뉴클레오티드 |
MG140 UTR | 778 | MG140-7 3' UTR | 뉴클레오티드 |
MG140 UTR | 779 | MG140-8 5' UTR | 뉴클레오티드 |
MG140 UTR | 780 | MG140-8 3' UTR | 뉴클레오티드 |
MG140 UTR | 781 | MG140-10 5' UTR | 뉴클레오티드 |
MG140 UTR | 782 | MG140-10 3' UTR | 뉴클레오티드 |
MG140 UTR | 783 | MG140-13 5' UTR | 뉴클레오티드 |
MG140 UTR | 784 | MG140-13 3' UTR | 뉴클레오티드 |
MG140 UTR | 785 | MG140-14 5' UTR | 뉴클레오티드 |
MG140 UTR | 786 | MG140-14 3' UTR | 뉴클레오티드 |
MG140 UTR | 787 | MG140-45 5' UTR | 뉴클레오티드 |
MG140 UTR | 788 | MG140-45 3' UTR | 뉴클레오티드 |
MG140 UTR | 789 | MG140-46 5' UTR | 뉴클레오티드 |
MG140 UTR | 790 | MG140-46 3' UTR | 뉴클레오티드 |
MG140 UTR | 791 | MG140-47 5' UTR | 뉴클레오티드 |
MG140 UTR | 792 | MG140-47 3' UTR | 뉴클레오티드 |
MG140 UTR | 793 | MG140-54 5' UTR | 뉴클레오티드 |
MG140 UTR | 794 | MG140-54 3' UTR | 뉴클레오티드 |
MG140 UTR | 795 | MG140-55 5' UTR | 뉴클레오티드 |
MG140 UTR | 796 | MG140-55 3' UTR | 뉴클레오티드 |
MG140 UTR | 797 | MG140-56 5' UTR | 뉴클레오티드 |
MG140 UTR | 798 | MG140-56 3' UTR | 뉴클레오티드 |
MG140 역전사 효소 단백질 | 799 | MG140-54 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 800 | MG140-55 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 801 | MG140-56 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 802 | MG140-54 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 803 | MG140-55 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 804 | MG140-56 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 805 | MG140-57 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 806 | MG140-58 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 807 | MG140-59 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 808 | MG140-60 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 809 | MG140-61 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 810 | MG140-62 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 811 | MG140-63 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 812 | MG140-64 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 813 | MG140-65 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 814 | MG140-66 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 815 | MG140-67 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 816 | MG140-68 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 817 | MG140-69 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 818 | MG140-70 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 819 | MG140-71 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 820 | MG140-72 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 821 | MG140-73 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 822 | MG140-74 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 823 | MG140-75 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 824 | MG140-76 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 825 | MG140-77 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 826 | MG140-78 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 827 | MG140-79 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 828 | MG140-80 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 829 | MG140-81 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 830 | MG140-82 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 831 | MG140-83 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 832 | MG140-84 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 833 | MG140-85 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 834 | MG140-86 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 835 | MG140-87 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 836 | MG140-88 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 837 | MG140-89 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 838 | MG140-90 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 839 | MG140-91 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 840 | MG140-92 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 841 | MG140-93 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 842 | MG140-94 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 843 | MG140-95 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 844 | MG140-96 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 845 | MG140-97 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 846 | MG140-98 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 847 | MG140-99 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 848 | MG140-100 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 849 | MG140-101 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 850 | MG140-102 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 851 | MG140-103 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 852 | MG140-104 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 853 | MG140-105 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 854 | MG140-106 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 855 | MG140-107 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 856 | MG140-108 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 857 | MG140-109 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 858 | MG140-110 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 859 | MG140-111 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 860 | MG140-112 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 861 | MG140-113 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 862 | MG140-114 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 863 | MG140-115 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 864 | MG140-116 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 865 | MG140-117 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 866 | MG140-118 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 867 | MG140-119 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 868 | MG140-120 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 869 | MG140-121 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 870 | MG140-122 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 871 | MG140-123 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 872 | MG140-124 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 873 | MG140-125 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 874 | MG140-126 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 875 | MG140-127 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 876 | MG140-128 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 877 | MG140-129 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 878 | MG140-130 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 879 | MG140-131 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 880 | MG140-132 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 881 | MG140-133 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 882 | MG140-134 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 883 | MG140-135 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 884 | MG140-136 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 885 | MG140-137 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 886 | MG140-138 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 887 | MG140-139 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 888 | MG140-140 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 889 | MG140-141 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 890 | MG140-142 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 891 | MG140-143 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 892 | MG140-144 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 893 | MG140-145 역전사 효소 | 단백질 |
MG140 역전사 효소 단백질 | 894 | MG140-146 역전사 효소 | 단백질 |
MG146 전위 단백질 | 895 | MG146-2 전위 단백질 | 단백질 |
실시예
다음의 실시예는 어떤 방식으로도 제한하려는 것이 아니다.
실시예 1. 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하며, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 시스템.
실시예 2. 실시예 실시예 1에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 3. 실시예 실시예 1 또는 실시예 실시예 2에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 4. 실시예 실시예 1 내지 실시예 3 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 5. 실시예 실시예 1 내지 실시예 4 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 6. 실시예 실시예 1 내지 실시예 5 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.
실시예 7. 실시예 실시예 1 내지 실시예 6 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 비번역 영역(UTR) 및 5' 비번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 8. 실시예 실시예 1 내지 실시예 7 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.
실시예 9. 실시예 실시예 1 내지 실시예 8 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 10. 실시예 실시예 1 내지 실시예 9 중 어느 하나에 있어서, 상기 NLS는 서열번호 896-911로 이루어진 군으로부터 선택되는 서열과 적어도 80% 동일한 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 11. 실시예 실시예 1 내지 실시예 10 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 12. 실시예 실시예 11에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 13. 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하며, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고; 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 14. 실시예 실시예 13에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 조작된 레트로트랜스포사제 시스템.
실시예 15. 실시예 실시예 13 또는 실시예 실시예 14에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 16. 실시예 실시예 13 내지 실시예 15 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 17. 실시예 실시예 13 내지 실시예 16 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 18. 실시예 실시예 13 내지 실시예 17 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 조작된 레트로트랜스포사제 시스템.
실시예 19. 실시예 실시예 13 내지 실시예 18 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 20. 실시예 실시예 13 내지 실시예 19 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 리보핵산 폴리뉴클레오티드 중간체를 통해 상기 카고 뉴클레오티드 서열을 전위시키도록 구성되는, 조작된 레트로트랜스포사제 시스템.
실시예 21. 실시예 실시예 13 내지 실시예 20 중 어느 하나에 있어서, 상기 서열 동일성은 BLASTP, CLUSTALW, MUSCLE, MAFFT, 또는 Smith-Waterman 상동성 검색 알고리즘 파라미터를 사용하는 CLUSTALW에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 22. 실시예 실시예 21에 있어서, 상기 서열 동일성은, 단어 길이(W) 3, 기대치(E) 10의 파라미터, 및 BLOSUM62 스코어링 매트릭스(존재 11, 연장 1의 갭 비용 설정)를 사용하고, 조건부 조성 스코어 매트릭스 조정을 사용하는, 상기 BLASTP 상동성 검색 알고리즘에 의해 결정되는, 조작된 레트로트랜스포사제 시스템.
실시예 23. 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 암호화하는, 데옥시리보핵산 폴리뉴클레오티드.
실시예 24. 유기체에서의 발현에 최적화된 조작된 핵산 서열을 포함하는 핵산으로서, 여기서 상기 핵산은 레트로트랜스포사제를 암호화하고, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되고, 상기 유기체는 상기 미배양 미생물이 아닌, 핵산.
실시예 25. 실시예 실시예 24에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75%의 서열 동일성을 갖는 변이체를 포함하는, 핵산.
실시예 26. 실시예 실시예 24 또는 실시예 실시예 25에 있어서, 상기 레트로트랜스포사제는 상기 레트로트랜스포사제의 N-말단 또는 C-말단에 근접한 하나 이상의 핵 국소화 서열(NLS)을 암호화하는 서열을 포함하는, 핵산.
실시예 27. 실시예 실시예 26에 있어서, 상기 NLS는 서열번호 896-911로부터 선택되는 서열을 포함하는, 핵산.
실시예 28. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 897을 포함하는, 핵산.
실시예 29. 실시예 실시예 28에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 N-말단에 근접한, 핵산.
실시예 30. 실시예 실시예 26 또는 실시예 27에 있어서, 상기 NLS는 서열번호 896을 포함하는, 핵산.
실시예 31. 실시예 실시예 30에 있어서, 상기 NLS는 상기 레트로트랜스포사제의 상기 C-말단에 근접한, 핵산.
실시예 32. 실시예 실시예 24 내지 실시예 31에 있어서, 상기 유기체는 원핵생물, 박테리아, 진핵생물, 진균류, 식물, 포유류, 설치류, 또는 인간인, 핵산.
실시예 33. 실시예 실시예 24 내지 실시예 32 중 어느 하나의 상기 핵산을 포함하는, 벡터.
실시예 34. 실시예 실시예 33에 있어서, 상기 레트로트랜스포사제와 복합체를 형성하도록 구성된 카고 뉴클레오티드 서열을 암호화하는 핵산을 추가로 포함하는, 벡터.
실시예 35. 실시예 실시예 33 또는 실시예 실시예 34에 있어서, 상기 벡터는 플라스미드, 미니서클, CELiD, 아데노-연관 바이러스(AAV) 유래 비리온, 또는 렌티바이러스인, 벡터.
실시예 36. 실시예 실시예 33 내지 실시예 35 중 어느 하나의 상기 벡터를 포함하는, 세포.
실시예 37. 레트로트랜스포사제를 제조하는 방법으로서, 실시예 실시예 36의 상기 세포를 배양하는 단계를 포함하는, 방법.
실시예 38. 표적 핵산 유전자좌를 포함하는 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 파괴, 결합, 닉킹, 절단, 마킹, 또는 변형시키는 방법으로서, 상기 방법은
(a) 상기 표적 핵산 유전자좌를 포함하는 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드를 상기 표적 핵산 유전자좌에 카고 뉴클레오티드 서열을 전위시키도록 구성된 레트로트랜스포사제와 접촉시키는 단계를 포함하고;
(b) 여기서 상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하는, 방법.
실시예 39. 실시예 실시예 38에 있어서, 상기 레트로트랜스포사제는 미배양 미생물로부터 유래되는, 방법.
실시예 40. 실시예 실시예 38 또는 실시예 실시예 39에 있어서, 상기 레트로트랜스포사제는 역전사 효소 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 41. 실시예 실시예 38 내지 실시예 40 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 하나 이상의 아연 핑거 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 42. 실시예 실시예 38 내지 실시예 41 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 엔도뉴클레아제 도메인을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
실시예 43. 실시예 실시예 38 내지 실시예 42 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 문서화된 레트로트랜스포사제와 80% 미만의 서열 동일성을 갖는, 방법.
실시예 44. 실시예 실시예 38 내지 실시예 43 중 어느 하나에 있어서, 상기 카고 뉴클레오티드 서열은 3' 미번역 영역(UTR) 및 5' 미번역 영역(UTR)이 측면에 위치하는, 조작된 레트로트랜스포사제 시스템.
실시예 45. 실시예 실시예 38 내지 실시예 44 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 리보핵산 폴리뉴클레오티드 중간체를 통해 전위되는, 방법.
실시예 46. 실시예 실시예 38 내지 실시예 45 중 어느 하나에 있어서, 상기 이중-가닥 데옥시리보핵산 폴리뉴클레오티드는 진핵생물, 식물, 진균류, 포유류, 설치류, 또는 인간 이중-가닥 데옥시리보핵산 폴리뉴클레오티드인, 방법.
실시예 47. 표적 핵산 유전자좌를 파괴 또는 변형시키는 방법으로서, 상기 방법은 실시예 실시예 1 내지 실시예 22 중 어느 하나의 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계를 포함하고, 여기서, 상기 레트로트랜스포사제는 카고 뉴클레오티드 서열을 상기 표적 핵산 유전자좌에 전위시키도록 구성되고, 상기 복합체는 상기 복합체가 상기 표적 핵산 유전자좌에 결합할 때 상기 복합체가 상기 표적 핵산 유전자좌를 변형시키도록 구성되는, 방법.
실시예 48. 실시예 실시예 47에 있어서, 상기 표적 핵산 유전자좌를 변형시키는 단계는 상기 표적 핵산 유전자좌를 결합, 닉킹, 절단, 마킹, 변형 또는 전위시키는 단계를 포함하는, 방법.
실시예 49. 실시예 실시예 47 내지 실시예 48에 있어서, 상기 표적 핵산 유전자좌는 데옥시리보핵산(DNA)을 포함하는, 방법.
실시예 50. 실시예 실시예 49에 있어서, 상기 표적 핵산 유전자좌는 게놈 DNA, 바이러스 DNA, 또는 박테리아 DNA를 포함하는, 방법.
실시예 51. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 시험관 내에 있는, 방법.
실시예 52. 실시예 실시예 47 내지 실시예 50 중 어느 하나에 있어서, 상기 표적 핵산 유전자좌는 세포 내에 있는, 방법.
실시예 53. 실시예 실시예 52에 있어서, 상기 세포는 원핵생물 세포, 박테리아 세포, 진핵생물 세포, 진균류 세포, 식물 세포, 동물 세포, 포유류 세포, 설치류 세포, 영장류 세포, 인간 세포, 또는 일차 세포인, 방법.
실시예 54. 실시예 실시예 52 또는 실시예 53에 있어서, 상기 세포는 일차 세포인, 방법.
실시예 55. 실시예 실시예 54에 있어서, 상기 일차 세포는 T 세포인, 방법.
실시예 56. 실시예 실시예 54에 있어서, 상기 일차 세포는 조혈 줄기 세포(HSC)인, 방법.
실시예 57. 실시예 실시예 47 내지 실시예 56 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 실시예 실시예 24 내지 실시예 32 중 어느 하나의 핵산 또는 실시예 실시예 33 내지 실시예 35 중 어느 하나의 벡터를 전달하는 단계를 포함하는, 방법.
실시예 58. 실시예 실시예 47 내지 실시예 57 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는 핵산을 전달하는 단계를 포함하는, 방법.
실시예 59. 실시예 실시예 58에 있어서, 상기 핵산은 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임이 작동 가능하게 연결되는 프로모터를 포함하는, 방법.
실시예 60. 실시예 실시예 47 내지 실시예 59 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 상기 레트로트랜스포사제를 암호화하는 상기 개방 해독 프레임을 함유하는 캡핑된 mRNA를 전달하는 단계를 포함하는, 방법.
실시예 61. 실시예 실시예 47 내지 실시예 60 중 어느 하나에 있어서, 상기 조작된 레트로트랜스포사제 시스템을 상기 표적 핵산 유전자좌에 전달하는 단계는 번역된 폴리펩티드를 전달하는 단계를 포함하는, 방법.
실시예 62. 실시예 실시예 47 내지 실시예 61 중 어느 하나에 있어서, 상기 레트로트랜스포사제는 상기 표적 핵산 유전자좌에서 또는 이에 근접하여 파괴을 유도하지 않는, 방법.
실시예 63. 서열번호 1-29, 393-735, 또는 799-895 또는 이들의 변이체와 적어도 75%의 서열 동일성을 갖는 이종 레트로트랜스포사제를 암호화하는 개방 해독 프레임을 포함하는, 숙주 세포.
실시예 64. 실시예 실시예 63에 있어서, 상기 숙주 세포는 대장균 세포인, 숙주 세포.
실시예 65. 실시예 실시예 64에 있어서, 상기 대장균 세포는 λDE3 리소겐이거나 상기 대장균 세포는 BL21(DE3) 균주인, 숙주 세포.
실시예 66. 실시예 실시예 64 또는 실시예 실시예 65에 있어서, 상기 대장균 세포는 ompT lon 유전자형을 갖는, 숙주 세포.
실시예 67. 실시예 실시예 63 내지 실시예 66 중 어느 하나에 있어서, 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
실시예 68. 실시예 실시예 63 내지 실시예 67 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.
실시예 69. 실시예 실시예 68에 있어서, 상기 친화성 태그는 고정화된 금속 친화도 크로마토그래피(IMAC) 태그인, 숙주 세포.
실시예 70. 실시예 실시예 69 에 있어서, 상기 IMAC 태그는 폴리히스티딘 태그인, 숙주 세포.
실시예 71. 실시예 실시예 68에 있어서, 상기 친화성 태그는 myc 태그, 인간 인플루엔자 헤마글루티닌(HA) 태그, 말토오스 결합 단백질(MBP) 태그, 글루타티온 S-전이효소(GST) 태그, 스트렙타비딘 태그, FLAG 태그, 또는 이들의 임의의 조합인, 숙주 세포.
실시예 72. 실시예 실시예 68 내지 실시예 71 중 어느 하나에 있어서, 상기 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내에서 연결되는, 숙주 세포.
실시예 73. 실시예 실시예 72에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합인, 숙주 세포.
실시예 74. 실시예 실시예 63 내지 실시예 73 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포에서의 발현에 대해 코돈 최적화된, 숙주 세포.
실시예 75. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 벡터 상에 제공되는, 숙주 세포.
실시예 76. 실시예 실시예 63 내지 실시예 74 중 어느 하나에 있어서, 상기 개방 해독 프레임은 상기 숙주 세포의 게놈에 통합되는, 숙주 세포.
실시예 77. 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.
실시예 78. 레트로트랜스포사제를 생산하는 방법으로서, 적합한 성장 배지 중 실시예 실시예 63 내지 실시예 76 중 어느 하나의 숙주 세포를 배양하는 단계를 포함하는, 방법.
실시예 79. 실시예 실시예 78에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제의 발현을 유도하는 단계를 추가로 포함하는, 방법.
실시예 80. 실시예 실시예 79에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.
실시예 81. 실시예 실시예 78 내지 실시예 80 중 어느 하나에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.
실시예 82. 실시예 실시예 81에 있어서, 상기 단백질 추출물을 IMAC, 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.
실시예 83. 실시예 실시예 82에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제를 암호화하는 서열에 프레임-내 연결된 IMAC 친화성 태그를 암호화하는 서열을 포함하는, 방법.
실시예 84. 실시예 실시예 83에 있어서, 상기 IMAC 친화성 태그는 프로테아제 절단 부위를 암호화하는 링커 서열을 통해 상기 레트로트랜스포사제를 암호화하는 상기 서열에 프레임-내 연결되는, 방법.
실시예 85. 실시예 실시예 84에 있어서, 상기 프로테아제 절단 부위는 담배 에칭 바이러스(TEV) 프로테아제 절단 부위, PreScission® 프로테아제 절단 부위, 트롬빈 절단 부위, 인자 Xa 절단 부위, 엔테로키나아제 절단 부위, 또는 이들의 임의의 조합을 포함하는, 방법.
실시예 86. 실시예 실시예 84 또는 실시예 실시예 85에 있어서, 상기 프로테아제 절단 부위에 상응하는 프로테아제를 상기 레트로트랜스포사제에 접촉시킴으로써 상기 IMAC 친화성 태그를 절단하는 단계를 추가로 포함하는, 방법.
실시예 87. 실시예 실시예 86에 있어서, 감산 IMAC 친화도 크로마토그래피를 수행하여 상기 레트로트랜스포사제를 포함하는 조성물로부터 상기 친화성 태그를 제거하는 단계를 추가로 포함하는, 방법.
실시예 88. 세포에서 유전자좌를 파괴하는 방법으로서, 상기 방법은 상기 세포를
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 이중-가닥 핵산으로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, 이중-가닥 핵산; 및
(b) 레트로트랜스포사제를 포함하는 조성물에 접촉하는 단계를 포함하고, 여기서
상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 형질도입하도록 구성되고;
상기 레트로트랜스포사제는 서열번호 1-29, 393-735, 또는 799-895, 또는 이들의 변이체 중 어느 하나와 적어도 75% 서열 동일성을 갖는 서열을 포함하고;
상기 레트로트랜스포사제는 세포에서 문서화된 레트로트랜스포사제와 적어도 동등한 전위 활성을 갖는, 방법.
실시예 89. 실시예 실시예 88에 있어서, 상기 전위 활성은 상기 표적 핵산 유전자좌를 포함하는 세포에 상기 레트로트랜스포사제를 도입하고 상기 세포에서 상기 표적 핵산 유전자좌의 전위를 검출함으로써 시험관 내에서 측정되는, 방법.
실시예 90. 실시예 실시예 88 또는 실시예 89에 있어서, 상기 조성물은 20 pmole 이하의 상기 레트로트랜스포사제를 포함하는, 방법.
실시예 91. 실시예 90에 있어서, 상기 조성물은 1 pmol 이하의 상기 레트로트랜스포사제를 포함하는, 방법.
Claims (141)
- 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하고, 여기서
(i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
(ii) 상기 레트로트랜스포사제는 역전사 효소(RT) 도메인, 서열번호 1-29 또는 393-401 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템. - 제1항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 또는 제2항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 포함하는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제6항 중 어느 한 항에 있어서, (c) 상기 표적 핵산 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제7항에 있어서, 상기 이중-가닥 DNA 서열은 상기 레트로트랜스포사제와 상호작용하도록 구성된 5' 인식 서열 및 3' 인식 서열을 포함하고, 여기서 상기 5' 인식 서열은 GG 뉴클레오티드 서열을 포함하고 상기 3' 인식 서열은 TGAC 뉴클레오티드 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 RNA는 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 상기 카고 서열의 5' 서열 또는 상기 카고 서열의 3' 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 이종 조작된 카고 뉴클레오티드 서열은 발현 카세트를 포함하는, 조작된 레트로트랜스포사제 시스템.
- 조작된 DNA 서열로서,
(a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
(b) 이종 카고 서열;
(c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 서열; 및
(d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열. - 제13항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나의 Zn-결합 리본 모티프 중 어느 하나, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
- 제13항 또는 제14항에 있어서, 상기 레트로트랜스포사제는 서열번호 1-29 또는 393-401 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
- 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2a의 서열 중 어느 하나에 비해 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
- 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 도 2b의 서열 중 어느 하나에 비해 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
- 제13항 내지 제17항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 3, 6, 7 ,8, 14, 또는 402 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 조작된 DNA 서열.
- 제13항 내지 제18항 중 어느 한 항에 있어서, 상기 5' 서열 또는 상기 3' 서열은 서열번호 761-798 중 어느 하나의 RNA 동족체, 이들의 상보체, 또는 이들의 역상보체와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 조작된 DNA 서열.
- 상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법. - 제20항에 있어서, 상기 역전사 효소가 서열번호 799-894 또는 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제20항 또는 제21항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
- 제20항 내지 제22항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
- 제23항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
- 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제25항에 있어서, 상기 역전사 효소 도메인은 서열번호 799-894, 427-439 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제25항 또는 제26항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 방법.
- 제27항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 방법.
- 제25항 내지 제28항 중 어느 한 항의 단백질을 암호화하는, 핵산.
- 개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제30항에 있어서, 서열번호 1-29, 393-401, 또는 427-439 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
- 조작된 레트로트랜스포사제 시스템으로서,
(a) 이종 조작된 카고 뉴클레오티드 서열을 포함하는 RNA로서, 여기서 상기 카고 뉴클레오티드 서열은 레트로트랜스포사제와 상호작용하도록 구성되는, RNA; 및
(b) 레트로트랜스포사제를 포함하고, 여기서
(i) 상기 레트로트랜스포사제는 상기 카고 뉴클레오티드 서열을 표적 핵산 유전자좌에 전위시키도록 구성되고;
(ii) 상기 레트로트랜스포사제는 서열번호 402 또는 895의 역전사 효소(RT) 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소(RT) 도메인 또는 엔도뉴클레아제 도메인을 포함하는, 조작된 레트로트랜스포사제 시스템. - 제32항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제32항 또는 제33항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제32항 내지 제34항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD, 또는 LG 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제32항 내지 제35항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제32항 내지 제36항 중 어느 한 항에 있어서, (c) 상기 표적 유전자좌를 포함하는 이중-가닥 DNA 서열을 추가로 포함하는, 조작된 레트로트랜스포사제 시스템.
- 제32항 내지 제37항 중 어느 한 항에 있어서, 상기 RNA는 시험관 내 전사된 RNA인, 조작된 레트로트랜스포사제 시스템.
- 제32항 내지 제38항 중 어느 한 항에 있어서, 상기 RNA는 상기 레트로트랜스포사제를 암호화하는 서열을 포함하는, 조작된 레트로트랜스포사제 시스템.
- 조작된 DNA 서열로서,
(a) 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 5' 서열;
(b) 이종 카고 서열;
(c) 상기 5' 서열의 RNA 동족체와 상호작용하도록 구성된 레트로트랜스포사제를 암호화하는 서열로서, 여기서 상기 레트로트랜스포사제는 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소(RT) 도메인, 엔도뉴클레아제 도메인, 또는 이들의 변이체를 포함하는, 서열; 및
(d) 상기 레트로트랜스포사제와 상호작용하도록 구성된 RNA 서열을 암호화할 수 있는 3' 서열을 포함하는, 조작된 DNA 서열. - 제40항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 Zn-결합 리본 모티프 중 어느 하나를 추가로 포함하는, 조작된 DNA 서열.
- 제40항 또는 제41항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 추가로 포함하는, 조작된 DNA 서열.
- 제40항 내지 제42항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 촉매 D, QG, [Y/F]XDD 또는 LG 모티프를 추가로 포함하는, 조작된 DNA 서열.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 레트로트랜스포사제는 서열번호 402 또는 895의 보존된 CX[2-3]C Zn 핑거 모티프를 추가로 포함하는, 조작된 DNA 서열.
- 상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법. - 제45항에 있어서, 상기 역전사 효소는 서열번호 402 또는 895와 적어도 80% 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제45항 또는 제46항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
- 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
- 제48항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
- 서열번호 402 또는 895의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제50항에 있어서, 상기 역전사 효소 도메인은 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제50항 또는 제51항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
- 제52항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
- 제50항 내지 제53항 중 어느 한 항의 단백질을 암호화하는, 핵산.
- 개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 402 또는 895의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제55항에 있어서, 서열번호 402 또는 895와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
- 상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법. - 제57항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제58항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제57항 내지 제59항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
- 제57항 내지 제60항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 적어도 하나의 포스포로티오에이트 결합을 포함하는, 방법.
- 제57항 내지 제61항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
- 제62항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
- 서열번호 555-728 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제64항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제65항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제64항 내지 제66항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인이 RNA-결합 단백질 도메인인, 단백질.
- 제67항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
- 제68항에 있어서, 상기 단백질은 서열번호 30-32, 40-50, 740-756, 757-760 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제68항에 있어서, 상기 역전사 효소 도메인은 서열번호 555-558, 561-567, 569, 570, 575, 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제64항 내지 제70항 중 어느 한 항의 단백질을 암호화하는, 핵산.
- 개방 해독 프레임을 암호화하는 핵산으로서, 상기 개방 해독 프레임은 서열번호 555-728 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80% 서열 동일성을 갖는 RT 또는 엔도뉴클레아제 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제72항에 있어서, 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608, 561, 562, 564, 565, 568, 571, 573, 576-579, 583, 590, 591, 594, 598, 601, 606, 607 중 어느 하나의 RT 또는 엔도뉴클레아제 도메인과 적어도 80%의 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 레트로트랜스포사제를 추가로 암호화하는, 핵산.
- 제73항에 있어서, 상기 역전사 효소는 서열번호 555-560, 563, 564, 566, 567, 569, 572, 574, 580-582, 584-588, 592, 593, 596, 602, 604, 605, 608 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
- 서열번호 729-733 중 어느 하나의 역전사 효소 도메인 또는 성숙효소와 적어도 80% 서열 동일성을 갖는 역전사 효소 도메인 또는 성숙효소 도메인을 암호화하는 서열, 또는 이들의 변이체를 포함하는 개방 해독 프레임(ORF)을 포함하는 서열을 포함하는 핵산으로서, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제75항에 있어서, 상기 ORF는 서열번호 729-733 중 어느 하나와 적어도 80% 서열 동일성을 갖는 단백질, 또는 이들의 변이체를 암호화하는, 핵산.
- 제75항 또는 제76항에 있어서, 상기 ORF는 상기 박테리아 유기체에서의 발현에 최적화되거나, 상기 유기체는 E. coli인, 핵산.
- 제75항 또는 제76항에 있어서, 상기 ORF는 포유류 유기체에서의 발현에 최적화되거나, 상기 유기체는 영장류 유기체인, 핵산.
- 제78항에 있어서, 상기 영장류 유기체는 H. 사피엔스인, 핵산.
- 제75항 내지 제79항 중 어느 한 항에 있어서, 상기 ORF는 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인을 암호화하는 상기 서열에 작동 가능하게 연결된 친화성 태그를 포함하고, 여기서 상기 ORF는 서열번호 298-302 중 어느 하나와 적어도 80%의 서열 동일성을 갖는, 핵산.
- 제77항에 있어서, 상기 ORF는 서열번호 303-307 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
- 제75항 내지 제81항 중 어느 한 항에 있어서, 상기 역전사 효소 도메인 또는 상기 성숙효소 도메인은 서열번호 729-733 중 어느 하나의 보존된 Y[I/L]DD 활성 부위 모티프를 포함하는, 핵산.
- 상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법. - 제83항에 있어서, 상기 역전사 효소는 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제84항에 있어서, 상기 역전사 효소는 서열번호 526 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제83항 내지 제85항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
- 제83항 내지 제86항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 상기 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
- 제87항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
- 서열번호 440-554 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 여기서 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제89항에 있어서, 상기 역전사 효소 도메인은 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제90항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80% 서열 동일성을 갖는 서열, 또는 이의 변이체를 포함하는, 단백질.
- 제89항 내지 제91항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
- 제92항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
- 제89항 내지 제93항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제89항 내지 제94항 중 어느 한 항의 단백질을 암호화하는, 핵산.
- 개방 해독 프레임을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 440-554 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제96항에 있어서, 서열번호 518-522, 524-527, 및 529-532 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
- 제97항에 있어서, 상기 역전사 효소는 서열번호 526과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 핵산.
- 제96항 내지 제98항 중 어느 한 항에 있어서, 상기 개방 해독 프레임은 서열번호 356-373 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
- 상보성 DNA(cDNA)를 합성하는 방법으로서,
(a) cDNA 합성을 위한 주형으로서 RNA 분자를 제공하는 단계,
(b) RNA 분자로부터 cDNA 합성을 개시하기 위한 프라이머 올리고뉴클레오티드를 제공하는 단계; 및
(c) 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80% 서열 동일성을 갖는 서열을 포함하는 역전사 효소, 또는 이들의 변이체를 사용하여 주형으로부터 프라이머 올리고뉴클레오티드에 의해 개시된 cDNA를 합성하는 단계를 포함하는, 방법. - 제100항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 방법.
- 제100항 또는 제101항에 있어서, 상기 역전사 효소는 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 방법.
- 제100항 내지 제102항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 올리고(dT) 서열 또는 적어도 6개의 올리고뉴클레오티드의 축퇴성 서열을 포함하는, 방법.
- 제100항 내지 제103항 중 어느 한 항에 있어서, 상기 프라이머 올리고뉴클레오티드는 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 방법.
- 제100항 내지 제104항 중 어느 한 항에 있어서, 상기 cDNA를 합성하는 단계는 상기 RNA 주형으로부터 DNA 서열을 연장시키기에 적합한 조건 하에서 반응 혼합물에서 상기 주형 RNA 분자, 상기 프라이머 올리고뉴클레오티드, 및 상기 역전사 효소를 인큐베이션하는 단계를 포함하는, 방법.
- 제105항에 있어서, 상기 반응 혼합물은 dNTP, 반응 완충액, 2가 금속 이온, Mg2+, 또는 Mn2+를 추가로 포함하는, 방법.
- 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 역전사 효소 도메인과 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는 역전사 효소 도메인을 포함하는 단백질로서, 상기 서열은 비-레트로트랜스포사제 도메인 또는 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제107항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 단백질.
- 제107항 또는 제108항에 있어서, 상기 역전사 효소 도메인은 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 서열, 또는 이들의 변이체를 포함하는, 단백질.
- 제107항 내지 제109항 중 어느 한 항에 있어서, 상기 비-레트로트랜스포사제 도메인은 RNA-결합 단백질 도메인인, 단백질.
- 제110항에 있어서, 상기 RNA 결합 단백질 도메인은 박테리오파지 MS2 외피 단백질(MCP) 도메인을 포함하는, 단백질.
- 제107항 내지 제112항 중 어느 한 항에 있어서, 상기 서열은 친화성 태그에 N-말단적으로 또는 C-말단적으로 융합되는, 단백질.
- 제107항 내지 제112항 중 어느 한 항의 단백질을 암호화하는, 핵산.
- 유기체에서의 발현에 최적화된 개방 해독 프레임(ORF)을 암호화하는 핵산으로서, 여기서 상기 개방 해독 프레임은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 627-673 중 어느 하나의 RT 도메인과 적어도 80% 서열 동일성을 갖는 RT 도메인, 또는 이들의 변이체를 암호화하고, 여기서 (a) 상기 개방 해독 프레임은 유기체에서의 발현에 최적화되고 상기 유기체는 상기 RT 또는 엔도뉴클레아제 도메인의 기원과 상이하거나; (b) 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제114항에 있어서, 상기 역전사 효소 도메인은 서열번호 609-610, 611-615, 616-617, 618-622, 623, 624-626, 또는 627-673 중 어느 하나의 보존된 xxDD, [F/Y]XDD, NAxxH, 또는 VTG 모티프를 포함하는, 핵산.
- 제114항 또는 제115항에 있어서, 서열번호 612-613, 616-619, 622, 624, 627-630, 633 중 어느 하나와 적어도 80% 서열 동일성을 갖는 RT, 또는 이들의 변이체를 암호화하는, 핵산.
- 제114항 내지 제116항 중 어느 한 항에 있어서, 상기 ORF는 친화성 태그를 암호화하는 서열을 포함하는, 핵산.
- 제117항에 있어서, 상기 개방 해독 프레임은 서열번호 308-309, 310-312, 313-314, 315-319, 320, 321-323, 또는 174-180 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
- 제114항 내지 제115항 중 어느 한 항에 있어서, 상기 유기체는 상기 RT 도메인의 기원과 상이한, 핵산.
- 제119항에 있어서, 상기 ORF는 서열번호 324-325, 326-328, 329-330, 331-335, 336, 327-329, 또는 181-187 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 핵산.
- 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80%의 서열 동일성을 갖는 적어도 6개의 연속 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
- 제121항에 있어서, DNA 뉴클레오티드를 포함하는, 합성 올리고뉴클레오티드.
- 제121항 또는 제122항에 있어서, 적어도 하나의 포스포로티오에이트 결합을 추가로 포함하는, 합성 올리고뉴클레오티드.
- 서열번호 340-341, 342-344, 345-346, 347-351, 352, 또는 353-355 중 어느 하나와 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 벡터.
- 본원에 기술된 단백질 중 어느 하나를 암호화하는, 핵산.
- 본원에 기술된 핵산 중 어느 하나를 포함하는, 숙주 세포.
- 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 벡터.
- 제124항 또는 제127항의 벡터를 포함하는, 숙주 세포.
- 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항 또는 제113항 내지 제120항 중 어느 한 항의 핵산을 포함하는, 숙주 세포.
- 제129항에 있어서, 상기 숙주 세포는 E. coli 세포인, 숙주 세포.
- 제129항 또는 제130항에 있어서, 상기 E. coli 세포는 λDE3 리소겐이거나 상기 E. coli 세포는 BL21(DE3) 균주인, 숙주 세포.
- 제130항 또는 제131항에 있어서, 상기 E. coli 세포가 ompT lon 유전자형을 갖는, 숙주 세포.
- 제129항 내지 제132항 중 어느 한 항에 있어서, 상기 핵산이 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 암호화하는 개방 해독 프레임(ORF)을 포함하고, 여기서 상기 개방 해독 프레임은 T7 프로모터 서열, T7-lac 프로모터 서열, lac 프로모터 서열, tac 프로모터 서열, trc 프로모터 서열, ParaBAD 프로모터 서열, PrhaBAD 프로모터 서열, T5 프로모터 서열, cspA 프로모터 서열, araP BAD 프로모터, 파지 람다로부터의 강한 좌측 프로모터(pL 프로모터), 또는 이들의 임의의 조합에 작동 가능하게 연결되는, 숙주 세포.
- 제133항에 있어서, 상기 개방 해독 프레임은 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인을 암호화하는 서열에 프레임 내에 연결된 친화성 태그를 암호화하는 서열을 포함하는, 숙주 세포.
- 제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지 중에 포함하는, 배양물.
- 레트로트랜스포사제, 이의 단편, 또는 역전사 효소 도메인을 생산하는 방법으로서, 제126항 또는 제128항 내지 제134항 중 어느 한 항의 숙주 세포를 적합한 액체 배지에서 배양하는 단계를 포함하는, 방법.
- 제136항에 있어서, 추가 화학 제제 또는 증가된 양의 영양소의 첨가에 의해 상기 레트로트랜스포사제, 상기 이의 단편, 또는 상기 역전사 효소 도메인의 발현을 유도하는 단계를 추가로 포함하는, 방법.
- 제137항에 있어서, 상기 추가 화학 제제 또는 증가된 양의 영양소는 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 또는 추가 양의 락토오스를 포함하는, 방법.
- 제138항에 있어서, 상기 배양 후 상기 숙주 세포를 단리하는 단계 및 상기 숙주 세포를 용해시켜 단백질 추출물을 생산하는 단계를 추가로 포함하는, 방법.
- 제139항에 있어서, 상기 단백질 추출물을 친화성 태그에 특이적인 친화도 크로마토그래피 또는 이온-친화성 크로마토그래피에 적용하는 단계를 추가로 포함하는, 방법.
- 제29항 내지 제31항, 제54항 내지 제56항, 제71항 내지 제74항, 제75항 내지 제82항, 제95항 내지 제99항, 또는 제113항 내지 제120항 중 어느 한 항의 핵산 중 어느 하나의 RNA 동족체를 포함하는, 시험관 내에서 전사된 mRNA.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163241943P | 2021-09-08 | 2021-09-08 | |
US63/241,943 | 2021-09-08 | ||
PCT/US2022/076061 WO2023039438A1 (en) | 2021-09-08 | 2022-09-07 | Systems, compositions, and methods involving retrotransposons and functional fragments thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240051994A true KR20240051994A (ko) | 2024-04-22 |
Family
ID=85506902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247009394A KR20240051994A (ko) | 2021-09-08 | 2022-09-07 | 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 |
Country Status (5)
Country | Link |
---|---|
KR (1) | KR20240051994A (ko) |
CN (1) | CN118076731A (ko) |
AU (1) | AU2022343719A1 (ko) |
CA (1) | CA3230213A1 (ko) |
WO (1) | WO2023039438A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020047124A1 (en) * | 2018-08-28 | 2020-03-05 | Flagship Pioneering, Inc. | Methods and compositions for modulating a genome |
-
2022
- 2022-09-07 KR KR1020247009394A patent/KR20240051994A/ko unknown
- 2022-09-07 AU AU2022343719A patent/AU2022343719A1/en active Pending
- 2022-09-07 CA CA3230213A patent/CA3230213A1/en active Pending
- 2022-09-07 CN CN202280062406.5A patent/CN118076731A/zh active Pending
- 2022-09-07 WO PCT/US2022/076061 patent/WO2023039438A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
AU2022343719A1 (en) | 2024-04-11 |
CN118076731A (zh) | 2024-05-24 |
WO2023039438A1 (en) | 2023-03-16 |
CA3230213A1 (en) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102623312B1 (ko) | Ruvc 도메인이 존재하는 효소 | |
US20200332273A1 (en) | Enzymes with ruvc domains | |
WO2021178934A1 (en) | Class ii, type v crispr systems | |
US20230340481A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
KR20240055073A (ko) | 클래스 ii, v형 crispr 시스템 | |
EP4127155A1 (en) | Class ii, type ii crispr systems | |
KR20240053585A (ko) | 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법 | |
WO2023076952A1 (en) | Enzymes with hepn domains | |
KR20240049306A (ko) | Ruvc 도메인을 갖는 효소 | |
US20220220460A1 (en) | Enzymes with ruvc domains | |
EP4200422A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
KR20240051994A (ko) | 레트로트랜스포존 및 이의 기능적 단편을 포함하는 시스템, 조성물, 및 방법 | |
WO2023039434A1 (en) | Systems and methods for transposing cargo nucleotide sequences | |
CN118119704A (zh) | 用于转座货物核苷酸序列的系统和方法 | |
US20240110167A1 (en) | Enzymes with ruvc domains | |
WO2023039377A1 (en) | Class ii, type v crispr systems | |
GB2617659A (en) | Enzymes with RUVC domains | |
CN116615547A (zh) | 用于对货物核苷酸序列转座的系统和方法 |