CN116648505A - 包含靶向b2m的rna指导物的组合物及其用途 - Google Patents
包含靶向b2m的rna指导物的组合物及其用途 Download PDFInfo
- Publication number
- CN116648505A CN116648505A CN202180085315.9A CN202180085315A CN116648505A CN 116648505 A CN116648505 A CN 116648505A CN 202180085315 A CN202180085315 A CN 202180085315A CN 116648505 A CN116648505 A CN 116648505A
- Authority
- CN
- China
- Prior art keywords
- nucleotide
- sequence
- seq
- identity
- nos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 claims abstract description 130
- 125000003729 nucleotide group Chemical group 0.000 claims description 2399
- 239000002773 nucleotide Substances 0.000 claims description 2393
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 217
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 217
- 229920001184 polypeptide Polymers 0.000 claims description 213
- 238000012217 deletion Methods 0.000 claims description 186
- 230000037430 deletion Effects 0.000 claims description 186
- 210000004027 cell Anatomy 0.000 claims description 168
- 125000006850 spacer group Chemical group 0.000 claims description 97
- 230000002746 orthostatic effect Effects 0.000 claims description 96
- 230000000295 complement effect Effects 0.000 claims description 93
- 150000007523 nucleic acids Chemical class 0.000 claims description 70
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 claims description 58
- 102100027314 Beta-2-microglobulin Human genes 0.000 claims description 57
- 102000039446 nucleic acids Human genes 0.000 claims description 52
- 108020004707 nucleic acids Proteins 0.000 claims description 52
- 239000013598 vector Substances 0.000 claims description 49
- 101150076800 B2M gene Proteins 0.000 claims description 43
- 230000002441 reversible effect Effects 0.000 claims description 39
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 21
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 21
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 210000004962 mammalian cell Anatomy 0.000 claims description 12
- GDPJWJXLKPPEKK-SJAYXVESSA-N dT4 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 GDPJWJXLKPPEKK-SJAYXVESSA-N 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 8
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 6
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 4
- 210000005260 human cell Anatomy 0.000 claims description 4
- 210000000130 stem cell Anatomy 0.000 claims description 4
- 108700028369 Alleles Proteins 0.000 claims description 2
- 230000035772 mutation Effects 0.000 claims description 2
- 229920002477 rna polymer Polymers 0.000 description 604
- 102000053602 DNA Human genes 0.000 description 406
- 108020004414 DNA Proteins 0.000 description 406
- 150000001413 amino acids Chemical class 0.000 description 43
- 102000009331 Homeodomain Proteins Human genes 0.000 description 30
- 108010048671 Homeodomain Proteins Proteins 0.000 description 30
- 230000004048 modification Effects 0.000 description 26
- 238000012986 modification Methods 0.000 description 26
- 125000003275 alpha amino acid group Chemical group 0.000 description 25
- 239000000872 buffer Substances 0.000 description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 108090000623 proteins and genes Proteins 0.000 description 18
- 230000000694 effects Effects 0.000 description 17
- 238000001890 transfection Methods 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 13
- 101710163270 Nuclease Proteins 0.000 description 12
- 102000040430 polynucleotide Human genes 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000012636 effector Substances 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000002777 nucleoside Substances 0.000 description 9
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 238000007481 next generation sequencing Methods 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 230000026279 RNA modification Effects 0.000 description 7
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 7
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 7
- 230000000536 complexating effect Effects 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- -1 aminoalkyl phosphoramidates Chemical class 0.000 description 6
- 210000002865 immune cell Anatomy 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 235000021317 phosphate Nutrition 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 210000004986 primary T-cell Anatomy 0.000 description 4
- 229940096913 pseudoisocytidine Drugs 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000012536 storage buffer Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000003146 transient transfection Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- 230000035899 viability Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 241000269368 Xenopus laevis Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 2
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 210000002449 bone cell Anatomy 0.000 description 2
- 229920006317 cationic polymer Polymers 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000000412 dendrimer Substances 0.000 description 2
- 229920000736 dendritic polymer Polymers 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 150000008298 phosphoramidates Chemical class 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- UHLXKKURVBBPRP-IOSLPCCCSA-N (2R,3R,4S,5R)-2-(6-amino-7-methylpurin-9-ium-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound Cn1c[n+]([C@@H]2O[C@H](CO)[C@@H](O)[C@H]2O)c2ncnc(N)c12 UHLXKKURVBBPRP-IOSLPCCCSA-N 0.000 description 1
- ZLVITLNPCSHOGL-CKTDUXNWSA-N (2s,3r)-2-amino-n-[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]-3-hydroxybutanamide Chemical compound C1=NC=2C(NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZLVITLNPCSHOGL-CKTDUXNWSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- HQHQCEKUGWOYPS-URBBEOKESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(octadecylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 HQHQCEKUGWOYPS-URBBEOKESA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- LCKIHCRZXREOJU-KYXWUPHJSA-N 2-[[5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]methylamino]ethanesulfonic acid Chemical compound C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O LCKIHCRZXREOJU-KYXWUPHJSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- PULHLIOPJXPGJN-BWVDBABLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)-3-methylideneoxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C)[C@H](O)[C@@H](CO)O1 PULHLIOPJXPGJN-BWVDBABLSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- GMCOADLDNLGOFE-ZLUOBGJFSA-N Asn-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N GMCOADLDNLGOFE-ZLUOBGJFSA-N 0.000 description 1
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- RMFITHMDQGFSDC-UBHSHLNASA-N Asp-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RMFITHMDQGFSDC-UBHSHLNASA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000011357 CAR T-cell therapy Methods 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- 238000000116 DAPI staining Methods 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- JHCVYQKVKOLAIU-NAKRPEOUSA-N Ile-Cys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N JHCVYQKVKOLAIU-NAKRPEOUSA-N 0.000 description 1
- OONBGFHNQVSUBF-KBIXCLLPSA-N Ile-Gln-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O OONBGFHNQVSUBF-KBIXCLLPSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- XMIFBEZRFMTGRL-TURQNECASA-N OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S XMIFBEZRFMTGRL-TURQNECASA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- JISIQDCOHJOOPU-WFBYXXMGSA-N Trp-Cys-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O JISIQDCOHJOOPU-WFBYXXMGSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- XMNDQSYABVWZRK-BZSNNMDCSA-N Tyr-Asn-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XMNDQSYABVWZRK-BZSNNMDCSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- FZADUTOCSFDBRV-RNXOBYDBSA-N Tyr-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FZADUTOCSFDBRV-RNXOBYDBSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- NMPXRFYMZDIBRF-ZOBUZTSGSA-N Val-Asn-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NMPXRFYMZDIBRF-ZOBUZTSGSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 150000008209 arabinosides Chemical class 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 102000047279 human B2M Human genes 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 125000003473 lipid group Chemical group 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 210000003014 totipotent stem cell Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RXRGZNYSEHTMHC-BQBZGAKWSA-N troxacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)OC1 RXRGZNYSEHTMHC-BQBZGAKWSA-N 0.000 description 1
- 229950010147 troxacitabine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002444 unipotent stem cell Anatomy 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本发明涉及包含靶向B2M的RNA指导物的组合物、表征这些组合物的方法、包含这些组合物的细胞以及使用这些组合物的方法。
Description
序列表
本申请含有已以ASCII格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ASCII副本创建于2021年10月29日,名为51451-014WO3_Sequence_Listing_10_29_21_ST25,并且大小为369,037字节。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
发明内容
正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。尽管本文披露的本发明不限于特定优点或功能,但本发明提供了包含RNA指导物的组合物,其中该RNA指导物包含(i)与B2M基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
在组合物的一方面,靶序列在B2M基因的外显子1、外显子2、外显子3、外显子4、内含子1、内含子2或内含子3内。
在组合物的另一方面,B2M基因包含SEQ ID NO:773的序列、SEQ ID NO:773的反向互补序列、SEQ ID NO:773的变体、或SEQ ID NO:773的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:391-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:391-552和554-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ ID NO:391-552和555-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:391-540、542-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:391-770中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25;k.SEQID NO:391-552和556-770中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29;或o.SEQ IDNO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ IDNO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:806的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:788-805中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:788-805中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:788-805中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:788-805中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:788-805中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:788-805中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:788-805中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:788-805中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:788-805中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:788-805中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:788-805中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:788-805中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:788-805中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:788-805中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:806或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ IDNO:808或SEQ ID NO:809的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:807的核苷酸1至核苷酸36;b.SEQ ID NO:807的核苷酸2至核苷酸36;c.SEQ ID NO:807的核苷酸3至核苷酸36;d.SEQ ID NO:807的核苷酸4至核苷酸36;e.SEQ ID NO:807的核苷酸5至核苷酸36;f.SEQID NO:807的核苷酸6至核苷酸36;g.SEQ ID NO:807的核苷酸7至核苷酸36;h.SEQ ID NO:807的核苷酸8至核苷酸36;i.SEQ ID NO:807的核苷酸9至核苷酸36;j.SEQ ID NO:807的核苷酸10至核苷酸36;k.SEQ ID NO:807的核苷酸11至核苷酸36;l.SEQ ID NO:807的核苷酸12至核苷酸36;m.SEQ ID NO:807的核苷酸13至核苷酸36;n.SEQ ID NO:807的核苷酸14至核苷酸36;或o.SEQ ID NO:808或SEQ ID NO:809或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:810或SEQID NO:811的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:810或SEQ IDNO:811的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:812的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:810或SEQ ID NO:811的核苷酸1至核苷酸36;b.SEQ ID NO:810或SEQ ID NO:811的核苷酸2至核苷酸36;c.SEQID NO:810或SEQ ID NO:811的核苷酸3至核苷酸36;d.SEQ ID NO:810或SEQ ID NO:811的核苷酸4至核苷酸36;e.SEQ ID NO:810或SEQ ID NO:811的核苷酸5至核苷酸36;f.SEQ IDNO:810或SEQ ID NO:811的核苷酸6至核苷酸36;g.SEQ ID NO:810或SEQ ID NO:811的核苷酸7至核苷酸36;h.SEQ ID NO:810或SEQ ID NO:811的核苷酸8至核苷酸36;i.SEQ ID NO:810或SEQ ID NO:811的核苷酸9至核苷酸36;j.SEQ ID NO:810或SEQ ID NO:811的核苷酸10至核苷酸36;k.SEQ ID NO:810或SEQ ID NO:811的核苷酸11至核苷酸36;l.SEQ ID NO:810或SEQ ID NO:811的核苷酸12至核苷酸36;m.SEQ ID NO:810或SEQ ID NO:811的核苷酸13至核苷酸36;n.SEQ ID NO:810或SEQ ID NO:811的核苷酸14至核苷酸36;o.SEQ ID NO:810或SEQ ID NO:811的核苷酸15至核苷酸36;或p.SEQ ID NO:812或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-390或819-1018中任一个的序列的互补序列基本上互补。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,组合物还包含Cas12i多肽。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:772、SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:817的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ ID NO:818的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:772、SEQID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的序列;b.Cas12i4多肽,其包含SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列;c.Cas12i1多肽,其包含SEQ ID NO:817的序列;或d.Cas12i3多肽,其包含SEQ ID NO:818的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
本发明进一步提供包含RNA指导物和Cas12i多肽的组合物,其中所述RNA指导物包含(i)与B2M基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
在组合物的一方面,靶序列在B2M基因的外显子1、外显子2、外显子3、外显子4、内含子1、内含子2或内含子3内。
在组合物的另一个方面,B2M基因包含SEQ ID NO:773的序列、SEQ ID NO:773的反向互补序列、SEQ ID NO:773的序列的变体、或SEQ ID NO:773的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:391-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:391-552和554-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ ID NO:391-552和555-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:391-540、542-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:391-770中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25;k.SEQID NO:391-552和556-770中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29;或o.SEQ IDNO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ IDNO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:806的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:788-805中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:788-805中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:788-805中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:788-805中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:788-805中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:788-805中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:788-805中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:788-805中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:788-805中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:788-805中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:788-805中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:788-805中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:788-805中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:788-805中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:806或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ IDNO:808或SEQ ID NO:809的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:807的核苷酸1至核苷酸36;b.SEQ ID NO:807的核苷酸2至核苷酸36;c.SEQ ID NO:807的核苷酸3至核苷酸36;d.SEQ ID NO:807的核苷酸4至核苷酸36;e.SEQ ID NO:807的核苷酸5至核苷酸36;f.SEQID NO:807的核苷酸6至核苷酸36;g.SEQ ID NO:807的核苷酸7至核苷酸36;h.SEQ ID NO:807的核苷酸8至核苷酸36;i.SEQ ID NO:807的核苷酸9至核苷酸36;j.SEQ ID NO:807的核苷酸10至核苷酸36;k.SEQ ID NO:807的核苷酸11至核苷酸36;l.SEQ ID NO:807的核苷酸12至核苷酸36;m.SEQ ID NO:807的核苷酸13至核苷酸36;n.SEQ ID NO:807的核苷酸14至核苷酸36;或o.SEQ ID NO:808或SEQ ID NO:809或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:810或SEQID NO:811的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:810或SEQ IDNO:811的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:812的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:810或SEQ ID NO:811的核苷酸1至核苷酸36;b.SEQ ID NO:810或SEQ ID NO:811的核苷酸2至核苷酸36;c.SEQID NO:810或SEQ ID NO:811的核苷酸3至核苷酸36;d.SEQ ID NO:810或SEQ ID NO:811的核苷酸4至核苷酸36;e.SEQ ID NO:810或SEQ ID NO:811的核苷酸5至核苷酸36;f.SEQ IDNO:810或SEQ ID NO:811的核苷酸6至核苷酸36;g.SEQ ID NO:810或SEQ ID NO:811的核苷酸7至核苷酸36;h.SEQ ID NO:810或SEQ ID NO:811的核苷酸8至核苷酸36;i.SEQ ID NO:810或SEQ ID NO:811的核苷酸9至核苷酸36;j.SEQ ID NO:810或SEQ ID NO:811的核苷酸10至核苷酸36;k.SEQ ID NO:810或SEQ ID NO:811的核苷酸11至核苷酸36;l.SEQ ID NO:810或SEQ ID NO:811的核苷酸12至核苷酸36;m.SEQ ID NO:810或SEQ ID NO:811的核苷酸13至核苷酸36;n.SEQ ID NO:810或SEQ ID NO:811的核苷酸14至核苷酸36;o.SEQ ID NO:810或SEQ ID NO:811的核苷酸15至核苷酸36;或p.SEQ ID NO:812或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-390或819-1018中任一个的序列的互补序列基本上互补。
在组合物的另一方面,该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:772、SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:817的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ ID NO:818的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:772、SEQID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的序列;b.Cas12i4多肽,其包含SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列;c.Cas12i1多肽,其包含SEQ ID NO:817的序列;或d.Cas12i3多肽,其包含SEQ ID NO:818的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
在组合物的另一方面,RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGAAUGUCGGAUGGAUGAAACC(SEQ ID NO:778);
AGAAAUCCGUCUUUCAUUGACGGCUAUCUCUUGUACUACACUG(SEQ ID NO:779);
AGAAAUCCGUCUUUCAUUGACGGACACGGCAGGCAUACUCAUC(SEQ ID NO:780);或
AGAAAUCCGUCUUUCAUUGACGGGUCACAGCCCAAGAUAGUUA(SEQ ID NO:781)。
本发明还进一步提供了一种RNA指导物,其包含(i)基本上与B2M基因内的靶序列互补的间隔子序列和(ii)同向重复序列。
在RNA指导物的一方面,靶序列在B2M基因的外显子1、外显子2、外显子3、外显子4、内含子1、内含子2或内含子3内。
在RNA指导物的另一方面,B2M基因包含SEQ ID NO:773的序列、SEQ ID NO:773的反向互补序列、SEQ ID NO:773的序列的变体、或SEQ ID NO:773的变体的反向互补序列。
在RNA指导物的另一方面,间隔子序列包含:a.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:391-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ ID NO:391-552和554-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ ID NO:391-552和555-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:391-540、542-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在RNA指导物的另一方面,间隔子序列包含:a.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:391-770中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25;k.SEQID NO:391-552和556-770中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28;n.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29;或o.SEQ IDNO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ IDNO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ IDNO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:806的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:788-805中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:788-805中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:788-805中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:788-805中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:788-805中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:788-805中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:788-805中任一个的核苷酸7至核苷酸36;h.SEQ IDNO:788-805中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:788-805中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:788-805中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:788-805中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:788-805中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:788-805中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:788-805中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:806或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQID NO:808或SEQ ID NO:809的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:807的核苷酸1至核苷酸36;b.SEQ ID NO:807的核苷酸2至核苷酸36;c.SEQ ID NO:807的核苷酸3至核苷酸36;d.SEQ ID NO:807的核苷酸4至核苷酸36;e.SEQ ID NO:807的核苷酸5至核苷酸36;f.SEQID NO:807的核苷酸6至核苷酸36;g.SEQ ID NO:807的核苷酸7至核苷酸36;h.SEQ ID NO:807的核苷酸8至核苷酸36;i.SEQ ID NO:807的核苷酸9至核苷酸36;j.SEQ ID NO:807的核苷酸10至核苷酸36;k.SEQ ID NO:807的核苷酸11至核苷酸36;l.SEQ ID NO:807的核苷酸12至核苷酸36;m.SEQ ID NO:807的核苷酸13至核苷酸36;n.SEQ ID NO:807的核苷酸14至核苷酸36;或o.SEQ ID NO:808或SEQ ID NO:809或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:810或SEQID NO:811的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ IDNO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:810或SEQ IDNO:811的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ IDNO:812的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:810或SEQ ID NO:811的核苷酸1至核苷酸36;b.SEQ ID NO:810或SEQ ID NO:811的核苷酸2至核苷酸36;c.SEQID NO:810或SEQ ID NO:811的核苷酸3至核苷酸36;d.SEQ ID NO:810或SEQ ID NO:811的核苷酸4至核苷酸36;e.SEQ ID NO:810或SEQ ID NO:811的核苷酸5至核苷酸36;f.SEQ IDNO:810或SEQ ID NO:811的核苷酸6至核苷酸36;g.SEQ ID NO:810或SEQ ID NO:811的核苷酸7至核苷酸36;h.SEQ ID NO:810或SEQ ID NO:811的核苷酸8至核苷酸36;i.SEQ ID NO:810或SEQ ID NO:811的核苷酸9至核苷酸36;j.SEQ ID NO:810或SEQ ID NO:811的核苷酸10至核苷酸36;k.SEQ ID NO:810或SEQ ID NO:811的核苷酸11至核苷酸36;l.SEQ ID NO:810或SEQ ID NO:811的核苷酸12至核苷酸36;m.SEQ ID NO:810或SEQ ID NO:811的核苷酸13至核苷酸36;n.SEQ ID NO:810或SEQ ID NO:811的核苷酸14至核苷酸36;o.SEQ ID NO:810或SEQ ID NO:811的核苷酸15至核苷酸36;或p.SEQ ID NO:812或其一部分。
在RNA指导物的另一方面,间隔子序列与SEQ ID NO:11-390或819-1018中任一个的序列的互补序列基本上互补。
在RNA指导物的另一方面,靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
在RNA指导物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在RNA指导物的另一方面,靶序列紧邻PAM序列。
在RNA指导物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
在RNA指导物的另一方面,RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGAAUGUCGGAUGGAUGAAACC(SEQ ID NO:778);
AGAAAUCCGUCUUUCAUUGACGGCUAUCUCUUGUACUACACUG(SEQ ID NO:779);
AGAAAUCCGUCUUUCAUUGACGGACACGGCAGGCAUACUCAUC(SEQ ID NO:780);或
AGAAAUCCGUCUUUCAUUGACGGGUCACAGCCCAAGAUAGUUA(SEQ ID NO:781)。
本发明还进一步提供了编码如本文所述的RNA指导物的核酸。
本发明还进一步提供了包含本文所述的此类RNA指导物的载体。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的细胞。
在细胞的一个方面,细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞或T细胞。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的试剂盒。
本发明还进一步提供了一种编辑B2M序列的方法,该方法包括使B2M序列与本文所述的组合物或RNA指导物接触。在实施例中,该方法在体外进行。在实施例中,该方法离体进行。
在该方法的一方面,B2M序列在细胞中。
在该方法的一方面,组合物或RNA指导物诱导B2M序列的缺失。
在该方法的一方面,缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。
在该方法的一方面,缺失是在5'-NTTN-3'序列的下游。
在该方法的一方面,缺失长度多达约40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至15个核苷酸。
在该方法的一方面,缺失在5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
在该方法的一方面,缺失与B2M序列中的突变重叠。
在该方法的一方面,缺失与B2M序列中的插入重叠。
在该方法的一方面,缺失去除了B2M序列或其一部分的重复扩展。
在该方法的一方面,缺失破坏了B2M序列的一个或两个等位基因。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGAAUGUCGGAUGGAUGAAACC(SEQ ID NO:778);
AGAAAUCCGUCUUUCAUUGACGGCUAUCUCUUGUACUACACUG(SEQ ID NO:779);
AGAAAUCCGUCUUUCAUUGACGGACACGGCAGGCAUACUCAUC(SEQ ID NO:780);或
AGAAAUCCGUCUUUCAUUGACGGGUCACAGCCCAAGAUAGUUA(SEQ ID NO:781)。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物包含SEQ ID NO:1222-1230中任一个的序列。
定义
本发明将相对于具体实施例来说明,但本发明并不受限于此而只受权利要求限制。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。
如本文所用,术语“活性”是指生物活性。在一些实施例中,活性包括酶活性,例如效应子的催化能力。例如,活性可以包括核酸酶活性。
如本文所用,术语“B2M”是指“β2微球蛋白”或“β-2微球蛋白”。B2M是主要组织相容性复合体(MHC)I类分子的组分,它存在于所有有核脊椎动物细胞的表面,其功能是将细胞内蛋白质的肽片段展示给细胞毒性T细胞。如本文所阐述的SEQ ID NO:773提供了B2M基因序列的实例。应当理解,本文所述的间隔子序列可以靶向SEQ ID NO:773或其反向互补序列,这取决于它们是如表5中所列的“+”还是“-”所示。表5和表6中列出的靶序列位于B2M基因的非靶链上。
如本文所用,术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA指导物指定的靶核酸上的靶序列结合的多肽,其中该多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:1-5和11-18中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,其通过引用整体并入本文。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:3(Cas12i1)、SEQ ID NO:5(Cas12i2)、SEQ ID NO:14(Cas12i3)或SEQ ID NO:16(Cas12i4)(对应于本申请的SEQ ID NO:817、772、818和814)中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施例中,本披露的Cas12i多肽是如PCT/US 2021/025257中所述的Cas12i1多肽或Cas12i2多肽。在一些实施例中,Cas12i多肽切割靶核酸(例如,作为切口或双链断裂)。
如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。如本文所用,术语“复合物”可以指RNA指导物和多肽(例如,Cas12i多肽)的组化。如本文所用,术语“复合物”可指RNA指导物、多肽和靶序列的组化。如本文所用,术语“复合物”可以指靶向B2M的RNA指导物和Cas12i多肽的组化。
如本文所用,术语“原型间隔子相邻基序”或“PAM”是指与靶序列(例如,B2M靶序列)相邻的DNA序列,包含RNA指导物(例如,靶向B2M的RNA指导物)和Cas12i多肽的复合物与该靶序列结合。在双链靶标的情况下,RNA指导物结合靶标的第一链(例如,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(例如,非靶链或非间隔子互补链)。如本文所用,术语“相邻”包括其中包含RNA指导物和Cas12i多肽的复合物的RNA指导物与紧邻PAM的靶序列特异性结合、相互作用或缔合的情况。在此类情况下,在靶序列与PAM之间没有核苷酸。术语“相邻”还包括在与RNA指导物结合的靶序列与PAM之间存在少数(例如,1、2、3、4或5个)核苷酸的情况。在一些实施例中,如本文所述的PAM序列存在于非靶链(例如,非间隔子互补链)中。术语“相邻”包括本文所述的PAM序列,其与非靶链中的序列直接相邻(或在非靶链中的序列的少量,例如1、2、3、4或5个核苷酸内)。
如本文所用,术语“RNA指导物”是指促进本文所述的多肽(例如,Cas12i多肽)靶向靶序列(例如,B2M基因的序列)的任何RNA分子。RNA指导物可以被设计成包括与特定的核酸序列(例如,B2M核酸序列)互补的序列的分子。RNA指导物可以包含靶向DNA的序列(即,间隔子序列)和同向重复(DR)序列。术语“crRNA”在本文中也用于指RNA指导物。
在一些实施例中,间隔子序列与靶序列互补。如本文所用,术语“互补”是指第一核酸分子(例如RNA指导物)的核碱基与第二核酸分子(例如靶序列)的核碱基碱基配对的能力。两个互补的核酸分子能够在适当的温度和溶液离子强度条件下非共价结合。在一些实施例中,第一核酸分子(例如,RNA指导物的间隔子序列)包含与第二核酸(例如,靶序列)的100%互补性。在一些实施例中,如果第一核酸分子包含与第二核酸至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的互补性,则第一核酸分子(例如RNA指导物的间隔子序列)与第二核酸分子(例如靶序列)互补。如本文所用,术语“基本上互补”是指与靶序列具有一定水平互补性的多核苷酸(例如,RNA指导物的间隔子序列)。在一些实施例中,互补性水平使得多核苷酸可以以足够的亲和力与靶序列杂交,以允许与多核苷酸复合的效应多肽(例如,Cas12i)作用于(例如,切割)靶序列。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有小于100%的互补性。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互补性。在一些实施例中,具有与靶序列基本互补的间隔子序列的RNA指导物与靶序列具有100%互补性。
如本文所用,术语“靶标”和“靶序列”是指RNA指导物特异性结合的核酸序列。在一些实施例中,RNA指导物的DNA靶向序列(例如,间隔子)结合靶序列。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。在一些实施例中,靶链(即,间隔子互补链)包含5'-NAAN-3'序列。在一些实施例中,靶序列是B2M基因序列内的序列,包括但不限于SEQ ID NO:773或其反向互补序列。
如本文所用,术语“上游”和“下游”是指核酸分子中单个核酸(例如,DNA)序列内的相对位置。“上游”和“下游”分别涉及发生RNA转录的5'至3'方向。当第一序列的3'端出现在第二序列的5'端之前时,第一序列在第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列在第二序列的下游。在一些实施例中,5'-NTTN-3'序列在本文所述的插入缺失的上游,并且Cas12i诱导的插入缺失在5'-NTTN-3'序列的下游。
附图说明
图1显示了SEQ ID NO:782的变体Cas12i2和几个靶向B2M的单独RNA指导物在不同浓度在HEK293T细胞中的插入缺失活性。
图2显示了SEQ ID NO:783的变体Cas12i2和几个靶向B2M的单独RNA指导物在不同浓度在原代T细胞中的插入缺失活性。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
图3显示了SEQ ID NO:783的变体Cas12i2和几个靶向B2M的单独RNA指导物在不同浓度在原代T细胞中导致的B2M表达减少。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
图4示出了在原代T细胞中引入不同浓度的靶向B2M的变体Cas12i2核糖核蛋白(RNP)后七天的细胞活力(经由DAPI染色)。误差条代表来自一个代表性供体的四个技术重复的平均值的标准偏差。
具体实施方式
本披露涉及能够结合B2M的RNA指导物及其使用方法。在一些方面,本文描述了一种包含具有一个或多个特性的RNA指导物的组合物。在一些方面,描述了产生RNA指导物的方法。在一些方面,描述了一种递送包含RNA指导物的组合物的方法。
组合物
在一些方面,本文所述的发明包括包含靶向B2M的RNA指导物的组合物。在一些实施例中,RNA指导物由同向重复组分和间隔子组分构成。在一些实施例中,RNA指导物与Cas12i多肽结合。在一些实施例中,间隔子组分与B2M靶序列基本上互补,其中B2M靶序列与本文所述的5'-NTTN-3'PAM序列相邻。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。
在一些实施例中,本文所述的发明包含含有复合物的组合物,其中该复合物包含靶向B2M的RNA指导物。在一些实施例中,本发明包含一种复合物,该复合物包含RNA指导物和Cas12i多肽。在一些实施例中,RNA指导物和Cas12i多肽以约1:1的摩尔比彼此结合。在一些实施例中,包含RNA指导物和Cas12i多肽的复合物与B2M靶序列结合。在一些实施例中,包含靶向B2M的RNA指导物和Cas12i多肽的复合物与B2M靶序列以约1:1的摩尔比结合。在一些实施例中,复合物包含可以切割B2M靶序列的酶活性,如核酸酶活性。RNA指导物、Cas12i多肽、和B2M靶序列(无论是单独还是一起)不是天然存在的。
本文披露的组合物的使用具有优于其他已知的核酸酶系统的那些的优点。Cas12i多肽比其他核酸酶小。例如,Cas12i2的长度为1,054个氨基酸,而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸,嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸,FnCpf1的长度为1,300个氨基酸,AsCpf1的长度为1,307个氨基酸,并且LbCpf1的长度为1,246个氨基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指导物也比Cas9 RNA指导物小。较小的Cas12i多肽和RNA指导物大小有利于递送。与包含SpCas9多肽的组合物相比,包含Cas12i多肽的组合物还表现出降低的脱靶活性。参见PCT/US 2021/025257,将该文献通过援引以其全文并入。此外,由包含Cas12i多肽的组合物诱导的插入缺失不同于由包含SpCas9多肽的组合物诱导的插入缺失。例如,SpCas9多肽主要诱导长度为1个核苷酸的插入和缺失。然而,Cas12i多肽诱导较大的缺失,这可有利于破坏基因(如B2M)的较大部分。
RNA指导物
在一些实施例中,本文所述的组合物包含靶向B2M基因或B2M基因的一部分的RNA指导物。在一些实施例中,本文所述的组合物包含两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)靶向B2M的RNA指导物。
RNA指导物可将本文所述的Cas12i多肽引导至B2M靶序列。两个或更多个RNA指导物可以将两个或更多个如本文所述的单独的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)靶向至两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)B2M靶序列。
阅读以下特定种类的RNA指导物的实例的本领域技术人员将理解,在一些实施例中,RNA指导物具有B2M靶特异性。也就是说,在一些实施例中,RNA指导物与一个或多个B2M靶序列(例如,在细胞内)特异性结合,并且不与非靶向的序列(例如,相同细胞内的非特异性DNA或随机序列)结合。
在一些实施例中,RNA指导物包含间隔子序列、随后是同向重复序列,指的是从5'至3'方向的序列。在一些实施例中,RNA指导物包含第一同向重复序列、随后是间隔子序列、和第二同向重复序列,指的是从5'至3'方向的序列。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列相同。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列不同。
在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于相同的RNA分子内。在一些实施例中,间隔子序列和同向重复序列彼此直接连接。在一些实施例中,在间隔子序列和同向重复序列之间存在短接头,例如长度为1、2、或3个核苷酸的RNA接头。在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于单独的分子中,它们通过碱基配对相互作用彼此连接。
关于RNA指导物的示例性同向重复组分和间隔子组分的额外信息提供如下。
同向重复序列
在一些实施例中,RNA指导物包含同向重复序列。在一些实施例中,RNA指导物的同向重复序列的长度介于12-100、13-75、14-50、或15-40个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40个核苷酸)。
在一些实施例中,同向重复序列是或包含表1的序列或表1的序列的一部分。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36。同向重复序列可以包含SEQ ID NO:9的核苷酸1至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸2至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸3至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸4至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸5至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸6至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸7至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸8至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸9至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸10至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸11至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸12至核苷酸34。在一些实施例中,同向重复序列在SEQ ID NO:10中阐述。在一些实施例中,同向重复序列包含在SEQ ID NO:10中阐述的序列的一部分。
在一些实施例中,同向重复序列具有或包含序列,该序列与表1的序列或表1的序列的一部分包含至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸1至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸2至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸3至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸4至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQID NO:9的核苷酸5至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸6至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸7至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸8至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸9至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸10至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸11至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸12至核苷酸34的序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:10具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与在SEQ ID NO:10中阐述的序列的一部分具有至少90%的同一性。
在一些实施例中,包含Cas12i2多肽和RNA指导物的组合物能够将插入缺失引入B2M靶序列中,该RNA指导物包含SEQ ID NO:10的同向重复序列和20个核苷酸长度的间隔子。见,例如,实例1,其中插入缺失在瞬时转染RNA指导物和SEQ ID NO:782的Cas12i2多肽后在十一个B2M靶序列处测量,以及实例2,其中插入缺失在RNP递送RNA指导物和SEQ IDNO:783的Cas12i2多肽后在四个B2M靶序列处进行测量。
在一些实施例中,同向重复序列是或包含序列,该序列与SEQ ID NO:1-10中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列是或包含SEQID NO:1-10中任一个的反向互补序列。
表1.Cas12i2同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:1 | GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:2 | AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:3 | AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:4 | CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:5 | CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:6 | GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:7 | GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:8 | GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:9 | GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG |
SEQ ID NO:10 | AGAAAUCCGUCUUUCAUUGACGG |
在一些实施例中,同向重复序列是表2的序列或表2的序列的一部分。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸14至核苷酸36。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸1至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸2至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸3至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸4至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸5至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸6至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸7至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸8至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸9至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸10至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸11至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸12至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸13至核苷酸36的序列具有至少95%的同一性。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。
在一些实施例中,同向重复序列与SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:788、789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、或805中任一个的反向互补序列。
在一些实施例中,同向重复序列与SEQ ID NO:806或SEQ ID NO:806的一部分具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:806或SEQ ID NO:806的一部分具有至少95%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:806或SEQ IDNO:806的一部分具有100%的同一性。
表2.Cas12i4同向重复序列。
在一些实施例中,同向重复序列是表3的序列或表3的序列的一部分。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:807-809中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQID NO:807-809中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:807-809中任一个的反向互补序列。
表3.Cas12i1同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:807 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC |
SEQ ID NO:808 | AAUUUUUGUGCCCAUCGUUGGCAC |
SEQ ID NO:809 | AUUUUUGUGCCCAUCGUUGGCAC |
在一些实施例中,同向重复序列是表4的序列或表4的序列的一部分。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:810-812中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQID NO:810-812中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:810-812中任一个的反向互补序列。
表4.Cas12i3同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:810 | CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU |
SEQ ID NO:811 | CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG |
SEQ ID NO:812 | AUAGUGUGUCCUUAGUUGACAU |
在一些实施例中,本文所述的同向重复序列包含尿嘧啶(U)。在一些实施例中,本文所述的同向重复序列包含胸腺嘧啶(T)。在一些实施例中,根据表1-4的同向重复序列包含这样的序列,该序列在表1-4中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
间隔子
在一些实施例中,RNA指导物包含靶向DNA的间隔子序列。在一些实施例中,RNA指导物的间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸)并且与特定靶序列互补。在一些实施例中,间隔子序列被设计为与例如基因组基因座的特定DNA链互补。
在一些实施例中,RNA指导物间隔子序列与靶序列的互补链基本上相同。在一些实施例中,RNA指导物包含与参考核酸序列(例如靶序列)的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。
在一些实施例中,RNA指导物包含间隔子序列,该间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸),并且该间隔子序列与靶序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互补性。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含长度为至多50并且与靶序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列(例如,RNA序列)。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。
在一些实施例中,间隔子序列是或包含表5的序列或表5的序列的一部分。表5和表6中列出的靶序列位于B2M序列的非靶链上。应该理解,SEQ ID NO:391-770或1019-1218的指示应该被认为等同于以下的列表:SEQ ID NO:391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、501、502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、517、518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、570、571、572、573、574、575、576、577、578、579、580、581、582、583、584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、693、694、695、696、697、698、699、700、701、702、703、704、705、706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、741、742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、和770,或1019、1020、1021、1022、1023、1024、1025、1026、1027、1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、1038、1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、1066、1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、1100、1101、1102、1103、1104、1105、1106、1107、1108、1109、1110、1111、1112、1113、1114、1115、1116、1117、1118、1119、1120、1121、1122、1123、1124、1125、1126、1127、1128、1129、1130、1131、1132、1133、1134、1135、1136、1137、1138、1139、1140、1141、1142、1143、1144、1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、1156、1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、1171、1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、1191、1192、1193、1194、1195、1196、1197、1198、1199、1200、1201、1202、1203、1204、1205、1206、1207、1208、1209、1210、1211、1212、1213、1214、1215、1216、1217、和1218。
间隔子序列可以包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16。间隔子序列可以包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17。间隔子序列可以包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18。间隔子序列可以包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19。间隔子序列可以包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20。间隔子序列可以包含SEQ ID NO:391--770中任一个的核苷酸1至核苷酸21。间隔子序列可以包含SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22。间隔子序列可以包含SEQID NO:391-552和555-770中任一个的核苷酸1至核苷酸23。间隔子序列可以包含SEQ IDNO:391-552和556-770中任一个的核苷酸1至核苷酸24。间隔子序列可以包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25。间隔子序列可以包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸26。间隔子序列可以包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27。间隔子序列可以包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28。间隔子序列可以包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29。间隔子序列可以包含SEQ ID NO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
在一些实施例中,间隔子序列具有或包含序列,该序列与表5的序列或表5的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQID NO:391-770中任一个的核苷酸1至核苷酸21的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸26的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ IDNO:391-552和556-770中任一个的核苷酸1至核苷酸28的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30的序列具有至少90%的同一性。
表5.靶序列和间隔子序列
本发明包括与本文披露内容一致的、以上列出的同向重复序列和间隔子的所有组合。在实施例中,RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGAAUGUCGGAUGGAUGAAACC(SEQ ID NO:778);
AGAAAUCCGUCUUUCAUUGACGGCUAUCUCUUGUACUACACUG(SEQ ID NO:779);
AGAAAUCCGUCUUUCAUUGACGGACACGGCAGGCAUACUCAUC(SEQ ID NO:780);或
AGAAAUCCGUCUUUCAUUGACGGGUCACAGCCCAAGAUAGUUA(SEQ ID NO:781)。
在一些实施例中,本文所述的间隔子序列包含尿嘧啶(U)。在一些实施例中,本文所述的间隔子序列包含胸腺嘧啶(T)。在一些实施例中,根据表5的间隔子序列包含这样的序列,该序列在表5中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
修饰
RNA指导物可以包括相对于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰,该一个或多个共价修饰包括在本发明的范围内。
示例性修饰可以包括对糖、核碱基、核苷间键(例如,对连接磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。
RNA指导物可以包括如对糖、核碱基、或核苷间键(例如,对连接的磷酸酯/对磷酸二酯键/对磷酸二酯骨架)的任何有用的修饰。嘧啶核碱基的一个或多个原子可被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如,甲基或乙基)或卤基(例如,氯或氟)替代或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(RNA)到脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或它们的杂交体的修饰。本文描述了另外的修饰。
在一些实施例中,修饰可包括化学或细胞诱导的修饰。例如,细胞内RNA修饰的一些非限制性实例由Lewis和Pan在“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论:分子细胞生物学],2017,18:202-210中所描述。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解,核苷酸类似物或其他修饰可位于序列的任何位置处,使得序列的功能基本上不降低。序列可包括约1%至约100%的经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何插入百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,糖修饰(例如,2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间连接(例如核苷间修饰,包括磷酸二酯连接的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中,序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(诸如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(诸如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和具有正常3'-5'连接的硼烷磷酸酯、这些酯的2'-5'连接的类似物,以及具有相反极性的那些,其中相邻的核苷单元对3'-5'连接至5'-3'或2'-5'连接至5'-2'。也包括各种盐、混合盐和游离酸形式。在一些实施例中,序列可带负电荷或带正电荷。
可掺入序列中的经修饰的核苷酸可以在核苷间键(例如,主链)上被修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换地使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外,经修饰的核苷和核苷酸可以包括用如本文所述的另一核苷间键对未经修饰的磷酸酯部分进行整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼酸磷酸酯(boranophosphate)、硼酸磷酸酯(boranophosphate ester)、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。
提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链连接赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性,并因此在细胞环境中具有更长的半衰期。
在特定的实施例中,经修饰的核苷包括α-硫代-核苷(例如5'-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5'-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根据本发明使用的其他核苷间连接,包括不含磷原子的核苷间连接。
在一些实施例中,序列可包括一个或多个细胞毒性核苷。例如,可将细胞毒性核苷掺入序列中,诸如双功能修饰。细胞毒性核苷可包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-反油酸酯)。
在一些实施例中,序列包括一个或多个转录后修饰(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化、以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰,如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P,和McCloskey,J.(1999).The RNA Modification Database:1999update[RNA修饰数据库:1999年更新].Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中,第一分离的核酸包含信使RNA(mRNA)。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸嘌呤或嘧啶,或者A、G、U、C、I、pU中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,该肌苷可以帮助免疫系统将序列相对于病毒RNA表征为内源性。肌苷的掺入还可以介导改善的RNA稳定性/减少降解。参见例如,Yu,Z.等人(2015)RNA editing by ADAR1 marks dsRNA as“self”[ADAR1进行的RNA编辑将dsRNA标记为“自我”].Cell Res[细胞研究].25,1283-1284,将该文献通过援引以其全文并入。
Cas12i多肽
在一些实施例中,本发明的组合物包含如PCT/US 2019/022375中所述的Cas12i多肽。
在一些实施例中,本发明的组合物包括本文所述的Cas12i2多肽(例如,包含SEQID NO:772和/或由SEQ ID NO:771编码的多肽)。在一些实施例中,Cas12i2多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i2多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:771)基本上相同。在一些实施例中,Cas12i2多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:771)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。参见例如,Tijssen,“Hybridization withNucleic Acid Probes.Part I.Theory and Nucleic Acid Preparation[与核酸探针杂交.第I部分.理论和核酸制备]”(Laboratory Techniques in Biochemistry andMolecular Biology[生物化学和分子生物学实验室技术],第24卷)。
在一些实施例中,Cas12i2多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:771)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:772具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:772的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:772的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i2多肽包含具有SEQ ID NO:782、SEQ ID NO:783、SEQ IDNO:784、SEQ ID NO:785、或SEQ ID NO:786的序列的多肽。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i2多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQID NO:785、或SEQ ID NO:786的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,该Cas12i2多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:782、SEQ IDNO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i4多肽(例如,包含SEQID NO:814和/或由SEQ ID NO:787编码的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i4多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:787)基本上相同。在一些实施例中,Cas12i4多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:787)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。
在一些实施例中,Cas12i4多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:787)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:814具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i4多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:814的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:814的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i4多肽包含具有SEQ ID NO:815或SEQ ID NO:816的序列的多肽。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:815或SEQ ID NO:816具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:815或SEQ ID NO:816具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i4多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i4多肽,该Cas12i4多肽与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:815或SEQ ID NO:816的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:815或SEQ ID NO:816的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i1多肽(例如,包含SEQID NO:817的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i1多肽包含与SEQ ID NO:817具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i1多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:817的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i1多肽,该Cas12i1多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:817的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i3多肽(例如,包含SEQID NO:818的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i3多肽包含与SEQ ID NO:818具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i3多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:818的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i3多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:818的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
尽管本文所述的变化可以是一个或多个氨基酸的变化,但Cas12i多肽的变化也可以是实质性的,例如作为氨基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有额外的肽,例如,一个或多个肽。另外的肽的实例可包括用于标记的表位肽,诸如多组氨酸标签(His标签)、Myc和FLAG。在一些实施例中,本文所述的Cas12i多肽可以融合到可检测部分,诸如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。
在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,本文所述的Cas12i多肽可以是自我灭活的。参见Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自我灭活的CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50,将该文献通过援引以其全文并入。
在一些实施例中,编码本文所述的Cas12i多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物。例如,核酸可以经密码子优化以用于任何非人真核生物,包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按多种方式进行改编。参见Nakamura等人Nucl.Acids Res.[核酸研究]28:292(2000),将其通过援引以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,诸如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,PA))。
靶序列
在一些实施例中,靶序列在B2M基因或B2M基因的基因座内。在一些实施例中,B2M基因是哺乳动物基因。在一些实施例中,B2M基因是人类基因。例如,在一些实施例中,靶序列在SEQ ID NO:773或其反向互补序列内。在一些实施例中,靶序列在SEQ ID NO:773(或其反向互补序列)阐述的B2M基因的外显子内,例如,在SEQ ID NO:774、775、776、或777的序列(或其反向互补序列)内。表5列出了SEQ ID NO:773的B2M基因外显子内的靶序列(及其反向互补序列)。在一些实施例中,靶序列在SEQ ID NO:773(或其反向互补序列)阐述的B2M基因的内含子内,例如,在SEQ ID NO:1219、1220、或1221的序列(或其反向互补序列)内。表5列出了SEQ ID NO:773的B2M基因内含子内的靶序列(或其反向互补序列)。在一些实施例中,靶序列在SEQ ID NO:773阐述的B2M基因序列或其反向互补序列的变体(例如,多态性变体)内。在一些实施例中,B2M基因序列是在SEQ ID NO:773阐述的序列或其反向互补序列的同源物。例如,在一些实施例中,B2M基因序列是非人B2M序列。
在一些实施例中,靶序列与5'-NTTN-3'PAM序列相邻,其中N是任何核苷酸。5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些实施例中,靶序列是单链的(例如,单链DNA)。在一些实施例中,靶序列是双链的(例如,双链DNA)。在一些实施例中,靶序列包含单链区和双链区两者。在一些实施例中,靶序列是线性的。在一些实施例中,靶序列是环状的。在一些实施例中,靶序列包含一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损的核苷酸、或核苷酸类似物。在一些实施例中,靶序列未经修饰。在一些实施例中,RNA指导物与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5'-NAAN-3'序列附近结合。
在一些实施例中,靶序列存在于细胞中。在一些实施例中,靶序列存在于细胞核中。在一些实施例中,靶序列对细胞是内源的。在一些实施例中,靶序列是基因组DNA。在一些实施例中,靶序列是染色体DNA。在一些实施例中,靶序列是编码蛋白质的基因或其功能区如编码区、或调节元件,如启动子、增强子、5'或3'非翻译区等。在一些实施例中,靶序列是质粒。
在一些实施例中,靶序列存在于靶序列的易于接近的区域中。在一些实施例中,靶序列是靶基因的外显子。在一些实施例中,靶序列跨靶基因的外显子-内含子接点。在一些实施例中,靶序列存在于非编码区(如基因的调节区)中。在一些实施例中,其中靶序列对细胞是外源的,靶序列包含在细胞的基因组中未发现的序列。
在一些实施例中,靶序列对于细胞是外源的。在一些实施例中,靶序列是水平转移的质粒。在一些实施例中,靶序列整合在细胞的基因组中。在一些实施例中,靶序列不整合在细胞的基因组中。在一些实施例中,靶序列是细胞中的质粒。在一些实施例中,靶序列存在于染色体外阵列中。
在一些实施例中,靶序列是分离的核酸,诸如分离的DNA或分离的RNA。在一些实施例中,靶序列存在于无细胞环境中。在一些实施例中,靶序列是分离的载体,诸如质粒。在一些实施例中,靶序列是超纯质粒。
靶序列是与RNA指导物杂交的B2M基因的基因座。在一些实施例中,细胞仅具有靶序列的一个拷贝。在一些实施例中,细胞具有靶序列的多于一个拷贝,如至少约2、3、4、5、10、100或更多个拷贝中的任一个。
在一些实施例中,选择B2M靶序列以由Cas12i多肽和RNA指导物使用以下标准中的一项或多项进行编辑。首先,在一些实施例中,选择靠近B2M编码序列的5'端的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向外显子1(SEQ ID NO:774)或外显子2(SEQ IDNO:775)中的序列。其次,在一些实施例中,选择与5'-CTTY-3'PAM序列相邻的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向与5'-CTTT-3'或5'-CTTC-3'序列相邻的序列。第三,在一些实施例中,选择与其他基因组序列具有低序列相似性的靶序列。例如,对于每个靶序列,通过搜索与PAM序列相邻的其他基因组序列并计算靶序列与PAM相邻序列之间的莱文斯坦距离来鉴定潜在非靶位点。莱文斯坦距离(例如,编辑距离)对应于将一个序列改变为另一个序列(例如,将潜在非靶基因座的序列改变为在靶基因座的序列)所需的编辑(例如,插入、缺失或取代)的最小次数。按照此分析,RNA指导物是为靶序列设计的,这些靶序列不具有Levenshtein距离为0或1的潜在脱靶序列。
生产
本发明包括用于产生RNA指导物的方法、用于产生多肽的方法以及用于复合RNA指导物和Cas12i多肽的方法。
RNA指导物
在一些实施例中,RNA指导物是通过DNA模板的体外转录制成的。因此,例如,在一些实施例中,通过使用上游启动子序列(例如,T7聚合酶启动子序列)在体外转录编码RNA指导物的DNA模板来产生RNA指导物。在一些实施例中,DNA模板编码多个RNA指导物,或者体外转录反应包括多个不同的DNA模板,每个DNA模板编码不同的RNA指导物。在一些实施例中,使用化学合成方法制备RNA指导物。在一些实施例中,通过在用包括编码RNA指导物的序列的质粒转染的细胞中表达RNA指导物序列来制备RNA指导物。在一些实施例中,质粒编码多个不同的RNA指导物。在一些实施例中,将各自编码不同的RNA指导物的多个不同的质粒转染到细胞中。在一些实施例中,从编码RNA指导物并且还编码Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,从表达RNA指导物但不表达Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,RNA指导物从商业供应商购买。在一些实施例中,使用一个或多个经修饰的核苷酸(例如,如上所述)合成RNA指导物。
Cas12i多肽
在一些实施例中,本发明的Cas12i多肽可以通过以下制备:(a)培养产生本发明的Cas12i多肽的细菌,分离该Cas12i多肽,任选地纯化该Cas12i多肽,并将该Cas12i多肽与RNA指导物复合。Cas12i多肽还可以通过(b)已知的基因工程技术来制备,具体地,通过以下过程制备:从细菌中分离编码本发明的Cas12i多肽的基因,构建重组表达载体,然后将该载体转移到表达RNA指导物的合适宿主细胞中以在宿主细胞中表达与RNA指导物复合的重组蛋白。替代性地,Cas12i多肽可以通过(c)体外偶联的转录-翻译系统然后与RNA指导物复合来制备。
在一些实施例中,宿主细胞用于表达Cas12i多肽。宿主细胞没有特别限制,并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包括细菌,诸如大肠杆菌、酵母(芽殖酵母酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾(Xenopus laevis)卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制,并且可以使用已知的方法,诸如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。
在用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞以产生Cas12i多肽。在Cas12i多肽表达后,可以根据常规方法(例如,过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并从培养物中纯化Cas12i多肽等。
在一些实施例中,用于Cas12i多肽表达的方法包括翻译该Cas12i多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸、或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译Cas12i多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多。
多种方法可以用于确定宿主细胞中成熟Cas12i多肽的产生水平。此类方法包括但不限于例如利用对Cas12i多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。
本披露内容提供了在细胞中体内表达Cas12i多肽的方法,这些方法包括向宿主细胞提供编码该Cas12i多肽的多核糖核苷酸(其中该多核糖核苷酸编码该Cas12i多肽);在该细胞中表达该Cas12i多肽;以及从该细胞中获得该Cas12i多肽。
复合
在一些实施例中,靶向B2M的RNA指导物与Cas12i多肽复合以形成核糖核蛋白。在一些实施例中,RNA指导物和Cas12i多肽的复合发生在低于约以下中任一个的温度下:20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、或55℃。在一些实施例中,在约37C下在至少约以下中的任一个的孵育时间段内,RNA指导物不会从Cas12i多肽解离:10min、15min、20min、25min、30min、35min、40min、45min、50min、55min、1hr、2hr、3hr、4hr、或更多个小时。
在一些实施例中,RNA指导物和Cas12i多肽在复合缓冲液中复合。在一些实施例中,将Cas12i多肽储存在被复合缓冲液替代的缓冲液中以与RNA指导物形成复合物。在一些实施例中,将Cas12i多肽储存在复合缓冲液中。
在一些实施例中,复合缓冲液的pH范围为约7.3至8.6。在一个实施例中,复合缓冲液的pH为约7.3。在一个实施例中,复合缓冲液的pH为约7.4。在一个实施例中,复合缓冲液的pH为约7.5。在一个实施例中,复合缓冲液的pH为约7.6。在一个实施例中,复合缓冲液的pH为约7.7。在一个实施例中,复合缓冲液的pH为约7.8。在一个实施例中,复合缓冲液的pH为约7.9。在一个实施例中,复合缓冲液的pH为约8.0。在一个实施例中,复合缓冲液的pH为约8.1。在一个实施例中,复合缓冲液的pH为约8.2。在一个实施例中,复合缓冲液的pH为约8.3。在一个实施例中,复合缓冲液的pH为约8.4。在一个实施例中,复合缓冲液的pH为约8.5。在一个实施例中,复合缓冲液的pH为约8.6。
在一些实施例中,在如本文所述纯化之前,可以使Cas12i多肽在宿主细胞中过表达并与RNA指导物复合。在一些实施例中,编码Cas12i多肽的mRNA或DNA被引入细胞中,使得Cas12i多肽在细胞中表达。在一些实施例中,RNA指导物也从单个mRNA或DNA构建体同时、分别或依次引入细胞,使得核糖核蛋白复合物在细胞中形成。
递送
可将本文所述的组合物或复合物配制成例如包括载剂(诸如载剂和/或聚合物载剂,例如脂质体),并且通过已知方法递送到细胞(例如,原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。此类方法包括但不限于转染(例如,脂质介导、阳离子聚合物、磷酸钙、树枝状大分子);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。
在一些实施例中,该方法包括将一种或多种核酸(例如,编码Cas12i多肽、RNA指导物、供体DNA等的核酸)、其一种或多种转录物、和/或预形成的RNA指导物/Cas12i多肽复合物递送至细胞,在该细胞中形成三元复合物。示例性细胞内递送方法包括但不限于:病毒或病毒样药剂;基于化学的转染方法,诸如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,诸如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送;基于粒子的方法,诸如使用基因枪、磁转染或磁辅助转染、粒子轰击;以及混合方法,诸如核转染。在一些实施例中,本申请进一步提供了通过此类方法产生的细胞,以及包含此类细胞的或由此类细胞产生的生物体(例如,动物、植物或真菌)。
在一些实施例中,将Cas12i组分和RNA指导物组分一起递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分一起包装在单个AAV颗粒中。在另一个实例中,在一些实施例中,将Cas12i组分和RNA指导物组分经由脂质纳米颗粒(LNP)一起递送。在一些实施例中,将Cas12i组分和RNA指导物组分分开递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分包装在分开的AAV颗粒中。在另一个例子中,在一些实施例中,将Cas12i组分通过第一递送机制递送,并将RNA指导物组分通过第二递送机制递送。
细胞
可将本文所述的组合物或复合物递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞在细胞培养物中或在两种或更多种细胞类型的共培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞获自活的生物并维持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或来源于细菌细胞。在一些实施例中,细胞是古细菌细胞或来源于古细菌细胞。
在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或来源于植物细胞。在一些实施例中,细胞是真菌细胞或来源于真菌细胞。在一些实施例中,细胞是动物细胞或来源于动物细胞。在一些实施例中,细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成制成的,有时称为人工细胞。
在一些实施例中,细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293T、MF7、K562、HeLa、CHO、及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中,细胞是永生或永生化细胞。
在一些实施例中,细胞是原代细胞。在一些实施例中,细胞是干细胞,例如全能干细胞(例如,全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中,细胞是诱导性多能干细胞(iPSC)或来源于iPSC。在一些实施例中,细胞是分化细胞。例如,在一些实施例中,分化细胞是肌肉细胞(例如,肌细胞)、脂肪细胞(例如,脂细胞)、骨的细胞(例如,成骨细胞、骨细胞、破骨细胞)、血细胞(例如,单核细胞、淋巴细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、神经细胞(例如,神经元)、上皮细胞、免疫细胞(例如,淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如肝细胞)、成纤维细胞或性细胞。在一些实施例中,细胞是终末分化细胞。例如,在一些实施例中,终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中,细胞是免疫细胞。在一些实施例中,免疫细胞是T细胞。在一些实施例中,免疫细胞是B细胞。在一些实施例中,免疫细胞是自然杀伤(NK)细胞。在一些实施例中,免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中,细胞是哺乳动物细胞,例如人细胞或鼠细胞。在一些实施例中,鼠细胞来源于野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中,细胞是活组织、器官、或生物内的细胞。
方法
本披露还提供了修饰B2M基因内的靶序列的方法。在一些实施例中,该方法包括将B2M靶向性RNA指导物和Cas12i多肽引入细胞中。B2M靶向性RNA指导物和Cas12i多肽可以作为核糖核蛋白复合物引入细胞。可以将B2M靶向性RNA指导物和Cas12i多肽在核酸载体上引入。可以将Cas12i多肽作为mRNA引入。可以将RNA指导物直接引入细胞中。
在一些实施例中,B2M基因的序列在SEQ ID NO:773(或其反向互补序列)中列出。在一些实施例中,靶序列在B2M基因的外显子中,例如具有SEQ ID NO:774、SEQ ID NO:775、SEQ ID NO:776或SEQ ID NO:777中任一个所示序列的外显子(或其反向互补序列)。在一些实施例中,靶序列在B2M基因的内含子中(例如,SEQ ID NO:773中所示序列的内含子,或其反向互补序列),例如具有SEQ ID NO:1219、SEQ ID NO:1220或SEQ ID NO:1221中任一个所示序列的内含子(或其反向互补序列)。在其他实施例中,B2M基因的序列是SEQ ID NO:773中所示序列的变体(或其反向互补序列)或SEQ ID NO:773中所示序列的同源序列(或其反向互补序列)。例如,在一些实施例中,靶序列是SEQ ID NO:773(或其反向互补序列)中所示的B2M序列的多态变体或B2M基因的非人形式。
在一些实施例中,如本文披露的RNA指导物被设计成与靶序列互补,该靶序列与5'-NTTN-3'PAM序列相邻。5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,RNA指导物被设计成与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5'-NAAN-3'序列附近结合。
在一些实施例中,Cas12i多肽具有酶活性(例如,核酸酶活性)。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA双链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA单链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA切口。在一些实施例中,DNA断裂和/或切口导致形成一个或多个插入缺失(例如,一个或多个缺失)。
在一些实施例中,本文披露的RNA指导物与Cas12i多肽形成复合物并将该Cas12i多肽引导至与5'-NTTN-3'序列相邻的靶序列。在一些实施例中,该复合物诱导与5'-NTTN-3'序列相邻的缺失(例如,核苷酸缺失或DNA缺失)。在一些实施例中,该复合物诱导与以下序列相邻的缺失:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,该复合物诱导与富含T/C的序列相邻的缺失。
在一些实施例中,缺失在5'-NTTN-3'序列的下游。在一些实施例中,缺失在以下序列的下游:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游。
在一些实施例中,缺失改变B2M基因的表达。在一些实施例中,缺失改变B2M基因的功能。在一些实施例中,缺失使B2M基因失活。在一些实施例中,缺失是移码缺失。在一些实施例中,缺失是非移码缺失。在一些实施例中,缺失导致细胞毒性或细胞死亡(例如,凋亡)。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失的长度多达约50个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)。在一些实施例中,缺失的长度多达约40个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16或17个核苷酸)。
在一些实施例中,本文所述的方法用于工程化在B2M基因中包含如本文所述的缺失的细胞。
本文披露的组合物、载体、核酸、RNA指导物和细胞可用于疗法中。本文披露的组合物、载体、核酸、RNA指导物和细胞可用于治疗受试者的疾病或病症的方法中。本领域已知的任何合适的递送或施用方法可用于递送本文披露的组合物、载体、核酸、RNA指导物和细胞。这样的方法可以涉及使靶序列与本文披露的组合物、载体、核酸或RNA指导物接触。这样的方法可以涉及编辑如本文披露的B2M序列的方法。在一些实施例中,使用本文披露的RNA指导物工程化的细胞用于离体基因疗法。在一些实施例中,使用本文披露的RNA指导物工程化的细胞用于CAR T细胞疗法。
试剂盒
本发明还提供了可以用于例如实施本文所述的方法的试剂盒或系统。在一些实施例中,试剂盒或系统包括RNA指导物和Cas12i多肽。在一些实施例中,试剂盒或系统包括编码这种Cas12i多肽的多核苷酸,并且任选地,该多核苷酸被包含在例如如本文所述的载体内。在一些实施例中,试剂盒或系统包括编码本文披露的RNA指导物的多核苷酸。可以将Cas12i多肽和RNA指导物(例如,作为核糖核蛋白)包装在试剂盒或系统内的相同容器或其他容器内,或者可以包装在内容物可以在使用前混合的分开的小瓶或其他容器中。任选地,试剂盒或系统还可以额外地包括缓冲液和/或RNA指导物和Cas12i多肽的使用说明。
本文引用的所有参考文献和出版物特此通过援引并入。
实例
提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围;通过它们的示例性性质将理解,可替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例1–通过转染编辑哺乳动物细胞中的B2M
本实例描述了使用通过瞬时转染引入哺乳动物细胞的Cas12i2和RNA指导物组合物对多个B2M靶标的插入缺失评估。
SEQ ID NO:782的变体Cas12i2与pcda3.1骨架(英杰公司)中的CMV启动子一起被克隆。然后将质粒大量制备并且稀释至1μg/μL。对于RNA指导物制备,通过含有靶序列支架的超聚体(ultramer)和U6启动子衍生编码RNA指导物的dsDNA片段。将超聚体重悬于pH 7.5的10mM Tris·HCl中至最终原液浓度为100μM。随后再次使用10mM Tris·HCl将工作原液稀释至10μM以充当用于PCR反应的模板。将RNA指导物的扩增在具有以下组分的50μL反应物中进行:0.02μl前面提及的模板、2.5μl正向引物、2.5μl反向引物、25μL NEB HiFi聚合酶和20μl水。循环条件是:1x(98℃下30s)、30x(98℃下10s,67℃下15s)、1x(72℃下2min)。将PCR产物用1.8X SPRI处理净化并且归一化至25ng/μL。制备的RNA指导物序列及其相应的靶序列在表6中示出。
表6.用于瞬时转染的RNA指导物和靶序列。
在转染前大约16小时,将100μl在DMEM/10%FBS+青霉素/链霉素中的25,000个HEK293T细胞铺板至96孔板中的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备0.5μl Lipofectamine 2000和9.5μl Opti-MEM的混合物,然后在室温下孵育5-20分钟(溶液1)。在孵育之后,将lipofectamine:OptiMEM混合物添加至最多至10μL的含有182ng效应子质粒和14ng RNA指导物以及水的单独混合物(溶液2)。将溶液1和溶液2混合物通过向上和向下吸移进行混合,且然后在室温下孵育25分钟。在孵育后,将20μL溶液1和溶液2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后72小时,通过以下方式使细胞胰蛋白酶化:向每个孔的中心添加10μL TrypLE并且孵育大约5分钟。然后将100μL D10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将QuickExtract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来扩增根据靶的特定基因组区域。通过柱纯化对PCR1产物进行纯化。进行第2轮PCR(PCR2)以添加Illumina衔接子和索引。然后合并反应,将其加载到2%E-gel EX上10分钟并进行凝胶提取。用150次循环NextSeq v2.5中等或高输出试剂盒进行测序运行。
如图1所示,十一个测试的RNA指导物中的每一个都在B2M靶序列中诱导了插入缺失。因此,RNA指导物和SEQ ID NO:782的变体Cas12i2能够靶向哺乳动物细胞外显子1和外显子2中的B2M靶标。
实例2—通过RNP电穿孔编辑哺乳动物细胞中的B2M
本实例描述了在哺乳动物细胞中使用Cas12i多肽对多个B2M靶序列进行核糖核蛋白(RNP)转染,然后进行FACS染色和插入缺失评估。
将来自三个单个供体的CD3+T细胞复苏,并使用自动细胞计数器进行计数。收集来自每个供体的样品,并分别进行CD3ε和DAPI染色以用于表面表达和活力的流式细胞术分析。将细胞密度调节至1e6个细胞/mL,并将细胞用抗CD3:CD28的混合物刺激3天。
通过以1:1(效应子:RNA指导物)的体积比(2.5:1RNA指导物:效应子摩尔比)混合纯化的变体Cas12i2(400μM;SEQ ID NO:783)与RNA指导物(在250mM NaCl中为1mM;参见表7中的序列)进行变体Cas12i2 RNP复合反应。通过以6.45:1(效应子:sgRNA)的体积比(2.5:1sgRNA:效应子摩尔比)混合纯化的SpCas9(Aldevron;62μM)与sgRNA(在水中为1mM;参见表7中的序列)进行SpCas9 RNP复合反应。对于“只有效应子”的对照,分别以与RNA指导物或sgRNA相同的体积比将变体Cas12i2或SpCas9与蛋白质储存缓冲液(25mM Tris(pH 7.5)、250mM NaCl、1mM TCEP、50%甘油)混合。包括另外的对照:SpCas9(Aldevron)与Lethal#1(转染对照指导物)、合并的CD3或ROSA26 sgRNA以及SpCas9(Horizon)与Lethal#1、合并的CD3或ROSA26 sgRNA。将复合物在37℃下孵育30-60分钟。孵育后,将RNP稀释至20μM、50μM、100μM或160μM效应子浓度(对于变体Cas12i2)和20μM或50μM(对于SpCas9)。
表7.用于RNP转染的RNA指导物序列。
将稀释的复合反应以2μL/孔分配到384孔电穿孔板中。收集细胞悬浮液,并使用自动细胞计数器进行计数。在P3缓冲液中将细胞密度调节至1.1e7个细胞/mL,并以2e5个细胞/反应(18μL)分配。变体Cas12i2 RNP的最终浓度为2μM、5μM、10μM或16μM。SpCas9 RNP的最终浓度为2或5μM。设置以下对照:只有未电穿孔细胞、只有P3原代细胞缓冲液(Lonza#VXP-3032)中的细胞、只有蛋白质储存缓冲液中的细胞。使用电穿孔装置(程序EO-115-AA,Lonza HT)对板进行电穿孔,不包括未电穿孔条件。使用机器人技术(StarLab Hamilton)将每个孔分成四个96孔编辑板(含有200μL总体积)。将编辑板在37℃下孵育7天,在第4天更换100μL培养基。
7天后,将板离心并除去上清液。将沉淀重悬于200μL PBS中。收集100μL样品,并用抗体组(抗B2M)或抗CD3ε抗体(lethal#1,用于Cas9对照的合并CD3ε、ROSA26、蛋白质储存缓冲液和未电穿孔)染色。将所有细胞用DAPI染色以评估活力。将剩余的细胞悬浮液转移到96孔PCR板中并以500x g离心5分钟。除去上清液并将沉淀冷冻在-80℃下。
对于gDNA提取,将沉淀解冻至室温并重悬于适当体积的DNA提取缓冲液(QuickExtract)中,得到1000个细胞/μL的最终浓度。然后将样品在PCR机器中在65℃下循环15分钟,在68℃下循环15分钟,在98℃下循环10分钟。然后将样品冷冻在-20℃下。
通过多轮PCR制备用于下一代测序(NGS)的样品。第一轮(PCR I)用于扩增靶位点侧翼的基因组区域并添加NGS衔接子。第二轮(PCR II)用于添加NGS index。然后将反应液汇集,通过柱纯化进行纯化,并在荧光计(量子比特公司(Qubit))上定量。使用150循环NGS仪器(NextSeq v2.5)中或高输出试剂盒完成测序运行,并在NGS仪器(NextSeq 550)上运行。
对于NGS分析,插入缺失映射功能使用样品的fastq文件、扩增子参考序列、和正向引物序列。对于每个读段,使用kmer扫描算法来计算读段与参考序列之间的编辑操作(匹配、错配、插入、缺失)。为了去除一些样品中存在的少量引物二聚体,每个读段的前30nt需要与参考匹配,并且超过一半的映射核苷酸为错配的读段也被滤除。通过这些过滤器的多达50,000个读段用于分析,并且如果读段含有插入或缺失,则将其计为插入缺失读数。将插入缺失%计算为含有插入缺失的读段数目除以分析的读段数目(通过过滤器的读段多达50,000个)。通过过滤器的最小读段数目的QC标准是10,000。
这些结果证明了原代T细胞中变体Cas12i2 RNP靶向多个B2M靶的稳健插入缺失活性(图2),活性峰值在16μM。流式细胞术染色显示变体Cas12i2RNP后T细胞中的B2M蛋白表达显著降低(图3)。在靶向B2M的Cas12i2RNP电穿孔后七天,细胞活力在所有条件下都保持高水平(图4)。
因此,该实例显示了如何测量用本文所述的RNA指导物/Cas12i多肽复合物电穿孔的细胞(例如T细胞)的活力、细胞中B2M的表达以及对细胞中B2M靶序列的活性(插入缺失%)。
该实例进一步表明RNA指导物和SEQ ID NO:783的变体Cas12i2能够靶向哺乳动物细胞中外显子2中的B2M靶标。
序列表
<110> 阿伯生物技术公司(Arbor Biotechnologies, Inc.)
<120> 包含靶向B2M的RNA指导物的组合物及其用途
<130> 51451-014WO3
<150> US 63/252,719
<151> 2021-10-06
<150> US 63/107,869
<151> 2020-10-30
<160> 1241
<170> PatentIn 3.5版
<210> 1
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1
guugcaaaac ccaagaaauc cgucuuucau ugacgg 36
<210> 2
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 2
aauagcggcc cuaagaaauc cgucuuucau ugacgg 36
<210> 3
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 3
auuggaacug gcgagaaauc cgucuuucau ugacgg 36
<210> 4
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 4
ccagcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 5
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 5
cggcgcucga auaggaaauc cgucuuucau ugacgg 36
<210> 6
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 6
guggcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 7
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 7
guugcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 8
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 8
guugcaaugc cuaagaaauc cgucuuucau ugacgg 36
<210> 9
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 9
gcaacaccua agaaauccgu cuuucauuga cggg 34
<210> 10
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 10
agaaauccgu cuuucauuga cgg 23
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 11
atataagtgg aggcgtcgcg ctggcgggca 30
<210> 12
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 12
tattaaacgc gtgcccagcc aatcaggaca 30
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 13
aggaatgccc gccagcgcga cgcctccact 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 14
tggcctggag gctatccagc gtgagtctct 30
<210> 15
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 15
ctggcctgga ggctatccag cgtgagtctc 30
<210> 16
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 16
gctgtgctcg cgctactctc tctttctggc 30
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 17
gggccgagat gtctcgctcc gtggccttag 30
<210> 18
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 18
ctgaagctga cagcattcgg gccgagatgt 30
<210> 19
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 19
aatataagtg gaggcgtcgc gctggcgggc 30
<210> 20
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 20
gctgggcacg cgtttaatat aagtggaggc 30
<210> 21
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 21
tcacagccca agatagttaa gtggggtaag 30
<210> 22
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 22
agtggggtaa gtcttacatt cttttgtaag 30
<210> 23
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 23
cattctctgc tggatgacgt gagtaaacct 30
<210> 24
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 24
ttttgtaagc tgctgaaagt tgtgtatgag 30
<210> 25
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 25
gtcacagccc aagatagtta agtggggtaa 30
<210> 26
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 26
cattcttttg taagctgctg aaagttgtgt 30
<210> 27
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 27
acccccactg aaaaagatga gtatgcctgc 30
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 28
cagcaaggac tggtctttct atctcttgta 30
<210> 29
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 29
tatctcttgt actacactga attcaccccc 30
<210> 30
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 30
ctatctcttg tactacactg aattcacccc 30
<210> 31
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 31
agcaaggact ggtctttcta tctcttgtac 30
<210> 32
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 32
tgtaagctgc tgaaagttgt gtatgagtag 30
<210> 33
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 33
tctttcagca aggactggtc tttctatctc 30
<210> 34
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 34
tactacactg aattcacccc cactgaaaaa 30
<210> 35
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 35
gtaagctgct gaaagttgtg tatgagtagt 30
<210> 36
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 36
ccccacttaa ctatcttggg ctgtgacaaa 30
<210> 37
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 37
cagcagctta caaaagaatg taagacttac 30
<210> 38
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 38
agcagcttac aaaagaatgt aagacttacc 30
<210> 39
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 39
caaaagaatg taagacttac cccacttaac 30
<210> 40
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 40
agacttgtct ttcagcaagg actggtcttt 30
<210> 41
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 41
actatcttgg gctgtgacaa agtcacatgg 30
<210> 42
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 42
ggctgtgaca aagtcacatg gttcacacgg 30
<210> 43
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 43
acacggcagg catactcatc tttttcagtg 30
<210> 44
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 44
ttcagtgggg gtgaattcag tgtagtacaa 30
<210> 45
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 45
tcagtggggg tgaattcagt gtagtacaag 30
<210> 46
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 46
cagtgggggt gaattcagtg tagtacaaga 30
<210> 47
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 47
agtgggggtg aattcagtgt agtacaagag 30
<210> 48
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 48
agtgtagtac aagagataga aagaccagtc 30
<210> 49
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 49
ctgaaagaca agtctgaatg ctccactttt 30
<210> 50
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 50
taagctgctg aaagttgtgt atgagtagtc 30
<210> 51
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 51
aaaaagtgga gcattcagac ttgtctttca 30
<210> 52
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 52
catccatccg acattgaagt tgacttactg 30
<210> 53
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 53
acttactgaa gaatggagag agaattgaaa 30
<210> 54
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 54
atattgccag ggtatttcac ttggggctaa 30
<210> 55
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 55
gagtacctga ggaatatcgg gaaaagacac 30
<210> 56
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 56
ggagtacctg aggaatatcg ggaaaagaca 30
<210> 57
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 57
tctgctggat gacgtgagta aacctgaatc 30
<210> 58
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 58
ccattctctg ctggatgacg tgagtaaacc 30
<210> 59
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 59
actttccatt ctctgctgga tgacgtgagt 30
<210> 60
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 60
gactttccat tctctgctgg atgacgtgag 30
<210> 61
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 61
aggaaatttg actttccatt ctctgctgga 30
<210> 62
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 62
aatgtcggat ggatgaaacc cagacacata 30
<210> 63
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 63
agtaagtcaa cttcaatgtc ggatggatga 30
<210> 64
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 64
ttcagtaagt caacttcaat gtcggatgga 30
<210> 65
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 65
tctctccatt cttcagtaag tcaacttcaa 30
<210> 66
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 66
aattctctct ccattcttca gtaagtcaac 30
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 67
ctgaagaatg gagagagaat tgaaaaagtg 30
<210> 68
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 68
caattctctc tccattcttc agtaagtcaa 30
<210> 69
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 69
tcccgatatt cctcaggtac tccaaagatt 30
<210> 70
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 70
cccgatattc ctcaggtact ccaaagattc 30
<210> 71
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 71
ccgatattcc tcaggtactc caaagattca 30
<210> 72
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 72
ctcaggtact ccaaagattc aggtttactc 30
<210> 73
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 73
aggtttactc acgtcatcca gcagagaatg 30
<210> 74
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 74
actcacgtca tccagcagag aatggaaagt 30
<210> 75
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 75
ctcacgtcat ccagcagaga atggaaagtc 30
<210> 76
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 76
cctgaattgc tatgtgtctg ggtttcatcc 30
<210> 77
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 77
ctgaattgct atgtgtctgg gtttcatcca 30
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 78
ctatgtgtct gggtttcatc catccgacat 30
<210> 79
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 79
ttcaattctc tctccattct tcagtaagtc 30
<210> 80
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 80
atccatccga cattgaagtt gacttactga 30
<210> 81
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 81
aagttgactt actgaagaat ggagagagaa 30
<210> 82
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 82
atgtgtcttt tcccgatatt cctcaggtac 30
<210> 83
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 83
tcaattctct ctccattctt cagtaagtca 30
<210> 84
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 84
atgtcttcct tttttttctc cactgtcttt 30
<210> 85
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 85
cctccatgat gctgcttaca tgtctcgatc 30
<210> 86
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 86
catgtctcga tctatgaaaa agacagtgga 30
<210> 87
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 87
cttttttttc tccactgtct ttttcataga 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 88
tttttctcca ctgtcttttt catagatcga 30
<210> 89
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 89
ttttctccac tgtctttttc atagatcgag 30
<210> 90
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 90
tttctccact gtctttttca tagatcgaga 30
<210> 91
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 91
tctccactgt ctttttcata gatcgagaca 30
<210> 92
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 92
ctccactgtc tttttcatag atcgagacat 30
<210> 93
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 93
tccactgtct ttttcataga tcgagacatg 30
<210> 94
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 94
ttcatagatc gagacatgta agcagcatca 30
<210> 95
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 95
tcatagatcg agacatgtaa gcagcatcat 30
<210> 96
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 96
catagatcga gacatgtaag cagcatcatg 30
<210> 97
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 97
ttctccactg tctttttcat agatcgagac 30
<210> 98
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 98
ttgaccttga gaaaatgttt ttgtttcact 30
<210> 99
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 99
atagatcgag acatgtaagc agcatcatgg 30
<210> 100
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 100
ctcaaggtca aaaacttacc tccatgatgc 30
<210> 101
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 101
tctcaaggtc aaaaacttac ctccatgatg 30
<210> 102
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 102
tcaaggtcaa aaacttacct ccatgatgct 30
<210> 103
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 103
ttgtttcact gtcctgagga ctatttatag 30
<210> 104
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 104
tgtttcactg tcctgaggac tatttataga 30
<210> 105
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 105
agaaaatgtt tttgtttcac tgtcctgagg 30
<210> 106
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 106
accttgagaa aatgtttttg tttcactgtc 30
<210> 107
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 107
gaccttgaga aaatgttttt gtttcactgt 30
<210> 108
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 108
tgaccttgag aaaatgtttt tgtttcactg 30
<210> 109
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 109
tattaggtat tacaagtaat ctagaaatga 30
<210> 110
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 110
acattgtatt aggtattaca agtaatctag 30
<210> 111
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 111
catagcattt acattgtatt aggtattaca 30
<210> 112
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 112
gcatagcatt tacattgtat taggtattac 30
<210> 113
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 113
cattgtatta ggtattacaa gtaatctaga 30
<210> 114
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 114
aacaataaca actatttgca tagcatttac 30
<210> 115
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 115
cttgtcatta ttccttaaac aataacaact 30
<210> 116
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 116
ttccttaaac aataacaact atttgcatag 30
<210> 117
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 117
tcattattcc ttaaacaata acaactattt 30
<210> 118
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 118
ttgtcattat tccttaaaca ataacaacta 30
<210> 119
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 119
tcttgtcatt attccttaaa caataacaac 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 120
ggtattacaa gtaatctaga aatgatttaa 30
<210> 121
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 121
ttcttgtcat tattccttaa acaataacaa 30
<210> 122
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 122
cttaaacaat aacaactatt tgcatagcat 30
<210> 123
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 123
caagtaatct agaaatgatt taaagtatac 30
<210> 124
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 124
cttgctaaaa tattaaatcc ttcagatact 30
<210> 125
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 125
aagtatacag gaggatgtgg ataggttata 30
<210> 126
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 126
gctccctctt agagtctgca tactcctcat 30
<210> 127
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 127
tgctccctct tagagtctgc atactcctca 30
<210> 128
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 128
agatactttt gctccctctt agagtctgca 30
<210> 129
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 129
aatccttcag atacttttgc tccctcttag 30
<210> 130
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 130
ctaaaatatt aaatccttca gatacttttg 30
<210> 131
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 131
tttcttgtca ttattcctta aacaataaca 30
<210> 132
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 132
aaagtataca ggaggatgtg gataggttat 30
<210> 133
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 133
tatatctatt ccttgctaaa atattaaatc 30
<210> 134
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 134
ggtgtccaag aaggggtcct gaaaccaatc 30
<210> 135
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 135
aatatccata gatttggtgt ccaagaaggg 30
<210> 136
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 136
tagaagggac ttaaatatcc atagatttgg 30
<210> 137
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 137
atagaaggga cttaaatatc catagatttg 30
<210> 138
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 138
tatagaaggg acttaaatat ccatagattt 30
<210> 139
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 139
tatgcaaata ctataccatt ttatagaagg 30
<210> 140
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 140
gtgtccaaga aggggtcctg aaaccaatcc 30
<210> 141
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 141
ttttcttgtc attattcctt aaacaataac 30
<210> 142
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 142
aaatctgtta tttgtcattc aaagtacagc 30
<210> 143
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 143
ctgagcatgt acagactttt ttttcttgtc 30
<210> 144
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 144
ctgaatccac agatgtggag cccctggata 30
<210> 145
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 145
gctgaatcca cagatgtgga gcccctggat 30
<210> 146
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 146
atccatggtt tgctgaatcc acagatgtgg 30
<210> 147
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 147
gatccatggt ttgctgaatc cacagatgtg 30
<210> 148
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 148
tgatccatgg tttgctgaat ccacagatgt 30
<210> 149
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 149
ttgatccatg gtttgctgaa tccacagatg 30
<210> 150
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 150
gaatgacaaa taacagattt aaaattttca 30
<210> 151
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 151
cccagtgttt ttgatccatg gtttgctgaa 30
<210> 152
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 152
tccccagtgt ttttgatcca tggtttgctg 30
<210> 153
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 153
ttccccagtg tttttgatcc atggtttgct 30
<210> 154
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 154
tttccccagt gtttttgatc catggtttgc 30
<210> 155
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 155
ttttccccag tgtttttgat ccatggtttg 30
<210> 156
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 156
aggaataatg acaagaaaaa aaagtctgta 30
<210> 157
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 157
ctccctctta gagtctgcat actcctcatg 30
<210> 158
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 158
ccccagtgtt tttgatccat ggtttgctga 30
<210> 159
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 159
tttttcttgt cattattcct taaacaataa 30
<210> 160
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 160
aatgacaaat aacagattta aaattttcaa 30
<210> 161
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 161
aaattttcaa ggcatagttt tatacctga 29
<210> 162
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 162
actgagcatg tacagacttt tttttcttgt 30
<210> 163
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 163
tgtctttact gagcatgtac agactttttt 30
<210> 164
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 164
agcaaaccat ggatcaaaaa cactggggaa 30
<210> 165
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 165
cgtatccagg ggctccacat ctgtggattc 30
<210> 166
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 166
aaagtacagc gggccttccg tatccagggg 30
<210> 167
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 167
tcattcaaag tacagcgggc cttccgtatc 30
<210> 168
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 168
aaaattttca aggcatagtt ttatacctga 30
<210> 169
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 169
gtcattcaaa gtacagcggg ccttccgtat 30
<210> 170
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 170
aatctgttat ttgtcattca aagtacagcg 30
<210> 171
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 171
taaatctgtt atttgtcatt caaagtacag 30
<210> 172
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 172
aaaattttaa atctgttatt tgtcattcaa 30
<210> 173
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 173
aaggcatagt tttatacctg a 21
<210> 174
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 174
caaggcatag ttttatacct ga 22
<210> 175
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 175
tcaaggcata gttttatacc tga 23
<210> 176
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 176
tttgtcattc aaagtacagc gggccttccg 30
<210> 177
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 177
gagtctgcat actcctcatg acctggcccg 30
<210> 178
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 178
actatcttaa caagctttga gtgcaagaga 30
<210> 179
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 179
acttctttga gcatcagatt cctaatctgg 30
<210> 180
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 180
tatttctaaa ttttccccca aattctaagc 30
<210> 181
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 181
ctaaattttc ccccaaattc taagcagagt 30
<210> 182
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 182
taaattttcc cccaaattct aagcagagta 30
<210> 183
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 183
tcccccaaat tctaagcaga gtatgtaaat 30
<210> 184
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 184
cccccaaatt ctaagcagag tatgtaaatt 30
<210> 185
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 185
ccccaaattc taagcagagt atgtaaattg 30
<210> 186
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 186
taagcagagt atgtaaattg gaagttaact 30
<210> 187
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 187
gaagttaact tatgcacgct taactatctt 30
<210> 188
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 188
acttatgcac gcttaactat cttaacaagc 30
<210> 189
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 189
tgcacgctta actatcttaa caagctttga 30
<210> 190
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 190
aaggaataat gacaagaaaa aaaagtctgt 30
<210> 191
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 191
acaagctttg agtgcaagag attgaagagt 30
<210> 192
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 192
gagtgcaaga gattgaagag ttcaaatctg 30
<210> 193
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 193
agtgcaagag attgaagagt tcaaatctga 30
<210> 194
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 194
aagagttcaa atctgaccaa gatgttgatg 30
<210> 195
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 195
aaatctgacc aagatgttga tgttggataa 30
<210> 196
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 196
atgttggata agagaattct ctgctcccca 30
<210> 197
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 197
atccaatcca aatgcggcat cttcaaacct 30
<210> 198
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 198
gaattcatcc aatccaaatg cggcatcttc 30
<210> 199
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 199
ggaattcatc caatccaaat gcggcatctt 30
<210> 200
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 200
aaaagcaagc aagcagaatt tggaattcat 30
<210> 201
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 201
tgcataaagt gtaagtgtat aagcatatca 30
<210> 202
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 202
gtgcataaag tgtaagtgta taagcatatc 30
<210> 203
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 203
caataatcct gtcaattata tttctaaatt 30
<210> 204
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 204
tgtgcataaa gtgtaagtgt ataagcatat 30
<210> 205
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 205
ttataaccct acattttgtg cataaagtgt 30
<210> 206
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 206
acattattat aaccctacat tttgtgcata 30
<210> 207
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 207
taaagaagat catgtccatg ttaacattat 30
<210> 208
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 208
ccagccctcc tagagctacc tgtggagcaa 30
<210> 209
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 209
tctgctcccc acctctaagt tgccagccct 30
<210> 210
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 210
gataagagaa ttctctgctc cccacctcta 30
<210> 211
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 211
taaccctaca ttttgtgcat aaagtgtaag 30
<210> 212
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 212
ccaataatcc tgtcaattat atttctaaat 30
<210> 213
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 213
taacaaattt ccaataatcc tgtcaattat 30
<210> 214
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 214
attataacaa atttccaata atcctgtcaa 30
<210> 215
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 215
ccctgtttga aaataaaggg gtaatagtgg 30
<210> 216
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 216
aagactgttt ccctgtttga aaataaaggg 30
<210> 217
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 217
ccaagtggaa cttgaagact gtttccctgt 30
<210> 218
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 218
accaagtgga acttgaagac tgtttccctg 30
<210> 219
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 219
taccaagtgg aacttgaaga ctgtttccct 30
<210> 220
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 220
ttaccaagtg gaacttgaag actgtttccc 30
<210> 221
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 221
cctgtttgaa aataaagggg taatagtggg 30
<210> 222
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 222
tttaccaagt ggaacttgaa gactgtttcc 30
<210> 223
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 223
cactgtgagc caaactctat atacaagggg 30
<210> 224
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 224
acactgtgag ccaaactcta tatacaaggg 30
<210> 225
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 225
ctaatctgga aaatgtgaat cactgaggcc 30
<210> 226
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 226
agcatcagat tcctaatctg gaaaatgtga 30
<210> 227
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 227
gagcatcaga ttcctaatct ggaaaatgtg 30
<210> 228
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 228
tttgagcatc agattcctaa tctggaaaat 30
<210> 229
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 229
acatttttta ccaagtggaa cttgaagact 30
<210> 230
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 230
aacttctttg agcatcagat tcctaatctg 30
<210> 231
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 231
gaaaataaag gggtaatagt gggagtgaga 30
<210> 232
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 232
tatgatttat ttaacttgtg gaacaaaaat 30
<210> 233
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 233
attcattata acaaatttcc aataatcctg 30
<210> 234
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 234
cattcattat aacaaatttc caataatcct 30
<210> 235
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 235
tatgacaaaa tgtttcattc attataacaa 30
<210> 236
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 236
tcaaatgtat aagaagtaaa tatgaatctt 30
<210> 237
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 237
atcaaatgta taagaagtaa atatgaatct 30
<210> 238
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 238
ctttatcaaa tgtataagaa gtaaatatga 30
<210> 239
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 239
aaaataaagg ggtaatagtg ggagtgagat 30
<210> 240
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 240
accacaacca tgccttactt tatcaaatgt 30
<210> 241
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 241
acttgtggaa caaaaataaa ccagattaac 30
<210> 242
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 242
aacttgtgga acaaaaataa accagattaa 30
<210> 243
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 243
tttaacttgt ggaacaaaaa taaaccagat 30
<210> 244
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 244
atttaacttg tggaacaaaa ataaaccaga 30
<210> 245
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 245
tgatttattt aacttgtgga acaaaaataa 30
<210> 246
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 246
atgatttatt taacttgtgg aacaaaaata 30
<210> 247
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 247
tggaacaaaa ataaaccaga ttaaccacaa 30
<210> 248
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 248
tttaaggaat aatgacaaga aaaaaaagtc 30
<210> 249
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 249
attttcaaac agggaaacag tcttcaagtt 30
<210> 250
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 250
ttattgttta aggaataatg acaagaaaaa 30
<210> 251
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 251
gagtgctgtc tccatgtttg atgtatctga 30
<210> 252
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 252
agtgctgtct ccatgtttga tgtatctgag 30
<210> 253
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 253
gatgtatctg agcaggttgc tccacaggta 30
<210> 254
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 254
atgtatctga gcaggttgct ccacaggtag 30
<210> 255
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 255
ctccacaggt agctctagga gggctggcaa 30
<210> 256
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 256
gaggtgggga gcagagaatt ctcttatcca 30
<210> 257
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 257
tcttatccaa catcaacatc ttggtcagat 30
<210> 258
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 258
tccaacatca acatcttggt cagatttgaa 30
<210> 259
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 259
gtcagatttg aactcttcaa tctcttgcac 30
<210> 260
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 260
gaactcttca atctcttgca ctcaaagctt 30
<210> 261
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 261
aactcttcaa tctcttgcac tcaaagcttg 30
<210> 262
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 262
aatctcttgc actcaaagct tgttaagata 30
<210> 263
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 263
cactcaaagc ttgttaagat agttaagcgt 30
<210> 264
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 264
ttaagatagt taagcgtgca taagttaact 30
<210> 265
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 265
agatagttaa gcgtgcataa gttaacttcc 30
<210> 266
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 266
agcgtgcata agttaacttc caatttacat 30
<210> 267
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 267
acttccaatt tacatactct gcttagaatt 30
<210> 268
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 268
taatgaatga aacattttgt catataagat 30
<210> 269
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 269
ttataatgaa tgaaacattt tgtcatataa 30
<210> 270
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 270
gttataatga atgaaacatt ttgtcatata 30
<210> 271
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 271
gaaatttgtt ataatgaatg aaacattttg 30
<210> 272
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 272
ttggaaattt gttataatga atgaaacatt 30
<210> 273
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 273
acaggattat tggaaatttg ttataatgaa 30
<210> 274
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 274
tactttgagt gctgtctcca tgtttgatgt 30
<210> 275
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 275
gaaatataat tgacaggatt attggaaatt 30
<210> 276
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 276
ggggaaaatt tagaaatata attgacagga 30
<210> 277
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 277
gggggaaaat ttagaaatat aattgacagg 30
<210> 278
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 278
gaatttgggg gaaaatttag aaatataatt 30
<210> 279
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 279
catactctgc ttagaatttg ggggaaaatt 30
<210> 280
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 280
acatactctg cttagaattt gggggaaaat 30
<210> 281
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 281
caatttacat actctgctta gaatttgggg 30
<210> 282
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 282
agaaatataa ttgacaggat tattggaaat 30
<210> 283
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 283
taattctact ttgagtgctg tctccatgtt 30
<210> 284
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 284
ataattctac tttgagtgct gtctccatgt 30
<210> 285
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 285
tttataattc tactttgagt gctgtctcca 30
<210> 286
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 286
aagatgccgc atttggattg gatgaattcc 30
<210> 287
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 287
gaagatgccg catttggatt ggatgaattc 30
<210> 288
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 288
aggtttgaag atgccgcatt tggattggat 30
<210> 289
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 289
caggtttgaa gatgccgcat ttggattgga 30
<210> 290
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 290
tcaggtttga agatgccgca tttggattgg 30
<210> 291
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 291
ttttcaggtt tgaagatgcc gcatttggat 30
<210> 292
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 292
ggattggatg aattccaaat tctgcttgct 30
<210> 293
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 293
cttttcaggt ttgaagatgc cgcatttgga 30
<210> 294
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 294
ttttcttttc aggtttgaag atgccgcatt 30
<210> 295
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 295
cttttctttt caggtttgaa gatgccgcat 30
<210> 296
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 296
tcttttcttt tcaggtttga agatgccgca 30
<210> 297
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 297
ttcttttctt ttcaggtttg aagatgccgc 30
<210> 298
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 298
ctaacctttt tcttttcttt tcaggtttga 30
<210> 299
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 299
attgctaacc tttttctttt cttttcaggt 30
<210> 300
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 300
tcttttcagg tttgaagatg ccgcatttgg 30
<210> 301
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 301
tgtcatataa gattcatatt tacttcttat 30
<210> 302
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 302
gattggatga attccaaatt ctgcttgctt 30
<210> 303
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 303
caaattctgc ttgcttgctt tttaatattg 30
<210> 304
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 304
acatggacat gatcttcttt ataattctac 30
<210> 305
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 305
taataatgtt aacatggaca tgatcttctt 30
<210> 306
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 306
tgcacaaaat gtagggttat aataatgtta 30
<210> 307
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 307
atgcacaaaa tgtagggtta taataatgtt 30
<210> 308
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 308
cactttatgc acaaaatgta gggttataat 30
<210> 309
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 309
tacacttaca ctttatgcac aaaatgtagg 30
<210> 310
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 310
gatgaattcc aaattctgct tgcttgcttt 30
<210> 311
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 311
atatgcttat acacttacac tttatgcaca 30
<210> 312
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 312
aatattgata tgcttataca cttacacttt 30
<210> 313
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 313
taatattgat atgcttatac acttacactt 30
<210> 314
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 314
ttaatattga tatgcttata cacttacact 30
<210> 315
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 315
ctttttaata ttgatatgct tatacactta 30
<210> 316
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 316
cttgcttttt aatattgata tgcttataca 30
<210> 317
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 317
tgcttgcttg ctttttaata ttgatatgct 30
<210> 318
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 318
atattgatat gcttatacac ttacacttta 30
<210> 319
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 319
ttgtttaagg aataatgaca agaaaaaaaa 30
<210> 320
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 320
gtcatataag attcatattt acttcttata 30
<210> 321
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 321
atatttactt cttatacatt tgataaagta 30
<210> 322
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 322
aatggcatag ttggggtgac acagctgtct 30
<210> 323
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 323
gggtgacaca gctgtctagt gggaggccag 30
<210> 324
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 324
tatattttag ccagcgttct ttcctgcggg 30
<210> 325
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 325
tagccagcgt tctttcctgc gggccaggtc 30
<210> 326
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 326
agccagcgtt ctttcctgcg ggccaggtca 30
<210> 327
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 327
gccagcgttc tttcctgcgg gccaggtcat 30
<210> 328
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 328
tttcctgcgg gccaggtcat gaggagtatg 30
<210> 329
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 329
cctgcgggcc aggtcatgag gagtatgcag 30
<210> 330
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 330
ctgcgggcca ggtcatgagg agtatgcaga 30
<210> 331
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 331
aatattttag caaggaatag atatacaatc 30
<210> 332
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 332
atattttagc aaggaataga tatacaatca 30
<210> 333
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 333
tagcaaggaa tagatataca atcatccctt 30
<210> 334
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 334
agcaaggaat agatatacaa tcatcccttg 30
<210> 335
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 335
gcaaggaata gatatacaat catcccttgg 30
<210> 336
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 336
gtctccctgg gggattggtt tcaggacccc 30
<210> 337
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 337
gtttcaggac cccttcttgg acaccaaatc 30
<210> 338
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 338
caggacccct tcttggacac caaatctatg 30
<210> 339
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 339
taatacctaa tacaatgtaa atgctatgca 30
<210> 340
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 340
cttgtaatac ctaatacaat gtaaatgcta 30
<210> 341
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 341
tagattactt gtaataccta atacaatgta 30
<210> 342
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 342
ctagattact tgtaatacct aatacaatgt 30
<210> 343
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 343
aatcatttct agattacttg taatacctaa 30
<210> 344
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 344
aaatcatttc tagattactt gtaataccta 30
<210> 345
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 345
ggaatctgat gctcaaagaa gttaaatggc 30
<210> 346
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 346
catataacct atccacatcc tcctgtatac 30
<210> 347
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 347
tataaaatgg tatagtattt gcatataacc 30
<210> 348
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 348
agtcccttct ataaaatggt atagtatttg 30
<210> 349
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 349
aagtcccttc tataaaatgg tatagtattt 30
<210> 350
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 350
gacaccaaat ctatggatat ttaagtccct 30
<210> 351
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 351
ttggacacca aatctatgga tatttaagtc 30
<210> 352
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 352
aggacccctt cttggacacc aaatctatgg 30
<210> 353
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 353
gcatataacc tatccacatc ctcctgtata 30
<210> 354
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 354
cagattagga atctgatgct caaagaagtt 30
<210> 355
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 355
ccagattagg aatctgatgc tcaaagaagt 30
<210> 356
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 356
tccagattag gaatctgatg ctcaaagaag 30
<210> 357
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 357
ttccacaagt taaataaatc ataaaacttg 30
<210> 358
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 358
gttccacaag ttaaataaat cataaaactt 30
<210> 359
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 359
tgttccacaa gttaaataaa tcataaaact 30
<210> 360
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 360
ttgttccaca agttaaataa atcataaaac 30
<210> 361
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 361
tttttgttcc acaagttaaa taaatcataa 30
<210> 362
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 362
atttttgttc cacaagttaa ataaatcata 30
<210> 363
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 363
cacaagttaa ataaatcata aaacttgatg 30
<210> 364
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 364
atctggttta tttttgttcc acaagttaaa 30
<210> 365
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 365
ataaagtaag gcatggttgt ggttaatctg 30
<210> 366
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 366
gataaagtaa ggcatggttg tggttaatct 30
<210> 367
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 367
tacatttgat aaagtaaggc atggttgtgg 30
<210> 368
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 368
ttatacattt gataaagtaa ggcatggttg 30
<210> 369
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 369
cttcttatac atttgataaa gtaaggcatg 30
<210> 370
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 370
acttcttata catttgataa agtaaggcat 30
<210> 371
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 371
tggttaatct ggtttatttt tgttccacaa 30
<210> 372
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 372
tcatataaga ttcatattta cttcttatac 30
<210> 373
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 373
aataaatcat aaaacttgat gtgttatctc 30
<210> 374
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 374
tctcttatat ctcactccca ctattacccc 30
<210> 375
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 375
acattttcca gattaggaat ctgatgctca 30
<210> 376
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 376
gctcacagtg taaagggcct cagtgattca 30
<210> 377
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 377
ggctcacagt gtaaagggcc tcagtgattc 30
<210> 378
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 378
tatatagagt ttggctcaca gtgtaaaggg 30
<210> 379
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 379
gtaaaaaatg tgaacccctt gtatatagag 30
<210> 380
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 380
cacttggtaa aaaatgtgaa ccccttgtat 30
<210> 381
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 381
atgtgttatc tcttatatct cactcccact 30
<210> 382
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 382
aagttccact tggtaaaaaa tgtgaacccc 30
<210> 383
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 383
caaacaggga aacagtcttc aagttccact 30
<210> 384
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 384
tcaaacaggg aaacagtctt caagttccac 30
<210> 385
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 385
ttttcaaaca gggaaacagt cttcaagttc 30
<210> 386
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 386
aaacctgaaa agaaaagaaa aaggttagca 30
<210> 387
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 387
cccctttatt ttcaaacagg gaaacagtct 30
<210> 388
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 388
tatctcactc ccactattac ccctttattt 30
<210> 389
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 389
aaacagggaa acagtcttca agttccactt 30
<210> 390
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 390
gcaatgaatt tattttattt ggattgcaga 30
<210> 391
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 391
auauaagugg aggcgucgcg cuggcgggca 30
<210> 392
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 392
uauuaaacgc gugcccagcc aaucaggaca 30
<210> 393
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 393
aggaaugccc gccagcgcga cgccuccacu 30
<210> 394
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 394
uggccuggag gcuauccagc gugagucucu 30
<210> 395
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 395
cuggccugga ggcuauccag cgugagucuc 30
<210> 396
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 396
gcugugcucg cgcuacucuc ucuuucuggc 30
<210> 397
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 397
gggccgagau gucucgcucc guggccuuag 30
<210> 398
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 398
cugaagcuga cagcauucgg gccgagaugu 30
<210> 399
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 399
aauauaagug gaggcgucgc gcuggcgggc 30
<210> 400
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 400
gcugggcacg cguuuaauau aaguggaggc 30
<210> 401
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 401
ucacagccca agauaguuaa gugggguaag 30
<210> 402
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 402
agugggguaa gucuuacauu cuuuuguaag 30
<210> 403
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 403
cauucucugc uggaugacgu gaguaaaccu 30
<210> 404
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 404
uuuuguaagc ugcugaaagu uguguaugag 30
<210> 405
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 405
gucacagccc aagauaguua agugggguaa 30
<210> 406
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 406
cauucuuuug uaagcugcug aaaguugugu 30
<210> 407
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 407
acccccacug aaaaagauga guaugccugc 30
<210> 408
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 408
cagcaaggac uggucuuucu aucucuugua 30
<210> 409
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 409
uaucucuugu acuacacuga auucaccccc 30
<210> 410
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 410
cuaucucuug uacuacacug aauucacccc 30
<210> 411
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 411
agcaaggacu ggucuuucua ucucuuguac 30
<210> 412
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 412
uguaagcugc ugaaaguugu guaugaguag 30
<210> 413
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 413
ucuuucagca aggacugguc uuucuaucuc 30
<210> 414
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 414
uacuacacug aauucacccc cacugaaaaa 30
<210> 415
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 415
guaagcugcu gaaaguugug uaugaguagu 30
<210> 416
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 416
ccccacuuaa cuaucuuggg cugugacaaa 30
<210> 417
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 417
cagcagcuua caaaagaaug uaagacuuac 30
<210> 418
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 418
agcagcuuac aaaagaaugu aagacuuacc 30
<210> 419
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 419
caaaagaaug uaagacuuac cccacuuaac 30
<210> 420
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 420
agacuugucu uucagcaagg acuggucuuu 30
<210> 421
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 421
acuaucuugg gcugugacaa agucacaugg 30
<210> 422
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 422
ggcugugaca aagucacaug guucacacgg 30
<210> 423
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 423
acacggcagg cauacucauc uuuuucagug 30
<210> 424
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 424
uucagugggg gugaauucag uguaguacaa 30
<210> 425
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 425
ucaguggggg ugaauucagu guaguacaag 30
<210> 426
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 426
cagugggggu gaauucagug uaguacaaga 30
<210> 427
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 427
agugggggug aauucagugu aguacaagag 30
<210> 428
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 428
aguguaguac aagagauaga aagaccaguc 30
<210> 429
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 429
cugaaagaca agucugaaug cuccacuuuu 30
<210> 430
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 430
uaagcugcug aaaguugugu augaguaguc 30
<210> 431
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 431
aaaaagugga gcauucagac uugucuuuca 30
<210> 432
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 432
cauccauccg acauugaagu ugacuuacug 30
<210> 433
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 433
acuuacugaa gaauggagag agaauugaaa 30
<210> 434
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 434
auauugccag gguauuucac uuggggcuaa 30
<210> 435
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 435
gaguaccuga ggaauaucgg gaaaagacac 30
<210> 436
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 436
ggaguaccug aggaauaucg ggaaaagaca 30
<210> 437
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 437
ucugcuggau gacgugagua aaccugaauc 30
<210> 438
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 438
ccauucucug cuggaugacg ugaguaaacc 30
<210> 439
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 439
acuuuccauu cucugcugga ugacgugagu 30
<210> 440
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 440
gacuuuccau ucucugcugg augacgugag 30
<210> 441
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 441
aggaaauuug acuuuccauu cucugcugga 30
<210> 442
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 442
aaugucggau ggaugaaacc cagacacaua 30
<210> 443
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 443
aguaagucaa cuucaauguc ggauggauga 30
<210> 444
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 444
uucaguaagu caacuucaau gucggaugga 30
<210> 445
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 445
ucucuccauu cuucaguaag ucaacuucaa 30
<210> 446
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 446
aauucucucu ccauucuuca guaagucaac 30
<210> 447
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 447
cugaagaaug gagagagaau ugaaaaagug 30
<210> 448
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 448
caauucucuc uccauucuuc aguaagucaa 30
<210> 449
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 449
ucccgauauu ccucagguac uccaaagauu 30
<210> 450
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 450
cccgauauuc cucagguacu ccaaagauuc 30
<210> 451
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 451
ccgauauucc ucagguacuc caaagauuca 30
<210> 452
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 452
cucagguacu ccaaagauuc agguuuacuc 30
<210> 453
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 453
agguuuacuc acgucaucca gcagagaaug 30
<210> 454
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 454
acucacguca uccagcagag aauggaaagu 30
<210> 455
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 455
cucacgucau ccagcagaga auggaaaguc 30
<210> 456
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 456
ccugaauugc uaugugucug gguuucaucc 30
<210> 457
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 457
cugaauugcu augugucugg guuucaucca 30
<210> 458
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 458
cuaugugucu ggguuucauc cauccgacau 30
<210> 459
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 459
uucaauucuc ucuccauucu ucaguaaguc 30
<210> 460
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 460
auccauccga cauugaaguu gacuuacuga 30
<210> 461
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 461
aaguugacuu acugaagaau ggagagagaa 30
<210> 462
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 462
augugucuuu ucccgauauu ccucagguac 30
<210> 463
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 463
ucaauucucu cuccauucuu caguaaguca 30
<210> 464
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 464
augucuuccu uuuuuuucuc cacugucuuu 30
<210> 465
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 465
ccuccaugau gcugcuuaca ugucucgauc 30
<210> 466
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 466
caugucucga ucuaugaaaa agacagugga 30
<210> 467
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 467
cuuuuuuuuc uccacugucu uuuucauaga 30
<210> 468
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 468
uuuuucucca cugucuuuuu cauagaucga 30
<210> 469
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 469
uuuucuccac ugucuuuuuc auagaucgag 30
<210> 470
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 470
uuucuccacu gucuuuuuca uagaucgaga 30
<210> 471
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 471
ucuccacugu cuuuuucaua gaucgagaca 30
<210> 472
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 472
cuccacuguc uuuuucauag aucgagacau 30
<210> 473
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 473
uccacugucu uuuucauaga ucgagacaug 30
<210> 474
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 474
uucauagauc gagacaugua agcagcauca 30
<210> 475
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 475
ucauagaucg agacauguaa gcagcaucau 30
<210> 476
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 476
cauagaucga gacauguaag cagcaucaug 30
<210> 477
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 477
uucuccacug ucuuuuucau agaucgagac 30
<210> 478
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 478
uugaccuuga gaaaauguuu uuguuucacu 30
<210> 479
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 479
auagaucgag acauguaagc agcaucaugg 30
<210> 480
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 480
cucaagguca aaaacuuacc uccaugaugc 30
<210> 481
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 481
ucucaagguc aaaaacuuac cuccaugaug 30
<210> 482
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 482
ucaaggucaa aaacuuaccu ccaugaugcu 30
<210> 483
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 483
uuguuucacu guccugagga cuauuuauag 30
<210> 484
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 484
uguuucacug uccugaggac uauuuauaga 30
<210> 485
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 485
agaaaauguu uuuguuucac uguccugagg 30
<210> 486
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 486
accuugagaa aauguuuuug uuucacuguc 30
<210> 487
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 487
gaccuugaga aaauguuuuu guuucacugu 30
<210> 488
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 488
ugaccuugag aaaauguuuu uguuucacug 30
<210> 489
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 489
uauuagguau uacaaguaau cuagaaauga 30
<210> 490
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 490
acauuguauu agguauuaca aguaaucuag 30
<210> 491
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 491
cauagcauuu acauuguauu agguauuaca 30
<210> 492
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 492
gcauagcauu uacauuguau uagguauuac 30
<210> 493
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 493
cauuguauua gguauuacaa guaaucuaga 30
<210> 494
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 494
aacaauaaca acuauuugca uagcauuuac 30
<210> 495
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 495
cuugucauua uuccuuaaac aauaacaacu 30
<210> 496
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 496
uuccuuaaac aauaacaacu auuugcauag 30
<210> 497
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 497
ucauuauucc uuaaacaaua acaacuauuu 30
<210> 498
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 498
uugucauuau uccuuaaaca auaacaacua 30
<210> 499
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 499
ucuugucauu auuccuuaaa caauaacaac 30
<210> 500
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 500
gguauuacaa guaaucuaga aaugauuuaa 30
<210> 501
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 501
uucuugucau uauuccuuaa acaauaacaa 30
<210> 502
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 502
cuuaaacaau aacaacuauu ugcauagcau 30
<210> 503
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 503
caaguaaucu agaaaugauu uaaaguauac 30
<210> 504
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 504
cuugcuaaaa uauuaaaucc uucagauacu 30
<210> 505
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 505
aaguauacag gaggaugugg auagguuaua 30
<210> 506
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 506
gcucccucuu agagucugca uacuccucau 30
<210> 507
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 507
ugcucccucu uagagucugc auacuccuca 30
<210> 508
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 508
agauacuuuu gcucccucuu agagucugca 30
<210> 509
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 509
aauccuucag auacuuuugc ucccucuuag 30
<210> 510
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 510
cuaaaauauu aaauccuuca gauacuuuug 30
<210> 511
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 511
uuucuuguca uuauuccuua aacaauaaca 30
<210> 512
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 512
aaaguauaca ggaggaugug gauagguuau 30
<210> 513
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 513
uauaucuauu ccuugcuaaa auauuaaauc 30
<210> 514
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 514
gguguccaag aagggguccu gaaaccaauc 30
<210> 515
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 515
aauauccaua gauuuggugu ccaagaaggg 30
<210> 516
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 516
uagaagggac uuaaauaucc auagauuugg 30
<210> 517
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 517
auagaaggga cuuaaauauc cauagauuug 30
<210> 518
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 518
uauagaaggg acuuaaauau ccauagauuu 30
<210> 519
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 519
uaugcaaaua cuauaccauu uuauagaagg 30
<210> 520
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 520
guguccaaga agggguccug aaaccaaucc 30
<210> 521
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 521
uuuucuuguc auuauuccuu aaacaauaac 30
<210> 522
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 522
aaaucuguua uuugucauuc aaaguacagc 30
<210> 523
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 523
cugagcaugu acagacuuuu uuuucuuguc 30
<210> 524
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 524
cugaauccac agauguggag ccccuggaua 30
<210> 525
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 525
gcugaaucca cagaugugga gccccuggau 30
<210> 526
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 526
auccaugguu ugcugaaucc acagaugugg 30
<210> 527
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 527
gauccauggu uugcugaauc cacagaugug 30
<210> 528
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 528
ugauccaugg uuugcugaau ccacagaugu 30
<210> 529
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 529
uugauccaug guuugcugaa uccacagaug 30
<210> 530
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 530
gaaugacaaa uaacagauuu aaaauuuuca 30
<210> 531
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 531
cccaguguuu uugauccaug guuugcugaa 30
<210> 532
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 532
uccccagugu uuuugaucca ugguuugcug 30
<210> 533
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 533
uuccccagug uuuuugaucc augguuugcu 30
<210> 534
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 534
uuuccccagu guuuuugauc caugguuugc 30
<210> 535
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 535
uuuuccccag uguuuuugau ccaugguuug 30
<210> 536
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 536
aggaauaaug acaagaaaaa aaagucugua 30
<210> 537
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 537
cucccucuua gagucugcau acuccucaug 30
<210> 538
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 538
ccccaguguu uuugauccau gguuugcuga 30
<210> 539
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 539
uuuuucuugu cauuauuccu uaaacaauaa 30
<210> 540
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 540
aaugacaaau aacagauuua aaauuuucaa 30
<210> 541
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 541
aaauuuucaa ggcauaguuu uauaccuga 29
<210> 542
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 542
acugagcaug uacagacuuu uuuuucuugu 30
<210> 543
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 543
ugucuuuacu gagcauguac agacuuuuuu 30
<210> 544
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 544
agcaaaccau ggaucaaaaa cacuggggaa 30
<210> 545
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 545
cguauccagg ggcuccacau cuguggauuc 30
<210> 546
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 546
aaaguacagc gggccuuccg uauccagggg 30
<210> 547
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 547
ucauucaaag uacagcgggc cuuccguauc 30
<210> 548
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 548
aaaauuuuca aggcauaguu uuauaccuga 30
<210> 549
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 549
gucauucaaa guacagcggg ccuuccguau 30
<210> 550
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 550
aaucuguuau uugucauuca aaguacagcg 30
<210> 551
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 551
uaaaucuguu auuugucauu caaaguacag 30
<210> 552
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 552
aaaauuuuaa aucuguuauu ugucauucaa 30
<210> 553
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 553
aaggcauagu uuuauaccug a 21
<210> 554
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 554
caaggcauag uuuuauaccu ga 22
<210> 555
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 555
ucaaggcaua guuuuauacc uga 23
<210> 556
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 556
uuugucauuc aaaguacagc gggccuuccg 30
<210> 557
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 557
gagucugcau acuccucaug accuggcccg 30
<210> 558
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 558
acuaucuuaa caagcuuuga gugcaagaga 30
<210> 559
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 559
acuucuuuga gcaucagauu ccuaaucugg 30
<210> 560
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 560
uauuucuaaa uuuuccccca aauucuaagc 30
<210> 561
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 561
cuaaauuuuc ccccaaauuc uaagcagagu 30
<210> 562
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 562
uaaauuuucc cccaaauucu aagcagagua 30
<210> 563
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 563
ucccccaaau ucuaagcaga guauguaaau 30
<210> 564
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 564
cccccaaauu cuaagcagag uauguaaauu 30
<210> 565
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 565
ccccaaauuc uaagcagagu auguaaauug 30
<210> 566
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 566
uaagcagagu auguaaauug gaaguuaacu 30
<210> 567
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 567
gaaguuaacu uaugcacgcu uaacuaucuu 30
<210> 568
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 568
acuuaugcac gcuuaacuau cuuaacaagc 30
<210> 569
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 569
ugcacgcuua acuaucuuaa caagcuuuga 30
<210> 570
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 570
aaggaauaau gacaagaaaa aaaagucugu 30
<210> 571
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 571
acaagcuuug agugcaagag auugaagagu 30
<210> 572
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 572
gagugcaaga gauugaagag uucaaaucug 30
<210> 573
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 573
agugcaagag auugaagagu ucaaaucuga 30
<210> 574
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 574
aagaguucaa aucugaccaa gauguugaug 30
<210> 575
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 575
aaaucugacc aagauguuga uguuggauaa 30
<210> 576
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 576
auguuggaua agagaauucu cugcucccca 30
<210> 577
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 577
auccaaucca aaugcggcau cuucaaaccu 30
<210> 578
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 578
gaauucaucc aauccaaaug cggcaucuuc 30
<210> 579
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 579
ggaauucauc caauccaaau gcggcaucuu 30
<210> 580
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 580
aaaagcaagc aagcagaauu uggaauucau 30
<210> 581
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 581
ugcauaaagu guaaguguau aagcauauca 30
<210> 582
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 582
gugcauaaag uguaagugua uaagcauauc 30
<210> 583
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 583
caauaauccu gucaauuaua uuucuaaauu 30
<210> 584
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 584
ugugcauaaa guguaagugu auaagcauau 30
<210> 585
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 585
uuauaacccu acauuuugug cauaaagugu 30
<210> 586
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 586
acauuauuau aacccuacau uuugugcaua 30
<210> 587
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 587
uaaagaagau cauguccaug uuaacauuau 30
<210> 588
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 588
ccagcccucc uagagcuacc uguggagcaa 30
<210> 589
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 589
ucugcucccc accucuaagu ugccagcccu 30
<210> 590
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 590
gauaagagaa uucucugcuc cccaccucua 30
<210> 591
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 591
uaacccuaca uuuugugcau aaaguguaag 30
<210> 592
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 592
ccaauaaucc ugucaauuau auuucuaaau 30
<210> 593
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 593
uaacaaauuu ccaauaaucc ugucaauuau 30
<210> 594
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 594
auuauaacaa auuuccaaua auccugucaa 30
<210> 595
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 595
cccuguuuga aaauaaaggg guaauagugg 30
<210> 596
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 596
aagacuguuu cccuguuuga aaauaaaggg 30
<210> 597
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 597
ccaaguggaa cuugaagacu guuucccugu 30
<210> 598
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 598
accaagugga acuugaagac uguuucccug 30
<210> 599
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 599
uaccaagugg aacuugaaga cuguuucccu 30
<210> 600
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 600
uuaccaagug gaacuugaag acuguuuccc 30
<210> 601
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 601
ccuguuugaa aauaaagggg uaauaguggg 30
<210> 602
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 602
uuuaccaagu ggaacuugaa gacuguuucc 30
<210> 603
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 603
cacugugagc caaacucuau auacaagggg 30
<210> 604
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 604
acacugugag ccaaacucua uauacaaggg 30
<210> 605
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 605
cuaaucugga aaaugugaau cacugaggcc 30
<210> 606
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 606
agcaucagau uccuaaucug gaaaauguga 30
<210> 607
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 607
gagcaucaga uuccuaaucu ggaaaaugug 30
<210> 608
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 608
uuugagcauc agauuccuaa ucuggaaaau 30
<210> 609
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 609
acauuuuuua ccaaguggaa cuugaagacu 30
<210> 610
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 610
aacuucuuug agcaucagau uccuaaucug 30
<210> 611
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 611
gaaaauaaag ggguaauagu gggagugaga 30
<210> 612
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 612
uaugauuuau uuaacuugug gaacaaaaau 30
<210> 613
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 613
auucauuaua acaaauuucc aauaauccug 30
<210> 614
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 614
cauucauuau aacaaauuuc caauaauccu 30
<210> 615
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 615
uaugacaaaa uguuucauuc auuauaacaa 30
<210> 616
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 616
ucaaauguau aagaaguaaa uaugaaucuu 30
<210> 617
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 617
aucaaaugua uaagaaguaa auaugaaucu 30
<210> 618
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 618
cuuuaucaaa uguauaagaa guaaauauga 30
<210> 619
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 619
aaaauaaagg gguaauagug ggagugagau 30
<210> 620
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 620
accacaacca ugccuuacuu uaucaaaugu 30
<210> 621
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 621
acuuguggaa caaaaauaaa ccagauuaac 30
<210> 622
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 622
aacuugugga acaaaaauaa accagauuaa 30
<210> 623
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 623
uuuaacuugu ggaacaaaaa uaaaccagau 30
<210> 624
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 624
auuuaacuug uggaacaaaa auaaaccaga 30
<210> 625
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 625
ugauuuauuu aacuugugga acaaaaauaa 30
<210> 626
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 626
augauuuauu uaacuugugg aacaaaaaua 30
<210> 627
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 627
uggaacaaaa auaaaccaga uuaaccacaa 30
<210> 628
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 628
uuuaaggaau aaugacaaga aaaaaaaguc 30
<210> 629
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 629
auuuucaaac agggaaacag ucuucaaguu 30
<210> 630
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 630
uuauuguuua aggaauaaug acaagaaaaa 30
<210> 631
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 631
gagugcuguc uccauguuug auguaucuga 30
<210> 632
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 632
agugcugucu ccauguuuga uguaucugag 30
<210> 633
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 633
gauguaucug agcagguugc uccacaggua 30
<210> 634
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 634
auguaucuga gcagguugcu ccacagguag 30
<210> 635
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 635
cuccacaggu agcucuagga gggcuggcaa 30
<210> 636
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 636
gaggugggga gcagagaauu cucuuaucca 30
<210> 637
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 637
ucuuauccaa caucaacauc uuggucagau 30
<210> 638
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 638
uccaacauca acaucuuggu cagauuugaa 30
<210> 639
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 639
gucagauuug aacucuucaa ucucuugcac 30
<210> 640
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 640
gaacucuuca aucucuugca cucaaagcuu 30
<210> 641
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 641
aacucuucaa ucucuugcac ucaaagcuug 30
<210> 642
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 642
aaucucuugc acucaaagcu uguuaagaua 30
<210> 643
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 643
cacucaaagc uuguuaagau aguuaagcgu 30
<210> 644
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 644
uuaagauagu uaagcgugca uaaguuaacu 30
<210> 645
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 645
agauaguuaa gcgugcauaa guuaacuucc 30
<210> 646
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 646
agcgugcaua aguuaacuuc caauuuacau 30
<210> 647
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 647
acuuccaauu uacauacucu gcuuagaauu 30
<210> 648
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 648
uaaugaauga aacauuuugu cauauaagau 30
<210> 649
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 649
uuauaaugaa ugaaacauuu ugucauauaa 30
<210> 650
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 650
guuauaauga augaaacauu uugucauaua 30
<210> 651
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 651
gaaauuuguu auaaugaaug aaacauuuug 30
<210> 652
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 652
uuggaaauuu guuauaauga augaaacauu 30
<210> 653
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 653
acaggauuau uggaaauuug uuauaaugaa 30
<210> 654
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 654
uacuuugagu gcugucucca uguuugaugu 30
<210> 655
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 655
gaaauauaau ugacaggauu auuggaaauu 30
<210> 656
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 656
ggggaaaauu uagaaauaua auugacagga 30
<210> 657
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 657
gggggaaaau uuagaaauau aauugacagg 30
<210> 658
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 658
gaauuugggg gaaaauuuag aaauauaauu 30
<210> 659
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 659
cauacucugc uuagaauuug ggggaaaauu 30
<210> 660
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 660
acauacucug cuuagaauuu gggggaaaau 30
<210> 661
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 661
caauuuacau acucugcuua gaauuugggg 30
<210> 662
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 662
agaaauauaa uugacaggau uauuggaaau 30
<210> 663
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 663
uaauucuacu uugagugcug ucuccauguu 30
<210> 664
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 664
auaauucuac uuugagugcu gucuccaugu 30
<210> 665
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 665
uuuauaauuc uacuuugagu gcugucucca 30
<210> 666
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 666
aagaugccgc auuuggauug gaugaauucc 30
<210> 667
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 667
gaagaugccg cauuuggauu ggaugaauuc 30
<210> 668
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 668
agguuugaag augccgcauu uggauuggau 30
<210> 669
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 669
cagguuugaa gaugccgcau uuggauugga 30
<210> 670
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 670
ucagguuuga agaugccgca uuuggauugg 30
<210> 671
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 671
uuuucagguu ugaagaugcc gcauuuggau 30
<210> 672
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 672
ggauuggaug aauuccaaau ucugcuugcu 30
<210> 673
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 673
cuuuucaggu uugaagaugc cgcauuugga 30
<210> 674
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 674
uuuucuuuuc agguuugaag augccgcauu 30
<210> 675
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 675
cuuuucuuuu cagguuugaa gaugccgcau 30
<210> 676
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 676
ucuuuucuuu ucagguuuga agaugccgca 30
<210> 677
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 677
uucuuuucuu uucagguuug aagaugccgc 30
<210> 678
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 678
cuaaccuuuu ucuuuucuuu ucagguuuga 30
<210> 679
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 679
auugcuaacc uuuuucuuuu cuuuucaggu 30
<210> 680
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 680
ucuuuucagg uuugaagaug ccgcauuugg 30
<210> 681
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 681
ugucauauaa gauucauauu uacuucuuau 30
<210> 682
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 682
gauuggauga auuccaaauu cugcuugcuu 30
<210> 683
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 683
caaauucugc uugcuugcuu uuuaauauug 30
<210> 684
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 684
acauggacau gaucuucuuu auaauucuac 30
<210> 685
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 685
uaauaauguu aacauggaca ugaucuucuu 30
<210> 686
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 686
ugcacaaaau guaggguuau aauaauguua 30
<210> 687
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 687
augcacaaaa uguaggguua uaauaauguu 30
<210> 688
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 688
cacuuuaugc acaaaaugua ggguuauaau 30
<210> 689
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 689
uacacuuaca cuuuaugcac aaaauguagg 30
<210> 690
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 690
gaugaauucc aaauucugcu ugcuugcuuu 30
<210> 691
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 691
auaugcuuau acacuuacac uuuaugcaca 30
<210> 692
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 692
aauauugaua ugcuuauaca cuuacacuuu 30
<210> 693
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 693
uaauauugau augcuuauac acuuacacuu 30
<210> 694
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 694
uuaauauuga uaugcuuaua cacuuacacu 30
<210> 695
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 695
cuuuuuaaua uugauaugcu uauacacuua 30
<210> 696
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 696
cuugcuuuuu aauauugaua ugcuuauaca 30
<210> 697
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 697
ugcuugcuug cuuuuuaaua uugauaugcu 30
<210> 698
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 698
auauugauau gcuuauacac uuacacuuua 30
<210> 699
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 699
uuguuuaagg aauaaugaca agaaaaaaaa 30
<210> 700
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 700
gucauauaag auucauauuu acuucuuaua 30
<210> 701
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 701
auauuuacuu cuuauacauu ugauaaagua 30
<210> 702
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 702
aauggcauag uuggggugac acagcugucu 30
<210> 703
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 703
gggugacaca gcugucuagu gggaggccag 30
<210> 704
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 704
uauauuuuag ccagcguucu uuccugcggg 30
<210> 705
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 705
uagccagcgu ucuuuccugc gggccagguc 30
<210> 706
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 706
agccagcguu cuuuccugcg ggccagguca 30
<210> 707
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 707
gccagcguuc uuuccugcgg gccaggucau 30
<210> 708
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 708
uuuccugcgg gccaggucau gaggaguaug 30
<210> 709
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 709
ccugcgggcc aggucaugag gaguaugcag 30
<210> 710
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 710
cugcgggcca ggucaugagg aguaugcaga 30
<210> 711
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 711
aauauuuuag caaggaauag auauacaauc 30
<210> 712
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 712
auauuuuagc aaggaauaga uauacaauca 30
<210> 713
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 713
uagcaaggaa uagauauaca aucaucccuu 30
<210> 714
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 714
agcaaggaau agauauacaa ucaucccuug 30
<210> 715
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 715
gcaaggaaua gauauacaau caucccuugg 30
<210> 716
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 716
gucucccugg gggauugguu ucaggacccc 30
<210> 717
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 717
guuucaggac cccuucuugg acaccaaauc 30
<210> 718
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 718
caggaccccu ucuuggacac caaaucuaug 30
<210> 719
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 719
uaauaccuaa uacaauguaa augcuaugca 30
<210> 720
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 720
cuuguaauac cuaauacaau guaaaugcua 30
<210> 721
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 721
uagauuacuu guaauaccua auacaaugua 30
<210> 722
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 722
cuagauuacu uguaauaccu aauacaaugu 30
<210> 723
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 723
aaucauuucu agauuacuug uaauaccuaa 30
<210> 724
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 724
aaaucauuuc uagauuacuu guaauaccua 30
<210> 725
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 725
ggaaucugau gcucaaagaa guuaaauggc 30
<210> 726
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 726
cauauaaccu auccacaucc uccuguauac 30
<210> 727
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 727
uauaaaaugg uauaguauuu gcauauaacc 30
<210> 728
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 728
agucccuucu auaaaauggu auaguauuug 30
<210> 729
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 729
aagucccuuc uauaaaaugg uauaguauuu 30
<210> 730
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 730
gacaccaaau cuauggauau uuaagucccu 30
<210> 731
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 731
uuggacacca aaucuaugga uauuuaaguc 30
<210> 732
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 732
aggaccccuu cuuggacacc aaaucuaugg 30
<210> 733
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 733
gcauauaacc uauccacauc cuccuguaua 30
<210> 734
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 734
cagauuagga aucugaugcu caaagaaguu 30
<210> 735
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 735
ccagauuagg aaucugaugc ucaaagaagu 30
<210> 736
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 736
uccagauuag gaaucugaug cucaaagaag 30
<210> 737
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 737
uuccacaagu uaaauaaauc auaaaacuug 30
<210> 738
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 738
guuccacaag uuaaauaaau cauaaaacuu 30
<210> 739
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 739
uguuccacaa guuaaauaaa ucauaaaacu 30
<210> 740
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 740
uuguuccaca aguuaaauaa aucauaaaac 30
<210> 741
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 741
uuuuuguucc acaaguuaaa uaaaucauaa 30
<210> 742
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 742
auuuuuguuc cacaaguuaa auaaaucaua 30
<210> 743
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 743
cacaaguuaa auaaaucaua aaacuugaug 30
<210> 744
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 744
aucugguuua uuuuuguucc acaaguuaaa 30
<210> 745
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 745
auaaaguaag gcaugguugu gguuaaucug 30
<210> 746
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 746
gauaaaguaa ggcaugguug ugguuaaucu 30
<210> 747
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 747
uacauuugau aaaguaaggc augguugugg 30
<210> 748
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 748
uuauacauuu gauaaaguaa ggcaugguug 30
<210> 749
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 749
cuucuuauac auuugauaaa guaaggcaug 30
<210> 750
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 750
acuucuuaua cauuugauaa aguaaggcau 30
<210> 751
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 751
ugguuaaucu gguuuauuuu uguuccacaa 30
<210> 752
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 752
ucauauaaga uucauauuua cuucuuauac 30
<210> 753
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 753
aauaaaucau aaaacuugau guguuaucuc 30
<210> 754
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 754
ucucuuauau cucacuccca cuauuacccc 30
<210> 755
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 755
acauuuucca gauuaggaau cugaugcuca 30
<210> 756
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 756
gcucacagug uaaagggccu cagugauuca 30
<210> 757
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 757
ggcucacagu guaaagggcc ucagugauuc 30
<210> 758
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 758
uauauagagu uuggcucaca guguaaaggg 30
<210> 759
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 759
guaaaaaaug ugaaccccuu guauauagag 30
<210> 760
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 760
cacuugguaa aaaaugugaa ccccuuguau 30
<210> 761
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 761
auguguuauc ucuuauaucu cacucccacu 30
<210> 762
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 762
aaguuccacu ugguaaaaaa ugugaacccc 30
<210> 763
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 763
caaacaggga aacagucuuc aaguuccacu 30
<210> 764
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 764
ucaaacaggg aaacagucuu caaguuccac 30
<210> 765
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 765
uuuucaaaca gggaaacagu cuucaaguuc 30
<210> 766
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 766
aaaccugaaa agaaaagaaa aagguuagca 30
<210> 767
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 767
ccccuuuauu uucaaacagg gaaacagucu 30
<210> 768
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 768
uaucucacuc ccacuauuac cccuuuauuu 30
<210> 769
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 769
aaacagggaa acagucuuca aguuccacuu 30
<210> 770
<211> 30
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 770
gcaaugaauu uauuuuauuu ggauugcaga 30
<210> 771
<211> 3162
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 771
atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60
ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120
caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180
cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240
agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300
ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360
tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420
gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480
agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540
agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600
ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660
accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720
gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780
attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840
gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900
accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960
ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020
gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080
aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140
attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200
ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260
aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320
aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380
cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440
cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500
gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560
ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620
accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680
atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740
gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800
aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860
aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920
aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980
gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040
aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100
ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160
aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220
tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280
aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340
agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400
ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460
acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520
aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580
aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640
tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700
tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760
ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820
agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880
agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940
gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000
accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060
gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120
gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162
<210> 772
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 772
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 773
<211> 7692
<212> DNA
<213> 智人
<400> 773
acttagcatc tctggggcca gtctgcaaag cgagggggca gccttaatgt gcctccagcc 60
tgaagtccta gaatgagcgc ccggtgtccc aagctggggc gcgcacccca gatcggaggg 120
cgccgatgta cagacagcaa actcacccag tctagtgcat gccttcttaa acatcacgag 180
actctaagaa aaggaaactg aaaacgggaa agtccctctc tctaacctgg cactgcgtcg 240
ctggcttgga gacaggtgac ggtccctgcg ggccttgtcc tgattggctg ggcacgcgtt 300
taatataagt ggaggcgtcg cgctggcggg cattcctgaa gctgacagca ttcgggccga 360
gatgtctcgc tccgtggcct tagctgtgct cgcgctactc tctctttctg gcctggaggc 420
tatccagcgt gagtctctcc taccctcccg ctctggtcct tcctctcccg ctctgcaccc 480
tctgtggccc tcgctgtgct ctctcgctcc gtgacttccc ttctccaagt tctccttggt 540
ggcccgccgt ggggctagtc cagggctgga tctcggggaa gcggcggggt ggcctgggag 600
tggggaaggg ggtgcgcacc cgggacgcgc gctacttgcc cctttcggcg gggagcaggg 660
gagacctttg gcctacggcg acgggagggt cgggacaaag tttagggcgt cgataagcgt 720
cagagcgccg aggttggggg agggtttctc ttccgctctt tcgcggggcc tctggctccc 780
ccagcgcagc tggagtgggg gacgggtagg ctcgtcccaa aggcgcggcg ctgaggtttg 840
tgaacgcgtg gaggggcgct tggggtctgg gggaggcgtc gcccgggtaa gcctgtctgc 900
tgcggctctg cttcccttag actggagagc tgtggacttc gtctaggcgc ccgctaagtt 960
cgcatgtcct agcacctctg ggtctatgtg gggccacacc gtggggagga aacagcacgc 1020
gacgtttgta gaatgcttgg ctgtgataca aagcggtttc gaataattaa cttatttgtt 1080
cccatcacat gtcactttta aaaaattata agaactaccc gttattgaca tctttctgtg 1140
tgccaaggac tttatgtgct ttgcgtcatt taattttgaa aacagttatc ttccgccata 1200
gataactact atggttatct tctgcctctc acagatgaag aaactaaggc accgagattt 1260
taagaaactt aattacacag gggataaatg gcagcaatcg agattgaagt caagcctaac 1320
cagggctttt gcgggagcgc atgccttttg gctgtaattc gtgcattttt ttttaagaaa 1380
aacgcctgcc ttctgcgtga gattctccag agcaaactgg gcggcatggg ccctgtggtc 1440
ttttcgtaca gagggcttcc tctttggctc tttgcctggt tgtttccaag atgtactgtg 1500
cctcttactt tcggttttga aaacatgagg gggttgggcg tggtagctta cgcctgtaat 1560
cccagcactt agggaggccg aggcgggagg atggcttgag gtccgtagtt gagaccagcc 1620
tggccaacat ggtgaagcct ggtctctaca aaaaataata acaaaaatta gccgggtgtg 1680
gtggctcgtg cctgtggtcc cagctgctcc ggtggctgag gcgggaggat ctcttgagct 1740
taggcttttg agctatcatg gcgccagtgc actccagcgt gggcaacaga gcgagaccct 1800
gtctctcaaa aaagaaaaaa aaaaaaaaag aaagagaaaa gaaaagaaag aaagaagtga 1860
aggtttgtca gtcaggggag ctgtaaaacc attaataaag ataatccaag atggttacca 1920
agactgttga ggacgccaga gatcttgagc actttctaag tacctggcaa tacactaagc 1980
gcgctcacct tttcctctgg caaaacatga tcgaaagcag aatgttttga tcatgagaaa 2040
attgcattta atttgaatac aatttattta caacataaag gataatgtat atatcaccac 2100
cattactggt atttgctggt tatgttagat gtcattttaa aaaataacaa tctgatattt 2160
aaaaaaaaat cttattttga aaatttccaa agtaatacat gccatgcata gaccatttct 2220
ggaagatacc acaagaaaca tgtaatgatg attgcctctg aaggtctatt ttcctcctct 2280
gacctgtgtg tgggttttgt ttttgtttta ctgtgggcat aaattaattt ttcagttaag 2340
ttttggaagc ttaaataact ctccaaaagt cataaagcca gtaactggtt gagcccaaat 2400
tcaaacccag cctgtctgat acttgtcctc ttcttagaaa agattacagt gatgctctca 2460
caaaatcttg ccgccttccc tcaaacagag agttccaggc aggatgaatc tgtgctctga 2520
tccctgaggc atttaatatg ttcttattat tagaagctca gatgcaaaga gctctcttag 2580
cttttaatgt tatgaaaaaa atcaggtctt cattagattc cccaatccac ctcttgatgg 2640
ggctagtagc ctttccttaa tgatagggtg tttctagaga gatatatctg gtcaaggtgg 2700
cctggtactc ctccttctcc ccacagcctc ccagacaagg aggagtagct gccttttagt 2760
gatcatgtac cctgaatata agtgtattta aaagaatttt atacacatat atttagtgtc 2820
aatctgtata tttagtagca ctaacacttc tcttcatttt caatgaaaaa tatagagttt 2880
ataatatttt cttcccactt ccccatggat ggtctagtca tgcctctcat tttggaaagt 2940
actgtttctg aaacattagg caatatattc ccaacctggc tagtttacag caatcacctg 3000
tggatgctaa ttaaaacgca aatcccactg tcacatgcat tactccattt gatcataatg 3060
gaaagtatgt tctgtcccat ttgccatagt cctcacctat ccctgttgta ttttatcggg 3120
tccaactcaa ccatttaagg tatttgccag ctcttgtatg catttaggtt ttgtttcttt 3180
gttttttagc tcatgaaatt aggtacaaag tcagagaggg gtctggcata taaaacctca 3240
gcagaaataa agaggttttg ttgtttggta agaacatacc ttgggttggt tgggcacggt 3300
ggctcgtgcc tgtaatccca acactttggg aggccaaggc aggctgatca cttgaagttg 3360
ggagttcaag accagcctgg ccaacatggt gaaatcccgt ctctactgaa aatacaaaaa 3420
ttaaccaggc atggtggtgt gtgcctgtag tcccaggaat cacttgaacc caggaggcgg 3480
aggttgcagt gagctgagat ctcaccactg cacactgcac tccagcctgg gcaatggaat 3540
gagattccat cccaaaaaat aaaaaaataa aaaaataaag aacatacctt gggttgatcc 3600
acttaggaac ctcagataat aacatctgcc acgtatagag caattgctat gtcccaggca 3660
ctctactaga cacttcatac agtttagaaa atcagatggg tgtagatcaa ggcaggagca 3720
ggaaccaaaa agaaaggcat aaacataaga aaaaaaatgg aaggggtgga aacagagtac 3780
aataacatga gtaatttgat gggggctatt atgaactgag aaatgaactt tgaaaagtat 3840
cttggggcca aatcatgtag actcttgagt gatgtgttaa ggaatgctat gagtgctgag 3900
agggcatcag aagtccttga gagcctccag agaaaggctc ttaaaaatgc agcgcaatct 3960
ccagtgacag aagatactgc tagaaatctg ctagaaaaaa aacaaaaaag gcatgtatag 4020
aggaattatg agggaaagat accaagtcac ggtttattct tcaaaatgga ggtggcttgt 4080
tgggaaggtg gaagctcatt tggccagagt ggaaatggaa ttgggagaaa tcgatgacca 4140
aatgtaaaca cttggtgcct gatatagctt gacaccaagt tagccccaag tgaaataccc 4200
tggcaatatt aatgtgtctt ttcccgatat tcctcaggta ctccaaagat tcaggtttac 4260
tcacgtcatc cagcagagaa tggaaagtca aatttcctga attgctatgt gtctgggttt 4320
catccatccg acattgaagt tgacttactg aagaatggag agagaattga aaaagtggag 4380
cattcagact tgtctttcag caaggactgg tctttctatc tcttgtacta cactgaattc 4440
acccccactg aaaaagatga gtatgcctgc cgtgtgaacc atgtgacttt gtcacagccc 4500
aagatagtta agtggggtaa gtcttacatt cttttgtaag ctgctgaaag ttgtgtatga 4560
gtagtcatat cataaagctg ctttgatata aaaaaggtct atggccatac taccctgaat 4620
gagtcccatc ccatctgata taaacaatct gcatattggg attgtcaggg aatgttctta 4680
aagatcagat tagtggcacc tgctgagata ctgatgcaca gcatggtttc tgaaccagta 4740
gtttccctgc agttgagcag ggagcagcag cagcacttgc acaaatacat atacactctt 4800
aacacttctt acctactggc ttcctctagc ttttgtggca gcttcaggta tatttagcac 4860
tgaacgaaca tctcaagaag gtataggcct ttgtttgtaa gtcctgctgt cctagcatcc 4920
tataatcctg gacttctcca gtactttctg gctggattgg tatctgaggc tagtaggaag 4980
ggcttgttcc tgctgggtag ctctaaacaa tgtattcatg ggtaggaaca gcagcctatt 5040
ctgccagcct tatttctaac cattttagac atttgttagt acatggtatt ttaaaagtaa 5100
aacttaatgt cttccttttt tttctccact gtctttttca tagatcgaga catgtaagca 5160
gcatcatgga ggtaagtttt tgaccttgag aaaatgtttt tgtttcactg tcctgaggac 5220
tatttataga cagctctaac atgataaccc tcactatgtg gagaacattg acagagtaac 5280
attttagcag ggaaagaaga atcctacagg gtcatgttcc cttctcctgt ggagtggcat 5340
gaagaaggtg tatggcccca ggtatggcca tattactgac cctctacaga gagggcaaag 5400
gaactgccag tatggtattg caggataaag gcaggtggtt acccacatta cctgcaaggc 5460
tttgatcttt cttctgccat ttccacattg gacatctctg ctgaggagag aaaatgaacc 5520
actcttttcc tttgtataat gttgttttat tcttcagaca gaagagagga gttatacagc 5580
tctgcagaca tcccattcct gtatggggac tgtgtttgcc tcttagaggt tcccaggcca 5640
ctagaggaga taaagggaaa cagattgtta taacttgata taatgatact ataatagatg 5700
taactacaag gagctccaga agcaagagag agggaggaac ttggacttct ctgcatcttt 5760
agttggagtc caaaggcttt tcaatgaaat tctactgccc agggtacatt gatgctgaaa 5820
ccccattcaa atctcctgtt atattctaga acagggaatt gatttgggag agcatcagga 5880
aggtggatga tctgcccagt cacactgtta gtaaattgta gagccaggac ctgaactcta 5940
atatagtcat gtgttactta atgacgggga catgttctga gaaatgctta cacaaaccta 6000
ggtgttgtag cctactacac gcataggcta catggtatag cctattgctc ctagactaca 6060
aacctgtaca gcctgttact gtactgaata ctgtgggcag ttgtaacaca atggtaagta 6120
tttgtgtatc taaacataga agttgcagta aaaatatgct attttaatct tatgagacca 6180
ctgtcatata tacagtccat cattgaccaa aacatcatat cagcattttt tcttctaaga 6240
ttttgggagc accaaaggga tacactaaca ggatatactc tttataatgg gtttggagaa 6300
ctgtctgcag ctacttcttt taaaaaggtg atctacacag tagaaattag acaagtttgg 6360
taatgagatc tgcaatccaa ataaaataaa ttcattgcta acctttttct tttcttttca 6420
ggtttgaaga tgccgcattt ggattggatg aattccaaat tctgcttgct tgctttttaa 6480
tattgatatg cttatacact tacactttat gcacaaaatg tagggttata ataatgttaa 6540
catggacatg atcttcttta taattctact ttgagtgctg tctccatgtt tgatgtatct 6600
gagcaggttg ctccacaggt agctctagga gggctggcaa cttagaggtg gggagcagag 6660
aattctctta tccaacatca acatcttggt cagatttgaa ctcttcaatc tcttgcactc 6720
aaagcttgtt aagatagtta agcgtgcata agttaacttc caatttacat actctgctta 6780
gaatttgggg gaaaatttag aaatataatt gacaggatta ttggaaattt gttataatga 6840
atgaaacatt ttgtcatata agattcatat ttacttctta tacatttgat aaagtaaggc 6900
atggttgtgg ttaatctggt ttatttttgt tccacaagtt aaataaatca taaaacttga 6960
tgtgttatct cttatatctc actcccacta ttaccccttt attttcaaac agggaaacag 7020
tcttcaagtt ccacttggta aaaaatgtga accccttgta tatagagttt ggctcacagt 7080
gtaaagggcc tcagtgattc acattttcca gattaggaat ctgatgctca aagaagttaa 7140
atggcatagt tggggtgaca cagctgtcta gtgggaggcc agccttctat attttagcca 7200
gcgttctttc ctgcgggcca ggtcatgagg agtatgcaga ctctaagagg gagcaaaagt 7260
atctgaagga tttaatattt tagcaaggaa tagatataca atcatccctt ggtctccctg 7320
ggggattggt ttcaggaccc cttcttggac accaaatcta tggatattta agtcccttct 7380
ataaaatggt atagtatttg catataacct atccacatcc tcctgtatac tttaaatcat 7440
ttctagatta cttgtaatac ctaatacaat gtaaatgcta tgcaaatagt tgttattgtt 7500
taaggaataa tgacaagaaa aaaaagtctg tacatgctca gtaaagacac aaccatccct 7560
ttttttcccc agtgtttttg atccatggtt tgctgaatcc acagatgtgg agcccctgga 7620
tacggaaggc ccgctgtact ttgaatgaca aataacagat ttaaaatttt caaggcatag 7680
ttttatacct ga 7692
<210> 774
<211> 197
<212> DNA
<213> 智人
<400> 774
gattggctgg gcacgcgttt aatataagtg gaggcgtcgc gctggcgggc attcctgaag 60
ctgacagcat tcgggccgag atgtctcgct ccgtggcctt agctgtgctc gcgctactct 120
ctctttctgg cctggaggct atccagcgtg agtctctcct accctcccgc tctggtcctt 180
cctctcccgc tctgcac 197
<210> 775
<211> 379
<212> DNA
<213> 智人
<400> 775
aagtgaaata ccctggcaat attaatgtgt cttttcccga tattcctcag gtactccaaa 60
gattcaggtt tactcacgtc atccagcaga gaatggaaag tcaaatttcc tgaattgcta 120
tgtgtctggg tttcatccat ccgacattga agttgactta ctgaagaatg gagagagaat 180
tgaaaaagtg gagcattcag acttgtcttt cagcaaggac tggtctttct atctcttgta 240
ctacactgaa ttcaccccca ctgaaaaaga tgagtatgcc tgccgtgtga accatgtgac 300
tttgtcacag cccaagatag ttaagtgggg taagtcttac attcttttgt aagctgctga 360
aagttgtgta tgagtagtc 379
<210> 776
<211> 128
<212> DNA
<213> 智人
<400> 776
aaagtaaaac ttaatgtctt cctttttttt ctccactgtc tttttcatag atcgagacat 60
gtaagcagca tcatggaggt aagtttttga ccttgagaaa atgtttttgt ttcactgtcc 120
tgaggact 128
<210> 777
<211> 1321
<212> DNA
<213> 智人
<400> 777
gcaatccaaa taaaataaat tcattgctaa cctttttctt ttcttttcag gtttgaagat 60
gccgcatttg gattggatga attccaaatt ctgcttgctt gctttttaat attgatatgc 120
ttatacactt acactttatg cacaaaatgt agggttataa taatgttaac atggacatga 180
tcttctttat aattctactt tgagtgctgt ctccatgttt gatgtatctg agcaggttgc 240
tccacaggta gctctaggag ggctggcaac ttagaggtgg ggagcagaga attctcttat 300
ccaacatcaa catcttggtc agatttgaac tcttcaatct cttgcactca aagcttgtta 360
agatagttaa gcgtgcataa gttaacttcc aatttacata ctctgcttag aatttggggg 420
aaaatttaga aatataattg acaggattat tggaaatttg ttataatgaa tgaaacattt 480
tgtcatataa gattcatatt tacttcttat acatttgata aagtaaggca tggttgtggt 540
taatctggtt tatttttgtt ccacaagtta aataaatcat aaaacttgat gtgttatctc 600
ttatatctca ctcccactat taccccttta ttttcaaaca gggaaacagt cttcaagttc 660
cacttggtaa aaaatgtgaa ccccttgtat atagagtttg gctcacagtg taaagggcct 720
cagtgattca cattttccag attaggaatc tgatgctcaa agaagttaaa tggcatagtt 780
ggggtgacac agctgtctag tgggaggcca gccttctata ttttagccag cgttctttcc 840
tgcgggccag gtcatgagga gtatgcagac tctaagaggg agcaaaagta tctgaaggat 900
ttaatatttt agcaaggaat agatatacaa tcatcccttg gtctccctgg gggattggtt 960
tcaggacccc ttcttggaca ccaaatctat ggatatttaa gtcccttcta taaaatggta 1020
tagtatttgc atataaccta tccacatcct cctgtatact ttaaatcatt tctagattac 1080
ttgtaatacc taatacaatg taaatgctat gcaaatagtt gttattgttt aaggaataat 1140
gacaagaaaa aaaagtctgt acatgctcag taaagacaca accatccctt tttttcccca 1200
gtgtttttga tccatggttt gctgaatcca cagatgtgga gcccctggat acggaaggcc 1260
cgctgtactt tgaatgacaa ataacagatt taaaattttc aaggcatagt tttatacctg 1320
a 1321
<210> 778
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 778
agaaauccgu cuuucauuga cggaaugucg gauggaugaa acc 43
<210> 779
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 779
agaaauccgu cuuucauuga cggcuaucuc uuguacuaca cug 43
<210> 780
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 780
agaaauccgu cuuucauuga cggacacggc aggcauacuc auc 43
<210> 781
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 781
agaaauccgu cuuucauuga cgggucacag cccaagauag uua 43
<210> 782
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 782
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 783
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 783
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 784
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 784
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 785
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 785
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 786
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 786
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 787
<211> 3222
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 787
atggcttcca tctctaggcc atacggcacc aagctgcgac cggacgcacg gaagaaggag 60
atgctcgata agttctttaa tacactgact aagggtcagc gcgtgttcgc agacctggcc 120
ctgtgcatct atggctccct gaccctggag atggccaagt ctctggagcc agaaagtgat 180
tcagaactgg tgtgcgctat tgggtggttt cggctggtgg acaagaccat ctggtccaag 240
gatggcatca agcaggagaa tctggtgaaa cagtacgaag cctattccgg aaaggaggct 300
tctgaagtgg tcaaaacata cctgaacagc cccagctccg acaagtacgt gtggatcgat 360
tgcaggcaga aattcctgag gtttcagcgc gagctcggca ctcgcaacct gtccgaggac 420
ttcgaatgta tgctctttga acagtacatt agactgacca agggcgagat cgaagggtat 480
gccgctattt caaatatgtt cggaaacggc gagaaggaag accggagcaa gaaaagaatg 540
tacgctacac ggatgaaaga ttggctggag gcaaacgaaa atatcacttg ggagcagtat 600
agagaggccc tgaagaacca gctgaatgct aaaaacctgg agcaggttgt ggccaattac 660
aaggggaacg ctggcggggc agaccccttc tttaagtata gcttctccaa agagggaatg 720
gtgagcaaga aagaacatgc acagcagctc gacaagttca aaaccgtcct gaagaacaaa 780
gcccgggacc tgaattttcc aaacaaggag aagctgaagc agtacctgga ggccgaaatc 840
ggcattccgg tcgacgctaa cgtgtactcc cagatgttct ctaacggggt gagtgaggtc 900
cagcctaaga ccacacggaa tatgtctttt agtaacgaga aactggatct gctcactgaa 960
ctgaaggacc tgaacaaggg cgatgggttc gagtacgcca gagaagtgct gaacgggttc 1020
tttgactccg agctccacac taccgaggat aagtttaata tcacctctag gtacctggga 1080
ggcgacaaat caaaccgcct gagcaaactc tataagatct ggaagaaaga gggtgtggac 1140
tgcgaggaag gcattcagca gttctgtgaa gccgtcaaag ataagatggg ccagatcccc 1200
attcgaaatg tgctgaagta cctgtggcag ttccgggaga cagtcagtgc cgaggatttt 1260
gaagcagccg ctaaggctaa ccatctggag gaaaagatca gccgggtgaa agcccaccca 1320
atcgtgatta gcaataggta ctgggctttt gggacttccg cactggtggg aaacattatg 1380
cccgcagaca agaggcatca gggagagtat gccggtcaga atttcaaaat gtggctggag 1440
gctgaactgc actacgatgg caagaaagca aagcaccatc tgccttttta taacgcccgc 1500
ttctttgagg aagtgtactg ctatcacccc tctgtcgccg agatcactcc tttcaaaacc 1560
aagcagtttg gctgtgaaat cgggaaggac attccagatt acgtgagcgt cgctctgaag 1620
gacaatccgt ataagaaagc aaccaaacga atcctgcgtg caatctacaa tcccgtcgcc 1680
aacacaactg gcgttgataa gaccacaaac tgcagcttca tgatcaaacg cgagaatgac 1740
gaatataagc tggtcatcaa ccgaaaaatt tccgtggatc ggcctaagag aatcgaagtg 1800
ggcaggacaa ttatggggta cgaccgcaat cagacagcta gcgatactta ttggattggc 1860
cggctggtgc cacctggaac ccggggcgca taccgcatcg gagagtggag cgtccagtat 1920
attaagtccg ggcctgtcct gtctagtact cagggagtta acaattccac taccgaccag 1980
ctggtgtaca acggcatgcc atcaagctcc gagcggttca aggcctggaa gaaagccaga 2040
atggctttta tccgaaaact cattcgtcag ctgaatgacg agggactgga atctaagggt 2100
caggattata tccccgagaa cccttctagt ttcgatgtgc ggggcgaaac cctgtacgtc 2160
tttaacagta attatctgaa ggccctggtg agcaaacaca gaaaggccaa gaaacctgtt 2220
gaggggatcc tggacgagat tgaagcctgg acatctaaag acaaggattc atgcagcctg 2280
atgcggctga gcagcctgag cgatgcttcc atgcagggaa tcgccagcct gaagagtctg 2340
attaacagct acttcaacaa gaatggctgt aaaaccatcg aggacaaaga aaagtttaat 2400
cccgtgctgt atgccaagct ggttgaggtg gaacagcgga gaacaaacaa gcggtctgag 2460
aaagtgggaa gaatcgcagg tagtctggag cagctggccc tgctgaacgg ggttgaggtg 2520
gtcatcggcg aagctgacct gggggaggtc gaaaaaggaa agagtaagaa acagaattca 2580
cggaacatgg attggtgcgc aaagcaggtg gcacagcggc tggagtacaa actggccttc 2640
catggaatcg gttactttgg agtgaacccc atgtatacca gccaccagga ccctttcgaa 2700
cataggcgcg tggctgatca catcgtcatg cgagcacgtt ttgaggaagt caacgtggag 2760
aacattgccg aatggcacgt gcgaaatttc tcaaactacc tgcgtgcaga cagcggcact 2820
gggctgtact ataagcaggc caccatggac ttcctgaaac attacggtct ggaggaacac 2880
gctgagggcc tggaaaataa gaaaatcaag ttctatgact ttagaaagat cctggaggat 2940
aaaaacctga caagcgtgat cattccaaag aggggcgggc gcatctacat ggccaccaac 3000
ccagtgacat ccgactctac cccgattaca tacgccggca agacttataa taggtgtaac 3060
gctgatgagg tggcagccgc taatatcgtt atttctgtgc tggctccccg cagtaagaaa 3120
aacgaggaac aggacgatat ccctctgatt accaagaaag ccgagagtaa gtcaccaccg 3180
aaagaccgga agagatcaaa aacaagccag ctgcctcaga aa 3222
<210> 788
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 788
ucucaacgau agucagacau guguccucag ugacac 36
<210> 789
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 789
uuuuaacaac acucaggcau guguccacag ugacac 36
<210> 790
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 790
uugaacggau acucagacau guguuuccag ugacac 36
<210> 791
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 791
ugcccucaau agucagaugu guguccacag ugacac 36
<210> 792
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 792
ucucaaugau acuuagauac guguccucag ugacac 36
<210> 793
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 793
ucucaaugau acucagacau guguccccag ugacac 36
<210> 794
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 794
ucucaaugau acuaagacau guguccucag ugacac 36
<210> 795
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 795
ucucaacuau acucagacau guguccucag ugacac 36
<210> 796
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 796
ucucaacgau acucagacau guguccucag ugacac 36
<210> 797
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 797
ucucaacgau acuaagauau guguccucag cgacac 36
<210> 798
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 798
ucucaacgau acuaagauau guguccccag ugacac 36
<210> 799
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 799
ucucaacgau acuaagauau guguccacag ugacac 36
<210> 800
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 800
ucucaacaau acucagacau guguccccag ugacac 36
<210> 801
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 801
ucucaacaau acuaaggcau guguccccag ugaccc 36
<210> 802
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 802
ucucaaagau acucagacac guguccccag ugacac 36
<210> 803
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 803
ucucaaaaau acucagacau guguccucag ugacac 36
<210> 804
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 804
gcgaaacaac agucagacau guguccccag ugacac 36
<210> 805
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 805
ccucaacgau auuaagacau guguccgcag ugacac 36
<210> 806
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 806
agacaugugu ccucagugac ac 22
<210> 807
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 807
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 808
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 808
aauuuuugug cccaucguug gcac 24
<210> 809
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 809
auuuuugugc ccaucguugg cac 23
<210> 810
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 810
cuagcaauga ccuaauagug uguccuuagu ugacau 36
<210> 811
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 811
ccuacaauac cuaagaaauc cguccuaagu ugacgg 36
<210> 812
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 812
auaguguguc cuuaguugac au 22
<210> 813
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<220>
<221> 尚未归类的特征
<222> (1)..(4)
<223> 位置1、2、3和4处的核苷酸之间的连接是
硫代磷酸酯连接
<220>
<221> 经修饰的碱基
<222> (1)..(2)
<223> gm
<220>
<221> 经修饰的碱基
<222> (3)..(3)
<223> cm
<220>
<221> 尚未归类的特征
<222> (97)..(100)
<223> 位置97、98、99和100处的核苷酸之间的连接
是硫代磷酸酯连接
<220>
<221> 经修饰的碱基
<222> (97)..(99)
<223> um
<400> 813
ggccgagaug ucucgcuccg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 814
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 814
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 815
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 815
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 816
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 816
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 817
<211> 1093
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 817
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys
1010 1015 1020
Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu
1025 1030 1035
Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys
1040 1045 1050
Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe
1055 1060 1065
Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu
1070 1075 1080
Val Asp Ile Gln Lys Asp Phe Lys Lys Lys
1085 1090
<210> 818
<211> 1098
<212> PRT
<213> 人工序列
<220>
<223> 合成的构建体
<400> 818
Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu
1 5 10 15
Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu
20 25 30
Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly
35 40 45
Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro
50 55 60
His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val
65 70 75 80
Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser
85 90 95
Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser
100 105 110
His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg
115 120 125
Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln
130 135 140
Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu
145 150 155 160
Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu
165 170 175
Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu
180 185 190
Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe
195 200 205
Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala
210 215 220
Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly
225 230 235 240
Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp
245 250 255
Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln
260 265 270
Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp
275 280 285
Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr
290 295 300
Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser
305 310 315 320
Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln
325 330 335
Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys
340 345 350
Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn
355 360 365
Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu
370 375 380
Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn
385 390 395 400
Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly
405 410 415
Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr
420 425 430
Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn
435 440 445
Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His
450 455 460
Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys
465 470 475 480
Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile
485 490 495
Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro
500 505 510
Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met
515 520 525
His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala
530 535 540
Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys
545 550 555 560
Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln
565 570 575
Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu
580 585 590
Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr
595 600 605
Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu
610 615 620
Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile
625 630 635 640
Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu
645 650 655
Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln
660 665 670
Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val
675 680 685
Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser
690 695 700
Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His
705 710 715 720
Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe
725 730 735
Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln
740 745 750
Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg
755 760 765
Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln
770 775 780
Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met
785 790 795 800
Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe
805 810 815
Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu
820 825 830
Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu
835 840 845
Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala
850 855 860
Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile
865 870 875 880
Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys
885 890 895
Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys
900 905 910
Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro
915 920 925
Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser
930 935 940
Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp
945 950 955 960
Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys
965 970 975
Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met
980 985 990
Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val
995 1000 1005
Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile
1010 1015 1020
Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu
1025 1030 1035
Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp
1040 1045 1050
Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe
1055 1060 1065
Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu
1070 1075 1080
Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met
1085 1090 1095
<210> 819
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 819
ctgaagctga cagcattcgg 20
<210> 820
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 820
ctggcctgga ggctatccag 20
<210> 821
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 821
tggcctggag gctatccagc 20
<210> 822
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 822
ctctcccgct ctgcaccctc 20
<210> 823
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 823
ccttctccaa gttctccttg 20
<210> 824
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 824
tccaagttct ccttggtggc 20
<210> 825
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 825
tccttggtgg cccgccgtgg 20
<210> 826
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 826
gtggcccgcc gtggggctag 20
<210> 827
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 827
cccctttcgg cggggagcag 20
<210> 828
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 828
cggcggggag caggggagac 20
<210> 829
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 829
ggcggggagc aggggagacc 20
<210> 830
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 830
ggcctacggc gacgggaggg 20
<210> 831
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 831
gcctacggcg acgggagggt 20
<210> 832
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 832
agggcgtcga taagcgtcag 20
<210> 833
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 833
gggcgtcgat aagcgtcaga 20
<210> 834
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 834
ggggagggtt tctcttccgc 20
<210> 835
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 835
ctcttccgct ctttcgcggg 20
<210> 836
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 836
tcttccgctc tttcgcgggg 20
<210> 837
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 837
cgctctttcg cggggcctct 20
<210> 838
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 838
cgcggggcct ctggctcccc 20
<210> 839
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 839
gcggggcctc tggctccccc 20
<210> 840
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 840
gtgaacgcgt ggaggggcgc 20
<210> 841
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 841
tgaacgcgtg gaggggcgct 20
<210> 842
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 842
gggtctgggg gaggcgtcgc 20
<210> 843
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 843
cccgggcgac gcctccccca 20
<210> 844
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 844
acaaacctca gcgccgcgcc 20
<210> 845
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 845
gggacgagcc tacccgtccc 20
<210> 846
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 846
ggacgagcct acccgtcccc 20
<210> 847
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 847
tcgacgccct aaactttgtc 20
<210> 848
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 848
gtcccgaccc tcccgtcgcc 20
<210> 849
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 849
tcccgaccct cccgtcgccg 20
<210> 850
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 850
cccactccca ggccaccccg 20
<210> 851
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 851
cccgagatcc agccctggac 20
<210> 852
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 852
gagaagggaa gtcacggagc 20
<210> 853
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 853
aggaatgccc gccagcgcga 20
<210> 854
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 854
tgagggaaag ataccaagtc 20
<210> 855
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 855
attcttcaaa atggaggtgg 20
<210> 856
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 856
ttcttcaaaa tggaggtggc 20
<210> 857
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 857
ttcaaaatgg aggtggcttg 20
<210> 858
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 858
aaaatggagg tggcttgttg 20
<210> 859
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 859
ttgggaaggt ggaagctcat 20
<210> 860
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 860
ggaaggtgga agctcatttg 20
<210> 861
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 861
ggccagagtg gaaatggaat 20
<210> 862
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 862
gccagagtgg aaatggaatt 20
<210> 863
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 863
ggagaaatcg atgaccaaat 20
<210> 864
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 864
gtgcctgata tagcttgaca 20
<210> 865
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 865
acaccaagtt agccccaagt 20
<210> 866
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 866
gccccaagtg aaataccctg 20
<210> 867
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 867
atgtgtcttt tcccgatatt 20
<210> 868
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 868
agtggggtaa gtcttacatt 20
<210> 869
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 869
cattcttttg taagctgctg 20
<210> 870
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 870
ttttgtaagc tgctgaaagt 20
<210> 871
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 871
tgtaagctgc tgaaagttgt 20
<210> 872
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 872
gtaagctgct gaaagttgtg 20
<210> 873
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 873
taagctgctg aaagttgtgt 20
<210> 874
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 874
tgtatgagta gtcatatcat 20
<210> 875
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 875
gatataaaaa aggtctatgg 20
<210> 876
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 876
atataaaaaa ggtctatggc 20
<210> 877
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 877
ggattgtcag ggaatgttct 20
<210> 878
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 878
tcagggaatg ttcttaaaga 20
<210> 879
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 879
ttaaagatca gattagtggc 20
<210> 880
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 880
aagatcagat tagtggcacc 20
<210> 881
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 881
gtggcacctg ctgagatact 20
<210> 882
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 882
ctgaaccagt agtttccctg 20
<210> 883
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 883
tgaaccagta gtttccctgc 20
<210> 884
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 884
ccctgcagtt gagcagggag 20
<210> 885
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 885
cctgcagttg agcagggagc 20
<210> 886
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 886
agcagggagc agcagcagca 20
<210> 887
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 887
cacaaataca tatacactct 20
<210> 888
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 888
acacttctta cctactggct 20
<210> 889
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 889
ttacctactg gcttcctcta 20
<210> 890
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 890
cctactggct tcctctagct 20
<210> 891
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 891
ctctagcttt tgtggcagct 20
<210> 892
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 892
tgtggcagct tcaggtatat 20
<210> 893
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 893
gtggcagctt caggtatatt 20
<210> 894
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 894
tggcagcttc aggtatattt 20
<210> 895
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 895
aggtatattt agcactgaac 20
<210> 896
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 896
agcactgaac gaacatctca 20
<210> 897
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 897
gcactgaacg aacatctcaa 20
<210> 898
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 898
gtttgtaagt cctgctgtcc 20
<210> 899
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 899
tttgtaagtc ctgctgtcct 20
<210> 900
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 900
gtaagtcctg ctgtcctagc 20
<210> 901
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 901
taagtcctgc tgtcctagca 20
<210> 902
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 902
tccagtactt tctggctgga 20
<210> 903
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 903
ctggctggat tggtatctga 20
<210> 904
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 904
tggctggatt ggtatctgag 20
<210> 905
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 905
gtatctgagg ctagtaggaa 20
<210> 906
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 906
ttcctgctgg gtagctctaa 20
<210> 907
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 907
ctgctgggta gctctaaaca 20
<210> 908
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 908
atgggtagga acagcagcct 20
<210> 909
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 909
tgccagcctt atttctaacc 20
<210> 910
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 910
tttctaacca ttttagacat 20
<210> 911
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 911
ctaaccattt tagacatttg 20
<210> 912
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 912
taaccatttt agacatttgt 20
<210> 913
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 913
tagacatttg ttagtacatg 20
<210> 914
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 914
agacatttgt tagtacatgg 20
<210> 915
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 915
gacatttgtt agtacatggt 20
<210> 916
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 916
gttagtacat ggtattttaa 20
<210> 917
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 917
ttagtacatg gtattttaaa 20
<210> 918
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 918
gtacatggta ttttaaaagt 20
<210> 919
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 919
taaaagtaaa acttaatgtc 20
<210> 920
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 920
aaaagtaaaa cttaatgtct 20
<210> 921
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 921
aaagtaaaac ttaatgtctt 20
<210> 922
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 922
atgtcttcct tttttttctc 20
<210> 923
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 923
cttttttttc tccactgtct 20
<210> 924
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 924
tttttctcca ctgtcttttt 20
<210> 925
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 925
ttttctccac tgtctttttc 20
<210> 926
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 926
ttcatagatc gagacatgta 20
<210> 927
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 927
tcatagatcg agacatgtaa 20
<210> 928
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 928
catagatcga gacatgtaag 20
<210> 929
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 929
atagatcgag acatgtaagc 20
<210> 930
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 930
ttgaccttga gaaaatgttt 20
<210> 931
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 931
tgaccttgag aaaatgtttt 20
<210> 932
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 932
gaccttgaga aaatgttttt 20
<210> 933
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 933
accttgagaa aatgtttttg 20
<210> 934
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 934
agaaaatgtt tttgtttcac 20
<210> 935
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 935
ttgtttcact gtcctgagga 20
<210> 936
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 936
tgtttcactg tcctgaggac 20
<210> 937
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 937
gtttcactgt cctgaggact 20
<210> 938
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 938
tttcactgtc ctgaggacta 20
<210> 939
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 939
cactgtcctg aggactattt 20
<210> 940
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 940
actgtcctga ggactattta 20
<210> 941
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 941
atagacagct ctaacatgat 20
<210> 942
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 942
tagacagctc taacatgata 20
<210> 943
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 943
tcatgttaga gctgtctata 20
<210> 944
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 944
gagctgtcta taaatagtcc 20
<210> 945
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 945
tctcaaggtc aaaaacttac 20
<210> 946
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 946
ctcaaggtca aaaacttacc 20
<210> 947
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 947
tcaaggtcaa aaacttacct 20
<210> 948
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 948
catgtctcga tctatgaaaa 20
<210> 949
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 949
agttttactt ttaaaatacc 20
<210> 950
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 950
tacttttaaa ataccatgta 20
<210> 951
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 951
acttttaaaa taccatgtac 20
<210> 952
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 952
cttttaaaat accatgtact 20
<210> 953
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 953
taaaatacca tgtactaaca 20
<210> 954
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 954
aaaataccat gtactaacaa 20
<210> 955
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 955
aaataccatg tactaacaaa 20
<210> 956
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 956
gaaataaggc tggcagaata 20
<210> 957
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 957
ctacccatga atacattgtt 20
<210> 958
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 958
tttagagcta cccagcagga 20
<210> 959
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 959
agagctaccc agcaggaaca 20
<210> 960
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 960
gagctaccca gcaggaacaa 20
<210> 961
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 961
ctactagcct cagataccaa 20
<210> 962
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 962
taggatgcta ggacagcagg 20
<210> 963
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 963
caaacaaagg cctatacctt 20
<210> 964
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 964
ttgagatgtt cgttcagtgc 20
<210> 965
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 965
agatgttcgt tcagtgctaa 20
<210> 966
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 966
gttcagtgct aaatatacct 20
<210> 967
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 967
agtgctaaat atacctgaag 20
<210> 968
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 968
agagtgtata tgtatttgtg 20
<210> 969
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 969
gtgcaagtgc tgctgctgct 20
<210> 970
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 970
tgcaagtgct gctgctgctc 20
<210> 971
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 971
agaaaccatg ctgtgcatca 20
<210> 972
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 972
aagaacattc cctgacaatc 20
<210> 973
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 973
agaacattcc ctgacaatcc 20
<210> 974
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 974
cctgacaatc ccaatatgca 20
<210> 975
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 975
tttatatcag atgggatggg 20
<210> 976
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 976
atatcagatg ggatgggact 20
<210> 977
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 977
tatcagatgg gatgggactc 20
<210> 978
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 978
agggtagtat ggccatagac 20
<210> 979
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 979
tttatatcaa agcagcttta 20
<210> 980
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 980
ttatatcaaa gcagctttat 20
<210> 981
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 981
tatatcaaag cagctttatg 20
<210> 982
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 982
atatcaaagc agctttatga 20
<210> 983
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 983
tatcaaagca gctttatgat 20
<210> 984
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 984
atgatatgac tactcataca 20
<210> 985
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 985
tgatatgact actcatacac 20
<210> 986
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 986
cagcagctta caaaagaatg 20
<210> 987
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 987
agcagcttac aaaagaatgt 20
<210> 988
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 988
ggagtacctg aggaatatcg 20
<210> 989
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 989
gagtacctga ggaatatcgg 20
<210> 990
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 990
atattgccag ggtatttcac 20
<210> 991
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 991
ccagggtatt tcacttgggg 20
<210> 992
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 992
cacttggggc taacttggtg 20
<210> 993
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 993
acttggggct aacttggtgt 20
<210> 994
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 994
gggctaactt ggtgtcaagc 20
<210> 995
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 995
gtgtcaagct atatcaggca 20
<210> 996
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 996
acatttggtc atcgatttct 20
<210> 997
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 997
catttggtca tcgatttctc 20
<210> 998
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 998
ggtcatcgat ttctcccaat 20
<210> 999
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 999
gtcatcgatt tctcccaatt 20
<210> 1000
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1000
ctcccaattc catttccact 20
<210> 1001
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1001
tcccaattcc atttccactc 20
<210> 1002
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1002
catttccact ctggccaaat 20
<210> 1003
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1003
ccactctggc caaatgagct 20
<210> 1004
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1004
cactctggcc aaatgagctt 20
<210> 1005
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1005
caccttccca acaagccacc 20
<210> 1006
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1006
ccaacaagcc acctccattt 20
<210> 1007
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1007
tgaagaataa accgtgactt 20
<210> 1008
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1008
gaagaataaa ccgtgacttg 20
<210> 1009
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1009
aagaataaac cgtgacttgg 20
<210> 1010
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1010
gtatctttcc ctcataattc 20
<210> 1011
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1011
ccctcataat tcctctatac 20
<210> 1012
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1012
cctcataatt cctctataca 20
<210> 1013
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1013
ctctatacat gccttttttg 20
<210> 1014
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1014
tttgtttttt ttctagcaga 20
<210> 1015
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1015
ttgttttttt tctagcagat 20
<210> 1016
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1016
tgtttttttt ctagcagatt 20
<210> 1017
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1017
gttttttttc tagcagattt 20
<210> 1018
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1018
ttttttttct agcagatttc 20
<210> 1019
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1019
cugaagcuga cagcauucgg 20
<210> 1020
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1020
cuggccugga ggcuauccag 20
<210> 1021
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1021
uggccuggag gcuauccagc 20
<210> 1022
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1022
cucucccgcu cugcacccuc 20
<210> 1023
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1023
ccuucuccaa guucuccuug 20
<210> 1024
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1024
uccaaguucu ccuugguggc 20
<210> 1025
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1025
uccuuggugg cccgccgugg 20
<210> 1026
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1026
guggcccgcc guggggcuag 20
<210> 1027
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1027
ccccuuucgg cggggagcag 20
<210> 1028
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1028
cggcggggag caggggagac 20
<210> 1029
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1029
ggcggggagc aggggagacc 20
<210> 1030
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1030
ggccuacggc gacgggaggg 20
<210> 1031
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1031
gccuacggcg acgggagggu 20
<210> 1032
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1032
agggcgucga uaagcgucag 20
<210> 1033
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1033
gggcgucgau aagcgucaga 20
<210> 1034
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1034
ggggaggguu ucucuuccgc 20
<210> 1035
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1035
cucuuccgcu cuuucgcggg 20
<210> 1036
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1036
ucuuccgcuc uuucgcgggg 20
<210> 1037
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1037
cgcucuuucg cggggccucu 20
<210> 1038
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1038
cgcggggccu cuggcucccc 20
<210> 1039
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1039
gcggggccuc uggcuccccc 20
<210> 1040
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1040
gugaacgcgu ggaggggcgc 20
<210> 1041
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1041
ugaacgcgug gaggggcgcu 20
<210> 1042
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1042
gggucugggg gaggcgucgc 20
<210> 1043
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1043
cccgggcgac gccuccccca 20
<210> 1044
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1044
acaaaccuca gcgccgcgcc 20
<210> 1045
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1045
gggacgagcc uacccguccc 20
<210> 1046
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1046
ggacgagccu acccgucccc 20
<210> 1047
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1047
ucgacgcccu aaacuuuguc 20
<210> 1048
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1048
gucccgaccc ucccgucgcc 20
<210> 1049
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1049
ucccgacccu cccgucgccg 20
<210> 1050
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1050
cccacuccca ggccaccccg 20
<210> 1051
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1051
cccgagaucc agcccuggac 20
<210> 1052
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1052
gagaagggaa gucacggagc 20
<210> 1053
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1053
aggaaugccc gccagcgcga 20
<210> 1054
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1054
ugagggaaag auaccaaguc 20
<210> 1055
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1055
auucuucaaa auggaggugg 20
<210> 1056
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1056
uucuucaaaa uggagguggc 20
<210> 1057
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1057
uucaaaaugg agguggcuug 20
<210> 1058
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1058
aaaauggagg uggcuuguug 20
<210> 1059
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1059
uugggaaggu ggaagcucau 20
<210> 1060
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1060
ggaaggugga agcucauuug 20
<210> 1061
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1061
ggccagagug gaaauggaau 20
<210> 1062
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1062
gccagagugg aaauggaauu 20
<210> 1063
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1063
ggagaaaucg augaccaaau 20
<210> 1064
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1064
gugccugaua uagcuugaca 20
<210> 1065
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1065
acaccaaguu agccccaagu 20
<210> 1066
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1066
gccccaagug aaauacccug 20
<210> 1067
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1067
augugucuuu ucccgauauu 20
<210> 1068
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1068
agugggguaa gucuuacauu 20
<210> 1069
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1069
cauucuuuug uaagcugcug 20
<210> 1070
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1070
uuuuguaagc ugcugaaagu 20
<210> 1071
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1071
uguaagcugc ugaaaguugu 20
<210> 1072
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1072
guaagcugcu gaaaguugug 20
<210> 1073
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1073
uaagcugcug aaaguugugu 20
<210> 1074
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1074
uguaugagua gucauaucau 20
<210> 1075
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1075
gauauaaaaa aggucuaugg 20
<210> 1076
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1076
auauaaaaaa ggucuauggc 20
<210> 1077
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1077
ggauugucag ggaauguucu 20
<210> 1078
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1078
ucagggaaug uucuuaaaga 20
<210> 1079
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1079
uuaaagauca gauuaguggc 20
<210> 1080
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1080
aagaucagau uaguggcacc 20
<210> 1081
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1081
guggcaccug cugagauacu 20
<210> 1082
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1082
cugaaccagu aguuucccug 20
<210> 1083
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1083
ugaaccagua guuucccugc 20
<210> 1084
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1084
cccugcaguu gagcagggag 20
<210> 1085
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1085
ccugcaguug agcagggagc 20
<210> 1086
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1086
agcagggagc agcagcagca 20
<210> 1087
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1087
cacaaauaca uauacacucu 20
<210> 1088
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1088
acacuucuua ccuacuggcu 20
<210> 1089
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1089
uuaccuacug gcuuccucua 20
<210> 1090
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1090
ccuacuggcu uccucuagcu 20
<210> 1091
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1091
cucuagcuuu uguggcagcu 20
<210> 1092
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1092
uguggcagcu ucagguauau 20
<210> 1093
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1093
guggcagcuu cagguauauu 20
<210> 1094
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1094
uggcagcuuc agguauauuu 20
<210> 1095
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1095
agguauauuu agcacugaac 20
<210> 1096
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1096
agcacugaac gaacaucuca 20
<210> 1097
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1097
gcacugaacg aacaucucaa 20
<210> 1098
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1098
guuuguaagu ccugcugucc 20
<210> 1099
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1099
uuuguaaguc cugcuguccu 20
<210> 1100
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1100
guaaguccug cuguccuagc 20
<210> 1101
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1101
uaaguccugc uguccuagca 20
<210> 1102
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1102
uccaguacuu ucuggcugga 20
<210> 1103
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1103
cuggcuggau ugguaucuga 20
<210> 1104
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1104
uggcuggauu gguaucugag 20
<210> 1105
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1105
guaucugagg cuaguaggaa 20
<210> 1106
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1106
uuccugcugg guagcucuaa 20
<210> 1107
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1107
cugcugggua gcucuaaaca 20
<210> 1108
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1108
auggguagga acagcagccu 20
<210> 1109
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1109
ugccagccuu auuucuaacc 20
<210> 1110
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1110
uuucuaacca uuuuagacau 20
<210> 1111
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1111
cuaaccauuu uagacauuug 20
<210> 1112
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1112
uaaccauuuu agacauuugu 20
<210> 1113
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1113
uagacauuug uuaguacaug 20
<210> 1114
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1114
agacauuugu uaguacaugg 20
<210> 1115
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1115
gacauuuguu aguacauggu 20
<210> 1116
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1116
guuaguacau gguauuuuaa 20
<210> 1117
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1117
uuaguacaug guauuuuaaa 20
<210> 1118
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1118
guacauggua uuuuaaaagu 20
<210> 1119
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1119
uaaaaguaaa acuuaauguc 20
<210> 1120
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1120
aaaaguaaaa cuuaaugucu 20
<210> 1121
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1121
aaaguaaaac uuaaugucuu 20
<210> 1122
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1122
augucuuccu uuuuuuucuc 20
<210> 1123
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1123
cuuuuuuuuc uccacugucu 20
<210> 1124
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1124
uuuuucucca cugucuuuuu 20
<210> 1125
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1125
uuuucuccac ugucuuuuuc 20
<210> 1126
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1126
uucauagauc gagacaugua 20
<210> 1127
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1127
ucauagaucg agacauguaa 20
<210> 1128
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1128
cauagaucga gacauguaag 20
<210> 1129
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1129
auagaucgag acauguaagc 20
<210> 1130
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1130
uugaccuuga gaaaauguuu 20
<210> 1131
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1131
ugaccuugag aaaauguuuu 20
<210> 1132
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1132
gaccuugaga aaauguuuuu 20
<210> 1133
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1133
accuugagaa aauguuuuug 20
<210> 1134
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1134
agaaaauguu uuuguuucac 20
<210> 1135
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1135
uuguuucacu guccugagga 20
<210> 1136
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1136
uguuucacug uccugaggac 20
<210> 1137
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1137
guuucacugu ccugaggacu 20
<210> 1138
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1138
uuucacuguc cugaggacua 20
<210> 1139
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1139
cacuguccug aggacuauuu 20
<210> 1140
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1140
acuguccuga ggacuauuua 20
<210> 1141
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1141
auagacagcu cuaacaugau 20
<210> 1142
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1142
uagacagcuc uaacaugaua 20
<210> 1143
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1143
ucauguuaga gcugucuaua 20
<210> 1144
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1144
gagcugucua uaaauagucc 20
<210> 1145
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1145
ucucaagguc aaaaacuuac 20
<210> 1146
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1146
cucaagguca aaaacuuacc 20
<210> 1147
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1147
ucaaggucaa aaacuuaccu 20
<210> 1148
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1148
caugucucga ucuaugaaaa 20
<210> 1149
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1149
aguuuuacuu uuaaaauacc 20
<210> 1150
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1150
uacuuuuaaa auaccaugua 20
<210> 1151
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1151
acuuuuaaaa uaccauguac 20
<210> 1152
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1152
cuuuuaaaau accauguacu 20
<210> 1153
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1153
uaaaauacca uguacuaaca 20
<210> 1154
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1154
aaaauaccau guacuaacaa 20
<210> 1155
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1155
aaauaccaug uacuaacaaa 20
<210> 1156
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1156
gaaauaaggc uggcagaaua 20
<210> 1157
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1157
cuacccauga auacauuguu 20
<210> 1158
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1158
uuuagagcua cccagcagga 20
<210> 1159
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1159
agagcuaccc agcaggaaca 20
<210> 1160
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1160
gagcuaccca gcaggaacaa 20
<210> 1161
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1161
cuacuagccu cagauaccaa 20
<210> 1162
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1162
uaggaugcua ggacagcagg 20
<210> 1163
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1163
caaacaaagg ccuauaccuu 20
<210> 1164
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1164
uugagauguu cguucagugc 20
<210> 1165
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1165
agauguucgu ucagugcuaa 20
<210> 1166
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1166
guucagugcu aaauauaccu 20
<210> 1167
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1167
agugcuaaau auaccugaag 20
<210> 1168
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1168
agaguguaua uguauuugug 20
<210> 1169
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1169
gugcaagugc ugcugcugcu 20
<210> 1170
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1170
ugcaagugcu gcugcugcuc 20
<210> 1171
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1171
agaaaccaug cugugcauca 20
<210> 1172
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1172
aagaacauuc ccugacaauc 20
<210> 1173
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1173
agaacauucc cugacaaucc 20
<210> 1174
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1174
ccugacaauc ccaauaugca 20
<210> 1175
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1175
uuuauaucag augggauggg 20
<210> 1176
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1176
auaucagaug ggaugggacu 20
<210> 1177
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1177
uaucagaugg gaugggacuc 20
<210> 1178
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1178
aggguaguau ggccauagac 20
<210> 1179
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1179
uuuauaucaa agcagcuuua 20
<210> 1180
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1180
uuauaucaaa gcagcuuuau 20
<210> 1181
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1181
uauaucaaag cagcuuuaug 20
<210> 1182
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1182
auaucaaagc agcuuuauga 20
<210> 1183
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1183
uaucaaagca gcuuuaugau 20
<210> 1184
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1184
augauaugac uacucauaca 20
<210> 1185
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1185
ugauaugacu acucauacac 20
<210> 1186
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1186
cagcagcuua caaaagaaug 20
<210> 1187
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1187
agcagcuuac aaaagaaugu 20
<210> 1188
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1188
ggaguaccug aggaauaucg 20
<210> 1189
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1189
gaguaccuga ggaauaucgg 20
<210> 1190
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1190
auauugccag gguauuucac 20
<210> 1191
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1191
ccaggguauu ucacuugggg 20
<210> 1192
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1192
cacuuggggc uaacuuggug 20
<210> 1193
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1193
acuuggggcu aacuuggugu 20
<210> 1194
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1194
gggcuaacuu ggugucaagc 20
<210> 1195
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1195
gugucaagcu auaucaggca 20
<210> 1196
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1196
acauuugguc aucgauuucu 20
<210> 1197
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1197
cauuugguca ucgauuucuc 20
<210> 1198
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1198
ggucaucgau uucucccaau 20
<210> 1199
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1199
gucaucgauu ucucccaauu 20
<210> 1200
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1200
cucccaauuc cauuuccacu 20
<210> 1201
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1201
ucccaauucc auuuccacuc 20
<210> 1202
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1202
cauuuccacu cuggccaaau 20
<210> 1203
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1203
ccacucuggc caaaugagcu 20
<210> 1204
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1204
cacucuggcc aaaugagcuu 20
<210> 1205
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1205
caccuuccca acaagccacc 20
<210> 1206
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1206
ccaacaagcc accuccauuu 20
<210> 1207
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1207
ugaagaauaa accgugacuu 20
<210> 1208
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1208
gaagaauaaa ccgugacuug 20
<210> 1209
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1209
aagaauaaac cgugacuugg 20
<210> 1210
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1210
guaucuuucc cucauaauuc 20
<210> 1211
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1211
cccucauaau uccucuauac 20
<210> 1212
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1212
ccucauaauu ccucuauaca 20
<210> 1213
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1213
cucuauacau gccuuuuuug 20
<210> 1214
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1214
uuuguuuuuu uucuagcaga 20
<210> 1215
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1215
uuguuuuuuu ucuagcagau 20
<210> 1216
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1216
uguuuuuuuu cuagcagauu 20
<210> 1217
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1217
guuuuuuuuc uagcagauuu 20
<210> 1218
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1218
uuuuuuuucu agcagauuuc 20
<210> 1219
<211> 3809
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1219
gtgagtctct cctaccctcc cgctctggtc cttcctctcc cgctctgcac cctctgtggc 60
cctcgctgtg ctctctcgct ccgtgacttc ccttctccaa gttctccttg gtggcccgcc 120
gtggggctag tccagggctg gatctcgggg aagcggcggg gtggcctggg agtggggaag 180
ggggtgcgca cccgggacgc gcgctacttg cccctttcgg cggggagcag gggagacctt 240
tggcctacgg cgacgggagg gtcgggacaa agtttagggc gtcgataagc gtcagagcgc 300
cgaggttggg ggagggtttc tcttccgctc tttcgcgggg cctctggctc ccccagcgca 360
gctggagtgg gggacgggta ggctcgtccc aaaggcgcgg cgctgaggtt tgtgaacgcg 420
tggaggggcg cttggggtct gggggaggcg tcgcccgggt aagcctgtct gctgcggctc 480
tgcttccctt agactggaga gctgtggact tcgtctaggc gcccgctaag ttcgcatgtc 540
ctagcacctc tgggtctatg tggggccaca ccgtggggag gaaacagcac gcgacgtttg 600
tagaatgctt ggctgtgata caaagcggtt tcgaataatt aacttatttg ttcccatcac 660
atgtcacttt taaaaaatta taagaactac ccgttattga catctttctg tgtgccaagg 720
actttatgtg ctttgcgtca tttaattttg aaaacagtta tcttccgcca tagataacta 780
ctatggttat cttctgcctc tcacagatga agaaactaag gcaccgagat tttaagaaac 840
ttaattacac aggggataaa tggcagcaat cgagattgaa gtcaagccta accagggctt 900
ttgcgggagc gcatgccttt tggctgtaat tcgtgcattt ttttttaaga aaaacgcctg 960
ccttctgcgt gagattctcc agagcaaact gggcggcatg ggccctgtgg tcttttcgta 1020
cagagggctt cctctttggc tctttgcctg gttgtttcca agatgtactg tgcctcttac 1080
tttcggtttt gaaaacatga gggggttggg cgtggtagct tacgcctgta atcccagcac 1140
ttagggaggc cgaggcggga ggatggcttg aggtccgtag ttgagaccag cctggccaac 1200
atggtgaagc ctggtctcta caaaaaataa taacaaaaat tagccgggtg tggtggctcg 1260
tgcctgtggt cccagctgct ccggtggctg aggcgggagg atctcttgag cttaggcttt 1320
tgagctatca tggcgccagt gcactccagc gtgggcaaca gagcgagacc ctgtctctca 1380
aaaaagaaaa aaaaaaaaaa agaaagagaa aagaaaagaa agaaagaagt gaaggtttgt 1440
cagtcagggg agctgtaaaa ccattaataa agataatcca agatggttac caagactgtt 1500
gaggacgcca gagatcttga gcactttcta agtacctggc aatacactaa gcgcgctcac 1560
cttttcctct ggcaaaacat gatcgaaagc agaatgtttt gatcatgaga aaattgcatt 1620
taatttgaat acaatttatt tacaacataa aggataatgt atatatcacc accattactg 1680
gtatttgctg gttatgttag atgtcatttt aaaaaataac aatctgatat ttaaaaaaaa 1740
atcttatttt gaaaatttcc aaagtaatac atgccatgca tagaccattt ctggaagata 1800
ccacaagaaa catgtaatga tgattgcctc tgaaggtcta ttttcctcct ctgacctgtg 1860
tgtgggtttt gtttttgttt tactgtgggc ataaattaat ttttcagtta agttttggaa 1920
gcttaaataa ctctccaaaa gtcataaagc cagtaactgg ttgagcccaa attcaaaccc 1980
agcctgtctg atacttgtcc tcttcttaga aaagattaca gtgatgctct cacaaaatct 2040
tgccgccttc cctcaaacag agagttccag gcaggatgaa tctgtgctct gatccctgag 2100
gcatttaata tgttcttatt attagaagct cagatgcaaa gagctctctt agcttttaat 2160
gttatgaaaa aaatcaggtc ttcattagat tccccaatcc acctcttgat ggggctagta 2220
gcctttcctt aatgataggg tgtttctaga gagatatatc tggtcaaggt ggcctggtac 2280
tcctccttct ccccacagcc tcccagacaa ggaggagtag ctgcctttta gtgatcatgt 2340
accctgaata taagtgtatt taaaagaatt ttatacacat atatttagtg tcaatctgta 2400
tatttagtag cactaacact tctcttcatt ttcaatgaaa aatatagagt ttataatatt 2460
ttcttcccac ttccccatgg atggtctagt catgcctctc attttggaaa gtactgtttc 2520
tgaaacatta ggcaatatat tcccaacctg gctagtttac agcaatcacc tgtggatgct 2580
aattaaaacg caaatcccac tgtcacatgc attactccat ttgatcataa tggaaagtat 2640
gttctgtccc atttgccata gtcctcacct atccctgttg tattttatcg ggtccaactc 2700
aaccatttaa ggtatttgcc agctcttgta tgcatttagg ttttgtttct ttgtttttta 2760
gctcatgaaa ttaggtacaa agtcagagag gggtctggca tataaaacct cagcagaaat 2820
aaagaggttt tgttgtttgg taagaacata ccttgggttg gttgggcacg gtggctcgtg 2880
cctgtaatcc caacactttg ggaggccaag gcaggctgat cacttgaagt tgggagttca 2940
agaccagcct ggccaacatg gtgaaatccc gtctctactg aaaatacaaa aattaaccag 3000
gcatggtggt gtgtgcctgt agtcccagga atcacttgaa cccaggaggc ggaggttgca 3060
gtgagctgag atctcaccac tgcacactgc actccagcct gggcaatgga atgagattcc 3120
atcccaaaaa ataaaaaaat aaaaaaataa agaacatacc ttgggttgat ccacttagga 3180
acctcagata ataacatctg ccacgtatag agcaattgct atgtcccagg cactctacta 3240
gacacttcat acagtttaga aaatcagatg ggtgtagatc aaggcaggag caggaaccaa 3300
aaagaaaggc ataaacataa gaaaaaaaat ggaaggggtg gaaacagagt acaataacat 3360
gagtaatttg atgggggcta ttatgaactg agaaatgaac tttgaaaagt atcttggggc 3420
caaatcatgt agactcttga gtgatgtgtt aaggaatgct atgagtgctg agagggcatc 3480
agaagtcctt gagagcctcc agagaaaggc tcttaaaaat gcagcgcaat ctccagtgac 3540
agaagatact gctagaaatc tgctagaaaa aaaacaaaaa aggcatgtat agaggaatta 3600
tgagggaaag ataccaagtc acggtttatt cttcaaaatg gaggtggctt gttgggaagg 3660
tggaagctca tttggccaga gtggaaatgg aattgggaga aatcgatgac caaatgtaaa 3720
cacttggtgc ctgatatagc ttgacaccaa gttagcccca agtgaaatac cctggcaata 3780
ttaatgtgtc ttttcccgat attcctcag 3809
<210> 1220
<211> 627
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1220
gtaagtctta cattcttttg taagctgctg aaagttgtgt atgagtagtc atatcataaa 60
gctgctttga tataaaaaag gtctatggcc atactaccct gaatgagtcc catcccatct 120
gatataaaca atctgcatat tgggattgtc agggaatgtt cttaaagatc agattagtgg 180
cacctgctga gatactgatg cacagcatgg tttctgaacc agtagtttcc ctgcagttga 240
gcagggagca gcagcagcac ttgcacaaat acatatacac tcttaacact tcttacctac 300
tggcttcctc tagcttttgt ggcagcttca ggtatattta gcactgaacg aacatctcaa 360
gaaggtatag gcctttgttt gtaagtcctg ctgtcctagc atcctataat cctggacttc 420
tccagtactt tctggctgga ttggtatctg aggctagtag gaagggcttg ttcctgctgg 480
gtagctctaa acaatgtatt catgggtagg aacagcagcc tattctgcca gccttatttc 540
taaccatttt agacatttgt tagtacatgg tattttaaaa gtaaaactta atgtcttcct 600
tttttttctc cactgtcttt ttcatag 627
<210> 1221
<211> 1250
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1221
gtaagttttt gaccttgaga aaatgttttt gtttcactgt cctgaggact atttatagac 60
agctctaaca tgataaccct cactatgtgg agaacattga cagagtaaca ttttagcagg 120
gaaagaagaa tcctacaggg tcatgttccc ttctcctgtg gagtggcatg aagaaggtgt 180
atggccccag gtatggccat attactgacc ctctacagag agggcaaagg aactgccagt 240
atggtattgc aggataaagg caggtggtta cccacattac ctgcaaggct ttgatctttc 300
ttctgccatt tccacattgg acatctctgc tgaggagaga aaatgaacca ctcttttcct 360
ttgtataatg ttgttttatt cttcagacag aagagaggag ttatacagct ctgcagacat 420
cccattcctg tatggggact gtgtttgcct cttagaggtt cccaggccac tagaggagat 480
aaagggaaac agattgttat aacttgatat aatgatacta taatagatgt aactacaagg 540
agctccagaa gcaagagaga gggaggaact tggacttctc tgcatcttta gttggagtcc 600
aaaggctttt caatgaaatt ctactgccca gggtacattg atgctgaaac cccattcaaa 660
tctcctgtta tattctagaa cagggaattg atttgggaga gcatcaggaa ggtggatgat 720
ctgcccagtc acactgttag taaattgtag agccaggacc tgaactctaa tatagtcatg 780
tgttacttaa tgacggggac atgttctgag aaatgcttac acaaacctag gtgttgtagc 840
ctactacacg cataggctac atggtatagc ctattgctcc tagactacaa acctgtacag 900
cctgttactg tactgaatac tgtgggcagt tgtaacacaa tggtaagtat ttgtgtatct 960
aaacatagaa gttgcagtaa aaatatgcta ttttaatctt atgagaccac tgtcatatat 1020
acagtccatc attgaccaaa acatcatatc agcatttttt cttctaagat tttgggagca 1080
ccaaagggat acactaacag gatatactct ttataatggg tttggagaac tgtctgcagc 1140
tacttctttt aaaaaggtga tctacacagt agaaattaga caagtttggt aatgagatct 1200
gcaatccaaa taaaataaat tcattgctaa cctttttctt ttcttttcag 1250
<210> 1222
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1222
agaaauccgu cuuucauuga cggaggaaug cccgccagcg cga 43
<210> 1223
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1223
agaaauccgu cuuucauuga cggcuggccu ggaggcuauc cag 43
<210> 1224
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1224
agaaauccgu cuuucauuga cggucccgau auuccucagg uac 43
<210> 1225
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1225
agaaauccgu cuuucauuga cggggaguac cugaggaaua ucg 43
<210> 1226
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1226
agaaauccgu cuuucauuga cggccauucu cugcuggaug acg 43
<210> 1227
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1227
agaaauccgu cuuucauuga cggaguaagu caacuucaau guc 43
<210> 1228
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1228
agaaauccgu cuuucauuga cgguucaauu cucucuccau ucu 43
<210> 1229
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1229
agaaauccgu cuuucauuga cggcagcaag gacuggucuu ucu 43
<210> 1230
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1230
agaaauccgu cuuucauuga cgguucagug ggggugaauu cag 43
<210> 1231
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1231
aggaatgccc gccagcgcga 20
<210> 1232
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1232
ctggcctgga ggctatccag 20
<210> 1233
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1233
tcccgatatt cctcaggtac 20
<210> 1234
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1234
ggagtacctg aggaatatcg 20
<210> 1235
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1235
ccattctctg ctggatgacg 20
<210> 1236
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1236
aatgtcggat ggatgaaacc 20
<210> 1237
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1237
agtaagtcaa cttcaatgtc 20
<210> 1238
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1238
ttcaattctc tctccattct 20
<210> 1239
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1239
cagcaaggac tggtctttct 20
<210> 1240
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1240
ctatctcttg tactacactg 20
<210> 1241
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的构建体
<400> 1241
ttcagtgggg gtgaattcag 20
Claims (86)
1.一种包含RNA指导物的组合物,其中该RNA指导物包含(i)与B2M基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
2.如权利要求1所述的组合物,其中该靶序列在该B2M基因的外显子1、外显子2、外显子3、外显子4、内含子1、内含子2或内含子3内。
3.如权利要求1或2所述的组合物,其中该B2M基因包含SEQ ID NO:773的序列、SEQ IDNO:773的反向互补序列、SEQ ID NO:773的变体、或SEQ ID NO:773的变体的反向互补序列。
4.如权利要求1至3中任一项所述的组合物,其中该间隔子序列包含:
a.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:391-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:391-552和554-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:391-552和555-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:391-540、542-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
5.如权利要求1至4中任一项所述的组合物,其中该间隔子序列包含:
a.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:391-770中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
6.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
7.如权利要求1至6中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
8.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:806的序列或其一部分具有至少90%同一性的序列。
9.如权利要求1至5或8中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:788-805中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:788-805中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:788-805中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:788-805中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:788-805中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:788-805中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:788-805中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:788-805中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:788-805中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:788-805中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:788-805中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:788-805中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:788-805中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:788-805中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:806或其一部分。
10.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:808或SEQ ID NO:809的序列或其一部分具有至少90%同一性的序列。
11.如权利要求1至5或10中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:807的核苷酸1至核苷酸36;
b.SEQ ID NO:807的核苷酸2至核苷酸36;
c.SEQ ID NO:807的核苷酸3至核苷酸36;
d.SEQ ID NO:807的核苷酸4至核苷酸36;
e.SEQ ID NO:807的核苷酸5至核苷酸36;
f.SEQ ID NO:807的核苷酸6至核苷酸36;
g.SEQ ID NO:807的核苷酸7至核苷酸36;
h.SEQ ID NO:807的核苷酸8至核苷酸36;
i.SEQ ID NO:807的核苷酸9至核苷酸36;
j.SEQ ID NO:807的核苷酸10至核苷酸36;
k.SEQ ID NO:807的核苷酸11至核苷酸36;
l.SEQ ID NO:807的核苷酸12至核苷酸36;
m.SEQ ID NO:807的核苷酸13至核苷酸36;
n.SEQ ID NO:807的核苷酸14至核苷酸36;或
o.SEQ ID NO:808或SEQ ID NO:809或其一部分。
12.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:812的序列或其一部分具有至少90%同一性的序列。
13.如权利要求1至5或12中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:810或SEQ ID NO:811的核苷酸1至核苷酸36;
b.SEQ ID NO:810或SEQ ID NO:811的核苷酸2至核苷酸36;
c.SEQ ID NO:810或SEQ ID NO:811的核苷酸3至核苷酸36;
d.SEQ ID NO:810或SEQ ID NO:811的核苷酸4至核苷酸36;
e.SEQ ID NO:810或SEQ ID NO:811的核苷酸5至核苷酸36;
f.SEQ ID NO:810或SEQ ID NO:811的核苷酸6至核苷酸36;
g.SEQ ID NO:810或SEQ ID NO:811的核苷酸7至核苷酸36;
h.SEQ ID NO:810或SEQ ID NO:811的核苷酸8至核苷酸36;
i.SEQ ID NO:810或SEQ ID NO:811的核苷酸9至核苷酸36;
j.SEQ ID NO:810或SEQ ID NO:811的核苷酸10至核苷酸36;
k.SEQ ID NO:810或SEQ ID NO:811的核苷酸11至核苷酸36;
l.SEQ ID NO:810或SEQ ID NO:811的核苷酸12至核苷酸36;
m.SEQ ID NO:810或SEQ ID NO:811的核苷酸13至核苷酸36;
n.SEQ ID NO:810或SEQ ID NO:811的核苷酸14至核苷酸36;
o.SEQ ID NO:810或SEQ ID NO:811的核苷酸15至核苷酸36;或
p.SEQ ID NO:812或其一部分。
14.如权利要求1至13中任一项所述的组合物,其中该间隔子序列与SEQ ID NO:11-390或819-1018中任一个的序列的互补序列基本上互补。
15.如权利要求1所述的组合物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
16.如权利要求1或15所述的组合物,其中该靶序列紧邻该PAM序列。
17.如权利要求1至16中任一项所述的组合物,其中该组合物进一步包含Cas12i多肽。
18.如权利要求17所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含与SEQ ID NO:772、SEQ ID NO:782、SEQ ID NO:783、SEQ IDNO:784、SEQ ID NO:785、或SEQ ID NO:786的序列具有至少90%同一性的序列;
b.Cas12i4多肽,其包含与SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列具有至少90%同一性的序列;
c.Cas12i1多肽,其包含与SEQ ID NO:817的序列具有至少90%同一性的序列;或
d.Cas12i3多肽,其包含与SEQ ID NO:818的序列具有至少90%同一性的序列。
19.如权利要求18所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含SEQ ID NO:772、SEQ ID NO:782、SEQ ID NO:783、SEQ ID NO:784、SEQ ID NO:785、或SEQ ID NO:786的序列;
b.Cas12i4多肽,其包含SEQ ID NO:814、SEQ ID NO:815、或SEQ ID NO:816的序列;
c.Cas12i1多肽,其包含SEQ ID NO:817的序列;或
d.Cas12i3多肽,其包含SEQ ID NO:818的序列。
20.如权利要求17至19中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽形成核糖核蛋白复合物。
21.如权利要求20所述的组合物,其中该核糖核蛋白复合物与靶核酸结合。
22.如权利要求20或21所述的组合物,其中该组合物存在于细胞内。
23.如权利要求17至22中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在载体中,例如表达载体中。
24.如权利要求23所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
25.一种RNA指导物,其包含(i)与B2M基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
26.如权利要求25所述的RNA指导物,其中该靶序列在该B2M基因的外显子1、外显子2、外显子3、外显子4、内含子1、内含子2或内含子3内。
27.如权利要求25或26所述的RNA指导物,其中该B2M基因包含SEQ ID NO:773的序列、SEQ ID NO:773的反向互补序列、SEQ ID NO:773的变体、或SEQ ID NO:773的变体的反向互补序列。
28.如权利要求25至27中任一项所述的RNA指导物,其中该间隔子序列包含:
a.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:391-770或1019-1218中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:391-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:391-552和554-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:391-552和555-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:391-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:391-540、542-552和556-770中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
29.如权利要求25至28中任一项所述的RNA指导物,其中该间隔子序列包含:
a.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:391-770或1019-1218中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:391-770中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:391-552和554-770中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:391-552和555-770中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:391-552和556-770中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:391-540、542-552和556-770中任一个的核苷酸1至核苷酸30。
30.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
31.如权利要求25至30中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
32.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:788-805中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:806的序列或其一部分具有至少90%同一性的序列。
33.如权利要求25至29或32中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:788-805中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:788-805中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:788-805中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:788-805中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:788-805中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:788-805中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:788-805中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:788-805中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:788-805中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:788-805中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:788-805中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:788-805中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:788-805中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:788-805中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:806或其一部分。
34.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:807具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:808或SEQ ID NO:809的序列或其一部分具有至少90%同一性的序列。
35.如权利要求25至29或34中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:807的核苷酸1至核苷酸36;
b.SEQ ID NO:807的核苷酸2至核苷酸36;
c.SEQ ID NO:807的核苷酸3至核苷酸36;
d.SEQ ID NO:807的核苷酸4至核苷酸36;
e.SEQ ID NO:807的核苷酸5至核苷酸36;
f.SEQ ID NO:807的核苷酸6至核苷酸36;
g.SEQ ID NO:807的核苷酸7至核苷酸36;
h.SEQ ID NO:807的核苷酸8至核苷酸36;
i.SEQ ID NO:807的核苷酸9至核苷酸36;
j.SEQ ID NO:807的核苷酸10至核苷酸36;
k.SEQ ID NO:807的核苷酸11至核苷酸36;
l.SEQ ID NO:807的核苷酸12至核苷酸36;
m.SEQ ID NO:807的核苷酸13至核苷酸36;
n.SEQ ID NO:807的核苷酸14至核苷酸36;或
o.SEQ ID NO:808或SEQ ID NO:809或其一部分。
36.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:810或SEQ ID NO:811的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:812的序列或其一部分具有至少90%同一性的序列。
37.如权利要求25至29或36中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:810或SEQ ID NO:811的核苷酸1至核苷酸36;
b.SEQ ID NO:810或SEQ ID NO:811的核苷酸2至核苷酸36;
c.SEQ ID NO:810或SEQ ID NO:811的核苷酸3至核苷酸36;
d.SEQ ID NO:810或SEQ ID NO:811的核苷酸4至核苷酸36;
e.SEQ ID NO:810或SEQ ID NO:811的核苷酸5至核苷酸36;
f.SEQ ID NO:810或SEQ ID NO:811的核苷酸6至核苷酸36;
g.SEQ ID NO:810或SEQ ID NO:811的核苷酸7至核苷酸36;
h.SEQ ID NO:810或SEQ ID NO:811的核苷酸8至核苷酸36;
i.SEQ ID NO:810或SEQ ID NO:811的核苷酸9至核苷酸36;
j.SEQ ID NO:810或SEQ ID NO:811的核苷酸10至核苷酸36;
k.SEQ ID NO:810或SEQ ID NO:811的核苷酸11至核苷酸36;
l.SEQ ID NO:810或SEQ ID NO:811的核苷酸12至核苷酸36;
m.SEQ ID NO:810或SEQ ID NO:811的核苷酸13至核苷酸36;
n.SEQ ID NO:810或SEQ ID NO:811的核苷酸14至核苷酸36;
o.SEQ ID NO:810或SEQ ID NO:811的核苷酸15至核苷酸36;或
p.SEQ ID NO:812或其一部分。
38.如权利要求25至37中任一项所述的RNA指导物,其中该间隔子序列与SEQ ID NO:11-390或819-1018中任一个的序列的互补序列基本上互补。
39.如权利要求25至38中任一项所述的RNA指导物,其中该靶序列与包含该序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
40.如权利要求39所述的RNA指导物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
41.如权利要求39或40所述的RNA指导物,其中该靶序列紧邻该PAM序列。
42.一种核酸,其编码如权利要求25至41中任一项所述的RNA指导物。
43.一种载体,其包含如权利要求42所述的核酸。
44.一种载体系统,其包含一个或多个编码(i)如权利要求1至41中任一项所定义的RNA指导物和(ii)Cas12i多肽的载体,任选地其中该载体系统包含编码该RNA指导物的第一载体以及编码该Cas12i多肽的第二载体。
45.一种细胞,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体。
46.如权利要求45所述的细胞,其中该细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、或T细胞。
47.一种试剂盒,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。
48.一种编辑B2M序列的方法,该方法包括使B2M序列与如权利要求1至24中任一项所述的组合物或如权利要求25至41中任一项所述的RNA指导物接触。
49.如权利要求48所述的方法,其中该B2M序列在细胞中。
50.如权利要求48或49所述的方法,其中该组合物或该RNA指导物诱导该B2M序列中的缺失。
51.如权利要求50所述的方法,其中该缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。
52.如权利要求50或51所述的方法,其中该缺失在该5'-NTTN-3'序列的下游。
53.如权利要求50至52中任一项所述的方法,其中该缺失的长度多达约50个核苷酸。
54.如权利要求50至53中任一项所述的方法,其中该缺失的长度多达约40个核苷酸。
55.如权利要求50至54中任一项所述的方法,其中该缺失的长度为约4个核苷酸至40个核苷酸。
56.如权利要求50至55中任一项所述的方法,其中该缺失的长度为约4个核苷酸至25个核苷酸。
57.如权利要求50至56中任一项所述的方法,其中该缺失的长度为约10个核苷酸至25个核苷酸。
58.如权利要求50至57中任一项所述的方法,其中该缺失的长度为约10个核苷酸至15个核苷酸。
59.如权利要求50至58中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。
60.如权利要求50至59中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
61.如权利要求50至60中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。
62.如权利要求50至61中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
63.如权利要求50至62中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
64.如权利要求50至63中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
65.如权利要求50至64中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
66.如权利要求50至65中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。
67.如权利要求50至66中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。
68.如权利要求50至67中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
69.如权利要求50至68中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
70.如权利要求50至69中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
71.如权利要求50至70中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
72.如权利要求50至71中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
73.如权利要求50至72中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
74.如权利要求50至73中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
75.如权利要求50至74中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
76.如权利要求50至75中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
77.如权利要求50至76中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
78.如权利要求50至77中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
79.如权利要求50至78中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
80.如权利要求50至79中任一项所述的方法,其中该5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
81.如权利要求50至80中任一项所述的方法,其中该缺失与该B2M序列中的突变重叠。
82.如权利要求50至81中任一项所述的方法,其中该缺失与该B2M序列中的插入重叠。
83.如权利要求50至82中任一项所述的方法,其中该缺失去除该B2M序列或其一部分的重复扩展。
84.如权利要求50至83中任一项所述的方法,其中该缺失破坏该B2M序列的一个或两个等位基因。
85.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGAAUGUCGGAUGGAUGAAACC(SEQ ID NO:778);
AGAAAUCCGUCUUUCAUUGACGGCUAUCUCUUGUACUACACUG(SEQ ID NO:779);
AGAAAUCCGUCUUUCAUUGACGGACACGGCAGGCAUACUCAUC(SEQ ID NO:780);或
AGAAAUCCGUCUUUCAUUGACGGGUCACAGCCCAAGAUAGUUA(SEQ ID NO:781)。
86.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物包含SEQ ID NO:1222-1230中任一个的序列。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/107,869 | 2020-10-30 | ||
US202163252719P | 2021-10-06 | 2021-10-06 | |
US63/252,719 | 2021-10-06 | ||
PCT/US2021/057398 WO2022094309A1 (en) | 2020-10-30 | 2021-10-29 | Compositions comprising an rna guide targeting b2m and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116648505A true CN116648505A (zh) | 2023-08-25 |
Family
ID=87623423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180085315.9A Pending CN116648505A (zh) | 2020-10-30 | 2021-10-29 | 包含靶向b2m的rna指导物的组合物及其用途 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116648505A (zh) |
-
2021
- 2021-10-29 CN CN202180085315.9A patent/CN116648505A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230203539A1 (en) | Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof | |
TW202317761A (zh) | 包含靶向運甲狀腺素蛋白(ttr)的rna指導物的基因編輯系統及其用途 | |
US20230407343A1 (en) | Compositions comprising an rna guide targeting pdcd1 and uses thereof | |
CN116648505A (zh) | 包含靶向b2m的rna指导物的组合物及其用途 | |
KR20230093328A (ko) | B2m을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도 | |
CN116867898A (zh) | 包含靶向trac的rna指导物的组合物及其用途 | |
US20240026351A1 (en) | Compositions comprising an rna guide targeting trac and uses thereof | |
CN116670275A (zh) | 包含靶向pdcd1的rna指导物的组合物及其用途 | |
US20230416732A1 (en) | Compositions comprising an rna guide targeting bcl11a and uses thereof | |
US20230193243A1 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof | |
CN116601292A (zh) | 包含靶向bcl11a的rna指导物的组合物及其用途 | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 | |
TW202334421A (zh) | 包含靶向ciita之rna引導之組合物及其用途 | |
WO2022140343A1 (en) | Compositions comprising an rna guide targeting dmpk and uses thereof | |
WO2023137451A1 (en) | Compositions comprising an rna guide targeting cd38 and uses thereof | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
WO2022140340A1 (en) | Compositions comprising an rna guide targeting dmd and uses thereof | |
CN117813379A (zh) | 包括crispr核酸酶的基因编辑系统和其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |